perl处理文本,统计词组个数

پېشقەدەم ئىنقىلابچىلارنى خەلق ئاممىسى چىن قەلبىدىن ھۆرمەتلەيدۇ .
بۇ گېنىرالنى جەڭچىلەر بەك ھۆرمەتلەيدۇ .
ئۇ ئۆز ئۇستازىغا ھۆرمەت نەزىرى بىلەن تىكىلىپ قارايتتى .
ئۇ ماركا يىغىشنى ياخشى كۆرىدۇ .
ماگىزىندا كىشىلەر ياقتۇرىدىغان كۈندىلىك بۇيۇملار سېتىلىۋاتىدۇ .
بىز ئارمىيە بىلەن خەلقنىڭ ئىتتىپاقلىقىنى كۆزىمىزنى ئاسرىغاندەك ئاسرىشىمىز لازىم .
بىز مەكتىپىمىزنىڭ دەل دەرەخ گۈل گىياھلىرىنى ئاسرىشىمىز لازىم .
تىرىشىپ ئۆگىنىدىغانلارنىڭ ھەممىسى ۋاقىتنى قەدىرلەشنى بىلىدۇ .
ھەممىمىز ئاشلىقنى قەدىرلەيلى .后面还有很多句子(几十万行都有可能),有可能一个句子一行,有可能一个句子由多行。这些维语句子被保存在word.txt文件中,且是Unicode格式。维语每个单词之间用空格隔开,现在我们将连续的两个单词组成一个词组,例如开头处:قەلبىدىن ھۆرمەتلەيدۇ 和 چىن قەلبىدىن依次进行下去;然后统计组成后的每个单词出现的次数,依次排列。
请问用perl怎么写程序?

作者: langlanglofa   发布时间: 2011-05-24

维吾尔语分词这么容易?没有单数的情况?

作者: iambic   发布时间: 2011-05-24