处理一个很大的text怪码文件~汗。。

处理一个很大的text怪码文件~汗。。

我有一个很大的txt文件,这是里面的一部分:

WASHINGTON|NNP|I-LOCATION
The|DT|O Pentagon|NNP|I-ORGANIZATION has|VBZ|O denied|VBN|O a|DT|O request|NN|O that

怎样才能让所有有空格的地方都另起一行? 而且最后的结果全部是小写

                                       谢谢

import string
f=open('a.txt','r')
for line in f.readlines():
    for l in line.split():
        print l.lower()
不知道行不行?
f.close()忘了
应该也可以将所有的空格用换行符替换掉,然后再小写处理!
谢谢~终于成功了~
我还有一个问题,当转成像2楼那样子后,需要列出每行出现的次数,但我得的却是每个单词出现的次数,但我总是找不出来问题出在哪里。。

occurrences={}
import string
f=open('muc.txt','r')
for line in f.readlines():
    for l in line.split():
        triples = l.split('|')
        k = triples[0].lower(), triples[1], triples[2]
        for line in k:
           if line not in occurrences:
              occurrences[line]=1
           else:
              occurrences[line]+=1
    linecounts=occurrences.items()
    linecounts.sort()
    for line, count in linecounts:
        print line,count
k值是这样子:

('washington', 'NNP', 'I-LOCATION')
('--', ':', 'O')
('the', 'DT', 'O')
('pentagon', 'NNP', 'I-ORGANIZATION')
('has', 'VBZ', 'O')
('denied', 'VBN', 'O')
('a', 'DT', 'O')
........

答案应该是类似这样的:(后面的数字就是那一行出现的次数)

washington NNP I-LOCATION 4
-- : O 2
the DT O 19
........
顶~
没有搞明白你的意图,是把一个文件里按空格断行后|换成空格变成小写统计每行出现次数么?
如果是不如按要求转换后写到另外文件中,然后在另外的文件中统计每行出现次数


QUOTE:
原帖由 luffy.deng 于 2008-4-27 21:03 发表
没有搞明白你的意图,是把一个文件里按空格断行后|换成空格变成小写统计每行出现次数么?
如果是不如按要求转换后写到另外文件中,然后在另外的文件中统计每行出现次数

是的,但是我怎样才能统计每行出现的次数?
import string
f=open('a.txt','r')
fw=open('tmp.txt','w')
for line in f.readlines():
   for c in line.split():
       fw.write(' '.join(c.lower().split('|'))+'\n')
fw.close()
f.close()
f=open('tmp.txt','r')
count={}
for line in f.readlines():
   if count.has_key(line):
      count[line]+=1
   else:
      count[line]=1
for k,v in count.iteritems():
   print k,v
f.close()