求一个算法,关于比较两个文本

求一个算法,关于比较两个文本

求一个算法,关于比较两个文本
比较两个文本,fileA和fileB
简单地说就是这样;
fileA: (1 2 3 是行号)
1 AB
2 D
3 C
fileB: (1是行号)
1 ABCE

要求最后得到的结果:
fileA: D
fileB: E

(不要告诉我用diff这样的命令阿,呵呵,我得处理1.3million个文本,不可能靠diff后再用肉眼看的,呵呵)
大家谈谈自己的想法,说说自己的方法
[size=6][/size]
要求比较模糊.----若f.
要求比较模糊.

若fileA中多一行:
4 AB
那比较后应该是一样的结果吗???

另最好提供下文件的平均大小, 主要字符范围.
如果是多行的并且没有行号.
如果是多行的并且没有行号的话,可能可以:)
尝试comm命令:)
把文件A单个字符存入一个哈希变量中,设置值为0
把文件B中单个字符与哈希变量比较,如存在值设置为1,不存在设置为2
循环整个哈系变量,值为0的存入filea,值为2的存入fileb