[求助]如何写大文件中的高效定长字符串搜索?

[求助]如何写大文件中的高效定长字符串搜索?

[求助]如何写大文件中的高效定长字符串搜索?
我需要在120M的fasta文件(平均每条序列长2.5k bp)找5万多个25bp探针的完全匹配情况。
就是把Affymetrix的25bp的探针在cDNA中定位。
请问如何写字符串搜索比较好?

我的想法是,每序列每25bp做crc8的hash,对hash做索引,查询时把探针算crc8,对匹配项逐个作普通字符串比较(eq)。

我是学生物的,刚开始接触perl,请问上述方法效率如何?能帮我写一下代码吗?
做个BLASTN ,然后再将完全匹配的找出
做个BLASTN ,然后再将完全匹配的找出