能否用perl计算预测正确数,进而计算Q3,SOV呢?

能否用perl计算预测正确数,进而计算Q3,SOV呢?

大家好,我想比较一种预测蛋白质二级结构预测方法的正确性,比如:PHD,ASSP2等,用它们预测的结果跟实验得出的比较,然后根据公式计算Q3,SOV。
现在的问题是由于序列数量众多,我不可以一个一个去比对预测对了多少,能否用perl实现这个功能,如何实现?万分感谢!
举个例子:
这是1U7G chain A实验得出的二级结构
Sequence and secondary structure for 1U7G chain A
1     APAVADKADN AFMMICTALV LFMTIPGIAL FYGGLIRGKN VLSMLTQVTV
     HHHH HHHHHHHHHH HHHHTTHHHH HHHTTS HHH HHHHHHHHHH
   
51     TFALVCILWV VYGYSLASGE GNNFFGNINW LMLKNIELTA VMGSIYQYIH
    HHHHHHHHHH HTHHHHHHSS SSS STT GGGTT TT EETTEEHHHH
   
101     VAFQGSFACI TVGLIVGALA ERIRFPAVLI FVVVWLTLSY IPIAHMVWGG
    HHHHHHHHHH HHHHHHHHHG GGB HHHHHH HHHHHHHHTH HHHHHHHHSS
   
151     GLLASHGALD FAGGTVVHIN AAIAGLVGAY LIGKRVGFGK EAFKPHNLPM
     HHHHHT SS TTTTHHH HHHHHHHHHH HS TT SS GGGHHH
   
201     VFTGTAILYI GWFGFNAGSA GTANEIAALA FVNTVVATAA AILGWIFGEW
    HHHHHHHHHH HHHHHHHGGG SSSSHHHHHH HHHHHHHHHH HHHHHHHHHH
   
251     ALRGLPSLLG ACSGAIAGLV GVTPACGYIG VGGALIIGVV AGLAGLWGVT
    HHHSS HHH HHHHHHHHHH HHTTTTTTS HHHHHHHHHH HHHHHHHHHH
   
301     MLKRLLRVDD PCDVFGVHGV CGIVGCIMTG IFAASSLGGV GFAEGVTMGH
    HHHHHH S GGGHHHHHHH HHHHHHHHHH HHTSGGGT TT HHH
   
351     QLLVQLESIA ITIVWSGVVA FIGYKLADLT VGLRV
    HHHHHHHHHH HHHHHHHHHH HHHHHHHHHH T SB
这是Jpred3预测的结果
1、2_1U7G:A
APAVADKADNAFMMICTALVLFMTIPGIALFYGGLIRGKNVLSMLTQVTVTFALVCILWVVYGYSLASGEGNNFFGNINWLMLKNIELTAVMGSIYQYIHVAFQGSFACITVGLIVGALAERIRFPAVLIFVVVWLTLSYIPIAHMVWGGGLLASHGALDFAGGTVVHINAAIAGLVGAYLIGKRVGFGKEAFKPHNLPMVFTGTAILYIGWFGFNAGSAGTANEIAALAFVNTVVATAAAILGWIFGEWALRGLPSLLGACSGAIAGLVGVTPACGYIGVGGALIIGVVAGLAGLWGVTMLKRLLRVDDPCDVFGVHGVCGIVGCIMTGIFAASSLGGVGFAEGVTMGHQLLVQLESIAITIVWSGVVAFIGYKLADLTVGLRV
---HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH----HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-------EEE-----------------HHHHHHHHHHHHHHHHHHHHHHHHHHH---HHHHHHHHHHHHHHHH-HHEEE-------------------HHHHHHHHHHHHHHHHH---------------HHHHHHHHHHHHHHHHHH-------HHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-----HHHHHHHHHHHHHH---------HHHHHHHHHHHHHHHHHHHHHHHHH--------EE----HHHHHHHHHHHHH--------------HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-------
能否用perl计算预测正确数,进而计算Q3,SOV呢?
先把 Perl 放一边。你有嘛不用比较就能计算预测正确数的方法么?
看得有点儿乱。


QUOTE:
原帖由 lujx 于 2008-8-3 14:08 发表
看得有点儿乱。

嗯,你把他说的那些生物学的东西过滤掉就不乱了
我不知道啊,请问您能推荐下吗?非常感谢!


QUOTE:
原帖由 xianghuiwan 于 2008-8-3 15:38 发表
我不知道啊,请问您能推荐下吗?非常感谢!

嗯,我能想到的最好办法就是用hash表(用你要比较的串做 key,用其出现的次数做 value),不过需要变通一下,除了纪录 key 出现的次数,还要纪录 key 冲突的情况。
hash表的效率好不好咯?
用 RoadRunner 算. 啥都不怕.


QUOTE:
原帖由 q1208c 于 2008-8-3 19:07 发表
用 RoadRunner 算. 啥都不怕.

别当超级计算机是万能的。
我用delphi编程实现了