文本记录提取

gyy_110

UID: 39087
帖子: 58
积分: 133
在线时间: 4 小时

1^# gyy_110 发表于 2007-12-10 12:45

文本记录提取

下面是一文本文件中的一段记录：
//

Query sequence: GENSCAN00000024498
Accession:    [none]
Description: pep:Genscan chromosome:Btau_3.1:28:560898:616194:-1  transcript:GENSCAN00000024498

Scores for sequence family classification (score includes all domains):
Model Description                                  Score E-value  N
-------- -----------                                  ----- ------- ---
0045423  Nuclear receptor ligand-binding domain          5.8 0.00063 1
0039946  Nuclear receptor ligand-binding domain          3.8    0.0034 1
0035697  Nuclear receptor ligand-binding domain          1.6    0.023 1

Parsed for domains:
Model Domain  seq-f seq-t hmm-f hmm-t    score  E-value
-------- ------- ----- ----- ----- -----    -----  -------
0039946 1/1    901 937 .. 227 267 .]    3.8 0.0034
0045423 1/1    901 940 .. 231 271 .]    5.8  0.00063
0035697 1/1    903 939 .. 215 251 .]    1.6 0.023

Alignments of top-scoring domains:
0039946: domain 1 of 1, from 901 to 937: score 3.8, E = 0.0034
               *->lkLpeLrslsakllellfflklilgsvplppLlleileaey<-*
                  ++L++L  + ++l++ +f + +++ +v++ +L leil
  GENSCAN000 901 KALDLLEYIDEDLMKIFFCFAVKEEDVNINDLKLEIL---- 937
0045423: domain 1 of 1, from 901 to 940: score 5.8, E = 0.00063
               *->lklpeLRsisaklleelfflkvligsvplppLllEmleaky<-*
                  ++l++L  i ++l++ +f++ v + +v++++L lE+l+

请帮忙取出从“//” 到“Alignments”前的代码
下面是我写的： sed -n "/^\/\//,/Alignments/p" $1 | sed /Alignments/d
管道前取出时会包括Alignments这行，所以通过管道又删除了，比较麻烦，
请各位高手帮忙简化。

取出从“//” 到第四个空行之间的代码（第四个空行如何表达），怎样写。谢谢！

　　　　　　

ArchieYao

UID: 18549
帖子: 3
积分: 6
在线时间: 10 分钟

2^# ArchieYao 发表于 2007-12-10 14:36

试一下这样可行不,不过会在顶部多了一行空行
sed -n -e "/^\/\//,/Alignments/{x;p;}" yourfile　　　　　　

ArchieYao

UID: 18549
帖子: 3
积分: 6
在线时间: 10 分钟

3^# ArchieYao 发表于 2007-12-10 14:39

awk

awk '/^\/\//,/Alignments/{if(!/Alignments/)print}' yourfile

偶进来充当高手了,

....

　　　　　　

gyy_110

UID: 39087
帖子: 58
积分: 133
在线时间: 4 小时

4^# gyy_110 发表于 2007-12-11 09:04

还有更简单的方法吗？
如果我想把中间的两个数组中的数值提取出来添加到数据库，怎么样提取？