文本记录提取

文本记录提取

下面是一文本文件中的一段记录:
//

Query sequence: GENSCAN00000024498
Accession:      [none]
Description:    pep:Genscan chromosome:Btau_3.1:28:560898:616194:-1  transcript:GENSCAN00000024498

Scores for sequence family classification (score includes all domains):
Model    Description                                    Score    E-value  N
-------- -----------                                    -----    ------- ---
0045423  Nuclear receptor ligand-binding domain           5.8    0.00063   1
0039946  Nuclear receptor ligand-binding domain           3.8     0.0034   1
0035697  Nuclear receptor ligand-binding domain           1.6      0.023   1

Parsed for domains:
Model    Domain  seq-f seq-t    hmm-f hmm-t      score  E-value
-------- ------- ----- -----    ----- -----      -----  -------
0039946    1/1     901   937 ..   227   267 .]     3.8   0.0034
0045423    1/1     901   940 ..   231   271 .]     5.8  0.00063
0035697    1/1     903   939 ..   215   251 .]     1.6    0.023

Alignments of top-scoring domains:
0039946: domain 1 of 1, from 901 to 937: score 3.8, E = 0.0034
                   *->lkLpeLrslsakllellfflklilgsvplppLlleileaey<-*
                      ++L++L  + ++l++ +f + +++ +v++ +L leil      
  GENSCAN000   901    KALDLLEYIDEDLMKIFFCFAVKEEDVNINDLKLEIL----    937  
0045423: domain 1 of 1, from 901 to 940: score 5.8, E = 0.00063
                   *->lklpeLRsisaklleelfflkvligsvplppLllEmleaky<-*
                      ++l++L  i ++l++ +f++ v + +v++++L lE+l+      

请帮忙取出从“//” 到“Alignments”前的代码
下面是我写的: sed -n "/^\/\//,/Alignments/p" $1 | sed /Alignments/d
管道前取出时会包括Alignments这行,所以通过管道又删除了,比较麻烦,
请各位高手帮忙简化。

取出从“//” 到第四个空行之间的代码(第四个空行如何表达),怎样写。谢谢!

      
试一下这样可行不,不过会在顶部多了一行空行
sed -n -e "/^\/\//,/Alignments/{x;p;}"  yourfile      
awk
awk '/^\/\//,/Alignments/{if(!/Alignments/)print}'  yourfile

偶进来充当高手了, ....

      
还有更简单的方法吗?
如果我想把中间的两个数组中的数值提取出来添加到数据库,怎么样提取?