请问如何批量查询不同学生的记录中符合要求的行数
例子如下:
张三 [Tribolium castaneum无脊椎]
张三 [Carboxydibrachium pacificum DSM 12653细菌]
张三 [Thermoanaerobacter tengcongensis MB4细菌]
李四 [Eubacterium biforme DSM 3989细菌]
李四 [Culex quinquefasciatus细菌]
李四 [Dyadobacter fermentans DSM 18053细菌]
孙晓 [Dyadobacter fermentans DSM 18053细菌]
孙晓 [Tribolium castaneum无脊椎]
孙晓 [Acyrthosiphon pisum无脊椎]
。。。。。。
我想同时查询张三,李四,孙晓的所有行里面包含“细菌”的行的个数,返回的结果我希望是这样的
张三 2
李四 3
孙晓 1
。。。。。。
请问各位高手该如何实现?
张三 [Tribolium castaneum无脊椎]
张三 [Carboxydibrachium pacificum DSM 12653细菌]
张三 [Thermoanaerobacter tengcongensis MB4细菌]
李四 [Eubacterium biforme DSM 3989细菌]
李四 [Culex quinquefasciatus细菌]
李四 [Dyadobacter fermentans DSM 18053细菌]
孙晓 [Dyadobacter fermentans DSM 18053细菌]
孙晓 [Tribolium castaneum无脊椎]
孙晓 [Acyrthosiphon pisum无脊椎]
。。。。。。
我想同时查询张三,李四,孙晓的所有行里面包含“细菌”的行的个数,返回的结果我希望是这样的
张三 2
李四 3
孙晓 1
。。。。。。
请问各位高手该如何实现?
作者: chenjiali1 发布时间: 2011-06-09
本帖最后由 ulmer 于 2011-06-09 16:29 编辑
回复 chenjiali1
1. using hash as counter.
2. split line to get column 1 as key, column2 as value.
3. pattern match value and count it,
复制代码
回复 chenjiali1
1. using hash as counter.
2. split line to get column 1 as key, column2 as value.
3. pattern match value and count it,
- use strict;
- use Data::Dumper;
-
- my %counter = ();
- while (<DATA>) {
- chomp;
- my ($name, $value) = split /\s+\[/;
- $counter{$name}++ if $value =~ /细菌/;
- }
- print Dumper \%counter;
-
- __DATA__
- 张三 [Tribolium castaneum无脊椎]
- 张三 [Carboxydibrachium pacificum DSM 12653细菌]
- 张三 [Thermoanaerobacter tengcongensis MB4细菌]
- 李四 [Eubacterium biforme DSM 3989细菌]
- 李四 [Culex quinquefasciatus细菌]
- 李四 [Dyadobacter fermentans DSM 18053细菌]
- 孙晓 [Dyadobacter fermentans DSM 18053细菌]
- 孙晓 [Tribolium castaneum无脊椎]
- 孙晓 [Acyrthosiphon pisum无脊椎]
作者: ulmer 发布时间: 2011-06-09
- #!/usr/bin/perl
- use warnings;
- use strict;
-
- my %hash;
-
- while(<DATA>)
- {
- my ($name, $info) = split / {2,}/;
- $hash{$name} = [] unless exists $hash{$name};
- push @{$hash{$name}}, $info;
- }
-
- my $cnt = 0;
- while (my ($key, $value) = each %hash)
- {
- print $key,"\t";
- for(@{$value})
- {
- if (/细菌/)
- {
- ++$cnt;
- }
- }
- print $cnt,"\n";
- $cnt = 0;
- }
-
- __DATA__
- 张三 [Tribolium castaneum无脊椎]
- 张三 [Carboxydibrachium pacificum DSM 12653细菌]
- 张三 [Thermoanaerobacter tengcongensis MB4细菌]
- 李四 [Eubacterium biforme DSM 3989细菌]
- 李四 [Culex quinquefasciatus细菌]
- 李四 [Dyadobacter fermentans DSM 18053细菌]
- 孙晓 [Dyadobacter fermentans DSM 18053细菌]
- 孙晓 [Tribolium castaneum无脊椎]
- 孙晓 [Acyrthosiphon pisum无脊椎]
张三 2
李四 3
孙晓 1
作者: Cu_fans 发布时间: 2011-06-09