如何截取HTML中指定的内容?

如何截取HTML中指定的内容?

如何截取HTML中指定的内容? 能不能不用TableExtract实现,
比如
<html>
<body>
<table border=0 bgcolor=#008080>
<tr>
<TD width=14% bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>Username:</td>
<TD bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>root</td>
</tr>
<tr>
<TD width=14% bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>Password:</td>
<TD bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>secret</td>
</tr>
</table>
</body>
</html>
我想获取的是Username: root  Password: secret
如果你的html很规则。。用正则可以实现,否则,偶也不知道了
行不行试试不就知道了?
CPAN 上 HTML::* 大头的模块有一大堆,必有一款适合你。


[Copy to clipboard] [ - ]
CODE:
#! /usr/bin/perl

use HTML::Parser;

my $html_string = join("", <DATA>);
my $parser = HTML::Parser->new( api_version => 3,      
text_h  => [\&text,  "self, dtext"],   
);

$parser->parse($html_string);

sub text {
my($self,$text)=@_;
   print "$text\n";
}

__DATA__
<html>
<body>
<table border=0 bgcolor=#008080>
<tr>
<TD width=14% bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>Username:</td>
<TD bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>root</td>
</tr>
<tr>
<TD width=14% bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>Password:</td>
<TD bgcolor=#EEEEEE height="25"><FONT COLOR='#3F67A3'>secret</td>
</tr>
</table>
</body>
</html>

结果很多换行 怎么处理?