匹配网页里面的中文内容怎样匹配?

匹配网页里面的中文内容怎样匹配?

匹配网页里面的中文内容怎样匹配?
抓取了网页的源代码,比如:
[quote]

<TR>
<TD align=left><font color=#31609e><font color=#31609e><font
color=#535353><img src="../images/detail.gif" alt="详细内容" width="78" height="21"></font></font></font></TD>
</TR>
<TR>
<TD align="left" class=bigtxt><br>既然你现在基本上已经知道了所有的这些<br><br>  而且,象那些双向的算法还在我们的制作之中<br>

frameborder=no border=0 marginwidth=0 marginheight=0 scrolling=no hspace=0 vspace=0></iframe></td></tr>

[/quote]

我想要里面的 "既然...." 后面的中文 , 怎么匹配阿 !

另外问下 ,分析网页,找出自己感兴趣的东西 , 怎样分析和匹配比较合理 ~
正则.
[quote]回复给 fkiori : 正则....[/quote]

说了跟没说一样, 别跟我说来匹配 <TD align="left" class=bigtxt><br> 这样的东西 , 一个网页里面那样的标识太多了 ..