新人:正则表达式提取网页讯息

新人:正则表达式提取网页讯息

新人:正则表达式提取网页讯息
抱歉打搅大家一下:
我想出理一个论坛的html的页。目标是找出每个最后发帖不是特定发帖者(plantroseer)的贴子,然后返回帖子的编号
由于页面有很多帖子,每个帖子的结构基本上可以划分成如下几行代码:
href="http://bbs.×××.com/ipb/index.php?showtopic=14601&view=getlastpost">最后发帖:</A>
<B><A
href="http://bbs.×××.com/ipb/index.php?showuser=7582">圣斗士</A></B></SPAN></TD></TR><!-- End Topic Entry 14601 --><!--TEMPLATE: skin_forum, Template Part: RenderRow--><!-- Begin Topic Entry 14645 -->
<TR>
<TD class=row4 align=middle><IMG alt=无新帖子
具体想法是:
找到“圣斗士”后与我需要的一个值“plantroseer”比较,比较结果不同的话就提取Begin Topic Entry 的值(字符串)7582保存到变量NO中

由于一个页面中有很多类似的段落,所以按上面的方法找到一个最后发贴者不是plantroseer的地方后,必须返回当个段落的帖子编号,而不能返回另外一个段落的帖子号

谢谢




   

意思都没有说清楚...