Perl/Python 网页信息的采集处理求救

Perl/Python 网页信息的采集处理求救

需要从网页上提取相应的数据,但我只会点php,用它写出的代码效率不高,经常down机(需要提取的数据也有几万行)

所以考虑换perl/python

比如这个页面,要取得所有下拉列表中的选项页面的对应的值

http://www.szfcweb.com/szwsfc/house_select_bottom.asp

当然,也需要同时过滤子窗口的数据

http://www.szfcweb.com/szwsfc/fwxx.asp?id=xxxx     ,xxxx是传值

提取出来的值是用来插入数据库的

有没有人能给出比较好的可扩展的解决方案啊,如果可以的话,有相应报酬

比较急,希望各位多多帮忙
用LWP::Simple取得HTML内容..
然後用RE 去将你要的找出来....
WWW::Mechanize也OK