UT 的作者原来改做这个了。。。速度爆快啊

UT 的作者原来改做这个了。。。速度爆快啊
这个新闻网站看了很久了,一直不知道谁做的,都是直接进去里面的,没想到大门口就贴着作者大名了。。。居然一直没留意。

http://news.sh2sg.com

刚好在研究类似的网站,有些问题请大家帮忙分析一下,

- 这个是 perl 写的吗?速度非常好。还是 mod_perl?或者是其它的语言。。。从哪里可以看出来?
- 它应该是用机器人来抓取网页还是 RSS?看了看新浪自己提供的 RSS feed,貌似没这么多分类,那是怎么样把新闻分类的?
- 新闻内容的广告过滤,有通用的算法吗?他这里过滤得很干净,可是每个网站的 html 都不一样吧,难道对每个页面都有自己一套过滤算法?

有什么类似的资料可以参考吗?