apache防百度爬虫方法-(大家都测试一下)

apache防百度爬虫方法-(大家都测试一下)

RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [OR]
RewriteCond %{REMOTE_ADDR} ^220\.181\.38\.181$
RewriteCond %{REMOTE_ADDR} ^61\.135\.166\.229$  
#ip地址根据抓取的实际情况为准,我的是这两台在抓
RewriteRule ^.* - [F,L]


我已测试过,经过如此设置后,走正常流量了。

这个都屏蔽了也不是很好啊
robots.txt 不成吗???
百度爬虫太流氓了,消耗我大量的机器负载,确带来不了流量,故,让他403了。

当然,中搜在线也是更让人惊诧,大家多分析日至便知其原委。
看来大家对 baidu 有同样的感受啊!
http://www.freelamp.com/1140971596/index_html
我以前看统计发现来自百度的访问真多啊,,后来才发现基本上是是爬虫
人家花了钱做推广。你们这些坏人居然封别人!干什么啊你们?
百度的国内市场占用率过半,百度来的点击你不要是自讨苦吃,真不知道怎么想的。
关键是这位老兄是服务提供者,所以流量当然越少越好
坏人果然很坏