用asp.net做网页采集,如何24小时采集呢?
我需要采集一个网页里的数据,一天24小时不间断的采集。
因为做好之后需要放在服务商那边的空间里,没法做成win的,只能做成
web的,我有点不明白,打开那个网页会进行采集,可是服务器不可能一天24小时
一直开着我那个页面吧。我如何24小时采集呢??
因为做好之后需要放在服务商那边的空间里,没法做成win的,只能做成
web的,我有点不明白,打开那个网页会进行采集,可是服务器不可能一天24小时
一直开着我那个页面吧。我如何24小时采集呢??
作者: woodyy 发布时间: 2011-06-15
你可以使用多线程进行
参见
http://blog.csdn.net/net_lover/archive/2003/08/27/6943.aspx
参见
http://blog.csdn.net/net_lover/archive/2003/08/27/6943.aspx
作者: net_lover 发布时间: 2011-06-15
不过,空间商的服务器不一定允许访问外网,也可能会有防火墙等其他限制,一个比较好的方法是:
你做个录入数据的接口,在你这边找一台机器,去抓取数据,然后通过数据接口把采集下来的数据提交到你的网站上面去。
你做个录入数据的接口,在你这边找一台机器,去抓取数据,然后通过数据接口把采集下来的数据提交到你的网站上面去。
作者: net_lover 发布时间: 2011-06-15
如果你放在Web服务器上(我想就是IIS吧),那么你需要弄一个客户端程序一天二十四小时不断地骚扰服务器,好让它即使回收了服务程序,也要立刻重启。
作者: sp1234 发布时间: 2011-06-15
不用一直开着你那个页面,谁会愿意盯着页面看呢?
不用,只要每隔1分钟去用客户端程序自动请求一下这个页面,根本不用看它返回结果。这个页面在后台,检查一下当前是否正在采集,如果没有那么就开始采集。其实这个页面可以在服务器处理后立刻返回,不要有任何延迟。
不用,只要每隔1分钟去用客户端程序自动请求一下这个页面,根本不用看它返回结果。这个页面在后台,检查一下当前是否正在采集,如果没有那么就开始采集。其实这个页面可以在服务器处理后立刻返回,不要有任何延迟。
作者: sp1234 发布时间: 2011-06-15
不可能达到24小时啊。
1小时采集一次吧。。。
1小时采集一次吧。。。
作者: wxr0323 发布时间: 2011-06-15