就比如有一个彩票开奖的网站,每五分钟开一次奖,我可以抓取到它的前三次开奖的结果吗?还有他的开奖剩余时间
看你用什么语言,先模仿浏览器获取服务器网页,再用正则表达式或者dom解析网页,前者根据不同的语言不同,比如用java的httpclient,php的curl,vb的xmlhttp或者C#的webclient/httpwebrequest等。
如果是ajax的数据请求 ajax不能跨域请求数据 可以用nginx 服务器 反向代理 实现ajax同源 获取数据
http://www.opencai.net/ 可以考虑直接调用彩票开放的接口实现数据抓取
使用php中curl模块 模拟登陆抓取页面,然后用正则表达式筛选你想要的数据