怎样实现不上网站下载网站最新的文件,比如说下载政府网站的最新政策文件?

现在政府文件都是放在网站上的,所以每天得上政府网站去看看有没有最新的文件,有没有办法不上网站,写程序自动监测最新文件,如果有则下载下来?

可以使用webserver

自己分析存在文件的页面,然后用类似火车头的采集软件定时采集页面分析url进行下载

发送HTTP请求,解析html,拿到页面连接,下载,保存

写个job好了咯,只要你清楚如何区分新文件的规则.