怎样实现不上网站下载网站最新的文件，比如说下载政府网站的最新政策文件？

现在政府文件都是放在网站上的，所以每天得上政府网站去看看有没有最新的文件，有没有办法不上网站，写程序自动监测最新文件，如果有则下载下来？

可以使用webserver

自己分析存在文件的页面，然后用类似火车头的采集软件定时采集页面分析url进行下载

发送HTTP请求，解析html，拿到页面连接，下载，保存

写个job好了咯,只要你清楚如何区分新文件的规则.