现在政府文件都是放在网站上的,所以每天得上政府网站去看看有没有最新的文件,有没有办法不上网站,写程序自动监测最新文件,如果有则下载下来?
可以使用webserver
自己分析存在文件的页面,然后用类似火车头的采集软件定时采集页面分析url进行下载
发送HTTP请求,解析html,拿到页面连接,下载,保存
写个job好了咯,只要你清楚如何区分新文件的规则.