python 网页爬虫

我有个信息系统(网页版),
我想写个PY程序,读取出当前页面(10个人员)的所有相关信息; 写入excel文件中; 然后读取下一个页面,继续读取页面中10人的所有信息,存入excel文件中.
由于我刚刚接触Py ,很多不懂, 请各位牛人多多指点, 最好能附上PY代码.

想什么的呀,政府信息是不能随便爬取的,这不是你个人的网站,想搞诈骗的嘛

爬虫是个好东西,爬政府信息的,踩缝纫机都溜得飞起.
解决办法:建议手动复制网站上的信息下来,爬虫容易留下爬取的证据.

为何不直接在网页里写个导出excel的功能呢,非得用py

兄弟~如果你是问问题免费都有人回答,你让别人给写个完整代码的,这价格实属感人,大家又不傻。建议上淘宝找人做吧

【相关推荐】




如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

我看你的网站是gov.cn结尾的,政府网站也敢爬吗,爬的还是真实信息

可以找到分页列表的数据接口,然后按照下面的方式将数据导出到excel中:https://blog.csdn.net/Haywardwang/article/details/112566259。

好像前几年有个新闻,有个哥们爬政府网站结果被抓了

建议别搞

纯技术上看,可以分析页面的td,tr等标签进行数据提取,然后写入execl,py都有现成的包可以用

太6了

老老实实的复制粘贴吧,或者偷偷的学习一下Python

不复杂

啥网站

这个是属于违法行为呀!

可以使用python的selenium或者request库实现。解析网页就行,网上找个教程自己就能学会。因为爬虫这种东西存在风险问题,如果出了事,写爬虫的人跑不了。

python爬虫入门教程(非常详细),超级简单的Python爬虫教程_python爬虫快速入门_编程小饴的博客-CSDN博客 爬虫(spider,又网络爬虫),是指向网站/网络发起请求,获取资源后分析并提取有用数据的程序。从技术层面来说就是 通过程序模拟浏览器请求站点的行为,把站点返回的HTML代码/JSON数据/二进制数据(图片、视频) 爬到本地,进而提取自己需要的数据,存放起来使用。_python爬虫快速入门 https://blog.csdn.net/CSDN_430422/article/details/129056224?ops_request_misc=&request_id=&biz_id=102&utm_term=python%20%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-129056224.142^v93^chatsearchT3_2&spm=1018.2226.3001.4187