1.什么是结构化网页,什么是非结构化网页
2.怎样爬取非结构化网页的数据
网页结构化是一种重要的网页无障碍技术,对于内容、色彩、功能丰富的网页,进行逻辑规划,支持浏览者能用键盘快速定位,帮助浏览者预览网页主要信息,快速找到自己感兴趣的内容板块,极大地提高浏览信息。
https://blog.csdn.net/fanyun_01/article/details/80729208
不太清楚您说的非结构化是什么意思,一般爬取网页就两种,一种分析html结构,一种找api然后获取数据
https://blog.csdn.net/zyzy123321/article/details/105673366
您好,我是有问必答小助手,您的问题已经有小伙伴解答了,您看下是否解决,可以追评进行沟通哦~
如果有您比较满意的答案 / 帮您提供解决思路的答案,可以点击【采纳】按钮,给回答的小伙伴一些鼓励哦~~
ps:问答VIP仅需29元,即可享受5次/月 有问必答服务,了解详情>>>https://vip.csdn.net/askvip?utm_source=1146287632
非常感谢您使用有问必答服务,为了后续更快速的帮您解决问题,现诚邀您参与有问必答体验反馈。您的建议将会运用到我们的产品优化中,希望能得到您的支持与协助!
速戳参与调研>>>https://t.csdnimg.cn/Kf0y