想要设计一个网络爬虫,功能是我给定很多网站,它都能从这些网站上抓取我想要的数据,比如法律法规之类的,本人对网络爬虫了解不深,以前都是针对一个网站做爬虫,有没有什么办法对不同的网站都能实现抓取的,不需要每一个网站都写一个正则去匹配抓取呢?求帮助
不同网站内容组织都不一样,你很难有统一的规则都能适应
像你这样的情况,下载个现成爬虫软件吧
可以用八爪鱼采集器试试,它的官网上有使用教程