想要爬取一些平台上有关康养旅游的评价,不知道从何下手,有没有人能给一些思路?比如:从哪些网站爬取?爬虫的基本流程?第一次尝试爬虫技术,不知道正常的操作方法?不想一个个去百度上看
先确定需要爬取的网站,然后分析网站的数据来源,是后端生成数据还是ajax生成数据,确定数据来源方式就根据HTTP请求编写代码,这个涉及一些请求参数的加密、转换等等处理,然后清洗数据和数据入库