如何使用anaconda 3爬取电影网站数据
1.分析电影的区域分布,
2,分析电影上座率区间分布情况
3、分析电影类型情况
这个你需要根据具体的网站才能给出具体的评估
譬如说,你想爬取哪个网站?我可以帮你
网站不同,爬取方法不同,有的直接爬,有的需要验证,想爬取哪个网站?
首先要明确的是anaconda3是python的开发环境工具,而爬虫爬取电影网站的话必然是要借助其他三方库实现的,但是爬虫编写的过程还要熟悉web页面的结构,也就涉及到基本的html和js等等,有的网站还需要了解反爬原理等等。
总的来说推荐使用Python的Selenium库来实现爬虫,入门比较简单,资料也比较多,至于题主说的电影区域分布、上座率、电影类型这些找到页面固定结构进行提取就可以了,具体的操作方法建议题主搜索一下Selenium实现爬虫的基本操作进行学习,了解基本的使用后多加练习就就能实现了。
另外对于不公开数据可能需要通过其他渠道进行获取,而有的网站非公开数据也最好不要爬虫获取后获利使用(个人学习研究的没问题)。