英语水平不好,但是爬虫又对我特别感兴趣,看了好多基本知识和语法,都没有办法理解,也有动手做了好几次爬虫就是没有理解其中的奥秘,弄出来都是报错或者乱码,有的时候看了爬虫项目实战,看到的代码搞不懂到底是怎么来的。各位大神们有没有更容易理解的方法…
奥秘指的是什么奥秘?代码没有什么捷径可言,唯多看多敲。我看你是不是学习顺序搞反了,想学爬虫,你得先了解你要爬的是个什么东西吧,先学html的基本语法,顺便了解下jquery的选择器,再来写爬虫应该会容易理解一些;无非就是f12,找标签,找id,找class,然后代码解析他的dom,找到合适的选择器,提取数据,丢进你的数据库或者说文件中。
我就是自学爬虫的。
想要学好
前端html必须有所了解
基本的bs4 xpath re 解析网页内容
如何抓包,就是一些后端发过来的响应内容 构建请求对象
先学基本requests get post 的这两请求
存储数据暂时存txt或者本地就行,先把这几个基本学了,后面你在来问吧,有帮助采纳哦。
关于方法已经有大佬说的,我只想提一下,标题有语病,爬虫对我感兴趣……