学爬虫,要看计算机基础哪些书,求推荐,计算机组成啥等

学爬虫,要看计算机基础哪些书,求推荐,计算机组成啥等,需要看不,

熟悉多线程编程、网络编程、HTTP协议相关
开发过完整爬虫项目(最好有全站爬虫经验,这个下面会说到)
反爬相关,cookie、ip池、验证码等等
熟练使用分布式
了解企业级爬虫和个人爬虫的差异(企业级爬虫,首先在数据量上跟我们平时学习的时候爬虫,不是同一数量级,数据量大很多。其次,企业级爬虫代码一般部署到专门的爬虫服务器上,采取7*24小时运行,所以需要日志监控,异常维护。)

知道什么是深度优先,广度优先的抓取算法,及实践中的使用规则;

能分析简单网站的结构,会使用urllib,urllib2或requests库进行简单的数据抓取;
如有帮助望采纳。

你好,这取决于你现在的基础。 建议你看看这个 https://edu.csdn.net/course?key=%E7%88%AC%E8%99%AB

可以看看【编程语言书籍】、《HTTP权威指南》、《TCP/IP详解》《鸟哥私房菜》、以及一些数据库