scrapy是python的异步爬虫框架,而async / await也是异步爬虫,这两者的效率上有什么区别吗?
scrapy 是基于 twisted 这个python 异步三方库写的
async及await是基于python3.x之后自带的asyncio这个库来实现的
这两块没有做过深入研究,所以效率上可以自己去测试。
只是针对爬虫这部分,scrapy框架更成熟一些,asyncio在配套使用上还不够完善。
async / await不是爬虫,而是异步io调用的基础功能,一个是面包一个是面粉的关系。
效率主要取决于网络传输和html解析,用什么框架区别不大。但是考虑到python本身效率很差,是解释语言,所以尽量调用已经写好的库(它们底层通常用c++实现)。
而全部用python自己写效率肯定差
大神捋清楚逻辑了吗,我也有点疑惑,说是异步,但运行速度看来不像,io阻塞了,难道要调用,但我看了官方文档,说的有些不太清楚,不过我知道有个aioscpy框架好像是支持aiohttp异步爬虫,不会遇到io阻塞