关于#python#的问题:python爬虫爬取

![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/093982018976182.png

参考GPT和自己的思路:根据你提供的情况来看,可能是因为网站做了反爬虫处理,导致你的爬虫被禁止访问。可以尝试使用其他用户代理头,或者使用轮换IP的方式来解决此问题。另外,也建议先查看该网站是否有使用robots.txt文件来指示爬虫不应该去爬哪些页面,如果有的话需要遵守该文件规定的限制。

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/1097312
  • 你也可以参考下这篇文章:python-异常
  • 除此之外, 这篇博客: 所有的Python “爬虫“ 初学者,都应该看这篇文章!中的 标签img 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

    定义一张图片,其中有一个src属性用于指定图片的地址。

    <!DOCTYPE html>
    <html lang="en">
    <head>
        <meta charset="UTF-8">
        <title>Title</title>
    </head>
    <img>
    <h1>一级标题</h1>
    <div>
        <ul>
            <li>无序列表中的数据①</li>
            <li>无序列表中的数据②</li>
            <li>无序列表中的数据③</li>
        </ul>
    <h2>二级标题</h2>
    <a href="https://blog.csdn.net/weixin_41261833">我是一个超链接</a>
        <ol>
            <li>有序列表中的数据①</li>
            <li>有序列表中的数据②</li>
            <li>有序列表中的数据③</li>
        </ol>
    </div>
    <h3>三级标题</h3>
    <p>这是定义的第一个段落</p>
    <p>这是定义的第二个段落</p>
    <p>这是定义的第三个段落</p>
    
    <span>这是定义的第一个行内元素。</span>
    <span>这是定义的第二个行内元素。</span>
    <span>这是定义的第三个行内元素。</span>
    
    <img src="https://i.loli.net/2020/05/30/Z5XrPidptFDb2BA.jpg" alt="加载失败">
    </body>
    </html>
    

    结果如下:
    在这里插入图片描述
    好了,本文就讲述到这里。希望你看了本文以后,以后再遇到爬虫,每当看到这些标签,你就能大致知道它是什么就行。


如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^