关于爬虫的问题,如何解决?

我写了一个爬虫来爬取壁纸,但是下载的全都是空白文件,最重要的是在别人的电脑上运行是正常的,源码也只是文件路径被改了一下,这是什么原因(解释器用的是pychart)

import requests
from lxml import etree
from urllib import request

u = 'https://www.10wallpaper.com/cn/list/mysterious_universe-space_hd_desktop_wallpapers.html'
result = requests.get(u)
data = etree.HTML(result.content)
d = data.xpath('//img')
for i in d:
    newurl = i.xpath('./@src')[0]
    newname = i.xpath('./@alt')[0]
    newname = str(newname)
    newurl = 'https://www.10wallpaper.com' + str(newurl)
    #print(newurl)
    request.urlretrieve(newurl, r'D:\pictures\\' + newname + '.jpg')
    print('<%s>下载完毕'%newname)

img

img

输出的文件不对

  • 这有个类似的问题, 你可以参考下: https://ask.csdn.net/questions/7767624
  • 我还给你找了一篇非常好的博客,你可以看看是否有帮助,链接:使用PyCharm进行远程调试:a.远程连接服务器,b.传入命令行参数和c.多线程调试(伪)(猎风习习原创)
  • 除此之外, 这篇博客: 在Pycharm中下载软件包遇到的问题及解决方法(适用小白)中的 对于一些看不懂错误信息的小白可以用下面的方法排错,最后实现下载软件包的目的 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
  • 1,打开命令行窗口,输入python看是否能出现python的运行界面,如果提示python不是内部的命令,说明没有正确安装python,需要将python添加到环境变量里,最简单的方法就是重新安装,在重新安装的时候,在安装界面勾选添加到环境变量的框即可

    2,接下来还是在命令行窗口用(pip install 需要下载的软件包的全名)此命令下载即可,如果还不能完成,可能是pip的版本过低,可使用(python -m pip install –upgrade pip)命令更新pip软件包,更新完毕后尝试重新下载,到这里,大多数错误已经排除了,可以成功下载软件包了。

    3,如果还没有成功的,可以到国内的镜像网站下载,然后导入到Pycharm.