yolov5训练,gpu训练提示页面太小,CPU反而没事

img

img

img


使用GPU训练报页面太小的错误,用cpu反而没事两个是不同的环境,GPU是新配的环境,装了对应的torch和torchvision。

虚拟内存也有设置。

不知道你这个问题是否已经解决, 如果还没有解决的话:
  • 给你找了一篇非常好的博客,你可以看看是否有帮助,链接:Yolov5进阶之五GPU环境搭建
  • 除此之外, 这篇博客: windows下使用GPU训练yolov3模型踩坑记录中的 torch和torchvision的版本对应 部分也许能够解决你的问题, 你可以仔细阅读以下内容或者直接跳转源博客中阅读:

    兴高采烈的安装完gpu版本的pytorch,终于可以开始训练人工智障了!可是,当运行完一轮后,啪啪打脸,一个报错甩出来

    报错是这样的:

    一开始我百度半天也没解决问题,仔细看了下报错信息,里面有一句是这样的

    Could not run ‘torchvision::nms’ with arguments from the ‘CUDA’ backend. This could be because the operator doesn’t exist for this backend, or was omitted during the selective/custom build process

    这不就是torchvision的问题嘛!然后百度才发现,torchvision也是分cpu版本和gpu版本的,我一开始直接用的 pip install torchvision ,也是安装的cpu版本!也就是说我是gpu版的torch+cpu版的torchvision,不报错才怪…

    后来卸载torchvision,重新安装gpu版的torchvision,成功跑完300轮!其实仔细看安装pytorch时的命令,是一并安装了gpu版的torchvision的。

    下面秀一张跑完之后的截图

  • 您还可以看一下 刘润森老师的yolov5目标检测教程课程中的 torch-gpu搭建小节, 巩固相关知识点

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

显卡的显存不够啊,要么降低batch size,要么降低图片的imgs这个参数,自己多调整几次就可以跑了。