yolov5模型训练问题

在训练刚开始至图片位置时停止卡了快一个钟了也不动,用cpu训练秒开

img

环境为cuda11.8
cudatoolkit 11.6
python 3.7
pytorch 1.7.0+cu101
torchvision 0.8.1+cu101
gpu是rtx 3070ti laptop

你的pytorch的cuda版本选错了,torch1.7.0是支持cuda11.x的,但是你下载的是cu101,这个就表示支持的cuda是10.1。但是你环境里面的cuda是11.x(30系显卡不支持cuda11.0以下的版本),所以运行不了。你需要换个cuda11.0的torch就行。另外,torchvision 0.8.1+cu101这个是torch1.7.1的,不匹配会报错的。
详细的信息可以看

img


如果pip安装失败,可以去pip后面的那个网址,使用迅雷下载到本地用pip安装wheel包。另外,我不是很建议将cuda安装在conda的虚拟环境中,最好也是迅雷下载单独安装,然后将cudnn复制到cuda路径下面即可通用。

问题已解决
http://t.csdn.cn/hoPml
原因为30系显卡对该版本pytorch不兼容