Couldn’t load custom C++ ops. This can happen if your PyTorch and torchvision

乍一看是提示pytorch和torchvision版本的问题。也确实是它们的问题哈 哈 哈。但是有细节要注意了。

昨晚我用我们实验室的3090跑模型,比我的1660台式机还慢!绝了

各种控制变量,最后就是定位到GPU慢,推理慢。

最终,只有换包解决。

首先3090跟1660主机torch版本是一样的,我只能寄希望于3090的pytorch不能很好兼容cuda。毕竟3090出来的时候,cuda差不多已经是11了。

于是去官网下载torch1.8.0+cu111,因为3090本机装了cuda11.1.所以就下了这个,期望包自带的cuda能和我安装的11.1对应起来。之前的版本是torch1.7.0+cu11.0。

这就是需要注意的细节了!

torch 的版本号是1.8.0+cu111

img

所以torchvision也得是0.9.0+cu111,而不是0.9.0

我就是直接pip install torchvision==0.9.0,出现题目提到的错误,理所应当以为我的torch就是1.8.0,cu111只是一些附带的东西。

所以结论就是torch和torchvision匹配的版本应该是
torch1.8.0 &&& torchvision 0.9.0
torch1.8.0+cu111 &&& torchvision 0.9.0+cu111

我直接pip install torchvision==0.9.0+cu111找不到包,可能名字有点小区别,直接去pytorch源下的
如果慢了可以去对应的国内镜像源找找