pytorch双卡训练单卡推理报错, 出现如下错误:
CUDA: invalid device ordinal
将batchsize改为1就不再报上述错误,这个问题应该如何解决?
该回答引用NewBing,仅供参考,不保证完全正确
根据您的描述,您在使用PyTorch双卡训练单卡推理时出现了CUDA: invalid device ordinal错误。这个问题可能是由于您的代码中指定了不存在的GPU设备导致的。¹
解决办法是在代码中指定正确的GPU设备,或者使用以下命令来指定GPU设备:¹
CUDA_VISIBLE_DEVICES=0 python your_script.py
源: 与必应的对话, 2023/6/21
(1) CUDA error: invalid device ordinal解决办法 - 知乎 - 知乎专栏. https://zhuanlan.zhihu.com/p/605914135.
(2) python - Invalid device Ordinal , CUDA / TORCH - Stack Overflow. https://stackoverflow.com/questions/50783853/invalid-device-ordinal-cuda-torch.
(3) 在pytorch中指定显卡 - 知乎 - 知乎专栏. https://zhuanlan.zhihu.com/p/166161217.
1.比较吃GPU显存
2.想要达到相同的精度,batchsize越大,则epoch越多
3.容易收敛到一些local minimum(局部最优)