神经网络训练gpu占用率低

img

img

用的是九天毕昇的v100云计算,开了pinmemory,numwork设的是8,占用率只有10几,还不如笔记本3060算的快

1.看下CPU情况,是不是显卡没调用起来,不至于说比3060还慢,毕竟v100算是目前顶级专业计算卡了,吞吐量在那里呢,3060拍马也赶不上的。
2.确认下是不是在加载数据阶段,此阶段显卡利用率第很正常。
3.另外就是你这里的性能瓶颈在硬盘了,你的数据集图片很小,数量多,从硬盘加载速度太慢赶不上显卡计算速度,而你自己笔记本可能是固态,加载速度快所以计算速度也快。这种服务器平台都是为了一些大数据集用的,此时的性能瓶颈在显卡算力。
所以都不好说,只能一个一个去排除。按理来说

你这模型就小啊,说明你还可以放大batch_size,你把batch_size提高4倍看看

你啥模型,参数几多,两三层模型GPU估计就这样

cpu问题!

batchsize搞大点

占用率低怎么了..... 你的目标是什么
单纯的提高占用率意义不大吧 你是想加速训练 还是查找代码问题
百度有很多加速的trick 代码问题可以debug