如图用了tensflow-gpu,进行深度学习bert模型的训练,但是cpu利用率只有百分之几,GPU利用率一直是百分之0,电脑内存和磁盘则双爆炸,电脑一直卡死,五个小时了一个epoch还没训练完成,请问是什么原因呢?
可能是cuda版本和tensorflow-gpu版本不兼容,检测一下版本问题
https://tensorflow.google.cn/install/source_windows
磁盘满的化,可能卡在IO操作。 换更快的硬盘或者预先处理io操作更少的中间数据
内存8G有点小,加上IO可能出现频繁虚拟内存和内存之间数据交换。
GPU显存2G显存,你的批次是多少? 批次过低的话,GPU处理时间和CPU接近,甚至可能更差。 (例如:efficient_b0 在 i7cpu 和3060 Latop 测试, 单图都是20ms,批次上升到64批次, CPU 要2032~2064 , GPU 20~30ms)