重装系统后,原本正常的程序跑的很慢,GPU利用率很低。

显卡rtx3080, 显存10g,环境是TensorFlow-gpu2.5.0,对应的cuda11.2,cudnn 8.1.0。
重装系统后,原来正常可以跑完的程序,现在变得很慢,GPU利用率只有20左右,而且越跑越慢,最后自己停止。
更新了驱动也没有变化,请问是什么原因导致的。

img

img

嗯,你用的是重装系统,你重装的是Win 11还是Win 10?

大致方向:
1、驱动问题
虽然你已经更新了驱动程序,但是可能仍然存在一些问题。可以尝试卸载并重新安装NVIDIA驱动程序,以确保它与你的GPU和系统兼容。另外,可以尝试在NVIDIA控制面板中禁用一些不必要的预览和实验性功能,以改善性能。
2、CUDA和cudnn版本不匹配
你使用的CUDA版本为11.2,cudnn版本为8.1.0,但这些版本之间可能存在不兼容性。你可以尝试升级或降级CUDA和cudnn版本,以确保它们相互兼容。
3、系统配置问题
可以检查你的CPU、内存和硬盘等硬件配置是否满足TensorFlow的要求。另外,还可以尝试在程序中添加一些调试信息,以了解程序在运行过程中是否遇到了什么问题。

首先检查你的TensorFlow-gpu版本和CUDA版本是否匹配,导致无法充分利用GPU的能力,其次你的输入数据处理或者模型结构存在瓶颈,导致GPU无法充分发挥作用,或者是你的系统设置或者环境变量存在问题,导致GPU无法正常工作,最好排查下

有几个可能的原因导致您的程序在重装系统后变得很慢,并且GPU利用率低下:

CUDA和cuDNN版本不匹配:确保您的CUDA和cuDNN版本与您所使用的TensorFlow-GPU版本兼容。不匹配的版本可能导致性能下降。

TensorFlow版本不兼容:确保您的TensorFlow-GPU版本与您的CUDA和cuDNN版本兼容。有时新版本的TensorFlow可能会引入一些性能问题。

驱动程序问题:尽管您已经更新了驱动程序,但仍有可能存在问题。尝试卸载显卡驱动程序并重新安装最新版本的驱动程序,确保其与您的显卡和其他组件完全兼容。

系统设置:检查系统设置,确保您的显卡在高性能模式下运行,并且没有其他应用程序或进程占用了显卡资源。

硬件问题:检查硬件连接,确保显卡和其他组件正确连接。如果可能,尝试将显卡安装在不同的PCIe插槽上,以排除潜在的硬件问题。