GPU的能耗pwr显示ERR!的原因

用nvidia-smi查看GPU的状态时,一直显示下面的这种情况(能耗pwr一直显示为ERR!):

图片说明

而且在tensorflow程序里跑代码时,GPU的使用率一直是0,模型还没开始训练就结束了,也没有报错。

运行程序时的情况

想知道这是为什么?是显卡坏掉了吗?

大概率是坏了,以下代码查看具体的报错.

dmesg -l err

如果有

NVRM:***

基本凉了,联系卖家,找售后吧.

这个问题解决了,是因为cudnn版本不匹配,之前安装的cudnn5.0,需要安装cudnn5.1,气~,版本不匹配真的很伤脑筋。