ubuntu20.04,nvidia-smi不起作用了

问题:nvidia-smi不起作用了

错误提示:

Failed to initialize NVML: Driver/library version mismatch
NVML library version: 535.86

系统环境:Ubuntu20.04

目前尝试的办法:在网上找了好多解决办法都没有用,我尝试卸载cuda12.2,进入cuda12.2的bin目录下发现连卸载脚本都没有
使用网上的教程提示

img

img

img

显卡驱动没安装不识别显卡

【以下回答由 GPT 生成】

解决方案:

这个问题通常是由于Nvidia驱动程序和nvml库版本不匹配导致的。您可以尝试以下步骤来解决此问题:

  1. 通过以下命令检查已安装的Nvidia驱动程序的版本:

bash nvidia-smi

如果未安装驱动程序,请按照以下步骤安装:

bash sudo apt update sudo apt install nvidia-driver-<version>

请将<version>替换为您所需的Nvidia驱动程序版本号。

  1. 卸载任何先前安装的CUDA版本。如果您找不到卸载脚本,您可以按照以下步骤手动卸载CUDA:

  2. 删除CUDA安装目录以及/usr/local/cuda目录下的所有文件和文件夹。

    bash sudo rm -rf /usr/local/cuda

  3. /etc/ld.so.conf.d/目录中删除任何与CUDA相关的配置文件。

    bash sudo rm /etc/ld.so.conf.d/*cuda*

  4. .bashrc.bash_profile文件中删除任何CUDA相关的环境变量。

    bash nano ~/.bashrc

    请根据需要删除与CUDA相关的行。

  5. 重新加载bash配置。

    bash source ~/.bashrc

  6. 确保安装了正确版本的nvml库。您可以通过以下命令检查:

bash ls /usr/lib | grep libnvidia-ml

如果未安装,请按照以下命令安装该库:

bash sudo apt update sudo apt install libnvidia-ml-dev

  1. 更新动态链接器配置以使新的nvml库可用:

bash sudo ldconfig

  1. 重启系统以确保所有更改生效。

bash sudo reboot

  1. 然后再次运行nvidia-smi命令来检查问题是否已解决。

如果上述步骤没有解决问题,可能是由于其他原因引起的。您可以尝试重新安装Nvidia驱动程序,或者向Nvidia官方技术支持寻求进一步的帮助。

希望这些步骤可以帮助您解决问题。如果有任何疑问,请随时提问。



【相关推荐】



如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^