问题:nvidia-smi不起作用了
错误提示:
Failed to initialize NVML: Driver/library version mismatch
NVML library version: 535.86
系统环境:Ubuntu20.04
目前尝试的办法:在网上找了好多解决办法都没有用,我尝试卸载cuda12.2,进入cuda12.2的bin目录下发现连卸载脚本都没有
使用网上的教程提示
显卡驱动没安装不识别显卡
【以下回答由 GPT 生成】
解决方案:
这个问题通常是由于Nvidia驱动程序和nvml库版本不匹配导致的。您可以尝试以下步骤来解决此问题:
bash nvidia-smi
如果未安装驱动程序,请按照以下步骤安装:
bash sudo apt update sudo apt install nvidia-driver-<version>
请将<version>
替换为您所需的Nvidia驱动程序版本号。
卸载任何先前安装的CUDA版本。如果您找不到卸载脚本,您可以按照以下步骤手动卸载CUDA:
删除CUDA安装目录以及/usr/local/cuda
目录下的所有文件和文件夹。
bash sudo rm -rf /usr/local/cuda
从/etc/ld.so.conf.d/
目录中删除任何与CUDA相关的配置文件。
bash sudo rm /etc/ld.so.conf.d/*cuda*
从.bashrc
或.bash_profile
文件中删除任何CUDA相关的环境变量。
bash nano ~/.bashrc
请根据需要删除与CUDA相关的行。
重新加载bash配置。
bash source ~/.bashrc
确保安装了正确版本的nvml库。您可以通过以下命令检查:
bash ls /usr/lib | grep libnvidia-ml
如果未安装,请按照以下命令安装该库:
bash sudo apt update sudo apt install libnvidia-ml-dev
bash sudo ldconfig
bash sudo reboot
nvidia-smi
命令来检查问题是否已解决。如果上述步骤没有解决问题,可能是由于其他原因引起的。您可以尝试重新安装Nvidia驱动程序,或者向Nvidia官方技术支持寻求进一步的帮助。
希望这些步骤可以帮助您解决问题。如果有任何疑问,请随时提问。
【相关推荐】