1.服务器端编号为1的显卡在没有程序运行的情况下有约7G的显存占用,nvidia-smi输出没有进程运行,查找/dev/nvidia1相关的进程也没有输出
2. 通过nvidia-smi --gpu-reset -i 1也无法进行重启,提示有程序占用
3.通过nvidia-smi查找相关的compute process,发现一个pid为55279的程序占用,但程序名为unknown,执行kill命令提示进程不存在,即已经killed的进程占用显存
4.服务器多人使用短期无法重启,希望通过命令修复