paddlecls训练时报错

paddlecls进行图片训练,训练到一半时报错。

OSError: (External) CUDA error(719), unspecified launch failure.
  [Hint: Please search for the error code(719) on website (https://docs.nvidia.com/cuda/cuda-runtime-api/group__CUDART__TYPES.html#group__CUDART__TYPES_1g3f51e3575c2178246db0a94a430e0038) to get Nvidia's official solution and advice about CUDA Error.] (at ..\paddle\phi\backends\gpu\cuda\cuda_info.cc:259)


这是一个CUDA错误,错误代码为719。根据错误提示,你可以在NVIDIA的CUDA Runtime API文档中找到关于此错误的官方解决方案和建议。

通常,CUDA错误会发生在使用GPU进行计算时,可能是由于GPU硬件或软件配置问题引起的。以下是一些可能导致CUDA错误的常见原因和解决方案:

GPU驱动程序问题
检查你的GPU驱动程序是否已经安装并更新到最新版本。如果没有,请安装最新的GPU驱动程序,并确保其与你的CUDA版本兼容。

CUDA版本不兼容
确保你的CUDA版本与你的GPU驱动程序和使用的深度学习框架版本兼容。如果不兼容,建议升级或降级CUDA版本。

GPU硬件问题
检查你的GPU是否正常工作。可以通过运行基本的GPU压力测试程序来测试GPU是否正常工作。

CUDA应用程序问题
检查你的CUDA应用程序是否正确地使用了GPU。确保你的CUDA应用程序正确地设置了GPU设备,并使用了适当的GPU内存和线程。

如果你遇到了这个错误,可以先尝试通过重启计算机或重启你的

  • 你可以参考下这篇文章:Paddle2.0之图像增广
  • 除此之外, 这篇博客: 猫十二分类问题中的 1. 解压PaddleClas与解压数据集 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:
    • 由于pip安装paddleclas时构建python-opencv会卡,所有从github上下载paddleclas压缩包传到AI Studio上。
    • 注:由于用到解压后的paddleclas,会切换到paddleclas目录下,文件路径建议统一使用绝对路径。

    In [16]

    # 解压数据集
    !unzip -oqn /home/aistudio/data/data10954/cat_12_test.zip -d data/
    !unzip -oqn /home/aistudio/data/data10954/cat_12_train.zip -d data/
    # 解压paddleclas
    !unzip -oqn /home/aistudio/PaddleClas-release-2.2.zip
    %cd PaddleClas-release-2.2