如题 用自己的笔记本(2060)跑unet和hrnet fps结果分别是15和19 用超算跑(Tesla a100)结果分别成了96和18
请问这是什么情况呢 unet的结果还正常 为什么hrnet的速度反而下降了呢 能想到的就是因为环境、系统、显卡显存存在区别 自己电脑是win11 torch1.8+cuda11.1 6g显存 超算是麒麟系统 1.10+cuda11.3 40g显存
下面附上hrnet的结果


这里的FPS下降很可能是由以下几个原因造成的:
- CUDA版本和驱动版本不同。不同的CUDA版本与驱动版本组合,会对深度学习框架的性能有较大影响。如果本地机器和超算的CUDA/驱动版本差距较大,可能导致FPS下降。
- 显卡型号和显存不同。HRNet作为较大的网络结构,对显存的需求也比较大。如果超算的显卡显存较小,在训练HRNet时可能会出现显存不足,导致FPS下降。
- 系统环境不同。不同的操作系统,如Win10/11和Linux,会对深度学习框架的运行性能有影响。如果本地机器和超算的操作系统差距较大,也可能导致FPS的变化。
- 超算的资源没有完全利用。有可能超算上的GPU资源没有完全分配给当前的训练任务,导致训练效率不高,FPS下降。这种情况可以通过修改超算的任务配置来提高FPS。
- 网络结构实现的差异。如果HRNet的PyTorch实现在不同环境下有较大差异,例如某些运算没有利用GPU加速,也会导致FPS的下降。这需要查阅HRNet的代码实现来确认。
总的来说,出现FPS差异的原因比较复杂,需要综合考虑不同环境的硬件,软件等多方面因素。你可以进一步检查两个环境的CUDA/驱动版本、显卡参数、任务配置等信息,定位更具体的FPS下降原因,并作出对应的优化措施。