之前在cuda7.5,Tesla p40,vs2010下开发的 cuda程序运行正常。但现在gpu换成了v100,于是将cuda版本也换成了 cuda10.2,vs换成vs2013 ,将之前的源代码重新编译,发现必须要将项目配置中cuda c/c++中的“是否生成gpu调试信息”设置为是,程序运行的结果才正确,但是运行速度明显变慢了很多。如果设置为否,运行速度和之前一样,但结果又不正确。请问各位专家怎样快速解决呢。其实只要程序运行结果正确,速度和之前p40一样就行,不一定非要基于v100深度优化