请问Nsight Compute目前支持4090的程序运行吗?
我是用python调用pybind11编译的cuda核函数,其中用torch.extension的load功能编译cpp和cu文件。在pycharm中是可以运行的,用Nsight Compute的profile也可以运行出核函数的单个运行时间,但是System trace选项就不行。我的cuda driver版本12.0,cuda runtime版本11.7运行报错,换了几个版本也不好使
那个System trace选项不好使,但是profile选项好使,可以运行出核函数的运行时间,但是我需要观察第一个流到最后一个流的时间,所以用System trace,但是无法运行。提示报错说cl版本和gcc版本读取不到,但是我都已经放到环境变量中了,并且在pycharm中是可以运行的
不支持
看来是目前还不支持4090 4090应该是只能12.0以上的driver驱动