我的CUDA核函数中只使用了INT32和FP32的数据类型,可是在用NVprofiler拿到的profiling中:却看到使用了FP64执行单元。
请问,这是什么原因呢?另外,如何在kernel里面显式指定计算单元,比如指定使用FP64单元计算FP32指令?
https://blog.csdn.net/haima1998/article/details/78250143