VS2013 + CUDA8.0混合编程GPU速度优化问题

目前需要用boost库多线程和CUFFT,GPU型号是NVIDIA GeForce GTX 960M,GPU占用率只有10%左右。CPU(4核8线程)中的多线程和GPU中的多线程并行执行有什么关系?设计核函数的时候线程格、线程块、线程数不同会有什么影响?如何优化才能提高GPU的占用率呢?960M的GPU有5个SM,每个SM有128个SP,每个线程块中的最大线程数是1024。使用流并行的话怎么设计流的数量呢?求各路大神指点迷津,先说声谢谢。另外对CUFFT有兴趣的也可以交流一下。

你好,能不能麻烦您发下VS的安装包呢

链接:https://pan.baidu.com/s/1nuFJ3QT 密码:u8v0
密码:u8v0

你好,请问可以重新分享下嘛,显示被取消了