看官方的文献说明是FBFFT的基础就是用的CUFFT但是较之好像有改进的地方,我没有找到相关的文献说明。还有就是FBMM矩阵运算相比较于CUBLAS transpose+CUBLAS GEMM又有改进的地方。有大神知道这些改进在哪吗?我读源码还没有读出来。。。。求大神点醒。
感觉很厉害的样子。。。。。。。。