最近在研究OpenCL 的Reduction操作和barrier,简单的来说就是规约算法和组间同步吧测试了一下典型的规约算法,大数组数组求和大数组找最大值测试结果发现GPU运算的结果要慢于CPU!由于刚接触,学习接触了才几周?不是很懂?有没有朋友解释一下?