我用的cuda8,0,GPU N960, 对于全局内存的访问,有资料说coalesced access可能会导致错误的结果,有的则是说只是影响效率,在CPU端应该只是影响效率,但不知道GPU是否一样?
支持的,只不过coalesced access效率更高