cuda编程计算结果与cpu不相同

具体是这样的
之前我用gpu算出来是和cpu一样的
但是我写了个单精度的函数版本,发现计算结果不一样
然后,我就还原了之前双精度版本,发现计算结果错了
我在双精度版本啥也没动,咋就根之前算得不一样呢

对比计算时中间结果的每一步的数值