cuda-fp16 api调用问题

我想使用半精度计算,目前运行环境是win7 64位,gpu是泰坦x,我想尝试调用 cuda_fp16.h 里的__hisnan()、__hadd()等函数。
调用:
const half KZero = float2half(0.0);
const half aa = __float2half(1.0);
const half bb =
hadd(KZero, aa);
提示:
error : no suitable conversion function from "const half" to "int" exists。
我发现__hadd()函数不仅在cuda_fp16.h里有声明,在device_functions.h里也有声明,当我调用这个函数的时候我感觉总是调用device_functions.h里的这些函数。
请教:
请问有人知道问题所在吗?我怎么才能正确使用这些api函数呢?

http://blog.csdn.net/xuxiatian/article/details/51968570