以双边滤波为例,如果检测到是Intel GPU则用bilateral_float4核函数,而其他GPU则用bilateral核函数,为什么对Intel GPU用浮点型,而且还能用float4,如果其他GPU能用int4 或uchar4来提升速度吗?
https://blog.csdn.net/lien0906/article/details/44171133