谁能提供opencl 传输数据太慢的优化方案

在用imx6d上用gpu进行计算, 把数据传输给GPU时,或者从GPU下载数据是,2M的数据用了40MS,严重拖处理速度,有什么办法能优化一下,最好有代码。

https://blog.csdn.net/china_video_expert/article/details/22991995

2m的数据用了20ms ,简直无法做优化了。建议跟设备商反映