如何用opencl去实现AES256

小弟想用opencl去开发一个使用gpu去加解密AES256(明文128bits,秘钥256bits),
但是现在毫无头绪。
手上虽然有一份cpu实现aes256的程序,但是不知道如何去写成opencl版本
希望大家给一些实用性的建议和帮助。