如何把kinect获取的骨骼信息和视频里人的骨骼信息作对比?

在做一个运动动作纠正的项目,想要识别真人动作和视频里人物动作相差多少,可以用什么方法?
如何把kinect实时获取的骨骼信息和视频叠加一起看?
感谢!