模型采用的是3Dresnet10。训练集的数据处理方法为,在时间上随机选取连续的64帧(不足64帧的,通过循环复制拼接前若干帧进行补齐),在空间上对同一个视频里的64帧同一进行5个位置的随机裁切(左上、右上、中心、左下、右下)、以一定概率进行垂直翻转、旋转、明暗变化;在测试集上,只进行了在时间上随机选取连续的64帧的操作。训练集1029个视频,测试集258个视频,类别一共6类。