各位大佬好,大四CV方向的留学狗,刚接触深度学习,毕设准备做使用监控摄像头实时检测人体动作和异常检测,请问大佬们有推荐的相关算法吗?
现在暂时打算用YOLO和openpose做,大佬们有什么建议吗。
首先表扬你一下,你的思路是没有问题的。采用YOLO和openpose的做法对付毕业肯定是不成问题的。
下面主要来分析问题:
因为你是想做动作识别和异常检测,其实最重要的就是动作识别,因为如果动作识别或者说分类出来了,就直接判断是否是异常情况。因此你的关键任务应该是在动作识别。
具体做法:
由于你是要对人的动作进行识别,所以一般分两步来做:先检测图片中人的位置(矩形框),在判断该位置处人的动作。因此你要深度学习来做的话,你的任务也就是两部分:深度学习目标检测+动作识别
所以你采用YOLO和openpose的方法是没有问题的。当然,你也可以选用其他的目标检测算法,比如faster rcnn,ssd等,具体选择在于你对速度和精度的权衡。
流程
a) 输入图像;
b) 从输入图像中检测部分边界框;
c) 检测出肢体;
d) 区分图中每个人。
给你推荐一篇论文https://link.zhihu.com/?target=http%3A//taikisekii.com/PDF/Sekii_ECCV18.pdf
这篇论文的方法是先将图片分割为较小的网格,使用较小的网络对每一幅网格图片进行单次物体检测范例,之后通过区域提议(region proposal)框架将姿态检测重定义为目标检测问题。
之后,使用单次CNN直接检测肢体,通过新颖的概率贪婪解析步骤,生成姿势提议。
区域提案部分被定义为边界框检测(Bounding Box Detections),大小和被检测人身材成比例,并且可以仅使用公共关键点注释进行监督。
整个架构由单个完全CNN构成,具有相对较低分辨率的特征图,并使用专为姿势检测性能设计的损耗函数直接进行端到端优化,此架构称为姿态提议网络(Pose Proposal Network,PPN)。PPN借鉴了YOLO的优点。
希望能帮到你