由上海交通大学卢策吾团队开发的开源项目-AlphaPose,是一个多人姿态估计系统,具有极高的精准度。AlphaPose 是基于腾讯优图和卢策吾团队在 ICCV 2017 上的分区域多人姿态识别算法(RMPE),该算法主要为了解决在人物检测结果不准的情况下进行稳定的多人姿态识别问题。
AlphaPose 在姿态估计标准测试集 MSCOCO 上达到 72.3 mAP,是首个超过 70 mAP 的开源系统, 比 Mask-RCNN 相对提高 8.2%,比 OpenPose(CMU)相对提高 17%。
设计思路:综合利用了对称性空间迁移网络(Symmetric Spatial Transformer Network)和单人姿态估计算法,从而摆脱了多人姿态识别任务对人物检测准确性的依赖,并且进一步通过参数化的人物姿态表达对识别结果进行了优化。根据在公开数据集MPII上的测试结果,该算法相较CMU提出的OpenPose算法提升了1个百分点,尤其是对手肘、手腕、膝盖、脚踝等细小关键点的改善尤为明显。
应用案例:
视频姿态跟踪(Pose Tracking):为了匹配同一个人在不同帧中的姿态,团队开源了一个高效的线上姿态跟踪器(Pose Tracker)——Pose Flow。Pose Flow 是第一个在 PoseTrack Challenge 数据集上的 mAP 超过 60 (66.5 mAP) 、MOTA 超过50 (58.3 MOTA) 的线上开源姿态跟踪器(Pose Tracker)。
视觉副词识别(Visual Adverb Recognition):团队提出对视觉副词进行研究,提供了新的 ADHA 数据集,以及一个基于该姿态估计系统的算法。
扫码关注,查看更多科技成果