全文总字数:5554字
1. 研究目的与意义(文献综述)
目的和意义:
人与自然界的交互是多种多样的,对于一个正常人来说通过视觉、味觉、嗅觉、听觉等来理解世界是一种本能,但对于机器来说却完全不同,人类可以很轻易的分辨出面对你招手的朋友是在招手还是在伸懒腰,但对于机器来说理解人类的行为和意图都是十分困难的。尤其是在很多情况下机器获得信息的唯一途径是图像,当信息获取的途径减少,理解真实的行动和意图的难度也会大幅度上升,也意味着通过图像分析理解人的姿态具有十分重要的价值和意义。
人体姿态估计是目前是一项在实际应用当中不断成熟的技术,其市场的需求不断增加,应用场景也在不断地被挖掘。想象一下,一辆自动驾驶汽车正驶向拥挤的城市交叉路口的场景。识别正在移动的行人,并预测行人或一群行人可能在几秒钟内的位置,以决定是否和何时刹车显得很关键。再想象一个机器人在博物馆或挤满行人的购物中心担任导游。机器人识别周围人的方位和位置是很重要的,可以提供更好的引导,避免撞到行人。在这些场景中,准确的行人姿态和位置预测对于促进更有效的人机交互和车辆避碰有着巨大的影响。在某些场景下,如电影中人物特效的制作、需要部署多个传感器才能使用的vr设备,3d人体姿态估计拥有很高的准确率,因为在这些情况下拥有多视角图像,并且人体没有遮挡情况。而本文集中于单视角视频或图片、自然情况下的3d人体姿态估计和预测。
2. 研究的基本内容与方案
基本内容与目标:
从图像序列中对人体进行3d姿态估计并实现对人体3d姿态进行预测,具体包括以下内容:
(1)利用已有的3d人体模型数据,学习人体的3d先验知识,实现从图像序列中对人体进行3d姿态估计。
3. 研究计划与安排
(1)2018/2/24—2018/3/1:毕业设计开题报告、工作计划表编制与开题报告会;
(2)2018/3/2—2018/4/30:学习对应语言、完成开发任务、系统测试与完善;
(3)2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1]李超. 基于卷积神经网络的人体行为分析与步态识别研究[d].杭州:浙江大学,2018
[2]julieta martinez, rayat hossain,javier romero, and james j. little.asimple yet effective baseline for 3d human pose estimation. in iccv, 2017.
[3]gyeongsik moon, ju yong chang, kyoungmu lee.camera distance-aware top-downapproach for 3d multi-person pose estimation from a single rgb image. in iccv,2019.
