基于视觉传感器的人体运动位姿识别技术开题报告

 2021-11-29 09:11

1. 研究目的与意义(文献综述)

随着信息时代的飞速发展,机器学习及人工智能产品不断涌入人们的日常生活,遍布人们学习,娱乐及生产生活。人体姿态估计则是人体行为识别的重要组成,而人体姿态估计可应用在安全监控,医疗图像处理及日常娱乐等领域,对人们的生活产生不可或缺的影响。

人体姿态估计是近年来在计算机领域一大具有难点及挑战性的研究热点,所谓计算机视觉,就是让计算机去学习并模仿出人的视觉功能,按照人们的期望来观察及分析世界,为人们提供方便便捷的服务。人工智能的发展,近年来数字相机,智能手机、只能监控摄像等电子产品已融入人们的生活中,并成为不可替代的一部分。

实际上,在对人体姿态研究中,大多数情况下都是通过对人体骨架或关节的位置进行研究估计,进而完成对图像的人体姿态估计。但由于人体各个部位之间是由关节相连接在一起的,关节的自由度高,因此人体姿态多变而复杂,此为姿态估计领域的一大难点,除此之外,由于部位相互连接,肢体之间存在自遮挡问题;人体所在背景的复杂度也是非常具有挑战性的难点问题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

(1) 研究(设计)的基本内容

随着信息时代的进步,传统的人机交互方式已经不能满足人们随着时代发展而逐渐增高的要求,因此,人们开始把研究方向逐渐转移到人自身,因此催生了人机交互的发展,而人体位子识别作为人机交互发展的基础和前提,在如今人工智能发展迅速的时代占据越来越重要的位置,并且有比其他交互技术更明显的优点。本次设计基于深度学习中的知识研究人体运动位姿估计的算法,并且以视觉传感器作为研究的基本工具。

(2) 研究(设计)的目标

1.查阅关于姿态估计的文献资料,学习和了解有关人体姿态估计的算法,掌握相关算法的实施原理。

2.设计以人体骨骼关键点检测的算法作为姿态估计的核心算法。

3.设计训练模型,以卷积神经网络作为训练过程中的主要网络模型,熟练的掌握卷积神经网络相关的编程框架,能够利用卷积神经网络结合相应的人体姿态估计算法进行训练,最终能够得到较为准确的训练模型从而可以用来进行人体运动姿态的识别。

4.最终识别结果以二维图像为主,能够在二维图像上较为准确的描绘出图像中人体的骨骼框架。

5.以实现单人的人体运动位姿识别为主。

6.若图像中出现多人则在人体不被遮挡的前提下保证较高的识别成功率。

7.最终训练的模型用于人体运动位姿识别的正确率在0.7以上。

(3) 拟采用的技术方案及措施

本次设计主要采用人体骨骼关键点检测作为姿态估计的主要算法,选用MSCOCO或AI Challenge数据集作为神经网络的训练数据集,采用卷积神经网络作为训练的主要网络模型,以TensorFlow作为主要的工具搭建模型训练的编程框架,最终以二维图像中人体的姿势识别作为主要的成果演示。

1.首先选择人体骨骼关键点检测的算法。通过比较选择Openpose作为核心算法,Openpose是基于部分亲和域(PAFS)的一种自下而上的人体姿态估计算法。其基本原理为:为每个人体关节点预测置信图,每个关节点出都有一个高斯

峰值,得到所有的关节点检测结果后使用PAFS判断两两关节点是否可以相连,最后使用关节点聚类并连线。

训练中每个关节点的置信度为:

其中,xi是图像中行人的第i个身体关节点的真实位置,m点处的置信度为m点到真实关节点的高斯距离,σ控制波峰的扩散。

图1 人体关节点示意图

行人的15个关节点的示例如图1所示,其中,0表示头,1表示颈部,2表示肩部,3表示右肘部,4表示右手腕部,5表示左肩部,6表示左肘部,7表示右手腕部,8表示右髋部,9表示右膝,10表示右脚踝,11表示左髋部,12表示左膝盖,13表示左脚踝,14表示中心点。

2.选取训练数据集可以考虑MPII、MSCOCO或者AI Challenge数据集,其中,MPII数据集样本大小为25K,关节点个数为16,由大约25k个图像组成,为多人提供注释,提供40k注释样本。MSCOCO汇集了超过30w的样本数量,有18个关节点,包括全身图像以及多人图像。AI Challenge在样本数量上与MSCOCO相似,关节点个数设置了14个。

3.卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。卷机神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络”。

卷积神经网络主要由五种结构组成,包括输入层、卷积层、池化层、全连接层、Softmax层。卷积神经网络结构框架如下图所示:

图2 卷积神经网络架构图

卷积神经网络处理数据集的过程如下图所示:

图3 卷机神经网络学习过程

4.TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。

TensorFlow不是一个严格的“神经网络”库。只要你可以将你的计算表示为一个数据流图,你就可以使用TensorFlow。你来构建图,描写驱动计算的内部循环。我们提供了有用的工具来帮助你组装“子图”(常用于神经网络),当然用户也可以自己在TensorFlow基础上写自己的“上层库”。

最终的模型训练过程都将通过TensorFlow来完成。

3. 研究计划与安排

第1-3周:查阅相关的论文及有关资料,完成开题报告等任务

第4-6周:根据设计任务确定各个模块的编程框架

第7—9周:完成不同模块的软件设计任务

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]吴茂贵.python深度学习基于tensorflow.机械工业出版社,2018.12.

[2]郑泽宇.tensorflow实战google深度学习框架.电子工业出版社,2019.5.

[3]何之源.21个项目玩转深度学习.电子工业出版社,2018.4

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。