1. 研究目的与意义(文献综述)
1.1 研究目的及意义
随着人工智能的快速发展,人机交互技术成为了计算机及机器人领域中极其重要的组成部分。人机交互技术是人与机器之间通过某种方式相互传递和交流信息,从而协同完成某种特定任务。经过多年的发展,人机交互技术取得了显著的进步,已经成为人工智能领域中不可或缺的一部分。按目前的发展趋势,以人为中心的人机交互技术将会取代以计算机为中心的人机交互技术。而手势识别的研究正符合这一潮流。
手势识别为许多设备提供了人机交互的方式。采用手势操作设备,首先需要预设手势对应的控制指令,然后利用拍照、视频切割等方法,采集不同的手势,最后设备识别出手势所代表的指令,控制设备从而达到人机交互。手势识别技术一般可以分为手势区域检测和手势识别两个环节。但是由于不同人的手势不尽相同,并且同一手势可以表示多种意义,因此基于视觉的手势识别成为一项难度较大,涉及领域较广的研究内容。
2. 研究的基本内容与方案
卷积神经网络是一种深度神经网络,作为深度学习的一个重要分支,卷积神经网络近年来已经成为图像和语音识别领域的研究热点。将卷积神经网络应用于手势识别,能直接把图像数据输入网络,且不用进行复杂的前期预处理。本课题综合深度学习算法,采用卷积神经网络对普通摄像头拍摄的静态手势图像进行检测与识别,在深入研究基于卷积神经网络的手势识别模型的理论基础上,对算法进行编程仿真。
手势识别的算法流程大致可分为几个步骤:图片输入,特征提取,手势识别。其中特征提取部分又可以细分为图像预处理,之后进行边缘特征和骨架特征的提取,再融合特征。其具体流程图如下:
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础,确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。
第6-9周:编程实现各算法,并进行仿真调试。
4. 参考文献(12篇以上)
[1]殷倩倩.基于计算机视觉的静态手势识别[d].上海:复旦大学,2014.
[2]陈先昌.基于卷积神经网络的深度学习算法与应用研究[d].杭州:浙江工商大学,2013.
[3]biswas k,basu s.gesturerecognition using microsoft kinect[c] //5th international conferenceon automation,robotics andapplications,wellington,new zealand,2011:100-103.
