基于CNN的单通道人脸表情识别开题报告

 2021-12-18 19:40:59

全文总字数:4071字

1. 研究目的与意义(文献综述)

人脸表情作为人际交往中重要的非语言类方式,可以传达重要的信息且所占的信息比重还大,过分析人的表情有助于理解人们的自身状态、心理活动等。所以人脸表情识别自然而然的成为了人工智能领域中不可或缺的一部分,也吸引了更多的人来研究人脸表情识别。该识别技术涉及到图像处理、机器视觉、心理学等多个学科,研究起来比较复杂。而且人脸表情还容易收到来自环境光照、角度、性别等多种因素的影响,在现阶段仍有诸多的难题,精确的提取图像并进行较好的识别,复杂性高、难度大。但它的应用场景却很广泛,主要应用在安全、医疗、交通及人工智能等相关领域。因此,在充分考虑人脸表情识别重要的理论价值和实际的应用价值前提下,有理由相信人脸表情识别技术是一个研究热点。

卷积神经网络(convolutional neuralnetworks, cnn)是一类包含卷积计算且具有深度结构的前馈神经网络(feedforward neural networks),是深度学习(deep learning)的代表算法之一 。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariantclassification),因此也被称为“平移不变人工神经网络(shift-invariantartificial neural networks, siann)”。2012年,hinton和他学生所展示的alexnet卷积神经网络在imagenet图像分类比之前任何算法表现都要优异的情况下,深度学习进一步得到了更多人的认可。深度学习在图像分类与识别方面有着天然的优势。首先,深度学习不需要人为的去定义图像特征,这就很好的避免了“因人而异”的影响因素,同时,深度学习在特征提取方面做得更加的全面,把图像输入到深度学习网络,它就能自动提取图像特征并进行分类识别。伴随着大数据的发展和计算机计算能力的提高,深度学习在图像识别上的效果会更好,因此,采用深度学习作为人脸表情识别的方法能避免人为因素且在识别率方面能够做得更加优异。

现阶段世界各地的科研机构和研究人员都对人脸表情识别技术做出了很多新贡献。2007年,美国mit大学多媒体实验室开发的一种智能机器人,不仅能够实现人脸面部表情的识别,还能根据表情做出相应的回应;2010年,ck (the extended cohn-kanade datast)表情数据库在原ck(cohn-kanade datast)数据库基础上扩展而来,其中包含123个对象,593个图像序列;2014年,liu等人开发了一个基于bdbn(boosted deepbelief network)模式的自动人脸表情识别系统,该方法试图在循环过程中执行特征学习、特征的选择及分类器的构建;2017年,a.t.lopes等人提出了一个结合卷积神经网络与特定的图像预处理的人脸表情识别系统,通过图像预处理去除了与表情特征无关的人脸信息,大大提高了识别率。以深度网络为基础的人脸表情识别,通过多层卷积和积分提取表情的非线性特征,在几种数据集上获得了更高的准确率。深度学习的成功,促进了世界各国研究学者的迈入,相关的科研成就也越来越丰厚。

国内关于人脸表情识别方面的研究,最早开始于清华大学、中国科技大学、哈尔滨工业大学等高校的研究机构。1997年,哈尔滨工业大学的高文教授等人首次将人脸表情识别技术引入我国;2006年,国家自然科学基金正式成立对人脸表情识别的研究,表情识别热潮进一步推动;2011年,中科院的王兆琪研究团队所研发的新型机器人,能够根据相信的反馈做出不同的表情和动作;2014年,香港中文大学的汤晓鸥团队,利用深度学习来研究人脸表情识别等技术;2017年,东南大学的唐传高等人以一篇基于深度学习的算法论文在人脸表情识别领域的竞赛中获得了冠军。从国家自然基金对人脸表情识别研究立项至今,国内多所高校和科研机构参与了人脸表情识别相关课题的研究,取得了丰厚的成果。尽管这些研究所取得的成果还没转为商业应用,但对人脸表情识别技术的发展起到了极大的推动作用。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基于深度卷积网络的单通道人脸表情识别就是指通过训练单通道卷积神经网络来进行人脸表情识别的一种方法,利用其自动学习特征提取的能力,可以更加有效的提取表情特征并避免一些人为设计提取特征的一些常见问题。旨在通过计算梯度下降的最优步长来加速模型的收敛速率,同时适当放大卷积神经网络浅层权值的调整能力,分层分阶段的调节学习率来缓解模型参数容易陷入局部极值的困境,来提高整体的表情识别率。同时像CK 等带有标签的人脸表情库可以为实验提供充足的数据,从而避免深度学习常见的过拟合问题。具体来说就是,基于深度卷积网络,利用Matlab构建卷积网络结构并完善,通过训练算法找到性能最优的网络结构后进行表情识别测试。计划是构建一个单通道的卷积网络结构,卷积层用于特征提取,能将特征逐级抽象,卷积层后面的池化层,可以防止过拟合及减少数据量以便训练网络结构,同时采用ReLU激活函数引入生物特征,从而提高人脸表情识别率,之后就是全连接层,用于表示人脸表情特征,最后进行分类处理。同时在最终输出层采用损失函数,对表情特征进行约束,提高算法识别率。而后使用Adam优化算法,不断更新每一层权值参数来训练网络。最后在一些知名的带标签表情库(JAFFE、CK )进行训练和测试,从而得出网络的识别性能。

3. 研究计划与安排

第1周—第4周 搜集资料,撰写开题报告;

第5周—第6周 论文开题,硬软件总体设计;

第7周—第12周 分步实施,实验及分析,撰写论文初稿;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]王敏峻.基于深度学习的人脸表情识别[d].内蒙古:内蒙古大学,2019.

[2]何嘉利.基于深度学习的表情识别[d].南京邮电大学,2017.

[3]刘衍琦, 詹福宇, 蒋献文, 周华英. matlab 计算机视觉与深度学习实战[m]. 电子工业出版社,2017. [4]alsmadim. facial recognition under expression variations[j]. int. arab j. inf.technol., 2016,13(1a): 133-141.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版