1. 研究目的与意义、国内外研究现状(文献综述)
课题意义:
情绪认知是人与生俱来的能力,情绪认知包含情绪识别和情绪表达两个方面,在情绪表达中,面部表情发挥着重要作用,根据心理学家mehrabian的研究发现,在人们日常交际的过程中,面部表情传递的信息高达55%,而语言只占7%。此外,面部表情还反映了一个人内心的真实情感和意图。在机器学习融入到我们社会生活方方面面的时代,表情识别不仅能够应用于智能家居、智慧城市、智能医疗等领域,而且对促进人类社会信息化交流有着极大的意义。面部表情是人类交际的重要手段,面部表情情感识别是机器学习的热门研究方向,具有重要的理论意义和广泛的研究价值。
按照对数据标记的数量分类,机器学习算法可分为单标记学习(single-label learning)算法和多标记学习(multi-labellearning)算法,单标记学习基于每个示例只被赋予一个标记,多标记学习基于多个标记同时被赋予给同一个示例。无论单标记学习还是多标记学习本质上都是在回答“哪些标记描述了示例”这个问题,虽然多标记学习可以处理标记不确定的情况,使得答案可以同时包含多个标记,但是这两种学习方式都无法解决“标记描述示例的程度是怎样的”这一问题,在这个问题上,标记对示例描述程度的相关重要性是关键,并且在现实世界中,带有标记相关重要性的数据十分普遍。在人脸表情情感识别中,人的情感通常是多个基本感情(如开心、悲伤、惊讶、恐惧、气愤、恶心)的混合表达,所有基本情感的不同表达程度构成了情感分布。如果把具有最高表达程度的情感或者表达程度高于某个阀值的情感当作正确的标记,那么该问题就可以看作是单标记学习或者多标记学习问题,但是这样的处理方式会丢失掉相关情感的表达程度这一重要信息。而耿新于近年来提出的新的机器学习范式—标记分布学习(label-distribution learning)可以很好的解决这一问题。
2. 研究的基本内容和问题
研究目标:实现并比较三个算法在人脸情感识别上的性能表现:
1、基于局部标记相关性的标记分布识别方法(label distribution learning by exploiting sample correlations locally,ldl-scl)
3. 研究的方法与方案
研究方法:
1、学习机器学习相关知识,以及标记分布学习的理论基础;
4. 研究创新点
人脸表情识别不是新颖的话题,本毕业设计的创新之处在于使用标记分布学习这一新进提出的机器学习范式。标记分布学习的概念最早在2010提出,是耿新团队为解决人脸年龄估计中训练数据不足以及如何更好地利用年龄之间相关性的问题时提出,并提出了相关算法,由于标记分布学习的方法可以充分利用相似图片以及相邻年龄标记之间的关系,因此取得了较好的估计效果。人脸表情情感识别面临的问题不仅是哪些情绪与面部表情相关,而且要知道每种情绪对表情的描述程度,但是当标记太过复杂时,会出现模型因为自身描述能力不够而无法完全拟合数据集的问题。本文实现的三个算法:ldl-scl、ldl-sf、edl-lrl算法都旨在解决这些问题,三个算法都是18年以来的研究成果,尚未有学者比较性能,本文在各种性能指标上做出横向比较,探索出当前最适合用于人脸表情情感识别的算法。
5. 研究计划与进展
全部研究工作将在2020年5月初完成。阶段性安排如下:
1、2020年1月至2月中旬
这一时期为开题到假期结束,拟完成机器学习相关基础知识学习,并完成开源深度学习框架的熟悉工作。
