1. 研究目的与意义
各种智能系统在生活中的应用越来越普遍。智能系统中经常需要身份识别以便提供个性化服务。身份识别中主要是通过一些具有个人身份特征的事物来鉴别,比如证件、钥匙等身份标识物品,或者是用户名和密码。但是传统的身份鉴别方法缺点是相当明显的:身份标识物品容易丢失或被伪造,密码容易被遗忘。如果利用每个人本身的生物特征如人脸特征,指纹等等就能达到相当好的效果。近年来兴起的人脸识别[1]在众多生物识别方法中应用最为广泛。在国外,人脸识别技术早已被大量使用在国家重要部门以及军警等安防部门。在国内,对于人脸识别技术的研究始于上世纪90年代,目前主要应用在公安、金融、网络安全、物业管理以及考勤等领域。人脸识别是机器视觉[2]和模式识别领域最富有挑战性的课题之一,同时也具有较为广泛的应用意义。人脸识别技术是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别、计算机视觉、神经网络[15]、心理学、生理学、数学等诸多学科的内容。如今,虽然在这方面的研究已取得了一些可喜的成果,但是人脸识别技术在实际应用中仍面临着很严峻的问题,因为人脸五官的分布是非常相似的,而且人脸本身又是一个柔性物体,表情、姿态或发型、化妆的千变万化都给正确识别带来了相当大的麻烦。如何能正确识别大量的人并满足实时性要求是迫切需要解决的问题。
人脸识别研究开始于1966年pri的bledsoe的工作,1990年日本研制的人像识别机,可在1秒钟内中从3500人中识别要找的人。1993年,美国国防部高级研究项目署和美国陆军研究实验室成立了feret(facerecognitiontechnology)项目组,建立了feret人脸数据库,用于评价人脸识别算法的性能。美国陆军实验室也是利用vc 开发,通过软件实现的,并且误识率(false accept rate,简称far)为49%。在美国的进行的公开测试中,far为53%。美国国防部高级研究项目署利用半自动和全自动算法。这种算法需要人工或自动指出图像中人的两眼的中心坐标,然后进行识别。在机场开展的测试中,系统发出的错误警报太多。
北京科瑞奇技术开发股份有限公司在2002年开发了一种人脸鉴别系统,对人脸图像进行处理,消除了照相机的影响,再对图像进行特征提取和识别。这对于人脸鉴别特别有价值,因为人脸鉴别通常使用正面照,要鉴别的人脸图像是不同时期拍摄的,使用的照相机不一样。系统可以接受时间间隔较长的照片,并能达到较高的识别率,在计算机中库藏2300人的正面照片,每人一张照片,使用相距1--7年、差别比较大的照片去查询,首选率可以达到50%,前20张输出照片中包含有与输入照片为同一人的照片的概率可达70%。2005年1月18日,由清华大学电子系人脸识别课题组负责人苏光大教授主持承担的国家“十五”攻关项目《人脸识别系统》通过了由公安部主持的专家鉴定。但是随着深度学习[3]的发展,卷积神经网络(convolutional neural networks,简称cnn)[4]也越来越在图像处理[5]、视频、语音和文本中取得了突破。在2012年举办的大规模视觉挑战赛中,卷积神经网络的算法取得了非常不错的成绩。从此卷积神经网络成为这一比赛的主流算法。图像识别所取得的最好成绩都是由深度卷积网络[6]相关的算法创造的。从侧面反映了深度卷积网络在计算机视觉[12]方面的良好性能。
2. 研究内容和预期目标
一、研究内容
(1)了解并掌握cnn的基本知识和基本原理:通过学习cnn的基本原理,以构建卷积神经网络模型。
3. 研究的方法与步骤
1.cnn的基本原理
卷积神经网络[11]属于神经网络范畴,lenet是推进深度学习领域发展的最早的卷积神经网络之一,其主要有四个操作:卷积、非线性处理、池化和分类。这些操作对于各个卷积神经网络[14]来说都是基本组件。下面对这些操作进行原理分析:
(1)卷积
卷积神经网络的名字就来自于其中的卷积操作。卷积的主要目的是为了从输入图像中提取特征。卷积可以通过从输入的一小块数据中学到图像的特征,并可以保留像素间的空间关系。每张图像都可以看作是像素值的矩阵。考虑一下一个5 x 5的图像,它的像素值仅为0或者1(注意对于灰度图像而言,像素值的范围是0到255,下面像素值为0和1的绿色矩阵仅为特例):
4. 参考文献
[1]张雯, 王文伟. 基于局部二值模式和深度学习的人脸识别[J]. 计算机应用,2015.[2]关胜晓. 机器视觉及其应用发展[J]. 自动化博览, 2005.[3]孙志军,薛磊,许阳明, 王正. 深度学习研究综述[J]. 计算机应用研究,2012. [4]肖柏旭. 基于卷积网络的人脸检测的研究与实现[D]. 华北电力大学硕士论文,2009. [5]许可. 卷积神经网络在图像识别上的应用的研究[D]. 浙江大学硕士论文, 2012.[6]张浩,吴秀娟. 深度学习的内涵及认识理论基础探析[J].中国电化教育,2012. [7]陈先昌. 基于卷积神经网络的深度学习算法与应用研究[D]. 浙江工商大学硕士论文,2013.[8]孙银黎. 对深度学习的认识[J]. 绍兴文理学院学报, 2007.[9]张翠平, 苏光大. 人脸识别技术综述[J]. 中国图象图形学报, 2000.[10]赵志宏, 杨绍普, 马增强. 基于卷积神经网络LeNet-5的车牌字符识别研究[J]. 系统仿真学报,2010.[11]陈耀丹, 王连明. 基于卷积神经网络的人脸识别方法[J]. 东北师大学报(自然科学), 2016.[12]王珏, 石纯一. 机器学习研究[J]. 广西师范大学学报(自然科学版), 2003.[13]H. Li , Z. Lin , X. Shen, J. Brandt and G. Hua.A Convolutional Neural Network Cascade for Face Detection [C].CVPR,2015.[14]Ross B. Girshick.Fast R-CNN [C].ICCV,2015.[15]Matthew D Zeiler,Rob Fergus.Visualizing and Understanding Convolutional Networks[C].ECCV,2014.
5. 计划与进度安排
(1) 2022/02/18-2022/02/25 查阅论文资料;(2) 2022/02/26-2022/03/05 进行理论分析和开题报告撰写;(3) 2022/03/06-2022/03/20 CNN框架搭建与外文翻译;(4) 2022/03/21-2022/04/20 方法实现与算法调试;(5) 2022/04/21-2022/05/20 软件测试与论文初稿撰写;(6) 2022/05/21-2022/06/18 完成毕业论文全部资料并参加毕业论文答辩。
