全文总字数:4176字
1. 研究目的与意义(文献综述)
随着智能手机和电脑的迅速普及,信息数字化已经成为大势所趋不可逆转。
主流媒体形式已经从传统的纸质媒介转移到多媒体形式。
而通信技术的迅猛发展以及计算机技术的快速演进,也使得图像和视频迅速成长为信息传播方式的中流砥柱。
2. 研究的基本内容与方案
2.1 研究的基本内容与目标本毕业设计将搭建一个卷积神经网络模型,并熟悉卷积神经网络的构建与训练流程。在此基础上,对于影响卷积神经网络性能的因素进行研究,同时借助于python tensorflow平台进行实际训练与性能测试,并尝试构建不同深度的网络,借此评估网络深度对于训练效率和实际表现的影响,最后基于实际硬件情况提出一套性价比较高的网络模型。2.2 拟采用的技术方案与措施(1) 印刷体汉字数据集的获取无论是采用传统机器学习方法,还是深度学习的方法,首先都需要收集到足够的数据。中科院开放了一套手写汉字的数据集。但是对于印刷体汉字,在国内尚未有组织机构开源数据集,所以对于训练和测试的数据集需要自行生成。另外,中文字体种类繁多,各个字体都有自己的特色,所以为了增强训练效果,使得训练结果具有更强的鲁棒性,需要对数据集进行一定的增广操作。生成汉字图片数据集的流程如图1所示。
图1 汉字图像数据集生成流程
3. 研究计划与安排
第1周:查阅相关文献资料,明确研究内容,了解研究所需技术语言和开发工具。第2周:初步搭建并熟悉开发环境,掌握搭建网络的函数与流程。第3周:确定方案,完成开题报告。第4—6周:学习深度学习在文字识别的相关理论,设计网络模型的拓扑结构。第7周:生成实验所需数据集,完成预处理工作。第8—10周:编程实现网络,并进行训练测试。第11-12周:优化网络模型,评价测试性能。第13—15周:完成并修改毕业论文。第16周:准备论文答辩。
4. 参考文献(12篇以上)
[1]张晶,李雅琴,王博文.光学字符识别(OCR)技术在内部审计中的实践应用[J].纳税,2020(14):275. [2]马景法. 基于深度学习的场景文字检测与识别[D].广州:华南理工大学,2017.[3]Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[J/OL]. arXiv preprint arXiv[4]Szegedy C, Liu W, Jia Y, et al .Going deeper with convolutions[C],Proceedings of the IEEE conference on computer vision and pattern recognition.2016:770-778[5]BAI X, YANG M, SHI B, et al.Deep learning for scene text detection and recognition[J].SCIENTIA SINICA Informationis,2018,48(5):531-544[6]陈艳,孙羽菲,张玉志.基于连通域的汉字切分技术研究[J].计算机应用研究,2005(06):246-248.[7]Ji Gan,Weiqiang Wang,Ke Lu. Compressing the CNN architecture for in-air handwritten Chinese character recognition[J]. Pattern Recognition Letters.2020(129):190-197.[8]Yunlong Huang,Zenghui Sun,Lianwen Jin,Canjie Luo. EPAN: Effective parts attention network for scene text recognition[J]. Neurocomputing.2020(376):202-213.[9]Karthick Kanagarathinam,Kavaskar Sekar. Text detection and recognition in raw image dataset of seven segment digital energy meter display[J]. Energy Reports.2019(5):842-852.[10]李小立.基于BP神经网络的印刷体汉字识别[J].智库时代,2018(45):189-191.[11]潘炜深,金连文,冯子勇.基于多尺度梯度及深度神经网络的汉字识别[J].北京航空航天大学学报,2015,41(04):751-756.[12]李俊阳,雷鑫,宋宇,赛琳伟.基于卷积神经网络的脱机单个手写汉字识别[J].智能计算机与应用,2018,8(02):92-95 99.[13]陈艳,孙羽菲,张玉志.基于连通域的汉字切分技术研究[J].计算机应用研究,2005(06):246-248.[14]柴伟佳,王连明.卷积神经网络的多字体汉字识别[J].中国图象图形学报,2018,23(03):410-417.[15]薛磊,杨晓敏,吴炜,陈默,何小海.一种基于KNN与改进SVM的车牌字符识别算法[J].四川大学学报(自然科学版),2006(05):1031-1036.
