1. 研究目的与意义(文献综述)
现在是一个信息时代,我们所面临的的不仅是信息数量大而杂乱,于其他信息载体而言,文字的优点不仅易于信息保存,同样也便于信息传递,正是如此,才得以让信息在时间和空间上都得到了迅速扩散。近些年来,随着科学技术的不断发展以及持续进步,文字识别的应用领域也得到相应的扩展,当前主要有文字识别和数字识别。随着互联网技术的飞速发展,计算机视觉内各个分支领域获得突破性进展,特别在图像检测,目标跟踪方向,结合卷积神经网络的图像特征提取能力,已经获得了优异的成绩,在文字识别提取方向,深度学习与传统图像分析的结合使用使得图像语义分析方向也有很大进展。
以往文字检测的基本原理是模式匹配,即将输入的文字和每个标准的文字相比较,然后计算匹配文字的相似度,将其中的最大类似度的标准文字作为识别结果。具体流程大概如下:
2. 研究的基本内容与方案
2、基本内容和技术方案
2.1基本内容
本次毕业设计内容是基于深度学习文字检测方法,输入待检测图像送入到已训练好的卷积神经网络模型中,提取图像中的文字特征,结合全卷积网络上采样并逐层融合多层特征图进行像素分割,输出得到每个像素的预测得分图。预测得分图采用双线性插值扩大和二值化处理后,直接获取预测文字候选区域的外接文字边界框作为参考文字边界框,然后进行加权补偿处理来修正参考文字边界框,最后通过筛选条件过滤掉非文字边界框得到最终的文字检测框。
3. 研究计划与安排
第1周—第3周 搜集资料,撰写开题报告;
第4周—第5周 论文开题;
第6周—第12周 撰写论文初稿;
4. 参考文献(12篇以上)
[1]王沉燕. 基于深度学习的自然场景文本检测算法研究[D]. 杭州电子科技大学, 2018.
[2]张艾萱. 基于深度学习的自然场景文本检测算法研究[D]. 北方工业大学, 2019.
[3]杨剑锋,王润民,何璇,等.基于FCN的多方向自然场景文字检测方法.计算机工程与应用,2020,56(2):164-170.
| [4]李杰. 基于FCN和特征层融合的场景文本检测研究[D].北京交通大学,2019. |
[5]李昊东. 基于全卷积网络改进的图像语义分割应用研究[D].南京邮电大学,2019.
[6]戴伟达. 基于全卷积神经网络的语义分割算法研究[D].南京邮电大学,2019.
[7]Zhang Z, Zhang C, Shen W, et al. Multi-oriented text detection with fully convolutional networks[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016: 4159-4167.
[8]Zhu Y, Yao C, Bai X. Scene text detection and recognition: Recent advances and future trends[J]. Frontiers of Computer Science, 2016, 10(1): 19-36.
[9]李倩羽. 基于深度学习的图像文字检测与识别的研究[D].哈尔滨工业大学,2018.
[10]石葆光. 基于深度学习的自然场景文字检测与识别方法研究[D].华中科技大学,2018.[11]刘战东. 基于深度学习的场景文字检测[D].中国科学技术大学,2019.
[12]马景法. 基于深度学习的场景文字检测与识别[D].华南理工大学,2017.
[13]张小爽. 基于实例分割的场景图像文字检测[D].浙江大学,2018.
[14]Zhou X,Yao C,Wen H,et al.EAST:an efficient and accurate scene text detector[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2017:2642-2651.
[16]Yin X C,Pei W Y,Zhang J,et al.Multi-orientation scene text detection with adaptive clustering[J].IEEE Transactions on Pattern Analysis Machine Intelligence,2015,37(9):1930-1937.
