微小字符的图像识别算法的研究与实现开题报告

 2021-11-20 22:56:39

1. 研究目的与意义(文献综述)

目前,随着电子、信息技术的发展,各类电子设备在追求高算力的同时也有对设备便携性的需求。电子设备往往由高性能芯片驱动,芯片的高集成度又决定了其体积小的特点。在芯片的实际生产过程中,厂商在每一个芯片表面打印芯片标识,标识由英文字母与数字组成,且一般具有统一的印刷字体。在工业应用环境下,芯片标识有利于后续对芯片的质量检测、分流、跟踪等工序,因此,利用机器视觉技术,高效、准确的自动识别芯片表面标识成为一个重要的环节。

光学字符识别(optical character recognition, ocr)是目前主流的字符自动识别技术,其概念起源于十九世纪三十年代,并在十九世纪五十年代,计算机技术诞生后开始逐步发展[1]。早期的ocr技术主要应用于文本检测与识别,可以实现对文档中文字区域的定位以及单个文字的识别;发展至今,ocr技术已被广泛应用于自然场景文本检测,例如:车牌识别,票据识别,信件自动分发等。

芯片表面字符识别属于工业场景下的光学字符识别应用,基于芯片表面的特性,此课题面临着一些方面的挑战:①芯片表面字符面积小,精确识别字符的前提是准确定位字符区域同时实现字符区域的放大;②芯片表面的图像采集并不处于理想情况,可能存在视角畸变(例如:发生投影变换、仿射变换等)的问题,需要进行视角纠正,来保证后续文字识别的准确度;③芯片表面具有对比度不高的特点,在拍摄过程中甚至出现非均匀光照现象,而传统的ocr技术应用场景单一,图像具有明显的色彩区分与对比度[2],因此进行合适的图像处理步骤消除此类影响十分必要。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

本课题研究以芯片表面的微小字符为研究对象,设计一种微小字符识别算法,算法目标在于克服字符面积小、芯片表面对比度弱、图像视角多变的难题,提高工业生产场景下,芯片表面字符的识别速度以及识别准确度。

算法分为字符检测与字符识别两个部分。字符检测部分包括图像预处理操作,相关的研究内容包括:图像增强、图像滤波、字符区域定位与放大、倾斜字符校正;字符识别部分采用基于深度学习的方法,以卷积神经网络为基础,搭建字符识别系统,研究内容包括:图像自适应二值化、字符分割、数据集的构建、字符识别模型的设计搭建以及算法性能的评估。在技术方案的设计上,整个系统可分成图像预处理,字符定位,字符识别三部分。

图像预处理主要针对芯片图像的对比度不高、存在噪声等特点进行处理,以方便后续的字符定位与字符检测。在图像增强方面,king[23]以模糊理论为基础,提出了基于模糊灰度变换的图像增强算法,算法定义了隶属度函数,将图像从灰度域转换至模糊域实现非线性拉伸,再从模糊域恢复至灰度域从而增强对比度,算法实现较为简单,但具有一定的计算量。黄江中[24]提出的水下图像增强算法首先通过直方图均衡化确定渡越点,再以渡越点为界实现图像灰度的非线性拉伸,相比传统方法降低了计算量。在实践中发现,两算法运算速度差异不大,但传统算法增强效果更好,因此初步计划使用king[23]的算法实现图像增强。在图像滤波方面,姒绍辉[25]提出的改进高斯滤波算法算法基于局部灰度相似性,设置自适应的高斯掩模窗口,在滤除噪声的同时保留了图像的纹理细节与边缘信息。黄文笔[26]依次对当前像素以及滤波窗口中值进行检测,克服了标准自适应中值滤波算法可能造成的边缘细节模糊问题。以上述算法为代表的图像滤波算法可被应用于此课题,在具体使用中,需要根据调试的结果对算法进行改进。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

(1)3月25日前,完善论文的调研工作,完成英文文献翻译工作。

实现技术方案中图像预处理环节的算法,包括图像增强、图像滤波去噪; (2)4月15日前,实现技术方案中字符定位环节的算法,包括字符候选区域的确认与初步筛选、畸变字符纠正、基于cnn的字符定位网络设计。

同时,应当完成该环节大部分的论文撰写。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1]mori s , suen c y , yamamoto k . historical review of ocr research anddevelopment[j]. proceedings of the ieee, 1992, 80(7):0-1058.

[2] 张瑞.基于cnn的工业环境字符识别方法研究[d]. 哈尔滨工业大学, 2017.

[3] yingyingzhu, cong yao,xiang bai. scene text detection and recognition: recent advances and future trends[j].frontiers of computer science, 2016, 10(1):19-36.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版