1. 研究目的与意义、国内外研究现状(文献综述)
1 课题意义利用图像处理的技术对手写字符进行自动识别是模式识别领域的一个重要研究方向,随着信息化技术的快速发展,在办公、财务报表、邮政编码、银行票据、计算机辅助教学等方面有着广泛应用,具有重要的研究意义和实用价值。
手写英文字符串的识别是光学字符识别(optical character recognition,ocr)技术的一个分支,按识别过程可分为脱机识别(off-line)和联机识别(on-line),其中最为困难的就是脱机手写字符串的识别。
从类别上看,包括大小写,英文字符的类别只有52种,笔划简单,但其识别率距离实用仍有距离。
2. 研究的基本内容和问题
1 研究目标本研究拟采用支持向量机算法实现对手写英文字符串的识别。
采用数码相机采集手写英文字符串图像,通过去噪、分割等过程对图像进行预处理。
对预处理后的图像进行特征提取,利用支持向量机进行识别分类,根据识别结果进行参数的调整,最终研究出识别手写英文字符串的高效方法。
3. 研究的方法与方案
1 研究方法(1)采集和预处理采用数码相机将原始文本输入到计算机中,采用二值化、去噪、分割、锐化、细化、归一化等过程对图像进行预处理。
(2)特征提取对预处理后的图像进行特征提取,拟采用模板法,通过实验确定维数。
(3)识别分类采用支持向量机法对被识别字符进行分类。
4. 研究创新点
(1)对手写英文字符串进行特殊的分割预处理本研究是针对手写英文字符串的识别,由于手写英文字符串一般都带有一定程度的倾斜和连笔,在分割时需要倾斜一定的角度以保证分割后字符的完整。
(2)采用合适的支持向量机进行识别分类通过对比实验,确定合适的核函数及其参数和惩罚因子,实现针对手写英文字符串的高效识别方法。
5. 研究计划与进展
(1)2018年1月-2018年2月收集与本研究有关的资料,了解和学习有关的研究工作成果和已有的研究工作成绩,并更加深入的学习和掌握相关的编程语言与技术,搭建编程环境。
完成构建样本库,对图像进行预处理等工作。
(2)2018年3月对预处理后的图像进行特征提取,根据特征,采用支持向量机法对被识别字符进行分类。
