1. 研究目的与意义、国内外研究现状(文献综述)
| 课题的意义: 随着科学技术的日益进步,有关笔迹鉴定的理论知识和检验技术得到了完善,笔迹鉴定在物证鉴定领域的地位日益提高,鉴定意见的价值得到了充分的肯定,为预防犯罪、打击犯罪及审理各种刑事、民事案件提供了重要的依据。 然而,目前笔迹鉴别基本上都是采用人工的方法,具有鉴定资格的鉴定人运用笔迹学以及其他自然学科的相关知识和技术,对书写人的笔迹及其特征进行分析和研究,进而完成对书写人的同一认定。其鉴定过程慢且不可靠,且个人主观感情极易影响鉴定结果的真实性,而运用计算机辅助进行笔迹鉴定,可以提高鉴定速度与准确性,避免人为因素的影响。因此,计算机笔迹鉴定的意义愈显更加明显。 国内外研究进展 (1)国外研究现状: 1966年,苏联科学家用字母“K”作为笔迹样本,提取笔迹骨架中的一些特征点来表达书写风格特征,鉴别率达到了75%。这是在计算机笔迹鉴别领域里最早的研究。 2000年,Said 等人提出了一种基于图像纹理特征的笔迹鉴别方法,该方法通过多通道 Gabor 滤波器和灰度共生矩阵提取特征,采用基于加权欧氏距离的最近邻分类方法进行特征匹配。 2001年,Hertel、Bunke及 Marti等人提出了一种以文本行为研究对象的笔迹鉴别方法,提取出若干以文本布局相关的特征。该方法以 IAM数据库为实验样本库,最终鉴别正确率达到了 99.6%。 2002年,Bensefia等人引入信息检索思想,首次提出了基于Grapheme emission特征的笔迹鉴别方法。该方法的鉴别正确率达到了 90%左右。 2004 年,L. Schomaker 等人提出一种基于轮廓连接成分(COCOCOs)和边的联合特征方法,有效地将图像统计的方法和手工字母特征提取方法结合起来,从而有效地提高笔迹鉴别率。 2007年,Bulacu等人提出了一种新的基于概率分布函数的笔迹鉴别技术。该方法同样引入数据融合思想,提取笔迹轮廓方向分布、边缘绞合、字间距、行间距等特征并进行加权融合。 2008 年,B. Helli 等人采用 Garbor 滤波器提取笔迹材料的笔迹纹理特征,并提出了一种基于距离的最长公共子序列(LCS)方法做特征向量的相似度计算。 2010 年,B.Helli等人对先前工作作更进一步的改进优化。他们使用 Garbor 滤波器和 XGabor 滤波器同时对笔迹材料进行特征提取,从而提取了两组笔迹特征;随后通过特征之间的关系生成特征关系图(FRG);最后用一种动态算法计算两个DAFRG(Directed Acyclic FRG)特征相似度。 2011年,Jain和Doennann提出通过K-邻近分割方法来进行离线笔迹鉴别。提取笔迹的边缘轮廓信息作为书写风格特征,实验样本库采用IAM数据库和MADCAT 数据库,鉴别率分别为93%和 90%。 2012年,Brink提出了Quill Feature笔迹鉴别算法。把笔迹宽度当做一种风格特征信息在Firemaker数据库实验首选正确率为86%;在IAM数据库中实验首选正确率为97%。 2014 年,Fiel等人首次提出了基于文档行分割的方式并组合深度卷积神经网络的笔迹鉴别方法。首先,他们使用 Deim提出的行分割方法对笔迹材料进行行分割,用归一化方法纠正歪斜的行笔迹材料,并进行数据增强,从而在 ICDAR2011和 CVL 数据集上取得当时最好的鉴别结果。同年,Christlein 等人利用深度卷积神经网络和GMM 的特征编码方法构成有效的笔迹鉴别方法,在 CVL 等数据集上取得不错的效果。 2017 年,Christlein等人在此工作的基础上结合 Exemplar-SVMs,有效地提高全局特征向量的特征分类,从而进一步提高模型的识别率。 2018 年, Christlein 等人提出一种基于深度神经网络的非监督笔迹鉴别方法,此方法对于历史文档类的笔迹材料(ICFHR2016,ICDAR2017)鉴别效果显著。同年,Venugopal等人提出一种新的在线笔迹鉴别方法,该方法基于稀疏编码特征。相较于其它方法,此方法对于对每个小的像素块的笔画信息表征更加灵活。 (2)国内研究现状: 1997年开始,刘成林、刘迎建、戴汝为提出了通过多通道分解方法提取多种笔迹特征,通过特征匹配鉴别书写人身份,取得了较为理想的效果。同年,他们又提出了一种通过简化的Wigner分布方法提取笔迹纹理特征,同样取得较好效果。 2001年,朱勇、谭铁牛、王蕴红等人提出一种与文本内容无关的笔迹鉴别方法,通过二维Gabor滤波器提取笔迹的多尺度纹理特征。 2002年开始,清华大学智能图文信息处理研究室与公安部第二研究所合作,在此期间研发出了利用基于单个字符的笔迹鉴别系统,在我国实属首例,该系统与2005年1月通过了公安部组织的技术鉴定。 2003年,刘宏等人提出了通过多通道Gabor滤波器来提取笔迹样本中的纹理特征。分类阶段采用支持向量机作为分类器,分类器的核函数为径向基函数,鉴别正确率达到了 97.7%。 2009年,李昕等人提出一种通过提取文字的微结构特征来进行笔迹鉴别的算法,以汉文、英文、维吾尔文和藏文作为实验对象,首选正确率分别为 94.6%、97.9%、92.5%和 91.7%。后来他们又在该方法的基础上提出了基于改进微结构特征的笔迹鉴别方法,采用加权 Manhattan距离度量的方法,最高首选正确率达到了95.4%。 2010 年,李昕等人对先前提出的微结构特征提取方法进行改进,修改了局部微结构的生成条件,并引进了加权 Manhattan距离的相似度度量方法。 2013 年,刘等人提出了一个新的中文数据集(CASIA),此数据集可用于在线笔迹鉴别任务和离线笔迹鉴别任务,进一步推动了基于中文的笔迹鉴别发展。 2014 年,邬向前等人提出了一种离线笔迹鉴别方法,该方法基于尺度不变特征变换(SIFT)。实验表明,在多个公开的标准数据集上(FIREMAKER, L-HIT-MW,MIAM)验证了模型的有效性。 2016 年,邹杰等人提出将合并规则和跳跃规则引入到动态规划的迭代过程,从而解决在线笔迹匹配算法鲁棒性不强的问题。实验表明,该方法能较好应对多种局部书写和分割的不一致的问题。同年,乔宇等人利用多并行卷积神经网络和新的像素扫描方法,有效地学习具有较强的判别性特征。 2017 年,邬向前等人进一步提出一种基于深度卷积神经网络和联合贝叶斯的方法对手写文档进行全局特征的提取,从而提高模型的泛化能力。此方法使用一种新的数据增强方式对数据进行扩充,有效地解决数据不足的问题。 应用前景: 笔迹鉴别作为人工智能的研究热点之一,在这次的技术浪潮中得到进一步地发展,并且部分技术已经应用于我们的实际生活中。在司法鉴定领域,笔迹信息是一份有效的司法依据,笔迹鉴别技术能成功应用于法医专家决策系统中。在商务安全领域,文档签字鉴定以及保护是重要的一个工作,笔迹鉴别技术可应用于认证系统之中,可以用来监控和查验相关的商务文档。此外,当前笔迹鉴别还可应用于历史文档分析。
|
2. 研究的基本内容和问题
研究的目标:
依据笔迹提取特征的方法的不同又可以分为两大类:文本独立方法和文本依存方法。前者是通过从样本文本中提取的某种特征,进行比较;后者是从参考笔迹中选择相同的文本文字进行比较。在本次课程设计中,主要使用文本独立的方法进行研究,拟实现的目标如下:
-
使用收集到的不同人的笔迹文本作为训练集,进行图像预处理和特征提取操作,形成不同的特征值。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!3. 研究的方法与方案
研究方法:
(1)阅读相关文献、书籍以及学术论文;
(2)在研究过程中与相关领域的前辈交流;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!4. 研究创新点
特色或创新之处:
拟对比不同的笔迹鉴别方法的鉴别结果,分析不同方法的优劣差异和适用情况。
5. 研究计划与进展
研究计划及预期进展:
2020年1月 确定毕设题目和研究方向,翻阅文献资料,撰写开题报告,开题答辩
2020年2月 获取数据笔迹样本,并对数据进行灰度化、二值化、归一化等预处理操作
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
