足迹图像数据清洗以及数据库构建技术研究与实现开题报告

 2022-05-10 08:05

1. 研究目的与意义

1.1 研究背景

足迹是在犯罪现场上遗留率最高的一类痕迹,世界上许多国家的警察机关对犯罪现场遗留足迹的研究和利用都很重视。刑侦人员可以根据现场采样的足迹和以往案件中的足迹进行串并案的处理,从而缩小嫌疑人的范围,提高案件侦破的效率。这样就要对先前得到的足迹图像进行入库和归类。由于从现场得到的足迹图像存在着模糊,不完整和干扰成分太多等特点,因而要想自动的进行入库和归类,就必须进行前期处理。在刑事案件现场勘查时,由于光线、空间和检验器材本身条件的限制通过照相、录像收集的足迹图像常常不够清楚,细微特征难以分辨,因此为了达到更好的视觉效果,并为了更有利于分割,必须对其进行图像处理。

随着勘察案件过程不断产生新的足迹图像,再加上过去已有的足迹图像,如何对这些图像数据进行有效的管理,成为一个亟待解决的问题。对足迹图像数据库的研究就是在这种背景下出现的。足迹图像数据库是这样一个系统,它能够将一大批足迹图像及其相关人员信息存储在一起,并对它们进行有效的管理,以保证数据的一致性、完整性。作为一门新兴的综合性技术,图像数据库与现有的很多研究领域都密切相关,比如说计算机视觉、图像处理、数据库、信息检索、人工智能以及网络等。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

2.1 研究内容

本课题要处理的图像为足迹图像,其中足迹图像分为赤足足迹图像、鞋印足迹图像。对采集的数字图像进行处理,使得处理后的足迹能够用于管理和检验,处理内容主要包括图像变换、转为灰度图、图像锐化处理等,并将经过处理的图像加以保存。

由于目前所面临的数据规模量不足的问题,利用当下流行的python爬虫技术,扩充现有的足迹图像库,从互联网上获取更规范、质量更好的足迹图像,并对其进行相应的处理。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究的方法与步骤

3.1 研究方法

3.1.1 scikit-image

基于python的图片处理包还是很多的,比如PIL,Pillow, opencv, scikit-image等。其中,PIL和Pillow只提供最基础的数字图像处理,功能有限;opencv本质上是一个c 库,只是提供了python的接口,官方更新速度非常慢,而且安装很不容易。综合来看,scikit-image是基于scipy的一款图像处理包,它功能非常齐全,同时将图片作为numpy数组进行处理,几乎集合了matlab的所有图像处理功能,在数据的处理方式,函数名字等方面对matlab的模仿姿势非常到位。

更为重要的是,作为python的一个图像处理包,这个包是完全开源免费的,而且可以依托于python强大的功能,与tensorflow等软件配合使用于主流的深度学习等领域。

3.1.2 Python爬虫框架Scrapy

网络爬虫(Web crawler),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,它们被广泛用于互联网搜索引擎或其他类似网站,可以自动采集所有其能够访问到的页面,以获取这些网站的内容。

Scrapy是大名鼎鼎的爬虫框架,是使用Python编写的。Scrapy可以很方便的进行web抓取,并且也可以很方便的根据自己的需求进行定制。

Scrapy运行流程大概如下:

引擎从调度器中取出一个链接(URL)用于接下来的抓取引擎把URL封装成一个请求(Request)传给下载器 下载器把资源下载下来,并封装成应答包(Response) 爬虫解析Response 解析出实体(Item),则交给实体管道进行进一步的处理 解析出的是链接(URL),则把URL交给调度器等待抓取

3.1.3 BLOB类型

BLOB (binary large object),用来存储二进制大对象的字段类型。

BLOB往往是一个大文件,典型的BLOB是一张图片、一个声音或一个视频文件,由于它们的尺寸,必须使用特殊的方式来处理(例如:上传、下载或者存放到一个数据库)。

处理BLOB的主要思想就是让文件处理器(如数据库管理器)不去理会文件是什么,而是关心如何去处理它。但也有专家强调,这种处理大数据对象的方法是把双刃剑,它有可能引发一些问题,如存储的二进制文件过大,会使数据库的性能下降。

MySQL中,BLOB是个类型系列,共包括四种BLOB类型:TinyBlob、Blob、MediumBlob、LongBlob,这几个类型之间的唯一区别是在存储文件的最大尺寸不同。

字段类型

最大长度(字节)

存储需求

TinyBlob

255

值的长度加上用于记录长度的1个字节(8位)

Blob

65K

值的长度加上用于记录长度的2个字节(16位)

MediumBlob

16M

值的长度加上用于记录长度的3个字节(24位)

LongBlob

4G

值的长度加上用于记录长度的4个字节(32位)

3.1.4 MyBatis框架

MyBatis 是一款优秀的持久层框架,它支持定制化 SQL、存储过程以及高级映射。MyBatis 避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集。MyBatis 可以使用简单的 XML 或注解来配置和映射原生信息,将接口和 Java 的 POJOs(Plain Ordinary Java Object,普通的 Java对象)映射成数据库中的记录。

3.2 研究步骤

(1)在CSDN和GitHub等社区网站上有大量经验教程,学习和了解Python语言如何处理图像,分析其优缺点,有些算法和功能是否能用Python实现。广泛查阅资料,其他编程语言如Java在图像处理上是否更合适;

(2)学习和应用Python爬虫技术,参考优秀的开源代码,编写满足需求的代码,例如从百度图片上获取更多的足迹图像;

(3)详细分析需求,绘制E-R图,设计数据库的逻辑结构,分析并得出一些约束规则。由于是图像类型的数据,需要大量查阅资料研究如何提高检索效率。

(4)利用JavaEE开发技术开发一个基于web的足迹图像管理系统。JDK1.8的开发环境,SSM框架加MySQL数据库。

4. 参考文献

[1] milan sonka,vaclav hlavac,roger boyle 著 兴军亮 艾海舟 等译, 图像处理、分析与机器视觉(第3版)[m], 清华大学出版社,2016.06

[2] rafael c. gonzalez(拉斐尔 c. 冈萨雷斯), richard e. woods , 数字图像处理基础[m], 电子工业出版社, 2017.05

[3] 米歇尔 (mitchellt.m.) (作者), 曾华军 (译者), 等 (译者), 机器学习[m],机械工业出版社, 2008.03

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 计划与进度安排

(1)1月11日至2月15日 分析课题,查找资料。

(2)2月16日至2月28日 完成需求分析。

(3)3月01日至3月16日 完成开题报告。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。