1. 研究目的与意义
在web2.0时代,尤其是随着flickr、facebook等社交网站的流行,图像、视频、音频、文本等异构数据每天都在以惊人的速度增长。
例如,facebook注册用户超过10亿,每月上传超过10亿的图片;flickr图片社交网站2015年用户上传图片数目达7.28亿,平均每天用户上传约200万的图片;中国最大的电子商务系统淘宝网的后端系统上保存着286亿多张图片。
针对这些包含丰富视觉信息的海量图片,如何在这些浩瀚的图像库中方便、快速、准确地查询并检索到用户所需的或感兴趣的图像,成为多媒体信息检索领域研究的热点。
2. 国内外研究现状分析
图像检索按描述图像内容方式的不同可以分为两类,一类是基于文本的图像检索(tbir, text based image retrieval),另一类是基于内容的图像检索(cbir, content based image retrieval)。
基于文本的图像检索方法始于上世纪70年代,它利用文本标注的方式对图像中的内容进行描述,从而为每幅图像形成描述这幅图像内容的关键词,比如图像中的物体、场景等,这种方式可以是人工标注方式,也可以通过图像识别技术进行半自动标注。
在进行检索时,用户可以根据自己的兴趣提供查询关键字,检索系统根据用户提供的查询关键字找出那些标注有该查询关键字对应的图片,最后将查询的结果返回给用户。
3. 研究的基本内容与计划
1. 详细了解图像检索的技术背景及国内外的最新发展趋势,总结项目的重点及创新点。
(2/26 - 3/10)2. 学习matlab编程语言,并搭建开发和测试环境。
(3/11 - 3/18)3. 实现hu矩算法,完成大量图片的矩特征提取并存入数据库,实现图像的检索功能并总结。
4. 研究创新点
1. 利用matlab对叶片图像进行分析,建立图像hu矩特征量并存入图像特征库。
2. 输入一张查询图像,用相同的特征提取方法提取查询图像的特征,实现在图像库中准确并快速地检索需要的图像。
3. 通过与其他图像矩的检索结果进行比较分析出各个图像矩的优缺点。
