基于深度哈希的图像检索方法研究开题报告

 2022-01-13 20:45:28

全文总字数:8727字

1. 研究目的与意义(文献综述)

随着信息化时代的到来,许多的信息数据不再只以文本的形式出现,而是出现了许多更加复杂的形式,比如图像以及视频信息。与此同时,各种网络社交平台的兴起,比如微博,淘宝等的兴起导致了互联网中的数字图像资源迅速地膨胀,这就带来了一个问题:人们如何从庞大的图像数据库中快速地找到自己想要的图像。为了解决这个问题,必然要设计相应的图像检索算法,该算法既要保证正确性,也要保证其具有较快的速度。

最初人们采用的方法是TBIR(基于文本的图像检索)技术,其原理是对图片人工标注其关键字,然后将关键字和图片一起存入数据库,查询时根据输入的关键字来找到对应的图片。然而随着图像数据的海量增加,人工标注关键字已经不现实了,而且人工标注关键字会受到人的主观因素的影响,因此这种方法就被淘汰了。接着有研究者提出了CBIR(基于内容的图像检索)技术,其原理是利用图像自身的视觉信息(比如图像中事物的颜色,形状以及纹理等特征)来作为检索的依据,只要将视觉信息经人为设计成特征的形式,那么通过计算特征之间的距离就可以衡量图像之间的相似性。然而,考虑到互联网中越来越多的图像数据,采用线性搜索的方式进行图像检索会造成巨大的计算开销和存储开销,为了解决这个问题,近些年来近似最近邻搜索逐渐成为了研究者们重点关注的一部分,哈希算法就是其中典型的代表。哈希算法即将原始图像数据通过哈希函数计算得出一串固定长度的二值编码,实现对图像的降维,有利于减少存储开销。在相似性计算阶段,利用汉明距离来衡量不同哈希码之间的相似性,同时大大地提高了图像检索的效率。

哈希算法分为不依赖数据的哈希算法和依赖数据的哈希算法。其中不依赖数据的哈希算法的典型代表就是LSH算法(即局部敏感哈希算法),该算法通过随机投影一些超平面来划分原始的特征空间,然后构造保持相似性的哈希编码,但该算法一般要求哈希编码的位数足够长才能够实现好的效果,这就导致了存储空间的增长。为了解决这个问题,后来又诞生了依赖数据的哈希算法,这种方法根据训练集数据来学习一个哈希函数,主要优点是即使哈希码的位数很少也能实现很好的检索效果。这种依赖数据的哈希算法又可以细分为三类:1.无监督哈希算法:即使用无标签的图像数据来进行训练从而得到哈希函数,其代表算法是ITQ算法和SH算法。ITQ算法先对图像进行降维操作,然后旋转矩阵以减少量化误差;SH算法在学习哈希函数时将图像对之间的加权汉明距离最小化,根据图像对之间的相似性确定权重。2.有监督哈希算法:这种算法充分运用了图像的标签的信息,其性能通常好于无监督算法,并且获得的二进制哈希码相对来说比较紧凑。3.半监督哈希算法:这种算法将无监督和有监督算法相结合,充分利用了无监督算法和有监督算法的优势,其代表算法主要是SSH算法,该算法将监督信息的经验误差最小化,同时将二进制编码的方差最大化。

2. 研究的基本内容与方案

1.研究的基本内容:用户如何在海量的图像数据库中快速找到自己想要查询的图像,是当今计算机视觉方向一个亟待解决的问题。本次毕业设计研究的基本内容是:设计一个深度哈希算法(结合卷积神经网络)来学习图像特征和哈希函数,利用图像的哈希码计算相似度,从而实现快速的图像检索。

2.研究的目标:通过设计的深度哈希算法,尽可能减少训练网络的时间,尽可能得到均匀且紧凑的二进制哈希码,尽可能提高图像检索的准确率和召回率,从而实现快速且准确的图像检索任务。

3.拟采用的技术方案及措施:近年来,深度学习在计算机视觉任务中取得了明显的效果。于是出现了一系列以深度神经网络来学习图像特征的深度哈希方法,这种方法的主要优势就是利用卷积神经网络来学习图像特征,使用卷积神经网络能够学习到图像的高层语义特征,从而避免了语义鸿沟的问题。目前我认为对于深度哈希算法的改进主要可以从以下两个方面进行:1.改变卷积神经网络的结构。常用的卷积神经网络主要有alexnet,vgg16等,为了学习到图像的更多特征,可以考虑用两个结构不同的卷积神经网络同时对图像的特征进行学习,然后将提取到的特征表示拼接起来代表这个图像的新的特征表示,这种新的特征表示比单层的网络提取出来的特征更为准确。另外,可以通过增加卷积次数减小卷积核大小来减少网络中参数的个数,从而提高训练网络的效率。最后,由于最大池化被证明拥有更好地性能,目前大部分网络都是使用单一的最大池化,然而最大池化仅保留图像的纹理信息,而忽略了图像的背景信息,而平均池化却可以保留图像的背景信息,因此可以考虑将最大池化和平均池化结合起来,效果可能会更好。2.选择一个好的损失函数。目前的损失函数主要有l1损失,l2损失,量化损失,交叉熵损失,三元组损失等,这些损失函数基本上是利用图像标签的相似性信息来设计的,但是最终图片检索的性能是要用map这个指标来衡量的,既然如此,可以考虑在训练的过程之中加入map这个指标从而提升学习到的哈希码的准确性。具体做法是将训练集的一小部分作为查询集,由于这个查询集是训练集的一部分,所以每个查询集图片的同类图片都清楚地知道,可以根据这一点仿照map指标设计一个损失函数,然后与普通的损失函数相结合形成一个新的损失函数,这个损失函数的性能应该会比之前好很多。我将针对以上两点想法来实现一个深度哈希算法,从而完成本次毕业论文。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1.11-2.28 阅读15篇文献,撰写开题报告

2.29-3.31 学习python语言,设计卷积神经网络和损失函数,完成整个实验过程

4.1-5.30 撰写毕业论文

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

文献1摘要:该篇论文在现有哈希方法基础上,进一步研究了基于深度哈希的图像检索问题,并提出了三种深度哈希方法:1.基于深度特征的卷积列采样有监督哈希方法:运用卷积神经网络代替手工来提取图像的深度特征,并用图像的深度特征进行列采样离散有监督哈希编码学习,这种方式与传统哈希编码方法相比有最佳的表现。2.二阶池化深度有监督哈希方法:在深度二阶池化模型的基础上,该方法将o2p二阶统计量表示嵌入在深度哈希网络中,构造二阶统计深度哈希网络架构,进行二阶统计信息和哈希编码同时学习。3.多层卷积特征聚合方式的高阶统计深度哈希方法:采用跨层卷积特征的互相关及同层卷积的自相关聚合两种方式获得二阶信息。实验结果表明,高阶统计深度哈希比仅使用一阶统计信息的方法有效,并且也优于几种有监督的深度哈希方法。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版