一、提要
为了提高图像检索的准确率,同时避免手工标注存在的缺陷,图像自动标注技术已经成为研究热点问题。图像自动标注是指利用计算机自动地对图像特征进行提取,通过标注算法建立起低层特征和高层语义概念之间的联系,产生一组能够描述图像视觉内容的文本标记词汇。“语义鸿沟” 可以通过自动标注使其得到较好的缓解,所以在图像检索中使用现在发展成熟的文本检索技术,可以使检索变得更快,且效率更高。
二、关键词
图像标注 传播模型
三、当前国内外研究形势
就方法而言,对图像进行标注主要有三种:全人工标注、半自动标注和全自动标注。其中,全人工标注由工作人员对图像库中每一幅图像进行手工标注,这是一项费时费力的工作,因此半自动和全自动标注是今后的研究重点。顾名思义,全自动标注由系统自动执行对图像的标注,而不需要人进行手工标注,由此产生一个或多个对图像进行描述的关键字。然而,由于目前计算机视觉和图像处理的水平有限,自动标注产生的关键字还不是很准确。因此,有些研究人员从图像库中划分出一个集合,对集合中的图像进行手工标注,这样,产生的初始集合中的图像与标注的关键字之间的关系是准确可靠的。将这种关系应用到新图的标注,无疑会提高系统标注的准确度。
首先,图像检索余图像标注密切相关,最经典的是谷歌的PageRank,它是用来标识网页的等级的一种方法,它有两种核心思想:一个网页被其他多个链接,则其PageRank值相对高,而PageRank值高的链接到一个其他网站,则被链接网站会相应地提高。并且这个算法适用范围很广泛,相应的在图像检索和图像标注方面,其也具有很高的适用性。早期Google能击败所有竞争对手,很大程度上是因为它解决了困扰前辈们的最大难题:对搜索结果按重要性排序。而解决这个问题的算法就是PageRank。
参考《一种自适应的Web图像语义自动标注方法》,这篇文章采用了与Google图像搜索引擎相似的方法:利用图像的关联文本信息,将图像检索转换为文本检索。不过作者在此基础上对其性能进行优化,他们将关联文本权重分布估计和先验知识约束有机地结合起来,对Web图像语义在其关联文本上的分布进行建模。
在对图像搜索方面进行了解之后 ,参考《基于语义自动标注算法的图像检索系统研究》一文,作者详细讲述了图像检索与图像标注的关系:由于基于内容的图像检索系统存在诸如查询过程不直观、系统响应通常比较 慢等特点,人们更期待能避免使用图像低层特征进行匹配,而使用语义层次的查询方式来取代,再加上“语义鸿沟”的存在,于是出现了自动图像标注算法。
