BRISK算法:二进制稳定不变可扩展的特征点外文翻译资料

 2023-02-11 01:02

毕业设计

(英文资料翻译)

英文题目: 1.BRISK: Binary Robust Invariant Scalable Keypoints

中文译文

BRISK算法:二进制稳定不变可扩展的特征点

摘要

从一幅图片中有效又高效的寻找特征点是一个值得深入研究的话题,这构成了众多计算机视觉应用的基础。在这个领域中的先驱是SIFT和SURF算法,它们在各种图形转换中表现的非常好,特别是SURF在随时间更新的高效方法中被认为是最有效的计算方法。

本文提出的BRISK算法是一种用作特征点检测,描述和匹配的新方法。在基准数据库中BRISK算法的综合评价:自适应,在显著较低的计算成本下所表现出来的高质量性能(在这种情况下,计算速度要比SURF快一个数量级)。速度的关键在于一个新的尺度空间的应用:基于FAST的检测器组合装配好的一个位串描述符,它是通过专用的每一个关键点邻域采样从强度比较得到的。

1.引言

将图像分解成感兴趣区域或特征区是计算机视觉中一种广泛应用的技术,在寻找原图像表面特征时使用了降低复杂度功能。图像表示、目标识别和匹配、三维场景重建以及运动跟踪都依赖于图像中稳定的具有代表性的特征,这个问题促进了研究并产生了大量的方法。

理想的特征点检测器发现突出的图像区域,这样尽管角度变化,它们也可以重复检测特征点。更普遍的是,它对所有可能的图像转换都是稳定的。同样的,理想的特征点检测器捕捉最重要和独特的信息内容,包含在检测到的显著区域中,这样如果遇到相同的结构可以被识别。此外,在满足这些属性来实现所需的特征点的质量,检测器和描述的速度同样需要优化来适应手头任务的时间限制。

在原则上,最先进的算法目标应用程序在实验精度和计算速度上有严格的要求。Lowersquo;的SIFT算法是目前被广泛接受的最高质量的选项之一,对各种常见的图像转换具有有效的特殊性和不变性,然而,这种算法有着计算成本的代价。在另一方面,FAST特征点检测器和BRIEF方法的结合对描述提供了更实时应用的选择。然而尽管速度拥有明显的优势,但就可靠性和稳健性而言后一种方法更易接受,因为它有最小的图像失真和旋转的承受度,尤其是在平面旋转和尺度变换上。结果,像SLAM这样的实时应用程序需要采用概率法为数据关联来找到匹配一致性。

从图像中提取合适的特征点的内在困难在于平衡两个相互竞争的目标:高质量的描述和较低计算需求。这就是这项工作的目的,即用BRISK算法建立一个新的里程碑。也许解决这个问题最相关的任务是SURF,它已经被证明了稳健性和速度的实现,只是,要得到的结果很明显,在花费更少的计算时间BRISK获得了可媲美的匹配效果。简而言之,本文对从图像中得到特征点提出了一种新颖的方法,要点如下:尺度空间特征点检测:图像和尺度维度都是通过使用一个显著性标准来识别感兴趣特征点。为了提高计算效率,在图像金字塔的octave层和层于层的中间检测特征点。通过拟合二次函数的连续域来获得各特征点的位置和尺度。特征点检测:由点组成的样本模式位于比例合适的同心圆上,在每一个关键点邻域使用同心圆来检测灰度值:处理局部强度梯度,确定特征描述方向。最后,面向BRISK的采样模式用于获得成对的亮度比较结果,将结果组成二进制BRISK描述符。

一旦生成BRISK特征点,它由于描述符的二进制本质特点就可以非常有效的匹配。强烈专注与计算效率,BRISK还利用存储SSE指令在今天的架构上的广泛支持。

2.相关工作

识别用于图像匹配的局部感兴趣区域在文献上可追踪很长一段路,由Harris和Stephens提出一个最早也可能最著名的角点检测开始。Mikolajzyk等人的创造性工作在当时提出了一个综合评价最具有竞争力的检测方法,这显示了没有一个单一的通用检测器而是取决于应用程序的上下文的不同方法的互补性质检测。最近的FAST标准特征点检测器已经成为越来越受欢迎的最先进的硬实时约束的方法,用AGAST扩展这些工作以提高性能。

目前在文献中最优秀的特征点提取方法是SIFT。高描述力和稳定性来启发和观点变化使得评价SIFT描述符在调查中处于排行榜顶部。然而,这种描述符使得SIFT的高维度提取速度非常慢。PCA-SIFT使得描述符从128维降到了36维,但是影响它的独特性和增加描述符形成的时间几乎毁掉它提速匹配的性能。在这里值得注意的是,GLOH描述符也属于SIFT一类方法的家族,也已经证明其更有独特性但是比SIFT要付出更多计算成本。

对特征逐渐增长的高质量和高速度的需求使得更多的算法研究能够以更高的速率处理大量的数据。值得注意的是,Agrawal等人用中心对称的局部二进制模式作为SIFT方向直方图的替代方法。最新的BRIEF算法是超高速描述符,匹配以及二进制串的组合设计的,包含了简单的图像增强在预定的像素位置的随机比较。尽管这种方法简单且有效,但它对图像旋转和尺度变换非常敏感,因此限制了其通用功能的应用。

可能目前最具吸引力的特征点提取方法是SURF,它已被证实明显比FAST的速度快很多。SURF特征点检测使用了Hessian矩阵(blob检测器)的矩阵,而其描述符总结了Harris小波在感兴趣区域的响应。SURF展示了令人印象深刻的最先进计时,在速度方面,数量级仍然远远不是最快的,目前这些限制了其提取特征点的质量。

本文提出了一种新颖的算法称为BRISK算法,它具有优质,快速的特征点检测,描述和匹配。就像名字显示的,该方法在很大程度上具有旋转不变性和尺度不变性,实现了高性能和最先进的同时极大地降低了计算成本。下面的特征描述符的方法是,目前在基准数据库执行的实验结果和使用标准化评价方法。即提出关于SURF和FAST的BRISK评价,这被普遍认可是在常见的图像转换领域内的比较准则。

3.BRISK方法

在本节中,描述了BRISK的关键步骤,也就是特征检测﹑描述符组成以及特征点匹配,读者可以更好的理解和创新。注意此方法的模块化是很重要的,方法允许使用BRISK检测器结合其他任何的特征点检测描述符,反之亦然,需要优化当前所需的性能和任务。

3.1.尺度空间的检测

致力于计算效率,Mair等人对图像感兴趣区域检测时的工作启发了我们的特征检测方法。他们的AGAST本质上是现在流行的FATS算法性能的扩展,这被证明是特征提取的一个非常有效的基础。实现尺度不变性的目标对高质量的特征点是至关重要的,为了进一步得到极大值,不仅要在图像平面上研究,而且在尺度空间使用FAST分数作为精确地测量。尽管离散化尺度轴在粗轴上比选择高性能检测器难,但BRIEF检测器估计了在各连续的尺度空间的各特征点的真实值。

在BRIEF的框架中,尺度空间金字塔层的组成是n个octave ci和n个intra-octave di,i={0,1,...,n-1},通常n=4。octaves是由逐步半采样的原始图像构成(原始图像对应c0)。每个intra-octave di位于ci和ci 1层之间(如图1所示)。第一个intra-octave d0 是由1.5倍的原图像c0降采样得到,同时其余的intra-octave层是由连续的半采样得到。因此, 如果用t来表示函数那么t(ci) = 2i 和t(di) = 2i·1.5。

这里需要重点注意的是FAST和AGAST都为特征点检测的掩膜形状提供了不同的选择。与FATS标准的中心像素的实现相比,在BRISK中,主要使用了9-16个掩膜,即在16像素的圆中至少需要9个连续的像素来提供足够亮或暗的像素来实现。

最初,FAST9-16检测器在每一个octave层和intra-octave层分别使用相同的阈值T来识别潜在的感兴趣区域。接下来,属于这些区域的点在尺度空间上受到非极大值抑制:首先,问题是特征点需要在每一层的FAST得分值s的8邻域内实现最大值条件。分值S定义为在一幅图像的块区域的点的最大阈值。其次,每一层及其上下层的分值也要尽可能的低。检查同样大小的正方形邻域:在每一层中内部边长为2个像素的最可能是最大值。因为相邻层(因此它的FAST的分值)代表有不同的离散化,对其邻域边界进行一些插值。图1描述了这个过程采样和极大值检测的一个例子。

尺度轴在octave c0层的最大值检测是一个特例:为了获得FAST分值,因为c0层是最底层,故需虚拟有一个d-1层,在c0上使用FAST5-8。然而在这种情况下,d-1层斑点的分数不需要比检测的octave c0的特征点低。

考虑到图像的特点作为一个连续量不仅在图像上也在尺度维度上,我们为每一个检测到的最大值执行亚像素和连续尺度细化。为了限制细化过程的复杂性,首先,满足一个二维最小二乘意义上的二次函数使得每3个得分斑点(获得该层和上下两层的特征点)得到3像素突出最大值。为了避免重复采样,考虑在每一层采用3times;3的得分斑点。接下来,这些细化评分用合适的一维曲线沿着尺度轴生成最后的得分估计和其最大值的尺度估计。最后一步,重复对图像坐标在该层及邻边决定性尺度进行插值。BRISK检测在船序列的两幅图中的一个例子如图2近距离所示(在4节中定义)。

图1.尺度空间感兴趣点检测:一个关键点(即显著性最大)是通过分析8邻域显著性得分在ci以及在相应的分数点上面和下面的相邻层来确定octave ci。在所有三层感兴趣区域,局部显着性最大的是在一个一维抛物线沿刻度轴安装前的亚像素插值,以确定真正的规模关键点。

图2.关闭一个BRISK的检测实例,图像1和2船的序列表现出小的缩放和平面旋转。圆圈的大小表示检测到的特征点的尺度而辐射线表示它们的方向。为了清晰起见,检测阈值设置在这里比在典型的设置更严格的值,会产生较低的重复。

3.2.特征点描述

给定一组特征点(包含亚像素图像细化位置和相关的浮点尺度值),BRISK描述符是由二进制字符串通过简单的亮度比较测试结果组成。在[4]中这种方法已证实是非常有效的,然而在这里采用更为定性的方式。在BRISK中,确定了每个特征点的特征方向以便得到方向均衡化的描述符,从而实现旋转不变性,这是一般稳定性的关键。另外,我们仔细选择了注重描述最大化的亮度对比。

图3.BRISK采样模型有N=60点:蓝色小圆圈表示取样位置;更大的,红色的虚线同心圆被绘制在一个半径对应的高斯内核的标准偏差,用于平滑采样点的强度值。所示的图案适用于一个比例t= 1。

3.2.1采样模式和旋转估计

BRISK描述符主要的概念是用于采样的特征点邻域模型。该模型如图3所示,以关键点为中心,在其周围采集N个特征点的圆,定义多个相等局部圆形区域。这种模式类似于DAISY描述符,重要的是要注意到在BRISK中所使用的是完全不同的,DAISY专门为密集匹配建立的,刻意地捕捉更多的信息,因此,要求速度和存储需求。

为了避免混叠效果,对在模式中的采样点Pi应用了高斯平滑,标准差delta;i正比于每个采样点对应于各自中心的距离,定位和扩展模式在图像中相应地为关键点k模式化,考虑一个N(N-1)/2个采样点对,用集合(Pi,Pj)表示。这些点的平滑像素值分别为I(Pi,sigma;i)和I(Pj,sigma;j),用于估计局部梯度值g(Pi,Pj)的公式为:

(1)

所有组合方式的集合称作采样点对,用集合表示为:

(2)

定义短距离点对子集S、长距离点对子集L(L个)为:

(3)

其中,阈值距离设置为:delta;max=9.57t,delta;min=13.67t(t是特征点k所在的尺度)。遍历子集L里的点对,来计算特征点k的主方向,如下:

(4)

长距离的点对都参与了运算,基于本地梯度互相抵消的假说,所以全局梯度的计算是不必要的。这一点同时也被距离变量阈值delta;min的实验确认了。

3.2.2创建描述符

对于旋转和尺度归一化的描述子的建立,BRISK使用了关键点k周围的抽样点旋转alpha;=ARCTAN2(gy,gx)角度作为模式。和BRIEF类似,BIRSK的描述子也是一个包含512个比特位的向量,每个描述子由短距离点对(Palpha;i,Palpha;j)isin;S两两进行比较产生的,上标alpha表示旋转的模式。这样的每一位b对应于:

(5)

与BRIEF不同的地方是,BRIEF只是进行亮度比较,除了预设尺度和预先对样本模型的旋转之外,BRISK和BRIEF有着根本的区别:首先,BRISK使用固定的样本模式

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[148411],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。