一种基于双核的视觉目标跟踪方法外文翻译资料

 2022-10-27 04:10

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


一种基于双核的视觉目标跟踪方法

摘要

在本文中提出一个基于双核的视觉目标跟踪方法。在评估目标的备用时,同时考虑备用和目标模型,并联系备用目标和他附近的背景的相似度。相似度是由巴氏系数计算得出的,对比度是通过与詹森 - 香农散度计算得出的,并且将他们融合成一个具有自适应性的目标函数。通过最大化目标函数的线性近似,诱导双内核目标位置从当前位置到新的位置。根据位置移位的关系,最优目标位置可以从递归均值漂移过程中获得。从几个图像序列实验评价可以看出,该算法可以获得更准确的目标的位置并分辨出假目标,并且在变形和部分遮挡的情况下,也具有相当的鲁棒性。

关键字:双核目标跟踪 mean-shift算法 詹森-香龙发散 巴氏系数

第一章 绪论

使用梯度上升技术避免穷举搜索,mean-shift跟踪算法[1]已经被广泛应用于许多实时视觉跟踪的场合。为了消除传统的均值移动跟踪器的缺陷,如尺度选择,空间信息丢失,巴氏相似性歧视穷人和形状信息的损失,许多改进算法被提出[2-5]。然而,因为所有这些方法没有考虑背景信息纳入考虑,当背景非常杂乱或一些目标的功能也存在于背景时,这种方法会失败。Comaniciu试图削弱那些通过使用背景加权直方图背景突出的特征的重要性,并与背景加权直方图(CBWH)进行校正[6],但该方法被证明是无效的。虽然CBWH在一定程度上可以抑制在目标定位时的背景信息干扰,该方法有两个缺点:1)加强了一些小的功能的同时削弱了目标模型的主要功能。 2)原目标模型将面目全非的动态背景信息,这违反了原则,目标模式在跟踪过程中应该与加权直方图的更改保持一致。因此,如何有效利用的背景信息,而不会损坏目标模型仍然是一个开放的难题.许多著名的关于使用的背景信息的研究工作已经在进行,许多完成目标跟踪任务[7-15]的优秀方法在过去几十年来也相继被提出了。当前景的阈值的背景图像的估计和当前图像[7]之间的误差不明显的时候,常使用共用背景减法。另一种常见的背景模型是代表背景颜色的高斯模型[8,9],该方法可以随时间变化,可以适应在光照的变化、重复性动作和场景长期变化等多个状态的混合。除了使用图像亮度或色彩单一的功能,根据滤波器结果的回应,一些其他的方法可以使用组合功能。这些特性在复杂的图像结构中的代表性更强。各种类型的高斯衍生物滤波器被设计出来用于提取边缘,脊的运动信息,并且将基于直方图的概率模型用于模拟背景。配合角特征的鲁棒性更高的背景减除算法通过给出。背景减除算法需要一个相对小的计算时间和良好的光照条件下的鲁棒检测。但是,它需要的背景是静止的或缓慢变化,因此往往在如相机移动、闭塞、阴影存在和光照条件突然发生变化等情况发生时受到影响。大多数的背景减除算法不要求目标的外观是已知的。一般情况下,我们的跟踪总是针对特定网络目标,即以对目标的外观没有特殊要求而著称。在这种情况下,用于移动摄像机跟踪的背景信息显示是有用的。目前的主流方法是把跟踪作为目标通过与其周围背景的二元分类。跟踪通过对训练样本执行最大化分离分类器检测给定的目标。实现了良好的分类,因此参考大量的潜在目标训练样本以及离线训练是必要的。明确指示的跟踪性能的前景/背景对比度的重要性,并提出切换三个颜色通道的各种组合之间的mean-shift跟踪算法,以便从最区分对象直方图中选择颜色特征背景直方图。通过最大限度地抵抗在纹理的空间的背景的区别检测达到被跟踪的目的,并且使用线性判别分析在线测试前景/背景区分功能。总之,基于所述前景和背景之间的差异最大化的大多数方法需要一个固定的相机和目标的外观的先验学习。一些方法可以用移动摄像机跟踪,但其限制是显而易见的。首先,它们只考虑前景/背景差异,而忽视了前景/目标的相似性,所以当背景的前景表现出低对比度时这种方法往往会出现失败。其次,最大化前景和背景阶级的区别,需要样本分类器和强力搜索,从而导致大量的计算。在本文中,我们采用模糊逻辑的自适应融合与前景/目标相似,其中的反差与詹森 - 香农散度测量的前景/背景进行比较得到的对比度扩展传统的均值mean-shift跟踪。我们定义一个新的目标函数,并从中获得了双内核目标位置移式。该方法使用的信息的两个互补源:它搜索类似目标对象的图像区域,并同时力求避免背景造成目标分散。因此该检测结果与上面提到的依赖于目标对象的外观相似性的这些方法比较起来对环境的突然变化不太敏感。此外,均值mean-shift算法不需要复杂的计算。本文的其余部分安排如下。在第二章中,我们讨论背景区域的选择,计算目标和背景的特征直方图;第三章叙述如何测量候选目标和其背景之间的对比度,并得到表达双核位移的算法。在第四章中将展示算法的结果,在第5章讨论未来的发展方向。

第二章 目标与背景的代表性

为了充分利用的背景信息,我们选择候选目标周围的区域作为其面积三倍目标候选区域的背景图像。让表示目标候选图像,是一个2D坐标,表示相应的特征向量 (例如,颜色或渐变),用表示该区域中心。让表示的背景图像。它的中心与候选目标相同。让表示目标模型的图像,并让它的中心是0。我们选择空间的加权的特征直方图表示目标、候选目标和背景。假设是图形中共有直方图,是 图形的指数,我们有目标模型︰ 候选目标: ,背景 ︰。给定采样点和内核函数,用核密度估计方法的概率特征,使可能的特征值为u=1,...,中的候选目标和背景用如下函数分别计算:

其中delta;为克罗内克函数。该函数将关联到其量化的特征空间中的图像索引位置像素。带宽 hp 和 hr 分别表示候选目标的位移和背景规模。通常 hr = 2hp。归一化常数 Cp 和 Cr 分别导出了征收条件和。 kp(x) 和 kr(x)是凸和单调的递减内核形函数,可以表示为:

kp(x) 意味着那些远离中心的像素有目标图像的概率密度的贡献甚微,而 kr(x) 意味着那些背景像素中心附近有属于背景区域的比远离中心像素的候选目标的概率。背景是一个环形的区域,所以内核函数值为非零值只当 x isin; [0.5,1)。计算结果与 pu(z),曲的计算是非常相似的。

第三章 基于双内核的目标跟踪

评估候选目标时,我们考虑两个标准。第一项标准是它与目标模型之间的相似性。一个是好的目标候选人应尽可能与目标相似。第二个标准是它和其背景的对比度。我们希望,他们之间的对比度尽可能突出。

3.1 双内核位置移公式的推导

候选目标直方图 p(z) 及其背景直方图 r(z) 视为在特征空间中的两个概率分布。然后对两个进行对比对比可以得到测量的距离函数。对比越明显则表明距离越大。交叉熵值被频繁地用于测量信息距离跟踪领域 [17]。它的函数定义为:

尽管它经常被考虑作为距离度量,交叉熵值不是真实的度量标准。例如,它是不对称的即。为了解决对称性问题,我们引入詹森香农分歧 [18]。它的定义为:

其中。不同于交叉熵,詹森香农分歧已被证明为真实的度量距离 (即,非负矩阵,对称和) 在 [18]。我们用来测量对比。很显然,候选目标和其背景的概率分布是相同的。候选目标与目标之间的相似性仍然用巴氏系数测量,函数式重写为:

考虑的相似性和对比的同时,我们定义一个新的目标函数为:

用alpha;,beta;表示相似性和对比权重值,其中0 lt;alpha;,beta;lt;1且alpha; beta; = 1。巴氏系数在度量相似性时具有几个可取属性。例如,它的度量结构,该结构有清晰的几何解释,是不变的目标规模和有效期的任意分布。詹森-香农发散角测量的对比有与巴氏系数相同的属性。此外,巴氏系数和詹森香农分歧 (7) 中的组合可以确保对象要对称和0 lt;rho;(z)lt; 1,实现功能,不能通过使用来实现。从前一帧中目标的位置开始他搜索在当前帧中的新目标位置。因此,必须计算第一批候选目标和背景在当前帧中位置的概率。将函数(5)及(6)代进函数(7)中,用泰勒级数解析 和 和周围的值后,我们进行一些操作线性逼近目标函数(7) :

其中

再将函数(1)代入到函数(8)中:

其中

为了找到目标在当前帧中的位置,对目标函数进行最大化处理并变换为作为z函数。所以计算目标函数 (10)的梯度矢量可以计算z域:

考虑到并让,我们从当前的位置获得位置转变关系到新的位置:

其中在前景内核中在背景内核中。上述方程是双内核位置移公式,确定目标候选区域和背景区域并显示目标的最佳位置。考虑的情况,在这种情况下的背景区域减少到零,并且空间加权的核且的值与和的关系可以表示为,这时候方程 (13)成为了意义上的mean-shift跟踪。

权重和可能是负数,这种值违反了规则,在经典的mean-shift算法中样品重量必须是非负数。Collins [2] 对mean-shift算法进行泛化处理,已不需要权重为非负数。他说明在mean-shift算法中点p 的权重的意义为支持的方向和大小其符号代表向量朝向或远离这一点。对于单点p来说,权重为正时,w偏移矢量应该靠近p,w是p的一个数值;权重为负时,w偏移矢量应该远离p,w是p的一个数值。Mean-shift方程可以解释为形成的这些逐点叠加偏移量导致了整体平均偏移矢量。

我们现在看看如何修改均值mean-shift式 (13),使得负权重有意义。该方程的分子逐点值的大小和方向偏移矢量,所以应该留下权重为负的情况。然而,分母规范化,总结幅度,因此我们必须总结只有震级(绝对值)的每个术语。此外,和 是Epanechnikov内核和其衍生的和是常数。修改方程为:

3.2采用模糊逻辑调整权重

一般来说,相似性和对比之间没有更改大幅连续的帧,往往是一个有效的假设,所以我们可以利用假设和自适应地调整其重量与基于相似性的当前帧中的模糊逻辑和前一帧中的对比。众所周知,模糊逻辑包括去模糊化、 模糊规则库、 模糊推理和重新去模糊化[19]。在本文中,基于单身去模糊化、 产品推理和质心重新去模糊化,设计了模糊逻辑和模糊规则是作为定义:

其中Rj是天海模糊规则,L是总数的模糊规则;e = {e1,......,el} 和v分别表示模糊逻辑输入和输出。

我们的算法在模糊逻辑的输入是可靠性水平的相似性和对比度在先前的框架中,而输出是当前帧中的相似性重量 alpha;。对比重量 beta;的计算 beta; = 1 minus; alpha;。我们的相似性和对比度的可靠性水平由 和分别表示,可以计算由式 (16)。和的模糊集是 {SR、 S、 M、 B、 BR} 和 alpha; 是 {ST、 VS、 SR、 S、 M、 B、 BR、 VB、 BT}、 ST代表最小,VS 代替非常小,SR 代表较小,S代表小、M代表,B代表大,BR代表越大,VB代表很多更大,BT为最大。和和alpha;的隶属度函数是所有的高斯函数,如图 1 所示。模糊规则库如表 1 所示。模糊规则的不可靠的线索给出较小的权重虽然已证明是可靠的线索给出较大的权重:

给定目标模型,在先前的框架中确定位置,从当前的开始,目标在当前帧中的最佳位置可以由(14)与递归搜索获得。完整的基于双内核的跟踪 (DKBT) 算法被列于表 2。

3.3 计算复杂度

让M是平均每帧迭代次数。在步骤 2 中,该算法需要计算加权的目标候选人直方图和其背景直方图。加权的直方图计算以来大致相同的成本作为加权直方图预先计算核心价值观。如果成本等于,然后的成本等于 3 ,因为= 3。在步骤 3 中,质心 (14) 计算主要涉及两个加权总和。无线计算包括三个添加、 三个师、 三个乘法、 平方根和对数,所以第一批加权总和与的成本是 ,其中表示加法,表示平方根和成本,是对两个数和的费用。在同样的方式,的计算包括两个增补、 两个师、 两个乘法和对数,间二用加权总和的成本是。巴氏系数计算成本,詹森香农发散计算费用为 (5)。调整重量与模糊逻辑的成本是可以忽略不计的。对于提出的算法,我们得出结论为,对于一个规模平均成本大约为:

设 N 是平均每帧为传统的mean-shift算法的迭代次数。如公式[1]中所述,mean-shift跟踪某一尺度的平均成本大约为:

公式(17)至(18)的比率为。在一个典型的设置中,迭代的平均次数是 N = 4.19 和 M = 5.12,4:3:1。因此,建议跟踪系统的计算时间是 4times;5.12times;(1 4 3) /(4.19times;(1 4))asymp;mean-shift的8倍大跟踪。如果降低了背景区域,然后平均成本将会下降。例如的比率是4 时。新的跟踪算法已经过测试的 2.0 ghz 2.0 ghz 双核PC。基本框架与规模相适应(即每一帧中的三个优化)运行速度的 150 fps允许同步对两个目标的实现跟踪。

第四章 实验与分析

在本章中,我们对四种有代表性的图像序列进行测试,而且也比较其性能与KBT和CBWH分别。目标模型中的第一批框架手动初始化。RGB颜色空间作为特征空间,并量化为 16 times; 16 times; 16 箱。初始化 alpha;= 1.0、beta; = 0,起始=sigma;、c = 0.5。解决目标规模不是本文的主题,因此我们采用简单方法作为主要建议[1],即重复跟踪算法在每次迭代使用窗口大小为正负15%的当前大小,和估计的规模最好使用目标函数 (7)。跟踪精度衡量与重叠率(见 [15])︰

其中表示地面真相区域创建通过手动选择作为目标的最佳匹配。是指由追踪器,目标窗口和 |·|表示该地区。显然,当和并确定时,eta;isin; [0,1] 和eta; = 1,。平均的重叠率eta;表示序列跟踪器的平均精度。

lt;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[152994],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。