

英语原文共 19 页,剩余内容已隐藏,支付完成后下载完整资料
IEEE电路与系统视频技术,16卷,3号,2006年3月
自适应运动估计快速算法
Ishfaq Ahmad,高级会员,IEEE,卫国郑,会员,IEEE,5罗,会员,IEEE,明刘,终身会员,IEEE
摘要:运动估计(ME)是一个多步骤过程,涉及到不是一个,而是的技术,如运动起点,运动搜索模式和自适应控制来抑制搜索,避免搜索静止区域等集体有效的组合这些技术就是使ME算法全线强劲,高效。本文提出了一种急算法是几种有效的想法,目的是最大限度地提高编码速度以及视觉质量寻找最准确的运动矢量(MVs)的实施例。该算法利用了空间和时间域的MV之间的相关性,控制,遏制搜索,搜索固定区域的避免,并采用可切换的形状搜索模式以加快移动搜索。该算法产生非常类似的质量比全搜索但几百倍速度更快。我们已经评估通过综合性能的研究显示,该算法由MPEG-4委员会建议的ME技术相比,实现了大幅加速,而不适用范围广的视频序列的质量损失算法。
关键词:自适应搜索模式,自适应阈值,惯性追踪,空间和时间的预测搜索。
一、引言
采用全搜索基于蛮力方法运动估计(ME)压倒性的复杂性导致了在ME爆炸性的研究。这项研究导致了无数的快速算法,但找到“最有效的”算法仍然是一个开放的研究问题。最有戏算法质量与速度之间权衡展览。由于ME的是高度场景依赖性,而且,没有一种技术可以完全依靠以产生用于各种视频场景的良好的视觉质量。相反,它是多种技术,如运动的起点,运动搜索模式,自适应控制,遏制了搜索,避免搜索固定区域等,使全线的ME算法稳健和有效的精髓。
而全搜索方法的性能被认为是“最佳”,它的复杂性是过高对于软件实现。此外,由于全搜索方法旨在十二次科幻绝对差(SADs)的最小总和,噪声的在一个视频的存在可导致次优的运动矢量(MV)。噪声的存在也可导致全搜索以产生混沌运动场为平稳运动的视频,花费更多的比特来编码与较少比特的MV左为与给定的比特预算[1],[22]编码的DCT相关系数。设计快速,准确的ME算法仍然是一个开放的研究问题。最常见的ME的方法是块匹配技术,其中,一个视频帧被划分成宏块(MB)(16times;16象素)或块(8times;8像素)和一个搜索窗口被定义。在当前帧的各MB与搜索窗内的参考帧的块进行比较。具有最大相关性或当前块和搜索窗内的参考块之间的失真最小的位移被选择作为MV。
已提出广大的块匹配算法(BMAs)(见[18]的广泛调查)。一些公知的算法:块象素抽取[16],三步搜索算法(TSS)[18]和两维对数搜索算法(2D-LOG)[16],以及它们的变化[25],[21 ],新三步搜索算法(NTSS)[22],四步搜索算法[26],结合定向搜索[23],[31],[37],正交方向搜索算法(OSA)[27],动态搜索窗口调整(DSWA)[20],十字搜索[7],菱形搜索[32],[39],基于梯度的搜索[24],基于区域的搜索[17],重新连接的基于区域的斯内德搜索[11]平行分层的一维搜索算法(PHODS)[4],和基于矢量候补四步搜索算法(CV4SS)[12]。分层搜索[3],[5],[21],[29]和多分辨率算法[2],[3]在多个级别执行ME依次,使用低通滤波或子采样[28]具有最低分辨率级别开始。
几乎所有的BMAs的使显性和隐性假设匹配失真增加而单调的检查点上移,从全局最优或误差表面客场是单峰在全局窗口。事实上,这种假设并不总是如此。因此,将所得的MV可能被困在一个局部最小值。大多数BMAs表现出正确的行为提供了以下先决条件:1)目标位移像素块内恒定的; 2)连续帧之间的象素的照明是空间和时间上均匀(这种约束可以在BMA放宽与亮度校正); 3)运动被限制为翻译; 4)匹配失真增加单调作为移位候选块从精确失真最小的方向移动了。大多数这些条件通常不符合现实生活的视频序列,但ME的数量226 700美元仍机制的算法执行得相当好。问题是这些算法产生不同的视频序列不同的性能,并且该原因并不明显。第二个问题是它们的高复杂性。 MV预测(MVP)技术,显示有显着的性能提升。接下来的MV初始猜测通过预测从以前的MV中时间或空间域获得。各种MVP中提出了文献[6],[14],[23],[30],[36]。内的MPEG-4或H.26X框架的MV被差分编码。预测的MV是从实际的MV减去所得到的差,使用可变长度码编码。
MPEG和ITU系列标准的建议基于块的运动补偿技术。相当多的评估和严格的测试之后,MPEG-4部分-7采用了MV场自适应快速搜索技术(MVFAST)[8] - [10]作为推荐ME算法[13]。我们集团提出了一个名为预测MVFAST(PMVAST)的算法[34](其中一部分出现在[13]),它也建议在MPEG-4标准。在本文中,我们提出了一个ME算法是许多用于找到更准确的MV,用更快的速度新颖的想法的组合。该算法,以最快的速度名为自适应ME(FAME)的算法,优于MVFAST和PMVFAST。 FAME需要的MV之间的相关性的优势,在空间和时间域,控制遏制搜索,避免搜索固定区域,并自适应使用特殊的菱形搜索模式以加快移动搜索。该算法的产量非常接近的品质相比全搜索但几百倍的速度提升。
本文的其余部分安排如下。第二节提供MVFAST和FASTPMV的过看法。细节和这些算法描述设置舞台成名,它使用新的功能,但考虑到一些这两个以前的算法的优良特性的讨论。第三节将进行详细介绍算法。第四节提供广泛的性能评估和比较,以及评论和意见。最后一节最后连接的最终的言论和未来方向的文件。
收稿February22,2003;修改August28,2004.This论文推荐副主编S.-U.李。一,艾哈迈德与计算机科学与工程系,德克萨斯大学阿灵顿,TX96019 USA(电子邮件:iahmad@cse.uta.edu)。W.Zheng是与香港科技大学的香港特区。他现在是西格玛设计公司,Milpitus,CA 95035 USA(电子邮件:wgzheng@ieee.org)。J.罗与计算机科学与工程系,德克萨斯大学阿灵顿,TX96019 USA。他现在是与汤姆逊公司研究,普林斯顿,NJ 08540 USA(电子邮件:Daniel.luo@thomson.net)。 M.十六大与香港科技大学的香港特区。他现在是电子科学与技术,九龙的香港大学部和电子工程,香港特区。数码影像鉴定连接器10.1109/ TCSVT.2006.870022
- FAST和FAST PM的概述
MVFAST提供高性能无论在质量和速度,并且不需要存储器来存储所搜索的点和矢量。该MVFAST已通过技术为核心,MPEG-4第7部分(2000年3月)用于快速ME。
MVFAST利用所谓早日消除搜索作为其第一步的可选阶段。在早期消灭搜索的相位,对一个MB的搜索将立即终止,如果在(0,0)获得的其SAD值小于阈值T,并在MV被指定为(0,0)。MVFAST定义局部运动一个MB的活动,运动类型,高,中,低分类。局部运动活动确定初始搜索中心以及搜索策略。如果运动活性低或中等时,搜索中心为原点。否则,在支持(ROS)能产生的最小SAD的区域属于集合MV的矢量被选择为搜索中心。
MVFAST采用两种搜索模式来执行围绕搜索中心本地搜索:小菱形搜索模式(SDSP)和大菱形搜索模式(LDSP)。选择取决于运动活性鉴定网络版。如果运动活性低或高,SDSP采用;否则,LDSP选择。 LDSP切换到SDSP,如果中心位置给出了最小SAD。
图1. BMVCL。
MVFAST的衍生物,叫PMVFAST被视为可能好处吨特殊编码的情况下可选的方法。 PMVFAST包括一个集MVFAST阈值的交易更高加速在存储器大小,存储器带宽和额外的算法复杂的成本。 PMVFAST结合了“停止时足够好”的原则,停止准则MVFAST的SDSP门槛和先进的预测钻石区搜索(APDZS)的时空MV预测[33],[35]还有英法fi cient LDSP和。的PMV用作初始预测。搜索停止,如果PMV 满足停止标准。PMVFAST计算SAD一些极有可能的MV并停止如果最小SAD至今SATIS网络编停止标准。 PMVFAST进行利用一些MVFAST的技术的本地搜索。
- FAME算法
运动一般划为前景和背景的议案。最有戏算法假定背景是静止或有慢镜头,并且该议案前景是稳定的(以固定方向移动)。这个假设导致的MV,然后再使用一个固定的形状地搜索,如一个金刚石或正方形之间有一定的相关性; MVFAST和PMVFAST使用类似的想法。然而,上述假设并不总是正确的。在许多情况下,前景是几乎仍然但背景快速移动,如照相机聚焦在移动的汽车。这里,汽车可以是相对静止但背景可具有快速运动。在这种情况下,一个固定的搜索模式可能会被困在一个局部极小,从而导致不正确的运动预测。此外,一个固定的阈值无法适应不同种类的顺序,以及废物有用的计算资源。成名算法发生在空间和时间域的MV之间的相关性的优势,采用自适应形状搜索模式以加快移动搜索。 FAME的各种功能,接下来进行了描述。
用于识别固定块自适应阈值:约98%的固定块都有各自的SAD在位置(0,0)比512少的16times;16[8],[13] MB的大小。如果我们可以检测到一个固定的MB,我们就可以设置它的MV为(0,0)和跳跃运动搜索。以前的算法[8],[34]检测使用一个固定的阈值固定的块。自适应阈值,使检测速度快,更稳健。
图2.颞MV预测。
图3.插图运动惯性。
最平稳的MB具有(0,0)小的SAD。该算法采用自适应阈值,命名为阈值固定块(TSB),其中使得检测更快速,健壮在这个意义上,它能够抵抗噪声的规律。如果该SAD(0,0)小于TSB,算法跳过搜索的其余部分,并使用(0,0)为当前块的MV。 TSB确定如下:
bull;通过MVCL表示MV候选名单。最初,MVCL包含的上限,上,左,右的MBs的MV。
bull;如果在MVCL所有相邻MBs在具有MV的(0,0),该算法使用它们的最大SAD作为阈TSB ;
bull;如果在MVCL相邻MB中的一个具有压不等于(0,0),我们使用自静止的区域内的从可能性最小的SAD的相邻MBs作为TSB开始变得更低。
为了使检测更完美,我们在一定范围内的约束TSB。上边界可以在视频序列的类型的角度来调整。
中型企业属于同一运动物体的检测:运动场的平整度,特别是在同一个移动物体,指的MV很高的相关性。该属性可被用于加速运动搜索,如果我们可以识别当前MB是其相邻MBs的同一移动对象中。此属性解释如下:
(1)
(2)
其中,是局部运动活性(LMA)测量因子,是上部,右上的MB,和左的MB的平均值,而且是 MV 在MVC中。
在FAME中 LMA的定义是不同于那个在MVFAST中的。在MVFAST中,是定义为[8]城市街区的长度,[13]。在FAME中,是定义为变化的MV的城市街区长度。我们的LMA的概念,使测量更加本地化,更详细。这也再次反映MVCL的MVs的一致性。可以观察到,如果当前MB与MBs的在MVCL属于同一移动物体,应该有一个小的值。该LMA被定义为
(3)
在我们的实验中,。当LMA处在低的时候,这意味着它的相邻MBs具有类似运动特性。当前MB有可能是与它的相邻MBs相同的对象的内部,并且可以具有相同的MV。
图4.FAME中的各种搜索模式。
图5.举例MV候选名单。
表格1在随后的表中使用的缩写
自适应阈值启用半停止:为了避免陷入不必要的搜索,FAME使用门槛停止搜索时,结果是不够好。如果在搜索过程中这个预测误差低于这个阈值,搜索前面停止。我们称这种半停止(THS),其再次自适应根据其MVCL的LMA设置的阈值。
bull;THS等于SAD相邻MBs的平均值,如果局部运动活性小于4。
bull;THS等于SAD相邻MB的最小值。
bull;为了避免因噪声引起的THS的极低或极高的价值,我们在一定范围内的约束THS。通常,下界具有下界TSB的相同的值。上限可以在视频序列的类型方面进行调整。
扩展MV候选集:最初MVCL由基本MVCL,叫BMVCL的。这包括如图1所示,其中MB是当前MB从其邻居MBs的运动矢量。该BMVCL扩展为包括附加的MV,如下面所解释。
由于FAME的算法也是基于运动预测技术,在MVCL考生是速度和FAME的质量至关重要。如果有更多的MV候选,找到正确矢量更快,更精确的机会更高。图2显示了MVCL普通成员,从空间域呈现预测。然而,MV的相关性不仅在空间域中存在,但在时间域中存在为好。FAME使用从时间域的一个MV预测。
运动惯性:某些时间MV预测基于算法被报道[8],[14],[33]。但这些算法只使用在参考图象中的相邻MBs的MV的平均值,或在参考图像对应MB的MV。如图2所示,对于MB,MV的从时间域这个预测将是,或者在图像相邻MBs的MV的平均值。基于我们的实验和观察,在一个视频序列中的运动对象的运动轨迹是当场景变化发生时,除了连续的。这意味着在时间域中的所
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[153030],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 饮用水微生物群:一个全面的时空研究,以监测巴黎供水系统的水质外文翻译资料
- 步进电机控制和摩擦模型对复杂机械系统精确定位的影响外文翻译资料
- 具有温湿度控制的开式阴极PEM燃料电池性能的提升外文翻译资料
- 警报定时系统对驾驶员行为的影响:调查驾驶员信任的差异以及根据警报定时对警报的响应外文翻译资料
- 门禁系统的零知识认证解决方案外文翻译资料
- 车辆废气及室外环境中悬浮微粒中有机磷的含量—-个案研究外文翻译资料
- ZigBee协议对城市风力涡轮机的无线监控: 支持应用软件和传感器模块外文翻译资料
- ZigBee系统在医疗保健中提供位置信息和传感器数据传输的方案外文翻译资料
- 基于PLC的模糊控制器在污水处理系统中的应用外文翻译资料
- 光伏并联最大功率点跟踪系统独立应用程序外文翻译资料
