- 文献综述(或调研报告):
离散基于标签的方法已成功地应用于许多计算机视觉问题,如音响,光流,交互式图像分割和目标识别。在典型的标记方法,输入数据用于构造一个三维体积成本。在图像坐标x和y上,它的存储成本用于选择一个标签l(即差距立体声)。对于立体视觉,这些成本由对应像素之间逐像素相关(例如强度的绝对差)给出。
我们的目标是找到一个解决方案,可以(i)服从标签成本,(ⅱ)在空间上是光滑,并且(iii)标签变化与图像的边缘对齐。文献【2】中提到快速近似的方法,这个方法是利用马尔可夫随机场模型(CRF)。这意味着,能量函数被制定,其中所述标签成本在一个数据项中被编码并且在空间上平滑边沿对齐的解决方案是通过例如强制执行两两平滑短期。这种成本函数可以使用全局能量最小化的方法来被最小化,例如图切割或置信度传播。缺点是,这种整体性的方法往往比较慢,不能很好地扩展到高分辨率的图像或大型标签空间。
在文献【3】【4】【5】中,提出了连续对应于离散标记的方法,它是基于凸能量函其可以被有效地优化在GPU上。它的缺点是,许多这样的方法的数据和平稳期都有一个受限制的形式。例如,在光流的亮度恒定的假设中通常是线性的,因此仅适用于小的位移。
在一般情况下,相对于小的、关于离散坐标问题的工作,文献【6】【7】【8】提出了以滤波器为基础的方法域中执行。但基于滤波器的方法无法同时实现实时和高品质的效果的。因此,文献【1】中提出了一个框架以克服上述限制。它对于一般多标签的问题有效地实现高质量的解决方案,原因是导波滤波器具有边缘保留性能和运行时独立于过滤器的尺寸。其具体方法是:首先在轴(X,Y,l)构造一个成本量,这在立体上被称为视差空间图像(DSI),可以通过在每个像素选择最低成本的标签来获得标签问题的结论。通过扫描线,具有最低成本的像素被标记。但这个结果并不稳定。为了规范这个结果,我们可以通过支持窗口来聚合(平滑)成本(被称为立体匹配窗口为基础的方法)。但由于箱式滤波器重叠深度不连续性,结果产生了边缘效应。为了解决边缘效应,使用一个有重量的箱式滤波器来使本量平滑。重量由能使得边缘保留在输入图像中决定。该框架使用范围广并且成本低,其中的三个应用是:
bull;实时立体视觉方法,其性能明德基准中无论是在速度和精度方面都优于其他的传统方法。
bull;离散光流的方法能够同时处理细(小规模)和大位移的的运动结构。我们用快速的性能滤波来解决大的标签空间问题。
bull;快速和高质量的交互式图像分割方法。
具体描述上述的标识框架[1]。其具体方法是:首先在坐标轴(X,Y,l)上构造一个成本量,这在立体上被称为视差空间图像[4](Disparity Space Image,简称DSI),可以通过在每个像素选择最低成本的标识来获得表示问题的结论。通过扫描线,具有最低成本的像素被标记,但这个结果并不稳定。为了规范这个结果,我们可以在支持窗口上聚合(使平滑)成本(在立体匹配中被称为窗口基础的方法)。但由于箱式滤波器重叠深度不连续性,结果产生了边缘效应。为了解决边缘效应,使用一个有重量的箱式滤波器来使本量平滑。权重[9]由能使得边缘保留在输入图像中决定。
首先考虑一个一般的标识问题。目的是在图像I的坐标(x,y)中把从L={1,hellip;L}的标识l分配到每个像素i中。分配到像素i的标识由提供,其中f是所有分配标识的集合。本文所述的方法由三个步骤组成:(1)构造本量(2)过滤本量和(3)标识的选择。本量C是一个三维阵列,它存储了在像素i=(x,y)对于选择标识的成本。
现在过滤L切片的本量。为了更加的精确,在标签l上的像素指数i的滤波的输出是在同一切片上所有像素的加权平均值:
