基于二维图像的深度信息提取研究文献综述

 2022-10-28 14:48:05
  1. 文献综述(或调研报告):
  2. 前言

图像深度信息的获取,旨在得到图像中不同对象的空间位置信息。图像深度信息一般表示为深度图,它是一个关于图像坐标的函数,给出物点的深度(相对于视点)。图像深度信息获取在图片理解(如:物体识别)、三维立体重建(如:3D电视)、机器人视觉(如:机器人行为指导)等领域有着广泛的应用。

目前,根据所需图片的数量,我们可以将二维到三维的转换算法分为两类[1]:单眼深度线索(如:线性透视、阴影和纹理等)和多眼(双眼)深度线索(如:双眼视差、运动和轮廓等)。多眼深度线索同时考虑到时间信息和空间信息,可以提取到更加准确的深度信息。但是,他们要求物体和照相机之间有相对运动存在,并且需要对多幅图像进行处理,不适用于动态场景重建问题。除此以外,由非专业人士拍摄的图像之间可能不存在视差,图像之间由于特征点不足而难以匹配,使得利用多眼深度线索的的方法难以实现图像深度恢复。单眼深度线索利用少量的已知条件获取该目标的空间三维信息,技术上只对一幅图像进行处理。因此,基于单幅图像提取深度成为国内外众多学者研究的热点。图像的中散焦、颜色等特征可以直接或间接地反映场景的深度信息,是单幅图像提取深度的重要线索[2]。国内外的研究者们在提取深度的过程中引入了颜色、纹理、散焦、垂直偏差等不同的特征,并提出了很多不同的深度恢复方法。

另外,还有研究者提出了自动将二维信息转化为三维信息的方法,如利用图像的深度信息和边缘信息[3]。这类方法会对电视等消费电子产业产生影响。

利用单幅图像提取深度的优势明显,但是单幅图像信息不全(如遮挡问题),因此精确度不够高。目前的研究方法中,基于深度学习的方法,不需要显示的从图像中提取特征,而成为当前研究的热点。本文在对有关图像深度信息获取的文献进行理解和综合的基础上,重点介绍基于深度学习方法(马尔科夫随机场)的单幅图像提取深度信息。

  1. 国内外发展现状

基于深度学习方法建立在大型的目标数据库基础之上,分为两个过程[4]。首先是学习过程,采集图像和相应的深度图,提取图形象特征构建推断模型,根据采集的信息(特征和深度值)训练模型,计算模型中的参数。其次是推断过程,以未知深度的图像作为源数据,根据学习过程中得到的推断模型,获得最终的深度图。

斯坦福大学的Saxena等人就采用了这种方法[5]。首先,提取一组局部和全局特征;接着,他们选择马尔科夫随机场作为条件概率函数;然后,基于训练数据(提取到的特征信息和已知的深度信息),采用最大似然估计来学习线性回归模型的参数;最后,深度估计值由最大先验估计得到。后续的研究者多受其启发[6][7],从选用的特征向量、特征向量与深度之间的模型构建以及学习方法等方面做出了改进。其中,飞利浦实验室的Q.Wei对Saxena等人的方法做出了改进[8],基于Saxena等人结合线性回归模型和MRF平滑模型的想法,他们的工作基于像素而不是基于图像块,处理更多样化的图像类型集合 ,将各种新的深度相关的局部特征(颜色、纹理[9]、梯度直方图[10]、散焦和垂直偏差)和先进的滤波方法[11]结合,并且提出了基于通用型高斯马尔科夫随机场模型的增强的边缘保留后处理算法。在他们降低了算法的复杂性,并且对于大量的图像类型,在全局深度图和的边缘恢复方面有着鲁棒性估计。其中,最关键的其实就是模型构建和参数学习。在机器学习参数的过程中,涉及到很多方法,如最小二乘法、二次规划[12]等方法。

在提取深度信息的过程中,如果将场景分类,做一些内容分析,得到的深度图将会更为精确[13]

国内对于单幅图像提取深度信息的研究比较少。对于基于统计学习方法的研究,大多是对Saxena等人论文工作的复现和改进[14][15]。通过提取图像特征,在高斯-马尔科夫随机场模型的基础上,根据训练数据,训练模型参数并用于提取新图像的深度信息。

  1. 总结

深度信息的获取具有广泛的应用领域和广阔的应用前景,单幅图像深度信息的提取也会丰富和推动相关领域的发展。虽然基于统计学习方法的单幅图像深度信息获取获得了良好的效果,但是但当重建图像与目标数据库不一致时,重建效果不够理想,甚至完全背离。除此之外,训练模型的选择方面还有很大的探索空间,采用新的模型(如:非线性回归模型)可能会有意想不到的效果。虽然利用单幅图像提取深度信息对图像的处理比较少,但是由于训练数据大,算法在某些情况下还是比较复杂的。

  1. 参考文献

[1] Lebreton P, Raake A, Barkowsky M, et al. Measuring perceived depth in natural images and study of its relation with monocular and binocular depth cues[C]//ISamp;T/SPIE Electronic Imaging. International Society for Optics and Photonics, 2014: 90110C-90110C-11.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版