文献综述
视觉是人类观察和认知外部世界的重要手段,人类获得的外部信息中有80%是通过视觉器官获取的 [1] 。用机器代替人眼进行目标对象的识别、判断和测量是数十年来科研工作者不懈追求的目标,而双目立体视觉便是计算机视觉的一个重要分支[2] 。双目立体视觉采用两个图像传感器或者采用单个图像传感装置经过位移的方法,来对同一场景进行成像分析,常用的方法为三角测量原理,即分析目标物体在不同成像设备上成像位置的差异,通过成像原理以及成像过程中的几何关系来建立获取目标位置的关系式。它模拟人眼的构造,通过相机模拟人眼采集外界信息,计算机模拟大脑处理双目信息,构造机器视觉对目标进行识别、跟踪和测量等[3]。实现双目立体视觉的装置主要由相机、PC机等组成,红外相机负责采集、得到图像数据,经过模数转换传送到PC机,PC机的功能是提供算法实现的硬件环境。
在双目立体视觉中相机标定是重要的组成部分,也是双目视觉实现三维重建的基础。深度感知和三维重建的原理就是利用相机标定的结果,从二维立体图像对中恢复出三维信息,因此相机标定精度的高低直接影响深度感知和三维重建效果的好坏。双目相机标定是依据一定的相机成像模型,求解三维场景中物点和二维像面上像点的对应关系,其实质上计算的是双目相机的内参数和相对位置关系。所谓相机成像模型是指摄像机系统采集目标场景的三维信息,空间立体目标场景经摄像机透镜系统的光学变换,投影于两个二维成像平面上[4],涉及坐标系变换包括:世界坐标系到相机坐标系,相机坐标系到图像物理坐标系,图像物理坐标系到图像像素坐标系[5]。相机成像模型包括线性模型与非线性模型[6]两种。目前最常用的线性模型是透视投影模型,也称为小孔成像模型,在这类模型中忽略了相机的畸变因素,只考虑透视投影变换以及刚体变换,而在相机的非线性成像模型中,非理想透视成像给图像带来了畸变,空间点在成像面上所成的像位置与理论位置相比,发生了偏移,需要用非线性畸变参数表示因畸变而偏移后的物点在图像中新的坐标。
相机标定的方法大致可以分为传统标定方法,自标定方法[7]以及基于主动视觉的标定方法[8]。传统的相机标定方法需要采用一个制作加工精密的标定块作为参照物,运用标定块的高精度几何形状来确定空间中物点与二维图像中的对应关系,建立相机模型参数的约束条件,再通过优化算法求取相应的参数[9]。1987年, Tsai[10]在综合前人工作的基础上提出两步法,即先标定外部参数再标定内部参数的方法进行标定。第一步,利用最小二乘法解超定线性方程,求得外部参数。第二步,若不存在径向畸变,则由一个超定线性方程求得内部参数。若存在径向畸变,则由一个非线性优化的方法获得全部参数。Zhang[11]在两步法的基础上提出了一种经典的平面标定法,不再使用制作成本较高的三维标定物,而使用更加简单的二维棋盘格作为标定板。该方法以其精度高、灵活性好的优点,至今仍然是相机标定中最为常见的一种标定方法。除两步法之外,Karsra和Abdel.Aziz曾提出了直线线性变换法[12],通过解线性方程获得相机的转换参数,方法简单直观,且计算速度快。缺陷在于,算法中未能考虑相机镜头的畸变问题,且受噪声干扰较为严重,因此一般适用于长焦距小畸变的镜头标定。在其基础上C.Stama[13]和Salvi[14]提出非线性标定法,能够补偿镜头畸变影响,但主要缺陷在于,算法的迭代需要较好的初始估计值,迭代程序设计的合理与否直接影响着优化过程的稳定性。
经典平面标定法假设像点与空间点间的对应关系已知,能得到精度很高的标定结果,因而在立体视觉中得到广泛使用。但是在某些实际应用中,需要调节相机焦距或移动相机位置,每次调节后都需要重新进行相机标定,如果每次都需要设置标定物,许多情况下不方便甚至很困难。自从Maybank与Faugeras在1992年首次提出摄像机自标定的概念以来[15],相机自标定技术已经成为相机标定的一个重点研究方向。具有代表性的有例如基于Kruppa方程的相机自标定方法[16],它将摄像机标定过程分两个步骤进行,即首先确定Kruppa方程中的未知比例因子,然后在第2步中,利用在第1步所确定的比例因子线性地标定出摄像机的内参数。自标定法摆脱标定板的限制,因而灵活性和实用性更强,但标定精度与平面标定法相比相差甚远,是制约其实际应用的最大限制。
参考文献
[1]章毓晋.图像理解与计算机视觉.北京:清华大学出版社,2011
[2]伯特霍尔德·霍恩.机器视觉「M].北京:中国青年出版社,2014.机器视觉
[3]庞星 双目立体匹配的理论研究及算法优化 [D]. 南京: 南京理工大学, 2015.
[4]裴聪.基于计算机视觉中双目立体匹配技术研究.江苏大学,2010
