1. 研究目的与意义(文献综述)
视觉一直是人类通过大自然的摄取信息的一个途径,并且现在视觉技术已经成为人们的认知过程中的主体应用技术,通过发展信息化技术和视觉技术的结合应用,对于我们开阔眼界,发展更新型的视觉科技提供了更大的帮助和助力。因此,我们国家优质的信息化领域主要研究方向正集中在一种新型的视觉领域,就是计算机视觉。
计算机视觉技术是通过数据语言中的各种符号以及计算机信息化模式和信息网络平台,进行信息化过程高效传输所产生的一种新型追踪系统,更形象地说,通过计算机实现在视觉信息的有效捕获,从而让信息有了更直观的表现力。
计算机视觉发展局经历四个阶段,第一阶段是马尔计算视觉。1982年大卫马尔(david marr)的《视觉》一书在计算机视觉领域中起到了关键性的作用,它标志着计算机视觉正式成为一门独立的学科。马尔的计算视觉分为三个层次:计算理论、表达和算法以及算法实现。马尔认为,大脑的神经计算和计算机的数值计算没有本质区别,而从现在神经科学的进展看,“神经计算”与数值计算在有些情况下还是会产生本质区别。
2. 研究的基本内容与方案
设计流程:第一步对视频进行解帧,将摄像机捕获的目标视频序列以AVI格式保存,并将视频逐 帧提取出来,以便后续处理。本文实验利用MATLAB调用AVI 函数, 实现对视频序列的逐帧分解。对分解得到的每一帧图像, 提取出运动目标。第二步对图像中的运动目标进行提取,对于每一幅图像,要滤去复杂的背景,提取出运动目标。首先要把彩色图像转化为灰度图,对256个亮度等级的灰度图像进 行适当的阈值选取,将灰度大于或等于阈值的像素被判定为属于目标物体,用1表示其灰度值,否则被判定为不属于目标物体, 灰度值为0。经过二值化处理后,即可得到目标物体。对于复杂的视频图像,运算通常也较复杂,可使用帧间差分法或背景差分法进行目标提取。我拟采用的是帧间差分法。第三步需要对运动物体的质心进行求解,其中、是目标质心在X和Y轴坐标,g(i,j)是第i行j列像素的灰度值,m、n是图像的行列数。根据像素面目标的质心可以得到目标质心的像面坐标。得到图像质心后,还不能直接进行拟和,因为由图像得到位移是像素值,与实际位移之间有一定的比例关系,可以通过计算图像中某一物体的像素距离,和实际物体的距离,两者之比即为比例系数,对运动目标高速摄像,并通过运算,得到目标质心在实际空 间某时刻的一组序列值,通过拟合这组序列值,即可获得目标的轨 迹,从而进行下一步处理。第四步是基于最小二乘拟合运动物体速度,通过质心的移动速度来确定物体的移动速度。
3. 研究计划与安排
1-3周:查阅相关资料,了解计算机视觉的相关原理以及如何通过软件实现物体的识别、区分、分离等等。
4-6周:学习通过视频和图片提取物体的运动信息,将其转换为数字信息。
7-9周:用c语言或者matlab编写程序,利用现有知识将运动物体信息求解。
4. 参考文献(12篇以上)
1、[美]adrian kaehler gary bradski著.学习opencv3.清华大学出版社. 2018年07月
2、richard szeliski. computer vision: algorithms and applications.清华大学出版社. 2012-1
