全文总字数:9167字
1. 研究目的与意义(文献综述)
目的及意义:
基于视频的车辆目标检测及追踪是对车辆进行行为分析的重要环节,在智慧交通,无人驾驶等场景中有重要应用价值。但是,现实交通场景是三维的,视频中的图像只是现实三维世界在二维上的投影,这个过程势必伴随着大量信息丢失。这也给基于视频的车辆检测及追踪任务带来一些问题,例如车辆遮挡难检测、车辆空间信息丢失等,这极大的影响了后续智慧交通应用的实现。
近年由于基于卷积神经网络的深度学习方法在机器视觉上的进展,高精度的2d车辆目标的检测和跟踪成为可能。然而,2d检测和跟踪方法只能得到目标在图像平面上的属性,如目标在图像上的尺寸、坐标位置等,缺少了在三维世界中的真实信息,包括三维尺寸、方向、真实位置等。而在智慧交通应用中,为了进行目标的位姿估计、速度估计、运动规划等活动,这些信息是必要的。
2. 研究的基本内容与方案
基本内容与目标:
(1)利用已有的3d车辆模型数据,学习车辆的3d先验知识,从而实现从少量视频序列帧中学习出车辆的3d信息,并用3d 边界框对检测到的目标进行标记。要求在有车辆遮挡的情况下,也能够实现3d车辆检测。
(2)结合视频推测出当前视野下已检测到的车辆的空间分布信息,用俯视图展示已检测车辆的相对位置关系。
3. 研究计划与安排
(1)2018/1/14—2018/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
(2)2018/3/1—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
(3)2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 参考文献(12篇以上)
[1] hou-ning hu, qi-zhi cai, dequan wang, ji lin, min sun, philipp krahenb, trevor darrell, fisher yu. joint monocular 3d vehicle detection and tracking. in ieee international conference on computer vision (iccv), pages 5390–5399, 2019.
[2] zengyi qin, jinglu wang, yan lu. monogrnet: a geometric reasoning network for monocular 3d object localization. in the thirty-third aaai conference on artificial intelligence (aaai-19), pages 8851–8858, 2019.
[3] andrea simonelli, samuel rota bulo, lorenzo porzi, manuel lopez-antequera, peter kontschieder. disentangling monocular 3d object detection. in ieee international conference on computer vision (iccv), pages 1991–1999, 2019.
