全文总字数:3225字
1. 研究目的与意义(文献综述)
计算机视觉一直是计算机领域比较热门的研究方向,尤其是这几年,无人驾驶汽车成为热门话题,掀起了行人检测技术发展的高潮。行人检测,通俗地来说,就是通过摄像头等视频录入设备捕捉监控画面,对画面中的行人目标进行定位、监控和跟踪。在无人驾驶领域,汽车需要时刻监控视野范围内的行人,根据他们的动向分析他们的运动轨迹,做到及时避让、安全行驶。道路上行人及运动目标的检测对精度和实时性要求极高,但道路行驶情况复杂多变,天气和光线等原因也一定程度上增加了检测难度,再加上障碍物遮挡等问题,使得行人检测技术无法很好地适应于实际应用。准确而高效地分析出行人与车辆的状态成为了现如今制约无人汽车发展的瓶颈之一。而在行人重识别领域中,城市安全成为其主要应用之一。行人检测技术需要在数以万计的监控摄像中尽可能准确地找到特定的目标,并且在刑事侦查中,检测目标往往会有遮挡、化妆、更改着装等躲避检测的行为,无疑给行人检测技术提出了新的挑战。
行人检测技术的发展可以大致分为三个阶段:图像处理阶段,特征模型分类阶段,深度学习阶段。而行人检测算法也从背景差法、帧差法,发展到haar特征检测法,紧接着,又出现了hog svm算法,而后又出现了一大批用于目标检测的特征,随着神经网络技术的不断发展,基于深度学习的目标检测算法开始崭露头角,基于rcnn、fast-rcnn、faster-rcnn、yolo等行人检测算法大量涌现 。随着行人检测技术的不断发展,许多公司也开始探索与此相关的产品。丰田、奔驰等开始将行人检测技术应用于辅助驾驶;大疆将人物追踪、障碍躲避应用于无人机;社区、商场、红绿灯路口等地也纷纷装上具有行人检测功能的摄像头;智能机器人也依赖于计算机视觉,通过对其所观测到的画面进行分析,来达到智能操作的效果。
但是行人检测技术还有许多问题和技术难点。例如,行人形态多变,可以走动,可以跑动,可以站立,可以蹲下,且高矮胖瘦复杂多变。另外,受到硬件的制约,拍摄的场景可能分辨率不足,色度昏暗,目标与背景重叠,边界模糊等。再加上动态目标可能相互遮挡导致难以区分,相似目标误判等,无不让行人检测变得挑战重重。基于上述各个方面,行人检测技术还有很长的路要走,所以,研究行人检测技术,丰富该领域的解决方案就变得十分必要。这也正是我期望研究这方面问题的原因,希望通过各界人士的努力,可以早日克服行人检测技术中的难点,为无人驾驶技术、城市安全监控技术等保驾护航!
2. 研究的基本内容与方案
设计的基本内容
本课题主要完成行人检测系统的设计与实现。该系统主要过程包括,获取监控视频,分析监控视频,识别行人目标和跟踪行人目标几个部分,其核心在于识别如何准确高效地识别行人目标,使用较多的有帧差法、基于haar小波特征的方法、基于hog svm的方法、基于深度学习的方法等。现如今研究较多的就是基于深度学习的方法,所以我将也在这方面下功夫,研究和设计基于深度学习的行人检测系统,通过将深度学习的知识应用于行人检测系统,来高效、准确地识别并跟踪行人。
拟采用的技术方案及措施
本系统拟采用深度学习的框架进行实现。因为现如今的计算机视觉领域中,深度学习算法可以较好地识别特定目标。通过将视频文件中的行人目标进行特征提取,区别背景和前景,在输入到提前训练好的卷积神经网络中进行识别,对于识别成功的行人附加一个合适大小的矩形框,以此来完成对视频中的行人进行检测跟踪的目标。系统预计包括视频输入模块、视频处理模块、目标检测模块、回归边框模块等。
目标
选取合适的算法实现行人检测系统,达到对视频中的行人进行检测、识别、跟踪的目的。对于识别到的行人以矩形框的形式标记出,并随着行人的移动而实时移动,并且尽可能提高准确率。
3. 研究计划与安排
| 周次 | 时间(周) | 内容 |
| 1 | 1 | 对行人检测系统进行需求分析 |
| 2~3 | 2 | 对各功能模块进行详细分析 |
| 4~5 | 2 | 深入查阅文献,了解各功能模块的实现方法,选取合适的实现方法深入理解 |
| 6~7 | 2 | 对整个系统进行概要设计,确定基本框架 |
| 8~11 | 4 | 进行详细设计,完成各个功能模块的实现 |
| 12~13 | 2 | 对系统进行测试和优化 |
| 14~15 | 2 | 撰写并提交毕业论文 |
| 16 | 1 | 答辩 |
4. 参考文献(12篇以上)
[1] 马颂德, 张正友. 计算机视觉:计算理论与算法基础[m]. 1998.
[2] 张旭东. 行人检测技术研究[d]. 电子科技大学.2011
[3] 宋婉茹, 赵晴晴, 陈昌红, et al. 行人重识别研究综述[j]. 智能系统学报, 2017, 12(06):770-780.
