1. 研究目的与意义
目标检测[1-3]技术在视频监控、公共安防,自动驾驶,生物医学等领域都有着广泛的应用,它是在视频或图像中把感兴趣的目标与背景或其他不感兴趣的目标进行区分,判断是否存在目标,并确定目标所在的准确位置。由于受复杂场景、弱小目标和遮挡目标等因素的影响较大,目标检测的准确率、误检率和检测速度成为了亟需解决的难点问题。目前已经提出了很多目标检测的方法,取得了一定的积极进展,但仍需探索新的目标检测方法。近几年来,深度学习技术取得了较大的突破,在语音识别、图像识别和自然语言处理等领域取得了很好的效果,特别是在图像识别领域[6],深度学习技术中的卷积神经网络方法已经在人脸识别、行人检测、图像分类等方向取得了优异的成绩,并获得了广泛的应用。
根据检测目标的原理,传统的目标检测方法有三类,分别是帧间差分法、光流法和背景减除法。帧间差分法又称时间差分法,其将视频图像序列中的连续两帧或多帧像素点值作差分,获取监控场景中运动目标的轮廓,实现对目标的检测。光流是指由物体运动引起的其表面像素点产生的瞬时速度场,光流法即通过计算每一帧图像中对应像索点的变化表征运动目标。背景减除法通过建立背景模型并将视频图像序列的每一帧与背景图像作差分来提取运动的前景目标。背景减除法原理简单, 计算量小,适用于监控场景固定的场合。与传统的目标检测方法相比,深度学习具有模型表达能力强等优势,对于诸如目标和行为识别这类比较复杂的问题具有良好的效果。而且,这种方式的学习过程类似于人类感知和认识世界的过程,从理论上来讲,当有足够多的训练样本时,深度神经网络能够学习到具有一定语义的特征,而且对于目标和行为的识别、定位具有较好的效果。深度学习技术中的cnn方法,它具有对位移、缩放、扭曲的鲁棒性,这是因为它采用了局部感受野、共享权值和下采样的方式。并且,cnn已经发展成一种高效的图像识别方法,被应用到了语音检测、人脸检测、车牌识别等很多方面。因此,利用深度学习的方法,特别是cnn方法进行目标检测,不仅在理论方面具有非常积极的意义,而且在实际的工程应用上的前景也很好。
随着深度学习的发展势头越来越好,越来越多的科技问题也开始运用深度学习。深度学习被应用于著名生物制药公司默克的分子药性预测问题,从各类分子中学习发现那些可能成为药物的分子获得世界最好效果。百度引入深度学习以后,语音识别效果的提升超过了以往业界在过去15年里所取得的成绩。微软亚洲研究院展示了中英即时口译系统,错误率仅为7%,而且发音十分顺畅。深度学习已经是计算机科学发展的大势所趋。与此同时,日本的工程师开始构建控制机器人的人工神经网络,南非神经科学家亨利·马克曼正与来自欧盟和以色列的科学家们合作,希望能利用数千次实验得到的数据在一台超级计算机中模拟出人脑[4]。在这一过程中,目标检测需要在复杂的现实环境中检测出预定目标,因此,目标检测的准确率、误检率和检测速度就成为急需解决的问题。近年来,更多具有it、通讯行业背景的行业加入到了深度学习中来,为整个行业注入了新的活力技术支持。得益于他们的技术创新,视频监控行业迅速完成了网络化、集成化和智能化[6]。
2. 研究内容和预期目标
一.研究内容
(1)熟悉运动目标检测的基本方法;
(2)熟悉深度学习方法及其在运动目标检测中的应用;
3. 研究的方法与步骤
本课题为基于深度学习的运动目标检测方法研究,而深度学习的关键在于深度学习网络的创建。以检测运动车辆为例,在传统的车辆检测方法中,帧间差分法对于相对静止的车辆会被检测为背景;在背景差分法中,当遇到光照、天气等自然条件影响,或者是车辆颜色和背景颜色很相近,阈值选取就会很难,很容易将背景和车辆混在一起,发生漏查的现象;若以准确性、鲁棒性和实时性作为评判标准,则以上三种方法均不能在三个方面同时达到比较好的状态。而本文提出的基于深度学习的运动目标检测方法,准确性高,鲁棒性好,实时性也可以通过采用gpu进行加速达到比较满意的程度[7]。
针对传统运动目标检测方式的缺点,提出一种基于视频监控的检测算法[8]。基于帧差法、背景差分法、光流法的运动目标检测方法都是利用运动目标相对静态的背景是运动的这一特性,而深度学习则是从某个位置的背景之上是否有运动目标这个角度来检测[4]。还有,前三种都是利用了帧间信息,所以对于光照、运动速度等外在因素的变化有一定要求,而深度学习仅仅用到了某一帧的信息,所以不存在这个问题,而且可以有效地解决前三种方法的缺点[7]。
一、传统的运动目标检测方法
4. 参考文献
[1]zhong-qiu zhao, peng zheng, shou-tao xu, xindong wu.object detection with deep learning: a review. ieee trans. on neural networks and learning systems, 2019.
[2]刘慧, 张礼帅, 沈跃, 张健, 吴边.基于改进ssd的果园行人实时检测方法[j].农业机械,2019.
[3]杨毅.运动目标检测与跟踪算法研究[d].东南大学, 2017.
5. 计划与进度安排
2022 年3 月1日 ~ 2022 年3月15日:调研,确定具体研究方案和实施计划;
2022年3月15日 ~ 2022年4月1日:撰写开题报告;
2022年4月1日 ~ 2022年4月30日:编程实现相关算法;
