人脸识别在多目标行人追踪系统中的影响与作用文献综述

 2023-08-27 06:08

文献综述(或调研报告):

多相机多目标追踪系统是目前计算机视觉的一个难题,即便是在深度学习的出现后,计算机视觉领域蓬勃发展的如今,物体的大小,遮挡,平移,旋转,形变,光影变化,多个摄像头之间的位置判断等等一系列困难使得这个问题一直都没有一个成熟的解决方案,即使是目前state-of-the-art的方案也无法达到令人满意的效果[1]。

多目标追踪系统面临着各种困境。物体本身的形变,亮度的变化,背景的变化,快速的移动,使得前后两帧的物品可能差距很大,这是多目标追踪的一大难题[2]。而相比于单相机多目标追踪系统,多相机多目标追踪系统的难点在于需要跨摄像机进行追踪。现实中,相机一般都会分开放置,录制范围不一定会重叠,这导致不同相机间同一物体的视角,光照都会不一样[2]。此外,实时追踪的效率要求非常苛刻,所以为了效率,很多实时追踪往往会降低性能,或者降低识别帧数,并且,对视频的目标追踪可以根据上下文进行判断,而实时追踪中是无法得到下文的[3],这些都大幅增加了难度。

多相机多目标追踪系统一般分为两步:

1.目标检测:

识别出每一帧的物体并用bounding box框起来。目标检测在计算机视觉中是一个已经被研究了很久的课题,随着卷积神经网络(CNN)的引入,该问题已经有了极大的进步,但在真实场景下还存在一些问题,目前仍然是研究的热点[4][10]。

基于CNN的目标检测大致分为两种类型,分别是One-Stage和Two-Stage,下面将进行介绍:

1)One-Stage方法:

One-Stage实际上就是直接得出目标位置坐标与类别概率,不需要生成候选区域(Region Proposals)的阶段,直接在CNN网络里得到所有结果[5][6]。这种方法流程比较简单,重点主要在CNN的结构以及损失函数的设计。这种方法相对而言更加快速,但准确度较低。

2)Two-Stage方法:

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。