全文总字数:4663字
1. 研究目的与意义(文献综述)
1.1目的和意义
行人重识别 (personre-identification) 也称行人再识别,被广泛认为是一个图像检索的子问题,是利用计算机视觉技术判断图像或者视频中是否存在特定行人的技术,即给定一个监控行人图像检索跨设备下的该行人图像。行人重识别技术可以弥补目前固定摄像头的视觉局限,并可与行人检测、行人跟踪技术相结合,应用于视频监控、智能安防等领域,因此研究该问题对公共安全和刑侦有着非常重要的现实意义。
由于城市监控摄像头难以捕捉到高清的行人图像信息,因此依靠生物信息的行人识别的传统方法,比如人脸识别和虹膜识别在大规模的城市监控中往往是不可行的。相反,基于视觉特征的识别方法通常比基于生物信息的识别方法更加可靠,基于人的外观,比如一个人携带的物品或者行人的衣服,可以更可靠地被利用在行人重识别中。
然而行人重识别的研究面临着许多问题与挑战,目前学术界已存的数据集是清理之后的高质量图像, 但在真实场景下行人重识别会遇到跨视角造成的姿态多变、分辨率变化、行人遮挡以及图像域变化等问题。比如:
2. 研究的基本内容与方案
本课题研究的基本内容是基于视频序列,检测到视频中指定的某个行人并对其进行重识别。行人重识别要解决的核心问题是行人特征提取和相似性度量,而基于视频的行人重识别又分为传统方法和深度学习方法,本课题将采用深度学习的方法,解决行基于视频序列的行人检测与重识别的问题,同时采用端到端深度学习框架来共同处理这两个任务,而不是将其分解为两个单独的行人检测和人员重新识别任务。
本课题将采用MATLAB作为编程语言,搭建出一个端到端的深度学习框架。首先需要准备一个数据集,本次研究采用PRW数据集,分为训练集和测试集,测试集中为所有出现在视频帧中的行人手动绘制一个边界框,并分配一个ID;然后开始搭建端到端的深度学习框架,采用基于CNN方法的识别模型,配置模型训练参数,利用训练集和测试集训练该模型;模型达到一定的精度后,调用该模型进行行人检测与重识别,测试行人重识别的准确度;最后再选择识别行人时影响行人识别过程的视角、分辨率、遮挡和光线等因素进行分析。
PRW数据集里的视频是在清华大学收集的,总共使用了6台摄像机,其中5台是1080×1920 HD,1台是576×720 SD,全长10小时。PRW数据集分为具有5个704帧和482个ID的训练集和具有6个112帧和450个ID的测试集,选择如此拆分,是因为这样可使训练和测试集之间的ID重叠最小。3. 研究计划与安排
第1-3周:充分理解题目,明确研究方向和内容。查阅参考资料,确定设计方案,完成开题报告,以及不少于万字符的英文翻译任务;
第4-7周: 学习深度学习的相关知识,认真研读相关参考文献,搭建端到端的深度学习框架;
第7-13周:在数据集上训练行人检测与重识别模型,并进行行人重识别,测试该模型的准确度,同时撰写毕设计论文初稿;
4. 参考文献(12篇以上)
[1] l. zheng, z. bie, y. sun, j. wang, c.su, s. wang, and q. tian. mars: a video benchmark for large-scale personre-identification. in eccv, 2016.
[2] l. zheng, l. shen, l. tian, s. wang, j.wang, and q. tian. scalable person re-identification: a benchmark. in cvpr,2015.
[3] l. zheng, s. wang, l. tian, f. he, z.liu, and q. tian. query-adaptive late fusion for image search and personreidentification. in cvpr, 2015.
