基于深度学习的人体动作识别方法实现文献综述

 2022-09-22 11:51:51

  1. 文献综述(或调研报告):

人体行为识别旨在从一个图像序列或者视频数据中识别其中所发生的行为。从上世纪 80年代以来,这项研究就引起了计算机科学家的注意[1]。如今,人体行为识别处于动作识别阶段,即简单的动作分类。动作识别可以视为特征提取和分类器学习的组合,识别的过程包括低层数据感知、数据预处理、运动特征提取、运动特征选择、分类器对特征分类进行动作识别[2],如图1所示,其中预处理到特征选择这三个阶段可以概括为特征表达,是从底层数据中提取所需的人体动作信息。这些信息经过分类器归到某个类中即类别标记,从而实现动作识别。

图1.人体动作识别流程图[2]

人体动作识别主流的处理方法大体可以分为全局特征法和局部特征法两大类。全局特征法利用背景差分法或者跟踪的方法定位整个感兴趣的人体,并采用人体的边缘、剪影轮廓、光流等信息对人体进行描述。全局特征模型中一部分以整体作为兴趣点,因此称之为整体模型,主要表现形式为表现特征、运动特征和混合特征。

最早使用人体轮廓的是 Bobick等人[3],以时间模板的形式表达人体运动的表示和识别。他们提出两个模板:运动能量图和运动历史图像。运动能量图是将相邻图像差分并二值化再通过叠加得到运动区域图像,按照动作发生的时间顺序加权后得到历史运动图像,最后得到基于矩的特征表示。

Blank[4]将人体动作视为包含剪影信息的时空立方体,从中提取动作特征。即通过差分背景法获取图像的剪影信息并沿时间轴组合成一个时空体,再从时空立方体提取运动特征。

Polana[5]针对周期性重复运动,提出了一个人体跟踪架构。利用傅里叶变换发现运动的周期并且以人体为中心划分网格,将运动特征与标记好的 2D 运动模板进行匹配。

Laptev[6]提出了一个特征融合的方案,将梯度直方图(Histogram of Gradient, HOG)和光流直方图(Histogram of Optical Flow, HOF)得到的特征组合,对现实场景下视频中的动作识别有着较好的性能表现。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。