智能交通网络数据流缺失数据插值研究文献综述

 2022-11-26 17:29:55

文献综述

摘要:随着中国城市化的快速建设与发展,ITS拥有广泛的应用环境和极高的应用价值。其往往需要较高准确率的交通流预测方案和完善的配套交通流调控措施。这意味着获得较高质量的数据在交通流预测问题中的重要性。国内外学者将近邻加权平均法、主成分分析法、时序预测模型方法、生成对抗网络、高斯模型、低秩张量分解法等多种方法应用于数据插补问题。在预测的准确率方面,我们依然能够有较大的改进空间,以实现在具体问题中得到更加出色的执行效果。本文总结了调研国内外过去和当下前沿的交通流预测和插值方法。

关键词:交通流预测 数据缺失 插值方法 智能学习

随着中国城市化的快速建设与发展,基于数据的智能交通系统也随之逐步建立。事实已经证明仅靠通过新建交通设施不可能解决交通拥挤问题,只有大力发展智能交通系统(ITS)拥有广泛的应用环境和极高的应用价值。ITS是一个庞大的系统,主要包括先进交通管理系统、先进交通信息管理系统、先进的车辆控制系统、营运车辆调度管理系统、先进的公共交通系统、先进的乡村交通系统及自动高速公路系统,所有这些都离不开交通流模型的支撑。这些ITS上层应用都离不开准确的交通流预测的支持。理解交通流的动态特性是发展先进交通管理系统和先进交通信息系统的核心,高效准确的交通流预测将有效提高ITS交通流调度的效率,促进智慧城市发展,提升城市治理质量。

交通流数据插值是交通流预测中的一个重要课题。主要应对数据驱动交通流预测方法中常见的数据缺失问题。往往需要较高准确率的交通流预测方案和完善的配套交通流调控措施。这意味着数据和模型很大程度决定了交通流预测和调控的效果,也即获得较高质量的数据在交通流预测问题中起到了至关重要的作用。然而,由于数据采集的硬件设备暴露于自然环境中,且常常受到不可控的损坏,如交通事故的人为损坏或硬件老化等问题,致使交通流数据采样常常是不完全的。

本课题主要探讨在数据产生缺失情况下的交通流估计和数值插补方法。实际ITS数据往往建模为时序系统模型,也即{}。其中节点编号i=1,2,...,N,时序切片t=1,2,...,T。在一个数据集中,当有限时间切片发生数据缺失,则其数据缺失率可以用 来描述。除了数据缺失率,在实际的交通数据缺失问题中,按照类型也可以将数据缺失问题分为两类,即随机数据缺失和非随机数据缺失(长时间连续数据缺失)[1]。 随机数据缺失(missing at random, MAR)问题主要针对多个传感器节点在不同时间段失去了车流数据采集能力的情况,且每次缺失时间较短,呈现一定的随机性。非随机数据缺失(missing not at random, MNAR)问题中,数据的缺失则呈现一定规律性,其中常见的是连续性的数据缺失,本课题旨在针对此类数据缺失问题进行研究,试图利用数据缺失节点周围的节点的良好数据以针对单节点的长时间连续性缺失数据进行恢复。

对当下前沿的交通流预测和插值方法进行调研与整理发现,交通流数据缺失问题主要包括以下几类方法,也即时序预测模型方法、生成对抗网络、高斯模型、主成分分析法、近邻加权平均法、低秩张量分解法。下面将分类别进行详细介绍与对应的国内外文献综述。

1.1 时序预测模型

预测模型方法建立在交通数据序列建模的基础上,模糊了交通流预测和缺失数据插补的概念,采用了预测模型如自编码器(AE)、LSTM、GCN等时序预测模型。这些预测模型既可以预测交通流,同时也可以进行交通缺失数据插补。

自编码器是先将高维数据降维到低维隐空间,再使用低维特征进行数据预测。其模型分为两个部分,也即encoder-decoder和encoder-predictor,前者用于数据压缩(降维)和重构,后者用于预测。 Lv Y等使用堆栈自编码器(SAE)模型,采用多层神经网络,配以逐层贪婪优化算法。在Caltrans绩效评估系统(PeMS)数据集上15min的3步预测,MAE达到34.1,MRE达到6.75%,RMSE达到50%[2] Duan Y等同样使用SAE在PeMS数据上进行缺失数据插补,MAE达到9.6,RMSE达到13.9%,MRE达到0.232% [3] 。Boquet G等通过提出一种变分自动编码器(VAE)模型,同时针对三个不同的现实世界交通数据集进行验证。在此框架下,针对缺失值的未观测交通数据提出了一种在线无监督插补方法[4]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版