基于动态张量完成的新的交通预测方法外文翻译资料

 2022-10-28 04:10

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


基于动态张量完成的新的交通预测方法

摘要

传统的交通预测方法将交通数据视为一维时间序列,这不能充分利用交通数据的多模式相关性,因此以前的预测模型存在不同水平的可预测性和限制。为了充分利用交通数据的固有多重相关性,本文提出了一种多维数组张量模型来封装交通流量数据。我们提出的这种新的交通预测方法,包括用日内趋势的粗略估计和使用动态张量完成(DTC)的精确估计。实验结果表明所提出的预测方法比传统预测方法更准确和可靠。

1 介绍

确实,鲁棒和实时短期交通预测是交通控制和交通流诱导的前提。近年来,随着智能交通系统的发展,短期交通预测在应用交通管理和高级驾驶员信息系统中起着越来越重要的作用。由于交通量数据正在积累大规模和复杂性的数据(Kerner,2009; Siegel和Belomestnyi,2006),因此短期交通预测领域在过去二十年里的进步越来越快。一般来说,模型具有不同的可预测性和限制水平,并且需要大量的努力来寻找提供高预测精度的高效仪器。

交通量数据的相关性对于短期交通量预测至关重要(BM Williams和PK Durvasula 1998)。在交通量数据中存在许多种尚未充分探索的相关性。对于单个检测器数据,多个相关包含交通数据的关系,例如周模式,日模式和间隔模式等。此外,空间相关存在于多个检测器数据中。然而,将交通数据作为一维时间序列向量,并使用数学模型或自学习技术挖掘交通数据的时间相关性进行估计,常用的短期交通预测方法如天真模型(Williams和Hoel,2003),自回归移动平均(Clark,2003),支持向量回归(Sapankevych和Sankar,2009),前馈神经网络(Chen和Grant-Muller,2001)和最近邻分析(Smith等人,2002)。这些方法具有若干限制,因为矢量模式数据仅覆盖对预测性能有不利影响的小时间信息。提高预测性能的主要方法是利用智能算法来利用空间信息,如贝叶斯组合神经网络(Zheng et al。,2006)和扩展的基于时间序列的方法(Min和Wynter,2011)。这些方法主要用于预测交通数据,但预测性能没有得到显着改善,主要原因是空间相关性尚未得到充分利用。

为了解决上述传统方法的缺点,我们提出使用多维数组,即张量模式来建模交通数据。通过保持业务数据的多径性质并提取每个张量模式中的潜在因素,张量模式可以组合和利用多模式相关(例如,链路模式,周模式,日模式和间隔模式)。

基于张量的方法可以通过高阶分解(称为张量分解)来捕获数据的全局结构。Hitchcock提出的张量分解具有很好的多维建模能力,具有快速收敛,高精度和低计算能力等优点(Ishteva,2009)。基于张量的方法被证明是一个很好的分析工具,用于处理静态多维数据,如图像处理(Cong等人,2011),EEG信号(Acar等人,2011)和CSA组(Myasnikov和Remeslennikov,1996 )。通过动态张量分析处理动态多维数据(如网络数据集,DBLP书目数据集和环境传感器数据)也非常方便(Sunet.al,2008)。在缺失交通数据完成区域,通过使用张量(多路数组)体积模型充分利用空间和时间信息的基于张量的方法(Tan等人,2013)已被证明更有效,其精确度高于其他传统的交通量数据估算方法,即使缺失率达到80%。

在本文中,我们关注使用来自单个环路检测器的数据的短期高速交通量预测,并且将动态张量完成应用于短期交通预测。

一些研究报告说,利用交通流量的日内趋势将提高预测准确性(C.Chen等人2012),大量失踪的入口对张量完成有负面影响(Acaret.al ,2011)。因此,已经提出了两步预测框架。使用交通流量的日内趋势向量进行粗略估计,然后利用趋势向量数据和交通历史数据构建体数据的张量模式,最后,基于Windows的张量完成-动态张量完成方法引入准确估计。我们选择了PeMs开放访问交通流量数据集(California Performance Measurement,System,http://pems.eecs.

berkeley.edu)来评估所提出的方法的性能。实验结果表明,所提出的基于动态张量完成(DTC)的预测方法比传统的短期流量预测方法更准确可靠。

本文的其余部分组织如下,第2节介绍了符号和张量基础。在第3节,我们分析交通数据和构造张量模式。我们在第4节中提出了我们的方法,在第5节中给出了张量模型方法和传统预测模型的组合的数值结果,结论和未来工作在第6节中给出。

2 符号和张量基础

在本节中,我们部分采用表示为(Acar等人,2010; Ishteva,2009; Kolda和Bader,2009)的符号。在本文中,三阶张量用书法字母表示,粗体字母表示矩阵,粗体字母小写字母 (a,b,...)和小写字母(a,b,...)表示标量。例如,三阶张量的元素是。一些特殊的标量,例如索引的上限, 通过大写字母()。符号“x”表示两组的笛卡尔乘积。

三阶张量的元素由三个索引引用。张量的模式1向量被定义为其列,模式2向量被定义为其行。通常,模式n向量(n = 1,2,3)是通过改变第n个索引而获得的向量,同时保持其他索引固定。线性独立的模式n向量的数量被称为模式n秩。它是矩阵的列和行秩的泛化。与矩阵情况相反,不同的模式n秩不一定彼此相等。

定义具有矩阵的张量的模n乘积通过

其中:

N路张量可以重新排列为矩阵; 这被称为matricization,也称为展开或平展。 张量的模式n定义如下

(2)

其中:

给定两个大小相同的张量,其Hadamard(单元)乘积表示为,定义为

(3)

标量积定义为

(4)

对于张量A的大小,其范数是。我们还定义如下的加权范数。 令A和W是两个尺寸的张量。 然后A的加权范数是

(5)

令是存储所有观测值的观测张量,使得

(6)

3 交通数据分析和张量模式的短期交通预测

交通预测主要使用历史交通数据的内部相关性来估计未来数据值。传统交通时间序列模型将交通数据视为平坦世界,关注交通数据的一种模式相关,并且很少注意交通数据的多模相关,因此最终具有较低的准确性,交通量数据包含多模式时间 和空间相关性。显然,挖掘多模式相关将对交通预测有很大的贡献。一些先前的工作(Zhang等人,2010)应用向量的相关系数来测量数据相关性。这里,我们将交通数据构造成三个矩阵,包括“周*天”,“天*点”和“点*周”。为了测量交通量数据的相关性,矩阵的相关系数由下式给出:

其中,和表示矩阵,和分别表示矩阵和的第i行和第j列元素,mean(X)表示矩阵X的平均值。

图1 相同模式交通量数据之间的相似性

图1给出了每种矩阵模式下的交通数据分布,直观地,日周,日点和周点服从相似的时间分布。应用矩阵的相关系数来测量交通数据相关性更多的多模相关性,例如,不同日点矩阵的相关系数不仅反映了不同日点模式矩阵的相似性,而且反映了不同周之间的相关性。

表1 三个模式矩阵的相似系数

为了利用交通量数据的多个相关性,使用多向张量模型来构造体数据。体积数据集通常每5分钟记录一次。一个循环检测器每天保存288个数据点,然后N周交通数据可以被视为三方数据张量,包括周日矩阵,日点矩阵和点周矩阵,如图2所示。

图2 三向交通数据张量

4 基于张量完成的预测方法

我们在本节中提出基于动态张量完成(DTC)的短期交通预测。DTC是一种将张量分解应用于实时数据完成的方法。不幸的是在交通预测过程中,许多未来数据在预测点之后是未知的,这可能导致精度的损失。为了解决这个问题,我们提出了一个两步预测框架,交通流量的日内趋势用于粗略估计和构建张量模式与历史数据,然后基于Windows的张量完成-一种DTC用于确定估计和保持张量模式的结构。因此,我们的方法可以表征为图3中的流程图。

图3 提出的方法流程图

4.1 张量分解

为了发现交通数据内的隐藏分量并保留相关信息以估计未知预测交通数据,预测工具应反映交通数据的多维相关性。理论上,将塔克分解应用于交通量数据更容易控制每个子空间的交互作用,塔克分解是一种更高阶主分量分析的形式。 它将张量分解成由沿着每个模式的矩阵乘以(或变换)的核心张量。因此,N周交通数据张量,我们有

(8)

这里,是周,日和点因子矩阵(通常是正交的)也可以被认为是每个模式的主要组成部分。张量称为核心张量,其条目显示不同组件之间的相互作用水平(Kolda和Bader,2009)。并且可以通过一阶加权优化(WOPT)算法(Acar等人,2010)通过梯度分析来估计张量模式内的未知交通数据。

为简单起见,让具有未知数据的原始业务量张量表示为具有大小为的实值三阶张量。 与A相同尺寸的非负重量张量W用于指示未知数据的位。 形式上,它可以定义为

(9)

然后我们可以通过迭代的解决方案来估计未知数据

(10)

然而,在交通预测过程中,如图4所示,预测点之后的时间点的数据是未知的。在这种未知的数据分布情况下,如果我们直接使用现在的张量完成方法来进行交通预测,精度会急剧下降。

图4 交通预测过程中的张量模式

4.2 通过日内趋势的粗略预测

为了解决直接应用张量完成时短期交通预测精度的下降,我们使用了日内趋势的粗略估计。

人类行为如工作和购物让交通流量周期为七天,与周相同,在不同周的同一天之间存在非常强烈的相似性(NING和LI,2002)。由于这种相似性,我们可以提取交通流量的日内趋势,以粗略估计交通数据。一些研究使用日内趋势进行粗略估计,然后从原始序列中删除日内趋势,剩余残差时间序列用于提取估计。 通过这种方式,可以提高交通预测的性能(Williams和Hoel,2003; Chen等,2012)。 经常使用的提取日内趋势的方法是简单平均法和主成分分析(Qu等人,2009)。

为了提高张量完成的交通预测的准确性,首先利用两种主要方法从历史交通数据中提取周一到周日的七个日内趋势向量,形成一个趋势矩阵,然后将趋势矩阵的相应时间点 数据用于填充未知点,最后,使用静态张量分解进行精确估计。 该过程在图5中描述。

图5 粗略估计后的张量完成的预测过程

4.3 基于Windows的张量完成

预测只有一周的交通数据不需要改变交通数据张量的结构,我们需要做的是在完成预测和收集新的观察数据后,用新观测数据替换张量图的相应日内数据。 然而,当需要预测几个星期的交通数据时,如果我们在周方向上改变张量结构,估计的准确性将会下降(Tan et al。,2013)。为了克服这个缺点,我们将基于Windows的张量完成应用于短期流量预测。

基于Windows的张量完成是一种动态张量完成,其效率计算实时高阶和高维数据的紧凑摘要,并揭示隐藏的相关性(Sun et al。,2008)。为了满足 动态预测与实时交通数据的需求,特别是需要保持在周方向的张量模式的结构,我们将应用基于Windows的张量完成到短期流量预测。

基于Windows的张量完成通过滑动窗口处理时间依赖性,滑动窗口给窗口中的所有时间戳相同的权重。在星期方向上,“天*点”矩阵可以被视为矩阵流。交通数据张量窗口A(n,W)由在第n周以大小W结束的矩阵流的子集组成,正式地,,其中每个(环路检测器每5分钟发送一次数据)

图6 基于窗口的流量数据完成

如图6所示,基于窗口的张量构造是逐渐从周方向业务数据流中提取模式以保持业务流数据张量结构。我们还每周计算新的基础向量,以确保我们的方法的准确性。

5 数值结果

我们提出的方法和传统的短期交通预测方法之间的比较包括ARIMA和BP神经网络在本节中给出。

5.1 测试数据

图7 在北部高速公路SR99,斯托克顿

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[137611],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。