RPR:基于云计算和出租车追踪数据的道路乘客建议外文翻译资料

 2022-12-16 19:56:40

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


RPR:基于云计算和出租车追踪数据的道路乘客建议

魏鹏静1bull;李坤湖1bull;雷书2bull;米敦木克吉2bull;高桥原3

【摘要】交通拥堵问题日益成为世界大城市亟待解决的难题,人们乘坐出租车的机会越来越少。为了解决这一问题,我们提出了一种基于道路上乘客的滑行轨迹数据的推荐策略,使之更加容易。考虑到滑行道数据的规模,利用Hadoop对滑行道数据进行处理,其任务包括数据的过滤和清理、绘制滑行道图、计算道路上的平均通过时间和空车到达率。当用户上传自己的位置和时间时,借助于互联网获得的天气条件,我们得到了与日期和天气相对应的模型;时间间隔被认为是用户请求服务的那一刻到累计空车数较大的那一刻之间的预期等待时间。加上出租车在道路上行驶的时间后,等于1,并被推给用户。这项实验是在北京一个由超过12000辆出租车在3个月内生成的真实数据集的基础上进行的。实验结果Hadoop的处理速度是串行数据的9倍,说明了Hadoop在海量记录道数据应用中的可行性。此外,推荐策略的准确率高达88.75%,满足了实时服务的需求。

【关键词】云计算Hadoop Taxis跟踪数据

1 介绍

交通问题已成为发达国家和发展中国家大城市面临的一个重要问题。例如,在中国北京,由于所有的公共汽车和地铁在高峰时间都处于超载状态,乘客必须等待至少30分钟才能被一辆没有人乘坐的出租车切断。相比之下,除了高峰时间,出租车要么没有乘客运行,要么停在某个地方来接客。由于这是一种对交通资源和天然气的浪费,因此导致了一种非环境友好的方法。因此,需要更有效地利用交通工具来解决交通问题。

乘客并不总是有兴趣走到热点,那里有更高的概率在城市里得到出租车服务。暴雨、降雪和烟雾等恶劣天气条件阻止了此类活动。由于乘客在大多数情况下对周围环境不熟悉,他更喜欢站在路边搭出租车。这种情况如图1所示。相比之下,乘客可以通过使用热线服务或智能手机中的应用程序(称为应用程序)乘坐出租车。一些流行的应用程序[1]禁止热线服务,这在高峰时段无法正常工作。然而,这些应用程序旨在改善

图1路边等待出租车的例子。乘客喜欢站在路边,而不是走到出租车停车位。

通过平衡交通生态,为潜在乘客提供服务质量。因此,这是朝着解决乘坐出租车乘客的障碍迈出的一大步。

近年来,随着各种新兴技术的快速发展,移动跟踪数据(MTD)[2]在智能交通系统中引起了广泛的关注。这些数据主要由智能手机、配备全球定位系统(GPS)的车辆等设备生成。MTD在开发和优化方面做了大量的工作,包括在geolife中挖掘用户日志数据,为用户提供感兴趣的停车位推荐服务[3],并从网上的人迹中提取他们的交通方式[4,5]。此外,由于车辆跟踪数据的灵活性和规模巨大,因此对研究人员更具吸引力。这些数据通常用于生成城市地图[6],预测和监测城市交通状况[7],并发现出租车的异常痕迹[8]。此外,郑等[9]研究了出租车绕行、低速等轨道交通案例,对交通规划进行评价。之后,他们提出了方案[10],通过提取经验丰富的出租车司机的路线选择策略,为司机提供更好的路线。在[11]中,分析了大量的滑行轨迹,以预测城市人类的运动特征。最近,Pan等人[12]根据出租车轨道上的上下需求,考虑城市不同区域的社会属性。通过以上的讨论,我们发现移动跟踪数据可以更好地解决城市中的许多问题,从而提高对普通人的服务。

本文的主要贡献概括如下。

–我们为乘客提供了一个建议策略,让他们站在路边乘出租车。我们在模型中引入了旅游气象指数(TMI),以考虑乘客的感受,并量化天气条件对出租车需求的影响。

–为了处理大规模的出租车跟踪数据,使用了一种称为Hadoop的现代云计算系统。Hadoop的主要任务是过滤和清理数据,绘制滑行轨迹,计算道路上的平均通过时间和空车到达率。

2 相关工作

有没有一种基于移动跟踪数据的解决交通问题的方法?显然是的,而且出租车追踪数据是研究中最常用的。从出租车司机的角度,根据出租车跟踪数据,袁等。[13]利用成本-效益-风险模型,设计三种策略,包括运送乘客的最低预期时间、最高收入和运送乘客的最大概率,为司机提供最佳推荐策略,缓解旅行困难问题;Lee等人[14]分析皮卡热点,推荐旅客最佳皮卡点,缓解乘坐出租车的困难;Yang等[15]利用出租车GPS数据规划公交路线,关注交通需求。齐等。[16]设计热点停车场出租车等待时间模型,估算等待时间,并向乘客推荐。袁等。[16]建立非齐次泊松分布的空车到达模型,将两辆空车的到达时间差作为等待时间。

但是,也有一些突出的问题。在论文[14]中,它忽略了乘客在皮卡点可能花费的等待时间,他们都忽略了那些宁愿在路边等待而不愿长时间步行乘坐出租车的乘客,包括[16]。最重要的是,天气状况在[13–17]中没有得到很好的考虑,尽管[17]根据好天气或坏天气来判断天气。

此外,对于处理海量跟踪数据的工具,很少有人关注。袁等。[17]建议openmp来承担这项任务,尽管如此,尽管它的性能很好,但在编程方面仍然存在很大的问题。Hadoop[18]是一个分布式云计算系统,具有很强的可靠性、效率、可扩展性和高容错性。因此,它被应用于出租车跟踪数据的存储和高效的处理。

图2推荐策略模型

3 推荐策略框架

该模型由两部分组成:(1)离线推荐和(2)在线推荐。推荐模型如图2所示。离线模式的主要工作是采集空出租车到达模型的跟踪数据。另一方面,在线推荐接受乘客的请求,并使用离线模型计算预期等待时间。

离线任务:我们使用mapreduce来高效地处理跟踪。首先,我们将轨迹映射到道路网络上,然后根据历史天气数据计算TMI。然后,在不同的日期和不同的天气条件下,得出所有道路的空车到达率。最后,这些都存储在数据库中。

在线任务:当在线请求推荐时,用户会上传他的位置和时间。然后,利用道路到达空车模型和用户从数据库中提取与日期和天气状况相关的用户位置。最后,我们计算出预期的等待时间并将其发送回乘客。表1总结了本文的主要注释。

4 数据预处理

滑行道数据的预处理由四部分组成:

(1)数据的过滤和清理;

(2)绘制滑行道;

(3)计算平均通过时间;

(4)提取道路上空车的到达率。考虑到数据的大小,Hadoop用于存储和处理跟踪数据,最重要的是加快处理速度。

在过滤和清洗过程中,会对错误的GPS点和非空的痕迹点进行清洗。根据图3所示的轨迹点标志,通过MapReduce中的地图很容易实现此操作。AB路段的通过时间是追踪点P8和P3之间的时间间隔。同样,路段cd的通过时间是指追踪点p16(或p15)和p10(或p11)之间的时间间隔。通过对所有通过道路的出租车的平均通过时间,可以最大限度地减小跟踪误差。

由于前两部分的预处理相对简单,我们省略了细节。在下面的小节中,我们首先描述了北京的轨迹数据集和路网,然后介绍了用于绘制轨迹和计算道路上到达空车率的方法。

4.1数据集描述

符号

定义

要与地图匹配的跟踪点

靶标

道路、车辆或人员正在行驶

n

一个序列包含一天内道路上到达的空出租车数量。

道路第i个时段内到达空车的数量

f(t)

公路上空车到达率的函数

TMI

旅游气象指标

G

乘客的GPS定位

W

从互联网获得的天气状况

TS

乘客的预期等待时间

特威特

预计有一辆空车到达目标公路的时间

迟后

出租车到达公路后用来寻找乘客的预期时间

模型

与日期和天气相对应的相关模型

表1符号定义

在中国北京,3个月内,约12000辆出租车产生了真实的出租车跟踪数据。数据格式汇总在表2中。超过30亿个记录道点的存储容量约为152 GB(解压)。

图3追踪点和通过时间

表2记录道数据格式

的士身份证

出租车ID:6个字符

事件

触发事件:0=更改为空

1 =要占用的变更

2 =防御工事,3=解除武装,4=其他

状态

当前状态:0=空车,1=乘客

2=停车,3=休息,4=其他

时间

时间:格式YYYYMMDDHHNNSS,北京时间

全球定位系统

经度:格式ddd.ddddddd Unit(),

纬度:格式dd.ddddddd单位()

V

GPS速度:格式:ddd,

数值:000255单位(km/h)内的整数

方向

GPS位置:格式:DDD

数值:000360以内的整数,单位为(

GPS状态:0=无效,1=有效

一般来说,北京的路网约有20万条道路,由158万个道路节点组成。虽然很少有道路是很难走的,例如胡同,但我们的数据集中至少考虑了10万条道路。4.2轨迹数据的地图匹配

4.2地图匹配的基本任务是为方案的下一阶段定位道路网络上的痕迹。为了处理海量的跟踪数据集,采用几何映射匹配算法进行跟踪匹配。同时,我们在MapReduce中进行并行处理,以加快此操作的速度。几何地图匹配算法通过累积点与周围道路之间的欧几里得距离来匹配GPS点。最小距离的道路视为匹配道路。采用方向与道路之间的度数修正匹配,表示为

(1)

其中,ri是第i条候选道路,deg是出租车的方向。由于运行时间取决于候选道路的数量,因此几何地图匹配算法的复杂性为o_nc_,其中nc是候选道路的数量。为了实现这一点,将地图进一步划分为网格,从而对落入同一网格的跟踪点进行参数约简处理。算法1简要介绍了MapReduce中匹配过程的实现。

4.3空车到达率的作用

提出了空出租车到达率的概念,用以衡量一段时间内空出租车到达道路的次数。这是下一章中计算预期等待时间的前期工作。我们将一天划分为m个时段,根据一段时间内的轨迹数据,很容易得到到达道路的空出租车数量,这里采用最小二乘法拟合空出租车到达率曲线。

假设nfrac14;fn0;n1;n2;hellip;;ni;hellip;nmg是一个具有与大多数序列类似趋势的代表,因为我们将时间间隔设置为半小时;然后,m是48。为了减弱配件上奇数点的影响,我们在5长度的移动窗口中通过平均点来平滑序列。那么,ni表示为

1西2

倪NJ_2_

5

JII2

考虑到计算的复杂性和适用性,我们采用多项式、高斯和有理函数拟合曲线。我们简单地表示拟合曲线如下。多项式的:

F_x_frac14;p1x4_p2x3_p3x2_p4x_p5_3_

高斯:f_x_frac14;a1_xb1_=c1_a2_xb2_=c2_a3_xb3_=c3_e2 e2 e2

(4)

理性:

PX3pi;X2

F x x1_2 q1p3x2_p42 Xgamma;gamma;Q

X

(5)

其中,p1;p2;p3;p4;a1;a2;anda3是拟合曲线的已知系数。拟合曲线的示例如图4所示。从上图可以看出,每一条拟合曲线只能反映序列的某些特征。特别是多项式可以显示整体趋势,同时缺少峰的细节。相比之下,高斯曲线拟合在下午表现良好,而一个更好的拟合方法是增加更多的项目和增加程度。结果,未知变量的数量增加;因此,由于数据集的大容量乘法运算,计算量突然增加。

我们从图4中观察到,9点之前的顺序更规则,而之后的顺序则比较粗糙。显然,这与我们的日常观察是一致的。例如,由于需求量低,司机需要休息,出租车在午夜停止运行。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[19614],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版