版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、用出租车GPS数据分析深圳道路交通情况摘要随着城市经济的发展,城市交通量不断增大,出租车通过安装GPS终端,将交通信息反馈给管理中心,为城市交通进行合理的规划做出了贡献。本文利用深圳市出租车GPS数据,解决了交通小区的划分,OD时空分布的计算和预测等问题。针对问题一,由于数据量庞大,本文选取2011/4/19一天的数据进行处理。选取车辆状态status从0变为1,从1变为0对应的坐标分别作为出租车载客的起讫点,对数据进行筛选。根据筛选后的数据,利用出租车起讫点的密集程度用基于密度的聚类算法DBSCAN聚类进行交通小区的划分,得到划分图。针对起讫点过于密集且没有进行划分的区域,结合深圳市交通地图
2、,采用K-Means空间聚类对这些地区进行细分,最后将深圳市划分为A-K等11个交通小区,划分结果见图6,对比深圳市行交通地图发现本文划分的小区与其大致吻合。本文通过计算小区内各点经纬度的平均值作为小区的坐标。如A区坐标:(114.23,22.56)。针对问题二,本文用OD矩阵表示OD时空分布,选取2011/4/19,7:40时刻做具体计算说明。首先计算出该时刻下,车辆状态status为1,即出租车重载或者开始载人的地点与各小区坐标的马氏距离,选取马氏距离较小的小区作为载客出租车起点的所属小区,追踪载客出租车的讫点,用同样的方法计算出讫点所属小区。对到达每个小区的车次进行累加求和,即可得到该时
3、刻各小区之间的交通量,即OD时空分布。例如7:40从E区前往K区的人数为130。用同样方法可以计算出任意时刻载客出租车的OD时空分布。 针对问题三,首先建立居民出行选择出租车作为交通工具的概率随小区间距离变化的隶属度函数,计算出各小区之间居民选择出租车来往的概率。然后挑选出居民出行特征明显的五个时刻:1:20,7:40,12:30,17:30,21:30,分别计算载客出租车的OD时空分布,之后根据各小区之间出租车通行的概率求解出居民出行的OD时空分布。最后统计其他部分时刻的居民出行总量,得到2011/4/19一天的居民出行量随时间的变化曲线,得出早上8点左右和下午6点左右是居民出行的高峰期。在
4、此基础上,基于信息熵对居民出行分布的均衡性进行了分析,得出夜间和午间居民出行相对均衡。 针对问题四,本文设定路口、路段车辆的平均行驶速度分别小于10km/h、20km/h时,认为拥堵。对载客出租车的行驶方向进行分析,确定出路口和路段位置。将2011/4/19除去居民出行较少的时间段21:00-7:00的其余时间按两个小时为间隔,划分为7个时间段。分别计算出各个时间段内,行驶在同一路段或路口所有载客出租车的平均速度,按照拥堵标准确定出各个时间段得拥堵路段和路口,得到拥堵图。通过分析7个拥堵图发现,大量路口和路段在7:00-9:00和17:00-19:00处于十分拥堵的状态,在11:00-13:0
5、0和19:00-21:00处于拥挤的路口和路段相对较少,其他时间基本没有出现拥堵情况。关键词: DBSCAN聚类 K-Means OD矩阵 隶属度函数 信息熵一、问题重述各大城市出租车越来越多的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向)等信息。附注网站提供了深圳市出租车GPS数据,从这些数据你是否能够:1. 根据出租车载客的起讫点,结合深圳市的交通地图,恰当的划分交通
6、小区,并选择小区中的某一点,用其经纬数值作为该小区的坐标。2. 根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布。如:某时刻从坐标到、的出租车有多少辆。3. 由此,在合理的假设条件下,能否对人们出行的OD时空分布进行推断?4. 根据出租车载客后的行驶数据,筛选出拥堵的路段时段以及拥堵的路口时段。拥堵的标准自己设定,如某路段在某个时段平均行驶速度小于多少公里/小时(比如,10公里/小时),可认为是拥堵。二、问题分析2.1交通小区的概念 交通诱导是均衡一定区域的交通流量,区域控制是对一定数量交叉口的协调控制。将这个有限的交通区域称之为交通小区。交通小区是具有一定交通关联度和交通相似度的
7、节点或连线的集合,随时间、关联度和相似度的变化而变化 ,反映城市路网交通特征的时空变化特性。交通小区具有同质性关联性、动态性、稳定性、自组织性等特性1。交通小区的划分是分析城市交通网络的一个很好的方式,因为交通小区内具有相似的交通特征和较强的交通关联性交通小区的划分与该城市的人口 面积 经济特征 产业结构等密切相关,并在一定程度上反应了一个城市的吸引力。一般来说,交通小区的划分应该遵循以下原则2:(1)分区内的经济、社会等特性尽量一致;(2)小区划分尽量不打破行政区的划分,以便可以利用行政区的统计资料;(3)尽量以铁路、河川等天然屏障作为分界线,尽可能避免小区内存在人为或自然障碍线;(4)分区
8、数量适当,中等城市不超过 50 个,大城市最多不超过100- 150 个 数量太多将加重规划的工作量,数量太少又会降低调查和分析的精度;(5)小区尽可能规整,避免狭长形状。本文主要针对深圳市的具体情况划分交通小区。从资料中得到深圳市行政区划分图为:深圳市行政区划分图2.2问题一的分析问题一要求根据出租车载客的起讫点,结合深圳市的交通地图,恰当地划分交通小区,并确定小区的经纬度。首先对数据进行分析,发现这是一份相当庞大且很全面的数据,同时也存在划分小区时所用不到的信息。GPS终端采集的数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向等信息。本题需要得到出
9、租车起讫点的信息。所以只需挑选出车辆状态从空车变为重车,重车变为空车时对应的数据。根据起讫点的经纬度确定出租车的位置,毫无疑问是大量的二维的样本点,想到用聚类的方法按照出租车起讫点的密集程度将深圳市划分为几个交通小区,然后可以选择小区内各点经纬度的平均值作为小区的坐标。2.3问题二的分析 问题二需要在第一问的交通小区划分的基础上,给出载客出租车的OD时空分布。OD时空分布就是某时刻各小区之间的交通量分布。本文选取居民出行量较多的上班时刻2011/4/19,7:40,来计算各个小区之间的出租车通行量。首先得确定出该时刻下有哪些出租车处于载人状态或者开始载人,然后确定这些出租车在这个时刻处于哪个小
10、区,接着追踪乘客的目的地,确定目的地在哪个小区。对到达各个小区的出租车辆数进行累加求和,即可得到该时刻载客出租车的OD时空分布。2.4问题三的分析 在前两问的基础上可以求出载客出租车的OD时空分布,如果要对人们出行的OD时空进行推断,首先得知道居民出行时有多大可能选择乘坐出租车,即得到各个小区之间居民乘坐出租车来往的概率分布,可以考虑建立居民出行基于距离而考虑选择出租车的隶属度函数。然后根据已知的载客出租车的OD时空分布,除以对应的概率,即可得到人们的总的出行OD时空分布。2.5问题四的分析衡量路段或路口的标准有很多种,这里选择路段或路口的平均速度来判断某路段或某路口是否拥堵。在路口时,由于行
11、驶方向较多,并且设置红绿灯,交通相对复杂,出租车的行驶速度也会放慢,所以设定路口行驶车辆的平均速度小于10km/h时,认定其会导致路段拥堵。在路段行驶时,来往车辆按两个方向进行行驶,交通较为顺畅,所以设定路段行驶车辆的平均速度小于20km/h时,认为其导致路段拥堵。本文将2011/4/19等间隔分成一些时间段。通过出租车行驶方向是否变化来判断路口和路段位置,分别计算出路口路段车辆的平均行驶速度,确定出拥堵的路口路段,得到各个时间段得交通拥堵图。三、模型假设1、假设深圳市在采集数据的时间内没有出现阻碍或促进居民出行的情况,例如一些活动;2、假设地球是规则的球体;3、假设居民出行选择出租车时只考虑
12、距离的长短;4、假设出租车的在路段平均行驶速度小于20km/h时导致路段拥堵;5、假设出租车在楼口的平均速度小于10km/h时导致路口拥堵;四、符号说明符号说明name车牌号time采集时间点jd经度wd纬度status车辆状态v车速angle行车方向出租车载客起讫点的经度出租车载客起讫点的纬度交通小区坐标从小区i出发去往小区j的的所有车次n小区个数m小区中样本点的个数l两个小区之间的距离p在某两个小区之间居民乘坐出租车的概率注:status为0时表示车辆非打表,即空载,为1时表示已打表,即重载;angle分别为 0东;1东南;2南;3西南;4西;5西北;6北;7东北;其他符号在文中出现处予以
13、说明。五、模型的建立与求解5.1问题一的求解 交通小区是为了减少交通控制和管理系统的复杂性提出的,为了减少交通控制,一些交通相似的地区所组成的紧密区域可以作为一个交通小区。载客出租车的起始地点和目的地就是交通密集的地方,根据载客出租车起讫点的密集程度用聚类算法方法将深圳市划分为若干个交通小区,在根据小区内各点经纬度的平均值确定小区的坐标。 数据处理 由于题目所给数据时时间段为2011/04/182011/4/26,车辆总数为13798的GPS数据,数据量十分庞大,基于缩短数据查询时间及提高整体运算性能等方面,本题选取时间段为2011/4/19,8:009:00的数据。 GPS终端采集的数据包括
14、序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向等信息。本题需要得到出租车起讫点的信息。数据中车辆状态status为0时表示出租车空载,为1时表示重载,所以当status从0变为1时,status值为1的位置即为乘客上车的位置,视为起点;status从1变为0时,status值为0的位置即为乘客下车的位置,视为讫点。针对车辆粤B000H6做如下具体说明:从数据表中挑选出的2011/4/19,8:009:00时段的部分原始数据如下:表1:部分原始数据nametimejdwdstatusvangle粤B000H62011/4/198:08:31114.084222
15、.5711516粤B000H62011/4/198:08:53114.081122.572471666粤B000H62011/4/198:12:18114.063922.571230130粤B000H62011/4/198:18:50114.05422.578880173粤B000H62011/4/198:19:20114.054222.57841223粤B000H62011/4/198:44:58114.049322.52568102粤B000H62011/4/198:45:20114.049322.52568002根据出租车载客起讫点的确定方法剔除无用数据后,得到如下筛选数据:表2:对应优
16、化后数据nametimejdwdstatusvangle粤B000H62011/4/198:08:53114.081122.572471666粤B000H62011/4/198:12:18114.063922.571230130粤B000H62011/4/198:19:20114.054222.57841223粤B000H62011/4/198:45:20114.049322.52568002上表中status为0的经纬度即为乘客的下车地点,status为1的经纬度即为乘客的上车地点。利用这种方法对2011/4/19,8:009:00时间段的数据进行优化得到出租车载客起讫点的数据,进而划分交通
17、小区。获取数据的散点图如下:图1:数据散点图交通小区的划分1.DBSCAN聚类划分交通小区本文利用出租车载客起讫点的密度,首先采用DBSCAN算法对深圳市进行交通小区的划分。DBSCAN算法是一种基于密度的聚类算法。它利用类的密度连通特性, 可以快速发现任意形状的类。其优点在于, 它可以发现任意形状的聚类, 并且不受"噪声"的干扰。其关键思想是, 聚类中每个核心点在给定半径(Eps )的圆内的相邻对象至少必须达到一个数量(MinPts) , 也就是相邻对象的数量必须超过一个阈值。具体划分过程如下:图2:DBSCAN交通小区划分流程图参照深圳市行政区面积及我国其他城市交通小区
18、的面积,设定数据点的最小领域Eps为0.0097度,领域内最小车辆数MinPts为20。根据以上流程对深圳市交通小区的划分图为:图3:DBSCAN聚类小区划分图2.结果分析从上图可以看出,交通小区划分结果并不理想,其中深圳市南部出租车载客起讫点非常密集,划分结果没有区分开来,这主要是因为DBSCAN算法的缺陷导致的。由于DBSCAN算法用的是全局Eps值,所以数据空间中的所有对象的领域大小被设置为一致,但是实际起讫点的密度和类间距离是分布不均匀的,所以选取的Eps值很容易让离得较近而密度较大的那些类归为一类。查询深圳市地图可以知道该区域分别为南山区、福田区、罗湖区、盐田区,这些地区人口居住密集
19、,工业密集,商业繁华,娱乐设施齐全,为深圳市的核心区,且靠近香港,相对而言人类出行较为频繁。本文考虑用K-Means聚类对这些密集地区进行重新划分。深圳市西北方出现较多噪声点,对应深圳市地图可以知道该区为光明新区,该地区占地面积较大,但是靠近西部,工业较少,经济相对较差,交通相对较少。但是这些噪声点不能剔除,因为剔除后无法反映实际交通情况,不利于政府统计数据进行城市规划。因此本文将这部分噪声点划分为一个独立的交通小区,反应光明光明新区交通量较少的情况。3.K-Means聚类细分交通小区 针对上述用基于密度聚类的DBSCAN算法对起讫点密集地区划分结果不理想的情况,用K-Means算法对密集地区
20、进行重新划分。K-Means算法是一种分割式聚类方法,它是数据挖掘技术中一种经典的基于划分的聚类算法。其目的在于从大量数据点中找出具有代表性的数据点,即中心点,然后再根据这些中心点进行后续的处理。具体划分过程如下:图4:K-Means交通小区细分流程图 根据深圳市行政区的划分情况,将划分个数K设置为7,划分的小区图如下:图5:K-Means细分小区图综上,基于DBSCAN聚类和K-Means聚类结合的方法得到的深圳市交通小区划分图为:图6:深圳市交通小区划分图从上图可以看出,通过聚类运算将深圳市划分为A-K等11个交通小区,与深圳市地图结合,发现居民出行较为频繁的地区与深圳市经济娱乐发展较成熟
21、的区域一致,且基本符合行政区域的划分,证明了交通小区划分的合理性。小区坐标各交通小区已经划分完毕,每个小区中对应部分出租车载客起讫点的经纬度,本文根据小区内各点经纬度的平均值确定小区的坐标。即小区坐标的计算公式为:式中,m为小区中数据点的个数,为数据点的经度,为数据点的纬度。 利用各交通小区中数据点的经纬度,通过公式(1)的计算可以得出各小区坐标为:表3:交通小区坐标ABCDEFjd114.23005114.2451251114.195238113.8919059114.04679113.9578wd22.5571748122.7251727322.6487367422.7012375622.
22、5371622.54838GHIJKjd114.03809113.91925113.87093114.13132114.10517wd22.6496222.5295822.5926322.5899622.54743小区中心已在上图中标出。5.2 问题二的求解 模型建立OD时空分布就是某时刻各小区之间的交通量分布。用OD矩阵表示OD时空分布,OD矩阵定义如下:式中,表示某时刻,从小区i出发去往小区j的的所有车次;n表示小区的个数。 本文选取居民出行量较多的上班时刻来具体说明如何确定载客出租车的OD时空分布,设定该时刻为2011/4/19,7:40。根据数据库中的数据,确定出该时刻下处于载人状态或
23、刚好载人的出租车及其经纬度,通过计算这些出租车与所有小区坐标的马氏距离来判定出租车是属于哪个小区的,与哪个小区的马氏距离最小,则判定出租车属于该小区。之后追踪这些出租车的目的地的经纬度,根据与各小区的马氏距离来判定差租车驶往哪个小区。对到达个小区的所有车次进行累加求和,即可得出该时刻的载客出租车的OD时空分布。具体操作流程图如下:图7:计算出租车OD时空分布的流程图 模型求解 基于以上流程图进行计算,得出2011/4/19,7:40,该时刻各小区之间的交通量,即载客出租车的OD时空分布如下:表4:载客出租车得OD时空分布ABCDEFGHIJK上车人次A2002200000915B0403000
24、1010045C020000001003D0005002030010E023162812718241513130529F100219422241419114G1121224490211624177H10012306226319516210I00147500253914131J22115413165362113263K702281211015131649269530下车人次144722865251981461561121475742027 从 上表中可以看出,上班时间E区和K区乘坐出租车上班的人数最多且在两小区下车人数也最多,说明这两个小区交通量大,工作单位多,经济相对发达。查询深圳市地图可知,
25、E区和K区分别对应福田区和罗湖区,恰恰是深圳市的经济核心区。由此证明了交通小区划分的合理性和OD时空分布计算的正确性。类比以上方法可以求出其他不同时刻下载客出租车得OD时空分布。5.3问题三的求解 本文考虑先求出各个小区间居民选择出租车进行来往的概率,根据已知的载客出租车的OD时空分布,推出人们出行的OD分布。5.3.1 模型建立1.各交通小区间距离 因为各小区坐标是以经纬度形式表示的,不利于计算两个小区之间的距离,现对其进行转化。假设地球为一个规则的球体,地球半径为R=6371.004km。查询可知深圳市所在纬度圈半径为:式中,为纬度角,资料显示22.45°<<22.8
26、7°,介于其范围较小,将设定为22.5°。单位纬度对应的距离为:单位经度对应的距离为:通过代入R和的值进行计算得到:,。所以深圳内两点间所跨经纬度对应的距离为:式中,为小区i和j之间的纬度差。为小区i和j之间的经度差。综上可以得到两个交通小区之间的距离为:2.隶属度函数居民选取交通工具跟其出发点与目的地之间的距离有关系,本文假设居民出行选择出租车作为交通工具只与小区间的距离有关系,通过资料查询,居民出行选择出租车的最大概率为0.7,建立居民出行选择出租车作为交通工具的概率随小区间距离变化的隶属度函数如下:式中,l为两个小区之间的距离;,为未知参数。5.3.2模型求解1.小区
27、距离利用公式(3)公式(7)可以计算出A-K各交通小区之间的距离(单位为km),分别为:表5:各交通小区之间的距离ABCDEFGHIJKA0.00018.74510.79138.24418.95227.97522.23432.06637.09210.77512.871B18.7450.0009.92436.37329.18935.45622.86239.91441.15919.04424.439C10.7919.9240.00031.69519.65626.81516.13931.28833.8869.26314.576D38.24436.37331.6950.00024.20618.2961
28、6.07319.29412.26827.52627.789E18.95229.18919.65624.2060.0009.22212.53713.12519.08510.4806.103F27.97535.45626.81518.2969.2220.00013.9534.47910.19018.40915.133G22.23422.86216.13916.07312.53713.9530.00018.08718.30011.64913.289H32.06639.91431.28819.29413.1254.47918.0870.0008.59022.79119.197I37.09241.159
29、33.88612.26819.08510.19018.3008.5900.00026.74424.576J10.77519.0449.26327.52610.48018.40911.64922.79126.7440.0005.439K12.87124.43914.57627.7896.10315.13313.28919.19724.5765.4390.0002.选择出租车出行的概率资料显示,居民出行过远时会较少的选择出租车,而选择相对便捷便宜的长途汽车或者地铁等交通工具,本文假设距离36km时,选择出租车的概率仅为0.2。相同的,出行距离较短时,居民更愿乘坐公交车或者步行,假设出行距离为2km
30、时,乘客选择出租车得概率为0.4。将以上两组数据代入公式(8),可以求出=0.0012,=2.5105,即隶属度函数为:根据隶属度函数的计算公式,可以求出各个小区之间居民选择出租车进行来往的概率:表6:各小区之间居民乘坐出租车的概率ABCDEFGHIJKA0.3370.6780.6700.1660.6750.4010.5970.2820.1820.6700.694B0.6780.3370.6540.1940.3620.2100.5770.1450.1310.6730.524C0.6700.6540.3370.2910.6620.4400.6990.3020.2400.6390.700D0.16
31、60.1940.2910.3370.5320.6840.6990.6690.6900.4160.407E0.6750.3620.6620.5320.3370.6380.6920.6960.6720.6650.543F0.4010.2100.4400.6840.6380.3370.6990.4860.6590.6820.700G0.5970.5770.6990.6990.6920.6990.3370.6860.6840.6830.697H0.2820.1450.3020.6690.6960.4860.6860.3370.6210.5800.671I0.1820.1310.2400.6900.67
32、20.6590.6840.6210.3370.4430.519J0.6700.6730.6390.4160.6650.6820.6830.5800.4430.3370.520K0.6940.5240.7000.4070.5430.7000.6970.6710.5190.5200.3373.居民出行OD时空分布本文挑选居民出行特征较强的五个时刻,分别为:上班时刻7:40;午休时刻12:30;下班时刻17:30;晚间出行21:30;夜里:1:20。分别利用问题二中的方法计算出载客出租车的OD时空分布,根据表6居民出行乘坐出租车的概率,计算出居民出行OD时空分布。其中12:30时刻下居民出行的OD时
33、空分布如下:表7:12:30时刻居民的出行OD时空分布ABCDEFGHIJK前往A110065230511851B1183100050001191C11140101003122D00638184857439129E5244384156344537463681481F200145311885527525307G6324208311222027405H366232874828428526491I0007813119151211212J117143021334165169409K1235852813838354416713212029到达4219945234128531543044830541820
34、065727其他时刻的OD分布表见附录。从上表可以看出午间时刻,居民前往K区的人数最多,E区次之,小区A、B、C、D的居民出行量和到达量都较少,结合深圳市地图分析,发现这种情况符合深圳市各地区的产业结构。4.居民总出行量本文统计出了其他一些时刻的居民出行总量,得到居民在2011/4/19一天的出行量的变化图像:图8:2011/4/19居民出行总量上图反应出两个出行高峰期,分别对应的是上午8点左右和下午18点左右,这两个时刻刚好对应这人们的上班和下班活动,出行量较一天中的其他时刻来说,相对较大,较集中。该图正确的反应了一天中居民出行量得变化,验证模型的合理性。5.熵值判断居民出行的均衡性在以上基
35、础上,本文针对F-K等六个交通小区交通量较大的情况,对居民出行空间分布的均衡性进行了分析。将城市中每个居民看作在城市空间中运动的一个分子时,城市居民在一定时期内出行分布的变化情况类似于墨水分子在水中扩散的情况。墨水分子扩散过程认为是孤立的,即不受外界影响,所以扩散过程是熵增的过程,在水分子中的分布也逐渐趋向均匀。但是对一个城市来说,居民出行分布变化过程并不是孤立的。因此,一个城市一段时间内居民出行分布的熵值有可能增大或减小。熵值增大说明居民出行分布趋向均衡;反之,则趋向悬殊。本文基于信息熵分析居民出行的均衡性5。首先将城市交通小区之间的出行频率作为信息源,其中居民在小区i和小区j的出行频率为:
36、式中,为从小区i到小区j的居民出行量。当i=j时,为区内出行率,且用信息熵来描述居民出行分布的熵值如下:式中,S为居民出行分布信息熵;k为波尔兹曼常数,在进行分析比较时可以令k=1;n为交通小区划分数。根据以上熵值的计算方法,基于前面所求五个时刻居民在各个小区之间的出行量,得到五个时刻居民出行的信息熵:图9:居民五个时刻出行分布的信息熵从上图可以看出居民出行最不均衡对应的时刻为早上7:40和下午17:30,分别为上班时间和下班时间,夜间午间相对均衡。结合前面居民出行的OD时空分布发现,居民前往E区和K区的人数较多,这些地区对应的是深圳市的经济核心区,工业,服务业等相对发达,居民选择在其工作的人
37、数相对较多,所以上班和下班期间出行最不均衡。5.4问题四的求解5.4.1模型建立本文考虑到时间过早或过晚时路上的行人稀少,交通量少,所以不进行时间段为21:00-7:00路口或路段拥堵的判定。将其余的时间按两个小时进行划分,得到7个时间段,分别对这7个时间段进行交通拥堵的判断。本文只考虑载客出租车的拥堵问题。对数据进行分析,发现出租车在行驶的过程中方向会发生变化,将变化的位置作为一个路口。统计出这个时间段内所有载客出租车产生的路口位置,将经度差和纬度差绝对值之和小于0.001的路口归为一个路口,计算出在这个路口内所有通行的出租车的平均速度,当平均速度小于10km/h时,认为该路口拥堵。统计出所
38、有的拥堵路口,得到这个时间段内的交通拥堵图。在判断路段拥堵方面,设定载客出租车连续记录5次数据的情况下没有改变行车方向,则认为其在同一路段进行行驶。对于不同出租车,如果两辆在各自路段行驶的经纬之差比(经度之差比上纬度之差)相同,则认为两辆车是在同一路段行驶。统计出某时段下行驶在某路段的所有出租车的平均速度,平均速度小于20km/h时,认为该路段拥堵。统计出各个时段得到对应的路段的交通拥堵图。5.4.1模型求解根据以上方法可以得出时间段7:00-9:00;9:00-11:00;11:00-13:00;13:00-15:00;15:00-17:00;17:00-19:00;19:00-21:00,
39、对应的路口和路段拥挤图。其中7:00-9:00对应的路口拥挤图和路段拥挤图如下:图10:7:00-9:00路口拥挤图图11:7:00-9:00路段拥挤图其他时间段的交通拥堵图见附录。通过对比这7个时间段的交通拥堵图,可以得出某个路段或路口一天的拥堵情况。总体分析发现,在早上7:00-9:00和下午17:00-19:00处于十分拥堵的路口很多。少量路段和路口是在午间11:00和晚间17:00-21:00处于拥堵。这可能是由于某些路段或路口经营饮食或者娱乐行业,吸引居民前往。其余时间基本没有出现拥堵情况。六模型检验与评价 6.1 模型优点1.基于密度的聚类算法DBSCAN在处理空间数据时具有快速、
40、有效处理噪声点和发现任意形状的聚类等优点,用其与K-Means聚类结合的该方法划分的深圳市交通小区与深圳市行政区域划分相吻合,结果较为合理。2.第三问我们在合理的假设下用隶属度函数合理的将出租车的od时空分布转化为人们的出行的od时空分布,并且我们运用时序图和熵值的概念对人们od时空分布结合深圳市的区域具体情况进行了详细的分析。3. 第二问与第四问我们牢牢的抓住题目的含义,进行通彻的分析,并用巧妙的方法解出最终的结果。在数据的选取方面我们选取了所有的车的信息,并且对其中的少部分的错误信息进行剔除,统计结果具有一定的客观性。6.2.2 模型缺点1.交通小区划分的数量相对较少,进行交通规划相对较难
41、;对部分经济发达地区,没有体现区内的差异性。2.在第二问中计算居民出行选择出租车作为交通工具的概率时,假设居民只从出行距离考虑选择交通工具,可能与实际情况不符。3.在判断交通拥挤的路段时段和路口时段时,只按两个小时进行划分时段,过程过于粗糙,可能导致短暂的拥堵情况被记录进去。七模型改进1.第三问中的居民出行乘坐出租车概率的隶属函数,在合理的假设下只考虑与距离有关系,为了更符合实际,本文考虑居民出门交通工具选择与出行距离两方面的因素,首先把关于模型中关于距离的隶属度函数进行修正:然后对居民出行交通工具的选择进行层次分析,选取人们常用的交通工具出租车、汽车、地铁、公交车作为人们出行交通工具的全部。
42、接着选取5个评价指标:省时性、环保性、普及性、省钱性、舒适性。图12:层次分析图通过层次分析中成对比较阵的具体确定,可以得到出租车、汽车、地铁、公交车的具体的权重系数 因此得到一个新的录属度函数,2.针对第四问时间段划分较大的情况,重新以十五分钟为间隔进行时间段得划分。然后确定出各个时间段拥堵的路口和路段。介于时间原因,这里没有给出具体拥堵图。【参考文献】【1】李晓丹,杨晓光,陈华丰·城市道路网络交通小区划分方法研究J ·计算机工程与应用·2009,45(5):19-22;【2】郭峤枫·浅析交通小区划分问题·西南交通大学交通运输学院,四川 成都 610031【3】吕玉强·基于出租车GPS数据聚类分析的交通小区动态规划方法的改进J ·技术与方法·2010年5月【4】杨波,刘海洲·基于聚类分析的交通小区划分方法的改进J ·交通与运输·2007,(7):23-26;【5】曲昭伟,姚荣涵,王殿海·基于最大信息熵原理的居民出行分布模型J ·吉林大学学报(工学版)·
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人二手商铺买卖合同协议书
- 个人间借款合同样本:版
- 个人股权抵押合同范例
- 三方合同:学生就业定向合作
- 专属应届毕业生:个人租赁合同范本
- 中学教务主任聘任合同样本
- 单项木工承包合同
- 中外采购与供应合同范本
- 专业水处理设备维护合同细则
- 三人合伙经营合同范本
- 烟叶复烤能源管理
- 食品安全管理员考试题库298题(含标准答案)
- 执业医师资格考试《临床执业医师》 考前 押题试卷绝密1 答案
- 2024年山东济宁初中学业水平考试地理试卷真题(含答案详解)
- 社会保险课件教学课件
- 订婚协议书手写模板攻略
- 准备单元 雪地上的“足迹”(教学设计)-2023-2024学年五年级下册科学大象版
- 宇航用商业现货(COTS)器件保证指南-编制说明
- 音乐学科阅读方案
- 《立体仓库钢结构货架技术规范(征求意见稿)》
- 2024年贵州蔬菜集团有限公司招聘笔试参考题库附带答案详解
评论
0/150
提交评论