版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-.z基于出租车GPS数据分析**交通拥堵情况解放军信息工程大学谷继亮、王龙、赵宸立摘要:本文基于出租车GPS数据,从区域交通量OD分布角度出发,结合**市交通地图,研究**市交通小区的划分,建立载客出租车和人们出行的OD时空分布,分析筛选出拥堵的路段时段以及拥堵的路口时段。本文特点在于把经过处理的数据显示在地里信息系统软件上,并结合马克威分析系统完成小区的划分以及交通拥堵模型的检验。首先,采用随机抽样的方法获取数据样本,并利用C++编程对数据进展优化处理,得到出租车载客起讫点时刻的GPS数据,基于聚类与交通小区划分的相似性原理,利用马克威分析系统中的快速聚类方法进展交通小区的划分,共求得200个小区以及各小区的坐标。其次,利用合理假设,建立交通量OD分布概率模型,采用Bayes方法对模型的参数进展估计、对模型的整体拟合效果进展了检验,利用马克威分析系统处理数据得出小区交通量,进而求解出交通量的OD分布。再次,根据各区域总体居民出行时耗(出行距离)与出行比例的总体分布,将交通小区发生量离散为不同出行时耗(出行距离)区间上的出行量,并将相应区间内的出行量按区间所包含的交通吸引小区的面积及吸引量大小进展分配,得到了人们出行时耗特征图。最后,根据出租车载客后的行驶数据,编写程序筛选出有用的数据,并且把这些数据显示在GIS上,查找车辆比较拥堵的路段以及拥堵的路口时段。通过马克威分析系统软件处理GPS数据,得到各个路段的车辆数据。关键字:交通小区、OD分布概率模型、聚类分析、马克威分析系统问题的提出近年来,随着国民经济的快速增长,人流、物流、信息流以前所未有的密度涌向大中城市并向周边辐射,城市化进程明显加快,城市规模不断扩大,人口不断集中。此种状态在带动城市交通需求高速增长,机动车辆快速增加的同时,也促使城市道路负荷加重,交通拥堵现象日益加剧。交通拥堵使交通延误增大,行车速度降低、时间损失、燃料费用增加、排污量增大、城市环境恶化、并诱发交通事故,直接影响人们的工作效率和身体**。出租车是城市客运交通的重要组成局部,是常规公共交通的重要补充。随着出租车数量的不断增长,出租车交通量已成为城市道路交通总量中的重要组成局部,成为影响城市道路交通分布及分配预测准确性的重要因素之一。由于出租车运行的随机性,没有固定的起讫点和运行线路,给定量分析带来一定的困难。各大城市越来越多的出租车的安装了GPS终端,这些终端能够每隔1分钟向出租车管理中心发送本车的位置、速度和方向等信息,是车辆GPS实时数据。原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向)等信息。这些GPS数据为我们研究出租车交通情况题共了参考和依据。现阶段在交通拥堵方面主要集中在研究*个路口的情况,并且用缓冲区方法,而没有对整个区域有个整体的描述,而对于整个区域的研究则是基于交通需求建立模型,数据采集的精度不高。本文基于出租车GPS数据建立**整个区域的交通拥堵模型。数据的采集和预处理我们从网络〔什么网〕上下载了**市出租车的GPS数据,由于数据量较大,硬件设备无法对这些数据全部进展处理,我们采取了随机抽样的方式,从一万多辆出租车中随机抽取了100辆出租车的GPS数据进展建模分析。然而,原有的GPS数据中有很多错误数据〔一些数据的经纬度超出**市*围,还有些车辆的状态明显错误〕,我们用C++语言编程对数据进展了筛选处理,得到了有效的GPS数据。利用这些数据我们进展了下面的数学建模分析。数据格式见表1。表格SEQ表格\*ARABIC1数据格式字段例如备注车牌号日期时间经度纬度运营状态速度方位角粤B00G702011/04/1808:44:27114.04461722.53726815300为空载;1为重载该点车辆的瞬时速度行车方向问题的分析与模型的建立3.1划分小区处理数据根据出租车载客的起讫点,结合**市的交通地图,恰当的划分交通小区,并选择小区中的*一点,用其经纬数值作为该小区的坐标。GPS数据中,出租车的状态为0表示载人,为1表示空车。在间隔几分钟后得到的下一数据多和上一数据的状态一样。要得到出租车载客的起讫点,我们需要对数据进展处理,使得到的数据中相邻的出租车运营状态不一样。当运营状态由0变为1时表示出租车由空车到有客人上车,当运营状态由1变为0时表示出租车由载客到客人下车。处理前后的数据见表2、表3:表格SEQ表格\*ARABIC2原始数据nametimejdwdstatusvangle粤BA3G242011/04/2418:27:32114.11360222.600800104粤BA3G242011/04/218:28:27114.11239622.601151160粤BA3G242011/04/2418:29:19114.11261722.6068991377粤BA3G242011/04/2418:29:58114.11261722.6093010230粤BA3G242011/04/2418:30:53114.11256422.609150004粤BA3G242011/04/2418:31:48114.11261722.607683083粤BA3G242011/04/2418:32:44114.11298422.6046160173粤BA3G242011/04/2418:33:38114.11228222.6016671224粤BA3G242011/04/2418:34:33114.11268622.5996671124表格SEQ表格\*ARABIC3优化后的数据nametimejdwdstatusvangle粤BA3G242011/18:29:19114.11261722.6068991377粤BA3G242011/04/2418:29:58114.11261722.6093010230粤BA3G242011/04/2418:33:38114.11228222.6016671224模型建立——K-Means聚类算法经过上一步的数据优化,即可得到由起讫点数据组成的数据集。现在需要对这些数据进展聚类运算:一段时间内的起点或者讫点被划分为假设干个区域,每个区域中的点分布紧凑,区域与区域之间自然分开本文采用了K-Means聚类算法。K-Means聚类算法是一种分割式聚类方法,它是数据挖掘技术中一种经典的基于划分的聚类算法。其目的在于从大量数据点中找出具有代表性的数据点,即中心点,然后再根据这些中心点进展后续的处理。K-Means算法采用了迭代更新的运算思想,聚类过程如下:首先从n个数据点随机选择k个点作为初始聚类中心;通过运算其它点与这些聚类中心点的相似度〔距离〕,将其分别分配给与其相似度最高〔距离最近〕的中心点所在的聚类;然后对划分好后的聚类重新运算聚类中心这一过程不断重复直到标准测度函数开场收敛。设*={}为待聚类样本的全体(称为论域),即道路网络,为观测样本(各个路段)的特征矢量或模式矢量,对应特征空间中的一个对象,为特征矢量的第j维特征取值。设c为聚类数,为样本数,聚类中心点集,且为硬划分矩阵。假设按照最近距离进展样本划分,则样本硬划分矩阵计算如下:式中,表示样本与中心点之间的欧氏距离。假设以类内平方误差和最小化为聚类目标函数,则聚类目标函数表示为:利用马克威分析系统聚类分析利用马克威分析系统,通过聚类分析得到了200个交通小区的坐标,如图表1,各个小区内的交通量和各小区之间的欧氏距离。在GIS上根据各个小区坐标附近点的绘制以下图小区大致*围。如图表2。图表SEQ图表\*ARABIC1交通小区坐标分布图图表SEQ图表\*ARABIC2小区的大致区域3.2根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布。如:*时刻从坐标到、的出租车有多少辆。区域交通量OD分布概率模型假设*一小区交通发生量分布到不同小区的OD量与这些小区的吸引量成正比。这是许多分布模型的根底,不再解释。整个**区域共划分为m个小区,则区域交通量OD分布矩阵为:Qij表示从小区i到小区j的交通量。设区域交通为Q总,则有:并记:i,j=1,2,…,m式中Pij表示从i小区到j小区的交通量与整个研究区域的交通量之比。取随机变量*、y分别表示个交通的起点、终点,利用参数Pij可构造(*、y)的联合分布。表格SEQ表格\*ARABIC4Pij的联合分布*y1,2,…,…,m*=i12…my=jp11,p12,…,p1mp21,p22,…,p2m……pm1,pm2,…,pmmp1,p2,…,pmp1p2…pmi=1,2,…,m上式为(*,y)de概率分布。模型求解把条件概率简记为P(j/I〕用来表示区域i的交通生成量与分布到其它各小区之间的关系。由于即:要求解pij就得先求出P{*=i}与pj/i。为讨论方便,将pj/I记为P,取得小区i的交通生成量为Qi,进展全样本抽样,设*i为小区i的交通生成量,则*i显然是随机变量,且服从二项分布Bi(*i,Qi,P),P=P(j/i)i,j=1,2,……,.假设仅仅考虑时机均等,P的估计量为p=*/Q,这仅是一个均值,而对j区城和其它各小区的区别未能反映,过去的信息和运行状况未起作用,通过对P采用Bayes估计,就能抑制上述缺点。Bayes方法认为参数P不是一个确定的常t,而被看作是一个随机变量P的一个值,因而符合客观实际。模型检验根据已获得的关于P的信息,可建立准确程度不同的P先验分布,作为对P进展修正的后脸分布的依据。如果所研究的各个小区的社会经济地理特点没什么大的区别,各区的相对位置近似。基于这样的情况,如果对各区间的交通分布情况了解不多,可假设P的先验分布为均匀分布的,密度函数为:P为交通量,f(p)为密度函数。由概率和前述可知,*的概率函数也服从二项式分布,则有:……式中:*是随机变量(*=0,1,2,…,Qi);Qi是小区I的交通生成量。所以*,P的联合分布为:*的边缘分布为:P的后验分布为:=而P的Bayes估计量就是后验分布的均值:上式中的交通量后验分布均值;x为变量;x为交通生成量。利用马克威分析系统处理数据根据第一题有关划分小区的情况,以及出租车GPS数据,利用马克威分析系统软件可以得出区域交通分布情况。如图表4、5、6。表格SEQ表格\*ARABIC5局部小区交通量以及所占的交通比例小区小区1小区2小区3小区4小区5小区6交通量270311842106交通比例0.007950.0009130.000530.0012370.0002940.000177图表SEQ图表\*ARABIC3局部小区交通量表格SEQ表格\*ARABIC6小区交通分布情况ji1,2,…,…,m总量12…ma11,a12,…,a1ma21,a22,…,a2m……am1,am2,…,ammb11b22……bmm求解交通量OD分布对于*一固定小区来说,设μ0为pij的平均值,δ02为pij的方差,参数P显然服从正态分布N(μ0,δ02),故P的先验概率密度函数为:这样可做到综合考虑交通分布情况,防止随机因素的影响。最后转化为具体的交通量OD分布,由P=Qij/Q总得Qij=PQ总,从而求得整个区域的交通量OD分布。如表格7。表格SEQ表格\*ARABIC7局部小区交通量OD分布表小区1小区2小区3小区4小区5小区6小区7小区1137.118715.743269.14124621.329575.078473.0470821.015694小区215.743261.8075591.049552.4489510.5830840.349850.116617小区39.1412461.049550.6094161.4219720.3385650.2031390.067713小区421.329572.4489511.4219723.3179340.7899840.4739910.157997小区55.078470.5830840.3385650.7899840.1880910.1128550.037618小区63.0470820.349850.2031390.4739910.1128550.0677130.022571小区71.0156940.1166170.0677130.1579970.0376180.0225710.0075243.3在合理的假设条件下,推断人们出行的OD时空分布。模型假设本文提出的出行OD矩阵估算方法中假定:城市一定区域内交通小区的出行时耗(出行距离)特征具有相似性,区域总体出行特征可近似代表各小区征,并将城市区域划分为中心区、过渡区、外围区等(视城市规模和空间布局可进一步细化为多个区域,区域划分越多,计算精度越高,但计算量也越大)。就假定条件而言,城市不同的区域其出行特征存在一定差异,但具有一样区位和特征的区域内的居民出行特征具有一定相似性,而且区域总体的出行特征正是各交通小区出性特征的综合,图7为**市调查结果,从图中可以看出各小区的出行比例与出行时耗关系曲线与区域总体关系曲线根本一致,并以检验证明了假设条件的成立。模型算法本方法的根本思路:根据各区域总体居民出行时耗(出行距离)与出行比例的总体分布,将交通小区发生量离散为不同出行时耗(出行距离)区间上的出行量,并将相应区间内的出行量按区间所包含的交通吸引小区的面积及吸引量大小进展分配。具体计算思路如以下图4、5所示,图4中曲线f(*)为小区i所在区域的总体出行时耗特征曲线,小区i在出行时耗距离区间上的出行比例为图5阴影面积,设小区i总出行量,则对应的区间上出行量;图4为城市规划小区的空间分布,阴影为空间上小区f出行时耗距离区间所覆盖的区域,然后根据阴影区域内各吸引小区的大致面积和吸引量将区间出行量按比例进展分配。图表SEQ图表\*ARABIC4小区i时耗分布图图表SEQ图表\*ARABIC5时耗覆盖区域例如按照上述思路,主要计算公式如下:〔1〕式中,为交通小区i到交通小区j的出行量;为第k个时耗(距离)区间交通小区i到交通小区j的出行量;为交通小区i发生量;为交通小区j吸引量;交通发生区i所在区域出行分布特征中第k个时耗(距离)区间的出行比例,且;为交通小区j隶属于交通小区i的第k个出行区间的隶属系数,可由下式计算。〔2〕其中,为交通小区i到交通小区j的出行时耗(距离);交通小区j的自身时耗(距离);为时耗(距离)区间k的上、下限。式(2)实际反映了交通小区j在交通小区i出行时耗(距离)轴上覆盖区间的情况,由图4例如可以理解,图中交通小区j相对于交通小区i在出行时耗(距离)区间[15,20]、[20,25]、[25,30]、[30,35]上的隶属系数分别为:0.3、0.5、0.2、0,易知式(2)能保证。由计算过程可知,根据式(1)计算得到的OD矩阵能够满足矩阵发生总量约束,但不一定能够满足吸引总量约束。因此上述结果还需要进展修正,可根据交通小区吸引量进展OD矩阵的再分配,其公式类同式(1),如下:〔3〕式中,交通吸引区j所在区域出行分布特征中第k各时耗〔距离〕区间的出行比例;为交通发生区i隶属交通吸引区j的第k个出行时耗区间的隶属系数,其它符号意义同上。公式〔2〕变为:〔4〕其中,Li交通发生区i的自身时耗(距离)直径;其它符号意义同上。按照式(1)和式(3)计算,分别得到满足出行总量约束和吸引总量约束的OD矩阵,设其元素分别为多和,则最终计算OD矩阵元素为:〔5〕模型修正实例分析验证,利用上式(5)得到的OD矩阵,根本能满足约束条件的精度要求,如果仍不能满足,利用下式(6)进展迭代运算,逐步修正结果:〔6〕式中,为第k次迭代要求的OD矩阵元素;为已求得的第k-1次OD矩阵元素,当k=1时为式(5)所求得OD矩阵;为已求得的第k-1次OD矩阵所对应的交通小区i的出行发生量,即=,且为预测交通小区i的出行发生量;为j已求得的第k-1次OD矩阵所对应的交通小区j的出行吸引量,即=,且为预测交通小区j的出行吸引量。根据式(6)进展迭代运算,直到满足精度要求和趋近于1为止。图表SEQ图表\*ARABIC6计算公式图解图表SEQ图表\*ARABIC7出行时耗特征由图7可以看出人们出行的交通量随出行距离的增加先增长然后呈下降趋势,这与实际情况根本吻合。3.4根据出租车载客后的行驶数据,筛选出拥堵的路段时段以及拥堵的路口时段。交通拥堵分析交通拥堵既是一个经济问题,又是一个社会问题,已经成为现代城市经济开展过程中的瓶颈,备受人们的广泛关注。交通拥堵程度的判断,广阔市民往往是凭经历和直觉进展的,如,“人车挤成一团〞、“前看不到头,后看不到尾〞等等,缺乏量化手段,具有一定的主观性和片面性。因此,对交通拥堵程度的量化及评价的研究具有重要意义和理论价值。交通拥堵的定义交通拥堵的定义:*路段在*个时段平均行驶速度小于15公里/小时为拥堵。根据出租车载客后的行驶数据,编写程序筛选出有用的数据,并且把这些数据显示在GIS上,查找车辆比较拥堵的路段以及拥堵的路口时段。图表SEQ图表\*ARABIC8红色表示拥堵的路段通过马克威分析系统软件处理GPS数据,得到各个路段的车辆数据。表格SEQ表格\*ARABIC8**拥堵路段拥堵路段1布吉关2沙湾关3南头关〔瓶颈路段〕4华强北5东门中路6清水河7深南路华侨城路段8深盐路盐田港区9盐坝高速入口10布吉路路段11深惠路路段12坂田五和大道13罗沙路路段14107国道设平均速度为Vi,其中i为路段的编号,得:n表示i路段*时段的车辆数vj表示车辆每个GPS数据中的速度根据Vi与交通拥堵速度的比较得到**比较拥堵的路段。四、模型的评价与推广模型的优缺点优点〔1〕本文建模思路清晰,面向一般化的问题,建立了严密的一般方程,具有良好的应用性。〔2〕建立模型时,紧贴实际,利用实验数据对模型进展验证、修正,模型的可靠性以及结果的精度都很高。〔3〕求解模型的方法灵活简化,模型的可操作性很强。缺点〔1〕小区划分*围没有得到准确量化〔2〕条件假设“*一小区交通发生量分布到不同小区的OD量与这些小区的吸引量成正比〞,此假设精度不高,对于数据用一定的影响。五、参考文献[1]傅莉萍.区域交通量OD分布推断方法,**轻工职业技术学院学报,2004,3(1).[2]吕玉强,秦勇,贾利民,董宏辉,贾献博,*智源.基于出租车GPS数据聚类分析的交通小区动态划分方法研究,物流技术,2010,216.[3]王昊,王炜,陈峻,*任婷.城市出租车交通分布预测模型,公路交通科技,2006,23(6).[4]胡小文,冯均佳.基于GPS数据采集的出租汽车交通运行特点研究,2007,5(2).[5]朱敏清.居民出行0D矩阵估箅新方法,交通与物流·第六届(2006)交通运输领域围际学术会议论文集,2006.附录:程序1(起讫点的筛选程序代码):*include<iostream.h>*include<fstream.h>voidmain(){ ifstreaminf("e:\\100GPS处理.t*t"); ofstreamouf("e:\\100GPS处理2.t*t"); charname[40]=""; chartime1[40]=""; chartime2[40]=""; charwd[40]=""; charjd[40]="";// chari='';// charjd[40]="";// doublewd=0,jd=0; intstatus=0,v=0,angle=0,i=0; inf>>name>>time1>>time2>>jd>>wd>>status>>v>>angle;ouf<<name<<""<<time1<<""<<time2<<""<<jd<<""<<wd<<""<<status<<""<<v<<""<<angle<<endl;;//<<jd<<wd<<status<<v<<angle i=status; while(!inf.eof()) { inf>>name>>time1>>time2>>jd>>wd>>status>>v>>angle; if(i!=status) { ouf<<name<<""<<time1<<""<<time2<<""<<jd<<""<<wd<<""<<status<<""<<v<<""<<angle<<endl;; i=status; } }}程序2〔筛选有效的起讫点数据〕:*include<iostream.h>*include<fstream.h>voidmain(){ ifstreaminf("e:\\gps.t*t"); ofstreamouf("e:\\gps1.t*t"); charname[40]=""; chartime1[40]=""; chartime2[40]=""; charwd[40]=""; doublejd=0.0; // chari=''; // charjd[40]=""; // doublewd=0,jd=0; intstatus=0,v=0,angle=0,i=0; inf>>name>>time1>>time2>>jd>>wd>>status>>v>>angle;ouf<<name<<""<<time1<<""<<time2<<""<<jd<<""<<wd<<""<<sta
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年医用高频仪器设备项目提案报告模范
- 生命小学作文15篇
- 2024-2025学年许昌市魏都区三年级数学第一学期期末综合测试试题含解析
- 2024-2025学年新源县三上数学期末检测试题含解析
- 2025年水用电磁阀项目立项申请报告模范
- 个人辞职报告19篇
- 个人年终总结合集15篇
- 2024年校园护卫人员标准聘用合同模板版B版
- 员工离职证明书(15篇)
- 2023行政主管年终工作报告五篇
- 仓库管理员月度绩效考核表
- 户外广告设施设置申请表+审批表(城市管理资料2022新版)
- 国家开放大学电大专科《刑法学(1)》期末题库及答案
- 焦炉砌筑规程
- 聚酰亚胺基础知识-1(横田力男)
- ATS(发动机智能冷却系统)
- 毕业论文饮料罐装生产流水线系统设计与调试
- 项目工程施工安全生产管理流程图
- CAD的乐趣(漂亮的自定义线型)
- 某某油库投产试运行方案
- 业障病因果病对照表
评论
0/150
提交评论