基于灰色马尔科夫链模型的交通事故伤亡人数预测_第1页
基于灰色马尔科夫链模型的交通事故伤亡人数预测_第2页
基于灰色马尔科夫链模型的交通事故伤亡人数预测_第3页
基于灰色马尔科夫链模型的交通事故伤亡人数预测_第4页
基于灰色马尔科夫链模型的交通事故伤亡人数预测_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于灰色马尔科夫链模型的交通事故伤亡人数预测摘要:道路交通系统是一个基于人、车、路的动态系统,影响交通安全的因素很多,作用机理复杂,因此道路交通事故的发生具有很大的随机性和偶然性。传统的GM(1,1)模型和马尔科夫模型都能单独解决有关时间序列白预测问题,但各有优缺点:GM(1,1)模型能预测出事物发展的总体趋势和大体方向,对预期远、波动大的数据的预测误差较大;而马尔科夫模型对于波动性大的数据序列的预测精度较高,但其主要是对具有平稳随机过程的问题进行的预测,对现实问题中占绝大多数的非平稳过程问题的预测存在局限性。本文以灰色GM(1,1)模型为基础,利用马尔科夫链模型对灰色GM(1,1)模型的预测

2、结果进行误差修正,并利用某市交通事故伤亡人数的数据对之后几年的伤亡人数进行预测。通过对比,证明基于灰色马尔科夫链模型的交通事故伤亡人数的预测更加准确。关键词:交通事故预测;马尔科夫链;灰色GM(1,1)模型;误差修正1、引言交通安全是国民经济发展和社会安定的重要方面,也是道路交通管理的两项基本任务之一。道路交通事故预测是道路交通安全研究的一项重要内容,它的目的是为了掌握交通事故的未来状况,以便及时采取相应的对策,有效地控制各影响因素,避免工作中的盲目性和被动性,减少交通事故的发生。因此,准确地对交通事故进行预测具有重要的现实意义。道路交通系统的非线性、随机性、动态性以及不确定性等特点,决定了作

3、为道路交通系统行为特征量的道路交通事故预测的复杂性。本文根据现实生活中交通系统非线性、随机性和动态性的特点,将灰色GM(1,1)模型和马尔科夫模型的结合起来,使其优势互补,提高对交通事故预测的准确性。2、GM(1,1)模型客观世界的很多实际问题,其内部的结构、参数以及特征并未全部被人们了解,人们不可能象研究白箱问题那样将其内部机理研究清楚,只能依据某种思维逻辑与推断来构造模型。对这类部分信息已知而部分信息未知的系统,我们称之为灰色系统。灰色系统的研究对象是“部分信息已知、部分信息未知”的“小样本”、“贫信息”不确定性系统,它通过对“部分”已知信息的生成、开发实现对现实世界的确切描述和认识。信息

4、不完全是“灰”的基本含义。灰色系统理论建模的主要任务是根据具体灰色系统的行为特征数据,充分开发并利用不多的数据中的显信息和隐信息,寻找因素间或因素本身的数学关系。通常的办法是采用离散模型,建立一个按时间作逐段分析的模型。但是,离散模型只能对客观系统的发展做短期分析,适应不了从现在起做较长远的分析、规划、决策的要求。事实上,微分方程的系统描述了我们所希望辨识的系统内部的物理或化学过程的本质。由于灰系统对一切随机量都可看作是在一定范围内变化的灰色量,因此,为适应灰系统建模需要,提出“生成”的概念,“生成”即指对原始数据做累加(或累减)处理。累加生成一般可写成AGO。若计x(0)为原始数列,x(r)

5、为r次累加生成后数列,即x(0)=x(0)(1),x(0)(2),x(0)(n),、(2-1)x(r)=x(1),x(r)(2),x(r)(n)则r次累加生成算式为kx(r)(k)=x(r,)(1)x(r,)(2)-k)=x(r-1)(i)=i(2-2)x(r4)(1)x(r4)(k-1)x(rJ)(k)=x(r)(k-1)x(r,)(k)一般常用的是一次累加生成,即kx(k)=、x(0)(i)=x(1)(k-1)x(0)(k)(2-3)i1建立GM模型,实际就是将原始数列经过累加生成后,建立具有微分、差分近似指数规x=1x(k1)x(k)2(2-13)显然,当时间密化值定义为1,即当4T1时

6、,上式可记为记为离散形式dx=x(t1)x(t)出dx(0)L(t(t)=x(t1)这实际也表明,模型是以生成数x(x是以x(0)的一次累加)为基础的。当或足够小时,x(t)到x(t+4t)不会发生突变,因此可取x(t)与x(t+At)的平均值作为&T0时的背景值,因此,背景值便可记为dx=x(1)(t1)-x(t)=x(0)(t1)dt律兼容的方程,称为灰色建模。GM(m,n)称为m阶n个变量的灰色模型,其中GM(1,1)模型是GM(1,n)模型的特例,是灰色系统最基本的模型,也是常用的预测模型,其简单的微分方程形式(白化形式的微分方程)是dxax=udt(2-4)利用常数变易法解得

7、,通解为atUx(t)=ce-a(2-5)若初始条件为t=0,x(t)=xo,则可得到微分方程的特解为u、对ux(t)=(xo)eaa(2-6)或时间响应函数x(t1)=(x(1)(1)-u)e-atuaa(2-7).dx.一一其中白化微分方程中的ax项中的x为匕的背景值,也称为初始值;a,u为常数(有时也将dtu写成b)。按白化导数定义有差分形式的微分方程,即dx凉=1回x(t:=t)-x(t)(2-8)dxdt=iimjx(tLx。)(2-9)(2-10)这显然表明dx是一次累计生成,dt因此上述方程可改写为(2-11)(2-12),”(%-1)于是便有YN-aXuE于是白化的微分方程.(

8、1)dxdt+ax(1)=u可改写为x(0)(k1)1ax(1)(k1)x(1)(k)=u2(2-14)x(0)(k1)=-ax(1)(k1)x(k)u2(2-15)x(0)(0)x1(1)(1)=-ax(1)(2)x(1)(1)u(3)=;ax(2)x(1)u(2-16)x(0)(n)=一:ax(n)x(n-1)u因此,上述方程可以改写为矩阵方程形式,即-x(0)ax(2)x(1)引入下列符号,设YN=x(0)(3)_x(0)(n).(0)1x(0)(3)-浜x-lax(1)(n)x(1)(n-1)2一11x十一11(2-17)x(1)为x(2-18).x(0)(n)一(2-19)-lax(

9、1)(2)+x(1)(1)11-al.1ax(1)(2)+x(1)(1)1a=,B=X:E=I2:1ax(1)(n)+x(n1)1则a|YN=aX+uE=X:E|=Ba1U1解得a=a=(BTB)BTYN_u将求解得到的代入微分方程的解式(也称时间响应函数),则(1)(1)ukux(k1)=(x(1)-)e一aa由于x(0)(1);x(1)(1),因此求导还原得(0)(0)u、_akx(k1)=-a(x(1)-)ea上述两式便为GM(1,1)的时间响应式,及灰色系统预测模型的基本算式,当然上述两式计算结果只是近似计算值。3、马尔科夫模型马尔科夫过程是由俄国著名数学家马尔科夫提出的,马尔科夫过程

10、既适用于区间序列同样也适用于时间序列,是一个典型的随机过程,该理论主要是研究序列的状态和转移规律。假设一个序列有几种状态,该序列目前处于某种状态,而下一时间段可能会转移到另一个状态,通过研究各状态的初始概率及各状态之间的转移概率,来确定各状态的变化趋势,从而进行预测,这样离散时间之下的随机过程就是马尔科夫过程。马尔科夫链是最简单的马尔科夫过程。马尔科夫过程的数值是连续的,任意两值之间都可以无限分割,状态也有无限多个。而马尔科夫链模型的时间以及状态参数都是离散数值,状态也是有限可列的。马尔科夫过程的特点是将来的状态只与现在有关,而与历史无关。也就是说,系统在时刻t1的状态,仅仅与时刻t所处的状态

11、有关,而不受时刻t之前所处状态的影响。这种特点就是马尔科夫过程的无后效性也称为马氏性,当然马尔科夫链模型是特殊的马尔科夫过程同样也具有无后效性。3.1马尔科夫过程的无后效性假设马尔科夫过程X,twTT为离散的时间集合,即丁=0,1,2,3,其状态空间(2-20)(2-21)(2-22)(2-23)(2-24)为可数的I。考虑有限维分布函数,对nA0,t1Mt2Mtn书,tkwT(k=1,2,n+1),及状态i0,12,*,北4匚1由乘法公式可以得到:PX(t1)=i1,X(t2)=i2,X(tn1)=in.1=PX(t1)=iMPX(t2)=i2|X(t=iX(3-1)MPX(tnQ=in+|

12、X(t1)=i1,X(t2)=i2;X(tn)=in上式最简单的情况为:PX(t2)=iz|X(t1)=PX&)1PX&)=i3|X(t1)=i1,X(t2)=i2=PX(t3)=i3:(3-2)PX(tn书)=:|X(t1)=i1,X(t2)=i2,X(tn)=in=PX(tn书)=in书此时:PX(t1)=i1,X(t2)=i2,X(tn1)=in.1二(3-3)PX(t1)=iJPX(t2)=i2PX(tn1)=显然上式中任意的i0,i1,i2,in,in书门都成立,那么x(t1),x(t2),x(tn书)相互独立。但在实际中这种都相互独立的情况很少见,下式为不独立的情况

13、:PX(t3)=i3|X(t1)=i1,X(t2)=i2=PX(t3)=i3IX(t2)=i2(3-4)PX(t4)=i4X(t1)=i1,X(t2)=i2,X(t3)=i3=PX(t4)=i41X(t3)=i3此时:PX(t1)=i1,X(t2)=i2,X(tn1)=in1(3-5)=PX(t1)=ijPX(t2)=i2PX(tn由)=inX(tn)=in将上式中的性质称之为无后效性,即表示在当前的情况下,系统未来的变化不受过去的影响,只依赖于目前系统所处的状态。设X(t),tT是 定 义 在I率 空 间C,f,P上 的 随 机 过 程 , 状 态 空 间 为I, 若 对 任 意 的n0,t

14、t2ii,iii2iiin(3-8)则一步转移概率Vi,jw|,PXn4=j|Xn=i=Pj(n)(3-9)称为n时刻从状态i经过一步转移到状态j的概率。系统所有状态一步转移概率集合所组成的矩阵称为一步状态转移概率矩阵。其形式如下:Ri年PincP21P22P2nP;(3-10)壬1Pn2Pnn_此矩阵具有以下两个性质:1)非负性:Pj-0,i,j=1,2,nn2)行元素和为1,即Pj=1,i=1,2,n那么,两步转移概率:7_2W,jW|,PXn.=j|Xn=i=Pj2(n)(3-11)称为n时刻从状态i经过两步转移到状态j概率。那么随机过程X(t),tWT的两步转移概率矩阵为:P=Pj(n

15、)(3-12)同理,k步转移概率:(k)Vi,ju|,PXn=j|Xn=i=Pj(n)(3-13)称为n时刻从状态i经过k个时刻到状态j的概率。因此,系统的k步转移概率矩阵就是由所有状态的k步转移概率集合所组成的矩阵。其形式如下:那么,式(3-14)则为X(t),tT的k步转移概率矩阵。此矩阵同样具有以下两个性质:1)非负性:pjk)0,i,j=1,2,,nP(k)P|1D(k)P12D(k)P1nP(k)=D(k)P21D(k)P22-,P2n(9D(k)_Pn1Pn2的P(k)On(3-14)n2)行元素和为1,即Pi(k)=1,i=1,2,,nj(k)对于式(3-ii),一般情况下,p(

16、)不仅和状态i,j有关,而且和时刻n有关。当和时刻n无关时,表示马尔科夫链具有平稳转移概率。如果vi,jwI,马尔科夫链X(t),twT的转移概率p(k)(n)与n无关,就称马尔科夫链是齐次的。应用上主要研究的是齐次马尔科夫链。马尔科夫链的一步转移概率矩阵和k步转移概率矩阵之间的关系:设p:*)是马尔科夫链X(t),twT的S步转移概率,则Pijs*)(n)=pn)pkt)(n+s)k三I当马尔科夫链具有齐次性时,则转移概率就具备了平稳性,也就是用仅与时间、间距、i和j有关,即pjs)(m)=pjs)(n)。此时,C-K方程可简写为pi(s*=ppk;,可得k步转移概率矩阵p(k)为一步转移概

17、率矩阵p的k次方。即:(k)kp=p(3-16)3.3马尔科夫链预测模型一个时间序列X(t),twT,其可能的观测数据Xt可以取r个离散的值,即序列可以处于r个状态。 设序列Xt处于状态q的状态概率为A=P(Xt=i)。 序列从e转到一下状态6j的转移概率为P,则由马尔科夫链的无后效性可知Pj=P(xt书=j|xt=i)。引入状态概率向量和一步转移概率矩阵式:rA=Q,a?,a.(t)ai=1,tT(3-19)4、灰色马尔科夫模型4.1灰色GM(1,1)模型灰色GM(1,1)模型首先通过对原始数据进行累加,建立均值生成序列和矩阵B与Y,然后通过最小二乘回归和微分等数学方法建立模型,最后通过模型

18、得到的值经过还原数据,得到预测结果。它的建模过程为:1)根据模型在各个时刻的值,建立如式(4-1)所示的原始数据序列x(0)=x(0)(1),x(0)(2),x(0)(n)2)对原始数据序列进行累加,得(3-15)(3-17)11P12P21P22P=.,Fr1Pr2由状态转移的马氏性以及式P1r1P2r,(Pj-0,i,jIJPj=1,iI)(3-18)(3-16)可以写出马尔科夫链的基本方程:(4-1)式中:Pj(m)M)MiP(m)P1IP(m).P2P(m)PrR(m)=D(m)P213D(m),4P229AP2?D(m)_r1p(m)Pr2P(m)1(4-8)4.2马尔科夫模型马尔科

19、夫链是根据所观察的离散状态,以经验为主的估计转移概率参数化的随机过程。它是对原始数据进行状态划分,求出转移概率矩阵,得出未来的预测值。以灰色马尔科夫链模型为例,其一般步骤如下:4.2.1状态划分根据灰色模型预测值与实际值间的相对误差,把相对误差分成r类状态。状态划分数量并无严格规定,是综合考量样本数量、拟合的误差范围等相关因素而确定,一般分成35类比较合适。4.2.2建立状态转移概率矩阵假设Pj(m)是状态i到j的m步转移概率,Mi(m)是状态i到j的m步转移次数,Mi属于i个状态的数量,状态转移概率矩阵如式(4-8)所示3)x(1).x(1)(1),x(1)(2),x(1)(n)对(4-2)

20、式序列作均值,生成序列z(k)=gx(1)(k)x(k-1)4)利用式(4-1)与式(4-3),建立矩阵Y与B,得一x(0)1z(2)x(0)(3)3(0)(k)_B=-z(1)(3)z(k)5)对参数进行最小二乘估计,得出a与b的值M=(BTB)BTY=a,b6)确定模型形式,并还原得到的灰色预测值,如式(4-6)、式(4-7)所示铲(k)=x21).(baax(0)(k)=b)(k),)(k1)(4-2)(4-3)(4-4)(4-5)(4-6)(4-7)4.2.3计算预测值假设时间序列在k时刻处于状态j,根据状态j的残差区间wj_,wj 的中值, 与灰色预测值X(0)(k),可以得出灰色马

21、尔科夫链模型的预测值为?(k+1),如式(4-9)所示:4.3对模型精度的检验灰色预测模型建立以后,对模型的实用性以及模型的精度进行验证。GM(1,1)模型通过计算残差、平均相对误差、均方差比值、小误差概率等指标后,查找灰色预测模型精度检验等级表(见表1),从而可以判断模型的精度等级。表 1 灰色模型的精度检测表步度等级指标范围相对误差()均方差比值(C)小误差概率(P)一级(好)0,1C0,95二级(合格)0.010,050.35C0,50,8P0,95三级(勉强合格)0.05A0,010.5C0,650,7P0,8四级(不合格)0.01A0,65P7计算过程和算式如下:1)分别计算出原始数

22、据序列的残差k),相对误差A(k)与平均相对误差区;(k)=x(0)(k)-0)(k)(4-10)(k)=|*(4-11)|x(k)l1:=一(k)nkd2)分别算出原始数据与残差的标准差,S2。根据6,6分别算出均方差比值C和小误差概率P6=卢x(0)(k)-X2.n心(4-14)(wjwj.)70、处)=1jw(4-9)(4-12)(4-13)P=仪k)-e0.674565、案例分析利用马尔科夫链对灰色GM(1,1)模型的预测误差进行修正,以某市20072013年的伤亡人数为基础,对某市20142016年的交通事故伤亡人数进行预测。5.1建立GM(1,1)预测模型灰色GM(1,1)模型的建

23、立过程如下:4)对参数进行最小二乘估计,得出a与b的值CT,Ta0.031712i?=(BTB)BTY=b111032.1554525)将a和b的值带入式(4-6),得出模型如式(5-3)所示声网=32547.78797-31500.78797sWP根据式(5-3),并根据式(4-6)还原数据,得出某市20072013年的伤亡人数灰色预测值,结果如表2所示。预测结果显示,08年和09年的模型相对误差较大,分别为7.96%和-9.29%。最后可得到20142016年伤亡人数灰色预测值分别为813人、788人、763人。表 2 某市交通事故实际伤亡人数与灰色模型预测值的对比年份实际伤亡人数灰色模型

24、预测值残差误差/%20071047104700.0020081068983857.962009872953-81-9.292010902923-21-2.332011876894-18-2.052012846866-20-2.362013895839566.26(4-15)(4-16)1)原始数据序列为:2)对数据进行累加得:3)建立均值生成序列与B为x(0)=1047,1068,872,902,876,846,895;x(0)=1047,2115,2978,3889,4765,5611,6506;z(k),z(k)=1581,2551,3438,4327,5188,6058.5,矩阵丫106

25、8-1581872-2551111(5-1)第5一-6058.5(5-2)(5-3)67GM(1,1)模型进行精度检验。 利用式(4-10卜式(4-16)可以算出, 平均相对误差为4.32%,后验差比值为61.34%,小误差I率为0.7143。查找表1,可知该模型的精度为3级,说明可以用于交通事故预测,但精度较低,需要进一步优化来提高模型的精度。5.2建立马尔科夫链模型5.2.1状态划分因为本研究样本数量较少,按照均值划分,误差可分为三个状态,分别用EPE2、E3表示,如表3所示。表 3 死亡人数状态划分表状态E1E2E3误差范围(-9.29%-3.54%)(-3.54%2.21%)(2.21

26、%7.96%)根据表3中的状态划分情况,可以把20072013年交通事故伤亡人数进行状态划分,结果如表4所示。表 4 某市 20072013 年交通事故实际伤亡人数状态划分情况年份实际伤亡人数灰色模型预测值误差/%状态2007104710470.00E2200810689837.96E32009872953-9.29E12010902923-2.33E22011876894-2.05E22012846866-2.36E220138958396.26E15.2.2构建转移概率矩阵一010【10%,100一010%.010一一0101R=b%(5-6)(5-4)(5-5)P1015.2.3计算预测

27、值利用式(4-9)对20072013年某市伤亡人数进行拟合。例如2008年的灰色预测值为983,处于状态?=983x1+0.5M(2.21%+7.96%),可以得出2008年的灰色马尔科夫链预测值为1033人。同理,可以得出其余年份的预测值,两种模型的残差和误差情况如表5所示。表 5a 灰色 GM(1,1)模型预测结果年份实际伤亡人数灰色GM(1,1)模型预测值残差误差/%2007104710470020081068983857.962009872953-81-9.292010902923-21-2.332011876894-18-2.052012846866-20-2.36201389583

28、9566.26表 5b 灰色马尔科夫链 GM(1,1)模型预测结果年份实际伤亡人数灰色马尔科夫链GM(1,1)模型预测值残差误差/%20071047104700200810681033353.282009872892-20-2.292010902917-15-1.662011876888-12-1.372012846860-14-1.652013895882131.45由上表可知,2008年和2009年的灰色GM(1,1)预测值相对误差为7.96%和-9.29%,而灰色马尔科夫链GM(1,1)预测值和相对误差降到3.28%和-2.29%。从图1可知,灰色GM(1,1)模型的预测值呈一条平滑递减曲线,而灰色马尔科夫链GM(1,1)模型的预测值具有一定的波动性,接近伤亡人数的实际值,预测结果更加可靠。1100年份年图 1 两种模型结果对比根据表4可知,2013年伤亡人数预测值处于状态E3,初始行向量为1=(0,0,1)。因此,R(1)V0=(0,0,1),说明2014年处于状态Ei,再利用式(4-9)预测出2014的伤亡人数为761人。同理,可以预测2015年、2016年伤亡人数年所处的状态及预测值,结果如表6所示。表 6GM(1,1)模型与灰色马尔科夫链预测模型对 20142016 年伤亡

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论