事故模型综述_第1页
事故模型综述_第2页
事故模型综述_第3页
事故模型综述_第4页
事故模型综述_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

事故受伤严重程度统计分析模型研究综述摘要:交通事故不可避免,研究如何降低事故危害对于交通安全具有重要意义。近年来,研究者使用了大量的方法和工具研究如何减少事故严重程度,已经有了较为成熟的理论基础。本文总结了目前关于机动车受伤严重程度的统计分析模型,并提出了本人关于粗集在该问题中的应用构想。关键字:事故受伤严重程度;统计分析模型;粗集分类号:U492.8 文献标识码:AResearchOverviewofThestatisticalanalysisofhighwaycrash-injuryseveritiesAbstract:Trafficaccidentsareinevitable,Itwouldbeofgreatsignificanceinstudyhowtoreduceaccidentharmfortrafficsafety.Overtheyears,researchershaveusedawiderangeofmethodologicaltoolstoreducetheinjury-severity,thestudyonithasdevelopedverymaturely.Thispapersummarizestheresearchthatrelatestothestatisticalanalysismodelsofmotor-vehicleinjuryandIcameupwiththeapplicationofideaofRoughSetinthisquestion.Keywords:injury-severity;statisticalanalysismodels;RoughSet前言随着社会经济的发展以及交通量的迅速增长,交通事故率不断上升,我国每年的交通事故死亡人数高居世界首位[1]。交通事故的大量发生已经直接影响到国民经济的迅速发展,严重威胁到人民的生命财产安全[2-3]。如何提高交通安全已经成为社会关注的热点。由于交通事故不可避免,如何减轻交通事故受伤严重程度具有重要的意义。近年来,国内外大量学者对如何降低事故危害展开了大量的研究和实践,对事故数据库进行了大量的分析,并由此产生了众多事故受伤严重程度模型。美国将交通事故严重程度划分为5个等级,即死亡事故、伤残事故、非伤残受伤事故、轻微受伤事故和仅财产损失事故[4]。日本将交通事故严重程度划分为3个等级,即死亡事故、重伤事故和轻伤事故[5]。本文对前人关于事故严重程度模型的成果进行了文献性的总结和分析,用的比较广泛的有专家预测法[6]、时间序列分析法[7]、经验模型法统计回归模型法[8-12]以及,本文仅就回归模型法总结了两种大类模型:logit模型和probit模型。在此基础上,本人构想了粗糙集在事故受伤严重程度模型中的应用。事故受伤严重程度数据的特征研究事故数据库时,事故受伤严重程度数据一般是离散的,比如死亡、受伤、非死亡等。过去的研究通常通过线性回归的方式对这些数据进行分析。这些数据通常具有以下特征:1、不可见做统计分析的时候,我们通常会从样本中随机选择一部分数据,并且假定每一个数被抽到的概率是一样的。但是,事故存在被人为隐瞒的特征(特别是在中国),这给事故数据的统计分析带来了极大的困难。而且事故数据库不可能把所有影响受伤严重程度的因素都包含进去。为了证实这一点,Hauer和Hakkert(1989)做了一个系统的分析,研究比较了警察、医院和保险公司统计的受伤数据并得到结论:几乎20%的严重受伤、50%的轻伤和超过60%的非受伤事故并未报道出来[13]。而Elvik和Myssen(1999)的研究得出这个比例分别是[14]:0%、75%、90%。很显然,大量事故被瞒报了,事故数据的不可见性给统计分析带来了巨大的困扰[14]。2、数据的规律分布事故受伤严重程度等级是非常有规律的呈金字塔排序分布,图2-1所示。如果不考虑这些规律,那么将造成参数估计的偏离,得到错误的推论[15-16]。-Accida]LsSeriouscoidliiisEaulSIlgllLLilllfllLtSPutcnLulconilict?;IJuTTiiigc些规律,那么将造成参数估计的偏离,得到错误的推论[15-16]。-Accida]LsSeriouscoidliiisEaulSIlgllLLilllfllLtSPutcnLulconilict?;IJuTTiiigci>nlycrci[ijurySEighlinjuiA—LindistLiii>cil卩图2-1事故受伤严重程度等级分布图3、遗漏变量导致偏差在建立事故受伤严重程度等级模型时,我们需要分析事故数据库。但是,通常情况下,一些对事故有微弱影响的影响因素并没有出现在事故数据库中,这些遗漏的变量可能会导致建立的模型有一点微小的偏差[17]。4、 样本量小很显然,事故数据的收集困难以及隐瞒性决定了事故数据库样本量不可能很大[18]。5、 内生性由于事故数据是离散的,那么解释变量很可能在度量上存在误差,其所建立的回归模型则会成为回归误差的一部分,从而导致内生性问题[19]。6、事故对象间的相关性在一个事故中,一般会存在超过一个的事故对象,而一些未被观测到的影响因素会与已知因素产生相关性。例如多车事故中,路面情况是其中一辆机动车事故的致因,而不是其他机动车的事故致因,但很多模型却未考虑这种影响[20]。7、空间和时间相关性事故的发生是机动车与冲突对象在空间或时间上发生了重叠所导致的,所以这个特征在建模时一定要考虑进去[21]。事故受伤严重程度模型近年来,学者们对事故受伤严重程度做了大量研究,Ben-Akiva和Lerman(1985)[22],Hensher等人(2005)[23],以及Train(2009)[24]对这些主要的离散选择模型做了大量描述。主要分为三大类模型:二元结果模型,次序离散结果模型,非次序多元离散结果模型。这些模型主要围绕着上述特征有针对性的解决了很多实际问题。2.1.二元结果模型该类模型主要应用了一般的离散结果模型,例如二元logit模型和二元probit模型来处理二元的受伤严重程度结果(死亡或非死亡、受伤或非受伤),简单实用。不过一般情况下,当被解释变量是名义变量时,logit和probit可以换用,但是若被解释变量是序次变量时,则只能用序次probit模型[25]。如马柱等人就根据乌鲁木齐市5年的交通事故统计资料建立了二项logit交通事故严重程度分析模型,对事故严重程度影响因素进行了提取[26]。但是该方法也有很大的局限性,事实上,事故受伤严重程度并不能单纯的进行二分,而是可以分为多个等级的。贝叶斯分层二元logit模型/联立二元logit模型针对事故对象间的相关性,2002年,Ouyang等人提出了联立二元logit模型研究了华盛顿多车碰撞问题,与在不考虑该特征情况下事故受伤严重程度的结果进行了比较,展示了该特征对事故受伤严重程度结果的重要性[27]。同样的,Helai等人(2008)提出贝叶斯分层二项logit模型研究了同一个多车事故中不可见因素的随机效应[20]。二分二元probit模型针对内生性这个问题,Lee和Abdel-Aty(2008年)假设司机在载客和未载客的情况下,事故受伤严重程度等级是有差异的,他们提出了二分probit模型,研究表明,一些未被观测到的因素对事故受伤严重程度具有很明显的作用[28]。有序离散结果模型上文提到,事故受伤严重程度等级具有规律分布特性的,传统的有序概率模型在这方面应用非常广泛。最Washington等人(2011)提出一个方法[17],通过指定一个潜在变量z来表示其排序,并且用一个干扰项来表示未被观测到的因素。该模型如下:z=px+&y=1ifz<My=2ifM<z<my=3y=・・・ifM0<z<M1,12y=iifz>Mi-1X是影响因素变量,y是观测到的事故受伤严重程度等级,卩0是一个估计参数。宗芳等人(2012)建立了OrderedProbit模型分析了各因素对事故受伤人数的影响程度[29]。但该模型由于无法从样本中获取事故中车数、肇事者性格等特点对事故后果的影响,因此有待完善。二分次序probit模型/定序多项logit模型二分次序probit模型是由两个方程组成的一个分层系统,表示两个方程的对等关系。同样是为了减弱内生性对事故严重程度的影响,DeLapparent(2008年)用二分probit模型分析了事故中是否系安全带所产生的不同结果[30]。该方法说明了残差项中是否选择系安全带和模型的相关性,考察了系安全带是否对事故受伤严重程度有补偿作用,如果忽视这种潜在的影响可能会导致安全带使用的有效性被严重夸大。因为使用安全带和其他的协变量可能会与未被观测到的因素有相关性,这同样会影响模型的结果,出现内生性问题。吴晓峰等人(2011年)提出了定序多项logit模型用于事故严重程度预测取得了较好的效果[31]。但是很显然,该模型分析所用样本量小,考虑因素过少,因此实用性值得商榷。异构选择模型对于许多模型来说,一个至关重要的假设就是他们的误差方差是相等的。然而,事故受伤严重程度数据有时会产生异构的误差项从而导致参数估计不一致或偏离。这种情况下一个比较有效的解决方式就是Quddus等人提出的异构离散结果模型[32]:P(y>i)=EXP((PX/8)-卩)P(y>i)=1+EXP((PX/8)-卩nniSn表示误差方差。但是,Williams(2009)的研究却表明,虽然异构离散结果模型能很好的解决异方差性问题,其模型求解困难[33]。2.2.3.广义有序logit模型有序离散结果模型(例如次序logit模型和次序probit模型)的另一个假定就是估计参数是一个常数。这种情况被称为并行回归假设[26]。广义次序logti模型推广了有序logit模型使得受伤类别i的概率可以用如下表示:P(y>i)=EXP((卩X-卩)P(y>i)=ini_r-1+EXP((PX-卩ni由于传统logit分析的内在比例优势假定使得其可能无法涵盖所有的受伤严重等级,Wang和Abdel-Aty(2008)[35]以及Quddus等人[32]对广义logit模型进行了改进:P(y>i)=EXP(卩X+pX-卩)P(y>i)=1i1 2 2i-1+EXP(PX+PX-卩1i1 2 2iB]是根据不同的受伤严重等级设定的参数;B2是一个固定参数;2.2.4.贝叶斯有序probit模型/混合广义有序logit模型贝叶斯或混合(随机)参数logit和probit模型是传统的有序概率模型经过扩展后的一些特殊模型。Eluru(2008)等人提出了一个混合广义有序logit模型用于评估交通事故中行人和骑自行车者的受伤严重程度等级[36]。这个模型允许未被观测到的变量选取不同的临界值参数来消除异构性带来的影响。2.2.5.累积logit模型2011年,马壮林等人采用了累积logit模型分析了交通流特性对事故严重程度的影响[37]。但是,当自变量较多时,用该方法求解困难,因此要对自变量进行筛选,易产生未被观测到影响因素,从而导致模型参数估计的偏离。李世民等应用累计logit模型分析了交叉口转弯车辆比例、控制方式和土地开发强度对无信号三路交叉口的事故严重性的影响。2.3.无序多项离散结果模型一些并未考虑具有序数性质的模型在交通事故受伤严重程度中同样应用的非常广泛,由于不考虑序数性质,这些模型因此不会受到传统的probit模型和logit模型的一些固有限制。2.3.1.多项logit模型多项logit模型在传统模型的基础上不考虑序数性质,并定义Sin为观测的第n个对象的受伤等级为i。即:Sin=PiXin+£in。如果假设误差项是独立的且具有相同的广义极值分布,那么多项logit模型:i iin多项logit模型除了不考虑受伤严重程度等级的排序之外,在计算由一个受伤严重程度等级到下个等级的时候特别易受未被观测到的变量所产生的相关性影响[38]。Washington等人(2011)对此研究得出结论:在这种相关性影响会违反模型的无关选择独立性假设[17]。2.3.2.逐次logit和probit模型逐次logit/prbit模型是有序logit/prbit模型的广义版本。Yamamoto(2008)等人研究表明,假设同一个影响因素与所有等级的受伤严重程度相关情况下,即便存在未被观测因素的影响,参数估计依然能保持不偏离[40]。2.3.3.马尔可夫转换多项logit模型Malyshkina和Mannering提出了一个双态马尔可夫转换多项logit模型来研究在假定如果道路安全存在两类未被观测到的状态下的事故受伤严重程度等级[41]。这两态考虑了不可见因素的异构性影响,即不可见的危险因素会影响事故受伤严重程度等级[42-43]。2.3.4.嵌套logit模型当独立性假设被违反之后,可以考虑使用嵌套logit模型,这是一个比较恰当的广义多项logit模型。假定误差项是广义极值分布,嵌套logit模型可以写成[38]:EXP(PX+©LS)P(i)= *in*inn2EXP(PX+eLSVi **niin,EXP(pX)

P(j/i)= 讥nn 2pXVJJ/iJn,LS=LN[2(pX)]in J/iJnVJ ,Pn(i)表示事故n受伤严重程度等级为i的无条件概率。LSin表示包容值,典表示可估参数。2.4.其他模型现存的方法中,主要存在两方面的问题,一是模型的可解读性较弱;二是大多数模型采用了分类准确率来衡量模型的性能好坏,而该指标并不适合于交通事故分析这种不均衡数据集的问题。针对当前模型的不足,2013年,仇晨晔把多目标微粒群算法引入到交通事故严重程度分析中,提出了基于多目标微粒群算法的交通事故严重程度分析方法[44]。叶飞等人(2013年)提出了基于神经网络的事故严重程度方法研究界定了交通事故各因素对事故影响的具体大小[45]。还有很多研究工作者使用了灰色预测模型研究该问题[46-50]。基于等价关系的粗集多属性决策模型在事故受伤严重程度等级模型中的应用4小结本文总结了事故数据库的一些特征,并分析了事故受伤严重程度模型:二元结果模型、次序离散结果模型、非次序多元离散结果模型以及这三大类模型针对性解决的一些实际问题最后构想了粗集多属性决策模型在事故受伤严重程度等级中的应用,希望能带给读者一些启迪和参考。参考文献[1] 王洪明.我国公路交通事故的现状及特征分析[J]•中国安全科学学报,2009,19(10):121-126.[2] 陈国华,曾辉•广东省特大道路交通事故统计分析及预防对策J]•中国安全科学学报,2010,20(10):106-112.⑶李文权,王炜.交通事故的时间分布规律[J]•中国安全科学学报[J],2005,15(4):56-61.[4] 任福田,刘小明,荣建,等.交通工程学[M].北京:人民交通出版社,2003.[5] 公务厅.交通安全白书[M].东京:大藏省印刷局社,2000.⑹刘小明,任福田.我国交通事故预测[J].中国交通工程,1992(1):18-20.⑺刘小明,任福田.交通事故时间序列预测方法研究[J].中国公路学报,1995,8(1):125-130.李相勇.道路交通事故预测方法研究.西南交通大学硕士研究生学位论文,2004.3.过秀成.道路交通安全学[M].南京:东南大学出版社.2001.交通工程手册编委会.交通工程手册[M].北京:人民交通出版社.1990.陆庆武•事故预测、预防技术[M].北京:机械工业出版社.赵恩棠•道路交通安全[M].北京:人民交通出版社.1990.Hauer,E.,Hakkert,S.,1989.Theextentandsomeimplicationsofincompletecrashreporting.TransportationResearchRecord1185,1—10.Elvik,R.,Myssen,A.,1999.Incompleteaccidentreporting:meta-analysisofstudiesmadein13countries.TransportationResearchRecord1665,133—140.Savolainen,P.,Mannering,F.,2007.Probabilisticmodelsofmotorcyclists'injuryseveritiesinsingle-andmulti-vehiclecrashes.AccidentAnalysisandPrevention39(5),955-963.Paleti,R.,Eluru,N.,Bhat,C.,2010.Examiningtheinfluenceofaggressivedrivingbehaviorondriverinjuryseverityintrafficcrashes.AccidentAnalysisandPrevention42(6),1839-1854.Washington,S.,Karlaftis,M.,Mannering,F.,2011.StatisticalandEconometricMethodsforTransportationDataAnalysis,2nded.ChapmanandHall/CRC,BocaRaton,FL.Ye,F.,Lord,D.,Investigatingtheeffectsofunderreportingofcrashdataonthreecommonlyusedtrafficcrashseveritymodels:multinomiallogit,orderedprobitandmixedlogitmodels,TransportationResearchRecord,forthcoming.Anselin,L.,Florax,R.,Rey,S.,2005.AdvancesinSpatialEconometrics:Methodology,ToolsandApplications.Springer-Verlag,Berlin,Germany.Helai,H.,Chor,C.,Haque,M.,2008.Severityofdriverinjuryandvehicledamageintrafficcrashesatintersections:aBayesianhierarchicalanalysis.AccidentAnalysisandPrevention40(1),45-54.Austin,R.A.,Faigin,B.M.,2003.Effectofvehicleandcrashfactorsonolderoccupants.JournalofSafetyResearch34(4),441-452.Ben-Akiva,M.,Lerman,S.,1985.DiscreteChoiceAnalysis:TheoryandApplicationtoTravelDemand.MITPress,Cambridge,MA.Hensher,D.,Rose,J.,Greene,D.,2005.AppliedChoiceAnalysis.CambridgeUniversityPress,Cambridge,UK.Train,K.,2009.DiscreteChoiceMethodswithSimulation.CambridgeUniversityPress,NewYork,NY王济川,郭志刚.Logistic回归模型:方法与应用[M].北京:高等教育出版社,2001.马柱,陈雨人,张兰芳.城市道路交通事故严重程度影响因素分析[J],重庆交通大学学报(自然科学版),2014,33(1):111-114.Ouyang,Y,Shankar,V,Yamamoto,T.,2002.Modelingthesimultaneityininjurycausationinmulti-vehiclecollisions.TransportationResearchRecord1784,143-152.Lee,C.,Abdel-Aty,M.,2008.Presenceofpassengers:doesitincreaseorreducedriver'scrashpotential?AccidentAnalysisandPrevention40(5),1703-1712.宗芳,许洪国,张慧永.基于OrderedProbit模型的交通事故受伤人数预测[J].华南理工大学学报(自然科学版),2012,40(7):41-56.DeLapparent,M.,2008.Willingnesstousesafetybeltandlevelsofinjuryincaraccidents.AccidentAnalysisandPrevention40(3),1023-1032.吴晓峰,丛浩哲.高速公路交通事故处置时间及严重程度预测模型研究[J]•智能交通,2011,1(22):75-79.Quddus,M.,Wang,C.,Ison,S.,Roadtrafficcongestionandcrashseverity:aneconometricanalysisusingorderedresponsemodels,JournalofTransportationEngineering,forthcoming.Williams,R.,2009.Usingheterogeneouschoicemodelstocomparelogitandprobitcoefficientsacrossgroups.SociologicalMethodsandResearch37(4),531-559Quddus,M.,Noland,R.,Chin,H.,2002.Ananalysisofmotorcycleinjuryandvehicledamageseverityusingorderedprobitmodels.JournalofSafetyResearch33(4),445-462.Wang,X.,Abdel-Aty,M.,2008.Analysisofleft-turncrashinjuryseveritybyconflictingpatternusingpartialproportionaloddsmodels.AccidentAnalysisandPrevention40(5),1674-1682.Eluru,N.,Bhat,C.,Hensher,D.,2008.Amixedgeneralizedorderedresponsemodelforexaminingpedestrianandbicyclistinjuryseveritylevelintrafficcrashes.AccidentAnalysisandPrevention40(3),1033-1054.马壮林.高速公路交通事故时空分析模型及其预防方法[D].北京交通大学,2010.McFadden,D.,1981.Econometricmodelsofprobabilisticchoice.In:Manski,C.,McFadden,D.(Eds.),S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论