基于变量逻辑回归的高速公路事故类型预测模型研究_第1页
基于变量逻辑回归的高速公路事故类型预测模型研究_第2页
基于变量逻辑回归的高速公路事故类型预测模型研究_第3页
基于变量逻辑回归的高速公路事故类型预测模型研究_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于变量逻辑回归的高速公路事故类型预测模型研究

道路交通事故的类型分为三种类型:死刑事故、伤亡事件和财产损失事件。事故的类型在一定程度上反映了事故的严重性,但它不完全适用于事故的严重程度。如果两者之间存在一定的对应关系,则验证可能属于哪个类型的事故。近年来,随着外国对这一问题的研究日益增多,中国的道路交通事故现在是一个重要的关键时期。在此基础上,本文运用逻辑回归方法,结合来自高速公路的数据,探索和测试了预测事故类型的模型。1类的logit模型因变量是多水平的分类变量的情况在研究领域内常见.对于因变量的j个水平,应该有j-1个回归方程,每个水平的因变量概率预测值在0~1之间,自变量可以是连续变量或计数变量.用逻辑回归方法对因变量的概率值建立回归模型,如果因变量有j类可能性,第i类的Logit模型为log(Pcyi)Pcyj))=βi0+βi1X1+βi2X2+⋯+βipXp(1)log(Ρcyi)Ρcyj))=βi0+βi1X1+βi2X2+⋯+βipXp(1)式中:β为模型的回归系数,对应每一个Logit模型都将会获得一组系数.对于基准类别,其模型所有的系数为0.就本研究而言,因变量(事故类型)具有3个分类,基准类别是死亡事故,将会获得两组非零系数.Logistic回归方程另一种形式是P=exp(y)/[1+exp(Y)].式中:Y=a+∑βixi,也可以表示为Y=ln[P/(1-P)],通过变换可以得出概率P与变量xi之间的数学表达式P=exp(β0+∑iβixi)1+∑exp(β0+∑iβixi)(2)Ρ=exp(β0+∑iβixi)1+∑exp(β0+∑iβixi)(2)2模型的构建2.1流变量.自变量已有研究成果表明,平原区的高速公路线形对交通事故的发生影响较小,因此本研究建模时重点考虑环境变量和交通流变量.自变量主要考虑城市-乡村变量(city_rural)、小时交通量(volume)、是否是立交影响区(interchange)、大小车速度差(speed_difference)、大车比例(truck%)和小时影响变量(hour)等6个,相关分析的结果已经表明6个变量之间相关性不是很强,可以同时代入模型.2.2城市-乡村变量本研究选择2条4车道高速公路的事故数据进行分析,2055条原始事故数据来自于交通事故台账和部分交通事故卷宗信息.本研究中车辆分为2大类,小车对应的是文献中的小客车;大车指的是文献的中型车、大型车和拖挂车.事故类型分为3类,分别用1,2,3表示;城市-乡村变量分为2类,分别用1,0表示;是否为立交影响区分为2类,否为0,是为1;小时交通量如表1所列.大小车速度差分类如表2所列.大车比例分成4类,如表3所列.把小时影响变量也纳入到建模中,将24h分成白天(07:00-19:00)和黑夜(20:00~06:00)2个时间段.2.3城市-乡村变量对事故类型的影响在初步确定的6个影响变量基础上,建立含有一个自变量的预测模型,看其对事故类型影响的大小.首先,考虑城市-乡村变量的影响,研究表明事故类型的分布在两种路段上并不相同.表4表明事故类型中死亡事故最少,PDO事故和受伤事故比例相差不大.从表5中可以看出,在乡村路段财产损失事故较多,占70.5%,在城市路段则伤人事故比较多,占62.6%.从表6可以看出,把城市-乡村变量作为影响事故类型的变量是合适的,把该变量纳入模型后,-2LogLikelihood显著降低.表7中模型统计量表给出了回归公式中的参数估计值,检验统计量非常显著,exp(B)所表示的具体含义为,与是Fatal事故相比,发生在乡村路段是PDO事故的可能性是城市路段的0.416倍,发生在乡村路段是受伤事故的可能性是城市路段的0.053倍.表8是观测值和模型预测值的对照表,从表中可以看出,财产损失事故一共有930起,其中有46%被正确地分类;没有一个死亡事故被正确地分类,这也从侧面说明了死亡事故的发生是比较随机的;而受伤事故被正确分类的比例最高,达到了90.2%.总体来说,约有65.0%的事故被正确地分类,但这并不能说明模型对数据的拟合程度不好,只能说明模型对数据的分类效果不明显.综合来看,城市-乡村变量对事故类型的影响较大,建模时应重点考虑.对于其他5个影响变量也用类似的分析方法进行了研究,得出如下结论:(1)是否是立交影响区对事故类型的影响相对较小;(2)小时交通量对事故类型的影响较小,统计量Sig.值表明交通量的Logit系数与零之间不存在显著性差异的情况;(3)大小车速度差对事故类型的影响较大,分析结果同时表明对于速度差变量只需分成两类即可;(4)大车比例对事故类型的影响较大,尤其是对死亡事故的发生造成影响;(5)小时变量对事故类型的影响相对较小.2.4城市-乡村变量与事故类型的关系为了更精确的衡量各个自变量对事故类型的影响,把上述讨论的6个影响变量同时代入模型,综合比较其对事故类型的影响如表9所列.从表9可以看出,AIC和BIC减少量、对数似然比测试、卡方检验以及变量等各项指标在模型中的显著性均表明城市-乡村变量与事故类型是最为相关的,这一点从模型拟合的伪R2值,以及前述对单个变量影响的分析都可以看出,因此不能从模型中剔除.而小时交通量的影响相对最小,应最先从模型中剔除.结合前述对单个变量的分析,再参考表9中多个统计量的指标值,最终确定对事故类型影响较大的变量依次为城市-乡村变量、大小车速度差和大车比例,而是否是立交影响区、交通量和小时变量则影响相对较小.3logit模型回归剔除影响不大的3个变量,把对事故类型影响较大的3个变量代入模型,其中大小车速度差重新合并成2类,以20km/h为分类界限,大车比例也重新合并成2类,以70%为分类界限.回归模型的统计结果表明与前述把6个自变量均代入模型的结果相比,模型的各个指标都有了很大的提高,模型基本上能够满足要求,GoodnessofFit中的Sig.值,即Hosmer-Lemeshow统计量>0.05,接受观测数据和预测数据之间没有显著差异的零假设,即认为模型对数据拟合较好.同时模型回归的分类表也表明,有近一半的PDO被正确地分类,90.2%的伤人事故被正确地分类,死亡事故仍然是未被正确的预测出,模型对数据的分类正确率为70%,基本满足要求.最终Logit模型为G1=log(PpPf)=2.028−0.779(City_rural)+0.108(Speed_difference)+0.484(Truck%)(3)G2=log(PiPf)=2.553−2.790(City_rural)+0.376(Speed_difference)+0.275(Truck%)(4)G1=log(ΡpΡf)=2.028-0.779(City_rural)+0.108(Speed_difference)+0.484(Τruck%)(3)G2=log(ΡiΡf)=2.553-2.790(City_rural)+0.376(Speed_difference)+0.275(Τruck%)(4)式中:City_rural为乡村路段时取1,城市路段取0;Speed_difference小于等于20km/h时取1,大于20km/h取0;Truck%小于等于70%时取1,大于70%时取0.当事故发生的地点信息、交通流信息确定后,就可以根据式(3),(4)结合式(2)来判断该起事故可能属于哪种事故类型.4对于基本事件的预测和分析,其也正不断深化了国内的重性城市-乡村变量、大小车速度差和大车比例对事故类型的影响较大.交通流特征参数对事故发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论