交通事故大数据挖掘分析分析_第1页
交通事故大数据挖掘分析分析_第2页
交通事故大数据挖掘分析分析_第3页
交通事故大数据挖掘分析分析_第4页
交通事故大数据挖掘分析分析_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、国外交通事故大数据挖掘分析摘要:近年来,随着车速的提高及交通量的增长,道路交通事故每年 呈上升趋势。通过对交通事故大数据挖掘分析,k-meak-mea nsns聚类分析和AprioriApriori关联规则分析交通事故的趋势和模式,找出事故频发的路段和 引发事故的原因以及事故频发的高峰期,以数据分析结果为依据,改善交通状况,减少交通事故,提高交通系统的效率。关键词:交通系统、k-meansk-means聚类、AprioriApriori算法Abstract:ecentAbstract:ecent years,asyears,as thethe improvementimprovement of

2、of speedspeed ofof vehiclevehicle andand growthgrowth ofof traffictraffic volume,roadvolume,road traffictraffic accidentsaccidents isis onon thethe riserise everyevery year.basedyear.based onon datadata miningmining andand analysisanalysis ofof traffictraffic accidentsaccidents bigbig data,K-meansda

3、ta,K-means clustercluster analysisanalysis andand AprioriApriori associationassociation rulesrules analysisanalysis traffictraffic accideaccide ntnt tendencytendency andand patterpatter n.findn.find outout frequefreque ntnt accideaccide ntnt sectisecti onsons andand thethe causecause ofof accidentac

4、cident andand peakpeak hours,basehours,base onon datadata analysisanalysis result,improveresult,improve thethe traffictraffic situation,reducesituation,reduce tarffictarffic accident,improveaccident,improve thethe efficieefficie ncyncy ofof traffictraffic system.system.KeyKey wordswords transportati

5、ontransportation systemsystem、 k-meansk-means clustercluster、 AprioriApriori algorithmalgorithm、引言1 1随着我国经济的发展,交通安全问题日益突出,已经引起了人们的 广泛关注。如何对大量的交通事故信息进行数据挖掘, 寻找出其中隐 藏的知识与规律,用以改善交通安全状况已成为数据挖掘的一个重要 的研究领域。2 2国内外现状智能交通系统国内外研究现状随着智能交通的发展,美国正在研 究和部署车辆避碰、司机与车辆监控、与乘坐者安全性能改善等工作。 欧洲正在开展为优化人机界面和道路安全的远程信理“智能道路”的

6、研究和示范。澳大利亚也正在用智能交通系统新技术改善道路安全。 日本投入了大量的人力和资金,成功地组织了一个“动态路径诱导系 统”的实验,日本相继完成了路车间通信系统、交通信息通信系统、 宽区域旅行信息系统、超智能车辆系统、安全车辆系统及新交通管理 系统等方面的研究。日本“车辆、道路与交通智能协会”成立,ITSITS由 导航系统、自动收费系统、安全驾驶6 6援助系统等9 9个开发领域和 2020个用户服务功能构成。欧洲的ITSITS的开发与应用是与欧盟的交通 运输一体化建设进程紧密联系在一起的。智能交通系统的交通管理、 车辆行驶和电子收费等都围绕全欧无线数据通信网来展开。韩国政府于2001200

7、1月制订了全新的RRSRRS计划投入7575亿美元,建成包括汽车及 高速公路系统,先进交通管理系统,电子收费系统个先进的RRSRRS子系统。新加坡的ITSITS研发也具有了较高的水平,其城市高速路监控系 统(EMAS)(EMAS)优化交通信号系统(GLIDE)(GLIDE)出行者信息服务系统。二、交通事故大数据分析流程1 1数据采集交通事故大数据来源于公共安全部门和交通部门下的事故数据仓库 CTCDRCTCDR CTCDFCTCDF的目标是给负责交通安全人员提供及时、精确、完整、 标准的交通事故数据。CTCDRCTCDR允许对数据进行复杂的查询,属性包括 日期、道路位置、道路类型、碰撞类型、伤

8、害程度等。通过用户自定 义交通事故数据维度,进行更高级的数据分析识别趋势和模式。2 2数据分析k-meansk-means聚类分析,AprioriApriori关联规则分析,关联规则反映一个事物与 其他事物之间的相互依赖性或相互关联性。事故数据的维度包括:日期、事故伤害程度、事故地点和区域、事故影响因素、事故碰撞类型、 天气条件、路面情况、建设或维护相关、光照条件、路拦等;交通个 体数据的维度包括:车辆是否是有资格的发动机型号、车辆类型、车 辆制动、车辆机动前缀、车辆机动后缀、驾驶员或行人的年龄、驾驶 员或行人是否喝酒和吸毒、车辆出毛病的个数、首先撞上物体、然后 撞上物体。涉及人员数据维度包括

9、IDID号、伤害分类、座位、年龄、 保护系统的使用、安全气袋的状态、喷射状态。道路特性数据的维度 包括平均日流量、农村或城市、通道数。3 3数据可视化TableauTableau进行数据可视化,生成相应的图表图形,直观表示交通事故 大数据分析结果。三、关于研究领域的原理及应用介绍(算法原理)(1 1) K-meansK-means算法是一种经典的聚类算法,其基本思想是:以随机 选取的K K个样本作为起始中心点,将其余样本归入相似度最高中心点 所在的簇,再确立当前簇中样本坐标的均值为新的中心点,依次循环下去,直到所有样本类别不再变动,得到K K个交通事故类,并得到聚 类算法模型,能够将所有交通事

10、故数据划分到所属的类中,同时得到m m个交通事故信息的特征对聚类效果的重要性程度。(对数据进行预处理渎入原始数据和军数确定硕聚类数 J(将数据进行原始分类)图1 1 K-meaK-mea nsns聚类算法流程(2 2) AprioriApriori算法是一种挖掘关联规则的频繁项集算法,设置最小支 持度和最小置信度,产生频繁项集,关联分析数据源,某个项目集的 支持度大于或等于最小支持度,则该项目集被标记为频繁项集。找出 频繁项集,根据这些频繁项集可以得到候选关联规则, 计算每条候选 关联规则的置信度,筛选出大于最小置信度的关联规则, 这些关联规 则能够发现道路交通事故数据中各种属性的关联,以及驾

11、驶员、车辆、 道路、天气、时间等属性引起道路交通事故的原因因素与事故结果之 间的规则,从中得到规律。图2 2 AprioriApriori算法流程图除去不相关数据解释说明解释说明来源公共安全部门和交通部门事故数据仓库CTCDRk-means聚类分析、Apriori关联规则分析、PCA降维算法和统计分析本文采用k-k-meansmeans聚类算法对交通事故数据进行基于属性聚类分析, 在属性聚类中,使得在一个类中的事故特性具有很高的相似性,将每个类的事故原因当作一个整体来看。采用AprioriApriori关联规则算法找到引起事故的多因素和各自的占比,运用多维关联规则挖掘方法建立 AprioriA

12、priori关联规则挖掘模型,通过找出可能导致交通事故发生的频繁因 素组合来发现某些事故发生的规律,并将这些规律作为现实中作出预 防举措的依据。四、研究的点采用数据挖掘方法研究交通事故数据,建立多维关联规则数据挖 掘模型,旨在通过数据挖掘的关联规则算法, 将事故因素集和事故结 果集组成事故模式,交通管理部门就可以通过对驾驶员、 车辆、道路、 天气、时间等因素来判断道路交通事故发生的可能性。k-meak-mea nsns算法对属性做聚类分析,通过指定时间范围,选择某个区域 或某条道路来确定要分析的数据对象,选定需要分析的项目属性进行 聚类分析,在属性聚类中,利用聚类分析对事故原因进行聚类和分组,

13、 使得在一个类中的事故特性具有很高的相似性, 可以将每个类的事故 原因当作一个整体。根据实际需要,在事故原因聚类分析时,要考虑 事故原因中各个属性的重要程度,进行属性重要度分析。Weather Conditio,.i2Blowtig Sand. Soil,.FogI No Adverse ConditionOttierRainSevere CrosswindsSleet HailSnow| UnknownWeather Condition Text Format15245.10423,379.212Blowing Sandr Soil, Dirt.2 789.016.262Fog1 927.0

14、18,019No Adverse Condition055,755.019.902Other2 034.623173Rain116 3B02S9.587Severe Crosswinds364 91A659Sleet, Hail2 770 330,872Snow30725,133,426Unknown8734 931505五、结果分析表明引起交通事故绝大部分都是在没有不利天气条件下发生的,下雨或下雪对事故发生有较大影响Light Condition T 1Dark-LightedDark-Not LilghtedDawnDaylightDusk| Unknown上图说明事故多发生Dayligh

15、tDaylight和DarklightDarklight,事故发生和光照条件并无 太大关系。Road Surface Conditi.12DryIceOtherSandh Mudh Dirt ar OilSnow/ShishUnknownWetLight Condition Te.交通事故多发生路面情况正常即干燥路面,其他情况如路面是湿的、 有融雪等等容易引起交通事故。上图表明引起交通事故的影响因素依次从大到小,分别是跟车距离太近、未能给出优先权、司机失控、变换车道不当、 违反交通管理、速Null AbfiormdJ fto&d Condtal. | Anhmal or Fonlgfi Qta

16、jc. Dflf*cHvB Lqulpmsnc . DM Ah led or ilksgdJi Pnr. | Drh斷| Drtww Lost ContiDl Drkc-r Vhw OMrucbed | DiivcrksiVctiick Drivingian Wrong Stdis. | Enbeml Raadvray in Wr. | Failed bo Gnnri R也Irt D4 . Fell AlHp . Folkunng Too Closely Improper Larw- C hem沪 Impropcf Passing hbm. Improper Turning Ihfanc1.

17、InsuAftcicnl Wrlic-al 1 OG 20G北 G辭 I0DG 120G 1-44G 1fiOG 140G 対 OG 22dG 140G度过快、弯道超车、不安全倒退等等。Ciuaered Instances0354610 ( 76%)1113Q9S ( 24%)Class 日匸匸ribute: Road Surface Condit-ion Text; FonnatClasses to Clustiera s01一一 assigned to cluster546S922395 I 備匸17SS1 9fiOB | Snow/Sluah27329275366 I Dry322710

18、87 | Unknown.46744C06 I Ice283172 I Oher792462 | SandrMud,Dirt orOil10 I 2.01D I 1.0按路面情况进行聚类,路面情况可分为冰雪、潮湿、平坦等状况,根 据聚类算法得出结论:平坦路面状况最多,事故数也最多,冰雪只在 冬季的部分时间和部分路面才出现,发生事故的比例相对很大,说明冰雪路面易发生事故。路面积水导致摩擦系数降低,车辆容易发生侧 滑而冲出公路,导致交通事故的发生。六、未来展望随着经济与社会的发展,公路交通量与日俱增,其交通堵塞、交通拥 挤与交通肇事等现象日益增多。 且公路占地多、环境污染和财力不足 等诸多原因,己不再主要用修建更多公路的办法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论