版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2182008,44(5 Computer Engineering and Applications计算机工程与应用高速公路交通事故成因分析与关联因素研究何松柏,袁晓洁:,窦志成2,王亚军1HE Songbail,YUAN Xiao-jie2,DOU Zhi-chen92,WANG Ya-junl1.军事交通学院,天津3001612.南开大学信息技术科学学院,天津3000711.Academy of Military Transport,Tianjin 300161;China2.College of Information Technical Science,Nankai Universit
2、y,Tianjin 300071,ChinaEmail:hsbcool163.cornliE Song-bai。YUAN Xiao-jie,DOU Zhi-cheng,et a1.Analysis on cause and research 011associated factors of freeway traffic accident.Computer EIIgin畿ri赡and Applications,2008,44(s:218-220.Abstract:This paper introduces an application of principal component analys
3、is for freeway traffic accident.The authors first in-vestigated main reasons which might cause traffic accident by principal component analysis,and then analyzed the conditional factors by association rule mining.It is helpful for reducing the occurrences ratio of traffic accident by making correspo
4、nding pro tective measures to investigated conditional factors.Key words:freeway;traffic accident;principal components analysis;association rule mining摘要:基于主成分分析原理研究了主成分分析在高速公路交通事故中的应用,根据数据分析结果,得出了影响交通安全的主要 原因,进而采用关联规则挖掘方法挖掘出导致事故原因的条件因素,从而提出相应的预防措施,以达到降低高速公路交通事故发 生的目的。关键词:高速公路;交通事故;主成分分析;关联规则挖掘文章编号:
5、10028331(200805021803文献标识码:A 中图分类号:TPl81引言近年来,我国高速公路交通事故越来越严重。据公安部交 通管理局统计,高速公路每百公里事故发生率是普通公路的4倍多,而且高速公路一旦发生交通事故,其严重程度往往高于 普通公路,尤其是死亡率,每百公里为17.4人,是普通公路的 两倍。例如,在2004年全国公路交通事故造成的83085人死 亡中,高速公路上死亡就有6235人,比上年上升18.3%,平均 每万公里死亡1823人,远远高于二、三级公路死亡水平。因此 如何减少和预防事故发生,降低事故损失就成了交通运输领域 亟待研究解决的问题。要实现这一目标,只进行道路基础设
6、施 建设是不够的,还需要对交通事故原因进行深层次的分析【l】。 根据目前国内高速公路交通事故数据采集统计方法,交通 事故数据被分为四个方面,即交通事故次数、死亡人数、受伤人 数和直接经济损失。交通事故四项统计数字分别从不同侧面对 交通事故的危害程度作出描述,但没有形成一个综合的评价指 标,这样难以对事故发生的主次要原因进行深入分析。本文将交通事故四项统计数字看作是一个四维的统计整 体,每项统计数字是总体的个数量指标。将交通事故四项统 计数字按照事故发生原因进行划分,从而得到n个观测数据, 构成了个四维向量。运用主成分分析法,对这个向量进行简 化,并最终以个综合评价指标来代替原来较多的评价指标,
7、 对引起交通事故各原因进行一个排序,进而采用关联规则挖掘 的方法,从交通事故数据库中找出各类事故发生的条件因素。2主成分分析数学模型2.1主成分分析原理主成分分析是将原有的指标重新组合成一组新的相互无 关的综合指标,同时根据实际需要从中选取较少的几个综合指 标,尽可能反映原来指标的信息。主成分分析法在交通事故综 合评价中的应用,实际上作了两个层次的线性合成:第一层次将原始指标通过晗当的线性组合转换成主成分, 按累计方差贡献率不低于某个值(比如O.85的原则确定前几 个主成分。具体来说就是将原有众多具有一定相关性的P个指 标,作一定的线性组合,作为新的综合指标。最经典的做法就是 用Y,(选取的第
8、一个线性组合,即第一个综合指标的方差来 表达,即Vat(Y。越大,表示y。包含的信息越多。因此在所有的 线性组合中选取的l,。应该是方差最大的,故称y.为第一主成作者简介:何松柏(1977一,男,讲师,主要研究领域:交通安全、计算机技术在交通运输中的应用;袁晓洁(1963一,女,博士,教授,博导,主要研究 领域:数据库和数据挖掘技术;窦志成(1980一,男,博士研究生,主要研究领域:数据挖掘,信息检索,个性化搜索;王亚军(1963一,男, 教授,硕导,主要研究领域:交通安全、计算机技术在交通运输中的应用。收稿13期:20070612修回13期:20070820 何松柏,袁晓洁,窦志成,等:高速
9、公路交通事故成因分析与关联因素研究 2008,44(5 219分。如果第一主成分不足以代表原有P个指标的信息,再考虑 选取l,:,即选第二个线性组合。为了有效地反映原有信息,l, 已有的信息就不需要再出现在y2中,即要求Cov(Y,Y2=O,则 称l,:为第二主成分,依此类推可以构造出第3、第4,第 P个主成分。第2层次是各主成分以各自的方差贡献率为权重,通过线 性加权求和得到综合评价指标来分析交通事故原因的先后顺 序,这反映了各主成分的信息圆。2.2主成分分析数学模型设:对交通事故的研究中涉及P个指标,分别用X。,兄, 五表示,这P个指标构成的P维随机向量为j,-(x。,%, 五,对x进行线
10、性变换,以形成新的综合变量,用y表示,即: Yt=111X1+flZ2+Zp瓦y产f21xl+f2l【2+如j昂Y=I.1Xl+厶Z2+z_砟简记为Yi=l;。+轼2+诵(扛1,2,m,并取l:+勺2=1。要求Y;,巧不相关(i巧;y-是Xt,X:,墨的线性函数中 方差最大的,依此类推p一。3高速公路交通事故成因分析本文选取某高速公路2004年9月2005年7月交通事故 数据,对交通事故数据按事故原因进行统计,进行主成分分析 计算步骤如下:(1各种事故原因造成的直接经济损失、受伤人数、死亡人 数、事故起数如表1所示。表1备事故原因导致高速公路交通事故统计情况一览表序号事故直接原因直接经济损封元
11、受伤数/个死亡数P个事故起勤起 (2对交通事故数据按照h=墨产进行标准化处理,利用Spss统计软件计算得到各事故原因导致高速公路交通事故 标准化数据如表2所示。表2各事故原因导致高速公路交通事故标准化数据(3将标准化数据按公式S=(s;,印求协方差阵,得出相 关系数矩阵:R=1.Ooo0.8940.8850.9730.8941.0000.9350.9120.8850.9351.0000.8860.9730.9120.8861.000(4计算相关矩阵置的特征值及特征向量在利用主成分分析法构造交通事故综合评价指标过程中, 由标准化数据求得的相关矩阵均为一个4阶对称方阵。利用 Spas软件对标准化数
12、据进行分析计算,可求得相关矩阵的4个 特征值分别为:A1=3.743,A2=O.167,A3-0.066,A,-0.024。同时可求得A。对于的特征向量为(O.501,O.500,O.495, 0.504。(5取m=l,计算主成分的累计方差贡献率三一上按累计方差贡献率G(。-A;,A。=93.57%85%,说明 i=l 扫1用一个综合评价指标来反映原四项统计数字是可行的。上(6取m=l,根据公式珏艺l,厶(扭1,2,1计算第一 扫1个主成分的样本值,即五l:o.501Y;。+0.500Y.-,+O.495Y。+o.500Y“, 玩是标准化后的数据。结果如表3所示。表3交通事故数据标准化、综合评
13、价值及捧序一览表从表3可以看出措施不当、其它驾驶员、超速行车、疲劳驾 驶、违章变更车遭、疏忽大意、其他部件故障是该高速公路发生 交通事故的主要原因,也是下一步挖掘的重点。4高速公路交通事故关联因素研究本文采用FPgrowth(Frequent Pattern Growth算法四进行 关联规则挖掘。算法输出结果是关联规则。为了更明确表示关 联规则,这里采用“条件集合考结果”的方式。条件集合包括车2202008,44(5 Computer Engineering and Applications计算机工程与应用型、驾龄、发生事故地区、年、月、日、几点、事故原因、事故形态、 天气因素中的某个或几个具
14、体组成因素。结果也是包括事故 发生时j吝九个因素中的个或者几个因素,即是选定的维度。 本文主要是挖掘导致事故原因的条件因素,因此只选择事故原 因,并且给出每条规则的支持度和置信度,来说明规则的重要 性和有效性。此处的支持度是指条件集合与结果这,1.个因素造 成事故所占总的事故的比例;置信度是指事故发生时,条件集 合因素出现的同时引发结果因素的比例旧。具体来说,参数设置 界面如图1所示,结果显示界面如图2所示。图1事故条件因素挖掘参数设置界面图2事故条件因素挖掘结果从图1和图2可以看出,在设置最小支持度阈值为7%,最 小置信度阈值为15%,此时得到17条规则。以第一条规则为 例:驾龄2年j措施不
15、当的支持度为o.239203表示驾龄2年 的驾驶员发生措施不当的事故起数占总事故起数的23.920 3%;置信度0.286853表示发生事故时,驾龄2年的驾驶员出 现的同时引发措施不当的比例为23.9203%。从规则可以看出, 在京津塘高速段、驾龄2年、小客、晴天及每月上旬驾驶员特别 容易出现措施不当;京津塘高速段、驾龄2年的小客驾驶员易 出现超速行驶;京津塘高速段、晴天、驾龄2年的驾驶员容易出 现疲劳驾驶,从而引起交通事故。因此,一是要加强驾龄2年驾驶员高速公路行车的监控措 施和安全教育活动,使其对安全高度重视;二是对京津塘高速 段道路设施进行完善,设计必要的警示标志,提示驾驶员在此 路段要
16、多加小心;三是重点加强对京津塘高速段小客车辆的监 控,促使他们在规定时速范围驾驶车辆;四是加强对驾龄2年 驾驶员心理素质的训练,使其在紧急情况下能采取正确的措施 等等。通过进行有的放矢的整治,可以从源头上控制交通事故 的数量,使人一车一路一环境达到充分和谐统一的关系。在经济 上,可以尽量降低交通事故对人民生命和国家财产的危害,促 进我国国民经济高速发展。5结束语在对高速公路交通事故成因分析与关系因素研究中,提出 的主成分分析法可以在确保原始数据信息损失最小的前提下, 经过线性变换和舍弃部分信息,以少数的综合变量取代原有的 多维变量,同时形成反映主成分和指标包含信息量的权数,以 计算综合评价值。
17、这样在指标权重选择上克服了主观因素的影 响,客观反映了样本间的现实关系。进而采用数据挖掘方法挖 掘出事故原因的条件因素,找出大量数据集中的潜在规律。它 是交通事故分析中一种有效的方法。参考文献:I】Motor-vehicle-related deaths involving intoxicated pedestriansU nited StatesR.MMWR Moral Wkly Rep,1994,43:249-253.【2】张苏冲国交通冲突技,1tiM戚都:西南交通大学出版社,1998. 【3】余锦华,杨维权.多元统计分析与应用【M】.广州:中山大学出版社, 2003.【4】4何平.多元统
18、计分析与应用【M】.成都:西南交通大学出版社,2004. 【5】范明,孟小峰擞据挖掘概念与技术【M.北京:机械工业出版社, 2002.【6YU Dang,GU Pei-liang,L1chen-guang.Railway freight transporta tion safety data management system(TMISbased on data explo-ration technologyJ.CHINA Railway Science,2004,25(2.(上接165页任协商安全防护方案SFEBTN。该方案可以很好地避免传统信 任协商安全防护方案中存在的策略循环依赖问题,并
19、且解决了 传统信任协商安全防护方案中不能很好鳃决的证书和策略隐 藏问题。参考文献:【1】Winaboreugh W H,Seamons K E,Jones V E.Automated trust nego-tiationC/DARPA Information Survivability Conf and Exposition. New York:IEEE Press,2000:88102.【21Yao A C.How tO generate and exchange seeretsC/Proc of the27th IEEE Symp on Foundations of Computer Sc
20、ience(FOCS.Los Alamit66.CA:IEEE Computer Society Press,1986:162167.【3】Yao A C.Protocols for secure computationsC/Proc 23rd IEEE Syrup on the Foundation of Computer Science.IEEE.1982:160-164. 【4】Garay J,MacKenzie P,Yang Ke.Efficient and universally compos-able committed oblivious transfer and applica
21、tionsC/Volume 2951of Lecture Notes in Computer Science:Theory of Cryptogra-phy,TCC 2004.Springer,2004:297316.【5】5Holt J E,Bradshaw R W,Seamons K E,et alMidden credentialsC1/ Jaiodia S,Samarati P,Syverson PF.Proc of the ACM Workshop on Privacy in the Electronic Society.New York:ACM Press.2003:1-8. 【6】罗曼.移动代理的安全性研究D】.广州:华南理工大学,2004. 高速公路交通事故成因分析与关联因素研究作者:何松柏 , 袁晓洁 , 窦志成 , 王亚军 , HE Song-bai, YUAN Xiao-jie, DOU Zhi-cheng, WANG Ya-jun作者单位:何松柏,王亚军,HE Song-bai,WANG Ya
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 办公室车队管理工作计划
- 2024年初一体育课程教学计划
- 计划主管的岗位职责
- 《早古分述》课件
- 七年级生物做实验教学计划
- 市医院工会201工作计划范文
- 小学第一学期学校安全工作计划
- 幼儿园病媒生物防治工作计划
- 礼嘉中学学年度第一学期现代教育技术工作计划
- 大学人事2024年度工作计划
- 复述课文内容的方法与技巧
- ASME-B31.3-2008-工艺管道壁厚计算
- 拼多多运营合作合同范本
- 2021年国开电大《微积分基础》形考任务微积分基础下载作业word版
- 比亚迪秦PLUS EV说明书
- 全国大学英语四、六级考试缺考申请表
- 美国特朗普-课件
- 《新时代幼儿园教师职业行为十项准则》学习宣讲PPT
- 抽水台班记录表
- TBA19利乐灌装机操作手册
- 篮球 社团活动记录表
评论
0/150
提交评论