版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、外文翻译内容时间序列计数数据模型:一个实证申请交通意外摘要计数资料主要划分为横断面,时间序列,和小组。在过去十年中,伯 松分布和负二项分布(注)模式已广泛用于分析横断而、时间系列计数数 据、随机效应和固定效应泊松和注模式被用來分析小组计数数据。然而, 最近的文献表明,尽管有关这些模型的分配假设适合横断面计数的数据, 但它们往往发现在纯时间序列计数数据没有能力考虑到序列相关性的影 响。实值时间序列模型,诸如框和詹金斯介绍的自动回归移动平均(arima) 模型,在过去几十年已用于许多应用程序。然而,当模拟非负整数值的数 据,如在交通事故随着时间的推移,框和詹金斯模式可能不适合了。这主 耍是由于在a
2、rima模型中正常的的错误假设。在过去的几年里,一类新的 被称为整数值口动冋归(inar )泊松模型的时间序列模型,已经由许多 作者研究了。这一级别的模型尤其适用于时间序列分析计算模型的数据, 因为这些模型能反映伯松回归的性能,并能够处理序列相关性,因此提供 t一种替代的实值时间序列模型。本文的首要目的是介绍大不列颠的这类分析交通事故的时间序列的 inar模型。不同类型的时间序列数据被认为是:综合时间序列数据都在 空间和调查的时间区域内是比较大的(例如,大不列颠和年的关系),分 散的时间序列数据在空间和时间区域内相对较小(例如,拥挤收费区与月 的关系)o inar模式的性能与同类别的框和詹金斯
3、实值模型相比较。其结 果表明,综合交通事故时间序列数据在系数估计方面和拟合优度的情况 下,这些两类模式的性能是十分相似的。这是因为在这种正常的相近的情 况卜,平均的计数是很准确的,arima模型可以令人满意。然而,inar泊 松模型的性能被发现冇明显优于的artma模型,因为在分散的时间序列数 据的交通事故屮,arima模型的计数是在相对较低。文章最后讨论了 inar 模型的局限性来处理的季节性和观测到的并质性。1.绪论公路运输给社会带来了巨大的利益,但它也有直接和间接成本。直接 成本包括捉供公路运输服务如基础设施,设备和人员的成本。间接成本包 括由于道路交通拥堵,和來道路交通的空气污染引起的
4、公路运输事故, 旅行延误的成本。所冇这些费用中,与道路交通事故相关的成本是非常高 的。根据英国运输部(dft, 2003年),为道路防止一人死亡(妇女议 会论坛)的价值为125万英镑(按2002年价格)。在世界上虽然英国是其 屮一个最安全的国家,但在2005年,事故每百公里旅游,在公路交通总 的死亡人数是3201人。分析道路交通事故的原因的最佳途径z是制定 各种事故预测模型,用來确定有关人力,车辆,社会经济,道路基础设施, 土地使用,环境的重大因素。例如,诺兰德和quddus (2004年)制定了 一个事故预测模型,并报告说,改善的医疗技术和医疗保健能减少英国交 通死广人数。基于事故预测模型的
5、成果,以实施不同的对策来减少道路交 通事故的频率。事故预测模型是用来监测已经提出的以尽量减少事故发生 的各种道路安全政策的效力。举例來说,休斯敦和理查森(2002年)制 定了一个事故预测模型,并得出结论认为,从屮学到小学改变现有的安全 带的法律来增强道路交通安全执法。然而,业绩和这些事故模型的有效性 在很大程度上依赖于选择适当的计量经济模型,由于道路交通事故都是非 负,离散,和零星的事件计数,了解不同的计数变量是至关重要。由丁道路交通事故的非负数,整数,和随机事件数量,这类事件的分 布遵循泊松分布。事故计数模型的方法发展很好。例如,横断面计数数据 是参照采用泊松回归模型(kulmala, 19
6、95年)。自事故计数数据通常是 过度分散的(即差额大于意思),一个负二项分布(注)冋归模型是一个 泊松-y混合物更适合运用(阿卜杜勒aty和拉徳力“,2000年;主,2000 年;伊万,2000年等等)。如果这种截而计数数据包含许多零的意见(即 超过零计数资料),然而零膨胀泊松(或注)模式或栅栏计数数据模型更 合适(土地,1996年等等)。如果横断面事故计数数据被截断或检查,如 截断一个有应至少一人死亡的事故,这些数据被参照使用在短泊松或截断 毒品调查科模型中。如果横断面事故计数数拯的报道诸如发生轻微的伤害 或财产损失的事故,然后根据报道使用泊松模型。如果事故计数数据是而 板数据,固定效应(远
7、东)泊松(或注)模型或随机效应(重新)泊松(或 注)模型被使用(钦邦和quddus, 2003年)。广义估计方程(吉)技术是 受雇于集群小组计数数据(主和佩尔绍德,2000年)。但是,在事故模拟模型文献事故计数的时间序列数拯中缺乏合适的计 量经济模型。通常,这种类型的事故数据是仿照用一个泊松回归模型或注 回归模型,有一个普遍的假设是:意见应彼此独立。这表明,这些模型更 适合横断面计数数据。使用这些时间序列模型计算的数据可能会导致估计 参数效率低下,因为时间序列数据通常是串行相关的。一个简单的解决办 法是在模型中实行一个时间趋势变量作为解释变量来控制序列的相关性。 例如,诺兰徳(2006)等。注
8、:模型釆用了一种趋势变量研究在交通意外 伤亡的伦敦进城费的影响。但是,也不能保证,这将明确解决序列相关性 的影响,特别是在交通意外伤亡对事件的长期时间序列计数数据。时间序列模型的连续数据非常发达。实值时间序列模型,诸如冋归移 动平均(ma)模型,由框和詹金斯(1970年)介绍了,过去儿十年,在许 多应用中已被用来计数模型时间序列数据(例如,zimring, 1975;夏尔马 和尔哈雷,1999年;休斯顿和理杳森,2002年;吴作栋,2005年;诺兰 德,2006年;等等)。然而,当非负整数值模型计数的数据,诸如在地理 实体里交通意外随着时间的推移,box和詹金斯模式可能不适合。这主要 是由于在
9、arima模型中错误的正常假设。这在很大程度上表明,模型是必 要的,它可以考虑到非负离散财产和自动计数的时间序列数据。在过去几 年中,一类新的,例如被称为整数值门回归(inar)泊松模型的时间序列 模型,已经在金融、公共卫生监测、旅行和旅游,林业部门等领域中被许 多作者研究了。这一级别的模型尤其适用于吋间序列分析计算模型的数 据,因为这些模型拥有分配数量的数据的属性,并能处理序列相关性,因 此,捉供了一种可替代的实值时间序列模型和一般泊松或注:模式。本篇章主耍的目的是介绍inar模式中的时间序列分析来口大不列颠 的事故计数数据。两种吋间序列事故数据类型被认为:(1)时间序列数据 汇总情况的空间
10、和时间的观察单位是比较大的(例如,大不列颠和年的关 系);(2)分类的时间序列数据在两个空间和时间的观察单位相对较小(例 如,在伦敦中部的拥挤收费区和月的关系)。各种计量经济模型,如ma, 注,注的时间趋势,inar (1)模型用于为每个数据集发展事故预测模型。 tnar (1)泊松模型的表现与其它模型相比较得岀的。其余的篇章,如下论述。下一节描述了在这些研究中inar模型的使 用。随后说明用于分析的数据来源。介绍和分析结论,然后在一些细节上 讨论。本文最后部分是结论和本研究的局限性。2 方法论由框和詹金斯(1970年)介绍的纯粹的连续时间序列数据的回归模 型,现在发展很好。框和詹金斯模型,如
11、季节性口动冋归移动平均(sarima) 模型能够考虑到这一趋势和季节性(因此序列相关性)通常存在于时间序 列数据中。延长这一模式是由框和眺(1975年)提议的,其中有能力研 究各种解释变量和作为解释变量干预,除了常规的趋势和季节性的组成部 分的影响。该模型可以表示如下(hipel和麦克里奥德,1994年):(1)其中t是离散时间(例如周、月、季或年),儿是适当的box- cox中 乙的变换,即是x,严,或者乙本身(box和cox, 1964 ),乙是特定 吋间t的因变量,这是干预的组成部分,x是独立变量的影响的决定性称 为控制变量,",是随机变化或可由一个arima模型,表示为(为
12、非季节性的时间序列)或sartma模型(为季节性时间序列),表示为 sarlmas,q)x(p,d,o)$的噪音部分。在这些公式屮,p是指非季节性自 动回归(ar)的进程,p是指季节性受体的进程,d是指非季节性差异,d 是指季节性差异,q是指非季节性移动平均线(ma)的进程,q是指季节 性(ma)的进程,而下标s是季节性的长度(例如s二12是每月吋间序列 数据)。该sarima模型可以表示为(box, 1994年等):n ='0(b)(bjq-byf-bjd(2)其中,©和是经常和季节性ar群,。和是经常和季节性ma群, b和乞是落后转变群,勺是一个与零均值不相关的随机误差项
13、,恒定方差 详情可在box (1994年)等中发现有关这一模型的进一步解释。arima或sarima的基础干预模型显示在方程(1)中,作为假定为正 态分布零均值和恒定方差的误差项,适用于实值时间序列数据。尽管这一 假设,这种模式正在被用来调查非负离散时间序列进程与许多应用相关, 包括道路交通事故(例如,休斯顿和理查森,2002年;诺兰德,2006年 等)。在以非负整数值时间序列过程屮,如每月事故计数数据,有几个关于 应用sarima模式的重大问题。第一个问题是模型的定义。一个实值的命 令1的自动回归过程可表述如下:k =必】+ 5(3) 为了获得一个整型值乙以卜的限制,必须在方程(3)中实行均
14、衡器, 如(i)勺是整数值及(ii) 1, 0,或1。这种制约因素限制了实际 实值时间序列自动回归进程的在计数变量的框架屮应用。第二个问题涉及 作出止常假设的普遍性。一个计数变量,其平均计数相对较高,如大不列 颠每年道路交通事故,通常认为是近似正常的分布,因此,使用sartma 模型可以满足作为正常的假设是不会有疑问的。然而,作为一个计数变量, 其意味着接近于零,如每刀的道路交通事故的死亡是一个小型单元方块, 其分布通常是向右倾斜的。因此,通常的,或任何其他分布的假设,是不 无道理的。这类整数价值自动回归过程曲inar表示,已经出许多作者(例如, 基地奥什和alzaid , 1987年;肯思国
15、际律师事务所,1988年;brannas 和赫尔斯特伦,2001年;卡尔利斯,2006年)研究了。这种模式的自然 想法取代了由一个随机滞后的x' s的影响的确定性(见方程(3)o发 展的途径在&和冷】z间取代了标量乘法间通过如下定义的细化的二项 式。° kr-i =mu-1 +如"1 + + "/严工1=1(4) 如果丫1是一个非负整数且。三°,1,而阮是一个独立序列与柏努 利随机变量分布一样(iid ),独立的n ,且保证 pr(mi = 1) = 1 - pr(w,. = 0)= a o值得注意的是,陰,"必】成为一个二项
16、分布随机变量是冇条件的,在一些成功的冷】独立审判的每一个成功的可 能性是因此,原來的实值ar (1)方程(3)的模式别取代为k "。近一1+勺(5) q的阶段行程基于乙和耳是独立的。方程(5)的第二部分在区间 '一1川时进入系统的组成要索称为革新。基本的inar的推导过程基于假 设,这种假设即革新,有一个独立和相同的泊松分布,即勺泊松(人), 这里的人是指由泊松定义表示为a = exp(/?yz +%人)(6) 在al-0sh和alzaid (1987年)和麦肯齐(1988年)可以发现方程 的模型的属性。方程屮变量忆与ml")相等吋被称为泊松inar(1),其中假定
17、时间序列的基本过程是固定的(al-osh和alzaid , 1987 年;肯思国际律师事务所,1988年;brannas和hall, 2001年;赫尔斯 特伦,2002年)。扩展该模型包扌舌泊松inma(l),泊松imarma(1),注:模型inar(l), 和注:模型inarma(1)。这些都是叮以同时处理非平稳和过度分散的计数数据(al-osh 和 alzaid, 1988 年;brannas 和 hall, 2001 年;卡尔利斯, 2006年)。方程(5)可以使用可编程估计确切最高群(em)可能算法(卡 尔利斯,2006年)。英他时间序列模型的计数,如串行相关误差模型(zeger, 1
18、988 年)和 zegar - qaqish 模型(zcgar 和 qaqish, 1988 年)中可以在 赫尔斯特伦(2002年)和kedem和fokianos (2002)中找到。3.资料上面讨论的两个数据集经常用來调查是否适宜不同类型的事故预测 模型。其屮之一是一个高度集屮的时间序列的事故数量,另一种是相对分 散的时间序列事故数量。在本研究认为高度集屮的时间序列数据是每年道路交通死亡人数以 gb 1950年至2005年从英国运输部(dft的,2006年)获得的。统计到 的总人数是55人,平均和标准差的吋间序列过程分别是5769和1352。 众所周知,在公路网屮,一个事故模型应包含一个事故
19、变量的暴露来控制 总的道路交通运动。文献表明,一个良好的事故变量的暴露是车辆公里数 (vkt)o gb的年度vkt数据,是从dft (dft, 2006年)屮收集到的。每 年道路交通死亡和vkt数据中都显示在图1中。值得注意的是,每年道路 交通死亡人数随着vkt的增加而增加,直到1966年,死亡人数随着vkt 的增加而减少。这主要是由于在过去几年,不同的道路安全的措施,法规 和政策的实施。例如,在1983年英国政府推出了安全带安全法,以减小 事故的严重程度。在1989年,针对粗心驾驶的扣分,驾驶的保险,儿童、 乘客的安全带的系带已编入法律。事故预测模型,利用这个调查数据将发 展,也将在控制vkt时影响到对道路交通死亡事故的这两个措施。时间序列数据认为这项研究是关于在伦敦拥挤收费区(消委会)在 1991
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 延安大学《外国文学史(二)》2022-2023学年第一学期期末试卷
- 烟台大学《理论力学》2021-2022学年第一学期期末试卷
- 徐州工程学院《植物压花实践艺术》2022-2023学年第一学期期末试卷
- 办公室礼仪与环境管理培训
- 徐州工程学院《手工艺产品创新设计》2023-2024学年第一学期期末试卷
- 完善客户反馈机制计划
- 房屋按揭贷款合同三篇
- 邢台学院《高级英语一》2021-2022学年第一学期期末试卷
- 风险管理应对培训
- 信阳师范大学《计算方法与Matab实验》2022-2023学年第一学期期末试卷
- 环境工程技术专业调研报告
- 妊娠合并卵巢扭转的护理查房
- 急性阑尾炎个案查房
- 卡方分布表完
- 团队意识培训课件
- 小学各年级健康睡眠与充足休息主题班会
- 火龙罐综合灸疗法
- 30题战略规划岗位常见面试问题含HR问题考察点及参考回答
- 2020-2021年英语专业四级考试真题及答案
- 闸门槽施工方案
- 14S501-1球墨铸铁单层井盖及踏步施工
评论
0/150
提交评论