基于数学模型对航班延误时间的研究(共37页)_第1页
基于数学模型对航班延误时间的研究(共37页)_第2页
基于数学模型对航班延误时间的研究(共37页)_第3页
基于数学模型对航班延误时间的研究(共37页)_第4页
基于数学模型对航班延误时间的研究(共37页)_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 摘 要对于问题一,建立了回归分析模型,用以验证国内统计标准的合理性。基于(jy)国内外航班延误的统计标准不同,由于flight stats给出的的是国际主要大型机场的排名,通过收集2014年国内十大航空公司部分月份的航班延误时间,然后进行数据统计与整理,对收集到的十个机场部分月份的指定天数的航班延误时间进行统计,进而求指定天数十个机场航班延误时间的平均值,判断得知flight的统计标准是不合理的。对于问题二,建立层次分析模型,从中分析得出导致航班(hn bn)延误的最主要因素。得出导致航班延误的主要因素权重排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事(jnsh)活动、以及机

2、场保障,即导致航班延误的最主要因素是航空公司的运行管理。对于问题三,建立时间序列模型,利用一次指数平滑法建立预测模型,然后对预测的航班延误时间峰值进行人为调控。建立指数平滑模型之后进行模型评估,进而求出是合适的,最后对航班延误时间进行预测,分析曲线走势,并与具体的航班延误时间进行对比分析,讨论模型的效用性。本文综合利用回归分析模型、基于层次分析法的综合评价,使用相关软件,对航班延误问题进行了多角度的分析。并给出了航班延误的时间序列模型,对航班延误作出了理论预测,且对模型的适用范围做出了推广,最后给出了模型的优缺点和改进方案,在实际应用中有较大的参考价值。关键词:回归分析模型;层次分析法;时间序

3、列模型;指数平滑法 问题(wnt)重述 随着我国民航运输业的快速发展,我国民航业正在经历美国等西方发达国家在上个世纪七十年代放松航空管制后航空业务量急剧膨胀,导致(dozh)机场和空域拥堵严重、航班延误快速增长的局面。2015年3月21日,香港南华早报报道,据总部设在美国的空中旅行数据提供商flight stats(以下简称(jinchng)flight)介绍,在全球61个最大机场中,中国机场及航空公司的准点离港表现可谓全球最差,准点离港表现最差的7个机场均位于中国内地,其中上海虹桥机场、浦东机场和杭州萧山机场分别以37.17%、37.26%和37.74%的准点率排名垫底。此次调查中,深圳宝安

4、机场、广州白云机场、重庆机场和北京首都国际机场也在表现最差的7个机场之列。在全球61个特大机场中,日本东京羽田机场表现最佳,准点率达89.76%。在航空数据网调查的全球各地374个大小不同的机场中,日本大阪伊丹机场表现最佳,准点率高达94.56%。请自行收集数据并建立模型解决以下问题:1、关于上述flight stats提供的结论是否正确?2、我国航班延误的主要原因是什么?3、针对我国航班延误的现状,提出一些改进措施。问题分析首先,flight给出的是国际主要大型机场的航班延误时间排名,我们在本问题在也只讨论国内大型机场的航班延误,以2014年给出的国内十大机场为准,具体机场信息见附录4。另外

5、,我们调查发现国内大型机场的航班到港基本不存在延误,因而我们在问题中只研究航班的离港延误时间,下面给出问题分析。2.1问题(wnt)一的分析:关于flight给出的全球61个最大机场中准点率排名,我们在flight官网找到了2014年全球主要(zhyo)最大机场航班延误排名,见下表:表一:2014年全球主要(zhyo)最大机场航班延误部分排名On-time RankAirportcodeFlightsSeatsTrackedComp.FactorOn-time54SVO1.15*1051.82*10777.22%76.62%54.20%55PEK2.85*1055.72*10797.18%95

6、.34%52.64%56CKG1.17*1051.84*10790.45%89.64%52.19%57CAN1.99*1053.41*10795.62%93.93%49.56%58SZX1.34*1052.31*10796.22%93.53%49.42%59PVG1.82*1053.45*10796.25%94.11%37.26%60SHA1.30*1052.45*10797.48%93.96%37.17%61HGH1.00*1051.60*10794.58%93.16%36.74%注:原始数据见附录二 首先这个排名是flight公司根据航班延误国际标准来统计作出的排名,但是由于每个国家的国情

7、不同,发展阶段不一致,我们中国也有自己的民航航班正常统计办法(以下简称统计办法),根据中国民航总局发布的民航航班正常统计办法1,对于枢纽机场,如在北京首都国际机场、上海浦东国际机场、广州白云国际机场起飞的航班,在公布的计划离港时间后30分钟内起飞且没有发生不正常情况的航班为正常航班;对于在上海虹桥国际机场和深圳宝安国际机场起飞的航班,这个时间规定是25分钟;对于在成都双流国际机场和昆明巫家坝机场起飞的航班,这个时间规定是20分钟。由于国内外的统计标准不同,我们有理由怀疑flight给出的排名的真实性。因而我们只需要说明国内统计办法的合理性,并大致得出其标准,同国际标准对比说明问题所在即可。毋庸

8、置疑的是,国际航班延误统计标准和中国的民航航班延误统计办法都有其理论依据,肯定不是随便定义的,我们试图从航班延误时间的角度建立回归分析模型,因此数据预处理的重点在于从现有航班信息中统计出不同时段的离港航班延误时间。我们以北京首都国际机场为首的2014年国内十大机场的航班进离港信息表为原始数据,并在fight官网收集到了按时间顺序记录(jl)的离港航班的计划起降时间,实际起降时间,根据这些信息我们计算出了整点时间每个航班延误的具体时间,进而对这些延误时间作为回归分析的数据,建立一元线性回归分析模型。我们(w men)从收集(shuj)的数据出发,确定自变量和因变量之间的定量关系式,即,大致估计出

9、国内大型机场延误时间的上下界,并计算出均值,同国际标准进行比较,最后说明国内大型机场航班延误统计标准的合理性。2.2问题二的分析据中新社2014年3月27日报道,航班延误的因素复杂多元,具体原因及其百分比是:航空公司运行管理占42.3%,流量控制占26.1%,恶劣天气影响占20.9%,军事活动影响占7%,机场保障占3.7%。基于我们查找到的航班延误的原因,欲找出导致航班延误的最主要因素,属于决策模型问题,由于层次分析具有系统性的分析方法,简洁实用的决策理论,以及所需定量数据信息较少的特性,我们的做法是建立层次分析模型,并依次建立层次结构模型,构造成对比较阵,计算权向量并做一致性检验,计算组合权

10、向量并做组合一致性检验,最后利用几何平均法,算术平均法,特征向量法,最小二乘法分别求得的总权重,综合分析得出导致航班延的最主要因素。2.3问题(wnt)三的分析 关于(guny)航班延误问题的解决办法,现在已经有很多政策性的方案,如预订机票时使用(shyng)民航资源网数据分析中心的“航线运力数据分析系统”提前查询航线航班历史准点率信息,尽量选择预订历史准点率较高的航班机票。我们的做法是建立航班延误预测模型。查找文献我们发现,Mueller R 在2003年发表的“飞行器进离港延误特征分析”2一文中分析了美国交通流量大和航班延误显著的10个主要枢纽机场的离港、航路和到达数据,其目的在于改善延误

11、预测,分别用正态分布和泊松分布建模,得到飞机延误时间的概率密度函数,根据原始数据计算均值和标准差,用最小二乘法改善均值和标准差,以减少模型与实际分布之间的误差,研究表明泊松分布能较好的建模离港延误,而正态分布则对建模航路和到达延误效果理想;然而,这种进离港延误的总体概率分布模型对于短期或单航班的进离港延误预测来说并没有实际意义。 徐涛等人在2009年发表的“基于贝叶斯网络的航班延误与波及分析模型”3一文中,采用贝叶斯网络对航班进离港事件进行分析和建模,构造了一个航班计划网络;利用贝叶斯原理,对网络中的节点进行延误预测,并能对可能发生延误的节点进行延误波及影响的分析,为相关部门提供参考,以采取措

12、施避免或减小延误影响。问题回到怎么解决航班延误问题,我们的想法是利用历史数据构建一个航班延误时间的预测模型,我们利用一次指数平滑法,对未来数天的航班延误时间作出大致预测,然后针对航班延误的峰值时间,及时进行政策方案调控(见附录七),以及时解决延误问题。最后我们观察了北京首都国际机场2015年5月4日的航班延误实时数据,建立预测评估模型,与我们得到的预测数据进行对比,说明模型的可靠性。 三、模型(mxng)假设合理性假设:假设问题(wnt)中影响数据拟合的误差是极小的。排他性假设:假设航班延误只与导致航班延误的主要因素(yn s)有关,不考虑其他因素对航班延误的影响。3、准确性假设:假设我们收集

13、的数据是真实可靠的,可以根据航班延误的时间得到相应的机场航班延误信息。四、符号说明与名词解释4.1 符号说明 序号 符号 符号说明 1 2 3 4 5 6 7 8 9 权重向量 一致性指标 一致性比例 航班离港的花费时间 流量控制影响的权重 军事活动影响的权重 航空公司运行管理的权重 恶劣天气影响的权重 机场保障影响的权重注:未列出的符号及重复的符号以出现处为准。4.2名称解释准点率:又称 HYPERLINK /view/1015040.htm t /_blank 正点率、航班正常率,是指航空旅客运输部门在执行 HYPERLINK /subview/4492076/4492076.htm t

14、/_blank 运输计划时, HYPERLINK /view/451294.htm t /_blank 航班实际出发时间与计划出发时间的较为一致的航班数量即正常航班与全部航班数量的 HYPERLINK /view/376291.htm t /_blank 比率。准点:如果一个航班在计划起飞时间后30分钟内完成起飞(机轮离地),即认为该航班准点放行。略晚点:如果一个航班在计划起飞时间后30-45分钟内完成(wn chng)起飞,即认为该航班略晚点放行。较晚点:如果一个航班在计划(jhu)起飞时间后45-60分钟内完成起飞,即认为该航班较晚点放行。5、严重晚点:如果一个航班在计划起飞时间后60分钟

15、以后(yhu)完成起飞,即认为该航班严重晚点。6、流量控制:流量控制是指通过限制单位时间内进入某空中交通管制节点的航空器的数量,来维持安全的空中交通流。五、模型的建立与求解5.1问题一的模型建立与求解5.1.1 数据预处理由于flight给出的是全球主要最大机场的航班统计排名,我们在数据收集时针对中国十大机场,具体收集的数据方式如下,2014年12个月中国十大机场,每一个月抽取6号、12号、18号、24号、30号(二月以28号为准),记为、,从这五天再抽取0-24时每一个整点(若整点没有航班,以最近的航班为准)的航班离(到)港的花费时间,记为,然后计算每一天的平均值,具体结果保留两位小数。我们

16、具体整理了2014年2、5、6、8、9、12月的国内十大机场航班离港延误平均时间如下表所示:表二:2014年2月国内十大机场航班离港延误数据统计简称/时间2月6号2月12号2月18号2月24号2月28号PEK18.8014.3818.3319.0921.75CAN15.2513.8820.5016.7518.38PVG28.1325.3835.8024.4531.25SHA23.5026.7527.5030.2528.50CTU20.8018.7523.2521.5022.00SZX24.8022.7523.3324.5021.88KMG26.7524.5025.3326.3325.11CKG

17、26.2325.6024.8025.5027.38XIY20.0019.5019.3821.5021.33HGH20.3322.0523.1521.5021.88平均值22.4621.3524.1423.1423.94 我们(w men)抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:(1.2,22.46),(1.4,21.35),(1.6,23.14),(1.8,23.14),(2.0,23.94)。表三:2014年5月国内十大机场航班(hn bn)离港延误数据统计简称/时间5月6号5月12号5月18号5月24号5月28号PEK19.8815.5019.8020.5021

18、.88CAN16.7514.5020.0017.7519.50PVG28.2526.3835.8026.5030.75SHA24.5025.7526.3330.8027.75CTU21.8019.5025.0020.7523.50SZX25.5021.0024.5024.0022.80KMG25.0023.4527.1125.7524.80CKG26.1325.0826.0424.8025.50XIY21.1721.2120.0321.2922.33HGH20.0022.0323.0422.4222.38平均值22.9021.4424.7723.4624.12我们抽取这个月6、12、18、24

19、、30号的平均延误时间(shjin),构造坐标如下:(4.2,22.90),(4.4,21.44)、(4.6,24.77)、(4.8,23.46)、(5.0,24.12)。表四:2014年6月国内十大机场航班离港延误数据统计简称/时间6月6号6月12号6月18号6月24号6月28号PEK20.1716.0320.0019.4221.38CAN15.2115.0419.1718.0819.01PVG35.0426.0328.3826.0430.13SHA24.4225.7525.1731.0427.29CTU22.3825.5025.3821.0423.38SZX25.0321.0324.042

20、5.2922.38KMG25.2123.1727.2125.0324.42CKG26.1325.0826.1324.2424.29XIY22.2121.1720.3822.0422.03HGH21.0423.3823.4222.0423.37平均值23.6822.2223.9323.4123.77 我们抽取(chu q)这个月每月6、12、18、24、30号的平均延误时间,构造坐标如下:(5.2,23.68),(5.4,22.22),(5.6,23.93),(5.8,23.41)、(6.0,23.77)。表五:2014年8月国内十大机场航班离港延误(ynw)数据统计简称/时间8月6号8月12号

21、8月18号8月24号8月28号PEK19.4221.0322.0416.0320.17CAN15.2120.4219.1718.0819.01PVG35.0426.0328.3826.0430.13SHA24.4225.7525.1731.0427.29CTU22.3825.5025.3822.0423.38SZX25.0322.3824.0425.2922.03KMG25.2123.1723.3823.3826.46CKG27.3822.0426.1324.0424.29XIY22.2126.1720.3823.4225.08HGH21.0428.3821.0425.0323.42平均值24

22、.2124.0823.5123.4424.13 我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标(zubio)如下:(7.2,24.21),(7.4,24.08),(7.6,23.51),(7.8,23.44)、(8.0,24.13)。表六:2014年9月国内十大机场(jchng)航班离港延误数据统计简称/时间9月6号9月12号9月18号9月24号9月28号PEK20.3822.0323.1717.3822.38CAN15.2120.4219.1718.0820.08PVG35.0426.0328.3830.0430.13SHA24.4225.7525.1735.3827.2

23、9CTU22.3825.5025.3825.8823.38SZX25.0322.3824.0428.4226.88KMG25.2123.1723.3825.3826.46CKG26.4222.0426.1324.0424.29XIY22.0426.1722.3823.4225.08HGH23.8828.3824.1325.3826.42平均值24.4024.1824.1325.3725.24 我们抽取这个月6、12、18、24、30号的平均延误时间(shjin),构造坐标如下:(8.2,24.40),(8.4,24.18),(8.6,24.13),(8.8,25.37),(9.0,25.24)

24、。表七:2014年12月国内十大机场航班离港延误(ynw)数据统计简称/时间12月6号12月12号12月18号12月24号12月28号PEK23.8824.1323.4625.3823.17CAN16.3822.2120.4223.3822.21PVG32.5025.1327.3830.4225.08SHA25.4226.0826.1730.0428.42CTU22.8825.1325.1325.8823.38SZX26.4221.8824.0427.8825.13KMG24.0423.1723.3824.3825.45CKG26.3822.0426.1324.0424.29XIY22.882

25、6.1723.4223.4225.08HGH24.0427.1325.8824.1327.08平均值24.5524.3024.5425.8924.93 我们抽取(chu q)这个月6、12、18、24、30号的平均延误时间,构造(guzo)坐标如下:(11.2,24.55),(11.4,24.30),(11.6,24.54),(11.8,24.89),(12.0,24.93)。5.1.2 模型(mxng)的建立1、选择回归模型的类型我们通过上述数据预处理得到的观测数据,在坐标上分析其散点图的变化趋势,从而选择标准函数类型,我们整理数据并得到散点图如下: 收集整理完数据以后我们着手建立回归分析模

26、型,由于我们旨在求2014年国内大型机场的航班延误时间的分布图,以及延误时间的大致均值,观察散点图我们发现其波动在23-26之间,所以我们建立一元线性回归模型,所谓一元线性回归,就是假定与之间的关系是线性关系,而且满足:,其中和称为回归系数,此时进行回归分析的目标就是给出系数和的估计值。线性回归(hugu)意味着条件平均数与之间的关系(gun x)是线性函数,对于每个的观察(gunch)值,来说,由于条件均值由式决定,观察值就应该是在条件均值的基础上再加上一个随机误差,则一元正态线性回归的模型为: ,其中 2、计算回归方程的参数由于实际问题中我们只能得到有限的数据,无法算出准确的和的值,只能求

27、出它们的估计值和,并得到的估计值为:,一般使用最小二乘法估计回归系数和。根据最小二乘法原理,所求出的残差平方和达到最小的直线为回归线。 即令: 要使 最小,应该有: 整理并解此方程后的,得到: 其中:x的校正平方和为: x和y的校正交叉乘积和为: 我们(w men)将数据代入后,得到: 对模型进行(jnxng)显著性检验对模型进行显著性检验,是用以判别回归效果,原本随机变量关系现在用确定性的关系式表示后,其可信度如何,必须加以验证,此是回归分析较为麻烦(m fan)的步骤,我们得到的一元线性回归曲线:将数据带入公式: 得到,即该回归曲线的拟合性较强。5.1.3 模型的求解 我们利用这30个坐标

28、拟合国内大型机场航班延误时间的一元线性回归曲线,利用MATLAB得到如下直线:Linear model Poly1:f(x) = p1*x + p2Coefficients (with 95% confidence bounds):p1 = 0.08254 (0.004081, 0.161)p2 = 23.84 (23.27, 24.42)Goodness of fit:SSE: 12.42R-square: 0.8423Adjusted R-square: 0.1116RMSE: 0.6661我们(w men)对比二次线性回归曲线:Linear model Poly2:f(x) = p1*x

29、2 + p2*x + p3Coefficients (with 95% confidence bounds):p1 =-0.01344 (-0.0363, 0.009428)p2 =0.2599 (-0.05181, 0.5716)p3 =23.39 (22.44, 24.35)Goodness of fit:SSE: 11.79R-square: 0.7861Adjusted R-square: 0.1258RMSE: 0.6607对比(dub)二者的R-square可以(ky)得到,即一次线性回归(hugu)曲线拟合离散型较强,观察一次二次回归曲线,我们发现,国内大型机场全年航班延误日平均

30、曲线的总体特点是全年延误情况基本平稳,春季延误波动性较大;夏季航班延误基本平稳,由此可以看出首都机场航班延误受节假日(包括五一十一黄金周)影响,人们的出行影响显著,而秋冬季节由于气温较低,人们出行量较小。对于春季而言,由于适逢中国传统佳节春节,导致航班延误突然攀升和迅速下降的趋势,从图中的曲线变化趋势来看,这与国内的实际基本情况完全一致。 综合分析,2014年国内大型机场航班延误时间分布在之间,我们可以利用航班延误时间的期望代表大型航班延误时间的标准。令代入得到 我们可以算出曲线与的离散程度最小,即国内大型机场航班延误时间的标准大致应为分钟。反过来我们将国内大型机场航班延误时间的标准分钟与国际

31、标准对比,显然,因此我们可以断定,不同标准下,flight给出的国际十大机场延误统计排名存在不合理性,从这个角度分析,他们给出的国际大型机场的航班延误率排名,并不能说明中国大型机场的航班延误问题较严重。通过这个结论,我们也应该意识到,现阶段不同的国家的发达程度以及管理措施也有差别,关于航班延误的时间标准,我们应该找出航班延误的主要原因,给予改进,进而向航班延误国际统计标准靠拢,这就是我们下一步要做的工作。5.2 问题二的建模与求解问题二要求我们得出我国航班延误的主要原因是什么,由于层次分析法一种定性与定量相结合的决策分析方法。常被运用于多目标、多准则、多要素、多层次的非结构化的复杂决策问题,特

32、别是战略决策问题,具有十分广泛的实用性,其中层次分析法权重向量的计算方法有四种,单一的计算方法存在较大误差,所以我们在但以计算方法的基础上,对其进行改进,选择四种方法均衡考虑,最后分析出导致航班延误的最主要因素,接下来我们依次建立模型。5.2.1模型(mxng)的建立1、建立(jinl)层次结构模型将决策的目标、考虑的因素(决策准则)和决策对象按它们之间的相互关系分为(fn wi)最高层、中间层和最低层,绘出层次结构图如下。2、构造判断矩阵在确定各层次各因素之间的权重时,如果只是定性的结果,则常常不容易被别人接受,因而采用:一致矩阵法,即:不把所有因素放在一起比较,而是两两相互比较。对比时采用

33、相对尺度,以尽可能减少性质不同因素相互比较的困难,以提高准确度。引用数字1-9及其倒数作为标度来定义判断矩阵,若元素和元素的重要性之比为那么元素j与元素i的重要性之比为,其中:1 表示两个元素相比,具有同样的重要性3 表示两个元素相比,前者比后者稍重要 5 表示两个元素相比,前者比后者明显重要 7 表示两个元素相比,前者比后者极其重要 9 表示两个元素相比,前者比后者强烈重要 2,4,6,8 表示上述相邻判断的中间值3、层次单排序以及一致性检验1)计算一致性指标: 其中(qzhng)为判断(pndun)矩阵的最大特征值。查找平均(pngjn)随机一致性指标:1234567000.520.891

34、.121.241.368910111213141.411.461.491.521.541.561.58 3)计算一致性比例: 时可以认为矩阵的一致性可以接受,否则应对判断矩阵做一致性修复。4、层次总排序以及一致性检验: 最终得到各元素,特别是最底层中各方案对目标的排序权重,从而进行方案选择,对层次总排序也需要做一致性检验,计算各个要素对系统总目标的合成权重,并对各个备选方案排序。得到评价因子矩阵A,航空公司运行管理,流量控制,恶劣天气影响,军事影响,机场保障的判断矩阵如图所示: 计算(j sun)权重向量 1、几何平均法 计算步骤(bzhu)如下: 1)A的元素(yun s)按行相乘得到一新向

35、量; 2)将新向量的每个分量开n次方;3)将所得向量归一化既得权重向量。2、算术平均法 Step1:A的元素按列归一化,即求: Step2:将归一化后的各列相加; step3:将相加后的向量除以n既得权重向量。 Step4:特征向量法将权重向量(xingling)W右乘权重比矩阵A,即:,其中(qzhng)为判断矩阵(j zhn)的最大值,存在且唯一,的分量均正向量,然后,将求得的权重向量做归一化处理即为所求。4、最小二乘法 利用拟合方法确定权重向量,使得残差平方和最小,即求解如下模型: 5.2.2模型的求解1、我们根据四种不同的求权重的方法,保留三位小数,整理得出如下数据:表八:导致航班延误

36、评价因子判断矩阵的权重系数方法几何平均0.0990.0550.2920.2520.1136.3680.0730.059算术平均0.1010.0600.2870.2450.1146.3740.0740.060特征向量0.0980.0570.2930.2420.1156.3700.0740.059最小二乘0.0890.0510.3070.2620.1336.4540.0900.073分析得到全部,航空公司运行管理、恶劣天气影响的权重较大。表九:航空公司运行管理判断矩阵的权重系数方法几何平均0.2180.2180.0660.3980.0985.2890.0720.064算术平均0.2140.2140

37、.0700.4000.1005.2910.0730.065特征向量0.2120.2130.0670.4110.0965.2920.0740.065最小二乘0.1890.1880.0710.4500.0995.3510.0880.078分析得到全部,恶劣天气、流量控制的权重较大。表十:流量控制判断矩阵的权重系数方法几何平均0.1300.0770.3680.0910.3325.0920.0230.020算术平均0.1330.0780.3660.0930.3285.1050.0240.021特征向量0.1310.0760.3700.0910.3295.0980.0280.021最小二乘0.1080.

38、0770.3680.1040.3415.1520.0370.034分析(fnx)得到全部,航空公司运行管理、机场(jchng)保障的权重较大。表十一(ShY):恶劣天气影响判断矩阵的权重系数方法几何平均0.1400.0940.4120.0940.2605.1650.0410.037算术平均0.1430.0950.4110.0950.2555.1660.0420.037特征向量0.1400.0930.4230.0930.2525.1670.0420.037最小二乘0.1040.1050.4340.1050.2525.2850.0650.050分析得到全部,航空公司运行管理、机场保障的权重较大。表

39、十二:军事活动影响判断矩阵的权重系数方法几何平均0.2850.1560.3760.1010.0835.2860.0720.064算术平均0.2780.1620.3680.1070.0845.2920.0730.065特征向量0.2840.1600.3730.1020.0825.2870.0720.064最小二乘0.2660.1310.4080.0970.0985.3620.0910.081分析得到全部,航空公司运行管理、流量控制的权重较大。表十三:机场保障判断矩阵的权重系数方法几何平均0.1990.1980.0750.3970.1315.2390.0900.054算术平均0.1940.1940

40、.0810.3880.1435.2520.0630.056特征向量0.1950.1950.0730.3900.1425.2450.0610.055最小二乘0.2050.2050.0750.4050.1115.2750.0690.061 分析得到全部,恶劣天气、流量控制、军事活动的权重较大。且以上判断矩阵在四种方法中都通过了一次性检验,即。2、计算各层对目标层的合成权重计算各层元素(yun s)对目标层的合成权重,若上一层次的包含(bohn)个因素(yn s),。如果C层次某些因素对于单排序的一致性指标为,相应的平均数即一致性指标为,则C层次的总排序随机一致性比率为:时,则层次总排序结果满足一致

41、性要求,求得: 1)几何平均法: 2)算术平均法: 3)特征向量法: 4)最小二乘法:四种方法都满足层次总排序的一致性要求,可求得各个区域总权重如下:表十四:四种方法求得的区域总权重区域方法权重流量控制军事活动航空运行公司管理恶劣天气机场保障几何平均法0.2200.1630.2700.1940.157算术平均法0.2140.1640.2660.1970.158特征向量法0.2150.1630.2710.1960.156最小二乘法0.1950.1560.2910.2010.1593、综合分析分析四种方法得到的求得的总权重可知,几何平均法,算术平均法,特征向量法,这三种方法得出导致航班延误的主要因

42、素严重性排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、机场保障;而用最小二乘法得到导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、恶劣天气、流量控制、机场保障、军事活动。观察区域总权重可得航空公司运行管理的总权重是最大的流量控制和恶劣天气的权重差不多,同样军事活动和机场保障的总权重也非常接近,他们的结果会在不同的计算法方法下产生较大误差,最小二乘法得到的区域总权重就和其他三种不同,但是综合考虑四种计算方法,得出导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、机场保障,即导致航班延误的主要因素是航空公司运行管理,

43、这样得出的结果比单一的方法更有说服力。5.3问题三的建模与求解针对(zhndu)航班延误预测问题,本文采用时间序列预测方法,试图从历史航班数据中建立时间序列航班预测模型。由于(yuy)一次移动平均实际上认为最近期数据对未来(wili)值影响相同,都加权;而期以前的数据对未来值没有影响,加权为 = 0 * Arabic * MERGEFORMAT 0。但是,二次及更高次移动平均数的权数却不是,且次数越高,权数的结构越复杂,但永远保持对称的权数,即两端项权数小,中间项权数大,不符合一般系统的动态性。一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。所以,更切合实际的方法应是对各期观测值依时

44、间顺序进行加权平均作为预测值。指数平滑法可满足这一要求,而且具有简单的递推形式4。 我们选取时间预测模型中的指数平滑法,指数平滑法是在 HYPERLINK /view/627827.htm t /view/_blank 移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列 HYPERLINK /view/1590251.htm t /view/_blank 预测模型对现象的未来进行预测5。其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。5.3.1 数据预处理收集处理数据 我们选取北京首都国际机场为收集对象,从2015年4月24日

45、-2015年5月3日,每天检测24个点,连续检测10天,共240个点,具体延误时间见下表,我们的统计如下:时间1:002:003:004:005:006:007:008:002015.5.312-7255231710242015.5.215-327822163232015.5.114-5282171914242015.4.301392210192020142015.4.291642314242415262015.4.2810-2197201813192015.4.2717-82811281010102015.4.2611029014274282015.4.2510-51115292162320

46、15.4.249716201817819时间9:0010:0011:0012:0013:0014:0015:0016:002015.5.328233127244441502015.5.230242522212041562015.5.131163234204124512015.4.3024283221315142432015.4.2925312141253146212015.4.2831272631314548322015.4.2729183121343343532015.4.2636102821214150242015.4.2529313723342331522015.4.2431183123

47、27464834时间17:0018:0019:0020:0021:0022:0023:0000:002015.5.33126302336221052015.5.2332031312125342015.5.13329261924345142015.4.302232272722318112015.4.29332720204428902015.4.284320182133232282015.4.272341312324211362015.4.264431372524252022015.4.25243429242524332015.4.24533231342734942、分析时间(shjin)序列 其

48、数据散布图如图所示,其中(qzhng)纵轴表示航班延误(ynw)时间,轴表示(biosh)从2015年4月24日-2015年5月3日,共计10天,我们构造轴为。从图中可以看出,该序列具有明显的趋势性和周期性,应该选取一次指数平滑法,在具体应用时可在使用模型之前依据数据特征对数据进行一些变换,如 Log,Logistic,Cox-Box等变换得到各个模型拟合的残差平方和统计量、R-Square统计量和AIC统计量。5.3.2模型的建立1、预测模型 设时间序列为为加权系数, 一次指数平滑公式为: 上式是由移动平均公式改进而来的。我们知道,移动平均数的递推公式为:以作为的最佳估计。令,以代替,既得式

49、:为进一步理解指数平滑的实质,把上式依次(yc)展开,有式表明(biomng)是全部历史数据的加权平均(pngjn),加权系数分别为 显然得到:以这种平滑值进行预测,就是一次指数平滑法,预测模型为:即: (1)也就是以第t期指数平滑值作为期预测值。2、初始值的确定 即第一期的预测值。一般原 HYPERLINK /view/39749.htm t /view/_blank 数列的项数较多时(大于15项),可以选用第一期的观察值或选用比第一期前一期的观察值作为初始值。如果原数列的项数较少时(小于15项),可以选取最初几期(一般为前三期)的平均数作为初始值。指数 HYPERLINK /view/21

50、35447.htm t /view/_blank 平滑方法的选用,一般可根据原数列 HYPERLINK /view/1323662.htm t /view/_blank 散点图呈现的趋势来确定。如呈现直线趋势,选用二次指数平滑法;如呈现 HYPERLINK /view/734.htm t /view/_blank 抛物线趋势,选用三次指数平滑法。或者,当时间序列的数据经二次指数平滑处理后,仍有 HYPERLINK /view/562504.htm t /view/_blank 曲率时,应用三次指数平滑法。3、加权系数的确定在进行指数平滑时,加权系数的选择是很重要的。由式可以看出,的大小规定了在

51、新预测值中新数据和原预测值所占的比重。值越大,新数据所占的比重就愈大,原预测值所占的比重就愈小,反之亦然。若把式(1)改写为 从上式可看出,新预测值是根据预测误差对原预测值进行修正而得到的。的大小则体现了修正的幅度,值愈大,修正幅度愈大;值愈小,修正幅度也愈小。若选取,则,即下期预测值就等于本期观测值,完全不相信过去的信息。这两种极端情况很难做出正确的预测。因此,值应根据时间序列的具体性质在之间选择。具体如何选择一般可遵循下列原则:如果时间(shjin)序列波动不大,比较平稳,则应取(yn q)小一点,如,以减少修正幅度,使预测模型(mxng)能包含较长时间序列的信息。 如果时间序列具有迅速且

52、明显的变动倾向,则应取大一点,如,使预测模型灵敏度高一些,以便迅速跟上数据的变化。 在实用上,类似移动平均法,多取几个值进行试算,看哪个预测误差小,就采用哪个。5.3.3模型求解预测结果我们采用指数平滑法,并分别取进行计算,初始值为即:按照预测模型: 我们先计算了各期预测值,然后我们整理了2015年5月4日8:00-14:00的北京首都国际机场的航班延误时间,具体数据见见附录5,与预测的航班延误时间对比列于下表中:表十五:时的预测值与实际值对比表时间 8:00 9:00 10:00 11:00 12:00 13:0014:00预测值 32 29 27 30 35 2824实际值 29 30 2

53、4 18 28 3332表十六:时的预测值与实际值对比表时间8:009:0010:0011:0012:0013:0014:00预测值18322428323028实际值29302418283332表十七(sh q):时的预测值与实际(shj)值对比图时间8:009:0010:0011:0012:0013:0014:00预测值26402819262932实际值29302418283332 分析(fnx)上表可得,指数平滑法预测航班延误时间是有效的,但是取值不同误差也不一样,接下来我们建立预测模型评估。2、预测模型评估:通过上表我们发现, 究竟取何值为好,预测值是很不相同的,对预测模型进行预测性能评

54、价,必须基于一定的评价指标。特别需要说明的是,对不同的预测模型进行比较评价,基于不同的指标,比较结果可能不同,这说明不同评价指标的不一致性。在不同的预测领域中,往往根据实际情况选择有价值的评价指标。预测模型选择如下统计量检验预测效果:我们建立预测评估模型如下:均方根误差(Root Mean Square Error): (2)平均绝对百分比误差(Mean Absolute Percentage Error): 平均绝对误差(Mean Absolute Error): 我们选择平均绝对百分比误差得到: 的取值0.20.50.8平均绝对百分比误差4.5034.5914.843 计算(j sun)结

55、果表明:时,误差(wch)较小,故选取,预测其他(qt)时间的航班延误时间。六、模型的评价与推广6.1 模型一的评价 模型一的优缺点优点缺点1、具有适用性,可以推广至中型小型机场的航班延误统计标准。2、模型一的建立思路简单易懂,建立过程自然流畅,并随着航班延误问题的深入,而不断加以改进,通过对结果进行分析,可知本文的模型精确度较高。1、没有考虑各种因素对航班的影响,突发情况将导致特性改变时,不能够及时的在模型中反映出来。2、基于人工统计数据,误差相对较大。模型二的优缺点 优点 缺点1、给出了差异的具体表达式,思路清晰明确,结果定量化便于对比。2、同时考虑了导致航班延误的多种具体因素以及其波动的

56、影响差异,考虑周全。3、利用层次分析法分析处理数据,所得结果可靠。1、不能排除突发因素给航班延误带来的影响。2、模型对机场和发展程度的差异考虑不够。模型三的优缺点 优点 缺点1、模型具有预测功能,能够为机场提供一定的参考,具有实际意义。2、模型的预测曲线精度较高,可靠性强。1、没有足够的历史实际数据对模型进行检验,无法评估模型的准确性。2、模型对突发天气状况或是节假日特殊情况考虑不周。6.2 模型(mxng)的推广1、关于模型一,航班延误的统计标准,会随着社会的发展改变,我们(w men)可以对现有的航班延误数据实时观测,从大型机场可以推广到中型、小型机场,同样可以求出对应航班延误曲线的的最小

57、离散直线同样可以作为航班延误的统计标准(biozhn)。关于模型二,层次分析法是一种2、关于模型二,层次分析法是一种定性与定量相结合的决策分析方法,计算权重时我们采用的是四种方法综合考虑,但单一的层次分析还是有局限性,我们试图将层次分析与优化模型结合起来共同研究航班延误,先利用层次分析找出几个重要原因,再利用优化模型做后续工作。3、关于模型三,我们建立时间序列预测模型,同样我们可以将这个方法推广到交通上,对北上广等发达城市的枢纽路口,或是高速公路的主要路线建立车流量预测模型,以及时做好应急工作。 最后我们写出了三个分别计算航班延误时间的MATLAB的程序,参见附录六。参考文献1民航航班正常统计

58、办法S,中国民航总局文件民航发(2013)。2Mueller E R and Chatter G B,Analysis of aircraft arrival and departure delay characteristicsC,Proceedings of Aircraft Technology Integration and Operations Technical Forum,2002。 3徐涛,丁建立,王建东,赵学健,基于贝叶斯网络的航班延误与波及分析模型J,系统仿真学报,2009。4(美)乔治E.P.博克斯,时间序列分析预测与控制,机械工业出版社2011年4月。5姜启源,谢金星(

59、jnxng),叶俊,数学模型,高等教育出版社,2011年4月第四版。6航班(hn bn)延误赔偿指导意见,民航总局文件,2013年。附录(fl)一、航班(hn bn)运行过程图二、2014年全球主要(zhyo)机场航班延误部分排名三、国内外统计(tngj)指标对比图 指标名称 国外 国内 说明 关舱延误 该指标主要是用于衡量机场和航空公司在起飞前的保障工作进行的情况 滑行延误 不同机场的滑行时间应该是不同的,该指标主要是用于衡量滑行延误的情况 空管起飞延误 该指标是衡量航班延误的重要指标空管着陆等待延误 该指标主要是对由空管造成航班在着陆前等待所造成的延误衡量 着陆延误 国外对于延误的衡量是全

60、面的着陆延误也是一个相当重要的指标 航路延误 该指标主要衡量航路飞行的延误情况 流量控制延误 国外存在流量管理系统,流量管理系统用于实际航班运行指导,该指标是衡量在发生流量控制的时候对于航班延误的影响程度通过对美国和国内现行统计指标体系的对比可以发现:美国的航班延误统计涉及到航班运行的全过程,即从航班滑行、起飞到着陆的整个过程,而我国现行统计方法仅仅是围绕航班的起飞正常性进行统计,这样衡量出来的正常率数据比较片面,缺少对航班整个运行过程中延误的统计,导致许多正常率高的航班反而旅客投诉比较多,因此,指标的设置已经不能真正衡量航班运行质量。而且,现行统计方法缺乏延误时间与延误原因的匹配,无法适应航

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论