统计预测与决策论文设计_第1页
统计预测与决策论文设计_第2页
统计预测与决策论文设计_第3页
统计预测与决策论文设计_第4页
统计预测与决策论文设计_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、word组合预测模型在全国能源消耗总量中的应用摘要:能源影响着我国社会经济的稳定持续开展,对未来能源消耗的准确预测具有重要的意义。本文以我国1978-2008年的全国能源消耗总量数据为根底,建立了ARIMA预测模型、灰色预测模型、三次多项式预测模型和基于这三种模型的组合模型,并进展了精度比拟,最后选择最优的组合预测模型对2009-2011年的全国能源消耗总量进展预测。关键词:ARIMA模型;灰色预测模型;三次多项式;组合模型;能源消耗1引言:能源是国民经济开展和人民生活水平提高的重要物质根底,能源短缺曾经长期制约我国经济的开展。近几年由于能源工业的开展,短缺局面虽然得到了缓解, 但从长远来看能

2、源供需形势仍然非常严峻,因此做好未来能源消费预测分析,为能源规划与政策的制定提供科学的依据,对于保持我国社会经济健康、持续、稳定开展具有重要的理论与现实意义。本文利用中国统计年鉴得到 31期全国能源消耗总量y的时间序列如下 表一所示:表一:全国能源消耗总量单位:万吨标准煤年份197819791980198119821983198419851986y571445858860275594476206766040709047668280850年份198719881989199019911992199319941995y86632929979693498703103783109170115993122

3、737131176年份199619971998199920002001200220032004y138948137798132214133831138552.6143199.2151797.3174990.3203226.7年份2005200620072008y2246822462702655832850002预测方法介绍2.1 ARIMA模型的根本原理ARIMA模型是Box和Jenkins1970年提出的以随机理论为根底的时间序列 分析方法,又称为“ Box-Jenkins模型,这以模型在经济领域的预测分析中得 到了广泛的应用。时间序列是依赖时间t的一组随机变量,构成该时序的单个序 列值虽然

4、具有不确定性,但对整个时间序列来说,它的变化却有一定的规律性, 可以用相应的数学模型来近似描述。ARIMA模型有三种根本类型:自回归模型、 移动平均模型、单整自回归移动平均模型。单整是指将一个时间序列有非平稳性变为平稳性所要经过的差分的次数, 这 是对非平稳时间序列进展时间序列分析的必经步骤。假设一个随机过程含有d个单位根,其经过d次差分之后可以变换为一个平稳的自回归移动平均过程。 如1 / 10word此该随机过程称为单整自回归移动平均模型。模型中 AR称为自回归分量,P为 自回归分量的阶数;MA为移动平均分量,q为移动平均分量的阶数;I为差分,d为使时间序列具有平稳性所需要的差分次数 p阶

5、自回归过程AR(p)的一般表达式为:Xt iXtl2Xt 2pXt p t其中t白噪声过程。q阶的移动平均过程MAq可以表示为:Xt t 1 t 12 t 2qtq, t为白噪声过程。pXt p t 1 t 12 t 2pXt p t 1 t 12 t 2Xt 01Xt 12 Xt 22.2灰色预测法灰色预测法是一种对含有不确定因素的系统进展预测的方法。一般是利用时间序列数据,通过建立 GM1,1模型进展预测。灰色预测模型的预测步骤如 下:(1)首先对原始时间序列数据x(0),做一次累加生成,得到新的序列x .(1)(2)利用一次累加生成序列拟合微分方程:叽ax ,得到参数a dt和(3)解微

6、分方程得到预测模型函数:X(k 1) X(0)(1) eak a a(4)将得到的X序列进展一次累减得到预测序列 X(0)(5)利用历史数据对数据模型进展精度检验,假如通不过检验,如此利 用残差对原模型进展修正。(6)通过预测方程进展预测。组合预测模型不同的预测方法根据一样的信息,往往会提供不同的结果,如果简单的将误 差较大的一些方法舍弃掉,将会丢弃一些有用的信息,使得模型的精度不高。组 合预测法是指通过建立一个组合预测模型, 把多种预测方法所得到的预测结果进 展综合。由于组合模型能够较大限度地利用各种预测样本信息,所以它比单项预测模型考虑问题更系统、更全面,因而能够有效地减少单个预测模型受随

7、机因素 的影响,可以提高预测的精度和稳定性。3全国能源消耗总量的实证分析建立ARIMAg型平稳化处理用ARIMA模型拟合的时间序列必须是平稳的,如果序列不平稳,如此要通 过差分或序列变换等先将序列平稳化。绘制原始序列的时序图得到图形如图一所 示:2 / 10word图一:y时序图由图可从直观上看出原始序列存在明显的长期递增趋势,原始序列不平稳。利用软件EViews6.0,运用单位根检验方法对序列进展平稳性检验发现原始序列 确定不平稳,因此本文先对该序列取对数,令 yl log( y),然后对yl进展差分, 差分两次之后得到平稳的序列 ylii 。单位根检验结果如下表二所示:表二:单位根检验结果

8、ADF值P值临界值a=1%临界值a=5%临界值a=10%原始序列y1.7585820.9995-3.68919-2.97185-2.62512取对数后yl0.6275170.988-3.68919-2.97185-2.62512一阶差分yli-2.958250.0529-3.72407-2.98623-2.6326二阶差分ylii-4.765430.0007-3.69987-2.97626-2.62742由表可知,取对数后再做两次一步差分之后的序列yliiADF检验的p值为0.0007,小于0.05,因此拒绝序列非平稳的原假设,可以承受序列为平稳的备择 假设。在此可知ARIMA模型定阶为d=2

9、。也可由图标直观说明序列的平稳性, 作出ylii的时序图如图一所示:3 / 10wordYLII.10.08YLII.10.08.06.04.02.00-.02-.04-.06-.081980198519901995200020052010图二:ylii时序图时序图也显示ylii序列平稳,结果与单位根检验相符。模型定阶模型定阶的方法有多中,本文选择基于自相关函数和偏自相关函数的定阶方法确定模型的阶数。首先,考察平稳序列 ylii的自相关图和偏自相关的性质,为拟合模型定阶,自相关函数(ACF)和偏自相关函数PACF图形如图三所示;图三:AutacorrslationFartla Correlat

10、ionAC PAC-Stmt Protj卜 b j1 0 105 0 1050 3571 0.550l|_!2 -0 308 -0 3233 5128 0.173 一3 -0.033 0.0503.5503 0,314114 0,059 -0.0493.6747 0.452,匚 + +0,76684 B-0.59005 B2i匚!5 -0.211 -0.2375.3426 0.375I11 16 -0.413 -0.41112.0U 0-062* 1(匚17 -0.046 -0.16012.103 0.0971!19 0,300 0 04515.940 0.043k i ! 19 0142 0

11、 03716.857 0.051 r id -0.088 -009217.221 0.070 : ii11 0 097 -0 0D617.688 0.080 P 1 q 1 2 0,079 -018910.020 0.115由图形可知,对处理后的序列ylii可以选择建立ARIMA(1,2,1)、ARIMA(1,2,2)、ARMA(2,2,1)、ARIMA(2,2,2)4种模型。分别拟合这四种模型得到结果如表三所示: / 10 / 10word表三:4种模型拟合结果模型变量估计系数T统计量伴生概 率P值调整R2AICSCARIMA(1,2,1)AR(1)MA(1)-0.375100.74524-

12、1.228113.238980.230400.003300.17179-4.13804-4.04288ARIMA(1.2,2)AR(1)MA(1)MA(2)0.32632-0.25253-0.732551.53493-1.74264-5.340260.137400.093700.000000.27357-4.23696-4.09422ARIMA(2,2,1)AR(1)AR(2)MA(1)-0.25552-0.234720.59424-0.95215-1.227332.305320.350500.231600.030100.18863-4.15745-4.01347ARIMA(2,2,2)AR(

13、1)AR(2)MA(1)MA(2)-0.76684-0.590051.246530.92659-5.24699-3.9485720,4099420.036340.000000.000600.000000.000000.28900-4.25798-4.06601其中只有ARIMA(2,2,2)模型的各系数通过了显著性才金驹,而且其模型的调整R2是四个模型中最大的,虽然它的 AIC, SC的绝对值不是最小的,ARIMA(1,2,1)模型的AIC最小,ARIMA(2,2,1)的SC最小,但它们的系数都没有通过显著性检验,而且调整R2也较小,所以本文选择ARIMA(2,2,2)模型,模型表达式为:yl

14、ii =(1-B)(1-B)log( y)= 2(1T.24653B 0.92659B ”t 1模型检验用ARIMA(2,2,2)模型做拟合得到残差序列 .,对残差序列进展自相关和偏自相关 分析,得到结果如图三所示:Dale; CHZ2D/10 Time: 1 4BSample: 1961 20 Inc 11 ide ri ohFfnrstions7 20C-ata+istic pmbahih1if?5for -4 ARMA termfs5AulULurryliiliurEAC FAC Q-Sttd ProbAulULurryliiliurE0.02 .WB 06R口 CR5 -n -?ii

15、-0.295 -0.033 0.236 .O 0.02 .WB 06R口 CR5 -n -?ii -0.295 -0.033 0.236 .O I 2 0 03?-0 043 05527H 17QS1 上 74 n 49F73b a9K3Nr o 1 o 2 3 o 4 1 3 7 4 o 口小口口。口 口0.町口口 - -0.05 I 1.32471 473FJ 1 hnrn:3.01 ie 6.3C2496.3674 8.S992 H.ZCbLl 0.770!J 0 DGOJ m门4n门闩闩 0.042 C.O96 O.O&0 U. i 2 I CLIO7 n 26 II 1图三5 / 1

16、0word由图可知。残差序列P值几乎都是大于0.05的,说明残差序列近于白噪声,根本没有可提取的信息了,模型已经提取了有规律的信息,说明模型拟合效果较好。模型预测利用1978-2008 年的时间序列建立的 ARMA(2,2,2)模型:2、(1 1.24653B 0.92659B ) fylii (1 B)(1 B)log( y) J 来预测 2004-2010 年的能1 0.76684 B 0.59005 B源消耗总量,结果如表四所示:表四:2004-2010年全国能源消耗总量 ARIMA(2,2,2)模型预测值年份2004.002005.002006.002007.002008.002009

17、.002010.002011.00实际值203226.68 224682.00246270.00 265583.00 285000.00预测值202971.88 233243.50268974.47 311049.59 358189.95413129.35 477104.00 549931.36绝对相对误差百分比(%)0.133.819.2217.1225.683.2灰色模型预测(1) ax中:根据历史数据序列x(0),做一次累加得到生成序列 x,对于微分方程(1) ax中:,构造数据矩阵B和数据向量Y,解该微分方程,得到Y BANX(0) X(0) (2)X(0)(3) aAX(1) (2)

18、 X(1)(3) -?2X (30) X (31) ?1X (30) X (31) ?12X (31)进展矩阵运算得到开展灰数a=-0.055673,生控制灰数=45508.908,得到预测模型为:X (k 1) 874576.3e.55673k817432.3。3.21残差检验将得到的序列X(1),进展一次累减生成预测序列X(0),将预测值与真实值比拟得到绝对误差序列 et 为:(0)=0、8516.84、7337.171、3478.379、2894.0693479.306 4761.587 6752.808 6917.228 8466.436 10356.31 9561.971 6328.

19、7566120.155 5915.771 6827.269、7321.323 9152.556、9938.481 1402.44 11990.4718629.48 22636.52 27218.27、28376.96、15499.22 1831.269、11756.32、21153.9227578.59 33369.396 / 10word计算相对误差后发现其中有些较大,甚至大于10%,最后五项的平均相对误差为7.36319507%。残差检验没有通过,下面进展关联度检验。当 =0.5时,关联度大于0.6时就可以通过关联度检验了。由残差的绝对序列可知然后根据公式min( (0)=0, max(

20、(0)=33369.39。然后根据公式i(k)min i(k)min i(0)max )max i(0)(i M,0.5)计算每个序列值的关联系数,再求平均得到关联度r=0.650237再求平均得到关联度r=0.650237o本文取取=0.5, r0.6,因此模型通过了关联度检验。虽然模型通过了关联度检验,但模型没有通过残差检验,精度不够理想,所以本文对该模型进展残差修正。3.22模型修正根据模型得到的残差序列et ,去掉第一项得到新的序列检验。虽然模型通过了关联度检验,但模型没有通过残差检验,精度不够理想,所以本文对该模型进展残差修正。3.22模型修正根据模型得到的残差序列et ,去掉第一项

21、得到新的序列e(0),然后进展累加得到序列e,在此根底上建立相应的GM (1,1)模型:e(k1) e(0)(1) aee aek 迤,UeUe模型两边求导得到残差修正项为:e(1)(k(0)aeaek1)( ae)e (1) eUeo原预测模型加上此修正项得到修正后的预测模型为:X(k 1) X(0)(1) e ak (k 1)( ae)e(1)曳e ae(k 1),其中 a aue(k 1)1k 2, (k 1)1k 2, 为修正系数0,k 2最后进展累减得到原始序列预测模型:X(0) (k 1) X(k 1) X(k)。根据所得数据,利用Excel软件,得到e,(k 1)ae =-0.0

22、6924 ,Ue =2893.212 e,(k 1)3482.92e0.06924k ,这样经过残差修正后的模型为:(1)0.055673 k0.06924kX (k 1) 874576.3e817432.3 (k 1)( 3482.92)e其 中(k 1)1,k 2 。在此序列的根底上进展累减得到2004-2011年的全国能源消0,k 2耗总量的预测值如下表五所示: / 10 / 10word表五:2004-2011年全国能源消耗总量灰色模型预测值年份20042005200620072008200920102011实际值203226.7224682246270P 265583285000预测

23、值201439.6212966.946225154.6238040.3251664.1266068.2281297.3297398.4相对误差百分比(%)0.875.218.5710.3711.693.3三次多项式当预测对象依时间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条适宜的函数曲线反响这种变化趋势时,就可用时间t为自变量,时序数值y为因变量,建立趋势模型:y f(t)0三次多项式预测模型是趋势外推预测模型中的一种比拟常用的模型。 为了探究时序数据变化的趋势,作出全国 能源消费总量y的散点图如图四所示:全国能源消耗总量图四:散点图由图可知全国能源消耗总量没有明显的季节波

24、动, 而且大致呈抛物线或指数的趋势上升,但经过精度比拟之后,三次多项式的拟合的最好,所以本文采用三次多项式模型进展拟合。利用软件 Eviews进展回归得到结果如下表六所示:表六:三次多项式模型结果变量系数标准差T统计量P值常数项34209.538549.9254.0011500.0004T10136.882277.3004.4512700.0001TA2-646.4941163.9748 1-3.9426440.0005TA318.582983.3716555.5115310.0000其中模型的F统计量为345.9252 ,相伴概率为0.00,小于0.05 ,所以拒绝原假设,即模型是显著的。而

25、且各系数的显著性检验的P值都小于0.05,通过了显8 / 10word著性检验。模型的调整的R2为0.971825,接近于1,说明模型拟合效果好。因此, 建立三次多项式模型如下:32y 18.583x646.494 x 10136.88x 34209.53用该模型对2004-2011年的全国能源消费总量进展预测得到结果如表七所示:表七:2004-2011年全国能源消费总量三次多项式预测值年份20042005 :200620072008200920102011真实值203226.7224682246270265583285000预测值202380.4219124.89237698.4258212

26、.3280778.2305507.6332511.9361902.6相对误差 百分比%0.412.473.482.771.483.4组合模型以上三种方法有些精度较高,有些精度较低,但由于各自理论的缺陷,会使 预测产生系统偏差。为了更充分的提取样本信息,提高预测精度,本文将以上三 种预测模型进展组合得到一个组合的预测模型。 组合模型的权重有多种,可以等 概率取权重,可以采用最小二乘估计法取权重,也可以使权重mi 1w .,其中i为残差标准差,m为单一模型的个数,或者使权重m 1i 1D 11w -D,其中Di 1为第i个单一模型误差平方和,m为单一模型个数。本文 Di 1i 1mi i 1采用第三种取取权重的方法,即 Wi 口.-0利用Excel软件求得权重 m 1i 1分别为: W1 =0.466858, w2 =0.171932824, w3 =0.361209557 根据预测模型:y Wi yt1 w2 yt2 wz y 3对2004-2011年的全国能源消耗总量进展预测结果如下表八所示: / 10 / 10表八:2004-2011年全国能源消

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论