ARIMA预测原理以及SAS实现代码_第1页
ARIMA预测原理以及SAS实现代码_第2页
ARIMA预测原理以及SAS实现代码_第3页
ARIMA预测原理以及SAS实现代码_第4页
ARIMA预测原理以及SAS实现代码_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ARIMA定义ARIMA的完整写法为ARIMA(p,d,q)其中p为自回归系数,代表数据呈现周期性波动d为差分次数,代表数据差分几次才能达到平稳序列q为移动平均阶数,代表数据为平稳序列,可以用移动平均来处理获得观察值序列差分

运算irN拟合ARMA获得观察值序列差分

运算irN拟合ARMA平稳性检测方法►方法一:时序图序列始终在一个常数值附近随机波动,且波动范围有界,且没有明显的趋势性或周期性,所以可认为是平稳序列。下图明显不是一个平稳序列procgplotdata=gdp;plotgdp*year=1;symbolc=redi=joinv=star;run;

•►方法二:自相关图自相关系数会很快衰减向0所以可认为是平稳序列。procarimadata=gdp;►adf单位根检验(精确判断)三个检验中只要有一个Pr<Rho小于0.05即可认定为平稳序列,主要是stationarity

=(adf=3)起作用procarimadata=gdp;identifyvar=gdpstationarity=(adf=3)nlag=12;run;Dick&y-Fuller单位根检蜀濡后RhoPr<RhoTauPr<TauFPr>FZ&roMean03.96450.99939710.9999112.27E50.99991.S20.56U23.74340.99912.as0.990033.57650.99002.230.9924SingleMean03.B9520.99976.45D399945.65&.001&117.06320.99991.M-19阴91.19[).77&423.93620.99972.770.99993.000.156333.63570.99962.222.46&.40MTrend03.D2090.99981.&&D.999920.23&.001&137.Z6670.99991.1&D-99991.19D.92M2411990.9删1.713.653415090.99991.51D29992.34&.7Z37■白噪声检验Pr>卡方<0.05即可认定为通过白噪声检验。procarimadata=gdp;identifyvar=gdpstationarity=(adf=3)nlag=12;run;■非平稳序列转换为平稳序列方法一:将数据取对数。方法二:对数据取差分dif函数datagdp_log;setgdp;loggdp=log(gdp);cfloggdp二dif(loggdp);run;/**对数数据散点图**/procgplot;plotloggdp*year=l;symbolc二blacki=joinv=star;run;/*一阶差分对数数据散点图*/procgplot;plotcfloggdp*year=l;symbolc=greenv=doti=join;run;

n.no1995cfloggdpyear从上图中可以看出,一阶差分后序列已经变成平稳的了,因此,数列需要做一阶差分0.30n.250.20一0.15-0.10-0.0519B019B5znri5199nn.no1995cfloggdpyear从上图中可以看出,一阶差分后序列已经变成平稳的了,因此,数列需要做一阶差分0.30n.250.20一0.15-0.10-0.0519B019B5znri5199nznnn■专换完毕后再验证下面代码中的(1)就代表1阶差分,adf=3则代表平稳性检验0-3,/*一阶差分对数数据的自相关图、偏自相关图、纯随机性检验、单位根检验*/procarimadata=gdp_log;identifyvar=loggdp(l)stationarity=(adf=3)nlag=12;run;曰嗓尸的目相关检查至耶后卡万目由度618.81G<0.0045}0.4790.1G1-0.1G1-0.293-0.309-0.3471220.4512CLOSSff-0.1390.0440.1070.068-0.017-0.046増广Dickey-Fuller单位根检验类型滞后RhoPr<RhoTauPr<TauFPr>FZeroMean0-1.83960.3437-0.850.33791-1.54520.3B15-0790.36492-1.06100.4567-0.520.47933-0.44950.5685-0.280.5744SingleMean0-12.53320.0434-2.700.08773.670.20461-15.19870.0166-2.53丄12丄13.200.31122-39.7723^.0001-2.93/0.057^U.370.0S813-15B.1750.0001-2.90M&4/4.340.0097Trend0-12.48910.1999-2.610.27303.490.52281-14.971B0.1004-2.420.35983.030.59442-40.3B09<.0001-2.860.19204.090.41713■166.0470.0001-2.910.17864.300.3817用Qlb统计量作的2检验结果表明:对数差分后的GDP序列的Qlb统计量的P值为0.0045(<0.05),故序列为非白噪声序列。单位根检验结果表明:对数差分后的GDP序列有常数均值、无趋势的二阶自回归模型的Tau统计量的P值小于0.0573,故序列基本可以确定为平稳序列,并可初步考虑用ARMA(2,g)模型对它们进行拟合。嚴型定阶/**定阶**/procarimadata=gdp_log;identifyvar=loggdp(l)nlag=6minicp=(0:2)q=(0:4);run;/*minic为一定范围模型定阶相对最优模型识别*/曰嗓戸的目相关检查至師后卡万目由度Pr>卡力目相关G18.8160.00450.4790.161-0.161-0.293-0.309-0.347MinimumInformationCriterionLagsMAOMA1MA2IUIA3MA4AR0-5.50235-5.92E5B-5.91546-6.03307-6.03373AR1-5.9469-5.07077-6.01308-6.36963-6.376AR2-6.20883-6.09519-5.97303-6.3134-6.26134误差序歹I晦:AR(EJ采用相对最优模型识别,根据上述分析及序列的自相关和偏自相关图,适当选择加=4,n=2,使用indentify命令中的minicp=(0:n)q=(0:m)短语进行相对最优模型定阶。结果显示(图6.10),在p=1,q=4时,BIC函数值最小。执行ARIMA过程的Estimatep=1q=4命令做参数检验,结果未能通过参数检验。让q在0〜3之间取值,通过反复测试,只有ARMA(1,3)模型与ARMA(1,0)模型通过参数检验及模型检验,其检验结果及参数估计如图6.11所示。■参数估计/**参数估计**/procarimadata=gdp_log;identifyvar=loggdp(l);estimatep=1q=4;run;/*SAS支持三种估计,默认为条件最小二乘估计,要制定可增加选项:METHOD=ML极大似然估计METHOD=ULS最小二乘估计METHOD=CLS条件最小二乘估计输出项的含义见王燕P104*/;条件最乎二乘估讦1渗数怙计标准误差t值近似Pr>|t|I滞后]:MU0.157770.043643.610.00170::MA1J0.423525.231530.000.93631:0.030B42.941690.010.9917:MA1730.435272.7S7040.160.87753'1MAI,40.1102G0.551330.200.84354;;AR1,10.965595.117540.190.84921:从上面可以看出,在p=1q=4时,通不过检验祭件最小二乗估计参数估计标淮误差t值近似Pr>|t|滞后MU0.163580.026796.11<.00010MA1J-1.481360.36408-4.070.00061MA1,2-1.084490.34753-3.120.00522MA1.3-0.637390.21520-2.600.02093AR1,1-830000.3S787-2.U0.04431常数估计0.299354万差估计标准误差估计0.0041530.064441AIC-64.3524SBC-5e.0G19残羞数26AIC和SBC不旦括对数行列式

p=1q=3和条件最小二秉佶计蓼数怙计标准误差t值近似Pra|t|滞后MU0.165960.023596.61<.00010AR1,10.49B530.131732.740.01131静估计0.078207:;万差估计;标准误差估计0.00403G:0.06353::AIC-67.6200iSBC-65.1046i谨差数r眄乂AIC和SBC不包括对数行列式op=1q=0时能通过检验从上面2个模型的检验结果可以看到,它们均为有效模型,但ARMA(1,0)模型的AIC为-67,SBC为-65均比ARMA(1,3)的AIC与SBC小,根据AIC准则和SBC准则,ARMA(1,0)应该更有效,所以应选择前者作为预测模型。■■AIL怕SDU已列STI」o裁数估计相关性裁救MUAR1JMU1.0000.069AR1J0.0691.000至滞后残卷的目相黄检查卡万目由废Pr>卡万目申目关66.0750.29970.0540.062-0.109-0.191-0.001■0.301127.22110.7806-0.0640.0660.0880.080-0.0140.0681811.99170.8006-0.087-0.1890.0390.0460.144-0.0622415.94230.85770.0000.0260.103-0.075-0.0660.026|佶计均值0.1659661―I1'-I目回归因子因子1:1-0.49053旷⑴GDP对数序列模型的口径为:£Vlogx=0.155955+-t1-0.49853B其中,xt表示GDP序列,模型可写为:logx=1.49853logx一0.49853logx+0.078207+£tt-1t-2t■预测/**参数估计及预测**/procarimadata=gdp_log;identifyvar=loggdp(l)nlag=16;estimatep=1q=0;forecastlead=4id=yearout二results;run;@year|@leccO圃TDUCA5T|@i5T>LK|@U95|@KE5I1TALAlOTB5.D9325926E01OTD5.£4740764425.24S2L4T6750.Q6353D235T\5.1函詣祁3龍5.373T31G814HO.bbLT^dGSi13305.134420^4955.4025^706^60.0&3530E35T〔5”2700^0390?55ZT]]^C^50.D3L0Z3305;1®15.5E022014B4E.G0SBL996^G0.06353023575”40129701D75.7903309995-0.DB559犯至ii10825.57329^6655.641200QTD30.0B3530235I5E16BE3曲弗57651179442<1.0BT90E9M:1®35.T9£06115775.0779601660.06353023575”5534431號L5.00247713990.114900^161®45.Diaeiiiorra5.0SOE28TS770.Q6353D235T[5.85G011S1376.L050^57816-0.D6&91768!13355.113L0579316.O5Z015&132CL0&3530E35T[552749S&3956.17&53255710.0510?11799IT19EIB6.220411227G6.2907602&250.06353023576.1GG25129B6G.4L520523&4-O.070357035108?6.4t2S03flM4B.322tL2T6520.0B3530235IB227Effi7Qt264T品西7生10.06069023®|7F1314151®BG.&iei:i5'313e5B.506S229T550.0635302357&.462^6131&6.7L143^94946.D3L93Q1B1iB.74607129406.™7QLiT320.Q6353D235T!B.6752741QD3"6.9243031471^O.05371flarei19905.BWLIZIZTT6.35汁盯旳囲0.0&3530E35T[6T631EO410970LZZ]^1^5TF04T5Z52E5[1991|952410^6516.9S529L29020.06353023576.8^077432437.0896062721^O.0129200131M20B3530235IB9621440598T2L]]7a6O7S0.0677583917:LBITIB192D1993T.41623^15137.33330401050.06353023577.20076733&&7.4518217&440.0匪號阴4C61OT47.7072550627.624D63]1G^0.Q6353D235T[7.5QQ44B14257.74949009=130.OB22929GSS!1995S.DDTZ0O^S417.33054580560.a&353DZ35T[T.0O6OZS535T60550627535CLOT6T3467«199B9.ED554Q77E86.S3SD5839G70.06353023578.11054142268.35957537OS-0.DE9517G1S8.3136103784S.3325S63I120.0B3530235I£!2501^3373850T]fl334S2-0.0BS9]5^93iZ122Z32425199B3.37944721560.44576403320.06353023576/321267059£a.5703Ulrnri-q.DB&33aai0iS.428602368:3.4»445829^0.Q6353D235T!9.36503^545'8.&L49G28023^O.DB1343^42!300DS.5443530019S.5313L40T350.063&3DE35T:0406TOT9D566.65503105340.0130301224;2CO19.B9765004706.693265190^0.06353023578.55574022458.8O4T021723P.D4260G3512OJ287272^l82filS.7&23SLBQ520.0B3530235I£!637E647212888B&gS6Bgi-0.035L33^34^za27ZB293D£DD33.BDO5920ra0.650LL63020.06353023570.125031^0L3.97463533S9O.O1D46451302CO4Q.DB42203O46■3.CO526L19a^0.Q6353D235T[9.83074421B5|12977316430.07B9591142!ZCO59.2T39LT112^0.Q&353DZ35T[9.1^3«013B59:亍站4凶涵了.i300B9.44SB995&570.1144S296949”22236KST7社671017SS3S2021?1|9.Bl1034T463|0.159431m892935542038Q3235155833.;3L£DDB9.7711rows'0.1®®3B&9Tg^QKOJTSOID.L&i:i'33633T■还原预测数值并画图/**绘制预测图**/dataresults;setresults;y=exp(loggdp);estimate1=exp(forecast);el95=exp(l95);eu95=exp(u95);run;procgplotdata=results;ploty*year=lestimate1*year=2el95*year=3eu95*year=3/overlay;symbol1c=blacki=nonev=star;symbol2c=redi=joinv=none;

symbol3c=greeni=joinv=nonel=2;run;Iyear3DDDD197519BD19B5199019952DDD2DC520101DODD5000”nnn2DDDDIyear3DDDD197519BD19B5199019952DDD2DC520101DODD5000”nnn2DDDD15DDD■^一种确定p、q的方式procarimadata=gdp;identifyvar=gdpstationarity=(adf=3);run;直接对gdp求arima模型,可已看出acf是拖尾,而pacf是1阶截尾,所以最好是p=1,q=0SDOD-&O0Ddg4D0D-0/M-o-a-cgdpSDOD-&O0Ddg4D0D-0/M-o-a-cgdp,B的趋势和相黄分折2D0D--1.0-■确定p、q的方式理论由于ARMA(p,q)模型可以转化为无穷阶移动平均模型,所以ARMA(p,q)模型的自相关系数不截尾。同理,由于ARMA(p,q)模型也可以转化为无穷阶自回归模型,所以ARMA(p,q)模型的偏自相关系数也不截尾。总结AR(p)模型、MA(q)模型和ARMA(p,q)模型的自相关系数和偏自相关系数的规律,见表6.1所示。模型自相关系数Pkk偏自相关系数ekkkkAR(p)拖尾p阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾■模型优化指标当一个拟合模型在指定的置信水平a下通过了检验,说明了在这个置信水平a下该拟合模型能有效地拟合时间序列观察值的波动。但是这种有效的拟合模型并不是惟一的。如果同一个时间序列可以构造两个拟合模型,且两个模型都显著有效,那么应该选择哪个拟合模型用于统计推断呢?通常采用AIC和SBC信息准则来进行模型优化。1.AIC准则AIC准则是由日本统计学家赤池弘次(Akaike)于1973年提出,AIC全称是最小信息量准则(aninformationcriterion)。AIC准则是一种考评综合最优配置的指标,它是拟合精度和参数未知个数的加权函数:AIC=—2ln(模型中极大似然函数值)+2(模型中未知参数个数)(6.68)使AIC函数达到最小值的模型被认为是最优模型。2.BIC准则AIC准则也有不足之处:如果时间序列很长,相关信息就越分散,需要多自变量复杂拟合模型才能使拟合精度比较高。在AIC准则中拟合误差等于nln(b2),即拟合误差随样本容量n£放大。但是模型参数个数的惩罚因子却与n无关,权重始终为常数2。因此在样本容量n趋于无穷大时,由AIC准则选择的拟合模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多。为了弥补AIC准则的不足,Akaike于1976年提出BIC准则。而Schwartz在1978年根据Bays理论也得出同样的判别准则,称为SBC准则。SBC准则定义为:SBC=—2ln(模型中极大似然函数值)+ln(n)(模型中未知参数个数)(6.69)它对AIC的改进就是将未知参数个数的惩罚权重由常数2变成了样本容量n的对数ln(n)。在所有通过检验的模型中使得AIC或SBC函数达到最小的模型为相对最优模型。之所以称为相对最优模型是因为不可能比较所有模型。表6.2河南省历年国民生产总值数据年份(Year)生产总值(亿元)(GDP)人均生产总值(元)(PGDP)年份(Year)生产总值(亿元)(GDP)人均生产总值(元)(PGDP)1978162.92232.319921279.751452.31979190.09266.719931662.761867.41980229.16316.719942224.432475.21981249.69340.119953002.743312.81982263.3035319963661.184007.41983327.95432.919974079.264430.11984370.04481.619984356.604695.11985451.74579.719994576.104893.71986502.91635.320005137.6654441987609.60755.820015640.115923.61988749.09909.920026168.736436.51989850.711012.320037048.597570.21990934.651090.620048815.099469.919911045.731201.2■付:完整代码datagdp;infiledatalines;inputyeargdppgdp;formatgdpBEST12.2pgdpBEST12.2;datalines;162.92232.3190.09266.7229.16316.7249.69340.1263.30353327.95432.9370.04481.6451.74579.7502.91635.3609.60755.8749.09909.9850.711012.3934.651090.61045.731201.21279.751452.31662.761867.42224.432475.23002.743312.83661.184007.44079.264430.14356.604695.14576.104893.75137.6654445640.115923.66168.736436.57048.597570.28815.099469.9run;/**原始数据散点图**/procgplotdata=gdp;plotgdp*year=1;symbolc=redi=joinv=star;run;/*注symbol常用参数C—图形颜色,red_红色,black_黑色,green_绿色,blue_蓝色,pink_洋红等*//*V—观测值的图形,star_*,dot_.,cicle_圆圈,diamond.菱形,none_不标*//*I—观察值的链接方式,join_线连,spline_光滑连接,needle_作观察值到横轴悬垂线,none_不连*/procarimadata二gdp;identifyvar二gdpstationarity

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论