ARIMA预测原理以及SAS实现代码_第1页
ARIMA预测原理以及SAS实现代码_第2页
ARIMA预测原理以及SAS实现代码_第3页
ARIMA预测原理以及SAS实现代码_第4页
ARIMA预测原理以及SAS实现代码_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ARIMA定义ARIMA的完整写法为ARIMA(p,d,q)►其中p为自回归系数,代表数据呈现周期性波动►d为差分次数,代表数据差分几次才能达到平稳序列►q为移动平均阶数,代表数据为平稳序列,可以用移动平均来处理。获得观察值序列分析结束获得观察值序列分析结束■平稳性检测方法►方法一:时序图序列始终在一个常数值附近随机波动,且波动范围有界,且没有明显的趋势性或周期性,所以可认为是平稳序列。下图明显不是一个平稳序列procgplotdata=gdp;plotgdp*year=1;symbolc=redi=joinv=star;run;9tipTOC\o"1-5"\h\z190DOj r30DO60DO 广J JiIODO■ 产/20DO- JnJ r|…RI|IIII| I|IIII|I1 1 ■ |IIII|1975 I960 1905 1990 1395 2Q0D 2005产回• ►方法二:自相关图自相关系数会很快衰减向0,所以可认为是平稳序列。procarimadata=gdp;identifyvar=gdpstationarity=(adf=3)nlag=12;run;►adf单位根检验(精确判断)

三个检验中只要有一个Pr<Rho小于0.05即可认定为平稳序列,主要是stationarity=(adf=3)起作用procarimadata=gdp;identifyvar=gdpstationarity=(adf=3)nlag=12;run;firDick&y-Fuller单位根检蕤类型滞后RhoPr<RhoTauPr<TauFPr>FZ&roMean03.0645o.g期9.71。一的9g112,27650.99991.S20.964423.74340.99912.&5o.^ao33.5765D.99002.ZB。一的24SingleMean03.69520.99976.45。•的9946.650.0010117,86320.99991.540.9&&91.190.776423.93620.99972.77。一的9g3.000.156333.63570.叼兆2.220.9^02.460.4S23Trend03.02090.99931.&&0.999920.230.0010137.0.99991.1&。一的991.190.9?7424.11990.99991.71。一妁993.650.4孰63415090.99991.5-1口一驳992.340.7237■白噪声检验Pr>卡方<0.05即可认定为通过白噪声检验。procarimadata=gdp;identifyvar=gdpstationarity=(adf=3)nlag=12;run;白噪声咽自相关检查至滞后卡方自由度Pr,卡方自相关&57.425<.00010.0370.7160.5100.50&0.4CM0.3121273.2312<.00010.214-0.1120.010-o.oao--0.14&-0.201■非平稳序列转换为平稳序列方法一:将数据取对数。方法二:对数据取差分dif函数datagdp_log;setgdp;loggdp=log(gdp);cfloggdp=dif(loggdp);run;/**对数数据散点图**/procgplot;plotloggdp*year=1;symbolc=blacki=joinv=star;run;/*一阶差分对数数据散点图*/procgplot;plotcfloggdp*year=1;symbolc=greenv=doti=join;run;

从上图中可以看出,一阶差分后序列已经变成平稳的了,因此,数列需要做一阶差分■转换完毕后再验证下面代码中的(1)就代表1阶差分,adf=3则代表平稳性检验0-3,/*一阶差分对数数据的自相关图、偏自相关图、纯随机性检验、单位根检验*/procarimadata=gdp_log;identifyvar=loggdp(1)stationarity=(adf=3)nlag=12;run;日堞声的目相关检查至期后卡万目由度目相关618.81G}0,4790.1G1-0.1G1-0.293-0.309-0.3471220.4512CLOSSff-0.1390.0440.1070.068-0.017-0.046真「Dickey-Fuller单位根检甄类型 」漏后RhoPr<RhoTauPr<TauFPr>FZeroMean0-1.83960.3437-0.850.33791-1.54520.3B15-0790.36492-1.06100.4567-0.520.47933-0.44950.5685-0.280.5744SingleMean0-12.53320.0434-2.700.08773.670.20461-15.19870.0166-2.533.200.31122-39.7723^,0001-2.93/0.057^U.370.0S813-15B,V50.0001-2.904.340.0097Trend0-12.48910.1999-2.610.27303.490.52281-14.971B0.1004-2.420.35983.030.59442-40.3B09<.0001-2.860.19204.090.41713■166,0470.0001-2.910.17864.300.3817用QLB统计量作的2检验结果表明:对数差分后的GDP序列的QLB统计量的P值为0.0045(<0.05),故序列为非白噪声序列。单位根检验结果表明:对数差分后的GDP序列有常数均值、无趋势的二阶自回归模型的Tau统计量的P值小于0.0573,故序列基本可以确定为平稳序列,并可初步考虑用ARMA(2,q)模型对它们进行拟合。峨型定阶/**定阶**/procarimadata=gdp_log;identifyvar=loggdp⑴nlag=6minicp=(0:2)q=(0:4);run;/*minic为一定范围模型定阶—一相对最优模型识别*/日曝声的目相关演至部后卡方目由度Pr>卡力目相关618.8160.00450.4790.161-0.161-0.293-0.309-0.347MinimumInformationCriterionLagsMAOMA1MA2MA3MA4AR0-5.50235-5.92E5B-5.91546-6.03307-6.03373AR1-5.9469-5.07077-6.01308-6.36963-6.376AR2-6.20883-6.09519-5.97303-6.3134-6.26134误差舷蜘:AR(EJBIC(1,4)=6376

采用相对最优模型识别,根据上述分析及序列的自相关和偏自相关图,适当选择m=4,n=2,使用indentify命令中的minicp=(0:n)q=(0:m)短语进行相对最优模型定阶。结果显示(图6.10),在p=1,q=4时,BIC函数值最小。执行ARIMA过程的Estimatep=1q=4命令做参数检验,结果未能通过参数检验。让q在0〜3之间取值,通过反复测试,只有ARMA(1,3)模型与ARMA(1,0)模型通过参数检验及模型检验,其检验结果及参数估计如图6.11所示。■参数估计/**参数估计**/procarimadata=gdp_log;identifyvar=loggdp(1);estimatep=1q=4;run;/*SAS支持三种估计,默认为条件最小二乘估计,要制定可增加选项:METHOD二ML极大似然估计METHOD二ULS最小二乘估计METHOD二CLS条件最小二乘估计输出项的含义见王燕P104*/;条件最小二乘估讦参数估计标准误差t值近似Pr>|t|滞后MU0.157770.043643.610.00170MA1J0.423525.231530.000.93631MA1,20.030B42.941690.010.99172MA1730.4352727S7040.160.87753MAI,40.1102G0.551330.200.84354AR1,10.965595.117540.190.84921从上面可以看出,在p=1q=4时,通不过检验条件最小二素估计爹数估计标准误差t值近似Pr>|t|滞后MU0.163580.026796.11<.00010MA1J-1.481360.36408-4.070.00061MA1,2-1.084490.34753-3.120.00522MA1.3-0.637390.21520-2.600.02093AR1,1830000.3S787-2.140.044310.299354方差估计标准误差估计0.0041530.064441AIC-64.3524SBC-5e.0G19城差数26AIC和SBC不包括对数行列式。

p=1q=3和条件最小二来估计蓼数估计标准误差t值近似Pr>|t|滞后MU0.165960.023596.61<.00010AR1,10.49B530.131732.740.01131常数估计0.078207月差估计标准误差估计0.00403G0.06353AIC-67.6200SBC-65.1046蔓" 26'AIC和SBC不包括对数行列式口p=1q=0时能通过检验从上面2个模型的检验结果可以看到,它们均为有效模型,但ARMA(1,0)模型的AIC为-67,SBC为-65均比ARMA(1,3)的AIC与SBC小,根据AIC准则和SBC准则,ARMA(1,0)应该更有效,所以应选择前者作为预测模型。■■aiu蛆〃、臼1口用son」?1)工、。孝教MUAR1JMU1.0000.069AR1J0.0691.000残差的目相关检查至滞后卡万目由度PC卡万era目关66.0750.29970.0540.062-0.109-0.191-0.001■0.301127.22110.7806-0.0640.0660.0880.080-0.0140.0681811.99170.8006-0.087-0.1890.0390.0460.144-0.0622415.94230.85770.0000.0260.103-0.075-0.0660.026;变量切的M0)覆的模型;估计均值0.1659661差分期间 1白回归因子固于1:1-0,49053日"⑴GDP对数序列模型的口径为:一一一一 £Vlogx=0.155955+ 1 t 1-0.49853B其中,xt表示GDP序列,模型可写为:logx=1.4985310gx1-0.4985310gx2+0.078207+£■预测u/**参数估计及预测**/procarimadata=gdp_log;identifyvar=loggdp⑴nlag=16;estimatep=1q=0;forecastlead=4id=yearout=results;run;国year⑸leccO惨TDUCA5T恒5T>过L35区U95包)KE5I1TALI1I'SfTB5.D9325926E0■21J7:|5.£4740764425.融3214To750.06353D235T 5.12^&37733&5.373T316814-0.DDL717Q6331330543442叫的55.4025^706^60.0&3530E35T; 5.2高皿用口T55ZT]]^CG550.D3L0Z33054侬15.5E022014B4E.G0SBL996^G0.0635302357 5T日129701D75.7903305^5-0.DB5593036510825.57329^6655.641200QTD30.0B3530235I 5516BE3KE357651179442-0.0BT90E9M1®35.T9£06115775.0779601660.0635302357 5.553443192L5.00247713990.1149009916T5.D1361110TOE.CTOE28TS770.06353D235T, 5.8560113137良L050*7816-0.D6&9176819555.113L0679316.O5Z0155132CL0&3530E35T 55274E653956.ir&5325OTl0.05105117999198B6.220411227166.2907602&250.0635302357 6.1GG25129B6以4L52:3523S4-0.D70357Q35ID1138f6.4t2S03flM4B.32211276520.0B3530235I B227Effi7Qt2B4T-虫73gl0.a60B9023ffiLLG.削印巧913€5B.就9空9T550.0635302357G.462收⑪166.71143^94940.D3L93Q1B112磔口B.74607129406.70079L1T320.06353D235TB.67527410931.9243091471-0.05371^37813IHH16.B10LT21Z776.35访9丁羽2d0.0&3530E35T; 6T631期1明7CU22H湖T-0.0QT5Z5255141991S.952410^6516.9S529L29020.0635302357 6.8^077432437.0896062721-0.D1262O013151M2T.1544如口2S3工院EEL以3T0.0B3530235I B962144弗的T2[]]70607&0.0677583917LB1993T.41623^15137.33330401050.0635302357 7.20076733&67.45TMi76440.0至9E9MC6IT19347.707255^27.B249&3116^0.QG353D235T 7.50044614257.T4Q钝口0TO30.0B22929GE8IBIHHHS.DDTZ0O^S417.3305458056CL0&3530E35T 78060Z3535T60550627535□OT6T3467«19199B9.ED554Q77E88.S3SD5839G70.0635302357 8.11054142268.35957537OS-0.DE9517G1S201孙8.3136103784S.3E25S63I120.0B3530235I W2%强到门850T]fl334S2-0.口的9】5493Z1199B3.37944721566.445764i:i::i:J20.0635302357 6/321267059£0.5703010071-0.OB6336016228.4286Q23SSS.490445929-40.06353D235T 8.3G5宓电545EL6L4962EO23-0. 843442Z3300D3.54435300190.53131401550.063&3DE35T: 0406TOT9D560655S31E5340.01303012Z4242coi9.B9765004708.的非6519M0.0635302357 8.55574022458.8O4T021723-0.D4260G3E1252OJ287272^l82filS.7a23SLBQ520.0B3530235I W637E6472128£郃£9日畸1-0.际田434ZS£DD33.BDO5920ra6.05DLLO3620.0635302357 注725coi初L3.97463533390.0104645136272c049.0642203046Q.CO52EL1QM0.06353D235T, 9.83074421B5Q.12977316430.07B9591142ZBZC059.273917112^10.0&353DZ35T: *1*4col3B593HiM加C03529300B9.44SB995&570.1144S29694 9.22236KST7马671017SS3S3D202171| 9.611034T463|0.159431msg2935542033Q32351558333L£DDB9.7711rows'0.1患班邢T -33014C0JT5OID.L&0133633T■■还原预测数值并画图/**绘制预测图**/dataresults;setresults;y=exp(loggdp);estimatel=exp(forecast);el95=exp(l95);eu95=exp(u95);run;procgplotdata:results;ploty*year=1estimate1*year=2el95*year=3eu95*year=3/overlay;symbol1c=blacki=nonev=star;symbol2c=redi=joinv=none;

symbol3c=greeni=joinv=nonel=2;run;喊一种确定p、q的方式procarimadata=gdp;identifyvar=gdpstationarity=(adf=3);run;直接对gdp求arima模型,可已看出acf是拖尾,而pacf是1阶截尾,所以最好是p=1,q=0

6D0D-600。4D0D-2000-6D0D-600。4D0D-2000-05050Lo.o.mL--LLuqd■确定p、q的方式理论由于ARMA(p,q)模型可以转化为无穷阶移动平均模型,所以ARMA(p,q)模型的自相关系数不截尾。同理,由于ARMA(P,q)模型也可以转化为无穷阶自回归模型,所以ARMA(P,q)模型的偏自相关系数也不截尾。总结AR(P)模型、MA(q)模型和ARMA(P,q)模型的自相关系数和偏自相关系数的规律,见表6.1所示。模型自相关系数P“k偏自相关系数小山kkAR(p)拖尾p阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾■模型优化指标当一个拟合模型在指定的置信水平a下通过了检验,说明了在这个置信水平a下该拟合模型能有效地拟合时间序列观察值的波动。但是这种有效的拟合模型并不是惟一的。如果同一个时间序列可以构造两个拟合模型,且两个模型都显著有效,那么应该选择哪个拟合模型用于统计推断呢?通常采用aic和SBC信息准则来进行模型优化。AIC准则AIC准则是由日本统计学家赤池弘次(Akaike)于1973年提出,AIC全称是最小信息量准则(aninformationcriterion)。AIC准则是一种考评综合最优配置的指标,它是拟合精度和参数未知个数的加权函数:AIC=-2ln(模型中极大似然函数值)+2(模型中未知参数个数) (6.68)使AIC函数达到最小值的模型被认为是最优模型。BIC准则AIC准则也有不足之处:如果时间序列很长,相关信息就越分散,需要多自变量复杂拟合模型才能使拟合精度比较高。在AIC准则中拟合误差等于nln(。2),即拟合误差随样本容量n£放大。但是模型参数个数的惩罚因子却与n无关,权重始终为常数2。因此在样本容量n趋于无穷大时,由AIC准则选择的拟合模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多。为了弥补AIC准则的不足,Akaike于1976年提出BIC准则。而Schwartz在1978年根据Bays理论也得出同样的判别准则,称为SBC准则。SBC准则定义为:SBC=-2ln(模型中极大似然函数值)+ln(n)(模型中未知参数个数) (6.69)它对AIC的改进就是将未知参数个数的惩罚权重由常数2变成了样本容量n的对数ln(n)。在所有通过检验的模型中使得AIC或SBC函数达到最小的模型为相对最优模型。之所以称为相对最优模型是因为不可能比较所有模型。表6.2河南省历年国民生产总值数据年份(Year)生产总值(亿元)(GDP)人均生产总值(元)(PGDP)年份(Year)生产总值(亿元)(GDP)人均生产总值(元)(PGDP)1978162.92232.319921279.751452.31979190.09266.719931662.761867.41980229.16316.719942224.432475.21981249.69340.119953002.743312.81982263.3035319963661.184007.41983327.95432.919974079.264430.11984370.04481.619984356.604695.11985451.74579.719994576.104893.71986502.91635.320005137.6654441987609.60755.820015640.115923.61988749.09909.920026168.736436.51989850.711012.320037048.597570.21990934.651090.620048815.099469.919911045.731201.2

■机完整代码datagdp;infiledatalines;inputyeargdppgdp;formatgdpBEST12.2pgdpBEST12.2;datalines;1978162.92232.31979190.09266.71980229.16316.71981249.69340.11982263.303531983327.95432.91984370.04481.61985451.74579.71986502.91635.31987609.60755.81988749.09909.91989850.711012.31990934.651090.619911045.731201.219921279.751452.319931662.761867.419942224.432475.219953002.743312.819963661.184007.419974079.264430.119984356.604695.119994576.104893.720005137.66544420015640.115923.620026168.736436.520037048.597570.22004;8815.099469.9run;/**原始数据散点图**/procgplotdata=gdp;plotgdp*year=1;symbolc=redi=joinv=star;run;/*注symbol常用参数C—图形颜色,red_红色,black_黑色,green_绿色,blue_蓝色,pink_洋红等*//*V—观测值的图形,star_*,dot_.,cicle_圆圈,diamond_菱形,none_不标*//*I—观察值的链接方式,join_线连,spline_光滑连接,needle_作观察值到横轴悬垂线,none_不连*/procarimadata=gdp;identifyvar=gdpstationarity=(adf=3);ru

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论