SAS建立时间序列模型_第1页
SAS建立时间序列模型_第2页
SAS建立时间序列模型_第3页
SAS建立时间序列模型_第4页
SAS建立时间序列模型_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SAS软件简介 SAS系统系统是由美国是由美国SAS软件研究所开发的用于软件研究所开发的用于决策支持的大型集成信息系统,是数决策支持的大型集成信息系统,是数据处理和统计领域的国际标准软件之据处理和统计领域的国际标准软件之一,广泛应用于金融、医药卫生、生一,广泛应用于金融、医药卫生、生产、运输、通讯、政府、教育和科研产、运输、通讯、政府、教育和科研等领域。等领域。应用应用SAS软件建立时间序列模型软件建立时间序列模型 准备工作:建立一个时间序列数据集准备工作:建立一个时间序列数据集SAS语句:语句:Data 数据集名;数据集名; Input 序号(序号(year or month)变量名)变量名

2、 ; Cards;/(输入数据,按(输入数据,按input格式逐个输入数格式逐个输入数据,以分号结束);据,以分号结束); Proc print data数据集名;数据集名;/输出数据表输出数据表Run;例例1 磨轮剖面资料磨轮剖面资料data li; input x ; cards;13.5 4.0 4.0 4.5 3.0 3.0 10.0 10.2 9.0 10.0 8.5 7.0 10.5 7.5 7.0 10.5 9.5 7.0 12.0 13.5 12.5 15.0 13.0 11.0 9.0 10.5 10.5 11.5 10.5 9.0 8.2 8.5 9.2 8.5 10.0

3、14.5 13.0 2.0 6.0 6.0 11.0 9.5 12.5 13.8 12.0 12.0 12.0 13.0 12.0 14.0 14.5 13.5 12.3 7.0 7.0 7.0 6.5 12.5 15.0 12.5 11.6 11.0 10.0 8.5 3.0 11.5 11.5 11.5 11.0 9.0 2.5 7.0 6.0 6.6 14.0 11.0 9.0 6.5 4.0 6.0 12.0 11.0 12.0 12.5 12.5 13.6 13.0 8.0 6.5 6.8 6.0 7.2 10.2 8.0 7.5 11.0 11.8 11.8 6.5 8.0 9.0

4、 8.0 8.0 9.0 9.5 10.0 9.0 12.0 13.5 13.8 15.0 12.5 11.0 11.5 14.5 11.5 11.8 13.0 15.0 14.5 13.0 9.0 11.0 9.0 10.0 14.0 13.5 3.0 2.2 6.0 8.0 9.0 9.0 9.0 7.0 6.0 6.5 7.0 7.5 8.5 9.0 9.5 10.0 11.5 11.2 12.5 11.6 8.0 7.0 6.0 6.0 6.0 9.0 12.0 13.5 13.0 3.5 1.8 1.6 7.5 8.0 7.9 11.6 12.5 10.5 8.0 9.0 11.6

5、11.8 12.6 10.2 10.0 5.0 7.0 -1.0 0.0 0.0 3.0 11.0 12.0 12.2 11.0 8.0 7.0 5.5 10.0 11.5 7.0 4.0 7.0 7.0 10.0 9.0 8.0 10.0 13.0 10.0 6.5 11.0 13.0 13.0 14.0 13.0 12.5 12.0 9.0 8.5 7.0 8.5 10.0 8.0 4.0 3.0 10.0 13.0 13.0 13.0 12.0 11.0 11.0 11.0 14.5 14.0 14.0 13.5 10.0 9.5 10.0 12.5 10.0 9.0 9.0 4.0 3

6、.0 6.0 5.0 7.0 6.0 5.0 8.510.5 11.1 11.0 10.0 11.2 8.0 2.5 5.0 13.2 14.0;Proc print data=li;run;data seriesg; input x ; xlog=log(x); date=intnx(month,31dec1948d,_n_); format date monyy.; cards; 112 118 132 129 121 135 148 148 136 119 104 118 115 126 141 126 126 149 170 170 158 133 114 140 145 150 17

7、8 163 172 178 199 199 184 162 146 166 171 180 193 181 183 218 230 242 209 191 172 194 196 196 236 235 229 243 264 272 237 211 180 201 204 188 235 227 234 264 302 233 259 229 203 229 242 233 267 269 270 316 364 347 312 274 237 278 284 277 317 313 318 374 413 405 355 306 271 306 315 301 356 348 356 42

8、2 465 467 404 347 305 336 340 318 362 348 363 435 491 505 404 359 310 337 360 342 406 396 420 472 548 559 463 407 362 405 417 391 419 461 472 535 622 606 508 461 390 432;Proc print data= seriesg;run;例例2 国航客票数国航客票数(Airline)数据数据SAS的建模步骤的建模步骤 SAS建模根据建模根据BoxJenkins建模方法建模方法,主要包括三个阶段:主要包括三个阶段:模型识别阶段(包括模型定

9、阶)模型识别阶段(包括模型定阶)模型参数估计阶段(包括模型检验)模型参数估计阶段(包括模型检验)模型的预测阶段模型的预测阶段第一阶段第一阶段: 模型的识别模型的识别 平稳性模型识别平稳性模型识别首先判定时间序列数据是否为平稳随机数首先判定时间序列数据是否为平稳随机数据,据,(一)通过(一)通过时间序列数据趋势图时间序列数据趋势图判别。判别。Sas语句:语句:symbol1 i=join v=star;proc gplot data=seriesg;plot x*date=1/haxis=1jan49d to 1jan61d by year;run;(二)通过自相关函数和偏自相关函数的截(二)通

10、过自相关函数和偏自相关函数的截尾性识别模型尾性识别模型“IDENTIFY”语句语句通过通过SAS软件,运行程序如下:软件,运行程序如下:proc arima data=数据集数据集 identify var=变量名变量名 nlag=时间间隔个数时间间隔个数run; 计算出自相关系数计算出自相关系数ACF, 逆自相关系数逆自相关系数SIACF, 偏自相关系数偏自相关系数PACF和互相关系数。和互相关系数。根据样本自相关系数根据样本自相关系数ACF和偏相关系数和偏相关系数PACF的形态来识别模型类别。的形态来识别模型类别。 如果序列的样本自相关系数在如果序列的样本自相关系数在q步后截尾,则是步后截

11、尾,则是MA序列,如果偏相关系数在序列,如果偏相关系数在p步后截尾,则是步后截尾,则是AR序列。序列。如果都不截尾,只是按负指数衰减或以阻尼正弦波形式如果都不截尾,只是按负指数衰减或以阻尼正弦波形式趋于零(即是拖尾的),则应判断为趋于零(即是拖尾的),则应判断为ARMA序列,但是序列,但是不能确定阶次。不能确定阶次。 若序列的样本自相关和偏相关系数都不截尾,而且若序列的样本自相关和偏相关系数都不截尾,而且至少有一个不是拖尾,即下降趋势很慢,不能被负指数至少有一个不是拖尾,即下降趋势很慢,不能被负指数函数所控制,或是不具有下降的趋势而是周期变化,那函数所控制,或是不具有下降的趋势而是周期变化,那

12、么我们便认为序列具有增长趋势或季节性变化,是非平么我们便认为序列具有增长趋势或季节性变化,是非平稳序列。可应用提取趋势性和季节性的方法,对数据进稳序列。可应用提取趋势性和季节性的方法,对数据进行处理,就是主要通过差分等变换将非平稳序列变成一行处理,就是主要通过差分等变换将非平稳序列变成一个平稳序列。个平稳序列。非平稳序列的平稳化非平稳序列的平稳化 若序列是非平稳的,下面是通过差分变换变成一个平稳若序列是非平稳的,下面是通过差分变换变成一个平稳序列。序列。SAS的程序为一阶差分的程序为一阶差分 变量名(变量名(1) identify var=变量(变量(1) nlog=N ; run; 若一阶差

13、分是平稳的,对差分序列建模,观测若一阶差分是平稳的,对差分序列建模,观测ACF、PACF的变化趋势,初步给出的阶数。因为输入数据是序的变化趋势,初步给出的阶数。因为输入数据是序列的有限样本,所以由输入序列计算出样本自相关系数是列的有限样本,所以由输入序列计算出样本自相关系数是逼近产生序列的理论自相关系数。这意味着样本自相关系逼近产生序列的理论自相关系数。这意味着样本自相关系数不能够恰好等于任何模型的理论自相关系数,并且可能数不能够恰好等于任何模型的理论自相关系数,并且可能会具有一种或多种不同的模型的理论自相关系数相似的类会具有一种或多种不同的模型的理论自相关系数相似的类型。若一阶差分序列仍不平

14、稳,重复以上过程,(二阶差型。若一阶差分序列仍不平稳,重复以上过程,(二阶差分,三阶差分等等)直到差分序列平稳。分,三阶差分等等)直到差分序列平稳。 由于大多数时间序列是非平稳的,所以必须在进行建模之由于大多数时间序列是非平稳的,所以必须在进行建模之前,就应该把它们变换为平稳序列。前,就应该把它们变换为平稳序列。 对数变换对数变换 ylog=log(y) 差分差分 identify var=变量名(变量名(1) /1为一阶差分为一阶差分季节性也会导致非平稳,若数据是月记录序列季节性也会导致非平稳,若数据是月记录序列 identify var=数据名(数据名(12) identify var=数

15、据名(数据名(1,1)/二阶差分二阶差分 identify var=数据名(数据名(1,12) var=数据名(数据名(1,12)是当前相邻时刻的差分以及相隔)是当前相邻时刻的差分以及相隔12个时刻的差分,对于差分阶数的指定和差分间隔长度的指个时刻的差分,对于差分阶数的指定和差分间隔长度的指定是没有限制的。定是没有限制的。例例2 国航客票数国航客票数(Airline)数据数据proc arima data=seriesg; identify var=xlog(1,12) nlag=15; run; 差分不仅影响用于差分不仅影响用于IDENTIFY语句输出的语句输出的序列,而且应用于任何随后的序

16、列,而且应用于任何随后的ESTIMATE和和FORECAST语句。语句。ESTIMATE语句对差分序语句对差分序列拟模型,列拟模型,FORECAST语句预测差分并自动语句预测差分并自动把差分加起来以取消有把差分加起来以取消有IDENTIFY语句指定的语句指定的差分操作。差分操作。第一阶段第一阶段(IDENTIFY)的输出的输出描述统计量:描述统计量:N E(X) D(X) (X) 自相关系数散点图自相关系数散点图 ACF 自相关系数图表及序列的当前值和过去值的相关自相关系数图表及序列的当前值和过去值的相关程度,图中以图像的形式显示相关系数的值。程度,图中以图像的形式显示相关系数的值。偏相关系数

17、偏相关系数 PACF 与自相关系数图格式相同与自相关系数图格式相同逆自相关系数逆自相关系数 SIACF 在在ARIMA建模中,样本递自相关系数和建模中,样本递自相关系数和PACF起起大体一样的作用,但大体一样的作用,但SIACF在指出子集和季节自在指出子集和季节自回归模型时效果优于回归模型时效果优于PACF。对偶模型的自相关系数称作原模型的逆自相关系对偶模型的自相关系数称作原模型的逆自相关系数。数。BtBtWaBtBtZa白噪声检验白噪声检验卡方检验卡方检验 H0 :直到某一给定时间间隔的样本自相关系数没:直到某一给定时间间隔的样本自相关系数没有显著不为零的有显著不为零的.(Xt为白噪声,独立

18、的随机扰动)为白噪声,独立的随机扰动) 如果对所有时间间隔,该零假设成立,则没有需要如果对所有时间间隔,该零假设成立,则没有需要建模的信息,也不需要建立建模的信息,也不需要建立ARIMA模型模型. 被检查的时间间隔个数依赖于被检查的时间间隔个数依赖于=选项选项 对前对前N-2个自相关系数的检验个自相关系数的检验P值。值。 P=0.005 拒绝拒绝 H0 (拒绝为白噪声,(拒绝为白噪声,P=0时,时, Xt高度自相关)高度自相关) P=0.005 接受接受 H0 (即对所有时间间隔,自相关即对所有时间间隔,自相关系数为零,说明没有建模信息,不必要做下去了)系数为零,说明没有建模信息,不必要做下去

19、了)第二阶段:估计和诊断检验阶段第二阶段:估计和诊断检验阶段 时间序列时间序列Wt由由IDENTIFY语句识别并且由语句识别并且由ESTIMATE语句处理语句处理, 即在完成可能的模型即在完成可能的模型识别后,开始估计和诊断检查阶段识别后,开始估计和诊断检查阶段. 估计模型估计模型AR(P)estimate p=?; (根据偏相关系数的截尾点根据偏相关系数的截尾点)run;ESTIMATE语句的功能语句的功能是用模型拟合数据,并打印是用模型拟合数据,并打印出参数估计值和诊断统计量,指出模型对数据的出参数估计值和诊断统计量,指出模型对数据的拟合优度。拟合优度。ESTIMATE的输出的输出 参数估

20、计表参数估计表:估计方法:估计方法:METHOD=选择不同的估计方法(选择不同的估计方法(条件最条件最小二乘法估计小二乘法估计,极大似然估计,条件、无条件估计,极大似然估计,条件、无条件估计,线性或非线性估计)线性或非线性估计)参数估计值参数估计值(提供:估计值,标准差,提供:估计值,标准差,t比值比值)t比值比值:关于参数估计值的显著性检验(近似值)。:关于参数估计值的显著性检验(近似值)。当观测序列的长度很短,并且被估计参数的个数相对当观测序列的长度很短,并且被估计参数的个数相对于序列昌都很长时,于序列昌都很长时,t统计量的近似效果统计量的近似效果很差。很差。均值项均值项MU常数项常数项:

21、Constant Estimate 模型的常数项可以表模型的常数项可以表示为均值项示为均值项MU和自回归参数的函数。和自回归参数的函数。拟合优度统计量表拟合优度统计量表Variance Estimate 残差序列的方差残差序列的方差Std Error Estimate 方差估计值的平方根方差估计值的平方根AIC和和BIC两个信息准则两个信息准则 (贝叶斯准则)(贝叶斯准则) 其中其中L是一个近似值,以是一个近似值,以AIC的绝对值越小拟合优度越好的绝对值越小拟合优度越好.参数估计值的相关系数表参数估计值的相关系数表 判断其变量之间互线性可能影响结果的程度判断其变量之间互线性可能影响结果的程度.

22、 如果两个参数估计值高度相关如果两个参数估计值高度相关(相关系数很高相关系数很高), 可以可以考虑模型从模型中去掉一个参数对应的变量。考虑模型从模型中去掉一个参数对应的变量。AIC=-2ln(L)+2RBIC(SBC)=-2ln(L)+ln(n)R残差自相关系数的检验残差自相关系数的检验 对于残差序列的卡方检验统计量将指对于残差序列的卡方检验统计量将指明残差是否不相关,或是否包含可以被更明残差是否不相关,或是否包含可以被更复杂模型利用的附加信息。复杂模型利用的附加信息。H0:无自相关:无自相关 P值值=1jan58d;plot x*date=1 forecast*date=2 l95*date

23、=3 u95*date=3 / overlay haxis=1jan58d to 1jan62d by year; run;例例2 国航客票数国航客票数(Airline)时间序列分析时间序列分析 Data 数据集名数据集名; input x ; date=intnx(month, datamonthyear(开始时刻开始时刻),_n_-1) /注:生成周期日期值,从第一个观测日期起所需的增量数注:生成周期日期值,从第一个观测日期起所需的增量数 cards; /输入数据,输入数据,建立数据集建立数据集(至少五年观测值)。至少五年观测值)。 Run; Proc x11 data=数据集名数据集名;

24、 monthly date=date; var=变量名变量名; tables d11(最终的季节调整过的序列)最终的季节调整过的序列) /注:注:D部表格给出了各成分的终估计,表部表格给出了各成分的终估计,表d10为季节因子终估为季节因子终估计,表计,表d12为趋势起伏的终估计,表为趋势起伏的终估计,表d13为不规则项终估计,为不规则项终估计, run; / SAS软件软件X11过程的实现过程的实现先验星期权重与交易日回归先验星期权重与交易日回归 若序列分离出长期趋势以后若序列分离出长期趋势以后, 若存在星期构若存在星期构成因素的影响成因素的影响,需要对序列中进行需要对序列中进行先验星期权重先验星期权重与交易日回归分析与交易日回归分析。历法效应:历法效应:假定历法效应既有先验周期权重也有假定历法效应既有先验周期权重也有其他影响,需要同时使用以下语句:其他影响,需要同时使用以下语句:Proc x11 data=数据集名数据集名; monthly date=date tdregr=adjust; var=变量名变量名; tables a1 a4 b15 b16 c14 c15 c18 d11; pdweights mon=1 tue=1 wed=1 thu=2 fri=2 sat=2;(sun=0) ou

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论