时间序列分析讲义课件_第1页
时间序列分析讲义课件_第2页
时间序列分析讲义课件_第3页
时间序列分析讲义课件_第4页
时间序列分析讲义课件_第5页
已阅读5页,还剩207页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

时间序列分析讲义第一章时间序列分析概念第二章时间序列的预处理第三章平稳时间序列建模第四章时间序列分析实例-SAS应用目录时间序列分析讲义第一章时间序列分析概念第二章时间序列1第一章时间序列分析基本概念第一章时间序列分析基本概念2随机序列:按时间顺序排列的一组随机变量观察值序列:随机序列的个有序观察值,称之为序列长度为的观察值序列随机序列和观察值序列的关系观察值序列是随机序列的一个实现我们研究的目的是想揭示随机时序的性质实现的手段都是通过观察值序列的性质进行推断1.1时间序列的定义

第一章时间序列分析基本概念随机序列:按时间顺序排列的一组随机变量1.1时间序列的定义3时序图1.1下面是几个常见的时间序列观察值序列的点图:时序图1.1下面是几个常见的时间序列观察值序列的点图:4时序图1.2德国业余天文学家施瓦尔发现太阳黑子的活动具有11年左右的周期时序图1.2德国业余天文学家施瓦尔发现太阳黑子的活动具有115时序图1.3时序图1.36时序图1.4时序图1.47时序图1.1,该时序有明显的增长趋势,不是平稳变化的;时序图1.2,该时序变化平稳,但有明显的周期特征;时序图1.3,该时序变化平稳,无明显的周期特征;但显示各时刻序列值显然毫无关联,显示白噪声特点时序图1.4,该时序变化平稳,无明显的周期特征;无明显白噪声特点时序图1.1,该时序有明显的增长趋势,不是平稳变化的;时序图8时间序列数字特征就可以用量化的方法识别时间序列。时间序列分析方法,是根据时间序的不同特点,建立不同的模型。所以时间序列特征的识别很重要。用图形一定程度上可以识别时间序列的特征,且很直观;但是图形识别不是量化的标准,往往不够准确。因此一个量化的识别时间序列的特征的方法是必要的。时间序列数字特征就可以用量化的方法识别时间91.2时间序列的数字特征均值函数

方差函数自协方差函数自相关函数1.2时间序列的数字特征均值函数10时间序列的数字特征包含了时间序列的重要信息,时间序列分析方法正是通过对分析时间序列的数字特征,来分析时序的特性,并由此确定对于该序列建立什么样的模型.我们根据时间序列的数字特征可以将时间序列分类:时间序列的数字特征包含了时间序列的重要信111.3随机序列的几种类型满足如下条件的序列称为平稳时间序列:注1:平稳时间序列的均值是常数,序列没有有明显的趋势

时序图1.2、1.3、1.4都符合是平稳序列特征时序图1.1是非平稳序列注2:没有周期性的平稳时间序列,一般有:即间隔时间很长时,则相关性趋弱。1.3随机序列的几种类型满足如下条件的序列称为平稳时间序列12满足下列条件的随机序列称为白噪声序列,也称为纯随机序列:注1:白噪声序列也是平稳时间序列中的特例.注2:由于白噪声序列不同时刻的值相互独立,那么这样的序列数值不能对于将来进行推断与预测,所以白噪声是不能建立模型的。时序图1.3符合白噪声序列特征满足下列条件的随机序列称为白噪声序列,也称为纯随机序列:注113若满足时间序列满足:称该时间序列是周期为T的时间序列.注1:若时间序列是周期为T的时间序列,则其均值函数和自相关函数都是周期的,T为其周期。

时序图1.2符合周期序列特征若满足时间序列满足:称该时间序列是周期为T的时间序列.注14

实际中我们得不到一个时间序列的完整性信息,因此不能计算理论均值和自相关函数。但我们能获取时间序列的一个样本,因此我们需要根据样本来计算样本的均值和样本自相关函数。实际中我们得不到一个时间序列的完整性信息,因此不能计算理15

1.4时间序列的样本均值与样本自相关函数

假设已经得到了时间序列的一段样本观察值,其中称为样本长度。时间序列的样本均值:样本自相关函数:其中:

后面,我们是通过样本的数字特征对于时间序列进行识别和建模的。1.4时间序列的样本均值与样本自相关函数假设已经得到16时间序列分析常用软件S-plus,Matlab,Gauss,TSP,Eviews和SAS推荐软件——SAS在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势

1.5时间序列分析软件时间序列分析常用软件1.5时间序列分析软件17时间序列分析方法,是对非白噪声且无周期性的的平稳时间序列直接建立模型的。1、做纯随机性检验,3、进行周期识别。若有周期,消除周期性。因此在建模之前需要做的预处理:若是纯随机性序列,终止建模。---得到非纯随机的无周期平稳时间序列数据,用于建模。2、对时间序列做平稳性检验,

若非平稳,需做平稳化处理。时间序列分析方法,是对非白噪声且无周期性18第二章时间序列的预处理原假设:延迟期数不超过期的序列值之间相互独立检验统计量

,则拒绝原假设,认为该序列为非出随机序列,可以建模。认为序列为纯随机序列,,则接受原假设2.1纯随机性检验

终止建模第二章时间序列的预处理原假设:延迟期数不超过期的19例2.1:对于下面序列进行纯随机性检验样本自相关图例2.1:对于下面序列进行纯随机性检验样本自相关图20检验结果延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以不能拒绝该序列纯随机的原假设。认为该序列是纯随机的,建模终止。检验结果延迟统计量检验统计量值P值延迟6期2.360.88321例2.2对1950年——1998年北京市城乡居民定期储蓄所占比例的纯随机性进行检验

例2.2时序图例2.2对1950年——1998年北京市城乡居民定期储蓄所22例2.2白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.46<0.00011282.57<0.0001由于P值显著小于显著性水平

,所以拒绝该序列为纯随机性的原假设。认为该序列不是纯随机的序列,可以建摸。例2.2白噪声检验结果LB统计量检验LB检验统计量的值P值6232.4周期性检验时序图形或值,观察有无周期特征。如果一个时间序列周期为T,则做T步差分,周期性的消除办法:可消除周期性。2.4周期性检验时序图形或值,观察有无周期特242.2平稳性的检验时序图检验

根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势也可以通过值序列是否平稳有无趋势,事实上,当不趋于0或不能很快地趋于0时,即可判断非平稳(参看第3章,平稳的性质)。2.2平稳性的检验时序图检验也可以通过值序25例题例2.3检验1964年—1999年中国纱年产量序列的平稳性例2.4检验1962年1月—1975年12月平均每头奶牛月产奶量序列的平稳性例2.5检验1949年—1998年北京市每年最高气温序列的平稳性(以上原始数据略)例题例2.3检验1964年—1999年中国纱年产量序列的平稳26例2.3时序图例2.3时序图27例2.3自相关图例2.3自相关图28例2.4时序图例2.4时序图29例2.4

自相关图例2.4自相关图30例2.5时序图例2.5时序图31例2.5自相关图例2.5自相关图32例2.3时序为非平稳的,有趋势;例2.4时序非平稳性,有趋势例2.5时序是一个平稳的例2.3时序为非平稳的,有趋势;33非平稳性序列的平稳化对于一个非平稳时间序列,若存在一阶趋势,则用一阶差分可变平稳:若存在二阶趋势,则用二阶差分可变平稳:一阶差分二阶差分非平稳性序列的平稳化对于一个非平稳时间序列,若存34若引入延迟算子B,定义:这样差分运算可以用延迟算子表示:注:延迟算子B具有线性运算。P阶差分:K步差分算子:一阶差分算子:若引入延迟算子B,定义:这样差分运算可以用延迟算子表示:注:35第三章平稳时间序列建模3.1平稳时间序列的模型一个无周期,非白噪声的平稳时间序列的一般可以建立如下模型:这个模型称为P阶自回归q阶移动平均的模型,也称ARMA模型,简记第三章平稳时间序列建模3.1平稳时间序列的模型一个无周36特别:称为P阶自回归模型,也称AR模型,简记称为q阶移动平均模型,也称MA模型,简记特别:称为P阶自回归模型,也称AR模型,简记称为q阶移动平均37利用延迟算子B:模型可以简记为:其中为均值,且有分别称为P阶自回归因子和q阶移动平均因子或简记为:利用延迟算子B:模型可以简记为:其中为均值,且有分别称38偏自相关函数定义对于平稳AR(p)序列,所谓滞后k偏自相关函数就是指在给定中间k-1个随机变量的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,对影响的相关度量,滞后k偏自相关函数实际上就等于k阶自回归模型第个k回归系数的值。3.2三种模型的性质为了进一步识别模型,还需要引入另外一个重要数字特征—偏相关函数。偏自相关函数定义滞后k偏自相关函数实际上就等于k阶自回归模型39滞后k偏自相关函数可由下式计算:

样本偏自相关函数可由得到滞后k偏自相关函数可由下式计算:

样本偏自相关函数40ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖413.3ARMA模型的识别、定阶因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与都会衰减至零值附近作小值波动当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?

3.3ARMA模型的识别、定阶因为由于样本的随机性,样本的42定理,对于MA(q)模型,定理,对于AR(p)模型,定理,对于MA(q)模型,定理,对于AR(p)模型,43模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。模型定阶的经验方法44序列自相关图例3.1(例2.2续)选择合适的模型ARMA拟合1950年——1998年北京市城乡居民定期储蓄比例序列。

序列自相关图例3.1(例2.2续)选择合适的模型ARM45序列偏自相关图序列偏自相关图46拟合模型识别:自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾

偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾

所以可以考虑拟合模型为AR(1)拟合模型识别:自相关图显示延迟3阶之后,自相关系数全部衰减到47例3.2

美国科罗拉多州某一加油站连续57天的OVERSHORT序列

序列图例3.2美国科罗拉多州某一加油站连续57天的OVERS48序列自相关图序列自相关图49序列偏自相关图序列偏自相关图50拟合模型识别:自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾偏自相关系数显示出典型非截尾的性质。综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1)

拟合模型识别:自相关图显示除了延迟1阶的自相关系数在2倍标准51例3.31880-1985全球气表平均温度改变值差分序列

例3.31880-1985全球气表平均温度改变值差分序列52序列自相关图序列自相关图53序列偏自相关图序列偏自相关图54拟合模型识别:自相关系数显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可以尝试使用ARMA(1,1)、MA(1)模型拟合该序列拟合模型识别:自相关系数显示出不截尾的性质55问题:当同一个序列有两个模型都有效,或者几个模型特征都不够明确,那么到底该选择哪个模型?

解决办法确定适当的比较准则,构造适当的统计量,确定相对最优或者问题:当同一个序列有两个模型都有效,或者几个模型特征都不够明56AIC统计量选择标准:AIC越小越好AIC准则BIC统计量选择标准:BIC越小越好BIC准则AIC统计量AIC准则BIC统计量BIC准则573.4ARMA模型的参数估计(略)3.4ARMA模型的参数估计(略)583.5模型的检验(1)模型的显著性检验目的检验模型的有效性(对信息的提取是否充分)检验对象残差序列判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列

反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效3.5模型的检验(1)模型的显著性检验目的59例3.4(例2.2续)检验1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性

残差白噪声序列检验结果延迟阶数QLB统计量P值检验结论65.830.32291210.280.50501811.380.8361由于P值大于0.05,接受原假设,认为残差为白噪声,拟合模型显著有效例3.4(例2.2续)检验1950年——1998年北京市城乡60(2)参数显著性检验目的检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简

假设条件检验统计量(2)参数显著性检验目的61例3.5(续例3.2)对OVERSHORTS序列的拟合模型进行检验

残差白噪声检验结论:P值大于0.05,接受原假设,认为残差为白噪声,模型显著有效参数显著性检验检验参数t统计量P值结论均值-3.75<0.000410.60<0.0001延迟阶数QLB统计量P值结论63.150.6772129.050.6171结论:P值小于0.05,拒绝原假设,认为各系数显著非零,各系数显著有效例3.5(续例3.2)对OVERSHORTS序列的拟合模型进623.6预测线性预测函数预测方差最小原则采用线性和方差最小原则3.6预测线性预测函数采用线性和方差最小原则63建模步骤时间序列图计算样本相关系数偏相关系数模型识别参数估计模型检验序列预测YN建模步骤时模型参数模型序YN64若为非周期平稳时间序列,则对其建立若经d阶差分后,建立了模型;则称对建立了模型。若周期为T,对经T步差分后,建立了模型,则称对建立了季节模型。说明:模型;若为非周期平稳时间序列,则对其建65第4章ARIMA实例分析第4章ARIMA实例分析66例4-1:1867-1938年英国绵羊数量,预测1939-1943年绵羊数量?tx18672203186823601869225418702165187120241872207818732214187422921875220718762119……例4-1:1867-1938年英国绵羊数量,预测1939-167第一步:时序图做平稳性的初步判定图1时序图建模步骤从图1可以得到,该序列是不是明显的平稳,稍有趋势(可以考虑一阶差分),但也可结合数字特征进一步判别。第一步:时序图做平稳性的初步判定图1时序图建模步骤68第二步:白噪声检验图2序列白噪声检验图建立模型前先进行进行白噪声检验。如图5所示。QLB(6)、QLB(12)、QLB(18)的p均小于0.05,所以表明该序列不是白噪声序列;可以建模。第二步:白噪声检验图2序列白噪声检验图建立模69第三步:平稳性识别及定阶图5差分后的序列白噪声检验图图3自相关图第三步:平稳性识别及定阶图5差分后的序列白噪声检验图图3自相70图4偏相关图偏相关在3步之后小于3个标准差,可以认为截尾,所以选择AR(3)图4偏相关图偏相关在3步之后小于3个标准差,可以认为截尾,所71第四步:模型参数估计及模型检验图5显示:各检验的P值小于0.05,所以各显著有效。图6显示:残差白噪声检验的P值大于0.05,认为残差不白噪声,模型显著有效。图5模型参数检验图图6残差白噪声检验图第四步:模型参数估计及模型检验图5显示:各检验的P值小于0.72拟合模型的形式:第五步:拟合模型的具体形式或:图7拟合模型拟合模型的形式:第五步:拟合模型的具体形式或:图7拟合模73第六步:预测我们预测5步:1939、1940、1941、1942、1943年绵羊数量。由于输出的结果不是整数,我们可以将其四舍五入。图8预测值第六步:预测我们预测5步:1939、194074(实线为预测值,虚线为置信系数95%的置信上下限)图9拟合效果图(实线为预测值,虚线为置信系数95%的置信上下限)图9拟75dataexample1;/*建立数据*/inputtx;/*输入变量t和x*/cards;/*告诉SAS,下面数数据*/1867 2203/*输入t和x的数据*/1868 23601869 22541870 2165……..1938 1791;1.建立数据例4-1的SAS命令解读dataexample1;/*建立数据*/1.建立数据例476procgplot;/*画x和t的图x是纵坐标,t是横坐标*/plotx*t;symbol1C=blackI=joinV=dot;run;C:表示图形的颜色,如C=black、red等;I:表示观察值之间连线的方式,如jion(线性连接)、spline(光滑连接)V:表示观察值的图形,如dot(点)、star(星号)run:表示程序写好,可以运行了。2.画图procgplot;/*画x和t的图x是纵坐标,t是横坐77procarimadata=example1;identifyvar=x;run;procarimadata=example1:告诉SAS,下面对数据

集example1中的数据进行ARIMA建模;identifyvar=x;对于变量x某些重要的信息

进行识别。它会给出五方便的信息:

(1)变量的描述性统计

(2)样本自相关图(3)样本偏自相关图(4)样本逆自相关图(5)白噪声检验

3.模型识别与定阶procarimadata=example1;proc78procarimadata=example1;identifyvar=x;estimatep=3method=CLS;run;Estimate:告诉SAS下面是参数估计的设置

p=3:表示拟合AR(3)Method=CLS/ML/ULS:CLS是条件最小二乘法(默认)、ML是极大似然、ULS是最小二乘估计4.估计procarimadata=example1;Estim79procarimadata=example1;identifyvar=x;estimate3;forecastlead=5id=tout=results;run;Forecast:告诉SAS下面是预测的设置;Lead=5:表示预测5步;Id=t:表示身份标示;Out=results:标示将预测值存在数据集results中5.预测procarimadata=example1;Forec80procgplotdata=results;plotx*t=1forecast*t=2l95*t=3u95*t=3/overlay;symbol1c=blacki=noneV=star;symbol2c=redi=jointV=none;symbol3c=greeni=jointV=nonel=32;run;6.拟合效果图Data=results:利用results数据集的变量画图;Forecast:预测值L95:下95%的值U95:上95%的值procgplotdata=results;6.拟合效果81例4-2有趋势的ARIMA1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80对于下面时序数据建模并作5期预测。例4-2有趋势的ARIMA1.05-0.84-1.482dataex4_2;inputx@@;t=_n_;cards;1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80;Run;分析步骤1:建立数据dataex4_2;分析步骤1:建立数据83proc

gplot

data=ex4_2;plot

x*t;symbol

v=starc=greeni=join;run;时序图可以得到,该序列是不是明显的平稳,稍有趋势(可以考虑一阶差分),但也可结合数字特征进一步判别。分析步骤2:图形初步判别平稳性procgplotdata=ex4_2;时序图可以得到84proc

arima;identify

var=x;run;分析步骤3:白噪声检验、模型识别序列白噪声检验显示:,可以建模序列白噪声检验图procarima;分析步骤3:白噪声检验、模型识别序列白85X的自相关函数图X的自相关函数图86X的偏相关函数图初选模型MA(4),或AR(5)X的偏相关函数图初选模型MA(4),或AR(5)87proc

arima;identify

var=xminic

p=(0:5)q=(0:5);run;分析步骤4:例用BIC帮助识别模型根据BIC选择为AR(5)模型模型的BICprocarima;分析步骤4:例用BIC帮助识别模型根88拟合AR(5)estimate

P=5;estimateP=5noint;

run;

残差白噪声检验通过分析步骤5:模型参数估计及检验拟合AR(5)estimateP=5;残差白噪声检验通过89均值,2、3、4、5系数都检验都不显著。均值,2、3、4、5系数都检验都不显著。90再尝试AR(1)estimate

P=1;estimateP=1;noint;

run;

残差白噪声检验不通过残差白噪声检验:再尝试AR(1)estimateP=1;残差白噪声检验不91estimate

q=4;estimate

q=4noint;

run;

尝试拟合MA(4):没有通过白噪声检验,模型不通过。estimateq=4;尝试拟合MA(4):没有通过白噪92data

ex4_2;input

x@@;dx=dif(x);t=_n_;cards;1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80;proc

gplotdata=ex4_2;plotx*tdx*t;symbol

v=starc=greeni=join;run;proc

arima;identify

var=x(1);run;分析步骤6:差分,重新识别模型dataex4_2;inputx@@;dx=dif(x)93一阶差分序列的自相关图一阶差分序列的自相关图94识别P=1,即为ARIMA(1,1,0)一阶差分序列的偏相关图识别P=1,即为ARIMA(1,1,0)一阶差分序列的偏相关95时间序列分析讲义96时间序列分析讲义97时间序列分析讲义98分析步骤7:参数估计及模型诊断proc

arimadata=ex4_2;identify

var=x(1);estimate

p=1;run;拟合ARIMA(1,1,0)模型:分析步骤7:参数估计及模型诊断procarimadat99残差白噪声检验通过均值参数不显著残差白噪声检验通过均值参数不显著100proc

arimadata=ex4_2;identify

var=x(1);estimate

p=1noint;run;拟合不带常数项的ARIMA(1,1,0)模型:procarimadata=ex4_2;拟合不带常数项的101参数及模型检验均通过,确定模型为ARIMA(1,1,0)参数及模型检验均通过,确定模型为ARIMA(1,1,0)102拟合模型为:即:或等价记为:拟合模型为:即:或等价记为:103步骤8:对时序做5期预测arimadata=ex4_2;identify

var=x(1);estimate

p=1noint;forecast

lead=5

id=t;run;5期预测结果:步骤8:对时序做5期预测arimadata=ex4_2;104data

ex4_2;inputx@@;dx=dif(x);t=_n_;cards;1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80;proc

gplotdata=ex4_2;plotx*tdx*t;symbol

v=starc=greeni=join;run;proc

arima;identify

var=x(1);estimate

p=1noint;forecast

lead=5

id=t;run;例4-2的完整程序:dataex4_2;例4-2的完整程序:105另附我找到的SAS教介绍的网址,不限于此,同学们需要时可以再搜素。

/view/ee1edbeae009581b6bd9eb5f.html/view/8d9c8acf5fbfc77da269b17e.htmlhttp:///view/264c78785acfa1c7aa00cc0c.html###http:///view/ddbf4c66caaedd3383c4d33b.html另附我找到的SAS教介绍的网址,不限于此,同学们需要时可以再106时间序列分析讲义第一章时间序列分析概念第二章时间序列的预处理第三章平稳时间序列建模第四章时间序列分析实例-SAS应用目录时间序列分析讲义第一章时间序列分析概念第二章时间序列107第一章时间序列分析基本概念第一章时间序列分析基本概念108随机序列:按时间顺序排列的一组随机变量观察值序列:随机序列的个有序观察值,称之为序列长度为的观察值序列随机序列和观察值序列的关系观察值序列是随机序列的一个实现我们研究的目的是想揭示随机时序的性质实现的手段都是通过观察值序列的性质进行推断1.1时间序列的定义

第一章时间序列分析基本概念随机序列:按时间顺序排列的一组随机变量1.1时间序列的定义109时序图1.1下面是几个常见的时间序列观察值序列的点图:时序图1.1下面是几个常见的时间序列观察值序列的点图:110时序图1.2德国业余天文学家施瓦尔发现太阳黑子的活动具有11年左右的周期时序图1.2德国业余天文学家施瓦尔发现太阳黑子的活动具有11111时序图1.3时序图1.3112时序图1.4时序图1.4113时序图1.1,该时序有明显的增长趋势,不是平稳变化的;时序图1.2,该时序变化平稳,但有明显的周期特征;时序图1.3,该时序变化平稳,无明显的周期特征;但显示各时刻序列值显然毫无关联,显示白噪声特点时序图1.4,该时序变化平稳,无明显的周期特征;无明显白噪声特点时序图1.1,该时序有明显的增长趋势,不是平稳变化的;时序图114时间序列数字特征就可以用量化的方法识别时间序列。时间序列分析方法,是根据时间序的不同特点,建立不同的模型。所以时间序列特征的识别很重要。用图形一定程度上可以识别时间序列的特征,且很直观;但是图形识别不是量化的标准,往往不够准确。因此一个量化的识别时间序列的特征的方法是必要的。时间序列数字特征就可以用量化的方法识别时间1151.2时间序列的数字特征均值函数

方差函数自协方差函数自相关函数1.2时间序列的数字特征均值函数116时间序列的数字特征包含了时间序列的重要信息,时间序列分析方法正是通过对分析时间序列的数字特征,来分析时序的特性,并由此确定对于该序列建立什么样的模型.我们根据时间序列的数字特征可以将时间序列分类:时间序列的数字特征包含了时间序列的重要信1171.3随机序列的几种类型满足如下条件的序列称为平稳时间序列:注1:平稳时间序列的均值是常数,序列没有有明显的趋势

时序图1.2、1.3、1.4都符合是平稳序列特征时序图1.1是非平稳序列注2:没有周期性的平稳时间序列,一般有:即间隔时间很长时,则相关性趋弱。1.3随机序列的几种类型满足如下条件的序列称为平稳时间序列118满足下列条件的随机序列称为白噪声序列,也称为纯随机序列:注1:白噪声序列也是平稳时间序列中的特例.注2:由于白噪声序列不同时刻的值相互独立,那么这样的序列数值不能对于将来进行推断与预测,所以白噪声是不能建立模型的。时序图1.3符合白噪声序列特征满足下列条件的随机序列称为白噪声序列,也称为纯随机序列:注1119若满足时间序列满足:称该时间序列是周期为T的时间序列.注1:若时间序列是周期为T的时间序列,则其均值函数和自相关函数都是周期的,T为其周期。

时序图1.2符合周期序列特征若满足时间序列满足:称该时间序列是周期为T的时间序列.注120

实际中我们得不到一个时间序列的完整性信息,因此不能计算理论均值和自相关函数。但我们能获取时间序列的一个样本,因此我们需要根据样本来计算样本的均值和样本自相关函数。实际中我们得不到一个时间序列的完整性信息,因此不能计算理121

1.4时间序列的样本均值与样本自相关函数

假设已经得到了时间序列的一段样本观察值,其中称为样本长度。时间序列的样本均值:样本自相关函数:其中:

后面,我们是通过样本的数字特征对于时间序列进行识别和建模的。1.4时间序列的样本均值与样本自相关函数假设已经得到122时间序列分析常用软件S-plus,Matlab,Gauss,TSP,Eviews和SAS推荐软件——SAS在SAS系统中有一个专门进行计量经济与时间序列分析的模块:SAS/ETS。SAS/ETS编程语言简洁,输出功能强大,分析结果精确,是进行时间序列分析与预测的理想的软件由于SAS系统具有全球一流的数据仓库功能,因此在进行海量数据的时间序列分析时它具有其它统计软件无可比拟的优势

1.5时间序列分析软件时间序列分析常用软件1.5时间序列分析软件123时间序列分析方法,是对非白噪声且无周期性的的平稳时间序列直接建立模型的。1、做纯随机性检验,3、进行周期识别。若有周期,消除周期性。因此在建模之前需要做的预处理:若是纯随机性序列,终止建模。---得到非纯随机的无周期平稳时间序列数据,用于建模。2、对时间序列做平稳性检验,

若非平稳,需做平稳化处理。时间序列分析方法,是对非白噪声且无周期性124第二章时间序列的预处理原假设:延迟期数不超过期的序列值之间相互独立检验统计量

,则拒绝原假设,认为该序列为非出随机序列,可以建模。认为序列为纯随机序列,,则接受原假设2.1纯随机性检验

终止建模第二章时间序列的预处理原假设:延迟期数不超过期的125例2.1:对于下面序列进行纯随机性检验样本自相关图例2.1:对于下面序列进行纯随机性检验样本自相关图126检验结果延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以不能拒绝该序列纯随机的原假设。认为该序列是纯随机的,建模终止。检验结果延迟统计量检验统计量值P值延迟6期2.360.883127例2.2对1950年——1998年北京市城乡居民定期储蓄所占比例的纯随机性进行检验

例2.2时序图例2.2对1950年——1998年北京市城乡居民定期储蓄所128例2.2白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.46<0.00011282.57<0.0001由于P值显著小于显著性水平

,所以拒绝该序列为纯随机性的原假设。认为该序列不是纯随机的序列,可以建摸。例2.2白噪声检验结果LB统计量检验LB检验统计量的值P值61292.4周期性检验时序图形或值,观察有无周期特征。如果一个时间序列周期为T,则做T步差分,周期性的消除办法:可消除周期性。2.4周期性检验时序图形或值,观察有无周期特1302.2平稳性的检验时序图检验

根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势也可以通过值序列是否平稳有无趋势,事实上,当不趋于0或不能很快地趋于0时,即可判断非平稳(参看第3章,平稳的性质)。2.2平稳性的检验时序图检验也可以通过值序131例题例2.3检验1964年—1999年中国纱年产量序列的平稳性例2.4检验1962年1月—1975年12月平均每头奶牛月产奶量序列的平稳性例2.5检验1949年—1998年北京市每年最高气温序列的平稳性(以上原始数据略)例题例2.3检验1964年—1999年中国纱年产量序列的平稳132例2.3时序图例2.3时序图133例2.3自相关图例2.3自相关图134例2.4时序图例2.4时序图135例2.4

自相关图例2.4自相关图136例2.5时序图例2.5时序图137例2.5自相关图例2.5自相关图138例2.3时序为非平稳的,有趋势;例2.4时序非平稳性,有趋势例2.5时序是一个平稳的例2.3时序为非平稳的,有趋势;139非平稳性序列的平稳化对于一个非平稳时间序列,若存在一阶趋势,则用一阶差分可变平稳:若存在二阶趋势,则用二阶差分可变平稳:一阶差分二阶差分非平稳性序列的平稳化对于一个非平稳时间序列,若存140若引入延迟算子B,定义:这样差分运算可以用延迟算子表示:注:延迟算子B具有线性运算。P阶差分:K步差分算子:一阶差分算子:若引入延迟算子B,定义:这样差分运算可以用延迟算子表示:注:141第三章平稳时间序列建模3.1平稳时间序列的模型一个无周期,非白噪声的平稳时间序列的一般可以建立如下模型:这个模型称为P阶自回归q阶移动平均的模型,也称ARMA模型,简记第三章平稳时间序列建模3.1平稳时间序列的模型一个无周142特别:称为P阶自回归模型,也称AR模型,简记称为q阶移动平均模型,也称MA模型,简记特别:称为P阶自回归模型,也称AR模型,简记称为q阶移动平均143利用延迟算子B:模型可以简记为:其中为均值,且有分别称为P阶自回归因子和q阶移动平均因子或简记为:利用延迟算子B:模型可以简记为:其中为均值,且有分别称144偏自相关函数定义对于平稳AR(p)序列,所谓滞后k偏自相关函数就是指在给定中间k-1个随机变量的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,对影响的相关度量,滞后k偏自相关函数实际上就等于k阶自回归模型第个k回归系数的值。3.2三种模型的性质为了进一步识别模型,还需要引入另外一个重要数字特征—偏相关函数。偏自相关函数定义滞后k偏自相关函数实际上就等于k阶自回归模型145滞后k偏自相关函数可由下式计算:

样本偏自相关函数可由得到滞后k偏自相关函数可由下式计算:

样本偏自相关函数146ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖1473.3ARMA模型的识别、定阶因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与都会衰减至零值附近作小值波动当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?

3.3ARMA模型的识别、定阶因为由于样本的随机性,样本的148定理,对于MA(q)模型,定理,对于AR(p)模型,定理,对于MA(q)模型,定理,对于AR(p)模型,149模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。截尾阶数为d。模型定阶的经验方法150序列自相关图例3.1(例2.2续)选择合适的模型ARMA拟合1950年——1998年北京市城乡居民定期储蓄比例序列。

序列自相关图例3.1(例2.2续)选择合适的模型ARM151序列偏自相关图序列偏自相关图152拟合模型识别:自相关图显示延迟3阶之后,自相关系数全部衰减到2倍标准差范围内波动,这表明序列明显地短期相关。但序列由显著非零的相关系数衰减为小值波动的过程相当连续,相当缓慢,该自相关系数可视为不截尾

偏自相关图显示除了延迟1阶的偏自相关系数显著大于2倍标准差之外,其它的偏自相关系数都在2倍标准差范围内作小值随机波动,而且由非零相关系数衰减为小值波动的过程非常突然,所以该偏自相关系数可视为一阶截尾

所以可以考虑拟合模型为AR(1)拟合模型识别:自相关图显示延迟3阶之后,自相关系数全部衰减到153例3.2

美国科罗拉多州某一加油站连续57天的OVERSHORT序列

序列图例3.2美国科罗拉多州某一加油站连续57天的OVERS154序列自相关图序列自相关图155序列偏自相关图序列偏自相关图156拟合模型识别:自相关图显示除了延迟1阶的自相关系数在2倍标准差范围之外,其它阶数的自相关系数都在2倍标准差范围内波动。根据这个特点可以判断该序列具有短期相关性,进一步确定序列平稳。同时,可以认为该序列自相关系数1阶截尾偏自相关系数显示出典型非截尾的性质。综合该序列自相关系数和偏自相关系数的性质,为拟合模型定阶为MA(1)

拟合模型识别:自相关图显示除了延迟1阶的自相关系数在2倍标准157例3.31880-1985全球气表平均温度改变值差分序列

例3.31880-1985全球气表平均温度改变值差分序列158序列自相关图序列自相关图159序列偏自相关图序列偏自相关图160拟合模型识别:自相关系数显示出不截尾的性质偏自相关系数也显示出不截尾的性质综合该序列自相关系数和偏自相关系数的性质,可以尝试使用ARMA(1,1)、MA(1)模型拟合该序列拟合模型识别:自相关系数显示出不截尾的性质161问题:当同一个序列有两个模型都有效,或者几个模型特征都不够明确,那么到底该选择哪个模型?

解决办法确定适当的比较准则,构造适当的统计量,确定相对最优或者问题:当同一个序列有两个模型都有效,或者几个模型特征都不够明162AIC统计量选择标准:AIC越小越好AIC准则BIC统计量选择标准:BIC越小越好BIC准则AIC统计量AIC准则BIC统计量BIC准则1633.4ARMA模型的参数估计(略)3.4ARMA模型的参数估计(略)1643.5模型的检验(1)模型的显著性检验目的检验模型的有效性(对信息的提取是否充分)检验对象残差序列判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列

反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效3.5模型的检验(1)模型的显著性检验目的165例3.4(例2.2续)检验1950年——1998年北京市城乡居民定期储蓄比例序列拟合模型的显著性

残差白噪声序列检验结果延迟阶数QLB统计量P值检验结论65.830.32291210.280.50501811.380.8361由于P值大于0.05,接受原假设,认为残差为白噪声,拟合模型显著有效例3.4(例2.2续)检验1950年——1998年北京市城乡166(2)参数显著性检验目的检验每一个未知参数是否显著非零。删除不显著参数使模型结构最精简

假设条件检验统计量(2)参数显著性检验目的167例3.5(续例3.2)对OVERSHORTS序列的拟合模型进行检验

残差白噪声检验结论:P值大于0.05,接受原假设,认为残差为白噪声,模型显著有效参数显著性检验检验参数t统计量P值结论均值-3.75<0.000410.60<0.0001延迟阶数QLB统计量P值结论63.150.6772129.050.6171结论:P值小于0.05,拒绝原假设,认为各系数显著非零,各系数显著有效例3.5(续例3.2)对OVERSHORTS序列的拟合模型进1683.6预测线性预测函数预测方差最小原则采用线性和方差最小原则3.6预测线性预测函数采用线性和方差最小原则169建模步骤时间序列图计算样本相关系数偏相关系数模型识别参数估计模型检验序列预测YN建模步骤时模型参数模型序YN170若为非周期平稳时间序列,则对其建立若经d阶差分后,建立了模型;则称对建立了模型。若周期为T,对经T步差分后,建立了模型,则称对建立了季节模型。说明:模型;若为非周期平稳时间序列,则对其建171第4章ARIMA实例分析第4章ARIMA实例分析172例4-1:1867-1938年英国绵羊数量,预测1939-1943年绵羊数量?tx18672203186823601869225418702165187120241872207818732214187422921875220718762119……例4-1:1867-1938年英国绵羊数量,预测1939-1173第一步:时序图做平稳性的初步判定图1时序图建模步骤从图1可以得到,该序列是不是明显的平稳,稍有趋势(可以考虑一阶差分),但也可结合数字特征进一步判别。第一步:时序图做平稳性的初步判定图1时序图建模步骤174第二步:白噪声检验图2序列白噪声检验图建立模型前先进行进行白噪声检验。如图5所示。QLB(6)、QLB(12)、QLB(18)的p均小于0.05,所以表明该序列不是白噪声序列;可以建模。第二步:白噪声检验图2序列白噪声检验图建立模175第三步:平稳性识别及定阶图5差分后的序列白噪声检验图图3自相关图第三步:平稳性识别及定阶图5差分后的序列白噪声检验图图3自相176图4偏相关图偏相关在3步之后小于3个标准差,可以认为截尾,所以选择AR(3)图4偏相关图偏相关在3步之后小于3个标准差,可以认为截尾,所177第四步:模型参数估计及模型检验图5显示:各检验的P值小于0.05,所以各显著有效。图6显示:残差白噪声检验的P值大于0.05,认为残差不白噪声,模型显著有效。图5模型参数检验图图6残差白噪声检验图第四步:模型参数估计及模型检验图5显示:各检验的P值小于0.178拟合模型的形式:第五步:拟合模型的具体形式或:图7拟合模型拟合模型的形式:第五步:拟合模型的具体形式或:图7拟合模179第六步:预测我们预测5步:1939、1940、1941、1942、1943年绵羊数量。由于输出的结果不是整数,我们可以将其四舍五入。图8预测值第六步:预测我们预测5步:1939、1940180(实线为预测值,虚线为置信系数95%的置信上下限)图9拟合效果图(实线为预测值,虚线为置信系数95%的置信上下限)图9拟181dataexample1;/*建立数据*/inputtx;/*输入变量t和x*/cards;/*告诉SAS,下面数数据*/1867 2203/*输入t和x的数据*/1868 23601869 22541870 2165……..1938 1791;1.建立数据例4-1的SAS命令解读dataexample1;/*建立数据*/1.建立数据例4182procgplot;/*画x和t的图x是纵坐标,t是横坐标*/plotx*t;symbol1C=blackI=joinV=dot;run;C:表示图形的颜色,如C=black、red等;I:表示观察值之间连线的方式,如jion(线性连接)、spline(光滑连接)V:表示观察值的图形,如dot(点)、star(星号)run:表示程序写好,可以运行了。2.画图procgplot;/*画x和t的图x是纵坐标,t是横坐183procarimadata=example1;identifyvar=x;run;procarimadata=example1:告诉SAS,下面对数据

集example1中的数据进行ARIMA建模;identifyvar=x;对于变量x某些重要的信息

进行识别。它会给出五方便的信息:

(1)变量的描述性统计

(2)样本自相关图(3)样本偏自相关图(4)样本逆自相关图(5)白噪声检验

3.模型识别与定阶procarimadata=example1;proc184procarimadata=example1;identifyvar=x;estimatep=3method=CLS;run;Estimate:告诉SAS下面是参数估计的设置

p=3:表示拟合AR(3)Method=CLS/ML/ULS:CLS是条件最小二乘法(默认)、ML是极大似然、ULS是最小二乘估计4.估计procarimadata=example1;Estim185procarimadata=example1;identifyvar=x;estimate3;forecastlead=5id=tout=results;run;Forecast:告诉SAS下面是预测的设置;Lead=5:表示预测5步;Id=t:表示身份标示;Out=results:标示将预测值存在数据集results中5.预测procarimadata=example1;Forec186procgplotdata=results;plotx*t=1forecast*t=2l95*t=3u95*t=3/overlay;symbol1c=blacki=noneV=star;symbol2c=redi=jointV=none;symbol3c=greeni=jointV=nonel=32;run;6.拟合效果图Data=results:利用results数据集的变量画图;Forecast:预测值L95:下95%的值U95:上95%的值procgplotdata=results;6.拟合效果187例4-2有趋势的ARIMA1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80对于下面时序数据建模并作5期预测。例4-2有趋势的ARIMA1.05-0.84-1.4188dataex4_2;inputx@@;t=_n_;cards;1.05-0.84-1.420.202.816.725.404.385.524.462.89-0.43-4.86-8.54-11.54-16.22-19.41-21.61-22.51-23.51-24.49-25.54-24.06-23.44-23.41-24.17-21.58-19.00-14.14-12.69-9.48-10.29-9.88-8.33-4.67-2.97-2.91-1.86-1.91-0.80;Run;分析步骤1:建立数据dataex4_2;分析步骤1:建立数据189proc

gplot

data=ex4_2;plot

x*t;symbol

v=starc=greeni=join;run;时序图可以得到,该序列是不是明显的平稳,稍有趋势(可以考虑一阶差分),但也可结合数字特征进一步判别。分析步骤2:图形初步判

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论