从数据到结论(人民大学吴喜之教授)12时间序列分析_第1页
从数据到结论(人民大学吴喜之教授)12时间序列分析_第2页
从数据到结论(人民大学吴喜之教授)12时间序列分析_第3页
从数据到结论(人民大学吴喜之教授)12时间序列分析_第4页
从数据到结论(人民大学吴喜之教授)12时间序列分析_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、时间序列分析时间序列分析横截面数据时间序列数据横截面数据时间序列数据 人们对统计数据往往可以根据其特点从两人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析过程。一个是个方面来切入,以简化分析过程。一个是研究所谓横截面研究所谓横截面(cross section)数据,也就数据,也就是对大体上同时,或者和时间无关的不同是对大体上同时,或者和时间无关的不同对象的观测值组成的数据。对象的观测值组成的数据。 另一个称为时间序列另一个称为时间序列(time series),也就是也就是由对象在不同时间的观测值形成的数据。由对象在不同时间的观测值形成的数据。 前面讨论的模型多是和横截面数据有关。

2、前面讨论的模型多是和横截面数据有关。这里将讨论时间序列的分析。我们将不讨这里将讨论时间序列的分析。我们将不讨论更加复杂的包含这两方面的数据。论更加复杂的包含这两方面的数据。 时间序列和回归时间序列和回归 时间序列分析也是一种回归。时间序列分析也是一种回归。 回归分析的目的是建立因变量和自变量之间关系回归分析的目的是建立因变量和自变量之间关系的模型;并且可以用自变量来对因变量进行预测。的模型;并且可以用自变量来对因变量进行预测。通常线性回归分析因变量的观测值假定是互相独通常线性回归分析因变量的观测值假定是互相独立并且有同样分布。立并且有同样分布。 而时间序列的最大特点是观测值并不独立。时间而时间

3、序列的最大特点是观测值并不独立。时间序列的一个目的是用变量过去的观测值来预测同序列的一个目的是用变量过去的观测值来预测同一变量的未来值。也就是说,时间序列的因变量一变量的未来值。也就是说,时间序列的因变量为变量未来的可能值,而用来预测的自变量中就为变量未来的可能值,而用来预测的自变量中就包含该变量的一系列历史观测值。包含该变量的一系列历史观测值。 当然时间序列的自变量也可能包含随着时间度量当然时间序列的自变量也可能包含随着时间度量的独立变量。的独立变量。例例tssales.sav 下面看一个时间序列的数据例子。这下面看一个时间序列的数据例子。这是某企业从是某企业从1990年年1月到月到2002

4、年年12月的月的销售数据销售数据(tssales.sav)。我们希望能够我们希望能够从这个数据找出一些规律,并且建立从这个数据找出一些规律,并且建立可以对未来的销售额进行预测的时间可以对未来的销售额进行预测的时间序列模型。序列模型。从该表格中的众多的数据只能够看出个大概;从该表格中的众多的数据只能够看出个大概;即总的趋势是增长,但有起伏。即总的趋势是增长,但有起伏。例例tssales.savDateSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP

5、 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990SALES12010080604020 利用点图则可以得到对该数据更加直观的印象:利用点图则可以得到对该数据更加直观的印象:某企业从某企业从1990年年1月到月到2002年年12月的销售数据图(单位:百万元)月的销售数据图(单位:百万元) 例例tssales.sav 从这个点图可以看出。总的趋势是增长的,但增长并不是单调上从这个点图可以看出。总的趋势是增长的,但增长并不是单调上升的;有涨有落。大体上看,这种升降不是杂乱无章的,和季节升的;有涨有落。大体上看,这种升降不是杂乱

6、无章的,和季节或月份的周期有关系。当然,除了增长的趋势和季节影响之外,或月份的周期有关系。当然,除了增长的趋势和季节影响之外,还有些无规律的随机因素的作用。还有些无规律的随机因素的作用。DateSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990SALES12010080604020SPSS的的实现实现: :时间序列数据的产生时间

7、序列数据的产生 SPSS并不会自动把某些变量看成带有某些并不会自动把某些变量看成带有某些周期的时间序列;需要对该变量的观测值周期的时间序列;需要对该变量的观测值附加上时间因素。附加上时间因素。 例数据例数据tasales.sav原本只有一个变量原本只有一个变量sales。这样就需要附加带有周期信息的时间。这样就需要附加带有周期信息的时间。 方法是通过选项方法是通过选项DataDefine Dates, 然后在然后在Cases Are选择选择years, months (年月年月), 并指定第一个观测值(并指定第一个观测值(First Case Is)是是1990年年1月。月。 SPSS的的实现

8、实现: :时间序列数据的点图时间序列数据的点图对时间序列点图可以选择对时间序列点图可以选择GraphsSequence,对本对本例选择例选择sales为变量,为变量,months为时间轴的标记即为时间轴的标记即可。可。时间序列的组成部分时间序列的组成部分 从该例可以看出,该时间序列可以有三部从该例可以看出,该时间序列可以有三部分组成:趋势分组成:趋势(trend)、季节季节(seasonal)成分成分和无法用趋势和季节模式解释的随机干扰和无法用趋势和季节模式解释的随机干扰(disturbance)。)。 例中数据的销售就就可以用这三个成分叠例中数据的销售就就可以用这三个成分叠加而成的模型来描述

9、。加而成的模型来描述。 一般的时间序列还可能有循环或波动一般的时间序列还可能有循环或波动(Cyclic, or fluctuations)成分;循环模式和成分;循环模式和有规律的季节模式不同,周期长短不一定有规律的季节模式不同,周期长短不一定固定。比如经济危机周期,金融危机周期固定。比如经济危机周期,金融危机周期等等。等等。时间序列的组成部分时间序列的组成部分 一个时间序列可能有趋势、季节、循环这一个时间序列可能有趋势、季节、循环这三个成分中的某些或全部再加上随机成分。三个成分中的某些或全部再加上随机成分。因此,因此, 如果要想对一个时间序列本身进行较深入如果要想对一个时间序列本身进行较深入的

10、研究,把序列的这些成分分解出来、或的研究,把序列的这些成分分解出来、或者把它们过虑掉则会有很大的帮助。者把它们过虑掉则会有很大的帮助。 如果要进行预测,则最好把模型中的与这如果要进行预测,则最好把模型中的与这些成分有关的参数估计出来。些成分有关的参数估计出来。 就例就例中中的时间序列的分解,通过的时间序列的分解,通过SPSS软件,软件,可以很轻而易举地得到该序列的趋势、季可以很轻而易举地得到该序列的趋势、季节和误差成分。节和误差成分。时间序列的组成部分时间序列的组成部分 下图表示了去掉季节成分,只有趋势和误差成分的序列。下图表示了去掉季节成分,只有趋势和误差成分的序列。DateSEP 2002

11、JAN 2002MAY 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990Seasonal adjusted SALES12010080604020时间序列的组成部分时间序列的组成部分 下图用两条曲线分别描绘了趋势成分和季节成分。下图用两条曲线分别描绘了趋势成分和季节成分。DateSEP 2002JAN 2002MAY 2001SEP 2000JAN 2000MAY

12、1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990120100806040200-20Trend-cycle for SALES from SEASON, MOD_1Seas factors for SALES from SEASON, MOD_时间序列的组成部分时间序列的组成部分 下图用两条曲线分别描绘了趋势成分和误差成分。下图用两条曲线分别描绘了趋势成分和误差成分。 DateSEP 2002JAN 2002MA

13、Y 2001SEP 2000JAN 2000MAY 1999SEP 1998JAN 1998MAY 1997SEP 1996JAN 1996MAY 1995SEP 1994JAN 1994MAY 1993SEP 1992JAN 1992MAY 1991SEP 1990JAN 1990120100806040200-20Trend-cycle for SALES from SEASON, MOD_1Error for SALES from SEASON, MOD_1 ADD SPSS的的实现实现: :时间序列的分解时间序列的分解 前面前面对例对例tssales.sav数据进行分解利用数据进行分解

14、利用SPSS的选的选项项Analyze- -Time Series- -Seasonal Decomposition, 然后在然后在Variable(s)(变量变量)处选择处选择sales, 在在Model选择选择Additive (可加模型,也可以试可乘可加模型,也可以试可乘模型模型Multiplicative), 最后得到四个附加变量,它们是:最后得到四个附加变量,它们是: 误差(误差(err_1)、)、 季节调整后的序列(季节调整后的序列(sas_1)、)、 季节因素(季节因素(saf_1) 去掉季节后的趋势循环因素(去掉季节后的趋势循环因素(stc_1)。)。 前面图都是利用前面图都是

15、利用GraphsSequence选项所做的。选项所做的。 指数平滑指数平滑 如果我们不仅仅满足于分解现有的时间序列,而如果我们不仅仅满足于分解现有的时间序列,而且想要对未来进行预测,就需要建立模型。首先,且想要对未来进行预测,就需要建立模型。首先,这里介绍比较简单的这里介绍比较简单的指数平滑指数平滑(exponential smoothing)。 指数平滑指数平滑只能用于纯粹时间序列只能用于纯粹时间序列的情况,而不能的情况,而不能用于含有独立变量时间序列的因果关系的研究。用于含有独立变量时间序列的因果关系的研究。 指数平滑的原理为:当利用过去观测值的加权平指数平滑的原理为:当利用过去观测值的加

16、权平均来预测未来的观测值时(这个过程称为平滑),均来预测未来的观测值时(这个过程称为平滑),离得越近的观测值要给以更多的权。离得越近的观测值要给以更多的权。 而而“指数指数”意味着:按照已有观测值意味着:按照已有观测值“老老”的程的程度,其上的权数按指数速度递减。度,其上的权数按指数速度递减。指数平滑指数平滑 以简单的没有趋势和没有季节成分的纯粹以简单的没有趋势和没有季节成分的纯粹时间序列为例,指数平滑在数学上这实际时间序列为例,指数平滑在数学上这实际上是一个几何级数。这时,如果用上是一个几何级数。这时,如果用Yt表示表示在在t时间的平滑后的数据(或预测值),而时间的平滑后的数据(或预测值),

17、而用用X1, X2, , Xt表示原始的时间序列。那么表示原始的时间序列。那么指数平滑模型为指数平滑模型为 1(1), (01)tttYXY或者,等价地,或者,等价地,0(1)ktt kkYX这里的系数为几何级数。因此称之为这里的系数为几何级数。因此称之为“几何几何平滑平滑”比使人不解的比使人不解的“指数平滑指数平滑”似乎更有似乎更有道理。道理。 指数平滑指数平滑 自然,这种在简单情况下导出的公式(如上面的自然,这种在简单情况下导出的公式(如上面的公式)无法应对具有各种成分的复杂情况。公式)无法应对具有各种成分的复杂情况。 后面将给出各种实用的指数平滑模型的公式。后面将给出各种实用的指数平滑模

18、型的公式。 根据数据,可以得到这些模型参数的估计以及对根据数据,可以得到这些模型参数的估计以及对未来的预测。在和我们例子有关的指数平滑模型未来的预测。在和我们例子有关的指数平滑模型中,需要估计中,需要估计1212个季节指标和三个参数(包含前个季节指标和三个参数(包含前面公式权重中的面公式权重中的 ,和趋势有关的和趋势有关的g g,以及和季节以及和季节指标有关的指标有关的d d)。)。 在简单的选项之后,在简单的选项之后,SPSSSPSS通过指数平滑产生了对通过指数平滑产生了对20032003年一年的预测。下图为原始的时间序列和预年一年的预测。下图为原始的时间序列和预测的时间序列(光滑后的),其

19、中包括对测的时间序列(光滑后的),其中包括对20032003年年1212个月的预测。图下面为误差。个月的预测。图下面为误差。 DateJUL 2003OCT 2002JAN 2002APR 2001JUL 2000OCT 1999JAN 1999APR 1998JUL 1997OCT 1996JAN 1996APR 1995JUL 1994OCT 1993JAN 1993APR 1992JUL 1991OCT 1990JAN 1990140120100806040200-20SALESFit for SALES Error for SALES我们例中时间序列数据的指数平滑和对未来的预测我们例中

20、时间序列数据的指数平滑和对未来的预测 SPSS的的实现实现: :指数平滑指数平滑: :tssales.sav数据数据 用选项用选项AnalyzeTime SeriesExponential Smoothing,然后在然后在Variable(s)(变量变量)处选择处选择sales,在在Model选择选择custom (自选模型自选模型),再点,再点Custom之后再在之后再在Trend Component选选Exponential(这主要是因为看到序列原始这主要是因为看到序列原始点图趋势不象直线点图趋势不象直线,其实选其实选Linear也差不多也差不多;此外还有此外还有Damped(减幅减幅)选

21、项选项) 在在Seasonal Component选选Additive(这是可加模型,也可这是可加模型,也可以试选可乘模型:以试选可乘模型:Multiplicative,细节可参看公式细节可参看公式) Continue之后,再点击之后,再点击Parameters来估计参数,在三个来估计参数,在三个有关参数选项上:有关参数选项上:General(Alpha)、Trend(Gamma)和和Seasonal(Delta)可均选可均选Grid Search(搜寻,这是因为不搜寻,这是因为不知道参数是多少合适,参数意义参见后面公式),然后知道参数是多少合适,参数意义参见后面公式),然后Continue。

22、最后如果要预测新观测值,在主对话框点击最后如果要预测新观测值,在主对话框点击Save,在在Predict Cases中选择中选择Predict through下面的截下面的截止年月(这里选了止年月(这里选了2003年年12月)。这样就可以得到各种月)。这样就可以得到各种结果了。结果了。SPSS的的实现实现: :指数平滑指数平滑结果中增加的变量有误差结果中增加的变量有误差(err_1)和拟合(预测)和拟合(预测)值值fit_1。这在前面图中绘这在前面图中绘出。在出。在SPSS输出文件中输出文件中还有那些估计的参数值还有那些估计的参数值(三个参数加上季节因(三个参数加上季节因子)。子)。 Box-

23、Jenkins 方法:方法:ARIMA模型模型 如果要对比较复杂的纯粹时间序列进如果要对比较复杂的纯粹时间序列进行细致的分析,指数平滑往往是无法行细致的分析,指数平滑往往是无法满足要求的。满足要求的。 而若想对有独立变量的时间序列进行而若想对有独立变量的时间序列进行预测,指数平滑更是无能为力。预测,指数平滑更是无能为力。 于是需要更加强有力的模型。这就是于是需要更加强有力的模型。这就是下面要介绍的下面要介绍的Box-Jenkins ARIMA模模型。型。 数学上,指数平滑仅仅是数学上,指数平滑仅仅是ARIMA模型模型的特例。的特例。 ARIMA模型模型 :AR模型模型 比指数平滑要有用和精细得

24、多的模型是比指数平滑要有用和精细得多的模型是Box-Jenkins引引入的入的ARIMA模型。或称为整合自回归移动平均模型模型。或称为整合自回归移动平均模型(ARIMA 为为Autoregressive Integrated Moving Average一些关键字母的缩写一些关键字母的缩写)。该模型的基础是自回归和移动。该模型的基础是自回归和移动平均模型或平均模型或ARMA(Autoregressive and Moving Average) 模型。模型。 它由两个特殊模型发展而成,一个特例是自回归模型或它由两个特殊模型发展而成,一个特例是自回归模型或AR (Autoregressive) 模

25、型。假定时间序列用模型。假定时间序列用X1, X2, , Xt表示,则一个纯粹的表示,则一个纯粹的AR (p)模型意味着变量的一个观模型意味着变量的一个观测值由其以前的测值由其以前的p个观测值的线性组合加上随机误差项个观测值的线性组合加上随机误差项at(该误差为独立无关的)而得:该误差为独立无关的)而得: 11ttptptXXXa这看上去象自己对自己回归一样,所以称为自回归模型;这看上去象自己对自己回归一样,所以称为自回归模型;它牵涉到过去它牵涉到过去p个观测值(相关的观测值间隔最多为个观测值(相关的观测值间隔最多为p个)。个)。 ARIMA模型模型 :MA模型模型 ARMA模型的另一个特例为

26、移动平均模型或模型的另一个特例为移动平均模型或MA (Moving Average) 模型,一个纯粹的模型,一个纯粹的MA (q)模型意味着模型意味着变量的一个观测值由目前的和先前的变量的一个观测值由目前的和先前的q个随机误差的线个随机误差的线性的组合:性的组合: 由于右边系数的和不为由于右边系数的和不为1(q q 甚至不一定是正数),因此甚至不一定是正数),因此叫做叫做“移动平均移动平均”不如叫做不如叫做“移动线性组合移动线性组合”更确切;虽更确切;虽然行家已经习惯于叫然行家已经习惯于叫“平均平均”了,但初学者还是因此可能了,但初学者还是因此可能和初等平滑方法中的什么和初等平滑方法中的什么“

27、三点平均三点平均”之类的术语混淆。之类的术语混淆。 11tttqt qXaaaqqARIMA模型模型 :ARMA模型模型 显然显然ARMA(p,q)模型应该为模型应该为AR (p)模型和模型和MA(q)模型的模型的组合了:组合了:显然显然ARMA(p,0)模型就是模型就是AR (p)模型,而模型,而ARMA(0,q)模型模型就是就是MA(q)模型。这个一般模型有模型。这个一般模型有p+q个参数要估计,看个参数要估计,看起来很繁琐,但利用计算机软件则是常规运算;并不复杂。起来很繁琐,但利用计算机软件则是常规运算;并不复杂。 1111ttptpttqt qXXXaaaqqARIMA模型:平稳性和可

28、逆性模型:平稳性和可逆性 但是要想但是要想ARMA(p,q)模型有意义则要求时间序列满足平模型有意义则要求时间序列满足平稳性稳性(stationarity)和可逆性和可逆性(invertibility)的条件,的条件, 这意味着序列均值不随着时间增加或减少,序列的方差这意味着序列均值不随着时间增加或减少,序列的方差不随时间变化,另外序列本身相关的模式不改变等。不随时间变化,另外序列本身相关的模式不改变等。 一个实际的时间序列是否满足这些条件是无法在数学上一个实际的时间序列是否满足这些条件是无法在数学上验证的,验证的, 这没有关系,但可以从下面要介绍的时间序列的自相关这没有关系,但可以从下面要介

29、绍的时间序列的自相关函数和偏相关函数图中可以识别出来。函数和偏相关函数图中可以识别出来。 一般人们所关注的的有趋势和季节一般人们所关注的的有趋势和季节/循环成分的时间序循环成分的时间序列都不是平稳的。这时就需要对时间序列进行差分列都不是平稳的。这时就需要对时间序列进行差分(difference)来消除这些使序列不平稳的成分,而使其变来消除这些使序列不平稳的成分,而使其变成平稳的时间序列,并估计成平稳的时间序列,并估计ARMA模型,估计之后再转模型,估计之后再转变该模型,使之适应于差分之前的序列(这个过程和差变该模型,使之适应于差分之前的序列(这个过程和差分相反,所以称为整合的分相反,所以称为整

30、合的(integrated)ARMA模型),模型),得到的模型于是称为得到的模型于是称为ARIMA模型。模型。ARIMA模型:差分模型:差分 差分是什么意思呢?差分可以是每一个观差分是什么意思呢?差分可以是每一个观测值减去其前面的一个观测值,即测值减去其前面的一个观测值,即Xt-Xt-1。这样,如果时间序列有一个斜率不变的趋这样,如果时间序列有一个斜率不变的趋势,经过这样的差分之后,该趋势就会被势,经过这样的差分之后,该趋势就会被消除了。消除了。 当然差分也可以是每一个观测值减去其前当然差分也可以是每一个观测值减去其前面任意间隔的一个观测值;比如存在周期面任意间隔的一个观测值;比如存在周期固定

31、为固定为s的季节成分,的季节成分, 那么相隔那么相隔s的差分的差分 为为Xt-Xt-s就可以把这种以就可以把这种以s为周期的季节成分消除。为周期的季节成分消除。 对于复杂情况,可能要进行多次差分,才对于复杂情况,可能要进行多次差分,才能够使得变换后的时间序列平稳。能够使得变换后的时间序列平稳。 ARMA模型的识别和估计模型的识别和估计 上面引进了一些必要的术语和概念。上面引进了一些必要的术语和概念。下面就如何识别模型进行说明。下面就如何识别模型进行说明。要想拟合要想拟合ARIMA模型,必须先把它利模型,必须先把它利用差分变成用差分变成ARMA(p,q)模型,并确定模型,并确定是否平稳,然后确定

32、参数是否平稳,然后确定参数p,q。现在利用一个例子来说明如何识别一现在利用一个例子来说明如何识别一个个AR(p)模型和参数模型和参数p。由此由此MA(q)及及ARMA(p,q)模型模型可用模型模型可用类似的方法来识别。类似的方法来识别。ARMA模型的识别和估计模型的识别和估计 根据根据ARMA(p,q)模型的定义模型的定义,它的参数它的参数p,q和和自相关函数自相关函数(acf,autocorrelations function)及偏自相关函数及偏自相关函数(pacf,partial autocorrelations function)有关。有关。 自相关函数描述观测值和前面的观测值的自相关函

33、数描述观测值和前面的观测值的相关系数;相关系数; 而偏自相关函数为在给定中间观测值的条而偏自相关函数为在给定中间观测值的条件下观测值和前面某间隔的观测值的相关件下观测值和前面某间隔的观测值的相关系数。系数。 这里当然不打算讨论这两个概念的细节。这里当然不打算讨论这两个概念的细节。引进这两个概念主要是为了能够引进这两个概念主要是为了能够了解如何了解如何通过研究关于这两个函数的通过研究关于这两个函数的acf和和pacf图来图来识别模型。识别模型。 Sequence number5855524946434037343128252219161310741Z3210-1-2例:数据例:数据AR1.sav

34、 为了直观地理解上面的概念,下面利用一个数据例子来描述。为了直观地理解上面的概念,下面利用一个数据例子来描述。ZLag Number16151413121110987654321ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientZLag Number16151413121110987654321Partial ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient例:数据例:数据AR1.sav;拖尾和截尾拖尾和截尾先来看该时间序列的先来看该时间序列的acf(左左)和和pacf图图( (右右) ) 左边的左边的acf

35、条形图是衰减的正弦型的波动;这种图形称为条形图是衰减的正弦型的波动;这种图形称为拖尾拖尾。而右边的。而右边的pacf条形图是在第一个条条形图是在第一个条(p=1)之后就很小,之后就很小,而且没有什么模式;这种图形称为在在而且没有什么模式;这种图形称为在在p=1后后截尾截尾。这说。这说明该数据满足是平稳的明该数据满足是平稳的AR(1)模型。模型。例:数据例:数据AR1.sav;拖尾和截尾拖尾和截尾 注意,所谓拖尾图形模式也可能不是正弦形式,注意,所谓拖尾图形模式也可能不是正弦形式,但以指数率衰减。类似地,如果但以指数率衰减。类似地,如果acf图形是在第图形是在第q=k个条后截尾,而个条后截尾,而

36、pacf图形为拖尾,则数据满图形为拖尾,则数据满足足MA(q)模型。如果两个图形都拖尾则可能满足模型。如果两个图形都拖尾则可能满足ARMA(p,q)模型。具体判别法总结在下面表中:模型。具体判别法总结在下面表中:acf和和pacf图图 如如acf和和pacf图中至少一个不是以指数图中至少一个不是以指数形式或正弦形式衰减,那么说明该序形式或正弦形式衰减,那么说明该序列不是平稳序列,必须进行差分变换列不是平稳序列,必须进行差分变换来 得 到 一 个 可 以 估 计 参 数 的 满 足来 得 到 一 个 可 以 估 计 参 数 的 满 足ARMA(p,q)模型的序列。模型的序列。 如一个时间序列的如

37、一个时间序列的acf和和pacf图没有任图没有任何模式,而且数值很小,那么这个序何模式,而且数值很小,那么这个序列可能就是一些互相独立的无关的随列可能就是一些互相独立的无关的随机变量。一个很好拟合的时间序列模机变量。一个很好拟合的时间序列模型的残差就应该有这样的型的残差就应该有这样的acf和和pacf图。图。例:数据例:数据AR1.sav 根据根据acf和和pacf图图的形态,不用进行任何差分就可的形态,不用进行任何差分就可以直接用以直接用AR(1)模型拟合。利用模型拟合。利用SPSS软件,选择软件,选择AR(1)模型模型( (等价地等价地ARIMA(1,0,0)(0,0,0)模型模型),),

38、得得到参数估计为到参数估计为1 1=0.86;=0.86;也就是说该也就是说该AR(1)模型为模型为 10.86tttXXa例:数据例:数据AR1.savSequence number6965615753494541373329252117139513210-1-2ZFit and Prediction 下图为下图为ar1.sav数据的原始序列和由模型得到的拟合值以数据的原始序列和由模型得到的拟合值以及对未来及对未来10个观测的预测图;看来拟合得还不错。个观测的预测图;看来拟合得还不错。例:数据例:数据AR1.sav 下面再看剩下的残差序列是否还有什么模式。这还可以由残差的下面再看剩下的残差序

39、列是否还有什么模式。这还可以由残差的pacf(左左)和和acf(右右)图来判断。可以看出,它们没有什么模式;这图来判断。可以看出,它们没有什么模式;这说明拟合比较成功。说明拟合比较成功。 Error for Z from ARIMALag Number16151413121110987654321ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientError for Z from ARIMALag Number16151413121110987654321Partial ACF1.0.50.0-.5-1.0Confidence LimitsCoeffic

40、ient例:数据例:数据AR1.sav 下图为残差对拟合值的散点图。看不出任何模式。说明残差的确下图为残差对拟合值的散点图。看不出任何模式。说明残差的确是独立的和随机的。是独立的和随机的。Fit for Z from ARIMA2.01.51.0.50.0-.5-1.0-1.5Error for Z from ARIMA1.0.50.0-.5-1.0-1.5ARIMA (p,d,q)(P,D,Q)s模型模型 在对含有季节和趋势在对含有季节和趋势/循环等成分的时间序列进循环等成分的时间序列进行行ARIMA模型的拟合研究和预测时,就不象对模型的拟合研究和预测时,就不象对纯粹的满足可解条件的纯粹的满

41、足可解条件的ARMA模型那么简单了。模型那么简单了。 一般的一般的ARIMA模型有多个参数,没有季节成分模型有多个参数,没有季节成分的可以记为的可以记为ARIMA(p,d,q),如果没有必要利用如果没有必要利用差分来消除趋势或循环成分时,差分阶数差分来消除趋势或循环成分时,差分阶数d=0,模型为模型为ARIMA(p,0,q),即即ARMA(p, q)。 在有已知的固定周期在有已知的固定周期s时,模型多了时,模型多了4个参数,可个参数,可记为记为ARIMA(p,d,q)(P,D,Q)s。这里增加的除了周这里增加的除了周期期 s 已 知 之 外 , 还 有 描 述 季 节 本 身 的已 知 之 外

42、 , 还 有 描 述 季 节 本 身 的ARIMA(P,D,Q)的模型识别问题。因此,实际建的模型识别问题。因此,实际建模要复杂得多。需要经过反复比较。模要复杂得多。需要经过反复比较。用用ARIMA模型拟合例模型拟合例tssalestssales. .savsav 先前对数据先前对数据tssales.sav序列序列进行了分解,并且用指数平进行了分解,并且用指数平滑做了预测。知其有季节和趋势成分。滑做了预测。知其有季节和趋势成分。 下面试图对其进行下面试图对其进行ARIMA模型拟合。先试图对该序列模型拟合。先试图对该序列做做acf和和pacf条形图。其中条形图。其中acf图显然不是拖尾(不是以图

43、显然不是拖尾(不是以指数速率递减),因此说明需要进行差分。指数速率递减),因此说明需要进行差分。SALESLag Number16151413121110987654321ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient用用ARIMA模型拟合例模型拟合例tssalestssales. .savsav 关于于参数,不要选得过大;每次拟合之后要检关于于参数,不要选得过大;每次拟合之后要检查残差的查残差的acf和和pacf图,看是否为无关随机序列。图,看是否为无关随机序列。 在在SPSS软件中还有类似于回归系数的检验以及软件中还有类似于回归系数的检验以及其

44、他一些判别标准的计算机输出可做参考(这里其他一些判别标准的计算机输出可做参考(这里不细说)。不细说)。 经过几次对比之后,对于例经过几次对比之后,对于例16.1数据我们最后选数据我们最后选中了中了ARIMA(0,1,1)( 0,1,1)12模型来拟合。拟合的模型来拟合。拟合的结果和对结果和对2003年年12个月的预测在下图中。个月的预测在下图中。 DateJUL 2003OCT 2002JAN 2002APR 2001JUL 2000OCT 1999JAN 1999APR 1998JUL 1997OCT 1996JAN 1996APR 1995JUL 1994OCT 1993JAN 1993A

45、PR 1992JUL 1991OCT 1990JAN 199012010080604020SALESFit and Prediction例例tssales.sav的原始序列和由模型得到的拟合值及对未来的原始序列和由模型得到的拟合值及对未来12个月的预测图。个月的预测图。 例:数据例:数据AR1.sav 为了核对,当然要画出残差的为了核对,当然要画出残差的acf和和pacf的条形图来看是否还有什的条形图来看是否还有什么非随机的因素存在。下图为这两个点图,看来我们的模型选择么非随机的因素存在。下图为这两个点图,看来我们的模型选择还是适当的。还是适当的。 Error for SALES from A

46、RIMALag Number16151413121110987654321ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient Error for SALES from ARIMALag Number16151413121110987654321Partial ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 DAY, period 746135724613572461SALES7060504030 例例:数据:数据tsadds2.sav

47、是一个销售时间序列,以每周七天是一个销售时间序列,以每周七天为一个季节周期,除了销售额序列为一个季节周期,除了销售额序列sales之外,还有一个之外,还有一个广告花费的独立变量广告花费的独立变量adds。先不理睬这个独立变量,把先不理睬这个独立变量,把该序列当成纯粹时间序列来用该序列当成纯粹时间序列来用ARIMAARIMA模型拟合。右图为模型拟合。右图为该序列的点图。该序列的点图。数据数据tsadds2.sav再首先点出其再首先点出其acfacf和和pacfpacf条形图条形图 SALESLag Number16151413121110987654321ACF1.0.50.0-.5-1.0Co

48、nfidence LimitsCoefficientSALESLag Number16151413121110987654321Partial ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientacf图显然不是拖尾模式,因此,必须进行差分以图显然不是拖尾模式,因此,必须进行差分以消除季节影响。试验多次之后,看上去消除季节影响。试验多次之后,看上去ARIMA(2,1,2)( 0,1,1)7的结果还可以接受。残差的的结果还可以接受。残差的pacfpacf和和acfacf条形图在下一页图中条形图在下一页图中 用用ARIMA模型拟合带有独立变量的时间序列模型拟

49、合带有独立变量的时间序列 继续改进我们的模型,再把独立变量广告支出加入模型,最后得继续改进我们的模型,再把独立变量广告支出加入模型,最后得到的带有独立变量到的带有独立变量addsadds的的ARIMA(2,1,2)( 0,1,1)ARIMA(2,1,2)( 0,1,1)7 7模型。拟合后模型。拟合后的残差图在下图中。的残差图在下图中。 Error for SALES from ARIMALag Number16151413121110987654321ACF1.0.50.0-.5-1.0Confidence LimitsCoefficientError for SALES from ARIMA

50、Lag Number16151413121110987654321Partial ACF1.0.50.0-.5-1.0Confidence LimitsCoefficient用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 从各种角度来看拟合带独立变量平方从各种角度来看拟合带独立变量平方的的ARIMA(2,1,2)( 0,1,1)ARIMA(2,1,2)( 0,1,1)7 7模型给出更模型给出更好的结果。好的结果。虽然从上面的虽然从上面的acfacf和和pacfpacf图看不出(一图看不出(一般也不应该看出)独立变量对序列的般也不应该看出)独立变量对序列的自相关性的影

51、响,但是根据另外的一自相关性的影响,但是根据另外的一些判别准则,独立变量的影响是显著些判别准则,独立变量的影响是显著的,而且加入独立变量使得模型更加的,而且加入独立变量使得模型更加有效。有效。 用用ARIMA模型拟合带有独立变量的时间序列模型拟合带有独立变量的时间序列 要注意,一些独立变量的效果也可能要注意,一些独立变量的效果也可能是满足某些时间序列模型的,也可能是满足某些时间序列模型的,也可能会和季节、趋势等效应混杂起来不易会和季节、趋势等效应混杂起来不易分辩。这时,模型选择可能就比较困分辩。这时,模型选择可能就比较困难。也可能不同模型会有类似的效果。难。也可能不同模型会有类似的效果。 一个

52、时间序列在各种相关的因素影响一个时间序列在各种相关的因素影响下的模型选择并不是一件简单明了的下的模型选择并不是一件简单明了的事情。实际上没有任何统计模型是绝事情。实际上没有任何统计模型是绝对正确的,它们的区别在于,在某种对正确的,它们的区别在于,在某种意义上,一些模型的某些性质可能要意义上,一些模型的某些性质可能要优于另外一些。优于另外一些。SPSS的的实现实现: :ARIMA模型模型 时间序列的时间序列的acf和和pacf图:可以用选项图:可以用选项GraphsTime SeriesAutocorrelations, 然后把变量选入然后把变量选入Variables中中(对于数据对于数据AR1

53、.sav,把时间序列把时间序列Z选入选入)。 在在Display中中(默认地默认地)有选项有选项Autocorrelations和和Partial autocorrelations导致导致acf和和pacf图。图。 人们还经常对残差项绘人们还经常对残差项绘acf和和pacf图。图。SPSS的的实现实现: :ARIMA(p,d,q)(P,D,Q)s模型拟合模型拟合 选择选择AnalyzeTime SeriesARIMA,然后把数然后把数据中的时间序列选入据中的时间序列选入Dependent(在数据在数据AR1.sav中中,选选Z,对数据对数据tssales.sav时选时选sales,而对数据而对

54、数据tsadds2.sav时选时选sales),对于对于Independent,仅在使用仅在使用数据数据tsadds2.sav时选了时选了adds。 在在Model的第一列为的第一列为ARIMA(p,d,q)(P,D,Q)s模型模型的前三个参数的前三个参数(p,d,q),第二列第二列(sp,sd,sq)为为ARIMA(p,d,q)(P,D,Q)s模型的后三个参数模型的后三个参数(P,D,Q)。这样只要选定我们所希望尝试的模型参数即可。这样只要选定我们所希望尝试的模型参数即可。 周期周期s由于在定义序列时已经有了由于在定义序列时已经有了(见对话框中注见对话框中注明的明的Current Perio

55、dicity后面的数字后面的数字),就不用另外就不用另外输入了。在输出的变量中有误差和拟合输入了。在输出的变量中有误差和拟合(预测预测)的的序列,在输出文件中还有各个参数和一些判别准序列,在输出文件中还有各个参数和一些判别准则等。则等。公式:公式:指数平滑模型指数平滑模型这些模型中有这些模型中有 ,g g,d d,f f为待估为待估计参数,计参数,g g0意味着斜率为常数意味着斜率为常数(趋势无变化),而(趋势无变化),而d d0意味着意味着没有季节成分,没有季节成分,f f和减幅趋势有和减幅趋势有关;对于时间序列关;对于时间序列Xt,趋势、光趋势、光滑后的序列、季节因子和预测的滑后的序列、季

56、节因子和预测的序列分别用序列分别用Tt、St、It 和和 表表示;另外,示;另外,p表示周期,表示周期,et为残为残差差 tX1ttXX指数平滑模型指数平滑模型: :线性趋势可加季节模型线性趋势可加季节模型(Linear trend, additive seasonality modelLinear trend, additive seasonality model) 01tttXbbtI1111,(1) ,tttttttttptttttpTTeSSTeIIeXSTIgd 指数平滑模型指数平滑模型: :线性趋势可乘季节模型线性趋势可乘季节模型(Linear trend, multiplicat

57、ive seasonality modelLinear trend, multiplicative seasonality model) 01()tttXbbt I1111,(1),()ttttptttttptttptttttpeTTIeSSTIeIISXST Igd 指数平滑模型指数平滑模型: :指数趋势可加季节模型指数趋势可加季节模型(Exponential trend, additive seasonality modelExponential trend, additive seasonality model) 0 1ttttXb bI11111,(1) ,ttttttttttpttt

58、ttpeTTSSS TeIIeXS TIgd 指数平滑模型指数平滑模型: :指数趋势可乘季节模型指数趋势可乘季节模型( (Exponential trend, multiplicative seasonality model)Exponential trend, multiplicative seasonality model)0 1()ttttXb b I11111,(1),()ttttpttttttptttptttttpeTTISeSS TIeIISXST Igd 指数平滑模型指数平滑模型: :减幅趋势可加季节模型减幅趋势可加季节模型(Damped trend, additive seasonality modelDamped trend, additive seasonality model) 01tttXbbtIf1111(1) ,(2) ,1(2) ,tttttttttptttttpTTeSSTeIIeXSTIf ffdf 指数平滑模型指数平滑模型: :减幅趋势可乘季

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论