版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第13章SPSS的时间序列分析13.1时间序列分析概述13.2指数平滑13.3建立自回归序列的新变量13.4自回归13.5季节分解法13.6案例分析一13.7案例分析二13.8案例分析三第13章SPSS的时间序列分析13.1时间序列分析概述1时间序列分析(TimeSeriesAnalysis)是研究事物发展变化规律的一种量化分析方法,隶属于统计学但又有不同于其他统计分析方法的特殊特点。近年来,时间序列分析的理论和应用研究一直是人们关注的热点,也取得了很大的进步。对于时间序列一词可以有不同层次的理解。一般情况下,那些依时间先后顺序排列起来的一系列有相同内涵的数据都可以称为时间序列。在这个意义上来看,时间序列在日常生活中时无处不在的。从国家社会等宏观角度看,我们常常听到的GDP、物价指数、股票指数等可以构成时间序列;从微观角度看,一个13.1时间序列分析概述时间序列分析(TimeSeriesAnal2家庭每天的开支、一个工人的每天的工作量、一个学生每天的伙食费,等等,也可以构成时间序列。事实上,万事万物的变化发展所表现出来的各种特征,只要能够被持续的观察和度量,同时被记录,就能够得到所谓的时间序列。时间序列与一般的统计数据的不同之处在于:这是一些有严格先后顺序的数据。不同时间点或时间段对应的数据之间可能是没有关联互相独立的,但大多数情况下它们之间往往存在着某种前后相承的关系,而非互相独立。因此,对这类数据的分析和研究需要一些特殊的方法。时间序列分析就是包含了针对这种独特数据特点而形成和发展起来的一系列统计分析方法的一个完整的体系。家庭每天的开支、一个工人的每天的工作量、一个学生每天的伙食费313.1.1时间序列的相关概念通常,将时间序列描述成一个有序的数列:,其中下标表示时间序号。对上述数列可以有以下几种理解:第一,为一个有先后顺序且时间间隔均匀的数列。第二,为随机变量族或随机过程的一个“实现”。即在每一个固定的时间点t上,将现象看做是一个具有多种可能事实的随机变量。每一个只是随机变量由于种种原因而表现出来的一个结果,而在所有被关注时间点上,就是一系列随机变量所表现出来的一个结果,通常称做一个实现或一个现实,也可以称做一个轨道。13.1.1时间序列的相关概念4●指标集T指标集T可直观理解为时间t的取值范围。对一般的随机过程来说它是一个连续的变化范围,如可取,此时上述随机过程可相应地记为。时间序列分析一般只涉及离散的时间点,如t可取,此时的随机过程记为,又由于0点的相对性,一般的t可取。●采样间隔采样间隔可直观理解为时间序列中相邻两个数的时间间隔。在实际研究中。在整个数据期间一般都取一致的时间间隔,这样会使分析结果更具直观意义,更易使人信服。如在实际当中T为时,若取个时间点,则采样间隔为。●指标集T●采样间隔5●平稳随机过程和平稳时间序列在一些时间序列分析方法当中要求时间序列具有平稳性,即要求时间序列对应的随机过程是一个平稳的随机过程。平稳随机过程定义如下:如果对和任意整数n,都使与同分布,则概率空间(W,F,P)上的随机过程称为平稳过程。从这个定义可以看出平稳性实质上是要求随机过程包含的任意有限维随机变量族的统计特性具有时间上的平移不变性。这是一种非常严格的平稳性要求,而要刻画和度量这种平稳性,需要掌握个随机变量或随机变量族的分布或联合分布,这在实践当中是非常困难甚至是不可能的。因此这种平稳性一般被称为“严平稳”或者“完全平稳”。●平稳随机过程和平稳时间序列6●白噪声序列白噪声序列是一种特殊的平稳序列。它定义为:若随机序列{yt}由互不相关的随机变量构成,即对所有,则称其为白噪声序列。可以看出,白噪声序列是一种平稳序列,在不同时点上的随机变量的协方差为0。该特性通常被称为“无记忆性”,意味着人们无法根据其过去的特点推测其未来的走向,其变化没有规律可循。虽然有这个特点,但白噪声序列却是其他时间序列得以产生的基石,这在时间序列的ARIMA模型分析中体现得相当明显。另外,时间序列分析当中,当模型的残差序列成为白噪声序列时,可认为模型达到了较好的效果,剩余残差中已经没有可以识别的信息。因此,白噪声数列对模型检验也是很有用处的。●白噪声序列7●时点序列和时期序列实际当中,人们研究的时间序列是前面提到的随机过程的一个“实现”,也就是那些按时间先后顺序排列的一系列数据。这些数据往往由两部分组成:一是观测值;二是观察值对应的时间点或时间段。一般情况下,时期数据和时点数据之间可以通过将时期数据累加、或者将时点数据后项减前项或后项比前项的处理方式互相转换。不过随着这种转换,序列包含的实际意义也会有所变化,相应变量的统计性质也会有很大的变化,对应的分析处理方法也会有很大的不同。●时点序列和时期序列813.1.2时间序列分析的一般步骤时间序列分析一般需经过数据的准备、数据的观察及检验、数据的预处理、数据的分析和建模、模型的评价、模型的实施应用等几个阶段。●数据的准备阶段●数据的观察及检验阶段●数据的预处理阶段●数据的分析和建模阶段●模型的评价阶段●模型的实施应用阶段13.1.2时间序列分析的一般步骤913.1.3SPSS时间序列分析的特点SPSS的时间序列分析没有自成一体的单独模块,而是分散在Data、Transform、Analyze、Graph四个功能菜单当中。在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;在Analyze和TimeSeries中主要提供了四种时间序列分析方法,包括指数平滑法、自回归法、ARIMA模型和季节调整方法;在Graph中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等。另外,也可利用SPSS的谱分析图等模块进行简单的谱分析。13.1.3SPSS时间序列分析的特点1013.2数据准备数据准备是利用SPSS进行时间序列分析的一个首要任务,它对以后的分析起着举足轻重的作用,是数据分析的基础。通过前面的讨论可知,时间序列最显著的特点就是数据有着严格的先后顺序,并且与一定时间点或时间段相对应。因此,要把一系列SPSS变量数据当做时间序列数据来分析,就必须首先指明每个数据对应的时间点或时间段,以及整个数据所对应的期间。SPSS的数据准备正是用来完成这些任务的。数据期间的选取也是时间序列分析中经常遇到的问题。所谓数据期间的选取是指,如果分析过程中只希望选取全部样本期中的部分时段数据进行分析,则应首先指定该时间段的起止时间。对此可通过SPSS的样本选取(SelectCases)功能实现。13.2数据准备1113.3指数平滑法13.3.1指数平滑法的基本思想为掌握指数平滑法的基本思想应首先了解移动平均的思想。研究时间序列的一个重要目的是预测。现实当中事物的发展都是有连续性的,事物过去的表现与现在的状态有关,现在的状态又与将来的可能表现有一定的联系。因此,可以从现有数据入手通过构造某种计算方法实现对未来的预测。基于这种思想可以构造出丰富多彩的预测模型。移动平均法正是这样一种利用已知值的某种平均值进行预测的方法。移动平均包括简单移动平均法和加权移动平均法。13.3指数平滑法13.3.1指数平滑法的基本思想12简单移动平均法是利用一定时间跨度t下数据的简单平均实现对下一期值的预测,即
可见,简单移动平均认为,时间跨度内的所有数据对未来的预测贡献全部相同。然而,众所周知,事物的当前状态与其在过去时间所有点上的表现之间联系的紧密程度并不完全一致,因此这样的预测有时可能出现很大的偏差。通常,序列数据在近期的表现比远期的表现与现实状态的联系更加紧密。因此,预测时对过去的数据应给予不同的重视程度。简单移动平均法是利用一定时间跨度t下数据的简单平均实现对下一13加权移动平均法是对简单移动平均法的改进,通过不同的权数体现对过去状态的不同重视程度。重视程度越高、与现实联系密切的时间点对应较大的权数,而重视程度低、与现实联系松散的时间点则对应较小的权数。即不同事物的发展规律是不同的,同一种事物随时间的推移其变化规律也会发生变化。所以,权数应随不同的问题、不同的时间变换而变化。通常,权数确定没有一定之规,一般可参照几种典型的具有代表性的方法来设计权数。加权移动平均法是对简单移动平均法的改进,通过1413.3.2指数平滑法的模型指数平滑法因权数选择和平滑方法的不同而分成多种模型形式。虽然他们都基于上述基本思想,但在具体实现上还有所差别,也有不同的适用场合。下面介绍常用的几种模型。一次指数平滑法(简单指数平滑法)一次指数平滑法是简单移动平均法的变形,模型为其中,是t时刻的一次指数平滑值,n为移动步长,整理后得:。13.3.2指数平滑法的模型其中,是t时刻的一次指数15如果令,则。其中为一次平滑模型中的平滑常数,且显然。由则可见,指数平滑法是以前t+1期的平滑值作为当期的预测值。如果令,则16二次指数平滑法(线性指数平滑法)二次指数平滑也称双重指数平滑,是对一次指数平滑值再进行一次平滑。一次指数平滑法是直接利用平滑值作为预测值,而二次指数平滑则是利用平滑值对时间序列的线性趋势进行修正,进而建立线性平滑模型进行预测。二次指数平滑法包括布朗(Brown)单一参数线性指数平滑、霍特(Holt)双参数指数平滑等。布朗单一参数线性指数平滑布朗单一参数线性指数平滑的一次平滑公式为
一次指数平滑法课件17布朗单一参数线性指数平滑的二次平滑公式为式中,为一次指数平滑值,为二次指数平滑值。由两个平滑值计算线性平滑模型的两个参数:,,从而得到线性指数平滑模型
式中,m为超前期数。当t=1时,由于和是平滑初始值,需事先给定。布朗单一参数线性指数平滑适用于有线性趋势的时间序列。布朗单一参数线性指数平滑的二次平滑公式为由两个平滑值计算线性18三次指数平滑法三次指数平滑法也称三重指数平滑,与二次指数平滑类似,也不直接将平滑值作为预测值,而是服务于模型建立。三次指数平滑包括布朗三次指数平滑、温特(Winter)线性和季节性指数平滑。布朗三次指数平滑布朗三次指数平滑是对二次指数平滑值再进行一次平滑,并用以估计二次多项式参数。其一般模型为由上式可知,布朗三次指数模型并非一个线性模型,而是类似于二次多项式的曲线模型,可表现时间序列的曲线变化趋势。其中
三次指数平滑法由上式可知,布朗三次指数模型并非一个线性模型,19各次平滑形式分别为布朗三次指数平滑模型适用于有非线性趋势存在的序列。各次平滑形式分别为布朗三次指数平滑模型适用于有非线性趋势存在20温特线性和季节指数平滑温特线性和季节指数平滑模型的一般形式为上式中包含三种成分,它们分别是平稳性、趋势性和季节性。为季节周期长度,为季节调整因子,分别为模型的三个初始参数。其中
温特线性和季节性指数平滑模型适用于同时具有趋势性和季节性的时间序列,且只适用于短期预测。温特线性和季节指数平滑温特线性和季节性指数平滑模型适用于同时2113.4自回归法13.4.1自回归法的基本思想和模型利用简单回归分析法进行时间序列分析时,模型要求各期的随机误差项之间是不相关的。在前文的平稳随机过程的定义中也介绍过,只有误差项中不存在任何可利用的信息时,才能够认为模型已经达到了最优。而当误差项之间存在相关性时,一方面常用的估计方法不再具有优良性,普通的简单回归模型存在着较大的缺陷;另一方面也说明模型对序列中的信息没有充分地提取。自回归模型,简写为AR模型,正是针对模型误差项存在相关性的情况而设计的一种改进的方法。由于自回归模型只考虑了误差项中的一阶相关性,因此也称为一阶自回归AR(1)模型,其一般形式为13.4自回归法13.4.1自回归法的基本思想和模型22其中,。可以看出,模型的主体部分与一般的回归模型完全相同,但是其残差序列不满足一般回归模型要求的残差项之间不存在相关性的Gauss-Markov假设,而是存在着系数为的一阶自相关。对于存在一阶自相关的序列,当然不能按普通回归模型进行分析,而应想办法消除残差项中的自相关性。一般的处理方法是对其进行差分。如何实施一阶差分是很重要的,不恰当的差分不但不能消除自相关性,甚至还可能带来相反方向的相关性。适当的差分方法是其中,。23上式表示的是一种加系数的差分处理方法,也就是前面提到过的广义差分。可以看出,只有广义差分的系数恰好等于残差项的一阶自相关系数时,广义差分才能真正消除误差项的一阶自相关性。因此,进行广义差分需要对误差项的一阶自相关系数进行估计。估计的方法较多,一般可通过对原模型的残差序列与其自身滞后一期序列的常数项为0的线性回归分析,将得到的回归系数作为系数的估计值。另外,还可以按下式进行估算,即上式表示的是一种加系数的差分处理方法,也就是前面提到24其中,DW是Durbin-Watson统计量,是对小样本随机误差项的一阶自相关性进行检验的统计量,这在回归分析中已经讲过。SPSS中系数的最终确定通过不断迭代以实现模型拟合优度最高为原则确定。对式(13.21)中的差分形式稍做变换得到上式所示的模型正是本节所讲的一阶自回归模型,可以看出它与一般回归模型十分相似,但其中的解释变量不只是影响被解释变量的外界因素等,还包括了被解释变量自身的一阶滞后序列,正是因为这个特点才称该模型为“自回归”模型。而这个特点也清楚地显示了自回归分析方法的局限性:它只能处理误差项存在一阶自相关的情况,对于可能存在的高阶自相关情况则没有考虑。其中,DW是Durbin-Watson统计量,是对小样本随机2513.5ARIMA模型分析ARIMA模型是随机性时间序列分析中的一大类分析方法的综合,这些方法以序列不同时期间的相关性度量为基础,可以进行精度较高的短期预测。13.5.1ARIMA分析的基本思想和模型ARIMA是自回归移动平均结合(AutoRegressiveIntegratedMovingAverage)模型之前,应首先了解ARMA模型。ARMA模型也称B-J方法,是一种时间序列预测方法。从字面上可以知道,ARMA模型是自回归模型(AR)和移动平均模型(MA)有效组合和搭配的结果,称为自回归移动平均模型。对ARMA的理解可分别从自回归模型AR和移动平均模型MA开始。13.5ARIMA模型分析ARIMA模型是随机性时间序列分26自回归模型认为,时间序列的自回归模型与一般线性回归模型形式相同,差别仅在于模型中的解释变量是被解释变量的1,2,,p阶的滞后变量。意味着一个时间序列的变化受到自身以往状态的影响,影响变化的主要因素是时间序列在不同时期的取值。于是AR(p)模型即为:从AR(p)的定义可知,在去除间接的相关性之后,与它间隔超过p期的序列值将不再相关,因而AR(p)的偏自相关图在p阶函数值之后将呈现截尾性。对AR(p)模型有平稳性的要求,这通过体现,深刻的论述参见时间序列方面的专著。自回归模型认为,时间序列的自回归模型与一般线性回归模型形式相27移动平均模型认为,时间序列模型可根据平均前期预测误差的原则建立,在前一期预测值之上加上预测误差便可得到现在的预测值。于是,经过递推MA(q)模型即为:MA(q)的定义可知,移动平均模型是白噪声序列的q+1个近期值的线性组合,因此,只会影响q+1期的序列值。因而使得相隔时间超过q+1的两个之间不存在相关性,从而使MA(q)的自相关图在q阶函数值之后将呈现截尾。对MA(q)模型有可逆性的要求,这通过来体现,同样请参见相关专著。移动平均模型认为,时间序列模型可根据平均前期预测误差的原则建28ARMA(p,q)模型是建立在AR(p)和MA(q)模型基础上的。对于平稳可逆的模型来说,它事实上是无限阶的AR模型或MA模型的等价形式,因此有效的ARMA模型可以弥补单纯用AR模型或MA模型导致的参数过多的问题,从理论上来讲能够较大地提高估计的精度并且节省计算量。ARMA其一般形式为:其中,等式的左边是模型的自回归部分,非负整数p称为自回归阶数,称为自回归系数;等式右边是模型的移动平均部分,非负整数q称为移动平均阶数,称为移动平均系数。分别是偏自相关函数值和自相关函数值显著不为零的最高阶数。可以看出ARMA(p,q)模型是建立在AR(p)和MA(q)模型基础29当时,模型是纯移动平均模型,记为ARMA(0,q);当时,模型是纯自回归模型,记为ARMA(p,0)。ARMA(p,q)模型可用较少的参数对序列进行较好地拟合,其自相关和偏自相关函数均呈现拖尾性。下表是上述模型的相关图特征列表。通过观察相关图并结合该表可以大致识别出模型的阶数。当时,模型是纯移动平均模型,记为ARMA(30ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列并非平稳序列,不能直接采用ARMA模型。但通常这些序列可通关变换处理后变为平稳序列。对它们的分析一般应采用自回归移动平均结合ARIMA模型。ARIMA模型又分为ARIMA(p,d,q)模型和模型。ARIMA(p,d,q)模型当序列中存在趋势性时,可通过某些阶数的差分处理使序列平稳化。这样的序列被称为是一种准平稳的序列,而相应地分析模型被概括为ARIMA(p,d,q),其中,d表示平稳化过程中差分的阶数。ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列并31模型当序列中同时存在趋势性和季节性的周期和趋势时,序列中存在着以季节周期的整数倍为长度的相关性,需经过某些阶数的逐期差分和季节差分才能使序列平稳化。对这样的准平稳序列的分析模型概括为模型,其中P,Q为季节性的自回归和移动平均阶数,D为季节差分的阶数,s为季节周期。本节讨论了模型的基本原理及在SPSS中的实现过程。模型是自回归模型的扩充形式,是随机性时间序列分析的代表性方法。这种模型有科学严密的理论体系,对波动性较强的时间序列能给出比较准确的模型,因而是当前比较常用的时间序列分析方法之一。
3213.6季节调整法本节所讨论的季节调整方法的本质就是要对时间序列的周期性进行识别和分解。一般的时间序列分析的论述中将这种方法局限在那些与年、季、月等相关的周期性的分析上,把这样的周期性变动称为季节性变动(seasonalfluctuation),而将其他的周期性变动统称周期性(periodicity)。不过一般认为季节调整方法完全可用于序列中各种周期性成分的识别和提取。13.6季节调整法本节所讨论的季节调整方法的本质就是要对时3313.6.1季节调整法的基本思想和模型季节调整法认为,时间序列是由四种成分构成的,它们分别是:趋势性T(Trend)、季节性S(SeasonalFluctuation)、周期性P(Periodicity)和不规则波动性I(IrregularVariations)。这些成分通过不同的组合方式影响时间时间序列的发展变化。时间序列分析的季节调整法从这个角度出发理解时间序列的构成因素,并将其转化成可量化的季节模型。通过季节模型能够反映出时间序列在一个周期内所呈现的典型状态,而这种状态在不同周期以基本相同的形态出现。季节调整模型通常分为加法模型和乘法模型。13.6.1季节调整法的基本思想和模型341、加法模型加法模型认为时间序列是由趋势性、季节性、周期性和不规则波动性叠加形成的。一般来说,加法模型适用于那些随着时间的推移,波动幅度没有明显变化的序列。加法模型的一般形式为2、乘法模型乘法模型认为时间序列是由趋势性、季节性、周期性和不规则波动性交乘形成的。一般来说,乘法模型适用于那些随时间的推移,波动幅度随之增大或减小的序列。乘法模型的一般形式为1、加法模型2、乘法模型35实际分析当中还会遇到其他的模型形式,但往往都是由以上两种模型变化而来的。他们或者因为某种成分无需考虑而将其舍去,或者是两种模型的某种组合等。另外,在一些书的讨论中往往将趋势仅仅局限于线性,实际上只要能明确识别出趋势的类型,非线性的趋势也可以引入到季节调整模型中,这样可大大拓宽季节调整方法的应用范围。季节模型通常都是由季节指数构成的,他们能够刻画出现象在一个周期内各时段的典型数量特征。若分析的数据是月度数据,而周期为一年,季节模型就由12个指数构成;若分析的数据是季度数据,季节模型就由4各指数构成;各个指数是以全年月或季的平均数为基础计算出来的。实际分析当中还会遇到其他的模型形式,但往往都36下面以一般的月(季)形式的季节周期来说明计算过程。分析季节变动的方法较多,常见的有按月(季)平均法和趋势剔除法等。按月(季)平均法是根据原时间序列通过平均计算季节指数的方法。其基本思想是,为消除随机性的影响,计算各年同月(或季)的平均数作为该月(或季)的代表值;然后计算出总月(或季)的平均数作为全年的代表值;最后将同月(或季)平均数与总月(或季)的平均数对比,结果即为季节指数。趋势剔除法的基本思想与按月(或季)类似,它首先将时间序列中的长期趋势消除,然后再利用按月(季)平均法计算季节指数。序列中的趋势值可采用移动平均法或最小二乘法求得,分别称为移动平均趋势剔除法和趋势剔除法。在乘法模型中,各因素的消除可通过除法实现。下面以一般的月(季)形式的季节周期来说明计算3713.7案例分析一
看一个时间序列的数据例子。这是某企业从1998年1月到2010年12月的销售数据(单位:百万元)。该数据有按照时间顺序的按月记录,共156个观测值。数据表13-1(tssale.sav)。13.7案例分析一看一个时间序列的数据例子。这是某企业从38从该表格中的众多数据只能看出一个大概,即总的趋势是增长的,但有起伏。利用散点图则可以得到对该数据更加直接的印象。在SPSS中通过选用【分析】【预测】【序列图】,我们可以得到时间序列图13.1。从这个点图可以看出,总的趋势是增长的,但增长并不是单调上升的;有涨有落。大体上看,这种升降不是杂乱无章的,和季节或月份的周期有关。当然,除了增长趋势和季节影响之外,还有些无规律的的随机因素的影响。从该表格中的众多数据只能看出一个大概,即总的趋势是增长的,但39从上面的例子不难看出时间序列可以有三部分组成:趋势季节、季节成分和无法用趋势和季节模式解释的随机干扰。如果要想对一个时间序列本身进行较深入的研究,把序列的这些成分分解出来、或者把它们过滤掉则会有很大的帮助。对案例中的时间序列通过SPSS软件进行分解,则可以轻而易举地得到该序列的趋势、季节和误差成分。下面的图13.2表示了去掉季节成分,只有趋势和误差成分的序列的一条曲线。图13.3用曲线描绘了纯季节成分。图13.4用曲线描绘了纯趋势成分。图13.5描绘了纯误差成分。从上面的例子不难看出时间序列可以有三部分组成:趋势季节、季节40一次指数平滑法课件41一次指数平滑法课件4213.7案例分析二本案例中,我们仍使用案例一中的数据。下面就如何使用SPSS19.0做指数平滑分析进行说明。演示步骤如下:1)启动SPSS软件,打开【数据编辑器】对话框,输入销售数据;2)选中工具菜单栏中【分析】、子菜单【预测】、【创建模型】,如图13.6所示;13.7案例分析二本案例中,我们仍使用案例一中的数据。下面就43一次指数平滑法课件443)选中“创建模型”后,能得到如图13.7所示的时间序列建模器;3)选中“创建模型”后,能得到如图13.7所示的时间序列建模454)选入相应的因变量,并在方法栏中选用指数平滑法,便可得到如图13.8所示的指数平滑曲线。4)选入相应的因变量,并在方法栏中选用指数平滑法,便可得到如4613.8案例分析三这是一个销售时间序列(数据见图13.9)。它以每周七天为一个季节周期;除了销售额序列sales之外,它还有一个广告花费的独立变量adds。先不理睬这个独立变量,把该序列当成纯粹的时间序列来用ARIMA模型拟合。该序列的点图在图13.10中。然后再首先出其acf和pacf条形图(图13.11).13.8案例分析三这是一个销售时间序列(数据见图13.947一次指数平滑法课件48一次指数平滑法课件49从图13.11可以看出,销售数据的acf图显然不是拖尾模式,因此,必须进行差分以消除季节影响。试验多次之后,看上去的结果还可以接受。拟合之后,残差的pacf和acf条形图展示在图13.12中。从图13.11可以看出,销售数据的acf图显然不是拖尾模式,50继续改进我们的模型,再把独立变量广告支出加入模型,最后得到的带有独立变量adds的模型。拟合后残差的acf和pacf图在图13.13中。继续改进我们的模型,再把独立变量广告支出加入模型,最后得到的51从各种角度来看拟合带独立变量平方的模型给出更好的结果。虽然从上面的acf和pacf图看不出独立变量对序列的自相关性的影响,但是根据另外的一些判别准则,独立变量的影响是显著地;而且加入独立变量是的模型更加有效。要注意,一些独立变量的效果也可能是满足某些时间序列模型的,也可能会和季节、趋势等效应混杂起来不易分辨。这时,模型选择可能就比较困难。也可能不同模型会有类似的效果。一个时间序列在各种相关的因素下的模型选择并不是一件简单明了的事情。实际上没有任何统计模型是绝对正确的,它们的区别在于,在某种意义上,一些模型的某些性质可能要优于另外一些。从各种角度来看拟合带独立变量平方的模型给出更好52第13章SPSS的时间序列分析13.1时间序列分析概述13.2指数平滑13.3建立自回归序列的新变量13.4自回归13.5季节分解法13.6案例分析一13.7案例分析二13.8案例分析三第13章SPSS的时间序列分析13.1时间序列分析概述53时间序列分析(TimeSeriesAnalysis)是研究事物发展变化规律的一种量化分析方法,隶属于统计学但又有不同于其他统计分析方法的特殊特点。近年来,时间序列分析的理论和应用研究一直是人们关注的热点,也取得了很大的进步。对于时间序列一词可以有不同层次的理解。一般情况下,那些依时间先后顺序排列起来的一系列有相同内涵的数据都可以称为时间序列。在这个意义上来看,时间序列在日常生活中时无处不在的。从国家社会等宏观角度看,我们常常听到的GDP、物价指数、股票指数等可以构成时间序列;从微观角度看,一个13.1时间序列分析概述时间序列分析(TimeSeriesAnal54家庭每天的开支、一个工人的每天的工作量、一个学生每天的伙食费,等等,也可以构成时间序列。事实上,万事万物的变化发展所表现出来的各种特征,只要能够被持续的观察和度量,同时被记录,就能够得到所谓的时间序列。时间序列与一般的统计数据的不同之处在于:这是一些有严格先后顺序的数据。不同时间点或时间段对应的数据之间可能是没有关联互相独立的,但大多数情况下它们之间往往存在着某种前后相承的关系,而非互相独立。因此,对这类数据的分析和研究需要一些特殊的方法。时间序列分析就是包含了针对这种独特数据特点而形成和发展起来的一系列统计分析方法的一个完整的体系。家庭每天的开支、一个工人的每天的工作量、一个学生每天的伙食费5513.1.1时间序列的相关概念通常,将时间序列描述成一个有序的数列:,其中下标表示时间序号。对上述数列可以有以下几种理解:第一,为一个有先后顺序且时间间隔均匀的数列。第二,为随机变量族或随机过程的一个“实现”。即在每一个固定的时间点t上,将现象看做是一个具有多种可能事实的随机变量。每一个只是随机变量由于种种原因而表现出来的一个结果,而在所有被关注时间点上,就是一系列随机变量所表现出来的一个结果,通常称做一个实现或一个现实,也可以称做一个轨道。13.1.1时间序列的相关概念56●指标集T指标集T可直观理解为时间t的取值范围。对一般的随机过程来说它是一个连续的变化范围,如可取,此时上述随机过程可相应地记为。时间序列分析一般只涉及离散的时间点,如t可取,此时的随机过程记为,又由于0点的相对性,一般的t可取。●采样间隔采样间隔可直观理解为时间序列中相邻两个数的时间间隔。在实际研究中。在整个数据期间一般都取一致的时间间隔,这样会使分析结果更具直观意义,更易使人信服。如在实际当中T为时,若取个时间点,则采样间隔为。●指标集T●采样间隔57●平稳随机过程和平稳时间序列在一些时间序列分析方法当中要求时间序列具有平稳性,即要求时间序列对应的随机过程是一个平稳的随机过程。平稳随机过程定义如下:如果对和任意整数n,都使与同分布,则概率空间(W,F,P)上的随机过程称为平稳过程。从这个定义可以看出平稳性实质上是要求随机过程包含的任意有限维随机变量族的统计特性具有时间上的平移不变性。这是一种非常严格的平稳性要求,而要刻画和度量这种平稳性,需要掌握个随机变量或随机变量族的分布或联合分布,这在实践当中是非常困难甚至是不可能的。因此这种平稳性一般被称为“严平稳”或者“完全平稳”。●平稳随机过程和平稳时间序列58●白噪声序列白噪声序列是一种特殊的平稳序列。它定义为:若随机序列{yt}由互不相关的随机变量构成,即对所有,则称其为白噪声序列。可以看出,白噪声序列是一种平稳序列,在不同时点上的随机变量的协方差为0。该特性通常被称为“无记忆性”,意味着人们无法根据其过去的特点推测其未来的走向,其变化没有规律可循。虽然有这个特点,但白噪声序列却是其他时间序列得以产生的基石,这在时间序列的ARIMA模型分析中体现得相当明显。另外,时间序列分析当中,当模型的残差序列成为白噪声序列时,可认为模型达到了较好的效果,剩余残差中已经没有可以识别的信息。因此,白噪声数列对模型检验也是很有用处的。●白噪声序列59●时点序列和时期序列实际当中,人们研究的时间序列是前面提到的随机过程的一个“实现”,也就是那些按时间先后顺序排列的一系列数据。这些数据往往由两部分组成:一是观测值;二是观察值对应的时间点或时间段。一般情况下,时期数据和时点数据之间可以通过将时期数据累加、或者将时点数据后项减前项或后项比前项的处理方式互相转换。不过随着这种转换,序列包含的实际意义也会有所变化,相应变量的统计性质也会有很大的变化,对应的分析处理方法也会有很大的不同。●时点序列和时期序列6013.1.2时间序列分析的一般步骤时间序列分析一般需经过数据的准备、数据的观察及检验、数据的预处理、数据的分析和建模、模型的评价、模型的实施应用等几个阶段。●数据的准备阶段●数据的观察及检验阶段●数据的预处理阶段●数据的分析和建模阶段●模型的评价阶段●模型的实施应用阶段13.1.2时间序列分析的一般步骤6113.1.3SPSS时间序列分析的特点SPSS的时间序列分析没有自成一体的单独模块,而是分散在Data、Transform、Analyze、Graph四个功能菜单当中。在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;在Analyze和TimeSeries中主要提供了四种时间序列分析方法,包括指数平滑法、自回归法、ARIMA模型和季节调整方法;在Graph中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等。另外,也可利用SPSS的谱分析图等模块进行简单的谱分析。13.1.3SPSS时间序列分析的特点6213.2数据准备数据准备是利用SPSS进行时间序列分析的一个首要任务,它对以后的分析起着举足轻重的作用,是数据分析的基础。通过前面的讨论可知,时间序列最显著的特点就是数据有着严格的先后顺序,并且与一定时间点或时间段相对应。因此,要把一系列SPSS变量数据当做时间序列数据来分析,就必须首先指明每个数据对应的时间点或时间段,以及整个数据所对应的期间。SPSS的数据准备正是用来完成这些任务的。数据期间的选取也是时间序列分析中经常遇到的问题。所谓数据期间的选取是指,如果分析过程中只希望选取全部样本期中的部分时段数据进行分析,则应首先指定该时间段的起止时间。对此可通过SPSS的样本选取(SelectCases)功能实现。13.2数据准备6313.3指数平滑法13.3.1指数平滑法的基本思想为掌握指数平滑法的基本思想应首先了解移动平均的思想。研究时间序列的一个重要目的是预测。现实当中事物的发展都是有连续性的,事物过去的表现与现在的状态有关,现在的状态又与将来的可能表现有一定的联系。因此,可以从现有数据入手通过构造某种计算方法实现对未来的预测。基于这种思想可以构造出丰富多彩的预测模型。移动平均法正是这样一种利用已知值的某种平均值进行预测的方法。移动平均包括简单移动平均法和加权移动平均法。13.3指数平滑法13.3.1指数平滑法的基本思想64简单移动平均法是利用一定时间跨度t下数据的简单平均实现对下一期值的预测,即
可见,简单移动平均认为,时间跨度内的所有数据对未来的预测贡献全部相同。然而,众所周知,事物的当前状态与其在过去时间所有点上的表现之间联系的紧密程度并不完全一致,因此这样的预测有时可能出现很大的偏差。通常,序列数据在近期的表现比远期的表现与现实状态的联系更加紧密。因此,预测时对过去的数据应给予不同的重视程度。简单移动平均法是利用一定时间跨度t下数据的简单平均实现对下一65加权移动平均法是对简单移动平均法的改进,通过不同的权数体现对过去状态的不同重视程度。重视程度越高、与现实联系密切的时间点对应较大的权数,而重视程度低、与现实联系松散的时间点则对应较小的权数。即不同事物的发展规律是不同的,同一种事物随时间的推移其变化规律也会发生变化。所以,权数应随不同的问题、不同的时间变换而变化。通常,权数确定没有一定之规,一般可参照几种典型的具有代表性的方法来设计权数。加权移动平均法是对简单移动平均法的改进,通过6613.3.2指数平滑法的模型指数平滑法因权数选择和平滑方法的不同而分成多种模型形式。虽然他们都基于上述基本思想,但在具体实现上还有所差别,也有不同的适用场合。下面介绍常用的几种模型。一次指数平滑法(简单指数平滑法)一次指数平滑法是简单移动平均法的变形,模型为其中,是t时刻的一次指数平滑值,n为移动步长,整理后得:。13.3.2指数平滑法的模型其中,是t时刻的一次指数67如果令,则。其中为一次平滑模型中的平滑常数,且显然。由则可见,指数平滑法是以前t+1期的平滑值作为当期的预测值。如果令,则68二次指数平滑法(线性指数平滑法)二次指数平滑也称双重指数平滑,是对一次指数平滑值再进行一次平滑。一次指数平滑法是直接利用平滑值作为预测值,而二次指数平滑则是利用平滑值对时间序列的线性趋势进行修正,进而建立线性平滑模型进行预测。二次指数平滑法包括布朗(Brown)单一参数线性指数平滑、霍特(Holt)双参数指数平滑等。布朗单一参数线性指数平滑布朗单一参数线性指数平滑的一次平滑公式为
一次指数平滑法课件69布朗单一参数线性指数平滑的二次平滑公式为式中,为一次指数平滑值,为二次指数平滑值。由两个平滑值计算线性平滑模型的两个参数:,,从而得到线性指数平滑模型
式中,m为超前期数。当t=1时,由于和是平滑初始值,需事先给定。布朗单一参数线性指数平滑适用于有线性趋势的时间序列。布朗单一参数线性指数平滑的二次平滑公式为由两个平滑值计算线性70三次指数平滑法三次指数平滑法也称三重指数平滑,与二次指数平滑类似,也不直接将平滑值作为预测值,而是服务于模型建立。三次指数平滑包括布朗三次指数平滑、温特(Winter)线性和季节性指数平滑。布朗三次指数平滑布朗三次指数平滑是对二次指数平滑值再进行一次平滑,并用以估计二次多项式参数。其一般模型为由上式可知,布朗三次指数模型并非一个线性模型,而是类似于二次多项式的曲线模型,可表现时间序列的曲线变化趋势。其中
三次指数平滑法由上式可知,布朗三次指数模型并非一个线性模型,71各次平滑形式分别为布朗三次指数平滑模型适用于有非线性趋势存在的序列。各次平滑形式分别为布朗三次指数平滑模型适用于有非线性趋势存在72温特线性和季节指数平滑温特线性和季节指数平滑模型的一般形式为上式中包含三种成分,它们分别是平稳性、趋势性和季节性。为季节周期长度,为季节调整因子,分别为模型的三个初始参数。其中
温特线性和季节性指数平滑模型适用于同时具有趋势性和季节性的时间序列,且只适用于短期预测。温特线性和季节指数平滑温特线性和季节性指数平滑模型适用于同时7313.4自回归法13.4.1自回归法的基本思想和模型利用简单回归分析法进行时间序列分析时,模型要求各期的随机误差项之间是不相关的。在前文的平稳随机过程的定义中也介绍过,只有误差项中不存在任何可利用的信息时,才能够认为模型已经达到了最优。而当误差项之间存在相关性时,一方面常用的估计方法不再具有优良性,普通的简单回归模型存在着较大的缺陷;另一方面也说明模型对序列中的信息没有充分地提取。自回归模型,简写为AR模型,正是针对模型误差项存在相关性的情况而设计的一种改进的方法。由于自回归模型只考虑了误差项中的一阶相关性,因此也称为一阶自回归AR(1)模型,其一般形式为13.4自回归法13.4.1自回归法的基本思想和模型74其中,。可以看出,模型的主体部分与一般的回归模型完全相同,但是其残差序列不满足一般回归模型要求的残差项之间不存在相关性的Gauss-Markov假设,而是存在着系数为的一阶自相关。对于存在一阶自相关的序列,当然不能按普通回归模型进行分析,而应想办法消除残差项中的自相关性。一般的处理方法是对其进行差分。如何实施一阶差分是很重要的,不恰当的差分不但不能消除自相关性,甚至还可能带来相反方向的相关性。适当的差分方法是其中,。75上式表示的是一种加系数的差分处理方法,也就是前面提到过的广义差分。可以看出,只有广义差分的系数恰好等于残差项的一阶自相关系数时,广义差分才能真正消除误差项的一阶自相关性。因此,进行广义差分需要对误差项的一阶自相关系数进行估计。估计的方法较多,一般可通过对原模型的残差序列与其自身滞后一期序列的常数项为0的线性回归分析,将得到的回归系数作为系数的估计值。另外,还可以按下式进行估算,即上式表示的是一种加系数的差分处理方法,也就是前面提到76其中,DW是Durbin-Watson统计量,是对小样本随机误差项的一阶自相关性进行检验的统计量,这在回归分析中已经讲过。SPSS中系数的最终确定通过不断迭代以实现模型拟合优度最高为原则确定。对式(13.21)中的差分形式稍做变换得到上式所示的模型正是本节所讲的一阶自回归模型,可以看出它与一般回归模型十分相似,但其中的解释变量不只是影响被解释变量的外界因素等,还包括了被解释变量自身的一阶滞后序列,正是因为这个特点才称该模型为“自回归”模型。而这个特点也清楚地显示了自回归分析方法的局限性:它只能处理误差项存在一阶自相关的情况,对于可能存在的高阶自相关情况则没有考虑。其中,DW是Durbin-Watson统计量,是对小样本随机7713.5ARIMA模型分析ARIMA模型是随机性时间序列分析中的一大类分析方法的综合,这些方法以序列不同时期间的相关性度量为基础,可以进行精度较高的短期预测。13.5.1ARIMA分析的基本思想和模型ARIMA是自回归移动平均结合(AutoRegressiveIntegratedMovingAverage)模型之前,应首先了解ARMA模型。ARMA模型也称B-J方法,是一种时间序列预测方法。从字面上可以知道,ARMA模型是自回归模型(AR)和移动平均模型(MA)有效组合和搭配的结果,称为自回归移动平均模型。对ARMA的理解可分别从自回归模型AR和移动平均模型MA开始。13.5ARIMA模型分析ARIMA模型是随机性时间序列分78自回归模型认为,时间序列的自回归模型与一般线性回归模型形式相同,差别仅在于模型中的解释变量是被解释变量的1,2,,p阶的滞后变量。意味着一个时间序列的变化受到自身以往状态的影响,影响变化的主要因素是时间序列在不同时期的取值。于是AR(p)模型即为:从AR(p)的定义可知,在去除间接的相关性之后,与它间隔超过p期的序列值将不再相关,因而AR(p)的偏自相关图在p阶函数值之后将呈现截尾性。对AR(p)模型有平稳性的要求,这通过体现,深刻的论述参见时间序列方面的专著。自回归模型认为,时间序列的自回归模型与一般线性回归模型形式相79移动平均模型认为,时间序列模型可根据平均前期预测误差的原则建立,在前一期预测值之上加上预测误差便可得到现在的预测值。于是,经过递推MA(q)模型即为:MA(q)的定义可知,移动平均模型是白噪声序列的q+1个近期值的线性组合,因此,只会影响q+1期的序列值。因而使得相隔时间超过q+1的两个之间不存在相关性,从而使MA(q)的自相关图在q阶函数值之后将呈现截尾。对MA(q)模型有可逆性的要求,这通过来体现,同样请参见相关专著。移动平均模型认为,时间序列模型可根据平均前期预测误差的原则建80ARMA(p,q)模型是建立在AR(p)和MA(q)模型基础上的。对于平稳可逆的模型来说,它事实上是无限阶的AR模型或MA模型的等价形式,因此有效的ARMA模型可以弥补单纯用AR模型或MA模型导致的参数过多的问题,从理论上来讲能够较大地提高估计的精度并且节省计算量。ARMA其一般形式为:其中,等式的左边是模型的自回归部分,非负整数p称为自回归阶数,称为自回归系数;等式右边是模型的移动平均部分,非负整数q称为移动平均阶数,称为移动平均系数。分别是偏自相关函数值和自相关函数值显著不为零的最高阶数。可以看出ARMA(p,q)模型是建立在AR(p)和MA(q)模型基础81当时,模型是纯移动平均模型,记为ARMA(0,q);当时,模型是纯自回归模型,记为ARMA(p,0)。ARMA(p,q)模型可用较少的参数对序列进行较好地拟合,其自相关和偏自相关函数均呈现拖尾性。下表是上述模型的相关图特征列表。通过观察相关图并结合该表可以大致识别出模型的阶数。当时,模型是纯移动平均模型,记为ARMA(82ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列并非平稳序列,不能直接采用ARMA模型。但通常这些序列可通关变换处理后变为平稳序列。对它们的分析一般应采用自回归移动平均结合ARIMA模型。ARIMA模型又分为ARIMA(p,d,q)模型和模型。ARIMA(p,d,q)模型当序列中存在趋势性时,可通过某些阶数的差分处理使序列平稳化。这样的序列被称为是一种准平稳的序列,而相应地分析模型被概括为ARIMA(p,d,q),其中,d表示平稳化过程中差分的阶数。ARMA模型只适合于对平稳序列的分析。实际应用中的时间序列并83模型当序列中同时存在趋势性和季节性的周期和趋势时,序列中存在着以季节周期的整数倍为长度的相关性,需经过某些阶数的逐期差分和季节差分才能使序列平稳化。对这样的准平稳序列的分析模型概括为模型,其中P,Q为季节性的自回归和移动平均阶数,D为季节差分的阶数,s为季节周期。本节讨论了模型的基本原理及在SPSS中的实现过程。模型是自回归模型的扩充形式,是随机性时间序列分析的代表性方法。这种模型有科学严密的理论体系,对波动性较强的时间序列能给出比较准确的模型,因而是当前比较常用的时间序列分析方法之一。
8413.6季节调整法本节所讨论的季节调整方法的本质就是要对时间序列的周期性进行识别和分解。一般的时间序列分析的论述中将这种方法局限在那些与年、季、月等相关的周期性的分析上,把这样的周期性变动称为季节性变动(seasonalfluctuation),而将其他的周期性变动统称周期性(periodicity)。不过一般认为季节调整方法完全可用于序列中各种周期性成分的识别和提取。13.6季节调整法本节所讨论的季节调整方法的本质就是要对时8513.6.1季节调整法的基本思想和模型季节调整法认为,时间序列是由四种成分构成的,它们分别是:趋势性T(Trend)、季节性S(SeasonalFluctuation)、周期性P(Periodicity)和不规则波动性I(IrregularVariations)。这些成分通过不同的组合方式影响时间时间序列的发展变化。时间序列分析的季节调整法从这个角度出发理解时间序列的构成因素,并将其转化成可量化的季节模型。通过季节模型能够反映出时间序列在一个周期内所呈现的典型状态,而这种状态在不同周期以基本相同的形态出现。季节调整模型通常分为加法模型和乘法模型。13.6.1季节调整法的基本思想和模型861、加法模型加法模型认为时间序列是由趋势性、季节性、周期性和不规则波动性叠加形成的。一般来说,加法模型适用于那些随着时间的推移,波动幅度没有明显变化的序列。加法模型的一般形式为2、乘法模型乘法模型认为时间序列是由趋势性、季节性、周期性和不规则波动性交乘形成的。一般来说,乘法模型适用于那些随时间的推移,波动幅度随之增大或减小的序列。乘法模型的一般形式为1、加法模型2、乘法模型87实际分析当中还会遇到其他的模型形式,但往往都是由以上两种模型变化而来的。他们或者因为某种成分无需考虑而将其舍去,或者是两种模型的某种组合等。另外,在一些书的讨论中往往将趋势仅仅局限于线性,实际上只要能明确识别出趋势的类型,非线性的趋势也可以引入到季节
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《确定品牌定位》课件
- 天津大学管理经济学复习要点四大才子之一版
- 大学体育与健康 教案 武术散打5
- 大学体育与健康 教案 网球11
- 上海师范大学天华学院-教务处
- 湖北汽车工业学院《智能仪表与过程控制》2021-2022学年第一学期期末试卷
- 智慧园区设计方案
- 胆道疾病的营养治疗
- 《E基础知识培训》课件
- 元宵节主题模板38
- 新能源小镇建设方案
- 中国PCI冠脉介入指南专业解读
- 幻肢痛的综合治疗通用课件
- 校园网络监控系统调试及试运行方案
- 2024届高三英语二轮复习:读后续写 告别鹦鹉 讲义素材
- 《金瓶梅》的人性研究
- 中班游戏教案坐传球
- 桑树种植行业分析
- 云计算与人工智能的协同应用
- 篮球专业职业生涯规划与管理
- GB 43472-2023灯具及灯具用电源导轨系统安全要求
评论
0/150
提交评论