第十一章SPSS的时间序列分析_第1页
第十一章SPSS的时间序列分析_第2页
第十一章SPSS的时间序列分析_第3页
第十一章SPSS的时间序列分析_第4页
第十一章SPSS的时间序列分析_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章SPSS的时间序列分析第一节时间序列分析概述一、相关概念时间序列:有序的数列:y1,y2,y3,…yt理解:1、有先后顺序且时间间隔均匀的数列;2、随机变量族或随机过程的一个“实现”,即在每一个固定时间点t上,现象yt看作是一个随机变量,y1,y2,y3,…yt是一系列随机变量所表现的一个结果。时间序列分析的一般步骤1、数据准备收集数据,按恰当格式组织2、数据的观察与检验阶段总体把握时间序列发展变化特征,图形法等3、数据的预处理阶段必要的变换,特征更加明显利于模型选择,满足模型要求4、数据分析和建模阶段时间序列模型时域:一、成熟方法:简单回归分析:研究变量间关系,用一个或几个变量的变化解释所关注变量的变化规律,适合于序列间的结构分析,较长期预测;趋势外推:利用各种特征曲线进行拟合,适合于精度要求不高的中长期预测;指数平滑:利用平滑去除随机干扰时间序列模型二、随机型时间序列模型:ARMA模型(B-J):一种典型的随机型时间序列分析方法,常用于随机性波动较频繁序列的短期预测。适合于平稳序列的分析。对于非平稳序列,通过差分或季节差分以及各种变换进行平稳化处理后采用,统称为ARIMA模型ARCH模型:自回归条件异方差模型,对于一个时间序列而言,在不同时刻可利用的信息不同,而相应的条件方差也不同,利用ARCH模型,可以刻划出随时间而变异的条件方差。时间序列分析的一般步骤5、模型评价阶段预测精度:SSE、MAPE、拟合优度、预测值方差横向关系:F统计量、t统计量、AIC、SBC6、模型的实施应用阶段第二节数据准备一、数据文件建立二、时间定义Data>DefineDates多种时间形式三、数据期间的选取Data>SelectCases第三节时间序列的图形化观察一、目的正态性平稳性:B-J法要求二阶宽平稳性周期性其他:异常值等第三节时间序列的图形化观察二、时间序列的图形化观察工具1、序列图Analyze>Forecasting>SequenceChart举例:GDP,具有上升趋势的非平稳序列月度电信业务收入,具有上升趋势和周期性的非平稳序列2、直方图平稳性、正态性第三节时间序列的图形化观察3、自相关函数图(ACF)和偏自相关函数图(PACF)序列平稳性考察中首要的图形工具,用于识别时间序列的各种非平稳性和确定时序模型中的参数具有重要作用。自相关函数图(ACF)和偏自相关函数图(PACF)是以自相关函数和偏自相关函数为依据绘制的图形Analyze>Forecasting>Autocorrelations第三节时间序列的图形化观察举例:GDP序列的各阶自相关函数值显著不为0,同时随着阶数的增加,函数值呈下降趋势;偏自相关函数值则呈明显下降趋势,很快落入置信区间。判断:具有明显上升趋势的非平稳序列,两阶差分后,具有白噪声特征第三节时间序列的图形化观察举例:月度电信业务收入序列的各阶自相关函数值显著不为0,同时随着阶数的增加,函数值呈下降趋势;偏自相关函数值则呈明显下降趋势,很快落入置信区间。自相关函数呈周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为0判断:具有明显上升趋势和周期性的非平稳序列第三节时间序列的图形化观察4、互相关图(CCF)对两个互相对应的时间序列进行相关性分析,检验一个序列与另一个序列的滞后序列之间的相关性Analyze>Forecasting>CrossCorrelations举例:GDP与通信业务收入,0阶滞后相关性最显著第四节时间序列的预处理一、缺失数据的处理二、变换处理平稳化处理:目的是使处理后的序列成为平稳序列,均值平稳化一般采用差分处理,差分通过逐项相减消除前后期数据相关性,可大致剔除序列中的趋势性。Transform>CreateTimeSeries第五节指数平滑法Xt代表数据,Tt,St,Rt

分别代表趋势值,季节加量,随即干扰,则有Xt=Tt+St+Rt线形模型的指数平滑法(HoltExponentialsmoothingmodel)线形模型的二次指数平滑法

(BrownExponentialsmoothingmodel)比例模型的指数平滑法

(Muir

Exponentialsmoothingmodel)季节模型的指数平滑法

(WintersExponentialsmoothingmodel)第六节ARIMA模型ARIMA模型全称为自回归移动平均模型(AutoregressiveIntegratedMovingAverageModel,简记ARIMA),是由博克思(Box)和詹金斯(Jenkins)于70年代初提出的著名时间序列预测方法,所以又称为box-jenkins模型、博克思-詹金斯法。在ARIMA(p,d,q)模型中,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。(后面将具体介绍此部分)ARIMA模型的基本思想将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。2、方法性工具2.1差分运算2.2后移算子2.1差分运算一阶差分P阶差分K步差分2.2后移算子后移算子(也称延迟算子)类似于一个时间指针,当前序列值乘以一个后移算子,就相当于把当前序列值的时间向过去拨了一个时刻。记B为后移算子,有用后移算子与差分运算的关系2.2后移算子3、ARIMA模型3.1AR模型(AutoRegressionModel)

3.2MA模型(MovingAverageModel)

3.3ARMA模型(AutoRegressionMovingAveragemodel)3.4ARIMA模型(AutoregressiveIntegratedMovingAverageModel)引例:当一个时间序列中,Xt和Xt-1有线性相关时,类似于Y与X的线性相关,我们可以用线性回归方程表示Xt和Xt-1之间的关系。上式中将Xt分为两部分:一部分由过去值Xt-1表示,另一部分由独立于的随机剩余项表示。这样,建立起来Xt和自己过去值的线性回归,称为自回归模型,其需满足随机项为白噪声序列,即如下条件:3.1AR(自回归)模型3.1AR(自回归)模型一般地,如果和p个过去值有关则是p阶自回归模型,记为AR(p),表达式为:或者计算AR模型就是要知道和几个过去值有关(p=?),相关关系如何,解得各阶Φ的值。3.1AR(自回归)模型除AR模型外,另一类特殊的时间序列模型为移动平均模型MA。q阶MA模型记作MA(q),观测值Xt被描述为过去误差的线性回归:或者MA模型的目的就是求各个θ的估计值。3.2MA(移动平均)模型3.3ARMA模型对于AR(p)模型,如果误差项不是白噪声,而是表现为MA(q)形式,则是ARMA(p,q)模型,即:3.4ARIMA模型运用ARMA模型的前提条件是,用作预测的时间序列是已经由一个零均数的平稳随机过程产生的,反映在图形上就是所有的样本点都围绕某一水平直线上下随机波动。所以,对于某些不平稳的序列必须经过差分变换。右图是1992年1月到2007年12月的电信收入序列(有缺失值)。蓝色为原观测序列,绿色和黄色分别为一次和二次差分后的序列。可以看出,差分后的序列成为平稳的随机序列。3.4ARIMA模型经过差分变换后的序列再应用ARMA模型,称为ARIMA模型(Autoregressiveintegratedmovingaveragemodels)。记作:其中,Wt是指差分过的序列。如果是对观测序列的d阶差分,则记作ARIMA(p,d,q)。这时模型需要对p,d,q定阶,而且需要对Φ

和θ做出估计。AR(p)和MA(q)模型实际上是ARIMA的特殊情况。还有ARIMA的季节模型(SeasonalModels),在这里不作讨论。4、ARIMA模型建模步骤4.1时间序列的平稳性4.2模型识别4.3参数估计和模型诊断4.4预测4.1时间序列的平稳性平稳时间序列的基本概念设Xt是一个随机的时间序列,即是对每个固定的t,Xt是一个随机变量,如果满足下述条件:则Xt称为宽平稳时间序列,rk称为自协方差函数。平稳时间序列的重要方法就是进行差分。4.2模型识别两个重要概念:自相关函数(AutocorrelationFunction,AFC)偏自相关函数PACF对于平稳AR(p)序列,所谓滞后k偏自相关系数就是指在给定中间k-1个随机变量的条件下,或者说,在剔除了中间k-1个随机变量的干扰之后,对影响的相关度量。用数学语言描述就是4.2模型识别模型识别主要是通过读ACF图和PACF图为目标序列定阶,即识别p,q的值,提供几个粗的模型以便进一步分析完善。例如:样本ACF(自相关)图样本PACF(偏自相关)图4.2模型识别模型定阶的经验方法如果样本(偏)自相关系数在最初的d阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然。这时,通常视为(偏)自相关系数截尾。ARMA模型相关性特征模型自相关系数偏自相关系数AR(P)拖尾P阶截尾MA(q)q阶截尾拖尾ARMA(p,q)拖尾拖尾4.3参数估计和模型诊断参数估计是对识别阶段提供的粗模型参数估计并假设检验(具体估计方法略,可以用统计工具直接计算),做出模型的诊断。模型识别和参数估计及模型诊断过程往往是一个模型逐渐完善的过程,需要不断修正最初的选择。4.3参数估计和模型诊断模型的显著性检验目的检验模型的有效性(对信息的提取是否充分)检验对象残差序列判定原则一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,即残差序列应该为白噪声序列。反之,如果残差序列为非白噪声序列,那就意味着残差序列中还残留着相关信息未被提取,这就说明拟合模型不够有效。4.3参数估计和模型诊断模型的拟合效果1、AIC准则——最小信息量准则(AnInformationCriterion)

指导思想——似然函数值越大越好,未知参数的个数越少越好AIC统计量(越小越好)缺陷:在样本容量趋于无穷大时,由AIC准则选择的模型不收敛于真实模型,它通常比真实模型所含的未知参数个数要多。2、SBC准则SBC统计量4.3参数估计和模型诊断例:用AIC准则和SBC准则评判两个拟合模型的相对优劣

结果AR(1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论