版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学,从数据到结论,第十五章时间序列分析,时间序列数据的横断面数据,人们经常可以根据自己的特点从两个方面切入统计数据来简化分析过程。一种是研究所谓的横截面数据,即由不同物体的观察值组成的数据,这些观察值基本上是同时的或与时间无关的。横断面数据为时间序列数据,另一种称为时间序列,即由不同时间物体的观测值形成的数据。上面讨论的大多数模型都与横截面数据相关。时间序列的分析将在这里讨论。我们将不讨论包括这两个方面的更复杂的数据。时间序列和回归,时间序列分析也是一种回归。回归分析的目的是建立因变量和自变量之间关系的模型;自变量可以用来预测因变量。通常,线性回归分析中因变量的观测值被认为是相互独立的,并
2、且具有相同的分布。时间序列和回归,时间序列的最大特点是观测值不独立。时间序列的一个目的是用变量的过去观测值来预测同一个变量的未来值。也就是说,时间序列的因变量是该变量未来可能的值,而用于预测的自变量包含该变量的一系列历史观测值。当然,时间序列的自变量也可能包含随时间测量的自变量。让我们看一个时间序列数据的例子。这是一家企业从1990年1月到2002年12月的销售数据。我们希望从这些数据中找出一些规律,建立一个能够预测未来销售的时间序列模型。从表中的众多数据中,只能看出一个粗略的想法;也就是说,总的趋势是增长,但也有起伏。例如,tssales.txt,通过使用点图可以获得对该数据更直观的印象:一
3、个企业从1990年1月到2002年12月的销售数据图表(单位:百万元),例如,tssales.txt,可以从该点图中看到。总的趋势是增长,但增长不是单调的;有起有落。然而,这种涨跌并不是无序的,与季节或月份有关。当然,除了增长趋势和季节性影响外,还有一些不规则的随机因素。SPSS :时间序列数据的实现,SPSS不会自动将某些变量视为具有一定周期的时间序列;有必要将时间因素添加到该变量的观测值中。tasales.sav最初只有一个可变销售额。因此,需要添加具有周期性信息的时间。方法是通过“数据定义日期”选项选择年份、月份,并指定第一个案例是1990年1月。实现SPSS :时间序列数据点图,时间序
4、列点图可以选择图序列,在这种情况下,选择销售额作为变量,月份作为时间轴标记。15.1从这个例子中可以看出,时间序列可以由三个部分组成:趋势、季节成分和随机扰动,它们不能用趋势和季节模式来解释。在这种情况下,销售数据可以用由这三个部分组成的模型来描述。一般时间序列也可能有周期或波动成分。不同于常规的季节模式,周期长度不一定是固定的。如经济危机周期、金融危机周期等等。时间序列可能包含趋势、季节和周期这三个组成部分中的部分或全部,以及随机组成部分。因此,如果我们想深入研究时间序列,分解或过滤掉序列中的这些成分是有帮助的。时间序列的一个组成部分。如果你想做预测,最好是估计模型中与趋势、季节、周期和其他
5、组成部分相关的参数。对于实例中时间序列的分解,用计算机统计软件可以很容易地得到时间序列的趋势、季节和误差分量。时间序列的一部分,下图显示了去除了季节成分的序列,仅显示了趋势和误差成分。作为时间序列的一部分,下图分别用两条曲线描述了趋势成分和季节成分。作为时间序列的一部分,下图分别用两条曲线描述了趋势分量和误差分量。实现SPSS :时间序列分解,在前面的案例tssales.sav数据分解中使用SPSS选项分析-时间序列-季节分解,然后在变量(变量)中选择销售,在模型中选择加性(加性模型,或试乘性模型),最后得到四个附加变量,分别是误差(err_1)、季节调整序列(sas_1)、季节因子(saf_
6、1)和季节去除后的趋势周期因子(stc_1)。前面的数字都是用GraphsSequence选项生成的。请注意,附加变量的名称根据之前获得的附加变量的数量进行调整(根据性质和顺序),15.2是指数平滑的。如果您对分解现有的时间序列感到满意,并且希望预测未来,那么您需要构建一个模型。在这里,我们首先介绍相对简单的指数平滑。指数平滑只能在纯时间序列的情况下使用,但不能在具有自变量的时间序列的因果关系研究中使用。15.2指数平滑。指数平滑法的原理是,当过去观测值的加权平均值用于预测未来观测值时(这个过程称为平滑),观测值越接近,权重就应该越大。而“指数”是指根据“旧”的观察值的程度,其权重呈指数下降。
7、指数平滑是数学中的几何级数,以没有趋势和季节成分的简单时间序列为例。指数平滑。此时,如果Yt用于表示在时间T的平滑数据(或预测值),X1,X2,Xt用于表示原始时间序列。那么指数平滑模型,或者等效地,这里的系数是几何级数。因此,称之为“几何平滑”似乎比令人费解的“指数平滑”更合理。指数平滑、自然,这个公式推导在简单的情况下(如上面的公式)不能应付各种成分复杂的情况。各种实用的指数平滑模型的公式将在后面给出。根据这些数据,我们可以得到这些模型参数的估计和对未来的预测。指数平滑,在与我们的例子相关的指数平滑模型中,我们需要估计12个季节指数和3个参数(包括前面公式中的权重A、与趋势相关的G和与季节
8、指数相关的D)。经过简单的选择后,SPSS通过指数平滑对2003年进行了预测。下图显示了原始时间序列和预测时间序列(平滑),包括2003年12个月的预测。下图是错误。在我们的案例中,时间序列数据的指数平滑和未来预测,SPSS实现了:个样本数据的指数平滑,使用选项分析时间序列指数平滑,然后选择变量销售。在模型中选择自定义,然后点击自定义后在趋势组件中选择显式(这主要是因为序列的原始点图的趋势不像直线,但类似于选择线性;此外,还有阻尼选项。当季节组件选择加法(这是加法模型或乘法模型,详情请参考公式)后,要继续,请单击参数估计参数。在三个相关参数选项上:一般(Alpha)、趋势(Gamma)和季节性
9、(Delta),您可以选择网格搜索(搜索,因为您不知道有多少参数是合适的,请参见下面的公式了解参数的含义),然后继续。最后,如果要预测新的观察值,请在主对话框中单击保存,并在预测案例中的预测至下选择结束年份(此处选择2003年12月)。这样,我们可以得到各种各样的结果。SPSS实现了:的指数平滑,结果中增加的变量包括误差(err_1)和拟合(预测)值fit_1。这在上图中有所描述。在SPSS输出文件中还有估计参数值(三个参数加上季节因素)。如果要仔细分析复杂的纯时间序列,指数平滑法就不能满足要求。如果我们想用独立变量来预测时间序列,指数平滑是无能为力的。需要更强大的模型。这就是下面将要介绍的博
10、克斯-詹金斯ARIMA模型。从数学上讲,指数平滑只是ARIMA模型的一个特例。ARIMA模型:增强现实模型。由Box-Jenkins引入的ARIMA模型比指数平滑更有用、更精细。或者综合自回归移动平均模型(ARIMA是自回归综合移动平均的一些关键字母的缩写)。该模型基于自回归和移动平均模型或ARMA(自回归和移动平均)模型。自回归模型:自回归模型,自回归模型是由两种特殊模型发展而来的,一种是自回归模型。假设时间序列由X1,X2,Xt表示,一个纯AR (p)模型意味着一个变量的观测值是通过在其先前的P观测值的线性组合上增加一个随机误差项而获得的(误差是独立的),这看起来像自回归,所以它被称为自回
11、归模型。它涉及过去的p个观测值(相关观测值的间隔最多为p),ARIMA模型:MA模型,ARMA模型的另一个特例是移动平均模型或MA (Moving Average)模型,一个纯MA (q)模型意味着一个变量的一个观测值是当前和以前的Q个随机误差的线性组合:因为右系数之和不是1(q甚至不是正),因此,虽然专家习惯于称之为“平均”,初学者可能会与初等平滑法中的一些术语如“三点平均”相混淆。显然,ARMA(p,q)模型应该是AR (p)模型和MA(q)模型的结合:ARMA(p,0)模型是AR (p)模型,而ARMA(0,q)模型是MA(q)模型。这个通用模型需要估计p q参数,这看起来很麻烦,但是使
12、用计算机软件是一个常规操作;这并不复杂。ARIMA模型:平稳性和可逆性,但如果ARMA(p,q)模型是有意义的,它要求时间序列满足平稳性和可逆性,这意味着序列的均值不随时间增加或减少,序列的方差不随时间变化,序列本身的相关模式不变。一个实际的时间序列是否满足这些条件不能用数学方法来验证,但是这个模型可以从后面介绍的时间序列的自相关函数和偏相关函数图中近似地识别出来。ARIMA模型:差异,人们关注的具有趋势和季节/周期成分的时间序列不是平稳的。此时,有必要对时间序列进行微分以消除使序列不稳定的成分,并将其转化为稳定的时间序列,然后对ARMA模型进行估计,然后对其进行变换以适应序列之前的差异(这一
13、过程与差异相反,因此称为综合)ARMA模型),并且所获得的模型被称为ARIMA模型。ARIMA模型:差异,差异意味着什么?差值可以是每个观测值减去先前的观测值,即Xt-Xt-1。这样,如果时间序列具有恒定斜率的趋势,则这种趋势将在这种差异之后被消除。ARIMA模型:差异,当然,差异也可以是每一个观测值减去它前面任何间隔的一个观测值;例如,如果有一个固定周期为s的季节性成分,则s之间的差值为Xt-Xt-s,这可以消除周期为s的季节性成分。对于复杂的情况,可能需要通过多个差值使转换后的时间序列稳定。ARMA模型的识别和估计,一些必要的术语和概念介绍如上。下面描述如何识别模型。为了拟合ARIMA模型
14、,我们必须先用差分法将其转化为ARMA(p,q)模型,并确定其是否稳定,然后再确定参数p,q。将通过一个例子来说明如何识别AR(p)模型和参数p。因此,MA(q)和ARMA(p,q)模型可以用类似的方法来识别。根据ARMA(p,q)模型的定义,其参数p和q与自相关函数和部分自相关函数有关。自相关函数描述了观测值和先前观测值之间的相关系数;偏自相关函数是在给定的中间观测值之前的某个时间间隔的观测值和观测值之间的相关系数。ARMA模型的识别和估计,当然,这里不打算讨论acf和pacf的细节。引入这两个概念的主要目的是通过研究acf和pacf关于这两个函数的图来理解如何识别模型。示例:数据AR1.t
15、xt为了直观地理解上述概念,下面用一个数据示例来描述它。示例:data AR1.txt;拖尾和截断首先看时间序列的acf(左)和pacf图,左边的acf条形图是衰减的正弦波动;这种模式被称为拖尾。而右边的pacf条形图在第一个条形图之后非常小(p=1),并且没有模式;这种模式称为p=1后的截断。这表明数据满足平稳AR(1)模型。示例:data AR1.txt;拖尾和截断,注意所谓的拖尾模式可能不是正弦曲线,而是指数衰减。类似地,如果acf图在q=k条之后被截断,并且pacf图是拖尾的,那么数据满足MA(q)模型。如果两个图都是拖尾的,ARMA(p,q)模型可以满足。具体的判别方法总结在下表中:acf和pacf图,例如,如果acf和pacf图中至少有一个不以指数或正弦形式衰减,则该序列不是平稳序列,并且必须进行微分变换以获得能够估计参数并满足ARMA(p,q)模型的序列。如果一个时间序列的acf和pacf图没有模式,并且值很小,那么这个序列可能是一些独立的随机变量。拟合良好的时间序列模型的残差应该有这样的acf和pacf图。例:数据AR1.txt,根据acf和pacf图的形状,可以直接与AR(1)模型拟合,没有任何差别。利用SPSS软件,选择AR(1)模型(相当于ARIMA(1,0,0)(0,0,0)模型),估计参数为1=0.86。也就是说,AR(1)模型例如是数据AR1.txt
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业园区电梯井道安装项目合同
- 建材厂建设土石方施工协议
- 智慧城市项目延期还款协议
- 海洋工程投标质量保证承诺书
- 教育培训顾问服务合同
- 环卫推广瓦工施工合同范本
- 买卖超市车位协议范本
- 展览展示招投标文件移交
- 环保改造以此合同为准
- 矿山开采总价包干承诺书
- 4S店展厅改造装修合同
- 送货简易合同范本(2篇)
- 全国职业院校技能大赛赛项规程(高职)智能财税
- 七年级上册音乐教案 人音版
- 某小区住宅楼工程施工组织设计方案
- 3-4单元测试-2024-2025学年统编版语文六年级上册
- 北师版数学八年级上册 5.8三元一次方程组课件
- 2025届湖北省武汉市新洲一中阳逻校区高二上数学期末学业水平测试模拟试题含解析
- 眼镜验光员(高级)技能鉴定考试题及答案
- 企业单位消防安全规范化管理指导手册
- 小学高年级课后服务 scratch3.0编程教学设计 二阶课程 项目4趣味潜水艇 第4节 躲避障碍教学设计
评论
0/150
提交评论