时间序列分析_第1页
时间序列分析_第2页
时间序列分析_第3页
时间序列分析_第4页
时间序列分析_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.1 时间序列定义:时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列.构成要素:现象所属的时间,反映现象发展水平的指标数值.要素一:时间t;要素二:指标数值。1.2 时间序列的成分:一个时间序列中往往由几种成分组成,通常假定是四种独立的成分一一趋势T、循环C季节S和不规则I。T趋势通常是长期因素影响的结果,如人口总量的变化、方法的变化等。C任何时间间隔超过一年的,环绕趋势线的上、下波动,都可归结为时间序列的循环成分。S许多时间序列往往显示出在一年内有规则的运动,这通常由季节因素引起,因此称为季节 成分。目前,可以称之为“季节性的周期”,年或者季节或者

2、月份。I时间序列的不规则成分是剩余的因素,它用来说明在分离了趋势、循环和季节成分后,时 间序列值的偏差。不规则成分是由那些影响时间序列的短期的、不可预期的和不重复出现的因素引起的。它是随机的、无法预测的。四个组成部分与观测值的关系可以用乘法模型或者加法模型或者综合。1.3 预测方法的选择与评估方法P216三种预测方法:移动平均法、加权移动平均法和指数平滑法。因为每一种方法的都是要“消除”由时间序列的不规则成分所引起的随机波动,所以它们被称为平滑方法。 平滑方法对稳定的时间序列一一即没有明显的趋势、 循环和季节影响的时间序列一一是合适的, 这时平滑 方法很适应时间序列的水平变化。 但当有明显的趋

3、势、 循环和季节变差时, 平滑方法将不能 很好地起作用。移动平均法使用时间序列中最近几个时期数据值的平均数作为下一个时期的预测值。移动平均数的计算公式如下:移动平均数=最近灯期数据之和11指数平滑法模型:式中Ft+1定一t+1期时间序列的预测值;Yt定一t期时间序列的实际值; Ft定一t期时间序列的预测值; 定一一平1t常数(0W “ W 1)。F = aYr+(y-aFt(11-2)均方误差是常用的(MSE)标准误差定义为各测量值误差的平方和的平均值的平方根。设n个测量值的误差为 1、e 2 n,则这组测量值的标准误差b等于:数理统计中均方误差是指参数估计值与参数真值之差平方的期望值,记为M

4、SE。MSE是衡量“平均误差”的一种较方便的方法, MSE可以评价数据的变化程度, MSE的值越小,说 明预测模型描述实验数据具有更好的精确度。与此相对应的,还有均方根误差RMSE平均绝对百分误差等等。RMSE(observedj predicted . n1三MSE =obserwd* predictedt1=1MAPEobseruedf - predictedobserved)100xnMADE上二1| observedi predicted时间序列平稳性的定义假定某个时间序列由某一随机过程(stochastic process)生成,即假定时间序列Xt (t=1,2,)的每一个数值都是从

5、一个概率分布中随机得到的。如果经由该随机过程所生成的时 间序列满足下列条件:均值E(Xt尸m是与时间t无关的常数;方差Var(Xt尸sV是与时间t无关的常数;协方差Cov(Xt,Xt+k尸gk是只与时期间隔k有关,与时间t无关的常数;则称经由该随机过程而生成的时间序列是(弱)平稳的( stationary)。该随机过程便是一个 平稳的随机过程 ( stationary stochastic process)。例如,白噪声(white noise)过程就是平稳的:Xt=ut , utIIN(0,sA2) 因为它的均值为常数零;方差为常数$人2;所有时间间隔的协方差均为零。但随机游走(random

6、 walk)过程是非平稳的:Xt=Xt-1+ut , utIIN(0,sA2),因为尽管其均值为常数E (Xt) =E (Xt-1),但其方差Var(Xt)=tsA2非常数。不过,若令 DXt=Xt-Xt-1,则随机游走过程的一阶差分(first difference )是平稳的:DXt=Xt-Xt-1=ut , utIIN(0,sA2)一般地,在经济系统中,一个非平稳的时间序列通常均可通过差分变换的方法转换成为平稳 序列。指数平滑法有几种不同形式:一次指数平滑法针对没有趋势和季节性的序列,二次指数平滑法针对有趋势但没有季节性的序列。术语“Ho-Winters法”有时特指三次指数平滑法。所有的

7、指数平滑法都要更新上一时间步长的计算结果,并使用当前时间步长的数据中包含的新信息。它们通过混合”新信息和旧信息来实现,而相关的新旧信息的权重由一个可调整的 拌和参数来控制。各种方法的不同之处在于它们跟踪的量的个数和对应的拌和参数的个数。 一次指数平滑法的递推关系特别简单: 且=以一(1-00_;其中0这CtWl其中, 是时间步长i上经过平滑后的值,是这个时间步长上的实际(未平滑的)数据。你可以看到是怎么由原始数据和上一时间步长的平滑值混合而成的。拌和参数可以是0和1之间的任意值,它控制着新旧信息之间的平衡:当 接近1时,我们就只保留当前数据点 (即 完全没有对序列进行平滑);当 接近0时,我们

8、就只保留前面的平滑值(也就是说整个曲线都是平的)。为何这个方法被称为 指数”平滑法?要找出答案,展开它的递推关系式即可知道:三依;十1 _ er今内+ Q 一夜)三一 J一皿,+a支)应W1 - amm%- -a力/也成为.q 办1十” oX1-九与. 0从这里可以看出,在指数平滑法中,所有先前的观测值都对当前平滑值产生了影响,但它 们所起的作用随着参数的哥的增大而逐渐减小。那些相对较早的观测值所起的作用相对较小,这也就是指数变动形态所表现出来的特性。从某种程度上来说,指数平滑法就像是拥有无限记 忆且权值呈指数级递减的移动平均法。(同时也要注意到所有权值的和,工产。一吟等于1,因为当q 150

9、 I呼4棒抬博K以恸季节性描述的是数据的周期性波动,比如以年或者周为周期,如下图:rW附。ItfOliHfli三次指数平滑算法可以对同时含有趋势和季节性的时间序列进行预测,该算法是基于一次指数平滑和二次指数平滑算法的。一次指数平滑算法 基于以下的递推关系:Si= ai+(1- a)S其中a是平滑参数,Si是之前i个数据的平滑值,取值为0,1, a越接近1,平滑后的值越 接近当前时间的数据值,数据越不平滑,a越接近0,平滑后的值越接近前 i个数据的平滑值,数据越平滑,a的值通常可以多尝试几次以达到最佳效果。一次指数平滑算法进行预测的公式为:Xi+h=S,其中i为当前最后的一个数据记录的坐标,亦即

10、预测的时间序列为一条直线,不能反映时间序列的趋势和季节性。二次指数平滑保留了趋势的信息,使得预测的时间序列可以包含之前数据的趋势。二次指数平滑通过添加一个新的变量t来表示平滑后的趋势:Si= a p+(1- a )(S1+ti-l)ti=?(Si-Si-1)+(1-?)ti-1二次指数平滑的预测公式为x+h=s+hti二次指数平滑的预测结果是一条斜的直线。三次指数平滑在二次指数平滑的基础上保留了季节性的信息,使得其可以预测带有季节性的时间序列。三次指数平滑添加了一个新的参数p来表示平滑后的趋势。三次指数平滑有累加和累乘两种方法,下面是累加的三次指数平滑Si= a (Xpi-k)+(1- a )

11、(S1+ti-1)ti=?(Si-Si-1)+(1-?)ti-1pi= Y (X5i)+(1-丫2 其中k为周期累加三次指数平滑白预测公式为:Xi+h=Si+hti+pi-k+(h mod k)注意:数据之魅P88此处有错误,根据 Wikipedia修正。下式为累乘的三次指数平滑:Si= a i/p i-k+(1- a )(i9+ti-1)ti=?(Si-Si-1)+(1-?)ti-1pi= Yi/Si+(1-丫)ip 其中 k 为周期累乘三次指数平滑白预测公式为:Xi+h=(Si+hti)pi-k+(h mod k)注意:数据之魅P88此处有错误,根据 Wikipedia修正。E, ?, 丫

12、的值都位于0,1之间,可以多试验几次以达到最佳效果。S,t,p初始值的选取对于算法整体的影响不是特别大,通常的取值为S0=X0,t0=X1-X0,累加时p=0,累乘时p=1.我们使用 DataMarket的International Airline Passengers数据来测试累加和累乘三次指数平滑 算法的性能,该数据记录的是每月的国际航线乘客数:下图为使用累加三次指数平滑进行预测的效果:其中红色为源时间序列,蓝色为预测的时间序列,a, ?, 丫的取值为0.45, 0.2, 0.95:卜图为累乘三次指数平滑进行预测的效果,a, ?, 丫的取值为0.4, 0.05, 0.9:可以看到三次指数平

13、滑算法可以很好的保存时间序列数据的趋势和季节性信息,在International Airline Passengers数据集上累乘平滑指数算法的效果更好。残差检验a.用相关计量软件:比如说E-VIEWS检查残差的分布。 如果残差分布具有明显和圆润的线 性分布图像,说明自相关性存在的可能性很高。 反之,无规则波动大的分布图像显示出相 关性微弱。自相关性判断方法1例子比如,以上图片,左边较为圆润的分布就显示出自相关性的存在,右边波动大的则反之。b.Durbin-Watson Statistics(德宾瓦特逊检验):假设time series模型存在自相关性,我们假设误差项可以表述为Ut= p *U

14、P1+ e利用统计检测设立假设,如果p =恻表明没有自相关性。Durbin-Watson统计量(后面建成 DW统计量)可以成为判断正、负、零(无)相关性的 工 具。DW统计量:d=E(U-Ut-1)A2/ EutA2 =2*(1 ).果d=2则基本没有自相关关系,d靠近0 存在正的相关关系,d靠近4则有负的相关关系。1c. Q-Statistics以(box-pierce)- Eviews( 7th version第七版本)为例子:很 多统计计量软件软件提供 Q test来检测,这里用 Eviews为例子。Q的统计量(test statistics)为Q=n*E p人2.零假设null hyp

15、othesis H0=0和方法2的含义一样。如果零假设证明失败,则对立假设p 4成立,意味着有自相关性。加1 0/珏01M射屯 4*t3 才种QMF AW344-91 Q HM ,JMl d 4 CM . Q QMU&I+ fl mm ,例,i 0 m mes a 而 J4H am Mig. q 如0 wen am W QWI mi电.om 涉,Q和 44t3 - 3 * W qwi w n iiD,BOXLJUNG 统计量LB检验的原假设和备择假设分别为:H0:原本的数据都是独立的,即总体的相关系数为0,能观察到的某些相关仅仅产生于随机抽样的误差。即 hatrhoA2_1=hatrhoA2_2=.=hatrhoA2_h

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论