第四讲-时间序列分析的预处理_第1页
第四讲-时间序列分析的预处理_第2页
第四讲-时间序列分析的预处理_第3页
第四讲-时间序列分析的预处理_第4页
第四讲-时间序列分析的预处理_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节时间序列数据的预处理一、动态数据的正态性检验二、动态数据的离群点三、动态数据的缺失值填充四、动态数据的平稳性检验五、动态数据的纯随机性检验1√√√获得观察值序列平稳性检验差分运算YN纯随机检验Y分析结束N拟合ARMA模型时间序列的预处理(续)1.平稳性定义——学问回顾若时间序列有有穷的二阶矩,且Xt满足如下两个条件:则称该时间序列为平稳序列。包括严平稳序列和宽平稳序列。四、平稳性检验在对实际的时间序列进行建模之前,应首先检验序列是否平稳,若序列非平稳,应先通过适当变换将其化为平稳序列,然后再进行模型的建立。2.关于非平稳序列的处理序列的非平稳包括均值非平稳和方差非平稳。均值非平稳序列平稳化的方法:差分变换。方差非平稳序列平稳化的方法:对数变换、平方根变换等。3.平稳性检验方法非参数检验法特征根检验法单位根检验法(1)通过时间序列的趋势图来推断(2)通过自相关函数(ACF)推断图检验方法

非参数检验法:游程检验一个游程定义为一个具有相同符号的连续串,在它前后相接的是与其不同的符号或完全无符号。例如,视察的结果用加、减标记表示,得到一组这样的记录依次:++---+----++-+这个样本的视察结果共有7个游程。(1)什么是游程(2)游程检验的基本思想假如符号序列是随机的,那么“+”和“-”将随机出现,因此它的游程数既不会太多,又不会太少;反过来说假如符号序列的游程总数太少或太多,我们就可以认为时间序列存在某种趋势性或周期性。a.小样本状况零假设H0:加号和减号以随机的方式出现检验方法:取显著性水平α(一般取0.05),查单样本游程检验表,得出抽样分布的临界值rL、rU判定:若rL<r<rU则不能拒绝零假设,即不能拒绝序列是平稳的;若r>rU或r<rL则拒绝零假设,序列是非平稳的。(3)检验方法b.大样本状况零假设H0:加号和减号以随机的方式出现检验方法:给定显著性水平α(一般取0.05)查标准正态分布表,得出抽样分布的临界值-zα,+zα。并计算统计量:判定:若-zα<z<+zα,则不能拒绝零假设,即不能拒绝序列是平稳的;否则拒绝零假设,序列是非平稳的。非参数检验可以很便利的通过SPSS软件进行,实例:用游程检验检验第一讲的数据的平稳性;步骤如下:1.打开SPSS输入数据2.依次单击Analyze—NonparametricTests—Runs;打开Runs对话框。3.在原变量对话框中选择变量进入“TestVariablelist”栏内4.选中“cutpoint”栏中“mean”选项5.单击“OK”按纽,起先进行统计分析。1.Analyze—NonparametricTests—Runs变量gnp进入“TestVariablelist”栏内选中“cutpoint”栏中“mean”选项→OK输出结果分析:因为P值(sig.)极大,所以不拒绝零假设,故不能拒绝原序列是平稳的。1)给出一个随机时间序列,首先可通过该序列的时间路径图(时序图)来粗略地推断它是否是平稳的。一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程;而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。

时序图检验法这种方法通过视察时间序列的趋势图来推断时间序列是否存在趋势性或周期性。优点:简便、直观。对于那些明显为非平稳的时间序列,可以接受这种方法。缺点:对于一般的时间序列是否平稳,不易用这种方法推断出来。(1)时序图检验(推断准则)依据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应当显示出该序列始终在一个常数值旁边随机波动,而且波动的范围有界、无明显趋势及无周期特征(2)自相关图检验(推断准则)平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。若时间序列的自相关函数在k>3时都落入置信区间,且渐渐趋于零,则该时间序列具有平稳性;若时间序列的自相关函数更多地落在置信区间外面,则该时间序列就不具有平稳性。若序列无趋势,但是具有季节性,那末对于按月采集的数据,时滞12,24,36……的自相关系数达到最大(假如数据是按季度采集,则最大自相关系数出现在4,8,12,……),并且随着时滞的增加变得较小。若序列是有趋势的,且具有季节性,其自相关函数特性类似于有趋势序列,但它们是摇摆的,对于按月数据,在时滞12,24,36,……等处具有峰态;假如时间序列数据是按季节的,则峰出现在时滞4,8,12,……等处。应用举例例1

时序图检验1951年——2005年我国居民住院消费价格指数的平稳性例2

时序图检验1990年1月——1997年12月我国药品总产值序列的平稳性例1居民住院消费价格指数时序图平稳序列例2药品总产值时序图非平稳序列(1)选择菜单Graph→Sequence。绘制序列图的基本操作(2)将需绘图的序列变量选入Variables框中。(3)在TimeAxisLabels框中指定横轴(时间轴)标记变量。该标记变量默认的是日期型变量。(4)在Transform框中指定对变量进行怎样的变更处理。其中Naturallogtransform表示对数据取自然对数,Difference表示对数据进行n阶(默认1阶)差分,Seasonallydifference表示对数据进行季节差分。(5)单击TimeLines按钮定义序列图中须要特殊标注的时间点,给出了无标注(NoreferenceLines)、在某变量变更时标注(Lineateachchangeof)、在某个日期标注(Lineatdate)三项供选择。(6)单击Format按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。

通过自相关函数(ACF)进一步推断一个时间序列的样本自相关函数定义为:可以证明:随着k的增加,样本自相关函数下降且趋于零。()()()åå=-=+---=nttkntkttXXXXXX121序列的自相关函数(ACF)要么是截尾的,要么是拖尾的。因此我们可以依据这个特性来推断时间序列是否为平稳序列。从下降速度来看,平稳序列要比非平稳序列快得多。平稳序列的自相关系数常常表现出截尾,而非平稳序列的自相关系数常常是拖尾的。应用举例例3

自相关图检验1951年——2005年我国居民住院消费价格指数的平稳性例4

自相关图检验1990年1月——1997年12月我国药品总产值序列的平稳性例2居民住院消费价格指数自相关图平稳序列自相关图例3药品总产值相关图非平稳序列自相关图(1)选择菜单Graph→TimeSeries→Autocorrelations。

绘制自相关函数图的基本操作(2)将需绘制的序列变量选入Variables框(3)在Display框选择绘制哪种图形,其中Autocorrelations表示绘制自相关函数图;Partialautocorrelations表示绘制偏自相关函数图。一般可同时绘制两种图形。

√(4)单击Options按钮定义相关参数,MaximumNumberofLags表示相关函数值包含的最大滞后期(时间间隔h)。一般选择两个最大周期以上的数据。在StandardErrorMethod框中指定计算相关系数标准差的方法,确定相关函数图形中的置信区间。其中Independencemodel表示假设序列是白噪声的过程;Bartlett’sapproximation表示用估计自相关系数和偏自相关系数方差的近似式计算方差。该方法适合序列是k-1阶的移动平均过程,且标准差随阶数的增大而增大的状况。(5)选中Displayautocorrelationatperiodiclags表示只显示时间序列周期整数倍处的相关函数值。一般假如只考虑序列中的周期因素可选中该项。否则该步可略去。最终就OK了。五纯随机性检验

(一)纯随机序列的定义(二)纯随机性的性质(三)纯随机性检验(一)纯随机序列的定义纯随机序列也称为白噪声序列,它满足如下两条性质并不是全部平稳序列都值得建模!纯随机序列无法预料,无法进一步建模!方差齐性纯随机性0标准正态白噪声序列时序图

(二)白噪声序列的性质

纯随机性各序列值之间没有任何相关关系,即为“没有记忆”的序列方差齐性(平稳)依据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是精确的、有效的(三)纯随机性检验

1.检验原理2.假设条件3.检验统计量4.判别原则5.应用举例1.检验原理:Barlett定理

假如一个时间序列是纯随机的,得到一个视察期数为的视察序列,那么该序列的延迟非零期的样本自相关系数将近似听从均值为零,方差为序列视察期数倒数的正态分布Bartlett公式若在时趋于零,则在N足够大的状况下其方差为并且,当时,近似于正态分布。47自相关系数协方差函数自相关函数2.假设条件原假设:延迟期数小于或等于期的序列值之间相互独立备择假设:延迟期数小于或等于期的序列值之间有相关性3.检验统计量Q统计量(大样本)LB统计量(小样本)4.判别原则拒绝原假设当检验统计量大于

分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,则认为该序列为非白噪声序列接受原假设当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能拒绝序列为纯随机序列的假定

若为白噪声的自相关系数,则在M=0依据统计检验的准则,当时,便可认为为0的可能性是95%,从而接受这一估计,即数据是独立的。51或5.应用举例例3:标准正态白噪声序列纯随机性检验。例4对1949-1998年北京市流感发病率序列做白噪声检验。例5对1950年——1998年北京市城乡居民医疗保险占比例序列的平稳性与纯随机性进行检验。

例3:标准正态白噪声序列纯随机性检验样本自相关图检验结果延迟Q统计量检验Q统计量值P值延迟6期4.34350.63延迟12期14.1710.29由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设。例41949-1998年北京市流感发病率序列的白噪声检验。样本自相关图例4白噪声检验结果延迟阶数Q统计量检验Q检验统计量的值P值65.3840.496126.17210.907由于P值显著大于显著性水平,所以不能拒绝序列纯随机的原假设。因而可以认为北京市流感发病的变动属于纯随机波动。这说明我们很难依据历史信息预料将来年份的流感发病状况。例5时序图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论