时间序列分析的基本概念_第1页
时间序列分析的基本概念_第2页
时间序列分析的基本概念_第3页
时间序列分析的基本概念_第4页
时间序列分析的基本概念_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章时间序列分析的基本概念本章将介绍时间序列分析的一些基本概念,其中关于平稳性、自协方差函数和样本自协 方差函数的概念尤为重要。由于时间序列是随机过程的特例,所以我们首先介绍随机过程的 一些基础概念和基本理论,最后介绍一些差分方程理论和动态数据的预处理方法。 2.1随机过程在对某些随机现象的变化过程进行研究时,需要考虑无穷多个随机变量,必须用一簇随 机变量才能刻画这种随机现象的全部统计特征,这样的随机变量族通常称为随机过程。下面 为几个常见的随机过程的例子:例2.1 (随机游动)设X1, X2,是一列独立同分布的随机变量序列,令S = S0 + X1 + X 2 + X则称随机变量序列sn

2、= 0,1,.为随机游动。其中S0是与X1,X2,相互独立(但是不同分布)的随机变量,一般地,我们总是假定S =0。如果0P(X = 1)= P(X =-1)= 1/2nns 就是一般概率论与数理统计教材中提到的简单随机游动。 n例22 (布朗运动)英国植物学家布朗注意到漂浮在液面上的微小粒子不断进行无规则 的运动,它是分子大量随机碰撞的结果。这种运动后来称为布朗运动。若记(X (t), r (t)为 粒子在平面坐标上的位置,则它是平面上的布朗运动。例2.3在通信工程中,电话交换台在时间段0,t内接到的呼唤次数是与t有关的随机 变量X(t),对于固定的t,X(t)是一个取非负整数的随机变量,则

3、X(t),t g 0,8)是随 机过程。下面介绍随机过程的定义。随机试验所有可能结果组成的集合称为这个试验的样本空 间,记为Q,其中的元素称为样本点或基本事件,Q的子集A称为事件,样本空间Q称 为必然事件,空集称为不可能事件,F是Q的某些子集组成的集合组,P是(。,F)上的 概率。定义2.1随机过程是概率空间(。,F, P)上的一族随机变量X(t), t g T,其中t是参 数,它属于某个指标集T,T称为参数集。随机过程可以这样理解:对于固定的样本点0 g。,X(tQ0)就是定义在T上的一个 函数,称之为X (t)的一条样本路径或一个样本函数;而对于固定的时刻tG T, X(t) = X(tq

4、 )是概率空间。上的一个随机变量,其取值随着试验的结果而变化,变化的 规律成为概率分布。随机过程的取值称为过程所处的状态,状态的全体称为状态空间,记为 S。根据T及S的不同,过程可以分成不同的类:依照状态空间可分为连续状态和离散状态; 依照参数集可分为离散参数和连续参数过程。对于一维随机变量,掌握了它的分布函数就能完全了解该随机变量。对于多维随机变量, 掌握了它们的联合分布函数就能确定它们的所有统计特性。对于由一族或多个随机变量形成 的随机过程,要采用有限维分布函数族来刻画其统计特性。定义2.2随机过程的一维分布,二维分布,n维分布,等等,其全体尸(尤,x ),t,t e T,n 1七,tn

5、1 n 1 n称为过程X (t)的有限维分布族。一个随机过程的有限维分布族具有如下两个性质:对称性:对(1,2,n)的任一排列(jj ,jn),有 TOC o 1-5 h z F(x,x ) = F(x,,x )(2.1)t1,Fjn j1jn1 In 1 n相容性: HYPERLINK l bookmark29 o Current Document 对m 1满t,tn 1 n 1 n足上述的对称性和相容性,则必存在一个随机过程X (t), t e T,使F(x,.,x ), t,,t e T, n 1恰好是X (t)的有限维分布族。t,%1 n 1 n柯尔莫哥洛夫定理说明,随机过程的有限维分

6、布函数族是随机过程概率特征的完整描 述。在实际问题中,要掌握随机过程的全部有限维分布函数族是不可能的,一般是利用随机 过程的某些统计特征,如下是一些常用的统计特征:定义2.3设X(t),teT是一个随机过程,如果对任意t e T,EX(t)存在,则称函数R X(t) = EX(t), t e T(2.3)为X(t),t e T的均值函数。称,x (s, t) = E(X (s) - Rx (s)(X (t) - Rx (t), s, t e T(2.4)为X(t),t e T的协方差函数。称Dx (t) = (t, t) = E X (t)-r x (t )2, s,te T(2.5)为X(t

7、),t e T的方差函数。均值函数是随机过程X(t),t e T在时刻t的平均值,方差函数是随机过程在时刻t对均 值(t)的偏离程度,而协方差函数和相关函数则反映了随机过程在时刻s和t时的线性相 X关程度。 2.2平稳过程的特征及遍历性有一类重要的过程,它处于某种平稳状态,其主要性质与变量之间的时间间隔有关,与 所考察的起始点无关,这样的过程称为平稳过程。定义2.4如果随机过程X (t), t e T对任意的t1,七e T和任意的h (使得 t + h e T,i = 1,2,,n),有:(X(t + h),X(t +h),,X(t + h)与(X(t),X(t ),,X(t )具有相同的联合

8、分 TOC o 1-5 h z 12n12n布,记为 HYPERLINK l bookmark50 o Current Document (X(t + h), X(t + h),,X(t + h) = (X(t ), X(t ),X(t )(2.6)12n12n则称X (t), t e T为严平稳的。对于严平稳过程而言,有限维分布关于时间是平移不变的,条件很强,不容易验证。所 以引入另一种所谓的宽平稳过程或二阶平稳过程。定义2.5设X(t),t e T是一个随机过程,若X(t),t e T的所有二阶矩都存在,并且对任 意t e T,EX(t) = r为常数,对任意s, t e T,r(s, t

9、)只与时间差t - s有关,则称 X (t), t e T为宽平稳过程,简称平稳过程。若T是离散集,则称平稳过程X (t),te T为平 稳序列。例2.4随机过程定义为 X (t) = f (t + s ),0 t 8,其中f (t)是具有周期T的函数, e是区间(0,T)上均匀分布的随机变量。问X(t)是否宽平稳过程?给出理由。解:f (t)是具有周期T的函数,因而是有界函数,是区间(0,T)上均匀分布的随机1、1 C变量,因而E(X(t) =f (t + ) - Td =f (t + )-d(& +1) = 0,为常数,r(t, s) = E(X (t) - E(X (t) - (X (s

10、) - E(X (s)=E (X (t) X (s)1=f (t + ) f (t + + (s -1)-dI Var(X (t), t - s = nT;=0, t - s 丰 nT因而X(t)的二阶矩都存在,均值函数为常数,协方差函数r(s,t)只与t s有关,因而是宽 平稳过程。对于平稳过程而言,由于r(s, t) = r(0, t - s),所以可以记为r(t - s)。对所有的t有 r(-t) = r(t),即为偶函数。所以r(t)的图形关于坐标轴对称,其在0点的值就是X(t)的 方差,并且|r(t)| 0n m n mn=1 m=1平稳随机过程的统计特征完全由其二阶矩函数确定。对固

11、定时刻t,均值函数和协方差 函数是随机变量X(t)的取值在样本空间Q上的概率平均,是由X(t)的分布函数确定的, 通常很难求得。在实际中,如果已知一个较长时间的样本记录,是否可按照时间取平均代替 统计平均呢?这是平稳过程的遍历性所要讨论的问题。由大数定律,设独立同分布的随机变量序列Xn,n = 1,2,具有EXn = p, DX =。2 顶lim P lim P N T8X-心k=11 这里,若将随机序列X,n = 1,2,看作是具有离散参数的随机过程,则万tXk为 ly k=1随机过程的样本函数按不同时刻所取的平均值,该函数随样本不同而变化,是随机变量。而EXn =旦是随机过程的均值,即任意

12、时刻的过程取值的统计平均。大数定律表明,随时间 n的无限增长,随机过程的样本函数按时间平均以越来越大的概率近似于过程的统计平均。 那么,只要观测的时间足够长,则随机过程的每个样本函数都能够遍历各种可能状态。这种 特性称为遍历性或各态历经性。定义2.6设X (t),-8t = lim t x (t)dt(2 7)T * 2T -T1X(t)X(t-T) = lim Jt x(t)X(t-T)dt(2 8)t * 2T -t为该过程的时间均值和时间相关函数。定义2.7设X(t),-8 t +8为均方连续的平稳过程,若1巧歹/(冲=卜X期 则称该平稳过程的均值具有各态历经性。若lim 二口 X(t)

13、X(t-T)dt = r (T)(2.10)T* 2T -TX则称该平稳过程的协方差函数具有各态历经性。定义2.8如果均方连续的平稳过程的均值和相关函数都具有各态历经性,则称该平稳过 程具有各态历经性或遍历性。定理22 (均值遍历性定理)设X = X , n = 0, 1,土 2是平稳序列,其协方差函数为r(t),则X具有遍历性n的充分必要条件是1,lim 它1r (t ) = 0(2.11)N F N :=0设X = Xf,-3t 3是平稳过程,则X具有遍历性的充分必要条件是lim12t (1二)r (T) d = 0(2.12) TOC o 1-5 h z T3 T 02T证明:由于证明的

14、思路相同,这里只证明连续时间的均值遍历性定理。首先计算X的 均值和方差。记-1 一X =t X (t)dtT2T -T则有. 一一. 一 一. 1 .EX = Elim X = lim E(X ) = lim EX (t)dtT 3 TT3TT3 2T -T进而var(又)=E(又-EX)2=Elim二t (X(t)-r)dt2T 3 2 T -T=lim 救Et (X(t)-R)dt2 T3 4J 2-T=lim 二 jT jT E(X (t) - R)(X (s) - R)dtds t3 4T2 -T -T(2.13)=lim jT jT y (t - s)dtds(2.13)T 3 4T

15、2 -T -T在上述积分中,作变换(T = t - Su = t + S则变换的Jacobi行列式值为-1 一1 1因而积分区域变换为顶点分别在T轴和U轴上的菱形区域:-2T Tb 2T。由于Y(T)是偶函数,故(2.13)式等于Um t “ 8T 2pT Y (T )dx2T-tdUm t “ 8T 2-2T-(2T-T I)1 .,=lim2t y (t )(2T - T |)dTt* 4T2 -2T1二凹矛 J2TY(T )(2T-t )dT1 .T(2.14)=Tim T ET Y(T )(1 2T)dT(2.14)故关于均值的遍历性定理就化为上式极限是否趋于零的问题。于是由均方收敛的

16、定义 知这确实是等价的,定理结论得证。推论21若冬(t )| dt 3,则均值遍历性定理成立。一8证明:当0 t 2T 时,|(1-t/2T),(t)| |r(t)|(2.15)1 2t (1 L)r(t)dt 2T|r(t)dt|T 0 TT 01 ., t0 lr (t) dt0(2.16)对于平稳过程的协方差函数的遍历性定理,可以考虑随机过程丫 = 丫 (t), -3 t 3,其中TT丫 (t) = (X(t+T) w)(X(t) w)T则EY (t) = r(t )。由定理的证明过程可见,均值具有遍历性等价于var(X) = 0。因此可以 T类推协方差函数具有遍历性等价于var(r(T

17、 ) = 0。于是有以下定理:定理2.1.3(协方差函数遍历性定理)设X = Xt,-3 t 3是平稳过程,其均值函数为零,则协方差函数有遍历性的充分 必要条件是(2.17)lim;2t (1号)(B(T ) - r2(0)dT =0(2.17)T 3 T 02/11其中B(r 1) = EX (t +T +T 1) X (t +T1) X (t +T) X (t)(2.18)在实际问题中,要严格验证平稳过程是否满足遍历性的条件是比较困难的。遍历性定理 的重要意义在于从理论上给出如下结论:一个实平稳过程,如果它是遍历的,则可用任意一 个样本函数的时间平均代替平稳过程的统计平均。在时间序列分析中

18、,还会经常遇到白噪声过程,定义如下:定义2.9如果随机过程X(t)(t = 1,2,)是由一个不相关的随机变量序列构成,即对于所有s扒,随机变量乂七和Xs的协方差均为零,即随机变量乂七和Xs互不相关,则称其为 纯随机过程。对于一个纯随机过程来说,若其期望和方差都为常数,则称其为白噪声过程。 白噪声过程的样本实现称为白噪声序列(White noise)。特别地,对于白噪声序列%J,如果对于任意的s, t,则称e则称e 是一个白噪声序列,记为ecov(e 点)=WN (口 ,b 2 )。(2.19)当eJ独立时,称eJ是一个独立的白噪声序列。对于一个独立的白噪声序列,当e 服从正态分布时,称eJ是

19、一个正态白噪声序列。 下面是随机产生的1000个服从标准正态分布的白噪声序列绘制的序列图,见图2.1。图2.1图2.1标准正态白噪声序列 2.3线性差分方程2.3.1 一阶差分方程假定当前时期t期的y (输出变量)和另一个变量 (输入变量)、及前一期的y之间 存在如下动态方程:yt =虬+3(2.20)则此方程称为一阶线性差分方程,这里假定为一个确定性的数值序列。差分方程就是关 于一个变量与它的前期值之间关系的表达式。(1)用递归替代法解差分方程根据方程(2.20),如果我们知道t = -1期的初始值口 口 y_i和的各期值,则可以通过 动态系统得到任何一个时期的值,即y =S+i y +ts

20、 +饥-is + . + 3(2.21)这个过程称为差分方程的递归解法。(2)动态乘子: TOC o 1-5 h z 对于方程(2.21),如果随y变动,而w ,w,,w都与y无关,则对y的影 0-11 2t-10 t响为:dy, 四 .己=。t 或 t+j =们(2.22)8s0t方程(2.22)称为动态系统的乘子,或脉冲响应函数(即暂时性影响)。动态乘子依赖于j,即输入的扰动和输出y 的观察值之间的时间间隔。 tt+j对于方程(2.20),当0。1时,动态乘子按几何方式衰减到零;当-1。0,动态乘子 振荡衰减到零;。1,动态乘子指数增加;。-1,动态乘子发散性振荡。因此,。1,动态 系统稳

21、定,即给定巴的变化的后果将逐渐消失。1,系统发散。当0=1时,此时yt = y-1 +0 + st,即输出变量的增量是所有输入的历 史值之和。 TOC o 1-5 h z 如果产生持久性变化,即巴,巴+1,.,st+j都增加一个单位,此时持久性影响为: dy dy dy .t+j + t+k + + t+ = 0 j +0 j -1 +. + 0 +1(2.23)ddsdtt+1t + j当0 1时,且jT8时,持久性影响为lim j+j + j+j + t+j = 1 + 0 0 j -1 + 0 j + = -j-(2.24)jK dsdsds1 -01-tt+1t+j如果考察s的一个暂时

22、性变化对输出y的累积性影响,则和长期影响一致。 t2.3.2 p阶差分方程如果动态系统中的输出yt依赖于它的p期滞后值以及输入变量st:(2.25)j =e j +e j +e +s(2.25)t 1 t12 t2p tp t此时可以写成向量的形式,定义& =tjt 1 jt-1叽:,F=*110,201,p1.0.0., 1 0p0,r 00,j1- tp+1._ 0001.0.0从而(2.25 )写成向量形式:(2.26)(2.26)这个系统由p个方程组成,为了便于处理,将p阶数量系统变成一阶向量系统。0 期的& 值为:&o = Fg_1 + V0 口1 期的& 值为: E= F& + v

23、 = F(Fg + v ) + v = F2& + Fv + v10 110110 1t期的&值为:写成&和v的形式为:& = Ft+1& + Ft期的&值为:写成&和v的形式为:& = Ft+1& + Ftv + Ft-1v + Ft-2 v + Fv + vt1012t1t1 jt1jt2:=jj-11 j2j3:+F-000,+ FT-010,+F1-1100,+:10,j .t p + 1jp._ 0 _.0._ 0 _._ 0 _(2.27)Jt的值。令口口 口匕)表示Ft中第(1,1)f*) 口 口 表示Ft中第(1,2)个元素等等。于是j的值为:该系统中的第一个方程代表了个元素,

24、j = f (j+1) j + f (j+1) j+ f (j+1) j+ - + f (j+1) jt+j11t 112t213t31 ptp+ f(乃 + f(顶-劫+ - + f+11 t 11t+111t+j 1t+j(2.28)表示成初始值和输入变量历史值的函数,此时p阶差分方程的动态乘子:8 t+h = f ( j )8w11t(2.29)是Fj的(1,1)口元素。因此对于任何一个p阶差分方程,M式,土式2+81 812tt(2.30)对于更大j值,通过分析表达式(2.28)就非常有用。通过矩阵F的特征根进行求解。(2.31)矩阵F的特征根为满足下式的力值:(2.31)F 人I p

25、对于一个p阶系统,行列式(2.31)为特征根人的p阶多项式,多项式的p个解是F的 p个特征根。定理2.4矩阵F的特征根由满足下式的人值组成:人p 。人p1 。人p2。 人 一。=0(2.32)证明:考虑具有相异特征根的p阶差分方程的通解,此时存在一个pxp阶非奇异矩阵满足:F = TM-1F 2 = TAT-1TAT-1 = TA2T-1(2.33)Fj = TA jT-1(2.33)其中A个口 px p矩阵,主对角线由F的特征根组成,其它元素为零。令勺表示T的第i行、第j列的元素,tj表示T-1的第i行、第j列的元素。则有:11121112t tF j = 2122L人 j 0 0 . 0

26、111 112t;0Xi00 II 121122tp000 xjtp1tp 2t1pt2p:t pp(2.34)因此Fj的第口(因此Fj的第口(1,1)个元素为:f (j) = c Xj + c Xj HF C Xj(2.35)其中C。尸。因为 C =曾=TT -1 = 1。将(2.35)代入(2M=1i=1得到p阶差分方程的动态乘子:tHtHjt=f (j) = C Xj + C Xj FF C Xj(2.36)定理25如果矩阵F特征值是相异的,则(2.37)X p-1(2.37)七n(X-x )i kk =1k力i因此求出F的特征值X,就可以求出相应的乌,由此就可以根据(2.36)计算得到

27、动 态乘子。如果所有的特征值都是实根,且存在一个特征根的绝对值大于1,则系统是发散的。根 据(2.36),动态乘子最终由绝对值最大的特征根的指数函数决定。 2.4动态数据预处理具有动态随机变化特征的数据序列通常称为动态随机数据。动态数据的统计特性可以用 概率分布密度来描述,但由于动态数据的随机过程往往具有很复杂的多维概率分布特性,实 际上难以分析和应用。时间序列分析作为另外一种描述动态数据统计特性的理论和方法,具 有方便和实用的突出特点。在建立时间序列模型之前,必须先对动态数据进行必要的预处理,以便剔除那些不符合 统计规律的异常样本,并对这些样本数据的基本统计特性进行检验,以确保建立时间序列模

28、 型的可靠性和置信度,并满足一定的精度要求。2.4.1平稳性检验时间序列的平稳性是时间序列建模的重要前提。在检验时间序列的平稳性时,必须考虑 两点:序列的均值和方差是否为常数;序列的自相关函数是否仅与时间间隔有关,而与时间 间隔端点的位置无关。下面介绍平稳性检验的几种常用方法。平稳性的参数检验法设样本序列七,Xn足够长,即N相当大。把样本序列分成k个子序列,即取 N = kM,M是一个较大的正整数,k也是一个正整数。分段后的样本序列为 x,.,i = 1,2, ,k; j = 1,2,.,M对于k个子序列,可以分别计算它们的样本均值、样本方差和样本自相关函数。它们的 定义分别为:1 M(2.3

29、8)Mx(2.38)Mij=1(2.39)一,、1R (t )= 一罗(x - x.)(x- x ) (i =1,2,k;T = 1,2,m, m 1.96*2b|s -a 1.96t公2R (t) R (t) 1.96&b3(t)(i 丰 j, i, j = 1,2,,k;T = 1,2,,m)成立时,可拒绝为平稳序列的假设,即该序列不具有平稳性。但一般并不知道的 理论方差与自相关函数,因此无法得出b12,b 2,和b 2(T ),只能以它们的样本估计值代 之。因此,这个方法还不够理想,还须结合背景判断在过程运行中周围条件及相关参数是否 维持不变来确定是否是平稳的。平稳性的非参数检验法平稳性

30、的非参数检验中常使用游程检验法。由于该方法只涉及一组实测数据,不需要假 设数据的分布规律,所以实际中应用最多。在保持随机序列原有顺序的情况下,游程定义为具有相同符号的序列,这种符号将观测 值分成两个相互排斥的类。假如观测序列的值是x,i = 1,2,N,其均值为X,用符号“+”表示土 x,而“-”表示土 x。按符号“+”和“-”出现的顺序将原序列写成如下形式+ + + - + + - + - - +观察可知,“+”和“-”共14个,分为7个游程。游程过多或过少都被认为是存在非平 稳性趋势。游程检验的原假设为:样本数据出现的顺序没有明显的趋势,就是平稳的。样本统计量有:吐表示一种符号出现的次数;

31、N2表示另一种符号出现的次数;尸表示 游程的总数。其中尸作为检验统计量。对于显著水平a = 0.05的双边检验,由附表给出概 a率分布左右两侧为-=0.025时的上限七和下限七。如果r在界限以内,则接受原假设; 否则拒绝原假设。当N当N1或N-超过15时,可用正态分布来近似,利用附表来确定检验的接受域和否定域。式中:(式中:(2.47)(2.48)(2.49)此时用的统计量为_ 2 nn+1H rNb _ 2N N (2N N _ N)b r 1 NN2(N1-12)1/2(2.50)对于a _ 0.05的显著性水平,如果Z J 1.96(按2b原则),则可接受原假设,否则就拒绝。下面两种方法

32、是图检验方法,利用时序图和自相关图显示的特征来作出判断检验时间序 列的。图检验方法用于判断检验时间序列平稳性操作简便、运用广泛,但也有主观性较强的 缺点。时序图检验法根据平稳时间序列均值、方差为常数的性质,平稳时间序列的时序图应该显示出该序列 始终在一个常数值附近随机波动,而且波动的范围有界的特点。如果观察序列的时序图显示 出该序列有明显的趋势性或者周期性,则时间序列通常不是平稳时间序列。据此我们可以判 断一些时间序列的平稳性。例2.5例26 19751980年夏威夷岛莫那罗亚火山(Mauna Loa)每月释放的二氧化碳的数 据(单位:ppm)。图2.3由时序图显示。我们可以看到这些数据中存在

33、着某种季节趋势和明显的增长趋势,因此可以 初步判定这一时间序列是非平稳的。2.4.2正态性检验通常,时间序列模型建立在具有正态分布特性的白噪声基础上,所以需要检验采集的数 据序列是否具有正态特性。正态分布的概率密度函数为式中R和。2分别为样本总体的均值和方差。概率分布为F (x) = 一f x e -搭) dx = Q ( * 一 -)e 2 兀 -8b式中称为概率积分。检验随机数据正态性的有效方法是“ X2拟合优度检验”。该方法是利用X2统计量作为观察到的概率密度函数和理论密度函数之间的偏差的度量,两者是否相同可通过分析、2 的样本分布来检验。如果数据是正态的,则应落入第j组区间中的数据个数

34、为F0=泌(丁)a + jc a + (j 1)c (2.51)F = N (-)Q(-)(2.51)F = N 1 Q (b -)k+ieb a式中a和6是两个端点值,c =厂,k是数据分组数。Fj和观察到的频数Nj之间的偏差为(气,由于(2.52)(2.53)E1 N =另 F = N(2.52)(2.53)因此总偏差为零。根据Pearson定理,样本的X2统计量为,-F )2X 2 = E J JFJ=0j假定这个样本X2统计量近似为X2分布,并将该统计量和理论X2分布作比较。此时, 自由度n = k + 2减去一些线性约束的数目,其中一个约束是当前k +1个组区间的频数已知时,由于总频

35、数为N,最后一个组区间的频数也知道了。另外两个约束是由于同理论正态 概率密度函数拟合观察数据的频数直方图而引起的,统计量X 2是利用样本均值和样本方差计算F ,而不是用真正的均值和方差。因此,如果利用全部气,则自由度为:n = (k + 2) - 3 = k -1实际n值可能比这还要小些,因为F 2的一些组可能和其他组合并。正态性假设检验规则是:假设随机变量服从正态分布,在把观察数据分组列入k + 2个 组区间后,利用样本均值和方差计算F,再求X2。样本分布函数对正态分布的任何偏差都 会使X 2增大。如果X 2 X2,则在显著水平 n,aa上拒绝上述假设。经验表明,总体样本量和分组数目应满足的

36、最优关系式为2k = 1.87( N -1)5此外,需要注意的是采用X2检验方法必须保证每个区间中的期望频数至少为2。由于 范围两端的期望频数最少,所以上述要求可以用来确定a和b,而参数a应满足如下关系式 -、知,1、2 = N(2兀)2 J(aw)/。exp(- x2)dx82b 一 a据此求得a,又利用H=,得参数b为b = 2 h + a而分组区间数目为k = r - 2,其中r为最小区间数。以上三个参数确定之后就可以计算样 本概率密度。2.4.3独立性检验在时间序列分析和建模过程中,除了要求检验样本数据的平稳性和正态性之外,还要求 检验其独立性。本节介绍的独立性方法是基于正态随机变量自

37、相关函数的统计性质。设随机变量XN(0,c 2),其自相关函数P (r)=1, r = 00, r 0P (r)=1, r = 00, r 0(2.55)当r 1时,p (r) = 0。实际中我们只能得到样本自相关系数的估计值d(r),一般不等于0,从自相关系数的估计值判断是否满足独立性条件,需要借助Bartlett公式。Bartlett公式:若P (r)在r M时趋于零,则在N足够大的情况下其方差为1Dp(r)牝一罗 p2(m) (r M)Nm=-M并且,当r M时,p(r)近似于正态分布。(2.56)若P(r)是白噪声的自相关系数,则M = 0DP (r)牝 1(r 0)N根据统计检验的2

38、。准则,当d(r) 典土 - 2 拦(2.57)(2.58)河P(r)| 0)这一估计,即数据是独 立的。如果有个别d(r) (r 0)超出式(2.57)所约束的范围,可以采用另一种检验该随机变 量是否独立的整体检验方法。考虑到r 1时,白噪声序列的样本自相关分布渐近于正态分 布,或是说当n较大时,5p(1),*Np(2), ,.:Np(k)这k个量近似为相互独立的正态随机变量N(0,1),因而它们的平方和符合x 2分布。构造统计量为Q = N d 2(尸)(2.60)r=1则检验七, ,XN是否为白噪声样本值的问题可转化为检验统计量Q是否是自由度为k的X2分布问题。具体算法是:以“ x 为白

39、噪声”做原假设,以a为显著水平,则根据a和自由度k t由X2分布表查出相应的X 2(k)值,并与计算出的Q值比较。如果aQ X2(k)(2.62)则否定原假设。2.4.4离群点的检验与处理离群点是指一个时间序列中,远离序列一般水平的极端大值和极端小值,也成为奇异值 或野值。形成离群点的原因是多种多样的,例如由于数据传输过程、采样及记录过程中发生 信号失真或丢失等而产生,又如研究现象本身由于受各种偶然非正常的因素影响而形成离群 点等等。不论何种原因引起离群点,通常都会在之后的时间序列分析中带来误差,影响建立 时序模型的精度。在得到时间序列以后,首先要检查是否存在离群点,下面介绍一种线性外 推的方

40、法来寻找和剔出离群点。该方法是将时间序列值与平滑值进行比较,认为正常的数据是“平滑的”,而离群点是 “突变的”。用X表示先对序列进行平滑、再平方得到的数值,X;表示先对序列取平方、 再做平滑而得到的数值,用S;表示方差,有S; = X X;,如果X H - X.| v kS(2.63)则认为X用是正常的,否则认为Xt+1是一个离群点。K是常数,一般取3-9的整数。如果Xt+1是离群点,则可用Xf H来代替,即人_X = 2X - X(2.64)t+1ii -1为避免出现无休止的外推计算,建议事先规定连续外推的次数,因为接连检测到一些离 群点后,最终的外推结果可能偏离很远,以致会排出本来是很正常

41、的数据点。习题二2.1EVIEWS软件介绍(II)借助Eviews5.1,我们可以很方便的判断一个时间序列是否平稳以及是否为纯随即性序 列。作出判断的步骤如下:一、绘制时间序列图时序图可以大致看出序列的平稳性,平稳序列的时序图应该显示出序列始终围绕一个 常数值波动,且波动的范围不大。如果观察序列的时序图显示出该序列有明显的趋势或周期, 那它通常不是平稳序列,现以例子来说明。例1、1964-1999年中国纱年产量序列(单位:万吨)。按照第一章的方法建立工作文件和导入外部Excel文件,创建新序列SHA,如图2.2。 点击主菜单Quick/Graph就可作图,见图2.3,分别是折线图(Line g

42、raph)条形图(Bar graph) 散点图(Scatter )等,也可双击序列名,出现显示电子表格的序列观测值,然后点击工具栏 的View/Graph。如果选择折线图,出现图2.4的对话框,在此对话框中键入要做图的序列, 点击OK则出现折线图,横轴表示时间,纵轴表示纱产量,见图2.5,选择图2.5上工具栏 options可以对折线图做相应修饰。点击主菜单的Edit/Copy,然后粘贴到文档就变成了如图 2.6的折线图。图2.2图2.3从图1.5可以看出,纱产量呈现波动中上升的趋势,显然不平稳,所以不是一个平稳序 列。这一结论,还可以通过平稳性统计检验来进一步说明。二、平稳性判断例1续.为了进一步的判断序列SHA的平稳性,需要绘制出该序列的自相关图。双击 序列名sha出现序列观测值的电子表格工作文件,点击View/Correlogram,出现图1.6的相 关图设定对话框,上面选项要求选择对谁计算自相关系数:原始序列(Level)、一阶差分(1st difference)和二阶差分(2nd difference),默认是对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论