异方差和自相关_第1页
异方差和自相关_第2页
异方差和自相关_第3页
异方差和自相关_第4页
异方差和自相关_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

异方差和自相关1第1页,共81页,2023年,2月20日,星期四本章要点异方差的定义、产生原因及后果异方差的检验方法异方差的修正方法自相关的产生原因忽略自相关的严重后果自相关的检验自相关的修正2第2页,共81页,2023年,2月20日,星期四在前面的章节里我们已经完成了对经典正态线性回归模型的讨论。但在实际中,经典线性回归模型的基本假定经常是不能得到满足的,而若在此状况下仍应用OLS进行回归,就会产生一系列的问题,因此我们就需要采取不同的方法对基本假定不满足的情况予以处理。在本章中,我们将着重考虑假定2和假定3得不到满足,即存在异方差和自相关情况下的处理办法。

3第3页,共81页,2023年,2月20日,星期四第一节异方差的介绍一、异方差的定义及产生原因异方差(heteroscedasticy)就是对同方差假设(assumptionofhomoscedasticity)的违反。经典回归中同方差是指随着样本观察点X的变化,线性模型中随机误差项的方差并不改变,保持为常数,即

i=1,2,…,n(3.1)如果的数值对不同的样本观察值各不相同,则称随机误差项具有异方差,即常数i=1,2,…n(3.2)4第4页,共81页,2023年,2月20日,星期四图3-1异方差直观图

5第5页,共81页,2023年,2月20日,星期四为什么会产生这种异方差性呢?一方面是因为随机误差项包括了测量误差和模型中被省略的一些因素对因变量的影响,另一方面来自不同抽样单元的因变量观察值之间可能差别很大。因此,异方差性多出现在横截面样本之中。至于时间序列,则由于因变量观察值来自不同时期的同一样本单元,通常因变量的不同观察值之间的差别不是很大,所以异方差性一般不明显。6第6页,共81页,2023年,2月20日,星期四二、异方差的后果

一旦随机误差项违反同方差假设,即具有异方差性,如果仍然用OLS进行参数估计,将会产生什么样的后果呢?结论就是,OLS估计量的线性和无偏性都不会受到影响,但不再具备最优性,即在所有线性无偏估计值中我们得出的估计值的方差并非是最小的。所以,当回归模型中随机项具有异方差性时,OLS法已不再适用。7第7页,共81页,2023年,2月20日,星期四第二节异方差的检验

由于异方差的存在会导致OLS估计量的最佳性丧失,降低精确度。所以,对所取得的样本数据(尤其是横截面数据)判断是否存在异方差,是我们在进行正确回归分析之前要考虑的事情。异方差的检验主要有图示法和解析法,下面我们将介绍几种常用的检验方法。8第8页,共81页,2023年,2月20日,星期四一、图示法

图示法是检验异方差的一种直观方法,通常有下列两种思路:(一)因变量y与解释变量x的散点图:若随着x的增加,图中散点分布的区域逐渐变宽或变窄,或出现了偏离带状区域的复杂变化,则随机项可能出现了异方差。(二)残差图。残差图即残差平方(的估计值)与x的散点图,或者在有多个解释变量时可作残差与y的散点图或残差和可能与异方差有关的x的散点图。具体做法:先在同方差的假设下对原模型应用OLS法,求出和残差平方,再绘制残差图(,)。9第9页,共81页,2023年,2月20日,星期四二、解析法

检验异方差的解析方法的共同思想是,由于不同的观察值随机误差项具有不同的方差,因此检验异方差的主要问题是判断随机误差项的方差与解释变量之间的相关性,下列这些方法都是围绕这个思路,通过建立不同的模型和验判标准来检验异方差。

10第10页,共81页,2023年,2月20日,星期四(一)Goldfeld-Quandt检验法

Goldfeld-Quandt检验法是由S.M.Goldfeld和R.E.Quandt于1965年提出的。这种检验方法以F检验为基础,适用于大样本情形(n>30),并且要求满足条件:观测值的数目至少是参数的二倍;随机项没有自相关并且服从正态分布。统计假设:零假设:是同方差(i=1,2,…,n)备择假设:具有异方差11第11页,共81页,2023年,2月20日,星期四Goldfeld-Quandt检验法涉及对两个最小二乘回归直线的计算,一个回归直线采用我们认为随机项方差较小的数据,另一个采用我们认为随机项方差较大的数据。如果各回归直线残差的方差大致相等,则不能拒绝同方差的原假设,但是如果残差的方差增加很多,就可能拒绝原假设。步骤为:12第12页,共81页,2023年,2月20日,星期四第一步,处理观测值。将某个解释变量的观测值按由小到大的顺序排列,然后将居中的d项观测数据除去,其中d的大小可以选择,比如取样本容量的1/4。再将剩余的(n-d)个数据分为数目相等的二组。13第13页,共81页,2023年,2月20日,星期四第二步,建立回归方程求残差平方和。拟合两个回归模型,第一个是关于较小x值的那部分数据,第二个是关于较大x值的那部分数据。每一个回归模型都有(n-d)/2个数据以及[(n-d)/2]-2的自由度。d必须足够小以保证有足够的自由度,从而能够对每一个回归模型进行适当的估计。对每一个回归模型,计算残差平方和:记值较小的一组子样本的残差平方和为=,值较大的一组子样本的残差平方和为=。14第14页,共81页,2023年,2月20日,星期四第三步,建立统计量。用所得出的两个子样本的残差平方和构成F统计量:若零假设为真,则上式中n为样本容量(观测值总数),d为被去掉的观测值数目,k为模型中自变量的个数。15第15页,共81页,2023年,2月20日,星期四第四步,得出结论。假设随机项服从正态分布(并且不存在序列相关),则统计量/将服从分子自由度和分母自由度均为()的F分布。对于给定的显著性水平,如果统计量的值大于上述F分布的临界值,我们就拒绝原假设,认为残差具有异方差性。否则,就不能拒绝原假设。16第16页,共81页,2023年,2月20日,星期四(二)Spearmanrankcorrelation检验法

首先引入定义Spearman的等级检验系数:其中表示第i个单元或现象的两种不同特性所处的等级之差,而n表示带有级别的单元或现象的个数。在这里,我们假设模型为:17第17页,共81页,2023年,2月20日,星期四第一步,运用OLS法对原方程进行回归,计算残差=,i=1,2…n。第二步,计算Spearman等级相关系数。将和解释变量观察值按从小到大或从大到小的顺序分成等级。等级的大小可以人为规定,一般取大小顺序中的序号。如有两个值相等,则规定这个值的等级取相继等级的算术平均值。然后,计算与的等级差,=的等级-的等级。最后根据公式计算Spearman等级相关系数。18第18页,共81页,2023年,2月20日,星期四第三步,对总体等级相关系数进行显著性检验:=0,:0。样本的显著性可通过t检验按下述方法加以检验:

t=对给定的显著水平,查t分布表得的值,若>,表明样本数据异方差性显著,否则,认为不存在异方差性。对于多元回归模型,可分别计算与每个解释变量的等级相关系数,再分别进行上述检验。19第19页,共81页,2023年,2月20日,星期四(三)Park检验法

Park检验法就是将残差图法公式化,提出是解释变量的某个函数,然后通过检验这个函数形式是否显著,来判定是否具有异方差性及其异方差性的函数结构。该方法的主要步骤如下:第一步,建立被解释变量y对所有解释变量x的回归方程,然后计算残差(i=1,2,…,n)第二步,取异方差结构的函数形式为=,其中,和是两个未知参数,是随机变量。写成对数形式则为:=。20第20页,共81页,2023年,2月20日,星期四第三步,建立方差结构回归模型,同时用来代替,即=。对此模型运用OLS法。对进行t检验,如果不显著,则没有异方差性。否则表明存在异方差。

Park检验法的优点是不但能确定有无异方差性,而且还能给出异方差性的具体函数形式。但也有质疑,认为仍可能有异方差性,因而结果的真实性要受到影响。21第21页,共81页,2023年,2月20日,星期四(四)Glejser检验法

这种方法类似于Park检验。首先从OLS回归取得残差之后,用的绝对值对被认为与密切相关的X变量作回归。有如下几种函数形式(其中是误差项):

22第22页,共81页,2023年,2月20日,星期四Glejser检验方法的优点是允许在更大的范围内寻找异方差性的结构函数。缺点是难于确定的适当的幂次,这往往需要进行大量的计算。从实际方面考虑,该方法可用于大样本,而在小样本中,则仅可作为异方差摸索的一种定性技巧。23第23页,共81页,2023年,2月20日,星期四(五)Breusch-Pagan检验法

该方法的基本思想是构造残差平方序列与解释变量之间的辅助函数,得到回归平方和ESS,从而判断异方差性存在的显著性。设模型为:(3.7)并且(3.8)在式(3.8)中表示是某个解释变量或全部。

24第24页,共81页,2023年,2月20日,星期四提出原假设为,具体步骤如下:第一步,用OLS方法估计式(3.7)中的未知参数,得(3.9)

和(n为样本容量)(3.10)第二步,构造辅助回归函数(3.11)式中为随机误差项。25第25页,共81页,2023年,2月20日,星期四第三步,用OLS方法估计式(3.11)中的未知参数,计算解释的平方和ESS,可以证明当有同方差性,且n无限增大时有

第四步,对于给定显著性水平,查分布表得,比较与,如果

>,则拒绝原假设,表明模型中存在异方差。

26第26页,共81页,2023年,2月20日,星期四(六)White检验

White检验的提出避免了Breusch-Pagan检验一定要已知随机误差的方差产生的原因,并且要求随机误差服从正态分布。White检验与Breusch-Pagan检验很相似,但它不需要关于异方差的任何先验知识,只要求在大样本的情况下。下面是White检验的基本步骤:设二元线性回归模型为(3.12)27第27页,共81页,2023年,2月20日,星期四异方差与解释变量的一般线性关系为

第一步,用OLS法估计式3.3的参数。第二步,计算残差序列和。第三步,求对,,,,的线性回归估计式,即构造辅助回归函数。第四步,计算统计量,其中n为样本容量,为辅助回归函数中的决定系数。28第28页,共81页,2023年,2月20日,星期四第五步,在的原假设下,服从自由度为5的分布,给定显著性水平,查分布表得临界值,比较与,如果前者大于后者,则拒绝原假设,表明式(3.12)中随机误差存在异方差。此外,由于金融问题研究中经常需要处理时间序列数据,当存在异方差性的时候,可考虑用ARCH方法检验。检验异方差的方法多种多样,可以根据所研究问题的需要加以选择,也可以同时选择不同的方法,对检验结果进行分析比较,以求得出更准确的结论。29第29页,共81页,2023年,2月20日,星期四第三节异方差的修正

异方差性虽然不损坏OLS估计量的无偏性和一致性,但却使它们不再是有效的,甚至不是渐近(即在大样本中)有效的。参数的显著性检验失效,降低了预测精度。故而直接运用普通最小二乘法进行估计不再是恰当的,需要采取相应的修正补救办法以克服异方差的不利影响。其基本思路是变异方差为同方差,或者尽量缓解方差变异的程度。在这里,我们将会遇到的情形分为两种:当误差项方差为已知和当为未知。30第30页,共81页,2023年,2月20日,星期四一、当为已知:加权最小二乘法

(weightedleastsquares,WLS

在同方差的假定下,对不同的,偏离均值的程度相同,取相同权数的做法是合理的。但在异方差情况下,则是显而易见的错误,因为的方差在不同的上是不同的。比如在递增异方差中,对应于较大的x值的估计值的偏差就比较大,残差所反映的信息应打折扣;而对于较小的x值,偏差较小,应给予重视。31第31页,共81页,2023年,2月20日,星期四所以在这里我们的办法就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。32第32页,共81页,2023年,2月20日,星期四可以考虑用作为的权数。于是加权最小二乘法可以表述成使加权残差平方和达到最小。33第33页,共81页,2023年,2月20日,星期四

二、当为未知

已知真实的可以用WLS得到BLUE估计量。但现实中多数情况下是未知的,所以还要考虑别的方法来消除异方差。一般来讲,可以将异方差的表现分为这样几种类别。我们以为模型。

(一)正比于:可对原方程做如下变换:

34第34页,共81页,2023年,2月20日,星期四(二)正比于:就可将原始的模型进行入下变换(三)正比于Y均值的平方:将原模型进行如下变换:35第35页,共81页,2023年,2月20日,星期四在上述变换中,都可以看到对的形式采取的是一种猜测的态度,即我们也不能肯定采取哪种变换更有效。同时这些变换可能还有其他的一些问题:1.当解释变量多于1个时,也许先验上不知道应选择哪一个X去进行变换;2.当无法直接得知而要从前面讨论的一个或多个变换中做出估计时,所有用到t检验F检验等的检验程序,都只有在大样本中有效。3.谬误相关的问题。36第36页,共81页,2023年,2月20日,星期四三、模型对数变换法

仍以模型为例,变量和分别用和代替,则对模型

进行估计,通常可以降低异方差性的影响。原因?37第37页,共81页,2023年,2月20日,星期四第四节金融实例分析[例3-1]纽约股票交易所(NYSE)与美国证券交易委员会(SEC)关于经济佣金率放松管制的争论,其中异方差的检验与修正在证明规模效应存在与否起着重要的作用。38第38页,共81页,2023年,2月20日,星期四下面通过一个具体金融案例来讨论异方差的检验与修正过程:根据北京市1978-1998年人均储蓄与人均收入的数据资料,若假定X为人均收入(元),Y为人均储蓄(元),分析人均储蓄受人均收入的线性影响,可建立一元线性回归模型进行分析。设模型为39第39页,共81页,2023年,2月20日,星期四图3-3Eviews回归结果1用OLS估计法估计参数40第40页,共81页,2023年,2月20日,星期四图3-4残差图(1)图示法41第41页,共81页,2023年,2月20日,星期四(2)Goldfeld-Quandt检验按前述检验方法,对1978~1985与1991~1998年时间段的数据进行OLS方法检验,求出F统计量,查表得是否存在异方差42第42页,共81页,2023年,2月20日,星期四(3)ARCH检验

图3-5ARCH检验结果43第43页,共81页,2023年,2月20日,星期四异方差的修正:WLS法图3-6WLS估计结果44第44页,共81页,2023年,2月20日,星期四对数变换法

图3-7对数变换估计结果45第45页,共81页,2023年,2月20日,星期四第五节自相关的概念和产生原因

为了能更好地说明自相关问题,我们以一个金融案例来开始本章余下三节的学习,并将在下面反复用到这个例子。例:利率的变化我们将用工业生产指数(IP),货币供应量增长率(GM2),以及通胀率(GPW)的函数来解释国债利率R的变化。46第46页,共81页,2023年,2月20日,星期四R=3个月期美国国债利率。为年利率的某一百分比IP=联邦储备委员会的工业生产指数(1987=100)M2=名义货币供给、以十亿美元为单位PW=所有商品的生产价格指数(1982=100)

47第47页,共81页,2023年,2月20日,星期四用于回归模型的货币与价格变量是:回归方程是:(括号中为t统计量)

(2.84)(8.89)(3.91)(6.15)

=0.22DW=0.18S=2.458Mean=6.0748第48页,共81页,2023年,2月20日,星期四一、滞后值与自相关的概念

在阐释自相关概念之前,先介绍滞后值的概念。一个变量的滞后值是这个变量在一段时间前的取值。举个例子:滞后一期的取值,记为。y的一阶差分,记为,是用y的当期值减去前一期的值:,以此类推,可以得到滞后二期,滞后三期值。49第49页,共81页,2023年,2月20日,星期四

表3-1当期值、滞后值、差分的关系

1990.10.8————1990.21.30.80.51990.3-0.91.3-2.21990.40.2-0.91.11990.5-1.70.2-1.91990.62.3-1.74.01990.70.12.3-2.21990.80.00.1-0.1

………

…50第50页,共81页,2023年,2月20日,星期四回到自相关问题,在回归模型:经典线性回归模型(CLRM)的基本假设第三条是:

若此假设被破坏,即,随机误差项u的取值与它的前一期或前几期的取值(滞后值)有关,则称误差项存在序列相关或自相关。自相关有正相关和负相关之分。实证表明:在经济数据中,常见的是正自相关。

51第51页,共81页,2023年,2月20日,星期四(a)正自相关52第52页,共81页,2023年,2月20日,星期四(b)负自相关53第53页,共81页,2023年,2月20日,星期四(c)无自相关54第54页,共81页,2023年,2月20日,星期四二、自相关产生的原因

1.经济数据的固有的惯性(inertia)带来的相关2.模型设定误差带来的相关3.数据的加工带来的相关55第55页,共81页,2023年,2月20日,星期四第六节自相关的度量与后果

一、自相关的度量假定存在自相关,若的取值仅与前一期有关,即=f(),则称这种自相关为一阶自相关。对于一般经济现象而言,两个随机项在时间上相隔越远,前者对后者的影响越小。如果存在自相关的话,最强的自相关应该是一阶自相关。这里,我们只讨论一阶自相关,并且假定这是一种线性自相关,具有一阶线性自回归AR(1)的形式:

56第56页,共81页,2023年,2月20日,星期四式中为常数,称为自相关系数。是一个新随机项,它满足经典回归的全部假定。上式可以看成是一个一元回归模型。是因变量,是自变量,是回归系数。可用OLS法估计:57第57页,共81页,2023年,2月20日,星期四当>0时,为正相关,<0为负相关。当=0时,由上式知,=,此时为一个没有自相关的随机变量。当=1或=-1时,与之间的相关性最强:=1表示完全一阶正相关;=-1表示完全一阶负相关。由此可见,自相关系数是一阶线性自相关强度的一个度量,其绝对值大小决定自相关的强弱。58第58页,共81页,2023年,2月20日,星期四二、出现自相关后的后果

(1)最小二乘估计量仍然是线性的和无偏的,但却不是有效的。(2)OLS估计量的方差是有偏的。因此,在随机项存在自相关的情况下,t检验失效,同样对F检验也有类似的结果。59第59页,共81页,2023年,2月20日,星期四第七节自相关的检验与修正

一、自相关的检验方法检验自相关的方法也可以分为两种:一种是图示法,另一种是解析法。(一)图示法由于回归残差可以作为随机项的估计量,的性质可以从的性质中反映出来。我们可以通过观察残差是否存在自相关来判断随机项是否存在自相关。60第60页,共81页,2023年,2月20日,星期四

1.按时间顺序绘制残差图图3-9利率残差61第61页,共81页,2023年,2月20日,星期四

2.绘制,散点图

图3-10利率残差、散点图62第62页,共81页,2023年,2月20日,星期四(二)解析法通过图示法我们只能粗略的判断是否存在自相关,如果要精确地探测序列相关性,需要使用解析法。解析法是通过假设检验来探测序列相关性的,下面我们将介绍其中的几种方法。63第63页,共81页,2023年,2月20日,星期四

1.D-W(Durbin-Watson)检验

D-W检验的基本思想:对一阶自相关:

当=0时,不具有一阶自相关,当时,具有一阶自相关。D-W检验构造的统计量:d

64第64页,共81页,2023年,2月20日,星期四上式可表示为:

65第65页,共81页,2023年,2月20日,星期四图3-11Durbin-Watsond统计量Durbin-Watson证明了d的实际分布介于两个极限分布之间。一个是下极限分布,其下临界值为,上临界值为4-;另一个是上极限分布,其下临界值为,上临界值为4-。

66第66页,共81页,2023年,2月20日,星期四D-W检验的步骤:(1)建立假设:(2)进行OLS回归并获得残差;(3)计算d值,大多数计算软件已能够实现。比如:Eviews软件就直接可以获得;(4)给定样本容量及解释变量的个数,从D—W表中查到临界值和;(5)将d的现实值与临界值进行比较:具体的比较过程可参见上图所示。67第67页,共81页,2023年,2月20日,星期四D-W检验的局限性(1)D-W检验不适合用于自回归模型。(2)D-W检验只适用于一阶线性自相关。(3)d统计量无法用来判定那些通过原点的回归模型的自相关问题。(4)利用D-W检验检验自相关时,一般要求样本容量至少为15,否则很难对自相关的存在性做明确的结论。68第68页,共81页,2023年,2月20日,星期四

2、杜宾-h(Durbin-h)统计量

经济学的研究过程中,遇上解释变量中包含有因变量的滞后值的情况很多,为克服这样的困境,杜宾提出了一个基于h统计量的渐近检验:在没有自相关的原假设之下,统计量是渐近正态的,其均值为0,方差为1。当检验一阶自回归的误差时,即使X包含有多个因变量的滞后值,统计量检验仍然有效。

69第69页,共81页,2023年,2月20日,星期四

3.Breusch-Godfrey检验

当序列可能存在高阶自相关,或者我们需要同时检验残差与它的若干滞后项之间是否存在相关性,此时我们可以用Breusch-Godfrey检验(简记BG检验法)。BG检验法假定误差项是由如下的阶自回归过程产生的:建立的零假设是:=070第70页,共81页,2023年,2月20日,星期四BG检验法的步骤(1)用最小二乘法估计回归模型并得到残差(2)将对第一步中的所有解释变量及的r个滞后值()进行回归,并取得值。由于我们取了的r阶滞后值,所以在这次回归中我们只有个观测值(其中T为原方程观测值个数)。(3)BG检验建立的检验统计量是,在大样本的条件下,它服从自由度为p的分布,即。若大于临界值,则拒绝不存在自相关的零假设,反之则不能拒绝。71第71页,共81页,2023年,2月20日,星期四二、自相关的修正方法

(一)已知的情况下——广义差分法:一般在实践中,往往假定残差项存在一阶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论