第四章 违反基本假设的情况_第1页
第四章 违反基本假设的情况_第2页
第四章 违反基本假设的情况_第3页
第四章 违反基本假设的情况_第4页
第四章 违反基本假设的情况_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章违反基本假设的情况第一页,共一百二十八页,编辑于2023年,星期五回顾——假设1解释变量是非随机的或固定的,且解释变量的观测值矩阵X为列满秩,即

Rank(X)=k+1含义:要求解释变量X1,X2,……,Xn之间没有准确的线性关系。违反:多重共线性第二页,共一百二十八页,编辑于2023年,星期五回顾——假设2称为中性假设含义:平均来看,每一期的随机干扰既不向上偏也不向下偏,没有系统偏差。第三页,共一百二十八页,编辑于2023年,星期五回顾——假设3

同方差

无序列相关合起来称为高斯马尔科夫假设含义:每个Y值以相同的方差分布在其均值周围;两个误差项之间不相关。违反:异方差性、自相关第四页,共一百二十八页,编辑于2023年,星期五假设4含义:解释变量X1,X2,……和随机项u不相关。违反:随机解释变量第五页,共一百二十八页,编辑于2023年,星期五§4.1异方差异方差的概念异方差的类型实际经济问题中的异方差性异方差性的后果异方差性的检验异方差的修正实例第六页,共一百二十八页,编辑于2023年,星期五一、异方差的概念对于模型如果出现即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。第七页,共一百二十八页,编辑于2023年,星期五二、异方差的类型

同方差性假定的意义是指每个i围绕其零平均值的变差,并不随解释变量X的变化而变化,不论解释变量观测值是大还是小,每个i的方差保持相同,即

i2=常数在异方差的情况下,i2已不是常数,它随X的变化而变化,即i2=f(Xi)第八页,共一百二十八页,编辑于2023年,星期五异方差一般可归结为三种类型:(1)单调递增型:i2随X的增大而增大;(2)单调递减型:i2随X的增大而减小;(3)复杂型:i2与X的变化呈复杂形式。第九页,共一百二十八页,编辑于2023年,星期五三、实际经济问题中的异方差性例4.1截面资料下研究居民家庭的储蓄行为

Yi=0+1Xi+iYi:第i个家庭的储蓄额Xi:第i个家庭的可支配收入高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小i的方差呈现单调递增型变化第十页,共一百二十八页,编辑于2023年,星期五例4.2以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:

Ci=0+1Yi+i将居民收入等距离分成n组,取组平均数为样本观测值。

一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。

所以样本观测值的观测误差随着解释变量观测值的不而不同,往往引起异方差性第十一页,共一百二十八页,编辑于2023年,星期五例4.3以某一行业的企业为样本建立企业生产函数模型:

Yi=Ai1Ki2Li3ei

被被解释变量:产出量Y

解释变量:资本K、劳动L、技术A那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。

这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。

第十二页,共一百二十八页,编辑于2023年,星期五

对于采用截面数据作样本的计量经济学问题,由于在不同样本点上的解释变量以外的其他因素的差异较大,所以存在异方差性的可能性较大。第十三页,共一百二十八页,编辑于2023年,星期五四、异方差的后果计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果

1、参数估计量非有效0LS估计量仍然具有线性无偏性,但不具有有效性在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。第十四页,共一百二十八页,编辑于2023年,星期五变量的显著性检验中,构造了t统计量它是建立在不变,而正确估计了参数方差的基础上的。如果出现异方差性,估计的出现偏误(偏大或偏下)t检验失效。其他检验也是如此。2.变量的显著性检验失去意义第十五页,共一百二十八页,编辑于2023年,星期五变量的显著性检验中,构造了t统计量它是建立在不变,而正确估计了参数方差的基础上的。如果出现异方差性,将使t统计量失真,使某些原本显著的解释变量可能无法通过显著性检验,从而使t检验失去意义。2.变量的显著性检验失去意义第十六页,共一百二十八页,编辑于2023年,星期五一方面,由于上述后果,使得模型不具有良好的统计性质;另一方面,在预测值的置信区间中也包含有随机误差项共同的方差2。所以当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。3、模型的预测精度下降第十七页,共一百二十八页,编辑于2023年,星期五五、异方差性的检验检验思路:

由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。第十八页,共一百二十八页,编辑于2023年,星期五问题在于用什么来表示随机误差项的方差一般的处理方法:第十九页,共一百二十八页,编辑于2023年,星期五几种异方差的检验方法用X——

的散点图进行判断1.图示法第二十页,共一百二十八页,编辑于2023年,星期五基本思想:选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。即试建立方程:

如,帕克检验常用的函数形式:若在统计上是显著的,表明存在异方差性。2、(2)戈里瑟(Gleiser)检验与帕克(Park)检验第二十一页,共一百二十八页,编辑于2023年,星期五G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。G-Q检验的思想:

先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。3、戈德菲尔德-匡特(Goldfeld-Quandt)检验第二十二页,共一百二十八页,编辑于2023年,星期五Goldfeld-Quandt检验步骤1.将n对样本观察值(Xi,Yi)按观察值Xi的大小排队2.将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/23.对每个子样分别进行OLS回归,并计算各自的残差平方和RSS1(较小)和RSS2(较大)。4.在同方差性假定下,构造如下满足F分布的统计量5.如果F是显著的,拒绝同方差假设,否则不拒绝第二十三页,共一百二十八页,编辑于2023年,星期五例子30个家庭的收入和消费支出的截面数据。假设消费与收入有线性关系,但数据中存在形式为的异方差。为了进行Goldfeld-Quandt检验,用收入对数据排序,去掉中间的c=4个观测第二十四页,共一百二十八页,编辑于2023年,星期五第二十五页,共一百二十八页,编辑于2023年,星期五分别对前13个和后13个数据进行回归,得到:由此结果,得到在5%的显著性水平下拒绝同方差的零假设第二十六页,共一百二十八页,编辑于2023年,星期五注解1、流行的,可用于小样本2、去掉中间的C个观测是为了强调大方差组(RSS2)和小方差组(RSS1)之间的差别。检验的效力(即如果零假设是不真实的而决绝零假设的概率)依赖于C的选择。Goldfeld和Quandt建议如果n=30,C=8,如果n=60C=16(然而Judge等建议C取4和10,如果n

分别是30和60)3、当模型中的X

变量多于一个,而且没有哪个变量更合适的先验信息,我们可以分别用每一个X

作检验,或者对每个X作Park检验。第二十七页,共一百二十八页,编辑于2023年,星期五

3、怀特(White)检验怀特检验不需要排序,且适合任何形式的异方差

怀特检验的基本思想与步骤(以二元为例):然后做如下辅助回归可以证明,在同方差假设下:(*)R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。第二十八页,共一百二十八页,编辑于2023年,星期五六、异方差的修正模型检验出存在异方差性,可用加权最小二乘法(WeightedLeastSquares,WLS)进行估计。加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。第二十九页,共一百二十八页,编辑于2023年,星期五从一个基本的模型开始:Y=工资,X=企业规模假设干扰项的真实方差(i)2

是已知的在模型两边除以标准差:令:1.(i)2已知第三十页,共一百二十八页,编辑于2023年,星期五考察干扰项Var(vi)=E[(vi)2]=E[(ui)2/(i)2]=E(ui)2/(i)2=1因此,vi

是同方差的,对变换后的模型使用OLS会得到参数的BLUE估计

变换后的模型:变换后的模型是一个无常数项回归!第三十一页,共一百二十八页,编辑于2023年,星期五EViewsEviews命令:CREATEDATAYXLSY/1/

X/

第三十二页,共一百二十八页,编辑于2023年,星期五加权最小二乘法对变换以后的模型使用OLS就是加权最小二乘回归(WLS)OLS对所有的观测数据给予了相同的权数(ei)2=(Yi-b0-b1Xi)2加权最小二乘法(WLS)(ei)2=(Yi/i

–b0/i

–b1Xi/i)2=wi(Yi–b0-b1Xi)2其中,wi=1/i2,称为权数注:具有大的方差的数据被赋予较小的权数,反之亦然第三十三页,共一百二十八页,编辑于2023年,星期五如果(i)2

是未知的,我们需要对(i)2

进行假设假设异方差的形式为:

2.(i)2未知第三十四页,共一百二十八页,编辑于2023年,星期五新模型中,存在

即满足同方差性,可用OLS法估计。在实际中可通过残差平方对解释变量的散点图来,确定的形式。第三十五页,共一百二十八页,编辑于2023年,星期五将残差平方对X作散点图,发现一个锥形这表明干扰项方差与X线性相关用X的平方根除以模型,对模型进行变换,变换后的模型具有同方差性。在EVIEWS中如何实现?第三十六页,共一百二十八页,编辑于2023年,星期五残差平方对X作散点图,发现一个喇叭形

这表明干扰项方差与X的平方成比例在模型的两边除以X,对模型进行变换,变换后的模型具有同方差。在EVIEWS中如何实现?第三十七页,共一百二十八页,编辑于2023年,星期五注意:在实际操作中人们通常采用如下的经验方法:

不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法第三十八页,共一百二十八页,编辑于2023年,星期五加权最小二乘法具体步骤1.选择普通最小二乘法估计原模型得到随机误差项的近似估计量2.建立得数据序列3.选择加权最小二乘法,以序列作为权,进行估计得到参数估计量。实际上是以乘原模型的两边,得到一个新模型,采用普通最小二乘法估计新模型。第三十九页,共一百二十八页,编辑于2023年,星期五加权最小二乘法在Eviews中的实现使用加权最小二乘法估计方程,首先到主菜单中选Quick/EstimateEquation…,然后选择LS-LeastSquares(NLSandARMA)。在对话框中输入方程说明和样本,然后按Options钮,出现如下对话框:第四十页,共一百二十八页,编辑于2023年,星期五

单击WeightedLS/TSLS选项在Weighted项后填写权数序列名,单击OK。第四十一页,共一百二十八页,编辑于2023年,星期五加权最小二乘法在Eviews中的实现EViews会打开结果窗口显示标准系数结果,包括加权统计量和未加权统计量。第四十二页,共一百二十八页,编辑于2023年,星期五七、案例--中国农村居民人均消费函数

例4.1.4

中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括(1)从事农业经营的收入,(2)包括从事其他产业的经营性收入(3)工资性收入、(4)财产收入(4)转移支付收入。考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响:第四十三页,共一百二十八页,编辑于2023年,星期五第四十四页,共一百二十八页,编辑于2023年,星期五普通最小二乘法的估计结果:

异方差检验第四十五页,共一百二十八页,编辑于2023年,星期五进一步的统计检验

(1)G-Q检验

将原始数据按X2排成升序,去掉中间的7个数据,得两个容量为12的子样本。对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:

子样本1:

(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648子样本2:

(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729第四十六页,共一百二十八页,编辑于2023年,星期五计算F统计量:

F=RSS2/RSS1=0.2792/0.0648=4.31

查表给定=5%,查得临界值F0.05(9,9)=2.97判断

F>F0.05(9,9)

否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。第四十七页,共一百二十八页,编辑于2023年,星期五(2)怀特检验

作辅助回归:

(-0.04)(0.10)(0.21)(-0.12)(1.47)

(-1.11) R2=0.4638似乎没有哪个参数的t检验是显著的。但

nR2

=31*0.4638=14.38=5%下,临界值20.05(5)=11.07,拒绝同方差性

第四十八页,共一百二十八页,编辑于2023年,星期五去掉交叉项后的辅助回归结果

(1.36)(-0.64)(064)(-2.76)(2.90)R2=0.4374X2项与X2的平方项的参数的t检验是显著的,且

nR2

=310.4374=13.56

=5%下,临界值20.05(4)=9.49

拒绝同方差的原假设

第四十九页,共一百二十八页,编辑于2023年,星期五

原模型的加权最小二乘回归

对原模型进行OLS估计,得到随机误差项的近似估计量ěi,再以1/|

ěi|为权重进行WLS估计,得各项统计检验指标全面改善第五十页,共一百二十八页,编辑于2023年,星期五§4.2自相关自相关的基本的定义实际经济问题中的自相关自相关的后果自相关的检验具有自相关模型的估计案例第五十一页,共一百二十八页,编辑于2023年,星期五一、自相关的基本定义对于模型

Yi=0+1X1i+2X2i+…+kXki+ii=1,2,…,n随机项互不相关的基本假设表现为

Cov(i

,j)=0

ij,i,j=1,2,…,n如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。第五十二页,共一百二十八页,编辑于2023年,星期五一般地,被称为k阶自相关。一些有用的自相关形式:(1) 称服从一阶自回归过程,记为AR(1)其中:被称为一阶自相关系数(2)

同上称服从二阶自回归过程,记为AR(2)第五十三页,共一百二十八页,编辑于2023年,星期五二、实际经济问题中的自相关大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。例如,绝对收入假设下居民总消费函数模型:

Ct=0+1Yt+tt=1,2,…,n由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。1.经济变量固有的惯性第五十四页,共一百二十八页,编辑于2023年,星期五所谓模型设定偏误(Specificationerror)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。例如,本来应该估计的模型为

Yi=0+1X1i+2X2i+3X3i+i一但在模型设定中做了下述回归:

Yi=0+1X1i+1X2i+vi因此,vi=3X3i+i,如果X3确实影响Y,则出现序列相关2.模型设定的偏误第五十五页,共一百二十八页,编辑于2023年,星期五又如如果真实的边际成本回归模型应为:

Yi=0+1Xi+2Xi2+i其中:Y=边际成本,X=产出但建模时设立了如下模型:

Yi=0+1Xi+vi因此,由于vi=2Xi2+i,

,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。

第五十六页,共一百二十八页,编辑于2023年,星期五在实际经济问题中有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。

3.数据的“编造”第五十七页,共一百二十八页,编辑于2023年,星期五第五十八页,共一百二十八页,编辑于2023年,星期五三、自相关的后果计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:1.参数估计量非有效

(1)OLS参数估计量仍具无偏性(2)OLS估计量不具有有效性(3)在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性第五十九页,共一百二十八页,编辑于2023年,星期五在关于变量的显著性检验中,当存在序列相关时,参数的OLS估计量的方差增大,标准差也增大,因此实际的t统计量变小,从而接受原假设i=0的可能性增大,检验就失去意义。2.变量的显著性检验失效3.预测精度下降区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。第六十页,共一百二十八页,编辑于2023年,星期五四、自相关的检验检验的基本思路:序列相关性检验方法有多种,但基本思路相同:

首先,采用普通最小二乘法估计模型,以求得随机误差项的“近似估计量”:

然后,通过分析这些“近似估计量”之间的相关性,以达到判断随机误差项是否具有序列相关性的目的。第六十一页,共一百二十八页,编辑于2023年,星期五由于残差可以作为的估计,如果存在自相关,可通过反映出来,因此可用的变化图形来判断随机项的序列相关性。1.图示法第六十二页,共一百二十八页,编辑于2023年,星期五以为解释变量,以各种可能的相关变量,诸如等为解释变量,建立各种方程。如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。回归检验法的优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。2.回归检验法第六十三页,共一百二十八页,编辑于2023年,星期五D-W检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出的一种检验序列自相关的方法,该方法的假定条件是:(1)解释变量X非随机;(2)随机误差项i为一阶自回归形式

i=i-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式:

Yi=0+1X1i+kXki+Yi-1+i(4)回归含有截距项3、杜宾-瓦森(Durbin-Watson)检验法第六十四页,共一百二十八页,编辑于2023年,星期五D.W.统计量:杜宾和瓦森针对原假设:H0:=0,即不存在一阶自回归,构如下造统计量:

该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。但是,他们成功地导出了临界值的下限dL和上限dU

,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。第六十五页,共一百二十八页,编辑于2023年,星期五若0<D.W.<dL存在正自相关

dL<D.W.<dU不能确定

dU<D.W.<4-dU无自相关

4-dU<D.W.<4-dL不能确定

4-dL<D.W.<4存在负自相关第六十六页,共一百二十八页,编辑于2023年,星期五D.W检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断第六十七页,共一百二十八页,编辑于2023年,星期五D.W.0时,模型存在完全一阶正相关D.W.4时,模型存在完全一阶负相关D.W.值在2左右时,模型不存在一阶自相关

(1)从判断准则看到,存在一个不能确定的D.W.值区域,这是这种检验方法的一大缺陷。(2)D.W.检验虽然只能检验一阶自相关,但在实际计量经济学问题中,一阶自相关是出现最多的一类序列相关;(3)经验表明,如果不存在一阶自相关,一般也不存在高阶序列相关。

所以在实际应用中,对于序列相关问题一般只进行D.W.检验。注意:第六十八页,共一百二十八页,编辑于2023年,星期五Eviews的回归结果第六十九页,共一百二十八页,编辑于2023年,星期五五、自相关的补救措施如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。最常用的方法是广义差分法(GeneralizedDifference)。广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。下面以一元模型为例介绍广义差分法。第七十页,共一百二十八页,编辑于2023年,星期五

1、广义差分法原模型为在(1)假设随机我查相服从AR(1)过程

原模型滞后一期的模型为:(2)(1)-(2)模型不存在自相关,服从基本假设,可以采用OLS方法估计模型。称该方程为广义差分方程。第七十一页,共一百二十八页,编辑于2023年,星期五2、怎样估计?几种估计的常用方法

1.一阶差分法

2.用DW统计量估计

3.科克伦-奥科特迭代(Cochrane-Orcutt)法

4.杜宾二步(Durbin)法第七十二页,共一百二十八页,编辑于2023年,星期五1、一阶差分法假设

=1这个假设对许多经济时序数据是成立的误差项是完全正自相关的广义差分方程退化成了一阶差分方程模型变为:Yi-Yi-1=b1(Xi-Xi-1)+vi该模型没有截矩项因此,原来的常数项无法估计 第七十三页,共一百二十八页,编辑于2023年,星期五用DW统计量估计d≈2(1-)

≈1-(d/2)将代入广义差分过程进行最小二乘回归。2.用DW统计量估计第七十四页,共一百二十八页,编辑于2023年,星期五将OLS残差对滞后一期的残差回归,以得到的一个估计将代入广义差分过程,并且作另一次回归将估计出的参数估计带回原模型,并计算新的残差重复这一过程,直到收敛为至。3.科克伦-奥科特迭代(Cochrane-Orcutt)法第七十五页,共一百二十八页,编辑于2023年,星期五Yi-Yi-1=β0(1-)+β1(Xi-Xi-1)+ui-ui-1Yi=

β0(1-)+β1(Xi-Xi-1)+Yi-1+ui-ui-1滞后因变量前的系数的估计作为的一个估计因此杜宾二步法:首先,因变量对其滞后变量、所有的自变量和滞后自变量进行回归:然后,代入广义差分过程,再回归。4.杜宾(Durbin)二步法第七十六页,共一百二十八页,编辑于2023年,星期五实例US的数据(1970-87),估计以下模型:Yi=b0+b1Xi+uiYi是NYSE的股票价格指数Xi是GNP(十亿美元)估计结果:

Y=10.78+0.025X t(1.17)(7.47)R2=0.77

DW=0.4618第七十七页,共一百二十八页,编辑于2023年,星期五查DW临界值n=18,k=15%的临界值是:dl=1.158,du=1.391.因为dw统计量的计算值低于这两个值,所以存在正自相关从dw统计量计算的数值:

=1-(d/2)=1-(0.4618/2)=0.7691估计广义差分方程:Yt-.77Yt-1=b0(1-.77)+b1(Xt-.77Xt-1)+vt需要定义新变量:Y-.77Y(-1),

X-.77X(-1)第七十八页,共一百二十八页,编辑于2023年,星期五Eviews命令:CrerteDataYXGenrLY=Y-0.77Y(-1)GenrLX=X-0.77X(-1)LsLYCLX说明:因为有一期滞后,所以失去了第一期的数据第七十九页,共一百二十八页,编辑于2023年,星期五估计结果:Y=-26.701+0.038Xt(-0.89)(4.48)R2=0.911d=1.3645从d的数值看,自相关要好多了看起来像是摆脱了自相关第八十页,共一百二十八页,编辑于2023年,星期五§3多重共线性多重共线性的概念实际经济问题中的多重共线性多重共线性的后果多重共线性的检验克服多重共线性的方法案例第八十一页,共一百二十八页,编辑于2023年,星期五一、多重共线性的基本概念对于模型

Yi=0+1X1i+2X2i++kXki+i

i=1,2,…,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。

第八十二页,共一百二十八页,编辑于2023年,星期五如果存在

c1X1i+c2X2i+…+ckXki=0

i=1,2,…,n

其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。

如果存在

c1X1i+c2X2i+…+ckXki+vi=0

i=1,2,…,n

其中ci不全为0,vi为随机误差项,则称为近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。第八十三页,共一百二十八页,编辑于2023年,星期五

注意:

完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。第八十四页,共一百二十八页,编辑于2023年,星期五

二、实际经济问题中的多重共线性

一般地,产生多重共线性的主要原因有以下三个方面:

(1)经济变量相关的共同趋势

时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。

横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第八十五页,共一百二十八页,编辑于2023年,星期五

(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。

例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。第八十六页,共一百二十八页,编辑于2023年,星期五

(3)样本资料的限制

由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。

一般经验:

时间序列数据样本:简单线性模型,往往存在多重共线性。

截面数据样本:问题不那么严重,但多重共线性仍然是存在的。第八十七页,共一百二十八页,编辑于2023年,星期五三、多重共线性的后果例:对二元回归模型这时,只能确定综合参数1+2的估计值不能唯一得确定1、完全共线性下参数估计量不存在如果两个解释变量完全相关,如x2=x1,则mbb++=2211XXYmlbb++=121)(XY第八十八页,共一百二十八页,编辑于2023年,星期五问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。2、近似共线性下OLS估计量在理论上仍是BLUE第八十九页,共一百二十八页,编辑于2023年,星期五如果模型中两个解释变量具有线性相关性,例如X2=X1

,这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。

1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。

3、参数估计量经济含义不合理第九十页,共一百二十八页,编辑于2023年,星期五

4、变量的显著性检验失去意义尽管t统计量是不显著的,但R2却很大解释变量的个别影响是不明显的共同影响是明显的低的t统计量值和高的R2并存。

第九十一页,共一百二十八页,编辑于2023年,星期五存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外第九十二页,共一百二十八页,编辑于2023年,星期五

5、模型的预测功能失效

变大的方差容易使区间预测的“区间”变大,使预测失去意义。第九十三页,共一百二十八页,编辑于2023年,星期五例 消费函数的结果:Y=24.77+0.94X1-0.04X2t(3.67)(1.14)(-0.53)R2=0.96,F=92.40X1

是收入X2

是财富高的R2

表明收入和财富的线性函数可以解释消费变化的96%第九十四页,共一百二十八页,编辑于2023年,星期五没有任何一个斜率系数是显著的。财富变量的符号是错误的。高的F值意味着系数都等于0的联合假设两个变量是如此地高度相关,以至于不能将二者的效应分离出来。如果将X2对X1回归,得到:X2=7.54+10.19X1(0.26)(62.04)R2=.99表明,在X1和X2之间有近乎完全的线形关系

Y只对收入回归:Y=24.45+0.51X1(3.81)(14.24)R2=0.96第九十五页,共一百二十八页,编辑于2023年,星期五收入变量是高度显著的,但是在前一个模型中是不显著的Y只对财富回归:Y=24.41+0.05X2t(3.55)(13.29)R2=0.96财富变量也是高度显著的,但是在前一个模型中是不显著的第九十六页,共一百二十八页,编辑于2023年,星期五

多重共线性检验的任务是:

(1)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之间存在共线性。

多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。

四、多重共线性的检验第九十七页,共一百二十八页,编辑于2023年,星期五

1、检验多重共线性是否存在

(1)对两个解释变量的模型,采用简单相关系数法求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。

(2)对多个解释变量的模型,采用综合统计检验法

若在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。第九十八页,共一百二十八页,编辑于2023年,星期五

2、判明存在多重共线性的范围

如果存在多重共线性,需进一步确定究竟由哪些变量引起。

(1)判定系数检验法(辅助回归法)

使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。

如果某一种回归

Xji=1X1i+2X2i+LXLi的判定系数较大,说明Xj与其他X间存在共线性。第九十九页,共一百二十八页,编辑于2023年,星期五具体可进一步对上述回归方程作F检验:

式中:Rj•2为第j个解释变量对其他解释变量的回归方程的决定系数,若存在较强的共线性,则Rj•2较大且接近于1,这时(1-Rj•2

)较小,从而Fj的值较大。因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。

构造如下F统计量第一百页,共一百二十八页,编辑于2023年,星期五

在模型中排除某一个解释变量Xj,估计模型;如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。另一等价的检验是:第一百零一页,共一百二十八页,编辑于2023年,星期五(2)逐步回归法

以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。

如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;

如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。第一百零二页,共一百二十八页,编辑于2023年,星期五

找出引起多重共线性的解释变量,将它排除出去。例:从消费函数中去掉财富变量,这时,剩余解释变量参数的经济含义和数值都发生了变化。

注意:只有在我们认为被去掉的变量的系数是0,这样做才是合理的。

如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。

五、克服多重共线性的方法

1、第一类方法:排除引起共线性的变量第一百零三页,共一百二十八页,编辑于2023年,星期五

2、第二类方法:差分法

时间序列数据、线性模型:将原模型变换为差分模型:

Yi=1X1i+2X2i++kXki+i可以有效地消除原模型中的多重共线性。

一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。第一百零四页,共一百二十八页,编辑于2023年,星期五

如:第一百零五页,共一百二十八页,编辑于2023年,星期五

由表中的比值可以直观地看到,增量的线性关系弱于总量之间的线性关系。

进一步分析:

Y与C(-1)之间的判定系数为0.9988,△Y与△C(-1)之间的判定系数为0.9567第一百零六页,共一百二十八页,编辑于2023年,星期五

3、第三类方法:减小参数估计量的方差

多重共线性的主要后果是参数估计量具有较大的方差,所以

采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。

例如:

增加样本容量,可使参数估计量的方差减小。第一百零七页,共一百二十八页,编辑于2023年,星期五先验信息可以是:从以前的估计可以知道什么情况下的相关性是较弱的理论所提示的解释变量之间的关系.

4、第四类方法:利用先验信息第一百零八页,共一百二十八页,编辑于2023年,星期五例:模型为:Y=b0+b1X1+b2X2+μ其中Y为消费支出,X1为收入,X2为财富我们可能从其他途径知道b2=0.10b1

消费相对于财富的变化率是消费相对于收入的变化率的10分之一因此,Y=b0+b1X1+0.10b1X2+μY=b0+b1X其中,X=X1+0.1X2一旦我们得到了b1的估计,就可以从先验关系中将b2估计出来第一百零九页,共一百二十八页,编辑于2023年,星期五例:C-D生产函数利用规模收益不变的先验信息第一百一十页,共一百二十八页,编辑于2023年,星期五

六、案例——中国粮食生产函数

根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1);粮食播种面积(X2)

成灾面积(X3);农业机械总动力(X4);

农业劳动力(X5)

已知中国粮食生产的相关数据,建立中国粮食生产函数:

Y=0+1X1+2X2+3X3

+4X4

+4X5

+第一百一十一页,共一百二十八页,编辑于2023年,星期五第一百一十二页,共一百二十八页,编辑于2023年,星期五

1、用OLS法估计上述模型:

R2接近于1;给定=5%,得F临界值F0.05(5,12)=3.11

F=638.4>15.19,故认上述粮食生产的总体线性关系显著成立。但X4

、X5

的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。

(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)第一百一十三页,共一百二十八页,编辑于2023年,星期五

2、检验简单相关系数发现:

X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:第一百一十四页,共一百二十八页,编辑于2023年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论