计量经济学范文_第1页
计量经济学范文_第2页
计量经济学范文_第3页
计量经济学范文_第4页
计量经济学范文_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章:多重共线性第一部分:学习目的和要求在经典多元线性回归模型中,其中一个重要假设就是各变量之间是线性无关的。但在现实中我们建立的多元线性回归模型的各变量之间都会存在一定程度上的线性相关一一即存在多重共线性。本章就是讨论存在多重共线性的情形, 主要介绍了多重共线性的概念, 多重 共线性的理论后果,几种检测多重共线性的方法, 以及对多重共线性进行补救的措施。 通过 本章的学习我们需要掌握以下几个问题:(1)多重共线性的概念,完全多重共线性和近似多重共线性的异同。(2) 了解多重共线性产生的原因。(3)理解多重共线性的理论及实际后果,对统计量估计的后果、对参数显著性检验和预测的 影响。(4)掌握

2、并学会运用多重共线性的几种监测方法,主要有样本决定系数检验法、相关系数检 验法、辅回归模型检验法、容许度与方差膨胀因子检验法及特征值检验法。(5)掌握并学会运用多重共线性的补救措施:利用先验信息法、变换模型法、综合使用横截面数据和时间序列数据法、增加样本容量法、删除变量和设定偏误法。第二部分:练习题一、术语解释1、多重共线性2、完全多重共线性与近似多重共线性3、辅回归4、容许度与方差膨胀因子5、条件指数与病态指数二、简答题1、导致多重共线性的原因有哪些?2、多重共线性为什么会使得模型的预测功能失效?3、如何利用辅回归模型来检验多重共线性?4、判断以下说法正确、错误,还是不确定?并简要陈述你的理

3、由。(1)尽管存在完全的多重共线性,OLS估计量还是最优线,f无偏估计量( BLUE )。(2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。(3)如果某一辅回归显示出较高的R2值,则必然会存在高度的多重共线性。(4)变量之间的相关系数较高是存在多重共线性的充分必要条件。(5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。(6)和VIF相比,容许度(TOL)是多重共线性的更好度量指标。5、考虑下面的一组数据:Y-10-8-6-4-20246810X21234567891011X313579111315171921如果我们用模型:Y = i 1区

4、来对以上数据进行拟合回归。(1)我们能彳#到这3个估计量吗?并说明理由。(2)如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计 算过程。6、考虑以下模型:丫=周”2*日3*:+吃;*由于X2和X3是X的函数,那么它们之间存在多重共线性。这种说法对吗?为什么?7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类型称为分布滞后模型( distributed-lag model)(见计量 经济学251页)。我们考虑以下模型:Yi - 12Xt- 3Xt 43Xt_2 _ 3 Xt J3 t其中丫一一消费,X 收入,t时间

5、。该模型表示当期的消费是其现期的收入及其滞后 三期的收入的线性函数。在这一类模型中是否会存在多重共线性?为什么?如果存在多重共线性的话,应该如何解决这个问题?8、设想在模型丫=旦+认+豚3+耳中,X2和X3之间的相关系数 Q为零。如果我们做如下的回归:丫 =X ! TOC o 1-5 h z 丫12X2i1i丫 二X M 1 3八3 2i(1)会不会存在叱=用且2 =用?为什么? 2233(2)用会等于R或?或两者的某个线性组合吗?(3)会不会有 var遇)=var()且 var(%) =var(区)?9、通过一些简单的计量软件(比如EViews、SPSS),我们可以得到各变量之间的相关矩阵1

6、3III3 321IIIr3kR =通o+I+卜卜a2kIII1J怎样可以从相关矩阵看出完全多重共线性、近似多重共线性或者不存在多重共线性?三、计算题1、考虑消费函数G :1 Y W t =1,即| n, 其中,C、Y、W依次表示消费、收入与财富。下面是假想数据。CYW7080810651001009901201273951401425110160163311518018761202002252140220220115524024351502602686(1)作C对丫和W的普通最小二乘回归。(2)这一回归方程是否存在着多重共线性?你的判断依据是什么?(3)分别作C对Y和W的回归,这些回归结果表

7、明了什么?(4)作W对Y的回归。这一回归结果表明了什么?(5)如果存在严重的共线性,你是否会删除一个解释变量?为什么?2、下表给出了美国1971-1986年期间新客车出售的数据。年份YX2X3X4X5X6197110227112.0121.3776.84.8979367197210872111.0125.3839.64.5582153197311350111.1133.1949.87.388506419748775117.5147.71038.48.618679419758539127.6161.21142.86.168584619769994135.7170.51252.65.2288752

8、197711046142.9181.51379.35.5092017197811164153.8195.31551.27.7896048197910559166.0217.71729.310.259882419808979179.3247.01918.011.289930319818535190.2272.32127.613.7319827980197.6286.62261.411.209952619839179202.6297.42428.18.69198410394208.5307.62670.69.65198511039215.2318.52841.17.75198611450224.4

9、323.43022.16.31Y 新车出售量,未经季节调整数量;X2 新车,消费者价格指数, 1967年=100,未经季节调整;X3 消费者价格指数,1967年=100,未经季节调整;X4 个人可支配收入,10亿美元,未经季节调整;X5 利率,百分数,金融公司票据直接使用;X6 民间就业劳动人数(个人),未经季节调整。如果你决定使用表中全部回归元作为解释变量,可能会遇到多重共线性吗?为什 么?如果你这样认为的话,你准备怎样解决这个问题?明确你的假设并说明全部计算。制定适当的线性或者对数线性的模型,以估计美国对汽车的需求函数。第三部分:参考答案一、术语解释1、多重共线性:对于经典线性回归模型(

10、CLRM )Y =飞*1X2i Xki . 5 i =1,2,n如果上式中某两个或多个解释变量之间出现了相关性,则称为存在多重共线性。 依据解释变量之间共线性的程度不同,可以分为完全多重共线性和近似多重共线性。2、完全多重共线性与近似多重共线性:所谓完全多重共线性,是指线性回归模型中的 若干解释变量或全部解释变量之间具有严格的线性关系,也就是说,对于多元线性回归模型,若各解释变量X1,X2,Xk的之间存在如下的关系式:1X12X2kXk -0II 22k k式中A,%,,儿是不全为零的常数,则称这些解释变量之间存在完全多重共线性。当各解释变量Xi, X2,,Xk的之间存在如下的近似的线性关系:

11、1X12X2kXk 0则可以说上述解释变量之间存在近似多重共线性。还可以采用如下的方式,在近似线性关系式中,假设 兀*0,则可将此近似线性关系表示为:Xi ”1X1 一 一:Xi i .iXi .1 : kXk Vi其中a,=九1 /九i , Vi为随机误差项。3、辅回归:在变量之间存在多重共线性的情况下,有一个解释变量能由其它解释变量近似的线性表示出来。为了找出哪个解释变量和其它变量有这种关系,我们可以将每个 Xi对其余变量进行回归,即Xi - 1X1 + 二yXi: i .Xi .1 +二kXk . Vi这种回归叫做辅回归,它是相对于Y对各个X的主回归而言的。4、容许度与方差膨胀因子:在含

12、有k个变量的回归模型中,包括常数项和k-1个回归元,解释变量 Xj的偏回归系数的方差可以表示为:一 2,VIFi ,2工Xvar(彳)=、X212我们定义万差膨胀因子 VIFi =2 , R2为第i个解释变量与其它解释变量辅回归模型的 1-R决定系数。1谷许度被定乂为 TOLi =1 - R2 = 。VIFi容许度与方差膨胀因子的数值可以被用来检测多重共线性。5、条件指数与病态指数:条件指数与病态指数是在特征值检验法中用来检测多重共线 性所构造出来的两个指标。条件指数(病态数)CN (condition number ) : CN=最大特征数/最小特征数病态指数 CI (condition i

13、ndex ): C =(N简答题1、答:经济数据中大量存在多重共线性这一现象, 主要原因在于:经济领域很难象其它实验学 科那样从控制性试验中获得数据; 此外,可能有经济变量结构上的原因, 也有数据收集与模 型设定方面的原因,具体的,有以下几种:(1)所使用的数据收集方法。我们只能在一个有限的范围内得到观察值,无法进行重 复试验。(2)模型或从中取样的总体受到约束(经济变量的共同趋势)。(3)模型设定的偏误。(4)过度决定的模型。这种情况尤其容易发生在解释变量的个数大于观测值个数的情 形。由于上述原因,实际应用中,解释变量之间总会存在一定程度的线性相关,因此,问题不是多重线性有无,而是多重共线性

14、的严重程度。2、答:多元线性回归模型的一个重要应用是经济预测。对于模型Y = X :如果给定样本以外的解释变量的观测值X0,就可以得到被解释变量的预测值丫0 =Xo :但是,这只是被解释变量的预测值的估计值而不是预测值。预测值仅以某一个置信水平位于以该估计值为中心的一个区间中。对于预测的置信区间,我们利用的是构造t统计量,得到在给定(1-a的置信水平下丫0的置信区间为Yo-t /2 - 1 Xo XX ”Xo二丫0 二丫0 t:/21 Xo XXXo1显然,当解释变量之间存在多重共线性时,(XX)非常大,故而Yo的置信区间也很大,因此,模型的预测功能失效。3、答:辅回归是相对于 Y对各个X的主

15、回归而言的。在变量之间存在多重共线性的情况下, 有一个解释变量能由其它解释变量近似的线性表示出来。为了找出哪个解释变量和其它变量有这种关系,我们可以将每个Xi对其余变量进行回归,即Xi =X1 +十a-X-十%/+ 1 +%Xk +Vi,并计算相应的决定系数,分别记为R2。然后,我们在建立统计量:F _R2 (k-2)i (1-R2) (n-k 1)它服从自由度为k-2和n-k+1的F分布。其中n为样本大小,k为包括常数项在内的解释变量个数。如果计算出的 Fi超过了相应自由度的临界值,则认为这个Xi和其余的解释变量存在共线性;如果Fi未超过临界值,则认为这个 Xi和其余的解释变量不存在共线性。

16、这种辅回归模型检验不仅可以检验是否存在多重共线性,而且还可以得到多重共线性的具体形式。4、答:(1)错。如果变量之间存在完全的线性关系时,我们甚至无法估计其系数或者标准误。(2)错。在高度多重共线性的情况下,仍然可以得到一个或者多个显著的t值。(3)错。OLS估计量的方差有下式给出:_ 2var(?)从此式可以看出,一个很高的R2可被一个很低的 92或者很高的Z Xi2抵消掉。(4)错。如果一个模型只有两个回归元,两两之间的高度相关系数便表示存在多重共 线性。但是在变量之间存在多重共线性的前提下,可能是几个变量之间的关系。变量之间的相关系数较高是存在多重共线性的充分非必要条件。(5)不确定。如

17、果观测到共线性在后来的样本数据中继续存在,或许无害。但如果不是这样,或者目的在于做出精确的估计的话,多重共线性便成为问题。 如果仅仅要是预测的话,预测有效的前提条件是模型结构的稳定。(6)错。VIF和TOL给出的信息含义是相同的。它们仅仅是同一种方法的两个不同 的指标而已。5、答:(1)不能。通过对 *2和*3的观察,我们可以知道它们存在以下的关系:X3i =2X2i -1,所以可知变量 X2和X3是完全线性相关的。(2)把方程写成Y = 1-X2i =(2X2i -1)=(-1 - -3) ( -2 2 3)X2i =:1 ,二Mi 其中% =耳P3P2 =久十2/。 113223因此,我们

18、可以唯一的估计出和口2,但无法估计出原始的 P ,因为两个方程无法解出三个未知数。6、答:这种说法不正确。因为X2和X3都是x的非线性函数,把它们包括在回归模型中并不违反经典性线性回归模型的基本假设。多重共线性的相关是指的变量之间的线性相关。7、答:(1)是的。经济时间序列数据有同向变动的趋势。在这里,收入的滞后变量一般也可 以相同的方向变动。(2)在遇到时间序列数据存在线性相关性时,我们一般都是采用一阶或者高阶差分变 换来消除共线性。8、答:(1)是的。这是因为 *2和X3之间的相关系数为 0,所以P系数的表达式2、。YiX2i)(XX3i )-。YiX3i)(XX2iX3i )为二_2_2

19、_2(-X2i )( _X3i )-(-X2iX3i)YiX3i)(xX2i2)-(v YiX2i)(VX2iX3i )马二一 2 一 2 一2(X2i)(X3i ) -(1 X2i X3i )中的交叉乘积项消失,从而变成与a和尸系数同样的表示式。(2)是它们的一个线性组合。证明如下:?纵-纵:? =Y - ?2X2 =丫 - gXz& =丫_?女3=丫_?3又3因此有用=喝+2一丫。(3)不是。原因如下:var(马)二乂2:(1-232)、 X2i/2一,(23 = 0)2;?2var?2 )、x2;9、答:我们可以利用相关矩阵的行列式来判断多重共线性与否,可以利用R的行列式大小来判断多重共

20、线性的强弱。若R的行列式为0时,则存在完全的共线性。若R的行列式很小接近于 0时,则存在近似的共线性。若R的行列式为1时,则变量正交、不存在共线性。三、计算题1、解:(1)使用EViews软件进行回归Dependent Variable: SER01Method: Least SquaresDate: 07/02/06 Time: 19:32Sample: 1 10Included observations: 10VariableCoefficientStd. Error t-StatisticProb.C24.3369061W-0.0.-1.0.2839Y.02

21、76R-squared0.Mean dependent111.0000varAdjusted R-squared0.S.D. dependent var31.42893S.E. of regression6.Akaike info criterion6.Sum squared resid282.8586Schwarz criterion6.Log likelihood-30.90120F-statistic106.5019Durbin-Watson stat2.Prob(F-statistic)0.回归得到的方程为:Y? =24.34-0.03/?+0.87?。(2)有。R-squared的值

22、为0.,但是系数 W通过不过显著性检验。VariableCoefficientStd. Error t-StatisticProb.C24.4545051Y43170.0000R-squared0.Mean dependent111.0000varAdjusted R-squared0.S.D. dependent var31.42893S.E. of regression6.Akaike info criterion6.Sum squared resid337.2727Schwarz criterion6.Log likelihood-31.78092F-st

23、atistic202.8679Durbin-Watson stat2.Prob(F-statistic)0.VariableCoefficientStd. Error t-StatisticProb.C26.4519140W75190.0000R-squared0.Mean dependent111.0000varAdjusted R-squared0.S.D. dependent var31.42893S.E. of regression8.Akaike info criterion7.Sum squared resid593.4849Schwarz crit

24、erion7.Log likelihood-34.60652F-statistic111.8346Durbin-Watson stat2.Prob(F-statistic)0.在这两个回归中,系数是显著的,而在同时对两个变量进行回归时,却存在部分系数的不显著,说明变量之间存在多重共线性。VariableCoefficientStd. Error t-StatisticProb.C-3.73,70690-0.0.9647Y10.372730.25,252990.0000R-squared0.Mean dependent1760.000varAdjusted R-squared0.S.D. dep

25、endent var632.0272S.E. of regression74.61690Akaike info criterion11,63947Sum squared resid44541.45Schwarz criterion11.69998Log likelihood-56.19734F-statistic637.7133Durbin-Watson stat2.Prob(F-statistic)0.VariableCoefficientStd. Error t-StatisticProb.Y10.354970.83,514000.0000R-squared0.Mean dependent

26、1760.000varAdjusted R-squared0.S.D. dependent var632.0272S.E. of regression70,35864Akaike info criterion11,43973Sum squared resid44553.05Schwarz criterion11,46999Log likelihood-56.19864Durbin-Watson stat2.不管是否带上常数项,R-squared的值都非常大(0,98 ),而且Y的系数都通过显著性检验,说明 W和Y存在高度的共线性。在满足模型的经济含义的前提下(以免造成模型设置失误),我们还是可

27、以通过舍去W或者Y来消除共线性的2、解:首先我们发现各个变量在数量级上存在较大差别,所以我们一般考虑对数线性回归模型。如果我们的对数回归模型中包含了所有的解释变量,则得到如下的结果:Dependent Variable: LOG(Y)Method: Least SquaresDate: 07/02/06 Time: 20:31Sample: 1971 1986Included observations: 16VariableCoefficientStd. Errort-StatisticProb.C3.19,116560.0.8682LOG(X2).0675LOG(X3)-4.1

28、.-2.0.0280LOG(X4).1217LOG(X5)-0.0.-0.0.8077LOG(X6).8942R-squared0.Mean dependent9.varAdjusted R-squared0.S.D. dependent var0.S.E. of regression0.Akaike info criterion-2.Sum squared resid0.Schwarz criterion-2.Log likelihood27.23099F-statistic11.77442Durbin-Watson stat1.Prob(F-statistic)0.我们发现 R-squared=0.0.80 , LOG(X4) 、L

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论