多重线性问题分析课件_第1页
多重线性问题分析课件_第2页
多重线性问题分析课件_第3页
多重线性问题分析课件_第4页
多重线性问题分析课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

问题一:多重共线性Multi-Collinearity一、多重共线性的概念二、实际经济问题中的多重共线性三、多重共线性的后果四、多重共线性的检验五、克服多重共线性的方法六、案例*七、分部回归与多重共线性问题一:多重共线性Multi-Collinearity一、1一、多重共线性的概念对于模型

Yi=

0+1X1i+2X2i++kXki+i

i=1,2,…,n其基本假设之一是解释变量是互相独立的。

如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。一、多重共线性的概念对于模型如果某2

如果存在

c1X1i+c2X2i+…+ckXki=0

i=1,2,…,n

其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。

如果存在

c1X1i+c2X2i+…+ckXki+vi=0

i=1,2,…,n

其中ci不全为0,vi为随机误差项,则称为

近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。如果存在如果存在3注意:

完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。注意:4二、实际经济问题中的多重共线性

一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势

时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。

横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。二、实际经济问题中的多重共线性一般地,产生多重共5(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。(2)滞后变量的引入在经济计量模型中,往往6(3)样本资料的限制

由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。

一般经验:

时间序列数据样本:简单线性模型,往往存在多重共线性。

截面数据样本:问题不那么严重,但多重共线性仍然是存在的。(3)样本资料的限制由于完全符合理论模型所7

二、多重共线性的后果1、完全共线性情况下的后果(1)完全共线性下参数估计量不存在(2)参数估计量的方差无限大二、多重共线性的后果1、完全共线性情况下的82、不完全多重共线性产生的后果

如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量分析可能会产生一系列的影响。

2、不完全多重共线性产生的后果如果模型中存在不完全的9(1)参数估计值的方差增大(2)对参数区间估计时,置信区间趋于变大(3)严重多重共线时,假设检验容易做出错误的判断(4)当多重共线性严重时,可能造成可决系数R2较高经F检验的参数联合显著性也很高,但对各个参数单独的t检验却可能不显著,甚至可能使估计的回归系数相反,得出完全错误的结论。(1)参数估计值的方差增大10变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标11注意:

除非是完全共线性,多重共线性并不意味着任何基本假设的违背;因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。

问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。注意:除非是完全共线性,多重共线性并不意味12

多重共线性检验的任务是:

(1)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之间存在共线性。多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。三、多重共线性的检验多重共线性检验的任务是:多重共线性表现为解131、检验多重共线性是否存在

(1)对两个解释变量的模型,采用简单相关系数法求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。(2)对多个解释变量的模型,采用综合统计检验法若在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。1、检验多重共线性是否存在(1)对两个解释变量的模型,采142、判明存在多重共线性的范围

如果存在多重共线性,需进一步确定究竟由哪些变量引起。(1)判定系数检验法使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。如果某一种回归Xji=

1X1i+2X2i+LXLi的判定系数较大,说明Xj与其他X间存在共线性。2、判明存在多重共线性的范围如果存在多重共线性15具体可进一步对上述回归方程作F检验:

式中:Rj•2为第j个解释变量对其他解释变量的回归方程的决定系数,若存在较强的共线性,则Rj•2较大且接近于1,这时(1-Rj•2)较小,从而Fj的值较大。因此,给定显著性水平

,计算F值,并与相应的临界值比较,来判定是否存在相关性。

构造如下F统计量具体可进一步对上述回归方程作F检验:式中:Rj•216

在模型中排除某一个解释变量Xj,估计模型;如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。另一等价的检验是:在模型中排除某一个解释变量Xj,估计模型;17(2)逐步回归法

以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。

如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;

如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。(2)逐步回归法以Y为被解释变量,逐18(3)方差扩大(膨胀)因子法

统计上可以证明,解释变量的参数估计式的方差可表示为

其中的是变量(VarianceInflationFactor),即的方差扩大因子其中是多个解释变量辅助回归的可决系数

(3)方差扩大(膨胀)因子法统计上可以证明,解释变量的参数19经验规则●方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。●经验表明,方差膨胀因子≥10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。经验规则●方差膨胀因子越大,表明解释变量之间的多重共性越严重20多重线性问题分析课件21(4)直观判断法①当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。②从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。(4)直观判断法①当增加或剔除一个解释变量,或者改变一个观测22③有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。④解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。③有些解释变量的回归系数所带正负号与定性分析结果违背时,很可23找出引起多重共线性的解释变量,将它排除出去。以逐步回归法(stepwise)得到最广泛的应用。

注意:这时,剩余解释变量参数的经济含义和数值都发生了变化。

如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。四、克服多重共线性的方法1、第一类方法:排除引起共线性的变量找出引起多重共线性的解释变量,将它排除出去。242、第二类方法:差分法时间序列数据、线性模型:将原模型变换为差分模型:Yi=1X1i+2X2i++kXki+i可以有效地消除原模型中的多重共线性。

2、第二类方法:差分法时间序列数据、线性模型:25一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。问题:差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。一般而言,差分后变量之间的相关性要比差分前弱得多,所26

如:例

如:27由表中的比值可以直观地看到,增量的线性关系弱于总量之间的线性关系。

进一步分析:Y与C(-1)之间的判定系数为0.9988,△Y与△C(-1)之间的判定系数为0.9567由表中的比值可以直观地看到,增量的线性关系弱283、第三类方法:减小参数估计量的方差

多重共线性的主要后果是参数估计量具有较大的方差,所以

采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。例如:①增加样本容量,可使参数估计量的方差减小。3、第三类方法:减小参数估计量的方差多重共线29②横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。注意:这里包含着假设,即参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。

②横截面数据与时序数据并用30③变量变换变量变换的主要方法:(1)计算相对指标(2)将名义数据转换为实际数据(3)将小类指标合并成大类指标变量数据的变换有时可得到较好的结果,但无法保证一定可以得到很好的结果。③变量变换31*④岭回归法(RidgeRegression)

70年代发展的岭回归法,以引入偏误为代价减小参数估计量的方差,受到人们的重视。具体方法是:引入矩阵D,使参数估计量为

其中矩阵D一般选择为主对角阵,即

D=aI

a为大于0的常数。(*)显然,与未含D的参数B的估计量相比,(*)式的估计量有较小的方差。*④岭回归法(RidgeRegression)32六、案例——中国粮食生产函数

根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1);粮食播种面积(X2)成灾面积(X3);农业机械总动力(X4);农业劳动力(X5)已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=

0+1X1+2X2+3X3

+4X4

+4X5

+六、案例——中国粮食生产函数根据理论和经验33多重线性问题分析课件34

1、用OLS法估计上述模型:R2接近于1;给定=5%,得F临界值F0.05(5,12)=3.11

F=638.4>15.19,故认上述粮食生产的总体线性关系显著成立。但X4

、X5

的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)1、用OLS法估计上述模型:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论