版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学
—理论·方法·EViews应用
郭存芝杜延军李春吉编著电子教案
第五章多重共线性◆学习目的了解多重共线性的概念,掌握在建立计量经济学模型时如何避免发生多重共线性,以及在存在多重共线性情况下,如何正确建立计量经济学模型。◆基本要求1)了解多重共线性的概念及多重共线性产生的原因;2)存在多重共线性对计量经济学模型的危害;3)掌握多重共线性的检验方法以及修正多重共线性的方法;4)学会利用EViews软件进行逐步回归分析,建立正确的计量经济学模型。◆多重共线性及其产生原因◆多重共线性的影响◆多重共线性的检验第五章多重共线性◆多重共线性的修正◆案例分析第一节多重共线性及其产生原因—、多重共线性的概念指模型解释变量之间存在完全线性或近似线性相关的一类问题。对模型(5-1)如果存在不全为零的,使得(5-2)成立,则称解释变量之间存在完全共线性(perfectmulticollinearity);第一节多重共线性及其产生原因—、多重共线性的概念指模型解释变量之间存在完全线性或近似线性相关的一类问题。对模型(5-1)成立,则称解释变量之间存在近似共线性(approximatemulticollinearity)。如果存在不全为零的,使得(5-3)在矩阵表示的线性回归模型完全共线性指矩阵X的秩即近似共线性意味着c)情况是不完全相关即解释变量之间的相关系数介于0和1之间。
需要强调,解释变量之间不存在线性关系,并非不存在非线性关系,当解释变量之间存在非线性关系时,并不违反无多重共线性假定。一般来说,解释变量之间的关系可概括为三种情况:a)情况是完全相关,即解释变量之间的相关系数为1;b)情况是完全不相关,即解释变量之间的相关系数为0;在建立计量经济学模型中,大量的问题是属于第三种情况。二、产生多重共线性的主要原因1.经济变量之间的内在联系,是产生多重共线性的根本原因。2.经济变量在时间上有同方向变动的趋势,这也是造成多重共线性的重要原因。3.模型中滞后变量的引入,也是造成解释变量多重共线的原因之一。4.在模型参数的估计过程中,样本之间的相关是不可避免的,这是造成多重共线性的客观原因。第二节多重共线性的影响对存在多重共线性的模型直接用普通最小二乘法估计参数,就会给模型带来严重的不良后果。1.如果解释变量存在完全共线性,则模型的参数无法估计;2.如果解释变量之间存在近似共线性,则参数OLS估计量的方差随着多重共线程度的提高而增加;3.变量的显著性检验和模型的预测功能失去意义;4.参数估计量经济意义不合理。1.如果解释变量存在完全共线性,则模型的参数无法估计;多元回归模型(5-4)的OLS估计量为(5-5)如果出现完全共线性,则不存在,无法得到参数的估计量。2.如果解释变量之间存在近似共线性,则参数OLS估计量的方差随着多重共线程度的提高而增加;在近似共线性下,虽然可以由式(5-5)得到参数OLS估计量,但由于此时,引起主对角线元素较大,且随着逼近于0而增大。这就使得参数估计量的方差增大,从而不能对总体参数做出准确推断。以二元回归模型为例,
的方差为(5-6)其中是X1与X2线性相关系数的平方,≤1。例:当完全共线性时,可以看出,越大,越大,多重共线性使得参数估计量为方差膨胀因子。其增大趋势如下表所示。方差增大,称当X1与X2线性无关时,当X1与X2近似共线时,0<r<1,Var(1)=>3.变量的显著性检验和模型的预测功能失去意义;存在多重共线性的模型,其参数估计量方差的变大,使得计算的t统计量变小,从而检验接受原假设影响很大的重要因素误判为不显著,结果使模型失去可靠性。其次,由于参数估计量的方差变大,因而对样本值的反映十分敏感,即当样本观测值稍有变化时,模型参数就有很大差异,致使模型难以应用。另外,由于参数估计量的方差增大,使模型的精度大大下降,求出的预测值难以置信。的可能性增大,这样会使本来4.参数估计量经济意义不合理。如果模型中两个解释变量X1和X2具有线性相关性,那么它们中的一个变量就可以由另一个变量表征。这时X1和X2的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所以各自的参数已失去了应有的经济意义,于是经常表现出似乎反常的现象,例如估计结果本来应该是正的,结果却是负的。经验告诉我们,在多元线性回归模型的估计中,如果出现参数估计值的经济意义明显不合理的情况,应该首先怀疑是否存在多重共线性。严重的多重共线性常常会导致下列情形出现:使得用普通最小二乘法得到的回归参数估计值很不稳定,回归系数的方差随着多重共线性强度的增加而加速增长,对参数难以做出精确的估计;造成回归方程高度显著的情况下,有些回归系数通不过显著性检验;甚至可能出现回归系数的正负号得不到合理的经济解释。但是应注意,如果研究的目的仅在于预测被解释变量Y,而各个解释变量X之间的多重共线性关系的性质在未来将继续保持,这时虽然无法精确估计个别的回归系数,但可估计这些系数的某些线性组合,因此多重共线性可能并不是严重问题。综上所述第三节多重共线性的检验1)检验多重共线性是否存在;多重共线性检验的任务是:2)估计多重共线性的范围,即判断哪些变量之间存在共线性。一、检验多重共线性是否存在1.简单相关系数检验法利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。一般而言,如果每两个解释变量的简单相关系数比较高,如大于0.8,则可认为存在着较严重的多重共线性。解释变量的相关矩阵中,解释变量之间的相关系数较大时,可能会存在多重共线性问题。较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。注意一、检验多重共线性是否存在2.直观判断法根据经验,通常以下情况的出现可能提示存在多重共线性的影响:(2)从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。(1)当增加或删除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。(3)有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。一、检验多重共线性是否存在3.行列式检验法由于回归模型参数估计量的方差协方差矩阵为而所以这说明(1)当较大时,较小,说明参数估计的精度较高,因而多重共线性不严重(2)当较小时,较大,则说明参数估计的误差较大,因此表明模型的多重共线性严重。(3)当时,,这说明模型解释变量之间完全相关,因此多重共线性最为严重,即为完全多重共线性。这种方法虽简便易行,但由于无法找到值大小的标准,这样就使检验精度受到影响。因此,这种方法常被用来检验和比较两个或两个以上含有相同个数解释变量模型的多重共线性问题,为选择建模的样本观测值提供信息。一、检验多重共线性是否存在4.综合统计检验法R2与F值较大,但各参数估计量的t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。对于多个解释变量(2个以上)的回归模型若在OLS法下:二、估计多重共线性的范围1.决定系数检验法
2.方差膨胀(扩大)因子法3.逐步回归法1.决定系数检验法例:设多元回归模型的解释变量为X1、X2、…、Xk,为分析研究它们之间的相关关系,需将每个解释变量与其他解释变量进行回归,可得出k个回归方程式并计算相应的拟合优度,即判定系数。如果某一回归方程的判定系数较大(接近于1),说明Xj与其他解释变量X间存在多重共线性。如果求出的判定系数都比较小,没有一个是接近于1的,则可认为模型的解释变量之间不存在严重的多重共线问题。析:可进一步对上述出现较大判定系数的回归方程作F检验:(5-7)
若存在较强的共线性,则较大且接近于1,这时较小,从而的值较大。因此,可以给定显著性水平,通过计算的值,并与相应的临界与其他解释变量X间不,拒绝,即认为Xj与其他解释,即认为Xj与其他解释变量X间不值比较来进行检验,判定是否存在相关性。此时存在显著的共线性。如果变量X间存在多重共线性,否则,接受存在多重共线性。1.判定系数检验法例:设多元回归模型的解释变量为X1、X2、…、Xk,为分析研究它们之间的相关关系,需将每个解释变量与其他解释变量进行回归,可得出k个回归方程式并计算相应的拟合优度,即判定系数。另一等价的检验是:在模型中排除某一个解释变量Xj,估计模型,如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。
2.方差膨胀(扩大)因子法
对于多元线性回归模型来说,如果分别以每个解释变量为被解释变量,做对其他解释变量的回归,这称为辅助回归。Var()=以Xj为被解释变量做对其他解释变量辅助线性回归的可决系数,用RjJ的方差可表示,则可以证明(证明过程从略),解释变量Xj参数估计量表示为其中,VIFj是变量Xj的方差膨胀因子,即由于Rj度量了Xj与其他解释变量的线性相关程度,这种相关程度越强,说明变量间多重共线性越严重,VIFj也就越大。反之,Xj与其他解释变量的线性相关程度越弱,说明变量间的多重共线性越弱,VIFj也就越接近于1。由此可见,VIFj的大小反映了解释变量之间是否存在多重共线性,可用它来度量多重共线性的严重程度。经验表明,VIFj≥10时,说明解释变量Xj与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。3.逐步回归法
以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否可以用其他变量的线性组合代替,而不是作为独立的解释变量。
如果拟合优度变化显著,则说明新引入的变量是一个独立的解释变量;如果拟合优度变化很不显著,则说明新引入的变量不是一个独立的解释变量,它可以用其他变量的线性组合代替,也就是说它与其他变量之间存在多重共线性。第四节多重共线性的修正常用的几种修正方法:一、省略变量法二、利用已知信息克服多重共线性三、通过变换模型形式克服多重共线性四、用增加样本容量来克服多重共线性五、逐步回归法一、省略变量法找出引起多重共线性的解释变量,将其省略掉——最为有效的修正多重共线问题的方法。
当省略了某个或某些变量后,保留在模型中的变量的系数的估计值及其经济意义均将发生变化。这种方法虽然简单,但是当解释变量较多时,往往很难选准在模型中比较次要的解释变量以便省略。因此,在用这种方法克服多重共线问题时,又可能会犯遗漏重要解释变量的错误,以致使模型出现新的问题。所以,在从模型中去掉某一解释变量时,一定要全面考虑、慎重从事,避免顾此失彼。定义:注意:缺点:二、利用已知信息克服多重共线性已知信息——就是指在建模之前根据经济理论、统计资料或经验分析,已知的解释变量之间存在的某种关系。例:为了克服多重共线性,可将解释变量按已知关系加以合并。设消费函数(5-8)其中,Y为消费支出,X1为消费者的年平均收入,X2为消费者的年平均储蓄额。
显然,X1和X2都是消费者可以支配的个人收入,因而高度相关,这样(5-8)式必然会有多重共线性。为于克服这一问题,可以通过省略一个解释变量的办法来解决,但是X1和X2对Y的影响及贡献很难分清,以致无法确定对解释变量的取舍。在这种情况下,经过对解释变量的进一步分析研究,发现消费者的收入和储蓄呈3:2的关系,即二、利用已知信息克服多重共线性这样,把(5-9)式代入(5-8)式,就可将二元线性回归模型转换成一元线性回归模型,即
(5-10)
这时,用普遍最小二乘法对(5-10)式进行参数估计,求出
和
,再将
代入(5-9)式求出
,就可得到克服了多重共线性问题的消费函数,即
(5-11)
(5-9)三、通过变换模型形式克服多重共线性不需要分析每个解释变量对被解释变量影响大小的模型:例:设需求函数(5-12)其中Y为需求量,X1为居民收入,X2为商品价格,X3为代用品价格。以时间序列数据为样本的模型:
把模型变为一阶差分形式三、通过变换模型形式克服多重共线性(5-14)
一般可以有效地消除存在于原模型中的多重共线性。这是由经济时间序列数据的内在性质决定的。一般讲,增量间的线性关系远比总量之间的线性关系弱一些。
以一阶差分的形式(5-14)来进行参数估计,可以克服解释变量多重共线性问题。但是,如果原模型的随机扰动项是同方差的,则经一阶差分变换后的模型其随机扰动项可能出现异方差问题。因此,在把原模型变换为差分形式时,要注意防止新模型的异方差性,这是用一阶差分形式来克服多重共线性的不足之处。四、用增加样本容量来克服多重共线性样本容量越大,出现多重共线性的可能性越小。另外,多重共线性的主要问题在于使参数估计量的方差变大,随机干扰项的方差、变量的变异程度与方差膨胀因子一起决定着参数估计量的方差。如果存在多重共线性,但随机干扰项的方差很小,或变量的变异程度很大都可能得到较小的参数估计量的方差。这时,即使有较严重的多重共线性,也不会带来不良后果。因此,只要回归方程估计的参数标准差较小,t统计值较大,就没有必要过于关心是否存在多重共线性的问题。五、逐步回归法具体步骤
1)先用被解释变量对每一个所考虑的解释变量做简单回归;2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础;3)逐个引入其余的解释变量。好处将统计上不显著的解释变量剔除,最后保留在模型中的解释变量之间多重共线性不明显,而且对被解释变量有较好的解释贡献。第五节案例分析考虑粮食需求函数(1)应用EView
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit 1 Unit 6 单词记忆字帖(素材)人教PEP版英语四年级上册
- 广东省梅州市兴宁市宋声学校2024-2025学年上学期人教版九年级物理期中练习卷(无答案)
- 2024-2025学年高一【数学(人教A版)】两角和与差的正弦、余弦和正切公式(1)-教学设计
- 福建省建阳区2023-24年审计局公务员招录考试招录152人管理单位遴选500题题库及解析答案
- 2024年融媒体中心事业单位考试招考142人500题大全加解析答案
- 自由搏击直拳基础教学
- 《为坚强喝彩定稿》课件
- 《快速记忆课》课件
- 《幼儿学习的特点》课件
- 《英语构词法》课件
- 支原体肺炎教学查房.ppt
- 书法字体的种类(课堂PPT)
- 生产与仓储循环--确定控制是否得到执行穿行测试
- 二乙医院评审汇报
- 小学入门数独100题(简单)
- 云南傣家竹楼PPT课件
- (医学院)手术室建设项目申请书
- 贵州六盘水发耳井田矿区水文地质报告
- 经济管理决策与分析
- 最新农村土地复垦竣工验收表资料
- 《原发性轻链型淀粉样变的诊断和治疗中国专家共识(2020年版)》要点汇总
评论
0/150
提交评论