版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多重共线性的概念第1页,课件共54页,创作于2023年2月问题的提出在前述基本假定下OLS估计具有BLUE的优良性。然而实际问题中,这些基本假定往往不能满足,使OLS方法失效不再具有BLUE特性。估计参数时,必须检验基本假定是否满足,并针对基本假定不满足的情况,采取相应的补救措施或者新的方法。检验基本假定是否满足的检验称为计量经济学检验第2页,课件共54页,创作于2023年2月回顾6项基本假定(1)解释变量间不相关(无多重共线性)(2)E(ui)=0(随机项均值为零)
(3)Var(ui)=2(同方差)
(4)Cov(ui,uj)=0(随机项无自相关)(5)Cov(X,ui)=0(随机项与解释变量X不相关)(6)随机扰动服从正态分布。第3页,课件共54页,创作于2023年2月不满足基本假定的情形(1)1、通常不会发生随机扰动项均值不等于0的情形。若发生也不会影响解释变量的系数,只会影响截距项。2、随机扰动项正态性假设一般能够成立,就算不成立,在大样本下也会近似成立的。所以不讨论此假定是否违背。第4页,课件共54页,创作于2023年2月不满足基本假定的情形(2)3、解释变量之间相关=>多重共线4、随机扰动项相关=>序列自相关时间序列数据经常出现序列相关5、随机扰动项方差不等于常数=>异方差截面数据时,经常出现异方差第5页,课件共54页,创作于2023年2月解决问题的思路1、定义违反各个基本假定的基本概念2、违反基本假定的原因、背景3、诊断基本假定的违反4、违反基本假定的补救措施(修正)第6页,课件共54页,创作于2023年2月一、多重共线性的概念对于模型
Yi=0+1X1i+2X2i++kXki+i
i=1,2,…,n其基本假设之一是解释变量是互相独立的。
如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。第7页,课件共54页,创作于2023年2月
如果存在
c1X1i+c2X2i+…+ckXki=0
i=1,2,…,n
其中:ci不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity)。
如果存在
c1X1i+c2X2i+…+ckXki+vi=0
i=1,2,…,n
其中ci不全为0,vi为随机误差项,则称为近似共线性(approximatemulticollinearity)或交互相关(intercorrelated)。第8页,课件共54页,创作于2023年2月
在矩阵表示的线性回归模型
Y=X+
中,完全共线性指:秩(X)<k+1,即中,至少有一列向量可由其他列向量(不包括第一列)线性表出。如:X2=X1,则X2对Y的作用可由X1代替。第9页,课件共54页,创作于2023年2月二、实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有以下三个方面:(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。
第10页,课件共54页,创作于2023年2月(2)滞后变量的引入
在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。
例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第11页,课件共54页,创作于2023年2月(3)样本资料的限制
由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。
一般经验:
时间序列数据样本:简单线性模型,往往存在多重共线性。
截面数据样本:问题不那么严重,但多重共线性仍然是存在的。第12页,课件共54页,创作于2023年2月
三、多重共线性的后果1.完全共线性下参数估计量不存在如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。的OLS估计量为:第13页,课件共54页,创作于2023年2月例:对离差形式的二元回归模型如果两个解释变量完全相关,如x2=x1,则这时,只能确定综合参数1+2的估计值:第14页,课件共54页,创作于2023年2月2.近似共线性下OLS估计量非有效
近似共线性下,可以得到OLS参数估计量,但参数估计量方差的表达式为
由于|X’X|0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。第15页,课件共54页,创作于2023年2月仍以二元线性模型
y=1x1+2x2+
为例:恰为X1与X2的线性相关系数的平方r2由于r2
1,故1/(1-r2)1第16页,课件共54页,创作于2023年2月多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(VarianceInflationFactor,VIF)当完全不共线时,r2
=0
当近似共线时,0<
r2
<1当完全共线时,r2=1,第17页,课件共54页,创作于2023年2月3.参数估计量经济含义不合理
如果模型中两个解释变量具有线性相关性,例如X2=X1
,这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。
1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。第18页,课件共54页,创作于2023年2月4.变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外第19页,课件共54页,创作于2023年2月5.模型的预测功能失效
变大的方差容易使区间预测的“区间”变大,使预测失去意义。第20页,课件共54页,创作于2023年2月注意:
除非是完全共线性,多重共线性并不意味着任何基本假设的违背;因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。
问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。第21页,课件共54页,创作于2023年2月
多重共线性检验的任务是:(1)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之间存在共线性。多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。四、多重共线性的检验第22页,课件共54页,创作于2023年2月1.检验多重共线性是否存在
(1)对两个解释变量的模型,采用简单相关系数法求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。(2)对多个解释变量的模型,采用综合统计检验法若在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。即R2较大但t值显著的不多。另外判断参数估计值的符号,如果不符合经济理论或实际情况,可能存在多重共线性。第23页,课件共54页,创作于2023年2月2.判明存在多重共线性的范围
如果存在多重共线性,需进一步确定究竟由哪些变量引起。
(1)判定系数检验法使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。如果某一种回归:Xji=1X1i+2X2i+LXLi的判定系数较大,说明Xj与其他X间存在共线性。第24页,课件共54页,创作于2023年2月具体可进一步对上述回归方程作F检验:式中:Rj•2为第j个解释变量对其他解释变量的回归方程的决定系数,构造如下F统计量第25页,课件共54页,创作于2023年2月
在模型中排除某一个解释变量Xj,估计模型;如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。
另一等价的检验是:若存在较强的共线性,则Rj•2较大且接近于1,这时(1-Rj•2)较小,从而Fj的值较大。因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。第26页,课件共54页,创作于2023年2月(2)逐步回归法
以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。
如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;
如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。第27页,课件共54页,创作于2023年2月找出引起多重共线性的解释变量,将它排除。以逐步回归法得到最广泛的应用。注意:这时,剩余解释变量参数的经济含义和数值都发生了变化。
如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。五、克服多重共线性的方法1.第一类方法:排除引起共线性的变量第28页,课件共54页,创作于2023年2月剔除变量与设定偏误面对严重多重共线性,最简单的做法之一是剔除共线性诸变量之一,但是从模型中删除一个变量,可能导致设定偏误或设定误差。也就是说在分析中使用了不正确设定的模型。由上面的讨论可见,从模型中除掉一个变量以缓解多重共线性的问题会导致设定上的偏误,因此在某些情形中,医治也许比疾病更糟糕,多重共线性虽然有碍于对模型参数的准确估计,但是剔除变量,则对参数的真值有严重的误导,应该记得,在近似共线性情形下,OLS估计量仍是BLUE。第29页,课件共54页,创作于2023年2月2.第二类方法:差分法
时间序列数据、线性模型:将原模型变换为差分模型:
Yi=1
X1i+2
X2i++k
Xki+
i可以有效地消除原模型中的多重共线性。
一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。第30页,课件共54页,创作于2023年2月例如:在中国消费模型中的2个变量:第31页,课件共54页,创作于2023年2月
由表中的比值可以直观地看到,两变量增量的线性关系弱于总量之间的线性关系。
进一步分析:
Y与C(-1)之间的相关系数为0.9845,△Y与△C(-1)之间的相关系数为0.7456。
一般认为:两个变量之间的相关系数大于0.8时,二者之间存在线性关系。所以,原模型经检验地被认为具有多重共线性,而差分模型则可认为不具有多重共线性。第32页,课件共54页,创作于2023年2月3.第三类方法:减小参数估计量的方差
多重共线性的主要后果是参数估计量具有较大的方差,所以采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。
例如:增加样本容量,可使参数估计量的方差减小。第33页,课件共54页,创作于2023年2月4.变量变换销量出厂价格市场价格高度相关市场总供应量相对价格第34页,课件共54页,创作于2023年2月5.用被解释变量的滞后值代替解释变量的滞后值个人消费现期收入前期收入高度相关线性关系较弱第35页,课件共54页,创作于2023年2月
6.利用先验信息改变约束形式先验信息:在此之前的研究成果所提供的信息。利用某些先验信息,可以把有共线性的变量组合成新的变量,从而消除共线性。如其中Y=消费,X2=收入X3=财富。因为收入与财富有高度共线的趋势,如果先验认为则代入消去第36页,课件共54页,创作于2023年2月利用先验信息改变约束形式高度相关已知α+β=1,即规模报酬不变,则将β=1-α代入第37页,课件共54页,创作于2023年2月
7.截面数据和时序数据结合有时在时间序列数据中多重共线性严重的变量,在截面数据中不一定有严重的共线性。在假定截面数据估计出的参数在时间序列数据中变化不大的前提下,可先用截面数据估计出一些变量的参数,再代入原模型估计另一些变量的参数。例:销量与商品价格、消费者收入。第38页,课件共54页,创作于2023年2月六、案例一——中国粮食生产函数
根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1)粮食播种面积(X2)
成灾面积(X3)农业机械总动力(X4)
农业劳动力(X5)已知中国粮食生产的相关数据,建立中国粮食生产函数:
Y=0+1X1+2X2+3X3+4X4+4X5+第39页,课件共54页,创作于2023年2月第40页,课件共54页,创作于2023年2月1.用OLS法估计上述模型:
R2接近于1;给定=5%,得F临界值F0.05(5,12)=3.11F=638.4>15.19,故认上述粮食生产的总体线性关系显著成立。但X4、X5的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。T=(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)第41页,课件共54页,创作于2023年2月2.检验简单相关系数发现:
X1与X4间存在高度相关性。列出X1,X2,X3,X4,X5的相关系数矩阵:第42页,课件共54页,创作于2023年2月3.找出最简单的回归形式可见,应选第一个式子为初始的回归模型。分别作Y与X1,X2,X4,X5间的回归:
(25.58)(11.49)R2=0.8919F=132.1DW=1.56
(-0.49)(1.14)R2=0.075F=1.30DW=0.12
(17.45)(6.68)R2=0.7527F=48.7DW=1.11
(-1.04)(2.66)R2=0.3064F=7.07DW=0.36第43页,课件共54页,创作于2023年2月4.逐步回归将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。第44页,课件共54页,创作于2023年2月
回归方程以Y=f(X1,X2,X3)为最优:5.结论注:虽然后两个模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 音乐企业文化建设技术服务合同(2篇)
- 苏教版江苏省无锡市重点中学2023-2024学年高一上学期期中数学试题
- 美宝莲口红课件
- 校园风景 课件
- 西京学院《造型基础》2021-2022学年第一学期期末试卷
- 2.1.2植物细胞第一课时
- 初二下收心班会
- 西京学院《机械设计》2022-2023学年第一学期期末试卷
- 阳光下的影子
- 西华师范大学《中国音乐史与名作赏析》2022-2023学年第一学期期末试卷
- 2024年银行考试-招商银行历年考试高频考点试题附带答案
- 2024肺栓塞指南解读2024
- 造价-人员配备方案1
- 中学教代会代表选举办法
- 医院药房二维码溯源管理
- 四川省凉山州2023-2024学年七年级上学期期末检测历史试卷
- 青岛市特殊建设工程消防验收办事指南
- 北京市西城区2023-2024学年五年级上学期期末数学试卷
- 初中九年级化学课件复分解反应的条件“百校联赛”一等奖
- 冷库安全施工方案
- 《企划案撰写》课件
评论
0/150
提交评论