多重共线性与随机解释变量_第1页
多重共线性与随机解释变量_第2页
多重共线性与随机解释变量_第3页
多重共线性与随机解释变量_第4页
多重共线性与随机解释变量_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多重共线性与随机解释变量第1页,课件共84页,创作于2023年2月一、多重共线性的概念第2页,课件共84页,创作于2023年2月1、多重共线性对于模型

(i=1,2,…,n)

如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。其基本假设之一是解释变量kXXX,,,21L互相独立。

第3页,课件共84页,创作于2023年2月

如果存在

c1X1i+c2X2i+…+ckXki=0i=1,2,…,n其中:ci不全为0,即某一个解释变量可以用其它解释变量的线性组合表示,则称为解释变量间存在完全共线性。

如果存在c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n其中ci不全为0,vi为随机误差项,则称为一般共线性(近似共线性)或交互相关(intercorrelated)。第4页,课件共84页,创作于2023年2月

在矩阵表示的线性回归模型

Y=XB+N

中,完全共线性意味着:秩(X)<k+1。换言之,矩阵中,至少有一列向量可由其他列向量(不包括第一列)线性表出。çççççèæ=knnnkkXXXXXXXXXXLLLLLLLL212221212111111n×(k+1)第5页,课件共84页,创作于2023年2月

注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。例如,如果X2=aX1,则X1与X2的相关系数为a,解释变量X2对因变量的作用完全可以由X1代替。

第6页,课件共84页,创作于2023年2月2、实际经济问题中的多重共线性现象

经济变量的共同变化趋势

时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;经济衰退时期,各基本经济变量又同时趋于下降。

横截面数据:如生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,而小企业二者都小。第7页,课件共84页,创作于2023年2月

滞后变量的引入

在计量经济模型中,往往需要引入滞后经济变量来反映真实的经济关系。

例如:消费=f(当期收入It,前期消费Ct-1)Ct=β0+β1It+β2Ct-1+μt(t=1,2,···,n)显然,当期收入与前期消费间有较强的线性相关性。第8页,课件共84页,创作于2023年2月

一般经验

对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性;以截面数据作样本时,问题不那么严重,但多重共线性仍然是存在的。第9页,课件共84页,创作于2023年2月二、多重共线性的后果第10页,课件共84页,创作于2023年2月

1、完全共线性下参数估计量不存在如果解释变量之间存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。多元线性回归模型

的普通最小二乘参数估计量为:

因为如果解释变量kXXX,,,21L完全共线性,那么通过适当的线性变换,可以将X中某一列的全部元素变为0,从而行列式0=¢XX。

第11页,课件共84页,创作于2023年2月2、近似共线性下OLS法参数估计量非有效

在一般共线性(或称近似共线性)下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式可以看出,由于此时|X’X|0,引起(X’X)-1主对角线元素较大,从而使得参数估计量的方差也较大,OLS参数估计量非有效。第12页,课件共84页,创作于2023年2月第13页,课件共84页,创作于2023年2月所以,多重共线性使参数估计量的方差增大。方差扩大因子(VarianceInflationFactor)为1/(1-r2),其增大趋势见下表:第14页,课件共84页,创作于2023年2月3、参数估计量的经济含义不合理

如果模型(2.8.1)中两个解释变量具有线性相关性,例如X1和X2,那么它们中的一个变量可以由另一个变量表征。这时,X1和X2前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。所以,各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的,结果恰是负的。第15页,课件共84页,创作于2023年2月4、变量的显著性检验失去意义存在多重共线性时参数估计值的方差与标准差变大容易使通过样本计算的t值小于临界值,误导作出参数为0的推断可能将重要的解释变量排除在模型之外第16页,课件共84页,创作于2023年2月5、模型的预测功能失效参数估计量的方差较大,会使预测值的置信区间较大,预测精确度较差,从而使预测失去意义。第17页,课件共84页,创作于2023年2月三、多重共线性的检验第18页,课件共84页,创作于2023年2月

由于多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法,如判定系数检验法、逐步回归检验法等。

多重共线性检验的任务是:(1)检验多重共线性是否存在;(2)估计多重共线性的范围,即判断哪些变量之间存在共线性。第19页,课件共84页,创作于2023年2月1、检验多重共线性是否存在

(1)对两个解释变量的模型,采用简单相关系数法

求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。

(2)对多个解释变量的模型,采用综合统计检验法

若在OLS法下,模型的R2与F值较大,但各参数估计量的t检验值较小,则说明各解释变量对Y的联合线性作用显著,但各解释变量之间存在共线性而使得它们各自对Y的独立作用不能分辨,故t检验不显著。第20页,课件共84页,创作于2023年2月2、判明存在多重共线性的范围

将模型中每一个解释变量分别以其余解释变量为解释变量进行回归计算,并计算相应的拟合优度,也称为判定系数。如果在某一种形式

Xji=1X1i+2X2i++LXLi中判定系数较大,则说明在该形式中作为被解释变量的Xj可以用其他X的线性组合代替,即Xj与其他X之间存在共线性。(1)判定系数检验法第21页,课件共84页,创作于2023年2月一种等价的检验:

在模型中排除某一个解释变量Xj,估计模型,如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。第22页,课件共84页,创作于2023年2月(2)逐步回归法

以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否可以用其它变量的线性组合代替,而不作为独立的解释变量。如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果拟合优度变化很不显著,则说明新引入的变量不是一个独立解释变量,它可以用其它变量的线性组合代替,也就是说它与其它变量之间存在共线性关系。第23页,课件共84页,创作于2023年2月(3)扩大因子法方差扩大因子:VIFj=1/(1-R2j)R2j=xj关于其余x的判定系数,若VIFj>10,认为xj与其余变量共线;平均扩大因子远远大于1,认为xj与其余变量共线;容忍度:

TOLj=1-R2j(xj的容忍度)第24页,课件共84页,创作于2023年2月(3)特征根法特征根分析:若(X’X)有多个特征根近似为0,则X就有多个多重贡献关系;条件数:记λi为(X’X)的第i个特征根,λm为最大特征根,称ki=(λm/λi)为第i个条件数若0<k<10(无共线),10<k<100(较严重共线),k>100(严重共线)第25页,课件共84页,创作于2023年2月四、克服多重共线性的方法第26页,课件共84页,创作于2023年2月克服多重共线性的方法:第一类方法:排除引起共线性的变量第二类方法:差分法第三类方法:减少参数估计量的方差第27页,课件共84页,创作于2023年2月

1、第一类方法:排除引起共线性的变量

找出引起多重共线性的解释变量,将它排除出去,是最为有效的克服多重共线性问题的方法。上述用于检验多重共线性的方法,同时就是克服多重共线性问题的方法,其中又以逐步回归法得到最广泛的应用。

但应注意的是:排除了引起共线性的变量后,剩余解释变量参数的经济含义和数值都发生了变化。它们不再仅仅反映自身与被解释变量的关系,也包含了与它们成线性关系的、被排除的变量对被解释变量的影响。第28页,课件共84页,创作于2023年2月2、第二类方法:差分法

对于以时间序列数据为样本、以直接线性关系为模型关系形式的计量经济学模型,将原模型变换为差分模型Yi=1X1i+2X2i++kXki+i可以有效地消除存在于原模型中的多重共线性。

原因在于:一般来讲,增量之间的线性关系远比总量之间的线性关系弱得多。第29页,课件共84页,创作于2023年2月例如:在中国消费模型中的2个变量:第30页,课件共84页,创作于2023年2月

由表中的比值可以直观地看到,两变量增量的线性关系弱于总量之间的线性关系。

进一步分析:

Y与C(-1)之间的判定系数为0.9845,△Y与△C(-1)之间的判定系数为0.7456。

一般认为:两个变量之间的判定系数大于0.8时,二者之间存在线性关系。所以,原模型经检验被认为具有多重共线性,而差分模型则可以认为不具有多重共线性。第31页,课件共84页,创作于2023年2月五、案例一:服装市场需求函数□第32页,课件共84页,创作于2023年2月1、建立模型

根据理论和经验分析,影响居民服装类支出Y的主要因素有:可支配收入X、居民流动资产拥有量K、服装价格指数P1、物价总指数P0。已知某地区的有关资料,根据散点图判断,建立线性服装消费支出模型:

Y=0+1X+2K+3P1+4P0+第33页,课件共84页,创作于2023年2月2、样本数据第34页,课件共84页,创作于2023年2月

由于R2较大且接近于1,而且F=638.4,大于临界值:F0.05(4,5)=15.19,故认为服装支出与上述解释变量间总体线性关系显著。但由于变量K的参数估计值的t检验值较小(未能通过检验),故解释变量间存在多重共线性。3、估计模型(1)用OLS法估计上述模型:

第35页,课件共84页,创作于2023年2月(2)检验简单相关系数不难看出,各解释变量间存在高度相关性,其中尤其以P1和P0间的相关系数为最高。第36页,课件共84页,创作于2023年2月(3)找出最简单的回归形式可见,应选①为初始的回归模型。第37页,课件共84页,创作于2023年2月(4)逐步回归

将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。第38页,课件共84页,创作于2023年2月4、讨论:

①在初始模型中引入P1,模型拟合优度提高,且参数符号合理,但P1的t检验未通过;②再引入K,拟合优度虽有提高,但K与P1的t检验未能通过,且X与P1的t检验值及F检验值有所下降,表明引入K并未对回归模型带来明显的“好处”,K可能是多余的;③去掉K,加入P0,拟合优度有所提高,且各解释变量的t检验全部通过,F值也增大了。④将4个解释变量全部包括进模型,拟合优度未有明显改观,K的t检验未能通过,K显然是多余的。第39页,课件共84页,创作于2023年2月

5、结论回归方程以Y=f(X,P1,P0)为最优:

Y=-12.45+0.10X-0.19P1+0.31P0第40页,课件共84页,创作于2023年2月五、案例二:中国消费函数模型第41页,课件共84页,创作于2023年2月1、OLS法估计结果第42页,课件共84页,创作于2023年2月2、差分法估计结果第43页,课件共84页,创作于2023年2月3、比较β1:0.48095→0.49672β2:0.19854→0.15850在消除了共线性后,GDP对CONS的影响增大,CONS1对CONS的影响减少。第44页,课件共84页,创作于2023年2月当模型存在共线性,将某个共线性变量去掉,剩余变量的参数估计结果将发生变化,而且经济含义有可能发生变化;严格地说,实际模型由于总存在一定程度的共线性,所以每个参数估计量并不真正反映对应变量与被解释变量之间的结构关系。第45页,课件共84页,创作于2023年2月模型选择准则1、R2准则2、调整的R2准则3、赤池信息(AIC)准则4、施瓦茨信息(SIC)准则第46页,课件共84页,创作于2023年2月R2准则第47页,课件共84页,创作于2023年2月调整的R2准则准则:该值越大越好!注意:被解释变量相同才能比较!第48页,课件共84页,创作于2023年2月赤池信息(AIC)准则准则:该值越小越好!注意:被解释变量相同才能比较!可用于比较一模型样本内或样本外的预测表现!第49页,课件共84页,创作于2023年2月施瓦茨信息(SIC)准则准则:该值越小越好!注意:被解释变量相同才能比较!可用于比较一模型样本内或样本外的预测表现!第50页,课件共84页,创作于2023年2月Cp统计量其中:----样本量;

----模型中自变量个数;

----1+全回归模型中个数();

----有个自变量的回归模型的决定系数;

----全回归模型的决定系数。如果一个模型和真实模型之间只有随机差异,的平均值为,而且,数据拟合的很好的回归模型其值应小于。因此,在用这个统计量对不同的回归模型进行评估时,目的往往是为了找到一个模型使其表达式值为负。第51页,课件共84页,创作于2023年2月随机解释变量

RandomIndependentVariable一、随机解释变量问题二、随机解释变量的后果三、工具变量法四、案例第52页,课件共84页,创作于2023年2月一、随机解释变量问题第53页,课件共84页,创作于2023年2月1、随机解释变量问题单方程线性计量经济学模型的假设之一是:

Cov(Xi,i)=0即解释变量与随机项不相关。

违背这一假设的问题被称为随机解释变量问题。这一假设实际上是要求:或者X是确定性变量,不是随机变量;或者X虽是随机变量,但与随机误差项不相关。第54页,课件共84页,创作于2023年2月2、随机解释变量问题的三种情况

对于模型

Yi=0+1X1i+2X2i++kXki+i(i=1,2,…,n)

为讨论方便,假设其中X2为随机解释变量

对于随机解释变量问题,又分三种不同情况:⑴随机解释变量与随机误差项不相关,即

E(X2)=0第55页,课件共84页,创作于2023年2月⑵随机解释变量与随机误差项在小样本下相关,在大样本下渐近无关,即在小样本下

E(X2)0

在大样本下

Plim(X2ii/n)=0

或:P(lim(X2ii/n)=0)=1⑶随机解释变量与随机误差项高度相关,且

Plim(X2ii/n)0第56页,课件共84页,创作于2023年2月2、实际经济问题中的随机解释变量问题

在实际经济问题中,经济变量往往都具有随机性。但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。

于是随机解释变量问题主要表现于用滞后被解释变量作为模型的解释变量的情况。第57页,课件共84页,创作于2023年2月例如:耐用品存量调整模型:

耐用品的存量Qt由前一个时期的存量Qt-1和当期收入It共同决定:

Qt=0+1It+2Qt-1+tt=1,,T

这是一个滞后被解释变量作为解释变量的模型。但是,如果模型不存在随机误差项的序列相关性,那么随机解释变量Qt-1只与t-1相关,与t不相关,属于上述的第1种情况。第58页,课件共84页,创作于2023年2月合理预期的消费函数模型

合理预期理论认为消费是由对收入的预期所决定的,或者说消费是有计划的,而这个计划是根据对收入的预期制定的。于是有:第59页,课件共84页,创作于2023年2月

在该模型中,作为解释变量的Ct-1不仅是一个随机解释变量,而且与模型的随机误差项(t-t-1)高度相关(因为Ct-1与t-1高度相关)。属于上述第3种情况。第60页,课件共84页,创作于2023年2月二、随机解释变量的后果第61页,课件共84页,创作于2023年2月1、出发点

计量经济学模型一旦出现随机解释变量,如果仍采用OLS法估计模型参数,不同性质的随机解释变量会产生不同的后果。对回归模型

Y=XB+N第62页,课件共84页,创作于2023年2月取期望,有

可见,随机解释变量带来什么后果取决于它与随机误差项是否相关。第63页,课件共84页,创作于2023年2月2、当随机解释变量与随机误差项不相关时这时采用OLS法估计模型参数,得到的参数估计量仍然是无偏估计量。第64页,课件共84页,创作于2023年2月

3、当随机解释变量与随机误差项在小样本下相关,在大样本下渐近无关时这时采用OLS法估计模型参数,得到的参数估计量在小样本下是有偏的,在大样本下具有渐近无偏的。第65页,课件共84页,创作于2023年2月4、当随机解释变量与随机误差项高度相关时这时采用OLS法估计模型参数,得到的参数估计量在小样本下是有偏的,在大样本下也不具有渐近无偏性。此时OLS法失效,需要发展新的方法估计模型。第66页,课件共84页,创作于2023年2月5、当滞后被解释变量作解释变量,并且与随机误差项相关时

这时,除了OLS法参数估计量是有偏的以外,还带来两个后果:

①模型必然具有随机误差项的自相关性。因为该滞后被解释变量与滞后随机误差项相关,又与当期随机误差项相关。

②D.W.检验失效。因为不管D.W.统计量的数值是多少,随机误差项的自相关性总是存在的。第67页,课件共84页,创作于2023年2月三、工具变量法

InstrumentalVariablesMethod第68页,课件共84页,创作于2023年2月

1、工具变量的选取

工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。

选择为工具变量的变量必须满足以下条件:

(1)与所替代的随机解释变量高度相关;(2)与随机误差项不相关;(3)与模型中其它解释变量不相关,以避免出现多重共线性。第69页,课件共84页,创作于2023年2月2、工具变量的应用对于多元线性模型Yi=0+1X1i+2X2i++kXki+i(i=1,2,…,n)第70页,课件共84页,创作于202

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论