版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲:内生的解释变量与工具变量法第二讲:1单方程线性模型•如果我们在经验分析中采用一个单方程线
性模型来研究x对y的影响,并得到相关的
政策结论,那么则要求方程y
=
0
+
1X1
+
2X2
+
.
.
.
kXk
+
u能够反映X与y之间的因果关系,而不是单纯的统计相关关系单方程线性模型•如果我们在经验分析中采用一个单方程线y2假设1•条件期望线性与外生性假设y
=E(y|X)+u=
0
+
1X1
+
2X2
+
.
.
.
kXk
+
u•定义:u
=
y−E(y|X),则假设1意味E(u|X)=0,这又成为X严格外生性的假设–如果E(u|X)=0成立,线性模型就能够解释x与y之间的因果关系,并成为结构模型–同时E(u|X)=0是E(X’u)=0的充分条件,E(X’u)=0是OLS估计的依据。–E(u|X)=0还意味着Cov(X,u)=0假设1•条件期望线性与外生性假设y=E(y|X)+3假设2•样本矩阵满列秩rank(X)=K<n•含义–要求有足够多的观测值,n>k–变量之间不存在线性组合–保证X‘X可逆,满秩,非奇异,从而估计结果唯一假设2•样本矩阵满列秩rank(X)=K<n•含义–4假设3•随机扰动项同方差、无自相关Var(y|X)=²I•含义–y的条件方差为纯量协方差矩阵–由于²为常数,与x无关,所以条件方差等价于无条件方差–该假设等价于Var(u|X)=²,即同方差Var(ui)=²,无序列相关Cov(ui,uj)=0假设3•随机扰动项同方差、无自相关Var(y|X)=²5假设4•(yi,xi)为随机样本,i=1,2,⋯,n假设4•(yi,xi)为随机样本,i=1,2,⋯,n6对模型假设的讨论•线性条件期望不成立的情形E(y|X)≠X’,E(u|X)≠0•来源–模型设定的错误misspecification–变量的误差–联立性对模型假设的讨论•线性条件期望不成立的情形E(y|X)≠7模型的设定错误•函数形式的错误–非参数设定来解决•包含了多余变量–如果多加的变量与其它的解释变量无关,OLS估计仍然是无偏,一致,但不有效–如果多加的变量与其它的解释变量有关,OLS估计有偏–例:研究新生儿体重y与母亲在孕期的食品摄入量x的关系,如果考虑家庭收入z。正确的模型设定为:
E(y|x,z)=x。如果加入z,模型变为E(y|x,z)=₀x+γz如果z与x无关,则β₀=β,但通常的情况下,z与x相关,从而₀≠模型的设定错误•函数形式的错误–非参数设定来解决•8•遗漏变量–被遗漏的变量q进入到随机扰动项中,
u=rq+v,OLS估计不一致,教材P63例•解决的办法–代理变量–工具变量法–paneldata•遗漏变量–被遗漏的变量q进入到随机扰动项中,•解9•教育回报的例子
–正确的模型设定
log(wage)=0+1exp+2exp²+3edu+abil+v
–能力ability通常观察不到,成为遗漏变量,模型
成为
log(wage)=0+1exp+2exp²+3edu+u–通常ability受到教育的影响abil=₀+₃edu+r,
E(r|exp,exp²)=0–从而E(b3)=3+3,b3不仅是有偏的,而且在大
样本中也是不一致的。–特别是,如果3>0,b3会高估教育对工资的影响•教育回报的例子–通常ability受到教育的影响a10变量的测量误差•被解释变量的测量误差•真实的模型设定y*=X’+u•y*没有被准确观察到,观察到的是y–y=y*+v,v为测量误差–模型变为:y=X’+u+v–如果E(v|X)=0,假设1没有被破坏–如果E(v|X)≠0,假设1不成立,OLS有偏且不一致变量的测量误差•被解释变量的测量误差y*=X’+u•11•解释变量的测量误差•真实的模型设定y=X’β+z*+u–z*含有测量误差,观察到
z=z*+v,E(z|x,z*)=z*,–实际的回归方程为:y=X’+z+(u-v)=X’+z+ε–这时,由于ε=u-v与z=z*+v相关,所以E(ε|X,z)≠0,假设1不成立•解释变量的测量误差y=X’β+z*+u–z*含有测12联立性•所谓联立性是指,两个变量之间的因果关系不是单方向的,它们之间相互影响•在单方程模型中,如果至少一个解释变量
同时由被解释变量y部分决定,模型就出现
了联立性问题•联立性问题很多情况下,是由于变量遗漏造成的。•在出现联立性的模型中,E(u|X)≠0联立性•所谓联立性是指,两个变量之间的因果关系不是单方向13解释变量的外生性• 解释变量外生性是古典线性回归模型的一个基本假定,也是保证线性模型成为结构模型的前提• 该假定的基本内容是指扰动项关于解释变量的条件期望等于零:E(u|X)=0–解释变量X产生机制与随机扰动项u无关–可以推出:Cov(Xjk,ui)=0和E(x′ku)=0–大样本条件下的渐进无关性:解释变量的外生性• 解释变量外生性是古典线性回归模型的一个14一个说明• E(x′ku)=0表示Xk与u在小样本情形下无关可能成立,即在大样本条件下,Xk与u满足渐近无关性。此时,OLS估计量仍然能够保持良好的大样本性质• 但是当E(x′ku)≠0时,
仍然有一个说明• E(x′ku)=0表示Xk与u在小样本情15内生解释变量的产生• 内生解释变量产生的原因基本上可以分为四种:–遗漏变量–观测误差–联立偏差–样本选择问题(sampleselection)内生解释变量的产生• 内生解释变量产生的原因基本上可以分为16遗漏变量• 当被遗漏的变量与引入模型的其他解释变量相关,被遗漏的变量进入到随机扰动项时,就会导致解释变量与扰动项相关• 假定真实的总体模型设定为:Y=Xβ+Wγ+u• 但是由于不可观察的原因,我们无法得到W的数据,这样回归模型就成为:Y=Xβ+ε ,其中ε=Wγ+u• 如果X中的某个或某几个解释变量,如Xk与W相关,就将导致Cov(xk,ε)≠0,从而出现内生的解释变量问题遗漏变量• 当被遗漏的变量与引入模型的其他解释变量相关,被17观测误差• 不论是通过现场调查还是二手数据,我们都不可能避免“观测误差”问题• 当观测误差进入到随机扰动项中,并与某个或某些解释变量相关时,就出现了内生解释变量–在收入调查中,被访者的报告误差常常与被访者的年龄呈现某种关系,即年龄越小,误差可能越大• 即使观测误差与随机扰动项无关,新的随机扰动项仍然会与解释变量相关观测误差• 不论是通过现场调查还是二手数据,我们都不可能避18联立偏差• 当X和Y相互作用,相互影响,互为因果时,我们应该用联立方程组的形式来描述它们之间的关系• 但如果我们仍然采用单一线性方程形式,以Y为被解释变量,X为解释变量,就会导致与扰动项相关的情况出现,X成为内生的解释变量联立偏差• 当X和Y相互作用,相互影响,互为因果时,我们应19样本选择• 样本选择指的是我们所观察的被解释变量的结果,部分地受到行为主体对是否参与某项活动选择的影响,从而导致我们所得到的样本成为非随机的样本–举例而言,在研究个人健康对于医疗保险保费的影响这一问题中,由于我们只能够观察到投保人的保费和他们的个人信息,而无法得到没有投保的消费者相关信息,从而使得个人健康这一变量具有内生性–具体而言,投保人的个人健康状况一般稍差,并愿意支付更高的保费样本选择• 样本选择指的是我们所观察的被解释变量的结果,部20内生解释变量的影响计量b不一致• 当E(u|X)≠0时,OLS估计量b有偏且不一致• 在大样本条件下,当,OLS估内生解释变量的影响计量b不一致• 当E(u|X)≠021内生解释变量的探查• 怎样判断模型的解释变量中出现了与随机扰动项相关的情形,并没有现成的检验方法• 当我们找到足够多的工具变量时,可以对疑似内生的解释变量进行检验• 除了统计上的检验之外,我们可以根据上述内生解释变量产生的原因,即遗漏变量、观测误差、联立偏差、样本选择与经济理论、所研究的具体问题结合起来,判断回归模型中是否出现了解释变量的内生性内生解释变量的探查• 怎样判断模型的解释变量中出现了与随机扰22• 例如,外商直接投资(FDI)技术溢出效应• 经验分析中通常都是以行业/企业产出水平或劳动生产率作为被解释变量,通过该变量对于FDI的回归系数的符号、大小以及显著程度,来判断FDI对于引入外资的行业/企业业绩变化的实际影响• 由于FDI的进入与外资引入国本身的要素禀赋、技术水平、劳动力状况以及经济发展水平密切相关,因此FDI与行业/产出水平相互影响,使之成为具有内生性的解释变量,人们可能会在溢出效应并没有发生的情况下,把生产效率的提高归因于外资企业的溢出作用,从而在单方程的计量分析中产生联立偏差• 例如,外商直接投资(FDI)技术溢出效应23工具变量法• 工具变量的定义• 工具变量法• IV估计量的统计性质两阶段最小二乘法(2StageLeastSquare)• 工具变量的选择• 对内生性的简单检验工具变量法• 工具变量的定义24• Xk为内生的解释变量• 假定我们可以把Xk分解为两个部分,一部分与随机扰动项u相关,另一部分与u无关• 如果我们能够找到另一个变量或多个变量Z,它与Xk相关,但与u无关,就可以通过Z将Xk中与u无关的部分分离出来,从而识别出Xk对y的边际影响,这个结果具有一致性这种方法称为工具变量法(InstrumentalVariablesMethod,简称IV法)• Xk为内生的解释变量25y
=
0
+
1X1
+
2X2
+
.
.
.
kXk
+
uy
=
0
+
1
1
+
2X2
+
.
.
.
kXk
+
u
X1=
a0
+
a1Z
+
a2X2
+
.
.
.
akXk
+
v原方程:新方程(工具变量):主回归:辅助回归:y=0+1X1+2X2+...26工具变量的定义• 在K变量线性回归模型中,不妨假定解释变量XK具有内生性,即E(u|XK)≠0,或E(x′Ku)≠0,或
如果变量Z1,Z2,…,ZL,L≥K,满足下面两个条件,则称为工具变量:工具变量的定义• 在K变量线性回归模型中,不妨假定解释变量27条件1:工具相关性• 该条件要求r[E(Z′X)]=K在大样本条件下,上式还可表述为• 条件1该条件要求工具变量与解释变量相关,但在实际中,仅仅相关是不够的,只有在高度相关的条件下,IV估计结果才具有良好的大样本性质∑zx 满列秩,即行列式≠0条件1:工具相关性• 该条件要求• 条件1该条件要求工具变量28弱工具变量• 与解释变量之间的相关关系很弱的工具变量被称为“弱工具变量”• 运用弱工具变量,IV估计结果不仅具有很低的估计精度和很大的方差,而且会放大变量遗漏的偏差• 同时,在大样本的条件下,IV估计量的渐进正态性将不会出现。弱工具变量• 与解释变量之间的相关关系很弱的工具变量被称为29条件2.工具外生性• 该条件要求E(Z′u)=0• 上式表明,Z与u无关,Z具有外生性• 在大样本条件下,上式还可表述为• 由于u不可观测,这个条件在理论上是不可检验的,但在现实中,当满足某些条件时,可以进行事后检验条件2.工具外生性• 该条件要求• 由于u不可观测,这个条件30例• 假定解释变量Xk具有内生性,找到Z=(X1,X2,…
,XK−1,ZK)只要Cov(ZK,XK)≠0,Cov(ZK,ε)=0变量Z就满足条件1和2,成为工具变量• 实际运用中,寻找工具变量的关键就是要找到与Xk高度相关而与u无关的Zk例31识别• 恰好识别–回归模型中有一个解释变量是内生的,而我们就找到一个工具变量–内生的解释变量个数与工具变量的个数相等• 不可识别–内生的解释变量个数大于工具变量的个数,我们无法估计回归参数• 过度识别–工具变量的个数更多–只有在这种情形下,我们才能够对工具变量的外生性进行检验识别• 恰好识别–回归模型中有一个解释变量是内生的,而我们32讨论:教育回报率研究中的IV• 内生的解释变量:教育水平或年限• 被解释变量:个人收入或工资水平• 文献中使用的工具变量–父母的教育水平–家庭收入–同胞的教育水平–18岁时家庭所在地的蓝领工资、失业率–家庭住址距离大学校区的距离–相关的义务教育法规讨论:教育回报率研究中的IV• 内生的解释变量:教育水平或年33IV估计量bIV的统计性质• IV估计量在有限样本的条件下表现并不理想–通常是有偏的–此时的IV估计量可能不满足矩条件• 在大样本条件下,IV估计量将拥有良好的性质,因此下面就只讨论的大样本性质IV估计量bIV的统计性质• IV估计量在有限样本的条件下表34两阶段最小二乘法• 原理和步骤• 实际操作• 2SLS估计量的性质两阶段最小二乘法• 原理和步骤35原理和步骤• 回归模型Y =Xβ+u• 假定解释变量XK具有内生性• 找到XK的M个工具变量:Z1,Z2,…
,ZM• 如果我们分别运用这M个工具变量对β进行估计,我们将得到M个工具变量估计结果• 但是,如果我们在一次回归中运用这M个工具变量,将会得到最好的估计结果,这个方法就是两阶段最小二乘法原理和步骤• 回归模型Y =Xβ+u36
372SLS具体步骤• 以XK为因变量,对X1,X2,…
,XK−1,Z1,…,ZM进行OLS回归,得到拟合值–
是其它外生的解释变量以及M个工具变量的线性组合–根据假定和工具变量的定义,
中的每个因子都与随机扰动项无关,因此
也与u无关–同时,
是XK的拟合值,因此它又与XK高度相关2SLS具体步骤• 以XK为因变量,对X1,X2,…38• 以y为因变量,对回归• 得到:X1,X2,…,XK−1,
进行OLS• 以y为因变量,对回归X1,X2,…,XK39实际操作ivregressestimatordepvar
[varlist1](varlist2=varlist_iv)[if][in][weight][,options](Stata10,之前的版本命令为ivregestimator2slstwo-stageleastsquares(2SLS)limllimited-informationmaximumlikelihood(LIML)gmmgeneralizedmethodofmoments(GMM)实际操作ivregressestimatordepvar40例ivregyG1G2G3(X=Z),first–the“first”optionprovidesyouwiththefirststageresultsivregyG1G2G3(X=Z1Z2),first–Ifyou’vegotmorethan1instrumentforeachendogenousindependentvariable例ivregyG1G2G3(X=Z),fir412SLS估计量的性质• 2SLS估计量除了具有一般工具变量估计量所具有的一致性和渐近正态性之外,当随机扰动项满足同方差的假定时,给定一组工具变量,2SLS估计量将是其中最有效的估计量,这个性质称为2SLS估计量的相对有效性• 证明见教材96-97页2SLS估计量的性质• 2SLS估计量除了具有一般工具变量估42工具变量的选择• IV方法运用的结果取决于工具变量的有效性• 而该有效性又取决于工具变量本身与内生的解释变量之间的相关性以及它与随机扰动项之间的独立性工具变量的选择• IV方法运用的结果取决于工具变量的有效性43Z与XK的相关性• Z与XK的相关性越强,根据正态分布所进行的统计推断的可靠性就越高• 一个好的工具变量,首先要看它是否与XK存在很强的相关性• 计量经济学家建议可以对2SLS程序中的第一阶段的回归方程进行回归系数的总体显著性检验,来判断Z与XK是否具有很强的相关性Bound,JaegerandBaker(1995)–如果F值小于10,则认为Z为弱的工具变量Z与XK的相关性• Z与XK的相关性越强,根据正态分布所进行44Z的外生性• 如果在IV估计中,我们使用了非外生的工具变量,即Z与随机扰动项u相关,IV估计量将是不一致的• 在“过度识别”的情形下,我们才可以对Z的外生性进行检验Sagan检验–用原模型的IV估计的残差e对其它外生的解释变量和工具变量进行回归,得到拟合优度R2。–Sagan统计量(n−K)R2~χ2(M−1)aZ的外生性• 如果在IV估计中,我们使用了非外生的工具变量45对XK内生性的简单检验Hausman设定检验–如果XK不具有内生性,IV估计结果与OLS估计结果没有显著的差异• 步骤–用XK对其他外生的解释变量和工具变量进行OLS回归,得到残差v–建立回归方程:Y=Xβ+γv+u–检验γ的显著性•如果不显著,表明XK不具有内生性对XK内生性的简单检验Hausman设定检验46工具变量选取示例:工具变量选取示例:47工具变量选取示例:工具变量选取示例:48一个例子:JoshuaAngrist(1990)• WhyDoWorldWarIIVeteransEarnMoreThanNonveterans?作者在这篇文章中分析了美国二战老兵的入伍经历对他们日后工资的影响工资方程:lnW=Vβ
+Xδ
+Yiαi
+ε– W:男性的工资– V
:他是否在二战期间服过兵役– X
:控制变量组– Yi
:出生年份虚拟变量– ε:随机误差项一个例子:JoshuaAngrist(1990)• Wh49第2讲-工具变量法ppt课件50• 如果我们用OLS方法对上面的工资方程进行估计的话,真实的参数α很可能被低估• 这是因为在美国志愿兵的体制下,应召入伍的样本不是一个随机样本–人们作出是否参军的决定是一个“自我选择”的过程,这个过程受到很多观察不到的因素的影响–特别是,这些因素也同时对他们的工资水平产生影响–一般而言,那些在工作市场上机会不多、工资微薄的人更可能会选择服兵役,因此成为一个具有内生性的解释变量• 如果我们用OLS方法对上面的工资方程进行估计的话,真实51寻找工具变量• 这个工具变量必须满足:• (1)工具的相关性,即它应该与个人的服兵役状态相关;• (2)工具的外生性,即它本身并不决定个人的工资水平,同时也不与其他决定工资水平的因素相关。寻找工具变量• 这个工具变量必须满足:52“抽签”征兵制度• 1942年,为了扩军的需要,美国政府在“志愿兵”制度的基础上,推行了“抽签”的强制征兵制度• 根据该制度,365天中的每一天被赋予一个随机选择号码(RandomSelectionNumber,RSN),这样每位19~26岁合格役男按照生日被分配一个相对应的RSN• 美国国防部根据征兵人数的需要,公布一个门槛号码(在那一年,这个号码是195),RSN小于门槛号码的役男将应征入伍。“抽签”征兵制度• 1942年,为了扩军的需要,美国政府在53• 在Angrist的研究中,这个制度的实行被当作了一次“自然实验”–Angrist将RSN是否小于门槛号码这一虚拟变量作为兵役状态的工具变量–由于RSN与门槛号码的大小关系决定了每位役男是否入伍的状态,RSN越小,入伍的可能性越大,RSN越大,入伍的可能性越低,因此它与有着很强的相关性–但同时RSN是一个随机号码,它本身与工资水平无关,因此满足工具的外生性要求,是一个有效的工具变量• 在Angrist的研究中,这个制度的实行被当作了一次“54第2讲-工具变量法ppt课件55– Z:工具变量“出生季度,以及出生季度与出生年份的乘积交互项”Z=(Q1,Q2,Q3,Q1*Y1926,…,Q3*Y1928)工具变量回归方程:– Z:工具变量“出生季度,以及出生季度与出生年份的乘积交互56BasicResultsontheReturntoWorldWa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国数控软件行业市场深度分析及投资战略规划建议报告
- 仓储物流项目可行性分析
- 唐山特种陶瓷制品项目可行性研究报告
- 中国锯片包装项目投资可行性研究报告
- 智能仪器仪表项目可行性研究报告建议书申请备案
- 压力枪行业行业发展趋势及投资战略研究分析报告
- 尼龙丝项目可行性研究报告
- 2025年中国塑胶包装行业市场发展现状及投资潜力预测报告
- 2025年特白瓷项目可行性研究报告-20250102-044540
- 2025年熔融还原铁项目可行性研究报告
- 中建安全标准化图册图集(上下全集)(全电子版)
- 高一物理必修一思维导图
- 锚索张拉和锁定记录表
- 2016年校本课程--------合唱教案1
- 【原创】《圆柱与圆锥》复习课教教学设计
- 《中国药典》规定中药饮片用量
- 国网合肥供电公司城市新建住宅小区电力建设实施细则
- 初中物理元件实物图及一些常用图形
- 中小学生备战期末迎接期末考试动员班会PPT
- 房测之友BMF用户说明书
- 国自然模板(空白版)
评论
0/150
提交评论