第三讲内生性专题高级计量经济学及Stata应用课件

上传人：1*** IP属地：广东上传时间：2024-07-23 格式：PPT 页数：123 大小：1.21MB 积分：14 举报 版权申诉

已阅读5页，还剩118页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2200119-90-70-178-18陈强计量及Stata应用

(c)20146内生变量在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”(endogenousvariables)。如果我们能够将内生变量分成两部分,一部分与扰动项相关,而另一部分与扰动项不相关,则有希望用与扰动项不相关的那一部分得到一致估计。对内生变量的这种分离可以借助于另外一个“工具变量”(InstrumentalVariable,IV)来实现。工具变量的思想假设存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动。此时,可以估计需求曲线。这个使供给曲线移动的变量就是工具变量。2019-07-18陈强计量及Stata应用

(c)201410气温满足工具变量的定义气温满足工具变量的两个条件:相关性:气温影响供给,而供给影响价格（需求方程中的内生解释变量）,故气温与价格相关外生性:气温为前定变量,故与扰动项不相关。二阶段最小二乘法传统的工具变量法通过“二阶段最小二乘法”(TwoStageLeastSquare,简记2SLS或TSLS)来实现。第一阶段回归:用内生解释变量p对工具变量回归x,得到拟合值。第二阶段回归:用被解释变量q对第一阶段回归的拟合值进行回归。2019-07-18陈强计量及Stata应用

(c)2014122SLS的原理第一阶段回归的拟合值为工具变量的线性函数,故也是外生的（因为工具变量是外生的）。因此,在第二阶段回归中,第一阶段回归的拟合值与扰动项不相关,故可得到一致估计。 2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生部分,以及与扰动项相关的其余部分。把被解释变量对此外生部分进行回归,即得到一致估计。例:宏观模型中的消费函数其中,Y,C,I,G分别代表国民收入、总消费、总投资、政府净支出与净出口。第一个方程为消费方程,第二个方程为国民收入恒等式。可以证明,如果单独对消费方程进行OLS估计,将得到不一致的估计。2019-07-18陈强计量及Stata应用

(c)201415弱工具变量如果工具变量与内生解释变量仅微弱相关,将导致工具变量法估计量的渐近方差变得很大。由于工具变量中仅包含很少与解释变量有关的信息,利用这部分信息进行的工具变量法估计就很不准确,即使样本容量很大也很难收敛到真实的参数值。这种工具变量称为“弱工具变量”(weakinstruments)。弱工具变量的后果类似于样本容量过小,会导致的小样本性质变得很差,而的大样本分布也可能离正态分布相去甚远,致使统计推断失效。2019-07-18陈强计量及Stata应用

(c)201416弱工具变量的检验在第一阶段回归中,检验所有工具变量的联合显著性,得到F统计量。经验规则:如果F<10,则存在弱工具变量；反之,则不存在弱工具变量。弱工具变量的解决方法:(1)寻找强工具变量；(2)如果工具变量足够多,可舍弃弱工具变量。(3)使用有限信息最大似然估计(LimitedInformationMaximumLikelihoodEstimation,简记LIML)2019-07-18陈强计量及Stata应用

(c)201417工具变量的外生性在恰好识别的情况下,无法检验工具变量的外生性。只能进行定性讨论或依赖于专家的意见。定性讨论:如果工具变量是外生的,则其对被解释变量发生影响的唯一渠道就是通过内生变量,除此以外别无其他渠道。此条件被称为“排他性约束”(exclusionrestriction)。在实践中,需要找出工具变量影响被解释变量的所有其他可能渠道,然后一一排除,才能比较信服地说明工具变量的外生性。2019-07-18陈强计量及Stata应用

(c)201418过度识别检验在过度识别的情况下,则可进行“过度识别检验”(overidentificationtest)。此检验的大前提(maintainedhypothesis)是该模型至少是恰好识别的,即有效工具变量至少与内生解释变量一样多。在此大前提下,过度识别检验的原假设为“所有工具变量都是外生的”。过度识别检验的步骤把2SLS的残差对工具变量及外生解释变量进行回归,检验工具变量的系数是否联合为0。记此辅助回归的拟合优度为R2。Sargan统计量:其中,m为工具变量个数,r为内生解释变量个数如果恰好识别,则m-r=0(自由度为0),义,故无法使用“过度识别检验”。无定2019-07-18陈强计量及Stata应用

(c)201420对解释变量内生性的检验究竟该用OLS还是工具变量法? “豪斯曼检验”(Hausmanspecificationtest)的原假设为“所有解释变量均为外生变量”。如果原假设成立,则OLS比工具变量法更有效。此时使用IV,虽然是一致估计量,但“无病用药”,反而增大估计量方差。反之,如果存在内生解释变量,则OLS不一致,而IV是一致的。豪斯曼检验的原理如果原假设成立,则OLS与IV都一致,即在大样本下与都收敛于真实的参数值 ,因此依概率收敛于0。反之,如果不成立,则IV一致而OLS不一致,故不会收敛于0。如果二者距离很大,则倾向于拒绝原假设。以二次型度量此距离可得:2019-07-18陈强计量及Stata应用

(c)201427IV矩估计的局限性传统的IV矩估计仅适用于恰好识别的情形。在过度识别情况下,则一般使用2SLS。在球型扰动项（同方差、无自相关）的情况下,2SLS是最有效率的。如果存在异方差或自相关,则存在更有效率的方法,即广义矩估计。矩条件的再考察与总体矩条件相对应的样本矩条件为:将上式看成联立方程组,则未知数共有K个,而方程个数为L个(的维度)。如果L<K,为不可识别,有无穷多解。如果L=K,为恰好识别,有唯一解,即。如果L>K,为过度识别,无解；此时传统的矩估计法行不通。2019-07-18陈强计量及Stata应用

(c)201431GMM与2SLS在同方差情况下,GMM=2SLS。在恰好识别情况下,GMM=2SLS。在异方差、过度识别情况下,GMM比2SLS更有效率。GMM的过度识别检验在恰好识别的情况下,GMM的目标函数=0。在过度识别的情况下,如果所有过度识别约束都成立,则目标函数J应该离0不远。如果J大于0很多,则可倾向于认为某些过度识别约束不成立。在原假设“所有矩条件均成立”的情况下,目标函数本身就是检验统计量:在同方差的情况下,J统计量等于Sargan统计量。2019-07-18陈强计量及Stata应用

(c)201434例:滞后变量作为IV 对于时间序列或面板数据,常使用内生变量的滞后变量作为IV。显然,内生变量与其滞后值相关。另一方面,由于滞后变量已经发生,故为“前定”,可能与当期扰动项不相关。 Grovesetal(1994)考察国企改革(员工奖金激励制度)对企业生产率的作用。一般地,奖金占员工中报酬比重越高,则越能促进生产率的提高。但,生产率越高的企业越有能力给员工发奖金,故存在双向因果关系。使用奖金比重的滞后值作为当期奖金比重的工具变量。二者的相关性是显然的。另一方面,当期的生产率不可能影响过去的奖金比重,故奖金比重的滞后值具有外生性。2019-07-18陈强计量及Stata应用

(c)201435例:警察人数与犯罪率一般认为,警察人数越多,执法力度越大,则犯罪率应该越低。但直接把犯罪率对警察人数进行回归,以此度量警察人数对犯罪率的作用,就会出现内生变量偏差。警察人数是内生变量；某市犯罪率越高,市政府越会增加警察人数。 Levitt(1997)创造性地使用“市长选举的政治周期”作为犯罪率的工具变量。在市长连任时,为了拉选票,会增加警察人数,故满足相关性。另一方面,选举周期以机械方式确定,除了对警察人数有影响外,不会单独地对犯罪率起作用,故满足外生性。2019-07-18陈强计量及Stata应用

(c)201436例:制度对经济增长的影响好制度能促进增长,但制度变迁也依赖于经济增长。Acemogluetal(2001)使用“殖民者死亡率”(settlermortality)作为制度的工具变量。近代欧洲殖民者在全世界殖民时,由于各地气候及疾病环境不同,欧洲殖民者的死亡率十分不同。在死亡率高的地方(比如,非洲),殖民者难以定居,故在当地建立掠夺性制度。而在死亡率低的地方(比如,北美),则建立有利于经济增长的制度(比如,较好的产权保护)。这种初始制度上的差异一直延续到今天。因此,殖民者死亡率与今天的制度相关,满足相关性。另一方面,殖民者死亡率除了对制度有影响外,不再对当前的经济增长有任何直接影响,故满足外生性。2019-07-18陈强计量及Stata应用

(c)201437例：看电视过多引发小儿自闭症？在美国,电视的普及与小儿自闭症(autism)发生率的攀升几乎同步。Waldmanetal(2006,2008)研究过多观看电视是否引发小儿自闭症。但有自闭倾向的儿童更经常看电视,而不喜户外活动或与人交往；故存在双向因果关系。 Waldmanetal(2006,2008)使用降雨量作为电视观看时间的工具变量。二者存在相关性,即降雨越多的地区,人们呆在室内的时间越长,故看电视时间也越长；而降雨量很可能是外生的。研究结果支持多看电视为小儿自闭症的诱因。2019-07-18陈强计量及Stata应用

(c)201438实例:年轻男子的教育回报率 Mincer(1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。针对美国面板调查数据中的年轻男子组群(YoungMen’sCohortoftheNationalLongitudinalSurvey,简记NLS-Y),Griliches(1976)采用工具变量法对遗漏变量问题进行了校正。 BlackburnandNeumark(1992)更新了Griliches(1976)的数据,即本例的数据集“grilic.dta”。2019-07-18陈强计量及Stata应用

(c)201439数据集grilic.dta中的变量 lw(工资对数),s(受教育年限),age(年龄),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledgeoftheWorldofWork”测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966-1973年中的某一年)。两期面板数据,初始期为当以上变量有数据的最早年份,结束期为1980年。不带“80”字样的变量名为初始期,带“80”字样的变量名为1980年数据。比如,iq指的是初始期的智商,而lw80指的是1980年的工资对数。数据特征use

grilic.dta,clearsum2019-07-18陈强计量及Stata应用

s,sig2019-07-18陈强计量及Stata应用

expr

tenure

rns

smsa,r2019-07-18陈强计量及Stata应用

expr

tenure

rns

smsa,r2019-07-18陈强计量及Stata应用

2sls

expr

tenure

rns

smsa (iq=med

kww),r

first2019-07-18陈强计量及Stata应用

overid2019-07-18陈强计量及Stata应用

(c)201452豪斯曼检验工具变量法的前提是存在内生解释变量。为此须进行豪斯曼检验,其原假设为“所有解释变量均为外生”,即不存在内生变量。quietlyreglwiqsexprtenurernssmsaestimatesstoreolsquietlyivregress2slslwsexprtenurerns smsa(iq=medkww)estimatesstoreivhausmanivols,constantsigmamore 传统的豪斯曼检验建立在同方差的前提下,故在此不使用稳健标准误。2019-07-18陈强计量及Stata应用

overid由于p值为0.70,故认为所有工具变量均为外生。2019-07-18陈强计量及Stata应用

reg

expr

tenure

rns

smsa,restimates

store

ols_no_iqquietly

reg

expr

tenure

rns

smsa,restimates

store

ols_with_iqquietly

ivregress

2sls

expr

tenure

rns smsa

(iq=med

kww),restimates

store

tslsquietly

ivregress

gmm

expr

tenure

rns smsa

(iq=med

kww)estimates

store

gmmquietly

ivregress

gmm

expr

tenure

rns smsa

(iq=med

kww),igmmestimates

store

igmm2019-07-18陈强计量及Stata应用

install

estoutesttab

ols_no_iq

ols_with_iq

tsls

gmm

igmm,se r2

mtitle

star(*

0.1

0.05

***

0.01)2019-07-18陈强计量及Stata应用

的因素。不同学科可能依条件的不同而采用不同的实验方法,大致可以分为以下几类。2019-07-18陈强计量及Stata应用

(c)201463实验的类别 (1)控制实验(controlledexperiment):在理想的物理实验中,对除以外的因素全部控制不变,单独让变化,然后观察y变化的情况。 (2)随机(控制)实验(randomizedcontrolledexperiment):比如,医学上对新药疗效的实验。由于参加实验者的体质与生活方式不同,不可能完全控制所有其他因素。通常将实验人群随机分为两组,“实验组”或“处理组”(treatmentgroup)服用真药,“控制组”(controlgroup,对照组)服用“安慰药”(placebo)。2019-07-18陈强计量及Stata应用

(c)201465实验的类别(续) 例:在农学中将地块随机地分成三组(因为很难找到土壤条件完全一样的地块),分别给予不同的施肥量,然后考察施肥的效果。 (3)自然实验或准实验(naturalexperimentorquasiexperiment):由于某些并非为了实验目的而发生的外部突发事件,使得当事人仿佛被随机地分在了实验组或控制组。比如,一个州通过某法律,但相邻州未通过此法律。两州民众事先不知道哪个州会通过此法,故无法自我选择住在哪个州。可近似认为民众随机选择住在哪个州,或者被随机地分在实验组(通过法律)与控制组(没通过法律)。理想的随机实验实验组与控制组的成员决定完全随机,比如,通过抛硬币或电脑随机数来决定。因此,个体被分在哪一组或得到多大实验“处理水平”(treatmentlevel),与个体特征或其他因素完全独立。故解释变量“处理水平”与被遗漏的扰动项不相关,可避免遗漏变量偏差(omittedvariablebias)或内生变量偏差(endogenietybias)。例:由于完全随机,无论遗漏多少解释变量,OLS都一致2019-07-18陈强计量及Stata应用

(c)201469例:班级规模与学习成绩美国田纳西州进行了为期四年的随机实验(称为ProjectSTAR,即Student-TeacherAchievementRatio),将幼儿园至小学三年级的学生随机分为三组。第一组为普通班,每班22-25名学生；第二组为小班,每班13-17名学生；第三组也为小班,但配备一名教学助理(teacher’saide)。教师也随机分到这三类班级。实验结果发现,尽管班级规模对学习成绩的影响在统计上显著,但在经济上并不显著(即此效应本身比较小,普通班与小班的成绩差距类似于男生与女生的成绩差距)。引入更多解释变量虽然在理想的随机实验条件下,OLS估计量(差分估计量)是一致的,但由于遗漏了较多变量,故的方差可能较大,OLS估计效率可能不高。如果引入某些遗漏变量,可提高估计效率。也提供了检验是否完全随机的机会。2019-07-18陈强计量及Stata应用

validity)外部有效性问题(external

validity)2019-07-18陈强计量及Stata应用

randomize)未能完全遵从实验设计(partial

compliance)中途退出实验(attrition)实验效应或霍桑效应(experimental

effect或Hawthorne

effect)样本过小2019-07-18陈强计量及Stata应用

sample)小型实验的条件与大规模推广时的现实条件不同一般均衡效应(general

equilibrium

effect)自我选择效应2019-07-18陈强计量及Stata应用

(c)201475第一类自然实验的例子最低工资如何影响对低技能工人的需求？ CardandKrueger(1994)：在1992年，美国新泽西州通过法律将最低工资从每小时$4.25提高到$5.05，但在相邻的宾夕法尼亚州最低工资却保持不变。这两个州的雇主仿佛被随机地分配到实验组(新泽西州)与控制组(宾夕法尼亚州) 收集了两个州的快餐店在实施新法前后雇佣人数的数据，发现提高最低工资对低技能工人的就业几乎没有影响。2019-07-18陈强计量及Stata应用

(c)201476第二类自然实验的例子服兵役是否影响退役后的长期收入？ Angrist(1990)考察越战期间的参军者，当时美国对全国年轻男子以生日抽签的方式进行征兵。尽管抽签结果完全随机，但是否参军还取决于体检，且有些人得到豁免，另一些人未抽中却自愿参军。个体分组仅部分地由自然实验决定，应使用抽签结果作为参军与否的工具变量进行估计。结果表明，服兵役会减少白人的长期收入，但不影响非白人的长期收入。双重差分法做随机实验或自然实验时,实验效果常需一段时间才显现。考虑两期面板数据(t=1实验前,t=2实验后): 为实验期虚拟变量(实验后=1；实验前=0), 为不可观测的个体特征,政策虚拟变量(policydummy)为如果实验未能完全随机化(如观测数据),则可能与被遗漏的个体特征相关,导致OLS不一致。2019-07-18陈强计量及Stata应用

(c)201480DD的两种形式方程与以下面板模型等价: 为实验组虚拟变量(实验组=1,控制组=0)；为实验期虚拟变量(实验后=1,实验前=0),互动项(实验组在实验期取值为1,反之为0)。分组虚拟变量刻画的是实验组与控制组本身的差异(即使不进行实验,也存在此差异),实验期虚拟变量刻画的是实验前后两期本身的差异(即使不进行实验,也存在此时间趋势),互动项度量实验组的政策效应。2019-07-18陈强计量及Stata应用

(c)201483双重差分的Stata命令sscinstalldiff (下载安装命令diff)diffy,treat(varname)period(varname) cov(z1z2)robustreporttest “y”为结果变量( ),“treat(varname)”指定处理变量( ),“period(varname)”指定实验期虚拟变量( )。 “robust”表示汇报稳健标准误。“cov(z1z2)”指定其他解释变量,“cov”表示协变量(covariate)；“report”表示汇报对协变量系数的估计结果。“test”表示检验在基期时,各变量在实验组与控制组的均值是否相等。2019-07-18陈强计量及Stata应用

(c)201485例:最低工资的自然实验以数据集cardkrueger1994.dta为例被解释变量:fte(fulltimeemployment人数) 实验组虚拟变量treated(treated=1,快餐店在新泽西；treated=0,快餐店在宾州),实验期虚拟变量t(t=1,1992年11月；t=0,1992年2月)。其他解释变量:bk(BurgerKing=1),kfc(KentuckyFriedChicken=1),roys(RoyRogers=1),wendys(Wendy’s=1)。手工计算双重差分法use

cardkrueger1994,cleargen

gd=t*treated (定义交叉项gd)reg

fte

treated

t,r处理效应(互动项gd)系数为2.914,p值为0.0942019-07-18陈强计量及Stata应用

(c)201491双重差分法的局限性将双重差分法应用于观测数据时,如果政策虚拟变量为内生,则依然得不到一致估计。比如,政府提供的就业培训项目,完全由个人决定是否参与。由于实际处理水平存在自我选择(selfselection),并非随机分组,导致不一致估计解决方法之一:倾向得分匹配(propensityscorematching),使实验组与控制组在各方面特征尽可能接近。2019-07-18陈强计量及Stata应用

counterfactual

framework “处理变量”(treatmentvariable)项目(1=参与,0=未参与)。表示个体i是否参与未来收入或其他感兴趣的结果(outcomeofinterest)为个体i的未来收入有两种状态,取决于是否参加项目:为未参加项目的未来收入,为参加项目的未来收入2019-07-18陈强计量及Stata应用

(c)201493处理效应个体i的处理效应(treatmenteffect):平均处理效应(AverageTreatmentEffect,简记ATE): 参与者平均处理效应(AverageTreatmentEffectontheTreated,简记ATT): 非参与者平均处理效应(AverageTreatmentEffectontheUntreated,简记ATU):2019-07-18陈强计量及Stata应用

(c)201494选择难题个体通常会根据参加项目的预期收益而自我选择是否参加项目,导致对平均处理效应的估计带来困难,称为“选择难题”(theselectionproblem)。与样本选择问题(Heckman,1979)的区别:样本选择问题通常不考虑某项目或政策的效应,故个体间的差异不在于是否得到处理,而在于是否能进入样本(即被解释变量是否可观测)随机分组可解决选择难题,但不适用于观测数据。2019-07-18陈强计量及Stata应用

(c)201495依可测变量选择除外,还可观测到其他个体特征,比如年龄、性别、培训前收入,记 ,也称“协变量”(covariates)。如果个体的选择完全取决于可观测的 ,称为“依可测变量选择”(selectiononobservables),则可进行倾向得分匹配。对于“依不可测变量选择”(selectiononunobservables),处理更为困难。2019-07-18陈强计量及Stata应用

(c)201496可忽略性假设RosenbaumandRubin(1983)引入“可忽略性”假设:给定 ,则独立于 ,记。可忽略性也称为“无混淆性”(unconfoundedness),“条件独立假定”(ConditionalIndependenceAssumption,简记CIA),或“依可测变量选择”(selectiononobservables)。可忽略性是个很强的假定,除非有较丰富的协变量(arichsetofcovariates)。2019-07-18陈强计量及Stata应用

(c)201497匹配估计量的思想假设个体i属于处理组,找到属于控制组的某个体j,使得个体j与个体i的可测变量取值尽可能相似(匹配),即基于可忽略性假设,则个体i与个体j进入处理组的概率相近,具有可比性；故可将作为的估计量,即将作为对个体i处理效应的度量。对控制组每位个体也进行匹配,然后对每位个体的处理效应平均,即得到“匹配估计量”(matchingestimators)。2019-07-18陈强计量及Stata应用

(c)201498倾向得分高维匹配不容易,希望用单一指标进行匹配。 RosenbaumandRubin(1983)使用“倾向得分”(propensityscore)来度量与距离。个体i的倾向得分为,在给定组的条件概率,即的情况下,个体i进入处理,简记使用倾向得分作为距离函数进行匹配,称为“倾向得分匹配”(PropensityScoreMatching,简记PSM)。2019-07-18陈强计量及Stata应用

Support)2019-07-18陈强计量及Stata应用

(c)2014107倾向得分匹配的Stata命令sscinstallpsmatch2,replace选择项“replace”表示以最新版命令替代可能的旧命令psmatch2Dx1x2x3,outcome(y)logittiesate commonoddspscore(varname)quietly “D”为处理变量(treatmentvariable),“x1x2x3”为协变量,“outcome(y)”来指定结果变量“y”。选择项“logit”表示使用logit估计倾向得分,默认probit “ties”表示包括倾向得分相同的并列个体,默认按排序选择其中一位个体。2019-07-18陈强计量及Stata应用

(c)2014108倾向得分匹配的Stata命令(续)“ate”表示同时汇报ATE,ATU与ATT,默认仅汇报ATT 选择项“common”表示仅对共同取值范围(commonsupport)内个体进行匹配,默认对所有个体进行匹配。选择项“odds”表示使用几率比(oddsratio,即)进行匹配；默认使用倾向得分p进行匹配。选择项“pscore(varname)”用来指定某变量作为倾向得分,默认通过“x1x2x3”来估计倾向得分。选择项“quietly”表示不汇报对倾向得分的估计过程。2019-07-18陈强计量及Stata应用

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三讲内生性专题高级计量经济学及Stata应用课件

文档简介

温馨提示

最新文档

评论

第三讲 内生性专题 高级计量经济学及Stata应用课件

文档简介

温馨提示

最新文档

评论

相关文档

第三讲内生性专题高级计量经济学及Stata应用课件