计量与stata四天lecture3iv高级计量经济学及Stata应用_第1页
计量与stata四天lecture3iv高级计量经济学及Stata应用_第2页
计量与stata四天lecture3iv高级计量经济学及Stata应用_第3页
计量与stata四天lecture3iv高级计量经济学及Stata应用_第4页
计量与stata四天lecture3iv高级计量经济学及Stata应用_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高级计量经济学及Stata应用第三讲工具变量法山东大学经济学院q

/

:econometrics-stata腾讯课堂:https:/

2017/4/24,(c)

20171例:农产品市场均衡模型0t0

1

ttst1

ttqqd

p

pu

(需求)v

(供给)tt

qd

qs(均衡)令供给等于需求可得:0

1

ttq

pqt

0

1

pt

ut

v

t2017/4/24,(c)

20172需求函数还是供给函数?2017/4/24,(c)

20173联立方程偏差求解联立方程可得:1

1t

t

t

t

p

p

(u

,

v

)

00

vt

ut

1

11

0qt

qt

(ut

,

vt

)

0

1

1vt

1ut

1

1

1

1故解释变量与扰动项相关,得不到一致估计,称为“联立方程偏差”(simultaneity

bias)或“内生性偏差”(endogeneity

bias)。2017/4/24,(c)

20174内生变量在计量经济学中,把所有与扰动项相关的解释变

量都称为“内生变量”(endogenous

variables)。如果我们能够将内生变量分成两部分,一部分与

扰动项相关,而另一部分与扰动项不相关,则有

希望用与扰动项不相关的那一部分得到一致估计。对内生变量的这种分离可以借助于另外一个“工具变量”(Instrumental

Variable,IV)

来实现。2017/4/24,(c)

20175工具变量的思想假设存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动。此时,可以估计需求曲线。这个使供给曲线移动的变量就是工具变量。2017/4/246气温作为工具变量假设影响供给方程扰动项的因素可以分解为两部分,即可观测的气 与不可观测的其他因素:qs

p

x

vt

0

1

t

2

t

t气温为前定变量,与两个扰动项都不相关。12气温的变化使得供给函数沿着需求函数移动,故可估计出需求函数。2017/4/24,(c)

20177工具变量的定义一个有效(valid)的工具变量应满足以下两个条件:(1)相关性:工具变量与内生解释变量相关

(2)外生性:工具变量与扰动项不相关。2017/4/24,(c)

20178气温满足工具变量的定义气温满足工具变量的两个条件:相关性:气温影响供给,而供给影响价格(需求方程中的内生解释变量),故气温与价格相关外生性:假定气温与扰动项不相关(比如,气温不影响人们对农产品的偏好或

)。2017/4/24,(c)

20179二阶段最小二乘法传统的工具变量法通过“二阶段最小二乘法”(Two

StageLeast

Square,简记2SLS或TSLS)来实现。第一阶段回归:用内生解释变量p对工具变量回归x,得到拟合值pˆ

。第二阶段回归:用被解释变量

q

对第一阶段回归的拟合值进行回归

。2017/4/24,(c)

2017102SLS的原理第一阶段回归的拟合值为工具变量的线性函数,故也是外生的(因为工具变量是外生的)。因此,在第二阶段回归中,第一阶段回归的拟合值与扰动项不相关,故可得到一致估计。2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生部分,以及与扰动项相关的其余部分。把被解释变量对此外生部分进行回归,即得到一致估计。2017/4/24,(c)

201711例:宏观模型中的消费函数Ct

0

1Yt

tYt

Ct

It

Gt

Xt其中,,,,分别代表国民收入、总消费、总投资、净支出与净出口。第一个方程为消费方程,第二个方程为国民收入恒等式。可以证明,如果单独对消费方程进行OLS估计,将得到不一致的估计。2017/4/24,(c)

201712多个内生变量与多个工具变量可识别的阶条件(必要条件):(1)

不可识别(unidentified):工具变量个数小于内生解释变量个数2

恰好识别

ust

or

exactl identified

:工具变量个数等于内生解释变量个数(3)过度识别(overidentified):工具变量个数大于内生解释变量个数2017/4/24,(c)

201713弱工具变量如果工具变量与内生解释变量仅微弱相关,将导致工具变量法估计量的渐近方差变得很大。由于工具变量中仅包含很少与解释变量有关的信息,利用这部分信息进行的工具变量法估计就很确,即使样本容量很大也很难收敛到真实的参数值。这种工具变量称为“弱工具变量”(weak

instruments)。弱工具变量的类似于样本容量过小,会导致的小样本性质变得很差,而大样本分布也可能离正态分布相去甚远,致使统计推断失效。2017/4/24,(c)

201714弱工具变量的检验在第一阶段回归中,检验所有工具变量的联合显著性,得到F统计量。经验规则:如果F<10,则存在弱工具变量;反之,则不存在弱工具变量。弱工具变量的解决方法:(1)

寻找强工具变量;(2)如果工具变量足够多,可舍弃弱工具变量。3

使用有限信息最大似然估计(Limited

Informationum

Likelihood

Estimation,简记LIML)2017/4/24,(c)

201715经典案例:出生季度是否为弱IV研究教育投资的回报率:ln

wage

educ

z

Angrist

and

Krueger

(1991)将出生季度(quarter

of

birth)作为教育年限的工具变量。

多数州要求青少年在满16岁生日之前必须在校上学(compulsory

schoolinglaws),而又要求儿童在入学那年的1月1日须满6周岁,导致年初出生者在入学时

比年末出生者更大。相比年末出生的学生,年初出生的学生在其受教育过程中,更早就达到了法定退学

(legaldropout

age),使得第1季度出生者所受教育平均而言低2017于/4/2第4

4季度出生者,(c)

2017

16201717弱工具变量由于不同年份的季节效应不同,故使用出生年度虚拟变量与出生季度虚拟变量的交互项作为IV第一阶段回归的F统计量仅为1.61,远小于10,故存在弱工具变量。Bound,

Jaeger

andBaker(1995)则发现,如果以随机地产生虚

出生季度作为工具变量,使用2SLS也能得到相似的教育投资回报率与统计显著性!这再次证明在弱工具变量的情况下,所得2SLS结果是不 的。2017/4/24,(c)

201718解决弱工具变量问题增强工具变量的方法之一是去掉多余的弱工具变量。为此,只使用出生季度虚拟变量为工具变量,并仅保留出生年份虚拟变量作为控制变量(原方程有很多控制变量)第一阶段回归的F统计量上升到32.27,已不存在弱工具变量问题。然而,2SLS估计的教育投资回报率不合理地升至1

.

,故此结果依然不 。可能的原因是,由于控制变量太少,故IV更可能与扰动项相关,使得IV。详见 文章《工具变量法(二):

弱工具变量》2017/4/24,(c)

201719工具变量的外生性在恰好识别的情况下,无法检验工具变量的外生性,只能进行定性

。定性

:如果工具变量

z

是外生的,则其对被解释变量y

发生影响的唯一就是通过内生变量x

,除此以外别无其他。此条件被称为“排他性约束”(exclusion

restriction)。在实践中,需要找出工具变量影响被解释变量的所有其他可能,然后一一排除,才能比较信服地说明工具变量的外生性。2017/4/24,(c)

201720排他性约束2017/4/24,(c)

201721过度识别检验在过度识别的情况下,则可进行“过度识别检验”(overidentification

test)。此检验的

(maintained

hypothesis)是该模型至少是恰好识别的,即有效工具变量至少与内生解释变量一样多。在此

下,过度识别检验的原假设为“所有工具变量都是外生的”。2017/4/24,(c)

201722过度识别检验的步骤把2SLS的残差对工具变量及外生解释变量进行回归,检验工具变量的系数是否联合为0。记此辅助回归的拟合优度为R2。Sargan统计量:

nR2

d

2

(m

r)其中,m为工具变量个数,r为内生解释变量个数如果恰好识别,则m-r=0(度为0),2

(0)

无定义,故无法使用“过度识别检验”。2017/4/24,(c)

201723过度识别检验的思想在过度识别的情况下,可用不同的工具变量组合来进行工具变量法估计;如果所有工具变量都有效,则这些工具变量估计IV量

ˆ

都将收敛到相同的真实参数

。可检验不同的工具变量估计量之间的差是否收敛于;如不是,则说明这些工具变量不全有效。在恰好识别的情况下,只有唯一的工具变量估计量,无法进行比较,故过度识别检验失效。2017/4/24,(c)

201724过度识别检验无法检验IV的外生性。即使接受了过度识别的原假设,也并不能证明这些工具变量的外生性。过度识别检验成立的

是该模型至少恰好识别。此前提无法检验,只能假定成立。IV即使不同的工具变量估计量ˆ

的概率极限相同,并不能保证它们都收敛到真实的参数

;也可能都收敛到其他值,比如

*

恰好识别的

保证了,在这些工具变量估计量至少有一个收敛到真实参数。2017/4/24,(c)

201725排他性约束的经典案例Miguel

etal.

(2004)使用41个非洲国家在1981-

的面板数据,以降雨变化(rainfallvariation)为工具变量,研究经济增长对于内战的因果作用,即经济

内战。首先,由于内战也会影响经济增长,故存在逆向因果,导致内生性。其次,这些非洲国家当时均为农业国,而且其农业主要靠老天自然降雨(rain-fedagriculture),故降雨变化与GDP增长相关,满足工具变量的相关性。

认为天气冲击是外生的,因为人类活动通常无法影响天气。但并不意味着,天气在计量的意义上就是外生的,因为天气依然会影响人类活动,故仍可能与扰动项相关。2017/4/24,(c)

201726天气的外生性?Miguel

et

al.

(2004)

几种可能

排他性约束的情形或农村贫困率,进而第一,降雨变化可能影响收入不内战。尽管缺乏收入不者发现降雨变化与与农村贫困率的数据,作没有显著关系(或影响收入分配与农村贫困)。第二,水灾可能会摧毁公路网,使得军更难控制叛军,从而加剧内战。然而,在简化式回归中,降水越多则内战越少,故如果此偏差存在,则只会低估经济增长对内战的影响,使得IV估计成为真实效应的下限。2017/4/24,(c)

201727天气的外生性(续)第三,降雨可能使得双方难以交战,比如,降雨使得交通条件。然而,作者发现,降雨变化对于可用的公路网并无显著影响。第四,降雨太少可能意味着热浪,使得人们脾气焦躁而易于开战。然而,回归结果表明,内战与滞后一年的经济增长及降雨关系最为密切,而一年时间已足够让头脑发热的人们冷静下来。最后,作者谦卑地承认,无法在根本上完全排除降雨变化通过其他

影响内战,但相信其他 的作用可能不大。2017/4/24,(c)

201728在IV近乎外生情况下的统计推断IV完全外生只是一种理想,现实的IV可能存在轻微内生性。考虑半简化式方程(semi-reduced

form

equation),即将工具变量z也放入原模型:yi

xi

zi

i如果工具变量

z

仅通过内生变量

x

起作用(即满足排他性约束),则在上式中,

0

。如果

0

,则表明

z

存在内生性。如果

0

,则说明工具变量

z

存在轻微的内生性,被Conley

et

al.

(2012)称为“近乎外生”(plausibly

orapproxima y

exogenous)。2017/4/24,(c)

201729基于先验信息的推断如果研究者能给出 的取值范围(support)或先验分布(prior

distribution),则Conley

et

al.(2012)表明,可以根据 的这些先验信息来构造回归系数

的置信区间。作者提供了相应的Stata程序plausexog,方法为ssc

install

plausexog。详见 文章《工具变量法(三):IV真的外生吗?》2017/4/24,(c)

201730Berkowitz

et

al.(2012)的方法“Berkowitzetal.(2012)则直接工具变量与扰动项的相关性,并假设对于几乎外生(nearlyexogenous)的工具变量而言,这种相关性在大样本下,即所谓渐近正交性”(asymptotic

orthogonality)。然后使用一种“部分再抽样”(fractionalresampling)的技术,将检验内生变量系数显著性的Anderson-Rubin检验(简记AR)推广至几乎外生的情形,称为“FAR检验”Riquelme

et

al.(2013)提供了相应的Stata程序far,可在Stata中输入“findit

far”搜索

。2017/4/24,(c)

201731对解释变量内生性的检验究竟该用OLS还是工具变量法?

检验”(Hausman

test)的原假设为“所有解释变量均为外生变量”。如果原假设成立,则OLS比工具变量法更有效。此时使用IV,虽然是一致估计量,但“无病用

药”,反而增大估计量方差。反之,如果存在内生解释变量,则OLS不一致,而IV是一致的。2017/4/24,(c)

201732检验的原理如果原假设成立,则OLS与IV都一致,即在大样本下ˆIV与ˆOLS都收敛于真实的参数值

,因此(ˆIV

OLS

ˆ

)依概率收敛于0。反之,如果不成立,则IV一致而OLS不一致,故不会收敛于0。如果二者距离很大,则倾向于

原假设。以二次型度量此距离可得:IVOLSIVOLSIVOLS1)(ˆ

ˆ

)

Var(ˆ

ˆ(ˆ

ˆ)

d

2

(r)2017/4/24,(c)

201733Hausman

Test

in

Practice•检验在计量理论上很重要,但实证较少

用(时

不汇

)原因一:研究者之所以使用IV,就是因为相信存在内生性原因二:即使接受了“无内生性”的原假设,犯第II类错误的概率仍可能较高2017/4/24,(c)

201734矩估计传统的矩估计(Method

of

Moments,简记MM)假设随量x

~

N

(,

2

),其中,

2

为待估参数。因为有两个待估参数,故须使用两个总体矩条件(population

moment

conditions):一阶矩:二阶矩:E(x)

E(x2

)

Var(x)

E(x)2

2

22017/4/24,(c)

201735矩估计的求解用对应的样本矩(sample

moments)替代总体矩条件可得以下联立方程组,求解可得:ni

1x

ˆ

ˆ

x22nn

ni

11

ˆ2

ˆi1n(xi

x

)2i

1

n

x

ˆ2

i

1矩估计的缺点:更高阶矩可能也包含有用信息,

但被弃而不用。广义矩估计(GMM)可弥补此缺点。2017/4/24,(c)

201736IV法作为矩估计假设最后一个解释变量为内生变量,其工具变量为w:yi

1xi1

K

1xi,

K

1

K

xiK

iyi

xi

i记工具向量为zi

(xi1

xi,K

1

wi

),其中外生解释变量为自己的工具变量(符合工具变量的定义)。2017/4/24,(c)

201737总体与样本矩条件“总体矩条件”或“正交条件”(orthogonalitycondition):E(zii

)

0

Ezi

(

yi

xi

)

01

i

ii

iE(z

y

) E(zi

yi)

E(zi

xi)

E(z

x

)以样本矩代替上总体矩,即得到IV估计量:1ˆnn

11

1i1ni

iz

y

(Z

X

)

Z

yIV

2017/4/24,(c)

201738OLS也是IV矩估计如果所有解释变量都是前定变量,则可以将自己作为自己的工具变量。因此,X

=Z

。•ˆIV

(Z

X)Z

y

(

X

X)X

y

ˆ11OLS2017/4/24,(c)

201739IV矩估计的局限性传统的IV矩估计仅适用于恰好识别的情形。在过度识别情况下,则一般使用2SLS。在球型扰动项(同方差、无自相关)的情况下,2SLS是最有效率的。如果存在异方差或自相关,则存在更有效率的方法,即广义矩估计。2017/4/24,(c)

201740矩条件的再与总体矩条件E(zii

)

0

相对应的样本矩条件为:ˆnni

ˆg

(

)

i

iz

(

y

x

)

01ni

1将上式看成联立方程组,则未知数

ˆ

共有K个,而方程个数为L个(

zi

的维度)。如果L

<K,为不可识别,有无穷多解。如果L

=K

,为恰好识别,有唯一解,即ˆ

。IV如果L

>K

,为过度识别,无解;此时传统的矩估计法行不通。2017/4/24,(c)

201741过度识别恰好识别ˆ2017/4/24,(c)

201742不可识别广义矩估计的定义ˆ

ˆ脑筋急转弯:虽然无法找到使得

gn

(

)

0

,但总可以让向量gn

(ˆ)尽可能地接近0。定义最小化的目标函数为min

J

(ˆ,Wˆ

)

n

gn

(ˆ)Wˆ

gn

(ˆ)ˆ其中,Wˆ

为根据数据估计的“权重矩阵”(weighting

matrix)。所得估计量就是广义矩估计(Generalized

Method

of

Moments,GMM)。2017/4/24,(c)

201743广义矩估计的优点可选择最优权重矩阵,使得估计量的渐近方差最小;称为“最优GMM”(optimalGMM)。但需要先估计最优权重矩阵。两步最优GMM:(1)进行2SLS估计(2SLS也是一致估计),得到残差,估计最优权重矩阵;(2)

使用此最优权重矩阵进行GMM估计。迭代GMM:使用GMM残差,估计最优权重矩阵;重复以上步骤,直至收敛。2017/4/24,(c)

201744GMM与2SLS在同方差情况下,GMM=2SLS。在恰好识别情况下,GMM=2SLS。在异方差、过度识别情况下,GMM比2SLS更有效率。2017/4/24,(c)

201745GMM的过度识别检验在恰好识别的情况下,GMM的目标函数=0。在过度识别的情况下,如果所有过度识别约束都成立,则目标函数J

应该离0不远。如果J

大于0很多,则可倾向于认为某些过度识别约束不成立。在原假设“所有矩条件均成立”的情况下,目标函数本身就是检验统计量:J

d

2

(L

K

)在同方差的情况下,J

统计量等于Sargan统计量。2017/4/24,(c)

201746如何获得工具变量寻找工具变量可大致分两步:列出与内生解释变量相关的尽可能多的变量的

(这一步较容易);从这一 中剔除与扰动项相关的变量(使用exclusion

restriction的逻辑)。2017/4/24,(c)

201747例:滞后变量作为IV对于时间序列或面板数据,常使用内生变量的滞后变量作为IV。显然,内生变量与其滞后值相关。另一方面,由于滞后变量已经发生,故为“前定”,可能与当期扰动项不相关。Groves

et

al.

(1994)

国企

(员工奖金激励制度)对企业生产率的作用。一般地,奖金占员工中

越高,则越能促进生产率的提高。但生产率越高的企业越有能力给员工发奖金,故存在双向因果关系。使用奖金的滞后值作为当期奖金

的工具变量。二者的相关性是显然的。另一方面,当期的生产率不可能影响过去的奖金,故奖金的滞后值具有外生性。2017/4/24,(c)

201748例:人数与率一般认为,人数越多,力度越大,则犯罪率应该越低。但直接把率对

人数进行回归,以此度量

人数对

率的作用,就会出现内生变量偏差。

人数是内生变量;某市率越高,市

越会增加人数。Levitt

(1997)创造性地使用“的政治周期”作为

率的工具变量。在时,为了拉选票,会增加

人数,故满足相关性。另一方面,

周期以机械方式确定,除了对

人数率起作用,故满足有影响外,不会单独地对外生性。2017/4/24,(c)

201749例:制度对经济增长的影响好制度能促进增长,但制度变迁也依赖于经济增长。

Acemoglu

et

al(2001)使用“殖民者率”(settlermortality)作为制度的工具变量。近代欧洲殖民者在全世界殖民时,由于各地气候及疾病环境不同,欧洲殖民者的 率十分不同。在

率高的地方(比如,非洲),殖民者难以

,故在当地建立掠夺性制度。而在

率低的地方(比如,

),则建立有利于

经济增长的制度(比如,较好的 保护)。这种初始制度上的差异一直延续到今天。因此,殖民者

制度相关,满足相关性。另一方面,殖民者率与今天的率除了对制度有影响外,不再对当前的经济增长有任何直接影响,故满足外生性。2017/4/24,(c)

201750例:看电视过多

小儿自闭

?在

,电视的普及与小儿自闭症(autism)发生率的攀升几乎同步。Waldman

et

al.

(2006,

2008)研究过多

电视是否

小儿自闭症。但有自闭倾向的儿童更经常看电视,而不喜户外活动或与人交往;故存在双向因果关系。Waldman

et

al.(2006,2008)使用降雨量作为电视时间的工具变量。二者存在相关性,即降雨越多的地区,人们呆在室内的时间越长,故看电视时间也越长;而降雨量很可能是外生的。研究结果支持多看电视为小儿自闭症的诱因。2017/4/24,(c)

201751实例:年轻男子的教育回报率Mincer(1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。针对

面板

数据中的年轻男子组群(YoungMen’s

Cohort

of

the

National

LongitudinalSurvey,简记NLS-Y),Griliches(1976)采用工具变量法对遗漏变量问题进行了校正。Blackburn

and ark

(1992)更新了Griliches(1976)的数据,即本例的数据集“grilic.dta”。2017/4/24,(c)

201752数据集grilic.dta中的变量”lw(工资对数),s(受教育年限),age(),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledge

ofthe

World

of

Work”测试中的成绩),mrt(虚拟变量,已婚=1),rns(南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966-1973年中的某一年)。两期面板数据,初始期为当以上变量有数据的最早年份,结束期为1980年。不带“80字样的变量名为初始期,带“80”字样的变量名为1980年数据。比如,iq指的是初始期的智商,而lw80指的是1980年的工资,(c)

2017

53。2017对/4/2数4数据特征userilic.dta

clearsumVariableObsMeanStd.

Dev.MinMaxrnsrns80mrtmrt80smsa758758758758758.2691293.292876.5145119.8984169.7044855.4438001.4553825.5001194.3022988.4565750000011111smsa80mediqkwwyear758758758758758.712401110.91029103.856236.5738869.03166.4529422.7411213.618677.3022472.631794005412661181455673ageage80ss80expr75875875875875821.8350933.0118713.4050113

707121.7354292.9817563.0855042.2318282

2146932.10554216289903038181811.444expr80tenuretenure80lwlw8075875875875875811.394261.8311357.3627975.6867396.8265554.2107451.673635.05024.4289494.4099268.692004.6054.74922.04510227.0518.0322017/4/24,(c)

201754智商与教育年限的相关关系pwcorr

iq

s,sigiqsiq1.0000s0.51311.00000.00002017/4/24,(c)

201755不考虑智商(能力的 变量)的OLSreg

lw

s

expr

tenure

rns

smsa,rLinear

regressionNumberof

obs=758F(

5,752)=84.05Prob

>F=0.0000R-squared=0.3521Root

MSE=.34641lwCoef.RobustStd.

Err.tP>|t|[95%

Conf.Interval]s.102643.006209916.530.000.0904523.1148338expr.0381189.00661445.760.000.025134.0511038tenure.0356146.00799884.450.000.0199118.0513173rns-.0840797.029533-2.850.005-.1420566-.0261029smsa.1396666.0280564.980.000.0845893.194744_cons4.103675.087666546.810.0003.9315754.2757752017/4/24,(c)

201756解读(1)回归结果显示,教育投资的年回报率为10.26%,而且在1%的水平上显著地不为0。这意味着,多受一年教育,则未来的工资将高出10.26%,这个教育投资回报率似乎太高了。可能的原因是,由于遗漏变量“能力”与受教育年限正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。2017/4/24,(c)

201757引入智商(iq)的OLSreg

lw

s

iq

expr

tenure

rns

smsa,rlwCoef.RobustStd.

Err.tP>|t|[95%

Conf.Interval]siqexprtenurernssmsa_cons.0927874.0032792.0393443.034209-.0745325.13673693.895172.0069763.0011321.0066603.0078957.0299772.0277712.115928613.302.905.914.33-2.494.9233.600.0000.0040.0000.0000.0130.0000.000.0790921.0010567.0262692.0187088-.1333815.08221863.667589.1064826.0055016.0524193.0497092-.0156834.19125534.122754Linear

regressionNumberof

obs=758F(

6,751)=71.89Prob

>F=0.0000R-squared=0.3600Root

MSE=.344542017/4/24,(c)

201758解读(2)加入“能力”的变量iq后,教育投资的回报率下降为9.28%,变得更为合理些,但仍然显得过高。由于用iq来度量能力存在“测量误差”,故

iq是内生变量,考虑使用变量(med,kww)作为iq的工具变量,进行2SLS回归,并使用稳健标准误。2017/4/24,(c)

2017592SLSivre

ress

2sls

lw

s

ex

r

tenure

rns

smsa(iq=med

kww),r-stage

regressionsF(

7,Prob

>

FR-squared750)

===Number

of

obs

=75847.740.00000.3066Adj

R-squared=0.3001Root

MSE=11.3931iqRobustCoef. Std.

Err.

t

P>|t| [95%

Conf.

Interval]s2.467021.232775510.600.0002.0100522.92399expr-.4501353.2391647-1.880.060-.9196471.0193766tenure.2059531.2695620.760.445-.3232327.7351388rns-2.689831.8921335-3.020.003-4.441207-.938455smsa.2627416.94653090.280.781-1.5954242.120907med.3470133.16813562.060.039.0169409.6770857kww.3081811.06467944.760.000.1812068.4351553_cons56.671223.07695518.420.00050.6307562.711692017/4/24,(c)

201760Instrumental

variables(2SLS)regressionNumber

of

obs=758Wald

chi2(6)=370.04Prob

>

chi2=0.0000R-squared=0.2775Root

MSE=.36436lwCoef.RobustStd.

Err.zP>|z|[95%

Conf.Interval]iq.0139284.00603932.310.021.0020916.0257653s.0607803.01895053.210.001.023638.0979227expr.0433237.00741185.850.000.0287968.0578505tenure.0296442.0083173.560.000.0133432.0459452rns-.0435271.0344779-1.260.207-.1111026.0240483smsa.1272224.02974144.280.000.0689303.1855146_cons3.218043.39836838.080.0002.4372563.998831Instrumented:Instruments:iqs

expr

tenure

rns

smsa

med

kww2017/4/24,(c)

201761解读(3)上表显示,教育投资回报率降为6.08%,比较合理。下面,进行过度识别检验。2017/4/24,(c)

201762过度识别检验estat

overidrestrictions:=

.151451 (p

=ScoreTest

of

overidentifyingchi2(1)0.6972)2017/4/24,(c)

201763弱工具变量检验

有效工具变量的第二个条件,即工具变量与内生变量的相关性。从第一阶段的回归结果可以看出,工具变量(med,

kww)对内生变量iq均有较好的解释力,p值都小于0.05。正式的检验可以通过如下命令进行:estat

stage2017/4/24,(c)

201764VariableR-sq.AdjustedR-sq.PartialR-sq.RobustF(2,750)Prob

>Fiq0.30660.30010.038213.40280.0000-stage

regression

summary

statisticsF统计量为13.40(超过10)

,故不存在弱工具变量。2017/4/24,(c)

201765检验工具变量法的前提是存在内生解释变量。为此须进行检验,其原假设为“所有解释变量均为外生”,即不存在内生变量。quietly

reg

lw

iq

s

expr

tenure

rns

smsaestimates

store

olsquietly

ivregress

2sls

lw

s

expr

tenurerns

smsa

(iq=med

kww)estimates

store

ivhausman

iv

ols,constant

sigmamore传统的

检验建立在同方差的前提下,故在此不使用稳健标准误。2017/4/24,(c)

201766

Coefficients

(b)iv(B)ols(b-B)Differencesqrt(diag(V_b-V_B))S.E.iq.0139284.0032792.0106493.0054318s.0607803.0927874-.032007.0163254expr.0433237.0393443.0039794.0020297tenure.0296442.034209-.0045648.0023283rns-.0435271-.0745325.0310054.0158145smsa.1272224.1367369-.0095145.0048529_cons3.2180433.895172-.6771285.3453751b

=B

=

inconsistentHo:

differenceconsistent

under

Hounder

Ha,

efficientand

Ha;

obtained

from

ivregressunder

Ho;

obtained

from

regressin

coefficients

not

systematicchi2(1)

==Prob>chi2

=(V_b-V_B

is(b-B)'[(V_b-V_B)^(-1)](b-B)3.840.0499not

positive

definite)Test:2017/4/24,(c)

201767异方差稳健的DWH检验(接上页)可在5%水平上

“所有解释变量均为外生”的原假设,即认为iq为内生变量。由于传统的

检验在异方差情形下不成立,

下面进行异方差稳健的Durbin-Wu-Hausman检验:estat

endogenousTests

of

endogeneityHo:

variables

are

exogenousDurbin

(score)

chi2(1)=3.87962(p

=

0.0489)Wu-Hausman

F(1,750)=3.85842(p

=

0.0499)2017/4/24,(c)

201768GMM估计如果存在异方差,则GMM比2SLS更有效率。为此,进行如下最优GMM估计。ivreress

mmlwsexrtenurernssmsa(iq=medkww)2017/4/24,(c)

201769lwCoef.RobustStd.

Err.zP>|z|[95%

Conf.Interval]iq.0140888.00603572.330.020.0022591.0259185s.0603672.01895453.180.001.0232171.0975174expr.0431117.00741125.820.000.0285861.0576373tenure.0299764.00827283.620.000.013762.0461908rns-.044516.0344404-1.290.196-.1120179.0229859smsa.1267368.02976334.260.000.0684018.1850718_cons3.207298.3980838.060.0002.4270693.987526Instrumental

variables

(GMM)regressionNumber

of

obs=758Prob

>

chi2=0.0000R-squared=0.2750GMMweightmatrix:RobustRootMSE=.36499Instrumented:Instruments:iqs

expr

tenure

rns

smsa

med

kww两步最优GMM的系数估计值与2SLS很接近。2017/4/24,(c)

201770过度识别检验estat

overidTest

of

overidentifying

restriction:Hansen's

J

chi2(1)

=

.151451

(p

=

0.6972)由于p值为0.70,故认为所有工具变量均为外生。2017/4/24,(c)

201771迭代GMMivregress

gmm

lw

s

expr

tenure

rns

smsa(iq=med

kww),igmm结果参见下页。容易看出,迭代GMM与两步GMM的系数估计值相差无几。2017/4/24,(c)

201772IterationIterationIteration1:2:3:changechangechangeinininbetabetabeta===1.753e-054.872e-082.501e-10changechangechangeinininWWW===1.100e-027.880e-052.304e-07Instrumentalvariables(GMM)regressionNumber

of

obs=758Wald

chi2(6)=372.73Prob

>

chi2=0.0000R-squared=0.2750GMMweightmatrix:RobustRootMSE=.36499lwCoef.RobustStd.

Err.zP>|z

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论