版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Lecture-8-Dynamic-and-Nonlinear-Panels-高级计量经济学及Stata应用课件2021-10-08陈强计量及Stata应用(c)
20142动态面板
有些经济理论认为,由于惯性或部分调整,个体的当前行为取决于过去行为,比如资
本存量的调整。
如果在面板模型中,解释变量包含了被解释变量的滞后值,则称之为“动态面板数据”(Dynamic
Panel
Data,简记DPD)。对于动态面板,即使FE也不一致例:其离差形式为:其中,,由于 中包含 的信息,而后者与 相关,故FE不一致,称为“动态面板偏差”(dynamic
panel
bias)。2021-10-08陈强计量及Stata应用(c)
20143一般的动态面板模型先作一阶差分以消去个体效应:
但 依然与 相关,因此, 为内生变量,需要寻找适当的工具变量才能得到一致估计。2021-10-08陈强计量及Stata应用(c)
20144Anderson-Hsiao估计量作为Anderson
and
Hsiao(1981)提出使用
的工具变量,然后进行2SLS估计。显然,二者相关,满足相关性。
如果 不存在自相关(对此假设须进行检验),则
与 不相关,满足外生性。2021-10-08陈强计量及Stata应用(c)
20145差分GMM根据同样的逻辑,更高阶的滞后变量也是有效工具变量,而Anderson-Hsiao估计量未加以利用,故不是最有效率的。
Arellano
and
Bond
(1991)使用所有可能的滞后变量作为工具变量(显然工具变量个数多于内生变量个数),进行GMM估计。
这就是“差分GMM”(Difference
GMM)(因为是对差分后的方程进行GMM估计)。2021-10-08陈强计量及Stata应用(c)
201462021-10-08陈强计量及Stata应用(c)
20147差分GMM的缺点
如果T很大,则会有很多工具变量,容易出现弱工具变量(weak
instruments)问题(通常滞后越多期则相关性越弱),产生偏差。
解决方法是在使用Stata命令xtabond时,限制最多使用q阶滞后变量作为工具变量,但文献中对于如何选择工具变量个数并无明确指南。差分GMM的缺点(续)
如果 仅为前定变量而非严格外生,则经过差分后,就可能与导致内生性。可使用相关,作为IV。
不随时间变化的变量法估计 的系数。被消掉了,故差分GMM无2021-10-08陈强计量及Stata应用(c)
20148水平GMM
Arellano
and
Bover(1995)重新回到了差分之前的水平方程(level
equation),并使用作为 的工具变量。显然,二者是相关的。且如果无自相关,则;但须假设 与个体效应 不相关,才能保证这些工具变量与水平方程的复合扰动项不相关。此假设意味着经济离稳态均衡不远。2021-10-08陈强计量及Stata应用(c)
20149系统GMM
Blundell
and
Bond(1998)把差分GMM与水平
GMM结合在一起,将差分方程与水平方程作为一个方程系统进行GMM估计,称为“系统
GMM”(System
GMM)。
系统GMM的优点是可提高估计效率,且可估计不随时间变化的变量的系数(系统GMM包含对水平方程的估计)。但必须额外地假定与 无关;否则,不能使用系统GMM。
在水平方程中,如果 也包括内生变量,则同样可用其滞后值作为工具变量。2021-10-08陈强计量及Stata应用(c)
2014102021-10-08陈强计量及Stata应用(c)
201411差分GMM的Stata命令xtabond
depvar
indepvars,lags(p)
maxldep(q) twostep
vce(robust)
pre(varlist) endogenous(varlist)
inst(varlist)
“depvar”为被解释变量,“indepvars”为解释变量。
“lags(p)”表示使用被解释变量的p阶滞后值作为解释变量默认p=1;“maxldep(q)”表示最多使用q阶被解释变量的
滞后值作为工具变量,默认使用所有可能的滞后值。选择
项“twostep”表示使用GMM,默认2SLS;“pre(varlist)”“endogenous
(varlist)”,“inst(varlist)”分别指定前量、内生变量与额外的工具变量。
“vce(robust)”表示使用稳健标准误,允许存在异方差,且针对两步GMM估计进行调整,Stata称为“WC-RobustStandard
Error”(Windmeijer,2005;WC表示“Windmeijer
bias-corrected”)2021-10-08陈强计量及Stata应用(c)
201412实例:美国工人的工资决定
以数据集mus08psidextract.dta为例。该面板数据集包含595名美国工人1976-1982年有关工资的以
下变量(n
=595,T
=7的短面板):
lwage(工资对数),ed(教育年限),exp(工龄),
exp2(工龄平方),wks(weeks
worked,工作周数),
occ(是否蓝领工人),ind(是否在制造业工作),
ms(婚否),south(是否在美国南方),smsa(是否
住大城市),union(是否由工会合同确定工资),
fem(是否女性),blk(是否黑人)。待估计模型以差分GMM估计以下动态面板模型:
其中,occ,
south,
smsa,
ind为外生解释变量,
wks及其一阶滞后为前定解释变量,而ms,union为内生解释变量。2021-10-08陈强计量及Stata应用(c)
2014132021-10-08陈强计量及Stata应用(c)
201414差分GMM估计use
mus08psidextract.dta,clearxtabond
lwage
occ
south
smsa
ind,lags(2)
maxldep(3) pre(wks,
lag(1,2))
endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))
twostep
vce(robust)
选择项“lags(2)”表示解释变量中包含被解释变量的一阶与二阶滞后;“maxldep(3)”表示最多使用被解释变量的三个滞后值作为工具变量;
选择项“pre(wks,lag(1,2))”表示变量wks及其一阶滞后L.wks为前定解释变量,而使用其两个更高阶滞后值(即二阶与三阶)为工具变量;
选择项“endogenous(ms,lag(0,2))”指定变量ms为内生解释变量(其中的“0”表示内生解释变量不包含ms的任何滞后),而最多使用其两个更高阶滞后值(即二阶与三阶)为工具变量。2021-10-08陈强计量及Stata应用(c)
201415扰动项的自相关检验
差分GMM成立的前提是,扰动项相关。即使原假设“扰动项不存在自无自相关”成立,“扰动项的一阶差分”(first-differenced
errors)将存在一阶自相关,因为
但扰动项的差分将不存在二阶或更高阶的自相关。为此,可以通过检验扰动项的差分是否存在一阶
与二阶自相关,来检验原假设。2021-10-08陈强计量及Stata应用(c)
201416扰动项的自相关检验(续)estat
abond
结果显示,扰动项的差分存在一阶自相关,但不存在二阶自相关,故接受原假设。2021-10-08陈强计量及Stata应用(c)
201417过度识别检验此差分GMM使用了40个工具变量,须进行过度识别检验。重新运行“xtabond”命令,但略去选择项“vce(robust)”quietly
xtabond
lwage
occ
south
smsa ind,lags(2)
maxldep(3)
pre(wks,lag(1,2)) endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))
twostepestat
sargan2021-10-08陈强计量及Stata应用(c)
2014182021-10-08陈强计量及Stata应用(c)
201419系统GMM估计xtdpdsys
lwage
occ
south
smsa
ind,lags(2) maxldep(3)
pre(wks,
lag(1,2)) endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))
twostep vce(robust)结果参见下页。系统GMM的系数估计值与差分
GMM很接近,但前者的标准误比后者更小。也许 因为使用了更多的工具变量(共60个),系统GMM 估计得更准确些。2021-10-08陈强计量及Stata应用(c)
201420系统GMM的扰动项自相关检验estat
abond
可在5%的显著性水平上拒绝“扰动项差分的二阶自相关系数为0的假设”,故可拒绝“扰动项无自相关”的原假设。我们怀疑系统GMM是否适用。2021-10-08陈强计量及Stata应用(c)
201421系统GMM的过度识别检验quietly
xtdpdsys
lwage
occ
south
smsa ind,lags(2)
maxldep(3)
pre(wks,lag(1,2)) endogenous(ms,lag(0,2)) endogenous(union,lag(0,2))
twostepestat
sargan强烈拒绝原假设2021-10-08陈强计量及Stata应用(c)
2014222021-10-08陈强计量及Stata应用(c)
201423改进的系统GMM估计
对于此数据集,虽然系统GMM可能更有效率,但成立前提不满足;也可能模型设定不当。为解决自相关,在解释变量中引入被解释变量的三阶滞后;
为改善工具变量有效性,对于内生解释变量ms,union仅使用一个更高阶滞后值(即二阶滞后)为工具变量,但最多使用被解释变量的五个滞后值作为工具变量,重新进行系统GMM估计与检验:xtdpdsys
lwage
occ
south
smsa
ind,lags(3) maxldep(5)
pre(wks,lag
(1,2)) endogenous(ms,lag(0,1)) endogenous(union,lag(0,1))
twostep vce(robust)2021-10-08陈强计量及Stata应用(c)
201424扰动项自相关检验estat
abond可接受扰动项无自相关的原假设。2021-10-08陈强计量及Stata应用(c)
201425过度识别检验quietly
xtdpdsys
lwage
occ
south
smsa
ind,lags(3) maxldep(5)
pre(wks,lag(1,2))
endogenous(ms,lag(0,1)) endogenous(union,lag(0,1))
twostepestat
sargan可在5%水平上接受“所有工具变量都有效”的原假设。2021-10-08陈强计量及Stata应用(c)
2014262021-10-08陈强计量及Stata应用(c)
201427非线性面板
对于面板数据,如果被解释变量为虚拟变量、计数变量、受限变量等,则为非线性面板。非线性面板一般不适用线性面板的方法。
主要包括:面板二值选择模型、面板计数模型、面板Tobit2021-10-08陈强计量及Stata应用(c)
201428面板二值选择模型
对于面板数据,如果被解释变量为虚拟变量,则称为“面板二值选择模型”(binarychoice
model
for
panel
data)。对于二值选择行为,通常通过一个“潜变量”(latent
variable)来概括该行为的净收益
(收益减去成本)。如果净收益大于0,则选择做;否则,选择不做。面板二值模型的设定假设净收益为
为不可观测的潜变量, 为个体效应,而解释变量 不含常数项。个体选择规则为2021-10-08陈强计量及Stata应用(c)
201429面板Probit与面板Logit与Probit/Logit模型的推导类似:
如果扰动项 服从标准正态,则为面板Probit;如果服从逻辑分布,则为面板Logit。2021-10-08陈强计量及Stata应用(c)
201430混合回归
面板二值模型的主要估计方法包括混合回归、随机效应估计与固定效应估计。如果 ,则为混合回归(pooledprobit或pooled
logit),可作为截面数据处理(无个体效应),使用截面数据的相关Stata命令即可。由于同一个体不同时期的扰动项可能存在自相关,故应使用以面板为聚类的聚类稳健标准误
(cluster-robust
standard
error)。2021-10-08陈强计量及Stata应用(c)
2014312021-10-08陈强计量及Stata应用(c)
201432混合回归的Stata命令probit
y
x1
x2
x3,vce(cluster
id) (混合probit回归)logit
y
x1
x2
x3,
vce(cluster
id) (混合logit回归)id为用来确定面板单位的变量。面板二值模型的个体效应
更一般地,允许个体效应的存在,即不同个体拥有不同的。如果与所有解释变量均不相关,称为“随机效应模型”(Random
Effects
Model,简记RE)。 如果 与某解释变量相关,称为“固定效应模型”(Fixed
Effects
Model,简记FE)。 对于线性面板的随机效应模型,一般使用GLS。但非线性面板不便使用GLS,故进行MLE估计。2021-10-08陈强计量及Stata应用(c)
201433随机效应的MLE估计假设 ,记其密度函数为
。以Logit为例。给定,个体i的条件分布为但 不可观测。将联合密度分解,然后积掉2021-10-08陈强计量及Stata应用(c)
201434随机效应的MLE估计(续)
最大化此似然函数即得到“随机效应Logit估计量”(Random
Effect
Logit)。
如将逻辑分布改为正态分布,则为“随机效应Probit估计量”(Random
Effect
Probit)。2021-10-08陈强计量及Stata应用(c)
2014352021-10-08陈强计量及Stata应用(c)
201436MLE的数值计算
上式积分无解析解,Butler
and
Moffitt
(1982)提出“Gauss-Hermite
quadrature”进行数值积分
(numerical
integration)。
Stata默认在12点上进行“adaptive
Gauss-Hermite
quadrature”计算。
Stata提供命令quadchk检验计算精度(取决于点数),即使用其他计算点数,比较结果的稳定性。如结果不稳健,应增加点数,直至稳定。随机效应模型的缺点 在进行随机效应估计时,已将 积分积掉,故得不到对个体效应 的估计。因此,无法预测 的发生概率或计算解释变量对 的边际效应。解决方法之一是假设 =
0。2021-10-08陈强计量及Stata应用(c)
201437对个体随机效应的检验同一个体不同时期扰动项之间的协方差:同一个体不同时期扰动项之间的自相关系数:越大,则复合扰动项中个体效应部分越重要。如果 ,则不存在个体随机效应,应选择混合回归。对此可进行LR检验。2021-10-08陈强计量及Stata应用(c)
201438面板二值模型随机效应的Stata命令xtprobit
y
x1
x2
x3(默认为随机效应probit)xtlogit
y
x1
x2
x3(默认为随机效应logit)
输出结果包含对原假设“ ”的LR检验结果(Stata记为rho)。如拒绝原假设,则采用随机效应模型;反之,支持混合回归。2021-10-08陈强计量及Stata应用(c)
201439面板二值模型的固定效应估计其中,个体效应 与解释变量 相关。
对于线性面板,一般通过组内变换或一阶差分消去固定效应。但这些变换对非线性面板不起作用
即使加入个体虚拟变量(LSDV法),仍得不到一致估计,因为当 时,待估计的个体效应的个数随之增加,称为“伴生参数”(incidentalparameters)。2021-10-08陈强计量及Stata应用(c)
201440如何解决伴生参数问题
对于固定效应的面板Probit模型,目前尚无法解决此伴生参数问题。对于固定效应的面板Logit模型,可找到的“充分统计量”(sufficient
statistic)在给定此充分统计量的条件下进行“条件最大似然估计”(conditional
MLE)。2021-10-08陈强计量及Stata应用(c)
201441充分统计量的概念考虑总体参数与统计量W。如果统计量W包含了的信息,则称W为参数样本中所有可用来估计的充分统计量。
给定W之后,任何根据样本计算的其他统计量都不可能提供关于 的额外信息。
样本数据在给定充分统计量W后的条件分布将不再依赖于 (这正是充分统计量的严格定义)。2021-10-08陈强计量及Stata应用(c)
201442个体效应的充分统计量对于Logit模型,Chamberlain
(1980)使用作为 的充分统计量,并最大化在给定 情况下的条件似然函数。
以两期模型为例,即T
=
2。对于个体i,只有三种可能情形,即 0,1,或
2。。必然有 ,故,对数似然函数为0,对样本似然函数无贡献,等于损失了这些观测值。2021-10-08陈强计量及Stata应用(c)
201443条件最大似然估计(2) 。必有 。同样道理,这些观测值不包含任何有助于估计 的信息。(3)。或者 ,或者,分别计算条件概率:2021-10-08陈强计量及Stata应用(c)
201444条件最大似然估计(续)2021-10-08陈强计量及Stata应用(c)
201445条件最大似然估计(续2)分子与分母的被同时消去;逻辑分布的方便。2021-10-08陈强计量及Stata应用(c)
201446固定效应模型的缺点无法估计不随时间变化变量的系数
将损失所有
或 的观测值,导致样本容量减少。
使用条件MLE时消去 ,故无法估计个体效应 。解决方法之一是假设 =
0。2021-10-08陈强计量及Stata应用(c)
2014472021-10-08陈强计量及Stata应用(c)
201448个体固定效应的检验可使用豪斯曼检验,在固定效应与混合回归之间选择。
原假设为不存在个体固定效应。如原假设成立,则固定效应与混合回归都一致,但混合回归更有效率(固定效应模型未充分利用的信息,且可能损失样本容量)。
如果原假设不成立,则固定效应一致,混合回归不一致。如果二者的系数估计值相差较大,则应拒绝原假设。在固定效应与随机效应之间选择,也可进行豪斯曼检验。2021-10-08陈强计量及Stata应用(c)
201449固定效应面板Logit的Stata命令xtlogit
y
x1
x2
x3,fe选择项“fe”表示固定效应,默认为随机效应。2021-10-08陈强计量及Stata应用(c)
201450例:中国北方农民起义
Chen(2013)以数据集uprising.dta研究中国北方农民起义的决定因素,横截面为王朝(dyn),时间为年(year)。被解释变量:uprising(是否发生农民起义)
解释变量:age(王朝年龄),pop(人口),temp(气温),sfamine(是否发生严重饥荒),sfamine1(sfamine一阶滞后),sfamine2(sfamine二阶滞后),sfamine3(sfamine三阶滞后),relief(有否政府救济),relief1
(relief一阶滞后),r(relief的二阶滞后),relief3
(relief的三阶滞后)。2021-10-08陈强计量及Stata应用(c)
201451固定效应面板Logituse
uprising.dta,clearxtlogit
uprising
age
pop
temp
sfamine sfamine1
sfamine2
sfamine3
relief relief1
relief2
relief3,fe
nologestimates
store
FE2021-10-08陈强计量及Stata应用(c)
2014522021-10-08陈强计量及Stata应用(c)
201453解释
有一个朝代(共43年观测值)从未发生农民起义,在估计固定效应模型被去掉。为第二个朝代(dyn=2),曹魏。
变量age,pop,temp的系数至少在5%水平上显著为正,这意味着王朝后期更易发生起义;人口压力越大,起义概率越高;气温越高,越易发生起义。变量sfamine(严重饥荒)的当期系数在1%水平上显著为正,前三阶滞后的系数在10%水平上显著为正,严重饥荒显著地增加农民起义的发生概率。
变量relief(政府救灾)的各期系数至少在5%水平上显著为负,意味着政府救灾有助于缓解农民起义。2021-10-08陈强计量及Stata应用(c)
201454混合回归Logit
为保持与固定效应的样本一致,在混合回归中也去掉了“dyn=2”的那个朝代。logit
uprising
age
pop
temp
sfamine sfamine1
sfamine2
sfamine3
relief relief1
relief2
relief3
if dyn~=2,vce(cluster
dyn)
nolog2021-10-08陈强计量及Stata应用(c)
2014552021-10-08陈强计量及Stata应用(c)
201456豪斯曼检验
为在固定效应与混合回归之间进行选择,进行豪斯曼检验。但豪斯曼检验不允许混合回归使用选择项“vce(cluster
dyn)”,故重新进行混合回归quietly
logit
uprising
age
pop
temp
sfamine sfamine1
sfamine2
sfamine3
relief
relief1 relief2
relief3
if
dyn~=2,nologestimates
store
POOLEDhausman
FE
POOLED豪斯曼检验结果强烈拒绝混合回归的原假设,应使用固定效应模型。2021-10-08陈强计量及Stata应用(c)
2014572021-10-08陈强计量及Stata应用(c)
201458随机效应面板Logitxtlogit
uprising
age
pop
temp
sfamine sfamine1
sfamine2
sfamine3
relief relief1
relief2
relief3
if
dyn~=2,re nologestimates
store
RE结果见下页2021-10-08陈强计量及Stata应用(c)
201459解释LR检验强烈拒绝原假设“效应模型,不宜进行混合回归。”,应使用面板随机
随机效应面板Logit的计算使用数值积分。下面使用命令quadchk检验此数值积分的稳健性。quadchk,noout选择项“noout”表示不显示重估模型的结果。
结果见下页:所有系数的相对差距均小于 ,故数值积分结果值得信赖。2021-10-08陈强计量及Stata应用(c)
2014602021-10-08陈强计量及Stata应用(c)
2014612021-10-08陈强计量及Stata应用(c)
201462豪斯曼检验(again)
为了在固定效应与随机效应模型之间进行选择,再次进行豪斯曼检验。hausman
FE
RE
结果见下页:可在5%水平上拒绝随机效应的原假设,应使用固定效应模型。2021-10-08陈强计量及Stata应用(c)
2014632021-10-08陈强计量及Stata应用(c)
201464面板Probit的随机效应模型为了演示,估计面板Probit的随机效应模型。xtprobit
uprising
age
pop
temp
sfamine sfamine1
sfamine2
sfamine3
relief
relief1 relief2
relief3
if
dyn~=2,re
nolog
结果见下页:LR检验强烈拒绝混合Probit回归,应使用随机效应模型。
随机效应面板Probit的结果与随机效应面板Logit相似。2021-10-08陈强计量及Stata应用(c)
2014652021-10-08陈强计量及Stata应用(c)
201466面板计数模型考虑被解释变量为计数变量的面板数据。例:若干企业在一段时间内每年获得专利的个数例:全国各省在几年内每年发生矿难的数目例:世界各国近几十年每年发生示威游行的次数例:一些病人在一段时间内的每期发病次数面板泊松回归
对于个体i,时期t,记被解释变量为 ,假设的概率由参数为 的泊松分布所决定:为保证泊松到达率非负,假设
其中, 不含常数项,而 为乘积形式的个体效应
(multiplicative
individual
effects)。2021-10-08陈强计量及Stata应用(c)
201467混合泊松回归
如果 ,则不存在个体效应,为混合泊松回归(pooledPoisson)。可作为截面数据处理,直接使用截面数据的泊松回归Stata命令,须使用聚类稳健标准误。混合泊松回归的Stata命令为,poisson
y
x1
x2
x3,vce(cluster
id)
irrid为用来确定面板单位的变量。选择项“irr”表示汇报 发生率比(incidence
rate
ratio)。2021-10-08陈强计量及Stata应用(c)
201468面板计数模型的个体效应一般允许个体效应存在,即不同个体拥有不同的
。
如果 与所有解释变量均不相关,则为“随机效应模型”(Random
Effects
Model,简记RE)。
如果 与某解释变量相关,则为“固定效应模型”(FixedEffects
Model,简记FE)。对于随机效应模型,由于是非线性模型,故进行MLE估计2021-10-08陈强计量及Stata应用(c)
201469随机效应的MLE估计
记 的密度函数为 。假设样本为iid,则在给定
的情况下,个体i的条件分布为,而密度函数可写为2021-10-08陈强计量及Stata应用(c)
201470随机效应的MLE估计(续)
由于 ,故常选择 服从Gamma分布(指数分布与卡方分布为Gamma分布特例)。特别地,假设,其中 ,则
,
将 的概率密度代入上页方程,可得到负二项分布的概率密度,然后进行MLE估计。
由于 为个体异质性 的方差,故可对“ ”进行LR检验来判断是否存在个体异质性,即究竟应使用随机效应泊松回归还是混合泊松回归。2021-10-08陈强计量及Stata应用(c)
201471随机效应的MLE估计(续2) 另一方法假设 ,但无解析解,需用“Gauss-Hermite
quadrature”方法进行数值积分;使用命令quadchk检验数值积分的精确度 类似地,可通过检验“ ”
(Stata称为“sigma_u
=
0”)来判断是否存在个体异质性。2021-10-08陈强计量及Stata应用(c)
201472固定效应的面板泊松模型类似于固定效应的面板二值选择模型,可使用 作为 的充分统计量。
计算在给定 情况下的条件似然函数,然后进行条件最大似然估计(conditional
MLE)。如果 ,则意味着,故个体i的观测值对于条件似然函数的贡献为0,将损失这部分样本容量。2021-10-08陈强计量及Stata应用(c)
201473固定效应vs.随机效应
固定效应模型的另一缺点是,无法估计不随时间而变的变量系数。
固定效应泊松回归的最大优点在于,它允许个体异质性 与解释变量 相关。
在固定效应与随机效应泊松回归之间进行选择时,可使用豪斯曼检验。2021-10-08陈强计量及Stata应用(c)
2014742021-10-08陈强计量及Stata应用(c)
201475面板泊松回归的Stata命令xtpoisson
y
x1
x2
x3,fe
irrxtpoisson
y
x1
x2
x3,normal选择项“fe”表示固定效应,默认为随机效应。选择项“irr”表示汇报发生率比(incidence
rate
ratio)。
选择项“normal”表示在估计随机效应模型时,指定个体异质性服从正态分布,默认为Gamma分布。面板负二项回归
泊松回归的缺陷是,它假设方差等于期望。如果存在过度分散(方差大于期望),可考虑负二项回归。
如果不存在个体异质性,则可直接进行混合负二项回归,其Stata命令为nbreg
y
x1
x2
x3,
vce(cluster
id)id为用来确定面板单位的变量。Stata将输出过度分散参 数
的95%置信区间。根据此置信区间,可以检验原假 设“
”(对应于泊松回归)。2021-10-08陈强计量及Stata应用(c)
201476随机效应的面板负二项模型对于随机效应的面板负二项模型,假设个体异质性服从Beta(r,s)分布。将个体异质性 积分掉,再进行MLE估计处理方法类似随机效应的面板泊松模型2021-10-08陈强计量及Stata应用(c)
201477固定效应的面板负二项模型
给定 (个体异质性的充分统计量),进行条件最大似然估计(conditional
MLE)。
固定效应负二项回归的奇特之处在于,可以估计不随时间而变的变量系数。
在固定效应与随机效应负二项回归之间选择,可使用豪斯曼检验。
在泊松回归与负二项回归之间选择,涉及稳健性与有效性的权衡2021-10-08陈强计量及Stata应用(c)
2014782021-10-08陈强计量及Stata应用(c)
201479面板负二项回归的Stata命令xtnbreg
y
x1
x2
x3,fe
irr
选择项“fe”表示固定效应,默认为“re”(随机效应)。
选择项“irr”表示汇报发生率比(incidence
rateratio)。2021-10-08陈强计量及Stata应用(c)
201480例:共保率如何影响对医疗服务的使用
以数据集mus18data.dta为例,研究不同的共保率(coinsurancerate)如何影响对医疗服务的使用。如果共保率为25%,则意味着投保人支付25%的医疗费用,而保险公司支付75%。被解释变量:mdu(个体看医生的次数),为计数变量。
解释变量:lcoins(共保率加1再取对数,即log(coinsurance+1)),ndisease(所患慢性病的数目),female(是否女性),age(年龄),lfam(家庭人数的对数),child(是否有孩子)。混合泊松回归use
mus18data.dta,
clearxtset
id
yearpoisson
mdu
lcoins
ndisease
female
age
lfam child,vce(cluster
id)
nolog结果见下页2021-10-08陈强计量及Stata应用(c)
2014812021-10-08陈强计量及Stata应用(c)
2014822021-10-08陈强计量及Stata应用(c)
201483解释所有解释变量至少在5%水平上显著。
lcoins与lfam的系数显著为负,表明共保率越高、家庭成员越多,则看医生次数越少
ndisease,female,age与child的系数显著为正,表明所患慢性病越多、女性、年龄越大、有子女,则看医生次数越多。2021-10-08陈强计量及Stata应用(c)
201484随机效应的面板泊松回归
由于命令“xtpoisson,re”不提供聚类稳健标准误,故使用选择项“vce(boot)”计算聚类自助标准误。xtpoisson
mdu
lcoins
ndisease
female
age
lfam child,re
vce(boot,reps(50)
seed(10101) nodots)
“reps(50)”表示重复抽样50次,“seed(10101)”表示以10101作为随机数的种子,“nodots”表示不显示重复抽样过程的点(dots)。运行此命令将花费较长时间2021-10-08陈强计量及Stata应用(c)
201485解释
上页最后一行的LR检验结果强烈拒绝
“alpha=0”的原假设(对应于混合泊松回归,其中 为个体异质性 的方差),
故拒绝混合泊松模型,认为应使用随机效应的面板泊松模型。2021-10-08陈强计量及Stata应用(c)
2014862021-10-08陈强计量及Stata应用(c)
201487随机效应的面板泊松回归(续)
命令“xtpoisson,re”默认假设个体异质性服从Gamma分布。下面使用选择项“normal”指定个体异质性服从正态分布。为了提高速度,使用普通标准误(不使用自助标准误)。xtpoisson
mdu
lcoins
ndisease
female
age
lfam child,re
normal
nolog结果见下页:估计系数与默认Gamma分布的结果接近。quadchk,nooutput(检验数值积分的准确度)2021-10-08陈强计量及Stata应用(c)
2014882021-10-08陈强计量及Stata应用(c)
201489重新估计对于某些系数,相对差距(relative
difference)超过
下面使用选择项“intpoints(#)”将数值积分的计算点数增加到16(默认为12)。xtpoisson
mdu
lcoins
ndisease
female
age
lfam child,re
normal
nolog
intpoints(16)quadchk,nooutput(所有系数的相对差距均小于,故可信赖此结果)2021-10-08陈强计量及Stata应用(c)
2014902021-10-08陈强计量及Stata应用(c)
2014912021-10-08陈强计量及Stata应用(c)
2014922021-10-08陈强计量及Stata应用(c)
201493固定效应的面板泊松回归
命令“xtpoisson,fe”不提供聚类稳健标准误。解决方法之一是使用自助标准误的选择项,比如“vce(boot,reps(50)seed(10101)nodots)”。
解决方法之二为下载非官方命令“xtpqml”(pqml表示Poisson
Quasi
Maximum
Likelihood),该命令的估计结果与“xtpoisson,fe”相同,但提供聚类稳健标准误。ssc
install
xtpqmlxtpqml
mdu
lcoins
ndisease
female
age
lfam child,i(id)必选项“i(id)”表示以变量id来确定面板单位。2021-10-08陈强计量及Stata应用(c)
2014942021-10-08陈强计量及Stata应用(c)
201495解释
有265组数据由于仅有一期观测值而被去掉,另有666组数据由于取值全为0而被去掉;
固定效应泊松模型无法识别不随时间而变的变量系数(lcoins,ndisease,female),这些变量被去掉。
回归结果的上半部提供普通标准误(事实上,复制了命令“xtpoisson,fe”的估计结果);
下半部的标准误则为聚类稳健标准误。聚类稳健标准误约是普通标准误的两倍,导致所有变量系数均不显著。是否存在过度分散sum
mdu,detaildis
r(Var)/r(mean)7.093696
被解释变量mdu的方差是平均值的7倍多,故可能存在过度分散。2021-10-08陈强计量及Stata应用(c)
201496混合负二项回归进行混合负二项回归,并使用聚类稳健标准误。nbreg
mdu
lcoins
ndisease
female
age lfam
child,vce(cluster
id)
nolog
结果见下表:过度分散参数
[1.24,
1.36],故拒绝“的95%置信区间为
”,认为存在过度分散,使用负二项回归可以提高效率。2021-10-08陈强计量及Stata应用(c)
2014972021-10-08陈强计量及Stata应用(c)
2014982021-10-08陈强计量及Stata应用(c)
201499随机效应的面板负二项回归
进行随机效应的面板负二项回归,并使用自助标准误。运行此命令须较长时间。xtnbreg
mdu
lcoins
ndisease
female
age
lfam child,nolog
vce(boot,reps(50)
seed(10101) nodots)
结果见下页:最后一行的LR检验结果强烈拒绝了混合负二项回归的原假设,认为应使用随机效应的面板负二项回归。2021-10-08陈强计量及Stata应用(c)
20141002021-10-08陈强计量及Stata应用(c)
2014101固定效应的面板负二项回归
进行固定效应的面板负二项回归,并使用自助标准误;运行此命令须较长时间。xtnbreg
mdu
lcoins
ndisease
female
age
lfam child,fe
nolog
vce(boot,reps(50) seed(10101)
nodots)
结果见下页:固定效应的面板负二项回归可以估计不随时间而变的变量系数,这是固定效应负二项回归的优点。2021-10-08陈强计量及Stata应用(c)
20141022021-10-08陈强计量及Stata应用(c)
2014103豪斯曼检验
使用豪斯曼检验在固定效应与随机效应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 双十二购房指南
- 体育用品行业保安工作总结
- 军训心得体会15篇
- 教育的项目计划书精彩3篇
- 建筑工程施工合同范文集合8篇
- 2023年-2024年岗位安全教育培训试题及参考答案【培优】
- 2023年项目安全培训考试题(打印)
- 文学作品意识形态解读-洞察分析
- 宇宙常数与宇宙结构形成-洞察分析
- 遗传进化机制探究-洞察分析
- 2024年工贸重点企业有限空间作业专家指导服务专题培训
- 2024年注册安全工程师考试题库及参考答案【完整版】
- 第十二章 全等三角形 作业设计-2023-2024学年人教版八年级数学上册
- 建筑结构荷载规范DBJ-T 15-101-2022
- 制药专业毕业设计开题报告
- 普通心理学智慧树知到期末考试答案2024年
- 青少年涉毒问题监测制度
- 征兵眼科科普知识讲座
- 人工智能在医疗健康领域的应用探索报告
- 高二上学期数学期末测试卷01-【好题汇编】备战2023-2024学年高二数学上学期期末真题分类汇编(人教A版2019选择性必修第一、二册)(原卷版)
- 环评验收方案
评论
0/150
提交评论