高级计量经济分析及Stata应用 课件 第6章 内生协变量_第1页
高级计量经济分析及Stata应用 课件 第6章 内生协变量_第2页
高级计量经济分析及Stata应用 课件 第6章 内生协变量_第3页
高级计量经济分析及Stata应用 课件 第6章 内生协变量_第4页
高级计量经济分析及Stata应用 课件 第6章 内生协变量_第5页
已阅读5页,还剩189页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《高级计量经济分析及stata应用》上海师范大学商学院第6章内生协变量第6章内生协变量6.1含内生协变量的线性回归6.2含内生协变量的扩展线性回归分析6.3

三阶段最小二乘法6.4

广义矩估计6.5

含连续内生协变量的probit模型6.6含内生协变量的扩展probit回归6.7含内生协变量的扩展有序probit回归6.8含内生协变量的Tobit回归6.9含内生协变量的区间回归6.10

含内生协变量的泊松模型6.11

含内生协变量的面板数据分析xtivreg6.12

含内生协变量的随机效应回归6.13

含内生协变量的泊松模型6.14

内生动态面板门限回归模型2025/4/1436.1含内生协变量的线性回归含内生协变量的线性回归模型为:

(6.2)

6.1含内生协变量的线性回归1.2SLS法与LIML法的参数估计值

6.1含内生协变量的线性回归2.GMM法的参数估计值通过使用2SLS估计,得到了的初始一致的参数估计值。利用参数的这个估计,可以计算加权矩阵W和参数的GMM估计量:

参数GMM估计量的方差为:

6.1含内生协变量的线性回归单方程工具变量回归估计的Stata命令为:

ivregressestimatordepvar[varlist1](varlist2=varlist_iv)[if][in][weight][,options]菜单操作为:Statistics>Endogenouscovariates>Linearregressionwithendogenouscovariates2.GMM法的参数估计值ivregress拟合线性模型,其中一个或多个回归系数是内生确定的。ivregress支持通过两阶段最小二乘法(2SLS)、有限信息最大似然法(LIML)和广义矩量法(GMM)进行估计。6.1含内生协变量的线性回归例6.1含内生协变量的线性回归下面用Stata自带数据集hsng2.dta说明实现。我们有1980年人口普查的州数据,包括自住房屋的美元价值中值(hsngval)和月总租金中值(租金)。我们希望为租金模型化为Hnsgval和城市地区人口百分比(pcturban)的函数:6.1含内生协变量的线性回归例6.1含内生协变量的线性回归(1)*下载数据集

.webusehsng2

*2SLS估计.ivregress2slsrentpcturban(hsngval=faminci.region),small6.1含内生协变量的线性回归例6.1含内生协变量的线性回归*LIML估计

.ivregresslimlrentpcturban(hsngval=faminci.region)6.1含内生协变量的线性回归例6.1含内生协变量的线性回归*使用默认的异方差稳健权重矩阵,通过GMM拟合回归.ivregressgmmrentpcturban(hsngval=faminci.region)6.1含内生协变量的线性回归例6.1含内生协变量的线性回归*使用异方差稳健权重矩阵通过GMM拟合回归,要求非稳健标准误差.ivregressgmmrentpcturban(hsngval=faminci.region),vce(unadjusted)6.1含内生协变量的线性回归例6.1含内生协变量的线性回归*通过2SLS拟合具有内生因子交互作用的回归

.ivregress2slsrentpcturban(c.popgrow##c.popgrow=c.faminc##c.faminci.region)

6.2含内生协变量的扩展线性回归分析

2025/4/1414

6.2含内生协变量的扩展线性回归分析

2025/4/14156.2.1含连续内生协变量的面板数据的扩展线性回归分析

6.2含内生协变量的扩展线性回归分析

2025/4/14166.2.1含连续内生协变量的面板数据的扩展线性回归分析

对数似然函数为:

6.2含内生协变量的扩展线性回归分析

2025/4/14176.2.2

二元和有序内生协变量

6.2含内生协变量的扩展线性回归分析

2025/4/14186.2.2

二元和有序内生协变量

如果方差和相关参数不是特定于水平的,那么:

6.2含内生协变量的扩展线性回归分析

2025/4/14196.2.2

二元和有序内生协变量

从这里,我们讨论了有序内生协变量模型。二元函数的内生协变量结果是相似的。6.2含内生协变量的扩展线性回归分析

2025/4/14206.2.2

二元和有序内生协变量

(6.17)连续结果的条件预期值为:(6.18)6.2含内生协变量的扩展线性回归分析

2025/4/14216.2.3probit

内生样本选择

(6.19)

结果yi的线性回归与si上的选择形式为:(6.20)6.2含内生协变量的扩展线性回归分析

2025/4/14

(6.22)对于选择标示变量,其下限和上限为:模型(6.19)的对数似然函数为:(6.21)

6.2.3probit内生样本选择6.2含内生协变量的扩展线性回归分析

2025/4/14

(6.24)

6.2.4Tobit内生样本选择(6.23)6.2含内生协变量的扩展线性回归分析

2025/4/14246.2.4Tobit内生样本选择

(6.25)6.2含内生协变量的扩展线性回归分析

2025/4/14256.2.4Tobit

内生样本选择

(6.26)6.2含内生协变量的扩展线性回归分析

2025/4/1426Stata估计命令为:(1)具有内生协变量的基本线性回归

eregressdepvar[indepvars],endogenous(depvars_en=varlist_en)[options](2)带样本选择的基本线性回归

eregressdepvar[indepvars],select(depvar_s=varlist_s)[options](3)Tobit样本选择的基本线性回归

eregressdepvar[indepvars],tobitselect(depvar_s=varlist_s)[options](4)结合内生协变量、处理和选择的线性回归

eregressdepvar[indepvars][if][in][weight][,extensionsoptions]6.2.4Tobit内生样本选择6.2含内生协变量的扩展线性回归分析

2025/4/1427模型拓展选项(options)有:➢

endogenous(enspec):内生协变量的模型;可能会重复;➢

entreat(entrspec):内生产量效应分配的模型;➢

extreat(extrspec):外生处理;➢

select(selspec):用probit模型进行选择;➢

tobitselect(tselspec):tobit选择模型模型设定选项(options)有:➢

noconstant:无常数项;➢

offset(varname_o):将varname_o包含在系数约束为1的模型中;➢

constraints(numlist):应用指定的线性约束。6.2.4Tobit内生样本选择6.2含内生协变量的扩展线性回归分析2025/4/14286.2.4Tobit内生样本选择菜单操作为:Statistics>Endogenouscovariates>Modelsaddingselectionandtreatment>Linearregressioneregress拟合一个线性回归模型,该模型考虑了内生协变量、非随机处理分配和内生样本选择的任何组合。允许使用连续、二元和有序的内生协变量。处理分配可以是内生的,也可以是外生的。probit或tobit模型可用于解释内生样本选择。6.2含内生协变量的扩展线性回归分析例6.2含内生协变量的扩展线性回归分析。这所虚构的州立大学正在研究它录取的学生的高中平均绩点(GPA)与他们的最终大学GPA之间的关系。他们怀疑未观察到的能力会影响高中和大学的平均成绩。因此,高中GPA是一个内生协变量。州立大学的研究人员利用2010年毕业的2500名学生的数据,将大学GPA作为高中GPA的函数。在这两种情况下,GPA均以0.01为增量进行测量,我们忽略了边界点引起的并发症。也忽略了U州的辍学率很高,这些学生的大学平均绩点缺失,研究人员只剩下大约1500名学生的样本。2025/4/14296.2含内生协变量的扩展线性回归分析例6.2含内生协变量的扩展线性回归分析。

州立大学的研究人员预计,一旦控制了高中GPA,高中竞争力对大学GPA的影响可以忽略不计。所以,他们将高中排名(hscomp)作为高中GPA的工具性协变量。其中包括家长收入(以10万美元为单位),他们认为这也可能影响学生的表现,主要模型和高中GPA模型都是如此。(1)*清理内存,下载数据集.clear

.webuseclass10

2025/4/14306.2含内生协变量的扩展线性回归分析例6.2含内生协变量的扩展线性回归分析。(2)*具有连续内生协变量hsgpa的线性回归

.eregressgpaincome,endogenous(hsgpa=incomei.hscomp)2025/4/14316.2含内生协变量的扩展线性回归分析例6.2含内生协变量的扩展线性回归分析。主方程和辅助方程误差之间的相关性估计为0.26。z统计量可用于无内生性的零假设的Wald检验。研究人员拒绝了这一假设。由于这一估计是正面的,他们得出结论,增加高中平均成绩的不可观察因素往往也会增加大学平均成绩。

2025/4/14326.2含内生协变量的扩展线性回归分析例6.2含内生协变量的扩展线性回归分析。

(3)*清理内存,下载数据集

.clear

.webusewageed

(4)*二元内生协变量线性回归.eregresswagec.age##c.agetenure,endogenous(college=i.peduc,probit)2025/4/14336.2含内生协变量的扩展线性回归分析例6.2含内生协变量的扩展线性回归分析。(5)*具有外生处理的线性回归

.eregresswagec.age##c.agetenure,extreat(college)2025/4/14346.2含内生协变量的扩展线性回归分析例6.2含内生协变量的扩展线性回归分析。(6)*具有稳健的标准误差估计

.eregresswagec.age##c.agetenure,extreat(college)vce(robust)2025/4/14356.3三阶段最小二乘法2025/4/1436reg3估计结构方程组,其中一些方程包含解释变量中的内生变量。一般来说,这些内生变量是系统中其他方程的因变量(详见第10章),但并不总是如此。这种扰动项与内生变量有关,这违反OLS经典假设。此外,因为一些解释变量是系统中其他方程的因变量,方程之间的误差项是相互关联。reg3使用工具变量方法来产生一致的估计,用广义最小二乘法(GLS)解释整个系统中扰动的相关结构方程。6.3三阶段最小二乘法2025/4/1437三阶段最小二乘法(3SLS)可以被认为是通过三步过程产生估计。

第一步,为所有内生变量发展工具变量值。这些工具变量的值可以只需将其视为各内生变量关于系统中所有外生变量回归后的预测值。此阶段与2SLS中的第一步相同,这一点对参数估计的一致性至关重要。第二步。获得方程扰动项协方差矩阵的一致估计。这些估计基于每个结构方程的2SLS估计的残差。第三步。使用第二阶段中估计的协方差矩阵执行GLS类型估计,并用工具变量值代替右侧的内生变量。6.3三阶段最小二乘法

2025/4/1438联立方程组的三阶段最小二乘估计法估计的Stata命令reg3的基本语法格式为:

reg3(depvar1varlist1)(depvar2varlist2)...(depvarNvarlistN)[if][in][weight]完整语法格式为:reg3([eqname1:]depvar1a[depvar1b...=]varlist1[,noconstant])

([eqname2:]depvar2a[depvar2b...=]varlist2[,noconstant])...

([eqnameN:]depvarNa[depvarNb...=]varlistN[,noconstant])[if][in][weight][,options]

6.3三阶段最小二乘法2025/4/1439菜单操作为:Statistics>Endogenouscovariates>Three-stageleastsquares

reg3估计一个结构方程组,其中一些方程包含解释变量中的内生变量。通常,内生的解释变量是系统中其他方程的因变量。通过三阶段最小二乘法(3SLS)进行估计;reg3支持迭代GLS估计和线性约束。reg3还可以通过看似无关的回归估计(SERE)、多元回归(MVREG)和方程逐步普通最小二乘法(OLS)或两阶段最小二乘法(2SLS)来估计方程组。

6.3三阶段最小二乘法2025/4/1440例6.3三阶段最小二乘法。下面用Stata自带数据说明实现。一个简单的宏观经济模型将消费(consump)与私人和政府工资支付(wagepriv和wagegovt)联系起来。同时,私人工资取决于消费、政府总开支支出(govt),以及经济中滞后的资本存量(capital1)。虽然这不是一个合理的模型,它确实符合简单的标准。这个模型可以写成:6.3三阶段最小二乘法2025/4/1441估计命令如下:1.3SLS

(1)*清理内存,下载数据

.clear

.use/data/r17/klein(2)*三阶段最小二乘法

.reg3(consumpwageprivwagegovt)(wageprivconsumpgovtcapital1)例6.3三阶段最小二乘法。6.3三阶段最小二乘法2025/4/1442例6.3三阶段最小二乘法。6.3三阶段最小二乘法2025/4/1443例6.3三阶段最小二乘法。

*2.全局估计(1)*清理内存,下载数据.clear

.webusesupDem(2)*在全局宏中存储方程.globaldemand"(qDemand:quantitypricepcompeteincome)".globalsupply"(qSupply:quantitypricepraw)”(3)*估算系统,将价格指定为内生.reg3$demand$supply,endog(price)

6.3三阶段最小二乘法2025/4/1444例6.3三阶段最小二乘法。6.3三阶段最小二乘法2025/4/1445例6.3三阶段最小二乘法。

*3.有约束的估计

(1)*清理内存,下载数据

.clear

.webuseklein

(2)*在全局宏中存储方程和变量列表

.globalconseqn"(consumpprofitsprofits1wagetot)"

.globalinveqn"(investprofitsprofits1capital1)"

.globalwageqn"(wageprivtotinctotinc1year)"

.globalenlist"wagetotprofitstotinc"

.globalexlist"taxnetxwagegovtgovt”6.3三阶段最小二乘法2025/4/1446例6.3三阶段最小二乘法。(3)*估计系统,指定内生和外生变量列表;迭代直到估计值收敛

.reg3$conseqn$inveqn$wageqn,endog($enlist)exog($exlist)ireg36.3三阶段最小二乘法2025/4/1447例6.3三阶段最小二乘法。(4)*修正消费方程

.globalconseqn"(consumpprofitsprofits1wageprivwagegovt)"(5)*消费方程中wagepriv和wagegovt的约束系数相等.constraint1[consump]wagepriv=[consump]wagegovt(6)*约束下的估计系统

.reg3$conseqn$inveqn$wageqn,endog($enlist)exog($exlist)constr(1)ireg36.3三阶段最小二乘法2025/4/1448例6.3三阶段最小二乘法。6.4广义矩估计普通最小二乘法(OLS)、加权最小二乘法(WLS)、广义最小二乘法(GLS)都有一定的局限性,只有在满足一定的条件时,其参数估计才是有效和无偏的,而广义矩估计法(GneralizedMethodofMoments,GMM)则不受模型假定的限制,不要求随机误差项要非自相关,不存在异方差,并且其得到的参数估计值比其他估计方法得到的参数估计值更与实际值接近。可以认为,广义矩估计法(GMM)包容了普通最小二乘法、加权最小二乘法、广义最小二乘法。2025/4/14496.4广义矩估计2025/4/1450

6.4广义矩估计2025/4/1451

(6.27)

6.4广义矩估计2025/4/1452广义矩估计法是矩估计法的一般化。广义矩估计法的原理是,设定参数满足的理论关系,然后选择参数估计尽可能接近理论关系,即把理论关系用样本近似值代替,求解使理论值和实际值之间的加权距离最小化的参数估计量,即可得到有效参数估计值。则参数β的GMM估计值的最小化加权平均矩的距离函数为:

(6.28)

6.4广义矩估计2025/4/1453

(6.29)

6.4广义矩估计2025/4/1454

样本矩的协方差矩阵为(6.30)(6.31)

6.4广义矩估计交互式版本:gmm([reqname1:]rexp_1)([reqname2:]rexp_2)...[if][in][weight][,options]矩计算程序版本:gmmmoment_prog[if][in][weight],{equations(namelist)|nequations(#)}{parameters(namelist)|nparameters(#)}[options][program_options]

其中,reqname_j是第j个残差方程名称,rexp_j是第j个残差方程的可替代表达式,并且moment_prog是一个momentevaluator程序。2025/4/1455GMM估计是一种大样本估计。在大样本的情况下,GMM估计是渐进有效的,在小样本情况下是无效的。所以,只有对大样本数据建模分析时,才能使用广义矩估计法。广义矩估计法的Stata命令为:6.4广义矩估计2025/4/1456菜单操作路径为:Statistics>Endogenouscovariates>Generalizedmethodofmomentsestimationgmm执行广义矩(gmm)估计法。在命令的交互式版本中,可以直接在对话框中或在命令行中使用“替换”命令输入每个矩条件的残差公式表达。即时评估程序版本为您提供了更大的灵活性,以换取更高的复杂性;在这个版本中,您可以在ado文件中编写一个程序,根据传递给它的参数向量计算矩。6.4广义矩估计2025/4/1457例6.4广义矩估计法。

我们提到2SLS可以被视为GMM估计量。在ivregress中,我们通过2SLS模型拟合租金(租金)作为自住房屋价值(hsngval)和居住在城市地区的人口百分比(pcturban)的函数:我们认为,影响租金的随机冲击可能也会影响房屋价值,所以我们作为内生变量处理了hsngval。作为附加工具变量,我们使用了家庭收入、faminc和三个区域虚拟变量(reg2-reg4)。6.4广义矩估计2025/4/1458例6.4广义矩估计法。

为了使用gmm重现ivregress2sls的结果,我们输入:(1)*清理内存,下载数据

.clear.use/data/r17/hsng2

(2)*gmm估计

.gmm(rent-{xb:hsngvalpcturban_cons}),instruments(pcturbanfamincreg2-reg4)vce(unadjusted)onestep6.4广义矩估计2025/4/1459例6.4广义矩估计法。

6.4广义矩估计2025/4/1460例6.4广义矩估计法。

(3)*我们现在允许残差是异方差的,尽管我们将保持这样的假设:他们是独立的.gmm(rent-{xb:hsngvalpcturban_cons}),instruments(pcturbanfamincreg2-reg4)6.5含连续内生协变量的probit模型2025/4/1461含连续内生协变量的probit模型为:(6.32)(6.33)

(6.34)6.5含连续内生协变量的probit模型2025/4/1462

6.5含连续内生协变量的probit模型

6.5含连续内生协变量的probit模型

6.5含连续内生协变量的probit模型2025/4/1465

6.5含连续内生协变量的probit模型2025/4/1466含连续内生协变量的probit模型估计的命令语法格式为:(1)最大似然估计法:ivprobitdepvar[varlist1](varlist2=varlist_iv)[if][in][weight][,mle_options](2)两步估计法

ivprobitdepvar[varlist1](varlist2=varlist_iv)[if][in][weight],twostep[tse_options]其中,varlist1是外生变量列表。varlist2是内生变量列表。

varlist_iv是与varlist1一起使用的外部变量列表,作为varlist2的工具。6.5含连续内生协变量的probit模型2025/4/1467菜单操作路径为:

Statistics>Endogenouscovariates>Probitmodelwithendogenouscovariates

ivprobit适用于二元因变量模型,其中一个或多个协变量是内生的,误差是正态分布的。默认情况下,ivprobit使用最大似然估计,但可以请求Newey(1987)的最小卡方(两步)估计。两种估计都假设内生协变量是连续的,因此不适合与离散的内生协变量一起使用。6.5含连续内生协变量的probit模型2025/4/1468例6.5含连续内生协变量的probit模型估计。我们有500个双亲家庭的假设数据,我们希望对女性是否就业进行建模。我们有一个变量femwork,如果她有工作,它等于1,否则等于0。她工作的决定取决于家里孩子的数量,已完成受教育的年限(femeduc),其他家庭收入以千美元计(其他公司)。我们怀疑,影响女性工作决定的不可观察的冲击也会影响家庭的其他收入。因此,我们将其他inc视为内生的。作为一种工具,我们使用男子完成学业的年数(男性教育)。

6.5含连续内生协变量的probit模型2025/4/1469例6.5含连续内生协变量的probit模型估计。.*下载数据

.webuselaborsup

.*最大似然估计法

.ivprobitfem_workfem_educkids(other_inc=male_educ)

6.5含连续内生协变量的probit模型2025/4/1470例6.5含连续内生协变量的probit模型估计。.*两步估计法

.ivprobitfem_workfem_educkids(other_inc=male_educ),twostep

6.6含内生协变量的扩展probit回归2025/4/1471

(6.35)

(6.36)

(6.37)6.6含内生协变量的扩展probit回归2025/4/1472

(6.38)则对数似然函数(6.36)可以化简为:(6.39)成功的条件概率可以用类似的符号表示为:(6.40)6.6含内生协变量的扩展probit回归2025/4/14736.6.1连续内生协变量

(6.41)(6.42)

6.6含内生协变量的扩展probit回归2025/4/14746.6.1连续内生协变量我们可以将因变量的联合密度写为乘积:

6.6含内生协变量的扩展probit回归2025/4/14756.6.1连续内生协变量

(6.43)

(6.44)6.6含内生协变量的扩展probit回归2025/4/14766.6.2二元和有序内生协变量

(6.44)

6.6含内生协变量的扩展probit回归2025/4/14776.6.2二元和有序内生协变量

6.6含内生协变量的扩展probit回归2025/4/14786.6.2二元和有序内生协变量

6.6含内生协变量的扩展probit回归2025/4/14796.6.2二元和有序内生协变量

(6.46)(6.47)6.6含内生协变量的扩展probit回归2025/4/14806.6.2二元和有序内生协变量

(6.48)6.6含内生协变量的扩展probit回归2025/4/14816.6.2二元和有序内生协变量

(6.49)(6.50)6.6含内生协变量的扩展probit回归2025/4/14826.6.2二元和有序内生协变量

扩展probit回归的命令语法格式为:

(1)具有内生协变量的基本probit回归

eprobitdepvar[indepvars],endogenous(depvars_en=varlist_en)[options](2)样本选择的基本probit回归

eprobitdepvar[indepvars],select(depvar_s=varlist_s)[options](3)基于tobit样本选择的基本probit回归

eprobitdepvar[indepvars],tobitselect(depvar_s=varlist_s)[options]扩展模型选项有:endogenous(enspec):内生协变量的模型,可以重复;select(selspec):用probit模型选择;tobitselect(tselspec):用tobit模型选择。6.6含内生协变量的扩展probit回归2025/4/14836.6.2二元和有序内生协变量

菜单操作:Statistics>Endogenouscovariates>Modelsaddingselectionandtreatment>Probitregressioneprobit拟合probit回归模型,该模型可容纳内生协变量、非随机处理分配和内生样本选择的任意组合。允许使用连续、二元和有序的内生协变量。处理分配可以是内源性的,也可以是外源性的。probit或tobit模型可用于解释内生样本选择。6.7含内生协变量的扩展有序probit回归2025/4/1484

(6.51)(6.52)

6.7含内生协变量的扩展有序probit回归2025/4/1485对应的上下限为:

(6.53)

(6.54)6.7含内生协变量的扩展有序probit回归2025/4/14866.7.1连续内生协变量

(6.55)(6.56)6.7含内生协变量的扩展有序probit回归2025/4/14876.7.1连续内生协变量

6.7含内生协变量的扩展有序probit回归2025/4/14886.7.1连续内生协变量

(6.57)

(6.58)6.7含内生协变量的扩展有序probit回归2025/4/14896.7.2二元和有序内生协变量

(6.59)

6.7含内生协变量的扩展有序probit回归2025/4/14906.7.2二元和有序内生协变量

(6.60)(6.61)6.7含内生协变量的扩展有序probit回归2025/4/14916.7.2二元和有序内生协变量扩展有序probit回归的命令语法格式为:(1)具有内生协变量的基本有序probit回归eoprobitdepvar[indepvars],endogenous(depvars_en=varlist_en)[options](2)样本选择的基本有序probit回归eoprobitdepvar[indepvars],select(depvar_s=varlist_s)[options](3)基于tobit样本选择的基本有序probit回归eoprobitdepvar[indepvars],tobitselect(depvar_s=varlist_s)[options]

6.7含内生协变量的扩展有序probit回归2025/4/14926.7.2二元和有序内生协变量菜单操作:Statistics>Endogenouscovariates>Modelsaddingselectionandtreatment>Orderedprobitregressioneoprobit符合有序probit回归模型,该模型可容纳内生协变量、非随机处理分配和内生样本选择的任意组合。允许使用连续、二元和有序的内生协变量。处理分配可以是内源性的,也可以是外源性的。probit或tobit模型可用于解释内生样本选择。

6.8含内生协变量的Tobit回归2025/4/1493

(6.62)(6.63)6.8含内生协变量的Tobit回归2025/4/1494

(6.64)6.8含内生协变量的Tobit回归2025/4/1495(6.65)

(6.66)6.8含内生协变量的Tobit回归2025/4/1496(2)两步估计法:

ivtobitdepvar[varlist1](varlist2=varlist_iv)[if][in][weight],twostepll[(#)]ul[(#)][tse_options]其中选项为:varlist1是外生变量列表。varlist2是内生变量列表。varlist_iv是与varlist1一起使用的外部变量列表,作为varlist2的工具。*ll[(#)]:左删失限制

*ul[(#)]:右删失限制

mle:使用条件极大似然估计;默认值constraints(constraints):应用指定的线性约束*twostep:使用Newey的两步估计量;

6.8含内生协变量的Tobit回归2025/4/1497菜单操作路径为:Statistics>Endogenouscovariates>Tobitmodelwithendogenouscovariates

ivtobit适合tobit模型,其中一个或多个协变量是内生确定的。默认情况下,ivtobit使用最大似然估计,但可以请求Newey(1987)的最小卡方(两步)估计。两种估计都假设内生协变量是连续的,因此不适合与离散的内生协变量一起使用。

6.8含内生协变量的Tobit回归2025/4/1498例6.6含内生协变量的Tobit回归(1)我们模拟了高中男生每周使用社交媒体((hsocial)的小时数。数据收集过程导致在12小时内对花费的小时数进行审查。因此,托比特型模型对于我们的数据是合理的。我们根据每个男孩是否有智能手机(sphone)、家里是否有电脑(computer)、高中入学年份(year)和每周学习时间(hstudy)来模拟每个男孩使用社交媒体的时间。我们认为,有一些不可观察的变量同时影响hstudy和social,也就是说hstudy是内生的。因为hstudy是内生的,所以我们也必须对其进行建模。我们的内生性hstudy研究模型始终包括用于模拟hsocial结果的外生协变量。

6.8含内生协变量的Tobit回归2025/4/1499例6.6含内生协变量的Tobit回归(1)我们还必须在内源性HST研究的模型中至少包含一个协变量,该协变量未包含在hsocial结果的模型中。我们使用带默认最大似然估计量的ivtobit对内生变量hstudy进行建模,作为父母最高教育程度(pedu)、看电视时间(tvhours)和用于建模hsocial的外部协变量的函数。

6.8含内生协变量的Tobit回归2025/4/14100例6.6含内生协变量的Tobit回归(1).*清理内存,下载数据

.clear.use/data/r17/smedia

(Fictionaldataonhoursspentonsocialmedia)

.ivtobithsociali.sphoneputeri.year(hstudy=tvhoursi.pedu),ul(12)

6.8含内生协变量的Tobit回归2025/4/14101例6.6含内生协变量的Tobit回归(1)

在表下,我们看到了瓦尔德检验,以确定主方程(预测hstudy)的残差与辅助方程(预测hsocial)的残差之间的相关性是否为0。相关性本身为0.47,表中显示为corr(e.hstudy,e.hsocial)。如果检验统计量不显著,则样本中没有足够的信息来拒绝无内生性的无效假设。在我们的例子中,我们拒绝了支持我们选择解释内生性的托比特模型的无效假设。6.9含内生协变量的区间回归2025/4/141026.9.1区间回归

(6.67)

6.9含内生协变量的区间回归2025/4/141036.9.1区间回归

对数似然函数:(6.68)

6.9含内生协变量的区间回归2025/4/141046.9.2连续内生协变量区间回归模型为:(6.69)零均值的正态随机项的协方差矩阵为:

6.9含内生协变量的区间回归2025/4/141056.9.2连续内生协变量

(6.70)

6.9含内生协变量的区间回归2025/4/141066.9.3二元和有序内生协变量的回归模型估计

(6.71)6.9含内生协变量的区间回归2025/4/14107

6.9.3二元和有序内生协变量的回归模型估计6.9含内生协变量的区间回归2025/4/14108

6.9.3二元和有序内生协变量的回归模型估计(6.72)6.9含内生协变量的区间回归2025/4/14109含内生协变量的扩展区间回归的命令语法格式为:(1)具有内生协变量的基本区间回归:eintregdepvar_1depvar_2[indepvars],endogenous(depvars_en=varlist_en)[options](2)带样本选择的基本区间回归:eintregdepvar_1depvar_2[indepvars],select(depvar_s=varlist_s)[options]

(3)Tobit样本选择的基本区间回归:eintregdepvar_1depvar_2[indepvars],tobitselect(depvar_s=varlist_s)[options]6.9.3二元和有序内生协变量的回归模型估计6.9含内生协变量的区间回归2025/4/141106.9.3二元和有序内生协变量的回归模型估计extensions选项有:endogenous(enspec):内生协变量的模型;可以重复select(selspec):用probit模型选择tobitselect(tselspec):用tobit模型供选择6.9含内生协变量的区间回归2025/4/141116.9.3二元和有序内生协变量的回归模型估计菜单操作为:Statistics>Endogenouscovariates>Modelsaddingselectionandtreatment>Intervalregressioneintreg拟合了一个区间回归模型,该模型可容纳内生协变量、非随机处理分配和内生样本选择的任意组合。允许使用连续、二元和有序的内生协变量。处理分配可以是内生的,也可以是外生的。probit或tobit模型可用于解释内生样本选择。

6.9含内生协变量的区间回归2025/4/14112例6.8具有连续内生协变量的区间回归。.

*下载数据.

clearall.

webuseclass10

(Classof2010profile)

.*内生协变量hsgpa的区间回归

.eintreggpalgpauincome,endogenous(hsgpa=incomei.hscomp)6.9含内生协变量的区间回归2025/4/14113例6.8具有连续内生协变量的区间回归。.margins,at(hsgpa=(23))contrast(at(r)effectsnowald)6.9含内生协变量的区间回归2025/4/14114例6.8具有连续内生协变量的区间回归。.*考虑内生样本选择

.eintreggpalgpauincome,endogenous(hsgpa=incomei.hscomp)select(graduate=hsgpaincomei.roommategram)

6.10含内生协变量的泊松模型

2025/4/14115ivpoisson中的估计量是GMM估计量,可以用误差函数和用于形成矩条件的工具来表示。文中给出了GMM估计量的误差函数。这里,我们提供了有关CF估计所使用的误差函数形式的一些详细信息。泊松模型的加法形式为:加法泊松模型的误差函数为:(6.73)(6.74)6.10含内生协变量的泊松模型

2025/4/14116

(6.75)(6.76)(6.77)6.10含内生协变量的泊松模型

2025/4/14117

(6.78)(6.79)6.10含内生协变量的泊松模型

2025/4/14118

(6.80)6.10含内生协变量的泊松模型

2025/4/14119

(6.81)

6.10含内生协变量的泊松模型

2025/4/14120

(6.82)

6.10含内生协变量的泊松模型

2025/4/14121含内生协变量的泊松模型估计的命令语法格式为:

(1)广义矩估计法

ivpoissongmmdepvar[varlist1][(varlist2=varlist_iv)][if][in][weight][,reg_err_optoptions]

其中reg_err_opt选项:

additive:条件平均项加总回归误差;默认值

multiplicative:条件平均项乘回归误差6.10含内生协变量的泊松模型

2025/4/14122(2)控制函数估计法

ivpoissoncfunctiondepvar[varlist1](varlist2=varlist_iv)[if][in][weight][,options]

控制函数估计法options有:

noconstant:抑制常数项

exposure(varname_e):包括系数约束为1的模型中的ln(varname\ue)offset(varname_o):在系数约束为1的模型中包括varname\uo

*twostep:使用两步GMM估计;默认值为ivpoissongmm

*onestep:使用一步GMM估计;默认值为ivpoissonC函数

*igmm:使用迭代GMM估计法

6.10含内生协变量的泊松模型

2025/4/14123

菜单操作路径为:

Statistics>Endogenouscovariates>Poissonmodelwithendogenouscovariatesivpoisson估计Poisson回归模型的参数,其中一些协变量是内生的。该模型也称为指数条件平均模型,其中一些协变量是内生的。可以使用加法或乘法误差项指定模型。该模型经常用于对结果计数进行建模,也用于对非负性结果变量进行建模。

6.10含内生协变量的泊松模型

2025/4/14124例6.9含内生协变量的泊松模型估计(1)。

一家新闻网站在一个大城市随机抽取了500名年轻人,希望根据被抽样的个人在互联网上花费的总时间(time)和他们通过电子邮件或查看其他网站(visits)收到该网站广告的次数。我们怀疑花在互联网上的时间与未观察到的因素相关,这些因素会进一步影响个人访问网站的次数。因此,我们将时间视为内生回归量。此变量使用两种工具。花在电话上的时间是一种工具。另一个工具是与住在外地的朋友和家人互动的时间(frfam)。我们使用带加性误差的指数条件平均模型对网站的访问量进行建模,并使用ivpoissongmm估计以下输出中的回归参数。为了考虑误差的异方差性,我们使用默认的稳健标准误差。6.10含内生协变量的泊松模型

2025/4/14125例6.9含内生协变量的泊松模型估计(1)。

.*下载数据.clearall.webusewebsite

(Visitstowebsite)

.*广义矩量法:加法误差

.ivpoissongmmvisitsadfemale(time=phonefrfam)

6.10含内生协变量的泊松模型

2025/4/14126例6.9含内生协变量的泊松模型估计(1)。

我们发现除女性外,所有协变量均存在显著系数。在其他协变量的固定值下,上网时间的增加将提高网站访问的预期数量。收到额外的广告也会导致预期的网站访问量增加。

6.11含内生协变量的面板数据分析xtivreg

2025/4/14127(6.83)考虑面板数据模型:

6.11含内生协变量的面板数据分析xtivreg

2025/4/141286.11.1面板数据模型的一阶差分工具变量回归估计该估计法从工具变量中获得其估计值和常规VCE对第一次差分数据进行回归。具体来说,首先对数据进行差分得到:(6.84)

6.11含内生协变量的面板数据分析xtivreg

2025/4/141296.11.2固定效应的面板数据模型的工具变量回归估计该模型的核心是内部转换。变量w的内部变换是:

式中,n是组数,N是变量的观察总数。面板数据模型的内部变换是:(6.85)

6.11含内生协变量的面板数据分析xtivreg

2025/4/141306.11.3效应间(BE)面板数据模型的工具变量回归估计

通过面板数据模型的中间变换后,得到:(6.86)

6.11含内生协变量的面板数据分析xtivreg

2025/4/141316.11.4GLS随机效应(RE)模型的估计

6.11含内生协变量的面板数据分析xtivreg

2025/4/141326.11.4GLS随机效应(RE)模型的估计

因为方差分量未知,所以需要一致的估计来实现可行的GLS。xtivreg提供了两种选择。默认设置是对不平衡面板的Swamy–Arora方法的简单扩展。如果指定了nosa选项,则使用Baltagi和Chang(2000)中描述的一致估计值。即:

默认的Swamy–Arora方法包含自由度校正,以提高其在小样本中的性能。6.11含内生协变量的面板数据分析xtivreg

2025/4/141336.11.4GLS随机效应(RE)模型的估计

(6.87)6.11含内生协变量的面板数据分析xtivreg

2025/4/141346.11.4GLS随机效应(RE)模型的估计

6.11含内生协变量的面板数据分析xtivreg

2025/4/14135面板数据模型的工具变量法和两阶段最小二乘法的Stata命令为:(1)GLS随机效应(RE)模型xtivregdepvar[varlist_1](varlist_2=varlist_iv)[if][in][,reRE_options](2)效应间(BE)模型xtivregdepvar[varlist_1](varlist_2=varlist_iv)[if][in],be[BE_options](3)固定效应(FE)模型

xtivregdepvar[varlist_1](varlist_2=varlist_iv)[if][in],fe[FE_options](4)第一差分(FD)估计量xtivregdepvar[varlist_1](varlist_2=varlist_iv)[if][in],fd[FD_options]

6.11.4GLS随机效应(RE)模型的估计6.11含内生协变量的面板数据分析xtivreg

2025/4/14136模型设定选项(options)有:re:重复使用随机效应估计法(默认值);ec2sls:使用Baltagi的ec2sls随机效应估计法;nosa:使用方差分量的Baltagi-Chang估计量;regress:将协变量视为外生变量,忽略工具变量。菜单操作为:Statistics>Longitudinal/paneldata>Endogenouscovariates>Instrumental-variablesregression(FE,RE,BE,FD)

6.11.4GLS随机效应(RE)模型的估计6.11含内生协变量的面板数据分析xtivreg

Stata命令xtivreg不提供选择项“vce(robust)”使用聚类稳健标准误,但可以使用选择项“vce(bootstrap)”得到稳健的自助标准误。当工具变量个数多于内生解释变量个数时,对面板数据进行GMM估计会更有效率,这需要下载非官方命令xtivreg2,该命令只能处理固定效应,即先对模型进行FE或FD变换后,再对变换后的模型使用GMM。

命令:

Xtivreg2

y[varlist](varlist2=varlist_iv,fegmm(FE变换)

Xtivreg2

y[varlist](varlist2=varlist_iv,fdgmm(FD变换)

2025/4/141376.11含内生协变量的面板数据分析xtivreg

2025/4/14138例6.11含内生变量的面板数据分析。下面这个例子的数据来自stata全国青年妇女纵向调查的一个摘录。限定时变协变量,我们认为,实际工资的对数是个人年龄及其平方、在观察到的工作地点的任期、她是否属于工会,是否居住在都会区,以及她是否住在南方的函数,这些变量分别是age,c.age#c.age,tenure,union,notsmsa,andsouth。如果我们把所有变量都视为外生变量,我们可以使用xtreg的单阶段估值法:6.11含内生协变量的面板数据分析xtivreg

2025/4/14139例6.11含内生变量的面板数据分析。(1)*清理内存,下载数据

.clear

.use/data/r17/nlswork(2)*xtreg的单阶段估值法

.xtregln_wagec.age#c.agetenurenot_smsaunionsouth,fe6.11含内生协变量的面板数据分析xtivreg

2025/4/14140例6.11含内生变量的面板数据分析。6.11含内生协变量的面板数据分析xtivreg

2025/4/14141例6.11含内生变量的面板数据分析。

现在假设我们希望将任期作为联邦和南方的函数来建模,并且我们相信这两个方程中的误差是相关的。因为我们仍然对估算范围内的数据感兴趣,我们现在需要一个两阶段最小二乘估计。以下输出显示了命令和拟合此模型的结果:(3)*两阶段最小二乘估计

.xtivregln_wagec.age#c.agenot_smsa(tenure=unionsouth),fe6.11含内生协变量的面板数据分析xtivreg

2025/4/14142例6.11含内生变量的面板数据分析。

6.11含内生协变量的面板数据分析xtivreg

2025/4/14143例6.11含内生变量的面板数据分析。(4)*GLSrandom-effectsmodel

.xtivregln_wagec.age#c.agenot_smsa2.race(tenure=unionbirthsouth),re

6.11含内生协变量的面板数据分析xtivreg

2025/4/14144例6.11含内生变量的面板数据分析。

(5)*EC2SLS

.xtivregln_wagec.age#c.agenot_smsa2.race(tenure=unionbirthsouth),reec2sls6.11含内生协变量的面板数据分析xtivreg

2025/4/14145例6.11含内生变量的面板数据分析。

(6)*G2SLS

.xtivregln_wagec.age#c.agenot_smsa2.race(tenure=unionbirthsouth),renosa6.12含内生协变量的随机效应回归

2025/4/14146设随机效应的面板线性回归模型为:(6.88)

(6.89)6.12含内生协变量的随机效应回归

2025/4/14147被解释变量的条件预期值为:

(6.90)(6.91)6.12含内生协变量的随机效应回归

2025/4/14148含内生协变量的随机效应回归的命令语法格式为:(1)随机效应的基本线性回归xteregressdepvar[indepvars][,options](2)综合随机效应、内生协变量、处理和选择的线性回归xteregressdepvar[indepvars][if][in][,extensionsoptions]模型拓展选项(options)有:➢

endogenous(enspec):内生协变量的模型;可能会重复;➢

entreat(entrspec):内生产量效应分配的模型;➢

extreat(extrspec):外生处理;➢

select(selspec):用probit模型进行选择;➢

tobitselect(tselspec):tobit选择模型

6.12含内生协变量的随机效应回归

2025/4/14149模型设定选项(options)有:➢

noconstant:无常数项;➢

offset(varname_o):将varname_o包含在系数约束为1的模型中;➢

constraints(numlist):应用指定的线性约束。➢

菜单操作为:Statistics>Longitudinal/paneldata>Endogenouscovariates>Modelsaddingselectionandtreatment>Linearregression(RE)xteregress拟合随机效应线性回归模型,该模型以与eregress相同的方式容纳内生协变量、处理和样本选择,还考虑了小组或组内观察值的相关性。6.12含内生协变量的随机效应回归

2025/4/14150例6.13具有连续内生协变量的随机效应回归。我们将使用nlswork.dta,关于1968年14-24岁的年轻女性的NLSY数据的一个子样本(人力资源研究中心1989)。假设我们想研究工资的自然对数(ln工资)与工作年限(任期)之间的关系。我们还利用个人年龄(年龄和c.age#c.age)、居住在大都市地区(而非smsa)以及个人是否为非裔美国人(2.种族)的二次效应对ln工资进行建模。我们怀疑影响个人的工作任期和影响其工资的未观察到的因素相关,所以我们将工作任期视为内生协变量。我们使用个人的工会地位(工会)和她是否居住在美国南部(南方)作为终身教职的工具协变量。我们还想解释数据中的面板内相关性,因此我们使用xteregress拟合了一个随机效应模型。在适应模型之前,必须使用xtset指定面板标识符变量,在本例中为idcode。我们的数据已经被设置为xtset,所以我们键入xtset来显示设置。

6.12含内生协变量的随机效应回归

2025/4/14151例6.13具有连续内生协变量的随机效应回归。.*下载数据.clearall

.use/data/r17/nlswork

(NationalLongitudinalSurveyofYoungWomen,14-24yearsoldin1968).xtset

Panelvariable:idcode(unbalanced)Timevariable:year,68to88,butwithgapsDelta:1unit6.12含内生协变量的随机效应回归

2025/4/14152.*随机效应回归

.xteregressln_wageagec.age#c.agei.not_smsa2.race,endogenous(tenure=agec.age#c.agei.union2.racei.south)vce(robust)6.12含内生协变量的随机效应回归

2025/4/14153例6.13具有连续内生协变量的随机效应回归。输出的前两部分提供了lnwage和tenure(任期)方程中的估计系数。因为这是一个线性回归,我们可以用通常的方式解释系数。例如,我们预计在工作年限延长一年后,原木工资将增加0.23。接下来,我们将看到观测水平误差方差的估计及其与因变量的相关性。随后是对随机效应方差的估计以及它们与因变量的相关性的估计。如果这些相关性中至少有一个与零显著不同,那么我们可以得出结论,任期是内生的。在我们的例子中,观测水平误差之间的相关性为-0.91,随机效应之间的相关性为-0.83。由于两者均为负值,且与零显著不同,我们得出结论,任期是内生的,未观察到的个人层面的因素会增加工作任期降低对数工资。此外,增加工作任期的未观察到的观察水平(时变)因素往往也会降低对数工资。6.12含内生协变量的随机效应回归

2025/4/14154例6.13具有连续内生协变量的随机效应回归。我们可能还想问一些关于人口中特定群体的问题。下面,我们考虑不同年龄组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论