Stata上机实验-课件_第1页
Stata上机实验-课件_第2页
Stata上机实验-课件_第3页
Stata上机实验-课件_第4页
Stata上机实验-课件_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Stata上机实验Stata上机实验1工具变量(IV)什么情况下需要工具变量?1。遗漏变量2。变量内生性问题3。测量误差使用这种方法的困难之处在于工具变量的“搜寻”,而不是在技术方面。工具变量(IV)什么情况下需要工具变量?2工具变量选择的要求:1。相关性:工具变量与内生解释变量高度相关,即Cov(xt,pt)≠0。2。外生性:工具变量与扰动项不相关,即Cov(xt,ut)=0。使用工具变量有两种方法:二阶段最小二乘法(2SLS)和广义矩估计法(GMM)。工具变量选择的要求:3二阶段最小二乘法:2SLS主要思想:进行两阶段回归。假设方程为:y=b1x1+b2x2+u其中x1是外生变量,x2是内生变量,找到两个变量z1和z2,作为x2的工具变量。第一阶段回归:regx2x1z1z2x2结合了z1和z2的信息,此时取出x2的拟合值x2_hat。第二阶段回归:regyx1x2_hat二阶段最小二乘法:2SLS主要思想:进行两阶段回归。4广义矩估计法:GMM基本思想:求解如下一般化目标函数,使之最小化J(b_GMM)=n*g(b_GMM)'*W*g(b_GMM)其中,W为权重矩阵在球型扰动项的假定下,2SLS是最有效的。但如果扰动项存在异方差或自相关,则广义矩估计方法效果更好。GMM方法又分为两步GMM法和迭代GMM方法。广义矩估计法:GMM基本思想:5使用grilic.dta估计教育投资的回报率。变量说明:lw80(80年工资对数),s80(80年时受教育年限),expr80(80年时工龄),tenure80(80年时在现单位工作年限),iq(智商),med(母亲的教育年限),kww(在‘knowledgeoftheWorldofWork’测试中的成绩),mrt(婚姻虚拟变量,已婚=1),age(年龄)。使用grilic.dta估计教育投资的回报率。6建立方程:usegrilic.dta,clearreglw80s80expr80tenure80对方程进行分析:1。遗漏变量问题:认为方程遗漏了“能力”这个变量,加入iq(智商)作为“能力”的代理变量。2。测量误差问题:iq(智商)对“能力”的测量存在误差。3。变量内生性问题:s80可能与扰动项中除“能力”以外的其他因素相关,因此是内生变量。建立方程:7解决方法:使用med,kww,mrt,age作为内生解释变量iq与s80的工具变量。1。使用2SLS。ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),first2。使用两步GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage)3。使用迭代GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage),igmm解决方法:使用med,kww,mrt,age作为内生解释变量8几点注意事项:1。2SLS只能通过stata完成,利用定义手动计算的结果是错误的,因为残差序列是错误的。2。不可能单独为每个内生变量指定一组特定的工具变量,所有外生变变量都作为自己的工具变量。3。在大样本下,IV估计是一致的,但在小样本下,IV估计并非无偏估计量,有些情况下偏误可能很严重。几点注意事项:9弱工具变量检验工具变量Z与X的相关性较低时,2SLS估计量存在偏误,Z称为“弱工具变量”。检验方法:estatfirststage1。初步判断可以用偏R2(partialR2)(剔除掉模型中原有外生变量的影响)。2。Minimumeigenvaluestatistic(最小特征值统计量),经验上此数应该大于10。弱工具变量检验工具变量Z与X的相关性较低时,2SLS估10ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),firstestatfirststageivregress2slslw80expr8011过度识别检验检验工具变量是否与干扰项相关,即工具变量是否为外生变量。目前仅限于在过度识别的情况下,进行过度识别检验。2SLS根据Sargan统计量进行过度识别检验,GMM使用HansenJTest进行过度识别检验。命令均为:estatoverid检验工具变量的外生性

H0:所有工具变量都是外生的。H1:至少有一个工具变量不是外生的,与扰动项相关。过度识别检验检验工具变量是否与干扰项相关,即工具变量是否为12ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),firstestatoveridivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage)estatoveridivregress2slslw80expr8013究竟该用OLS还是IV即解释变量是否真的存在内生性?假设能够找到方程外的工具变量。1。如果所有解释变量都是外生变量,则OLS比IV更有效。在这种情况下使用IV,虽然估计量仍然是一致的,会增大估计量的方差。2。如果存在内生解释变量,则OLS是不一致的,而IV是一致的。究竟该用OLS还是IV即解释变量是否真的存在内生性?14豪斯曼检验(Hausmanspecificationtest)原假设:H0:所有解释变量均为外生变量。H1:至少有一个解释变量为内生变量。

quietlyreglw80s80expr80tenure80iqeststoreolsquietlyivregress2slslw80expr80tenure80(s80iq=medkwwmrtage)eststoreivhausmanivols豪斯曼检验(Hausmanspecificationte15一些面板数据教材面板数据分析(美)萧政著横截面与面板数据的经济计量分析伍德里奇著,王忠玉译Baltagi.EconometricAnalysisofPanelData最新动态可关注期刊:JournalofEconometrics一些面板数据教材面板数据分析(美)萧政著16面板数据一些前沿问题面板向量自回归模型(PanelVAR)面板单位根检验(PanelUnitRoottest)面板协整分析(PanelCointegeration)门槛面板数据模型(PanelThreshold)面板联立方程组面板空间计量面板数据一些前沿问题面板向量自回归模型(PanelV17静态面板数据静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关的模型,如AR(1),AR(2),MA(1)等,也不是静态模型。静态面板数据主要有两种模型------固定效应模型和随机效应模型。静态面板数据静态面板数据模型,是指解释变量中不包含被解释变量18面板数据的格式companyyearinvestmvalue11951755.9483311952891.24924.9119531304.46241.7119541486.75593.621951588.22289.521952645.52159.4219536412031.321954459.32115.531951135.21819.431952157.32079.731953179.52371.631954189.62759.9面板数据的格式companyyearinvestmvalue19面板数据模型考虑如下模型:Yit=Xitb+Uituit=ai+εit其中,i=1,2,…N;t=1,2,…Tuit称为复合扰动项。面板数据模型考虑如下模型:20固定效应模型对于特定的个体i而言,ai

表示那些不随时间改变的影响因素,如个人的消费习惯、国家的社会制度、地区的特征、性别等,一般称其为“个体效应”(individualeffects)。如果把“个体效应”当作不随时间改变的固定性因素,相应的模型称为“固定效应”模型。固定效应模型对于特定的个体i而言,ai表示那些不随时间改变21固定效应模型固定效应模型的公式变为:Yit=ai+Xitb+εit回归结果是每个个体都有一个特定的截距项。固定效应模型固定效应模型的公式变为:22随机效应模型随机效应模型将个体效应ai视为随机因素,即把个体效应设定为干扰项的一部分。公式将变为:Yit=Xitb+(ai+εit)回归的结果是随机效应模型的所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上。随机效应模型随机效应模型将个体效应ai视为随机因素,即把个体23怎样选择固定效应和随机效应?随机效严格要求个体效应与解释变量不相关,即Cov(ai,XitB)=0而固定效应模型并不需要这个假设条件。这是两种模型选择的关键。怎样选择固定效应和随机效应?24面板数据基本命令1。指定个体截面变量和时间变量:xtset2。对数据截面个数、时间跨度的整体描述:xtdes。3。对每个个体分别显示该变量的时间序列图:xtline。4。静态面板数据基本回归命令:xtreg。面板数据基本命令1。指定个体截面变量和时间变量:xtset25usegrunfeld,clearxtsetcompanyyearxtdesxtlineinvest混合回归:reginvestmvaluekstock固定效应:xtreginvestmvaluekstock,fe随机效应:xtreginvestmvaluekstock,reusegrunfeld,clear26结果解读固定效应随机效应特别注意:1。三个R2哪个重要?2。固定效应为什么有两个F检验?3。corr(u_i,Xb)的含义。4。sigma_u、sigma_e、rho的含义。结果解读固定效应27模型选择固定效应还是混合OLS?可以直接观测F值随机效应还是混合OLS?先用随机效应回归,然后运行xttest0固定效应还是随机效应?Hausman检验模型选择固定效应还是混合OLS?28Hausman检验基本思想:如果Corr(a_i,x_it)=0,Fe和Re都是一致的,但Re更有效。如果Corr(a_i,x_it)!=0,Fe仍然一致,但Re是有偏的。因此原假设是Corr(a_i,x_it)=0,即应该采用随机效应。Hausman检验29xtreginvestmvaluekstock,feeststorefixedxtreginvestmvaluekstock,reeststorerandomhausmanfixedrandom本题接受原假设,即应该用随机效应。xtreginvestmvaluekstock30几个常见问题1。既然固定效应每个个体都有单独的截距项,如何获得每个个体的截距项?xi:reginvestmvaluekstockpany即LSDV方法或者添加虚拟变量法。几个常见问题1。既然固定效应每个个体都有单独的截距项,如何获312。非平衡面板如何处理?usenlswork,clearxtsetidcodeyearxtdes这是一份典型的大n小t型非平衡面板数据。方法一:下载命令xtbalance提取成一个平衡面板数据,但不推荐使用,因为会损失大量样本。方法二:利用算法填补缺失值,需要经济理论和算法的支撑。2。非平衡面板如何处理?323。面板数据格式不符合要求的处理。例如如下表格格式该如何处理?处理方法:扁平数据变长条数据的命令:reshapeuseinvest2,cleareditreshapelonginvestkstock,i(company)j(year)3。面板数据格式不符合要求的处理。33companyinvest2002invest2003invest2004kstock2002kstock2003kstock2004118.919.119.619.616.816.7217.418.418.818.117.41731919.620.120.21717.142020.420.320.417.517.3518.118.318.418.516.416.1619.72019.917.216.316.3companyinvest2002invest2003inv34其他回归方法1。聚类稳健的标准差通常可以假设不同个体之间的扰动项相互独立,但同一个体在不同时期的扰动项之间往往存在自相关。故须采用聚类稳健的标准差。usegrunfeld,clearxtsetcompanyyearreginvestmvaluekstock,vce(clustercompany)同理有:xtreginvestmvaluekstock,fevce(clustercompany)xtreginvestmvaluekstock,revce(clustercompany)其他回归方法1。聚类稳健的标准差352。对于固定效应模型,可采用虚拟变量法。基本思想:固定效应模型实质上就是在传统的线性回归模型中加入N-1个虚拟变量,使得每个截面都有自己的截距项。由于固定效应模型假设存在着“个体效应”,每个个体都有其单独的截距项。这就相当于在原方程中引入n−1个虚拟变量(如果省略常数项,则引入n个虚拟变量)来代表不同的个体,获得每个个体的截据项。2。对于固定效应模型,可采用虚拟变量法。36tabcompany,gen(dum)dropdum1reginvestmvaluekstockdum*与上述方法比较一下:xi:reginvestmvaluekstockpany结果完全一样。tabcompany,gen(dum)37组间估计法对于随机效应模型,还可以采用“组间估计量”。对于那些每个个体的时间序列数据较不准确或“噪音”较大的数据,可对每个个体取时间平均值,然后用平均值来回归。xtreginvestmvaluekstock,be由于损失了较多信息量,组间估计法并不常用。组间估计法对于随机效应模型,还可以采用“组间估计量”。对于那38极大似然估计如果随机效应模型中假设扰动项服从正态分布,则可以使用最大似然估计法(MLE)来进行估计。xtreginvestmvaluekstock,mle与随机效应模型的估计比较结果几乎完全一致。极大似然估计如果随机效应模型中假设扰动项服从正态分布,则可以39双向固定效应模型固定效应模型:Yit=ai+XitB+εit双向固定效应模型:Yit=ai+ft+XitB+εit实际上添加了t-1个时间虚拟变量。主要反应随着时间变化的一些特征。tabyear,gen(yr)editdropyr1xtreginvestmvaluekstockyr*,fe大部分时间虚拟变量显著,说明随着时间的变动,invest有不断变动的趋势。双向固定效应模型固定效应模型:Yit=ai+XitB+εi40检验:可以使用似然比检验。原假设:时间虚拟变量不显著。xtreginvestmvaluekstock,feeststorefe1xtreginvestmvaluekstockyr*,feeststorefe2lrtestfe1fe2整体来看时间虚拟变量不够显著。检验:可以使用似然比检验。41异方差、序列相关和截面相关大n小T重点关注异方差大T小n重点关注序列相关由于面板数据中每个截面(公司、个人、地区)之间还可能存在内在的联系,因此,截面相关性是面板数据的一个特有的特征。三个假设:1。Var[e_it]=sigma^2同方差假设2。Corr[e_it,e_it-s]=0序列无关假设3。Corr[e_it,e_jt]=0截面不相关假设异方差、序列相关和截面相关大n小T重点关注异方差421。异方差的检验(组间):finditxttest3或者直接sscinstallxttest3xtreginvestmvaluekstock,fexttest31。异方差的检验(组间):432。序列相关的检验:基本思想:若无序列相关,则一阶差分后残差相关系数应为-0.5。finditxtserialxtserialinvestmvaluekstockxtserialinvestmvaluekstock,output2。序列相关的检验:443。截面相关的检验:sscinstallxttest2xtreginvestmvaluekstock,fexttest23。截面相关的检验:45FGLS估计1。xtgls命令xtglsinvestmvaluekstock,panels(iid)PooledOLSxtglsinvestmvaluekstock,panel(het)截面异方差xtglsinvestmvaluekstock,corr(ar1)所有个体具有相同的自相关系数

FGLS估计1。xtgls命令46xtglsinvestmvaluekstock,corr(psar1)每个个体有自己的自相关系数xtglsinvestmvaluekstock,panel(corr)截面间相关且异方差xtglsinvestmvaluekstock,panel(corr)corr(ar1)异方差、序列相关和截面相关xtglsinvestmvaluekstock,472。xtpcse命令xtpcseinvestmvaluekstockOLS估计,面板稳健性标准差xtpcseinvestmvaluekstock,corr(ar1)Prais_Winsten估计,个体具有共同的自相关系数xtpcseinvestmvaluekstock,corr(psar1)每个截面有自己的自相关系数xtpcseinvestmvaluekstock,corr(ar1)hetonly不考虑截面相关2。xtpcse命令48Stata上机实验Stata上机实验49工具变量(IV)什么情况下需要工具变量?1。遗漏变量2。变量内生性问题3。测量误差使用这种方法的困难之处在于工具变量的“搜寻”,而不是在技术方面。工具变量(IV)什么情况下需要工具变量?50工具变量选择的要求:1。相关性:工具变量与内生解释变量高度相关,即Cov(xt,pt)≠0。2。外生性:工具变量与扰动项不相关,即Cov(xt,ut)=0。使用工具变量有两种方法:二阶段最小二乘法(2SLS)和广义矩估计法(GMM)。工具变量选择的要求:51二阶段最小二乘法:2SLS主要思想:进行两阶段回归。假设方程为:y=b1x1+b2x2+u其中x1是外生变量,x2是内生变量,找到两个变量z1和z2,作为x2的工具变量。第一阶段回归:regx2x1z1z2x2结合了z1和z2的信息,此时取出x2的拟合值x2_hat。第二阶段回归:regyx1x2_hat二阶段最小二乘法:2SLS主要思想:进行两阶段回归。52广义矩估计法:GMM基本思想:求解如下一般化目标函数,使之最小化J(b_GMM)=n*g(b_GMM)'*W*g(b_GMM)其中,W为权重矩阵在球型扰动项的假定下,2SLS是最有效的。但如果扰动项存在异方差或自相关,则广义矩估计方法效果更好。GMM方法又分为两步GMM法和迭代GMM方法。广义矩估计法:GMM基本思想:53使用grilic.dta估计教育投资的回报率。变量说明:lw80(80年工资对数),s80(80年时受教育年限),expr80(80年时工龄),tenure80(80年时在现单位工作年限),iq(智商),med(母亲的教育年限),kww(在‘knowledgeoftheWorldofWork’测试中的成绩),mrt(婚姻虚拟变量,已婚=1),age(年龄)。使用grilic.dta估计教育投资的回报率。54建立方程:usegrilic.dta,clearreglw80s80expr80tenure80对方程进行分析:1。遗漏变量问题:认为方程遗漏了“能力”这个变量,加入iq(智商)作为“能力”的代理变量。2。测量误差问题:iq(智商)对“能力”的测量存在误差。3。变量内生性问题:s80可能与扰动项中除“能力”以外的其他因素相关,因此是内生变量。建立方程:55解决方法:使用med,kww,mrt,age作为内生解释变量iq与s80的工具变量。1。使用2SLS。ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),first2。使用两步GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage)3。使用迭代GMM。

ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage),igmm解决方法:使用med,kww,mrt,age作为内生解释变量56几点注意事项:1。2SLS只能通过stata完成,利用定义手动计算的结果是错误的,因为残差序列是错误的。2。不可能单独为每个内生变量指定一组特定的工具变量,所有外生变变量都作为自己的工具变量。3。在大样本下,IV估计是一致的,但在小样本下,IV估计并非无偏估计量,有些情况下偏误可能很严重。几点注意事项:57弱工具变量检验工具变量Z与X的相关性较低时,2SLS估计量存在偏误,Z称为“弱工具变量”。检验方法:estatfirststage1。初步判断可以用偏R2(partialR2)(剔除掉模型中原有外生变量的影响)。2。Minimumeigenvaluestatistic(最小特征值统计量),经验上此数应该大于10。弱工具变量检验工具变量Z与X的相关性较低时,2SLS估58ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),firstestatfirststageivregress2slslw80expr8059过度识别检验检验工具变量是否与干扰项相关,即工具变量是否为外生变量。目前仅限于在过度识别的情况下,进行过度识别检验。2SLS根据Sargan统计量进行过度识别检验,GMM使用HansenJTest进行过度识别检验。命令均为:estatoverid检验工具变量的外生性

H0:所有工具变量都是外生的。H1:至少有一个工具变量不是外生的,与扰动项相关。过度识别检验检验工具变量是否与干扰项相关,即工具变量是否为60ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),firstestatoveridivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage)estatoveridivregress2slslw80expr8061究竟该用OLS还是IV即解释变量是否真的存在内生性?假设能够找到方程外的工具变量。1。如果所有解释变量都是外生变量,则OLS比IV更有效。在这种情况下使用IV,虽然估计量仍然是一致的,会增大估计量的方差。2。如果存在内生解释变量,则OLS是不一致的,而IV是一致的。究竟该用OLS还是IV即解释变量是否真的存在内生性?62豪斯曼检验(Hausmanspecificationtest)原假设:H0:所有解释变量均为外生变量。H1:至少有一个解释变量为内生变量。

quietlyreglw80s80expr80tenure80iqeststoreolsquietlyivregress2slslw80expr80tenure80(s80iq=medkwwmrtage)eststoreivhausmanivols豪斯曼检验(Hausmanspecificationte63一些面板数据教材面板数据分析(美)萧政著横截面与面板数据的经济计量分析伍德里奇著,王忠玉译Baltagi.EconometricAnalysisofPanelData最新动态可关注期刊:JournalofEconometrics一些面板数据教材面板数据分析(美)萧政著64面板数据一些前沿问题面板向量自回归模型(PanelVAR)面板单位根检验(PanelUnitRoottest)面板协整分析(PanelCointegeration)门槛面板数据模型(PanelThreshold)面板联立方程组面板空间计量面板数据一些前沿问题面板向量自回归模型(PanelV65静态面板数据静态面板数据模型,是指解释变量中不包含被解释变量的滞后项(通常为一阶滞后项)的情形。但严格地讲,随机干扰项服从某种序列相关的模型,如AR(1),AR(2),MA(1)等,也不是静态模型。静态面板数据主要有两种模型------固定效应模型和随机效应模型。静态面板数据静态面板数据模型,是指解释变量中不包含被解释变量66面板数据的格式companyyearinvestmvalue11951755.9483311952891.24924.9119531304.46241.7119541486.75593.621951588.22289.521952645.52159.4219536412031.321954459.32115.531951135.21819.431952157.32079.731953179.52371.631954189.62759.9面板数据的格式companyyearinvestmvalue67面板数据模型考虑如下模型:Yit=Xitb+Uituit=ai+εit其中,i=1,2,…N;t=1,2,…Tuit称为复合扰动项。面板数据模型考虑如下模型:68固定效应模型对于特定的个体i而言,ai

表示那些不随时间改变的影响因素,如个人的消费习惯、国家的社会制度、地区的特征、性别等,一般称其为“个体效应”(individualeffects)。如果把“个体效应”当作不随时间改变的固定性因素,相应的模型称为“固定效应”模型。固定效应模型对于特定的个体i而言,ai表示那些不随时间改变69固定效应模型固定效应模型的公式变为:Yit=ai+Xitb+εit回归结果是每个个体都有一个特定的截距项。固定效应模型固定效应模型的公式变为:70随机效应模型随机效应模型将个体效应ai视为随机因素,即把个体效应设定为干扰项的一部分。公式将变为:Yit=Xitb+(ai+εit)回归的结果是随机效应模型的所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上。随机效应模型随机效应模型将个体效应ai视为随机因素,即把个体71怎样选择固定效应和随机效应?随机效严格要求个体效应与解释变量不相关,即Cov(ai,XitB)=0而固定效应模型并不需要这个假设条件。这是两种模型选择的关键。怎样选择固定效应和随机效应?72面板数据基本命令1。指定个体截面变量和时间变量:xtset2。对数据截面个数、时间跨度的整体描述:xtdes。3。对每个个体分别显示该变量的时间序列图:xtline。4。静态面板数据基本回归命令:xtreg。面板数据基本命令1。指定个体截面变量和时间变量:xtset73usegrunfeld,clearxtsetcompanyyearxtdesxtlineinvest混合回归:reginvestmvaluekstock固定效应:xtreginvestmvaluekstock,fe随机效应:xtreginvestmvaluekstock,reusegrunfeld,clear74结果解读固定效应随机效应特别注意:1。三个R2哪个重要?2。固定效应为什么有两个F检验?3。corr(u_i,Xb)的含义。4。sigma_u、sigma_e、rho的含义。结果解读固定效应75模型选择固定效应还是混合OLS?可以直接观测F值随机效应还是混合OLS?先用随机效应回归,然后运行xttest0固定效应还是随机效应?Hausman检验模型选择固定效应还是混合OLS?76Hausman检验基本思想:如果Corr(a_i,x_it)=0,Fe和Re都是一致的,但Re更有效。如果Corr(a_i,x_it)!=0,Fe仍然一致,但Re是有偏的。因此原假设是Corr(a_i,x_it)=0,即应该采用随机效应。Hausman检验77xtreginvestmvaluekstock,feeststorefixedxtreginvestmvaluekstock,reeststorerandomhausmanfixedrandom本题接受原假设,即应该用随机效应。xtreginvestmvaluekstock78几个常见问题1。既然固定效应每个个体都有单独的截距项,如何获得每个个体的截距项?xi:reginvestmvaluekstockpany即LSDV方法或者添加虚拟变量法。几个常见问题1。既然固定效应每个个体都有单独的截距项,如何获792。非平衡面板如何处理?usenlswork,clearxtsetidcodeyearxtdes这是一份典型的大n小t型非平衡面板数据。方法一:下载命令xtbalance提取成一个平衡面板数据,但不推荐使用,因为会损失大量样本。方法二:利用算法填补缺失值,需要经济理论和算法的支撑。2。非平衡面板如何处理?803。面板数据格式不符合要求的处理。例如如下表格格式该如何处理?处理方法:扁平数据变长条数据的命令:reshapeuseinvest2,cleareditreshapelonginvestkstock,i(company)j(year)3。面板数据格式不符合要求的处理。81companyinvest2002invest2003invest2004kstock2002kstock2003kstock2004118.919.119.619.616.816.7217.418.418.818.117.41731919.620.120.21717.142020.420.320.417.517.3518.118.318.418.516.416.1619.72019.917.216.316.3companyinvest2002invest2003inv82其他回归方法1。聚类稳健的标准差通常可以假设不同个体之间的扰动项相互独立,但同一个体在不同时期的扰动项之间往往存在自相关。故须采用聚类稳健的标准差。usegrunfeld,clearxtsetcompanyyearreginvestmvaluekstock,vce(clustercompany)同理有:xtreginvestmvaluekstock,fevce(clustercompany)xtreginvestmvaluekstock,revce(clustercompany)其他回归方法1。聚类稳健的标准差832。对于固定效应模型,可采用虚拟变量法。基本思想:固定效应模型实质上就是在传统的线性回归模型中加入N-1个虚拟变量,使得每个截面都有自己的截距项。由于固定效应模型假设存在着“个体效应”,每个个体都有其单独的截距项。这就相当于在原方程中引入n−1个虚拟变量(如果省略常数项,则引入n个虚拟变量)来代表不同的个体,获得每个个体的截据项。2。对于固定效应模型,可采用虚拟变量法。84tabcompany,gen(dum)dropdum1reginvestmvaluekstockdum*与上述方法比较一下:xi:reginvestmvaluekstockpany结果完全一样。tabcompany,gen(dum)85组间估计法对于随机效应模型,还可以采用“组间估计量”。对于那些每个个体的时间序列数据较不准确或“噪音”较大的数据,可对每个个体取时间平均值,然后用平均值来回归。xtreginvestmvaluekstock,be由于损失了较多信息量,组间估计法并不常用。组间估计法对于随机效应模型,还可以采用“组间估计量”。对于那86极大似然估计如果随机效应模型中假设扰动项服从正态分布,则可以使用最大似然估计法(MLE)来进行估计。xtreginvestmvaluekstock,mle与随机效应模型的估计比较结果几乎完全一致。极大似然估计如果随机效应模型中假设扰动项服从正态分布,则可以87双向固定效应模型固定效应模型:Yit=ai+XitB+

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论