第九章模型设定_第1页
第九章模型设定_第2页
第九章模型设定_第3页
第九章模型设定_第4页
第九章模型设定_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章模型设定和数据问题的深入探讨函数形式误设模型设定错误冗余变量遗漏变量函数形式误设冗余变量系数不显著!不影响估计量的无偏性和一致性

除非遗漏变量与其他解释变量不相关

否则OLS估计量不具有无偏性和一致性OLS估计量不具有无偏性和一致性如果一个多元回归模型没有正确地解释因变量和解释变量之间的关系,那么它就存在函数形式误设问题。遗漏变量真实模型:log(wage)=0+1educ+2exper+3exper2+4female+5femaleeduc+u若遗漏变量exper2,哪些系数的估计量会受到影响?所有系数的估计量通常都会出现偏误!对于工作经历,情况更糟,其回报为2+23exper如何检验是否存在遗漏变量问题?单个变量,显著性检验(t检验)多个变量,联合显著性检验(F检验)

通常可以引入所有显著变量的平方项,并通过检验其联合显著性来检测模型的非线性。RESET检验—回归设定误差检验对于模型:

y=b0+b1x1+b2x2+...+bkxk+u若模型设定正确,则引入x的非线性函数,应该对解释变量没有显著影响!可以在模型中x的平方或更高次幂项,并检验其联合显著性!但会导致解释变量过多。构造如下模型:

y=b0+b1x1+b2x2+...+bkxk+1ŷ2+2ŷ3+e检验H0:1=2=0

拒绝H0:模型存在设定错误不能拒绝H0:模型设定正确可以引入ŷ的更高次幂项,但不宜过多,通常引入ŷ2和ŷ3RESET检验可以发现模型设定错误,但不能告诉我们如何改进!非嵌套模型的检验如下两种模型,如何选择:y=b0+b1x1+b2x2+u

(1)y=b0+b1log(x1)+b2log(x2)+u(2)第一种方法,构建综合模型:

y=0+1x+2x2+3log(x1)+4log(x2)+u检验H10:3=4=0检验H20:1=2=0

拒绝H10,不能拒绝H20,选择模型(2)拒绝H20,不能拒绝H10,选择模型(1)若H10和H20同时拒绝或同时接受,则无法判断!第二种方法,Davison和MacKinnon(1981)估计模型(2),得到y的拟合值ŷ1构建模型:

y=b0+b1x1+b2x2+ŷ1+u

检验H10:=0估计模型(1),得到y的拟合值ŷ2构建模型:

y=b0+b1log(x1)+b2log(x2)+ŷ2+u

检验H20:=0拒绝H10,不能拒绝H20,选择模型(2)拒绝H20,不能拒绝H10,选择模型(1)若H10和H20同时拒绝或同时接受,则无法判断!代理变量的使用能力影响工资:log(wage)=0+1educ+2exper+3abil+u只关注教育的回报,即参数1能力(abil)不可观测,考虑用IQ代替。代理变量就是某种与分析中试图控制而又无法观测变量相关的因素。该变量无法观测不关注该变量的影响要研究其他变量的影响,必须对该变量进行控制。考虑模型:log(wage)=0+1educ+2exper+3abil+uIQ作为abil的代理变量,假定二者满足:abil=0+1IQ+v遗漏变量的植入解(plug-insolution)log(wage)=0+1educ+2exper+3IQ+u哪些条件下,1的OLS估计量会收敛于1?经典假定:u和educ、exper和abil,以及IQ都不相关。好代理变量条件:扰动项v与educ、exper和abil都不相关

E(abil|educ,exper,IQ)=E(abil|IQ)=0+1IQ给定IQ,教育和工作经验对个人能力没有影响!log(wage)=0+1educ+2exper+3abil+uabil=0+1IQ+v可以得到:

log(wage)=(0+30)+1educ+2exper+31IQ+u+3v为什么不能关注个人能力对工作的影响?如果“好代理变量条件”不满足呢?

abil=0+1IQ+2educ+3exper+v植入解对应的模型:

log(wage)=(0+30)+(1+32)educ+(2+33)exper+31IQ+u+3v只能一致估计参数(1+32)

,无法明确教育的回报1为什么该数值较小且不显著?滞后因变量作为代理变量城市犯罪率

crime=0+1unem+2expend+3crime-1+u关注参数是1和2,即失业和投入对犯罪的影响为什么引入滞后期crime-1呢?除unem和expend外,还有其他因素影响crime,但这些因素不可观测。这些因素对crime的影响存在惯性,即导致过去和现在犯罪率高的不可观测因素,很多是相同的。过去的高犯罪导致高执法支出,控制crime-1本身也很有意义。随机斜率模型简单的变斜率模型:log(wage)=0+1educ+2exper+3exper2+4female+5femaleeduc+uexper的偏效应为2+23exper;educ的偏效应为1+5female,都不是固定不变。偏效应取决于无法观测因素:yi=ai+bixi为何没有扰动项?能否对所有的i,估计ai和bi考虑一个例子:

log(wage)=ai+bi(abil)educ

教育的回报因个人能力而异!需要估计平均偏效应,即a=E(ai)和b=E(bi)?

定义ai=a+ci,bi=b+di

yi=a+bxi+ui=a+bxi+(ci+dixi)哪些条件下可以通过简单回归得到平均偏效应的一致估计?测量误差因变量变量的测量误差只要误差与解释变量无关,OLS估计量是无偏的。被解释变量的测量误差归入扰动项,导致估计量的方差变大。y*=b0+b1x1+b2x2+...+bkxk+uy=b0+b1x1+b2x2+...+bkxk+u+e0实际估计的模型:

真值y*

未知,用其观测值y替代,假设存在测量误差e0。乘积型测量误差,因变量为对数形式:log(scrap)=b0+b1grant+u+e0若有人为获取津贴故意低报次品率,还可以一致估计b1吗?解释变量的测量误差y

=0+1x*+u

对于一元回归模型:

真值x

*是未知的,通常只能用其观测值x替代,假设两者之间存在测量误差e1,经典变量误差假定为:x=x*+e1实际中使用观测值x建模时,模型变换为:y

=0+1x+(u-1e1)Cov(x*,e1)=0Cov(x,

u-1e1)=0-1Cov(x,e1)=OLS估计量有偏且不一致!数据缺失、非随机样本和异常值数据缺失随机缺失,没有影响,只是样本容量减小!非随机样本:外生样本选择:基于自变量的样本选择没有影响!内生样本选择:基于因变量的样本选择估计量有偏且不一致!分层抽样高收入阶层、一般工薪阶层、农民随机从各阶层抽取样本,但因为更关注农民收入问题,农民阶层的样本抽取较多——外生样本选择若为了研究低收入家庭,而低收入家庭主要集中于农民阶层,这同样会导致农民阶层的样本抽取过多——内生样本选择。其他例子工资预期

log(wage0)=0+1educ+2exper+

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论