计量经济学导论:现代观点(第七版)课件:限制因变量_第1页
计量经济学导论:现代观点(第七版)课件:限制因变量_第2页
计量经济学导论:现代观点(第七版)课件:限制因变量_第3页
计量经济学导论:现代观点(第七版)课件:限制因变量_第4页
计量经济学导论:现代观点(第七版)课件:限制因变量_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学

Econometrics

限值因变量模型和样本选择纠正提要一、二值响应的对数单位和概率单位模型二、用于角点解响应的托宾模型三、泊松回归模型四、截取和断尾回归模型五、样本选择纠正前面第7章研究了线性概率模型,它是多元回归模型在二值因变量情况下的应用。二值因变量只是限值因变量(limiteddependentvariable,LDV)的特例。广义而言,LDV就是一个取值范围明显受到限制的因变量。二值变量只取0和1两个值,当然是LDV。解释大多数经济变量都以某种方式受到限制,通常都要求它们必须为正值。例如,小时工资、住房价格和名义利率都必须大于0。但并非所有这种变量都需要特别处理。如果严格为正的变量取许多不同的值,那么很少需要特殊的计量模型。而当y是离散的且只取少数几个值时,把它看成近似连续的变量就毫无意义。y的离散性本身并不意味着线性模型就不合适。如同对二值响应的讨论中所见,线性概率模型有些缺陷。另一方面,计量经济分析中会出现其他类型的限值因变量,特别是在建立个人、家庭和企业行为的模型时。优化行为常常会导致总体中不可忽略的一部分角点解响应(cornersolutionresponse);也就是,选择数量0或0美元是最优的。比如,在任一给定年份,有相当数量的家庭的慈善捐助为0。因此,虽然年度家庭慈善捐助的总体分布散布于很大的正数范围内,但在数字0上却相当集中。尽管线性模型可能适合于刻画慈善捐助的期望值,但线性模型又可能对某些家庭做出负值的预测。由于许多观测都是0,所以就不可能取对数。一、二值响应的对数单位和概率单位模型1、线性概率模型缺点虽然估计和使用线性概率模型很简单,但它有一些缺陷。最重要的两个不足是,拟合出来的概率可能小于0或大于1,且任何一个解释变量(以水平值形式出现)的偏效应都是不变的。使用更复杂的二值响应模型(binaryresponsemodels)可以克服线性概率模型的这些缺陷。2、对数单位和概率单位模型

2、对数单位和概率单位模型-续2、对数单位和概率单位模型-续2、对数单位和概率单位模型-续2、对数单位和概率单位模型-续3、对数单位和概率单位模型的极大似然估计(1)利用极大似然估计的必要性3、对数单位和概率单位模型的极大似然估计-续(2)极大似然估计估计量3、对数单位和概率单位模型的极大似然估计-续(2)极大似然估计估计量4、多重假设的检验(1)拉格朗日乘数或得分检验;(2)瓦尔德检验;4、多重假设的检验(3)似然比检验4、多重假设的检验思考题5、解释对数单位和概率单位模型的估计值5、解释对数单位和概率单位模型的估计值-续

5、解释对数单位和概率单位模型的估计值-续

(4)各种二值响应的R2度量

5、解释对数单位和概率单位模型的估计值-续

(4)各种二值响应的R2度量二、OLS的渐近性质5、解释对数单位和概率单位模型的估计值-续

(5)偏效应与偏效应的计算方法5、解释对数单位和概率单位模型的估计值-续

(5)偏效应与偏效应的计算方法5、解释对数单位和概率单位模型的估计值-续

(6)离散解释变量的偏效应5、解释对数单位和概率单位模型的估计值-续

(6)离散解释变量的偏效应5、解释对数单位和概率单位模型的估计值-续

(7)线性概率模型值得注意的两个问题例17.1已婚妇女的劳动市场参与例17.1已婚妇女的劳动市场参与-续例17.1已婚妇女的劳动市场参与-续例17.1已婚妇女的劳动市场参与-续思考题二、用于角点解响应的托宾模型1、托宾模型正如本章开篇中提及的,另一类重要的限值因变量在严格为正值时大致连续,但总体中有一个不可忽略的部分取值为0。个人在某给定月份用于喝酒方面的花费就是一例。在美国21岁以上的总体中,这个变量的取值范围很大。但有相当大比例的人,在喝酒方面的花费为0。下面对托宾模型的讨论省略对某些细节的验证。1、托宾模型-续1、托宾模型-续2、对托宾估计值的解释(1)估计作为x函数的y的期望值2、对托宾估计值的解释-续(1)估计作为x函数的y的期望值2、对托宾估计值的解释-续(2)偏效应2、对托宾估计值的解释-续(2)偏效应3、OLS和托宾估计值的比较计算系数的调整因子至少对连续的解释变量而言,有两种常见办法:例17.2已婚妇女的年度劳动供给文件MROZ包括753个已婚妇女在工作小时数方面的数据,其中有428个妇女当年在家庭以外工作挣工资,另外325个妇女的工作小时数则为0。对于那些工作小时数为正的妇女而言,工作的时间范围也相当宽,从12小时到4950小时。因此,年工作小时数很适合用托宾模型。我们还用OLS(使用全部753个观测)估计了线性模型。结论由表17-3给出。该表有几个值得注意的如下特征:例17.2已婚妇女的年度劳动供给-续首先,托宾系数估计值具有与对应的OLS估计值相同的符号,且统计显著性也类似。可能的例外是,rwifeinc和kidsge6的系数,但其t统计量大小相当。其次,尽管人们禁不住想比较OLS估计值和托宾估计值的大小,但并不是很有信息价值。必须小心,不要因为kidslt6的托宾系数大致是OLS系数的两倍,就认为托宾模型中工作小时数对幼年子女数量的反应要大得多。例17.2已婚妇女的年度劳动供给-续例17.2已婚妇女的年度劳动供给-续例17.2已婚妇女的年度劳动供给-续例17.2已婚妇女的年度劳动供给-续4、托宾模型中的设定问题(1)托宾模型的期望表达式依赖于其背后潜变量模型中的正态性和同方差性。4、托宾模型中的设定问题-续(2)托宾潜在的重要局限性4、托宾模型中的设定问题-续(3)非正式评价托宾模型的方法是否适当三、泊松回归模型1、计数变量的估计法另一类非负因变量是计数变量,它可以取非负整数值{0,1,2,┄}。一个有价值的方法是将期望值模型化为指数函数1、计数变量的估计法-续更精确的估计值2、泊松分布计数变量不可能服从正态分布(因为正态分布是能取所有值的连续变量),而且如果它只取很少的几个值,那么这个分布与正态分布就相差很远。对计数数据来说,令人满意的分布则是泊松分布。2、泊松分布(1)指数函数的泊松估计值与线性函数OLS估计值的比较2、泊松分布(2)泊松分布的特点3、拟极大似然估计或准极大似然估计3、拟极大似然估计或准极大似然估计-续注意:泊松MLE标准误的调整即便(17.35)也不完全是一般性的。如同在线性模型中一样,可以得到完全不限制方差的泊松QMLE的标准误例17.3拘捕次数的泊松回归现在将有许多用处的泊松回归模型用于例9.1CRIME中的拘捕数据。因变量narr86是一个人在1986年被拘捕的次数。这个变量对样本2725个人中的1970个人都是0,而且只有8个narr86的值大于5。因此,泊松回归模型比线性回归模型更适合。表17-5还给出线性回归模型OLS估计值的结论。OLS的标准误就是通常的标准误;当然可以使之对异方差性稳健。泊松回归的标准误通常是极大似然标准误。因为=1.232,所以泊松回归的标准误应乘以这个因子(因此每个修正后的标准误约高出.23%)。比如,totlime的更可靠的标准误是l.23×0.015≈0.0185,相应的t统计量约为1.3。虽然对标准误的调整使所有变量的显著性都有所下降,但其中有几个仍十分统计显著。例题17.3拘捕次数的泊松回归-续四、截取和断尾回归模型通常,结果变量中的聚集(比如总体中取值为零的比例相当大)与数据截取问题的区别可能产生混淆。特别是在使用托宾模型时尤其如此。17.2节介绍的标准托宾模型只是用于角点解结果。有关托宾模型的文献通常也把另一种情形放在同一框架中处理:响应变量在某个临界值之上或之下截取。典型的截取是因为调查设计,有时候也可能是因为制度上的约束。我们将数据截取问题与角点解结果分开处理,并用截取回归模型(censoredregressionmodel)来解决数据截取的问题。实质上,用截取回归模型解决的问题是响应变量y的数据缺失问题。尽管能随机地从总体中抽取样本单位,并能够得到所有样本单位的解释变量信息,但对某些i,缺少yi的结果。仍知道所缺少的这些信息是高于还是低于某个给定的临界值,而这一信息为估计参数提供了有用的信息。1、截取回归模型截取回归模型无须借助于分布假定而定义,本小节研究截取正态回归模型。想要解释的变量y服从经典线性模型。为强调概念,在从总体随机抽取上加下标i:2、截取回归模型的估计3、截取回归模型的应用:持续期间分析持续期间是度量了某事件发生之前持续时间的变量。比如,可能想解释一个从监狱释放的重罪犯下次被捕前持续的天数。对于某些重罪犯,这种情况可能再也不会发生,或者要经过很长的时间,以致在分析数据时不得不对持续期间进行截取。在截取正态回归的持续期间应用中,和在顶端编码应用中一样,使用自然对数作为因变量,这意味着对(17.37)中的截取临界值也取对数。如同本书中所见,利用因变量的对数变换,可能会引起将参数解释为百分比变化的问题。此外,由于取对数的多数都是正变量,所以持续期间变量的对数明显比持续期间变量本身更接近正态分布。3、截取回归模型的应用:持续期间分析若违背截取正态回归模型的任一假定(特别是存在异方差性和非正态性),则MLE一般都是不一致的。这就说明,由于利用非截取样本的OLS在不要求正态性和同方差性的情况下能得到一致估计,所以截取的潜在成本也很大。有些方法不要求假定分布,但它们过于高深。例17.4累犯的持续期间分析文件RECID包含的数据是北卡罗来纳监狱中的犯人在释放后到再次被捕所持续的月数,称为durat。有些犯人在狱中参加了工作培训。控制一系列人口变量及对监狱和犯罪历史的度量。在1445个犯人中,有893人在追踪的持续期间内未被捕;因此,这些观测要被截取掉。截取时间因人而异,从70个月到81个月不等。表17-6给出对log(durat)进行截取正态回归的结果。每个系数乘以100,表示在其他条件不变的情况下,对应解释变量每提高一个单位,估计预期持续期间变化的百分数。例17.4累犯的持续期间分析-续例17.4累犯的持续期间分析-续4、断尾回归模型断尾回归模型与截取回归模型在下面的重要方面存在不同:在截取数据中,只是简单地从总体中随机选取样本。然而所产生的问题是,尽管可以得到每一个选取的样本的解释变量,但是结果y只能够在一定的阈值之间。然而在断尾回归中,首先选取总体的一部分,然后再在其中选取样本。因此,有一部分总体就不会被观察到。特别是,对于这部分总体,不了解它们的解释变量的情况。断尾数据的现象在针对特定目标进行调查的时候会经常出现,可能因为考虑了成本的问题,于是将总体的其他部分完全忽视。然而,研究人员也许希望用断尾样本得到的结果来回答关于总体的问题,必须要注意的是,断尾样本得到的结果只是针对总体中一部分的研究。5、断尾回归模型的估计5、断尾回归模型的估计如果将例17.4中被截取的所有观测数据都去掉,就可以把它当作一个断尾样本来分析。这将给552个来自断尾正态分布的观测,其中的断尾点因i而异。不过,无论如何也不能如此分析持续期间数据(或顶端编码数据),因为它删除了有用的信息。可以知道893个持续期间数据的下界和解释变量,这本身就是有用的信息;截取回归用到这些信息,而断尾回归则没有用到。在豪斯曼和怀斯(HausmanandWise,1977)给出的一个更好的断尾回归例子中,他们强调,将OLS应用于一个右断尾的样本,一般会导致估计量向零偏误。这一点在直觉上讲得通。5、断尾回归模型的估计假设关心的是收人与受教育程度之间的关系。如果只观测收人低于某个临界值的人,就会砍断收人分布的上端。这就倾向于使估计线相对于整个总体中的真实回归线来说变得平坦。图17-4说明:将收入在5万美元处从上截断的情况。尽管观测到空心圆圈表示的数据点,但观测不到实心圆圈表示的数据集。利用断尾样本的回归分析得不到一致估计量。如果图17-4中的样本是被截取而不是断尾(即有顶端编码数据),那么就能观测到图17-4中所有点的受教育程度,但对于收人在5万美元以上者,便不知道其准确的收人数量,只知道其收入至少有5万美元。实质上,实心圆圈所表示的所有观测都将垂直下落到income=50的水平线上。五、样本选择纠正断尾回归是所谓非随机样本选择(nonrandomsampleselectiontruncation)的特殊情形。对调查问卷的设计并不是非随机样本选择的唯一原因。回答者不能对某些问题回答会导致因变量和自变量数据的缺失,在估计中应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论