第6章内生解释变量

上传人：2*** IP属地：湖北上传时间：2022-05-27 格式：PPT 页数：52 大小：597KB 积分：30 举报 版权申诉

已阅读5页，还剩47页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第六章第六章内生解释变量内生解释变量第一节第一节解释变量内生性的成因与检验解释变量内生性的成因与检验第二节第二节解释变量内生性检测解释变量内生性检测第三节第三节内生性问题的解决办法内生性问题的解决办法第一节解释变量内生性的成因与检验解释变量与随机误差项之间往往存在某种程度的相关性，即：解释变量与随机误差项之间往往存在某种程度的相关性，即：cov(,)0jiixu(1,2,jk1,2, )in 此时，就称模型存在此时，就称模型存在内生性问题内生性问题，与随机误差项相关的解释，与随机误差项相关的解释变量称为变量称为内生解释变量内生解释变量。一、解释变量内生性及其影响一、解释变量内生性及其

2、影响cov(,)0jiixu(1,2,jk1,2, )in 这称为解释量的这称为解释量的外生性假定外生性假定。解释变量与随机误差项是线性无关的（甚至是均值独立的），解释变量与随机误差项是线性无关的（甚至是均值独立的），即要求即要求内生性会对内生性会对OLSE的统计性质产生不良影响的统计性质产生不良影响1、影响无偏性、影响无偏性如果假定如果假定SLR.3（不相关假定）不成立，则一定违背古典假（不相关假定）不成立，则一定违背古典假定定SLR.3的均值独立假定，即的均值独立假定，即一定不成立。而假一定不成立。而假定定SLR.3（均值独立）是（均值独立）是OLSE无偏性成立的关键假定。由无偏性成立

3、的关键假定。由（2.22）知：）知：0)|(iixuE=1(|)iEx1()(|)iiiEEkux1(|)iiik E ux=01112112()lim()lim()lim()lim()1lim() cov( ,)1var( )lim() iiiiiiiiiiixx uPPk uPPxxPxx ux unxPxxn2、影响一致性影响一致性cov( ,)iix u111cov( ,)lim()var( )iiix uPx如果如果0，则，则，，OLSE不再具有一致性。不再具有一致性。3、其它影响、其它影响其它不良影响还包括，随机误差项的方差估计量是有偏的，其它不良影响还包括，随机误差项的方差估计

4、量是有偏的，由此导致回归系数的方差估计量是有偏的，进而与方差相由此导致回归系数的方差估计量是有偏的，进而与方差相关的假设检验、区间估计容易导出错误的结论。这些影响关的假设检验、区间估计容易导出错误的结论。这些影响需要结合内生性产生的具体的原因进行分析。需要结合内生性产生的具体的原因进行分析。二、内生性产生的原因二、内生性产生的原因横截面回归中解释变量内生性产生的原因主要有遗漏变量、横截面回归中解释变量内生性产生的原因主要有遗漏变量、错误的函数形式、测量误差和联立性。错误的函数形式、测量误差和联立性。1、遗漏变量、遗漏变量在建立计量经济模型时，由于人们认识上的偏差，理论分析在建立计量经济模型时，

5、由于人们认识上的偏差，理论分析的缺陷，或者是有关统计数据的影响，导致有意或无意地忽的缺陷，或者是有关统计数据的影响，导致有意或无意地忽略了某些重要变量，未能将其作为解释变量引入模型，这种略了某些重要变量，未能将其作为解释变量引入模型，这种变量就称为变量就称为遗漏变量遗漏变量（Omitted Variable）。被遗漏的变量虽）。被遗漏的变量虽未引入模型，但其对因变量的影响还是存在的，其影响由随未引入模型，但其对因变量的影响还是存在的，其影响由随机误差项体现出来。如果被遗漏变量和模型中现有的解释变机误差项体现出来。如果被遗漏变量和模型中现有的解释变量存在相关，则会造成解释变量与随机误差项的相关，

6、即产量存在相关，则会造成解释变量与随机误差项的相关，即产生内生性问题。生内生性问题。考虑成年劳动者的工资方程中存在未观测到的能力的问题考虑成年劳动者的工资方程中存在未观测到的能力的问题 01 122yxxu（6.1）其中其中y代表工资的对数，代表工资的对数，x1代表受教育年限，代表受教育年限，x2代表个人能力，代表个人能力，u是随机误差项。是随机误差项。01 1yxv（6.2）若若x2无法准确测量，将其归入随机误差项中，得到如下回归无法准确测量，将其归入随机误差项中，得到如下回归模型：模型：其中其中v中包含了中包含了x2。显然，若是。显然，若是x2与与x1相关，则会导致相关，则会导致，

7、从而产生内生性问题。从而产生内生性问题。1cov( , )0 x v 将正确模型（将正确模型（6.1）式代入（）式代入（6.3）式得）式得对（对（6.2）式进行回归）式进行回归， x1的系数估计量为的系数估计量为:111211()()()xxyyxx（6.3） 111211()()()xxyyxx1101 12201 122211()() ()()xxxxuxxuxx11221112221111()()()()()()xxxxxxuuxxxx （6.3）（1）若遗漏的）若遗漏的 x2与与x1 相关，则（相关，则（6.4）、（）、（6.5）式中的第）式中的第二项在小样本的期望与大样本下的概率极

8、限都不会为零，二项在小样本的期望与大样本下的概率极限都不会为零，使得普通最小二乘估计量使得普通最小二乘估计量OLSE是有偏的，在大样本下也是是有偏的，在大样本下也是不一致的。不一致的。121121cov( ,)limvar()x xPx（6.5）（2）若）若 x2与与x1不相关，则由（不相关，则由（6.4）、（）、（6.5）易知）易知的估的估计量满足无偏性与一致性，但这时计量满足无偏性与一致性，但这时的估计却是有偏的。的估计却是有偏的。10（3）随机误差项的方差估计随机误差项的方差估计也是有偏的。也是有偏的。2u21211var()()vxx21221112var()() (1)ux

9、xr （4）的方差是真实估计量的方差是真实估计量的方差的有偏估计。的方差的有偏估计。11在搜集数据时，如果遇到所搜集的数据不能确实地反映变在搜集数据时，如果遇到所搜集的数据不能确实地反映变量间经济行为的情况，就称模型中包含了量间经济行为的情况，就称模型中包含了测量误差测量误差（Measurement Errors）。具体来说，测量误差是指在收集）。具体来说，测量误差是指在收集数据过程中的数据过程中的登记误差登记误差、在数据加工整理过程中的、在数据加工整理过程中的整理误整理误差差以及其他以及其他统计误差统计误差。测量误差出现的原因是多方面的。测量误差出现的原因是多方面的。首先，调查登记本身就

10、可能产生误差；首先，调查登记本身就可能产生误差；其次，数据的加工处理过程中也可能导致一定的误差；其次，数据的加工处理过程中也可能导致一定的误差；此外，数据的不当使用也会出现误差，此外，数据的不当使用也会出现误差，测量误差可能是被解释变量的测量误差，也可能是解释变测量误差可能是被解释变量的测量误差，也可能是解释变量的测量误差。量的测量误差。2、测量误差、测量误差（1）因变量存在测量误差）因变量存在测量误差，且与自变量不相关，且与自变量不相关，，则，则OLS估计量具有良好的性质，是估计量具有良好的性质，是无偏和一致的无偏和一致的。（2）因变量存在测量误差）因变量存在测量误差，且与自变量相关，

11、且与自变量相关，，则产生，则产生内生性问题，内生性问题，OLSE是是有偏且不一致的有偏且不一致的。测量误差造成的内生性也会影响回归分析的结果。测量误差造成的内生性也会影响回归分析的结果。（3）自变量存在测量误差）自变量存在测量误差，且与自变量测量值不相关、与，且与自变量测量值不相关、与随机误差不相关，则随机误差不相关，则估计值是一致的，但方差会变大估计值是一致的，但方差会变大。（4）自变量存在测量误差，且与自变量测量值相关，则产）自变量存在测量误差，且与自变量测量值相关，则产生内生性问题，生内生性问题，OLSE是不一致的是不一致的。OLSE常常会低估真实的常常会低估真实的回归参数回归参数。

12、注意注意：回归变量的测量误差是数据问题，目前计量经济学家：回归变量的测量误差是数据问题，目前计量经济学家们还们还提不出有效的解决方法提不出有效的解决方法。一般的做法往往是。一般的做法往往是忽略测量误忽略测量误差问题差问题，主观上希望测量误差足够小，从而不破坏回归分析，主观上希望测量误差足够小，从而不破坏回归分析假定的合理性。假定的合理性。例如，如果例如，如果“真实真实”的回归函数为的回归函数为但却将模型设定为但却将模型设定为错误的函数形式错误的函数形式（Wrong Functional Form）是指在设定模）是指在设定模型时，选取了不正确的函数形式。最常见的就是当型时，选取了不正确的函数形式

13、。最常见的就是当“真实真实”的函数形式为非线性时，却选取了线性的函数形式。的函数形式为非线性时，却选取了线性的函数形式。3、错误的函数形式错误的函数形式1212uyx x e01 122yxxv由错误的函数形式造成了内生性，即使其他假设均成立，由错误的函数形式造成了内生性，即使其他假设均成立，且样本很大，普通且样本很大，普通最小二乘估计量也是不一致的最小二乘估计量也是不一致的。由于经济现象的错综复杂，大多数经济问题中各变量之间由于经济现象的错综复杂，大多数经济问题中各变量之间存在反馈效应。要描述经济现象的这种复杂关系，必须从存在反馈效应。要描述经济现象的这种复杂关系，必须从整体和系统的角度进行

14、，建立由多个相互联系的单一方程整体和系统的角度进行，建立由多个相互联系的单一方程组成的组成的联立方程模型联立方程模型才能完整表达。正如单方程模型会遇才能完整表达。正如单方程模型会遇到内生性问题，联立方程模型更容易遇到内生性问题。因到内生性问题，联立方程模型更容易遇到内生性问题。因为在联立方程模型中，结构式中已包含有其它的内生变量，为在联立方程模型中，结构式中已包含有其它的内生变量，所以在从结构式到简约式的转化中，自然也把误差项带入所以在从结构式到简约式的转化中，自然也把误差项带入了其它的结构式中，产生了其它的结构式中，产生联立性联立性（Simultaneity），进而不），进而不可避免地造成内

15、生性。由于内生性的存在，会使得可避免地造成内生性。由于内生性的存在，会使得OLS估估计量是有偏的和不一致的计量是有偏的和不一致的。4、联立性联立性检验的基本思想检验的基本思想：如果不知道遗漏了哪个变量，可寻找一：如果不知道遗漏了哪个变量，可寻找一个替代变量来进行遗漏变量检验，替代变量通常选用所设个替代变量来进行遗漏变量检验，替代变量通常选用所设定模型被解释变量的拟合值定模型被解释变量的拟合值的若干次幂的线性组合。若模的若干次幂的线性组合。若模型估计所得的残差包含着遗漏的相关变量，那么这个残差型估计所得的残差包含着遗漏的相关变量，那么这个残差可用被解释变量拟合值若干次幂的线性组合近似表示；若可

16、用被解释变量拟合值若干次幂的线性组合近似表示；若这个线性组合是显著的，则认为原模型设定有误（遗漏变这个线性组合是显著的，则认为原模型设定有误（遗漏变量）。由于可引入若干个替代变量去判断是否有多个变量量）。由于可引入若干个替代变量去判断是否有多个变量被遗漏，所以该方法被称为一般性设定误差检验。被遗漏，所以该方法被称为一般性设定误差检验。拉姆齐拉姆齐(Ramsey，1969)提出了一种提出了一种“回归设定误差检验回归设定误差检验”（Regression Specification Error Test），简称），简称RESET检验。检验。第二节第二节解释变量内生性检测解释变量内生性检测一、一、R

17、ESET检验检验第一步：用第一步：用OLS法对模型（法对模型（6.7）进行回归估计）进行回归估计RESET检验的基本步骤为：检验的基本步骤为：ikikiiuxxy110（6.7）第二步：用被解释变量的拟合值第二步：用被解释变量的拟合值的若干次幂的若干次幂的线性组合，的线性组合，测度残差中是否包含着遗漏的相关变量。测度残差中是否包含着遗漏的相关变量。iy具体做法为，在第一步的模型（具体做法为，在第一步的模型（6.7）中增加一个包含拟合）中增加一个包含拟合值值的函数。这个函数通常选择为拟合值的函数。这个函数通常选择为拟合值的平方、立方的平方、立方和四次方的线性组合。例如：和四次方的线性组

18、合。例如：iyiyiiiikikiiyyyxxy433221110其中，其中， RSSU为对模型为对模型(6.8)（相当于无约束模型）进行回归（相当于无约束模型）进行回归得到的残差平方和，得到的残差平方和， RSSR 为模型（为模型（6.7）（有约束模型）进）（有约束模型）进行回归得到的残差平方和，行回归得到的残差平方和，dfU 和和 dfR分别为分别为前二者的自由前二者的自由度。针对模型（度。针对模型（6.8），（），（6.9）式可以写为：）式可以写为：其中其中n为样本个数，为样本个数，k为解释变量个数。为解释变量个数。第三步：提出原假设：第三步：提出原假设：。构造。构造F统计量：统计量

19、：01230H :() ()RURUUURSS - RSSdf -dfFRSSdf（6.9） 3(3)1)RUURSSRSSFRSSnk（6.10）第四步：给定显著性水平第四步：给定显著性水平，若，若F统计值大于等于临界值统计值大于等于临界值，则拒绝原假设，表明存在设定误差（遗漏变量），否则，说则拒绝原假设，表明存在设定误差（遗漏变量），否则，说明不存在设定误差（遗漏变量）。类似的，也可以利用明不存在设定误差（遗漏变量）。类似的，也可以利用F统统计值对应的概率值来判断：如果概率值小于等于计值对应的概率值来判断：如果概率值小于等于，则拒绝，则拒绝原假设，表明存在设定误差（遗漏变量），否则

20、，说明不存原假设，表明存在设定误差（遗漏变量），否则，说明不存在设定误差（遗漏变量）。在设定误差（遗漏变量）。F表表6-1 城镇居民人均可支配收入和人均消费性支出抽样调查数据（元）城镇居民人均可支配收入和人均消费性支出抽样调查数据（元）例例61关于城镇居民的消费行为，某些研究者认为由关于城镇居民的消费行为，某些研究者认为由于有较高的社会福利保障，以绝对收入假说消费函数模型于有较高的社会福利保障，以绝对收入假说消费函数模型为理论模型，能够得到理想的拟合结果，因而得出为理论模型，能够得到理想的拟合结果，因而得出城镇居城镇居民的消费行为应该服从绝对收入消费理论假说，收入是唯民的消费行为应该服从绝对收

21、入消费理论假说，收入是唯一显著的变量一显著的变量。用表。用表6-1的样本数据验证这一结论是否正确。的样本数据验证这一结论是否正确。家庭序号家庭序号可支配收入可支配收入消费性支出消费性支出y家庭序号家庭序号可支配收入可支配收入消费性支出消费性支出y11510.21278.891162804998.0021700.61554.86126859.65309.0032026.61840.59137702.86030.0042577.42110.81148472.26510.9453496.22852.34159421.67182.00642833537.5716104937943.0074838.

22、93919.471711759.58696.5585160.34186.001813785.89997.4795425.14331.611915780.7611242.85105854.024619.912025410.00 x x模型的参数均通过了模型的参数均通过了0.01水平下的显著性检验，水平下的显著性检验，R2=0.998表表明拟合效果很好。但是由于我们仅用当期收入来解释消费明拟合效果很好。但是由于我们仅用当期收入来解释消费支出的变化，因此，可能遗漏了相关变量。下面进行支出的变化，因此，可能遗漏了相关变量。下面进行RESET检验。检验。利用利用EViews做回归，得样本回归方程：做回归

23、，得样本回归方程：468.620.7003iiyx（6.11）由式（由式（6.11）估计出消费性支出）估计出消费性支出，在原回归模型中加入新，在原回归模型中加入新的解释变量的解释变量、后重新估计，发现后重新估计，发现的系数不显著，因的系数不显著，因此，加入变量此，加入变量进行估计，得到估计结果：进行估计，得到估计结果：iy2iy3iy3iy2iy2141.3660.8220.0000142iiiyxy（6.12） F统计量的值大于统计量的值大于0.05显著性水平下自由度为（显著性水平下自由度为（1,16）的）的F分分布的临界值布的临界值4.49，因此拒绝原假设，表明原模型确实存在，

24、因此拒绝原假设，表明原模型确实存在设定误差，遗漏了相关变量，所以我们认为消费与收入之设定误差，遗漏了相关变量，所以我们认为消费与收入之间的关系可能并不像一元线性模型那么简单。间的关系可能并不像一元线性模型那么简单。RESET检验也可以利用检验也可以利用EViews直接来完成。操作方法如下：直接来完成。操作方法如下：作作y关于关于x的回归，然后在输出结果窗口选择的回归，然后在输出结果窗口选择View / Stability Test / Ramsey RESET Test，在弹出的，在弹出的“Number of Fitted”对对话框中，设定代理变量个数为话框中，设定代理变量个数为1。点击。点击

25、“OK”，检验结果如，检验结果如下：下：计算计算F统计量：统计量：() ()(311458.8-40698.67)/(17-16)40698.67/16RURUUURSS -RSSdf -dfFRSSdf=106.4448由于由于F统计量对应的概率为统计量对应的概率为0，显然小于，显然小于 0.05，故拒绝原假，故拒绝原假设，认为遗漏了相关变量。由此可见，我国城镇居民的消设，认为遗漏了相关变量。由此可见，我国城镇居民的消费行为，不能认为服从绝对收入消费理论假说，线性模型费行为，不能认为服从绝对收入消费理论假说，线性模型设定有误。设定有误。表表6-4 EViews输出结果输出结果Ramsey R

26、ESET Test:F-statistic106.4448 Probability0.000000Log likelihood ratio38.66636 Probability0.000000Test Equation:Dependent Variable: YVariableCoefficientStd. Errort-StatisticProb. C141.365539.013553.6234990.0023X0.8219870.01214967.659220.0000YF2-1.42E-051.38E-06-10.317210.0000R-squared0.999723 Mean de

27、pendent var5165.361Adjusted R-squared0.999689 S.D. dependent var2859.409S.E. of regression50.43478 Akaike info criterion10.82318Sum squared resid40698.67 Schwarz criterion10.97230Log likelihood-99.82019 F-statistic28921.10Durbin-Watson stat2.455390 Prob(F-statistic)0.000000豪斯曼内生性检验的豪斯曼内生性检验的具体步骤具体步骤

28、为：为：1.对所研究的回归模型，无论是否存在测量误差，先采用对所研究的回归模型，无论是否存在测量误差，先采用OLS法得到参数估计量。法得到参数估计量。关于测量误差存在与否的内生性检验是豪斯曼（关于测量误差存在与否的内生性检验是豪斯曼（J. A. Hausman，1978）提出的，其）提出的，其基本思路基本思路是，把可能存在测是，把可能存在测量误差的解释变量与其工具变量做回归，将得到的残差序量误差的解释变量与其工具变量做回归，将得到的残差序列作为解释变量加入初始的模型，如果残差序列是显著的，列作为解释变量加入初始的模型，如果残差序列是显著的，则说明存在测量误差，否则说明不存在测量误差。则说明存在

29、测量误差，否则说明不存在测量误差。二、二、豪斯曼检验豪斯曼检验2.对可能存在测量误差的解释变量，选择与其相关的工具对可能存在测量误差的解释变量，选择与其相关的工具变量变量(参见本章第参见本章第3节节)，将可能存在测量误差的解释变量，将可能存在测量误差的解释变量对选择的工具变量进行回归，并获得回归残差对选择的工具变量进行回归，并获得回归残差（作为（作为自变量测量误差的代表）。自变量测量误差的代表）。i3.将回归残差将回归残差作为解释变量加入第作为解释变量加入第1步中的回归模型，步中的回归模型，再次进行再次进行OLS估计，得估计，得的参数估计值的参数估计值及显著性检验结及显著性检验结果。果

30、。ii4.若若显著，则认为解释变量的确存在观测误差，反之，显著，则认为解释变量的确存在观测误差，反之，认为解释变量不存在测量误差。认为解释变量不存在测量误差。其中，其中，ex为某贫困地区地方政府的支出，为某贫困地区地方政府的支出，aid为中央政府的为中央政府的拨款量，拨款量，inc为贫困地区地方政府的财政收入，为贫困地区地方政府的财政收入，pop为该地为该地区的总人口数。现怀疑中央政府的拨款量区的总人口数。现怀疑中央政府的拨款量aid存在测量误差。存在测量误差。我们选择贫困人口数我们选择贫困人口数ps为工具变量，其为工具变量，其原因原因为扶贫支出是为扶贫支出是该地区地方政府支出中比重最大的支

31、出，其经费来源主要该地区地方政府支出中比重最大的支出，其经费来源主要是依赖中央政府的拨款，而中央政府的拨款与该地区贫困是依赖中央政府的拨款，而中央政府的拨款与该地区贫困人口数人口数ps有直接关系有直接关系，因此因此ps与与aid有较高相关性。将有较高相关性。将aid对对ps进行回归，得：进行回归，得：例例62 假设利用观测到的样本数据作回归，已得到假设利用观测到的样本数据作回归，已得到以下结果：以下结果：46.81 0.003240.000190.597exaidincpop （6.13） t = (-0.56) (13.64) (8.12) (-5.17)R2=0.993 F=2190从上式

32、看出，因为从上式看出，因为系数的系数的t值是值是1.73，小于，小于t的临界值的临界值1.96，在在0.05的显著性水平下，双侧的显著性水平下，双侧t检验接受原假设（不存在测量检验接受原假设（不存在测量误差），但在误差），但在0.1的显著性水平上，双侧的显著性水平上，双侧t检验则拒绝原假设检验则拒绝原假设而接受备择假设（存在测量误差）。而接受备择假设（存在测量误差）。注意注意，引进对测量误差可能性的修正，使，引进对测量误差可能性的修正，使aid变量的系数变小，变量的系数变小，这从另一个侧面说明，测量误差夸大了这从另一个侧面说明，测量误差夸大了aid对对ex的影响。的影响。277.950.84

33、5( 1.28) (18.02)0.87aidpstR 得到如下的残差变量得到如下的残差变量：i( 77.950.85)iaidaidaidps 将将项加入（项加入（6.13），再回归得到以下结果：），再回归得到以下结果：i138.51 0.001740.000180.2751.372exaidincpop t = (-1.41) (1.94) (7.55) (-1.29) (1.73)工具变量的选择应工具变量的选择应满足以下条件满足以下条件：工具变量必须具有实际：工具变量必须具有实际经济意义；工具变量与内生解释变量高度相关，但与随机经济意义；工具变量与内生解释变量高度相关，但与随机项不相

34、关；工具变量与模型中的其他解释变量也不相关；项不相关；工具变量与模型中的其他解释变量也不相关；模型中多个工具变量之间不相关。模型中多个工具变量之间不相关。注意注意，工具变量对内生解释变量的替代并不是，工具变量对内生解释变量的替代并不是“完全完全”替代，替代，即不是用工具变量代换模型中对应的内生解释变量，而是即不是用工具变量代换模型中对应的内生解释变量，而是在最小二乘法的正规方程组中用工具变量对内生解释变量在最小二乘法的正规方程组中用工具变量对内生解释变量进行部分替代。进行部分替代。工具变量法工具变量法（Instrument Variable，IV）是消除内生性的一）是消除内生性的一种常用方法

35、，应用的种常用方法，应用的基本思路基本思路是，当出现内生解释变量，是，当出现内生解释变量，即解释变量与随机项相关时，则寻找另一个变量，该变量即解释变量与随机项相关时，则寻找另一个变量，该变量与内生解释变量高度相关，但与随机项不相关，称该变量与内生解释变量高度相关，但与随机项不相关，称该变量为为工具变量工具变量，用其替代内生解释变量参与参数的估计过程。，用其替代内生解释变量参与参数的估计过程。第三节第三节内生性问题的解决办法内生性问题的解决办法一、一、工具变量法工具变量法由由OLS推导的正规方程和参数估计值公式为：推导的正规方程和参数估计值公式为：设有一元线性回归模型：设有一元线性回归模型：0

36、1iiiyxu（6.16） xyxxyyxxxxnyxyxniiiiiiiii102221)()()(采用矩方法（采用矩方法（Moment Method ，MM）也可推导出完全一）也可推导出完全一样的结果：样的结果：（6.17）（6.18）由假定由假定SLR.3，，可知，可知， ( |)0iE u x( )0E u cov( ,)()0iiiix uE xu 0ieen0nexxeii对应的样本矩条件为：对应的样本矩条件为：即有：即有：，将，将代入，有：代入，有：00ii iexe01iiiiieyyyx0101()0()0iiiiiyxx yx整理后，得到正规方程组：整理后，得到正

37、规方程组：（6.20）如果解释变量内生，则第二个矩条件不能满足，样本矩条如果解释变量内生，则第二个矩条件不能满足，样本矩条件件也就无从谈起，所以，无法推导出（也就无从谈起，所以，无法推导出（6.21），），OLSE是不是不一致的。一致的。可见（可见（6.20）（）（6.17）完全相同，）完全相同，MM估计量（估计量（6.21）与）与OLS估计量（估计量（6.18）也完全一致。说明在这种情况下，）也完全一致。说明在这种情况下，OLS等价于等价于MM。xyxxyyxxxxnyxyxniiiiiiiii102221)()()(解得：解得：（6.21）此时我们需要寻找一工具变量此时我们需要寻找一

38、工具变量z。满足。满足cov( ,)()0iiiiz uE zu替换（替换（6.19）中的第二个方程，得：）中的第二个方程，得：对应的样本矩条件为对应的样本矩条件为，，即，即，0nezzeii0iiez这种方法称为这种方法称为工具变量法工具变量法。解得：解得：0101()0()0iiiiiyxz yx0101iiiiiiynxz yzz xxyxxzzyyzzxzxznyzyzniiiiiiiiiiii101)()(对应的正规方程组为：对应的正规方程组为：当当xj ( j=1,2,k) 与随机项与随机项 ui相关，设相关，设xj 的工具变量为的工具变量为 zj ( j = 1, 2, ,

39、k)，即每一个解释变量均对应一个工具变量。即每一个解释变量均对应一个工具变量。这样得到方程组：这样得到方程组：将上述一元线性回归模型的工具变量法推广到多元线性回将上述一元线性回归模型的工具变量法推广到多元线性回归模型的情形：归模型的情形：01 1iikkiiyxxu根据工具变量应满足的条件，可得：根据工具变量应满足的条件，可得：0jiiz u将关系式将关系式01 122()iiiikiiuyxxx代入上式，整理得：代入上式，整理得：01122ijijiijiijikkijiy zzx zx zx z（6.28）注意注意：工具变量法属于：工具变量法属于矩方法矩方法。可以证明，无论对于一元。可以

40、证明，无论对于一元线性模型还是多元线性模型，参数的线性模型还是多元线性模型，参数的工具变量估计量都是工具变量估计量都是有偏但一致的估计量有偏但一致的估计量。参数的工具变量的估计量为：参数的工具变量的估计量为：01122101111221101122iiikkiiiiiiiikkiii kikii kii kikki kiynxxxyzzx zx zx zyzzx zx zx z（6.29）其矩阵形式为：其矩阵形式为：ZY = ZX-1()IV= Z XZ Y例例63 以以代表国内生产总值，以代表国内生产总值，以代表消费，以代表消费，以代表代表政府支出。表政府支出。表6-5给出了某地上述

41、三项指标的数据。理论研给出了某地上述三项指标的数据。理论研究证明，国内生产总值与随机项相关，而外生的政府支出究证明，国内生产总值与随机项相关，而外生的政府支出与随机项无关，但与国内生产总值高度相关。试用工具变与随机项无关，但与国内生产总值高度相关。试用工具变量法估计国内生产总值对于消费的边际效应。量法估计国内生产总值对于消费的边际效应。年份年份xyz年份年份xyz17164.34694.52468.6925863.615952.1 9636.02 8792.1 5773.0 3386.01034500.620182.112998.0310132.8 6542.03846.01147110.92

42、7216.219260.6411784.07451.2 4322.01258510.533635.023877.0514704.09360.1 5495.01368330.440003.926867.2616466.010556.5 6095.01474894.343579.428457.6718319.511365.2 6444.01579853.346405.930396.0821280.413145.9 515.0表表6-5 国内生产总值、消费、政府支出数据国内生产总值、消费、政府支出数据（单位：亿元）（单位：亿元）由于内生性的国内生产总值由于内生性的国内生产总值x与随机项与随机项u相

43、关，而外生性的政相关，而外生性的政府支出府支出 z与随机项与随机项 u无关，且与国内生产总值无关，且与国内生产总值 x高度相关，故高度相关，故可用可用z 作为国内生产总值作为国内生产总值 x的工具变量。参数估计如下：的工具变量。参数估计如下：设消费设消费与国内生产总值与国内生产总值之间具有线性关系，可建立如下模型：之间具有线性关系，可建立如下模型：01tttyxu1iiiiiiiinz yzynz xzx01yx=0.568876.01则样本回归模型为：则样本回归模型为：876.010.568iiyx即国内生产总值对于消费的边际效应为即国内生产总值对于消费的边际效应为0.568。EView

44、s软件中，工具变量法操作如下：软件中，工具变量法操作如下：点击点击 Quick / Estimate Equation，在打开的对话框中，在打开的对话框中，“Estimation Settings/Method”选择选择“TSLS-Two-Stage Least Square(TSNLS and ARMA)”，在，在“Equation Specification”栏中输入方程形式栏中输入方程形式“y c x”，在，在“Instrument List”栏中输入栏中输入“c z”（图（图6-1）。）。Dependent Variable: YMethod: Two-Stage Least Squa

45、resInstrument list: C ZVariableCoefficientStd. Errort-StatisticProb. C876.0101123.73837.0795380.0000X0.5680510.003003189.14980.0000R-squared0.999651 Mean dependent var19724.20Adjusted R-squared0.999624 S.D. dependent var14652.80S.E. of regression284.1214 Sum squared resid1049425.F-statistic35777.64

46、Durbin-Watson stat1.297665Prob(F-statistic)0.000000表表6-6 EViews输出结果输出结果点击点击“OK”即可得到回归结果如下：即可得到回归结果如下：实际问题分析时往往有不只一个的外生变量被遗漏，排斥在实际问题分析时往往有不只一个的外生变量被遗漏，排斥在模型之外，且可能与内生解释变量相关，这意味着它们都是模型之外，且可能与内生解释变量相关，这意味着它们都是有效的工具变量。这时应该如何选取工具变量来消除内生性有效的工具变量。这时应该如何选取工具变量来消除内生性呢？泰尔呢？泰尔 (H. Theil，1953)、贝斯曼、贝斯曼(R. L. Basm

47、ann，1957)分别分别提出用提出用两阶段最小二乘法两阶段最小二乘法（Two Stage Least Square，TSLS）来处理此类问题。本节只讨论单个内生解释变量的来处理此类问题。本节只讨论单个内生解释变量的TSLS。二、二、两阶段最小二乘法两阶段最小二乘法那么，如何选择那么，如何选择“最好最好”的工具变量呢？的工具变量呢？与与y2的相关关系越强的变量，作为的相关关系越强的变量，作为y2的工具变量越合适，所的工具变量越合适，所以将以将y2表述为：表述为：其中，其中，y1是被解释变量，是被解释变量，x1是是外生解释变量外生解释变量（Exogenous Variables），），y2是内生

48、解释变量。对该方程我们感兴趣的是是内生解释变量。对该方程我们感兴趣的是系数系数，所以可以称为，所以可以称为结构方程结构方程（Structural Equation）。）。如果存在两个外生变量如果存在两个外生变量z1、z2，与，与u不相关，与不相关，与y2相关，则相关，则z1与与z2都可以作为都可以作为y2的工具变量。而且，既然的工具变量。而且，既然x1、z1、z2均与均与u不相关，那么其任何线性组合也与不相关，那么其任何线性组合也与u不相关，即不相关，即x1、z1、z2的的任意线性组合都可以作为任意线性组合都可以作为y2的工具变量。的工具变量。假设有二元回归模型：假设有二元回归模型：101 1

49、22yxyui201 12 132yxzzv（6.32）即用内生变量对所有的外生变量和工具变量构造回归模型，即用内生变量对所有的外生变量和工具变量构造回归模型，对应于最初的结构方程，该方程我们称之为对应于最初的结构方程，该方程我们称之为简化方程简化方程（Reduced Equation）。）。23121102112),|(zzxzzxyE即是我们要得到的工具变量。即是我们要得到的工具变量。注意注意：为避免：为避免产生多重共线性，这里要求模型产生多重共线性，这里要求模型(6.32)中中至少有一个不是至少有一个不是0。32和实际应用中实际应用中，直接用，直接用y2对所有的外生解释变量和工具变量

50、进对所有的外生解释变量和工具变量进行回归，得到的行回归，得到的y2的拟合值的拟合值201 12132 yxzz作为作为y2的工具变量。的工具变量。对对的检验可以直接利用的检验可以直接利用F检验来完成。检验来完成。0032或接下来便可以利用接下来便可以利用作为作为y2的工具变量进行的工具变量进行OLS估计。这估计。这就是就是两阶段最小二乘法两阶段最小二乘法（Two Stage Least Square，TSLS）。）。顾名思义，所谓的顾名思义，所谓的TSLS即是即是分两个阶段估计模型分两个阶段估计模型，即，即2 y第一阶段：利用内生解释变量第一阶段：利用内生解释变量y2对所有外生解释变量和工

51、具对所有外生解释变量和工具变量做回归，得到其拟合值变量做回归，得到其拟合值 .2 y第二阶段：将第二阶段：将作为作为y2的工具变量继续做回归，得到最终的工具变量继续做回归，得到最终的回归模型。的回归模型。2 y其中，其中，wage表示小时工资，表示小时工资，educ表示受教育情况，是内生表示受教育情况，是内生解释变量，解释变量，exper表示实际工作经验，是外生解释变量，表示实际工作经验，是外生解释变量，u与与exper和和 exper2均不相关。假定我们还认为母亲的受教育情均不相关。假定我们还认为母亲的受教育情况（况（meduc）和父亲的受教育情况（）和父亲的受教育情况（feduc）与）与

52、u不相关。那不相关。那么我们可以将它们都用作内生解释变量么我们可以将它们都用作内生解释变量educ的工具变量。的工具变量。educ的简化方程可写为：的简化方程可写为：例例64建立回归模型考查工资和受教育情况、实际工建立回归模型考查工资和受教育情况、实际工作经验之间的关系，利用作经验之间的关系，利用TSLS对模型进行回归分析。设原对模型进行回归分析。设原始模型为：始模型为：20123log(),wageeducexperexperu（6.34） 201234,educexperexpermeducfeducv（6.35）利用利用Eviews对该模型做回归，首先建立工作文件，将数据录对该模型做回

53、归，首先建立工作文件，将数据录入。点击入。点击Quick / Estimate Equation，在出现的窗口中，在出现的窗口中“Estimation Settings / Method”选择选择“TSLS-Two-Stage Least Square(TSNLS and ARMA)”，在，在“Equation Specification”栏中输入方程形式栏中输入方程形式“log(wage) c educ exper exper2”，“Instrument List”栏中输入栏中输入“c exper exper2 meduc feduc”，（图（图6-2）。）。表表6-7 EViews输出结果

54、输出结果点击点击OK，输出结果如表，输出结果如表6-7所示。所示。Method: Two-Stage Least Squares Included observations: 428 after adjustments Instrument list: C EXPER EXPER2 MEDUC FEDUC VariableCoefficientStd. Error t-Statistic Prob. C0.0481000.4003280.120152 0.9044 EDUC0.0613970.0314371.953024 0.0515 EXPER0.0441700.0134323.288329

55、 0.0011 EXPER2-0.0008990.000402 -2.237993 0.0257 R-squared0.135708 Mean dependent var1.190173 Adjusted R-squared0.129593 S.D. dependent var0.723198 S.E. of regression0.674712 Sum squared resid193.0200 F-statistic8.140709 Durbin-Watson stat1.945659 Prob(F-statistic)0.000028 Second-Stage SSR212.2096所估

56、计的教育情况所估计的教育情况educ回归系数为回归系数为0.0614，意味着其他条件，意味着其他条件不变的前提下，每多接受一年教育工资平均地增加不变的前提下，每多接受一年教育工资平均地增加6.14%。由于它相对大的标准误，在对应着双侧对立假设的由于它相对大的标准误，在对应着双侧对立假设的0.05的显的显著水平上，著水平上，TSLS估计值几乎不显著。估计值几乎不显著。注意注意：如果回归模型中存在多个内生解释变量，那么对每个：如果回归模型中存在多个内生解释变量，那么对每个内生解释变量都要寻找工具变量。这涉及到模型的识别问题。内生解释变量都要寻找工具变量。这涉及到模型的识别问题。关于这个问题，可以参

57、考本书第十一章联立方程模型的有关关于这个问题，可以参考本书第十一章联立方程模型的有关内容。内容。对应的回归方程为：对应的回归方程为：2log()0.0481 0.06140.0441.0009 (0.4003) (0.0314) (0.0134) (0.0004) 428, 0.1357.2wageeducexperexpernR在美国，每年大约有在美国，每年大约有40000例高速公路交通死亡事故，其中例高速公路交通死亡事故，其中大约大约1/3的致命性交通事故涉及司机醉酒驾车，而且这个比的致命性交通事故涉及司机醉酒驾车，而且这个比例在饮酒高峰期会上升。例在饮酒高峰期会上升。由此可见，劝阻醉酒驾

58、车似乎可以有效减少交通死亡事故的由此可见，劝阻醉酒驾车似乎可以有效减少交通死亡事故的发生。所以很多美国州政府试图通过提高啤酒税的经济方法发生。所以很多美国州政府试图通过提高啤酒税的经济方法来劝阻司机醉酒驾车，进而减少交通死亡事故的发生。那么来劝阻司机醉酒驾车，进而减少交通死亡事故的发生。那么这项措施到底是否有效呢？斯托克收集了这项措施到底是否有效呢？斯托克收集了48个州（个体），个州（个体），从从1982年到年到1988年间的相关样本数据，利用这些数据对该措年间的相关样本数据，利用这些数据对该措施的有效性进行验证分析。施的有效性进行验证分析。我们通过斯托克、沃森（我们通过斯托克、沃森（Stoc

59、k & Watson）在）在计量经济学计量经济学（第三版）（第三版）教材中引用的一个有关交通事故死亡率和啤酒教材中引用的一个有关交通事故死亡率和啤酒税的案例，说明税的案例，说明差分回归差分回归（或者称为（或者称为“前后比较前后比较”）的基本思）的基本思路。路。三、差分回归法三、差分回归法先利用先利用OLS对该问题进行分析。选取交通事故死亡率（每万对该问题进行分析。选取交通事故死亡率（每万人的死亡人数）和啤酒税（以人的死亡人数）和啤酒税（以1988年美元价格计算的每箱啤年美元价格计算的每箱啤酒的实际啤酒税）作为回归分析的被解释变量和解释变量。酒的实际啤酒税）作为回归分析的被解释变量和解释变量。首

60、先，利用首先，利用1982年年48个州的横截面数据进行分析，得到回归个州的横截面数据进行分析，得到回归方程和散点图如下：方程和散点图如下：2.010.15(6.36)(0.15)(0.13)(13.4)(1.15)FatalityRateBeerTaxset可见，可见，啤酒税的斜率系数为正啤酒税的斜率系数为正，但在，但在0.1的显著性水平下的显著性水平下不显著不显著。回归方程（回归方程（6.37）中啤酒税的）中啤酒税的系数为正系数为正，且在且在0.01的水平下的水平下统计显著统计显著。然后，与此类似，根据然后，与此类似，根据1988年（其它年份也可以）的年（其它年份也可以）的48个州个州的横截

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第6章内生解释变量

文档简介

温馨提示

最新文档

评论

第6章 内生解释变量

文档简介

温馨提示

最新文档

评论

相关文档

第6章内生解释变量