第九章设定误差与测量误差_第1页
第九章设定误差与测量误差_第2页
第九章设定误差与测量误差_第3页
第九章设定误差与测量误差_第4页
第九章设定误差与测量误差_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 2 西方国家盛行西方国家盛行“Occams razor”Occams razor”原则,意思是原则,意思是“简简 单优于复杂单优于复杂”的节约性原则。在建立模型中一定的抽象和简的节约性原则。在建立模型中一定的抽象和简 化是不可避免的。化是不可避免的。 例如例如, ,在研究进口在研究进口(IM)(IM) 与国内生产总值与国内生产总值(GDP)(GDP) 的关系时,如果考虑的关系时,如果考虑 汇率汇率(EX)(EX)因素,建立因素,建立 并估计了模型(并估计了模型(1 1) 引子:引子: 简单一定胜于复杂吗简单一定胜于复杂吗? ? (1 1) 3 如果根据如果根据“简单优于复简单优于复 杂杂”

2、的原则的原则省略一些变省略一些变 量,得到模型(量,得到模型(2)的)的 结果结果: 比较:比较:两个模型的两个模型的t t和和F F检验结果都比较理想检验结果都比较理想 模型(模型(2 2)GDPGDP的的t t值值27.7227.72优于模型(优于模型(1 1)的)的7.727.72 模型模型(1)(1)较复杂较复杂, ,模型(模型(2 2)更为简洁)更为简洁 能否根据能否根据“Occams razorOccams razor”原则,判断模型(原则,判断模型(2 2)比模)比模 型(型(1 1)更好呢?)更好呢? 这是对模型设定的判断问题。这是对模型设定的判断问题。 4 对模型的设定是计量

3、经济研究的重要环节。对模型的设定是计量经济研究的重要环节。 前面各章除了对随机扰动项前面各章除了对随机扰动项 ui 的基本假定以外,还强调的基本假定以外,还强调: 假定模型对变量及函数形式的设定正确地描述了被解释假定模型对变量及函数形式的设定正确地描述了被解释 变量与解释变量之间的真实关系,假定模型中的变量没有变量与解释变量之间的真实关系,假定模型中的变量没有 测量误差。测量误差。 但是在实际的建模实践中,对模型的设定不一定能够完但是在实际的建模实践中,对模型的设定不一定能够完 全满足这样的要求,从而会使模型出现设定误差。全满足这样的要求,从而会使模型出现设定误差。 5 本章主要讨论三个问题本

4、章主要讨论三个问题: : 什么是设定误差什么是设定误差 设定误差及类型设定误差及类型 变量设定误差的后果变量设定误差的后果 设定误差的检验设定误差的检验 设定误差的设定误差的DW检验检验 拉格朗日乘数(拉格朗日乘数(LM)检验)检验 一般性检验(一般性检验(RESET检验)检验) 函数形式设定误差的检验函数形式设定误差的检验 测量误差测量误差 变量测量误差产生的后果变量测量误差产生的后果 测量误差的检验方法测量误差的检验方法 6 第一节 设定误差 一、设定误差及类型一、设定误差及类型 如果对计量模型的各种诊断或检验总是不能令人满意,这如果对计量模型的各种诊断或检验总是不能令人满意,这 时应考虑

5、模型设定是否有问题:时应考虑模型设定是否有问题: 考虑所建模型是否遗漏了重要的变量?考虑所建模型是否遗漏了重要的变量? 是否包含了多余的变量?是否包含了多余的变量? 所选模型的函数形式是否正确?所选模型的函数形式是否正确? 被解释变量和解释变量的被解释变量和解释变量的数据数据是否有是否有测量误差测量误差? 对随机误差项是否有不正确的设定对随机误差项是否有不正确的设定(是否符合基本假定是否符合基本假定)? 所有这些,计量经济学中可以统称为模型的设定误差。所有这些,计量经济学中可以统称为模型的设定误差。 本讲主要讨论本讲主要讨论变量设定误差变量设定误差和和测量误差测量误差 7 1. 相关变量的遗漏

6、相关变量的遗漏(Omitting Relevant Variables) 最常见的设定误差如相关变量遗漏和无关变量误选最常见的设定误差如相关变量遗漏和无关变量误选 例如,如果例如,如果“正确正确”的模型为的模型为 12233iiii YXXu 而我们将模型设定为而我们将模型设定为 即设定模型时漏掉了一个相关的解释变量即设定模型时漏掉了一个相关的解释变量 。 这类错误称为这类错误称为遗漏相关变量(遗漏相关变量(“欠拟合欠拟合”)。 3i X 122iii YXv 8 2. 2. 无关变量的误选无关变量的误选 (Including Irrevelant Variables)(Including I

7、rrevelant Variables) 12233iiii YXXu 1223344iiiii XXYX 即设定模型时,多选了无关解释变量即设定模型时,多选了无关解释变量 。这类错误。这类错误 称为称为无关变量的误选(无关变量的误选(“过拟合过拟合”)。 但我们却将模型设定为但我们却将模型设定为 例如例如,如果,如果“真实模型真实模型”为:为: 4i X 9 事先并不知道模型中应当包含哪些变量,事先并不知道模型中应当包含哪些变量,变量的选取变量的选取 实际上有一定盲目性和主观性。实际上有一定盲目性和主观性。 虽然知道应该包含哪些变量,但由于有的虽然知道应该包含哪些变量,但由于有的数据很难取数

8、据很难取 得得,而被迫将具有重要经济意义的变量排斥在模型之外。,而被迫将具有重要经济意义的变量排斥在模型之外。 事先并不知道变量间确切的事先并不知道变量间确切的函数形式函数形式,而在回归模型,而在回归模型 中采用了主观想象的函数形式。中采用了主观想象的函数形式。 在多重共线性等模型检验中可能在多重共线性等模型检验中可能删除了重要变量删除了重要变量。 因为事先并不知道所研究的真实模型究竟是什么,设定误因为事先并不知道所研究的真实模型究竟是什么,设定误 差在建模中比较容易出现。差在建模中比较容易出现。 设定误差的存在可能会对模型形成不良的后果。设定误差的存在可能会对模型形成不良的后果。 设定误差的

9、原因设定误差的原因 10 二、变量设定误差产生的后果二、变量设定误差产生的后果 当模型设定出现误差时,模型的估计结果与当模型设定出现误差时,模型的估计结果与“真实真实”情情 况可能会出现偏误;况可能会出现偏误; 这种由模型设定带来偏误的性质与偏误的程度这种由模型设定带来偏误的性质与偏误的程度, ,同模型同模型 设定误差的类型密切相关设定误差的类型密切相关 实质实质: 从实质上看,变量设定误差的主要后果,是会使从实质上看,变量设定误差的主要后果,是会使 得得一个或多个解释变量与随机扰动项之间存在相关性一个或多个解释变量与随机扰动项之间存在相关性, 或者或者导致随机扰动项呈现某种规律性变化(如异方

10、差或导致随机扰动项呈现某种规律性变化(如异方差或 自相关)自相关),进而违反基本假定,影响参数估计的统计特,进而违反基本假定,影响参数估计的统计特 性。性。 (1 1)遗漏相关变量(欠拟合)偏误)遗漏相关变量(欠拟合)偏误 12233iiiii YXXu 设正确的模型为:设正确的模型为: 如果遗漏如果遗漏 却对:却对:进行回归进行回归,得到得到 122iii YX 正确模型离差形式为正确模型离差形式为2 23 3 () iiii yxxuu 23223 22323 222 222 () iiiiii iii x xxuux x EE xxx 是否真实参数的合理估计呢?是否真实参数的合理估计呢?

11、小样本时小样本时取期望取期望 12233i YXXu 则有则有 (见见P245,9.5式式) 2232 223 222 222 () iiiii iii i xx xxuu xxx y 3i X 2 232 223 22 , lim iiii n ii Cov XXCov Xu p Var XVar X 大样本时大样本时,两边取概率极限,有,两边取概率极限,有 (证明见附录证明见附录9.1) 可以看出,可以看出, 的遗漏将可能产生如下后果:的遗漏将可能产生如下后果: 1)如果漏掉的)如果漏掉的 与与 相关相关,即,即 在小样本下在小样本下 的期望的期望 可以证明可以证明, 此时此时 其中其中

12、是是 对对 回归的斜率系数回归的斜率系数 除非除非 或或 为为0,否则否则 就是有偏的。就是有偏的。 2211 ()()EE,同理 23 0 ii x x 223 32 ()Eb 3i X 3i X 3i X 2i X 2i X 32 b 32 b 3 2 2 23 223 2 2 ii i x x E x 23 32 2 2 ii i x x b x 注意到注意到: 在大样本下在大样本下 求求 的概率极限的概率极限 结论结论:若是遗漏的:若是遗漏的 与与 相关,相关,OLS估计量在估计量在小样本小样本 下有偏,在大样本下非一致下有偏,在大样本下非一致。 2211 lim()lim() nn

13、pp ,同理 直观理解:直观理解:“本来应归于本来应归于 的影响,因未列入的影响,因未列入 , 部分影响被包含在部分影响被包含在 中了中了。 3i X 3i X 2 232 223 22 , lim iiii n ii Cov XXCov Xu p Var XVar X 此时:此时: 23 ,0 ii Cov XX若若 与与 相关相关 3i X 2i X 2 3i X 2i X (见(见P258附附 录录9.1证明)证明) (见(见P258附附 录录9.2证明)证明) 14 2)如果遗漏的如果遗漏的X3与与X2不相关不相关,即,即 则此时则此时 ,斜率系数的估计,斜率系数的估计 满足满足无偏性

14、与一致性,无偏性与一致性, 但可以证明但可以证明: 这时这时截距项截距项的估计的估计 却是却是有偏有偏的的 即即 23 0 ii x x 2 1 3 X 22 vu E 3) 遗漏变量遗漏变量 的回归的回归 中的随机扰动项中的随机扰动项 的方差的方差 的估计量的估计量 ,对正确模型随机对正确模型随机 扰动项扰动项 的方差的方差 的估计的估计 是有偏的是有偏的,因为,因为 122iii YXv 其中其中 则则 22 (2)(3) uvvu RRSSSnnS i u 23 223 2 2 ii i x x E x 22 E ,(2)(3) vu RSSRSSnn 2 u i v 11 () E (

15、 ) i Var v 2 (2) vv RSSn 2 (3) uu RSSn 15 2 2 4) 的方差是的方差是 方差的有偏估计方差的有偏估计: 由 得 由正确模型 可得到 2 2 2 2 () i v Var x 2 2 32 2222 2322323 222 23 2 ()() ) 1 ( i u u iiiiii i ii x x xxxx Va x x xx r 如果如果X3与与X2相关,相关, , ,显然有显然有 22 )()VVarar 即使即使X3与与X2不相关,由于不相关,由于 也有也有 22 )()VVarar 22 3 2 22 (1) i u xr 22 u v 2 2

16、3 0r (见第二章的讨论)(见第二章的讨论) (见第三、四章的讨论)(见第三、四章的讨论) 12233iiii YXXu 122iii YXv 16 5 5)由于对方差的估计有偏由于对方差的估计有偏, ,与方差相关的其他估计与方差相关的其他估计 和检验和检验,包括区间估计、假设检验等,都,包括区间估计、假设检验等,都容易导出错容易导出错 误的结论。误的结论。 结论结论: 一旦根据相关理论把模型建立起来,再从中遗漏一旦根据相关理论把模型建立起来,再从中遗漏 变量需要充分地谨慎。变量需要充分地谨慎。 模型中包括了不重要的解释变量,即采用误选了无关解释模型中包括了不重要的解释变量,即采用误选了无关

17、解释 变量的模型,也会带来的偏误,称为包含无关变量的偏误变量的模型,也会带来的偏误,称为包含无关变量的偏误 设设正确模型正确模型: (1) 离差形式为离差形式为 包含无关变量的包含无关变量的模型模型: (2) 2.包含无关变量的偏误包含无关变量的偏误 122iii YXu 22331iiii XYXv 2 2 () iii yxuu 2 23323 2 222 2323 () iiiiiii iiii x yxx yx x xxx x 采用采用OLS法对模型(法对模型(2)进行估计,有:)进行估计,有: (见第三章的讨论)(见第三章的讨论) 2 23323 2 222 2323 () iiii

18、iii iiii x yxx yx x xxx x 将(将(1)式的离差形式)式的离差形式 2 2 () iii yxuu代入,容易推导得:代入,容易推导得: 2 32233 22 222 2323 ()() ()() () iiiiiii iiii xx uux xx uu xxx x 对于对于 1) 可以证明,包括无关变量的(可以证明,包括无关变量的(2)式参数的)式参数的OLS估计量是估计量是 无偏,且具有一致性无偏,且具有一致性。即:。即: 2222 ()lim n Ep 1111 3333 ()lim 0()m0li n n Ep Ep 同理,可证明:同理,可证明: (证明见附录(证

19、明见附录9.2) 是无关变量是无关变量 3i X 2 包括无关变量后包括无关变量后 的方差可能增大的方差可能增大 ( 的的方差可能比正确模型参数估计值方差可能比正确模型参数估计值 的方差大的方差大) 3)但但 2 22 2 2 3 2 () 1 (1 () ) v u V rr a a V r ;此结论对;此结论对 1 也成立也成立 2 2 2 2 () u i Var x 则则 通常通常 2 23 01r则可能则可能 22 )()VVarar 正确模型的方差为正确模型的方差为 2 2 2 22 223 () (1) v i Var xr (见教材第四章(见教材第四章P110证明)证明) 包括

20、无关变量模型中的方差为包括无关变量模型中的方差为 2 2) ,随机误差项方差的估计也是随机误差项方差的估计也是无偏估计。无偏估计。 22 v u E 22 v u E 注意到此时注意到此时 4 4) 由由 ,包含无关变量包含无关变量 将使得将使得 的方的方 差比不包含无关变量时增大差比不包含无关变量时增大, ,从而从而接受错误假设的概率可能会接受错误假设的概率可能会 较高。较高。 2 3 X 22 )()VVarar 21 遗漏相关变量遗漏相关变量误选无关变量误选无关变量 参数参数 估计估计 量量 X3与与X2不相关不相关 无偏性、一致性无偏性、一致性 但但 有偏有偏 具无偏性、一致性具无偏性

21、、一致性 X3与与X2 相关相关 小样本小样本有偏有偏无偏性无偏性 大样本大样本非一致非一致一致性一致性 参数估计的方差参数估计的方差方差为有偏估计方差为有偏估计方差有偏且会增大方差有偏且会增大 不是有效估计量不是有效估计量 22 ()()VarVar 22 ()E 22 ()()VarVar 总结总结:遗漏相关变量和误选无关变量的比较遗漏相关变量和误选无关变量的比较 通常情况下,误选无关变量不如遗漏相关变量的后果严重。通常情况下,误选无关变量不如遗漏相关变量的后果严重。 若注重估计量的无偏性、一致性时若注重估计量的无偏性、一致性时 宁愿误选无关变量也不愿遗漏相关变量;宁愿误选无关变量也不愿遗

22、漏相关变量; 若注重估计量的有效性时若注重估计量的有效性时一般不愿误选无关变量。一般不愿误选无关变量。 22 ()E 11 ()E 1 2 11 ()E 22 ()E 22 均方误差均方误差(MSE)原则原则 为了在无偏性和有效性间权衡,可采用均方误差准则为了在无偏性和有效性间权衡,可采用均方误差准则 均方误差均方误差为参数估计值与参数真实值之差平方的期望为参数估计值与参数真实值之差平方的期望: 容易证明容易证明 当无法找到无偏估计和最小方差估计,需要在当无法找到无偏估计和最小方差估计,需要在“较小偏较小偏 倚倚”和和“较小方差较小方差”间权衡时,均方误差是可供选择的间权衡时,均方误差是可供选

23、择的 准则。准则。 *2 ()()MSEE *2*2*2 ()() ()EEEE 方差方差 偏倚的平方偏倚的平方 均方误差均方误差 模型的设定实际是对无偏性与有效性进行权衡,偏模型的设定实际是对无偏性与有效性进行权衡,偏 爱哪一方取决于模型的研究目的。爱哪一方取决于模型的研究目的。 23 第二节第二节 设定误差的检验设定误差的检验 对变量设定误差进行检验必须在经济理论指导下对变量设定误差进行检验必须在经济理论指导下 进行,不可抛弃经济理论而进行假设检验。进行,不可抛弃经济理论而进行假设检验。 对于是否误选无关变量的检验对于是否误选无关变量的检验:通过:通过OLSOLS估计,估计, 对可疑变量参

24、数的显著性进行检验。单个变量可用对可疑变量参数的显著性进行检验。单个变量可用t t 检验检验,多个变量可用,多个变量可用F F检验检验作联合检验。作联合检验。(不再讲(不再讲) ) 对于遗漏变量设定误差的检验:对于遗漏变量设定误差的检验:有多种方法,例有多种方法,例 如如DWDW检验、拉格朗日乘数检验、检验、拉格朗日乘数检验、RESET RESET 一般性检验等。一般性检验等。 这里只讨论这里只讨论遗漏变量遗漏变量设定误差的最常用的检验方法。设定误差的最常用的检验方法。 24 基本思想:基本思想:遗漏的相关变量会包含在随机扰动项中,遗漏的相关变量会包含在随机扰动项中, 即即 ,那么回归所得的残

25、差序列就会随,那么回归所得的残差序列就会随 的的 增大而增大,增大而增大,呈现正的相关性呈现正的相关性,因此可从是否有正自相,因此可从是否有正自相 关性的角度检验相关变量的遗漏。关性的角度检验相关变量的遗漏。 从遗漏变量的模型看,可以认为遗漏变量模型是无遗漏从遗漏变量的模型看,可以认为遗漏变量模型是无遗漏 变量模型在被遗漏变量的系数变量模型在被遗漏变量的系数 为为0 0时的特例:时的特例: 即即 无遗漏变量模型无遗漏变量模型无约束模型无约束模型 遗漏变量模型遗漏变量模型受约束模型受约束模型(约束为(约束为 ) 一、检验一、检验遗漏变量的遗漏变量的DW检验检验 正确的模型正确的模型 遗漏变量遗漏

26、变量 的模型的模型 3i X 3 3 0 33iii vuX (无约束)(无约束) (受约束)(受约束) 22331iiii XYXu 122iii YX 3i X 25 i e 0 H : 1 H: i e i e , 22 1 21 () nn iii ii deee , 检验前提:检验前提:按遗漏解释变量的递增次序对残差序列按遗漏解释变量的递增次序对残差序列进行排序进行排序 用排序后的残差序列用排序后的残差序列计算计算 d 统计量:统计量: 2)设定)设定 无遗漏变量无遗漏变量(受约束回归模型受约束回归模型合理,无正自相关)合理,无正自相关) 1)对回归模型运用)对回归模型运用OLS法得

27、残差序列法得残差序列 检验遗漏变量的检验遗漏变量的D DW检验的具体步骤检验的具体步骤 3 3查查Durbin-WatsonDurbin-Watson表,若表,若d d 统计量显示存在正自相关,则拒统计量显示存在正自相关,则拒 绝无遗漏变量的原假设,表明存在遗漏变量设定误差。绝无遗漏变量的原假设,表明存在遗漏变量设定误差。 否则若否则若d d 统计量显示不存在正自相关,接受无遗漏变量的原假设统计量显示不存在正自相关,接受无遗漏变量的原假设 ,受约束回归模型合理,模型不存在,受约束回归模型合理,模型不存在遗漏变量的遗漏变量的设定误差。设定误差。 i e 有遗漏变量(无约束回归模型合理,有正自相关

28、)有遗漏变量(无约束回归模型合理,有正自相关) 26 注意注意:检验遗漏变量的检验遗漏变量的DW检验的特点检验的特点 1.“检验遗漏变量的检验遗漏变量的DW检验检验”与与”检验自相关的检验自相关的DW检验检验” 的原假设不同的原假设不同 2.检验遗漏变量的检验遗漏变量的DW检验一般不能直接用回归结果的检验一般不能直接用回归结果的 DW统计量,只有确认了统计量,只有确认了前提:遗漏变量已按递增次序前提:遗漏变量已按递增次序 排列排列,才能直接使用,才能直接使用DW统计量。统计量。 3.如果遗漏变量没有按递增次序排列,则必须用遗漏变如果遗漏变量没有按递增次序排列,则必须用遗漏变 量按递增次序排列后

29、的残差重新计算量按递增次序排列后的残差重新计算DW统计量。统计量。 0 H :无遗漏变量(受约束回归合理) 1 H:有遗漏变量(无约束回归合理) 0 H: =0 1 H:0 检验遗漏变量检验遗漏变量 检验自相关检验自相关 27 23 12341 1 iiiii YXXXu 2 1232 2 iiii YXXu 123 3 iii YXu 为设定总生产成本为设定总生产成本Y与产出与产出X的总体回归函数,准的总体回归函数,准 备使用如下的三个备选模型:备使用如下的三个备选模型: 如果其中只有(如果其中只有(1)为真实模型,试用)为真实模型,试用DW法检验模法检验模 型设定误差。型设定误差。 举例举

30、例 28 序号产出(X)总成本(Y) 1 1193 2 2226 3 3240 4 4244 5 5257 6 6260 7 7274 8 8297 9 9350 1010420 假设的样本数据假设的样本数据 29 三个模型分别代入数据回归:三个模型分别代入数据回归: (1) 23 22 141.76763.48712.9620.939 (6.375) (4.778) (0.9856)(0.0592) (22.238) (13.285) ( 13.151)(15.861) 0.99830.99752.70 iiii YXX X se t R R D W 2 22 222.3838.02502.

31、542 (23.488) (9.809) (0.869) (9.468)(-0.818) (2.925) 0.92840.90791.038 iii YXX se t R R W D (2) 22 166.46719.933 (19.201) (3.066) (8.752 0.8409 ) (6.502) 0.82100.716 ii YX se t RRDW (3) 30 本例中遗漏变量本例中遗漏变量已按递增次序排列已按递增次序排列了,此时的了,此时的DW值等值等 于于 d 值,无需重新计算值,无需重新计算 d 统计量。统计量。 对上述模型的对上述模型的DW统计量的分析及查表情况如下:统计量

32、的分析及查表情况如下: 1、模型、模型(1): 有有 DW=2.70,当,当 n=10、k=3、=5% 时时dL=0.525, dU=2.016,不能表明存在显著的正相关,不能表明存在显著的正相关 关系,接受关系,接受H0,表示没有遗漏的变量。,表示没有遗漏的变量。 (注意注意:遗漏变量遗漏变量按递增次序,按递增次序,只看是否有正自相关只看是否有正自相关) 问题:问题:本例并不好本例并不好, 样本太小,严格说不适合用样本太小,严格说不适合用DW检验,检验, 这里只是个示例这里只是个示例 31 2、模型、模型(2):有:有 DW=1.038,当当 n=10,k=2, =5%时时 dL=0.697

33、, dU=1.641。显然有。显然有 0.6971.038 (约束个数约束个数),则,则 拒绝拒绝H0,认为受约束模型不成立,存在遗漏变量,认为受约束模型不成立,存在遗漏变量 ; 否则,接受否则,接受H0,认为受约束模型成立,无遗漏变量。,认为受约束模型成立,无遗漏变量。 (注意:(注意:EView 中不能用检验自相关的中不能用检验自相关的residual tests去检验)去检验) 具体步骤:具体步骤: 2 2 12233iiikkii eXXXL 三、拉姆齐一般性检验(三、拉姆齐一般性检验(RESET检验)检验) (regression specification error test回归

34、设定误差检验回归设定误差检验) 基本思想:基本思想:这是拉姆齐提出的方法这是拉姆齐提出的方法 如果事先已知道遗漏了哪个变量(如如果事先已知道遗漏了哪个变量(如 ),只需将),只需将 引入模型,并检验其显著性即可。引入模型,并检验其显著性即可。 但往往事先并但往往事先并不知道遗漏了哪个变量不知道遗漏了哪个变量,可考虑寻求被,可考虑寻求被 遗漏变量的某些可能的替代变量遗漏变量的某些可能的替代变量 Z Z 去检验其显著性。去检验其显著性。 怎样选替代变量呢?拉姆齐的怎样选替代变量呢?拉姆齐的RESETRESET检验采用遗漏了变检验采用遗漏了变 量模型所估计的量模型所估计的 的若干次幂作为遗漏变量的的

35、若干次幂作为遗漏变量的“替替 代代”变量。变量。(可能有多个变量被遗漏)(可能有多个变量被遗漏) 以遗漏变量模型为受约束模型,以加入替代变量的模以遗漏变量模型为受约束模型,以加入替代变量的模 型为无约束模型,用增加解释变量的型为无约束模型,用增加解释变量的F F检验,去判断应检验,去判断应 否增加否增加“替代替代”变量。变量。 3i X 3i X i Y 具体作法:具体作法: 1)估计被遗漏变量的模型,如)估计被遗漏变量的模型,如 2)计算被解释变量的估计值)计算被解释变量的估计值 和残差和残差 3)用图形法等判断)用图形法等判断 和和 可能的的函数关系,决定引可能的的函数关系,决定引 入入

36、的多少次幂作为的多少次幂作为“替代替代”变量变量(一般常用平方、三一般常用平方、三 次、四次方即可次、四次方即可) 4)在被遗漏变量的模型中增加包含)在被遗漏变量的模型中增加包含j个个 的若干次幂的的若干次幂的 线性组合,通常采用(例如线性组合,通常采用(例如 j=3 ) 122iikkii YXXu i Yi e i e i Y i Y 234 123122 iiiikkiii YYXXYY i Y (受约束模型)(受约束模型) (无约束模型)(无约束模型) (参数个数(参数个数 ) R kk (参数个数(参数个数 ) U kkj 回顾:回顾:受约束模型的检验 22 2 () ()() ()

37、 (,) ()(1) () RUURURUR URU UUUU RSSRSSkkRRkk FF kknk RSSnkRnk 其中其中 分别为无约束和受约束模型的可决系数。分别为无约束和受约束模型的可决系数。 22 , UR RR 无约束模型中包含无约束模型中包含 个未知参数;受约束模型中包含个未知参数;受约束模型中包含 个未知个未知 参数,未包含的参数个数(约束去除的变量个数)为参数,未包含的参数个数(约束去除的变量个数)为 。 在在RESETRESET检验中检验中:受约束模型中参数个数为受约束模型中参数个数为 无约束模型中参数个数为无约束模型中参数个数为 约束变量个数(约束变量个数(加入替代

38、变量的个数)加入替代变量的个数) 无约束模型无约束模型RSSRSSU U的自由度为的自由度为 U k R k UR kk 用剩余平方和用剩余平方和RSS是否有显著差异来检验施加约束的合理性,是否有显著差异来检验施加约束的合理性, 可检验可检验 是否比是否比 充分地小,作充分地小,作 F 检验检验 : U kkj R kk UR kkj () U nknkj () RU RSSRSS U RSS 37 5)提出)提出 ,构造统计量(如,构造统计量(如j=3) 其中:其中: 和和 分别为对加入替代变量后模型分别为对加入替代变量后模型(无约束模(无约束模 型)型)回归的回归的残差平方和残差平方和与与

39、可决系数可决系数, 和和 分别为分别为 成立时,对遗漏成立时,对遗漏 变量模型变量模型(受约束模型)(受约束模型)回归的回归的残差平方和残差平方和与与可决系数可决系数。 6)若)若F统计量大于统计量大于F临界值,拒绝临界值,拒绝 则表明存在遗漏变量。则表明存在遗漏变量。 若若F统计量小于统计量小于F临界值,不拒绝临界值,不拒绝 则表明不存在遗漏变量。则表明不存在遗漏变量。 0 :0,(1,2,3) i Hi 22 2 ()/()/ ( ,() /()(1)/() RUUR UU RSSRSSjRRj FF j nkj RSSnkjRnkj U RSS 2 U R R RSS 2 R R 0 :

40、0,(1,2,3) j Hj 0 :0,(1,2,3) j Hj n为样本容量;为样本容量;k为遗漏变量模型的参数个数;为遗漏变量模型的参数个数;J为加入替代变量的个数为加入替代变量的个数 0 :0,(1,2,3) j Hj 38 例如:例如:总生产成本函数总生产成本函数 2 166.467 19.933 (8.752) (6.502)0.8409 ii YX tR 计算被解释变量的估计值计算被解释变量的估计值 并生成新变量并生成新变量 、 ,作回归,作回归 得得 i Y 2 i Y 3 i Y 3 2 2 2140.7723476.6557-0.091870.000119 (132.0044

41、) (33.3951)( 0.0062)(0.000007 4) 0 .9983 iiii YX t YY R F检验:检验: 0.9983 0.9 ()/2 284.4035 (1)/10(22) 0.84 9 9 38 0 F 22 2 ()/ (1)/() UR U RRj F Rnkj F统计量高度显著,说明确实存在遗漏变量的设定误差。统计量高度显著,说明确实存在遗漏变量的设定误差。 估计的模型为估计的模型为 (注意本例取(注意本例取 j=2) (拉姆齐)(拉姆齐)一般性(一般性(RESET)检验的优缺点检验的优缺点 优点:优点:不要求设立具体的未遗漏变量的模型(不要求设立具体的未遗漏

42、变量的模型(用用 若若 干干 次幂替代遗漏变量次幂替代遗漏变量)。)。 可引入若干个替代变量去判断是否有多个变量被可引入若干个替代变量去判断是否有多个变量被 遗漏(所以称为一般性检验)遗漏(所以称为一般性检验) 易于运用易于运用 缺点:缺点: 只能检验有无遗漏变量的设定误差,即使检验出有遗只能检验有无遗漏变量的设定误差,即使检验出有遗 漏变量的设定误差,也无助于确定正确模型。漏变量的设定误差,也无助于确定正确模型。 某些情况下不使用某些情况下不使用: :只要被遗漏的变量的期望值是模型已只要被遗漏的变量的期望值是模型已 包括解释变量的线性函数,包括解释变量的线性函数,RESETRESET检验就无

43、法检验出变量遗检验就无法检验出变量遗 漏问题。漏问题。(见伍德里奇:(见伍德里奇:计量经济学导论计量经济学导论P272P272) i Y 四、模型函数设定形式的检验四、模型函数设定形式的检验 所谓模型函数形式的选择实际是指被解释变量条件期所谓模型函数形式的选择实际是指被解释变量条件期 望函数的设定。当选取了错误的模型函数形式并对其进行望函数的设定。当选取了错误的模型函数形式并对其进行 估计时,可能会带来偏误,这称为错误函数形式偏误。估计时,可能会带来偏误,这称为错误函数形式偏误。 模型错误的函数形式往往会模型错误的函数形式往往会引起随机扰动项的自相关引起随机扰动项的自相关。 发现模型是否有错误

44、的函数形式的简便方法发现模型是否有错误的函数形式的简便方法: 用回归的残差用回归的残差 对解释变量的较高次幂回归,然后检对解释变量的较高次幂回归,然后检 验新的残差项是否还有自相关,如果残差验新的残差项是否还有自相关,如果残差 对解释变量的对解释变量的 较高次幂回归所得到的新残差不再有自相关,则很可能原较高次幂回归所得到的新残差不再有自相关,则很可能原 模型采用了错误的函数形式。模型采用了错误的函数形式。 40 i e i e 对遗漏变量设定误差的某些检验方式,也可检验模型函数对遗漏变量设定误差的某些检验方式,也可检验模型函数 形式是否正确。形式是否正确。 例如,总生产成本例如,总生产成本Y与

45、产出与产出X关系的模型,可能分别设定为关系的模型,可能分别设定为: 可以运用可以运用DW检验、拉格朗日乘数检验、拉格朗日乘数LM检验和检验和RESET检验等检验等 方法,检验模型中的方法,检验模型中的 和和 是否被遗漏的变量,实际也就是否被遗漏的变量,实际也就 检验了其中哪种函数形式更加符合实际。检验了其中哪种函数形式更加符合实际。 其他方法:其他方法:对模型函数形式设定误差的检验,还可以采用对模型函数形式设定误差的检验,还可以采用 对非嵌套模型设定的假设检验,如戴维森对非嵌套模型设定的假设检验,如戴维森-麦金农的麦金农的J-检验检验 ,非嵌套,非嵌套F检验等。检验等。(不讲)(不讲) 41

46、3 i X 2 i X 23 1234iiiii YXXXu 2 123iiii YXXu 12iii YXu 对模型错误函数形式的其他检验方法对模型错误函数形式的其他检验方法: 42 第三节第三节 测量误差测量误差 一、模型变量的测量误差一、模型变量的测量误差 测量误差测量误差模型中变量数据不准确带来的误差模型中变量数据不准确带来的误差 包括登记误差、整理误差、其他统计误差包括登记误差、整理误差、其他统计误差 产生测量误差的原因:产生测量误差的原因:人为因素、技术因素、数据不当处理人为因素、技术因素、数据不当处理 、数据不当使用。、数据不当使用。 分为:分为:被解释变量的测量误差、解释变量的

47、测量误差被解释变量的测量误差、解释变量的测量误差 测量误差的后果:测量误差的后果: 无测量误差的模型无测量误差的模型 其中:其中: 为被解释变量的理论(真实)值;为被解释变量的理论(真实)值; 为解释变量真实值为解释变量真实值 有测量误差的观测值:有测量误差的观测值: 为为 的测量误差的测量误差 为为 的测量误差的测量误差 用用 和和 所作回归实际为所作回归实际为 (测量误差会包括在随机扰动中)(测量误差会包括在随机扰动中) * iii YXu * i Y * i X * iii YY i * iii XX i * i Y * i X () iiiii uYX * iii YY * iii X

48、X i Y i X 43 若作回归若作回归 有有 其中其中 ; 代入上式并计算代入上式并计算 概率极限得概率极限得 因为因为 ,可见存在测量误差时将,可见存在测量误差时将低估低估真实参数,真实参数, 这被称为因测量误差而导致的这被称为因测量误差而导致的OLS估计的估计的衰减偏误衰减偏误. () iiiii YXu 2 ii i x y x )( * iii yy * () iii xx * * *22 2 lim 1 i i X VarX P VarX (见P264附录9.3) 0 22 * X * *2 () i X Var X * iii YY * iii XX 44 二、测量误差的检验二

49、、测量误差的检验豪斯曼(豪斯曼(Hausman)检验)检验 基本思想:基本思想: 如果解释变量存在测量误差,且测量误差如果解释变量存在测量误差,且测量误差 已知,可已知,可 把测量误差把测量误差 作为解释变量引入模型,检验测量误差作为解释变量引入模型,检验测量误差 对被解释变量影响的显著性,以判断是否有测量误差。对被解释变量影响的显著性,以判断是否有测量误差。 怎样寻求测量误差的观测值怎样寻求测量误差的观测值? 事实上无法观测,只事实上无法观测,只 能设法去寻找其能设法去寻找其可可替代的变量替代的变量。 方法方法: :对可能存在测量误差的解释变量对可能存在测量误差的解释变量X X,选择与其相,

50、选择与其相 关且认为无测量误差的工具变量关且认为无测量误差的工具变量Z Z,将,将X X对变量对变量Z Z回归,回归, 得测量误差的估计得测量误差的估计 ,再将,再将 作为作为X X测量误差测量误差 的的 替代变量。替代变量。 i i i i 45 豪斯曼(豪斯曼(Hausman)检验方法)检验方法 对于对于 1)若认为某解释变量)若认为某解释变量Xj可能有测量误差可能有测量误差, ,选择与可能有测 选择与可能有测 量误差的解释变量量误差的解释变量Xj相关的无测量误差的工具变量相关的无测量误差的工具变量Zj 2)以可能有测量误差的解释变量)以可能有测量误差的解释变量Xj为被解释变量,以无为被解

51、释变量,以无 测量误差的变量测量误差的变量 为解释变量作回归为解释变量作回归 计算残差计算残差 作为对测量误差的估计作为对测量误差的估计 3)作回归)作回归 4) 不存在测量误差不存在测量误差 存在测量误差存在测量误差 经经 t 检验结果,若检验结果,若 显著不为显著不为0,拒绝,拒绝 ,认为存,认为存 在测量误差;在测量误差; 若不能拒绝若不能拒绝 ,认为不存在测量误差;,认为不存在测量误差; 122iikkii YXXu 122 iikkii YXXu 0 :H 1 :H 0 :H 0 :H 12 iii XZ 12 iii XZ i Z 46 问题:问题: 分析本章引子中所提出的问题:研究中国进口量的变动。分析本章引子中所提出的问题:研究中国进口量的变动。 模型应如何设定呢?模型应如何设定呢? 如果为了简化只考虑国内生产总值如果为了简化只考虑国内生产总值GDP的影响,设定的模的影响,设定的模 型为型为 其中,其中,IMt是进口总额,是进口总额,GDPt是国内生产总值。是国内生产总值。 这样的模型是否有变量设定误差?这样的模型是否有变量设定误差? 第四节第四节 案例分析案例分析 12ttt IMGDPu (1) 47 年份年份 国内生产总值国内生产总值GDP 亿元亿元 进口总额进口总额 IM 亿元亿元 100美元折合人民币美元折合人民币

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论