第5章模型设定_第1页
第5章模型设定_第2页
第5章模型设定_第3页
第5章模型设定_第4页
第5章模型设定_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第5章 模型设定计量经济学,高教出版社,2011年6月王少平、杨继生、欧阳志刚等编著2前 言n高斯马尔可夫定理:OLS估计量无偏、最优的首要条件是,模型必须正确设定。n对于一个现实的经济问题,什么样的模型才是正确设定的模型?n对于所谓设定不正确的模型,其设定偏误有什么样的具体表现?我们该如何去识别模型的设定是否存在某种偏误?n如果一个模型确实存在某种设定偏误,它对我们的分析结论又会产生什么样的影响?计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著35.1 计量经济学模型的设定偏误 n一、模型设定偏误一、模型设定偏误 n如果所建立的计量经济学模型与真实的经济关系不一致,模型

2、就出现了所谓的“设定偏误”。n对于正确设定的模型,一个最基本的信息是:其对于正确设定的模型,一个最基本的信息是:其参数估计值的符号必须与理论预期或基于现实观参数估计值的符号必须与理论预期或基于现实观察的经验预期相一致察的经验预期相一致。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著4n消费函数:Ct为消费支出,Yt表为收入n凯恩斯的绝对收入假定模型 假定边际消费倾向不变: tttYC110 考虑到边际消费倾向递减: (5.1.1)ttttYYC22210 (5.1.2)或tttYC310lnln (5.1.3)n基于预期因素的模型ttttCYC41210 (5.1.4)二

3、、模型设定偏误的类型二、模型设定偏误的类型计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著5设定偏误主要有两个来源:设定偏误主要有两个来源:n不适当的解释变量:漏掉了必要的解释变量或包含不适当的解释变量:漏掉了必要的解释变量或包含了不必要的解释变量了不必要的解释变量。 n不适当的函数形式不适当的函数形式。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著65.2 模型设定偏误的后果 一、模型拟合不足一、模型拟合不足n如果模型中漏掉了必要的解释变量,称之为模型模型拟合不足拟合不足。n若消费函数的“真实”的模型是(5.1.4),而选择了模型(5.1.1)ttt

4、YC110(5.1.1) tttC4121(5.2.1) 问题:误差并不是真正的随机误差,它包含遗漏问题:误差并不是真正的随机误差,它包含遗漏解释变量的影响解释变量的影响计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著7后果:后果: 现有解释变量系数的OLS估计量是有偏的、非一致的。 如果解释变量之间相关,会导致现有解释变量与扰动项相关,表现出内生性。影响:影响: 遗漏的解释变量对被解释变量的部分影响由现有解释变量来解释。表现:表现:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著8问题的一般化:问题的一般化:n如果“真实”的模型为:ttttXXY221

5、10(5.2.2) n却被错误地设定为:tttXY110(5.2.3) 则:)()(21211XXrfE其中: 是 和 样本相关系数 的函数。 和 有相同的符号。 =0时, =0。(5.2.4) )(21XXrf1X2X21XXr)(21XXrf21XXr21XXr)(21XXrf计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著9其他影响:其他影响:n由于拟合不足模型的误差项不是真正的随机误差项, 我们对 的估计也是错误的。2n对参数估计量方差的估计也是有偏的。n基于参数的置信区间和显著性检验很可能产生误导 性的结论。计量经济学,高教出版社2011年6月,王少平、杨继生、欧

6、阳志刚等编著10n二、模型过度拟合二、模型过度拟合 n如果模型包含了多余的解释变量,称之为模型过度模型过度拟合拟合。n如果“真实” 的消费函数模型应该是(5.1.1),但我们却选择了模型(5.1.4): ttttCYC41210(5.1.4) ttttC11124(5.2.5) t 112tC问题:估计了一个不需要估计的参数问题:估计了一个不需要估计的参数模型(5.1.4)的误差项 实际上是真正的误差项 减去 ,即:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著11具体影响:具体影响:n误差项满足经典假定,模型的参数估计量是无偏的。 n问题本质:估计了一个实际上不必估计的

7、参数 不会导致误差项与解释变量之间相关,不影响参数OLS估计量的无偏性。n拟合过度模型OLS估计量的方差会增大:多余的解释变量和模型中必要的解释变量总是存在一定的相关性,部分变化信息重复。重复信息的影响难以在解释变量间准确分解,导致系数估计精度下降。02nOLS估计量仍然是线性无偏的,但是,估计量的方差会增大,除非多余解释变量与其他解释变量的样本相关系数为0(在现实中几乎不可能出现)表现:表现:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著12n消费函数1221221)()1 ()var(YYrt(5.2.6) 12rtY1tC1221)()var(YYt(5.2.7)

8、tY1tC1tCtY1其中: 是 和 的样本相关系数。n只要 和 的样本相关系数不为0,多余解释 变量 的加入就会导致系数 估计量 方差 的增大。n在模型(5.1.4)中, 的方差为: n在模型(5.1.1)中, 的方差为: 计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著132其他影响:其他影响:n拟合不足和过度拟合在实证分析中并没有明显的优 劣差异。n由于过度拟合模型的误差项是真实的随机误差项, 我们对 的估计是正确的。相应地,参数的置信 区间和显著性检验仍然有效,但由于估计量的方差 增大,统计推断的精度会下降。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳

9、志刚等编著14n三、不正确的函数形式三、不正确的函数形式 n“真实”的消费函数是(5.1.3),但选择了模型(5.1.1)或(5.1.2)。 所估计的经济关系与现实的经济关系不一致。n模型(5.1.2)和(5.1.3)都能够反映边际消费倾向递减的特征。 “真实”模型不可知的,二者之间如何选择?n基于样本数据进行检验计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著155.3 模型误设的检验 n一、过度拟合的检验一、过度拟合的检验n对有疑问的解释变量进行显著性检验。 一个可疑变量:t检验。 多个可疑变量:F检验。n目的目的:判定过度拟合的假设是否成立,不是筛选解释变量。n显著性

10、检验不能作为模型设定时解释变量取舍的显著性检验不能作为模型设定时解释变量取舍的主要依据。主要依据。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著1613819. 04491. 05579.84tttCYC(5.3.1) 9982. 02R T28 1tCnt检验结果表明可以拒绝解释变量 的系数为0。 不存在过度拟合的问题。 n消费函数:t统计值 4.3152 5.7279 3.1316 p值 0.0002 0.0000 0.0044计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著17二、拟合不足的检验二、拟合不足的检验 n检验方法:LM检验(拉格朗日乘

11、数检验)。(拉格朗日乘数检验)。 tttYC110tttttCYYC51322100:320H:AH23(5.3.2)(5.3.3)(5.1.1)和 至少一个不为0n拟合不足进行检验的假设:消费模型备选模型计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著18nF检验的问题:检验的问题:无约束模型的误差项是经典误差项且满足正态性假定,有限样本中不一定能够满足。n大样本的检验统计量大样本的检验统计量LM检验统计量。检验统计量。t 1tttttCYY1322101(5.3.4)判定系数2eR)(22qNRLMasyen判定规则:判定规则:对给定的显著性水平 ,LM统计值大于临界值

12、 ,就拒绝原假设,否则不拒绝。2 (1)对(5.1.1)进行OLS估计,得到方程的残差 (2)对原方程解释变量和被怀疑为遗漏的变量作辅助回归:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著1921186.52320.03260.0000310.1213tttttYYC (5.3.6) t统计值 -6.1905 0.4808 -6.1171 1.3673p值 0.0000 0.6350 0.0000 0.18427209. 02eR N28n拒绝原假设,(5.1.1)遗漏了必要的解释变量 或者 或者兼而有之,即存在拟合不足的问题。2tY1tC991. 5)(93.27997

13、5. 0282qLMn举例:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著20三、拉姆齐的三、拉姆齐的RESERT检验检验 n拉姆齐的RESERT检验可用于模型函数形式的检验,也可用于模型拟合不足的检验。tttYC110t 1tC(2) 以 对 作图,观测近似函数关系。t 1tC(3)将相应的 函数形式加入原回归方程,建立新的辅助回归方程。tC(4)对新加入的解释变量进行联合显著性检验。若拒绝新解释变量联合不显著的原假设,则认为模型设定存在偏误。 (1)估计(5.1.1),得到 和 n检验步骤:检验步骤: (5.1.1)n消费函数计量经济学,高教出版社2011年6月,王少

14、平、杨继生、欧阳志刚等编著21-80-60-40-2002040604008001,2001,6002,0002,4002,800tCt 1 图5.3.1 和的对应关系 ttttCYC2210辅助回归方程举例:举例:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著220:20H12:0H2tC(5.3.9)OLS估计结果为:2000087. 08600. 02863.41tttCYCt统计值 2.4383 31.0749 -5.9849 p值 0.0219 0.0000 0.00009989. 02RT29n待检验假设待检验假设为:n结论:结论: 系数估计值t检验的p值为0

15、.0000,拒绝 原假设,认为模型(5.1.1)存在拟合不足或函数形 式误设。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著23四、非嵌套模型的检验四、非嵌套模型的检验 n非嵌套关系:非嵌套关系:模型的解释变量之间没有完全的包容关系,一个模型不是另一个模型的约束形式这种关系。n非嵌套模型之间进行选择:戴维森和麦金农的戴维森和麦金农的J检检验。验。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著24基本思想:基本思想:(2)建立辅助回归: (3)对 的系数进行显著性检验。若拒绝其系数为0,则拒绝A为真的原假设,选择B。反之,选择模型A。 ttttYYC2

16、2210ttttCYC41210(5.1.2)(5.1.4)(5.3.11) tBttttCYYC32210BtCn反过来,假设B为真,A为备选模型。n进行上述步骤(1)(3)的检验。模型A:模型B:n 假设A为真,B为备选模型。 (1)估计模型B,得被解释变量的拟合值计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著25举例:举例:n假设A为真,B为备选模型。13819. 04491. 05579.84ttBtCYC(5.3.10)t统计值 4.3152 5.7279 3.1316 p值 0.0002 0.0000 0.0044T289982. 02R(2)辅助方程OLS估

17、计结果: BttttCYYC2291. 0000034. 06580. 04611.242t统计值 0.6062 3.2833 -7.1302 0.806 p值 0.5501 0.0031 0.0000 0.4278(5.3.12)9992. 02R T28。 (3)根据估计结果,不能拒绝 的系数为0。不能拒绝A为真的原假设。BtCn(1)估计模型B计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著26n反过来,假设B为真,A为备选模型。 AttttCCYC8633. 01213. 00161. 08770. 319993. 02R(5.3.14)t统计值 0.2133 0.

18、1861 1.3673 6.1171 p值 0.8329 0.8539 0.1842 0.0000T28AtC辅助回归方程OLS估计结果为。 系数t统计值的p值为0.0000,拒绝该系数为0,拒绝原假设n结论:选择模型结论:选择模型A而拒绝模型而拒绝模型B。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著27不足之处不足之处n两个模型都可能被拒绝或者两个模型都不能拒绝。n若出现这样的情形,需借助其他信息进行进一步地分析。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著285.4 样本数据导致的模型设定问题 n一、随机测量误差一、随机测量误差n鉴于技术和成

19、本等因素的制约,难以避免统计数据的误差。n影响:影响:n(1)解释变量存在随机测量误差的影响n(2)被解释变量存在随机测量误差的影响计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著29ttYtYYe*1*10110tttttYYCYtttttteYY11*11*1)((5.4.1)(5.4.2)问题:问题: 与 相关*tY*1tn影响:影响:解释变量的回归系数估计量是有偏的,对误差项方差的估计和回归系数方差的估计也是有偏的。(与模型拟合不足相似)举例:n消费函数:tttYC110n(1) 解释变量Y存在随机测量误差:计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳

20、志刚等编著30n(2) 被解释变量存在随机测量误差被解释变量存在随机测量误差*110110*ttCtttCtttYeYeCCCtttttteCC1*1*1)(ttCtCCe*1ttY(5.4.3)(5.4.4))var()var()var(11*1tCttten影响:回归系数估计量仍是无偏的,但估计量方差影响:回归系数估计量仍是无偏的,但估计量方差增大,估计精度下降。增大,估计精度下降。(与模型过度拟合相似)n问题问题: 与 不相关但包含了测量误差计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著31二、奇异样本数据问题二、奇异样本数据问题 45678910110481216

21、20XY奇异值 图5.4.1 样本奇异值 n样本奇异值:显著地偏离样本回归线的样本观测值计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著32影响影响nOLS估计量对奇异样本数据很敏感。n残差不再具有正态性。计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著33 iiXY2680. 02354. 57878. 02R8870. 02Rt值 (32.5819) 17.0191N80剔除奇异样本数据后:iiXY2764. 02101. 5t值 (45.5700) 24.5884N79举例:举例:原数据的OLS估计的结果为:计量经济学,高教出版社2011年6月,王

22、少平、杨继生、欧阳志刚等编著34如图:如图:56789101020304050607080奇异样本点位于回归线右下方,样本回归线斜率减小,截距增大计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著3504812162024-4-3-2-1010246810-1.0-0.5-0.00.51.0 图5.4.3 含有奇异样本点时的残差直方图 图5.4.4 剔除奇异样本点的残差直方图 奇异样本点剔除后,对残差进行JB检验不能拒绝残差服从正态分布的原假设。 计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著36n检测方法:检测方法:n最简便易行的方法:观察样本图形或残

23、差图。n如果某个样本点具有数值非常大的残差,基本上就可确认为一个奇异样本点。 -5-4-3-2-10121020304050607080图5.4.5 含有奇异样本点时的残差图 计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著375.5 关于模型设定偏误问题的蒙特卡洛仿真实验 n蒙特卡洛(Monte-Carlo)模拟基本思想:基本思想:n(1)设定参数数值,随机生成解释变量和随机误差项的数值,得到仿真样本。n(2)对仿真样本进行估计。n(3)保持参数值不变,大量重复这一过程,将估计值与设定的参数真值进行比较,直观考察估计量的偏误和精度。计量经济学,高教出版社2011年6月,王

24、少平、杨继生、欧阳志刚等编著38一、模型拟合不足的仿真实验一、模型拟合不足的仿真实验n1. 1. 解释变量相关时:解释变量相关时:n(1)设定真实的总体回归模型,生成仿真样本数据。iiiiXXY22110(5.5.1)n设定: , , 。 从均匀分布(0,5)中随机抽取, 为从正态分布N(5,2)中随机抽取的值加上0.5 。误差项 从标准正态分布中随机抽取。样本容量设定为100。 50115 . 02iX1iX2iX1i计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著39n(2)如果漏掉了一个解释变量 ,拟合不足的模型为:n基于仿真样本,分别对(5.5.1)和(5.5.2)

25、进行OLS估计,得到估计值: 、 、 、 、 。iiiuXY110012012Xn(3)大量重复,观测参数估计值的偏离情况。(5.5.2)计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著403456789255075100125150175200真值0a.截距的估计(真值为5)0.80.91.01.11.21.31.41.51.6255075100125150175200真值11iX1b. 斜率系数的估计(真值为1) 图5.5.1 拟合不足模型与正确设定模型的估计结果(iX1iX2相关 ) n影响:影响:当模型漏掉了必要的解释变量时,截距和系数 的估计值都显著地偏离真值。0

26、计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著412. 解释变量不相关时解释变量不相关时n 样本仍从均匀分布(0,5)中随机抽取。n 样本仍从正态分布N (5,2)中随机抽取。n参数真值和其他变量数据生成过程不变重新进行 实验,结果见图5.5.2。iX1iX2计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著423456789255075100125150175200真值a.截距的估计(真值为5)0.70.80.91.01.11.21.3255075100125150175200真值b. 斜率系数的估计(真值为1)iX1图5.5.2 拟合不足模型与正确设定模型的估计结果( 、 不相关) iX1iX2011n影响:影响:系数的估计值是围绕真值波动的,近似等于真值。但截距的估计值仍明显偏离真值。0计量经济学,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著43二、模型拟合过度的仿真实验二、模型拟合过度的仿真实验 n估计两个模型,两个模型的OLS估计量都是无偏的, 但是(5.5.1)的参数估计量将有较大的方差。n过度拟合的模型:(5.5.1) 。n 解释变量 从均匀分布(0,5)随机抽取, 从正 态分布N(5,2)中随机抽取的值加上0.5 ,即 和 相关。 从标准正态分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论