第13章模型设定和诊断检验ppt课件_第1页
第13章模型设定和诊断检验ppt课件_第2页
第13章模型设定和诊断检验ppt课件_第3页
第13章模型设定和诊断检验ppt课件_第4页
第13章模型设定和诊断检验ppt课件_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第十三章计量经济建模:模型设定和诊断检验.2 经济学家多年来对“真理的寻求曾给人一种观感:经济学家们就好似在一间黑房子里搜索不断本来并不存在的黑猫;而计量经济学家还经常声称找到了一只。.3 经典线性回归模型的假定之一假定9是,分析中所运用的模型被“正确地设定;假设模型并未被明确设定,我们就遇到了这样的问题:模型设定误差model specification error或者模型设定偏误model specification bias。.4寻觅正确的模型就像寻觅圣杯一样。详细而言,我们需求思索如下问题:我们如何去寻觅一个“正确的模型?换言之,在阅历分析中选择一个模型的准那么有哪些?在实际中,容易

2、遇到哪些类型的模型设定误差?设定误差的后果有哪些?如何侦查设定误差?换言之,我们可以运用哪些诊断工具?一旦侦查出设定误差,我们能采取哪些补救措施?如何评价几个表现不相上下的备选模型?.513.1 模型选择准那么根据亨得利和理查德的观念,一个被选用于阅历分析的模型应满足如下准那么:数据包容性;即从模型做出的预测必需有逻辑上的能够性。与实际一致;即必需有好的经济含义。回归元的弱外生性;即解释变量或回归元必需与误差项不相关。.6表现出参数的不变性;即参数的值必需稳定,否那么预测 就很困难。表现出数据的协调性;即从模型中估计的残差必需完全随机从技术上而言必需是白噪音。模型有一定的包容性;即模型应该包容

3、或包括一切与之竞争的模型。.713.2 设定误差的类型1、漏掉一个有关变量1.Omitting A Relevant Variable为了简明起见,令这个模型为: (13.2.1) 其中,Yi = 消费的总本钱,Xi = 产量。等式(13.2.1)是立方总本钱函数。.8但是,假设出于某种缘由,研讨者决议运用以下模型: (13.2.2)由于(13.2.1)被以为是真实的,采用(13.2.2)就构成了一种设定误差,即漏掉了一个有关变量Xi3的误差。因此,(13.2.2)中的误差项u2i现实上是:.9 2、包含了一个无需或无关的变量 Including an unnecessary or irrel

4、evant variable假定另一个研讨者运用了以下模型: (13.2.4)新的误差项是: (13.2.5) 由于真模型中5 = 0.103、错误的函数方式Wrong functional form再假定又一研讨者拟定以下模型: (13.2.6) .114、丈量偏误的误差Errors of measurement bias思索有研讨者运用如下模型:(13.2.7) 其中, , ,i和i均为丈量误差。(13.2.7)所阐明的是,研讨者没有运用真正的Yi和Xi,却用了含有丈量误差的替代变量Yi*和Xi*。.125、对随机误差项ui不正确的设定 Specification errors to th

5、e stochastic error 假设真实的、正确的模型是: (13.2.8) 并且lnui满足CLRM的假定 误设为: (13.2.9).1313.3 模型设定误差的后果1、模型拟合缺乏漏掉一个相关变量真实的模型: (13.3.1)但出于某种缘由,我们拟合了如下模型: (13.3.2) 后果将会如何?.三变量回归模型的离差方式:(1)有: (2)(3)两边分别除以X2i2:(4)回到前面,有 X3对X2回归14.15于是,等式(4)变换为: (5)分别取等式两边的期望值 (6)其中,2和3都是常数,ui与X2i和X3i不相关.16于是,漏掉变量X3的后果如下:1、假设X3与X2相关,r2

6、3 0,那么 和 是有偏误且非一致的。也就是说, 2、假设X3与X2不相关,r23 = 0,那么 ,虽然 如今无偏,但 是无偏的。3、干扰的方差2将被不正确地估计。4、 的方差 ( )是真实估计量的方差的一个有偏误的估计值。5、通常的置信区间和假设检验程序容易给出错误的结论。6、所作出的预测不可靠。.17 结论:一旦根据相关实际把模型建立起来,切忌从中再忽略掉一个变量。.182、包含一个无关变量模型拟合过度如今让我们假定 (13.3.6) 是真实模型,而我们拟合了一下模型: (13.3.7) .19我们知道:真实模型的离差方式为:.20将(3)代入(2): 因此, 仍是无偏的。我们发现:将 (

7、3) 代入 (5):.x3在真实模型中不存在,它的系数为0。因此,这一设定误差(拟合过度)将导致如下后果:1一切参数的OLS估计量都是无偏且一致的,即,2误差方差2的估计是正确的。3通常的置信区间和假设检验依然有效。21.224但是,普通而言,诸 系数的估计值将不是有效的,也就是说,它们的方差普通都大于真实模型中 的方差。例如: 一个无益的结论似乎是:与其忽略有关变量,不如含有无关变量。.23但是,这种实际是不值得维护的,由于添加不用要的变量将导致:1、估计量的效率损失2、多重共线性问题3、自在度的损失 普通而言,最好的方法是,根据实际,仅仅包含那些直接影响因变量,而又不能由已被引进的其他变量

8、来替代的解释变量。.2413.4 设定误差的检验一、对过度拟合的侦查假设,为了解释某一景象,我们提出一个k变量模型: (13.4.1)假设要判别变量Xk能否真的属于这个模型,一个简单的方法是用 t 检验:.25我们可以用F检验来判别X3和X4能否真的属于这个模型。问题:1、能否反复运用 t 检验,首先是 的显著性,然后是 等等的显著性,最后是 的显著性?.26 这种建模战略被称为自下而上的方法bottom-up approach从一个较小的模型开场,然后逐渐扩展模型 或者多少带有轻薄口吻地称之为: 数据开采date mining方法 回归捕捉regression fishing方法 数据窥探d

9、ata snooping方法 数字斟酌number crunching方法。.27 本专业的纯化论者很看不起数据开采的实际。谴责“数据开采的缘由之一如下: 在数据开采情况下的名义的与真实的显著性程度是不同的。一种数据开采的危险是,诸如1%、5%、10%的常用的显著性程度并非是真实的显著性程度。.28 洛弗尔Lovell,1983曾指出,假设有c个备用的回归元,根据数据开采的情况,从中最后选出k个k c,那么真实的显著性程度*和名义上的显著性程度有如下关系:(13.4.2)或近似地为 (13.4.3) 例如,假设 c = 15,k = 5, = 5%, 由(13.4.3),真实的显著性程度为 (

10、155)(5%) = 15%.29 在实际中,多数研讨者都仅报告其“最终回归结果,而不泄漏此前是如何经过大量数据开采或预检验而得到这些结果的概略。 这与个人升迁有关! 但是,在运用计量经济学家看来,纯粹主义者即非数据开采者的建模方法也存在问题。.30 查曼Zaman,1995的观念: 假设我们从一个更开阔的视角来对待数据开采,把它看成一种寻求阅历规律的过程,并能从这些阅历规律中判别现有实际模型中能否存在错误或纰漏,那么它将起到一个非常大的作用。 肯尼迪Kennedy,1992以为,“运用计量经济学家的艺术在于,允许数据驱动实际进展而又不致堕入太大的数据开采的危险。.31 二、对脱漏变量和不正确

11、函数方式的检验 1. 残差分析 P518-519 和 figure 13.1 结论: 假设有设定误差,残差图必定展现出明显的款式。.32 2. 再次运用德宾-沃森 d 统计量 德宾-沃森 d 统计量的定义: 由于 和 只在一次察看中有区别,因此它们近似相等。因此:.33由于假设 = 1,d = 0,阐明残差存在完全的正相关关系;假设 = -1,d = 4,残差存在完全负相关关系;假设 = 0,d = 2,残差不存在一阶的自相关。.假设真实的模型是:而拟合的模型是:或者那么 d 值阐明存在正向的自回归。参见P519 Table13.1的d 值34.35 为了用德宾-沃森检验来侦查模型设定误差,我

12、们以如下方式进展: 1从假定的模型求得OLS残差。 2假设以为假定的模型因排除了一个有关的解释变量,比如说Z而是误设的,那么将第1步中所得的残差按Z值的递增次序陈列。 留意:Z变量可以是假定模型所含的X变量之一,或该变量的某一函数,如.363由这样陈列的残差计算d统计量。留意:t 在这里是观测次数,并不一定指时间序列数据。4根据德宾-沃森表,假设估计的 d 值是显著的,就可接受模型误设的假设。 问:如何补救?.373. 拉姆齐的RESET检验 拉姆齐Ramsey曾指出一种称为RESETregression specification error test的普通性设定误差检验。答:添加解释变量。

13、.38 拉姆齐的RESET检验: 我们依然运用本钱产出的例子,并假定本钱是产出的线性函数: (13.4.6)其中,Y = 总本钱,X = 产出.39 假设用此回归的残差 对 描图,就会得到一个如下所示的图形:.40 虽然 和 都是零,图中的残差仍阐明其均值系统地随 而变化的方式。 这提示我们,假设以某种方式将 当做回归元引入(13.4.6),那么应使 增大。 而假设 的增大是统计上显著的,就阐明线性本钱函数(13.4.6)是误设的。.41RESET的操作步骤如下:1从所选的模型,例如(13.4.6)得到 的估计值 。.42 2将某种方式的 作为增补的回归元引入,重做(13.4.6)。 由图13

14、.2,我们察看到 与 之间存在曲线关系,阐明可引进 和 作为增补的回归元。作回归:3记来自(13.4.7)的R2为 R2新 ,得自(13.4.6)的为R2旧,然后引入F检验: (8.5.18).434假设所计算的F值是显著的,就可接受模型(13.4.6)被误设的虚拟假设。 即: H0:模型被误设 假设 ,那么接受H0 P522 例题 .44 RESET的优点之一是,它不要求设定对立模型,故易于运用。 但这同时也是它的缺陷,由于即使知道了模型误设,也不一定有助于另外选出一个更好的模型。.454. 对于增补变量的拉格朗日乘数LM检验 为了阐明此检验,我们继续运用前述的阐明性例子。假设将线性本钱函数

15、(13.4.6)同立方本钱函数(13.4.4)相比,前者就是后者的一个受约束方式。约束条件:.46LM检验进展如下:1用OLS法估计受约束回归(13.4.6),并求得残差 。2假设无约束的回归(13.4.4)实践上是真实回归,那么得自(13.4.6)的残差应与平方产出 和立方产出 有关。.473用 对全部回归元作回归: vi 是具有通常性质的一个误差项。4恩格尔曾证明,对于大样本,从辅助回归 (13.4.11) 估计出来的R2的n倍遵照自在度等于受约束回归中约束个数的 分布 (13.4.11).485作出判别: P524 例.49一、因变量 Y 中的丈量误差 思索以下模型: (13.5.1)

16、其中,Yi* = 永久性消费支出 Xi = 当前收入 ui = 随机干扰项 13.5 丈量误差.50 可观测的变量 Yi i 表示丈量误差 于是,我们估计的不是(13.5.1),而是: (13.5.3).51 其中, 是一个合成误差项,包含着总体干扰项。 为了简单起见,假定:.52有了这些假设,我们可以证明: 1、从(13.5.1)和(13.5.3)估计出来的 是一个无偏估计量。 2、从(13.5.1)和(13.5.3)估计出来的 的方差和规范差是不同的。 模型(13.5.1): (13.5.4) 模型(13.5.3): (13.5.5).53二、解释变量 X 中的丈量误差 思索如下的模型:

17、其中,Yi = 当前消费支出 Xi* = 永久性收入 ui = 干扰项方程误差.54 假设我们不能观测到 Xi* ,于是便用 Xi 来替代 (13.5.7) wi 代表 Xi* 中的丈量误差,从而我们估计的不是(13.5.6),而是: 其中, 是方程与丈量两种误差的一个混合。 .55为了简便,假定:合成误差项 zi 能否独立于解释变量 Xi ?.56答案:.57 因此,(13.5.8)中的解释变量与误差项是相关的,这违背了经典线性回归模型中的关键假定:解释变量与随机干扰项无关。 假设这一假定被破坏,那么可以证明,OLS估计量不仅是有偏误的而且是非一致的。 其中, 和 分别是 和 的方差, 指

18、的概率极限。 解释见 附录13 A.3.58什么是概率极限?例: 是 的估计值,假设: P 代表概率。 上式阐明, 和 之差的绝对值小于恣意小的正数 的概率趋向于1。 在这里, 是 的一个一致估计量。用公式表示: 或者.59 根据(13.5.10),我们可以假定,假设 2W 相对 2X 而言较小, ,我们可以运用通常的OLS估计。但是,在实践情形中,要观测到哪一个较大很困难。因此我们运用通常的OLS估计时要小心。 补救方法: IV 或 PV代理变量 见第十七章.6013.6 对随机误差项不正确的设定 真实的模型: 回归模型:假定 满足新的OLS的假定。根据过原点的回归方程,的估计量为:(1).

19、61将Y交换为真实模型(13.2.8)中的Y,有:(2)统计实际阐明,假设 ,那么有:有: ,例如,在 Black-Scholes 期权定价中,假设股票价钱服从ui 对数正态ST log normallnST .62因此,, 是 的一个有偏估计量。.6313.7 嵌套与非嵌套模型思索以下模型:模型 A: 模型 B:我们说模型 B 被嵌套在模型 A 中,由于它是模型 A 的一个特殊情形:假设我们估计模型 A ,然后检验假设:.64 我们前面讨论过的设定误差检验和第8章中讨论过的约束 F 检验在本质上都属于这种嵌套假设检验,只是我们没有这么称谓而已。 如今,思索以下的模型: 模型 C: 模型 D:

20、比如财政变量比如金融变量.65 其中,X 和 Z 各代表不同的变量。我们说模型 C 和 D 是非嵌套的,由于不能把一个作为另一个的特殊情形推导出来。 模型 D 中可以包含 X3 ,模型 C 中可以包含 Z2 。虽然如此,它们仍是非嵌套模型,由于模型 C 没有包含 Z3 ,模型 D 中没有包含 X2 。.66 即使进入模型的变量完全一样,函数方式不同也能够使两个模型称为非嵌套模型。思索如下模型: 模型 E: 模型 D 和 E 是非嵌套的,由于不能把其中一个作为另外一个的特殊情形而推导出来。.6713.8 非嵌套假设的检验 哈维Harvey将检验非嵌套假设的方法分成两种: 1判别方法discrim

21、ination approach:给定两个或多个相竞争的模型,根据某些拟合优度准那么选择其一。 2辨识方法discerning approach :在调查一个模型时同时顾及其他模型所提供的信息。.68 一、判别方法 就是运用: ,赤池信息准那么 Akaikes Information Criterion , AIC,施瓦茨信息准那么 Schwarizs Information Criterion , SIC,或马娄斯的 准那么 (Mallowss Criterion ) 来选择模型。 . 二、辨识方法 1. 非嵌套 F 检验或包容 F 检验 思索前面引见的模型 C 和 D 。如何在这两个模型之

22、间进展选择呢?为此,假设我们估计如下的嵌套或混合模型: 模型F:.70 留意模型 F 嵌套或包含了模型 C 和 D。但 C 和 D 是非嵌套模型。 如今,假设模型 C 是正确的,那么 ,而假设模型 D 是正确的,那么 。 问:如何检验? 答:F 检验。.71 然而,这种检验程序却带来一些问题。 1假设 X 与 Z 高度相关,那么很能够一个或多个 系数在统计上不显著,虽然我们有能够回绝一切斜率系数同时为零的假设。在这种情形中,我们无法决议究竟是模型 C 还是模型 D 才是正确的。 2能够出现矛盾的情况: 选择模型 C 检验一切系数都是显著的 参与一个或两个 Z 变量 t 或 F 检验不显著 C正

23、确 选择模型 D 检验 一切系数都显著 参与一个或两个 X 变量 t 或 F 检验 不显著 D正确.72 因此,参考假设的选择可以决议模型选择的结果类似于“先入为主,特别是在相互争持的回归元中有多重共线性的情况下。 3人为地嵌套模型能够缺乏经济意义。.73 2. 戴维森-麦金农 J 检验Davidson-Mackinnon J Test 我们要比较模型 C 和 D ,步骤如下:1估计模型 D ,得到 Y 的估计值 。2将 作为回归元放进模型 C 中,得:.3用 t 检验对 进展检验。4假设 ,不被回绝 H0 ,不回绝模型 C 为真模型 由于 代表模型 C 所含变量以外的其它变量的影响。 不显著

24、,阐明其它变量并没有添加模型C原有的解释。 即:模型 D 不含有足以改良模型 C 的表现的任何额外信息,故模型 C 兼容了模型 D。 类似地推理,假设虚拟假设被回绝,那么模型 C 就不是真模型。.755把模型 C 和 D 的换位。先估计模型 C,并运用 ,估计如下模型: (13.8.6) 如今假设检验 。 假设 H0 不被回绝,我们选择模型 D 而非 C。假设被回绝,那么模型 D 不是真模型。 虽然在直观上比较可取,但 J 检验也存在一些问题:.761有下述能够的结果:假设:4 = 0 假设:4 = 0不回绝回绝不回绝同时接受C和D接受D而回绝C回绝接受C而回绝D同时回绝C和D.77 根据上表

25、所示,假设 J 检验程序导致同时接受或同时回绝两个模型,我们就得不到一个正确的答案。 2t 统计量只是渐进地,即只在大样本中服从规范正态分布。因此,在小样本中,J 检验会过多地回绝真实假设或真实模型,因此不是在统计意义上很有效果的。.7813.9 模型选择准那么 一、 R2 准那么越接近1,拟合得越好。 问题: 1. 它度量的是样本内拟合优度,即度量了给定样本中所估计的Y值与其实践值有多么接近。它不能保证对样本外观测也能很好地预测。2. 在比较两个或多个 R2 时,因变量或回归子必需一样。3. 模型中的变量越多,R2 越大。.79二、校正 R2 准那么从这个公式中可以看出, ,阐明校正 R2

26、是如何对添加更多的回归元进展惩罚的。校正 R2 只需在所添加的变量的 t 值的绝对值大于1时才会添加。因此它比 R2 更好。但在比较时,回归子必需一样。.80三、 赤池信息准那么AIC由日本统计学教授 H. Akaike 从信息论出发提出的综合思索模 型的拟合优度适用性和复杂程度的准那么。在AIC准那么中,对模型中添加回归元进展了惩罚。AIC 的定义为: .81其中 k 为回归元的个数包括截距项,n 为观测次数。为了数学计算上方便起见,把(13.9.3)写成:其中,lnAIC为AIC的自然对数,2k/n为惩罚因子。 .82 在比较两个或多个模型时,具有最低的AIC值的模型优先。 AIC运用广泛。它不仅适用于样本内预测,还适用于预测一个回归模型在样本外的表现。此外,它对嵌套和非嵌套模型都适用,甚至还可以用于决议 AR(p) 模型的滞后长度。.83 直观含义: 代表了估计的模型与真实模型之间的差别。k 越大,模型越复杂,偏向就越小。同时,我们必需估计更多的变量,并且拥有一个更大的 。 阶数k越小,模型越简化,待估参数越少, 。但是,与真实模型之间的偏向越大。.84 总之,当我们选择k,如分布滞后模型的滞后长度,我们应该权衡模型的拟合优度和复杂程度以最小化AIC。.85其中,n 是滞后长度yi 服从正态条件分布:ei N( 0, 2 )另一种解释.86最大似然函数 L 的对数方式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论