计量经济学12ppt课件_第1页
计量经济学12ppt课件_第2页
计量经济学12ppt课件_第3页
计量经济学12ppt课件_第4页
计量经济学12ppt课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三部分 实践中的 回归分析 Chp 12 多重共线性 12-2 主要内容 n 多重共线性的概念性质 n 多重共线性的理论后果 n 多重共线性的实际后果 n 多重共线性的诊断 n 多重共线性的补救措施 n 小结 12-3 一、多重共线性的概念及性质 n 对于模型 Yi=B0+B1X1i+B2X2i+ +BkXki+ui i=1,2,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相关 性,则称为 多重共线性 (Multicollinearity)。 12-4 如果存在不全为 0的 ci, 使得 c1X1i+c2X2i+ ckXki=0 i=1,2, n 则称为解释变量间存在 完全共线性 ( perfect multicollinearity) 。 如果存在 c1X1i+c2X2i+ ckXki+vi=0 i=1,2, n 其中 ci不全为 0, vi为随机误差项,则称为 近似 共线性 ( approximate multicollinearity) 或 交 互相关 (intercorrelated)。 12-5 n 完全多重共线性的例子: P266 Yi=A1+A2X2i+A3X3i+ui 其中, X3i=300-2X2i or X2i=150-X3i/2 进行迭代后 (将 X3i的表达式代入初始方程 ), 可以看到,该例不是多元回归,而是简单的双 变量回归: Yi=A1+A2X2i+A3(300-2X2i)+ui =(A1+300A2)+(A2-2A3)X2i+ui =C1+C2X2i+ui 12-6 n 可以看到,在完全多重共线性的情况下, 不可能对多元回归模型中的单个回归系数进 行估计和假设检验。 我们可以得到原始系数线性组合的一个估计 值,但无法获得每个系数的估计值。 12-7 二、接近或不完全多重共线性的情形 n 接近或不完全多重共线性的例子: P268 Yi=A1+A2X2i+A3X4i+ui ( 12-8 ) =145.37 -2.7975X2i -0.3191X4i (1.2107) (-3.4444) (-0.7971), R2=0.9778 12-8 n 对模型 12-8的回归结果的分析: 对比前一例,虽然 X3和 X4 很接近,但前者无法 估计,后者仍可估计; 对价格回归的说明; 对判定系数的说明; 对收入(工资)系数的说明 统计不显著, 且符号错误; X4不显著,但 F检验表明,联合假设 B2=B4=0 却是显著的,即价格和工资同时对商品的需求有 显著影响 n 原因在于, X2 与 X4 二者 高度相关 : (在只有两个 解释变量的情形下,相关系数可用于共线性程度的度量 。 ) n X4i=299.92-2.0055X2i +ei(见 P269, 图 12-2) 12-9 实际经济问题中的多重共线性 n 一般地,产生多重共线性的主要原因有以 下三个方面: 1. 经济变量相关的共同趋势 n 时间序列样本: 经济 繁荣时期 ,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰 退时期 ,又同时趋于下降。 n 横截面数据 : 生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小。 12-10 2. 滞后变量的引入 n 在经济计量模型中,往往需要引入滞后经济 变量来反映真实的经济关系。 例如 ,消费 =f(当期收入 , 前 期收入) 显然,两期收入间有较强的 线性相关性。 12-11 3. 样本资料的限制 n 由于完全符合理论模型所要求的样本数据较 难收集,特定样本可能存在某种程度的多重共线性 。 一般经验 : n 时间序列数据 样本:简单线性模型,往往 存在多重共线性。 n 截面数据 样本:问题不那么严重,但多重 共线性仍然是存在的。 12-12 三、多重共线性的理论后果 n 只要共线性是不完全的,则 OLS估计量仍然是 最优线性无偏估计量,但其仍然存在如下问题: 在接近共线性的情形下, OLS估计量仍然是无 偏的; n 但无偏性是在重复抽样的情形下得出的,对单个 样本仍存在重大影响 接近共线性并未破坏 OLS估计量最小方差性, 但并不意味着任何一个样本的 OLS估计量的方差 会很小; 即使变量 X与总体不线性相关,但可能与某一样 本线性相关: n 原因:多数经济数据都不是通过实验获得的 12-13 四、多重共线性的实际后果( ) n OLS估计量的方差和标准误较大; n 置信区间变宽; n t值不显著; n R2值较高; n OLS估计量及其标准误对数据的微小变化非常敏 感 趋于不稳定; n 回归系数符号有误; n 难以评估各个解释变量对回归平方和或 R2的贡献 。 分别就支出对价格、收入,及价格和收入作回归, 得到的 R2都很大,故难以区别哪一部分归于收入,哪 一部分归于价格。 12-14 变量的显著性检验失去意义 存在多重共线性时 参数估计值的方差与标准差变大 容易使通过样本计算的 t值小于临界值, 误导作出参数为 0的推断 可能将重要的解释变量排除在模型之外 12-15 五、多重共线性的诊断 n 应注意的几个问题: 多重共线性是一个程度问题,而非存在与否 的问题 多重共线性针对的是解释变量是非随机的情 形 ,因而它是一个样本特征,而不是总体特征 12-16 n 诊断多重共线性的 经验法则(重点) R2较高,但 t值统计显著的不多; 解释变量两两高度相关; n 存在问题:两两相关系数可能较低,但却可能 存在共线性 检验偏相关系数 n 类似于偏回归系数 从属回归或辅助回归 n 做每个变量对其他剩余变量的回归并计算出相 应的 R2值 12-17 n 例,考虑 Y对 X2,X3, , X7这 6个解释变量的 回归,如果回归结果表明存在多重共线性,如 R2值很高,但解释变量的系数很少是统计显著 的,我们可找出哪些变量可能是其他变量的线 性组合,步骤如下: 做 X2对其他剩余变量的回归,并求样本判定 系数,记为 R22; 做 X3对其他剩余变量的回归,并求样本判定 系数,记为 R32; 重复以上步骤,得到 6个这样的辅助回归 12-18 检验 R2的显著性 R2值 F值 F显 著否? 0.90 0.18 0.36 0.86 0.09 0.24 79.20 1.93 4.95 54.06 0.87 2.78 是 * 否 是 * 是 * 否 是 * *: 1%的显著性水平 *: 5%的显著性水平 12-19 n 诊断多重共线性的经验法则(续) 方差膨胀因子( VIF) 12-20 n 结论: 较高的 Ri2既非较高标准误的必要条件,也 非充分条件,多重共线性本身并不必然导致较 高的标准误。 诊断多重共线性的方法有多种,但没有哪一 种方法能够彻底诊断多重共线性问题。 多重共线性是一个程度问题,它是一种样本 特殊现象。 12-21 如何看待多重共线性 n 多重共线性的好坏取决于研究的目的 。 如果是为了利用模型预测应变量的未来均值 ,则多重共线性未必是一件坏事。 如果研究的目的不仅仅是预测,而且还要可 靠地估计出模型的参数,则严重的共线性就是 件坏事 其导致估计量的标准误增大。 12-22 n 例: 1960-1982年期间美国的鸡肉需求 n 回归的初步结论: 收入弹性和自身价格均统计显著, n 收入弹性(大于 0)小于 1:非奢侈品; n 自身价格弹性(小于 0)绝对值小于 1:缺乏 弹性。 两个交叉弹性(替代品)(大于 0)不显著 n 两种肉类与鸡肉是互为竞争的 n 鸡肉的需求并不猪肉和牛肉价格的影响 12-23 n 对鸡肉需求函数的共线性诊断: 相关矩阵 n 相关系数很高,但并不表明需求函数中一定 存在共线性,只是有存在的可能 辅助回归 n 所有的 R2都统计显著,表明回归方程中每个 解释变量都与其他解释变量高度共线。 12-24 多重共线性的解决办法( ) n 方法 1:从模型中删除一个变量 例:关于鸡肉猪肉牛肉价格对鸡肉消费 量的影响 存在的问题 n 为了削弱共线性的严重程度,得到的系数估 计值可能是有偏的 从模型中删除这些变量可能导致模型设定错 误,使简化模型估计得到的参数是有偏的 n 建议:不要仅仅因为共线性很严重就从一个 经济上可行的模型中删除变量 12-25 n 方法 2:获取额外的数据或新的样本 有时获得额外的数据将削减共线性程度; 但出于成本和其他一些因素的考虑,获得变 量的额外数据也许并不可行,否则,这一实施措 施肯定是可行的。 对于上式,给定 2和 R2,n 越大, Var越小。 12-26 n 方法 3:重新考虑模型 原模型可能是由于省略了一些重要变量,或 者是没有正确选择函数形式。 例: P278, 原来为对数形式,现在用原始数 据进行回归。 12-27 n 方法 4:先验信息 根据先验研究了解有关参数的某些信息。例如 对于: Demand=B1+B2price+B3 salary+u We know that B3=0.9, so (Demard-0.9salary)=B1+B2price +u 该方法的缺陷在于外生的或先验的信息并不总 是可获得的。 如果各样本之间的收入效应预期变化不大,且 得知有关收入系数的先验信息,那么该方法将较 为可行。 12-28 n 方法 5:变量变换 有时通过对模型中的变量进行变换也能降低 共线性程度。对于 Y(进口 ) X2(GNP) X3(CPI) T检验表明,收入和价格系数都不统计显著, 但 F检验却拒绝零假设,表明回归方程之间存在 共线性,作如下变换,得 12-29 n 差分法 时间序列数据、线性模型:将原模型变换为 差分模型 : Yi=B1 X1i+B2 X2i+ +Bk Xki+ ui 可以有效地消除原模型中的多重共线性 。 一般讲,增量之间的线性关系远比总量之间 的线性关系弱得多 。 2. 第二类方法:差分法 12-30 例如 :在中国消费模型中的 2个变量 : 12-31 由表中的比值可以直观地看到, 两变量增量的线性 关系弱于总量之间的线性关系。 n 进一步分析: Y与 C(-1)之间的判定系数为 0.9845, Y与 C(-1)之间的判定系数为 0.7456。 一般认为: 两个变量之间的判定系数大于 0.8时,二者之间存在线性关系。 所以,原模型经检验地被认为具有多重共线 性,而差分模型则可认为不具有多重共线性。 12-32 n 其他补救措施 因子或主成分分析 岭回归 12-33 本章小结 n 多重共线性:两个或多个变量高度线性相 关 n 多重共线性的后果 n 多重共线性的检验 n 多重共线性的诊断 12-34 案例 中国粮食生产函数 根据理论和经验分析,影响粮食生产( Y) 的 主要因素有: 农业化肥施用量( X1) 粮食播种面积 (X2) 成灾面积 (X3) 农业机械总动力 (X4) 农业劳动力 (X5) 已知中国粮食生产的相关数据,建立中国粮食 生产函数: Y=B0+B1 X1 +B2 X2 +B3 X3 +B4 X4 +B4 X5 +u 12-35 表:中国粮食生产与相关投入资料 年份 粮食 产 量 Y 万吨 农业 化肥施 用量 X1万公 斤 粮食播种面 积 X2千公 顷 受灾面 积 X3公 顷 农业 机械 总 动 力 X4万千 瓦 农业劳动 力 X5万人 1983 38728 1659.8 114047 16209.3 18022 31645.1 1984 40731 1739.8 112884 15264 19497 31685 1985 37911 1775.8 108845 22705.3 20913 30351.5 1986 39151 1930.6 110933 23656 22950 30467 1987 40208 1999.3 111268 20392.7 24836 30870 1988 39408 2141.5 110123 23944.7 26575 31455.7 1989 40755 2357.1 112205 24448.7 28067 32440.5 1990 44624 2590.3 113466 17819.3 28708 33330.4 1991 43529 2806.1 112314 27814 29389 34186.3 1992 44264 2930.2 110560 25894.7 30308 34037 1993 45649 3151.9 110509 23133 31817 33258.2 1994 44510 3317.9 109544 31383 33802 32690.3 1995 46662 3593.7 110060 22267 36118 32334.5 1996 50454 3827.9 112548 21233 38547 32260.4 1997 49417 3980.7 112912 30309 42016 32434.9 1998 51230 4083.7 113787 25181 45208 32626.4 1999 50839 4124.3 113161 26731 48996 32911.8 2000 46218 4146.4 108463 34374 52574 32797.5 12-36 1. 用 OLS法估计上述模型 : R2接近于 1; 给定 =5%,得 F临界值 F0.05(5,12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论