第5章多元线性回归分析2_第1页
第5章多元线性回归分析2_第2页
第5章多元线性回归分析2_第3页
第5章多元线性回归分析2_第4页
第5章多元线性回归分析2_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1回归分析中的多重共线性问题 什么是多重共线性 多重共线性产生的后果 多重共线性的检验 多重共线性的补救措施2第一节 什么是多重共线性 多重共线性的含义 产生多重共线性的背景3所谓的多重共线性 (Multi-Collinearity),不仅包括完全的多重共线性,还包括不完全的多重共线性。对于解释变量 ,如果存在不全为 0的数 ,使得则称解释变量 之间存在着完全的多重共线性。一、多重共线性的含义4当 时,表明在数据矩阵 中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。5不完全的多重共线性 实际中,常见的情形是解释变量之间存在不完全的多重共线性。 对 于解 释变 量 , 存在不全 为 0的数, 使得为 随机 变 量。 这 表明解 释变 量只是一种近似的 线 性关系 。其中 ,6,解 释变 量 间 毫无 线 性关系, 变 量 间 相互正交。 这时 已不需要作多元回 归 ,每个参数 j都可以通 过 Y 对 Xj 的一元回 归 来估 计 。回归模型中解释变量的关系 可能表现为三种情形:(1),解 释变 量 间 完全共 线 性。此 时 模型参数将无法确定。,解 释变 量 间 存在一定程度的 线 性关系。 实际 中常遇到的情形。(2)(3) 7二、产生多重共线性的背景 多重共线性产生的背景主要有几种情形:1.变量之间具有共同变化趋势。 2.模型中包含滞后变量。 3.利用截面数据建立模型也可能出现多重共线性。 4.样本数据自身的原因。 8第二节 多重共线性产生的后果完全多重共线性产生的后果不完全多重共线性产生的后果9一、完全多重共线性产生的后果1.参数的估计值不确定当解释变量 完全线性相关 时 OLS 估计式不确定 从偏回归系数意义看:在 和 完全共线性时,无法保持 不变,去单独考虑 对 的影响( 和 的影响不可区分) 从 OLS估计式看:可以证明此时2.参数估计值的方差无限大OLS估计式的方差成为无穷大: 10如果存在完全共线性我们再引入一个任意非零常数回归系数却显然不同11下面再用模型参数说明完全多重共线性的后果。对于上述二元线性回归模型:12二、不完全多重共线性产生的后果如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量分析可能会产生一系列的影响。1.参数估计值的方差增大当 增大时 也增大 132.对参数区间估计时,置信区间趋于变大3.假设检验容易作出错误的判断4.可能造成可决系数较高,但对各个参数单独的 t 检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。 14第三节 多重共线性的检验 简单相关系数检验法 方差扩大(膨胀)因子法 直观判断法 逐步回归法15一、简单相关系数检验法含义: 简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则: 一般而言,如果每两个解释变量的简单相关系数 (零阶相关系数 )比较高,例如大于 0.8,则可认为存在着较严重的多重共线性。1617注意:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。18现在的统计分析软件一般采用 容忍度和方差膨胀因子 度量变量之间的共线性问题。一般模型的共线性的 容忍度 ( tolerance)与 方差膨胀因子 ( Variance Inflation Factor, VIF)互为倒数 方程膨胀因子也被译为 方程扩大因子 等。简单地说,容忍度可以定义为二、方差扩大(膨胀)因子法 这里 Rj 是参与回归的第 j 个自变量与其它参与回归的自变量的复相关系数。相应地, VIF 定义为19统计 上可以 证 明,解 释变 量 的参数估 计 式的方差可表示 为 其中的 是 变 量(Variance Inflation Factor),即的方差扩大因子20如果不存在共线性,则 Rj=0,从而容忍度和 VIF 都为 1。一般用 VIF 判断共线性的强度。严格地说,要求 VIF10。不过,这一点在实际中有时很难做到。因此,在具体操作中应该将VIF 与 P 值或者 t 值结合起来进行综合判断。举例说来,假如我们要计算三元线性模型21如何计算 VIF?借助矩阵知识,可以非常方便地算出 VIF 值。首先对 m 个自变量分别进行标准化,表示为矩阵 nm 矩阵 X*。于是变量间 简单相关系数 的矩阵可以表示为:22经验规则 方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于 1,多重共线性越弱。 经验表明,方差膨胀因子 10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。23三、直观判断法1. 当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。2. 从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。243. 有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。4. 解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。25四、逐步回归检测法逐步回归的基本思想将变量逐个的引入模型,每引入一个解释变量后,都要进行检验,并对已经选入的解释变量逐个进行 t 检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。26第四节 多重共线性的补救措 施 修正多重共线性的经验方法 逐步回归法271. 增大样本容量如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。问题: 增加样本数据在实际计量分析中常面临许多困难。一、修正多重共线性的经验方法28292. 剔除变量法把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。注意 : 若剔除了重要变量,可能引起

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论