第四章41多重共线性_第1页
第四章41多重共线性_第2页
第四章41多重共线性_第3页
第四章41多重共线性_第4页
第四章41多重共线性_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 第第4章章 违背基本假定的多元线性回归模型违背基本假定的多元线性回归模型计量经济学计量经济学2 违背基本假定的各种情形:违背基本假定的各种情形: (1)随机误差项序列存在异方差异方差性(heteroskedasticity); (2)随机误差项序列存在自相关自相关性(autocorrelation); (3)解释变量之间存在多重共多重共线线性(MultiCollinearity) ; (4)解释变量为随机变量; (5)误差项不服从正态分布。 u OLS法是否还适用?所得参数的OLS估计量是否还具有优良的统计性质?变量显著性t检验和方程显著性F检验还有效吗?u 如果OLS法失效,有哪些补救措

2、施?u 如何检验模型是否违背基本假定条件? 回顾回顾:经典线性回归模型的基本假定条件。经典线性回归模型的基本假定条件。建立违背基本假定回归模型存在的基本问题:建立违背基本假定回归模型存在的基本问题: 本章主要讨论不满足基本假定中的某一条,而其余假定条件均成立时,多元线性回归模型参数的有效估计和检验问题。 3目的目的 讨论违背基本假定的多元线性回归模型的建模讨论违背基本假定的多元线性回归模型的建模问题(参数的估计、统计检验)。问题(参数的估计、统计检验)。4教学安排教学安排 共12学时(每讲3学时) 第一讲 4.1 第二讲 4.2第三讲 4.3第四讲 4.4和本章小结、习题选讲4.1 多重共线性

3、多重共线性的概念多重共线性的概念“多重共线性(多重共线性(multi-collinearity)” 原指模型的解释变量间存在线性关原指模型的解释变量间存在线性关系。系。 01122= + + + +iiikkiiY XXXu1121311112223222123(1101010kknnnknknkXXXXXXXXXXXX X)完全多重共线性完全多重共线性意味着: rank(X) k+1,rank(XX) = rank(X) k+1,从而k阶方阵XX是不可逆的。 如果非零向量 使得下面的等式成立,则称这些解释变量存在多重共线性。YXX)(X1能够进行能够进行OLS估计吗?估计吗? 一个例子:一个

4、例子:计量经济学考试成绩的回归模型:计量经济学考试成绩的回归模型:012345iscoremathscoreeconscorehourdayhourweekothersu 其中,mathscore和econscore分别为数学成绩和经济学成绩;hourday和hourweek分别为每天和每周每天和每周学习计量经济学的时间;others还包含其他一些变量,如监考老师的态度,身边有没有学习好的同学,是否发现一些有新意的问题(+5分)等等。 能够对这个模型进行OLS估计吗? 完全多重共线性是一种模型设定错误!完全多重共线性是一种模型设定错误!8 k,10kXXX,21 不完全的多重共线性:不完全的多

5、重共线性:解释变量 之间存在不完全的多重共线性,是指 X的各列是近似线性相关的,即存在不全为0的数 ,使得)(niXXkiki, 2 , 10110 显然,解释变量之间存在不完全的多重共线性意味着存在某一解释变量的样本数据能由其余解释变量的样本数据近似地线性表示。 多重共线性:多重共线性:解释变量之间的完全多重共线性和不完全多重共线性的统称,其本质是解释变量的样本数据之间存在完全的或近似的线性相关性。 一个基本结论: 当解释变量中有两个变量的样本数据之间高度相关时,模型就存在较严重的多重共线性;但当解释变量两两之间的相关程度都很低时,所有解释变量之间仍可能存在较严重的多重共线性。 问题:问题:

6、在多元线性回归模型中,解释变量之间存在多重共线性就是指解释变量两两共线或高度相关,对否?例题(p91)u 特例:不可识别的情形。l rXi Xj = 0,解释变量间,解释变量间无线性关系无线性关系,变量间相互正交。,变量间相互正交。 对如下的多元回归和k个一元回归模型: yi = 0+1x1 i+ 2x2i + kxki + ui yi = 11 +1x1i + u1i yi = k1 +kxki + uki 偏回归系数j的OLS估计量与一元回归系数j的OLS估计量完全相同。l rXi Xj = 1,解释变量间,解释变量间完全共线性完全共线性。此时模型参数将无法确定。此时模型参数将无法确定。l

7、 0|rXi Xj|20,则可以认为模型存在较严重多重共线性的征兆。 (已超范围)nikiniiXXnS12121/1000/1000/1多重共线性的克服方法多重共线性的克服方法 利用已知信息利用已知信息LnYt =LnA+ LnKt + LnLt + ut + = 1 LnYt = LnA+ LnLt + (1- ) LnKt + ut Ln(Yt/Kt)= LnA + Ln(Lt/Kt)+ ut 估计出后,再利用关系式 + = 1,估计。 有时LnK和LnL会高度相关,假设发现该行业是规模报酬不变的,则:从而: 增加样本容量或重新抽取样本增加样本容量或重新抽取样本 主要适用于那些由测量误差

8、而引起的多重共线性。主要适用于那些由测量误差而引起的多重共线性。当重新抽取样本时,克服了测量误差,自然也消除了当重新抽取样本时,克服了测量误差,自然也消除了多重共线性。另外,增加样本容量也可以减弱多重共多重共线性。另外,增加样本容量也可以减弱多重共线性的程度。线性的程度。 合并截面数据与时间序列数据 Ln Yt = 0+ 1 Ln Pt + 2 Ln It + ut 某种商品的销售量模型如下: 其中Yt 表示销售量,Pt表示平均价格,It表示消费者收入。时间序列数据中,价格Pt与收入It一般高度相关。 首先利用截面数据估计收入弹性系数2。因为在截面数据中,平均价格是一个常量,所以不需要估计1。

9、 LnYt = 0+ 1 Ln Pt + Ln It + ut LnYt - Ln It = 0+ 1 LnPt + ut (1)用被解释变量对每一个所考虑的解释变量做简单回归。)用被解释变量对每一个所考虑的解释变量做简单回归。(2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,以对被解释)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,以对被解释 变量贡献大小为顺序逐个引入其余的解释变量。变量贡献大小为顺序逐个引入其余的解释变量。 这个过程会出现3种情形: 若新变量的引入改进了R2,且回归参数的t检验在统计上也是显著的,则 该变量在模型中予以保留。 若新变量的引入未能改进R

10、2,且对其他回归参数估计值的t检验也未带来 什么影响,则认为该变量是多余的,应该舍弃。 若新变量的引入未能改进R2,且显著地影响了其他回归参数估计值的符号 与数值,同时本身的回归参数也通不过t检验,这说明出现了严重的多重 共线性。舍弃该变量。 逐步回归法逐步回归法26 多重共线性造成的主要后果是参数估计量具有较大的方差。为了解决这一问题,计量经济学家们提出了一些以引入偏误为代价来提高参数估计量的稳定性的参数估计方法,如岭回归法(ridge regression)、主成分回归法(principal components regression)等。 岭回归估计法岭回归估计法是借助于OLS估计量的表达式,机械地设定一种具有较小方差的参数估计量以解决多重共线性问题的方法。该方法的吸引力在于用较小的偏误换来方差的改善。具体做法是令估计量为 该方法的缺陷:该方法的缺陷:在如何确定r值上缺乏令人信服的理论依据,而且对参数的统计推断也相当复杂。因此,这种方法在实际中并不常用。YXrDXX1)(其中D为 主对角线上的元素构成的对角矩阵,r为大于0的常数。XX 改变参数的估计方法以减小参数估计量的方差改变参数的估计方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论