第四章 异方差问题_第1页
第四章 异方差问题_第2页
第四章 异方差问题_第3页
第四章 异方差问题_第4页
第四章 异方差问题_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章异方差问题【学习目标】1.知识目标:异方差的概念、产生原因与后果;异方差的各种检验方式;修正异方差的方法与应用

2.能力目标:对比GQ检验、White检验、Glejser检验等方法;掌握加权最小二乘法中权重的选择;掌握Eviews软件操作方法,能应用Eviews软件解决异方差分析。【情景写实】我们容易发现,收入越高的家庭,往往对食品选择的范围越大,消费者消费行为的随意性更大,消费者个体之间的食品支出额的差异也越大;收入较低的家庭受收入水平的限制,消费者消费行为随意性较小,消费者个体之间的食品支出额的差异也越小。通常在分析人均年收入对人均年食品支出额的影响时会假定不同收入阶层的食品支出额的差异性是相同的因为应用普通最小二乘法估计多元线性回归模型的参数时,有一个重要的假定Var(i)=2,即随机误差项i具有相同的方差。显然从实际情况来看,随着收入水平的提高,消费者个之间的消费行为的随机误差项i的方差会越来越大,那么随机误差项i满足同方差的假定不成立,即存在所谓的异方差问题。第一节异方差问题概述一、异方差的概念多元线性回归模型中,如果有此时,我们认为该模型存在异方差问题。即【相关链接】4-1现实中的异方差问题下表列出了某年我国制造工业销售收入与销售利润的统计资料(单位:万元)行业名称销售利润(Y)销售收入(X)行业名称销售利润(Y)销售收入(X)食品加工业187.253180.44医药制造业238.711264.1食品制造业111.421119.88化学纤维制品81.57779.46饮料制造业205.421489.89橡胶制品业77.84692.08烟草加工业183.871328.59塑料制品业144.341345纺织业316.793862.9非金属矿制品339.262866.14服装制品业157.71779.1黑色金属冶炼367.473868.28皮革羽绒制品81.71081.77有色金属冶炼144.291535.16木材加工业35.67443.74金属制品业201.421948.12家具制造业31.06226.78普通机械制造354.692351.68造纸及纸品业134.41124.94专用设备制造238.161714.73印刷业90.12499.83交通运输设备511.944011.53文教体育用品54.4504.44电子机械制造409.833286.15石油加工业194.452363.8电子通讯设备508.154499.19化学原料纸品502.614195.22仪器仪表设备72.46663.68以销售收入为横坐标,销售利润为纵坐标,将各制造工业数据描入二维坐标,得到图4-1。图4-1我国制造工业销售收入与销售利润散点图从图4-1中可以看出,随着工业销售收入的增加,销售利润的平均水平不断提高,同时离散程度也逐步扩大,Var(μi)与Xi成正比,即常数,说明我国制造工业销售收入与销售利润之间存在严重的异方差问题。二、异方差类型异方差通常有三种主要类型:1.递增型,即Var(μi)随的增大而增大(如图4-2)例如,以截面数据研究消费与收入之间的联系:。高收入消费主体的消费呈现出较大的随意性,低收入者的消费受收入约束而具有较小的随意性,其消费变动是很小的。体现在模型中μi的方差随的增大而增大。2.递减型,即Var(μi)随的增大而减小(如图4-3)例如,研究印刷工人的错误密度(Y)与从事工作时间(T)的关系。人们不断学习,其知识积累将与日俱增,而行动中犯错误的密度随时间增加而减少。印刷工人从事印刷工作的时间越长,错误密度越小,而且错误密度的随机涨落也越小。体现在模型中便是的方差随的增大而减小。如图4.5所示。3.复杂型,即Var(μi)随的变化呈现复杂形式(如图4-4)例如,以某一行业的企业为样本建立企业生产函数模型,产出为被解释变量,资本、劳动、技术等投入要素为解释变量,那么每个企业所处的外部环境对产出的影响则包含在随机误差项中。由于每个企业所处的外部环境对产出的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,为复杂型的一种。如图4.6所示。三、异方差产生的原因1.略去了某些重要解释变量模型遗漏了重要解释变量,那么这些变量的影响将归入随机误差项中,如果这些解释变量的变化具有异方差性,这种情况下随机误差项会表现出和那些被遗漏的解释变量相同的变化趋势,从而呈现异方差性。【相关链接】服装需求模型的建立研究人们的服装需求模型:以服装需求量为被解释变量,收入I、服装价格P和其他商品价格为解释变量,于是有:在该模型中,气候因素的影响并没有作为解释变量,其影响则包含在随机误差项中,而对于不同收入的消费者,气候变化带来的对服装需求量的影响是不同的。高收入者资金比较充足,气候变化时可以拿出来较多的钱购买服装以适应气候的变化,不同人的偏差可以较大,而低收入者的购买能力则很有限,偏差较小。于是不同收入的消费者的服装需求量偏离的均值的程度是不同的,也就是说不同收入的消费者的服装需求量具有不同的方差,这就产生了异方差。2.模型设定错误引起的异方差很多情况下,解释变量与被解释变量之间的关系比较复杂的非线性关系。如果在构造模型时用线性模型表达工资收入的关系。理论上认为,随着年龄的增长,工作经验积累,工资慢慢增加,达到顶峰后又慢慢减少,整体工资随年龄呈现倒“U”型,因此正确设定的模型为非线性关系,或者用简单的非线性模型表达复杂的非线性关系,就会造成函数形式的设定误差,进而出现异方差。模型来研究年龄和,理论上认为,随着年龄的增长,工作经验积累,工资慢慢增加,达到顶峰后又慢慢减少,整体工资随年龄呈现倒“U”型,因此正确设定的模型为建立工资收入的关系。分别表示工资收入和年龄。如果在设定模型时将模型错误的设定为此时随机误差项实际上包含了丢失变量,因此,

方差可能随变量的变化而变化,出现异方差。3.经济数据本身存在的异方差经济数据本身的异方差是指当因变量数据样本来自于不同类型的个体时,样本方差的差异。例如上面所提到的消费之间的模型:

消费规律是不一样的。高收入消费主体的消费呈现出较大的随意性,低收入者的消费受收入约束而具有较小的随意性,如靠最低生活保障收入维持生计的消费者,其消费变动是很小的。体现在模型中便是误差项的异方差。对于不同收入层次的家庭其4.测量误差一方面,测量误差常常随着时间逐渐积累,所以扰动项的方差,趋向于随时间增加;另一方面,随着抽样技术和其他数据采集技术的不断改进,测量误差以及扰动项的方差也可能随时间减少。例如相对于没有精确数据处理装备的银行,有这种装备的银行在每月或每季的账户收支说明书中会出现更少的差错。当然,这两种情况最容易出现在时间序列数据中,故由于测量误差的影响,时间序列数据建立的模型的项也容易出现异方差。四、异方差的后果1.参数估计值仍是无偏的,但不再具有最小方差性

(4-3)由上式(4-3)可以看出,只要模型满足误差项零从OLS估计值的最小方差性证明可以看出,参数估计值具有最小方差性的前提之一就是随机误差的同方差性,如果存在异方差,将不能保证OLS估计值的方差最小

均值和解释变量的非随机性,异方差的存在并不影响估计值的无偏性。。2.参数显著性检验失效在变量的显着性检验中,构造了t统计量:

如果存在异方差,OLS估计式不再具有最小方差,如果从而增大了t统计值,使拒绝原假设的可能性增加,因而t检验失去意义。F检验也是如此。在这种情况下,建立在t分布和F分布之上的参数置信区间和显著性检验也是不可靠的。仍然用不存在异方差时的OLS方式估计其方差,将会低估,3.模型的预测失效由于随机误差项样本观测值的变化而变化,将导致预测区间变大或者变小,预测功能失效。的异方差性,参数估计量的方差随着第二节异方差问题的检验

异方差性,即相对于不同的样本点,也就是相对于不同的解释变量观测值,随机误差项具有不同的方差,那么检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性。各种检验方法就是在这个思路下发展起来的。问题在于用什么来表示随机误差项的方差。一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机误差项的估计量,用ei表示。于是有一、图形检验法由于异方差指随机扰动项的方差随着解释变量的变化而变化,因此异方差反映在散点图上,就是残差平方随解释变量Xi的变化而改变。图4.7列出四种不同的散点图。其中图4.7a表示没有异方差性,图4.7b,4.7c,4.7d表示有异方差性,分别为递增型、递减型、复杂型。图4.7a同方差图4.7b递增型异方差图示检验法只能进行大概的判断,其它检验方法则更为准确。【相关链接】异方差的图形检验法【相关链接】GQ检验方法Eviews6.0软件操作步骤(数据见表4.2):第一步:首先将变量按从小到大进行排序。在Procs菜单里选SortCurrentPage命令,出现排序对话框,如果以递增型排序,选Ascenging,如果以递减型排序,则应选Descending,键入X,点ok。本例选递增型排序,这时变量Y与X将以X按递增型排序。如图4.9.3,4.9.4。第二步:构造子样本区间,建立回归模型。在本例中,样本容量n=31,删除中间1/4的观测值,即大约7个观测值,余下部分平分得两个样本区间:1—12和20—31,它们的样本个数均是12个,即。对后12个样本进行回归。在Sample菜单里,将区间定义为20—31,再用OLS方法求得如下结果,见图4.9.10图4.10.3white检验结果从图4.10.3white检验结果可以看出此外在下,查分布表,得临界值比较计算的统计量与临界值,因为>,所以拒绝原假设,接受备择假设,表明。模型存在异方差。四、Glejser检验

Glejser检验由H.Glejser于1969年提出。检验原回归式的残差的绝对值若有,则说明存在异方差;若无,则说明不存在异方差。通常应检验的几种形式:

是否与解释变量xi存在函数关系。如果哪一种形式通过了显著性检验,则说明存在该种形式的异方差。该检验要求变量的观测值为大样本。第三节异方差性的修正经检验如果发现模型中存在异方差,就要对模型进行适当的处理,因为异方差虽然不影响OLS估计的线性性和无偏性,但是它不再具有最小方差性,从而t检验不可靠,预测精度下降。因此,必须采取相应的修正补救方法以克服异方差的不利影响,下面介绍最常用的加权最小二乘法和对数变换法。一、加权最小二乘法

在该模型中,存在

。即满足同方差性。于是可以用普通最小二乘法估计其参数,得到关于参数的无偏的、有效的估计量。这就是加权最小二乘法,在这里权数就是底下我们以一元模型为例,给出几种常见的f(x)形式,看模型异方差的具体修正过程。【相关链接】异方差性的修正由上面的各种异方差检验结果可知,表4.2农业种植面积(X)对农业总产值(Y)的影响模型存在异方差,接下来将结合Eviews6.0软件操作说明如何用加权最小二乘法修正异方差。在实际Eviews操作中,我们选用三个常用的权数在EquationEstimation窗口中输入YCX,然后选择Options选项卡。在WeightedLS/TSLS前复选框上打勾,依此输入,可得3个回归结果。图4.11.1回归窗口

图4.11.2权重选项框经估计检验发现用权数模型的拟合优度最高,模型回归效果最好。下面仅给出用权数的结果。对加权最小二乘法处理后的模型残差项进行异方差检验,即在图4.11.3的回归窗口。例如选择White检验,检验结果如图4.11.5所示。由图4.11.5可知<,所以接受原假设,模型不存在异方差,经过加权后,模型消除了异方差。图4.11.5White检验结果从图4.11.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论