版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一章异方差性第一节异方差的性质1同方差同方差性意谓等同的分散程度,亦即相等的方差,用符号表示为
E(u2i)=
2i=1,2,3……2异方差模型:y=b0+b1x1+b2x2+...bkxk+u
其中
i=1,2,3……前面的同方差的假设,隐含着扰动项u的方差条件于解释变量是常数如果这个假设不成立,即对于x的不同的值u的方差不同,那么扰动项就是异方差如果出现:
即对于不同的样本点,随机误差项的方差不再是常数,则认为出现了异方差性。
说明回归分析,是在对线性回归模型提出若干基本假设的条件下,应用普通最小二乘法得到了无偏的、有效的参数估计量。但是,在实际的计量经济学问题中,完全满足这些基本假设的情况并不多见。如果违背了某一项基本假设,那么应用普通最小二乘法估计模型就不能得到无偏的、有效的参数估计量,OLS法失效,这就需要发展新的方法估计模型。如果随机误差项序列不具有同方差性,即出现异方差性。
同方差性干扰
.x
x1x2yf(y|x)x3..E(y|x)=b0+b1x异方差的例子
下述为ui方差变化的理由:1按照边错边改的学习模型,人们在学习过程中,其行为误差随时间而减少。在这种情况下预料的
2会减小。如下图这是一个打字练习:图11.3异方差性展示2随着收入增加
备用收入增加可支配收入增多人们对其储蓄行为有更多的选择,
2与收入同时增加3数据采集技术的改进4异方差还会因为异常值的出现而产生异常值:一个超越正常的范围的观察值,是指和其他观察值相差很多。例:下面是对20个国家在第二次世界大战后直至1969年期间的股票价格Y和消费者价格X的百分率进行描点。5CLRM假定9的破坏,即回归模型设计是不正确的。例:6模型中一个或多个回归元的分布偏态(skewness)。如收入,财富,教育等7异方差的其他来源:1不正确的数据变形
2不正确的函数形式下图是美国在1950—2000年期间的GNP,消费支出,储蓄或就业数据。我们可以通过上述表格描出每个职工薪金的标准差和平均薪金第二节出现异方差性时的OLS估计
双变量模型Yi=
1+
2Xi+ui
2的OLS估计量是:但现在的方差是
这显然不同于同方差性假定下的常用方差性公式:第三节广义最小的二乘法1广义最小二乘法产生的原因----常用的OLS方法无法采取对自变异较大的总体的观察测值做较小的加权,对来自较小的总体的观测值做较大的加权。(而这种策略更为准确)2广义最小二乘明确利用上述的思想,能产生BULE估计量为了了解其如何做到这一点,我们来继续利用双变量模型可导出其中带星号变量或转换变量为原始变量
i。转换的作用:先将原始变量转换成满足经典模型假设的转换变量,然后对他们使用OLS程序,较做广义最小二乘法。概括的说,GLS是对满足标准最小二乘假定的转换变量的OLS。如此得到的估计量叫做GLS估计量。这些估计量是BLUE。
最小化
2。的GLS估计量为:方差为OLS和GLS的区别OLS的最小化:GLS要求我们最小化表示式
在GLS中我们最小化一个以1/
2为权的一个加权残差平方和,而OLS中我们最小化一个无权的或等权的残差和。图11.3.11中最小化一个加权RSS,故适宜于称它为加权最小二乘。而由上述得到的估量值称为WLS估量值。第四节出现方差性时使用OLS的后果考虑异方差性的OLS估计按照上述公式,是否就可利用平常的t和F检验建立置信区间并检验假设呢?一般地说,回答是否定的因为,可证。这就是说,根据做出的置信区间将是无谓的过大。其结果是,t和F检验很可能给我们提供了不准确的结果:因为明显过大的使本来显著的系数变成了统计上不显著的。忽视异方差的OLS估计如果我们忽视异方差性而一味使用惯常的检验程序,则无论我们得出什么结论或做出什么推断,都可能产生严重的误导。为使问题的讨论更加明朗,我们引用戴维森和麦金农所做的一个蒙特卡罗实验。他们考虑一个简单的模型,可用我们的符号表示如下:假定最后的一个式子表明误差方差是异方差性的,并且它的值是回归元X值的α次方。现对所选的一些α值,把它们的结果列表如下:
这些结果的最令人注目的特点是,不管是否考虑对异方差性的修正,OLS一致地过高估计了由(正确的)GLS程序得到的真实标准误,尤其以大的α值为甚,从而确立了GLS的优越性。这些结果还表明,如果我们不用GLS而只用OLS,不管是否考虑到异方差性,情况都不是清晰的。一个技术性注解尽管我们曾经说过,在异方差情形中,GLS是BLUE,而OLS不是,但在有些例子中OLS在异方差情况下仍然是BLUE。只是这种例子在实践中并不多见。异方差性的侦察
我们怎样知道在一个具体的情况中是否有异方差性?
和多重共线性相类似,此并不存在有侦破异方差性的严明的法则,只有少数的经验规则。但是这种结局是不可避免的,因为除非我们知道对应于选定X值的整个Y总体,否则计是无从获知的。然而,在经济研究中这样的数据(总体)照例是得不到的,除非是例外。由上可知,在大多数的计量经济调查研究中,异方差性不过是一种直觉,深思熟虑的猜测,先前经验或纯粹猜想。下面我们来列举一些非正式或正式的侦察异方差性的方法。非正式方法问题的性质。往往根据所考虑问题的性质就能判别是否会遇到异方差性。例如,普雷斯(Prais)和霍撤克(Houthakker)在一项家庭预算研究中发现,围绕消费对收人的回归,残差的方差随收人增加而增加。仿效这一开拓性的工作,现在人们一般都假定在类似的调查中可以预期不同干扰之间有不相等的方差。事实上,在涉及不均匀单元的横截面数据中,异方差性可能是一种常规而不是例外。例如,在投资与销售量、利率等关系的横截面分析中,如果样本同时含有小、中和大型厂家,一般都预期有异方差性。
图解法。如果对异方差性的性质没有任何先验或经验信息,实际上,可先在无异方差性的假定下做回归分析,然后对残差的平方
做一事后检查,看看这些ui2是否呈现任何系统性的样式。虽然
还不等于ui2
,但可作为一种替代变量,特别是当样本含量足够大时。对外的检查可能出现诸如下图的那些样式。四帕克检验法(Parktest)(1)思路:帕克检验法的基本思想是把残差图法加以形式化,给出
2i关于Xi的具体函数结构形式,然后检验这种结构是否显著。从而判定是否具有异方差性及其异方差的函数结构。(2)具体做法如下:步骤一,建立被解释变量Y对所有解释变量X的回归方程,然后计算残差步骤二,取异方差结构的函数形式为其中,
2,ß是两个未知参数,是随机变量。将上式改写成对数形式步骤三,建立方差结构回归模型上式改写为:对模型应用OLS法,得出ß和α的估计值。步骤三,对ß进行t检验。如果ß不显著,则表明ß的真值为零,此时
2i实际上与Xi无关,即不存在异方差性。否则,表明有异方差性存在。例:酬金与劳动力的关系,我们利用11.1的图表做下述回归:其中i=第i企业就业人数,回归的结果如下:
1992.3452+0.2329Xise=(38.319)(4.216)t=(0.934)(-0.667)R2=0.0595将得自回归的残差用于帕克检验的方程中,得如下结果:35.817–2.8099lnXise=(38.319)(4.216)t=(0.934)(-0.667)R2
=
0.0595五格莱泽检验法(Glesjertest)(1)思路:同上面我们刚刚谈到的帕克检验法类似,格莱泽检验法也是通过建立与之间X的关系,而对新模型进行估计的。不同的是,帕克检验法中,与X之间的关系是给定的,而格莱泽检验法则是用同时去拟合若干种函数,将其中显著成立的函数关系,作为异方差结构的函数形式。(2)其具体步骤如下:步骤一,建立被解释变量Y对所有解释变量的回归方程,然后计算残差步骤二,若X被认为是与V(u)有关的解释变量,则选定与X的一系列可能的函数,例如:
步骤三,利用OLS法对上述函数进行估计,然后计算每个回归方程的拟合优度,把最大的作为最佳拟合的回归形式。步骤四,对最佳回归形式中的参数进行显著性检验。若显著异于0,则表明存在异方差性;否则再试其它形式,而不能轻易断定不存在异方差性。例:薪金与生产力的关系:格莱泽检验我们还是用同一个例子将所得残差的绝对值对平均生产力回归
407.2783–0.0203Xise=(633.1621)(0.0675)r2=0.01272t=(0.6432)(-0.3012)斯皮尔曼的等级相关经验。等级相关关系:其中di=第i单元或现象的两种不同的特性所处的等级之差步骤一:对Y和X的数据做回归拟和并求出残差步骤二:求残差的绝对值并和Xi按递升或递降次序划等级,然后计算上述斯皮尔曼的等级相关系数。步骤三:假定总体等级相关系数为0,且n>8,样本rs的显著性可通过下述方程检验:其中自用度df=n-2
例等级相关检验的说明。为说明等级相关检验,考虑下表中的数据。此数据包含了10个共同基金的平均年回报(E,%)及其标准差(σ,%)。投资组合理论中的资本市场线假定期望收益(Ei)和风险(用标准差σ来度量)之间有如下线性关系:利用表中的数据,估计上述模型,并从中计算出残差。由于数据涉及规模与投资目标都不相同的10个共同(互助)基金,人们会先验地预料着异方差性。为检验此假设,现利用等级相关技术。应用公式得:
戈德菲尔德—匡特检验。这一广为流传的方法适用于异方差性方差
2i
同回归模型中解释变量之一有正向关系的情形。为简单起见,考虑通常的双变量模型:假使
2i
的正向关系为:为了做出明确的证明步骤如下:根据上述方法,如果在一项应用中,计算的入(=F)值大于选定显著性水平的临界F值,就可拒绝同方差性假设,就是说异方差性看来很可能出现了。例:下表展示了一个30户家庭的横截面相对于收入的消费支出数据。对头13个观测值作回归:
=3.4094+0.6968Xi
(8.7049)(0.0744)r2=0.8887RSS1=377.17df=11对末13个观测值作回归:
=-28.0272+0.7941Xi(30.6421)(0.1319)r2=0.7681RSS2=1536.8df=11我们可知=4.07布劳殊—培干—戈弗雷(Breusch-Pagan-God{fey)检验。戈德菲尔德—匡特检验的成功不仅依赖于c值(被省略的居中观测值个数),还依赖于用以排序的X变量的正确识别。如果我们考虑布劳殊—培干—戈弗雷(BPG)检验,则可避免这种检验的局限性。为说明这种检验,考虑是变量线性回归模型:
假定误差方差σ2有如下函数关系:
假定:即σi2是诸Z的一个线性函数。如果,则才此为一常数。因此,为了检验σi2是否同方差性,就可检验假设0这就是布劳殊—培干检验的基本思想。具体检验步骤如下:
步骤1.用OLS估计上页的1式并得到残差步骤2.计算。回顾第4章知这是
2的最大似然估计量。步骤3.按以下定义构造Pi:
这不外是将每个平方残差除以步骤4.将如此构造的Pi对诸Z回归:
其中νi是回归的残差项。步骤5.从上式求出ESS(解释平方和)并定义:
假定是正态分布的。可以证明,如果有同方差性,当样本大小n无限增大时,则:就是说,遵循自由度为(m—1)的分布。怀特的一般异方差性检验。戈德菲尔德—匡特检验要求按照被认为是引起异方差性的X变量把观测值重新排序,而BGP检验则易受偏离正态性假定的影响。怀特所提出的检验,不同于这两个检验,并不要求排序也不依赖于正态性假定,而且易于付诸实施。为说明其基本思想,考虑如下的三变量回归模型:
步骤1.对给定的数据,估计(11.5.21)并获得残差。步骤2.再做如下(辅助)回归:
就是将得自原始回归的平方残差对原始诸X变量或回归元、它们的平方和交叉乘积做回归,还可引进回归元的高次方。步骤3.在无异方差性的虚拟假设下,可以证明,从辅助回归算得的R2乘以样本大小(n),渐近地遵循自由度等于辅助回归中的回归元
(不包括常数项)个数的X2分布,即:其中df的定义如前。在本例中,因辅助回归中有5个回归元,故有5个自由度。步骤4.如果(11.5.23)中算得的X’值超过选定显著性水平的临界X2值,结论就是有异方差性。如果不超过,就算没有异方差性,也就是说,在辅助回归(11.5.21)中例11.6做怀特异方差性检验。根据41个国家的横截面数据,S.刘易斯(StephenLewis)估计了如下回归模型
其中Y=贸易税收(进口与出口税收)/
政府总收入,X2=进出口总和/GNP,X3=人均GNP。他的假设是y与X2有正向关系(贸易额越高,贸易税收越高),并且y与X3有负向关系(随着收入增大,政府发现直接税——如所得税——比贸易税更易于征收)。经验结果支持了这些假设。对我们来说,重要的问题是数据中有没有异方差性。由于数据是涉及多个相异国家的横截面数据,人们会先验地预期误差方差中的异方差性。将怀特的异方差性检验应用于从回归(11.5.24)得到的残差,得到如下结果
R2=0.1148
怀特检验可能是(纯粹)异方差性的一个检验,或者是设定错误的一个检验,或者两者兼有。
其他异方差性检验。还有若干个其他异方差性检验,每个都依赖于一定的假定。我们只提出其中的一种,因为它特别简单。这就是寇因克—巴塞特(Koenker-Bassett)检验(KBtest)。具体而言,若原模型是:估计此模型并从中得到u2i,然后估计第六节补救措施
正如已经看到的,异方差性虽然不损坏OLS估计量的无偏性和一致性,但却使它们不再是有效的,甚至不是渐近(即在大样本中)有效的。效率的缺乏使得通常的假设检验程序变成可疑。因此,补救措施显然是需要的。补救方法可分两种:
2i为已知和
2i为未知当
2i
为以已知:加权最小二乘法正如在11.3节所看到的,如果已知
2i
,纠正异方差性的最明显方法,就是采取加权最小二乘,因为这样一来,得到的估计量是BLUE。例11.7加权最小二乘法说明。为说明此法,假定我们要针对表11.1中的数据,研究酬金与就业人数之间的关系。为简单起见,我们用1表示就业人数(1—4个职工),2表示(5~9个职工),……9表示(1000~2499个职工)。我们还可用表中各组就业人数的组中值表示就业人数。现令Y代表平均每职工酬金(美元),而X代表就业人数,我们做以下回归:计算必需的原始数据由下表给出WLS的回归结果如下:
()=3406.639(1/
i)+154.153(Xi/
2i
)
(80.983)(16.959)t=(42.066)(9.090)R2=0.9993131下面是不加权的OLS回归结果:
=3417.833+148.767Xi(81.136)(14.418)t=(42.125)(10.318)R2=0.9383当
2i
为未知时前所说,若已知真实的
2i
。我们可用WLS法得到BLUE估计量。但由于真实的
2i鲜为人知,我们可以找到方法使在有异方差性的情形下,也能获得OLS估计量的方差和协方差的(统计上)一致性估计。怀特的“异方差性相一致”的方差与标准误。怀特曾证明,可以做出这样一种估计,它可以对真实的参数值做出渐近(即大样本)有效的统计推断。怀特的经异方差性校正的标准差又被称为稳健标准误(robuststandarderrors)。例11.8怀特程序的说明。作为一个例子,我们引用格林(Greene)的一些结果如下:
=832.91-1834.2(收入).04(收入)2OLSse=(327.3)(829.0)(519.1)t=(2.54)(2.21)(3.06)怀特se=(460.9)(1243.0)(830.0)t=(1.81)(一1.48)(1.91)其中Y=1979年各州公共学校人均支出,收入=1979年各州人均收入。样本由50个州及华盛顿特区构成。以上数字结果表明,经(怀特)异方差性校正的标准误比OLS标准误大得多,因而所估计的2值比得自OLS的要小得多。根据后者,两个回归元都在5%水平上统计上显著,而根据怀特估计量则不然。但应指出,怀特的经异方差校正的标准误可能大于或小于未校正标准误。关于异方差性模式的可能假定。怀特程序除了本身是一个大样本程序外,还有一个缺点,就是这样得到的估计量,不如先按异方差性的类型做数据变换,再做估计来得有效。为说明这点,让我们再回到双变量回归模型:我们现在考虑关于异方差性模式的几种假设。假定1:误差方差正比于Xi2
(11.6.5)对原型作变换
其中=
可证:从而的方差是同方差性的,并可对变换方程施行OLS。假定2:误差方差正比于Xi。平方根变换:如果的方差正比于Xi本身,可作变换得:易证为同方差性情形,可按OLS对上式进行假定3:误差方差正比于Y均值的平方此时:假定4,和回归相比,诸如:这样一个对数变换常常能减低异方差性。
这样的结果之所以出现,是因为对数变换压缩了测量变量的尺度,把两个值的10倍之差降低到约2倍之差。例如,数值80十倍于数值8。但In80(=4.3280)仅约两倍于Ins(=2.0794)。
对数变换的另一优点是,斜率系数召:测出Y对x的弹性,即对应于x的1%的变化,Y的百分比变化。例如,Y是消费而X是收人,(n.6.12)中的月:将测出收人弹性,而在原始模型中,月2仅测出对应于收人的一单位变化,平均消费的变化率。这就是为什么对数模型在经验计量经济学中广为应用的一个理由。(我们所考虑的变换还有其他的一些问题:1当我们越出双变量模型的范围时,先验证选择x变量去变换数据。2最后一个假定中,当某些X和Y值为0或负数时不]适用。3还有一个谬误相关的问题。谬误相关是指即使原始变量是不相关或随机的,但变量的比率却被发现有相关关系的情形。4当
2i
无法直接得知而要从前面讨论的一个或多个变换中做出估计时,所有用到t检验,F检验等检验程序时,都只是对大样本有效。第七节总结性的例子
在结束我们对异方差性的讨论时,我们用两个例子说明侦察它的各种方法以及对它的一些补救措施。例11.9再看儿童死亡率一例让我们再次回到曾考虑过几次的儿童死亡率一例。我们从64个国家的数据得到方程(8.2.1)中所示的回归结果。由于数据是横截面数据,涉及的国家在儿童死亡率上有不同的表现,所以很可能会出现异方差性。为探明究竟,首先看从方程(8.2.1)中得到的残差。这些残差画在图11.12中。从图上看,残差没有显示出任何存在异方差性的明显形式。尽管如此,表象仍可能有欺骗性。所以,我们用帕克、格莱泽和怀特检验,看是否有异方差性的证据。帕克检验由于有两个回归元GNP和FLR,所以我们可以将回归(8.2.1)中残差的平方对其中任意一个回归,或者将它们对回归(8.2.1)中估计出来的CM值做回归。利用后者,我们得到如下结论:格莱泽检验将(8,2.1)中所得到残差的绝对值对同一回归所估计的CM值做回归,得到如下结论:同样,由于斜率系数的,值并非统计显著,所以残差的绝对值与估计的CM值之间没有系统的关系。
怀特检验应用含有和不含交叉项的怀特异方差性检验,我们没有发现任何异方差性证据。我们也重新估计(8.2.1)以得到怀特异方差一致的标准误和f值,结论与方程(8.2.1)中给出的那些结论十分相似,从我们前面所做的各种异方差性检验来看,无足为奇。总之,儿童死亡率回归(8.2.1)看来不存在异方差性的问题。例:1988年美国18个产业群体的R&D支出、销售额和利润表11.5给出了美国18个产业群体研发支出、销售额和利润方面的数据,所有数据都以百万美元计。由于表中横截面数据差别很大,所以在R&D对销售额(或利润)的回归中就可能出现异方差性。回归结果如下:无足为奇,R&D与销售额之间有明显的正相关关系。为了看出回归(11.7.3)是否遇到异方差性的问题,我们从上述回归中得到残差及其平方,并相对销售额进行描点,示于图11.13。从此图来看,残差及其平方与销售额之间有系统关系,可能表明存在异方差性。为规范地进行检验,我们使用帕克、格莱泽和怀特检验,并给出如下结果:帕克检验
se=(4802343)(40.3625)r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025注册公司租房合同范本下载
- 2025电梯维修保养合同
- 2025劳动合同订立的时间
- 营商环境与国际贸易-洞察分析
- 招聘文案写作课程设计
- 油画树直播教学课程设计
- 2024年白酒品牌保护合同3篇
- 特殊教育美术课程设计
- 电池包课程设计
- 礼仪与管理课程设计案例
- 湖北省十堰市2023-2024学年高二上学期期末调研考试 地理 含答案
- 重庆市2023-2024学年六年级上册语文期末测试试卷(含答案)3
- 水下土方疏浚(水力冲挖)施工方案
- 以往马克思主义中国化进程与青年学生使命担当(2022年春)学习通超星期末考试答案章节答案2024年
- 人工智能与信息社会学习通超星期末考试答案章节答案2024年
- DB13(J) 148-2012 建筑地基基础检测技术规程
- 2023浙教版小学劳动一年级上册教学设计(含目录)
- 2024年江西三校生对口升学考试语文试卷真题(含答案详解)
- 【《现金流视角下的绿地集团财务风险防范探究(定量论文)》11000字】
- 重大事故隐患判定标准与相关事故案例培训课件
- 2024至2030年中国冲调饮料行业市场深度研究及投资规划建议报告
评论
0/150
提交评论