异方差完整案例分析_第1页
异方差完整案例分析_第2页
异方差完整案例分析_第3页
异方差完整案例分析_第4页
异方差完整案例分析_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10.5一个更完整例子让我们来看一个更完整基于横殿面异方差例子。20世纪70年代中期,美国能源部门试图基于各地过去汽油消耗量与人口变动情况以及其他一些因素给各地区、各州甚至各零售点直接分配汽油。实现这种分配必须将大量因素作为各州〔各地区〕燃油消耗量(应变量)函数而建立模型。而对于这样横截面模型,即使是估计模型,也很可能会具有异方差问题。在模型中,应变量为各州燃油消耗量,可能解释变量包括:与各州规模大小相关变量〔例如公路里程数、注册机动车数量与人口〕,以及与各州规模大小无关变量〔例如燃油税率与最高限速〕。因为在模型中反映各州规模大小变量不应多于一个〔如果包含过多变量容易导致多重共线性〕,因为有许多州最高限速一样〔但在时间序列模型中,它将是一个有用变量〕。因此,一个合理模型为:PCON=f(REG,TAiX)+e=。+PREG+PTAX+eii01i2ii〔10-20〕式中PCON——第i个州燃油消耗量〔百万BTU〕,REGi——第i个州注册机动车数量〔千辆〕,TAX——第i个州燃油税率〔美分/加仑〕,ei——经典误差项。我们可以认为一个州注册汽车数量越多,该州所消耗燃油也越多;而一个州燃油税率越高那么该州燃油消耗量越小1。我们搜集那一时1在方程中我们也可用tax*REG或者TAX*POP〔POP代表第i个州的人口〕第1页'期数据〔见表10-1〕用于估计方程〔10-20〕,得到:PCON=i551.7+0.1861REG.-53.59TAX〔0.0117〕〔16.86〕〔10-21〕R2=t=15.880.861N=50-3.18PCONUHM表10-1燃油消费例子中数据TAXREGPOPestate27097431136Maine12214774948New5811351520HampshireVermont821981337505865750953MassachusettsRhodelsland4501122583126Connecticut18198823517567NewYork1229849177427Newlersey120011672511879Pennsylvania1205763610772Ohio取代林作为方程的解释变量。我们在第节中讨论虚拟变量斜率时曾介绍了一个关于交互项的更为复杂的例子。对于一个给定的税率,它对一个大州的燃油消耗的影响要比对一个小州的影响大得多,而用反映州的规模大小的变量乘以徵x会使所得到的新变量〔交互项〕能够更好地度量这一效应。

650388454821146Indiana119872426minois7601362509116Michigan4601331624745Wiscolnsin5031332784133Minnesota3711323462906lowa571734124942Missouri1368653672NorthDakota10913615694SouthDakota20312151589Nebraska349820612408Kansas11811415600Delaware48728934270Maryland6281137055485Virginia19211421961WestVirginia6421245836019NorthCarolina3201319753227SouthCarolina67739165648Ceorgia1459883351044Florida64341026153692Kentuchy482933814656Temmessee4571130393941A;aba,a325915932569Mississippi30014812307Arkansas1417828004383Louisiana45127803226Oklahoma3572511381532Texas891319758805Montana105873977ldaho1638508509Wyoming323925023071Coiorado1921111931367Newmexico2911022162892Arizona1691110381571Utaevada5621232374276Washington364820752668Oregon2840917132469California071558319444Alaska214586997Hawaii资料来源:1958StatisticalAbstract(U.S.DepartmentofCommerce),excepttheresidual.注:DataFile=GAS10这一方程看起来没什么问题。所有系数在假设方向上都是显著,方程在统计上也是总体显著。回归结果没有给出德宾-沃森〔Durbin-Watson〕d统计值,因为这些观测值不存在“固有〃顺序因而勿需进展序列相关检验〔如果你想知道,根据表10-1中顺序所计算d统计值为2.20〕。根据前面所讨论,让我们考察方程是否存在由各州规模差异引致异方差可能性。为了检验这种可能性,我们从方程〔10-21〕中得到残差,〔这些残差被列于表10-1中〕,对其进展帕克检验。在进展帕克检验之前,我们必须首先确定比例因子z。几乎所有与规模大小有关变量都可以考虑作为比例因子z,但注

册机动车数量〔REG〕肯定是一个比拟合理选择。注意,以燃油税

率〔TAX〕作为帕克检验比例因子z将是错误,因为没有证据说明燃

第4页油税率明显随着州规模不同而变化。相反,税收总额倒是可以替代REG作为比例因子z。我们观察残差与注册机动车数量之间关系〔见图10-7〕,从残差看确可能存在潜在异方差。下一步就是要进展帕克检验:ln(e2)=a°+a1lnREG+日〔10-22〕式中e——从方程〔10-21〕中获取残差,七——经典〔具有同方差性〕误差项。见原书p373图10-7方程〔10-21〕残差异方差性如果我们把从方程〔10—21〕与表10—1中残差对应于各州注册机动车数量〔REG〕绘出散点图,发现注册机动车数量〔REG〕较大时,残差变化范围也较大,而REG较小时对应残差变化范围也较小。这种残差模式预示着存在异方差,我们必须对其进展正式检验,例如帕克检验。进展帕克检验辅助回归,我们得到:ln(e2)=1.650+0.952lnREG〔10-23〕〔0.308〕t=3.09R2=0.148N=50从统计表B-1中可以看出,在显著性水平为1%时,双侧检验t统计量临界值为2.7,这样我们可以拒绝同方差虚拟假设,因为适宜判定过程为:拒绝H0:a1=0如果|侦」>2.7不拒绝H0:如果匕如<2.7由于方程〔10-20〕残差显示存在异方差,我们应该如何处理呢?首先,我们应该考察方程设定看是否存在遗漏变量。对于这一方程,尽管存在遗漏变量可能性,但估计方程非常清晰显示出纯异方差因此,我们用变量REG作为比例因子,利用WLS方法来重新估计方程〔10-20〕:PCON/REG=P/REG+P+PTAX/REG+日ii0i12iii〔10-24〕所得到估计结果为2:PCON/REG=218.54/REG+0.168-17.398TAX./REG〔10-25〕〔0.014〕〔4.682〕t=12.27-3.71R2=0.333N=50把所得到结果与方程〔10—21〕认真进展比拟,注意:1方程〔10-25〕中1/reg斜率系数实际上是方程〔10-21〕中截2注意这时整个方程两边都除以了reg。这实际上是假定误差项为e=Z口。然而,帕克检验中lnREG的系数接近于1,显示误差项适当的函数形式应为旗,当然我们也不能仅仅根据帕克检验中的系数就采取该种形式的变换。如果理论根底支持这种形式的变换,那么整个方程两边应该除以、Z,但在本例中,理论并不支持这样的变换。要更深入地了解这一问题,请参考脚注7。距。因此,尽管在OLS估计程序中它被当作一个斜率系数对待,但这里并没有计算其t统计值。2方程〔10-25〕中截距项实际上是方程〔10-21〕中人归弓斜率系数。注意,我们所得到估计值在大小与显著性上都与方程〔10-21〕中结果很接近。3在WLS估计方程中,比例因子REGt统计值比其在潜在异方差方程〔10-21〕中t统计值要小;总体拟合优度也较低,但这一点非特别重要,因为两个方程应变量并不一样。然而,正如在节中所提到,为了防止由于样本规模差异导致谬误相关所引起异方差,可供选择方案是重新思考回归目与对方程变量进展重新定义。如果对方程〔10-20〕进展重新考虑,我们能用人均汽油消耗量作为应变量,得到:PCON/POP=P+PREG/POP+PTAX+eii01ii2ii〔10-26〕式中,pop,——第i个州人口〔单位:1000人〕我们重新构造方程方式类似于WLS,但方程变换是有其理论支持。我们对方程〔10-26〕进展估计,得到:PCONA/POP=0.168+0.1082REG/POP-0.0103TAXiiiii〔10-27〕(0.0716)(0.0035)t=1.51-2.95R2=0.165N=50如果我们把方程〔10-27〕与方程〔10-21〕、〔10-25〕进展比拟,发现方程〔10-27〕结果并不一定比其他方程好,但也有明显不同。虽然不能直接与其他方程相比拟,但方程〔10-27〕统计性质并没有应有强度(大小),不过方程统计性质并不一定是决定〔是否应使用变换方程,译者注〕因素。哪个模型更好一些呢?是未经调整具有潜在异方差原始模型,还是使用加权最小二乘法模型,或者是根据理论进展重新设定模型?这取决于你研究目。如果你研究目是考察税率对汽油消费影响,就系数符号与显著性而言,这三个模型实质上给出了一样结果,但后两个模型防止了异方差。如果你研究目是要考察分配给各州汽油总量,那么原始模型是一个较好选择。在大多数情况下,如果方程存在很严重异方差,对方程进展修正是必要,但是具体是选用WLS还是对方程进展重新设定,那么应视具体问题而定。我们发现,如果方程重新设定具有直观意义,那么它通常就是纠正异方差最好方法,因为它防止了凭主观臆断来选择比例因子z。最后,对于这个例子,我们采用最流行补救措施——校正异方差标准误。我们从方程〔10-20〕开场,应用怀特建议方法估计se(&),在存在异方差时,该估计量具有最小方差性〔对于大样本而言〕。我们得到:PCON=551.7+0.1861REG.-53.59TAX〔10-28〕〔23.90〕〔〔23.90〕t=8.64—2.24R2=0.86N=50比拟方程〔10-28〕与方程〔10-21〕。注意,正如你所预料那样,他们斜率系数是一样,这是因为HC程序也是用OLS方法估计系数。还要注意到,通过HC程序估计se(6)比OLS方法估计SE(我)要大〔通常情况下经过校正SE(我)比未经校正SE(我)要大,但也不是绝对〕。尽管所得出t统计值较低,但它们在我们所预期方向上仍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论