异方差性和自相关.ppt_第1页
异方差性和自相关.ppt_第2页
异方差性和自相关.ppt_第3页
异方差性和自相关.ppt_第4页
异方差性和自相关.ppt_第5页
已阅读5页,还剩177页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/2/1,1,在前面讨论的回归模型中都有一些基本的假定。只有当一个回归模型满足经典假定条件时,才能得到一个较好的估计。然而,在研究实际的社会经济等问题时,经常会遇到一些违背经典假定的情况。,第三章 异方差性和序列相关,2019/2/1,2,在这些情况下,如果直接用普通最小二乘法建立模型,会得到很不理想的结果。因此,如何处理这些问题,就是我们需要面对的问题。,2019/2/1,3,第三章 异方差性和序列相关,主要内容: 第一节 异方差性 第二节 序列相关,2019/2/1,4,根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下: 式中 Y 表示卫生医疗机构数(个),X 表示人口数量(万人)。,引子:更为接近真实的结论是什么?,第一节 异方差性,2019/2/1,5,模型显示的结果和问题,人口数量对应参数的标准误差较小; t统计量远大于临界值,可决系数和修正的可决系 数结果较好,F检验结果明显显著; 表明该模型的估计效果不错,可以认为人口数量 每增加1万人,平均说来医疗机构将增加5.3735个。 然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?,2019/2/1,6,在回归模型的基本假设中,假定随机误差项u1,u2,un 具有相同的方差,独立或不相关,即对于所有样本点,有:,(3.1),一、异方差性的概念和产生的原因,(一)异方差性的概念,2019/2/1,7,但是在建立实际问题的回归模型时,经常存在与此假设相违背的情况,一种是经济计量建模中常说的方差非齐性或异方差性,即:,当 时,(3.2),2019/2/1,8,异方差性: 在线性模型的基本假定中,关于方差不变的假定不成立,其他假定不变的情形称为异方差性。,2019/2/1,9,(二)异方差产生的原因,实际问题是非常错综复杂的,因而在建立实际问题的回归分析模型时,经常会出现某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响,导致随机误差项产生不同方差。通过下面的几个例子,我们可以了解产生异方差性的背景和原因。,2019/2/1,10,【例1】按照差错学习模式,当人们学习时,动作上出现的差错随时间的增加而逐渐减少。如在某一时期内测验打字差错数(Y)与打字实习小时数(X)之间的关系。随着打字实习小时数的增加,打字差错平均字数及它们的方差不是不变的,而是随之减少的。这个模型中就出现了异方差。,2019/2/1,11,【例2】在研究城镇居民收入与消费的关系时,我们知道居民收入与消费水平有着密切的关系。用 Xi 表示第 i 户的收入,Yi 表示第 i 户的消费额,那么反映收入与消费之间的模型为:,(3.3),2019/2/1,12,在式(3.3)的模型中,因为各户的收入不同,消费观念和习惯的差异,导致消费的差异非常大,模型中存在明显的异方差性。一般情况下,低收入的家庭购买差异性较小,大都购买生活必需品;但是高收入的家庭购买行为差异就很大,高档消费品很多,房子、汽车的规格选择余地也很大,这样购买金额的差异就很大;导致消费模型的随机误差项具有不同的方差。,2019/2/1,13,【例3】利用某行业的不同企业的截面样本数据估计生产函数,(3.4),由于这里的u表示了包括不同企业的工艺、地理条件、工人素质、管理水平上的差异以及其他因素,对于不同企业,这些因素对产出的影响程度不同,引起ui偏离均值的程度不同,出现了异方差。,2019/2/1,14,引起异方差的原因还有很多,如模型中省略了重要的解释变量,模型的函数形式设定不准确等都容易产生异方差。一般情况下样本数据为截面数据时容易产生异方差性。,2019/2/1,15,二、异方差产生的后果,当一个回归模型中的随机误差项存在异方差时,是否可以继续使用普通的最小二乘法?倘若我们仍然使用,将会产生什么样的后果?,2019/2/1,16,当模型中存在异方差时,估计量 的方差将大于在同方差条件下的方差。如果用普通最小二乘法估计参数,将出现低估 的真实方差的情况。进一步将导致回归系数的检验值高估,可能造成本来不显著的某些回归系数变成显著。这将给回归方程的应用效果带来一些影响。,2019/2/1,17,当模型中存在异方差时,普通最小二乘估计存在以下问题。,2019/2/1,18,1.参数估计量虽是无偏的,但不是最小方差线性无偏估计 根据经典线性回归中关于参数估计量的无偏性和有效性的证明过程,可以看出,当线性回归模型出现异方差性时,其普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。,2019/2/1,19,2019/2/1,20,3.回归方程的应用效果极不理想,或者说模型的预测失效。 一方面,由于上述后果,使得模型不具有良好的统计性质;另一方面,在预测值的置信区间中也包含有随机误差项共同的方差 。所以,当模型出现异方差性时,它的预测功能失效。,2019/2/1,21,三、异方差性的检验,对于异方差性的检验,人们进行了大量的研究,提出的诊断方法已有十多种,但没有一个公认的最优方法,下面介绍几种常见的方法。,2019/2/1,22,(一)残差图分析法,2019/2/1,23,图3.1,2019/2/1,24,图3.2,2019/2/1,25,2019/2/1,26,在EViews软件包中,直接给出了以ei 为纵坐标,以观测时间或序号为横坐标的残差图。,2019/2/1,27,如果回归模型适合于样本数据,那么残差ei 应反映ui 所假定的性质,因此可以根据ei 来判断回归模型ui 是否具有某些性质。一般情况下,当回归模型满足所有假定时,以ei 为纵坐标的残差图上的n 个点散布应是随机的、无任何规律。,2019/2/1,28,等级相关系数法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既适用于大样本,也适用于小样本。将异方差性与误差项和某个解释变量之间相关程度联系起来,从而将对异方差性的研究转化为对它们之间相关程度的研究。,(二)等级相关系数法,2019/2/1,29,进行等级相关系数检验通常 有三个步骤:,第一步,作Y 关于X 的普通最小二乘估计,求出ui 的估计值,即ei 的值。,2019/2/1,30,第二步,取ei 的绝对值,即 ,把 和 按递增或递减的次序划分等级。按下式计算出等级相关系数,(3.5),其中,n为样本容量,di 为对应于Xi 和 的等级的差数。,2019/2/1,31,第三步,做等级相关系数的显著性检验。在n8的情况下,用下式对样本等级相关系数 rs 进行t 检验。检验的统计量为,(3.6),2019/2/1,32,如果 ,则可以认为异方差性问题不存在,如果 ,说明 Xi 和 之间存在系统关系,则说明模型中存在异方差。,2019/2/1,33,在多元的情况下,需对每一个解释变量做等级相关系数检验。只有当每个解释变量检验都不存在异方差时模型中才不存在异方差。否则,模型中存在异方差。,2019/2/1,34,首先将样本按某个解释变量的大小顺序排列,并将样本从中间截成两段;然后各段分别用普通最小二乘法拟合回归模型,并分别计算各段的残差平方和。,(三)戈德菲尔德匡特(Goldfeld-Quandt)检验(样本分段比检验),2019/2/1,35,令第一段为高方差段,第二段为低方差段,并记两段的样本容量分别为n1 和n2,模型参数个数为k,两段样本回归残差分别为e1i和e2i,则两段的残差平方和分别为 和 ,从而可计算出各段模型的随机误差项的方差估计量分别为 和,2019/2/1,36,由此可构造出检验统计量为,(3.7),2019/2/1,37,该统计量服从自由度为(n1-k)和(n2-k)的分布。在给定的显著性水平 之下,若此统计量的值大于临界值 则可认为有异方差的存在。,2019/2/1,38,为了提高此检验的功效,戈德菲尔德和匡特曾经建议,将观测样本分成两段时,可将中间的部分数据删掉。然而,删掉的数据越多,各段中估计的自由度就越小,从而又会影响检验的功效。因此,删掉的中间部分数据也不能太多。一般地,删掉的数据不应多于样本观测数据的/3。,2019/2/1,39,用残差绝对值 对每个解释变量建立各种回归模型,如,等等,并检验回归系数 是否为。,(四)戈里瑟(Glejser)检验,2019/2/1,40,设原假设为 备择假设为 ,应用t 检验判断,如果, 则有异方差。这种方法不仅能检验出模型中存在的异方差,而且把异方差的表现形式找出来便于后面改进时使用。,2019/2/1,41,(五)怀特(White)检验,用残差平方 对所有解释变量及其平方项和交叉乘积项 进行线性回归,并检验各回归系数是否为。,2019/2/1,42,对于两个解释变量的回归模型,(3.8),怀特检验步骤如下: 第一步,使用普通最小二乘法估计模型(3.8),并获得残差 ei 。,2019/2/1,43,第二步,做如下的辅助回归,(3.9),就是将残差ei 的平方 对所有的解释变量及解释变量的平方与交叉积回归,求这个辅助回归的判定系数 R2 。,2019/2/1,44,第三步,在无异方差的原假设下,可以证明,辅助回归的 R2 乘以样本容量n,渐近地服从自由度为辅助回归中解释变量个数 r(不包括常数项)的x2分布,即,(3.10),在本例中,辅助回归有5个解释变量,因此r =5。,2019/2/1,45,2019/2/1,46,(六)ARCH检验,2019/2/1,47,3、ARCH检验的基本步骤,2019/2/1,48,2019/2/1,49,四、异方差性的修正办法,当我们所研究的问题存在异方差性时,就违背了线性回归模型的经典假定。此时,就不能用普通最小二乘法进行参数估计,必须寻求适当的补救方法,对原来的模型进行变换,使变换后的模型满足同方差性假定,然后进行模型参数的估计,就可得到理想的回归模型。,2019/2/1,50,我们考虑一元线性回归模型,(3.11),加权最小二乘法,2019/2/1,51,2019/2/1,52,由于,通过加权变换使误差项变成同方差了。,2019/2/1,53,如果模型的其他假定条件都满足,则模型(3.12)就变成满足经典假定的回归模型了,就可利用普通最小二乘法估计参数,得到的估计量是最佳线性无偏估计量。,2019/2/1,54,通过加权变换使原模型中的异方差误差项转换为同方差误差项,使加权变换后的模型满足最小二乘法的假定,从而使用普通最小二乘法估计参数,这种方法称为加权最小二乘法。,2019/2/1,55,(二) 未知时,如果 是未知的,一般情况下,我们可根据误差与解释变量或被解释变量的关系来确定变换的权数。一般我们先采用戈里瑟检验方法确定ei 与Xi 之间的关系。,2019/2/1,56,1如 之间为线性关系,则可认为,(3.13),这时,选择 为权数,即对模型(3.11)两边同时乘以 ,将异方差模型变为同方差模型。,2019/2/1,57,即将模型(3.11)变为,(3.14),2019/2/1,58,2019/2/1,59,2如 之间为线性关系,则可认为,(3.15),2019/2/1,60,这时,选择1/Xi为权数,可将模型(3.11)变换为如下模型:,(3.16),2019/2/1,61,2019/2/1,62,五、案例分析(一),现有2001年北京市规模最大的41个百货零售商店的商品销售收入和利税总额资料如表3.1所示。,2019/2/1,63,表3.1 北京市41家最大百货商店销售资料 单位:万元,2019/2/1,64,续表,2019/2/1,65,2019/2/1,66,利用普通最小二乘法,根据表3.1中的数据,我们可以估计出该回归方程为,(3.17),2019/2/1,67,根据此回归方程,可以求出利税总额的回归估计值和残差 ,然后将销售收入Xi 作为横坐标,残差ei 为纵坐标,画出回归残差图。从残差图看,残差有不断扩大的趋势,ui 存在明显的异方差性。,2019/2/1,68,图3.3 残差图,2019/2/1,69,我们运用戈里瑟检验,可得如下的残差回归方程:,(3.18),2019/2/1,70,(3.19),很明显,对这二个残差回归方程的回归系数的显著性检验,均拒绝同方差假设,表明存在异方差性。,2019/2/1,71,2019/2/1,72,对变换后的模型使用普通最小二乘法得到如下结果:,(3.20),2019/2/1,73,对比加权最小二乘估计式(3.20)与普通最小二乘估计式(3.17),我们发现斜率系数相差很小,但加权最小二乘估计的标准误(0.011)要小于普通最小二乘估计的标准误(0.012),说明在有异方差的情形下,普通最小二乘估计高估了估计量的标准误。,2019/2/1,74,最后,我们得到的最终模型应为,(3.21),2019/2/1,75,案例分析(二),一、问题的提出和模型设定 为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。 假定医疗机构数与人口数之间满足线性约束,则理论模型设定为: 其中 表示卫生医疗机构数, 表示人口数。,四川省2000年各地区医疗机构数与人口数,2019/2/1,77,二、参数估计,估计结果为:,2019/2/1,78,三、检验模型的异方差,(一)图形法 1. EViews软件操作 由路径:Quick/Qstimate Equation,进入 Equation Specification窗口,键入 ,点“ok”,得样本回归估计结果。,2019/2/1,79,(1)生成残差平方序列。 在得到估计结果后,用生成命令生成序列,记为 。生成过程如下,先按路径:Procs/Generate Series,进入Generate Series by Equation对话框,键入下式并点“OK”即可。,2019/2/1,80,生成序列图示,2019/2/1,81,(2)绘制 对 的散点图。选择变量名 与 。(注意选择变量的顺序,先选的变量将在 图形中表示横轴, 后选的变量表示 纵轴),进入数 据列表,再按路 径view/ graph/ scatter,可得散 点图,见右图:,2019/2/1,82,2.判断 由图可以看出,残差平方 对解释变量 的散点图主要分布在图形中的下三角部分,大致看出残差平方 随 的变动呈增大的趋势,因此,模型很可能存在异方差。但是否确实存在异方差还应通过更进一步的检验。,2019/2/1,83,1. EViews软件操作 (1)对变量取值排序(按递增或递减)。在Procs菜单里选Sort Current Page/Sort Workfile Series命令,出现排序对话框,键入 ,如果以递增型排序,选“Ascenging”,如果以递减型排序,则应选“Descending”,点ok。本例选递增型排序,这时变量 与 将以 按递增型排序。 (2)构造子样本区间,建立回归模型。在本例中,样本容量 ,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:18和1421,它们的样本个数均是8个,即,(二)Goldfeld-Quandt检验,2019/2/1,84,在Sample菜单里,将区间定义为18,然后用OLS方法 求得如下结果(表1),2019/2/1,85,在Sample菜单里,将区间定义为1421,再用OLS方法求得如下结果(表2),2019/2/1,86,2019/2/1,87,(4)判断 在 下,式中分子、分母的自由度均为6, 查F分布表得临界值为: 因为 ,所以拒绝原假设,表明模型确实存在异方差。,2019/2/1,88,(三)White检验,由回归方程估计结果,按路径view/residual tests/white heteroskedasticity(no cross terms or cross terms),进入White检验。 根据White检验中辅助函数的构造,最后一项为变 量的交叉乘积项,因为本例为一元函数,故无交叉 乘积项,因此应选no cross terms,则辅助函数 为: 经估计出现White检验结果,见表3。,2019/2/1,89,2019/2/1,90,四、异方差的修正,2019/2/1,91,方法:在Estimate equation 中输入“ ”,点 option,在对话框中点 weighted LS,在weighted 中输入“ ”再点ok ,即出现加权最小二乘结果。,2019/2/1,92,表 4,估计结果: 结论: 运用加权小二乘法消 除了异方差性后,参数的t检验 均显著,可决系数大幅提高, F检验也显著,并说明人口数 量每增加1万人,平均说来将 增加2.953个卫生医疗机构,而 不是引子中得出的增加5.3735 个医疗机构。,2019/2/1,93,引子:t检验和F检验一定就可靠吗?,研究居民储蓄存款 与居民收入 的关系: 用普通最小二乘法估计其参数,结果为 (1.8690) (0.0055) = (14.9343) (64.2069),第二节 序列相关,2019/2/1,94,检验结果表明:回归系数的标准误差非常小,t 统计量较大,说明居民收入 对居民储蓄存款 的影响非常显著。同时可决系数也非常高,F统计量为4122.531,也表明模型异常的显著。 但此估计结果可能是虚假的,t统计量和F统计量都被虚假地夸大,因此所得结果是不可信的。为什么?,2019/2/1,95,在进行回归分析时,我们总假定其随机误差项是不相关的,即,(3.22),上式表示不同时点的误差项之间不相关。如果一个回归模型不满足上式,即 ,则我们称随机误差项之间存在着序列相关现象,也称为自相关。,一、序列相关的概念和产生的原因,(一) 序列相关的概念,2019/2/1,96,(二) 序列相关产生的背景和原因,我们在实际问题的研究中,经常遇到时间序列中出现序列相关的情形。产生序列相关的背景及其原因通常有以下几个方面。,2019/2/1,97,遗漏了重要的解释变量 在回归分析的建模过程中,如果忽略了一个或几个重要的解释变量,而这些遗漏的重要变量随着时间的推移而呈现出相关的趋势,回归模型中的误差项就会具有明显的相关趋势,这是因为误差项包含了遗漏的变量。,2019/2/1,98,经济变量的滞后性 在实际问题的研究中,许多经济变量都会产生滞后影响,例如物价指数、基建投资、国民收入、消费、货币发行量等都有一定的滞后性。如前期消费额对后期消费额一般会有明显的影响。,2019/2/1,99,消费支出对收入的回归分析中,经常会发现当期的消费支出除了依赖于其他变量外,还依赖于前期的消费支出,用模型表示为: 。 出 现这种现象的原因是由于心理、技术及制度上等等的原因,消费者不轻易改变他们的消费习惯。这个模型中就出现了序列相关。,2019/2/1,100,回归函数形式的设定错误也可能引起序列相关 例如,假定某实际问题的正确回归函数应由指数模型 (3.23) 来表示。,(3.23),2019/2/1,101,但是,研究者误用线性回归模型 (3.24) 来表示。,(3.24),这时,误差项 表现为序列相关。,2019/2/1,102,蛛网现象(Cobweb Phenomenon)。 是微观经济学中的一个概念。它表示某种商品的供给量因受前一期价格影响而表现出来的某种规律性,即呈蛛网状收敛或发散于供需的均衡点。由于规律性的作用,使得所用回归模型的误差项不再是随机的了,而产生了某种自相关。,2019/2/1,103,例如,许多农产品的当期供给受前一期的价格的影响。这样,今年某种农产品的生产和供给计划取决于上一年的价格。因此,农产品的供给函数可表示为,(3.25),其中,St=t 时期农产品供给量;Pt-1=t-1时期农产品的价格。,2019/2/1,104,假设在t 时期末,价格Pt 低于Pt-1,于是在t+1期初,农民决定比t 时期少生产一些,则 t+1 期的产量会低于 t 期。这样下去,就会形成蛛网现象。,2019/2/1,105,对原始数据加工整理。 在回归分析建模中,我们经常要对原始数据进行一些处理,如在具有季节性时序资料的建模中,我们常常要消除季节性,对数据作修匀处理。但如果采用了不恰当的差分变换,也会带来序列相关。,2019/2/1,106,序列相关问题不仅在时序资料的建模中会经常碰到,而且在截面样本中有时也会存在。大多数经济时间序列由于受经济波动规律的作用,一般随着时间的推移有一种向上或向下变动的趋势。所以,随机误差项ut 一般会出现序列相关的情形。,2019/2/1,107,二、序列相关性带来的后果,当一个线性回归模型的随机误差项存在序列相关时,就违背了线性回归方程的经典假定,如果仍然直接用普通最小二乘法估计未知参数,将会产生严重后果,一般情况下序列相关产生的后果与异方差类似。,2019/2/1,108,2可能严重低估误差项的方差。,1参数的估计量是无偏的,但不是 有效的。,2019/2/1,109,3常用的 检验和t 检验失效。 使用普通最小二乘法估计参数可能导致回归参数统计检验为显著,但实际上并不显著的严重错误结论。,2019/2/1,110,4如果不加处理地运用普通最小二乘法估计模型参数,回归参数的置信区间和利用回归模型进行预测的结果会存在较大的误差。,2019/2/1,111,三、序列相关的检验,当随机误差项存在序列相关时会给普通最小二乘法的应用带来非常严重的后果。因此,如何诊断随机误差项是否存在序列相关就成为一个极其重要的问题。下面介绍几种主要的诊断方法。,2019/2/1,112,图示检验法,DW检验法,序列相关的检验,自相关系数法,2019/2/1,113,(一)图示检验法,图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项et ,et作为ut随机项的真实估计值,再描绘et 的散点图,根据散点图来判断et的相关性。残差et的散点图通常有两种绘制方式 。,2019/2/1,114,1、绘制et-1 ,et 的散点图。 用(et-1 ,et )(t = 1,2,n)作为散布点绘图,如果大部分点落在第、象限,表明随机误差项ut存在着正的序列相关,如图3.4所示。,2019/2/1,115,图 3.4 et与et-1的关系,2019/2/1,116,如果大部分点落在第、象限,那么随机误差项ut 存在着负自相关,如图3.5所示。,2019/2/1,117,2、按照时间顺序绘制回归残差项et的图形。如果et (t= 1,2,n)随着t 的变化逐次有规律地变化,呈现锯齿形或循环形状的变化,就可断言et 存在相关,表明存在着序列相关。如果et 随着t的变化逐次变化并不断地改变符号,那么随机误差项ut 存在负的序列相关,如图3.6所示。,2019/2/1,118,如果et 随着t 的变化逐次变化并不频繁地改变符号,而是几个正的et 后面跟着几个负的,则表明随机误差项存ut 在正的序列相关,如图3.7所示。,2019/2/1,119,(二) 自相关系数法,误差序列 的自相关系数定义为,(3.26),2019/2/1,120,自相关系数 的取值范围是-1,1,当 接近于1时,表明误差序列存在正相关,当 接近于-时,表明误差序列存在负相关。,2019/2/1,121,在实际应用中,误差序列 的真实值是未知的,需要用其估计值 代替,得自相关系数的估计值为,(3.27),2019/2/1,122,作为自相关系数 的估计值与样本量有关,需要做统计显著性检验才能确定自相关性的存在,通常采用下面介绍的DW检验代替对 的检验。,2019/2/1,123,(三)DW检验,DW检验是J.Durbin(杜宾)和G.S.Watson (沃特森)于1951年提出的一种适用于小样本的检验方法。DW检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题。这种检验方法是建立经济计量模型中最常用的方法,一般的计算机软件都可以计算出DW值。,2019/2/1,124,随机误差项的一阶自回归形式为,为了检验序列的相关性,构造的原假设是,(3.28),(3.29),2019/2/1,125,为了检验上述假设,构造DW统计量。首先要求出回归估计式的残差et 定义DW统计量为,(3.30),2019/2/1,126,我们推导出DW值的取值范围。,(3.31),2019/2/1,127,如认为:,则:,(3.32),2019/2/1,128,因此,由于,2019/2/1,129,表 3.2 DW值与 的值的对应关系,所以,DW值与 的对应关系如表3.2所示。,2019/2/1,130,由上述讨论可知DW的取值范围为 DW,根据样本容量 n 和解释变量的数目k(不包括常数项)查DW分布表,得临界值 dL 和 dU ,然后依下列准则考察计算得到的DW值,以决定模型的自相关状态。,2019/2/1,131,表3.3 DW 检验决策规则,2019/2/1,132,表3.3可以用坐标图更加直观地表示出来:,2019/2/1,133,图3.8 DW 检验示意图,2019/2/1,134,需要注意的是,DW检验尽管有着广泛的应用,但也有明显的缺点和局限性。 DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法。,2019/2/1,135, DW统计量的上、下界表要求n15,这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断。 DW检验不适应随机误差项具有高阶序列相关的检验。 只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量。,2019/2/1,136,四、补救措施,当一个回归模型存在序列相关性时,首先要查明序列相关产生的原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺少重要的解释变量,则应增加该解释变量;如果以上两种方法都不能消除序列相关,则需采用方法处理。本书在此介绍几种常用的方法。,2019/2/1,137,(一)差分法,差分法是一类克服序列相关的有效的方法,被广泛地采用。差分法是将原模型变换为差分模型,分为一阶差分法和广义差分法。,2019/2/1,138,一阶差分法,(3.33),变换为,(3.34),一阶差分法是将原模型,2019/2/1,139,其中, 如果原模型存在完全一阶正自相关,即:,(3.35),其中, 为经典误差项。,2019/2/1,140,那么对于式(3.34)的差分模型,则应满足应用普通最小二乘法的经典假定,用普通最小二乘法估计式(3.34)的差分模型,得到的参数估计量即为原模型参数的无偏、有效的估计量。,2019/2/1,141,实际问题中,完全一阶正自相关的情况并不多见,所以人们不是经常直接使用差分模型。对于非完全一阶正自相关的情况,只要存在一定程度的一阶正自相关,差分模型就可以有效地加以克服。通常人们采用下面的广义差分法,但估计的过程将变得较为复杂。,2019/2/1,142,广义差分法可以克服所有类型的序列相关带来的问题,一阶差分法是它的一个特例。,2广义差分法,2019/2/1,143,如果原模型(3.33)存在,(3.36),为经典误差项,则可以将原模型(3.33)变换为,2019/2/1,144,(3.37),2019/2/1,145,3随机误差项相关系数的估计,应用广义差分法,必须已知不同样本点之间随机误差项的相关系数 。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。于是发展了许多估计方法,诸如迭代法、德宾两步法等。,2019/2/1,146,其基本思路是采用普通最小二乘法估计原模型,得到随机误差项的“近似估计值”,然后利用该“近似估计值”求得随机误差项相关系数的估计量。不同的方法旨在力图使得这些估计量更加逼近实际。,2019/2/1,147,(1)Cochrane Orcutt迭代法,在实际应用中,自相关系数 往往是未知的, 必须通过一定的方法估计。最简单的方法是据DW统计量估计 。由DW 与 的关系可知 : 但是,式(6.31)得到的是一个粗略的结果, 是对 精度不高的估计。其根本原因在于我们对有自相关的回归模型使用了普通最小二乘法。为了得到 的精确的估计值 ,人们通常采用科克伦奥克特(CochraneOrcutt)迭代法。,2019/2/1,148,该方法利用残差 去估计未知的 。对于一元线性回归模型 假定 为一阶自回归形式,即 :,2019/2/1,149,科克伦奥克特迭代法估计 的步骤如下: 1)使用普遍最小二乘法估计模型 并获得残差: 2)利用残差 做如下的回归,2019/2/1,150,3)利用 ,对模型进行广义差分,即 令 使用普通最小二乘法,可得样本回归函数为:,2019/2/1,151,2019/2/1,152,我们并不能确认 是否是 的最佳估计值,还要继续估计 的第三轮估计值 。当估计的 与 相差很小时,就找到了 的最佳估计值。,5)利用残差 做如下的回归 这里得到的 就是 的第二轮估计值,2019/2/1,153,当自相关系数未知时,也可采用德宾提出的两步法,消除自相关。将广义差分方程表示为:,(2)德宾两步法,2019/2/1,154,2019/2/1,155,(二)广义最小二乘法(GLS),广义最小二乘法,顾名思义,是最具有普遍意义的最小二乘法。其中普通最小二乘法和加权最小二乘法是它的特例。,2019/2/1,156,表3.4是北京市19781996年城镇居民家庭人均收入与人均支出的数据。以人均实际支出为被解释变量, 以人均实际收入为解释变量可建立消费函数。,五、案例分析(一),2019/2/1,157,表3.4 北京市城镇居民家庭收入与支出数据表 (单位:元),2019/2/1,158,续表,2019/2/1,159,采用普通最小二乘法,估计出回归方程为,(3.38),2019/2/1,160,模型中,DW0.575,取 ,查DW上下界表 dL=1.18,dU=1.40, DW1.18说明误差项存在正自相关。,2019/2/1,161,回归模型的残差列在表3.4中, 可以明显地看出残差序列存在着某种模式的变动,该残差的前项均为负值,中间连续项均为正值,然后又连续多项为负值,且这些残差值由小逐渐增大然后又逐渐减小,这表明该残差序列存在着较强的正自相关,预示着回归模型的随机误差项可能存在着一阶自回归变动模式。,2019/2/1,162,为经典误差项。,设原模型的误差项为,序列相关的形式为一阶自相关。即,(3.39),2019/2/1,163,2019/2/1,16

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论