计量经济学的三种检验.ppt_第1页
计量经济学的三种检验.ppt_第2页
计量经济学的三种检验.ppt_第3页
计量经济学的三种检验.ppt_第4页
计量经济学的三种检验.ppt_第5页
已阅读5页,还剩139页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,计量经济学检验,一、多重共线性 二、异方差 三、自相关,2,一:多重共线性,多重共线性的性质 多重共线性的原因 多重共线性的后果 多重共线性的诊断 多重共线性的补救措施,3,回顾多元线性回归模型的若干假定,零均值假定 同方差假定 无自相关假定 随机项与自变量不相关 非多重共线性,4,假定1,零均值假定:E(ui)=0,i=1,2,.n 对X1 ,X2的每个观测值,u可以取不同的值,考虑u的所有可能值,它们的总体平均值(期望值)等于0。,5,假定2,同方差假定:Var(ui)= u 2, i=1,2,n 上式表明,各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。 违反假定:异方差,6,假定3,无自相关假定: Cov(ui, uj)=0, i j, i,j=1,2n 表明任意两次观测的ui, uj是不相关的,即u在某次的观测值与任何其它次观测中的值互不影响,称为无序列相关性。 等方差性和无序列相关性称为高斯马尔柯夫(Gauss-Markov)假定。 违反假定:自相关,7,假定4,随机项与自变量不相关: Cov(ui, x1i)=0; Cov(ui, x2i)=0 区分随机项u与每个自变量各自对y的影响。 如果x是非随机变量,即x是在重复抽样中取某固定值,该条件自然满足。,8,假定5,解释变量之间不存在线性相关关系,即任意两个解释变量之间无确切的线性关系。 用统计学语言,称为非共线性或非多重共线性。 非完全共线性是指变量不能完全表示为其他变量的完全线性函数。 违反假定:多重共线性,9,完全多重共线性,完全共线性(Perfect collinearity)的例子 : X1 X2 X3 10 50 52 15 75 75 18 90 97 24 120 129 X1 和 X2 是完全线性相关的: X2 = 5X1,10,完全多重共线性,若X2 = 5X1 将其代入Y=b0 +b1 X1+b2 X2 +b3 X3 Y=b0 +b1 X1 +b2 * 5X1 +b3 X3 = b0 +(b1 + 5b2 ) X1 +b3 X3 = b0 +A X1 +b3 X3 三变量模型 无法从A值中得到b1 、b2的值,11,接近完全多重共线性的情形,多重共线性是一个极端的情形 在实际中,很少遇到完全多重共线性的情况,常常是接近或高度多重共线性。亦即解释变量是接近线性相关的。 例:widget教科书,12,问题,多重共线性的性质是什么? 多重共线性产生的原因是什么? 多重共线性的理论后果是什么? 多重共线性的实际后果是什么? 在实际中,如何发现多重共线性? 消除多重共线性的弥补措施有哪些?,13,多重共线性的性质,可以获得原始系数的一个线性组合的估计值。 当解释变量之间存在完全线性相关或完全多重共线性时,不可能获得所有参数的唯一估计值。 既然我们不能获得它们的唯一估计值,也就不能根据某一样本做任何统计推论(也即假设检验),14,多重共线性的原因,例:消费函数 Y = b0 + b1X1 + b2X2 X1 = income ; X2 = wealth X2 = 5X1 Y = b0 + b1X1 + b2 5X1 Y = b0 + (b1 + 5b2)X1,15,多重共线性的原因,所用的数据收集方法 例:在X的一个限定的范围内抽样 有关被抽样总体的约束: 例:具有高收入的人倾向于有更多的财富 也许有关低收入的富有的人和高收入的没钱人的数据不够充足。,16,多重共线性的原因,模型设定: 例: 在模型中加入多项式项,特别是当X的取值范围很小的时候。 变量之间有共同的时间趋势 模型的过定( overdetermined) 解释变量的数目多于观测的数目。,17,多重共线性的理论后果,在存在高度多重共线性的情形下,即使多元回归方程的一个或者多个偏回归系数是统计不显著的,普通最小二乘估计量仍然是最优线性无偏估计量。,18,注意,无偏性是一个重复抽样的性质,即:保持X不变,如果得到一些样本并用OLS计算这些样本估计量,则其平均值收敛于估计量的真实值。但这并不是某个样本估计值的性质,在现实中,我们经常无法得到大量的重复样本。,19,注意,接近共线性并未破坏最小二乘估计量的最小方差性:在所有线性无偏估计量中,OLS估计量的方差最小。 最小方差并不意味着方差值本身也比较小。,20,注意,即使变量总体之间不线性相关,但却可能与某一样本线性相关 多重共线性本质上是一个样本(回归)现象。 原因:大多数经济数据不是通过试验获得。如:国民生产总值、价格、失业率、利润、红利等,是以其实际发生值为依据,而并非试验得到。,21,多重共线性的实际后果,OLS估计量的方差和标准差较大。也就是说,OLS估计量的精确度下降。 置信区间变宽。 t值不显著, R2较高。 OLS估计量及其标准差对数据的微小变化非常敏感,也就是说它们趋于不稳定。 回归系数符号有误。 难以衡量各个解释变量对回归平方和(ESS)或R2的贡献。,22,例:消费函数,消费函数的结果: Y = 24.77 + 0.94X1 - 0.04X2 t (3.67) (1.14) (-0.53) R2=0.96, F = 92.40 X1 是收入 X2 是财富 高的 R2 表明收入和财富可以解释消费变化的96%,23,结果分析,没有任何一个斜率系数是显著的。 财富变量的符号是错误的。 高的 F 值意味着系数都等于0的联合假设不成立 两个变量是如此地高度相关,以至于不能将二者的效应分离出来。,24,例:消费函数,如果将 X2 对 X1 回归,得到: X2 = 7.54 + 10.19X1 (0.26) ( 62.04) R2 =0 .99 表明,在 X1 和 X2之间有近乎完全的线形关系,25,例:消费函数,Y 只对收入回归: Y = 24.45 + 0.51X1 (3.81) (14.24) R2= 0.96 收入变量是高度显著的,但是在前一个模型中是不显著的,26,例:消费函数,Y 只对财富回归: Y = 24.41 + 0.05X2 t (3.55) (13.29) R2 = 0.96 财富变量也是高度显著的,但是在前一个模型中是不显著的,27,多重共线性真的是一个问题吗?,取决于研究目的 如果是为了预测,多重共线性未必是坏事 如果是为了估计参数(比如弹性、边际值等),多重共线性必定是坏事,28,多重共线性的检验,多重共线性是一个程度问题而不是存在与否的问题。 由于多重共线性是在假定解释变量是非随机的条件下出现的问题,因而它是样本的特点,而不是总体的特征。,29,检验方法1,R2较高但t值显著的不多。这是多重共线性的“经典”特征。,30,检验方法2,解释变量两两高度相关。 逐对检查解释变量之间的相关系数 这些仅仅是一些有用的指示,经过这些探查后可能还会有多重共线性 解释变量的组合或许具有相关性,31,检验方法3,辅助回归:将每个变量对其他剩余变量回归并计算相应的R2 值,其中每一个回归都被称作是从属或者辅助回归。 然后用F test 检验 R2 是否显著地区别于0 F = R2/(k-1) /(1-R2)/(n-k) k 是 X的数目 如果F大于临界值,则 R2 是显著区别于0的 计算较繁琐,32,例,考虑Y对X1,X2,X3,X4,X5、X6这6个解释变量的回归 辅助回归:用R12表示X1对其余X的回归的判决系数,33,检验方法4,方差膨胀因素(Variance inflation factor ) 其中 R2j 是Xj对其他X的辅助回归的判决系数 这个指标度量方差增加的速度,34,R2 和 VIF,当 R2 增加时, VIF也随着增加 如果大于10 ,就表明有问题,35,注意,R2较高,标准差未必一定大。也就是说它不一定扩大估计量的标准差。 辅助回归方程的R2可能只是多重共线性的一个“表面指示器”。 更正规的表述为:“较高的R2既不是较高标准差的必要条件也不是充分条件,多重共线性本身并不必然导致较高的标准差。”,36,总结,检验多重共线性有许多种不同的方法,但却没有一种检验方法能够使我们彻底解决多重共线性问题。 多重共线性是一个程度的问题,它是与样本相关的一种现象。 有时我们必须综合运用以上各种手段来诊断多重共线性的严重程度。 总之,没有一个简单的办法判断多重共线性问题。,37,补救措施,如果t统计量大于2,就不用担心 如果回归的 R2大于任何一个 X对其余 Xs回归的R2 ,就不用担心 如果仅仅是对预测感兴趣,并且解释变量的线性组合在未来仍然延续,就不用担心,38,补救措施(经验法则),从模型中删除不重要的解释变量 获取额外的数据或者新的样本 重新考虑模型 先验信息 变量变换 其他补救措施,39,从模型中删除不重要的解释变量,对待严重的多重共线性问题,最简单的解决方法就是删除一个或多个共线性变量。 导致“模型设定误差”,参数估计量可能是有偏的。 建议不要仅仅因为共线性很严重就从一个经济上可行的模型中删除变量。所选模型是否符合经济理论是一个重要的问题。,40,获取额外的数据或者新的样本,有些情况下,通过获得额外的数据(增加样本容量)就能削减共线性的程度。,41,获取额外的数据或者新的样本,既然多重共线性是一个样本特征,那么在包括同样变量的另一样本中,共线性也许不象第一个样本那样高。 关键是能否获得另一个样本,因为收集数据的费用很高。,42,Y:消费支出;X1:收入;X2:财富 10个观察值: Y=24.337+0.87164 X1 -0.0349 X2 se=(6.2801) (0.31438) (0.0301) t= (3.875) (2.7726) (-1.1595) R2 =0.9682,消费支出对于收入和财富的回归方程,43,消费支出对于收入和财富的回归方程,40个观察值: Y=2.0907+0.7299 X1 +0.0605 X2 t= (0.8713) (6.0014) (2.0641) R2 =0.9672,44,重新考虑模型,模型的不恰当设定可能是回归模型存在共线性的原因。 省略一些重要的变量 没有正确选择模型的函数形式 例:需求函数 Q=b0+b1p+b2pr+b3income+u 变形成 Q=b0+b1(p/pr)+b2income+u,45,先验信息,根据以往的研究,我们或许知道有关参数值的某些信息,可以将这些信息用于当前的样本。 假设先验信息是“正确”的,就“解决”了共线性问题。,46,例 对wideget需求函数,假设在过去估计过的对wideget需求函数中,收入系数为0.9,并且是统计显著的。如果收入系数的过去值没有多少改变的话,我们可以重新估计方程 需求量=b0+b1*价格+b2*收入+u = b0+b1*价格+0.9*收入+u 需求量- 0.9*收入= b0+b1*价格+u,47,先验信息的缺陷,获得外生的或先验的信息并不总是可行的。 即使我们能够获得这一信息,但要假设先验信息在当前研究的样本中依然有效这个要求“太高”。,48,变量变换,有些情形,通过对模型中变量的变换能够降低共线性程度。 例如:在对美国总消费支出的研究中(总消费支出作为总收入和总财富的函数),我们可以采取人均的形式,也就是说,作人均消费支出对人均收入和人均财富的函数,有可能在总消费函数中存在严重的共线性问题,而在人均消费函数中其共线性问题并没有那么严重。 不能保证这样的一个变换总能够有助于问题的解决。,49,例,假设我们具有消费、财富和收入的时间序列 将会出现严重的多重共线性,因为这些变量随着时间作同方向的运动 我们意欲估计 Yt = b0 + b1X1t + b2X2t + ut 在时间t-1处的模型: Yt-1 = b0 + b1X1t-1 + b2X2t-1 + ut-1 两个方程相减 Yt-Yt-1=b1(X1t-X1t-1)+b2(X2t-X2t-1)+vt,50,例,这样做有时会解决问题,因为和原始变量相比,变量的差分也许不再共线 但由此产生的问题是新的误差项v或许不再满足干扰项序列不相关的假设,51,例,在多项式回归中,常常会遇到多重共线性 我们可以将解释变量减去它的平均值,往往会减小多重共线性的程度,52,其他补救措施,时间序列数据和截面数据的结合 要素分析或主成分分析 岭回归法 逐步回归法,53,二、异方差,同方差假定:Var(ui)= u 2, i=1,2,n 上式表明,各次观测值中u具有相同的方差,即各次观测所受到的随机影响的程度相同,称为等方差性。 违反假定:异方差 假设方差随着观测数据而变化 就得到异方差性(heteroskedasticity) var(ui) = (i)2 随着观测数据而变化,54,问题,异方差的性质是什么? 异方差的后果是什么? 如何检验异方差的存在? 如果存在异方差,有哪些补救措施?,55,异方差的性质,56,异方差的性质,异方差问题多存在于横截面数据中,在时间序列中出现较少。 规模效应:如果截面数据来自于一组规模差异很大的对象,在数据中就会存在异方差性。比如,小公司、中等的公司、大公司;低收入家庭、中等收入家庭、高收入家庭。 在时间序列数据中,变量趋于具有相似的数量等级。,57,例:工资与企业规模,平均工资随着厂商规模的增加而增加。见下表:,58,工资与企业规模,我们能指望工资的方差是不变的吗? 方差随着厂商规模的增加而增加 因此,厂商越大,支付的工资越多,但工资的变异性也更大(variability),59,例:储蓄与收入,储蓄随着收入增加而增加,储蓄和支出的变异性也随着增加 随着收入增加,人们具有更多的可以自由支配的收入,因此具有处置收入的更大的选择余地。,60,例:学习,由于学习,人们的行为误差越来越小,方差将逐渐减小。 随着打字时间的增加,每小时的打字错误逐渐减小。,错字率,时间,61,异方差的后果,OLS估计量仍然是线性的 OLS估计量仍然是无偏的 但无论是对大样本,还是小样本,OLS估计量不再具有最小方差性。也就是说,OLS估计量不再是有效的。 根据常用估计OLS估计量方差的公式得到的方差通常是有偏的。 因此,建立在t分布和F分布之上的置信区间和假设检验是不可靠的。,62,异方差的检验,根据问题的性质 残差的图形检验 Park test Glejser test Goldfeld-Quandt test White检验,63,1、根据问题的性质检验,所考察问题的性质往往提供是否存在异方差的信息。 例如:根据Paris和Houthakker关于家庭预算的开创性著作,发现在消费对收入的回归中,残差方差随收入的增加而增加。现在一般相类似的调查研究通常假设不同随机干扰项的方差不等。,64,根据问题的性质检验,事实上,在涉及不均匀单位的横截面数据中,异方差可能是常有的情况而不是例外。 例如:在与销售、利率等相关的投资支出的横截面数据分析中,如果把小、中、大型公司聚集在一起加以抽样,就很可能存在异方差。 在对与产出相关的平均成本的横截面数据研究中,如果样本包括小、中和大型公司,也可能存在异方差。,65,2、残差的图形检验,干扰项方差是不可观测的,但是我们可以用残差平方来“代理”它。这是一种通过对残差进行分析得到有用信息的一种方法,称为残差分析法。这种方法在计量经济学中有着重要的应用。 将残差平方对一个或多个解释变量描图,或者对Y的估计值Y描图,根据这样的残差图可以为判断异方差的存在提供线索。,66,残差平方模式,67,残差平方模式,a图:变量与残差平方之间没有可观察到的系统模式,表明数据中可能不存在异方差。 be图:数据中可能存在异方差,68,问题,对于多元回归方程,将残差平方对每个解释变量描图,可能只有一个变量表现出be图的某个模式。 这时,我们可以将残差平方对Y的估计值Y描图,而不必对每个解释变量描图。由于Y是各个X的线性组合,残差平方和对Y的散点图可能会出现be某种模式,表明数据中可能存在异方差。避免将残差平方对每个解释变量描图的繁琐过程。,69,Park test,如果通过考察残差发现了异方差性的证据,我们可以作一个检验 将方差对X变量回归 ln(i)2=b1 + b2lnXi + vi,70,Park test,方差未知 使用残差的平方作为代理变量(proxy) 作回归: ln(ei)2=b1 + b2lnXi + vi 如果是多元模型,则将残差的平方对每个X变量回归,或者对Y的预测值回归 如果 b2 是显著区别于0的,则表明模型有异方差性,71,Glejser test,与 Park test类似 将残差 ei 的绝对值对 X回归 回归的函数形式可以有所变化 可以对X的平方根或者倒数1/X 等进行回归 如果具有显著的t统计量,则表明有异方差性,72,Glejser建议的函数形式,| ei |=b0+b1Xi+vi | ei |=b0+b1 ( Xi )1/2 +vi | ei |=b0+b1 (1/ Xi ) +vi,73,Glejser test注意,在Glejser所建议的回归方程中,误差项本身可能就存在异方差和序列相关问题。 对于大样本,上述模型能够很好的检测异方差问题。 Glejser检验可用作大样本的检测工具,74,Goldfeld-Quandt test,75,例,30个家庭的收入和消费支出的截面数据。假设消费与收入有线性关系,但数据中存在形式为 的异方差。 为了进行Goldfeld-Quandt 检验,用收入对数据排序,去掉中间的c=4个观测,76,77,分别对前13个和后13个数据进行回归,得到 : 由此结果,得到 在5%的显著性水平下拒绝同方差的零假设,78,Goldfeld-Quandt test,1、流行的检验方法,可用于小样本 2、去掉中间的C 个观测是为了强调大方差组(RSS2)和小方差组(RSS1)之间的差别。检验的效力(即如果零假设是不真实的而拒绝零假设的概率)依赖于C的选择。Goldfeld 和 Quandt 建议如果 n = 30, C=8 ,如果n = 60 C=16 (然而 Judge 等建议如果 n 分别是 30 和 60 , C 取 4 和10),79,White检验,假定模型:Y=b0+b1X1+b2X2+u White检验步骤: 用OLS估计回归方程,得到残差ei 然后作如下回归: ei 2 =A0+A1X1+A2X2+A3X1 2 +A4X2 2 +A5X1X2+v 求辅助回归方程的R2值。满足零假设,则不存在异方差。,80,White检验,White证明辅助回归方程的R2值与样本容量n的乘积服从X2分布,自由度等于辅助回归方程中解释变量的个数(不包括截距项) 如果X2值超过了所选显著性水平下的X2临界值,或者说X2值的p值很低,则可以拒绝不存在异方差的零假设,也就是说原回归方程存在异方差。,81,White检验,White检验的缺陷:过于一般化,如果有多个变量,则要在辅助回归方程中要包括这些变量、变量的平方(或者更高次幂)以及它们的就交叉乘积项,这会迅速降低自由度。 因此,必须谨慎地引入太多的变量,有时可以去掉交叉乘积项。,82,异方差的其他检验方法,Spearman秩相关检验 Bartlett方差同质性检验 Peak检验 Breusch-Pagan检验 CUSUMSQ检验,83,异方差的补救措施,(i)2已知的加权最小二乘法(WLS) (i)2未知时的变换 重新设定模型,84,加权最小二乘法(WLS),假定(i)2已知 考虑上述厂商的例子,假设模型具有异方差性 工资随着企业规模增加而增加,但是方差也随着增加,85,加权最小二乘法(WLS),从一个基本的模型开始: Yi = b0 + b1Xi + ui Y = 工资 , X = 企业规模 假设干扰项的真实方差(i)2 是已知的 在模型两边除以标准差: Yi/ i = b0(1/ i) + b1Xi/ i + ui/i 令 : vi = ui/i,86,加权最小二乘法(WLS),考察干扰项 Var(vi)= E(vi)2 = E(ui)2/(i)2 = E(ui)2/(i)2 = 1 因此,vi 是同方差的,对变换后的模型使用OLS 会得到参数的BLUE 估计,87,加权最小二乘法(WLS),变换后的模型: Yi/ i = b0(1/ i) + b1Xi/ i + ui/i 是一个无常数项回归! Eviews命令: Ls Y/ 1/ X/ ,88,加权最小二乘法(WLS),从直观上看,加权最小二乘法很简单,但是有一个重要的问题:如何知道或者如何找出真实的误差方差(i)2 ? 在经济计量学的研究中,有关误差方差的信息是极少的,因此,如果想要使用WLS方法,常借助于似乎可靠的关于(i)2的假设,把原来的回归模型变换为能够满足同方差假定的模型,然后运用OLS法估计该模型。,89,(i)2未知时的变换,情形1:误差与Xi 成比例:平方根变换 情形2:误差与Xi 2成比例,90,情形1:误差与Xi 成比例:平方根变换,将残差平方对 Xi作散点图,发现为一个锥形 (i)2 =K Xi 这表明干扰项方差与Xi线性相关 用Xi的平方根除模型,对模型进行变换,91,情形1:误差与Xi 成比例:平方根变换,这是一个没有常数项的回归。可以证明,该模型的干扰项是同方差的,因此可以使用OLS进行估计(实际上是WLS),92,情形1:误差与Xi 成比例:平方根变换,如果模型中包括多个解释变量,可以根据图形找出合适的解释变量。 如果有多个解释变量都可以,就不使用任何解释变量,而是利用Y的估计值Y作为变换变量,因为Y是解释变量的线性组合。,93,情形2:误差与Xi 2成比例,残差平方对X作散点图,发现一个喇叭形 这表明干扰项方差与X的平方成比例 在模型的两边除以X,对模型进行变换,94,情形2:误差与Xi 2成比例,斜率变成了截矩,截矩变成了斜率。但是我们在估计出上面方程后还可以乘以Xi,回到原始模型,95,重新设定模型,除了“推测”以外,还可以重新设定回归函数,即选择一个不同的函数形式,这样也可以消除异方差。 例如:用双对数模型代替线性回归模型,常常能够消除异方差。 因为对数变换压缩了测定变量的尺度,从而把两个变量值之间10倍差异缩小为2倍差异。 90是9的10倍,但ln90(=4.4998)只有ln9(=2.1972)的两倍,96,实例:规模经济,纽约股票交易所(NYSE)最初极力反对经纪佣金率放松管制。在引入放松管制以前(1975年5月),NYSE向股票交易委员会(SEC)提交了一份经济计量研究报告,认为在经纪行业中存在着规模经济,因此(由垄断决定的)固定佣金率是公正的。NYSE所提交的经济计量分析基本上是围绕着以下回归函数进行:,97,规模经济,Y=476000+31.348X-(1.083*10 -6)X2 t= (2.98) (40.39) (-6.54) R2 =0.934 其中,Y=总成本,X=股票交易的数量 从模型中可以看出,总成本与交易量正相关。但是由于交易量的二次方项系数为负,并且统计显著,这意味着总成本是以一个递减的速率增加。因此,NYSE认为在经纪行业中存在着规模经济,从而证明NYSE的垄断地位是正当的。,98,规模经济,然而美国司法部反托拉斯局认为上述模型中所声称的规模经济只是幻想。因为上面函数存在异方差问题。这是因为在估计成本函数时,NYSE并未考虑到样本中所包括的小公司和大公司的差别,也就是说,NYSE没有考虑到规模因素。假设误差项与交易量成比例,反托拉斯局重新估计方程得到如下结果,99,规模经济,Y=342000+25.57X+(4.34*10 -6)X2 t= (32.3) (7.07) (0.503) 二次项系数不仅统计不显著,而且其符号也发生了变化,因此在经纪行业中不存在规模经济,这就推翻了NYSE的垄断佣金结构的论点。,100,三:自相关,无自相关假定: Cov(ui, uj)=0, i j, i,j=1,2n 表明任意两次观测的ui, uj是不相关的,即u在某次的观测值与任何其它次观测中的值互不影响,称为无序列相关性。 违反:自相关,101,问题,自相关的性质是什么? 自相关的原因是什么? 自相关的理论与实际后果是什么? 如何诊断自相关? 如果自相关的后果比较严重,如何采取措施加以补救?,102,自相关的性质,自相关问题通常是与时间序列数据有关 在横截面数据中也可能产生自相关问题,称为空间相关 某一季度工人罢工对本季度及下一季度产出影响 某一家庭消费支出与另一家庭的消费支出,103,自相关产生的原因,惯性 模型设定误差 蛛网现象 数据加工,104,惯性,大多数经济时间序列的一个显著特征就是惯性或者说是迟缓性。 经济变量中表现出的一种持续的趋势 许多经济变量都表现出商业循环 比如:国民生产总值、就业、货币供给、价格指数 比如:在经济复苏时,在这些变量中,具有某种内在的力量,使得前后期的数值之间相互依赖,后一期数据倾向于高于前一期数据,直到发生某些事件使增长停下来为止 一个高的正的干扰之后会在下一期跟着一个高的正的干扰 因此,在涉及时间系列数据的回归方程中,连续的观察值之间很可能是相关的,105,模型设定误差,模型的不恰当设定意味着由于本应包括在模型中的重要变量未包括进模型中(过低设定的情形),或者是模型选择了错误的函数形式。 由于模型设定误差,从不正确的模型中得到的残差将会呈现系统模式。 假设我们在考察牛肉的需求,并将牛肉的价格和收入包括在模型中,但是不包括猪肉的价格 如果猪肉的价格确实影响牛肉的需求,干扰项将包括这个系统效应,从而表现出自相关,106,蛛网现象,农产品供给:Yt=b0+b1Xt-1+u t,107,数据加工,在实证分析中,通常需要加工原始数据 季度数据是由月度数据加总后平均得到。,108,自相关的后果,最小二乘估计量仍然是线性和无偏的 但不再是有效的。 OLS估计量的方差是有偏的。有时候,用来计算方差和OLS估计量标准差的公式会严重低估真实的方差和标准差,从而导致t值变大,这会使的从表面上看某个系数显著不为0,但事实并非如此。 因此,通常所用的t检验和F检验一般来说是不可靠的。 通常计算的R2不能测度真实R2,109,自相关的诊断,残差图形法 游程检验 杜宾瓦尔森检验,110,残差图形法,作残差对时间的散点图 检查残差随时间的变动模式 作残差对滞后残差(lagged residuals)的散点图 检查在一个和两个象限中的散点分布串,111,残差图形法,112,残差图形法,自相关可以分为: 正自相关:相邻的误差项倾向于共同上升,或共同下降 负自相关:相邻误差项呈现出一增一减的运动模式 零自相关:误差项之间不相关,也称序列不相关,此时满足基本假设,113,残差图形法,114,115,游程检验,是一种正式的非参数检验的方法 游程:同一符号或属性的不间断历程 游程长度:游程中正负交替的个数。 如果你预期残差是随机的,那么正负残差是随机混合在一起的 如果残差是相关的,那么,就可能出现一组正的残差跟着一组负的残差的情况,116,例,例子:()()()()() 共有5个游程:一个7个正值的游程,一个1个负值的游程,一个3个正值的游程,一个5个负值的游程,一个4个正值的游程,117,问题,与预期相比,从这20个观察值中所观察到的5个游程是太多了还是太少了? 如果游程太多,意味着残差在频繁地变换着符号,表明存在着负序列相关。 如果游程太少,意味着正的自相关。,118,游程检验,N观察值的总个数(= N1 + N2 ) N1+号(正的残差)个数 N2-号(负的残差)个数 k游程个数 游程临界值:在残差是独立的假设下,Swed和Eisenhart建立了一些特殊的表格,给出在N个观察值的随机次序下预期游程的临界值。,119,例,N=20, N1 =14, N2 =6,k=5 对于5%的游程临界值为5 如果实际游程个数等于或者小于5,则拒绝假设(即残差是随机的),存在自相关。 本例中,实际游程个数是5,因此拒绝残差随机的假设,换言之,本例存在自相关,120,杜宾瓦尔森检验(Durbin-Watson Test),这是一个使用得最多、而且简单易行的检验 DW统计量:,121,杜宾瓦尔森检验,几乎所有的计量经济学软件都提供DW统计量的数值 比如,在Eviews的回归报告中,122,Eviews回归结果,123,DW统计量的基本假设,回归模型需包括一个截距项。因此,DW统计量无法用来判定通过原点的回归模型的自相关问题。 变量X是非随机变量,也就是说,X是在重复抽样中固定的值。,124,DW统计量的基本假设,随机干扰项的产生机制是: ut = ut-1 + vt 其中, -1 1,称为自相关系数(coefficient of autocorrelation) v t:服从基本假设,不存在自相关 干扰项在第t期的数值依赖于第t-1期的误差项的数值加上某个随机项 对过去的依赖由自相关系数表示,125,DW统计量的基本假设,该过程称为马尔可夫一阶自回归或一阶自回归,记为AR(1) 一阶是指只有一期的滞后(lagged one period) 在许多计量经济工作中,都假设 AR(1) 过程,因为它较容易处理,126,DW统计量的基本假设,在回归方程中,没有把因变量的滞后值作为解释变量。换言之,该检验对下面的模型不适用: Yt=b0+b1X+b2Yt-1+ut h统计量,127,杜宾瓦尔森检验,D统计量的数值在 0 和 4之间 越靠近0,越表示有正自相关 越靠近4,越表示有负自相关 越靠近2,越表示无自相关,128,杜宾瓦尔森检验,可以查DW临界值表,进行更准确的检验 对于N = 27, 4个解释变量,查表的上下两个临界值: dl1.08, du1.76,129,自相关补救措施,假设干扰项服从 AR(1)过程 ut = ut-1 + vt v t:服从基本假设,不存在自相关 原模型为: Yt = b0 + b1Xt + ut (1) 滞后一期的模型为 : Yt-1 = b0 + b1Xt-1 + ut-1 用 乘两边 Yt-1 = b0 + b1Xt-1 + ut-1 (2),

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论