




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学课件5
采用普通最小二乘法,估计线性回归模型的参数从而得到OLS估计量,要使估计量具有令人满意的性质,线性回归模型必须满足一组假设条件。在实践中,如果某些假设条件不能满足,则OLS法就不再适用于模型的估计。在这种情况下,分析方法就需要改变。2实践中可能碰到的一些常见问题如下:l误设定(Misspecification或specificationerror)l多重共线性(Multicollinearity)l异方差性(Heteroscedasticity)l自相关(Autocorrelation)本章将对上述问题作简要讨论,主要介绍问题的后果、检测方法和解决途径。3第一节误设定采用OLS法估计模型时,实际上有一个隐含的假设,即模型是正确设定的。这包括两方面的含义:函数形式设定正确和解释变量选择正确。但在实践中这个假设却不一定能实现。可能犯下列三个方面的错误:选择错误的函数形式遗漏有关的解释变量包括无关的解释变量从而造成所谓的“误设定”问题。4一.选择错误的函数形式这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型便无法反映所研究现象的实际情况,会产生很严重的后果。除了双对数模型,下面再介绍几种比较常见的非线性回归模型。这几种模型是:半对数模型,双曲函数模型和多项式回归模型。51.半对数模型因变量和解释变量中一个为对数形式而另一个为线性的模型。因变量为对数形式的称为对数-线性模型(log-linmodel)。解释变量为对数形式的称为线性-对数模型(lin-logmodel)。先介绍前者,其形式如下:对数-线性模型中,斜率的含义是Y的百分比变动,即解释变量X变动一个单位引起的因变量Y的百分比变动。利用微分可以得出:6这表明,斜率度量的是解释变量X的单位变动所引起的因变量Y的相对变动,即Y的增长率。由于对数-线性模型中斜率系数的这一含义,因而也叫增长模型(growthmodel)。增长模型通常用于测度所关心的经济变量(如GDP)的增长率。例如,可以通过估计下面的半对数模型得到一国GDP的年平均增长率的估计值,这里t为时间趋势变量。7实例:1973-1987年间美国未偿付消费者信贷的增长下表给出了1973-1987年间美国未偿付消费者信贷的数据,Y单位为百万美元表示未偿付消费者信贷额,t表示年份数,试估计未偿付消费者信贷的年增长率并进行分析。8年份Yt年份Yt1973190601119813665979197419936521982381115101975204963319834303821119762281624198451176812197726380851985592409131978308272619866460551419793475077198768554515198034938689要估计未偿付消费者信贷的年增长率,即估计以下模型:lnYt=1+2t+ut根据以上数据得到回归结果如下:10回归系数均是统计显著的,回归方程显著成立。对回归结果解释如下:回归系数0.0946表示未偿付消费者信贷Y的年增长率为9.46%.对截距12.007解释如下,当t=0时,lnY0=12.007,即当t=0时,Y0≈163911.7,即1973年初未偿付消费者信贷量为163911.7百万美元。11线性-对数模型的形式如下:可用微分得到因此这表明上式表明,Y的绝对变动量等于乘以X的相对变动量。因此,线性-对数模型通常用于研究解释变量每变动1%引起的因变量的绝对变动量是多少这类问题。12实例:1973-1987年美国GNP与货币供给间的关系下表给出了1973-1987年间美国GNP与货币供给的数据,Y表示GNP,X表示货币供给用M2度量单位均为亿美元。试估计货币供给每增加一个百分点,GNP的绝对变动量。13年份YX年份YX19731359.3861.019813052.61795.519741472.8908.519823166.01954.019751598.41023.219833405.72185.219761782.81163.719843772.22363.619771990.51286.719854014.92562.619782249.71389.019864240.32807.719792508.21500.219874526.72901.019802723.01633.114根据以上数据估计以下模型:Yt=1+2lnXt+ut得到回归结果如下:15回归系数均是统计显著的,回归方程显著成立。对回归结果解释如下:回归系数2584.8表示货币供给每增加一个百分点,GNP的绝对变化量为25.848亿美元。162.双曲函数模型双曲函数模型的形式为:不难看出,这是一个仅存在变量非线性的模型,很容易用重新定义的方法将其线性化。双曲函数模型的特点是,当X趋向无穷时,Y趋向0,反映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线(Y=0)。双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯曲线。173.多项式回归模型多项式回归模型通常用于描述生产成本函数,其一般形式为:多项式回归模型中,解释变量X以不同幂次出现在方程的右端。这类模型也仅存在变量非线性,因而很容易线性化,可用OLS法估计模型。其中Y表示总成本,X表示产出,P为多项式的阶数,一般不超过四阶。18二.模型中遗漏有关的解释变量模型中遗漏了对因变量有显著影响的解释变量的后果是:将使模型参数估计量不再是无偏估计量。下面用一个简单例子说明:
设正确模型为Y=0+1X1+2X2+u……(5.9)而实际估计的模型为Y=0+1X1+u…(5.10)也就是说忽略了对Y有重要影响的变量X2估计式(5.10),得19而由式(5.9)有将式(5.12)代入式(5.11),得取期望值,得20上式右边第三项等于零,而第二项方括号中内容可以看做回归方程X2=+X1+u中斜率系数的估计量。可以预期,X1和X2之间存在一定程度的相关,从而第二项不等于0,因此,是真实参数1的一个有偏估计量。遗漏有关的解释变量将使参数估计量产生偏倚。21三.包括无关的解释变量模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。设正确模型为Y=0+1X1+u…(5.13)而实际估计的模型为Y=0+1X1+2X2+u……(5.14)也就是说X2与Y无关,因而应有2=0可以证明,即是真实参数1的无偏估计量。22其中r12是X1和X2的相关系数。故模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。23
四.解决解释变量误设定问题的原则在模型设定中的一般原则是尽量不漏掉有关的解释变量。因为估计量有偏比增大误差更严重。但如果方差很大,得到的无偏估计量也没有多大意义,因此也不宜随意乱增加解释变量。在回归实践中,有时要准确判断某个变量是否应该作为解释变量包括在方程中不是一件容易的事。下面给出一些判断准则。243.:该变量加进方程中后,是否增大?选择解释变量的四条准则1.理论:从理论上看,该变量是否应该作为解释变量包括在方程中?2.t检验:该变量的系数是否显著?4.偏倚:该变量加进方程中后,其它变量的系数估计值是否显著变化?如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是“否”,则该变量是无关变量,可以安全地从方程中删掉它。这是两种容易决策的情形。25
但在很多情况下,这四项准则的判断结果会出现不一致。例如,有可能某个变量加进方程后,增大,但该变量不显著。在这种情况下,一般而言采用的办法是将理论准则放在第一位,否则产生不正确结果的风险很大。26五.检验误设定的RESET方法上面给出了选择解释变量的四条准则。但有时只凭这些准则并不能确定设定是最恰当的,这种情况下,可使用一些更正规的检验方法来检验误设定。这类方法相当多,有一、二十种,这里仅介绍拉姆齐(J.B.Ramsey)的回归设定误差检验法(RESET法)。27
RESET检验法的思路
RESET检验法的思路是在要检验的回归方程中加进等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能够通过F检验,表明它们改善了原方程的拟合状况,则有理由说原方程存在误设定问题。28等项形成多项式函数形式,多项式是一种强有力的曲线拟合工具,因而如果存在误设定,则用这样一个工具可以很好地代表它们。如果不存在误设定,则可以预期,这些新添加项的系数不显著异于0,因为不存在让它们做替身的东西。29RESET检验法的步骤拉姆齐RESET检验的具体步骤是:(1)用OLS法估计要检验的方程,得到(2)由上一步得到的值(i=1,2,…,n),计算,然后用OLS法估计:(3)用F检验比较两个方程的拟合情况(类似于上一章中联合假设检验采用的方法),如果两方程总体拟合情况显著不同,则得出原方程可能存在误设定的结论。30使用的检验统计量为:其中:RSSM为第一步中回归(有约束回归)的残差平方和,RSS为第二步中回归(无约束回归)的残差平方和,M为约束条件的个数,这里是M=3。拉姆齐RESET检验仅能检验误设定的存在,而不能指出是哪一类的误设定,即不能得到正确的模型是什么。另一方面,如果模型设定正确,RESET检验能够排除误设定的存在,转而去查找其它方面的问题。31第二节多重共线性应用OLS法的一个假设条件是:矩阵X的秩=K+1<N。即自变量之间不存在严格的线性关系,观测值个数大于待估计的参数的个数。否则,OLS估计值的计算无法进行,估计过程由于数学原因而中断,就象分母为0一样。32这两种情况都很罕见。但经济变量之间存在近似的线性关系是很常见的。当某些解释变量高度相关时,尽管估计过程不会中断,但会产生严重的估计问题,这种现象称为多重共线性。解释变量间存在严格线性相关关系时,称为完全的多重共线性。33一、多重共线性的定义多重共线性是指解释变量Xi(i=1,2,…,k)之间存在完全的或近似的线性关系。可分为完全和不完全多重共线性:完全多重共线性是指rank(X)<k+1,X矩阵的列向量线性相关,至少有一列向量可以由其它列向量线性表示。34例如:在回归模型Y=b0+b1X1+b2X2+u中,X2=X1,为不为0的常数,这时X2与X1的相关系数为1,解释变量X2对因变量Y的作用可由X1完全替代。不完全多重共线性是指解释变量Xi之间存在着近似的线性关系。例如:X2=X1+,为随机项,X2与X1的相关系数近似等于1。35二、多重共线性的原因产生多重共线性的原因主要有以下三个方面:361.有关经济变量存在相似变化趋势时间序列样本中,某些变量的行为方式相同,变化增量近似等比,出现同步增长或同步下降的趋势。这些变量的样本数据就会存在某些近似的比例关系,若把这些变量作解释变量,就会产生多重共线性。横截面数据也有可能产生多重共线性,例如在研究企业生产函数时,资本投入和劳动力投入几乎是高度线性相关的。372.滞后变量的引入在经济计量模型中,需要用滞后变量来反映真实的经济关系,同一变量的前后期之值很可能是高度线性相关的。(关于滞后变量将在第六章介绍)383.样本资料原因在(总体)理论模型中不存在多重共线性,但在特定的样本数据中存在某种程度的多重共线性。(纯粹是由样本数据引起的.)39三、多重共线性的影响后果若完全多重共线性则无法估计模型参数,不完全多重共线性的影响后果如下:1.不改变参数估计量的无偏性。对于不完全多重共线性,参数OLS估计量仍为BLUE。2.各共线变量的参数的OLS估计量方差很大,即估计值精度很低。(BLUE表明在各线性无偏估计量中方差最小,但不等于方差的值很小。)40例如:Yt=0+1X1t+2X2t+ut其中r12是X1和X2的相关系数。当r12接近1时,将非常高。41
3.由于若干个X变量共变,它们各自对因变量的影响无法确定。4.各共线变量系数估计量的t值低,使得犯第Ⅱ类错误的可能性增加。由于各共线变量的参数的OLS估计量方差大,因而系数估计量的t值低,使得犯第Ⅱ类错误(接受错误的原假设H0:βj=0)的可能性增加,容易将本应保留在模型中的解释变量舍弃了。42三、多重共线性的判别和检验1.根据回归结果判别判别是否存在多重共线性的最简单方法是分析回归结果。如果发现:(1)系数估计值的符号不对;(2)某些重要的解释变量t值低,而R2不低;(3)当一不太重要的解释变量被删除后,回归结果显著变化。则可能存在多重共线性。其中上述第二种现象是多重共线性存在的典型迹象。此方法简便易行,因而是实践中最常用的方法,缺点是无法确诊。432.使用相关矩阵检验统计软件一般提供各解释变量两两之间的相关系数矩阵,如发现某些相关系数高(绝对值高于0.8或0.90),则表明多重共线性存在。但即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。443.使用VIF检验VIF是方差膨胀因子的英文(varianceinflationfactors)缩写,这是一种比较正规的检验方法。该方法通过检查指定的解释变量能够被回归方程中其它全部解释变量所解释的程度来检测多重共线性。方程中每个解释变量有一个VIF,该VIF是关于多重共线性使相应的系数估计量的方差增大了多少的一个估计值。45VIF检验的具体步骤如下:设原方程为Y=0+1X1+2X2+…+kXk+u要计算k个不同的VIF,每个Xi一个,分三步:(1)Xi对原方程中其它全部解释变量进行OLS回归.例如,若i=1,则回归下面的方程X1=0+2X2+3X3+…+kXk+v(2)计算的方差膨胀因子VIF。46(3)分析多重共线性的程度VIF越高,多重共线性的影响越严重。由于没有VIF临界值表,只能使用经验法则:若>5则存在严重多重共线性。也有人建议用VIF>10作为存在严重多重共线性的标准,特别是解释变量多的情形应当如此。需要指出的是,所有VIF值都低,并不能排除严重多重共线性的存在。474.通过条件指数检验
条件指数(Conditionindex)是X´X矩阵的最大和最小特征根之比的平方根,条件指数高,表明存在多重共线性。至于什么程度算高,也没有一个绝对的标准。通常认为大于10即存在多重共线性,大于30表明存在严重多重共线性。大多数统计软件提供此检验值。48四解决多重共线性的方法思路:加入额外信息。具体方法有以下几种1.增加数据多重共线性实质上是数据问题,因此,增加数据就有可能消除或减缓多重共线性,具体方法包括增加观测值、利用不同的数据集或采用新的样本。49例5.1需求函数Yt=β1+β2Xt+β3Pt+ut在时间序列数据中,收入X和价格P往往高度相关,会产生多重共线性。但在横截面数据中,则不存在这个问题,因为某个特定时点P为常数。如果取一横截面样本(如从5000个家庭取得的数据),则可用来估计模型Yi=α1+α2Xi+ui
然后将得到的估计值作为一个约束条件(β2=)施加于时间序列数据的回归计算中,即估计Yt
-Xt=β1+β3Pt+ut,得到,。50
2.对模型施加某些约束条件在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差。如在Cobb—Douglas生产函数中加进规模效益不变的约束,可解决资本和劳动的高度相关而引起的多重共线性问题。51
3.删除一个或几个共线变量这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删除哪些变量,可根据假设检验的结果确定。应注意的是,这种做法可能会使得到的系数估计量产生偏倚,因而需要权衡利弊。524.将模型适当变形例5.2某商品的需求函数为:其中:Q=需求量,X=收入,P=该商品的价格,P*=替代商品的价格,在实际数据中,P和P*往往呈同方向变动,高度相关,模型存在多重共线性。如果仅要求在知道两种商品的相对价格变动时,对需求量进行预测,则可将需求函数变为:就可以解决多重共线性问题。53例5.3有滞后变量的情形Yt=β1+β2Xt+β3Xt-1+ut一般而言,Xt和Xt–1往往高度相关,将模型变换为:Yt=β1+β2(Xt
-Xt–1)+β3´Xt-1+ut其中β3´=β3+β2
经验表明:△Xt和Xt–1的相关程度要远远小于和Xt和Xt–1的相关程度,因而这种变换有可能消除或减缓多重共线性。545.主成分法可将共线变量组合在一起形成一个综合变量,用它来代表这组变量。
构造综合变量的最常用方法是主成分法,作法是对全部解释变量运用主成分分析以得到主成分,每个主成分是全部解释变量的线性组合,如C1=1X1+2X2+…+kXk
55各主成分之间互不相关,用很少几个主成分就可以解释全部X变量的绝大部分方差,因而在出现多重共线性时,可以用主成分替代原有解释变量进行回归计算,然后再将所得到的系数还原成原模型中的参数估计值。56五.处理多重共线性问题的原则1.多重共线性是普遍存在的,轻微的多重共线性问题可不采取措施。2.严重的多重共线性问题,一般可根据经验或通过分析回归结果发现。如影响系数的符号,重要的解释变量t值很低。要根据不同情况采取必要措施。3.如果模型仅用于预测,则只要拟合程度好,可不处理多重共线性问题,存在多重共线性的模型用于预测时,往往不影响预测结果。57第三节异方差性上面讨论了误设定和多重共线性问题。回顾应用OLS法所需假设条件,其中大部分是有关扰动项的统计假设,它们是:(1)E(ut)=0,t=1,2,…,n.扰动项均值为0(2)Cov(ui,uj)=0,i≠j.扰动项相互独立(3)Var(ut)=2
,t=1,2,…,n.常数方差(4)ut
~N(0,2).正态性58对于(1),可论证其合理性。而第(4)条,也没有多大问题。大样本即可假定扰动项服从正态分布。而对于(2),(3)两条,则无法论证其合理性。
实际问题中,这两条不成立的情况比比皆是。下面将讨论异方差性和自相关的情形。59
一、异方差性及其后果1.定义若Var(ut)=2=常数的假设不成立,即
Var(ut)=t2≠常数,则称扰动项具有异方差性。2.可能产生异方差的场合解释变量取值变动幅度大时。异方差主要发生在横截面数据的情况,时间序列中一般不会发生,除非时间跨度过大。60例5.4Yi=α+βXi+ui
其中:Y为指定规模和组成的家庭每月消费支出,X为这样的家庭的每月可支配收入.在X的N个观测值横截面样本中,某些家庭接近于勉强维持生存的水平,另一些家庭则有很高的收入。61低收入家庭的消费支出不大可能离开他们的均值E(Y)过远,太高无法支持,太低则消费将处于维持生存的水平之下。因此,低收入家庭消费支出额的波动应当较小,因而扰动项具有较小的方差。而高收入家庭则没有这种限制,其扰动项可能有较大的方差。这就意味着异方差性。623.异方差性的后果(1)参数OLS估计量不再具有最小方差.异方差性不破坏OLS估计量的无偏性,但不再是有效的,也不具有渐近有效性。(2)系数的显著性检验失去意义在异方差性情况下,矩阵主对角元素不再是OLS估计量真实方差的无偏估计量,从而导致系数的置信区间和假设检验结果不可信赖。63二、异方差性的检验
常用的检验方法有:
斯皮尔曼等级相关检验法(SpearmanRankRelationtest)
戈德弗尔德—匡特检验法(GoldfeldQuandttest)
格里瑟检验法(Glesjertest)
帕克检验法(Parktest)
怀特检验法(White’sGeneralHeteroscedasticitytest)64
1.斯皮尔曼等级相关检验法思路:对异方差性的研究转化为对ut与Xt的相关程度的研究。由于扰动项无法观测,因而用残差代替之,转化为对et与Xt的相关程度的研究,若et与Xt高度相关,则可推断异方差性存在。65在此无法用相关系数来检验,因为et与Xt的相关系数恒等于0:因而改用Xt和et的等级相关系数检验et和Xt的相关程度。66等级相关系数的计算步骤(1)将两变量的相应观测值分别按升序(或降序)排序,所得到的序号即为等级。(2)计算两变量各对观测值相应的等级之差dt.(3)计算等级相关系数67例5.5等级相关系数的计算假设有Xt和et如下:Xt:25,40,52,58,65et:1.6,-2.9,-10.7,–14.8,5.7有et:1.6,2.9,10.7,14.8,5.7Xt的等级︱et︳的等级dt
1 1 0 2 2 0 3 4 -1 4 5 -1 5 32r=1–(6×6)/(5×24)=1-0.3=0.768计算出等级相关系数后,就可判断异方差性是否存在。若相关系数绝对值高,则存在异方差性。对于多个解释变量的情况,可分别计算et与各解释变量的等级相关系数进行检验。692.戈德弗尔德——匡特检验法基本思路:假定t2随Yt的数值大小变动。检验步骤:(1)将数据分为三组:小Yt值组,中Yt值组,大Yt值组(数据项大致相等)(2)对小Yt值组估计模型,给出(3)对大Yt值组估计模型,给出70(4)检验假设H0:H1:(或)检验统计量为
F0=~F(n3-k-1,n1-k-1)若F0>Fc,则拒绝H0,存在异方差性。71例5.6S=α+βY+u其中:S=储蓄Y=收入设1951—60年,=0.016251970—79年,
=0.9725F0=0.9725/0.01625=59.9查表得:d.f.为(8,8)时,5%Fc=3.44∵F0>Fc因而拒绝H0。结论:存在异方差性。72三、消除异方差性的思路基本思路:变换原模型,使经过变换后的模型具有同方差性,然后再用OLS法进行估计。对于模型Yt=β0+β1X1t+…+βkXkt+ut(5.15)若扰动项满足E(ut)=0,E(uiuj)=0,i≠j,但E(ut2)=t2≠常数.73设扰动项异方差形式如下:
Var(ut)=t2=2t2,t=1,2,…,n其中2为一未知常数,t2表示一组已知数值,则用t去除模型各项,得变换模型:
74所以变换后的扰动项方差为常数,可用OLS法进行估计,得到的参数估计量为BLUE。但这是变换后模型(5.16)的OLS估计量。对原模型而言,它已不是OLS估计量,称为广义最小二乘估计量(GLS估计量)。75四、广义最小二乘法(Generalizedleastsquares)下面用矩阵形式的模型来推导出GLS估计量的一般计算形式。设GLS模型为Y=Xβ+u(5.17)满足E(u)=0,E(uu´)=2,X非随机,X的秩=K+1<n,其中Ω为正定矩阵。(注:正定矩阵是和单位矩阵合同的矩阵;正定矩阵<=>所有顺序主子式均大于0。)
76
根据矩阵代数知识可知,对于任一正定矩阵Ω,存在着一个满秩(非退化,非奇异)矩阵P,使得Ω=PP´,Ω-1=(P-1)´P-1
用P-1左乘原模型(5.17)(对原模型进行变换):P-1Y=P-1Xβ+P-1u令Y*=
P-1Y
,X*=P-1X,u*=P-1u,得到
Y*=X*β+u*
(5.18)模型(5.18)的扰动项u*满足OLS法的基本假设条件。7778可直接用OLS估计模型(5.18),参数估计量向量这就是的广义最小二乘估计量(GLS估计量)的公式,该估计量是BLUE。只要Ω为正定矩阵就可用GLS法估计模型(5.17)。79如果只存在异方差,则其中显然有8081五、广义最小二乘法的应用1.根据实际问题确定Ω矩阵应用GLS法的关键是确定Ω矩阵。对于仅存在异方差的实际问题,Ω矩阵是一个对角矩阵,即82例5.7Yt=β1+β2Xt+utt=1,2,…,n.其中,Y=家庭消费支出,X=家庭可支配收入高收入家庭有较大的扰动项方差,假定扰动项方差与可支配收入成正比,即Var(ut)=δXt,t=1,2,…,n.式中δ是一未知常数,由于Xt为已知,相当于t2,而δ相当于2,因此应用GLS法,即可得出β的GLS估计量。832.根据格里瑟检验法(Glesjertest)确定异方差形式Glesjer检验法不仅可检验异方差是否存在,还可确定异方差形式,对于确定Ω矩阵很有用。84
格里瑟检验法的思路是假定扰动项方差与解释变量之间存在幂次关系,
方法是用et对被认为与扰动项方差有关的解释变量回归,确定et和该解释变量的关系。需要用该解释变量的不同幂次进行试验,选择出最佳拟合形式。85具体步骤如下:(1)因变量Y对所有解释变量回归,计算残差et
(t=1,2,…,n)(2)et对所选择解释变量的各种形式回归,如
然后利用决定系数,选择拟合最佳的函数形式。(3)对β1进行显著性检验,若显著异于0,则表明存在异方差性,否则再试其它形式。86
格里瑟检验法的最大优点是能够提供有关异方差性形式的信息,为GLS法提供Ω矩阵。缺点是太繁琐。一般用其它方法检验异方差是否存在,然后再用格里瑟法确定异方差的具体形式,进而应用GLS法。87例5.8Yt=β1+β2X1t+…+βkXkt+ut假设根据经验知道扰动项方差与Xjt有关,并用格里瑟法试验,得出:883.加权最小二乘法WLS法对于仅存在异方差性的问题,Ω矩阵是一个对角矩阵,即在这种情况下应用广义最小二乘法,也就是在原模型Y=Xβ+u两端左乘矩阵89变换原模型,再对变换后的模型应用普通最小二乘法进行估计。这种做法实际上等价于在代数形式的原模型Yt=β0+β1X1t+…+βkXkt+ut的两端除以t,得变换模型90此变换模型扰动项同方差,可用OLS法估计。这种做法相当于在回归中给因变量和解释变量的每个观测值都赋予一个与相应扰动项的方差相联系的权数(1/t,t=1,2,…,n),然后再对这些变换后的数据进行回归,这种做法称为加权最小二乘法WLS法,是广义最小二乘法的特例。91例5.9Yi=β1+β2Xi+ui…(5.19)式中Y为R&D支出,X为销售额。采用美国1988年18个行业的数据估计上述方程,结果如下(括号中数值为t值)这里是横截面数据,由于行业之间的差别,可能存在异方差。应用格里瑟法试验,得到异方差形式为i2=Xi,将原模型的两端除以92用OLS法估计(5.20),结果如下(括号中数值为t值)与式(5.19)的结果比较,两个方程斜率系数的估计值相差不大,但采用WLS法估计的β比直接用OLS法估计的系数更为显著,这表明OLS法高估了X的系数估计量的标准误差。93第四节自相关一、定义若Cov(ui,uj)=E(uiuj)=0,i≠j不成立,即线性回归模型扰动项的方差—协方差矩阵的非主对角线元素不全为0,则称为扰动项自相关,或序列相关(SerialCorrelation)。94二、自相关的原因及后果1.原因:自相关主要发生在时间序列数据的情形.主要有以下两种原因:(1)随机冲击的延期影响(惯性)时间序列情况下,随机扰动的影响往往持续不止一个时期。例如,地震、洪水、罢工或战争等将在发生时期的后续若干期中影响经济运行。95
又如一个工厂的产量,由于某种外部随机因素的影响(如某种原材料的供应出了问题),该厂某周产量低于正常水平。则随后的一周或几周中,由于这种影响继续延续,产量也很可能低于正常水平(即扰动项为负)。可以看出,观测的周期越长,这种延期影响就越小,因此,年度数据比季度数据序列相关可能性要小。96(2)误设定如果忽略了一个有关的解释变量,而该变量是自相关的,则将使扰动项自相关,不正确的函数形式也将导致同样后果。在这些情况下,解决的方法是纠正误设定。本章后面将介绍的纠正自相关的方法都不适用于这种情况的自相关。972.后果自相关的后果与异方差类似。(1)在扰动项自相关的情况下,OLS估计量仍为无偏估计量,但不再具有最小方差,即不是BLUE。(2)OLS估计量的标准误差不再是真实标准误差的无偏估计量,回归参数的置信区间和假设检验结果不可相信。98三、自相关的检验1.一阶自相关的检验德宾—沃森检验法(Durbin—Watsontest)(1)一阶自相关ut=ρut-1+εt,t=1,2,…,n.
ρ称为自相关系数(-1≤ρ≤1),这种扰动项的自相关称为一阶自相关,即扰动项仅与其前一期的值有关。ρ>0正自相关ρ<0负自相关ρ=0无自相关99在一阶自相关模式中,假定εt具有以下性质:E(εt)=0,E(εt²)=σ2=常数,E(εiεj)=0,i≠j,εt服从正态分布。在计量经济学中,具有上述性质的变量称为白噪声(Whitenoise),表示为εt=Whitenoise或εt=白噪声100(2)德宾—沃森检验法(DW法)DW法要检验的原假设是:H0:=0,若H0为真,则ut=t,所检验的模型不存在扰动项自相关;若拒绝原假设,则存在自相关。检验统计量DW根据OLS回归的残差计算:101DW检验的原理:DW检验量的分子是即残差变动的平方和。如果相邻两期的扰动项存在正自相关,则它们值的符号一般相同,所以应该很小。极端的情况是=1,这时ut=ut-1,102由于et可作为ut的估计值,故也应该约等于0,即DW约等于0
。另一方面,如果相邻两期的扰动项存在负自相关,则它们值的符号一般相反,所以应该增大。极端的情况是=-1,这时ut=-ut-1,103所以DW=则104将DW检验量的分子展开,有105故当n充分大时,最后一项可以认为是约等于0,因此有106另一方面,用OLS法估计et=et-1+t,t=2,3,…,n得出式中,为一阶自相关系数的估计值。107所以DW和一阶自相关系数ρ的估计值之间存在以下近似关系:DW≈2-2由于-1≤ρ≤1,因而0≤DW≤4。DW检验的原理是:当DW值接近2时,则无自相关,DW值离2越远,则自相关存在的可能性越大。108DW检验的缺陷DW统计量的概率分布不仅与样本容量n和解释变量个数k有关,还依赖于解释变量的具体观测值(即依赖于X矩阵)。不象t、F检验那样,根据n,k就可以确定其分布,并给出一张临界值表。德宾和沃森证明,只给定n,k,虽然DW统计量的真实分布不确定,但却位于两个极限分布之间,分别称为下分布和上分布,如下图所示:109每个分布的95%临界水平用A,B,C,D表示0ABCDDW值图5-1
概率密度下分布上分布95%95%110如果DW的值在A左边或在D右边,则不管DW统计量服从何种分布(上,下或中间),无自相关的原假设被拒绝。若DW的值在B和C之间,则接受原假设。而当DW的值在A和B之间或C和D之间时,则无法得出结论。上述分析可以概括为:
DW<A或DW>D存在自相关B<DW<C无自相关A<DW<B或C<DW<D无结论区111
无结论区的存在是DW法的最大缺陷。德宾和沃森根据上下限分布给出了一个下临界值dL和一个上临界值du来检验自相关,dL和du仅依赖于观测值的数目n、解释变量k,以及显著性水平,而不依赖于解释变量所取的值。(请参阅DW表)112检验程序如下:a.用OLS法对原模型进行回归,得残差et(t=1,2,…,n)。b.计算DW值(回归软件给出DW值)。c.用n,k和查表得dL,du。d.判别
实际的检验程序可用下面的示意图说明。正自相关无结论区无自相关无结论区负自相关0dL
du 24-du4-dL4113①若0<DW<dL,则ut存在一阶正自相关②若4-dL<DW<4,则ut存在一阶负自相关③若du<DW<4-du则ut不存在自相关④若dL<DW<du或4-du<DW<4-dL,则不能确定ut是否存在自相关
例:DW=3.5,查表(n=30,k=2,=5%)得:dL=1.284,du=1.567。因为4-dL=2.716<DW=3.5<4结论:ut存在一阶负自相关。1142.其它检验自相关的方法DW检验法只能检验一阶自相关,且方程中不包括滞后因变量(如Yt-1,Yt-2等)。下面列出其它几种检验方法及其适用环境。检验方法适用环境Durbin’sh检验法一阶自相关,方程中有Yt-1Box-Pierce检验法一般自相关(K阶)拉格朗日乘数LM检验法一般自相关(K阶)115四、消除自相关的方法1.一阶自相关如果是一阶自相关,只要知道ρ,就可以完全消除自相关,下面用双变量模型来说明(同样适用于多个解释变量模型)。设Yt=α+βXt+ut…(5.25)
ut=ρut-1+εt其中εt是白噪声,且ρ≠0。
(5.25)式两端取一期滞后,得
Yt-1=α+βXt-1+ut-1…(5.26)(5.26)式两端乘以ρ,得
ρYt-1=αρ+βρXt-1+ρut-1…(5.27)116(5.25)-(5.27),得:
Yt-ρYt-1=α(1-ρ)+β(Xt-ρXt-1)+(ut-ρut-1)…(5.28)(5.28)式中的扰动项为ut-ρut–1=εt,从而满足标准假设条件。令Yt´=Yt-ρYt-1Xt´=Xt-ρXt-1(广义差分变换)α´=α(1-ρ),有
Yt´=α´+βXt´+εt…(5.29)若ρ为已知,就可用OLS法直接估计(5.29)式,否则需要先估计ρ。在ρ未知的情况下,通常用下列两种方法。117(1)科克伦—奥克特法(Cochrane—Orcutt)它是一个迭代过程,步骤如下:①用OLS法估计原模型(5.25)式,计算残差et。②et对et-1回归,即估计et=ρet-1+εt,得到ρ的估计值③用计算然后估计Yt´=α´+βXt´+εt,得到α和β的估计值和。④把参数估计值代入原模型重新计算残差,返回第②步。此过程不断修改,和,直至收敛。118(2)希尔德雷斯—卢法(Hildreth—lu)这是一种格点搜索法,即在ρ的预先指定范围(如-1至1)内指定搜索间隔(如0.01),然后用这样产生的全部ρ值(-1.00,-0.99,…,1.00)产生Yt´=Yt–ρYt-1Xt´=Xt-ρXt-1估计Yt´=α´+βXt´+εt
产生扰动项最小标准误差的ρ值即作为ρ的估计值,用该ρ值得到的和即为原模型的系数估计值。1192.一般自相关对于一般自相关问题,可采用广义最小二乘法处理。自相关意味着扰动项u的方差—协方差矩阵E(u12)E(u1u2)…E(u1un)E(uu´)=E(u2u1)E(u22)…E(u2un)……E(unu1)E(unu2)…E(un2)中某些E(uiuj)≠0,i≠j.即E(uu´)=2Ω,其中Ω为对称正定矩阵。因而可应用GLS法。此方法可用于任何类型的自相关。120第五章小结一、误设定误设定包括函数形式的误设定和解释变量的误设定。重点介绍了两种类型的误设定。1、模型中忽略了有关的解释变量其后果是使参数估计量产生偏倚,即OLS估计量不再是无偏估计量。2、模型中包括了无关的解释变量其后果是增大了估计量的方差,但估计量仍无偏。121
在实际工作中,可用拉姆齐RESET检验法检验模型是否误设定,但仍无
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年地理知识竞赛题库及答案
- 2025护士资格考试传染病试题及答案
- 情感化营销策略在批发平台的应用考核试卷
- 年产新型包装材料95000件项目报告表
- 枞阳融资管理办法
- 微信对账管理办法
- 2024年四川省资中县卫生高级职称(卫生管理)考试题含答案
- 报修平台管理办法
- 开展业务管理办法
- 政协目标管理办法
- 【可行性报告】2023年高纯金行业项目可行性分析报告
- LangChain入门指南:构建高可复用、可扩展的LLM应用程序
- 重点企业全流程自动化控制改造提升工作方案
- 扩展坞的方案
- 运维安全审计系统堡垒机
- 光伏电站运维安全管理台账
- 《抑郁焦虑识别》课件
- 《新活素心内科》课件
- 输电线路基础占地补偿协议书
- 某某公司钢渣处理项目可行性研究报告书
- 中建标准厂房钢结构安装施工方案
评论
0/150
提交评论