违反模型古典假定的计量经济问题_第1页
违反模型古典假定的计量经济问题_第2页
违反模型古典假定的计量经济问题_第3页
违反模型古典假定的计量经济问题_第4页
违反模型古典假定的计量经济问题_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 论违反模型古典假定的计量经济问题 异方差性一、异方差性对于模型 同方差性假设为 如果出现 即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则称出现了异方差性。强调对于每一个样本点,随机误差项都是随机变量,服从均值为0的正态分布,所谓异方差性,是指这些随机变量服从不同方差的正态分布。我们可以通过下面两个图形比较同方差和异方差:在a同方差情况下,与任意选定的X相对应的Y的子总体具有相同的方差。在b异方差情况下,不同的X所对应的Y的子总体具有不同的方差。二、异方差的实际背景1经济现象本身的特点例研究居民消费问题,建立消费函数 =居民收入额 =居民支出额收入高的居民平均支出水平也高,收入

2、低的居民在维持平均水平较低的每月日常支出后节余很少,很难有大的偶尔开支,因此偏离均值的程度就小。而收入高的居民在维持平均水平叫高的每月日常支出后节余仍然很多,完全有能力支出大的非日常项目,因此偏离均值的程度就大。收入水平不同的居民之消费行为的差异,在消费模型中的表现就是误差项具有异方差性,误差项的假定不符合实际经济现象。2略去某些变量 若对被解释变量有重要影响的解释变量全都明确地引入模型并设立正确,不存在大的观测误差,误差项是由大量微小的随机误差聚合而成,一般说来不会违反同方差假定。 但有时根据研究目的,有些经济变量被略去,不明确引入模型。若这些被略去的变量对被解释变量影响比较重要,一般呈现某

3、种趋势,那么误差项的随机性和同方差性将被破坏。3模型的设立误差 在实际中,往往为了便于估计而采用线性模型近似表示,设想一下,用一条直线去近似地表示一条曲线,在有的区间直线与曲线相距较近,能够很好地表示曲线的这一区间部分,误差较小,必然存在另外一些区间直线与曲线相距较远,不能够很好的表示曲线的这一区间部分,误差较大从而形成异方差性。4测量误差 由于对变量的样本观察值的误差,随解释变量的增加,测量误差也趋于增加。因为在很大的范围内收集资料和保持它们的一致性及可靠性是比较困难的,此外,测量误差在时间范围内逐渐积累,误差项也趋于增加,误差项的方差呈递增趋势,随着抽样技术和资料搜集技术的改进,测量误差会

4、逐渐减少,误差项的方差随时间呈递减趋势。这两种趋势都使模型具有异方差性。三、异方差性的后果1参数估计量非有效从前面有关参数估计量的线性性,无偏性和有效性的证明过程,可以看出线性性和无偏性的证明过程中没有利用同方差性的假定,所以当计量经济学模型出现异方差性,其普通最小二乘法参数估计量仍然具有线性性,无偏性,但不再具有有效性,即使样本趋于无穷大,仍然不具有渐近有效性。2变量的显著性检验失去意义 t统计量中包含有,当不满足同方差假定时,不再是总体方差的无偏估计,从而导致计算出的t统计量不再满足t分布,检验失去意义,其他检验(F)也是如此。3模型的预测失败 一方面由于上述后果,使模型不具有良好的统计性

5、质,另一方面,在观测值的置信区间中也包含有随机误差项共同的方差,所以当模型出现异方差性时,它的预测功能失效。四、异方差性的检验1图示法(1)若不随的变化而变化,则扰动项无异方差性,否则存在异方差性。(2)2Spearman(斯皮尔曼)等级相关系数检验该方法用于检验是否存在异方差,观测值可以是大样本,也可以是小样本基本思路 若扰动项是同方差的,那么残差的大小与解释变量的取值无关。 ( 不可求,用代替)这可以通过二者的等级相关系数来反映。检验步骤(1)用最小二乘法估计回归模型 的回归系数 求出扰动项的估计值 显然,的异方差性与的异方差性等价,因此只要检验与的相关性,便可确定的异方差性。 但是在与的

6、简单相关系数的计算公式中,分子是等于0的,即与的简单相关系数恒等于0,所以不能用来衡量与的关系,也就不能判断的异方差性,为此我们改用等级相关系数来检验与的相关程度。(2)对解释变量和残差分别按从小到大的顺序重新排列,并赋予1到n中的一个顺序号表示其等级。(若两个值相等,则等级取等级的平均数)(3)计算与的等级差 =的等级的等级(4)计算等级相关系数 其中n为样本容量(5)对等级相关系数进行显著性检验提出假设 r近似服从均值为0,方差为1/(n-1)的正态分布 无异方差性 有异方差性计算Z统计量查表确定临界值 判断若<,则接受,认为与关系不密切,即无异方差性 (等级相关系数不显著)若>

7、;,则拒绝,接受,认为与关系密切,存在异方差性 (等级相关系数显著)例题见 于俊年P120页3HGlejser(戈里瑟)检验 该方法不仅可以用于检验异方差的存在,更重要的是可以查明异方差的表现形式,这对异方差的修正非常重要。基本思路 在残差关于解释变量的各种幂次影响关系中,确定出一个最显著的函数形式,它不仅可以说明异方差的存在,还确立了异方差的表现形式。检验步骤(1)用OLS估计回归模型的回归系数,求出扰动项的估计值。(2)用与解释变量的不同幂次进行回归模拟,选择出最佳的回归估计式。 例如: 在对这些模型进行OLS估计的基础上,由和标准差(t)检验,选择最优的拟合回归形式。(3)对选择的最优拟

8、合回归形式进行F检验,若显著则认为存在异方差性,否则再选择其他回归形式。 若认为与多个解释变量有关,则可用对多个解释变量回归,方法同上。 由于检验是试验性的,如果模型选不好,则检验不出是否存在异方差性。4GoldfeldQuandt(戈德菲尔特夸特)检验仅适用于大样本,而且具体步骤(1)将解释变量按观测值从小到大重新排队,被解释变量与解释变量保持原来的对应关系。(2)将位于中间的c个观测值略去,通常,剩下两个样本容量分别为的子样本(n与c应当同为奇数或同为偶数)。一个子样本解释变量的观测值较小,另一个子样本解释变量的观测值较大。(3)对两个子样本分别利用最小二乘法进行回归,并计算各自的残差平方

9、和,记为解释变量的观测值较小的残差平方和,为解释变量观测值较大的子样本的残差平方和。(4)进行假设检验 随递增判断 若F> 拒绝,接受随递增,说明随机扰动项存在异方差性。 若F< 接受,说明随机扰动项是同方差的。5Park(帕克)检验马薇 P1456White(怀特)检验 王维国 P141 天大P65五、解决异方差扰动项的办法检验与解决,例题, 钟直P2041对原模型进行变化 扰动项具有异方差的实质是为解释变量的函数。若认为只与一个解释变量有关,可表示为;若认为与m个解释变量有关,则异方差形式可写作以一个为例设原模型为 其中具有异方差性(其余假定都满足),假定现在已知 其中为常数,

10、现在的问题是经典假定遭到了破坏,如何求出参数的最佳线性无偏估计量?解决这个问题的基本想法是对原模型作适当的变换,使变换后的随机项不再具有异方差,从而用OLS法求出参数的最佳线性无偏估计量。 用去除方程两端 令则模型变为 ()式中的参数即原模型中的参数,但是随机扰动项已经没有异方差性了。因为 因此对模型()应用OLS法,即可得出参数的最佳线性无偏估计量,问题得以解决。例 设模型中的异方差结构为,(最常见)求的最佳线性无偏估计量。解: 用去除模型两边 改写成 其中 由于变换后的已无异方差,应用OLS法得的最佳线性无偏估计量为 例 设则上式变为 设 模型变为 用OLS估计的估计值、2加权最小二乘法(

11、WLS) 在OLS法中,其基本原则是使残差平方和达到最小,在这里,我们看到每个残差都有相同的权数,(权数皆为1)。对于随机项具有同方差性来说,这样处理是合适的。若是异方差情况下,的方差在不同的上应该是不同的。例,当的方差随值的增大而增大时,对应于较大X值的估计值的偏差就比较大,因此用相同的尺度标准去衡量不断变化的偏差是不适合的,解决的办法是对应于较大的X的观测值给予较小的权数,对应于较小的X的观测值给予较大的权数。显然,用作为的权数是合理的。现在,我们可以用权数将普通最小二乘法修正为:使加权残差平方和- (1)达到最小,这就是加权最小二乘法。下面说明,加权最小二乘法同样可以消除异方差性的影响设

12、异方差是的函数 (2) 将(2)代入(1)得加权最小二乘法,要求 - 达到最小。 (2) 现在对原模型进行变换 (3) 对(3)式应用OLS法,要求残差平方和 - (4)达到最小 显然,能使(4)式达到最小的、也一定能使(2)达到最小。因为二者只差一个常数因子,即两种方法得到的结果相同,由于用变换的方法能消除u异方差的影响,所以用加权最小二乘法也能消除异方差的影响。两种方法实质上是一致的,对原模型进行变换的方法实际上是加权最小二乘法当=1时的特例,也可以看作是加权最小二乘法的直接应用。例 已知消费模型 其中:=消费支出 ;=个人可支配收入 =消费者的流动资产 E()=0 V()= (为常数)请

13、回答以下问题:(1)进行适当变换消除异方差,并证明之,(2)写出消除异方差后,模型的参数估计量的表达式。解:(1) 变换后的模型已无异方差性,因为 (常数)(2)设 则模型变为 第二节 序列相关性一、序列相关性对于模型 (i=1,2,,n)随机误差项相互独立的基本假设表现为 如果出现 即对于不同的样本点,随机误差项之间不再是完全相互独立,而是存在某种相关性,则认为出现了序列相关性。说明 自相关是相关的一种特殊情况。自相关指的不是两个(或更多)不同变数之间的关系,而是指同一变数的逐次值之间的关系。二、序列相关性的来源1被解释变量的自相关 经济现象的变化不是凭空发生的,是离不开周围的环境和自身的基

14、础的。离不开周围的环境是指与其它经济现象具有影响或被影响的关联,离不开自身的基础是指当期的水平只能在前期的水平上在一定范围内变化。 因此,作为被解释变量的经济现象往往是自相关的,其t期数值依赖于t-1期数值,被解释变量与误差项具有相同的分布,因此被解释变量的自相关会导致误差项的自相关。2略去了自相关的解释变量 在建立回归模型时,不管是按照经济理论和实际经验,还是按照统计标准,总是选择最重要的解释变量,而略去相对不那么重要的解释变量。如果略去的解释变量是自相关的,则必然在误差项中反映出来,使得误差项出现自相关。略去若干个解释变量,各个解释变量的自相关可能相互抵消,误差项不出现自相关。3随机扰动项

15、本身的特性 有些影响大的偶然因素如战争、地震等,其影响会延续一个时期以上,如果没有以性质变量的方式明确引入模型中,则这种影响将在连续若干期误差项中存在,造成自相关。4错误地设定模型形式 如果模型采取的数学形式与所研究的关系的真实形式不同,u可能表示为序列相关。例如Y与X的真实关系是循环形式,但如果选择了线性形式,则u值将会在时间上是相关的。5由整理统计观测值所引起 大多数发表的时间序列数据都含有某些内插值,还有“修匀过程”,即将连续时期中真实扰动项加以平均的过程。结果,u的逐次值就相关联,并显现为自相关形式。三、序列相关性的后果1参数估计量非有效 参数估计量仍旧是线性、无偏的,但不具有有效性,

16、因为在有效性的证明中利用了同方差性和互相独立性条件,而且,参数估计值不具有一致性。参数估计量的方差比之自相关情况下增大。2变量的显著性检验失去意义 由于参数OLS估计量的方差增大,标准差也增大,在参数显著性检验时,实际计算的t统计量变小,从而接受可能性增大,这表明拒绝估计值的机会大大增加,t检验失效。3模型的预测失效 由于上述后果,使得模型不具有良好的统计性质,因此预测功能失效。四、序列相关的检验1图示法(1)残差的自相关图(2)残差的时序图图3为循环型,并不频繁地改变符号,而是相继几个正的之后跟着几个负的,表明存在正的自相关。图4为锯齿型,随时间变化逐次改变符号,说明存在负的自相关。2回归检

17、验法 该方法用于任何形式的自相关检验,同时给出了自相关的具体形式。这对序列自相关的修正非常重要。具体步骤(1)对被解释变量关于解释变量做最小二乘回归,并计算残差(2)对残差关于其滞后值,作各种形式的最小二乘回归,例如取 (3)对各个回归方程进行统计检验,如果某种回归形式的拟合优度高,t检验显著,就说明该序列自相关存在。 这种方法的缺点是计算量大,一般可以先通过散点图初步确定与其近期滞后值的影响关系形式,再有针对性的选择回归形式。3Von Newmann(冯.诺曼)比检验冯诺曼已证明,当n很大时,比值 (1)叫做冯诺曼比率,其中=0,冯诺曼比近似于正态分布,具有均值 方差 化简(1)式 (2)把

18、这个比值与具有正态分布的均值和方差的理论分布值进行比较。提出假设: (无序列相关) (有序列相关)计算统计量查表确定临界值 ,其中k是用户给出的允许误差判断若>,接受,表示扰动项无序列相关。若<,拒绝,接受,表示扰动项存在序列相关。冯诺曼比与DW统计量的关系 4Durbin-Watson(杜宾瓦特森)检验。 是诊断自相关最著名的检验,其定义为 DW统计量的最大优点就是简单易行。(1)DW检验的适用条件回归模型中包括截距项,DW统计量无法用来判定那些通过原点的回归模型的自相关问题。解释变量是非随机变量适用于一阶自相关检验 称为自相关系数 当>0时,扰动项正序列相关,当<0

19、时,扰动项负序列相关。对于自回归方程(因变量的滞后值作为解释变量)不适用。 例 (2)检验步骤提出假设: (u无一阶自相关) (u存在一阶自相关)计算DW统计量 对于大样本 因此 我们知道 的回归系数估计量于是 DW=2(1-)因为,是的估计值 所以DW检验统计量的值域为 判断 值 DW值 判断 =-1 DW=4 完全负相关=0 DW=2 无自相关=1 DW=0 完全正相关杜宾和瓦尔森给出了DW的两个临界值的下限dl和du,这些临界值取决于观察值个数n和解释变量个数k。n可取从6到200,k最大可达到20,而且给出2种显著性水平1%和5%下的DW值。DW的临界区域重要缺陷:有两个无结论区,一旦

20、DW值落入则无法判断,必须增大样本容量,重新估计模型,重新检验。样本容量不小于15。五、解决序列相关的方法(一)广义差分法 差分法是一类克服序列相关性的有效的方法,差分法是将原模型变换为差分方程,分为一阶差分法和广义差分法。 对于多元线性回归模型 (1)假设扰动项u存在一阶序列相关 (2) 其中满足普通最小二乘法的假设,并假设自回归系数已知,且由(1)式 (3)(1)(3)得: (4)令 于是有: (5) 由于满足全部假定,变换后的模型(5)叫做广义差分模型,已没有自相关,因此可以用OLS估计参数和,应该注意,变换后的数据将损失一个观测值,这是因为变换中不存在和为了避免这一损失,K.R.Kad

21、iyala提出了对第一个观测值作如下变换 对模型估计可得,再利用求得 当扰动项存在高阶序列相关时,假设自回归系数已知即 (6)多元线性回归模型 (7)的t-1t-m滞后项的回归模型分别为 用(7)式减去乘以一阶滞后式、乘以二阶滞后式、乘以m阶滞后式得: t=m+1,m+2,n令 于是 (8)(8)式满足普通最小二乘法估计的假设,可用OLS求估计值,因为在差分时损失了m个样本值,所以估计(8)式时,其样本观测点t=m+1,m+2,n,因此,若进行高阶差分,样本观测值的个数要比较多,以保证差分后估计回归系数时有足够的样本个数。(二)一阶差分法将原模型 (i=1,2,,n)变换为 (i=1,2,,n

22、) (9)其中若模型存在完全一阶正自相关 即 (=1)其中不存在序列相关,那么(9)满足OLS的基本假设,可用OLS估计(9)的参数。注意一阶差分模型不含有截距项。(三)的估计(随机误差项相关系数)一阶线性自回归形式 -1<<1称为自相关系数用OLS估计 当样本容量很大时,有 (符合相关系数定义)1从DW统计量中估计 在小样本情况下(theil)泰尔建议 n k方程自变量个数(不含截距项)大多数软件包都可以计算出DW统计量的值,那么我们就可以得到的近似值,这种方法很容易使用,但只有在样本量很大时才能得到较理想的值。2从OLS残差中估计3.杜宾(Durbin)两步法 (钟宜P222)

23、 杜宾两步法适合于任意阶扰动项序列相关,为方便起见,不妨设多元线性回归模型的扰动项一阶序列相关。设给定模型为: (服从基本假设)第一步,对模型进行广义差分变换,得移项得:整理得:令上式可写作 对这个方程应用OLS,求得的估计值,在这里它是滞后变量的系数。第二步:用的估计值对方程进行变换:令得到应用OLS方法,求得参数估计值, 而=/ 这就是Durbin两步法,第一步求出自相关系数的估计值,第二步利用求得的,对参数进行估计。这种方法不但求得了自相关系数的估计值,而且得出了模型参数的估计值,是一种简便可行的方法。(四)广义最小二乘法第三节 多重共线性一、 多重共线性(Multicollineari

24、ty)对于模型 i=1,2,n (2.8.1)其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。如果存在 i=1,2,n (2.8.2)其中c不全为0,即某一个解释变量可以用其它解释变量的线性组合表示,则称为完全共线性。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性。二、实际经济问题中的多重共线性在实际经济问题中,由于经济变量本身的性质,导致计量经济学模型的解释变量之间往往存在不同程度的线性关系。下面通过几个例子加以说明。例如,以某一行业的企业为样本建立企业生产函数模型,以产出量为被解释变量,选择资本、劳动、技术等投入要素为解释变量。

25、这些投入要素的数量往往与产出量成正比,产出量高的企业,投入的各种要素都比较多,这就使得投入要素之间出现线性相关性。如果以简单线性关系作为模型的数学形式,那么多重共线性是难以避免的。再如,我们建立一个服装需求函数模型,以服装需求量为被解释变量,根据需求理论,选择收入、服装价格和其他商品价格为解释变量,于是有: i=1,2,n在该模型中,按照直观判断,解释变量收入与价格之间不应该相关,因为商品的价格并不随购买者的收入而发生变化。但是,调查数据却显示,它们之间确实存在着一定的相关性。进一步分析发现,高收入者经常在高档商场购买服装,低收入者一般在低档商场购买服装,同样的服装对于不同收入的购买者确实有不

26、同的价格。这就产生了多重共线性。再例如,以相对收入假设为理论假设、以时间序列数据作样本建立居民消费函数: t=1,2,n很显然,当期收入与前期消费之间具有较强的线性关系。一般经验告诉我们,对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性。以截面数据作样本时,问题不那么严重,但仍然是存在的。三、多重共线性的后果计量经济学模型一旦出现多重共线性,如果仍采用普通最小二乘法估计模型参数,会产生下列不良后果:1完全共线性下参数估计量不存在多元线性模型 的普通最小二乘参数估计量为: (2.8.3)如果出现如(2.8.2)上所示的完全共线性,显然,(2.8.3) 中的不存在

27、,无法得到参数的估计量。2一般共线性下普通最小二乘法参数估计量非有效在一般共线性(或称近似共线性)下,虽然可以得到普通最小二乘法参数估计量,但是由参数估计量方差的表达式 可见,由于此时,引起主对角线元素较大,所以(2.8.3)表示的普通最小二乘参数估计量非有效。3参数估计量经济含义不合理如果模型(2.8.1)中两个解释变量具有线性相关性,例如和,那么它们中的一个变量可以由另一个变量表征。这时,和前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的,结果恰是负的。4变量的显著性

28、检验失去意义5模型的预测功能失效四、多重共线性的检验由于多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法,主要是统计方法。例如判定系数检验法、逐步回归检验法等。 判定系数检验法使模型中每一个解释变量分别以其余解释变量为解释变量进行回归计算,并计算相应的拟合优度,也称为判定系数。如果在某一种形式 中判定系数较大,则说明在该形式中作为被解释变量的可以用的线性组合代替,即与之间存在共线性。或者,在模型(2.8.1)中排除某一个解释变量,估计模型,如果拟合优度与包含时十分接近,则说明与其它解释变量之间存在共线性。2逐步回归法以为被解释变量,逐个引入解释变量,构成回归模型,进行模型

29、估计。根据拟合优度的变化决定新引入的变量是否可以用其它变量的线性组合代替,而不作为独立的解释变量。如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果拟合优度变化很不显著,则说明新引入的变量不是一个独立解释变量,它可以用其它变量的线性组合代替,也就是说它与其它变量之间存在共线性关系。此外,还可以构造统计量,对解释变量之间的相关系数、偏相关系数进行显著性检验,以找出引起多重共线性的变量。五、克服多重共线性的方法如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。1第一类方法:排除引起共线性的变量找出引起多重共线性的解释变量,将它排除出去,是最为有效的克服多重共线性问题的方法。上述的用于检验多重共线性的方法,同时就是克服多重共线性问题的方法,其中又以逐步回归法得到最广泛的应用。2第二类方法:差分法 对于以时间序列数据为样本、以直接线性关系为模型关系形式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论