计量经济学第5章-单方程模型中的其它形式_第1页
计量经济学第5章-单方程模型中的其它形式_第2页
计量经济学第5章-单方程模型中的其它形式_第3页
计量经济学第5章-单方程模型中的其它形式_第4页
计量经济学第5章-单方程模型中的其它形式_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章单方程模型的其它形式§5.1虚拟因变量模型(5.1.1模型中设置虚拟因变量的必要性;5.1.2线性概率模型的估计方法;5.1.3非线性概率模型)§5.2滞后变量模型(5.2.1滞后变量模型的建立;5.2.2无限期分布滞后模型的估计问题;5.2.3柯克估计法;5.2.4阿尔蒙估计法)§5.3时间序列模型(5.3.1时间序列模型的一般性质;5.3.2自回归过程及其平稳条件;5.3.3单位根检验;5.3.4协整理论;5.3.5自回归过程的识别和估计;)硕士生《经济计量学》第二讲§5.1虚拟因变量模型虚拟变量作为一种变量类型,既可以作为自变量,无疑也可以作为因变量。只是虚拟变量作为因变量时,无法直接用OLS方法估计模型中的参数罢了。5.1.1模型中设置虚拟因变量的必要性在现实生活中,对于许多事情人们常常会持有两种截然不同的态度,因而必然会有两种截然不同的选择。比如:1)在调查社会公众对于发行公债的态度时,必然会得到“赞成”和“反对”结果,或者是取“购买”和“不购买”两种选择。究竟取何种态度和行为,无疑与调查对象的知识水平和收入状况等因素有关。2)在对学龄儿童的入学率进行考察时,无疑也只能有两种结果,即或者“已入学(在读)”或者“未入学(裰学)”。究竟属何种情况,无疑与所在家庭的经济状况或收入水平及家庭结构有关(在日本成年女性的就业也是如此)。3)对于耐用消费品(比如汽车、住房等)的拥有情况进行调查,可能的情况无疑也只能是两种,即“有”和“没有”。究竟属于何种情况,显然与个人的收入状况有着密切的关系。4)调查某一种药品是否有效,显然也只能是两种结果,即“有效”和“无效”。究竟为何者,取决于患者的病史、年龄等多种相关情况。对于上述多种情况,即可以引入二进制变量Y,设模型的形式为:其中:k是相关因素数目。显然,在E(Ui)=0的条件下,应有:另一方面,如果以pi表示Yi=1的概率,则1-pi便是Yi=0的概率,于是Yi的概率分布便是:因此,应有:结合(5-2)和(5-3)二式,显然应有:这就说明,因变量Yi的条件期望可以解释为第i个调查对象取1的概率,或者说,是第i个调查对象赞成、在读、拥有和有效的概率。由于概率pi的数值要求必须介于0和1之间,所以Yi的条件期望必须满足:0≤E(Yi|Xi)≤1(5-5)也正是由于Yi的条件期望具有概率含义,所以模型(5-1)就称作为线性概率模型。由于其中的Y只取0或1,所以模型也称作二元选择模型。

在线性概率模型中,回归系数通常就被解释为当相应的自变量改变1个单位时,发生某件事(即因变量取1)的条件概率的变动值。假定在模型(5-1)中,k=1,Yi表示居民对小车的拥有情况,Xi为以万元为单位的家庭年收入,如果β1=0.05,就意味着当一个家庭比另一个家庭年收入多1万元时,这个家庭拥有小汽车的机会就比另一个家庭大5%。5.1.2线性概率模型的估计方法

模型(5-1)在形式上与普通线性回归模型没有什么不同,因此无疑可以用OLS方法估计其中的参数。以我国2004年30个省区每百户是否拥有1辆以上的家用汽车数据为例,显然这一变量与该地区人均的生产总值有关。有关资料见表5-1。

在表5-1中人均生产总值单位为:万元/人。应用表5-1的数据进行回归,得到的结果(注意:回归结果中包括海南省的数据:2.25和0.945)如下:

显然,回归系数是显著的,模型的总显著性也是不错的。该模型表明,一个地区的人均生产总值每增加1万元,该地区每百户拥有一辆以上家用汽车的概率将增加21.6%。在这里,常参数为非零表明,一个地区每百户是否拥有1辆以上的家用汽车,除了受该地区人均生产总值的影响以外,还受到其他因素的影响。

不过,由于Y是虚拟变量,这里存在着几个不同于一般回归模型的新问题。(1)随机项U不服从正态分布

由于在模型(5-1)中Y是二值变量,U因而也必然为二值变量,这时对U再做正态性假定已不可能。根据(5-1)和(5-4),应有:亦即:这就是说,对于一定的X,U只有两种可能与之对应。所以,U的分布一定不是连续型的正态分布。(2)随机项U具有异方差性对于模型(5-1),即使E(Ui)=0,E(UiUj)=0,U的常方差性也不可能保持。我们已经知道,U有如下分布:所以,在E(Ui)=0的条件下,应有:显然,由于pi对于不同的自变量Xi有不同的值,所有,U的方差必然表现为异方差性。在第四章我们已经知道,异方差性将使得OLS估计量的方差增大或减小,因而将使得对参数的可靠性检验结果变得不可信。所以,在采用OLS方法对线性概率模型进行估计时,必须先处理异方差问题。处理异方差时,用Y的估计值代替p即可。(3)条件0≤E(Yi|Xi)≤1不完全满足

由于Y只能取0或1两个值,所以,观测值的分布在k=1的情况下必然如图5-1所示。记回归直线与直线Y=0和Y=1的交点横坐标分别为X0和X1,则很显然,当X<X0时,E(Y|X)<0;当X>X1时,E(Y|X)>1。所以,在使用线性概率模型的情况下,通常需要规定:当E(Y|X)<0时,Y的估计值取0;当E(Y|X)>1时,Y的估计值取1。不过,对这一问题最好的处理办法,是放弃线性模型,而改用对于任意自变量都能满足要求的非线性模型。图5-1(4)拟合优度不可能很大由图5-1不难看出,由于因变量是二值变量,所有观测值均集中在横轴和另一平行于横轴的直线上,因而无论用什么函数来拟合这些数据,拟合优度都不可能很大,这是线性概率模型的又一显著特点。比如,在使用表5-1中数据的回归结果中,可决系数仅为0.205。所以,在这里可决系数已不适宜于作为衡量拟和优度的准则。5.1.3非线性概率模型常用的非线性概率模型主要有两种,一是正态累计模型,二是逻辑(Logit)模型。这两种模型的数学形式十分相似,但由于后者计算量较小,因而应用更广泛一些。所以,这里仅讨论逻辑模型。逻辑模型的数学形式是:在这里,令则Y服从如下的逻辑斯蒂(Logistic)分布(函数):这也正是模型(5-6)称作逻辑模型的原因。由于Y的取值仍然是0或1,所以无疑应有:将(5-6)式的左端在Y0=pi处按泰勒级数展开,取前两项得到:对照(5-8)和(5-6)应有:

由①得到:(5-9)就是统计学中的逻辑函数(或逻辑斯蒂函数),其形状如图5-2所示,是一条S形曲线,这种曲线常常用来研究增长问题。从图中不难看出,由逻辑模型得出的条件概率总是分布在0和1之间,而且以极限方式趋近于0和1。图5-2非线性概率模型的估计,主要可分为两种情况,一种是大样本条件下的估计方法,另一种是小样本条件下的估计方法。我们已经知道,E(Yi|Xi)可以表示在X=Xi时,Yi=1的预期概率,因而Yi自然可以看成是这一概率的样本观测值,而1-Yi就是Yi=0的样本观测值,所以Yi/(1-Yi)也就是观测值的概率比。因此,对于较大的样本(n≥30),则可以采用分组的方法,每一组至少5~6个观测值,这样即可以算出一个Y=1的概率来。举例来说,假定某个自变量观测值或某一组的平均数Xi对应于10个因变量观测值,其中6个为1,4个为0,因此应有Yi=0.6,1-Yi=0.4。0.6/0.4=1.5,ln1.5=0.4055。如此处理以后,即可得到因变量与自变量或自变量平均数的一组一一对应的观测值,由此即可用一元线性模型的OLS方法估计出(5-6)中的参数。当然,这样处理的前提条件是,数据必须完全是随机排列的。如果数据的排列组合具有某种人为因素,则很容易出现极端情况,从而使得概率的样本观测值出现0或1相对集中的情况。比如,以表5-1中的数据为例,如果5个观测值一组,则前5个概率为1,因而1-Y=0,0是不能做除数的;而后5个为0。实际中如果遇到这种情况,恰当的处理办法是扩大分组的样本容量,或者对个别1或0集中的组进行适当调整。

另外,需要注意分组的时候最好每组的观测点数目是奇数,因为偶数常常可能会遇到1和0相等的情况,这时会得到分子和分母均为0.5,导致1取对数为0的情况。比如,对表5-1中的资料,应用分组法(每组11个观测值)得到的两组观测值如表5-2所示。回归后得到的模型为:在Eviews中,也可以用Logit命令估计非线性概率模型。利用该命令估计非线性概率模型,像利用Ls命令估计线性方程模型一样,必须指定要估计的具体方程形式。如在Eviews10的命令窗口输入Logitycx即可得到如

表5-3所示结果。相应的模型如下所示。不难看出,模型是充分有效的。

对于较小样本,分组方法失去基础,这时可采用极大似然法(MaxLikelihood,ML)进行估计(在Eviews软件中当使用命令Logit估计非线性概率模型用的就是ML方法),计算工作量相对大些,故此处从略。DependentVariable:Y Method:ML-BinaryLogit(Quadratichillclimbing) Date:03/10/14Time:16:22 Sample:19802010 Includedobservations:31 Convergenceachievedafter5iterations Covariancematrixcomputedusingsecondderivatives Coefficient Std.Error z-Statistic Prob.

C -2.791563 1.252548 -2.228707 0.0258 X 2.427464 1.123918 2.159822 0.0308

McFaddenR-squared 0.244823

Meandependentvar 0.516129 S.D.dependentvar 0.508001

S.E.ofregression 0.440303 Akaikeinfocriterion 1.175144

Sumsquaredresid 5.622127 Schwarzcriterion 1.267659

Loglikelihood -16.21473 Hannan-Quinncriter. 1.205301

Restr.loglikelihood -21.47143 LRstatistic 10.51340

Avg.loglikelihood -0.523056 Prob(LRstatistic) 0.001185

ObswithDep=0 15

Totalobs 31 ObswithDep=1 16

表5-3逻辑斯蒂模型的EViews估计结果5.2.1滞后变量模型的建立对于相关自变量的任何变化,因变量迟早总会作出反应,这种反应既有即时效应,也有滞后效应。滞后变量的引入,正是为了反映这种滞后效应。引起滞后效应的原因很多,归结起来主要是三个方面:

(1)技术性原因这主要与一些产品的生产周期较长有关。比如,农产品的生产周期一般在一年左右,因而在市场经济体制条件下,农产品的本期供应量,常常取决于以前若干期农产品的市场价格,因为农民往往是根据当年或若干年以前的产品价格来安排制定下一年度的种植计划§5.2滞后变量模型再比如,有些耐用工业品的产量,也常常由于生产周期较长,因而当期的产量往往与若干年以前的投资密切相关,等等。(2)制度性原因这主要与一些规章制度造成的约束有关。比如,由于原材料供应合同的限制,即使原材料的价格发生了变化,企业也无法在合同期满以前另觅新的货源。再比如,由于银行存款期的限制,因而对于投资者来说,有时即使出现了好的投资机会,投资者也无法或者不肯从银行取出存款用于投资。

(3)心理原因这与人们的生活习惯有关。比如,即使消费者的可支配收入有了明显得增加,消费往往也不会立刻有明显的增长,因为人们要改变自己的生活消费习惯以适应新的情况,常常需要经过一段时间的调适。在时间序列模型中引入滞后变量,通常主要有两种情况。一种情况是因变量除了受当期自变量影响外,还同时受到以前若干期自变量的影响。这时模型可设计为:这一模型称作分布滞后模型,其中既有一期滞后变量,也有二期滞后变量,通称为X的滞后变量。这是一个三元线性模型。另一种情况是,模型中包含属于自变量的因变量的滞后变量,这种模型称作为自回归模型。比如:上述两类滞后变量模型的滞后期都是有限的。在现实的经济分析中,我们常常会说,发展中国家与发达国家的经济基础不同。这说明有些经济变量可能与几十年以前甚至几百年以前的相关变量有关。也就是说,滞后效应有时候可能非常久远,并不仅仅是以前的一两个时期。如果把所有可能的滞后效应都考虑进来,则可得到如下更一般的滞后变量模型:这是一个无限期的分布滞后模型。在这里,βi称作第i期的反应系数,通常假定βi满足:其中,β代表X的变动对于Y的长期影响,βi代表X变动对于Y的短期影响。如果定义权重:则模型(5-10)亦可写成:其中,wi可解释为每一种短期影响在长期影响中所占的份额。5.2.2无限期分布滞后模型的估计问题对于无限期的分布滞后模型,我们无法采用通常的办法来估计,由于参数多到无穷,因而任何容量有限的样本都不可能提供足够的自由度。在这种情况下,通常可以有两种办法供选择:一是采用截断法。即假定分布滞后模型是有限的,取某个时期之后的所有反应系数为0,比如说β4及以后的所有βi=0,此时模型变为:该模型原则上可以用OLS方法估计,不过存在三个方面的困难:(1)将无限期分布滞后模型拦腰切断地做法不免带有主观随意性,因为我们并不清楚从哪一期切断更合适。(2)各期滞后变量与当期变量本属于同一序列,一般具有相同的变化趋势,因而模型必然会受到多重共线性的影响。以我国1981~2004年国内总产值(GDP)与全社会固定资产的投资总额的关系为例,毫无疑问,固定资产投资是一项具有明显滞后效应的经济活动。有关的数据如表5-2所示。当滞后阶数I≥2时,由于共线性,导致所有解释变量的参数均不显著。只有当I=1时的滞后模型及二阶和三阶滞后变量回归时的模型是显著有效的。一阶滞后模型是:

这一模型说明,这24年中GDP的多少与当年全社会固定资产投资成反相关,与上年的全社会固定资产投资成正相关。这可以做如此解释,即如果当年固定资产投资过大,可能会干扰GDP的正常生产,从而使GDP出现下降;而上年的固定资产投资在当年由于已经投资到位并正常发挥作用,因而将对当年的GDP生产发挥促进作用。二阶和三阶的滞后模型是:这一模型说明,当年的GDP多少与前两年的固定资产投资正相关,其解释与上述的一阶滞后正相关相同。当年的GDP与前3年的固定资产投资反相关可解释为,如果前3年的投资过大,可能会影响到与GDP正相关的前2年和前1年的投资额,因而与当年的GDP为反相关。(3)滞后变量的引入,会损失一些观测值。一般地说,在模型中引入m期滞后变量,通常会损失m对观测值。所以,对于滞后变量模型,要以一定的精度估计出模型中的参数,要求必须掌握足够多的原始数据。由于经济数据的收集经常会受到很多条件的限制,因而估计这类模型经常会遇到数据不足的困难。

由于以上问题的存在,截断法在处理无限期滞后模型时使用的并不多。比较可行的是另一种方法。这种方法假定反应系数具有某种特殊结构,从而可以避免截断法遇到的各种困难。依照对于系数结构所作假定的不同,这种方法又可以分为几种情况。目前使用较多的有柯克估计法和阿尔蒙估计法。5.2.3柯克估计法

为了克服无限期分布滞后模型估计时所遇到的困难,柯克(Koyck)对无限期分布滞后模型提出了如下的结构假定:

这一假定与(5-11)中的假定是一致的。其中,λ称作递减率。这时无限期滞后模型变为:将该式向后推迟一期,再对各项乘以λ:由(5-13)中减去该式,可得到:(5-13)应用柯克估计法对表5-2中的数据进行估计,得到的模型为:不难看出,模型是充分有效的。依方程:2737=α(1-0.895)可解出α=26066.7,因此原来的无限期滞后模型可写成:该模型说明,全社会的固定资产投资X对于GDP产出的影响是当年投资增加1个单位,GDP产出增加0.3887个单位,以后每滞后一年其作用系数将在前一年的基础上衰减0.105倍。容易看出,柯克变换很好地解决了无限期分布滞后模型所遇到的困难。一是变换后的模型只包含三个参数,即λ、α、β0,因而自由度问题已不复存在。二是新模型为二元线性模型,只含有两个自变量,一个是原自变量X,另一个是滞后因变量,这是两个不同的序列,我们没有理由认为二者之间会存在共线性问题。三是新模型中只含有一个一期滞后变量,只损失一个观测值,因此不会出现数据不足的问题。模型(5-14)就称作柯克模型。但是,柯克模型也同时带来了一些新问题。第一,即使原模型中的随机项U满足经典回归的所有假定,但是柯克模型中的随机项v也无法满足无序列相关的假定。因为:序列相关性的存在,将使得参数估计值的方差增大或减小,因而将可能使得参数丧失有效性。第二,柯克模型的随机项与解释变量Yt-1是相关的。因为,Vt与Yt有关,因而Vt与Yt-1也一定相关。这就违背了常方差假定的推论,即随机项与解释变量无关的结论。第三,柯克模型假定随着滞后期的增加,反应系数按照几何级数递降,这一过分严格的要求大大地限制了柯克估计法的使用范围。因为反应系数并不一定是随着滞后期的增加按照几何级数递降的,甚至并不是递降的,有时可能是递增的,如图5-3所示。反映系数的结构缺乏柔顺性,不能适应各种可能情况,这是柯克方法的一个重大缺陷。图5-35.2.4阿尔蒙估计法针对柯克模型的缺点,阿尔蒙(S.Almon)提出了另一种处理分布滞后模型的方法。这种方法实质是从一个有限滞后分布模型出发,先用一个关于i的多项式去逼近βi,经过适当变换后,得出一个可以用OLS方法估计的新模型。由于原模型中的每一个常数都是新模型参数的线性组合,因此当新模型参数估计出来后,便不难得出原模型参数的估计值。假定有一个有限的分布滞后模型是:其中,βi的分布为图5-3所示的某种情形。根据数学知识,如图5-3所示的曲线均可以用关于βi的多项式来逼近,多项式的阶数应是曲线的极点数加1。比如,图5-3中前者应为二次多项式,后者是三次多项式。现在我们假定βi的结构为二次多项式,这时可令:将该式代入到(5-15)中,可得到:

模型(5-16)就称作阿尔蒙模型。这是一个三元线性模型,无疑可以用OLS方法进行估计。其中的参数估计出来后,即可用如下的变换求出原模型的参数:以表5-2中的数据为例,假定k=5。应用Eviews1.0回归,需要先生成如(5-17)式所示的新序列。其方法是在命令窗依次输入以下命令即可:GenrW0=X+X(-1)+X(-2)+X(-3)+X(-4)+X(-5)GenrW1=X(-1)+2*X(-2)+3*X(-3)+4*X(-4)+5*X(-5)GenrW2=X(-1)+4*X(-2)+9*X(-3)+16*X(-4)+25*X(-5)然后输入命令:lsycw0w1w2即可。得到的方程是:可以看出,除了一次项的系数不显著以外,其余参数都是充分有效的。由于二次项的系数为负值,因此β系数的分布是上凸的。这是容易理解的。因为,投资活动是具有显著滞后效应的一项经济活动。开始往后的时候,由于投资逐步到位并发挥作用,因此越往后效果越明显;到了一定时期再往后,随着投资效益的不断释放,效果就会递减。

阿尔蒙方法虽然克服了柯克方法所遇到的困难,但同时也带来了一些新的问题。这主要是:

(1)必须事先确定适当地滞后期数k一般地说,从方便处理的角度看,我们通常会希望k值小一些;而要充分地反映滞后效应,k值又不能取得太小。K值究竟取多大合适,并没有明确的准则。这是阿尔蒙方法的一个缺点。

(2)必须事先确定多项式的阶数如前所述,多项式的阶数应是曲线的极点数加1。但是,困难的是βi的分布形式我们事先无从知道。所以,要恰当地确定多项式的阶数往往比较困难,有时只能采用主观的方法。这是阿尔蒙方法的另一个弱点。(3)由于阿尔蒙模型的每一个自变量w都是原模型自变量X及其滞后变量的线性组合,所以各个w之间必存在较强的相关关系,即阿尔蒙模型一般具有多重共线性,因而必然会使得一个或一个以上的参数α不显著。但这一般不会影响研究问题。§5.3时间序列模型及预测预测是经济计量学研究的一个非常重要的目的。预测除了可以使用因果关系模型以外,还可以使用时间序列模型。所谓时间序列模型,即由一个变量的随机时间序列所构成的模型,也称作随机过程模型。5.3.1时间序列模型的一般性质(1)随机过程一个时间序列实际上就是一个经济指标按照时间顺序的排列。一般我们所考察的时间序列Y1,Y2,…,Yn实际上只是一个随机时间序列的样本。通常我们总是假定,一个随机时间序列是一个无穷序列的一部分,这个无穷的随机序列就称作一个随机过程,记作Yt。其实,随机扰动项Ut就是一个随机过程。如果随机过程Ut所遵从的分布不随着时间改变,并且满足:则这一随机过程就称作纯随机过程(国内流行的概念叫白噪声)。

如果随机过程Ut只满足零均值和常方差性假定,自身存在线性相关关系,假定为一阶自相关:其中,ρ为自相关系数,vt为纯随机过程,此时的随机过程Ut称作一阶自回归过程。自回归过程在时间序列预测中具有非常重要的地位,因为时间序列预测的实质,乃是根据某一变量的以往观测值来预测其未来值,这就要求所考察的随机过程的不同元素应彼此相关,而自回归过程恰好满足了这一要求。(2)自相关函数一个随机过程中任意两个元素之间相关程度的量度,称作自相关函数。通常可以采用自相关系数ρk作为Yt和Yt+k之间相关程度的量度,其中,k称作自相关函数的阶数。其定义为:在这里,就称作自相关函数。当k=0时,有:(3)平稳随机过程通常把具有下列性质的随机过程就称作为平稳随机过程:对于平稳过程来说,由于常方差性,应有:随机过程是否具有平稳性对于时间序列预测来说非常重要,因为这一性质保证了随机过程的结构不会随着时间发生变化,这是进行准确预测的必要条件。如果过程的结构随着时间变化,要进行准确预测是不可能的。很显然,纯随机过程是平稳随机过程。但并不是所有的随机过程都是平稳随机过程,一阶自回归过程只有在时才具有平稳性。(4)滞后算符为了方便表达,可引入滞后算符L,定义如下:相应地,应有:一般情况下有:当n=0时,有:在时间序列分析中,经常会用到一个算符多项式:它作用于随机变量Yt,便得到:一般地,可以定义关于L的一个无穷幂级数如下:如果两个算符和满足:其中,m、n可以有限也可以无限,则称和为互逆算符。记作:或者比如,在|φ|<1的条件下,如果定义:有:于是应有:这时有:5.3.2自回归过程及其平稳条件

一阶自回归过程可定义为:其中,Ut为纯随机过程。利用一阶自回归模型,可以用当前时期的变量值预测未来为期一个时期的变量值。然而,由于我们往往并不知道随机过程产生的机制,一阶自回归只是其中最简单的一种形式。一般地应有:其中,Ut为纯随机过程,p称作自回归过程的阶数,上述模型一般记作AR(p),相应地,一阶自回归模型记作AR(1)。(5-21)如果利用滞后算符来表示,则(5-23)可表示为:在一阶自回归条件下,按照模型(5-22),应有:对于(5-24),由于E(Ut)=0,所以应有:E(Yt)=0。另外,由于Ut互不相关,所以应有:显然,上式只有在|φ|<1时才是有限的,这时平稳条件才是成立的。我们再来考察协方差。根据(5-24),应有:由于Ut之间不相关,所以应有:此式表明,Cov(Yt,Yt+k)只与k有关,而与t无关,于是平稳随机过程的第三个条件满足。

判断一个时间序列是否平稳的最简单且实用的办法,就是观察该随机序列对时间t的散布图。如果散布图上的数据点在横轴的上下波动(E(Yt)=0)或在平行于横轴的某一直线上下波动(E(Yt)≠0),则表明时间序列是非平稳的。否则,如果散布图呈现某种直线型或曲线型系统变化趋势,则表明该时间序列是平稳时间序列。(5-26)

5.3.3单位根检验非平稳性检验具体的方法有多种。这里,我们介绍一种比较新的检验方法,叫做单位根(有的也叫单元根)检验(Unitroottest)。一、单位根的含义设Yt代表随机时间序列,需要

估计回归方程为:

△Yt=A0+A1t+A2Yt-1+Ut(5-27)其中△是一阶差分符号,其中t是趋势变量,取值为1、2、3等等,Yt-1为变量Y的一期滞后变量。零假设为Yt-1的系数A2为零,这等价于时间序列是非平稳的。我们称这个假设为单位根假设。

之所以使用单位根这一术语,是因为在这里通常假定:Yt=A0+A1t+CYt-1+Ut。先在方程的两边同时减去Yt-1得到:(Yt-Yt-1)=A0+A1t+CYt-1-Yt-1+Ut,也就是△Yt=A0+A1t+(C-1)Yt-1=A0+A1t+A2Yt-1+Ut,其中A2=C-1。这样,如果C等于1,则回归方程(5-27)中的A2将为零。

按照已有的知识,为了检验A2的估计值a2是否为零,通常我们都会使用很熟悉的t检验。但不幸的是,这里,我们不能这么做,因为严格来说,t检验只有当时间序列为平稳时才有效。所以,对于单位根的检验必须探讨新的方法。单位根检验与时间序列的平稳性之间的关系是:对于一个单一的时间序列来说,如果它的当期项可以表示成它的前一期项(即一阶滞后项)的线性形式,且关于前一期项即一阶滞后变量的系数ρ=1的原假设在统计意义上不成立或者说被择假设ρ<1能够在统计意义上成立的话,则称序列不存在单位根,该序列是一个在统计意义上的平稳序列,或者称无单位根平稳序列。

具体地说,这里的线性形式包含了序列的下述三种形式的趋势线:

一种是,序列Yt在Y=0这一水平线上的平稳性。也就是说,如果序列Yt的散点图最终收敛于Y=0这条水平趋势线,则称序列Yt是纯粹平稳序列,此时,有一阶自回归过程:Yt=ρYt-1+Ut,且备择假设H1:ρ≠1成立(或者说原假设H0:ρ=1被拒绝,下同。注意,有些文献中这里是ρ<1,但实际上这里经常可能会有ρ>1的情况);第二种情况是,Yt在Y=α这一水平线上的平稳性。也就是说,如果序列Yt的散点图最终收敛于Y=α这条水平趋势线,则称序列Yt是带漂移的平稳序列,此时,有带漂移的一阶自回归过程:Yt=α+ρYt-1+Ut,且备择假设H1:ρ<1成立;第三种情况是,Yt在Yt=α+βt这一趋势线上的平稳性。也就是说,如果序列Yt的散点最终收敛于Yt=α+βt这条趋势直线,则称序列Yt是带趋势的平稳序列,此时,有带趋势的一阶自回归过程:Yt=α+βt+ρYt-1+Ut,且备择假设H1:ρ<1成立。

上述三种情况中只要有其中之一不存在单位根,或者可以在统计意义上拒绝H0:ρ=1的原假设,则称序列Yt是平稳的时间序列。相反,如果要认定一个序列是不平稳的,则以上三个模型必须同时存在单位根才可以得出结论。这一结论非常重要。二、单位根的后果实际上对于一般的时间序列而言,ρ≠1是很容易满足的。因为在第一种情况下,我们有:而对于一个具有递增趋势的时间序列来说,其估计结果必然是ρ>1的。在这种情况下,如果有ρ=1,则必有:亦即:也就是:Yt=Yt-1

而在第二种情况下,我们有:

不难看出,在这里ρ的估计值实际也就是时间序列的自相关系数(注意,在ρ的估计值的计算中,假定Yt的均值与Yt-1的均值相等)。因此一般地,在时间序列的自相关程度不十分强烈的情况下,ρ<1也是容易满足的。同时,也不难看出,如果有=1成立,同样得到Yt=Yt-1,且有=0,即与第一种情况完全等同。

这表明整个序列实际上是一条与X轴(t)平行的平行线。

而在第三种情况下,根据§4.4.1部分的分析,在二元模型中,每个回归系数的值应等于因变量对该变量回归时的回归系数,减去因变量对另一变量回归时的回归系数乘以另一变量对该变量回归时的回归系数,再乘以两个解释变量相关系数平方之补数的倒数,应有:

其中,是时间序列Yt与时间t的相关系数的平方(假定Yt-1与时间t的相关系数跟Yt与时间t的相关系数相同),是时间序列Yt与Yt-1的自相关系数,也就是第二种情况中的,是Yt对时间t回归时的回归系数,是时间t对于Yt-1回归时的回归系数(假定Yt-1对时间t的回归与Yt对时间t的回归具有相同的系数,参式2-20)。所以,=1实际也就是:即=1。这时,,即同样有:Yt=Yt-1。

综合上述三种情况,单位根的实质即时间序列Yt在以时间t为横轴的平面上为一平行直线,即Yt与时间t无关。换一种说法,单位跟检验的目的,实际上就是要查明一个时间序列事实上是否为一常量,如果某时间序列存在单位根,则该时间序列事实上就是一个常量,即它与时间不相关,即不能作为变量来使用;如果某时间序列不存在单位根,则该时间序列事实上就是一个变量,即它与时间是相关的,或者说是随着时间变化的,可以作为变量来使用。

三、单位根的检验

单位检验(UnitRootTest)一般采用迪克富勒检验(DikeyFulerTest)法(简称DF检验),也称作τ检验,它的临界值由这一方法的提出者根据蒙特卡罗模拟给出。这种检验的原假设是:H0:ρ=1;被择假设是:H1:ρ<1。在应用中,若估计得到的τ值(绝对值)大于D-F值的临界值,将拒绝单位根假设,即认为该序列为平稳序列;否则,若计算的τ值(绝对值)小于临界的τ值,则不能拒绝单位根假设。τ统计量是迪克与富勒(1970)构造的一个类似于t-分布的统计量,τ=(ρ-1)/Sρ。其中,Sρ是统计量ρ的标准差。他们证明,在存在单位根假设的条件下,τ-统计量不再具有正常的t分布,但是在样本容量很大的情况下,τ-统计量收敛于一个标准维纳过程的泛函,并且可以用蒙特卡罗方法模拟出结果,于是得到了被广泛应用的DF检验法。

DF检验存在着一个前提,它假定随机扰动项Ut不存在自相关。由于在实际经济活动中,大多数经济过程是不满足此项假设的,为此需要用到扩展的迪克富勒(1979)检验法(theArgumentDikeyFulerTest),即ADF检验。在ADF检验中,常常把DF检验的模型的右边扩展为包含序列Yt的变化量的滞后项,例如使带趋势的DF检验模型变为:(5-28)这里,k=1,2,3,等等,具体可以根据实验来确定,这样可以有效缓解Ut项的自相关问题,使单位根检验更具可靠性。不过,这里需要注意的是,由于在5-28式中,被解释变量使用的是差分变量,因此包含单位根的原假设应该是回归系数γ=0。ADF检验采用的是单边检验中的左侧检验法,即如果统计量大于临界值(ADF检验的临界值一般是负的),则接受原假设,即序列服从单位根过程,意味着所考察的序列是非平稳的;反之;如果统计量小于临界值;则拒绝原假设,即序列不存在单位根,说明序列是平稳的。

在Eviews1.0中,单位根检验可以通过输入命令Uroot进行。输入该命令时只要告诉它序列名称就可以了。输出结果会给出样本的ADF统计量和1%、5%及10%显著性水平条件下的临界值。【例5.3】在现实的经济生活中,很多时间序列都可能会包含单位根,比如工业企业的年利润率,股市逐日的收益率,某些经济指标的环比指数,如物价的环比指数等,通常都可能包含单位根(物价的定基指数一般不含单位根)。表5-3给出的是我国1995-2005年独立核算的工业企业(含国有企业和规模以上非国有企业)的几种利润率和工业总产值和增加值的环比指数资料,试检验其是否含有单位根。表5-3及单位根检验演示在Eviews10中运用Uroot命令进行检验,使用如5-28式所示的带趋势项的模型,得到的三个临界值分别为: 1%CriticalValue-5.7492

5%CriticalValue -4.1961 10%CriticalValue -4.43865个变量的ADF统计量分别为:ADFTestStatistic -2.079325ADFTestStatistic -2.205980ADFTestStatistic -2.074583ADFTestStatistic -3.799162ADFTestStatistic -6.164685不难看出,只有第5组变量不包含单位根。对第5组变量按照5-28式进行回归,得到的回归结果如表5-4所示。由表5-4不难看出,由于变量不包含单位根,因此所有参数的t统计量都是显著的。LS//DependentVariableisD(Y5)VariableCoefficient Std.ErrorT-Statistic Prob.Y5(-1)-1.6327950.264863 -6.164685 0.0035D(Y5(-1))0.4073990.180621 2.255550 0.0871C 1.577086 0.262518 6.007534 0.0039Trend0.059255 0.009791 6.052228 0.0038R-squared0.911805Meandependentvar0.027100AdjustedR-squared0.845659S.D.dependentvar0.08423S.E.ofregression0.033091Akaikeinfocriterion-6.51016Sumsquaredresid 0.00438Schwartzcriterion -6.470436Loglikelihood18.68912F-statistic 13.78471Durbin-Watsonstat1.084115Prob(F-statistic) 0.014148表5-4工业增加值指数回归结果

5.3.4协整理论一、伪回归问题格兰杰(Granger)和纽波尔(Newbold)在一篇重要论文中指出,当两个时间序列都具有很强的时间趋势时,即使它们的生成过程毫不相关,使用常用的回归分析往往会得出这样的回归结果:表示它们相关程度的统计量R2取值很高,但表示残差自相关程度的D-W统计量取值却很低,格兰杰和纽波尔把这种现象就称之为“伪回归”。实际上,伪回归现象早已为经济学家们所关注,只是对于在什么样的条件下会产生伪回归,长期以来一直没有统一的认识。直到20世纪的70年代,格兰杰和纽波尔的研究发现,造成伪回归的根本原因在于时间序列的非平稳性,人们才对这一问题的认识有了比较一致的看法。由于伪回归过程中回归残差序列不再是纯随机序列,因此回归结果的可靠性也就值得怀疑。格兰杰和纽波尔利用MonteCarlo模拟方法研究表明,利用传统的回归分析方法对彼此毫不相关的非平稳经济变量进行回归,t检验值和F检验值往往会倾向于显著,从而会错误地得出变量相关的“伪回归”结果。二.格兰杰因果关系检验经济计量学研究的一个重要内容即是探索各类经济变量间的因果关系,而经济变量间错综复杂的关系也为研究带来了相当的难度,面对一个无法进行控制实验、充满不确定性的领域,我们只能从概率的角度即通过随机抽样的方法来了解因果关系,于是关于因果关系的定义和检验方法成为统计学、经济计量学研究的重要内容。同样也产生了许多关于因果关系的经济学定义,其中之一就是得到广泛应用的格兰杰因果关系。格兰杰(Granger,1969)从时间序列的意义上来界定因果关系,提出了因果关系的计量经济学定义:“欲判断X是否引起Y,则考察Y的当前值在多大程度上可以由Y的过去值解释,然后考察加入X的滞后值是否能改善解释程度。如果X的滞后值有助于改善对Y的解释程度,则认为X是Y的格兰杰原因。”从统计学角度来看,也即是X的滞后项在统计意义上显著。由于格兰杰因果关系检验方法比较简单适用,因而被越来越多的人接受,从而在时间序列经济计量分析中被得到广泛使用。格兰杰因果关系可描述如下。对于变量X和Y,假定目前还不清楚它们之间的依赖关系如何,现在拟定回归分析模型:其中,m是之后阶数,和表示随机项,并假定互不相关。变量和之间的关系主要包括以下几种情形:(1)X到Y的单向因果关系。如果的估计结果统计上显著不等于零,而的估计量统计上显著为零,则可以判明X为原因变量、Y为结果变量,也即有一个从X到Y的单向因果关系。(2)Y到X的单向因果关系。如果的估计结果统计上显著等于零,而的估计量统计上显著不等于零,则可判明Y为原因变量、X为结果变量,也即有一个从Y到X的单向因果关系。(3)Y到X、X到Y的双向因果关系。如果的估计结果

统计上显著不等于零,而的估计量统计上也显著不等于零,则可以判明X和Y之间互为原因变量与结果变量,也即有一个从Y到X、X到Y的双向因果关系。(4)Y和X相互独立。如果的估计结果统计上显著等于零,并且的估计量统计上也显著等于零,则可判明和之间保持着相互独立的关系。其实,由下面的检验过程中我们将不难看出,这种检验实际上也就是本书第3章第6节(§3.6部分)讲过的对模型中参数所加约束的检验(原假设为所加约束为真,被择假设是所加约束不全为真),在EViews中即Wald检验。Granger因果关系检验一般需要经过以下几个步骤:第一步,对Y做不含X的所有变量但包括Y的各阶滞后变量的回归分析,求回归残差平方和SSER(这相当于Wald检验中的有约束残差平方和)。即对下列形式的回归模型做分析:第二步,对Y做含X在内的所有变量包括Y和X的各阶滞后变量的回归分析,求出回归残差平方和SSEU(这相当于Wald检验中的无约束残差平方和)。即做如下模型的回归分析:第三步,建立检验。检验统计量为:检验的原假设为:H0:α1=α2=…=αm=0。其中,k为对Y做含X在内的所有变量包括Y和X的滞后变量以及其他变量的回归分析时,模型中需要估计的参数的数目。一般地有,k=2m。第四步,进行判断。在给定的显著水平下,如果统计量的值大于临界值,则可以判断X是Y变化的Granger原因。如果要做Y对X变化的因果关系检验,同样也可以按照以上步骤进行。在具体应用Granger因果关系检验时需要注意:第一,Granger因果关系检验对无限分布滞后模型可能不适应,碰到这样的情况,首先要确定分布滞后模型的滞后阶数。第二,模型滞后阶数的多少对因果关系方向判断的结果,可能会造成重大的影响,这就是说GRANGER因果关系检验对模型滞后阶数比较敏感。因此,运用Granger因果关系检验方法,模型滞后阶数的确定可能至关重要。第三,假如模型还存在另外的变量,这个变量可能引起被解释变量变化的原因,同时也与解释变量存在高度的相关关系,这时候,Granger因果关系检验将遇到难题。【例5.4】以表5.4中的数据为例。我们知道,投入与产出之间一般情况下都是一种互为因果的关系,然而样本数据的情况究竟如何,运用格兰杰因果关系检验则可以更好地了解两变量之间的关系。应用EViews5.0进行格兰杰因果关系检验(方法是在数据窗口为活动窗口的情况下,选择命令View/GrangerCausality并确定滞后项阶数即可),得到的结果如表5.6所示。表5.6表5.4数据的格兰杰因果关系检验输出结果PairwiseGrangerCausalityTestsDate:03/24/11Time:15:25Sample:19812004Lags:3

NullHypothesis:ObsF-StatisticProb.

XdoesnotGrangerCauseY

21

6.361290.0061

YdoesnotGrangerCauseX

0.843680.4925由表5.6可以看出,在表5.4中的数据即国内总产值GDP(Y)与全社会的固定资产的投资总额(X)之间,X是Y的格兰杰原因(其可靠性为99.4%),而Y不是X的格兰杰原因。如果以Y为因变量做Wald检验,得到的结果如表5.7所示。WaldTest:Equation:UntitledTestStatisticValue

df

ProbabilityF-statistic6.645808(3,15)

0.0045Chi-square19.937423

0.0002NullHypothesisSummary:NormalizedRestriction(=0)Value

Std.Err.C(4)0.7327400.236942C(5)-0.2240950.528562C(6)-1.2675280.473709Restrictionsarelinearincoefficients.检验结果表明,施加约束后的模型与没有施加约束的模型具有极显著的差异。从下面给出的参数估计值可以看出,只有Xt-2项的系数不显著。

表5.7表5.4数据格兰杰因果关系的Wal检验输出结果(Y为因变量)WaldTest:Equation:UntitledTestStatisticValue

df

ProbabilityF-statistic0.811766(3,15)

0.5070Chi-square2.4352973

0.4871NullHypothesisSummary:NormalizedRestriction(=0)Value

Std.Err.C(1)-0.0593650.298859C(2)-0.1620390.538983C(3)0.2357700.278611Restrictionsarelinearincoefficients.表5.8表5.4数据格兰杰因果关系的Wal检验输出结果(X为因变量)检验结果表明,施加约束后的模型与没有施加约束的模型没有显著的差异。从下面给出的参数估计值可以看出,所有Yt-i项的系数均不显著。三、随机游走模型根据上述刚刚介绍的单位根检验,我们已经知道,当存在单位根时,时间序列就变为:Yt=Yt-1+Ut(5—29)这就是一个随机游走模型(randomwalkmodel)。其中Ut是均值为零,方差为常数的随机误差项。假定我们考察的时间序列是在时间0开始的,即首项为Y0。于是,我们有:Yt-1=Yt-2+Ut-1Yt-2=Yt-3+Ut-2……Y2=Y1+U2Y1=Y0+U1利用递推替代方法,由Yt-1开始依次替代,最终将得到:Yt=Y0+∑Ui

其中,加总是从t=1到t=n,n是样本容量或观察总次数。现在,可以很容易地证得:E(Yt)=Y0D2(Yt)=n在这里,我们利用了这一事实,即Ut是随机的,其中每个都有同样的方差。也就是说,在这里Yt的方差不仅不是常数,而且是随着n的增加而不断地增加的。因此,依据我们前面所给出的非平稳时间序列的定义,随机游走模型中变量Yt是非平稳时间序列(这里,非平稳是指在方差中)。但是,请注意随机游走模型的一个很有意思的特征,即如果你将它写成:△Yt=(Yt-Yt-1)=Ut如以前一样,其中△是观测数的一阶差分。在这里我们看到,Yt的一阶差分是平稳的,因为E(△Yt)=E(Ut)=0,并且有D2(△Yt)=D2(Ut)=。

四、单整和协整所谓单整(Integration),即对于一个非平稳的时间序列,如果在差分d次后可成为一个平稳时间序列,而在差分d-1次后仍然是非平稳的,则称时间序列是d阶单整的,并记为I(d)序列。显然,经一次差分后得到的平稳序列就是I(1),平稳的时间序列一般可以表示为I(0)。所谓协整(CoIntegration),即尽管每个时间序列自身是非平稳的,但它们的一个线性组合却是平稳的,这样的时间序列就被称作为是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论