版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章基本回归模型
经济计量研究始于经济学中的理论假设,根据经济理论设定变量间的一组关系,如消费理论、生产理论和各种宏观经济理论,对理论设定的关系进行定量刻画,如消费函数中的边际消费倾向、生产函数中的各种弹性等进行实证研究。单方程回归是最丰富多彩和广泛使用的统计技术之一。本章介绍EViews中基本回归技术的使用,说明并估计一个回归模型,进行简单的特征分析并在深入的分析中使用估计结果。随后的章节讨论了检验和预测,以及更高级,专业的技术,如加权最小二乘法、二阶段最小二乘法(TSLS)、非线性最小二乘法、ARIMA/ARIMAX模型、GMM(广义矩估计)、GARCH模型和定性的有限因变量模型。这些技术和模型都建立在本章介绍的基本思想的基础之上。1
对于本章及随后章节所讨论的技术,可以使用下列的经济计量学教科书作为参考。下面列出了标准教科书(逐渐变难):(1)Pindyck,Rubinfeld(1991),EconometricModelsandEconomicForecasts,《经济计量模型和经济预测》,第三版。(2)Johnston和DiNardo(1997),EconomtricMethods,《经济计量方法》,第四版。(3)Greene(1997),EconomtricAnalysis,《经济计量分析》,第三版。(4)Davidson和MacKinon(1993),EstimationandInferenceinEconometrics,《经济计量学中的估计和推断》。2一、普通最小二乘法(OLS)1.最小二乘原理设(x1,y1),(x2,y2),…,(xn,yn)是平面直角坐标系下的一组数据,且x1<x2<…<xn,如果这组图像接近于一条直线,我们可以确定一条直线y=a+bx,使得这条直线能反映出该组数据的变化。如果用不同精度多次观测一个或多个未知量,为了确定各未知量的可靠值,各观测量必须加改正数,使其各改正数的平方乘以观测值的权数的总和为最小。因而称最小二乘法。3一、普通最小二乘法(OLS)1.最小二乘原理估计总体回归函数的最优方法是选择B1和B2的估计量b1,b2,使得残差et尽可能达到最小。用公式表达即为总之,最小二乘原理就是选择样本回归函数使得y的估计值与真实值之差的平方和最小。5三、多元线性回归模型通常情况下,将含有多个解释变量的线性回归模型(多元线性回归模型)写成如下形式,yi=
0+
1
x1i
+
2
x2i+
3
x3i+…
k
xki+ui
(i=1,2,…,n)其中,y为被解释变量,也被称为因变量;x为解释变量或自变量;u是随机误差项(randomerrorterm),也被称为误差项或扰动项;n为样本个数。6三、多元线性回归模型在多元线性回归模型中,要求解释变量x1,x2,…,xk之间互不相关,即该模型不存在多重共线性问题。如果有两个变量完全相关,就出现了完全多重共线性,这时参数是不可识别的,模型无法估计。7三、多元线性回归模型通常情况下,把多元线性回归方程中的常数项看作虚拟变量的系数,在参数估计过程中该常数项始终取值为1。因而模型的解释变量个数为k+1.多元回归模型的矩阵形式为Y=X
+u其中,Y是因变量观测值的T维列向量;X是所有自变量(包括虚拟变量)的T个样本点观测值组成的T×(k+1)的矩阵;
是k+1维系数向量;u是T维扰动项向量。8四、线性回归模型的基本假定线性回归模型必须满足以下几个基本假定:假定1:随机误差项u具有0均值和同方差,即
E(ui
)=0i=1,2,…,n
Var
(ui
)=σ2
i=1,2,…,n
其中,E表示均值,也称为期望,在这里随机误差项u的均值为0。Var表示随机误差项u的方差,对于每一个样本点i,即在i=1,2,…,n的每一个数值上,解释变量y对被解释变量x的条件分布具有相同的方差。当这一假定条件不成立是,称该回归模型存在异方差问题。
9四、线性回归模型的基本假定假定2:不同样本点下的随机误差项u之间是不相关的,即Cov(ui,uj)=0,i≠j,i,j=1,2,…,n
其中,cov表示协方差。当此假定条件不成立时,则称该回归模型存在序列相关问题,也称为自相关问题。10四、线性回归模型的基本假定假定3:同一个样本点下的随机误差项u与解释变量x之间不相关,即Cov(xi,ui)=0i=1,2,…,n
11四、线性回归模型的基本假定假定4:随机误差项u服从均值为0、同方差的正态分布,即
u~N(0,σ2)
如果回归模型中没有被列出的各因素是独立的随机变量,则随着这些随机变量个数的增加,随机误差项u服从正态分布。12四、线性回归模型的基本假定假定5:解释变量x1,x2,…,xi是非随机的确定性变量,并且解释变量间互不相关。则这说明yi的概率分布具有均值,即E(yi|xi)=E(
0+
1xi
+ui)=
0+
1xi该式被称为总体回归函数。如果两个或多个解释变量间出现了相关性,则说明该模型存在多重共线性问题。13五、线性回归模型的检验1.拟合优度检验拟合优度检验用来验证回归模型对样本观测值(实际值)的拟合程度,可通过R2统计量来检验。
14五、线性回归模型的检验1.拟合优度检验公式三者的关系为TSS=RSS+ESS
TSS为总体平方和,RSS为残差平方和,ESS为回归平方和。15五、线性回归模型的检验1.拟合优度检验总体平方和(TSS)反映了样本观测值总体离差的大小,也被称为离差平方和;残差平方(RSS)说明的是样本观测值与估计值偏离的程度,反映了因变量总的波动中未被回归模型所解释的部分;回归平方和(ESS)反映了拟合值总体离差大小,这个拟合值是根据模型解释变量算出来的。16五、线性回归模型的检验1.拟合优度检验拟合优度R2的计算公式为R2=ESS/TSS=1-RSS/TSS当回归平方(ESS)和与总体平方和(TSS)较为接近时,模型的拟合程度较好;反之,则模型的拟合程度较差。因此,模型的拟合程度可通过这两个指标来表示。17五、线性回归模型的检验2.显著性检验变量显著性检验(t检验)
检验中的原假设为:
H0:
i=0,备择假设为:
H1:
i
≠0,如果原假设成立,表明解释变量x对被解释变量y没有显著的影响;当原假设不成立时,表明解释变量x对被解释变量y有显著的影响,此时接受备择假设。
18五、线性回归模型的检验2.显著性检验方程显著性检验(F检验)
原假设为:
H0:
1=0,
2=0,…,
k=0,备择假设为:
H1:
i中至少有一个不为0,
如果原假设成立,表明解释变量x对被解释变量y没有显著的影响;当原假设不成立时,表明解释变量x对被解释变量y有显著的影响,此时接受备择假设。
19五、线性回归模型的检验2.显著性检验方程显著性检验(F检验)
F统计量为该统计量服从自由度为(k,n-k-1)的F分布。给定一个显著性水平α,当F统计量的数值大于该显著性水平下的临界值Fα(k,n-k-1)时,则在(1-α)的水平下拒绝原假设H0,即模型通过了方程的显著性检验,模型的线性关系显著成立。
20五、线性回归模型的检验3.异方差性检验(1)图示检验法图示检验法通过散点图来判断用OLS方法估计的模型异方差性,这种方法较为直观。通常是先将回归模型的残差序列和因变量一起绘制一个散点图,进而判断是否存在相关性,如果两个序列的相关性存在,则该模型存在异方差性。
21五、线性回归模型的检验3.异方差性检验(1)图示检验法检验步骤:建立方程对象进行模型的OLS(最小二乘)估计,此时产生的残差保存在主窗口界面的序列对象resid中。建立一个新的序列对象,并将残差序列中的数据复制到新建立的对象中。然后选择主窗口中的“Quick”|“Graph”|“Scatter”选项,生成散点图,进而可判断随机项是否存在异方差性。
22五、线性回归模型的检验3.异方差性检验(2)怀特(White)检验法检验步骤:用OLS(最小二乘法)估计回归方程,得到残差e。作辅助回归模型:求辅助回归模型的拟合优度R2的值。White检验的统计量服从χ2分布,即N·R2~χ2(k)其中,N为样本容量,k为自由度,k等于辅助回归模型()中解释变量的个数。如果χ2值大于给点显著性水平下对应的临界值,则可以拒绝原假设,即存在异方差;反之,接受原假设,即不存在异方差。23五、线性回归模型的检验3.异方差性检验(2)怀特(White)检验法White检验的统计量服从χ2分布,即N·R2~χ2(k)其中,N为样本容量,k为自由度,k等于辅助回归模型()中解释变量的个数。如果χ2值大于给点显著性水平下对应的临界值,则可以拒绝原假设,即存在异方差;反之,接受原假设,即不存在异方差。24五、线性回归模型的检验3.异方差性检验(2)怀特(White)检验法在EViews5.1软件中选择方程对象工具栏中的“View”|“ResidualTests”|“WhiteHeteroskedasticity”选项即可完成操作。25五、线性回归模型的检验3.异方差性检验异方差性的后果:当模型出现异方差性时,用OLS(最小二乘估计法)得到的估计参数将不再有效;变量的显著性检验(t检验)失去意义;模型不再具有良好的统计性质,并且模型失去了预测功能。
26五、线性回归模型的检验4.序列相关检验方法:(1)杜宾(D.W.—Durbin-Watson)检验法(2)LM(拉格朗日乘数—LagrangeMultiplier)检验法27五、线性回归模型的检验4.序列相关检验(1)杜宾(D.W.—Durbin-Watson)检验法
J.Durbin,G.S.Watson于1950年提出了D.W.检验法。它是通过对残差构成的统计量来判断误差项ut是否存在自相关。D.W.检验法用来判定一阶序列相关性的存在。D.W.的统计量为28五、线性回归模型的检验4.序列相关检验(1)杜宾(D.W.—Durbin-Watson)检验法如果,0<D.W.<dt,存在一阶正自相关dt<D.W.<du,不能确定是否存在自相关du<D.W.<4-du,不存在自相关4-du<D.W.<4-dt不能确定是否存在自相关4-dt<D.W.<4
,存在一阶负自相关29五、线性回归模型的检验4.序列相关检验(1)杜宾(D.W.—Durbin-Watson)检验法使用D.W.检验时应注意,因变量的滞后项yt-1不能作为回归模型的解释变量,否则D.W.检验失效。另外,样本容量应足够大,一般情况下,样本数量应在15个以上。30五、线性回归模型的检验4.序列相关检验(2)LM(拉格朗日乘数—LagrangeMultiplier)检验法LM检验原假设和备择假设分别为:H0:直到p阶滞后不存在序列相关H1:存在p阶序列相关LM的统计量为
LM=n·R2~χ2(p)其中,n为样本容量,R2为辅助回归模型的拟合优度。LM统计量服从渐进的χ2(p)。在给定显著性水平的情况下,如果LM统计量小于设定在该显著性水平下的临近值,则接受原假设,即直到p阶滞后不存在序列相关。31五、线性回归模型的检验4.序列相关检验序列相关性的后果:用OLS(最小二乘估计法)得到的估计参数将不再有效;变量的显著性检验(t检验)失去意义;模型不再具有良好的统计性质,并且模型失去了预测功能。32五、线性回归模型的检验5.多重共线性方法:(1)相关系数检验法
(2)逐步回归法33五、线性回归模型的检验5.多重共线性(1)相关系数检验法在群对象窗口的工具栏中选择“View”|“Correlations”|“CommonSample”选项,即可得到变量间的相关系数。如果相关系数较高,则变量间可能存在线性关系,即模型有多重共线性的可能。34五、线性回归模型的检验5.多重共线性(2)逐步回归法当在回归模型中增加或减少解释变量个数时,如果拟合优度变化很大,说明新引进的变量是一个独立的解释变量,即它与其他变量间是相互独立的,模型不存在多重共线性;如果拟合优度变化不大,说明新引进的变量不是一个独立的解释变量,它可由原有的解释变量的线性组合构成,即它与其他变量间非相互独立,模型可能存在多重共线性。35五、线性回归模型的检验4.序列相关检验消除多重共线性方法:剔除法差分法36§3.1创建方程对象
EViews中的单方程回归估计是用方程对象来完成的。为了创建一个方程对象:从主菜单选择Object/NewObject/Equation或Quick/EstimationEquation…,或者在命令窗口中输入关键词equation。在随后出现的方程说明对话框中说明要建立的方程,并选择估计方法。37§3.2
在EViews中对方程进行说明
当创建一个方程对象时,会出现如下对话框:
在这个对话框中需要说明三件事:方程说明,估计方法,估计使用的样本。在最上面的编辑框中,可以说明方程:因变量(左边)和自变量(右边)以及函数形式。有两种说明方程的基本方法:列表法和公式法。列表法简单但是只能用于不严格的线性说明;公式法更为一般,可用于说明非线性模型或带有参数约束的模型。38
§3.2.1列表法
说明线性方程的最简单的方法是列出方程中要使用的变量列表。首先是因变量或表达式名,然后是自变量列表。例如,要说明一个线性消费函数,用一个常数c和收入inc对消费csp作回归,在方程说明对话框上部输入:cspcinc注意回归变量列表中的序列c。这是EViews用来说明回归中的常数而建立的序列。EViews在回归中不会自动包括一个常数,因此必须明确列出作为回归变量的常数。内部序列c不出现在工作文档中,除了说明方程外不能使用它。在上例中,常数存储于c(1),inc的系数存储于c(2),即回归方程形式为:csp=c(1)+c(2)*inc。39
在统计操作中会用到滞后序列,可以使用与滞后序列相同的名字来产生一个新序列,把滞后值放在序列名后的括号中。cspc
csp(-1)inc相当的回归方程形式为:csp=c(1)+
c(2)
csp(-1)+c(3)
inc。通过在滞后中使用关键词to可以包括一个连续范围的滞后序列。例如:cspccsp(-1to-4)inc这里csp关于常数,csp(-1),csp(-2),csp(-3),csp(-4),和inc的回归。
在变量列表中也可以包括自动序列。例如:log(csp)clog(csp(-1))log((inc+inc(-1))/2)相当的回归方程形式为:log(csp)=c(1)+c(2)
log(csp(-1))+c(3)
log((inc+inc(-1))/2)40§3.2.2公式法说明方程
当列表方法满足不了要求时,可以用公式来说明方程。许多估计方法(但不是所有的方法)允许使用公式来说明方程。EViews中的公式是一个包括回归变量和系数的数学表达式。要用公式说明一个方程,只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。
41
用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量,选择Object/NewObject…并从主菜单中选择Matrix-Vector-Coef,为系数向量输入一个名字。然后,选择OK。在NewMatrix对话框中,选择CoefficientVector并说明向量中应有多少行。带有系数向量图标
的对象会列在工作文档目录中,在方程说明中就可以使用这个系数向量。例如,假设创造了系数向量a和beta,各有一行。则可以用新的系数向量代替c:
log(csp)=a(1)+beta(1)*log(csp(-1))42§3.3在EViews中估计方程
3.3.1
估计方法
说明方程后,现在需要选择估计方法。单击Method:进入对话框,会看到下拉菜单中的估计方法列表:
标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的方程可以用一个公式说明。非线性方程不允许使用binary,ordered,censored,count模型,或带有ARMA项的方程。43
3.3.2估计样本
可以说明估计中要使用的样本。EViews会用当前工作文档样本来填充对话框。
如果估计中使用的任何一个序列的数据丢失了,EViews会临时调整观测值的估计样本以排除掉这些观测值。EViews通过在样本结果中报告实际样本来通知样本已经被调整了。
在方程结果的顶部,EViews报告样本已经得到了调整。从1978年
2002年期间的25个观测值中,EViews使用了24个观测值。44
3.3.3估计选项(Options)
EViews提供很多估计选项。这些选项允许进行以下操作:对估计方程加权,计算异方差性,控制估计算法的各种特征。45§3.4方程输出
在方程说明对话框中单击OK钮后,EViews显示估计结果:
根据矩阵的概念,标准的回归可以写为:其中:y是因变量观测值的T维向量,X是解释变量观测值的T
k维矩阵,T是观测值个数,k是解释变量个数,
是k维系数向量,u是T维扰动项向量。46
§3.4.1系数结果
1.
回归系数(Coefficient)
系数框描述了系数
的估计值。最小二乘估计的系数b是由以下的公式计算得到的
如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如果是使用公式法来说明方程,EViews会列出实际系数c(1),c(2),c(3)等等。对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数c是回归中的常数或者截距---它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变,相应的自变量和因变量之间的斜率关系。47
例3.1:本例是用中国1978年〜2006年的数据建立的居民消费方程:cst=c0+c1inct+ut其中:cs是居民消费;inc是可支配收入。方程中c0代表自发消费,表示收入等于零时的消费水平;而c1代表了边际消费倾向,0<c1<1,即收入每增加1元,消费将增加
c1元。从系数中可以看出边际消费倾向是0.73。也即1978年~2006年中国居民可支配收入的73%用来消费。48
2.标准差(Std.Error)
标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信性----标准差越大,估计中的统计干扰越大。估计系数的协方差矩阵是由以下公式计算得到的:这里是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。可以通过选择View/CovarianceMatrix项来察看整个协方差矩阵。其中49
3.t-统计量
t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。
4.概率(P值)
结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下,指出t统计量与实际观测值一致的概率。
这个概率称为边际显著性水平或P值。给定一个P值,可以一眼就看出是拒绝还是接受实际系数为零的双边假设。例如,如果显著水平为5%,P值小于0.05就可以拒绝系数为零的原假设。对于例1的结果,系数inc的零假设在1%的显著水平下被拒绝。50
§3.4.2方程统计量
1.R2统计量
R2统计量衡量在样本内预测因变量值的回归是否成功。R2是自变量所解释的因变量的方差。如果回归完全符合,统计值会等于1。如果结果不比因变量的均值好,统计值会等于0。R2可能会由于一些原因成为负值。例如,回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二乘法或ARCH方法。EViews计算R2的公式为:,其中,是残差,是因变量的均值。51
2.R2调整
使用R2作为衡量工具存在的一个问题,即在增加新的自变量时R2不会减少。在极端的情况下,如果把样本观测值都作为自变量,总能得到R2为1。
R2调整后的记为,消除R2中对模型没有解释力的新增变量。计算方法如下:
从不会大于R2
,随着增加变量会减小,而且对于很不适合的模型还可能是负值。52
3.回归标准差
(S.E.ofregression)
回归标准差是在残差的方差的估计值基础之上的一个总结。计算方法如下:
4.残差平方和
残差平方和可以用于很多统计计算中,为了方便,现在将它单独列出:53
5.对数似然函数值
EViews可以作出根据系数的估计值得到的对数似然函数值(假设误差为正态分布)。似然比检验可通过观察方程严格形式和不严格形式的对数似然值之间的差异来进行。对数似然计算如下:
54
6.Durbin-Watson
统计量
D-W统计量衡量残差的一阶序列相关性,计算方法如下:
作为一个规则,如果DW值小于2,证明存在正序列相关。在例1的结果中,DW值很小,表明残差中存在序列相关。关于Durbin-Watson统计量和残差序列相关更详细的内容参见“序列相关理论”。对于序列相关还有更好的检验方法。在“序列相关的检验”中,我们讨论Q统计量和LM检验,这些都是比DW统计量更为一般的序列相关检验方法。55
7.因变量均值和标准差(S.D)
y
的均值和标准差由下面标准公式算出:
8.AIC准则(AkaikeInformationCriterion)
计算公式如下:
其中l
是对数似然值
我们进行模型选择时,AIC值越小越好。例如,可以通过选择最小AIC值来确定一个滞后分布的长度。56
9.Schwarz准则
Schwarz准则是AIC准则的替代方法:
10.F统计量和边际显著性水平
F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型,F统计量由下式计算:
在原假设为误差正态分布下,统计量服从
F(k–1,T–
k)
分布。
57
F统计量下的P值,即Prob(F-statistic),是F检验的边际显著性水平。如果P值小于所检验的边际显著水平,比如说0.05,则拒绝所有系数都为零的原假设。对于例1,P值为零,因此,我们拒绝回归系数为零的原假设。注意F检验是一个联合检验,即使所有的t统计量都是不显著的,F统计量也可能是高度显著的。58§3.5方程操作
3.5.1方程视图
以三种形式显示方程:EViews命令形式,带系数符号的代数方程,和有系数估计值的方程。
可以将这些结果剪切和粘贴到支持Windows剪贴板的应用文档中。59
·EstimationOutput显示方程结果。·Actual,Fitted,Residual以图表和数字的形式显示因变量的实际值和拟合值及残差。
·
Actual,Fitted,ResidualTable以表的形式来显示这些值。60
·GradientsandDerivatives...描述目标函数的梯度和回归函数的导数计算的信息。详细内容参见附录E,“梯度和导数”。·CovarianceMatrix以表的形式显示系数估计值的协方差矩阵。要以矩阵对象保存协方差矩阵,可以使用@cov函数。·CoefficientTests,ResidualTests,andStabilityTests这些是“定义和诊断检验”中要详细介绍的内容。613.5.2方程过程
·Specify/Estimate...编辑方程说明、改变估计方法、估计样本。·Forecast...用估计方程的预测。·MakeModel创建一个与被估计方程有关的未命名模型。·UpdateCoefsfromEquation把方程系数的估计值放在系数向量中。·MakeRegressorGroup创建包含方程中使用的所有变量的未命名组(常数除外)。·MadeResidualSeries...以序列形式保存回归中的残差。·MakeDerivativeGroup创建包含回归函数关于其系数的导数的组。·MadeGradientGroup创建包含目标函数关于模型的系数的斜率的组。621.回归方程的函数形式
下面讨论几种形式的回归模型:(1)双对数线性模型(不变弹性模型)(2)半对数模型(3)双曲函数模型(4)多项式回归模型所有这些模型的一个重要特征是:它们都是参数线性模型,但是变量却不一定是线性的。
(1)
双对数线性方程
双对数线性模型估计得到的参数本身就是该变量的弹性。如设Qt为产值,Pt为价格,在
log(Qt)=
+
log(Pt)+ut的估计式中,P增加1%时,Q大约增加β%,所以β相当于Qt的价格弹性。§3.6线性回归方程的应用实例
63
[推导]
当
t+1期的P比上一期增加1%时,有log(Qt+1)=
+βlog(Pt·1.01))=
+βlog(Pt)+βlog(1.01))=log(Qt)+βlog(1.01)
移项得,
log(Qt+1)−log(Qt)=βlog(1.01)),即
,还原得
因此,P变化1%时,Q大约变化β%。
例3.3:下面建立我国居民消费的收入弹性方程:log(cspt)=
0.25
+0.908log(inct)t=(1.66)(55.05)
R2=0.99D.W.=0.45其中cspt是城镇居民消费,inct是居民消费可支配收入。64
方程中消费的收入弹性为0.93,说明我国居民可支配收入每增加1%,将使得居民消费增加0.93%。65
(2)半对数模型
线性模型与对数线性模型的混合就是半对数模型或半对数模型包含两种形式,分别为:(3.2.10)
(3.2.11)
半对数模型也是线性模型,因为参数是以线性形式出现在模型中的。而且,虽然原来的变量x和y之间是非线性关系,但变量x(或y)经过对数变换后,变量ln(x)和y之间(或变量x和ln(y)之间)是线性关系,因此可以称其为半对数线性模型。类似双对数模型,半对数模型也可以使用OLS估计。66半对数模型(3.2.10)和(3.2.11)中的回归系数具有直观的意义:,(3.2.12)即:
1表示x变化1%导致y绝对量的变化量;
1表示x的变化1单位导致y变化的百分比。特别地,如果在半对数模型式(3.2.11)中x取为t(年份),变量t按时间顺序依次取值为1,2,…,T,则t的系数度量了y的年均增长速度,因此,半对数模型(3.2.11)又称为增长模型。对于增长模型,如果
1为正,则y有随时间向上增长的趋势;如果
1为负,则y有随时间向下变动的趋势,因此t可称为趋势变量。宏观经济模型表达式中常有时间趋势,在研究经济长期增长或确定性趋势成分时,常常将产出取对数,然后用时间t作解释变量建立回归方程。67例3.4:我们建立半对数线性方程,估计我国实际GDP(支出法,样本区间:1978~2002年)的长期平均增长率,模型形式为其中:GDP
Pt表示剔出价格因素的实际GDPt。方程中时间趋势变量的系数估计值是0.094,说明1978~2002年我国实际GDP的年平均增长率为9.4%。F值或R2表明模型拟合效果很好,D.W.显示模型存在(正的)自相关。68
(3)双曲函数模型形如下式的模型称为双曲函数模型
这是一个变量之间是非线性的模型,因为Xt是以倒数的形式进入模型的,但这个模型却是参数线性模型,因为模型中参数之间是线性的。这个模型的显著特征是随着Xt的无限增大,(1/Xt
)接近于零。
69例3.5美国菲利普斯曲线
利用美国1955~1984年的数据(附录E.2),根据菲利普斯曲线,即通货膨胀率
t
和失业率Ut的反向关系,建立双曲函数:
估计结果表明,菲利普斯曲线所描述的
t和Ut的反向关系并不存在。之所以出现这样的背离,主要是因为20世纪70年代出现石油危机,从而引发了“滞胀”,通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响,则可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表。70含有通货膨胀预期的菲利普斯曲线估计结果为
可以看出,加入通货膨胀预期因素后,模型的拟合效果很好,而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。
712.虚拟变量的应用
例3.6:工资差别
为了解工作妇女是否受到了歧视,可以用美国统计局的“当前人口调查”中的截面数据研究男女工资有没有差别。这项多元回归分析研究所用到的变量有:W—雇员的工资(美元/小时)1;若雇员为妇女SEX=0;男性ED—受教育的年数AGE—雇员的年龄1;若雇员不是西班牙裔也不是白人NONWH=0;其他1;若雇员是西班牙裔HISP=0;其他72
对206名雇员的样本所进行的研究得到的回归结果为(括号内是t统计量的值):(22.10)(-3.86)R2=0.068D.W.=1.79
反映雇员性别的虚拟变量SEX在显著性水平1%下显著。因为工资的总平均是9.60美元,该虚拟变量告诉我们,妇女的平均工资为8.12美元,或比总平均低1.48美元。73
在回归模型中加入年龄AGE和受教育年数ED以及种族或民族,性别虚拟变量仍然是显著的:(-3.38)(-4.61)(8.54)(4.63)(-1.07)(0.22)R2=0.367D.W.=1.7874
最后考虑年龄AGE与工资W之间非线性关系的可能性时,男女差别还是显著存在的。这一点可以由下列回归结果看出:(-4.59)(-4.50)(7.98)(-1.22)(0.28)(3.87)(-3.18)R2=0.398D.W.=1.75
这个回归模型的年龄AGE项说明,在其他条件不变的情况下,雇员的工资率随着他的年龄的增长而增长(系数为0.62),但是增加的速度越来越慢(-0.0063)。进一步的研究表明,工资在雇员的年龄为49.2岁时达到最大,之后逐年下降。75例3.7季节虚拟变量当使用含有季节因素的经济数据进行回归分析时,可以对数据进行季节调整消除原数据带有的季节性影响,也可以使用虚拟变量描述季节因素,进而可以同时计算出各个不同季度对经济变量的不同影响。如果用虚拟变量,这时包含了4个季度的4种分类,需要建立3个虚拟变量。用Qi表示第i个季度取值为1,其他季度取值为0的季节虚拟变量,显然Q1+Q2+Q3+Q4=1,如果模型中包含常数项,则只能加入Q1,Q2,Q3
,否则模型将因为解释变量的线性相关而无法估计,即导致虚拟变量陷阱问题。当使用月度数据时,方法与上述类似,但需要有11个虚拟变量。
76图3.1-1社会消费品零售总额RS图3.1-2GDP
通过图3.1,可以看出1995年1季度~2003年1季度的季度GDP和社会消费品零售额RS存在明显的季节因素(数据见附录E表E.4),GDP通常逐季增加,也有一些年份中第二季度高于第三季度。RS在第一季度增加,第二季度减小,第三季度略有上升,第四季度达到高峰。77
下面利用季度数据对我国的国民生产总值GDP和社会消费品零售额RS进行回归分析,分别考虑不包含和包含虚拟变量的情形。不包含虚拟变量的回归结果为(3.3.9)
t=(2.53)(14.9)
R2=0.88D.W.=2.13使用虚拟变量的回归方程结果为
t=(-4.82)(17.93)(7.58)(6.14)(52.83)(3.3.10)R2=0.99D.W.=1.9978可以看出包含虚拟变量的方程明显地改进了拟合能力。这种季节调整方法是以季节变动要素不变并且服从于加法模型为前提,否则应该首先运用X-12或其他方法对数据进行季节调整。
图3.2SL的实际曲线(实线)和拟合曲线(虚线)(左、右图分别由式(3.3.9),(3.3.10)得到)79§3.7估计中存在的问题
如果自变量具有高度共线性,EViews在计算回归估计时会遇到困难。在这种情况下,EViews会产生一个显示错误信息对话框“奇异矩阵”。出现这个错误信息后,应该检查回归变量是否是共线的。如果一个回归变量可以写作其他回归变量的线性组合,则回归变量是完全共线的。在完全共线的情况下,回归变量矩阵X不是列满秩的,不能计算OLS估计值。
80§3.8定义和诊断检验
经验研究经常是一种相互影响的过程。这一过程从估计关系的定义开始。选择定义常含有几个选择:变量,连接这些变量的函数,以及当数据是时间序列时表示变量间关系的动态结构。不可避免地,在初始定义的恰当性方面存在不确定性。一旦估计了方程,EViews提供了评价方程定义质量的工具。随着改进,检验结果将影响所选择的定义,这一过程将重复下去,直到方程定义恰当为止。本节描述了在方程对象的View中关于定义检验统计量的多个菜单。我们试图提供足够的统计方法来进行这些检验,但是实际考虑的许多描述是不完全的,建议查阅标准统计和经济计量学参考资料。81
下面描述的每一检验过程包括假设检验的原假设定义。检验指令输出包括一个或多个检验统计量样本值和它们的联合概率值(P值)。P值说明在原假设为真的情况下,样本统计量绝对值的检验统计量大于或等于临界值的概率。P值度量的是犯第一类错误的概率,即拒绝正确的原假设的概率,P值越大,错误地拒绝原假设的可能性就越大;P值越小,拒绝原假设时就越放心。例如,如果P值在0.01和0.05之间,原假设在5%显著性水平被拒绝而不是在1%水平。切记:对每一检验都有不同假设和分布结果。例如,有些检验统计量有确切的有限的样本分布(常为t或F分布)。其它是服从近似分布的大样本检验统计量。每一检验的内容都不同,将分别描述。82
其它检验在其它章节讨论。它们包括单位根检验、Granger因果检验和Johansen协整检验。
方程对象菜单的View中给出三种检验类型选择来检验方程定义。包括系数检验、残差检验和稳定性检验:
83§3.8.1系数检验
系数检验对估计系数的约束进行评价,包括对遗漏变量和冗余变量特殊情况的检验。
一、Wald检验——系数约束条件检验
1.Wald检验原理
Wald检验没有把原假设定义的系数限制加入回归,通过估计这一无限制回归来计算检验统计量。Wald统计量计算无约束估计量如何满足原假设下的约束。如果约束为真,无约束估计量应接近于满足约束条件。下面给出计算Wald检验统计量的一般公式。84
对于一个线性回归模型
一个线性约束:
式中R是一个已知的
q
k阶矩阵,r是
q维向量。Wald统计量简写为,b为没有加入约束得到的参数估计值:
W
在H0下服从渐近
2(q)分布。进一步假设误差独立同时服从正态分布,我们就有一确定的、有限的样本F-统计量
是约束回归的残差向量。F统计量比较有约束和没有约束计算出的残差平方和。如果约束有效,这两个残差平方和差异很小,F统计量值也应很小。EViews显示
2和F统计量以及相应的P值。85
2.如何进行Wald系数检验
为介绍如何进行Wald系数检验,我们考虑一个例子。生产函数的数学形式为
在最初提出的C-D生产函数中,假定参数满足
+
=1
,也就是假定研究对象满足规模报酬不变。
Q为产出,K为资本投入,L为劳动力投入。很容易推出参数
,
分别是资本和劳动的产出弹性。那么由产出弹性的经济意义,应该有
,
即当资本与劳动的数量同时增长
倍时,产出量也增长
倍。1937年,提出了C-D生产函数的改进型,即取消了
+
=1
的假定,允许要素的产出弹性之和大于1或小于1,即承认研究对象可以是规模报酬递增的,也可以是规模报酬递减的,取决于参数的估计结果。86
例3.8
Cobb-Douglas生产函数估计形式如下:
利用美国主要金属工业企业的数据(27个企业的数据),C-D生产函数估计结果如下:
(1)87
从结果看LogL和logK的系数和小于1,但为确定这种差异是统计相关的,我们常进行有约束的Wald系数检验。选择View/CoefficientTests/Wald-CoefficientRestrictions,在编辑对话框中输入约束条件。约束条件应表示为含有估计参数和常数(不可以含有序列名)的方程,系数应表示为c(1),c(2)等等,除非在估计中已使用过一个不同的系数向量。为检验
+
=1的规模报酬不变的假设,在对话框中输入下列约束:
c(2)+c(3)=1单击OK,EViews显示Wald检验如下结果(原假设:约束条件有效):
EViews显示F统计量和
2统计量及相应的P值。
2统计量等于F统计量乘以检验约束条件数。本例中,仅有一个约束条件,所以这两个检验统计量等价。它们的P值表明我们可以确定地接受规模报酬不变的原假设。88
下面考虑检验多个约束条件的情况。例如,改变前面的C-D生产函数为非线性形式,我们估计一个如下形式的生产函数
检验约束条件:。这个非线性模型的估计结果如下:
89
检验多个约束条件,应用逗号隔开约束条件。在方程对话框中选择View/Coefficienttests/WaldCoefficientRestrictions。在Wald检验对话框中输入如下约束条件:c(4)=0,c(5)=0,c(6)=0,结果如下:
检验结果是不能拒绝原假设,表明(1)式的Cobb-Douglas生产函数是这一问题较适当的方程定义形式。90二、遗漏变量(OmittedVariables)检验
1.遗漏变量检验原理
这一检验能给现有方程添加变量,而且询问添加的变量对解释因变量变动是否有显著作用。原假设H0是添加变量不显著。
检验的输出是F统计量和似然比(LR)统计量及各自P值,以及在备选假设下无约束模型估计结果。F统计量基于约束和无约束回归残差平方和之差。LR统计量由下式计算:
Lr和Lu是约束和无约束回归对数似然函数的最大值。在H0下,LR统计量服从渐近
2分布,自由度等于约束条件数,即加入变量数。91
注意:(1)遗漏变量检验要求在原始方程中和检验方程中观测值数相等。如果要加入变量的任一序列与原方程样本相比,含有缺失观测值(当加入滞后变量时这种情况常见),检验统计量将无法建立。(2)遗漏变量检验可应用于线性LS,TSLS,ARCH,Binary,Ordered,Censored,Count模型估计方程。只有通过列表法列出回归因子定义方程而不能通过公式,检验才可以进行。
2.如何进行遗漏变量检验
选择View/CoefficientTests/OmittedVariables—LikelihoodRation,在打开的对话框中,列出检验统计量名,用至少一个空格相互隔开。92
例如:原始回归为:log(q)clog(L)log(k)。输入:KLEViews将显示含有这两个附加解释变量的无约束回归结果,而且显示原假设:新添变量系数为0
的检验统计量。输出的结果如下:
对数似数比统计量就是LR检验统计量且渐进服从于
2
分布,自由度等于添加回归因子数。本例中,检验结果不能拒绝原假设,即添加变量不显著。93三、冗余(RedundantVariables)变量
1.冗余变量检验原理
冗余变量检验可以检验方程中一部分变量的统计显著性。更正式,可以确定方程中一部分变量系数是否为0,从而可以从方程中剔出去。原假设:被检验变量系数为0。冗余变量检验可以应用于线性LS,TSLS,ARCH(仅均值方程),Binary,Ordered,Censored,Count模型估计方程。只有以列表法列出回归因子形式,而不是公式定义方程,检验才可以进行。
2.如何进行冗余变量检验
选择View/CoefficientTests/RedundantVariable—likelihoodRatio,在对话框中,输入每一检验的变量名,相互间至少用一空格隔开。94
例如:原始回归为log(Q)clog(L)log(K)KL
如果输入增加的变量K和L,EViews显示去掉这两个回归因子的约束回归结果,以及检验原假设:被检验变量系数为0
的统计量。结果如下:
检验统计量是F统计量和对数似然比。如果误差是独立正态分布随机变量,F统计量有确定有限样本F分布,分子自由度为原假设下系数约束条件数,分母自由度为总回归自由度。LR检验是渐近检验,服从
2分布。
95§3.8.2残差检验
EViews提供了对估计方程残差的序列相关,正态性,异方差性和自回归条件异方差性检验。96(1)相关图和Q
统计量(2)平方残差相关图(3)残差直方图和正态检验
显示残差直方图和残差的描述统计量,包括检验残差正态性的Jarque-Bera统计量。如果残差服从正态分布,直方图应呈钟型,J-B统计量应不显著。也适用于LS,TSLS,非线性LS等模型残差。选择View/ResidualTests/HistogramNormality显示直方图和J-B统计量。在原假设:残差正态分布下,J-B统计量应服从
2
分布,自由度为2。
(4)序列相关LM检验(5)ARCHLM检验(6)White异方差性检验97§3.8.3定义和稳定性检验
一个推荐的经验方法是把观测值区间T分为T1和T2两部分。T1个观测值用于估计,T2个观测值用于检验和评价。把所有样本数据用于估计,有利于形成最好的拟合,但没有考虑到模型检验,也无法检验参数不变性,估计关系的稳定性。检验预测效果要用估计时未用到的数据,建模时常用T1区间估计模型,用T2区间检验和评价效果。对于子区间T1和T2的相对大小,没有太明确的规则。有时可能会出现明显的结构变化的转折点,例如战争,石油危机等。当看不出有转折点时,常用的经验方法是用85%-90%的数据作估计,剩余的数据作检验。EViews提供了一些检验统计量选项,它们检查模型参数在数据的不同子区间是否平稳。981.Chow分割点检验
Chow分割点检验的思想是对每一个子样本区间估计方程,看估计方程中是否存在显著差异。显著差异说明关系中存在结构变化。例如,可以使用这个检验来检查石油危机前后的能源需求函数是否一样。为进行检验,把数据分为两个或多个子样本区间,每一子区间包含的观测值数应大于方程参数,这样才使得方程能被估计。Chow分割点检验基于比较利用整个样本估计方程获得的残差平方和及利用每一子区间样本估计方程获得的残差平方和之间的差别。对Chow分割点检验,EViews提供了两个检验统计量。F统计量和对数似然比(LR)统计量,F统计量基于对约束和非约束残差平方和的比较。在最简单情况下(一个分割点),计算如下:
99
Chow分割点检验的原假设:不存在结构变化。Chow分割点检验的主要缺陷是,如果每一个子区间要求至少和被估计参数一样多的样本数,那么这里就存在一个问题,比如说,要检验战争和和平时期的结构变化,但是战争时期的样本数较少。下面要讨论的Chow预测检验可以解决这个问题。
其中:
是整个样本期间估计的残差平方和;是第i个子区间的残差平方和;T是观测值数;k是方程参数个数,这一公式可以扩展为多于一个分割点。100
为了进行Chow分割点检验,选择View/StabilityTests/ChowBreakpointTest…出现对话框以后,填入间断点的日期。比如,如果方程的数据是从1978到2002年,填入1994,则被定义成两个子区间:一个是1978到1993,另一个是1994到2002。
例3.9
我们利用Chow检验来判断例3.1所建立的消费函数的稳定性。20世纪90年代前的中国仍然处于卖方市场,虽然居民收入水平增幅较大,但商品供给有限,而且当时的利息率较高,因而居民收入更加倾向于储蓄增值而不是立即消费。1994年我国开始了全面的体制改革和制度创新,随着国有企业体制改革的推进和大量非国有企业的兴起并日益壮大,国内商品市场日益繁荣,商品品种更加丰富,使得居民收入用于消费的部分增加。不妨以1994年为假想的间断点,用Chow检验判断1994之前和之后的两段时期消费函数是否产生了显著的差异。
该结果是拒绝原假设(不存在结构变化):即1994前后存在结构变化。101
Chow预测检验先估计了包括T1区间子样本的所有样本观测值的模型,然后用同样的模型去估计T1区间样本的因变量的值。如果两个估计值差异很大,就说明模型可能不稳定。检验适用于最小二乘法和二阶段最小二乘法。EViews给出F统计量计算如下:
这里用所有样本观测值估计方程的残差平方和,是用T1子样本进行估计方程的残差平方和,k是被估计参数的个数。当误差是独立同正态分布时,F统计量服从精确的有限样本的F分布。
2.Chow预测检验
102
选择View/StabilityTest/ChowForecastTest进行Chow预测检验。对预测样本开始时期或观测值数进行定义。数据应在当前观测值区间内。
仍以例3.1所建立的消费函数为例,定义1994作为预测区间第一个分割点。检验重新估计1978—1994的方程,并且使用这个结果来计算剩余时期的预测误差。结果如下:
对数似然比(LR)统计量拒绝原假设,中国的消费函数在1994年前后有结构变化,但F统计量不能拒绝原假设。注意:本例说明两种Chow检验产生相同的结果。但有时也会产生相反的结果。103§3.9
EViews中的方程预测
为说明一个被估计方程的预测过程,我们仍然考虑例3.1中的模型,如果要对此模型的预测功能进行评价,可以用1978~1999年的22年数据进行参数估计,用2000~2002年的数据作为检验性数据,考察实际值和预测值的差别。
104用1978~2004年的22年数据进行参数估计的结果:
105
§3.9.1如何进行预测
为预测该方程的实际消费csp,在方程的工具栏中按Forecast按钮,或选择Procss/Forecast…。这时会出现对话框:106
我们应提供如下信息:
1.序列名
预测后的序列名将所要预测的因变量名填入编辑框中。EViews默认了一个名字,但可以将它变为任意别的有效序列名。这个名字应不同于因变量名,因为预测过程会覆盖已给定的序列值。
S.E.(Optional)如果需要,可以为该序列的预测标准差提供一个名字。如果省略该项,预测标准误差将不被保存。
GARCH(Optional)对用ARCH估计的模型,还可以保存条件方差的预测值(GARCH项)。见6章对GARCH估计的讨论。107
2.预测方法
动态(Dynamic)—从预测样本的第一期开始计算多步预测。
静态(Static)—利用滞后因变量的实际值计算一步向前(one-step-ahead)预测的结果。
结构(Structural)—预测时EViews将忽略方程中的任何ARMA项。若不选此项,在方程中有ARM
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一年级数学计算题专项练习1000题集锦
- 二年级数学计算题专项练习1000题汇编集锦
- 新课改背景下的数学教学方法变革研究
- 2025年华师大新版选择性必修1历史下册阶段测试试卷含答案
- 教育启发下的地铁文创产品设计与营销创新
- 校园文化中体育活动的创新与实践
- 对公客户投资理财教育的国际比较与借鉴研究
- 2025年仁爱科普版七年级化学上册月考试卷含答案
- 期货合同与买卖协议书
- 银行借贷合同
- 给男友的道歉信10000字(十二篇)
- 2020年高级统计实务与案例分析真题及答案
- 全面质量管理(TQM)基本知识
- 练字本方格模板
- 产品供货质量保障措施
- 电力电缆高频局放试验报告
- 《老山界》第1第2课时示范公开课教学PPT课件【统编人教版七年级语文下册】
- JJG 517-2016出租汽车计价器
- JJF 1914-2021金相显微镜校准规范
- GB/T 32045-2015节能量测量和验证实施指南
- GB/T 10001.6-2021公共信息图形符号第6部分:医疗保健符号
评论
0/150
提交评论