华中科技大学《计量经济学》第十三、十四章:计量经济建模模型_第1页
华中科技大学《计量经济学》第十三、十四章:计量经济建模模型_第2页
华中科技大学《计量经济学》第十三、十四章:计量经济建模模型_第3页
华中科技大学《计量经济学》第十三、十四章:计量经济建模模型_第4页
华中科技大学《计量经济学》第十三、十四章:计量经济建模模型_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十三、十四章计量经济建模:模型设定和诊断问题的提出何谓正确设定的模型?正确设定的标准是什么?在应用中可能遇到何种类型的设定错误?由设定错误所产生的后果又是什么?如何诊断和校正模型存在设定误差等?13.1.模型选择标准传统观点:节省性,即能用简单的模型就不用复杂的模型;识别性:参数可识别;理论一致性:即模型和结果应符合有关的经济学理论;预测功效:模型应有一个好的预测能力,或较高的拟合优度,在模型符合理论的前提下,拟合优度应相对较高.Hendry和Richard模型设定应满足以下标准:模型与数据的相容性,即基于模型进行预测必须是逻辑可行的。模型与理论一致性,即模型必须有良好的经济学意义和解释,消费理论中MPC小于1等。模型的回归因子(解释变量)为弱外生变量,即回归因子与误差项不相关。模型的参数应具有稳定性或常数性,若不然,预测就是非常困难的。估计的模型应体现出数据的内在逻辑一致性,即估计的残差必须是纯随机的(即白噪音或i.i.d),如果一个模型是适宜的,估计的残差就必为白噪音,若残差不是白噪音,意味着模型存在某种设定误差,这是本章的重点。包容性,即正确设定的模型应能解释与它竞争的模型,或竞争模型不可能是正确设定模型的一种改进。13.2.设定误差的类型

去掉了一个不应去掉的变量所引起的设定误差包含了一个不相关或不应包含的变量错误的函数形式

测度误差所引起的设定错误

随机误差项的错误形式引起设定误差

在上述5类设定问题中,1-4类设定误差是基本和常见的,称为模型设定误差(Modelspecificationerror),其基本特征是与正确设定的模型相比较,而第5种设定误差称为模型误设所引起的误差(Modelmis-specificationerror,),简称为误设误差,其特征是不知道正确设定的模型,而是从相互竞争的模型开始,如凯恩斯理论强调政府支出对GDP的作用,而货币学派则强调货币对于解释GDP的作用.基于这2种经济学理论就形成了两个相互竞争的模型,回归因子分别为政府支出和货币.从经济学理论和计量经济学的实证,并不知道其中的哪一个是正确设定的模型.13.3.模型设定误差的后果1.去掉一个不应去掉的变量导致的设定误差产生的后果为模型的不足拟合(underfitting)模型Yi=b1+b2X2i+b3X3i+ui(13.8)

但出于某些原因却估计了下述具有设定误差(去掉一个不应去掉的变量X3i)的模型

Yi=a1+a2X2i+vi(13.9)

产生的后果若X3i与X2i相关,即相关系数为r23≠0这种设定误差导致参数估计有偏

若r23=0,但,即X3i与X2i无关,具有对于设定误差的模型(13.9)的估计,a1的估计是有偏而a2的估计是无偏。真实模型的误差ui的方差s2也不能通过估计具有设定误差的模型而实现对s2的正确估计。

即基于设定误差模型的参(或系数)数的方差估计是真正模型的参数估计的方差的有偏估计。在大多数情况下,有0<r23<1,故,这即为不足拟合的主要含义。参数的方差估计的有偏性导致常规的置信区间和假设检验可能产生错误结论。进一步,基于设定误差模型进行预测和置信区间预测也是不可信的。2.包含一个不应包含的变量导致的设定误差所产生的后果为模型的过度拟合(overfittingamodel)

正确设定的模型为

Yi=b1+b2X2i+ui(13.10)

而估计的模型为Yi=a1+a2X2i+a3X3i+vi(13.11)

这种设定误差所产生的后果为a1、a2和a3的估计是无偏和一致的,即(b3在正确设定的模型中不出现即为0)。

ui的方差s2

也能正确估计常规的置信区间和假设检验有效但a1、a2和a3的估计不再有效也就是说,包含一个不相关的变量导致参数估计的精度降低

未加证明的经验:包含一个不相关变量比去掉了一个相关变量要好!但是包含一个不相关变量导致估计量的精度降低,还可能引起多重共线性等。因此最好的方法是,基于经济学理论或变量间的逻辑关系或已有的文献,模型仅包含那些直接影响应变量的解释变量,且这些解释变量还不应被模型所包含的其它解释变量所解释13.4.设定误差的检验

1.侦察模型包含了一个不应包含的变量对于一个多元模型

Yi=b1+b2X2i+…+bkXki+ui(13.12) 如果基于理论,没有充分的理由认为某个变量如X2应包含在模型中,此时可用显著性t检验对b2的显著性进行检验,如显著,可以不去掉。类似地问题如怀疑某2个(如X2i和X3i)或3个变量不应同时包括在模型中,可对联合原假设(如b2=b3=0)进行检验,拒绝原假设表明可以同时包含这2个变量。但是上述方法不宜逐步和反复地进行,如不宜对b3进行t检验,拒绝原假设而将X3i包含在模型中,进而对b4进行t检验,拒绝原假设再将X4i包含在模型中,这种过程称为数据采掘(Datamining)的建模方法,对这种方法的指责之一是因为这种数据采掘导致显著性水平扭曲,即数据采掘过程中的显著性水平(称为名义显著性水平,即常规的显著性水平a)与真正或实际的显著性水平不一致,可以证明,在C个变量中通过数据采掘选取了K(<C)个变量,则名义显著性水平与真实的显著性水平(a*)的关系为

a*=1-(1-a)C/K由此导致拒绝或接受原假设的结论可能是错误的,因此基于数据采掘最终所得到的模型也就不一定是正确设定的模型。2检验去掉了不应去掉的变量和错误的函数形式对残差进行考查

若模型是适宜的,残差应为纯随机的即ei~i.i.d.相反将导致残差出现明显的规则变化即存在自相关再用DW检验

运用DW检验设定误差一般应有基本的判断:即所估计的模型是否漏掉了重要的变量,导致残差的自相关说明具有设定误差。RamseyRESET(regressionspecificationerrortest)检验

以2元模型为例a.对此模型进行OLSb.考察(纵轴)与(横轴)的图形,以成本函数为例,线性模型估计为VariableCoefficientStd.Errort-StatisticProb.C166.466719.021428.7515370.0000x19.933333.0655806.5023050.0002R-squared0.840891

Meandependentvar276.1000AdjustedR-squared0.821002

S.D.dependentvar65.81363S.E.ofregression27.84451

Akaikeinfocriterion9.668005Sumsquaredresid6202.533

Schwarzcriterion9.728522Loglikelihood-46.34003

F-statistic42.27997Durbin-Watsonstat0.715725

Prob(F-statistic)0.000188图3.随

呈现曲线变化,所以进行下一步:c.增加的平方和立方项,即对此模型进行OLS,得到

对应的,记(13.13)的拟合优度为

(13.14)

VariableCoefficientStd.Errort-StatisticProb.C2140.215131.989316.215070.0000x476.552133.3908614.271930.0000xF2-0.0918650.006192-14.836800.0000XF30.0001197.46E-0615.896770.0000R-squared0.998339

Meandependentvar276.1000AdjustedR-squared0.997509

S.D.dependentvar65.81363S.E.ofregression3.284911

Akaikeinfocriterion5.505730Sumsquaredresid64.74382

Schwarzcriterion5.626764Loglikelihood-23.52865

F-statistic1202.220Durbin-Watsonstat2.700212

Prob(F-statistic)0.000000R2由0.84增加到0.998,但并不一定意味着这一增加就显著

d.构造F(13.15)

其中,K表示增加了新的变量的模型的参数个数,即(13.14)中参数个。计算F=280.41计算的F值显著,接受原假设(原始模型(13.13)为具有设定误差)。这一检验方便计算,但结论仅为原始模型为具有设定误差的模型,不表示新增了的平方和立方项的模型是适宜模型

如果模型漏掉了不应漏掉的一个或若干个变量,用LM检验可以检验模型具有设定误差(漏掉了不应漏掉的一个或若干个变量),从而应增补变量.LM检验思想为,将应该包含(但没有包含)的变量的模型看作是正确设定模型的约束模型(即将漏掉的变量的系数约束为0,如线性成本模型为立方成本模型的约束,即平方项和立方项约束为0),对约束模型进行回归的残差(即没有被漏掉变量所解释的部分)与漏掉的变量应相关,或漏掉的变量应能解释约束模型的残差,若如此,应增加漏掉的变量3.增补变量的LM检验例子:成本的立方模型(正确设定)Yi=b1+b2Xi+b3X2i+b4X3i+ui

线性成本模型Yi=b1+b2Xi+ui这是立方模型的约束回归,约束为b3=b4=0,回归结果如上,将残差对X1,X2和X3回归,有VariableCoefficientStd.Errort-StatisticProb.C-24.699966.375314-3.8743130.0082X43.544304.7786019.1123540.0001X2-12.961530.985663-13.150060.0000X30.9395880.05910615.896790.0000R-squared0.989562

Meandependentvar0.000000AdjustedR-squared0.984343

S.D.dependentvar26.25205S.E.ofregression3.284907

Akaikeinfocriterion5.505728Sumsquaredresid64.74366

Schwarzcriterion5.626762Loglikelihood-23.52864

F-statistic189.6028Durbin-Watsonstat2.700214

Prob(F-statistic)0.000002nRe2=10×0.989=9.896,拒绝原假设(约束模型为真)而应增补X2和X3作为回归因子

13.5观测误差

所谓观测误差是指,由于模型设定或某些特殊定义的变量的数据不能直接观测,需使用已有的相关数据而产生的误差应变量Y具有观测误差若以为持久消费支出,这是一个不可观测的的变量,而已有的基本生活费支出数据

可以大致度量它,但

的误差

e称为观测误差

假定这种观测误差为0均值和独立同分布,由于(13.16)

(13.17)而其中的X表示收入,假定扰动成立经典假设,且

即观测误差与模型的扰动无关,与X无关,则对(13.17)进行OLS能产生参数的线性无偏估计,但其方差不是最小。

解释变量的观测误差反之,若X有观测误差,即

Y表示无观测误差的消费支出.此时,

假定E(ui)=0,E(wi)=0,E(uiwi)=0,且E(uiX*i)=E(X*iwi)=0,所以E(ui-bwi)=0,进一步,有

(13.20)(13.18)(13.19)所以,模型(13.19)的残差与解释变量相关,故对(13.19)回归不可能获得无偏估计,进一步,也不可能获得一致估计13.6.随机项的不正确设定对于前述模型

Yi=bXiui

(13.6)

为正确的模型设定形式,其中随机误差项以相乘进入模型,且误差的对数lnui满足经典假设的条件.但若对

Yi=aXi+ui(13.7)进行估计,将产生有偏估计.13.7.嵌套(Nested)对非嵌套(Non-nested)模型嵌套模型对于模型A和B模型A:Yi=b1+b2X2i+b3X3i+b4X4i+b5X5i+ui

(13.8)模型B:Yi=b1+b2X2i+b3X3i+ui

(13.9)

由于模型B是由模型A在约束b4=b5=0之下的约束形式,也就是说,对A进行估计,用F检验b4=b5=0且不拒绝这一假设,则模型A简约为模型B.另一方面,若在B中增加X4i,且A也不拒绝b5=0,此时A简约为B.因此,模型B嵌套于A中.非嵌套模型

模型C:Yi=a1+a2X2i+a3X3i+vi(13.10)模型D:Yi=b1+b2Z2i+b3Z3i+ui

(13.11)其中X和Z是不同的解释变量,由于模型C和D互不能作为对方的约束形式表出,或者说C和D不是对方的约束形式,故C和D为(相互)

非嵌套模型.检验非嵌套模型a.辨识(discerning)分析---非嵌套F检验或兼(包)容(encompassing)的F检验.选取C还是D?为这一目的,构造模型F:Yi=b1+b2X2i+b3X3i+b4Z2i+b5Z3i+ui

(13.13)显然模型F嵌套(或包容)了模型C和D,但模型C和D互不嵌套.若模型C是正确设定的模型,应有H01:b4=b5=0;反之,若模型D是正确设定的模型,应有H02:b2=b3=0;所以对模型F估计并对联合原假设H01或H02进行F检验,即可实现在模型C和D中进行选择.D-M的J检验对于模型C和D,检验非嵌套可归结为在C和D中选取其中之一.为此,

对原假设H0:模型C为真,检验如下:步骤1:估计模型D,由此得到Y的估计YD;步骤2:将YD作为新的回归元,增加到模型C中,即

Yi=a1+a2X2i+a3X3i+a4Y

iD+ui(13.14)并对它进行回归;步骤3:对a4进行t检验,若接受假设a4=0,则接受原假设H0:模型C为真.若拒绝a4=0,则拒绝原假设模型C为真,模型C不真。若设定原假设H0:模型D为真,则从估计模型C开始,具体为:步骤1:估计模型C,由此得到Y的估计YC;步骤2:将YC作为新的回归元,增加到模型D中,即

Yi=b1+b2Z2i+b3Z3i+b4YC+vi(13.15)对此模型进行回归,并对b4=0进行t检验,接受b4=0则接受原假设H0,即模型D为真。拒绝b4=0则意味着模型D不真,因而在模型D和C中,可选C.J检验的问题:接受模型C也接受D,或者拒绝模型C也拒绝D,即同时接受或巨大变化时拒绝,所以没有明确结论。显然,当从C开始,接受a4=0,从模型D开始,又接受b4=0,由此有接受C也接受D,类似的也可能产生同时拒绝。若同时拒绝模型C和D,表明模型C和D不能很好地解释Y的行为,若同时接受模型C和D,正如Kmenta所说,数据还不足以在两个模型中进行判别。在上述J检验中,所使用的是t检验,对于大样本,t统计量渐近服从标准正态分布,所以对于小样本,J检验的检验势较低,导致J检验倾向于拒绝为真的假设13.8.选择模型常用的准则基于R2选取模型

存在的问题为:①R2所度量的是样本内的拟合优度,即给定的数据或样本对回归直线的拟合优度,因而不能保证对于样本外的点的拟合优度,换言之,预测精度不能得到保证;②在比较两个或多个模型的R2时,应变量必须相同③更为重要的是,增加变量将导致R2变大,至少不减,所以基于R2选取模型可能导致增加了不应增加的变量相比较而言,Ad-R2仅在所增加的变量的t值大于1时才导致它的增加,但比较多个模型的Ad-R2也要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论