第10章 设定误差与模型选择(计量经济学-中南财经政法大学,向书坚)_第1页
第10章 设定误差与模型选择(计量经济学-中南财经政法大学,向书坚)_第2页
第10章 设定误差与模型选择(计量经济学-中南财经政法大学,向书坚)_第3页
第10章 设定误差与模型选择(计量经济学-中南财经政法大学,向书坚)_第4页
第10章 设定误差与模型选择(计量经济学-中南财经政法大学,向书坚)_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章设定误差与模型选择1第10章设定误差与模型选择1、计量经济建模的传统观点:平均经济回归2、设定误差类型3、设定误差的后果4、设定误差的检验5、观测误差2§10.1计量经济建模的传统观点被称为平均经济回归(AER)建模思想是:从含有一定个数的回归元的一个模型开始,经过诊断,然后把越来越多的变量加到模型中来。(从简单到复杂)注意与后面韩德瑞的建模思想进行比较。韩的建模思想是由一般到简单,即由尽可能多变量进行约化,直到最后几个能通过检验的变量。(从一般到简单)3AER方法建模所所需遵循的准则:节省性;以实用为标准,模型尽可能简单识别性;同一参数必须有一个确定的估计值拟合优度;拟合优度是评价模型好坏的标准之一理论一致性;正确的系数符号,以保证模型能给出合理的经济意义上的解释。预测功效。预测是计量经济模型一个很重要的功能。注意:大并不能保证模型有好的预测精度返回4§10.2设定误差的类型以立方总成本函数为例来说明。①漏掉一个变量:

误差项可以看做:②包含无关变量:误差项可以看做:

5③错误的函数形式:因变量以对数的形式出现在模型中。④测量误差:

其中,,

都是测量误差返回6§10.3设定误差的后果1、漏掉一个有关变量为了避免使用矩阵代数,选用一个只有两个自变量的模型来说明。真实模型:如用下述模型拟合,将漏掉,其后果(1)如果与相关,则,是的有偏非一致估计。即无论样本容量有多大,7(2)即便与不相关,此时仍是有偏的,则是无偏。怎么理解上面两点?先看两个模型的系数估计表达式。在真实模型中这里小写字母表示对应变量的离差,例如:

8在误设模型中再看第二条中的结论:我们只分析,如果与不相关,那么,即9也就是。因此。对于,可以自己验证。其实只要清楚系数估计量的表达式,对上述两条结论的验证应该比较容易。(3)随机误差项的方差无法正确估计,致使参数估计量的检验无法得出正确的结论。即

t检验失效102、包含无关变量真实模型误设模型后果:(1)参数的ols估计量性质都还不错。,,。,置信区间和假设检验仍然有效。(2)的估计量是非有效的,即11对于第二点的解释:由ols所估计的结果有

故所以12两种设定误差的后果比较:遗漏有关变量。参数估计量有偏非一致,随机误差项的方差估计亦不正确,致使区间估计和假设检验都得不到正确的结论。包含无关变量。参数估计量无偏且一致,随机误差项的方差估计量为非有效的估计量,参数的统计推断精度降低。因此,不能简单认为与其略掉有关变量不如含有无关变量。

返回13§10.4设定误差的检验§10.4.1对多余变量的侦查假定为了解释某一现象而建立一个k变量的模型:对于是否属于模型,一个简单的办法是作t检验,即是否显著。这种思路在实际中很不可取,因为这样就意味着凡是参数检验不显著的变量都被排除在模型之外,显著的就包含在模型中。而不去考虑这些变量的舍取是否有理论上的依据。14§10.4.2名义与真实的显著水平如果真实模型中有c个变量,而在建立模型时只选取了k个变量作回归。那么原先确定的显著水平并不能反应参数的真实显著水平。真实显著水平和名义显著水平有如下关系:可以近似为:取,和,由上式可以计算出真实的显著水平。15§10.4.3对遗漏变量和不正确的函数形式的检验1、残差分析(仍然以前面的立方总成本函数为例)如果用二次函数拟合又或者用线性函数拟合16三个模型的残差图(图13.1)172、使用D.W.统计量。

模型D.W.值残差类型线性成本函数D.W.=0.716正相关二次成本函数D.W.=1.038无法确定立方成本函数D.W.=2.70无自相关18用DW检验侦察模型设定误差的步骤:1、从假定的模型求得OLS残差2、如果认为假定模型中遗漏了自变量(Z),则将残差按Z的大小排列,Z变量可以是自变量X之一或X的某个函数(X2)3、从这样排列的残差计算d统计量4、查DW表,如果d值显著,即可接受模型误设的假设。

193、拉姆齐(Ramsey)的RESET检验以成本函数为例并假定成本函数对产出是线性。RESET检验的步骤:(1)从上述模型得到的估计值。(2)将作为增补自变量引入,重新做回归,由残差可以发现与之间有曲线关系,因此重新引入和作为增补自变量,再做回归:20(3)以*式的为;原线性模型的为,然后进行F检验。(4)如果F值在给定的水平上显著,就可以认为原先线性模型假设是错误的。下面看一个具体的例子〖资料来源:教材P204表7.4〗212223以我们刚才所举的例子,用已有的数据可得出如下结果:进行F检验求得24F值高度显著,因此原模型为误设模型。这与残差图表现和D.W.检验的结果一致。RESET检验的优点:不用设立对立模型,简单易用。缺点是:即使知道模型是误设的,也无法寻找出更优的模型。2526274、为增补变量的拉格朗日乘数(LM)检验继续用前面的例子来说明。线性成本函数立方成本函数(1)式相比(2)式而言,前者是后者的受约束形式。假定平方和立方产出项的系数均为零。28LM检验的步骤:

(1)用OLS估计(1)式并求出残差。(2)如果(2)式是真实回归,则用对所有自变量做回归:其中满足一般假定。(3)对于大样本而言,恩格尔曾经证明,从辅助回归估计出的的n(样本大小)倍遵循自由度等于受约束回归中的约束个数的分布,即在本例中约束个数为2,这里的asy表示渐近地服从(4)如果所计算的值大于显著性水平的临界值,就拒绝受限回归;否则不予拒绝。29在本例中,回归结果如下:同时根据该模型所得残差做辅助回归,得如下结果:3031本例中样本容量只有10,这里只是为了说明LM的操作方法。,这里=0.01,即在1%的水平上显著。这样就得出了与RESET检验类似的结论,即拒绝线性模型,接受立方模型。返回32§10.5观测误差前面的分析我们都一直没有关注或者说承认变量存在观测误差,在现实中观测误差确实存在。观测误差应变量存在观测误差自变量存在观测误差参数估计值是无偏的,但非有效出现随机解释变量。参数估计有偏、非有效、非一致。331、应变量Y中的观测误差考虑以下模型:(Ⅰ)其中应变量表示永久消费支出;自变量表示当前收入;不可直接观察,可利用这样一个观测变量于是原模型变为:(Ⅱ)如果随机误差项都满足经典假定,则对两个模型都有34但由于两个模型的标准差已不相同,因此的方差亦不相同。模型Ⅰ中:模型Ⅱ中:这些结论推倒可以参考相应章节的附录。

352、解释变量X中的观测误差对前面的模型略作改动:其中表示当前消费支出表示永久收入假如观测到的不是,而是:这样模型变为:

36不妨假定有零均值,序列独立且与不相关,我们却不能假定与,因为

与相关产生的后果极为严重,使得对参数的估计失去意义。37进一步讨论会发现有如下结论:上式是指依概率1收敛于因此即便样本容量再大,都是有偏估计。通常的补救措施是工具变量法。可是工具变量法理论完美,不易操作。在实际中要找到一个合适的变量作为工具变量是不容易的38一个例子具体数据见书上463页表13.2。仅有应变量Y有观测误差真实消费函数用代替,得到:39变量说明:,是真实值;是观测值。当X中有观测误差时前面真实回归已知,现在不用而用得如下结果:结果与理论一致,估计系数有偏误,不过偏误还比较小。最后还有一种情形是自变量和应变量同时都有观测误差,会有什么结果出现?可以通过已有的数据去做回归,观察结果。返回40

§10.6模型选择1、利莫尔的模型选择方法2、韩德瑞的模型选择方法3、诊断性检验选讲:总评4、非嵌套假设的检验5、要点与结论41§10.6.1利莫尔的模型选择方法利莫尔认为模型设定探索的六种理由:搜寻类型 目的1、假设检验 选出“真”模型2、阐明性 解释涉及多个相关变量的数据3、简化 为造出一个“有成效”的模型4、代理变量 在测量同一变量的多种测量方法之间进行选择5、数据选择 为估计和预测而选取适当数据6、数据后模型构建 为改进现有模型42为了说明上述搜寻理由的含义,下面将用一个例子对每一个搜寻程序进行演示。例子来源于利莫尔本人对商品的需求理论的检验探索。模型假定其他条件不变,对商品需求量依赖于消费者的收入和该商品的价格。另立计量经济学的基本思想:建模的重点是选择一个合适的模型而不是确定模型后对其进行估计。43利用150户家庭的数据,建立一个如下的线性模型:其中Y表示橙子的购买量,I表示货币收入,P表示橙子的价格模型是否真的是一个线性模型,现在对此不作定论然后逐步进行前面说列的六种搜寻程序44(1)假设检验搜寻假如研究者意欲检验价格弹性是-1的假设,以此为约束,估算出如下的受约束回归:利用F检验,拒绝价格弹性是-1的原假设。45(2)数据选择搜寻考虑橙子也许在阳光不足的地区有最大的营养价值,把数据分成两个组,进行分组回归。一个对北方人,一个对南方人。得如下结果在5%的显著水平上,收入和价格系数均不相同的假设不予拒绝。46(3)代理变量搜寻如果相信总开支E也许比货币收入I更能代表收入的一种衡量,于是用E代替I并得以下结果:收入变量(代理)E的系数变得更为显著,而且也已增大。47(4)阐明性搜寻注意到上面几个回归结果的值均低,考虑把替代品比如葡萄的价格(GP)加进需求函数,于是重新估计得到下面的结果:增大一些,但是价格系数通不过检验,商品自身价格的系数没有合理的经济解释48(5)数据变化后模型重建继续考虑需求理论中无货币幻觉这一齐次性公设。齐次公设是指收入和价格同一比例变化,购买就不改变。在该约束条件下重新估计模型。价格变量有正确的符号,收入和自身价格都统计上显著。葡萄价格仍不显著。49货币幻觉是指人们只看到名义货币量的变动而看不见货币的购买力的变动,即只看到货币名义价值的变化而看不到货币实际价值的变动。货币幻觉在通货膨胀时期尤为明显。即工资上涨幅度低于通货膨胀率时,实际工资是在下降的。50(6)简化搜寻由于在前面的分析中,葡萄价格统计上不显著,而且收入和自身价格的系数差别不大,因此最后估计得以下模型:简化搜寻的目的在于得到一个简单、经济又有用的模型51利莫尔的端界分析(Extremeboundanalysis)假设回归模型中有两类变量,一类是主要变量;另一类是次要变量对主要变量作回归分析时,是否包括次要的自变量就会有不同组合通过不同组合的回归,每一个主要变量的系数就会有若干个估计值,估计值的最小值和最大值构成一个区间,且相应为端界如果这个区间小,则认为数据对所研究的系数产生了相当坚实的信息(稳健估计量,RobustStatistic)如果区间大,则断定数据对所研究的系数产生了脆弱的估计52假设影响工资的因素包括(1)教育E、年龄A、智商IQ〖主要变量〗(2)父母教育PE、父母智商PIQ〖次要变量〗①工资对E、A、IQ回归;②工资对E、A、IQ、PE回归③工资对E、A、IQ、PIQ回归④工资对E、A、IQ、PE、PIQ回归这样,E、A、IQ的系数都有四个估计值。如果E的系数的四个估计值落在一个小区间内,则表明E系数对模型中是否包含次要变量不敏感,认为数据给出了E系数的一个稳健估计如何确定主要变量和次要变量,不是一件很容易的事情喔!53§10.6.2

韩德瑞的模型选择方法LSE(韩德瑞或伦敦经济学院)的经济建模方法:一个代表数据生成过程的自回归分布滞后模型的逐步约化,得到一个具有长期稳定关系的简单模型。韩德瑞简化模型的六条准则:1、数据所允许。2、与理论相一致。3、回归元必须是弱外生。4、显示参数的恒定性。5、显示数据的协调性。6、兼容性。54§10.6.3

诊断性检验概述1、嵌套模型模型A:模型B:如果估计模型A,然后检验假设,并且不拒绝它,那么模型B就嵌套在模型A中。2、非嵌套模型模型C:模型D:

由于X和Z代表不同变量,因此把模型C和D称之为非嵌套模型。显然这两个模型不能相互推导。55§10.6.3

非嵌套假设检验对非嵌套模型的检验主要有两大类:(1)判别方法(2)辨识方法判别方法的核心思想就是通过拟合优度(调整以后的判定系数)来选择模型,我们知道拟合优度在很多情况下不能很好的说明模型的好坏的。因此这种方法也存在很多弊端。56辨识方法常用的有非嵌套F检验。不妨假定有如下模型E:该模型包含了模型C和D,但C和D互不嵌套。因此属于非嵌套模型。非嵌套F检验就是要检验模型E的系数显著性,看和是否为零。如果模型C正确,则;如果模型D正确,则。具体操作步骤与普通F检验无异。57非嵌套F检验存在的问题:(1)变量之间存在共线性可能使和都不能拒绝零假设。从而无法决定哪个是正确模型。(2)参考假设的选择干扰模型的选择。如果以模型C作为参考模型,把加到模型中,通过F检验发现它对解释平方和的增补贡献不显著,于是决定选择C模型。但是同样的事情可能发生在选择模型D作为参考模型的情形下,这时非嵌套F检验无助于作出正确的选择。(3)假定的嵌套模型E也许没有任何经济意义。58一个例子:关于名义GDP的变化是由货币供给的变化来解释还是由政府支出的变化来解释?考虑如下模型:其中=t时刻的名义GDP增长率=t时刻货币供给增长率=t时刻充分或高就业政府支出增长率59将两个模型揉合在一起:估计结果如下表:根据上面估计的结果,是否能认为货币主义的模型就一定优于凯恩斯主义的模型呢?这是个值得思考的问题系数估计值0.400.410.250.06-0.051.060.080.060.00-0.06-0.070.03t值2.965.262.140.71-0.375.592.262.250.02-2.20-1.810.4060戴维森-麦金农J检验由于非嵌套F检验在实际应用中存在一些问题,因此人们提出了其他的检验,如戴维森-麦金农J、检验Cox检验、JA检验等。下面主要介绍戴维森-麦金农检验。其步骤如下:1、估计模型D并得到Y的估计值。2、将1中的估计值作为增补回归元代入模型C中,并估计以下模型:613、用t检验对假设进行检验。4、如果不拒绝原假设,则认为模型C为真模型,反之则不认为模型C是真模型。代表不被模型C所含有的变量的影响,而这种影响并没有增加模型C原有的解释能力。换言之,D模型不含有足以改进模型C的任何额外信息。故模型C兼容了模型D。5、用同样的方法把模型C和D颠倒,重复步骤4以决定是否认为模型D胜过模型C。62戴维森-麦金农J检验虽然理论上更完备,但同样存在“两难”抉择,即出现同时拒绝和同时接受。另外用t统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论