模型选择标准与检验新_第1页
模型选择标准与检验新_第2页
模型选择标准与检验新_第3页
模型选择标准与检验新_第4页
模型选择标准与检验新_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模型选择标准与检验新第一页,共三十二页,2022年,8月28日2/13/2023虚拟变量的常见应用描述不同类型(如:不同“性别”的人食品消费支出是否存在差异)的数量规律定性因素间的交互作用如例:“黑人女性”是否受到双重歧视多种类别的定性变量(如:美国不同地区研究生接受率差异)控制时间特征季节虚拟变量年份虚拟变量,长期的序列分为二、三段制度效应:“国八条”房地产调控政策影响效应第二页,共三十二页,2022年,8月28日2/13/2023第六章复习要点多分类定性变量引入虚拟变量的一般原则差别截距系数(加法引入虚拟变量参数估计值)、差别斜率系数(乘法引入虚拟变量参数估计值)的含义回归结果分析:具体参见书后练习题重点6.6,6.7,6.11,6.13,6.16,6.20,6.21,6.22,6.27,6.28第三页,共三十二页,2022年,8月28日2/13/2023基本假定违背:不满足基本假定的情况。(1)模型设定有偏误;所选模型是正确设定的(2)解释变量之间存在多重共线性;(3)随机误差项序列存在异方差性;(4)随机误差项序列存在序列相关性。所选模型是正确设定的解释变量之间不存在完全线性关系误差项方差为常数误差项之间不相关基本假定基本假定基本假定基本假定第四页,共三十二页,2022年,8月28日第七章模型选择:标准与检验7.1"好的"模型具有的性质7.2设定误差的类型7.3遗漏相关解释变量的模型:过低拟合模型7.4引入不相关解释变量模型:过度拟合模型7.5不正确的函数形式7.6变量的度量误差7.7模型设定误差的检验第五页,共三十二页,2022年,8月28日7.1“好的”模型具有的性质简约性可识别性拟合优度理论一致性预测能力模型是对现实的抽象,模型应尽可能简洁即能够用少数解释变量能够说明一个被解释变量就不要用多个解释变量每个参数只有一个估计值对样本数据的拟合程度较好参数估计值的符号与经济理论相符预测值与经验值检验模型的有效性,即具有良好的预测能力第六页,共三十二页,2022年,8月28日7.2设定误差的类型:四个遗漏相关变量采用了错误的函数形式变量的度量误差引入无关变量请注意:实践中的模型设定误差可能源于上述一个或多个原因。第七页,共三十二页,2022年,8月28日对所研究问题的相关理论了解不深未关注本领域前期的研究成果在研究中缺乏相关数据数据测量时有误差设定误差产生的原因第八页,共三十二页,2022年,8月28日

采用遗漏相关变量的模型进行估计而带来的误差称为遗漏相关变量误差

设正确的模型为

Y=B1+B2X1+B3X2+却错误设定为:

Y=A1+A2X1+v7.3遗漏相关变量第九页,共三十二页,2022年,8月28日遗漏解释变量将产生如下后果:

(1)如果漏掉的X2与X1相关,使得遗漏变量的模型的最小二乘估计量是有偏的。即不仅代表了x1对被解释变量的直接影响,还代表了对被解释变量的间接影响(经由x2)。简言之,本应由x2对被解释变量的影响确体现在x1上。第四章之4.9设定误差,分析了古钟拍卖价格与钟表年代、竞标人数的回归,(见P83)(2)错误模型的参数估计量也是不一致的,即参数估计值的均值与其理论值不相等。(3)如果X2与X1不相关,则遗漏变量的模型的估计量满足无偏性与一致性。(4)错误模型的随机误差项方差是真实随机误差方差的有偏估计第十页,共三十二页,2022年,8月28日(5)错误模型的斜率系数方差也是有偏估计。

(6)通常的置信区间和假设检验过程不再可靠,置信区间会变宽,会更频繁接受零假设。第十一页,共三十二页,2022年,8月28日2/13/2023举例:婴儿死亡率的决定因素被解释变量:婴儿死亡率(CM)解释变量:人均国民收入PGNP;女性识字率FLR正确模型:上述三个变量模型(CM对PGNP、FLR回归)错误模型:遗漏FLR变量的两个变量模型(CM对PGNP回归)结论:不包含女性识字率的双变量模型,错误之处:不仅忽略了遗漏变量“女性识字率”对婴儿死亡率的影响,而且,也忽略了女性识字率对人均国民收入的影响。因此,错误模型中的解释变量PGNP,就担负起遗漏变量“女性识字率”对被解释变量(CM)的影响,从而无法表现出PGNP对CM的真实的影响。提示:在建立计量经济模型时,需要对所研究现象所蕴含的经济理论做深入了解,目的是把相关变量都引入模型中。第十二页,共三十二页,2022年,8月28日2/13/2023包含无关变量偏误:采用包含无关解释变量的模型进行估计带来的偏误。

设Y=0+1X1+v

(*)

为正确模型,但却估计了错误的模型:

Y=0+1X1+2X2+(**)

如果2=0,则(**)与(*)相同,因此,可将(**)式视为以2=0为约束的(*)式的特殊形式。即P86,第四章所介绍的“受限最小二乘”7.4包含无关变量:过度拟合模型第十三页,共三十二页,2022年,8月28日用OLS法估计模型Y=0+1X1+2X2+由于所有的经典假设都满足,因此

:(1)OLS估计量无偏的,也是一致的(4)但是,引入多余解释变量的模型的OLS估计量无效,不具有最小方差性(2)从错误的回归方程中,得到的方差估计量是正确的(3)置信区间和假设检验仍然是有效的OLS估计量是线性无偏估计量,但非最优,不再有效。小结:第十四页,共三十二页,2022年,8月28日例7-2:举例说明第六章中的6.5:食品支出模型被解释变量:食品支出解释变量:税后收入(x),“性别”(采用加法引入和乘法引入两个变量(D、DX)模型:回归结果:t=(5.765)(7.376)(-0.194)(-0.485)第十五页,共三十二页,2022年,8月28日2/13/2023结论前面的模型中引入了差别截距、差别斜率变量的虚拟变量模型,由于D、DX参数估计值都不显著,而引入虚拟变量D的差别截距模型(6-9)的虚拟变量系数显著,表明,差别斜率虚拟变量DX很可能属于多余的。也就是说,食品支出模型中,正确的引入解释变量,应该是定量变量:税后收入X,虚拟变量D食品支出模型引入虚拟变量D,表明:男女食品支出的平均水平(截距)存在差异,但男女食品支出的变化率(斜率)无差异。第十六页,共三十二页,2022年,8月28日2/13/2023

当选取了错误函数形式并对其进行估计时,带来的偏误称错误函数形式偏误

容易判断,这种偏误所估计的模型参数估计量是有偏估计。

例如,如果“真实”的回归函数为生产函数却估计线性式:

显然,两者的参数具有完全不同的经济含义,且估计结果一般也是不相同的。

7.5错误函数形式第十七页,共三十二页,2022年,8月28日例7-3:举例说明被解释变量:美国进出口商品支出解释变量:个人可支配收入(PDI)、年份(Year)线性回归模型与对数回归模型所得到的参数估计值含义是完全不同的,(详细解释见教材第170页)第十八页,共三十二页,2022年,8月28日2/13/20237.6度量误差应变量中的度量误差引起的后果不太严重。解释变量中的度量误差引起的后果非常严重。建议使用工具变量或替代变量:与原始变量X高度相关,但与回归误差项无关,且不存在度量误差。若不同时期变量的定义不同,则需要确保数据的可比性。实践中的建议:确保解释变量(X)的数据尽可能准确,不免除记录、舍入和遗漏误差。第十九页,共三十二页,2022年,8月28日模型设定偏误的后果

模型设定出现误差时,模型估计结果会与“实际”有偏差。这种偏差的性质与程度与模型设定误差的类型密切相关。第二十页,共三十二页,2022年,8月28日7.7模型设定误差的检验

7.7.1检验是否含有无关变量

可用t检验与F检验完成。检验的基本思想:如果模型中误选了无关变量,则其系数的真值应为零。因此,只须对无关变量系数的显著性进行检验。

t检验:检验某1个变量是否应包括在模型中;

F检验:检验若干个变量是否应同时包括在模型中(建议:F检验可以采用受限最小二乘,可以回答多个变量是否包含在模型中)。第二十一页,共三十二页,2022年,8月28日

7.7.2对遗漏相关变量或函数形式设定偏误的检验

(1)残差图示法第二十二页,共三十二页,2022年,8月28日

残差序列变化图(a)趋势变化:模型设定时可能遗漏了一随着时间的推移而持续上升的变量

(b)循环变化:模型设定时可能遗漏了一随着时间的推移而呈现循环变化的变量

第二十三页,共三十二页,2022年,8月28日(c)

模型函数形式设定偏误时残差序列呈现正负交替变化

图示:一元回归模型中,真实模型呈幂函数形式,但却选取了线性函数进行回归。

第二十四页,共三十二页,2022年,8月28日7.7.3在线性模型和对数模型之间选择:MWD检验H0:线性模型:Y是X的线性函数H1:对数线性模型:Y是X(或LnX)的线性函数估计线性模型,得到Y的拟合值估计对数线性模型,得到LnY的拟合值做Y对X和Z1的回归做LnY对X(或LnX)和Z2的回归对Z1的系数进行变量的显著性检验,若显著,则拒绝H0对Z2的系数进行变量的显著性检验,若显著,则拒绝H1第二十五页,共三十二页,2022年,8月28日例P176:因为Z1的系数显著,则拒绝H0:假设真实的进口支出函数是线性的。因为Z2的系数显著,则拒绝H1:假设真实的进口支出函数是对数线性的。根据上述结果,本例中两个模型都是合理的。第二十六页,共三十二页,2022年,8月28日

7.7.4一般性设定偏误检验

但更准确更常用的判定方法是拉姆齐(Ramsey)于1969年提出的所谓RESET检验(regressionerrorspecificationtest)。

基本思想:

如果事先知道遗漏了哪个变量,只需将此变量引入模型,估计并检验其参数是否显著不为零即可;问题是不知道遗漏了哪个变量,需寻找一个替代变量Z,来进行上述检验。

RESET检验中,采用所设定模型中被解释变量Y的估计值Ŷ的若干次幂来充当该“替代”变量。

第二十七页,共三十二页,2022年,8月28日(1)估计。先估计原始模型得到拟合值。(4)检验和判断。若仅增加一个“替代”变量,可采用t检验;若增加多个“替代”变量,可采用“受限最小二乘”的F检验。(2)观察残差与拟合值的关系,决定引入拟合值的若干次幂进入模型作为“替代变量”。(3)再估计。估计引入了“替代变量”的新模型。拉齐姆检验(RESET检验)第二十八页,共三十二页,2022年,8月28日RESET检验评价优点:简单易行。缺陷:可用于判断模型设定是否错误,却不能帮助我们选择正确模型。因此,该检验主要是诊断工具。第二十九页,共三十二页,2022年,8月28日

例:对商品进口进行研究,估计了中国商品进口M与GDP的关系,然而,由于仅用GDP来解释商品进口的变化,明显地遗漏了诸如商品进口价格、汇率等其他影响因素。在此,采用RESET检验考察建模时是否遗漏了重要的相关变量。(1)用原回归模型估计出商品进口序列

R2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论