




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模型中的特殊解释变量虚拟变量经济第一页,共十六页,编辑于2023年,星期日
8.3虚拟变量(重点掌握)
许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响;战争、自然灾害对GDP的影响;季节对某些产品(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。第二页,共十六页,编辑于2023年,星期日这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummyvariables),记为D。例如,反映文程度的虚拟变量可取为:1,本科学历D=0,非本科学历第三页,共十六页,编辑于2023年,星期日注意:(1)当定性变量含有m个类别时,模型不能引入m个虚拟变量。最多只能引入m-1个虚拟变量,否则当模型中存在截距项时就会产生完全多重共线性,无法估计回归参数。(2)把虚拟变量取值为0所对应的类别称作基础类别。(3)当定性变量含有m个类别时,不能把虚拟变量的值设成如下形式。这种赋值法在一般情形下与虚拟变量赋值是完全不同的两回事。(4)回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起做解释变量。第四页,共十六页,编辑于2023年,星期日
(第3版教材第189页)1.用虚拟变量测量截距变动设有模型,
yt=0+1xt+2D+ut,其中yt,xt为定量变量;D为定性变量。当D=0或1时,上述模型可表达为,D=1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若2显著不为零,说明截距不同;若2为零,说明这种分类无显著性差异。D=1
D=000+2第五页,共十六页,编辑于2023年,星期日例8.3随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额Yi(千美元)对年收入Xi(千美元)的回归模型。通过对样本点的分析发现,居于上部的6个点(用小圆圈表示)都是代表自己有房子的家庭;居于下部的14个点(用小三角表示)都是租房住的家庭。而这两类家庭所对应的观测点各自都表现出明显的线性关系。于是给模型加入一个定性变量“住房状况”,用D表示。定义如下:(第3版教材第189页)第六页,共十六页,编辑于2023年,星期日例8.3建立回归模型Yi
=0+1
Xi+2
Di
+ut
得估计结果如下,=-0.3204+0.0675Xt+0.8273Di
(-5.2)(16.9)(11.0)R2=0.99,DW=2.27由于回归系数0.8273显著地不为零,说明对住房状况不同的两类家庭来说,回归函数截距项确实明显不同。当模型不引入虚拟变量“住房状况”时,得回归方程如下,=-0.5667+0.0963Xi
(-3.5)(11.6)R2=0.88,
DW=1.85比较回归方程,前者的确定系数为0.99,后者的确定系数仅为0.88。说明该回归模型中引入虚拟变量非常必要。(第3版教材第190页)第七页,共十六页,编辑于2023年,星期日
“季节”是在研究经济问题中常常遇到的定性因素。比如,酒,肉的销量在冬季要超过其它季节,而饮料的销量又以夏季为最大。当建立这类问题的计量模型时,就要考虑把“季节”因素引入模型。由于一年有四个季节,所以这是一个含有四个类别的定性变量。应该向模型引入三个虚拟变量。
例8.4市场用煤销售量模型。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下:第八页,共十六页,编辑于2023年,星期日
(第2版第224页)(第3版第192页)以时间t为解释变量(1982年1季度取t=1)的煤销售量(Yi)模型估计结果如下:
=2431.20+49.00t+1388.09D1+201.84D2+85.00D3
(26.04)(10.81)(13.43)(1.96)(0.83)
R2=0.95,DW=1.2,F=100.4,T=28,t0.05(28-5)
=2.07由于D2,D3的系数没有显著性,说明第二、三季度可以归并入基础类别第一季度。于是只考虑加入一个虚拟变量D1,把季节因素分为第四季度和第一、二、三季度两类。从上式中剔除虚拟变量D2,D3,得煤销售量(Yi)模型如下:
=2515.86+49.73t+1290.91D1
(32.03(10.63)(14.79)R2=0.94,DW=1.4,F=184.9,T=28,t0.05(25)=2.06这里第一、二、三季度为基础类别。例8.4第九页,共十六页,编辑于2023年,星期日(第2版第224页)(第3版第192页)2.测量斜率变动以上介绍了用虚拟变量测量回归函数的截距变化。实际上,也可以用虚拟变量考察回归函数的斜率是否发生变化。方法是在模型中加入定量变量与虚拟变量的乘积项。设模型如下,Yi
=0+1Xi
+2Di
+3(XiDi)+ui
按2,3是否为零,回归函数可有如下四种形式。E(Yi)=0+1Xi,(当2=3=0)E(Yi)=(
0+2)+(
1+3)Xi,(当20,30)E(Yi)=0+(1+3)Xi,(当2=0,
30)E(Yi)=(0+2)+
1Xi,(当
20,
3=0)截距、斜率同时发生变化的两种情形见图。
3.分段线性回归(不讲)第十页,共十六页,编辑于2023年,星期日
例8.5
中国进出口贸易总额序列(1950~1984年)如图。试检验改革开放前后该时间序列的斜率是否发生变化。定义虚拟变量D如下,
以时间time为解释变量,进出口贸易总额用trade表示,估计结果如下,
=0.2818+0.0746time-35.8809D+1.2559timeD(1.35)(6.2)(-8.4)(9.6)
上式说明,改革开放前后相比无论截距和斜率都发生了变化。进出口贸易总额的年平均增长量扩大了近17倍。(第2版第226页)(第3版第194页)第十一页,共十六页,编辑于2023年,星期日补充案例:香港季节GDP数据(千亿港元)的拟合(file:dummy6)1990~1997年香港季度GDP呈线性增长。1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,1998~2002年底GDP总量几乎没有增长(见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简单地用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期,定义季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量DT如下,第十二页,共十六页,编辑于2023年,星期日得估计结果如下:=1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4+1.8338DT-0.0654DTt(50.8)(64.6)(3.7)(9.9)(11.0)(19.9)(-28.0)
R2=0.99,DW=0.9,s.e.=0.05,F=1198.4,T=52,t0.05(52-7)
=2.01对于1990:1~1997:4=1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4对于1998:1~2002:4=2.9911+0.0014t+0.0775D2+0.2098D3+0.2349D4例3:香港季节GDP数据(千亿港元)的拟合(file:dummy6)第十三页,共十六页,编辑于2023年,星期日
如果不采用虚拟变量拟合效果将很差。=1.6952+0.0377t(20.6)(13.9)R2=0.80,DW=0.3,T=52,t0.05(52-2)
=2.01补充案例:香港季节GDP数据的拟合第十四页,共十六页,编辑于2023年,星期日
8.4时间变量以时间变量t作解释变量。估计与检验方法与定量解释变量Xt相同。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 热学基础知识介绍
- 针灸推拿与创新创业大赛
- 床垫批发业务购销合同
- 幼儿教师必知的礼仪规范
- 农业种植管理服务合同
- 注塑培训资料
- 机械制造加工企业安全手册
- 联合营销计划合同书
- 劳务分包合同安全协议
- 雷雨安全教育主题班会
- 2022年郑州轨道工程职业学院单招职业适应性测试试题及答案解析
- 接触网验收标准
- 地铁16号线风阀设备安装手册
- 新《危险化学品安全管理条例》课件
- 中医科物理治疗登记表
- 高山下的花环
- 中医望色望神图集共59张课件
- 《跋傅给事帖》2020年浙江嘉兴中考文言文阅读真题(含答案与翻译)
- 物业小区保洁清洁方案
- 银行从业资格考试题库附参考答案(共791题精心整理)
- 年产20吨阿齐沙坦原料药生产车间的设计和实现材料学专业
评论
0/150
提交评论