版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第8章模型中的特殊解释变量虚拟变量(dummyvariable)主要内容一、为什么引入虚拟变量二、用虚拟变量测量截距变动三、测量斜率变动四、分段线性回归2一、为什么引入虚拟变量1.定量解释变量诸如前几章介绍的,可以在取值范围内连续取值的解释变量,称作定量解释变量。如:人均收入,农产品收购量,等。2.定性变量如性别、民族、国籍、战争、自然灾害和政治体制等,只表示某种特征的存在与不存在,称作定性变量。3一、为什么引入虚拟变量建立回归模型的过程中,被解释变量不仅受定量解释变量影响,有时还受一些诸如如性别、民族、国籍、战争、自然灾害和政治体制等定性变量的影响。因此,当这些定性变量对被解释变量产生影响时,当然也应该包括在回归模型中。4一、为什么引入虚拟变量3.如何将定性变量引入模型由于定性变量通常表示的是某种特征或属性是否存在,如男性、女性,城市户口、非城市户口等,所以量化方法可采用取值为0或1。可以用1表示该属性存在,0表示该属性不存在(也可相反)。5一、为什么引入虚拟变量4.虚拟变量上述这种取值为0或1的变量称作虚拟变量,用D(Dummy)表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。
当一个定性变量含有m个类别时,应向模型引入m-1个虚拟变量。
6一、为什么引入虚拟变量比如“性别”含男性与女性两个类别,所以当“性别”作解释变量时,应向模型引入一个虚拟变量。取值方式是:
(男性)(女性)(女性)(男性)或7一、为什么引入虚拟变量
再例如,定性变量“学历”还有四个类别,即大学学历、中学学历、小学学历和无学历。当“学历”作解释变量时,应向模型引入(4-1)三个虚拟变量,一种取值方式是:(大学学历)(非大学学历)(小学学历)(非小学学历)(中学学历)(非中学学历)8一、为什么引入虚拟变量5.虚拟变量注意事项(1)当定性变量含有m个类别时,模型不能引入m个虚拟变量。否则在虚拟变量间会产生完全多重共线性,无法估计回归参数。例如:一年四季,取m=4个虚拟变量。截距项对应的单位向量等于D1+D2+D3+D4。即出现完全多重共线性。tβ0D1D2D3D41995.1110001995.2101001995.3100101995.4100011996.1110001996.2101001996.3100101996.4100011997.11
10009一、为什么引入虚拟变量(2)把虚拟变量取值为0所对应的类别称作基础类别。例如:按上面对“学历”的赋值方法,“无学历”为基础类别。(3)当定性变量含有m个类别时,不能把虚拟变量的值设成如下形式:(第一个类别)(第二个类别)(第m个类别)这种赋值法在一般情形下与虚拟变量赋值是完全不同的两回事。10一、为什什么引入入虚拟变变量(4)回归模模型可以以只用虚虚拟变量量作解释释变量,,也可以以用定量量变量和和虚拟变变量一起起作解释释变量。。11二、用虚虚拟变量量测量截截距变动动下面给出出的模型型都属于于测量截截距变动动的模型型。以上面第第二个模模型为例例,D=1、0时,回归归函数分分别是(D=1)(D=0)由此可见见,向模模型引入入虚拟变变量,其其数学意意义就是是回归函函数截距距项发生生变化。。对虚拟变变量的系系数作显显著性检检验,就就是判别别两条回回归直线线的截距距项是否否存在显显著性差差异。12二、用虚虚拟变量量测量截截距变动动例8.3随机调查查美国旧旧金山地地区20个家庭的的储蓄情情况,拟拟建立年年储蓄额额Yi(千美元)对年收入入Xi(千美元)的回归模模型。上部的6个样本点点,都是是自己有有房的家家庭。下部的14个样本点点,都是是租房住住的家庭庭。这两类家家庭所对对应的样样本观测测点各自自都表现现出明显显的不同同的线性性关系。。13二、用虚拟变变量测量截距距变动为研究不同住住房状况家庭庭的储蓄情况况,引入定性性变量“住房房状况”,用用D表示。虚拟变量D定义如下:建立回归模型型:(有房户)(租房户)Y—年储蓄额Y(千美元)X—年收入(千美元)D—住房状况14二、用虚拟变变量测量截距距变动因为D不能作为Eviews的用户变量名名,所以虚拟拟变量的名称称取D1。15二、用虚拟变变量测量截距距变动由于虚拟变量量D的回归系数显显著地不为零零,说明对住住房状况不同同的两类家庭庭来说,回归归函数截距项项确实明显不不同。(因为D不能作为Eviews的用户变量名名,所以取D1)16二、用虚拟变变量测量截距距变动当模型不引入入虚拟变量““住房状况””时,得回归归方程如下:比较上述两个个回归方程的的统计检验指指标,说明该该回归模型引引入虚拟变量量非常必要。。17二、用虚拟变变量测量截距距变动引入虚拟变量量后,不同住住房状况的居居民的储蓄明明显具有不同同的截距:(1)D=1时,即对于有有房户(2)D=0时,即对于租租房户18二、用虚拟变变量测量截距距变动例8.4季节影响“季节”是在研研究经济问题题中常常遇到到的定性因素素。比如,酒酒、肉的销量量在冬季要超超过其他季节节,而饮料的的销量又以夏夏季为最大。。当建立这类类问题的计量量模型时,就就要考虑把““季节”因素素引入模型。。由于一年有四四个季节,所所以这是一个个含有四个类类别的定性变变量。应该向向模型引入3个虚拟变量。。19二、用虚拟变变量测量截距距变动研究,1982年第1季度至1988年第4季度全国按按季节市场场用煤销售售量,时间间序列图如如下20二、用虚拟拟变量测量量截距变动动从上图看出出,煤销售售量随季节节不同呈明明显的周期期性变化。。给出三个个虚拟变量量,设:(第四季度)(其他季度)(第二季度)(其他季度)(第三季度)(其他季度)这里是以第第一季度为为基础类别别,也可以以选其他季季度为基础础类别。设模型为::21二、用虚拟拟变量测量量截距变动动1982年第1季度取t=1,估计模型型参数给定显著性性水平α=0.05,D2、D3的系数没有有显著性,,说明第二二、三季度度可以归并并入基础类类别第一季季度。22二、用虚拟拟变量测量量截距变动动现在考虑只只加入一个个虚拟变量量D1,把季节因因素分为第第四季度和和第一、二二、三季度度两类。(第四季度)(其他季度)这里第一、、二、三季季度为基础础类23二、用虚拟拟变量测量量截距变动动第四季度用用煤量:第一、二、、三季度用用煤量:24三、测量斜斜率变动用虚拟变量量还可以考考察回归函函数的斜率率是否发生生变化,来来分析不同同“类型””的不同斜斜率。方法是在模模型中加入入定量变量量与虚拟变变量的乘积积项:设模模型型如如下下按β2、β3是否否为为零零,,回回归归函函数数可可有有如如下下四四种种形形式式::25三、、测测量量斜斜率率变变动动截距距、、斜斜率率同同时时发发生生变变化化的的两两种种情情形形::26三、、测测量量斜斜率率变变动动例2:利利用用中中国国进进出出口口贸贸易易总总额额数数据据((1950-1984)。。试试检检验验改改革革前前后后该该时时间间序序列列的的斜斜率率是是否否发发生生变变化化。。定义义虚虚拟拟变变量量D如下下::从图图中中观观察察到到,,改改革革开开放放前前后后的的散散点点斜斜率率确确实实不不同同,,所所以以可可以以用用虚虚拟拟变变量量进进行行测测度度。。1978年27三、、测测量量斜斜率率变变动动模型型的的数数学学形形式式::以时时间间time为解解释释变变量量,,进进出出口口贸贸易易总总额额用用trade表示示::Eviews先中中生生成成解解释释变变量量time和虚虚拟拟变变量量D的乘乘积积::genrtimeD=time*D1(因因为为D不能能作作为为Eviews的用用户户变变量量名名,,所所以以取取D1)28三、、测测量量斜斜率率变变动动29三、、测测量量斜斜率率变变动动还有有虚虚拟拟变变量量的的两两项项都都是是显显著著的的,,所所以以上式式说说明明,,改改革革前前后后无无论论截截距距和和斜斜率率都都发发生生了了变变化化。。进出出口口贸贸易易总总额额的的年年平平均均增增长长量量((斜斜率率))扩扩大大了了17倍。。30四、、分分段段线线性性回回归归当在在模模型型中中使使用用虚虚拟拟变变量量时时,,回回归归函函数数就就不不再再是是连连续续的的了了,,分分段段线线性性回回归归可可以以既既使使用用虚虚拟拟变变量量描描述述出出模模型型结结构构变变化化,,又又可可以以使使回回归归函函数数保保持持连连续续,,其其中中每每一一段段都都是是线线性性的的。。31四、分分段线线性回回归考虑下下面的的模型型其中Xb1表示结结构发发生变变化的的t=b1时刻的的Xt的值。。当D1=0时,当D1=1时,其中Xt=Xb1时,两两个式式子相相等。。尽管两两个子子时段段回归归函数数不同同,但但是在在结构构发生生突变变的那那一刻刻,两两个子子时段段回归归函数数是连连续的的。32四、分分段线线性回回归如果回回归函函数在在两个个时刻刻t=b1,b2,(b1<b2)发生生结构构变化化时,,定义义两个个虚拟拟变量量如下下:其中t=1,2,3,……,T,相应的的分段段线性性回归归模型型为::33四、分分段线线性回回归三个直直线段段的回回归函函数分分别是是:34四、分分段线线性回回归例8.6中国货币币流通量量。对数数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心血管内科护理制度
- 器材管理制度
- 11.3全等三角形判定SAS课件
- 2024年黄山考客运从业资格证考试题目
- 吉首大学《复变函数》2021-2022学年第一学期期末试卷
- 重庆市2023-2024学年高三年级上册期中考试英语试题(含答案)
- 吉林艺术学院《电视节目策划》2021-2022学年第一学期期末试卷
- 协议书范文离婚书范本模板
- 2024年大棚种植蔬菜回收合同范本
- 肉鸡养殖场收购协议书范文模板
- 企业风险分析表格
- 公安派出所建筑外观形象设计规范1
- 产品标识控制程序文件
- (施工方案)双梁桥式起重机安装施工方案
- 提高内镜中心内镜洗消合格率PDCA
- DBJ∕T13-354-2021 既有房屋结构安全隐患排查技术标准
- 建设工程质量管理手册
- 调机品管理规定
- 园长思想政治鉴定范文(5篇)
- 质量管理体系文件分类与编号规定
- 2022年工程项目技术管理人员批评与自我批评
评论
0/150
提交评论