第四节虚拟变量.ppt

上传人：q*** IP属地：江苏上传时间：2020-03-20 格式：PPT 页数：44 大小：524.50KB 积分：20 举报 版权申诉

已阅读5页，还剩39页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第四节虚拟变量模型一虚拟变量的基本含义四虚拟被解释变量二虚拟变量的引入三虚拟变量的设置原则一虚拟变量的基本含义许多经济变量是可以定量度量的如商品需求量价格收入产量等但也有一些影响经济变量的因素无法定量度量如职业性别对收入的影响战争自然灾害对GDP的影响季节对某些产品如冷饮销售的影响等等为了在模型中能够反映这些因素的影响并提高模型的精度需要将它们量化这种量化通常是通过引入虚拟变量来完成的根据这些因素的属性类型构造只取 0 或 1 的人工变量通常称为虚拟变量 dummyvariables 记为D 例如反映文程度的虚拟变量可取为 1 本科学历D 0 非本科学历一般地在虚拟变量的设置中基础类型肯定类型取值为1 比较类型否定类型取值为0 一虚拟变量 dummy 及其作用 1 定义反映品质指标变化数值只取0和1的人工变量用符号D来表示如城镇居民农村居民销售旺季销售淡季政策紧缩政策宽松本科以上学历本科以下学历变量的划分应遵循穷举与互斥原则 2 作用可以描述和测量定性因素的影响这是计量经济学研究的重点能够正确反映经济变量之间的相互关系提高模型的精度从经济意义上来说能够更好地解释现实经济现象便于处理异常数据当样本资料中存在异常数据时一般有三种处理方式一是在样本容量较大的情况下直接剔除异常数据二是用平均数等方式修匀异常数据三是设置虚拟变量即将异常数据作为一个特殊的定性因素异常时期正常时期二虚拟变量的设定 1 虚拟变量的引入方式在计量经济模型中设置虚拟变量可以采用两种方式加法方式和乘法方式 1 加法方式虚拟变量D与其他解释变量在模型中是相加关系 Yi a bxi Di i上式等价为当Di 0时 Yi a bxi i当Di 1时 Yi a bxi i 上图表明以加法方式引入虚拟变量反映定性因素对截距的影响也就是通过调整截距区分异常情况 2 乘法方式虚拟变量D与其他解释变量在模型中是相乘关系 Yi a bxi XDi i其中 XDi Xi Di 上式等价于当Di 0时 Yi a bxi i当Di 1时 Yi a b xi i 上图表明以乘法方式引入虚拟变量可反映定性因素对斜率的影响系数描述了定性因素的影响程度 3 一般方式同时用加法与乘法方式引入虚拟变量然后再利用t检验判断是否显著的不等于零进而确定虚拟变量的具体引入方式例教材P136表3 列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料在EViews软件的命令窗口中依次键入以下命令 CREATE 8建立工作文件DATA 输入需求量收入数据SCATXY绘制相关图操作演示从相关图可以看出前3个样本点即低收入家庭与后5个样本点即中高收入家庭的支出情况存在较大差异因此为了反映收入层次这一定性因素的影响设置虚拟变量将我国城镇居民的彩电需求函数设成 Yi a bxi Di XDi i同时引入加法和乘法方法再进行t检验 DATAD1输入虚拟变量的值前三个为0 后五个为1 由于D是EViews软件的保留字所以将虚拟变量取名为D1 另外此时也可以用SMPL和GENR命令直接生成D1变量 GE RXD X D1生成变量XDLS D1XD估计需求函数结果如下图所示中高收入家庭低收入家庭我国城镇居民彩电需求函数的估计结果为对应的t统计量值 R2的值调整的R2值 SE的值的t检验都是显著的表明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求在截距和斜率上都存在着明显差异各自的需求函数为低收入家庭事实上现阶段我国城镇居民中高收入家庭的彩电普及率已达到百分之百所以对彩电的消费需求处于更新换代阶段此例说明了三个问题如何设置和在模型中引入虚拟变量如何测量定性因素即收入层次的影响如何区分不同类型的模型即需求函数中高收入家庭 2 虚拟变量的设置原则一个因素多个类型对于有m个不同属性的定性因素应该设置m 1个虚拟变量来反映该因素的影响例设公司职员的年薪与工龄和学历有关学历分成三种类型大专以下本科研究生为了反映学历这个定性因素的影响应该设置两个虚拟变量而将年薪模型取成假设以加法方式引入 Yi a bxi 1D1i 2D2i i 本科其他研究生其他其等价于 Yi a bxi i大专以下 D1 D2 0 Yi a 1 bxi i本科 D1 1 D2 0 Yi a 2 bxi i研究生 D1 0 D2 1 上图直观地描述了三类年薪函数的差异情况通过检验 1 2的显著性可以判断学历层次对职员的年薪是否有显著影响 2 多个因素各两种类型如果有m个定性因素且每个因素各有两个不同的属性类型则引入m个虚拟变量例如研究居民住房消费函数时考虑到城乡的差异以及不同收入层次的影响将消费函数取成 Yi a bxi 1D1i 2D2i i其中y x分别是居民住房消费支出和可支配收入虚拟变量这样可以反映各类居民家庭的住房消费情况农村居民城镇居民高收入家庭低收入家庭城市低收入家庭 D1 0 D2 0 Yi a bxi i城市高收入家庭 D1 0 D2 1 Yi a 2 bxi i农村低收入家庭 D1 1 D2 0 Yi a 1 bxi i农村高收入家庭 D1 1 D2 1 Yi a 1 2 bxi i推广到更一般的情况如果有些因素有多个属性水平则参照一个因素多种类型的设置原则来设置虚拟变量另外定性因素的变化通常表现为某种属性或特征是否存在所以可以用只取1 0值的虚拟变量来量化定性因素的变化一般地 1 表示这种属性或特征存在 0 表示这种属性或特征不存在 1 调整季节波动利用季节或月份资料建立模型时经常存在着季节波动使用虚拟变量可以反映季节因素的影响例如利用季度数据分析某公司利润y与销售收入x之间的相互关系时为研究四个季度的季节性影响引入三个虚拟变量设第1季度为基础类型取利润函数为 Yi a bxi 1D1i 2D2i 3D3i i则系数a 1 2 3分别反映了一二三四季度对利润的平均影响程度根据这些系数的t检验可以判断季节因素对利润是否显著影响第i 1季度i 1 2 3其他季度 2 检验模型结构的稳定性模型结构的稳定性检验主要有两个用途一是分析模型结构对样本变化的敏感性如多重共线性检验二是比较两个或多个回归模型之间的差异情况即分析模型结构是否发生了显著变化设根据两个样本估计的回归模型分别为样本1 Yi a1 b1xi i样本2 Yi a2 b2xi i设置虚拟变量估计以下模型 Yi a1 b1xi a2 a1 Di b2 b1 XDi i其中 XDi xi Di 样本2样本1 利用t检验判断D XD系数的显著性可以得到四种检验结果 1 两个系数均等于零即a2 a1 b2 b1 表明两个回归模型之间没有显著差异称之为重合回归 2 D的系数不等于零 XD的系数等于零即a2 a1 b2 b1 表明两个回归模型之间的差异仅仅表现在截距上称之为平行回归 3 D的系数等于零 XD的系数不等于零即a2 a1 b2 b1 表明两个回归模型的截距相同但斜率存在显著差异称之为汇合回归 4 D XD的系数均不等于零即a2 a1 b2 b1 表明两个回归模型完全不同称之为相异回归第 1 种情况下模型结构是稳定的其余情况都表明模型结构不稳定 3 分段回归有些经济关系需要用分段回归加以描述当解释变量x低于某个已知的临界水平x 时 y与x之间是某种线性相关关系而x x 时又是另一种相关关系利用虚拟变量可以很好地解决分段回归问题取虚拟变量为分段回归模型设置成 Yi a bxi xi x Di i其中 x 是已知的临界水平这样各段的函数为 Yi a bxi ixx x x x x 使用虚拟变量既能如实描述不同阶段的经济关系又未减少估计模型时样本容量保证了模型的估计精度 4 混合回归建立计量经济模型时有时能同时获得变量的时序数据和横截面数据只要模型参数不随时间而改变并且在各个横截面之间没有差异就可以使用混合样本估计模型因此在合并样本之前需在比较使用不同样本估计的模型之间是否有显著差异例8 教材P143表3 9为我国城镇居民1998年 1999年全年人均消费支出和可支配收入的统计资料试使用混合样本数据估计我国城镇居民消费函数设1998年 1999年我国城镇居民消费函数分别为 1998年 Yi a1 b1xi i1999年 Yi a2 b2xi i 为比较两年的消费函数是否有显著差异设置虚拟变量并且合并两年的数据估计以下模型 Yi a1 b1xi Di XDi i其中 a2 a1 b2 b1 使用EViews软件的估计过程如下 CREATEU16建立工作文件DATAYX 输入1998 1999年消费支出和收入的数据 1 8期为1998年资料 9 16期为1999年资料 1999年1998年 SMPL18样本期调为1998年 GENRD1 0输入虚拟变量的值SMPL916样本期调为1999年GENRD1 1输入虚拟变量的值SMPL116样本期调至1998 1999年GENRXD X D1生成XD的值LSYCXD1XD利用混合样本估计模型估计结果为操作演示根据t检验 D XD的回归系数均不显著即认为 a2 a1 0 b2 b1 0 这表明1998年 1999年我国城镇居民消费函数并没有显著差异因此可以将两年的样本数据合并成一个样本估计城镇居民的消费函数对应t统计量的值 R2的值调整的R2值练习题 1 简述虚拟变量的引入方式及其影响 2 设置虚拟变量时应遵守哪些原则 3 虚拟变量有哪些特殊应用概念同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析 analysis ofvariance ANOVA 模型一个以性别为虚拟变量考察企业职工薪金的模型其中 Yi为企业职工的薪金 Xi为工龄 Di 1 若是男性 Di 0 若是女性二虚拟变量的引入虚拟变量做为解释变量引入模型有两种基本方式加法方式和乘法方式企业男职工的平均薪金为上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式在该模型中如果仍假定E i 0 则企业女职工的平均薪金为 1 加法方式几何意义假定 2 0 则两个函数有相同的斜率但有不同的截距意即男女职工平均薪金对教龄的变化率是一样的但两者的平均薪金水平相差 2 可以通过传统的回归检验对 2的统计显著性进行检验以判断企业男女职工的平均薪金水平是否有显著差异 0 2 又例在横截面数据基础上考虑个人保健支出对个人收入和教育水平的回归教育水平考虑三个层次高中以下高中大学及其以上模型可设定如下这时需要引入两个虚拟变量在E i 0的初始假定下高中以下高中大学及其以上教育水平下个人保健支出的函数高中以下高中大学及其以上假定 3 2 其几何意义还可将多个虚拟变量引入模型中以考察多种定性因素的影响如在上述职工薪金的例中再引入代表学历的虚拟变量D2 x工龄 D1性别本科及以上学历本科以下学历职工薪金的回归模型可设计为女职工本科以下学历的平均薪金女职工本科以上学历的平均薪金于是不同性别不同学历职工的平均薪金分别为男职工本科以下学历的平均薪金男职工本科以上学历的平均薪金 2 乘法方式加法方式引入虚拟变量考察截距的不同许多情况下往往是斜率也有变化或斜率截距同时发生变化斜率的变化可通过以乘法的方式引入虚拟变量来测度例根据消费理论消费水平C主要取决于收入水平Y 但在一个较长的时期人们的消费倾向会发生变化尤其是在自然灾害战争等反常年份消费倾向往往出现变化这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察这里虚拟变量D以与X相乘的方式引入了模型中从而可用来考察消费倾向的变化假定E i 0 上述模型所表示的函数可化为正常年份反常年份如设消费模型可建立如下当截距与斜率发生变化时则需要同时引入加法与乘法形式的虚拟变量例考察1990年前后的中国居民的总储蓄收入关系是否已发生变化下表中给出了中国1979 2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据以Y为储蓄 X为收入可令 1990年前 Yi 1 2Xi 1ii 1 2 n11990年后 Yi 1 2Xi 2ii 1 2 n2则有可能出现下述四种情况中的一种 1 1 1 且 2 2 即两个回归相同称为重合回归 CoincidentRegressions 2 1 1 但 2 2 即两个回归的差异仅在其截距称为平行回归 ParallelRegressions 3 1 1 但 2 2 即两个回归的差异仅在其斜率称为汇合回归 ConcurrentRegressions 4 1 1 且 2 2 即两个回归完全不同称为相异回归 DissimilarRegressions 可以运用邹氏结构的稳定性检验这一问题也可通过引入乘法形式的虚拟变量来解决将n1与n2次观察值合并并用以估计以下回归 Di为引入的虚拟变量于是有可分别表示1990年后期与前期的储蓄函数在统计检验中如果 4 0的假设被拒绝则说明两个时期中储蓄函数的斜率不同具体的回归结果为由 3与 4的t检验可知参数显著地不等于0 强烈示出两个时期的回归是相异的储蓄函数分别为 3 临界指标的

人人文库> 全部分类> 应用文书 > 项目管理

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第四节虚拟变量.ppt

文档简介

温馨提示

最新文档

评论

第四节 虚拟变量.ppt

文档简介

温馨提示

最新文档

评论

相关文档

第四节虚拟变量.ppt