第四节 虚拟变量.ppt_第1页
第四节 虚拟变量.ppt_第2页
第四节 虚拟变量.ppt_第3页
第四节 虚拟变量.ppt_第4页
第四节 虚拟变量.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四节虚拟变量模型 一 虚拟变量的基本含义 四 虚拟被解释变量 二 虚拟变量的引入 三 虚拟变量的设置原则 一 虚拟变量的基本含义 许多经济变量是可以定量度量的 如 商品需求量 价格 收入 产量等但也有一些影响经济变量的因素无法定量度量 如 职业 性别对收入的影响 战争 自然灾害对GDP的影响 季节对某些产品 如冷饮 销售的影响等等 为了在模型中能够反映这些因素的影响 并提高模型的精度 需要将它们 量化 这种 量化 通常是通过引入 虚拟变量 来完成的 根据这些因素的属性类型 构造只取 0 或 1 的人工变量 通常称为虚拟变量 dummyvariables 记为D 例如 反映文程度的虚拟变量可取为 1 本科学历D 0 非本科学历 一般地 在虚拟变量的设置中 基础类型 肯定类型取值为1 比较类型 否定类型取值为0 一 虚拟变量 dummy 及其作用 1 定义 反映品质指标变化 数值只取0和1的人工变量 用符号D来表示 如 城镇居民农村居民 销售旺季销售淡季 政策紧缩政策宽松 本科以上学历本科以下学历 变量的划分应遵循穷举与互斥原则 2 作用 可以描述和测量定性因素的影响 这是计量经济学研究的重点 能够正确反映经济变量之间的相互关系 提高模型的精度 从经济意义上来说 能够更好地解释现实经济现象 便于处理异常数据 当样本资料中存在异常数据时 一般有三种处理方式 一是在样本容量较大的情况下直接剔除异常数据 二是用平均数等方式修匀异常数据 三是设置虚拟变量 即将异常数据作为一个特殊的定性因素 异常时期正常时期 二 虚拟变量的设定 1 虚拟变量的引入方式 在计量经济模型中设置虚拟变量可以采用两种方式 加法方式和乘法方式 1 加法方式虚拟变量D与其他解释变量在模型中是相加关系 Yi a bxi Di i上式等价为 当Di 0时 Yi a bxi i当Di 1时 Yi a bxi i 上图表明 以加法方式引入虚拟变量 反映定性因素对截距的影响 也就是通过调整截距区分异常情况 2 乘法方式 虚拟变量D与其他解释变量在模型中是相乘关系 Yi a bxi XDi i其中 XDi Xi Di 上式等价于 当Di 0时 Yi a bxi i当Di 1时 Yi a b xi i 上图表明 以乘法方式引入虚拟变量 可反映定性因素对斜率的影响 系数 描述了定性因素的影响程度 3 一般方式同时用加法与乘法方式引入虚拟变量 然后再利用t检验判断 是否显著的不等于零 进而确定虚拟变量的具体引入方式 例 教材P136表3 列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料 在EViews软件的命令窗口中依次键入以下命令 CREATE 8建立工作文件DATA 输入需求量 收入数据SCATXY绘制相关图操作演示 从相关图可以看出 前3个样本点 即低收入家庭 与后5个样本点 即中 高收入家庭 的支出情况存在较大差异 因此 为了反映 收入层次 这一定性因素的影响 设置虚拟变量 将我国城镇居民的彩电需求函数设成 Yi a bxi Di XDi i同时引入加法和乘法方法 再进行t检验 DATAD1输入虚拟变量的值 前三个为0 后五个为1 由于D是EViews软件的保留字 所以将虚拟变量取名为D1 另外 此时也可以用SMPL和GENR命令直接生成D1变量 GE RXD X D1生成变量XDLS D1XD估计需求函数结果如下图所示 中高收入家庭低收入家庭 我国城镇居民彩电需求函数的估计结果为 对应的t统计量值 R2的值 调整的R2值 SE的值 的t检验都是显著的 表明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求 在截距和斜率上都存在着明显差异 各自的需求函数为 低收入家庭 事实上 现阶段我国城镇居民中高收入家庭的彩电普及率已达到百分之百 所以对彩电的消费需求处于更新换代阶段 此例说明了三个问题 如何设置和在模型中引入虚拟变量 如何测量定性因素 即收入层次 的影响 如何区分不同类型的模型 即需求函数 中高收入家庭 2 虚拟变量的设置原则 一个因素多个类型对于有m个不同属性的定性因素 应该设置m 1个虚拟变量来反映该因素的影响 例 设公司职员的年薪与工龄和学历有关 学历分成三种类型 大专以下 本科 研究生 为了反映 学历 这个定性因素的影响 应该设置两个虚拟变量 而将年薪模型取成 假设以加法方式引入 Yi a bxi 1D1i 2D2i i 本科其他 研究生其他 其等价于 Yi a bxi i大专以下 D1 D2 0 Yi a 1 bxi i本科 D1 1 D2 0 Yi a 2 bxi i研究生 D1 0 D2 1 上图直观地描述了三类年薪函数的差异情况 通过检验 1 2的显著性 可以判断学历层次对职员的年薪是否有显著影响 2 多个因素各两种类型 如果有m个定性因素 且每个因素各有两个不同的属性类型 则引入m个虚拟变量 例如 研究居民住房消费函数时 考虑到城乡的差异以及不同收入层次的影响 将消费函数取成 Yi a bxi 1D1i 2D2i i其中y x分别是居民住房消费支出和可支配收入 虚拟变量 这样可以反映各类居民家庭的住房消费情况 农村居民城镇居民 高收入家庭低收入家庭 城市低收入家庭 D1 0 D2 0 Yi a bxi i城市高收入家庭 D1 0 D2 1 Yi a 2 bxi i农村低收入家庭 D1 1 D2 0 Yi a 1 bxi i农村高收入家庭 D1 1 D2 1 Yi a 1 2 bxi i推广到更一般的情况 如果有些因素有多个属性水平 则参照 一个因素多种类型 的设置原则来设置虚拟变量 另外 定性因素的变化通常表现为某种属性或特征是否存在 所以可以用只取1 0值的虚拟变量来 量化 定性因素的变化 一般地 1 表示这种属性或特征存在 0 表示这种属性或特征不存在 1 调整季节波动利用季节或月份资料建立模型时 经常存在着季节波动 使用虚拟变量可以反映季节因素的影响 例如 利用季度数据分析某公司利润y与销售收入x之间的相互关系时 为研究四个季度的季节性影响 引入三个虚拟变量 设第1季度为基础类型 取利润函数为 Yi a bxi 1D1i 2D2i 3D3i i则系数a 1 2 3分别反映了一 二 三 四季度对利润的平均影响程度 根据这些系数的t检验可以判断季节因素对利润是否显著影响 第i 1季度i 1 2 3其他季度 2 检验模型结构的稳定性 模型结构的稳定性检验主要有两个用途 一是分析模型结构对样本变化的敏感性 如多重共线性检验 二是比较两个 或多个 回归模型之间的差异情况 即分析模型结构是否发生了显著变化 设根据两个样本估计的回归模型分别为 样本1 Yi a1 b1xi i样本2 Yi a2 b2xi i设置虚拟变量 估计以下模型 Yi a1 b1xi a2 a1 Di b2 b1 XDi i其中 XDi xi Di 样本2样本1 利用t检验判断D XD系数的显著性 可以得到四种检验结果 1 两个系数均等于零 即a2 a1 b2 b1 表明两个回归模型之间没有显著差异 称之为 重合回归 2 D的系数不等于零 XD的系数等于零 即a2 a1 b2 b1 表明两个回归模型之间的差异仅仅表现在截距上 称之为 平行回归 3 D的系数等于零 XD的系数不等于零 即a2 a1 b2 b1 表明两个回归模型的截距相同 但斜率存在显著差异 称之为 汇合回归 4 D XD的系数均不等于零 即a2 a1 b2 b1 表明两个回归模型完全不同 称之为 相异回归 第 1 种情况下模型结构是稳定的 其余情况都表明模型结构不稳定 3 分段回归 有些经济关系需要用分段回归加以描述 当解释变量x低于某个已知的临界水平x 时 y与x之间是某种线性相关关系 而x x 时又是另一种相关关系 利用虚拟变量可以很好地解决分段回归问题 取虚拟变量为 分段回归模型设置成 Yi a bxi xi x Di i其中 x 是已知的临界水平 这样各段的函数为 Yi a bxi ixx x x x x 使用虚拟变量既能如实描述不同阶段的经济关系 又未减少估计模型时样本容量 保证了模型的估计精度 4 混合回归 建立计量经济模型时 有时能同时获得变量的时序数据和横截面数据 只要模型参数不随时间而改变 并且在各个横截面之间没有差异 就可以使用混合样本估计模型 因此 在合并样本之前 需在比较使用不同样本估计的模型之间是否有显著差异 例8 教材P143表3 9为我国城镇居民1998年 1999年全年人均消费支出和可支配收入的统计资料 试使用混合样本数据估计我国城镇居民消费函数 设1998年 1999年我国城镇居民消费函数分别为 1998年 Yi a1 b1xi i1999年 Yi a2 b2xi i 为比较两年的消费函数是否有显著差异 设置虚拟变量 并且合并两年的数据 估计以下模型 Yi a1 b1xi Di XDi i其中 a2 a1 b2 b1 使用EViews软件的估计过程如下 CREATEU16建立工作文件DATAYX 输入1998 1999年消费支出和收入的数据 1 8期为1998年资料 9 16期为1999年资料 1999年1998年 SMPL18样本期调为1998年 GENRD1 0输入虚拟变量的值SMPL916样本期调为1999年GENRD1 1输入虚拟变量的值SMPL116样本期调至1998 1999年GENRXD X D1生成XD的值LSYCXD1XD利用混合样本估计模型估计结果为 操作演示 根据t检验 D XD的回归系数均不显著 即认为 a2 a1 0 b2 b1 0 这表明1998年 1999年我国城镇居民消费函数并没有显著差异 因此 可以将两年的样本数据合并成一个样本 估计城镇居民的消费函数 对应t统计量的值 R2的值 调整的R2值 练习题 1 简述虚拟变量的引入方式及其影响 2 设置虚拟变量时应遵守哪些原则 3 虚拟变量有哪些特殊应用 概念 同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析 analysis ofvariance ANOVA 模型 一个以性别为虚拟变量考察企业职工薪金的模型 其中 Yi为企业职工的薪金 Xi为工龄 Di 1 若是男性 Di 0 若是女性 二 虚拟变量的引入 虚拟变量做为解释变量引入模型有两种基本方式 加法方式和乘法方式 企业男职工的平均薪金为 上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式 在该模型中 如果仍假定E i 0 则企业女职工的平均薪金为 1 加法方式 几何意义 假定 2 0 则两个函数有相同的斜率 但有不同的截距 意即 男女职工平均薪金对教龄的变化率是一样的 但两者的平均薪金水平相差 2 可以通过传统的回归检验 对 2的统计显著性进行检验 以判断企业男女职工的平均薪金水平是否有显著差异 0 2 又例 在横截面数据基础上 考虑个人保健支出对个人收入和教育水平的回归 教育水平考虑三个层次 高中以下 高中 大学及其以上 模型可设定如下 这时需要引入两个虚拟变量 在E i 0的初始假定下 高中以下 高中 大学及其以上教育水平下个人保健支出的函数 高中以下 高中 大学及其以上 假定 3 2 其几何意义 还可将多个虚拟变量引入模型中以考察多种 定性 因素的影响 如在上述职工薪金的例中 再引入代表学历的虚拟变量D2 x工龄 D1性别 本科及以上学历本科以下学历 职工薪金的回归模型可设计为 女职工本科以下学历的平均薪金 女职工本科以上学历的平均薪金 于是 不同性别 不同学历职工的平均薪金分别为 男职工本科以下学历的平均薪金 男职工本科以上学历的平均薪金 2 乘法方式 加法方式引入虚拟变量 考察 截距的不同 许多情况下 往往是斜率也有变化 或斜率 截距同时发生变化 斜率的变化可通过以乘法的方式引入虚拟变量来测度 例 根据消费理论 消费水平C主要取决于收入水平Y 但在一个较长的时期 人们的消费倾向会发生变化 尤其是在自然灾害 战争等反常年份 消费倾向往往出现变化 这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察 这里 虚拟变量D以与X相乘的方式引入了模型中 从而可用来考察消费倾向的变化 假定E i 0 上述模型所表示的函数可化为 正常年份 反常年份 如 设 消费模型可建立如下 当截距与斜率发生变化时 则需要同时引入加法与乘法形式的虚拟变量 例 考察1990年前后的中国居民的总储蓄 收入关系是否已发生变化 下表中给出了中国1979 2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据 以Y为储蓄 X为收入 可令 1990年前 Yi 1 2Xi 1ii 1 2 n11990年后 Yi 1 2Xi 2ii 1 2 n2则有可能出现下述四种情况中的一种 1 1 1 且 2 2 即两个回归相同 称为重合回归 CoincidentRegressions 2 1 1 但 2 2 即两个回归的差异仅在其截距 称为平行回归 ParallelRegressions 3 1 1 但 2 2 即两个回归的差异仅在其斜率 称为汇合回归 ConcurrentRegressions 4 1 1 且 2 2 即两个回归完全不同 称为相异回归 DissimilarRegressions 可以运用邹氏结构的稳定性检验 这一问题也可通过引入乘法形式的虚拟变量来解决 将n1与n2次观察值合并 并用以估计以下回归 Di为引入的虚拟变量 于是有 可分别表示1990年后期与前期的储蓄函数 在统计检验中 如果 4 0的假设被拒绝 则说明两个时期中储蓄函数的斜率不同 具体的回归结果为 由 3与 4的t检验可知 参数显著地不等于0 强烈示出两个时期的回归是相异的 储蓄函数分别为 3 临界指标的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论