




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章虚拟变量回归 一 虚拟变量的基本含义二 虚拟变量的引入三 虚拟变量的设置原则 1 一 虚拟变量的基本含义 许多经济变量是可以定量度量的 如 商品需求量 价格 收入 产量等但也有一些影响经济变量的因素无法定量度量 如 职业 性别对收入的影响 战争 自然灾害对GDP的影响 季节对某些产品 如冷饮 销售的影响等等 为了在模型中能够反映这些因素的影响 并提高模型的精度 需要将它们 量化 2 四種测量的分类模式 定量的 定性的 连续的or定距的interval 离散的 次序的ordinal 名义的nominal 分类变量 这种 量化 通常是通过引入 虚拟变量 来完成的 根据这些因素的属性类型 构造只取 0 或 1 的人工变量 通常称为虚拟变量 dummyvariables 记为D 例如 反映文程度的虚拟变量可取为 1 本科学历D 0 非本科学历 一般地 在虚拟变量的设置中 基础类型 肯定类型取值为1 比较类型 否定类型取值为0 4 概念 同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析 analysis ofvariance ANOVA 模型 一个以性别为虚拟变量考察企业职工薪金的模型 其中 Yi为企业职工的薪金 Xi为工龄 Di 1 若是男性 Di 0 若是女性 5 二 虚拟变量的引入 虚拟变量做为解释变量引入模型有两种基本方式 加法方式和乘法方式 企业男职工的平均薪金为 上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式 1 加法方式 6 企业女职工的平均薪金为 几何意义 假定 2 0 则两个函数有相同的斜率 但有不同的截距 意即 男女职工平均薪金对工龄的变化率是一样的 但两者的平均薪金水平相差 2 可以通过传统的回归检验 对 2的统计显著性进行检验 以判断企业男女职工的平均薪金水平是否有显著差异 0 2 7 例题6 1 男女食品支出和税后收入的关系 P134 6 4 被解释变量 食品支出 解释变量 性别 6 9 被解释变量 食品支出 解释变量 税后收入 性别 8 6 23 被解释变量 食品支出 解释变量 税后收入 性别 税后收入 性别 9 1 分别写出 6 4 6 9 的估计方程 2 进一步写出男性 女性的估计方程 3 根据估计结果 解释偏回归系数含义 DependentVariable YVariableCoefficientStd Errort StatisticProb C3176 833233 044613 631870 0000SEX 503 1667329 5749 1 5267140 1578R squared0 189026 6 4 被解释变量 食品支出 解释变量 性别 DependentVariable YVariableCoefficientStd Errort StatisticProb C2673 667233 044611 472770 0000SEX2503 1667329 57491 5267140 1578R squared0 189026 性别赋值 男性 1 女性 0 性别赋值 男性 0 女性 1 10 DependentVariable YVariableCoefficientStd Errort StatisticProb C1506 244188 00968 0115290 0000INCOME0 0589820 0061179 6417450 0000SEX 228 9868107 0582 2 1388990 0611R squared0 928418 6 9 被解释变量 食品支出 解释变量 税后收入 性别 11 例2 在横截面数据基础上 考虑个人保健支出对个人收入和教育水平的回归 教育水平考虑三个层次 高中以下 高中 大学及其以上 模型可设定如下 这时需要引入两个虚拟变量 12 在E i 0的初始假定下 高中以下 高中 大学及其以上教育水平下个人保健支出的函数 高中以下 高中 大学及其以上 假定 3 2 其几何意义 13 可将多个虚拟变量引入模型中以考察多种 定性 因素的影响 例4 如在上述职工薪金的例中 再引入代表学历的虚拟变量D2 本科及以上学历本科以下学历 职工薪金的回归模型可设计为 14 男性女性 女职工本科以下学历的平均薪金 女职工本科以上学历的平均薪金 于是 不同性别 不同学历职工的平均薪金分别为 男职工本科以下学历的平均薪金 男职工本科以上学历的平均薪金 15 2 乘法方式 加法方式引入虚拟变量 考察 截距的不同 许多情况下 往往是斜率就有变化 或斜率 截距同时发生变化 斜率的变化可通过以乘法的方式引入虚拟变量来测度 16 17 例5 根据消费理论 消费水平C主要取决于收入水平Y 但在一个较长的时期 人们的消费倾向会发生变化 尤其是在自然灾害 战争等反常年份 消费倾向往往出现变化 这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察 这里 虚拟变量D以与X相乘的方式引入了模型中 从而可用来考察消费倾向的变化 假定E i 0 上述模型所表示的函数可化为 正常年份 反常年份 如 设 消费模型可建立如下 18 当截距与斜率发生变化时 则需要同时引入加法与乘法形式的虚拟变量 例5 1 1 考察1990年前后的中国居民的总储蓄 收入关系是否已发生变化 表5 1 1中给出了中国1979 2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据 19 20 以Y为储蓄 X为收入 可令 1990年前 Yi 1 2Xi 1ii 1 2 n11990年后 Yi 1 2Xi 2ii 1 2 n2则有可能出现下述四种情况中的一种 1 1 1 且 2 2 即两个回归相同 称为重合回归 CoincidentRegressions 2 1 1 但 2 2 即两个回归的差异仅在其截距 称为平行回归 ParallelRegressions 3 1 1 但 2 2 即两个回归的差异仅在其斜率 称为汇合回归 ConcurrentRegressions 4 1 1 且 2 2 即两个回归完全不同 称为相异回归 DissimilarRegressions 21 22 将n1与n2次观察值合并 并用以估计以下回归 Di为引入的虚拟变量 于是有 可分别表示1990年后期与前期的储蓄函数 23 在统计检验中 如果 4 0的假设被拒绝 则说明两个时期中储蓄函数的斜率不同 具体的回归结果为 6 11 22 89 4 33 2 55 由 3与 4的t检验可知 参数显著地不等于0 强烈示出两个时期的回归是相异的 储蓄函数分别为 1990年前 1990年后 0 9836 24 例题6 1 男女食品支出和税后收入的关系 6 4 被解释变量 食品支出 解释变量 性别 6 9 被解释变量 食品支出 解释变量 税后收入 性别 25 6 23 被解释变量 食品支出 解释变量 税后收入 性别 税后收入 性别 26 1 写出 6 23 的估计方程 2 进一步写出男性 女性的估计方程 3 解释偏回归系数含义 27 DependentVariable YVariableCoefficientStd Errort StatisticProb C1432 577248 47825 7654040 0004INCOME0 0615830 0083497 3760910 0001SEX 67 89322350 7645 0 1935580 8513XD 0 0062940 012988 0 4845950 6410R squared0 930459 6 24 6 4 1交互影响Interactioneffects 相得益彰 恐怖片 画面与配乐 效果陡增 Inthismodelgender性别andrace種族arequalitativeregressorsandeducationisaquantitativeregressor Implicit暗示inthismodelistheassumption假定thatthedifferentialeffectofthegenderdummyD2isconstant常数acrossthetwocategoriesofraceandthedifferentialeffectoftheracedummyD3isalsoconstantacrossthetwosexes Thatistosay ifthemeansalaryishigherformalesthanforfemales thisissowhethertheyarenonwhite non Hispanicornot Likewise if say nonwhite non Hispanicshavelowermeanwages thisissowhethertheyarefemalesormales 6 4 1交互影响 上式假设D2这个变量上的差异对Y的影响总是相同的 而且与其他变量无关 这可能不符合事实 因为某些因素的叠合作用是倍增 theremaybeinteractionbetweenthetwoqualitativevariablesD2andD3 ThereforetheireffectonmeanYmaynotbesimplyadditiveasin 10 18 butmultiplicativeaswell asinthefollowingmodel Yi B1 B2D2i B3D3i B4 D2iD3i B5Xi ui交互影响虚拟变量 以乘积形式表现 合体 当D2和D3同时为1时 这个交互影响就可能存在 交互影响 变量的作用 假定其他因素不变 如果是女人 则D2 1 吃亏2 36假定其他因素不变 如果是黑人 则D3 1 吃亏1 73按照上面二条件 如果既女又黑 应该吃亏2 36 1 73 4 09但既女又黑时 D2D3项为1 前面的系数B4为正数2 13 就是社会实际对这種人有优待 吃亏数由4 09下降了2 13 即达到1 96此处 该因素D2D3不起作用的概率小于8 三 虚拟变量的设置原则 虚拟变量的个数须按以下原则确定 每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1 即如果有m个定性变量 只在模型中引入m 1个虚拟变量 例 已知冷饮的销售量Y除受k种定量变量Xk的影响外 还受春 夏 秋 冬四季变化的影响 要考察该四季的影响 只需引入三个虚拟变量即可 31 则冷饮销售量的模型为 在上述模型中 若再引入第四个虚拟变量 则冷饮销售模型变量为 其矩阵形式为 32 如果只取六个观测值 其中春季与夏季取了两次 秋 冬各取到一次观测值 则式中的 显然 X D 中的第1列可表示成后4列的线性组合 从而 X D 不满秩 参数无法唯一求出 这就是所谓的 虚拟变量陷井 应避免 33 6 7因变量dependentvariable也是虚拟变量Linearprobabilitymodel LPM 因变量只有0 1二值概率线性模型 自变量的变化对因变量的影响体系在概率上 而不是具体的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村光伏骗局合同标准文本
- 加盟终止合同样本
- 出售公司财产合同标准文本
- 2025年超低频振动标准项目建议书
- 加工订购合同样本
- 出租田园小屋合同样本
- 北京市丰台区第十二中学2025届高三下期末质量监测物理试题
- 农资招商合同标准文本
- 加盟居间合同标准文本
- 出售泉州校服合同样本
- 春季过敏性疾病预防
- 黑龙江省哈尔滨市香坊区2023-2024学年八年级上学期期末数学试题
- GB/Z 43281-2023即时检验(POCT)设备监督员和操作员指南
- 主动披露报告表
- 煤矿一通三防知识培训课件
- 2022年版小学《义务教育音乐课程标准》考试复习题库
- 筑业海南省建筑工程资料表格填写范例与指南
- 国家开放大学《广告学概论》形考任务1-4参考答案
- 毕业论文建筑消防系统论文
- 自制移动吊车(炮车)方案
- 《咕咚来了》PPT图文带mpa
评论
0/150
提交评论