




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、6.1虚拟变量的特性6.2 ANCOVA模型:定量变量,包含二分变量的回归模型6.3中应用了定量变量,多分变量的回归6.4中应用了定量变量,对多个定性变量的回归6.5两个回归6.6虚拟变量的季节性分析中应用了6.7变量也是虚拟变量的方案。线性概率模型6.8摘要,Niu库文档共享,前面考虑的回归模型的解释变量都是定量变量,本章介绍了如何在模型中引入定性变量,使模型更加丰富和完善。这些定性变量称为虚拟变量。共享子库文档,6.1虚拟变量的特性,虚拟变量:通常表示有或没有任何特性的定性变量。通常,这些变量的值为0,1。由符号d表示。方差分析模型(ANOVA):解释变量只是虚拟变量的模型。协方差模型(A
2、NCOVA):回归模型中的一些分析变量是定量的,一些是定性的。我们来看一下母牛库文档共享,ANOVA模型的一个示例。Yi=B1 B2Di ui (6-1),其中Y=年度食品支出,此时解释变量只是一个虚拟变量。假设随机扰动项满足经典线性回归模型的基本假设,根据模型(6-1):男性食品支出的预期如下:女性食品支出的预期如下:使用OLS方法检查零假设很容易。男女平均食品支出没有明显差异(即B2=0),可以根据t检验值判断B2在统计上是否重要。牛库文件共享,表6-1男性,女性食品支出及税后收入和年龄数据,首先整理数据,获得表6-2。6.1男性和女性个人消费者的年度食品支出,表6-1显示了2000-20
3、01年男性和女性年度食品支出(美元)和税后收入(美元)的数据。共享母牛库文档,并使用这些数据建模虚拟变量。(y为食品支出,女性为1):yi=B1 b2di ui作为OLS返回,如下所示:Niu库文档共享,evews输出结果如下:使用evews软件操纵进行说明。从宇文库文件共享、回归结果可以看出,估计男性的平均餐费支出为3176.83美元,女性的平均餐费支出为3176.83-503.17=2673.66美元。回归结果显示,B2在统计上没有注意到。也就是说,男性和女性在食品支出上的差异并不大。如上所述,这种解析变数只是虚拟变数的模型称为分散式解析模型(ANOVA)。实际上,这些模型可以用于判断两个
4、组(或多个组)的平均值是否大不相同。在此例中,男性和女性的平均食品支出没有显著差异。共享Niu库文档,虚拟变量的某些特性:(1)为了区分男性和女性的差异,仅引入了一个虚拟变量。虚拟变量完全可以区分两种不同的种类。如果模型包含截断点,则模型(6-1)将写为:其中y表示食品支出。无法推断模型(6-6),因为D11和D2i完全共线。(6-6),假设有一个样本,包含牛库文件共享,三个男人,两个女人。数据矩阵如下:数据矩阵右侧的第一列表示公用终止点B1。易于验证:D1=(1-D2)或D2=(1-D1),即D1和D2完全共线。掉进虚拟变量的陷阱。共享子库文档,一般规则如下:如果定性变量具有m类(m-1),
5、则引入虚拟变量。否则,会陷入虚拟变量陷阱,出现完全的多重共线性。(2)虚拟变量的分配是任意的。(3)具有零值的类也称为基本类、对比度类、控制类或缺少类。)。基准类的选择也取决于研究的目的。(4)虚拟变量d(称为差值截断系数)的系数表示值为1的类的截断点值与基准类截断点值之间的差值。为了研究宇文库文件共享、例6.2劳动组合化程度及劳动权益法等劳动权益法的效果(本法禁止各种工会保护措施)。因此,预计通过劳动权益法的州处于低于未通过和州工会化的水平,Brennan等构建了工会会员(属于工会的工人占所有工人的比例)对劳动权益法的函数模型。数据见表6-3(新教材P216)。函数模型如下所示: PVTi=
6、B1 B2RWLi Ui,其中PVT表示工会化程度,RWL是虚拟变量,通过工作资格方法的主要分配为1,未通过的分配为0。共享牛右文库文件,回归结果如下(见Eviews文件),回归结果显示,通过劳动者劳动权益法的州中,劳动组合化程度平均为10.415%,未实施劳动者权利法的州中,劳动组合化程度平均为19.8%。因为虚拟变量的系数不是0。因此,通过劳动权益法的州和不这样的州的工会化程度存在相当大的差异。分库文档共享,6.2 ANCOVA模型:数量变量,包含二分变量的回归模型,ANCOVA模型:Yi=B1 B2Di B3Xi ui (6-8),其中y-食品支出x-税后收入d=,以上模型,母牛库文档共
7、享,模型说明如下。如果Yi=B1 B2Di B3Xi ui假定E(ui)=0,则男性平均食品支出为:e (yi | Xi,di=0)=B1 b3xi女性平均食品支出如下:e (yi | Xi,di=1)=(B1 B2) b3xi是具有不同斜度的两条平行直线。共享小库文档,Eviews输出结果为,将此结果与以前的结果进行比较。牛文告文件共享,男人平均餐费支出如下:女性平均餐费支出:(6-10),税后收入,X,Y,餐费支出,男性平均餐费,女性平均餐费,牛文告文件共享,这张表提供了1951年美国50个州的公立学校和哥伦比亚公立学校教师的平均工资以及每个学生的公共教育支出的数据。现在想知道教师的工资是
8、否有地区差异。该地区分为东北、中北部(21个)、南部(17个)、西部(13个)三类。将虚拟变量定义为:无论学生支出如何,您都可以查看以下模型:考虑到yi=B1 b2d2i b3iui (6-12)、分库文档共享、学生支出,您可以查看以下模型:yi=B1 b2d2i b3i b4xi u西部地区公共教师平均年度工资单:E (Yi| D2=0,D3=0,Xi)=B1 B4Xi东北部以及中部和北部地区公共教师平均年度工资单:E (Yi| D2=)、sow work文件共享、Eviews输出结果如下(不包括在每个学生的公共教育支出中)、sow work文件共享、加入每个学生的公共教育支出变量、模型的回
9、归结果如下:se=(1395.06)(801.17)(861.12)(0.3176)t=(9.51158)(-2.0888)(-1.3287)(10.3287)在5%显著性水平上,两个虚拟变量的统计显著性不同。Niu库文档共享,6.4包含一个量化变量和多个定性变量的回归,虚拟变量的技术可以扩展为说明变量具有一个或多个定性变量的方案。例如,考虑平均每小时工资的例子,有影响教育年限、性别和肤色的因素。为了简单起见,假设肤色有两种,白色和非白色。模型设置如下:yi=B1 b2d2i b3i b4xi ui (6-18)样式,y小时工资x-培训年限D2i=D3i=,母牛库文档共享,E(ui)=0假设:
10、yi=D3=1)=(b1b3) b4xi非白人女性平均每小时工资:e(已修改| Xi,D2=1,D3=1)=(B1 B2 B3) B4Xi,Niu库文档共享,我们例如,如果B3的差分截断在统计上很重要,则表明肤色对平均每小时工资有相当大的影响。由528个单独数据估计的回归结果如下:t=(-0 . 2357)(-5 . 4873)(-2 . 1803)(9 . 9094)R2=0 . 2032,母牛库文档共享,6.4.1交互效果,虚拟变量之间可能存在交互。(6-20),对虚拟变量的交互,此时:白人男性平均每小时工资为:不是白人男性的平均每小时工资是:非白人妇女的平均每小时工资如下:女性差异效果,
11、非白人差异效果,非白人女性差异效果,共享牛库文档,T=(-0.2357)(-5.4873)(-2.1803)(1.743)子库文档共享,6.4.2模型的一般化可以将模型扩展到包含多个量化变量和多个定性变量的方案中。但是,设置虚拟变量时,要避免落入虚拟变量的陷阱。6-3政党对选举运动的资金支持(略),Wilhite和Theilmann在1982年政党对国会选举的资金支持研究中取得了以下回归结果。请参阅表9-4。在此回归等式中,变量PARTY$(支持政党的本地候选资金)、$GAP、VGAP和PU是三个量化变量,OPEN、DEMOCRAT和COMM是三个定性变量,它们分别分为两个类别。共享牛文告文件
12、,表6-5美国政党的总资金支持,$GAP-候选财政VGAP衡量-之前竞选中不同政党投票的差异根据pu-国会季刊的政党团结指数,分享牛文告文件,返还结果$GAP越大(即VGAP越大,竞争对手在之前的选举中获胜的次数越多,国会对该候选人的资金支持就越少。公开竞争可能会在国会吸引更多的支援金,以确保与返回结果一致的国会内议席。Niu库文档共享,6.5比较两种回归,前面介绍的虚拟变量模型,虚拟变量以附加形式引入模型。也就是说,模型存在差异。虚拟变量也可以引入模型作为乘法,使模型具有差异梯度。以加法形式引入,以乘法形式引入,分解的回归模型根据,差矩,差斜率,分库文档共享,差矩和差斜率的统计重要性,(1)
13、 B2=0,B4=0,一致回归(2)两个模型的截止力矩具有相同的斜率,平行回归(3) B2=0,B40;两个模型的截止力矩具有相同的斜率,同时回归(4)B20,B40;两种模型的截止斜率都不同,使用不同的回归、一致的回归、平行回归、同时回归、不同的回归、分库文档共享,仍然是食品支出案例进行调查。以上结果表明,差分截止和差分斜率在统计上并不重要。与前面的模型相比,我们得出什么结论?(通过比较Eviews文件可用),共享小库文档,示例6-4:美国1970-1995年储蓄-收入关系,表6-7提供了10亿美元的个人可支配收入(税后收入)和个人储蓄的数据(1970-1995年)我们想看看美国这个期间储蓄
14、(y)和个人可支配收入(x)的关系。,我们首先调查数据的图形性能:共享小文库文件,共享小文库文件,图形分析以及对这个问题的背景分析(1982年美国经历了和平时期最糟糕的经济衰退),我们认为1982年前和1982年以后美国储蓄和收入之间的关系可能会有所不同。我们可以使用虚拟变量技术解决这个问题。复查下一个回归。Yt=C1 C2Dt C3Xt C4(DtXt) ut其中y个人储蓄;X-个人可支配收入C2是差异截距。C4是差异坡度比。抑郁症前后的(平均)储蓄函数如下:e (yt | dt=0,XT)=c1c3xt e (yt | dt=1,XT)=(c1c2) (C3) XT,共享子库文档,表6-7中的数据,通过共享宇文文档,EVM软件回归结果:ls y c D1 x d1x,通过共享索文文档,两个期间的储蓄函数如下:平均储蓄函数:1970-1981年平均储蓄函数:1982-1995年,即两个时期美国人的边际储蓄倾向有相当大的差异。1970至1981年间平均每增加1美元收入储蓄8美分,但1982至1995年间平均每增加1美元收入储蓄2美分也不会增加。Niu库文档共享,美国储蓄-收入关系(1970-1995),个人储蓄,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财政收入的核算
- 2024年监理工程师考试时间安排试题及答案
- 掌握命脉的人力资源管理师试题及答案
- 提升复习效率的人力资源管理师试题及答案
- 2024监理工程师考场技巧试题及答案
- 黑龙江民族职业学院《空间对接机构技术》2023-2024学年第二学期期末试卷
- 助力考试成功的试题及答案
- 黑龙江省哈尔滨市六十中学2024-2025学年初三第二轮复习测试卷化学试题(七)含解析
- 黑龙江省大庆市重点中学2025届高三下学期第七次月考数学试题含解析
- 黑龙江省绥化市望奎县2025年数学四下期末综合测试试题含解析
- 总包(外墙)向涂料单位移交单
- 大学生心理健康教育(兰州大学版)学习通超星课后章节答案期末考试题库2023年
- 外包钢加固法
- 监护仪的测量原理讲稿专项课件
- 煤矿常见地质构造-课件
- 学校“中华古诗词大赛”备考试题库(300题各题型)
- 《推动和平与发展》-教学设计
- 创新思维方法
- 历届 最近十年 (新知杯)上海市初中数学竞赛试卷及答案(含模拟试题及解答)
- 危大工程安全管理档案(2019版)
- 钢筋混凝土框架结构设计
评论
0/150
提交评论