浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第1页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第2页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第3页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第4页
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习内容与要求本章主要介绍因变量受定性因素影响时如何分析的问题。要求通过本章学习掌握虚拟变量的基本含义,以及在模型中的运用,熟悉同时含有虚拟变量和定性变量的模型。第五章虚拟变量

(DummyVariable)第五章虚拟变量

主要内容5.1虚拟变量(定性变量)的定义、作用和取值5.2虚拟变量的设置5.3两分定性变量模型5.4多分定性变量模型5.5多个定性变量模型5.6同时含有虚拟变量和定量变量的模型5.7虚拟变量EViews应用举例回归分析中因变量影响因素定量因素定性因素虚拟变量具有数量特征,能够赋予具体数值的变量不具有数量特征,只是表明事物的某种属性第五章虚拟变量

5.1虚拟变量(定性变量)的定义、作用和取值1.虚拟变量(哑变量、属性变量、双值变量、类型变量)的定义指反映定性因素变化的变量。既可作因变量,也可作解释变量。本章主要讨论虚拟变量为自变量的情形。2.引入虚拟变量的作用引入虚拟变量的作用,在于将定性因素或属性因素对因变量的影响数量化。(1)可以描述和测量定性(或属性)因素的影响;(2)能够正确反映经济变量之间的相互关系,提高模型的精度;(3)便于处理异常数据。设置虚拟变量(即将异常数据作为一个特殊的定性因素)。例如:第五章虚拟变量

5.1虚拟变量(定性变量)的定义、作用和取值属性状态人工变量取值具有某种属性1不具有某种属性0解决思路:人工构造变量:将定性变量量化,取值仅为1和0的人工变量,通常用D表示,使其能与定量变量一样可以在回归模型中应用。解决办法:第五章虚拟变量

5.1虚拟变量(定性变量)的定义、作用和取值例如:(1)表示性别的虚拟变量可取为D1=1男性0女性(2)表示文化程度的虚拟变量可取为D2=1本科及以上学历0本科以下学历(3)表示地区的虚拟变量可取为D3=1城市0农村(4)表示消费心理的虚拟变量可取为D4=1喜欢某种商品0不喜欢某种商品(5)表示天气变化的虚拟变量可取为D5=0雨天1晴天第五章虚拟变量

5.1虚拟变量(定性变量)的定义、作用和取值第五章虚拟变量

5.2虚拟变量的设置5.2.1虚拟变量的陷阱虚拟变量之间产生多重共线性设置不当第五章虚拟变量

5.2虚拟变量的设置举例:考查季节因素对美国制造业的销售量的影响。由于季节有四个水平,因此需引入三个虚拟变量,设冬季为基础类型变量,Yi为销售量,模型为:1春季1夏季1秋季D1=,D2=,D3=0其他0其他0其他第五章虚拟变量

5.2虚拟变量的设置当D1=D2=D3=0时,就表示冬季。如果引入四个虚拟变量,即1春季1夏季D1=,D2=,0其他0其他1秋季1冬季D3=,D4=0其他0其他模型变为,此时,D1+D2+D3+D4=1,陷入虚拟变量陷阱。第五章虚拟变量

5.2虚拟变量的设置5.2.2虚拟变量的设置规则在模型中,有截距项,若每一定性因素有m个水平属性(或类型),则模型中只能引入m-1个虚拟变量。无截距项,则引入m个虚拟变量。举例1:公司职员的年薪与工龄(x)和受教育程度(D)有关。若将受教育程度简单分为大学毕业于非大学毕业。根据规则,应引入一个虚拟变量D。1,大学毕业D=0,其他年薪模型为:第五章虚拟变量

5.2虚拟变量的设置举例2公司职员的年薪与工龄(x)和学历(D)有关。学历分为大专以下、本科生、研究生三个水平。为了反映学历对职工年薪的影响,可引入两个虚拟变量:1本科1研究生D1=,D2=0其他0其他年薪模型为:第五章虚拟变量

5.2虚拟变量的设置8.2.3虚拟变量的取值方法“1”表示具有某种属性或特征,为比较类型、肯定类型。“0”表示不具有某种属性或特征,为基础类型、否定类型。第五章虚拟变量

5.3两分定性变量模型两分定性变量模型指所研究的定性变量只有两种性质。举例:分析某公司员工的性别对薪水的影响:假设WAGE为薪水,DUMMY为性别,取1为男性,取0为女性。设立回归方程:WAGE=α+βDUMMY+μ第五章虚拟变量

5.3两分定性变量模型VariableCoefficientStd.Errort-StatisticProbDUMMY568.2274168.22083.3778680.0015C1518.696122.537312.393740.0000EViews的输出结果为:经验回归方程为:WAGE=1518.696+568.2274DUMMY第五章虚拟变量

5.3两分定性变量模型由于只有0.195343,故模型整体的拟合优度很差,但是对于只含有虚拟变量的模型,重要的是观察自变量的性质是否影响到因变量。由于DUMMY的p值为0.0015,意味着在1%的显著性水平下,可以接受DUMMY之前的系数不为0。第五章虚拟变量

5.3两分定性变量模型观察性别差异对薪酬的影响:对于男性员工,平均薪水E(Yi/Di=1)α+β=2086.9234对于女性员工,平均薪水E(Yi/Di=0)=α=1518.696两者相差β,即568.2274。第五章虚拟变量

5.4多分定性变量模型多分定性变量的含义模型中定性变量含有两个以上水平属性或类型。在模型中只有一个虚拟变量是不够的,需要两个或两个以上的虚拟变量添加到模型中去。第五章虚拟变量

5.4多分定性变量模型举例:前面例子中,公司职员的年薪与工龄(x)和学历(D)有关。学历分为大专以下、本科生、研究生三个水平。为了反映学历对职工年薪的影响,可引入两个虚拟变量:1本科1研究生D1=,D2=0其他0其他年薪模型为:第五章虚拟变量

5.4多分定性变量模型如果一个员工是本科学历,则D1=1,D2=0;如果一个员工是研究生学历,则D1=0,D2=1;如果一个员工没有接受大学教育,则D1=0,D2=0。此时:E(Yi/D1=0,D2=0)=α表示没有大学学历的员工的平均薪水E(Yi/D1=1,D2=0)=α+β1表示有本科学历的员工的平均薪水E(Yi/D1=0,D2=1)=α+β2表示有研究生学历的员工的平均薪水第五章虚拟变量

5.5多个定性变量模型一个模型中,可能不只需要一个定性变量,而是包括若干个定性变量,并且每个虚拟变量可能不止一个性质。举例:考察教授的薪金决定因素,假定涉及的定性变量为性别和肤色,设教授的薪金为Yi,则模型为:

1男性1白人D1=,D2=0女性0黑人第五章虚拟变量

5.5多个定性变量模型此时,E(Yi/D1=0,D2=0)=α表示黑人女教授的平均薪金E(Yi/D1=1,D2=0)=α+β1表示黑人男教授的平均薪金E(Yi/D1=0,D2=1)=α+β2表示白人女教授的平均薪金E(Yi/D1=1,D2=1)=α+β2表示白人男教授的平均薪金通过β1与β2的显著性检验,判断性别和种族歧视是否影响工资薪酬。第五章虚拟变量

5.5多个定性变量模型举例:考察某家公司49名员工的薪金和性别的数据。其中,WAGE为工资,RACE为人种,RACE值取1表示为白人,0表示其他人种;CLERICAL为工作性质,取1为公司职员,取0位其他;GENDER为性别,取1为男性,取0为女性。模型为:WAGE=α+β1RACE+β2CLERICAL+β3GENDER+uT第五章虚拟变量

5.5多个定性变量模型VariableCoefficientStd.Errort-StatisticProbRACE561.1595160.38153.4989030.0011GENDER117.6163191.32230.6147550.5418CLERICAL-796.5342210.4523-3.7848690.0005C1706.833177.51719.6150360.0000根据样本数据的EViews回归结果如下:数据显示,RACE、CLERICAL的p值在1%的显著性水平下,工作性质和肤色在这家公司员工的薪酬差异中能起到很好的解释作用。但GENDER这一变量的参数的显著性不强,可以认为该家企业薪酬上不存在性别歧视。第五章虚拟变量

5.6同时含有虚拟变量和定量变量的模型虚拟变量模型的定义同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。两种变量同时出现在模型中,需要谨慎对待每个变量对回归总体作用的影响。一个以性别为虚拟变量来考察职工薪金的模型如下:其中例如:

——为职工的薪金;单击此处添加备注为职工工龄;=1——代表男性=0——代表女性

构造虚拟变量模型的两种基本方式:

加法方式所设定的计量经济模型中加入适当的虚拟变量,此时虚拟变量与其他解释变量在设定模型中是相加关系。其作用是改变了设定模型的截距水平。

乘法方式在所设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。第五章虚拟变量

5.6同时含有虚拟变量和定量变量的模型1.加法方式上述职工薪金模型中性别虚拟变量的引入就采取了加法方式,女职工的平均薪金为:男职工的平均薪金为:在该模型中,如仍假定,则:第五章虚拟变量

5.6同时含有虚拟变量和定量变量的模型从几何意义上看

男女职工平均薪金示意图则两个函数有相同的斜率,但有不同的截距。假定

,这意味着,男女职工平均薪金对工龄的变化率

是一样的,但两者的平均薪金水平相差。

可以通过传统的回归检验,对的统计显著性进行检验,以判断男女职工的平均薪金水平是否显著差异。第五章虚拟变量

5.6同时含有虚拟变量和定量变量的模型2、乘法方式许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。在所设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。乘法形式引入虚拟解释变量的主要作用:①两个回归模型之间的比较;②提高模型对现实经济现象的描述精度。

第五章虚拟变量

5.6同时含有虚拟变量和定量变量的模型例:随着收入水平的提高,家庭教育费用支出的边际消费倾向可能会发生变化。为了反映定性因素对斜率的影响,可以用乘法方式引入虚拟变量,将家庭教育费用支出函数取成:虚拟变量对斜率的影响

第五章虚拟变量

5.6同时含有虚拟变量和定量变量的模型斜率差异这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。如,设消费模型可建立如下:第五章虚拟变量

5.6同时含有虚拟变量和定量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论