计量经济学 第2版 课件 第8章 虚拟变量模型_第1页
计量经济学 第2版 课件 第8章 虚拟变量模型_第2页
计量经济学 第2版 课件 第8章 虚拟变量模型_第3页
计量经济学 第2版 课件 第8章 虚拟变量模型_第4页
计量经济学 第2版 课件 第8章 虚拟变量模型_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ECONOMETRICS第8章

虚拟变量模型教学目的和要求0105040302了解虚拟变量模型;明确虚拟变量在建立和估计计量经济模型中的意义和作用;掌握引入和应用虚拟变量的基本思想和方法;能够运用虚拟变量模型实证分析;掌握Eviews软件中相关内容的操作方法。课程内容010302虚拟解释变量模型虚拟被解释变量模型案例分析引子:性别对家务劳动时间有显著影响吗?

家务劳动是家庭成员必须承担的义务,我国传统观念认为,男主外女主内,女性承担了大部分的家务劳动。我国家务劳动时间是否存在性别差异?影响家务劳动时间的主要因素有哪些?随着科技的进步、经济的发展、受教育程度的提高以及二孩政策的放开,这种家务劳动时间分配模式是否有所改变?随着越来越多的女性参与到公共事务中来,男性群体家务劳动时间有没有发生的变化?类似定性因素对人们经济行为的影响也需要加以研究。

在建立计量经济学模型的过程中,变量选择是十分重要的。有些变量是定量变量,例如个人的年收入、一个国家的GDP、房屋价格等,这些都是数值型变量;还有一些变量为定性变量,例如个人的性别、学历、种族、文化程度、季节差异、政府更迭、制度变革、经济政策、区位差异等,如果不将这些定性因素纳入到模型中,单纯由定量因素构建模型,一方面可能导致模型的解释能力不强,另方面会影响人们对经济系统运行影响因素分析的全面性。那么,由于定性因素不能准确量化,并且有些定性因素是作为人们经济行为的影响因素(如性别对家务劳动时间分配或攻读博士学位),而有的是作为人们经济行为的结果(如是否购房、投资渠道选择),又如何将其纳入到模型之中?

8.1虚拟解释变量模型1.一个定性因素多个属性

对于具有两种属性状态的定性变量,如性别,婚否等等,可以按照是否具有某种特征将此定性变量定义成两个虚拟变量?以性别这个定性变量为例,定义female和male这两个虚拟变量:

在带有截距项的回归模型中,仅引入其中一个虚拟变量进入模型;如果同时将两个虚拟变量放入模型,由于

造成解释变量完全的多重共线性,将会掉进虚拟变量陷阱。8.1.2虚拟解释变量的设置原则2.多个因素多个属性如果有n个定性因素,每个定性因素含有个不同的属性状态,在带有截距项的回归模型中,则可以按照上述方式在模型中共引入个虚拟变量。考虑到性别和学历差异对工资水平有重要的影响,可以将工资模型设为其中虚拟变量和虚拟变量female依次设为

8.1.2虚拟解释变量的设置原则1.加法方式在模型中,在其余解释变量相同的情形下检验不同样本组别的截距项是否存在显著差异,即各个组别的总体回归函数斜率相同时截距项有无差异,此时虚拟变量通过加法进入了模型,可以自然地将样本分组:

图中表明男性和女性组别家务劳动时间模型斜率相同,但是截距不同。虚拟变量通过加法方式引入模型,反映定性因素对截距的影响,也就是两个群体平均水平的差异。在相同工资水平的情况下,女性群体承担家务劳动的平均时间要比男性群体高出个单位。8.1.3虚拟解释变量的设置方式XYY女性男性O(1)虚拟变量与定量变量的交互作用

在模型

中,假设无论男性还是女性,解释变量lnwage对家务劳动时间housework的边际效应时相同的。但在现实生活中,多数情况下相同的工作岗位往往女性的工资比男性低,从比较利益来看,这也是女性相对于男性在家务劳动时间花费较长的原因之一。现在检验lnwage对housework的边际效应有无性别差异,即性别变量是否影响模型(8-1)对应不同组别的斜率。在上述模型中将性别虚拟变量通过乘法引入模型,加入虚拟变量female与lnwage的交互项,那么如何解释该交互项的系数的含义呢?2.乘法方式

可以得到不同组别的平均家务劳动时间2.乘法方式交互项的系数度量了工资对家务劳动时间的边际效应在性别上的差异,具体来说,当lnwage增加一个单位,男性平均家务劳动时间增加个单位,而女性平均家务劳动时间将增加个单位,那么就度量了当lnwage增加一个单位,女性平均增加的家务劳动时间与男性的差异。如果假设不同组别的总体回归函数拥有不同的斜率,那么就增加虚拟变量与其它解释变量的交互项。XY女性男性O左图表明反映定性因素对斜率的影响可以通过乘法方式引入虚拟变量,虚拟变量的系数度量了两个组别斜率的差异。男性平均家务时间:女性平均家务时间:(2)虚拟变量与虚拟变量的交互作用

虚拟变量以乘法的方式引入模型不仅会发生在虚拟变量与定量变量之间,还可能发生虚拟变量与虚拟变量之间的交互作用。考虑下面模型2.乘法方式其中married是婚姻状况的虚拟变量,定义为根据前面的介绍,以加法进入模型的虚拟变量married的系数影响各个组别对应的总体回归函数的截距,那么虚拟变量female与虚拟变量married的交互项又起到什么作用,它的系数的含义又如何解释呢?婚姻和性别都是具有两个类别的定性变量,因此模型(8-7)含有这两个定性变量,就将整个样本分成四个组别:未婚男性,未婚女性,已婚男性和已婚女性。各个组别的平均家务劳动时间如下

2.乘法方式虚拟变量female的系数度量了在工资水平相同的条件下未婚群体女性相对于男性平均家务劳动增加的时间;虚拟变量married的系数则表示工资水平一致的情形下男性群体已婚状态相较于未婚状态平均家务劳动增加的时间;交互项的系数的含义相对有点复杂,它包含两层含义:第一层表示在工资水平相同的条件下性别因素带来的已婚群体与未婚群体平均家务时间差异的影响,第二层表示在工资水平相同的条件下婚姻状态带来的女性群体与男性群体平均家务时间差异的影响。1.检验模型结构稳定性

模型结构稳定性一般是来自同一总体的不同样本所建立的同一形式回归模型的参数无显著差异;如果不同模型的回归函数存在差异,则认为模型结构不稳定或模型突变。

设来自同一总体的两个样本建立的回归模型为

定义虚拟变量

将两个样本合并后的总体模型为:全样本利用单个变量的显著性t检验可以判断变量D和XD的系数显著性。如果D和XD的系数有一个不显著,则意味着模型结构是不稳定的;否则说明模型结构具有稳定性。8.1.4虚拟解释变量的应用

在实际问题的建模过程中,被解释变量与解释变量在不同的解释变量数值变动区间均呈线性变动关系,但线性回归方程参数的值存有差异,如果用一条线性回归线去模拟,则模型拟合程度必定不高;如果直接进行分段回归,又往往受制于分段样本量偏小。遇到此类问题,可借助于在模型中引入虚拟变量加以解决。例如,假若收入(Y)对消费(X)具有线性影响,在不同的收入水平下,消费与收入的具体数量关系可由如下3个子样本回归模型进行描述。2.进行分段线性回归

全样本回归模型可以设为

3.测度季节因素影响第1季度第2季度第3季度第4季度

定性变量在模型中不仅可以作为解释变量,也可以被解释变量。虚拟被解释变量的出现,其主要作用是对某一经济现象或活动作出选择或决策。这一类问题的特征是被研究对象在受到多因素影响时,决策结果是定性的。例如,大学生进行学业规划时是继续深造还是马上就业?居民在进行投资渠道选择时是投资房地产还是购买股票、债券?等。影响决策的因素(解释变量)可以是定量的,也可以是定性的,而研究对象(被解释变量)则是定性的。把被解释变量作为虚拟变量的模型称为定性选择模型(qualitativechoicemodels)。如果被解释变量仅有两种状态或属性则称为二元选择模型(binarychoicemodels);如果被解释变量有三种及以上状态或属性则称为多元选择模型。本章讨论二元选择模型。8.2虚拟被解释变量模型

8.2.1线性概率模型从而显然有

2.线性概率模型的特点

2.线性概率模型的特点

XYYO1Y

鉴于线性概率模型的局限性,现实中应用较少,人们通常选用Probit模型和Logit模型等研究二元选择问题。

8.2.2Probit模型XO1Y0.5P将上述想法绘制的曲线具有S型特征,这与随机变量的分布函数曲线的特征相似。因此,分布函数即可作为研究这一类问题计量经济学模型的设定。依据不同的假定,分布函数可取相应的具体形式,Probit模型是其中的一种,取分布函数为标准正态分布的累积分布函数。最简单的Probit模型就是指被解释变量Y是一个0,1变量,事件发生的概率依赖于解释变量,即,也就是说,Y=1的概率是一个关于X的函数,其中服从标准正态分布。设

2.Probit模型的估计

3.Probit模型的检验

3.Probit模型的检验不全为零

8.2.3Logit模型

2.Logit模型的特点

3.Logit模型的估计

3.Logit模型的估计

上式称为n次观测的似然函数。将上式两端取对数得

Logit模型检验方法同probit模型。

当被解释变量是名义变量(即取值只是名义代号,没有大小顺序的含义)时,Logit和Probit没有本质的区别。两者的区别主要在于采用的分布函数不同,前者假设随机变量服从logistic分布,而后者假设随机变量服从正态分布。其实,这两种分布函数的公式很相似,函数值相差也并不大,唯一的区别在于logistic分布函数的尾巴比正态分布粗一些。4.Logit模型检验8.3案例分析

案例:工薪阶层群体出行选择模型

使用一项针对工薪阶层群体关于公共交通工具的调查报告,主要目的是调查出行是选择乘坐公交车上下班还是骑自行车上下班。被解释变量Y设置如下

序号性别年龄

月收入Y序号性别年龄

月收入Y101885001512010000202112000161251200030238501171271300040239501181281500050281200119130950160318500201321000070361500121133180008042100012213310000904695012313812000100481200024141150001105518001251451800112056210012614810000130581800127152150011411885002815618001案例分析表格工薪阶层群体关于公共交通工具的调查报告结果表数据来源:何晓群、刘文卿.应用回归分析[M].北京.中国人民大学出版社,2017.

建立线性概率模型(LPM)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论