虚拟变量模型_第1页
虚拟变量模型_第2页
虚拟变量模型_第3页
虚拟变量模型_第4页
虚拟变量模型_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

虚拟变量模型第一页,共五十一页,2022年,8月28日

二态变量

1.1二态变量的概念

1.2二态变量的作用

1.3二态变量的设置规则

二态变量模型

2二态解释变量模型

3二态被解释变量模型第二页,共五十一页,2022年,8月28日1.1二态变量的概念

经济分析中接触最多的是一些数值变量,诸如GDP,CPI等等。这些变量的共同特征是它们各自有一个合理的值域区间,当变量变化时在值域区间内取值。

但是人类的经济活动仅仅通过数值变量的描述还是不够的,人的社会经济行为还与一些属性因素相联系,譬如收入在形成过程中,不同的性别所得到的收入是不一样的;在城乡、不同地区收入存在差距;再比如,在我国,经济的发展水平对于不同的区域有不同的表现,等等。既然属性因素同样影响人的经济活动,经济问题的研究就需要属性变量。第三页,共五十一页,2022年,8月28日设变量D表示某种属性,该属性有两种类型,即当属性存在时D取值为1;当属性不存在时D取值为0。记为

该变量D即为二态变量。二态变量又称虚拟变量、名义变量或哑变量,是用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1,一般“1”代表某一属性存在,“0”代表某一属性不存在,即“是”或“否”,“男”或“女”等。第四页,共五十一页,2022年,8月28日1.2二态变量的作用引入虚拟变量的作用,在于将定性因素或属性因素对因变量的影响数量化。

1.可以描述和测量定性(或属性)因素的影响。2.能够正确反映经济变量之间的相互关系,提高模型的精度;例如在分段回归中的应用。3.便于处理异常数据。由于某些突发事件的存在,如战争、自然灾害,使原本比较稳定的经济关系发生一段时间的混乱,此时可以利用虚拟变量。当样本资料存在异常数据时,一般有三种处理方式:一是在样本容量较大的情况下直接剔除异常数据;二是用平均数等方式修匀异常数据;三是设置虚拟变量(即将异常数据作为一个特殊的定性因素)。第五页,共五十一页,2022年,8月28日1.3二态变量的设置规则1.一个定性因素多个属性若一个定性因素有m个不同属性或相互排斥的类型,在模型中则只能引入m-1个虚拟变量,否则会产生完全多重共线性。2.多个定性因素多种不同属性如果有m个定性因素,且每个因素各含有mi个不同的属性类型,则引入个虚拟变量。3.虚拟变量取值应从分析问题的目的出发予以界定;通常将基础类型、否定类型取值为0,而将比较类型、肯定类型以及我们将要研究的重点类型取值为1.4.虚拟变量在单一方程中,可以作为解释变量,也可以作为因变量。

第六页,共五十一页,2022年,8月28日2二态解释变量模型2.1加法引入规则2.1.1一个定性解释变量2.1.2一个定量解释变量和一个定性解释变量2.1.3一个定量解释变量和一个定性解释变量,但有多个属性类型2.1.4一个定量解释变量和两个以上定性解释变量2.1.5对模型中存在异常值的修正2.1.6对季节因素的修正2.2乘法引入规则2.2.1检验模型的结构是否发生了变化2.2.2交互效应2.2.3分段线性回归第七页,共五十一页,2022年,8月28日

2.1加法引入规则虚拟解释变量与别的解释变量以相加的关系出现在模型里。加法引入虚拟变量对模型产生的结果是只改变截距项。设模型为

式中,为虚拟变量,它与其它解释变量是相加的关系。如果虚拟变量按这种方式引入模型,则称虚拟变量按加法类型引入。第八页,共五十一页,2022年,8月28日2.1.1模型中只有一个定性解释变量设模型形式为

其中,

为具有两个属性类型的定性变量。第九页,共五十一页,2022年,8月28日设为居民的年可支配收入,为虚拟变量,其取值表示为:=1表示城镇居民;=0表示农村居民。即该方程的意义在于,在其它因素不变的条件下,城镇居民与农村居民的收入是否具有显著性差异。由此得到城镇居民的年平均收入:

农村居民的年平均收入为:

第十页,共五十一页,2022年,8月28日为了检验城镇居民和农村居民的差异对年平均收入的影响是否具有显著性,可构造假设:

对上述模型进行回归,利用样本统计量对假设作出判断(t检验)。只有一个定性解释变量往往可用于检验一个属性因素对被解释变量的影响是否显著性存在。

第十一页,共五十一页,2022年,8月28日2.1.2模型中有一个定量解释变量和一

个定性解释变量设模型形式为

式中,为定量变量,为具有两个属性类型的定性变量。第十二页,共五十一页,2022年,8月28日设为消费支出;为收入;为虚拟变量,即

上述表达式的意义在于,在收入不变的条件下,研究城镇居民和农村居民对消费的不同影响,即判断城乡居民在消费上是否存在显著性差异。农村居民年平均消费:

城镇居民年平均消费:第十三页,共五十一页,2022年,8月28日可以看出,城镇居民和农村居民两种收入类型的斜率系数一样,但截距不同。说明两种类型的居民在收入的水平上存在的规模差异。这一假定也可通过对的显著性检验,

t检验来判断。第十四页,共五十一页,2022年,8月28日

模型中有一个定量解释变量和一个定

性解释变量,但有多个属性类型

设模型形式为

式中,为定量变量,和为具有两个属性特征的定量变量。

第十五页,共五十一页,2022年,8月28日设为年医疗保健费支出;为居民年可支配收入;如果将受教育程度分为三种类型:高中以下、高中、大专及大专以上,则引入虚拟变量为如下两个

高中以下的年平均医疗保健费支出:

高中的年平均医疗保健费支出:

大专及大专以上年平均医疗保健费支出:第十六页,共五十一页,2022年,8月28日对于模型

有类型假定高中以下高中大专及大专以上第十七页,共五十一页,2022年,8月28日2.1.4模型中有一个定量解释变量和两个以上定

性解释变量

设模型形式为

式中,为定量变量,和为具有两个属性特征的定量变量。

第十八页,共五十一页,2022年,8月28日设为卷烟需求量;为居民可支配收入,考虑两种不同属性:不同区域的居民,即城镇居民与农村居民;不同性别,即男与女。因此各引入一个虚拟变量

第十九页,共五十一页,2022年,8月28日农村女性居民:农村男性居民:

城镇女性居民:

城镇男性居民:

第二十页,共五十一页,2022年,8月28日2.1.5对模型中存在异常值的修正设模型形式为由于某种突发因素的干扰,使得在时刻随机误差产生系统性偏离,表现为随机误差项在相应时点存在均值非0的问题,即这时,可引入虚拟变量第二十一页,共五十一页,2022年,8月28日则

其中,,对求数学期望,有

表明新的随机误差项满足零均值假定,从而可用OLS法对引入虚拟变量的模型求参数的估计。当时,

当时,第二十二页,共五十一页,2022年,8月28日例如:研究消费行为时,认为消费水平C主要受到收入水平Y的影响,但对于正常年份和反常年份,消费行为的表现是不同的,这时可考虑引入虚拟变量

当正常年份时,

当反常年份时,进一步对参数估计,利用样本统计量对总体参数作检验,从而可判断正常年份消费行为与反常年份消费是否存在差异。第二十三页,共五十一页,2022年,8月28日2.1.6对季节因素的修正假设是具有某种季节特征的消费行为(如啤酒、汗衫等商品的消费),这时需要对季节波动进行调整,下面介绍利用虚拟变量来调整季节变化。季节为属性因素,按自然属性有4个不同的季节(春、夏、秋、冬),即4个属性类型。因此,在有截距项的前提下,可引入3个虚拟变量,即

第二十四页,共五十一页,2022年,8月28日引入季节虚拟变量的模型为

第1季度,第2季度,第3季度,第4季度,第二十五页,共五十一页,2022年,8月28日2.2乘法引入规则以乘法形式引入虚拟变量,是在所设定的模型里,将虚拟解释变量与其它解释变量用乘积作为新的解释变量。乘法引入虚拟解释变量将改变模型中的斜率系数。设模型为

其中,为定量解释变量,为虚拟变量。按上述形式引入虚拟变量即为乘法引入。第二十六页,共五十一页,2022年,8月28日2.2.1检验模型的结构是否发生了变化设模型形式为

式中,

为储蓄总额,

为收入总额,

为虚拟变量,即

改革开放后,平均储蓄额为改革开放前,平均储蓄额为

第二十七页,共五十一页,2022年,8月28日在上式中被称为截距差异系数,被称为斜率差异系数,它们分别代表改革开放前后储蓄函数的截距与斜率存在的差异。结构变化的专门检验——邹氏检验检验的基本步骤:(1)设根据同一总体两个样本估计的回归模型分别为:样本1:

样本2:第二十八页,共五十一页,2022年,8月28日第二十九页,共五十一页,2022年,8月28日2.2.2交互效应在实际经济活动中,多个定性解释变量对被解释变量的影响可能存在一种交互影响,即一个变量的边际效应可能要依赖于另外变量的变动(即由于变量间的交互作用而对解释变量的影响)。这时可用乘法引入虚拟变量的方法来表示。第三十页,共五十一页,2022年,8月28日

设模型形式为

其中,

为农副产品生产总收益,

为农副产品生产投入,

为油菜籽生产虚拟变量,

为养蜂生产虚拟变量。第三十一页,共五十一页,2022年,8月28日但上述模型不能反映发展油菜生产,同时又发展养蜂生产,而在它们中间存在着一定的交互作用,这种交互作用对农副产品生产总收益可能会带来更大的影响。因此,反映交互作用可通过按乘法引入虚拟变量来解决:不发展油菜生产,也不发展养蜂生产:

同时发展油菜生产和养蜂生产:

在实证分析中,可利用交互效应虚拟解释变量

系数的显著性来加以判断。第三十二页,共五十一页,2022年,8月28日2.2.3分段线性回归在经济活动中,有时会存在影响因素在达到某个临界值时发生结构性变化,这时可利用虚拟变量来区分这种结构性变化,即用虚拟变量表示来不同的截距和斜率的回归。以研究销售额对提取奖金的影响为例。第三十三页,共五十一页,2022年,8月28日设模型的形式为

式中,

为奖励额度,

为销售额,

为销售公司按销售额的一定比例计提奖励的目标水平值,即销售额在

以下和以上计提的奖励的方法不同(或计提的额度不同),则引入虚拟解释变量为

当销售额度低于

时,

当销售额度高于

时,第三十四页,共五十一页,2022年,8月28日3二态被解释变量模型3.1线性概率模型3.1.1线性概率模型的概念3.1.2线性概率模型的估计3.2Probit模型和Logit模型3.2.1Probit模型和Logit模型的产生背景3.2.2Probit模型和Logit模型的含义3.2.3Probit模型和Logit模型的估计参考:潘省初.《计量经济学中级教程》,清华大学出版社第三十五页,共五十一页,2022年,8月28日二态被解释变量在有些情况下,我们可能需要建立被解释变量为虚拟变量的回归模型。在这种模型中,被解释变量描述的是特征、选择或者种类等不能定量化的东西,如乘公交还是自己开车去上班、考不考研等。在这些情况下,被解释变量是定型变量,我们可以用定义虚拟变量的放大来刻画它们。这种被解释变量为虚拟变量的模型称为定性选择模型或定性响应模型。这里简要介绍线性概率模型、Probit模型、Logit模型第三十六页,共五十一页,2022年,8月28日3.1.1线性概率模型的概念设家庭购买住房的选择主要受到家庭的收入水平,则用如下模型表示

其中为家庭的收入水平,为家庭购买住房的选择,即

由于y是取值为0和1的随机变量,并定义y取值为1的概率是p,则y的分布为

y01概率1-pp第三十七页,共五十一页,2022年,8月28日这样y的数学期望为

显然

从而

上述数学描述的经济学解释是,因为选择购买住房变量取值是1,其概率是p,并且这时对应p的表示是一线性关系,因此,选择家庭购买住房的概率是家庭收入x的一个线性函数。称这一关系式为线性概率函数。第三十八页,共五十一页,2022年,8月28日3.1.2线性概率函数的估计对线性概率函数的估计存在以下困难:(1)随机误差项的非正态性表现。

表明

服从两点分布,常规的显著性检验出现问题。虽然U不是正态变量,考虑到中心极限定理,以及大样本的情况,检验可以在渐近分布的意义下进行。第三十九页,共五十一页,2022年,8月28日(2)的异方差性。事实上,

上式中,p随着i变动,是一个变动的量,则

的方差不是一个固定常数。第四十页,共五十一页,2022年,8月28日利用加权最小二乘法修正异方差。取权数为

可以证明具有同方差。在具体估计线性概率模型时,用作为p的估计来计算权数的估计。第四十一页,共五十一页,2022年,8月28日(3)0≤E(yi∣xi)≤1不成立。克服这一问题可直接从对线性概率模型的估计,求出,用人工的方法定义当>1时,取=1;当<0时,取=0。但要比较好地解决这类问题,只能考虑采用新的估计方法,如Logit模型和Probit模型等。第四十二页,共五十一页,2022年,8月28日(4)LMP模型本身的先天不足。LMP模型假定自变量和Y=1的概率之间存在线性关系,而此关系往往不是线性的。(5)在线性概率模型中,以及不再是合适的拟合优度测试。此问题不仅是线性概率模型的问题,而是所有定性选择模型的问题。较好一点的测度是模型正确预测的观测值的百分比。首先,我们将每一个预测值归类为1或0.如果拟合值大于等于0.5,则认为因变量的预测值为1,否则为0.然后将这些预测值与实际发生的情况相比较,计算正确预测的百分比:第四十三页,共五十一页,2022年,8月28日3.2.1Probit模型和Logit模型的产生背影鉴于线性概率模型上的缺点,我们应对回归模型作两个方面的改进,使:(1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间;(2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。显然所有连续性随机变量的分布函数F(zi)都符合要求,我们常用的是logistic函数与正态分布函数。采用累积正态概率分布函数的模型称作Probit模型,即用正态分布的累积概率作为Probit模型的预测概率;采用logistic函数的模型称作logit模型。第四十四页,共五十一页,2022年,8月28日3.2.2Probit模型和Logit模型的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论