版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章 虚拟变量回归第一节 虚拟变量的概念一、问题的提出计量经济学模型对变量的要求可观测、可计量。但在现实经济问题中,存在定性影响因素,比如1、属性(品质)因素的表达。在经济活动中,有的经济变量的变动要受到属性因素(或品质因素)的影响。如收入在形成过程中,不同的性别所得到的收入是不一样的;在城乡、不同地区等收入存在差距;再比如,在我国,经济的发展水平对于不同的区域有不同的表现。2、异常值现象。当经济运行过程中,可能会受到突发事件的影响,那么,其值有可能出现异常,偏离正常轨迹很远,对这类现象需要加以修正。3、季节因素的影响。有的经济现象存在明显的季节特征,如啤酒的消费。那么,在建模过程中,季节变
2、动这一因素怎样考虑?4、离散选择现象的描述。如公共交通与私人交通的选择、商品购买与否的决策、求职者对职业的选择等。第1、2、3种情况属于解释变量为定性变量,第4情况为被解释变量属于定性变量。称前一种情况为虚拟解释变量,后一种为虚拟被解释变量。本章主要介绍虚拟解释变量的内容。二、虚拟变量的定义1、定义。设变量D表示某种属性,该属性有两种类型,即当属性存在时D取值为1;当属性不存在时D取值为0。记为 2、虚拟变量引入的规则。(1)在模型里存在截距项的条件下,如果一个属性存在m个相互排斥类型(非此即彼),则在模型里引入m-1个虚拟变量。否则,会出现完全的多重共线性。但要注意,在模型无截距项的情况下,
3、如果一个属性存在m个类型,即便引入m个变量,不会出现多重共线性问题。( 请思考为什么?)(2)虚拟变量取值为0,意味着所对应的类型是基础类型。而虚拟变量取值为1,代表与基础类型相比较的类型,称为比较类型。例如“有学历”D为1,“无学历”D为0,则“无学历”就是基础类型,“有学历”为比较类型。(3)当属性有m个类型时,不能把虚拟变量的取值设成如下情况 D=0, 第一个类型; D=1, 第二个类型; D=m-1, 第m个类型。原因是上述情况没有反映出属性类型的相互排斥性。 第二节 虚拟解释变量的回归一、加法引入规则1、加法引入规则,虚拟解释变量与别的解释变量以相加的关系出现在模型里。加法引入虚拟变
4、量对模型产生的结果是只改变截距项。设模型为 式中,为虚拟变量,它与其它解释变量是相加的关系。如果虚拟变量按这种方式引入模型,则称虚拟变量按加法类型引入。2、加法引入虚拟变量的应用。(1)模型中只有一个定性解释变量。设模型形式为 其中,为具有两个属性类型的定性变量,如在教材第217页,设为居民的年可支配收入,为虚拟变量,其取值表示为:=1表示城镇居民;=0表示农村居民。即,该方程的意义在于,在其它因素不变的条件下,城镇居民与农村居民的收入是否具有显著性差异。由此得到城镇居民的年平均收入:。农村居民的年平均收入为:为了检验城镇居民和农村居民的差异对年平均收入的影响是否具有显著性,可构造假设: 对上
5、述模型进行回归,利用样本统计量对假设作出判断(t检验)。只有一个定性解释变量往往可用于检验一个属性因素对被解释变量的影响是否显著性存在。(2)模型中有一个定量解释变量和一个定性解释变量。设模型形式为 式中,为消费支出;为收入;为虚拟变量,即,上述表达式的意义在于,在收入不变的条件下,研究城镇居民和农村居民对消费的不同影响,即判断城乡居民在消费上是否存在显著性差异。农村居民年平均消费: 城镇居民年平均消费: 可以看出,城镇居民和农村居民两种收入类型的斜率系数一样,但截距不同。说明两种类型的居民在收入的水平上存在的规模差异。这一假定也可通过对的显著性检验来判断。(3)模型中有一个定量解释变量和一个
6、定性解释变量,但有多个属性类型。 设模型形式为 式中,为年医疗保健费支出;为居民年可支配收入;如果将受教育程度分为三种类型:高中以下、高中、大专及大专以上,则引入虚拟变量为如下两个 高中以下的年平均医疗保健费支出:高中的年平均医疗保健费支出:大专及大专以上年平均医疗保健费支出: 对于模型 有类型假定高中以下高中大专及大专以上(4)模型中有一个定量解释变量和两个以上定性解释变量,每个定性解释变量有两个或以上属性类型。设模型形式为 式中,为卷烟需求量;为居民可支配收入,考虑两种不同属性:不同区域的居民,即城镇居民与农村居民;不同性别,即男与女。因此各引入一个虚拟变量 农村女性居民:农村男性居民:城
7、镇女性居民:城镇男性居民:(5)对模型中存在异常值的修正。设模型形式为 由于某种突发因素的干扰,使得在时刻随机误差产生系统性偏离,即这时,可引入虚拟变量则 其中,对求数学期望,有 表明新的随机误差项满足零均值假定,从而可用OLS法对引入虚拟变量的模型求参数的估计。当时,当时,还有一种情况,研究消费行为,认为消费水平C主要受到收入水平Y的影响,但对于正常年份和反常年份,消费行为的表现是不同的,这时可考虑引入虚拟变量 则有当正常年份时,当反常年份时,进一步对参数估计,利用样本统计量对总体参数作检验,从而可判断正常年份消费行为与反常年份消费是否存在差异。(6)对季节因素的修正。 假设是具有某种季节特
8、征的消费行为(如啤酒、汗衫等商品的消费),这时需要对季节波动进行调整,下面介绍利用虚拟变量来调整季节变化。设模型形式为 季节为属性因素,按自然属性有4个不同的季节(春、夏、秋、冬),即4个属性类型。因此,在有截距项的前提下,可引入3个虚拟变量,即引入季节虚拟变量的模型为第1季度,第2季度,第3季度,第4季度,二、乘法引入规则1、以乘法形式引入虚拟变量,是在所设定的模型里,将虚拟解释变量与其它解释变量用乘积作为新的解释变量。乘法引入虚拟解释变量将改变模型中的斜率系数。设模型为 或者其中,为定量解释变量,均为虚拟变量。按上述形式引入虚拟变量即为乘法引入。2、乘法引入虚拟解释变量的应用。(1)检验模
9、型的结构是否发生了变化。设模型形式为 式中,为储蓄总额,为收入总额,为虚拟变量,即改革开放后,平均储蓄额为改革开放前,平均储蓄额为在上式中被称为截距差异系数,被称为斜率差异系数,它们分别代表改革开放前后储蓄函数的截距与斜率存在的差异。结构变化的专门检验邹氏检验(在EViews里的记号为CHOW检验,该内容自学)。(3)交互效应。在实际经济活动中,多个定性解释变量对被解释变量的影响可能存在一种交互影响,即一个变量的边际效应可能要依赖于另外变量的变动(即由于变量间的交互作用而对解释变量的影响)。这时可用乘法引入虚拟变量的方法来表示。设模型形式为 其中 ,为农副产品生产总收益,为农副产品生产投入,为
10、油菜籽生产虚拟变量,为养蜂生产虚拟变量。 但上述模型不能反映发展油菜生产,同时又发展养蜂生产,而在它们中间存在着一定的交互作用,这种交互作用对农副产品生产总收益可能会带来更大的影响。因此,反映交互作用可通过按乘法引入虚拟变量来解决。 不发展油菜生产,也不发展养蜂生产: 同时发展油菜生产和养蜂生产: 在实证分析中,可利用交互效应虚拟解释变量系数的显著性来加以判断。(4)分段线性回归。在经济活动中,有时会存在影响因素在达到某个临界值时发生结构性变化,这时可利用虚拟变量来区分这种结构性变化,即用虚拟变量表示来不同的截距和斜率的回归。以研究销售额对提取奖金的影响为例。设模型的形式为 式中,为奖励额度,
11、为销售额,为销售公司按销售额的一定比例计提奖励的目标水平值,即销售额在以下和以上计提的奖励的方法不同(或计提的额度不同),则引入虚拟解释变量为 当销售额度低于时,当销售额度高于时, 第三节 虚拟被解释变量一、问题的提出虚拟被解释变量的出现,其主要作用是对某一经济现象或活动作出选择或决策。这一类问题的特征是被研究对象在收到多因素影响时,它的取值只有两种(可能的)状态:是与否。在计量经济学建模中,称这类模型为二元型响应模型或离散选择模型。本小节侧重介绍这类模型参数的估计及专门分析这类问题的模型。二、线性概率模型1、线性概率模型的概念。设家庭购买住房的选择主要受到家庭的收入水平,则用如下模型表示 其
12、中为家庭的收入水平,为家庭购买住房的选择,即 由于y是取值为0和1的随机变量,并定义y取值为1的概率是p,则y的分布为y 0 1概率 1-p p这样y的数学期望为显然从而上述数学描述的经济学解释是,因为选择购买住房变量取值是1,其概率是p,并且这时对应p的表示是一线性关系,因此,选择家庭购买住房的概率是家庭收入x的一个线性函数。称这一关系式为线性概率函数。 2、线性概率函数的估计。 对线性概率函数的估计存在以下困难: (1)随机误差项的非正态性表现。表明服从两点分布。 (2)的异方差性。事实上,上式中,p随着i的变动是一个变动的量,则的方差不是一个固定常数。(3)利用加权最小二乘法修正异方差。
13、取权数为 可以证明具有同方差。在具体估计线性概率模型时,用作为p的估计来计算权数的估计。3、0E(yixi)1不成立。克服这一问题可直接从对线性概率模型的估计,求出,用人工的方法定义当>1时,取=1;当<0时,取=0。但要比较好地解决这类问题,只能考虑采用新的估计方法,如Logit模型和Probit模型等。三、Logit模型1、产生Logit模型的背景。对于线性概率模型来说,存在的问题是:(1)经济意义不能很好地得到体现。(2)在线性概率模型中,对于不满足的情况,用人工的方法处理,即 当>1时,取=1 当<0时,取=0尽管能够弥补不足,但仍然具有较强的主观因素。2、Logit模型的含义。(1)想法是:应与呈非线性关系,具体表现是随着的减小,趋近0的速度会越来越慢;反过来随着的增大,接近1的速度也越来越慢。并且的变化始终在0和1之间。(2)怎样表达: 从几何图形看,根据上述想法绘制的曲线具有S型特征,这与随机变量的分布函数曲线的特征相似。因此,分布函数即可作为研究这一类问题计量经济学模型的设定。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社保合同补充协议
- 外汇担保借款合同
- 技术转移与知识产权管理作业指导书
- 全新旅行社劳动合同
- 资产担保合同
- 水务管理与水质保障作业指导书
- 殡葬服务合同年
- 城市轨道与公共交通技术作业指导书
- 2025年内蒙古年货运从业资格证考试试题
- 2025年货运从业资格哪里考
- 烟叶复烤能源管理
- 应收账款管理
- 食品安全管理员考试题库298题(含标准答案)
- 执业医师资格考试《临床执业医师》 考前 押题试卷绝密1 答案
- 非ST段抬高型急性冠脉综合征诊断和治疗指南(2024)解读
- 2024年山东济宁初中学业水平考试地理试卷真题(含答案详解)
- 社会保险课件教学课件
- 抚恤金丧葬费协议书模板
- 订婚协议书手写模板攻略
- 准备单元 雪地上的“足迹”(教学设计)-2023-2024学年五年级下册科学大象版
- NB-T32042-2018光伏发电工程建设监理规范
评论
0/150
提交评论