虚拟变量回归模型ppt课件_第1页
虚拟变量回归模型ppt课件_第2页
虚拟变量回归模型ppt课件_第3页
虚拟变量回归模型ppt课件_第4页
虚拟变量回归模型ppt课件_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量经济学讲义1安徽大学经济学院虚拟变量回归模型虚拟变量回归模型安徽大学经济学院计量经济学讲义计量经济学讲义2安徽大学经济学院6.1 虚拟变量回归模型引入男女食品消费支出差别分析例1支出、收入单位为美圆年龄女性食品支出 女性收入 男性食品支出 男性收入 65221714952253320437问题:难以用性别作为解释变量,不易描画问题。计量经济学讲义3安徽大学经济学院6.1 虚拟变量回归模型引入男女食品消费支出差别分析:年龄食品支出收入性 别 652217149521 652533204370以性别作为解释变量具有特殊性,即只取1或0两个值。在实践生活中我们会遇到更多的虚拟变量。计量经济学讲义

2、4安徽大学经济学院6.1 虚拟变量回归模型引入1890. 0)5267. 1)(6318.13()5749.329)(0446.233(1667.503833.31762rtseDYii(6.1) 回归结果显示:男性平均食品支出大约为3177美圆,女性平均食品支出大约为31775032674美圆。从数值上看两者差别为503美圆,差别比较明显。但是估计的Di不是统计显著的,由于t值仅为1.5267,由此对应的p值为15%。这意味着男女食品支出的数值存在差别,但差别并不显著。这一结果有意义吗?计量经济学讲义5安徽大学经济学院6.1 虚拟变量回归模型引入思索普通虚拟变量的回归方程: 其中,Y年食品支

3、出美圆,Di1,女性;Di0,男性。 男性食品支出的期望:121)0()0|(BBBDYEii 女性食品支出的期望:(6.2)(6.3) 截距B1表示男性食品平均支出,“斜率系数B2表示女性与男性食品支出差别,B1B2表示女性食品支出。B2不再称之为斜率,而是称为差别截距系数。2121)1()1|(BBBBDYEii(6.4)iiiuDBBY21计量经济学讲义6安徽大学经济学院其中,Y年食品支出美圆,X收入美圆,D1,女性;D0,男性。6.2 一个定量变量一个定性变量模型iiiiuXBDBBY321 食品支出差别只与性别决议的吗?显然不是!思索以下模型:9284.0)0000.0)(0611.

4、0)(0000.0()6417.9)(1388.2)(0115.8()0061.0)(0582.107)(0096.188(0589.09868.288244.15062RptseXDYiii(6.5)(6.6)计量经济学讲义7安徽大学经济学院 回归模型结果分析: 1在方程(6.1)中,虚拟变量系数是统计不显著的,而这里显著; 2方程(6.6)是一多元回归模型,当收入为常数时,男性平均食品支出为1506美圆;女性圆,且两个均值显著不同; 3假设不思索性别差别,那么收入系数为0.0589,表示无论男女收入添加一美圆,食品支出添加6美分,即边沿食品消费倾向为6美分。6.2

5、 一个定量变量一个定性变量模型计量经济学讲义8安徽大学经济学院 女性平均食品消费支出:6.2 一个定量变量一个定性变量模型iiXY0589.02574.1277 男性平均食品消费支出:iiXY0589.0244.1506 上述两个回归方程只是截距不同,斜率一样。计量经济学讲义9安徽大学经济学院6.2 一个定量变量一个定性变量模型 问题:假设不思索性别的影响,食品消费边沿倾向为6美分,那么思索性别情况,男女的边沿食品消费倾向之间有差别吗?换句话说,方程(6.5)的斜率系数B3会显著不同吗?假设证明了显著不同,那么由方程(6.5)和根据它得到的回归结果就值得疑心了,这个问题稍后继续讨论。计量经济学

6、讲义10安徽大学经济学院6.3 包含一个定量变量一个多分定性变量模型 实践生活中定性变量的概念并不陌生,例如“男与女,“是与否,“好与坏等等,这些都是二分定性变量。“定性的含义只是表示变量的性质,不反映变量的程度。 除二分定性变量外,还有多分定性变量,也称之为多分类变量,例如“中、东、西、“高、中、低、“富有、小康、温饱、贫困等。 计量经济学讲义11安徽大学经济学院6.3 包含一个定量变量一个多分定性变量模型州州教师工资教师工资PayPay学生支出学生支出PPSPPS地区地区D2D2D3D3ME195833346110NH202633114110MD271864349201DC33990502

7、0201CA291323608300WY272245440300 上表给出的是美国51个不同州外加哥伦比亚特区公立学校教师的平均工资程度和每个学生平均支出的情况。如今的问题是:将不同州分成“中东北、南部和西部三个不同地域,分析不同州教师的工资能否存在显著差别?计量经济学讲义12安徽大学经济学院6.3 包含一个定量变量一个多分定性变量模型 现思索以下模型: AASi = B1 + B2*D2i + B3*D3i + ui其中,AAS公立教师平均工资D21,中东北;0,其它地域D31,南部地域;0,其它地域由于定性变量“地域是三分类,所以需求两个虚拟变量,西部作为基准类。(6.7)计量经济学讲义1

8、3安徽大学经济学院6.3 包含一个定量变量一个多分定性变量模型中东北部公立学校教师平均工资:(6.8)E(AASi|D2i=0, D3i=1)= B1 + B3E(AASi|D2i=0,D3i=0) = B1E(AASi|D2i=1, D3i=0)= B1 + B2南部地域公立学校教师平均工资:西部地域公立学校教师平均工资:(6.9)(6.10)共同截距B1表示虚拟变量赋值为0的地域平均ASS。差别斜率B2和B3表示不同地域AAS均值差别。既然西部地域是基准类,因此一切工资比较都与西部有关。计量经济学讲义14安徽大学经济学院6.3 包含一个定量变量一个多分定性变量模型 *表示在5的程度下统计显

9、著;*表示在5的程度下不是统计显著的。 回归结果阐明:西部平均ASS约为26159美圆。D2i的差别截距系数不是统计显著的,即中东北部平均ASS比西部是统计无差别的。D3i的差别截距系数是统计显著的,即南部地域平均ASS比西部低3265美圆。 虚拟变量仅仅指出了差别的存在,但并未阐明导致差别性的缘由。0901.0)0349.0()233.0()000.0()1776.2)(2078.1)(159.23(615.3264433.173462.261582*32RptDDSASiii(6.11)计量经济学讲义15安徽大学经济学院6.3 包含一个定量变量一个多分定性变量模型 比较回归结果(6.11)

10、和(6.12)得到两个相反的结论:假设PPS不变,那么中东北地域与西部地域ASS均值存在显著差别,西部高出1674美圆;而西部与南部地域ASS没有显著差别。 斜率系数3.29表示,每个学生的公共教育支出每添加1美圆,那么公立学校教师平均工资提高约3.29美圆。05.0*05.0,*7266.0)3539.10()3286.1()0889.2()5115.9(29.32 .11445 .16731 .132692*32ppRtPPSDDSASiiii;(6.12) 将学生的公共教育支出PPS引入模型,得到以下回归模型:计量经济学讲义16安徽大学经济学院6.3 包含一个定量变量一个多分定性变量模型

11、05.0*05.0,*7266.0)3539.10()3286.1()0889.2()5115.9(29.32 .11445 .16731 .132692*32ppRtPPSDDSASiiii;(6.12) 问题:哪个模型更好些?0901.0)0349.0()233.0()000.0()1776.2)(2078.1)(159.23(615.3264433.173462.261582*32RptDDSASiii(6.11)计量经济学讲义17安徽大学经济学院6.4 包含一个定量变量和多个定性变量的回归模型多个不同属性的定性变量作为解释变量引入回归模型:)(0)(1)(0)(1*32433221其他

12、,非白种人和非西班牙人男性,女性教育(受教育年限)小时工资(美元)其中,DDXYuXBDBDBBYiiiii(6.13)计量经济学讲义18安徽大学经济学院 回归结果解释:1基准类是白种和男性/或西班牙男性;2假设教育程度和种族为常量,那么女性小时收入比男性大约少2.36美圆;假设教育程度和性别为常量,那么非白种人/非西班牙人小时收入平均比基准类大约少1.73美圆;3假设不思索性别和种族影响,那么受教育年限每添加一年,平均工资提高约0.8美圆。05.0*05.0*5282032.0)9094.9()1803.2()4873.5()2357.0(8028.07327.13606.22610.02*

13、32ppnRtXDDYiiii;(6.14) 从容量为528个的数据得到估计的回归模型:6.4 包含一个定量变量和多个定性变量的回归模型计量经济学讲义19安徽大学经济学院多个不同属性的定性变量作为解释变量引入回归模型:)(0)(1)(0)(1*32433221其他,非白种人和非西班牙人男性,女性教育(受教育年限)小时工资(美元)其中,DDXYuXBDBDBBYiiiii(6.13)iiiiiiiuXBDDBDBDBBY*532433221(6.15)非白种人/非西班牙女性比非白种人/非西班牙男性工资低。即定性变量D2和D3之间存在交互影响,它们对Y的影响不像方程(6.13)那样简单,而是倍增的

14、。6.5 多个定性变量的交互影响计量经济学讲义20安徽大学经济学院虚拟变量的乘积称为交互影响虚拟变量,它给出了两个定性变量的结合影响。iiiiXBBBBBDDYE*)()1, 1|(5432132(6.16)方程(6.16)表示非白种人/非西班牙女性的平均小时工资函数。其中,B2女性的差别效应B3非白种人/非西班牙人的差别效应B4非白种人/非西班牙人女性的差别效应还可以对方程(6.16)进展统计检验,看统计检验能否显著。6.5 多个定性变量的交互影响计量经济学讲义21安徽大学经济学院对含有一个定量与一个二分定性变量模型:(6.17)在方程(6.17)中添加了交叉变量DiXi。6.6 定量与定性

15、变量交互影响的模型iiiiuXBDBBY321(6.5)iiiiiiuXDBXBDBBY)(4321上述模型的修正模型为:计量经济学讲义22安徽大学经济学院男性Di0平均食品支出函数:(6.17)B4称为差别斜率系数或斜率漂移,它表示了不同性别或两种分类下收入变量系数的差别有多大。6.6 定量与定性变量交互影响的模型iiiiXBBXDYE31),0|(6.5)iiiiXBBBBXDYE)()(), 1|(4321女性Di1平均食品支出函数:计量经济学讲义23安徽大学经济学院 根据差别截距系数B2和差别斜率系数B4的统计显著性,可以区分女性与男性食品支出函数是截距不同还是斜率不同,或是都不同。6

16、.6 定量与定性变量交互影响的模型YXOYXOB20B40B20B40a)一致回归b)平行回归计量经济学讲义24安徽大学经济学院6.6 定量与定性变量交互影响的模型YXOYXOB20B40B20B40c)并发回归d)相异回归计量经济学讲义25安徽大学经济学院6.6 定量与定性变量交互影响的模型(6.17)iiiiiiuXDBXBDBBY)(4321利用(6.17)模型得到如下回归结果:变量系数标准误t统计量p概率C1432.58248.47825.7654040.0004D-67.89322350.7645-0.1935580.8513X0.0615830.0083497.3760910.00

17、01D.X-0.0069240.012988-0.4845950.6410R20.930459因变量均值2925.250修正R20.904381因变量标准误604.3869回归标注误186.8903F统计量35.68003残差平方和279423.9Prob(F统计量)0.000056计量经济学讲义26安徽大学经济学院6.7 虚拟变量在季节调整中的运用 当运用含有季节要素的经济数据进展回归分析时,可以对数据进展季节调整消除原数据带有的季节性影响,也可以运用虚拟变量描画季节要素,进而可以同时计算出各个不同季度对经济变量的不同影响。假设用虚拟变量,这时包含了4个季度的4种分类,需求建立3个虚拟变量。

18、用Qi表示第i个季度取值为1,其他季度取值为0的季节虚拟变量,显然Q1 + Q2 + Q3 + Q4 = 1 ,假设模型中包含常数项,那么只能参与Q1,Q2,Q3 ,否那么模型将由于解释变量的线性相关而无法估计,即导致虚拟变量圈套问题。当运用月度数据时,方法与上述类似,但需求有11个虚拟变量。 计量经济学讲义27安徽大学经济学院6.7 虚拟变量在季节调整中的运用计量经济学讲义28安徽大学经济学院6.7 虚拟变量在季节调整中的运用计量经济学讲义29安徽大学经济学院6.7 虚拟变量在季节调整中的运用40005000600070008000900010000110001200019951996199

19、71998199920002001200240005000600070008000900010000110001200019951996199719981999200020012002 可以看出包含虚拟变量的方程明显地改良了拟合才干。这种季节调整方法是以季节变动要素不变并且服从于加法模型为前提,否那么应该首先运用X-12或其他方法对数据进展季节调整。 不含虚拟变量的拟合结果含虚拟变量的拟合结果计量经济学讲义30安徽大学经济学院6.8 线性概率模型(LPM)因变量为虚拟变量 在以前的模型中因变量皆为定量变量,虚拟变量都是作为解释变量引入方程的。 但有时我们需求根据实践情况判别“是与“否。例如根据

20、年收入能否能贷到房款。是否得到房贷年收入Y拟合值032-0.1286381640.6884101720.8926720440.1777550480.2798861760.9948021801.0969330520.382019计量经济学讲义31安徽大学经济学院6.8 线性概率模型(LPM)因变量为虚拟变量 Y=1,表示得到房贷,否那么为0;X表示年家庭收入。思索以下模型: Yi = B1 + B2*Xi + ui (6.20)模型(6.20)不是普通的线性回归方程,由于Y只能取0与1,所以不能把斜率系数B2解释为单位X变动引起Y的变动率。形如式(6.20)的模型称之为LPM模型。 E(Yi|X

21、i)可以解释为给定Xi下,事件发生的概率,即E(Yi1|Xi),此条件概率依X线性变化。本例E(Yi|Xi)表示不同收入程度下恳求到房贷的概率。计量经济学讲义32安徽大学经济学院6.8 线性概率模型(LPM)因变量为虚拟变量 斜率系数B2解释为X单位变动引起的Y1概率的变化。根据(6.20)得到的Yi的估计值就是预测Y1的概率,b2是B2的估计值。 Yi = B1 + B2*Xi + ui (6.20) 当Y是二分变量时,假设按照上述了解来解释回归方程(6.20),那么能否以为OLS估计适宜呢?我们必需回答四个必需回答的问题。计量经济学讲义33安徽大学经济学院6.8 线性概率模型(LPM)因变

22、量为虚拟变量 1虽然Y取值为1或0,但无法保证Y的估计值介于0,1之间,实践上Yi能够为负或大于1; 2由于Y是一个二分变量,所以误差项也是一个二分变量。也即是ui服从正态分布的假定不成立,而是服从二项概率分布; 3可以证明误差项是异方差,而古典线性回归模型不断假定误差项是同方差的; 4由于Y仅仅取值0 和1,所以R2无实践意义。计量经济学讲义34安徽大学经济学院6.8 线性概率模型(LPM)因变量为虚拟变量 回答上述四个问题: 1Y的估计值Yi能够为负或大于1,实际中,假设Y的估计值为负,那么取0;假设Y的估计值大于1,那么取1; 2假设样本容量足够大,二项分布收敛于正态分布。即ui服从正态分布的假定在大容量下可以为是成立的; 3关于误差项是异方差的情形,以后讨论; 4由于Y仅仅取值0 和1,所以R2无实践意义。本身无意义的东西不去讨论。计量经济学讲义35安徽大学经济学院6.8 线性概率模型(LPM)因变量为虚拟变量 回过头来需求仔细讨论LPM模型: Yi = B1 + B2*Xi + ui (6.20) 其主要问题是:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论