




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四节虚拟变量模型
一、虚拟变量的基本含义
四、虚拟被解释变量二、虚拟变量的引入三、虚拟变量的设置原则一、虚拟拟变量的的基本含含义许多经济济变量是是可以定量量度量的,如:商品需求求量、价价格、收收入、产产量等但也有一一些影响响经济变变量的因因素无法定量量度量,如:职业、性性别对收收入的影影响,战战争、自自然灾害害对GDP的影响,,季节对对某些产产品(如如冷饮))销售的的影响等等等。为了在模模型中能能够反映映这些因因素的影影响,并并提高模模型的精精度,需需要将它它们“量量化”,,这种“量量化”通通常是通通过引入入“虚拟拟变量””来完成成的。根根据这些些因素的的属性类类型,构构造只取取“0””或“1”的人人工变量量,通常常称为虚拟变量量(dummyvariables),记为D。例如,反映文文程度的的虚拟变变量可取取为:1,本本科学学历D=0,非本科学学历一般地,,在虚拟拟变量的的设置中中:基础类型型、肯定定类型取取值为1;比较类型型,否定定类型取取值为0。一、虚拟拟变量((dummy)及其作用用1、定义::反映品质质指标变变化、数数值只取取0和1的人工变变量。用用符号D来表示。。如:城镇居民农村居民销售旺季销售淡季政策紧缩政策宽松本科以上学历本科以下学历变量的划划分应遵遵循穷举与互斥原则。2、作用::⑴可以描描述和测测量定性性因素的的影响。。这是计量量经济学学研究的的重点。。⑵能够正正确反映映经济变变量之间间的相互互关系,,提高模模型的精精度。从经济意意义上来来说,能能够更好好地解释释现实经经济现象象。⑶便于处处理异常常数据。。当样本资资料中存存在异常常数据时时,一般般有三种种处理方方式,一一是在样样本容量量较大的的情况下下直接剔剔除异常常数据;;二是用用平均数数等方式式修匀异异常数据据;三是是设置虚虚拟变量量(即将将异常数数据作为为一个特特殊的定定性因素素):异常时期正常时期二、虚拟变量量的设定定1.虚拟变变量的引引入方式式。在计量经经济模型型中设置置虚拟变变量可以以采用两两种方式式:加法法方式和和乘法方方式。(1)加法方方式虚拟变量量D与其他解解释变量量在模型型中是相相加关系系。Yi=a+bxi+αDi+εi上式等价价为:当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=(a+α))+bxi+εiD=0D=1aa+αα上图表明明,以加法方式式引入虚拟拟变量,,反映定性性因素对对截距的的影响,也就是是通过调整截距距区分异常常情况。。(2)乘法方方式虚拟变量量D与其他解解释变量量在模型型中是相相乘关系系。Yi=a+bxi+βXDi+εi其中:XDi=Xi*Di,上式等等价于::当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=a+(b+β))xi+εiD=0D=1aβ上图表明明,以乘法方式式引入虚拟拟变量,,可反映映定性因素素对斜率率的影响,,系数β描述了定定性因素素的影响程度度。(3)一般方方式同时用加法与乘乘法方式式引入虚拟拟变量,,然后再再利用t检验判断断α、β是否显著著的不等等于零,,进而确确定虚拟拟变量的的具体引引入方式式。例7.教教材P136表3-8列出了了1998年我国城城镇居民民人均收收入与彩彩电每百百户拥有有量的统统计资料料。在EViews软件的命命令窗口口中依次次键入以以下命令令:CREATEU8建立工作作文件DATAYXX输输入入需求量量、收入入数据SCATXY绘制相关关图操作演示示从相关图图可以看看出,前前3个样本点点(即低低收入家家庭)与与后5个样本点点(即中中、高收收入家庭庭)的支支出情况况存在较较大差异异,因此此,为了了反映““收入层层次”这这一定性性因素的的影响,,设置虚虚拟变量量:将我国城城镇居民民的彩电电需求函函数设成成:Yi=a+bxi+αDi+βXDi+εi同时引入入加法和和乘法方方法,再再进行t检验。DATAD1输入虚拟拟变量的的值(前三个为为0,后五个个为1)(由于D是EViews软件的保保留字,,所以将将虚拟变变量取名名为D1;另外,,此时也也可以用用SMPL和GENR命令直接接生成D1变量)GENR XD=X**D1生成变量量XDLSYCCXXD1XD估计需求求函数结果如下下图所示示:中高收入家庭低收入家庭我国城镇镇居民彩彩电需求求函数的的估计结结果为::对应的t统计量值值R2的值调整的R2值SE的值α、β的t检验都是是显著的的,表明明我国城城镇居民民低收入入家庭与与中高收收入家庭庭对彩电电的消费费需求,,在截距距和斜率率上都存存在着明明显差异异,各自自的需求求函数为为:低收入家家庭:事实上,,现阶段段我国城城镇居民民中高收收入家庭庭的彩电电普及率率已达到到百分之之百,所所以对彩彩电的消消费需求求处于更更新换代代阶段。。此例说明明了三个个问题::①如何设置置和在模模型中引引入虚拟拟变量;;②如何测量量定性因因素(即即收入层层次)的的影响;;③如何区分分不同类类型的模模型(即即需求函函数)。。中高收入入家庭::2.虚拟变量量的设置置原则⑴一个个因素多多个类型型对于有m个不同属性性的定性因因素,应应该设置置m-1个虚拟变变量来反反映该因因素的影影响。例:设公公司职员员的年薪薪与工龄龄和学历历有关。。学历分分成三种种类型::大专以以下、本本科、研研究生。。为了反反映“学学历”这这个定性性因素的的影响,,应该设设置两个个虚拟变变量:而将年薪薪模型取取成(假假设以加加法方式式引入)):Yi=a+bxi+α1D1i+α2D2i+εi本科其他研究生其他其等价于于:Yi=a+bxi+εi大专以下下(D1=D2=0)Yi=(a++α1)+bxi+εi本科(D1=1,D2=0)Yi=(a++α2)+bxi+εi研究生(D1=0,D2=1)上图直观观地描述述了三类类年薪函函数的差差异情况况,通过过检验、、α1、α2的显著性性,可以以判断学学历层次次对职员员的年薪薪是否有有显著影影响。大专以下本科研究生工龄年薪α2-α1
α1
(2)多个因因素各两两种类型型如果有m个定性因因素,且且每个因因素各有有两个不不同的属属性类型型,则引引入m个虚拟变变量。例如,研研究居民民住房消消费函数数时,考考虑到城城乡的差差异以及及不同收收入层次次的影响响,将消消费函数数取成::Yi=a+bxi+α1D1i+α2D2i+εi其中y,x分别是居居民住房房消费支支出和可可支配收收入,虚虚拟变量量这样可以以反映各各类居民民家庭的的住房消消费情况况:农村居民城镇居民高收入家庭低收入家庭城市低收收入家庭庭(D1=0,D2=0)Yi=a+bxi+εi城市高收收入家庭庭(D1=0,D2=1)Yi=(a++α2)+bxi+εi农村低收收入家庭庭(D1=1,D2=0)Yi=(a++α1)+bxi+εi农村高收收入家庭庭(D1=1,D2=1)Yi=(a++α1+α2)+bxi+εi推广到更更一般的的情况,,如果有有些因素素有多个个属性水水平,则则参照““一个因因素多种种类型””的设置置原则来来设置虚虚拟变量量。另外,定定性因素素的变化化通常表表现为某某种属性性或特征征是否存存在,所所以可以以用只取取1、0值的虚拟拟变量来来“量化化”定性性因素的的变化。。一般地地,“1”表示这种种属性或或特征存存在,““0”表示这种种属性或或特征不不存在。。1、调整季节节波动利用季节节或月份份资料建建立模型型时,经经常存在在着季节节波动。。使用虚拟拟变量可可以反映映季节因因素的影影响。例如,利利用季度度数据分分析某公公司利润润y与销售收收入x之间的相相互关系系时,为为研究四四个季度度的季节节性影响响,引入入三个虚虚拟变量量(设第第1季度为基基础类型型):取利润函函数为:Yi=a+bxi+α1D1i+α2D2i+α3D3i+εi则系数a、α1、α2、α3分别反映映了一、、二、三三、四季季度对利利润的平平均影响响程度,,根据这些些系数的的t检验可以以判断季季节因素素对利润润是否显显著影响响。第i+1季度i=1,2,3其他季度2、检验模模型结构构的稳定定性模型结构构的稳定定性检验验主要有有两个用用途:一是分析析模型结结构对样样本变化化的敏感感性,如如多重共共线性检检验;二二是比较较两个((或多个个)回归归模型之之间的差差异情况况,即分分析模型型结构是是否发生生了显著著变化。。设根据两两个样本本估计的的回归模模型分别别为:样本1:Yi=a1+b1xi+εi样本2:Yi=a2+b2xi+εi设置虚拟拟变量::估计以下下模型::Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi其中,XDi=xi*Di。样本2样本1利用t检验判断断D、XD系数的显显著性,,可以得得到四种种检验结结果:(1)两个系数数均等于于零,即a2=a1,b2=b1,表明两两个回归归模型之之间没有有显著差差异,称称之为““重合回归归”。(2)D的系数不不等于零零,XD的系数等等于零,即a2≠a1,b2=b1。表明两两个回归归模型之之间的差差异仅仅仅表现在在截距上上,称之之为“平行回归归”。(3)D的系数等等于零,,XD的系数不不等于零零,即a2=a1,b2≠b1。表明两两个回归归模型的的截距相相同,但但斜率存存在显著著差异,,称之为为“汇合回归归”。(4)D、XD的系数均均不等于于零,即a2≠a1,b2≠b1。表明两两个回归归模型完完全不同同,称之之为“相异回归归”第(1)种情况况下模型型结构是是稳定的的,其余余情况都都表明模模型结构构不稳定定。3、分段回回归有些经济济关系需需要用分分段回归归加以描描述:当当解释变变量x低于某个个已知的的临界水水平x*时,y与x之间是某某种线性性相关关关系,而而x>x**时又是另另一种相相关关系系。利用虚拟拟变量可可以很好好地解决决分段回回归问题题。取虚虚拟变量量为:分段回归归模型设设置成::Yi=a++bxi+β(xi-x*)Di+εi其中,x*是已知的的临界水水平。这这样各段段的函数数为:Yi=a++bxi+εix<x**Yi=(a-β)+((b+ββ)xi+εix>x**
x>x*x<x*使用虚拟拟变量既既能如实实描述不不同阶段段的经济济关系,,又未减减少估计计模型时时样本容容量,保保证了模模型的估估计精度度。4、混合回回归建立计量量经济模模型时,,有时能能同时获获得变量量的时序序数据和和横截面面数据。。只要模型型参数不不随时间间而改变变,并且且在各个个横截面面之间没没有差异异,就可可以使用用混合样样本估计计模型。。因此,在在合并样样本之前前,需在在比较使使用不同同样本估估计的模模型之间间是否有有显著差差异。例8.教材P143表3-9为我国城城镇居民民1998年、1999年全年人人均消费费支出和和可支配配收入的的统计资资料。试试使用混混合样本本数据估估计我国国城镇居居民消费费函数。。设1998年、1999年我国城城镇居民民消费函函数分别别为:1998年:Yi=a1+b1xi+εi1999年:Yi=a2+b2xi+εi为比较两两年的消消费函数数是否有有显著差差异,设设置虚拟拟变量::并且合并并两年的的数据,,估计以以下模型型:Yi=a1+b1xi+αDi+βXDi+εi其中α=a2-a1,β=b2-b1。使用EViews软件的估估计过程程如下::CREATEU16建立工作作文件DATAYX(输入1998、1999年消费支支出和收收入的数数据,1~8期为1998年资料,,9~16期为1999年资料))1999年1998年SMPL18样本期调调为1998年GENRD1=0输入虚拟拟变量的的值SMPL916样本期调调为1999年GENRD1=1输入虚拟拟变量的的值SMPL116样本期调调至1998~1999年GENRXD=X*D1生成XD的值LSYCXD1XD利用混合合样本估估计模型型估计结果果为:操作演示示根据t检验,D、XD的回归系系数均不不显著,,即认为为α=a2-a1=0,β=b2-b1=0;这表明明1998年、1999年我国城城镇居民民消费函函数并没没有显著著差异。。因此,,可以将将两年的的样本数数据合并并成一个个样本,,估计城城镇居民民的消费费函数。。对应t统计量的的值R2的值调整的R2值练习题::1、简述虚虚拟变量量的引入入方式及及其影响响。2、设置虚拟拟变量时时应遵守守哪些原原则?3、虚拟变变量有哪哪些特殊殊应用。。概念:同时含有有一般解解释变量量与虚拟拟变量的的模型称称为虚拟拟变量模模型或者者方差分分析(analysis-ofvariance:ANOVA)模型。一个以性性别为虚虚拟变量量考察企企业职工工薪金的的模型::其中:Yi为企业职职工的薪薪金,Xi为工龄,,Di=1,若是男性性,Di=0,若是女性性。二、虚拟拟变量的的引入虚拟变量量做为解解释变量量引入模模型有两两种基本本方式::加法方式式和乘法方式式。企业男职职工的平平均薪金金为:上述企业业职工薪薪金模型型中性别别虚拟变变量的引引入采取取了加法法方式。。在该模型型中,如如果仍假假定E(i)=0,则企业女职职工的平平均薪金金为:1、加法法方式几何意义义:假定2>0,则两个个函数有有相同的的斜率,,但有不不同的截截距。意意即,男男女职工工平均薪薪金对教教龄的变变化率是是一样的的,但两两者的平平均薪金金水平相相差2。可以通过过传统的的回归检检验,对对2的统计显显著性进进行检验验,以判判断企业业男女职职工的平平均薪金金水平是是否有显显著差异异。02又例:在横截截面数据据基础上上,考虑虑个人保保健支出出对个人人收入和和教育水水平的回回归。教育水平平考虑三三个层次次:高中中以下,,高中,大学及其其以上模型可设设定如下下:这时需要要引入两两个虚拟拟变量::在E(i)=0的初始假假定下,,高中以以下、高高中、大大学及其其以上教教育水平平下个人人保健支支出的函函数:高中以下下:高中:大学及其其以上::假定3>2,其几何何意义::还可将多多个虚拟拟变量引引入模型型中以考考察多种种“定性性”因素素的影响响。如在上述职职工薪金金的例中中,再引引入代表表学历的的虚拟变变量D2:(x工龄,D1性别)本科及以以上学历历本科以下下学历职工薪金金的回归归模型可可设计为为:女职工本本科以下下学历的的平均薪薪金:女职工本本科以上上学历的的平均薪薪金:于是,不不同性别别、不同同学历职职工的平平均薪金金分别为为:男职工本本科以下下学历的的平均薪薪金:男职工本本科以上上学历的的平均薪薪金:2、乘法法方式加法方式式引入虚虚拟变量量,考察察:截距的不不同,许多情况况下:往往往是斜斜率也有有变化,,或斜率、、截距同同时发生生变化。斜率的变变化可通通过以乘乘法的方方式引入入虚拟变变量来测测度。例:根据消费费理论,,消费水水平C主要取决决于收入入水平Y,但在一个个较长的的时期,,人们的的消费倾倾向会发发生变化化,尤其其是在自自然灾害害、战争争等反常常年份,,消费倾倾向往往往出现变变化。这这种消费费倾向的的变化可可通过在在收入的的系数中中引入虚虚拟变量量来考察察。这里,虚虚拟变量量D以与X相乘的方方式引入入了模型型中,从从而可用用来考察察消费倾倾向的变变化。假定E(i)=0,,上述模型型所表示示的函数数可化为为:正常年份份:反常年份份:如,设消费模型型可建立立如下::当截距与与斜率发发生变化化时,则则需要同同时引入入加法与与乘法形形式的虚虚拟变量量。例,考察1990年年前后的的中国居居民的总总储蓄--收入关关系是否否已发生生变化。。下表中给出出了中国国1979~2001年以城城乡储蓄蓄存款余余额代表表的居民民储蓄以以及以GNP代表的居居民收入入的数据据。以Y为储蓄,,X为收入,,可令::1990年前::Yi=1+2Xi+1ii=1,,2…,,n11990年后:Yi=1+2Xi+2ii=1,,2…,,n2则有可能能出现下下述四种种情况中中的一种种:(1)1=1,且2=2,即两个个回归相相同,称称为重合回归归(CoincidentRegressions);(2)11,但2=2,即两个个回归的的差异仅仅在其截截距,称称为平行回归归(ParallelRegressions);(3)1=1,但22,即两个个回归的的差异仅仅在其斜斜率,称称为汇合回归归(ConcurrentRegressions);(4)11,且22,即两个个回归完完全不同同,称为为相异回归归(DissimilarRegressions)。可以运用用邹氏结构构的稳定定性检验验。这一问问题也可可通过引引入乘法法形式的的虚拟变变量来解解决。将n1与n2次观察值值合并,,并用以以估计以以下回归归:Di为引入的的虚拟变变量:于是有::可分别表表示1990年年后期与前期的储蓄函函数。在统计检检验中,,如果4=0的假设被被拒绝,,则说明明两个时时期中储储蓄函数数的斜率率不同。。具体的回回归结果果为:由3与4的t检验可知知:参数数显著地地不等于于0,强强烈示出出两个时时期的回回归是相相异的,,储蓄函数数分别为为:(-6.11)(22.89)(4.33)(-2.55)=0.98361990年前:1990年后:3、临
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新疆医科大学《三维动画MAYA》2023-2024学年第一学期期末试卷
- 石家庄财经职业学院《大学语三》2023-2024学年第二学期期末试卷
- 安徽艺术职业学院《无线通信网络规划与优化》2023-2024学年第一学期期末试卷
- 四川传媒学院《影视栏目包装专题设计》2023-2024学年第一学期期末试卷
- 广西壮族河池市金城江区2024-2025学年数学四下期末综合测试模拟试题含解析
- 马鞍山职业技术学院《材质渲染综合应用》2023-2024学年第二学期期末试卷
- 中国2025年黄金产业布局:供需两端驱动产业升级
- 丙烷管道跨接施工方案
- 上海市浦东新区2024-2025学年八年级(上)月考生物试卷(12份)(含解析)
- 路灯安装工程施工方案
- 2025年湖南铁道职业技术学院单招职业技能测试题库带答案
- 部编高教版2023·职业模块 中职语文 2.《宁夏闽宁镇:昔日干沙滩今日金沙滩》 课件
- 安全环保职业健康法律法规清单2024年
- (正式版)YBT 6328-2024 冶金工业建构筑物安全运维技术规范
- 2022年袋鼠数学竞赛真题一二年级组含答案
- 人工智能引论智慧树知到课后章节答案2023年下浙江大学
- 银行保洁服务投标方案(技术标)
- VISIO图标大全(完整版)
- 电梯大修标准(共5页)
- 国家专项计划报考资格申报表
- 清铃揿针介绍
评论
0/150
提交评论