第八章虚拟变量回归new_第1页
第八章虚拟变量回归new_第2页
第八章虚拟变量回归new_第3页
第八章虚拟变量回归new_第4页
第八章虚拟变量回归new_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章虚拟变量回归计量经济学1在对在校学生的消费行为进行的调查中,发现在校生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。

显然,男女生在消费上存在差异。为了了解男、女生的消费支出结构差异,应当如何建立模型?面临的问题:如何把男女生这样的非数量变量引

入方程?

引子:男女大学生消费真有差异吗?

2

问题的一般性描述在实际建模中,一些定性变量具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。如何对非定量因素进行回归分析?采用“虚拟变量”对定性变量进行量化一种思路。3第八章虚拟变量回归

本章主要讨论:●虚拟变量及其作用●虚拟变量设定●虚拟解释变量的回归●虚拟被解释变量的回归(选讲,不包括)4一、定义反映品质指标变化、数值只取0和1的人工变量,用符号D来表示。

如:城镇居民农村居民销售旺季销售淡季政策紧缩政策宽松本科以上学历本科以下学历变量的划分应遵循穷举与互斥原则。第一节虚拟变量及其作用5二、作用⑴可以描述和测量定性因素的影响。⑵能够正确反映经济变量之间的相互关系,提高模型的精度。⑶便于处理异常数据。即将异常数据作为一个特殊的定性因素

异常时期正常时期6一、虚拟变量的引入方式

(1)加法方式Yi=a+bxi+αDi+εi等价为:当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=(a+α)+bxi+εiD=0D=1aa+αα以加法方式引入,反映定性因素对截距的影响

第二节虚拟变量的设定(2)乘法方式

Yi=a+bxi+βXDi+εi其中:XDi=Xi*Di,上式等价于:当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=a+(b+β)xi+εiD=0D=1aβ以乘法方式引入,可反映定性因素对斜率的影响,系数β描述了定性因素的影响程度。8(3)一般方式同时用加法与乘法方式引入虚拟变量,然后再利用t检验判断α、β是否显著的不等于零,进而确定虚拟变量的具体引入方式。

【例】现有1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料。

9观察相关图

从相关图可以看出,前3个样本点与后5个样本点存在较大差异,因此,可设置虚拟变量反映“收入层次”:中高收入家庭低收入家庭10将我国城镇镇居民的彩彩电需求函函数设成::Yi=a+bxi+αDi+βXDi+εiDATAD1(由于D是是EViews软件件的保留字字,所以将将虚拟变量量取名为D1;另外外,此时也也可以用SMPL和和GENR命令直接接生成D1变量)GENRXD=X*D1生生成变量XDLSYYCXXD1XD估估计需需求函数结果如下图图所示:11我国城镇居居民彩电需需求函数的的估计结果果为:对应的t统统计量值R2的值调整的R2值SE的值结果表明不同收入家庭对彩电电的消费需需求,在截截距和斜率率上都存在在着明显差差异。12低收入家庭庭:此例说明了了三个问题题:①如何设置和和在模型中中引入虚拟拟变量;②如何测量定定性因素((即收入层层次)的影影响;③如何区分不不同类型的的模型(即即需求函数数)。中高收入家家庭:13二、虚拟变变量的设置置原则⑴一个因因素多个类类型对于有m个个不同属性性的定性因因素,应该该设置m-1个虚拟拟变量来反反映该因素素的影响。例如,设公司职职员的年薪薪与工龄和和学历有关关。学历分分成三种::大专以下下、本科、、研究生。。为反映““学历”的的影响,,应该设置置两个虚拟拟变量:本科其他研究生其他Yi=a+bxi+εi大专以下下(D1=D2=0)Yi=(a+α1)+bxi+εi本科(D1=1,D2=0)Yi=(a+α2)+bxi+εi研究生(D1=0,D2=1)而将年薪薪模型取取成(假假设以加加法方式式引入)):Yi=a+bxi+α1D1i+α2D2i+εi其等价于于:三类年薪薪函数的的差异情情况如下下图所示示:大专以下本科研究生工龄年薪α2-α1

α1

D=设置虚拟拟变量D或增设设D3行吗?研究生其他(2)多多个因素素各两种种类型如果有m个定性性因素,,且每个个因素各各有两个个不同的的属性类类型,则则引入m个个虚拟变变量。例如,研究居居民住房房消费函函数时,,考虑到到城乡的的差异以以及不同同收入层层次的影影响,将将消费函函数取成成:yi=a+bxi+α1D1i+α2D2i+εi其中y,x分分别是居居民住房房消费支支出和可可支配收收入,虚虚拟变量量设为::这样可以以反映各各类居民民家庭的的住房消消费情况况:农村居民城镇居民高收入家庭低收入家庭城市低收收入家庭庭(D1=0,,D2=0)城市高收收入家庭庭(D1=0,D2=1)农村低收收入家庭庭(D1=1,D2=0)农村高收收入家庭庭(D1=1,D2=1)思考:若若是多因因素、多多个属性性水平的的问题,,如何设设置?一、调整整季节波波动例如,用季度度数据分分析某公公司利润润y与销销售收入入x之间间的相互互关系时时,为研研究四个个季度的的季节性性影响,,引入三三个虚拟拟变量((设第1季度为为基础类类型)::利润函数数可取为为:Yi=a+bxi+α1D1i+α2D2i+α3D3i+εi第i+1季度i=1,2,3其他季度第三节虚虚拟拟变量的的特殊应应用二、检验验模型结结构的稳稳定性设根据两两个样本本估计的的回归模模型分别别为:样本1::Yi=a1+b1xi+εi样本2::Yi=a2+b2xi+εi估计模型型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi其中,XDi=xi*Di。样本2样本1设置虚拟拟变量::20利用t检检验判断断D、XD系数数的显著著性,得得到四种种检验结结果:(1)a2=a1,b2=b1,两个回回归模型型没有显显著差异异。(2)a2≠a1,b2=b1,两个回回归模型型之间的的差异仅仅仅表现现在截距距上。(3)a2=a1,b2≠b1,两个回回归模型型的截距距相同,,但斜率率存在显显著差异异。(4)a2≠a1,b2≠b1,表明两两个回归归模型完完全不同同。第(1))种情况况下模型型结构是是稳定的的,其余余情况都都表明模模型结构构不稳定定。重合回归归平行回归归汇合回归归相异回归归21三、分段段回归设虚拟变变量为::分段回归归模型设设置成::Yi=a+bxi+β(xi-x*)Di+εi其中,x*是已知的的临界水水平(分分段点))。这样各段段的函数数为:Yi=a+bxi+εix<x*Yi=(a-β)+(b+β)xi+εix>x*x>x*x<x*使用虚拟拟变量能能如实描描述不同同阶段的的经济关关系,又又未减少少估计模模型时样样本容量量,保证证了估计计精度。。22四、混合合回归【例】现有我国国城镇居居民1998年年、1999年年全年人人均消费费支出和和可支配配收入的的统计资资料。试试使用混混合样本本数据估估计我国国城镇居居民消费费函数。。设1998年、、1999年我我国城镇镇居民消消费函数数分别为为:1998年:Yi=a1+b1xi+εi1999年:Yi=a2+b2xi+εi能否将变变量的时时序数据据和横截截面数据据混合建建模为比较两两年的消消费函数数是否有有显著差差异,设设置虚拟拟变量::并且合并并两年的的数据,,估计以以下模型型:Yi=a1+b1xi+αDi+βXDi+εi其中α=a2-a1,β=b2-b1。1999年1998年24使用EViews软软件的估估计过程程如下:CREATEU16建建立工工作文件件DATAYX(输入1998、1999年年消费支支出和收收入的数数据,1~8期期为1998年年资料,,9~16期为为1999年资资料)SMPL18样样本期调调为1998年年GENRD1=0输输入入虚拟变变量的值值SMPL916样样本期调调为1999年GENRD1=1输输入虚拟变变量的值25SMPL116样样本期调至至1998~1999年年GENRXD=X*D1生生成XD的值值LSYCXD1XD利利用混合样样本估计模型型t统计量R2的值调整的R2值值估计结果为::操作演示26第四节案案例分析为了考察改革革开放以来中中国居民的储储蓄存款与收收

入的关系系是否已发生生变化,以城城乡居民人民民币储

蓄存存款年底余额额代表居民储储蓄()),以国民总总收入GNI代表城乡居民民收入,分析析居民收入对对储蓄存款影影响的数量关关系,并建立立相应的计量量经济学模型型。27表8.1国国民总总收入与居民民储蓄存款单单位位:亿元

年份国民总收入

(GNI)城乡居民人民币储蓄存款年底余额(

)城乡居民人民币储蓄存款增加额()年份国民总收入

(GNI)城乡居民人民币储蓄存款年底余额()城乡居民人民币储蓄存款增额(

)19783624.1210.6NA199121662.59241.62121.819794038.228170.4199226651.911759.42517.819804517.8399.5118.5199334560.515203.53444.119814860.3532.7124.219944667021518.86315.319825301.8675.4151.7199557494.929662.38143.519835957.4892.5217.1199666850.538520.88858.5数据来源:《《中国统计年年鉴2004》,中国统统计出版社。。表中“城乡乡居民人民币币储蓄存款年年增加额”为为年鉴数值,,与用年底余余额计算的数数值有差异。。28表8.1国国民总总收入与居民民储蓄存款((续)单单位:亿元年份国民总收入

(GNI)城乡居民人民币储蓄存款年底余额(

)城乡居民人民币储蓄存款增加额(

)年份国民总收入

(GNI)城乡居民人民币储蓄存款年底余额()城乡居民人民币储蓄存款增加额(

)19847206.71214.7322.2199773142.746279.8775919858989.11622.6407.9199876967.253407.57615.4198610201.42237.6615199980579.459621.86253198711954.53073.3835.720008825464332.44976.7198814922.33801.5728.2200195727.973762.49457.6198916917.85146.91374.22002103935.386910.613233.2199018598.47119.81923.42003116603.2103617.716631.929为了研究1978—2003年期间城乡居居民储蓄存款款随收入的变变化规律是否否有变化,考考证城乡居民民储蓄存款、、国民总收入入随时间的变变化情况,如如下图所示::30从上图中,尚尚无法得到居居民的储蓄行行为发生明显显改变的详尽尽信息。若取取居民储蓄的的增量()),并作作时序图(见见左下图):31从居民储蓄增增量图(上页页左图)可以以看出,城乡乡居民的储蓄蓄行为表现出出了明显的阶阶段特征:在在1996年年和2000年有两个明明显的转折点点。再从城乡乡居民储蓄存存款增量与国国民总收入之之间关系的散散布图看(见见上页右图)),也呈现出出了相同的阶阶段性特征。。32为了分析居民民储蓄行为在在1996年年前后和2000年前后后三个阶段的的数量关系,,引入虚拟变变量和和。。和的选选择,是以1996、2000年两两个转折点作作为依据,并并设定了如下下以加法和乘乘法两种方式式同时引入虚虚拟变量的的的模型:其中:33对上式进行回回归后,有::34即有:由于各个系数数的t检验均均大于2,表表明各解释变变量的系数显著地不不等于0,居居民人民币储储蓄存款年增增加额的回归模型型分别为:35这表明三个时时期居民储蓄蓄增加额的回回归方程在统统计意义上确确实是不相同同的。1996年以前收收入每增加1亿元,居民民储蓄存款的的平均增加0.1445亿元;在2000年以以后,则为0.4133亿元,已发发生了很大变变化。36上述模型与城城乡居民储蓄蓄存款与国民民总收入之间间的散布图是吻吻合的,与当当时中国的实实际经济运行行状况也是相符符的。需要指出的是是,在上述建建模过程中,,主要是从教教学的目的出发发运用虚拟变变量法则,没没有考虑通货货膨胀因素。而而在实证分析析中,储蓄函函数还应当考考虑通货膨胀因因素。371.虚拟变量量是人工构造造的取值为0和1的作为属性变变量代表的变变量。2.虚拟变量量个数的设置置有一定规则则:在有截距距项的模型中中,若定性因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论