




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章虚拟变量一、虚拟变量及其作用
二、虚拟变量的设定三、虚拟变量的特殊应用四、虚拟被解释变量课外练习【教学目的及要求】参考文献了解虚拟变量的意义和作用,掌握虚拟解释变量的引入方式与设置原则,掌握EViews软件的相关应用。掌握虚拟解释变量在调整季节波动、检验模型的稳定性、分段回归和混合回归等方面的特殊应用。了解线性概率模型、Logit模型和Probit模型的基本思想和估计方法。
教学目的及要求
1.定义反映品质指标变化、数值只取0和1的人工变量,用符号D来表示。
如:城镇居民农村居民销售旺季销售淡季政策紧缩政策宽松本科以上学历本科以下学历变量的划分应遵循穷举与互斥原则。一、虚拟变量(dummy)及其作用2.作用⑴可以描述和测量定性因素的影响。
⑵能够正确反映经济变量之间的相互关系,提高模型的精度。⑶便于处理异常数据。
即将异常数据作为一个特殊的定性因素
异常时期正常时期1.虚拟变量的引入方式
(1)加法方式
Yi=a+bxi+αDi+εi
等价为:当Di=0时:Yi=a+bxi+εi
当Di=1时:Yi=(a+α)+bxi+εiD=0D=1aa+αα以加法方式引入,反映定性因素对截距的影响
二、虚拟变量的设定(2)乘法方式
Yi=a+bxi+βXDi+εi其中:XDi=Xi*Di,上式等价于:当Di=0时:Yi=a+bxi+εi
当Di=1时:Yi=a+(b+β)xi+εiD=0D=1aβ以乘法方式引入,可反映定性因素对斜率的影响,系数β描述了定性因素的影响程度。(3)一般方式同时用加法与乘法方式引入虚拟变量,然后再利用t检验判断α、β是否显著的不等于零,进而确定虚拟变量的具体引入方式。
【例7】教材P126表3-8列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料。
观察相关图操作演示
从相关图可以看出,前3个样本点与后5个样本点存在较大差异,因此,可设置虚拟变量反映“收入层次”:中高收入家庭低收入家庭将我国城镇居民的彩电需求函数设成:
Yi=a+bxi+αDi+βXDi+εiDATAD1(由于D是EViews软件的保留字,所以将虚拟变量取名为D1;另外,此时也可以用SMPL和GENR命令直接生成D1变量)
GENR XD=X*D1 生成变量XD LSYCXD1XD 估计需求函数结果如下图所示:我国城镇居民彩电需求函数的估计结果为:
对应的t统计量值R2的值调整的R2值SE的值
结果表明不同收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异。低收入家庭:
此例说明了三个问题:①如何设置和在模型中引入虚拟变量;②如何测量定性因素(即收入层次)的影响;③如何区分不同类型的模型(即需求函数)。
中高收入家庭:
2.虚拟变量的设置原则
⑴一个因素多个类型
对于有m个不同属性的定性因素,应该设置m-1个虚拟变量来反映该因素的影响。
例如,设公司职员的年薪与工龄和学历有关。学历分成三种:大专以下、本科、研究生。为反映“学历”的影响,应该设置两个虚拟变量:
本科其他研究生其他
Yi=a+bxi+εi
大专以下(D1=D2=0)Yi=(a+α1)+bxi+εi
本科(D1=1,D2=0)Yi=(a+α2)+bxi+εi
研究生(D1=0,D2=1)而将年薪模型取成(假设以加法方式引入):
Yi=a+bxi+α1D1i+α2D2i+εi其等价于:三类年薪函数的差异情况如下图所示:大专以下本科研究生工龄年薪α2-α1
α1
D=设置虚拟变量D或增设D3行吗?研究生其他(2)多个因素各两种类型
如果有m个定性因素,且每个因素各有两个不同的属性类型,则引入m个虚拟变量。
例如,研究居民住房消费函数时,考虑到城乡的差异以及不同收入层次的影响,将消费函数取成:yi=a+bxi+α1D1i+α2D2i+εi
其中y,x分别是居民住房消费支出和可支配收入,虚拟变量设为:这样可以反映各类居民家庭的住房消费情况:
农村居民城镇居民高收入家庭低收入家庭城市低收入家庭(D1=0,D2=0)
城市高收入家庭(D1=0,D2=1)
农村低收入家庭(D1=1,D2=0)
农村高收入家庭(D1=1,D2=1)思考:若是多因素、多个属性水平的问题,如何设置?1.调整季节波动例如,用季度数据分析某公司利润y与销售收入x之间的相互关系时,为研究四个季度的季节性影响,引入三个虚拟变量(设第1季度为基础类型):利润函数可取为:
Yi=a+bxi+α1D1i+α2D2i+α3D3i+εi第i+1季度i=1,2,3其他季度三、虚拟变量的特殊应用2.检验模型结构的稳定性
设根据两个样本估计的回归模型分别为:样本1:Yi=a1+b1xi+εi
样本2:Yi=a2+b2xi+εi
估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi其中,XDi=xi*Di。样本2样本1
设置虚拟变量:
利用t检验判断D、XD系数的显著性,得到四种检验结果:(1)a2=a1,b2=b1,两个回归模型没有显著差异。(2)a2≠a1,b2=b1,两个回归模型之间的差异仅仅表现在截距上。(3)a2=a1,b2≠b1,两个回归模型的截距相同,但斜率存在显著差异。(4)a2≠a1,b2≠b1,表明两个回归模型完全不同。第(1)种情况下模型结构是稳定的,其余情况都表明模型结构不稳定。重合回归平行回归汇合回归相异回归3.分段回归
设虚拟变量为:
分段回归模型设置成:
Yi=a+bxi+β(xi-x*)Di+εi
其中,x*是已知的临界水平(分段点)。这样各段的函数为:
Yi=a+bxi+εi
x<x*Yi=(a-β)+(b+β)xi+εi
x>x*x>x*x<x*使用虚拟变量能如实描述不同阶段的经济关系,又未减少估计模型时样本容量,保证了估计精度。
4.混合回归【例8】教材P143表3-9为我国城镇居民1998年、1999年全年人均消费支出和可支配收入的统计资料。试使用混合样本数据估计我国城镇居民消费函数。设1998年、1999年我国城镇居民消费函数分别为:
1998年:Yi=a1+b1xi+εi1999年:Yi=a2+b2xi+εi
能否将变量的时序数据和横截面数据混合建模为比较两年的消费函数是否有显著差异,设置虚拟变量:
并且合并两年的数据,估计以下模型:
Yi=a1+b1xi+αDi+βXDi+εi其中α=a2-a1,β=b2-b1。1999年1998年使用EViews软件的估计过程如下:
CREATEU16建立工作文件
DATAYX(输入1998、1999年消费支出和收入的数据,1~8期为1998年资料,9~16期为1999年资料)
SMPL18样本期调为1998年GENRD1=0输入虚拟变量的值SMPL916样本期调为1999年GENRD1=1输入虚拟变量的值SMPL116样本期调至1998~1999年GENRXD=X*D1生成XD的值LSYCXD1XD利用混合样本估计模型t统计量R2的值调整的R2值估计结果为:操作演示1.简述虚拟变量的引入方式及其影响。2.设置虚拟变量时应遵守哪些原则?3.虚拟变量有哪些特殊应用。4.教材P187第18-21题课外练习参考文献1.张晓峒.计量经济学软件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2031年中国涂油池行业投资前景及策略咨询研究报告
- 2025至2031年中国水座行业投资前景及策略咨询研究报告
- 2025至2031年中国树脂高速可弯曲砂轮(软片)行业投资前景及策略咨询研究报告
- 2025至2031年中国智能型钢丝测力仪行业投资前景及策略咨询研究报告
- 桥梁结构健康监测与评估行业跨境出海项目商业计划书
- 武术道场企业制定与实施新质生产力项目商业计划书
- 2025至2031年中国地毯垫层用再生海绵行业投资前景及策略咨询研究报告
- 毽球生产工厂行业跨境出海项目商业计划书
- 环保教材设计与出版行业深度调研及发展项目商业计划书
- 电子竞技选手职业企业制定与实施新质生产力项目商业计划书
- 电梯机房操作规程
- 鲁科版四年级下册英语 复习
- 餐饮业劳务合同
- 广联达BIM智慧工地
- 安全生产教育培训记录表
- 电梯参数及配置要求
- -高考体育单招真题现代文专项阅读汇编(含答案)-备战2023届高考体育单招语文一轮复习之现代文阅读复习之一
- GB/T 3733.1-1983卡套式端直通管接头
- GB/T 1689-1998硫化橡胶耐磨性能的测定(用阿克隆磨耗机)
- GA/T 954-2011法庭科学工具痕迹中凹陷痕迹的检验规范
- 入网安评基线核查常用检查项
评论
0/150
提交评论