




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章虚拟变量回归
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校
生的消费行为呈现多元化的结构。人际交往消费、
手机类消费、衣着类消费、化妆品类消费、电脑类
消费、旅游类消费占有较大的比例;而食品类消费、
学习用品类消费不突显。
显然,男女生在消费上存在差异。为了了解男、女
生的消费支出结构差异,应当如何建立模型?
面临的问题:如何把男女生这样的非数量变量引
入方程?
2
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要
影响。例如,研究某个企业的销售水平,产业属性
(制造业、零售业)、所有制(私营、非私营)、
地理位置(东、中、西部)、管理者的素质、不同
的收入水平等是值得考虑的重要影响因素,但这些
因素共同的特征是定性描述的。二
如何对非定量因素进行回归分析?
采用“虚拟变量”对定性变量进行量化一种思路。
产,第八章虚拟变量回归
本章主要讨论:
・虚拟变量
・虚拟解释变量的回归
・虚拟被解释变量的回归(选讲,不包括)
令第一节虚拟变量
■■——J
本节基本内今:
•基本概念
・虚拟变量设置规则
5
一、基本概念
定量因素:可直接测度、数值性的因素。
定性因素:属性因素,表征某种属性存在与否的
非数值性的因素。
基本思想:
直接在回归模型中加入定性因素存在诸多的困难
(那些困难?),是否可将这些定性因素进行量
化,以达到定性因素能与定量因素有着相同作用
之目的。
6
虚拟变量的定义
计量经济学中,将取值为o和1的人工变量称为虚
拟变量。虚拟变量也称:哑元变量、定性变量等
等。通常用字母D或DUM加以表示(英文中虚拟
或者哑元Dummy的缩写)。
对定性变量的量化可采用虚拟变量的方式实现。
二、虚拟变量设置规则
虚拟变量的设置规则涉及三个方面:
1.“0”和“1”选取原则
2.属性(状态、水平)因素与设置虚拟变量
数量的关系二
二3.虚拟变量在回归分析中的角色以及作用等
方面的问题
8
“0”和“1”选取原则
•虚拟变量取“I”或“0”的原则,应从分析问
题的目的出发予以界定。
•从理论上讲,虚拟变量取“0”值通常代表比较
的基础类型;而虚拟变量取“1”值通常代表被
比较的类型。
“0”代表基期(比较的基础,参照物);
“1”代表报告期(被比较的效应)。
例如,比较收入时考察性别的作用。当研究男性收入是否
高于女性时,是将女性作为比较的基础(参照物),故有
男性为“1”,女性为“0”O
例111男1改革开放以后
⑴。二<(2)D=
1°女0改革开放以前
1天气阴11天气雨
(3)D/=()D2=<4
10其他0其他
问题:
为何只选0、1,选2、3、4行吗?为什么?
10
属性的状态(水平)数与虚拟变量
数量的关系
定性因素的属性既可能为两种状态,也可能为多种
状态。例如,性别(男、女两种)、季节(4种状
态),地理位置(东、中、西部),行业归属,所
有制,收入的分组等。
-1,0)天气阴
I
如:(。1,。2)=<(0,1)天气雨
I(0,0)其他
11
虚拟变量数量的设置规则
1.若定性因素具有111个(加22)相互排斥属性(或
几个水平),当回归模型有截距项时,只能引入
m-1个虚拟变量;
2.当回归模型无截距项时,则可引入m个虚拟变
量;否则,就会陷入“虚拟变量陷阱”。(为什二
么?)
广、个例子(虚拟变量陷阱)
研究居民住房消费支出匕和居民可支配收入X,之间的
数量关系。回归模型的设定为:Yi=ao+^iXi+ui()
现在要考虑城镇居民和4村居民之间的差异,如何办?
为了对“城镇居民”、“农村居民”进行区分,分析
各自在住房消费支出Y上的差异,设Dli=l为城镇;
Dli=0为%村,则模型为
Yi=()+iXi+1D1+ui(2)
(模型有截距,“居民属性”定性变量只有两个相互排斥
的属性状态(加=2),故只设定一个虚拟变量。)
产飞
若对两个相互排斥的属性“居民属性”,仍然
引入〃22个虚拟变量,则有
fl城镇居民11农村居民
Du=\
lo农村居民10城镇居民
则模型(1)为
Yi0\Xi1D12。2Ui(3)
则对任一家庭都有:D\+Di=ID1+D2-I=0,
即产生完全共线,陷入了“虚拟变量陷阱”。
“虚拟变量陷阱”的实质是:完全多重共线性。
虚拟变量在回归模型中的角色
z虚拟变量既可作为被解释变量,也可作为解释二
变量,分别称其为虚拟被解释变量和虚拟解释变量。
虚拟被解释变量的研究是当前计量经济学研究的
前沿领域,如MacFadden、Heckmen等人的微观计
二量经济学研究,大量涉及到虚拟被解释变量的分析。
本课程只是讨论虚拟解释变量的问题
第二节虚拟解释变量的回归
本节基本内<:
・加法类型
・乘法类型
・虚拟解释变量综合应用
16
产飞
在计量经济学中,通常引入虚拟变量的方式分为
加法方式和乘法方式两种:即
Yt=ao+PXtut卜aiD
Yt=a+pi/+必+
原模型:匕=a+®Ei+ui
加法方式引入a=ao+ociD
乘法方式引入0=01+02。
实质:加法方式引入虚拟变量改变的是截距;
乘法方式引入虚拟变量改变的是斜率。
I、加法类型
以加法方式引入虚拟变量时,主要考虑的问二
题是定性因素的属性和引入虚拟变量的个数。
分为四种情形讨论:
(1)解释变量只有一个定性变量而无定量变量,
而且定性变量为两种相互排斥的属性;二
(2)解释变量分别为一个定性变量(两种属性)
和一个定量解释变量;
18
产飞
(3)解释变量分别为一个定性变量(两种以上属
性)和一个定量解释变量;
(4)解释变量分别为两个定性变量(各自分别是
两种属性)和一个定量解释变量;
思考:
四种加法方式引入虚拟变量会产生什么效应?
fqClJ一个两种属性定性斛羚变量而
无定量变量的情形
模型形式:Yi/(Di)i0
例如:19/0\1
11城市
其中:Di=农村(比较的基础:农村)
Q那幻E(H|A=1)==ao+ai)
E(H|D=6)
1=ao
'匕=ao+ai)jii城市
VYi=^0+|Llz
农村
20
/飞(2)一个定性斛羚变量(两种属性)
和一个定量斛释变量的情形
模型形式Yi=f(Di,Xi)+/Lti^>d=a0+aiDz
例如:Yi=a0+aiA+px,+仅
X
共同的特征:战距发生改变C?J
22
一个定性解稼变量(两种以上
属性)和一个定量斛分变量的情形
模型形式Yi=f(X19I92,)+*,
(如:民族有§潦中特性;季度有4种特性)
例如:啤酒售量工人均收入X、季度。;
匕=a0+aiDi+a2。2+a3。3+0X,+囚
f1一季度「1二季度
其中:D\—<Z)2=<其它
lo其它10
(1三季度
。3=《
10其它
23
一季度:E(H|X1,O1=1,Di=D3=0)=ao+oci)
土壁ft:E(匕|X1,02=l,Z)(=Z)3=0)=(ao+a2)
WM®:E(Yi|Xl,D3=1,Di=D2=0)=(a0+a3)
£>2=03=0)=ao+pX
’(基准:四季度)
24
两个定性解羚变量(均为两种
属性)和一个定量斛分变量的情形
例:分析啤酒销售量丫受到人均收入X、季节Q
以及居民属性。2的影响。
Yj—CXQ+ocyF)Y+a?力2+/3Xj+内
1夏季城市
其中:E\=
0冬季农村
(比较的基础一冬季、农村)
25
夏季、城市居民
EYi\Xi,D\1,。2101
2)Xi
夏季、农村居民(
EYi\XifD\=l,Z)2=0=0+1)
卷季、城市居民,
(+
EYi\Xi,D\0,。21(0
冬毅)柴村唐'民
EYi\Xi,D\0,D200
Xi
26
Pix—1zDo—j
Di=1,\)2=0
Di=0,Z)2=1
eDi=0,D2=0
X
上述图形的前提条件是什
27
运用OLS得到回归结果,再用t检验讨论因素
是否对模型有影响。
加法方式引入虚拟变量的一般表达式:
匕=CCO+0C1O1/+OC2D2t+...+akDkt+pXt+ut
基本分析方法:条件期望。二
E(Yt/Dit,Dzt,・・.,Dkt)=oto+otiDit+ot2D2t+…+otkDkt
+pXt
28
加法方式引入虚拟变量的主要作用为:
1.在有定量解释变量的情形下,主要改变方程
截距;
2.在没有定量解释变量的情形下,主要用于方
差分析。
29
二、乘法类型
基本思想
以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟
Xi
解释变量与其它解释变量的乘积,作为新的解释变量出现在
模型中,以达到其调整设定模型斜率系数的目的。或者将模
型斜率系数表示为虚拟变量的函数,以达到相同的目的。
乘法引入方式:
(1)截距不变;
(2)截距和斜率均发生变化;
分析手段:仍然是条件期望。
30
C1J前距不变的情形
模型形式:
Yt=fXtfDtXtut,
例:球究消费娑出Y受收入X、年份状况D的影响
Yi=a+^iXt+^2(DtXt)+\it
\1反常年份
其中:丫-消费支出;X—收入;Dt=\
[0正常年份
反常年份E(Yt\XtfDt=1)=a+(^i+^2)Xt
正常年份E(Yt\XtfDt=O)=a+^i
始正常年份的基础上进行比较,(只有斜率系数发生改变)。
(2)就距和斜率均发生变化
模型形式:
YifXt.Dt.DtXto\D,
11D
例,同样研究消费支出Y、收入X、年份状况D间的影
响关系。
Yt=ao+01X/+aiD+p2(DtXt)+|i/
fl反常年份
其中:y-消费支出;x-收入;Dt=]
lo正常年份
反常年份E(川XjDt=1)=(ao+ai)+(伙+P2)Xz
正常年份E(H|X/,D=O)=a+PiX/
在正常年份基础上比较,截距和斜率系数都改变,为什么?
32
广?不同截距、斜率的组合刎
--------------------------►-------------------------------------------------------------------------------------------►
重合回归:截距斜率均相同平行回归:截距不同斜率相同
ib
一J1:
共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同
33
三、虚拟斛释变量综合应用
所谓综合应用是指将引入虚拟解释变量的加法方
式、乘法方式进行综合使用。
基本分析方式仍然是条件期望分析。
本课主要讨论
-(1)结构变化分析;二
2(2)交互效应分析;2
(3)分段回归分析
34
C1J结构变化分析
结构变化的实质是检验所设定的模型在样本期内
是否为同一模型。显然,平行回归、共点回归、
不同的回归三个模型均不是同一模型。
平行回归模型的假定是斜率保持不变(加法类型,
包括方差分析);
共点回归模型的假定是截距保持不变(乘法类型,
又被称为协方差分析);
不同的回归的模型的假定是截距、斜率均为变动
的(加法、乘法类型的组合)。
35
例:比较改革开放前、后我国居民(平均)“储
蓄一收入”总量关系是否发生了变化?
模型的设定形式为:
匕=al+a20/+P1X/+p2(DiXt)+以(1)
其中:Yt为储蓄总额,Xt为收入总额。
fl改革开放后
D-\
lo改革开放前
36
回归方程:
改革开放后E(7r|Xt,Z)=1)=al+a2)(01+02)X.(2)
(+
(3)
改革开放前E(Yt|Xt,0=0)=al+。1X,
显然,只要。2、2不同时为零,上述模型就能刻画
改革开放前后我国居民储蓄收入模型结构是否发生
变化。
37
产飞
问题:
1,本例中,平行、共点回归、不同的回归三模型
的经济学背景解释是什么?
2.如何进行结构变化判断?
3.是否可对(2)、(3)分别进行OLS估计?为什么?
4.若分别对(2)、(3)进行OLS估计应注意什么?
38
(2)交互效应分析
交互作用:
一个解释变量的边际效应有时可能要依赖于另一
个解释变量。为此,Klein和Morgen(1951)提出了
有关收入和财产在决定消费模式上相互作用的假
设。他们认为消费的边际倾向不仅依赖于收入,
而且也依赖于财产的多少一一较富有的人可能会
有不同的消费倾向。
39
为了捕获该影响,设C=a+B"》。假设边际
消费倾向p依赖于财产Zo一个简单的表示方法
就是P=pl+p2Zo代入消费函数,有:
c=a+pir+p2yz+w
由于KZ捕获了收入和财产之间的相互作用而被称
为交互作用项。
显然,刻画交互作用的方法,在变量为数量(定量)
变量时,是以乘法方式引入虚拟变量的。
40
例:是否发展油菜籽生产与是否发展养蜂生产的
差异对农副产品总收益的影响研究。
模型设定为:
Yi=ai+a2DH+a3Z)3z+^Xi+m()i
其中:匕•(农副产品收益);X(农副产品投入)
二'fl发展养蜂生产「1发展油菜籽生产-
D1=〈;D3=〈
lo其他10其他
(1)式中,以加法形式引入虚拟变量暗含何假设?
41
(i)式以加法形式引入,暗含的假设为:
菜籽生产和养蜂生产是分别独立地影响农副品生产
总收益。但是,在发展油菜籽生产时,同时也发展
养蜂生产,所取得的农副产品生产总收益,可能会
高于不发展养蜂生产的情况。即在是否发展油菜籽二
生产与养蜂生产的虚拟变量以和小间,很可能
存在着一定的交互作用,且这种交互影响对被解释
变量农副产品生产收益会有影响。
42
c
问题:如何刻画同时发展油菜籽生产和养蜂生产的
交互作用?
基本思想:在模型中引入相关的两个变量的乘积。
二区别之处在于,上页定义中的交互效应是针对数量
变量,而现在是定性变量,又应当如何处理?
43
为了反映交互效应,将(1)变为:
Yi2D2i3D3Z4D2iD3i
XiUi
同时发展油菜籽和
Yi—Otl+0t2+013+0t4)PXi+Ui
养蜂生产:
(+
发展油菜籽生产:Yi12)X
iUi
发展养蜂生产:匕•=@1+a3)^Xi+ui
(
基础类型:匕=al+PFX/+ui
44
产飞
如何检验交互效应是否存在?
看(系数a4对应的%值:
「Ho:OC4=0
即检验:<
IHi:a4W0
若拒绝原假设,即交互效应对y产生了影响(应
该引入模型)。
45
(3)分段回归分析
作用:提高模型的描述精度。二
虚拟变量也可以用来代表数量因素的不同阶段。
分段线性回归就是类似情形中常见的一种。
一个例子:研究不同时段我国居民的消费行为。
实际数据表明,1979年以前,我国居民的消费支
y
出呈缓慢上升的趋势;从1979年开始,居民消
费支出为快速上升趋势。
如何刻画我国居民在不同时段的消费行为?
46
基本思路:采用乘法方式引入虚拟变量的手段。
显然,1979年是一个转折点,可考虑在这个转折
点作为虚拟变量设定的依据。若设X*=1979,
当/〈X*时可引入虚拟变量。(为什么选择1979
作为转折点?)
47
产飞
依据上述思路,有如下描述我国居民在不同时段
消费行为模型:
Yt0U娄(tX)
D!ut
Xt(t=1955,1956,2004)
其中:D
Xt
0
居民消费趋势方程:
1979年以前:Yt=po+pu+wz
*1979年以后:Yt=00—p2X+(pl
+02),+Ut
48
分析
1979年之前,回归模型的斜率为p;
1
1979年之前,回归模型的斜率为仇+色;
若统计检验表明,p2
显著不为零,则我国居民的消
费行为在1979年前后发生了明显改变。49
第三节案例分析
为了考察改革开放以来中国居民的储蓄存款与收
入的关系是否已发生变化,以城乡居民人民币储
蓄存款年底余额代表居民储蓄(y),以国民总
收入GNI代表城乡居民收入,分析居民收入对储
蓄存款影响的数量关系,并建立相应的计量经济
学模型。
50
表8.1国民总收入与居民储蓄存款单位:亿元
城乡居城乡居民城乡居£汰城乡居民
国民总收)民币储人民币储民币储年游人民币储
.4,.・、/..>~~i»/11-/—<U.JiAZ.
南仔就因氏思双岳仔泡J胃
份
(GNI)底及额蓄存款增款年底w撷额
(Yy份R入(GNI)(VVy
、▲/VV\JLJL7
__in।z/rn(\,.yz、
mMXX、/■<I
19783624.1210.6NA199121662.59241.62121.8
1Q7Q7nA1QQ9a11TROA,二17Q
19804517.8399.5118.5199334560.515203.53444.1
19814860.3532.7―124.219944667021518.86315.3
■<coc
19825301.80/5.4151.7•1ecu57494.929662.38O1Y443,.5E
19835957.4892.5217.1199666850.538520.88858.5
数据来源:《中国统计年鉴2004》,中国统计出版社。表中“城乡居民人民币
储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。51
表8.1国民总收入与居民储蓄存款(续)单位:亿元
城乡居城乡居城乡居民人城乡居民人
民人民民人民民币储蓄存民币储蓄存
年国民总收币诸蓄一币储蓄年国民总收入款年底余额款增加额
份入(GNT)7款年存款增份(GNI)(Y)(YY)
IE亡心
底余额加额
(/)(VY\
19847206.71214.7322.2199773142.746279.87759
19858989.11622.6407.9199876967.253407.57615.4
198610201.42237.6615199980579.459621.86253
198711954.53073.3835.720008825464332.44976.7
198814922.33801.5728.2200195727.973762.49457.6
198916917.85146.91374.22002103935.386910.613233.2
199018598.47119.81923.42003116603.2103617.716631.9
52
为了研究1978—2003年期间城乡居民储蓄存款随收入的
变化规律是否有变化,考证城乡居民储蓄存款、国民总收
入随时间的变化情况,如下图所示:
53
从上图中,尚无法得到居民的储蓄行为发生明显改变
的详尽信息。若取居民储蓄的增量(YY),并作时序
图(见左下图):
20000
15000
>10000
5000
0
20000400006000080000100000
GNI
54
产飞
从居民储蓄增量图(上页左图)可以看出,城乡居
民的储蓄行为表现出了明显的阶段特征:在
1996年和2000年有两个明显的转折点。再从城
乡居民储蓄存款增量与国民总收入之间关系的散
布图看(见上页右图),也呈现出了相同的阶段
性特征。
55
为了分析居民储蓄行为在1996年前后和2000年前后三个阶段
的数量关系,引入虚拟变量D和D。
12
D/和D2的选择,是以1996、2000年两个转折点作为依据,
并设定了如下以加法和乘法两种方式同时引入虚拟变量的的
模型:
YY,=P1+P2GNL+p3(GNL-66850.50)Du+鱼(GNL
苴徵54.00)Dit+ut
出丁.1t2000年以后
fl/=1996年以后
Dit
D\t=<
0/2000年及以前
[0,=1996年及以前
对上式进行回归后,有:
EVie^s—[Equation:EQO1Vorkfile:CHAPTER8—CAS1
L-JFileEdit0bjeatViewProcQuickOgtionsWindowKelp
,lew|Pro匚|Object|Print|Name|Freeze|Estimate|Foreuast|Stats|Resids|
DependentVariable:YY
Method.LeastSquares
Date:08^2/05Time:21:64
Sample(adjusted):19792003
Includedobservations:25afteradjustments
VariableCoefficientStd.Errort-StatisticProb.
c-830.4045172.1626-4.8233740.0001
GNI0.1444860.00574025.170010.0000
(GNI-66850.50rDUM1-0.291371□027182-10.719200.0000
(GNI-88254.00rDUM20.5602190.04013613,958100.0000
R-squared0989498Meandependentvar41G8.G52
AdjustedR-squared□987998S.D.dependentvar4581.447
S.E.ofregression501,9182Akaikeinfocriterion15.42040
Sumsquaredresid5290359.Schw
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 空中楼阁说课课件
- 二零二五年青少年户外拓展训练安全协议
- 二零二五年度大型货物运输与货物包装合同
- 2025版绿色环保住宅租赁合同协议示范文本
- 二零二五年度科技企业孵化器厂房及办公楼场地租赁合同
- 2025版个人住宅抵押贷款合同书家居版
- 2025版凯正源净水器售后服务质量监控协议
- 2025年环保材料试用推广合同协议
- 二零二五年度建筑工程施工进度监理合同
- 二零二五年度绿色能源项目居间合同法第二十三章执行标准
- 2025年高考地理总复习知识梳理+训练:城市、产业与区域发展
- 双氧水罐罐区安全设计规范
- 【正版授权】 ISO 13408-6:2021 EN Aseptic processing of health care products - Part 6: Isolator systems
- 开票税点自动计算器
- 医疗器械质量安全风险会商管理制度
- 2022-2023年人教版八年级化学上册期末测试卷(及参考答案)
- 护理不良事件防范教学培训课件
- DLT 5175-2021 火力发电厂热工开关量和模拟量控制系统设计规程-PDF解密
- 乙状结肠癌术后护理
- 全国中医优才计划
- 亚马逊站外精准引流推广
评论
0/150
提交评论