9第八章 虚拟变量回归模型_第1页
9第八章 虚拟变量回归模型_第2页
9第八章 虚拟变量回归模型_第3页
9第八章 虚拟变量回归模型_第4页
9第八章 虚拟变量回归模型_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 虚拟变量回归模型8.1 虚拟变量8.2 虚拟解释变量的回归模型8.3 虚拟被解释变量的回归模型 8.4 案例分析 8.1 虚拟变量 两大类变量: 1. 定量变量(尺度变量, scale variable) 可以计算比率、也可以差分。如 GDP、价格、产量、人口数、身高等。虚拟变量的概念2. 定性变量(名义变量, nominal variable) 不可计算比率、也不可差分。如 性别、种族、国籍、党派、企业类别等。虚拟变量(dummy variable)就是定性变量。虚拟变量也可引入回归模型,用符号 D 表示。其取值为“1”或“0”。8.2 虚拟解释变量的回归模型【例】 研究某企业的职工

2、工资与工龄之间的线性回归关系,并判断该企业是否存在性别歧视。 设工资Y为被解释变量;工龄X为解释变量;性别为虚拟变量,用D表示。D=1,表示男性, D=0,表示女性。引入虚拟变量D的回归模型:如果 ,说明存在性别歧视。虚拟变量的引入方式加法方式 特征: 截距变,斜率不变。当 D=0(女性)当 D=1(男性)0XY男性女性(工龄)(工资)1 加法方式(续) 特征: 截距变,斜率不变。2 乘法方式 特征: 截距不变,斜率变。当 D=0(女性)当 D=1(男性)0XY男性女性(工龄)(工资)乘法方式(续) 特征: 截距不变,斜率变。3 加法方式与乘法方式相结合 特征: 截距变,斜率变。当 D=0(女

3、性)当 D=1(男性)加法方式与乘法方式相结合(续) 特征: 截距变,斜率变。 0XY男性女性(工龄)(工资)【案例1】研究中国1979-2001年储蓄与GNP之间的关系,请问:1990年前后,储蓄-GNP的关系是否发生结构性变化?年度储蓄(Y)GNP(X)19792814038.21980399.54517.81981523.74860.31982675.45301.81983892.55957.419841214.77206.719851622.68989.119862237.610201.419873073.311954.519883801.514922.319895146.916917

4、.819907034.218598.41991910721662.5199211545.426651.9199314762.434560.5199421518.846670199529662.357494.9199638520.866850.5199746279.873142.7199853407.576967.2199959621.880579.4200064332.488228.1200173762.494346.48.3 案例分析1 变量分析: 设储蓄为被解释变量Y;GNP为解释变量X; 1990年前后这一时期属性为虚拟变量D。 D=0 表示1990年前, D=1 表示1990年后。2

5、虚拟变量引入方式: 加法方式与乘法方式相结合3 回归模型: 当 D=0(1990年前)当 D=1(1990年后)加法方式乘法方式为了考察结构性变化,只要检验 2 或 4 是否显著地不等于零。Eviews中虚拟变量的赋值操作命令由于Eviews中不可用D作为变量名,故用DM代替虚拟变量D。Series DM 定义虚拟变量DMSmpl 1979 1989 指定样本范围(1990前)DM = 0 将虚拟变量赋值为0Smpl 1990 2001 指定样本范围(1990后)DM = 1 将虚拟变量赋值为1Smpl all 指定全范围样本虚拟变量项的回归系数的 t 检验结果表明,回归系数与零有显著性差异,

6、即不等于零。所以,1990前后储蓄-GNP的关系存在结构性变化。 也可用Eviews进行结构性变化的检验, 即 Chow Test(邹至庄检验)邹至庄(1929),英文名 Gregory C. Chow,著名美籍华人经济学家,美国普林斯顿大学教授。 1 首先用命令 equation eq.ls y c x 进行回归分析(不引入虚拟变量)。eq 为回归方程名。2 然后用命令 eq.chow 1990 进行结构性变化检验。 1990表示有待检验的结构性变化点。Chow Test 的步骤如果 F-statistic的值大于F(2,19)的临界值; 或者,如果Prob.F F(2,19)=3.52(查

7、表) Prob.F(2,19) = 0.004548 0.05 说明1990年前后确实存在结构性变化。也可在回归分析结果的视窗内,通过 View /Stability Tests/Chow Breakpoint Test 的视窗操作,进行结构性检验(如下图所示)。 【案例2】研究美国1978-1985年各季度冰箱销售量与耐用品支出之间的关系。参见古扎拉蒂教材 p.290,表9-4.)。季度冰箱销售量(千台)耐用品支出(10亿美元)FRIGDUR1978(1)1317252.6 1978(2_1615272.4 1978(3)1662270.9 1978(4)1295273.9 1979(1)1

8、271268.9 1979(2)1555262.9 1979(3)1639270.9 1979(4)1238263.4 1980(1)1277260.6 1980(2)1258231.9 1980(3)1417242.7 1980(4)1185248.6 1981(1)1196258.7 1981(2)1410248.4 1981(3)1417255.5 1981(4)919240.4 1982(1)943247.7 1982(2)1175249.1 1982(3)1269251.8 1982(4)973262.0 1983(1)1102263.3 1983(2)1344280.0 1983(

9、3)1641288.5 1983(4)1225300.5 1984(1)1429312.6 1984(2)1699322.5 1984(3)1749324.3 1984(4)1117333.1 1985(1)1242344.8 1985(2)1684350.3 1985(3)1764369.1 1985(4)1328356.4 1 变量分析: 将DUR作为解释变量;FRIG作为被解释变量; 引入3个季度虚拟变量D1,D2,D3。 (虚拟变量数 = 属性数 1 )2 季度虚拟变量的赋值规则: D1=1 (第1季度)0 (其他季度)D2=1 (第2季度)0 (其他季度)D3=1 (第3季度)0 (

10、其他季度)3 季度虚拟变量的赋值操作命令: series D1 D1=seas(1) series D2 D2=seas(2) series D3 D3=seas(3)4 回归分析操作命令: equation eq.ls Frig c Dur D1 D2 D3 提问根据回归分析结果,发现存在什么问题?如何修改回归模型?8.4 虚拟被解释变量的回归模型【例】 研究是否购买住房与收入水平的关系。设是否购房为被解释变量,用 Y 表示;收入为解释变量,用 X 表示。 Y 就是虚拟被解释变量,其取值为 Y=1 (购买) ; Y=0 (不买) 1. 线性概率模型(LPM,Linear Probabilit

11、y Model )回归模型:回归方程:回归方程:虚拟被解释变量的条件均值的意义设被解释变量的属性(购房)发生概率为所以,虚拟被解释变量的条件均值即购房概率,它是收入的线性函数。约束条件LPM模型估计的问题(1)随机扰动项的非正态性后果:对回归参数估计无影响,但影响 t 检验和区间估计。 在大样本条件下,都没有影响。(2)随机扰动项的异方差性可见,随机扰动项出现异方差。为了消除异方差,采用WLS(加权最小二乘法)。可以证明:第1步: 用OLS,求第2步: 用WLS,取解决方法 1 :(3)条件均值不满足约束条件如果 认定 ; 认定 解决方法 2 :选择非线性概率模型,如Logit模型、Probi

12、t模型。线性概率模型与非线性概率模型的特征比较1LPM(a) 线性概率模型1CDF(b) 非线性概率模型2. Logit 模型LPM模型:Logit模型:(非线性)如果Xp使用Mathematica软件描出曲线图。令等式左边为事件发生概率与不发生概率之比,称机会比率。将非线性转化为线性 ,称为机会比率的对数,机会比率对数是解释变量 X 的线性函数。说明 变动一个单位,机会比率对数平均变化 个单位,Logit 模型的估计区分两类数据:(1)个体水平数据购房概率 p收入 X(千美元)0608110112如果 , ,可见,Z 表达式无意义,无法用OLS,需用ML(最大似然法)最大似然法(Method

13、 of Maximum Likelihood) 也称极大似然法,最早由德国数学家高斯(1777-1855)提出,1912年由英国统计学家费歇(Fisher)证明与应用。它是建立在最大似然原理基础上的一种统计方法。最大似然原理 【例】设有外形完全相同的两个箱子,甲箱有99个白球1个黑球,乙箱有1个白球99个黑球。随机地从某箱中抽取一球,发现是白球。请问此箱是甲箱还是乙箱? 分析:从逻辑上严格地来说,仅仅从取出的球是白球这一点是无法判定该箱究竟是甲箱还是乙箱。但是,如果我们从统计概率上来判断,看上去最像是甲箱,而不是乙箱。因为甲箱的白球概率为0.99;乙箱的白球概率仅仅0.01。 其实,如果我们从

14、“最大似然”的英文Maximum Likelihood来看,原始含义就是“看起来最像”。 “看起来最像”,在很多情况下其实就是我们的决策依据。(2)群组数据(整理汇总数据)家庭收入(千美元)X群组内家庭总数 群组内购房家庭数 购房概率权重机会比率对数64080.26.4-1.386850120.249.12-1.1531060180.312.6-0.847由此,可用OLS估计回归参数。但是由于存在异方差,需用WLS,权重计算公式:回归模型:【案例3】已知50名硕士考生的考试分数(SCORE)、录取状况(Y)、应届生状况(D1),求录取概率模型(Logit模型)张晓峒教材p.218 表16.5)是否录取 Y分数 SCORE是否应届生 D1140111401013921138701384113790137801378013761137101362013621136110359103581135

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论