面板数据的处置专题培训课件_第1页
面板数据的处置专题培训课件_第2页
面板数据的处置专题培训课件_第3页
面板数据的处置专题培训课件_第4页
面板数据的处置专题培训课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、引言如果想估计我国的“消费函数”如果我有2005年31个省市自治区的“家庭可支配收入”与“家庭消费”的数据则画散点图;做回归;引言利用2005年31个省市自治区的“家庭可支配收入”与“家庭消费”的数据: CONS = -10.51 + 1.31*INCOME引言如果想估计我国的“消费函数”如果我有北京市20002008年的“家庭可支配收入”与“家庭消费”的数据则画散点图;做回归;引言利用北京市20002008年的“家庭可支配收入”与“家庭消费”的数据: CONS = -4732.85 + 1.72*INCOME引言如果想估计我国的“消费函数”如果我有31个省市自治区,从20002008年的“家

2、庭可支配收入”与“家庭消费”的数据应该如何做回归?引言可能的处理方法:谨慎型无知者无谓型引言谨慎型估计31个不同地区的消费方程;本质假设:消费行为在不同地区之间有差异,但同一地区在不同时间内没有差异;引言谨慎型估计9个不同时期的全国消费方程;本质假设:消费行为在不同地区之间没有差异,但同一地区在不同时间内有差异;引言无知者无谓型把所有数据混在一起做回归;本质假设:消费行为在不同地区之间没有差异,同一地区在不同时间内也没有差异;引言上述处理方法的缺陷没有充分利用数据;无法避免遗漏变量的影响;有时候无法进行上述处理;面板数据的处理一、基本概念二、案例:啤酒税与交通死亡率之间的回归面板数据的处理一、

3、基本概念面板数据(panel data)平衡面板数据、非平衡面板数据(balanced panel data)二、案例研究:啤酒税与交通死亡率 U.S. traffic death data for 1982: 较高的酒精税,更多的交通死亡吗? $1982U.S. traffic death data for 1988 较高的酒精税,更多的交通死亡吗? 啤酒税越高,交通死亡率越高? 遗漏因素可能引起遗漏变量偏误。 Example #1: traffic density. Suppose: (i) High traffic density means more traffic deaths (i

4、i) (Western) states with lower traffic density have lower alcohol taxes 特别地,“高税收”可能反映“高的交通密度” (所以OLS系数可能是正偏误高税收,更多的死亡) 当遗漏变量在给定的州内并不随着时间变化而改变时,面板数据可以让我们消除遗漏变量偏误。 两时期面板数据Suppose Eu|BeerTax, i) = 0.主要的想法: 从1982到1988年死亡率的任何改变,不可能由Zi引起,因为(by assumption)在1982到1988年期间 Zi 没有改变 数学: consider fatality rates i

5、n 1988 and 1982: FatalityRatei1988 = b0 + b1BeerTaxi1988 + b2Zi + ui1988 FatalityRatei1982 = b0 + b1BeerTaxi1982 + b2Zi + ui1982 (ititZ 把两个时期的回归方程相减FatalityRatei1988 = b0 + b1BeerTaxi1988 + b2Zi + ui1988 FatalityRatei1982 = b0 + b1BeerTaxi1982 + b2Zi + ui1982 so FatalityRatei1988 FatalityRatei1982 =

6、 b1(BeerTaxi1988 BeerTaxi1982) + (ui1988 ui1982) 新的误差项, (ui1988 ui1982), 与BeerTaxi1988或BeerTaxi1982.都不相关。 这个“相减的”等式可以用OLS进行估计, 尽管Zi 无法观测。 啤酒税与交通死亡率 FatalityRate v. BeerTax: 固定效应的回归Fixed Effects Regression What if you have more than 2 time periods (T 2)? Yit = b0 + b1Xit + b2Zi + uit, i =1,n, T = 1,T

7、 We can rewrite this in two useful ways: 1. “n-1二元自变量” regression model 2. “固定效应” regression model Yit = b0 + b1Xit + b2Zi + ui, i =1,n, T = 1,T 我们首先重写为“固定效应”的形式. Suppose we have n = 3 states: California, Texas, Massachusetts. Yit = b0 + b1Xit + b2Zi + ui, i =1,n, T = 1,T California (that is, i = CA

8、)的总体回归: YCA,t = b0 + b1XCA,t + b2ZCA + uCA,t = (b0 + b2ZCA) + b1XCA,t + uCA,t or YCA,t = aCA + b1XCA,t + uCA,t aCA = b0 + b2ZCA 不随时间改变 aCA是CA的截距, b1 是斜率 截距对CA是独特的, 但是斜率对所有州是相同的: 平行线. For TX: YTX,t = b0 + b1XTX,t + b2ZTX + uTX,t = (b0 + b2ZTX) + b1XTX,t + uTX,t or YTX,t = aTX + b1XTX,t + uTX,t, where

9、 aTX = b0 + b2ZTX 收集所有三个州的直线: YCA,t = aCA + b1XCA,t + uCA,t YTX,t = aTX + b1XTX,t + uTX,t YMA,t = aMA + b1XMA,t + uMA,t or Yit = ai + b1Xit + uit, i = CA, TX, MA, T = 1,T The regression lines for each state in a picture 总结: 两种方法写出固定效应模型 “n-1二元自变量”的形式 固定效应回归的参数估计三种估计方法: 1. “n-1二元自变量” OLS回归 2. “Entity

10、-demeaned(个体中心化)” OLS回归 3. “改变”设定, 无截距(仅仅适用于T = 2) 三种方法可以找出相同的回归系数的估计和相同的标准误差。 我们已经进行了“改变”的设定 (1988 minus 1982) 但是仅仅适用于T = 2年 方法#1和#2适用于一般的T 方法#1仅仅适用于当n 不是太大的实践。 1. “n-1 binary regressors” OLS regression2. “Entity-demeaned” OLS regression2. “Entity-demeaned” OLS regression2. “Entity-demeaned” OLS re

11、gressionExample. For n = 48, T = 7: Regression with Time Fixed EffectsTime fixed effects only面板数据处理方法的本质为了解决“由于无法观测而遗漏重要变量”的问题!例如,利用“截面数据”构造回归方程:其中但是,X2是无法观测的!怎么办?处理方法一对每一个个体多观测几期(T期)于是有X2,i1, X2,i2,X2,iT 假设:该变量(X2 )在不同时期都相等!但对不同个体之间有差异。例如:酒精税在各州是不同的,但在考察期内没有变化。处理方法一假设:该变量(X2 )在不同时期都相等!但对不同个体之间有差异。固

12、定效应模型Yit = b0 + b1Xit + b2Zi + ui, i =1,n, T = 1,T Suppose we have n = 3 states: California, Texas, Massachusetts案例:酒精税与交通死亡率的回归The regression lines for each state in a picture Y = aCA + b1X Y = aTX + b1X Y = aMA+ b1X aMA aTX aCA Y X MA TX CA 处理方法一固定效应模型的参数估计: 1、前后两期相减(适用于T=2); 2、引入(n-1)个虚拟变量的回归; 3、

13、去中心化回归; (1)固定效应估计量(FEE); (2)与虚拟回归的估计量(LSDV)相同; (3)无法估计“常数项”;处理方法一固定效应模型的参数估计: 如果满足如下条件: 且自变量之间不存在共线性,则 那么(FEE)与(LSDV)就是一个BLUE估计量; 所有的 t检验、F检验都可以使用; 所以,可以检验“固定效应”是否存在;处理方法二对每一时期,多观测几个个体(n个个体)于是有X2,i1, X2,i2,X2,iT 假设:该变量(X2 )在不同时期之间有差异!但对不同个体都相等。例如,汽车的安全性能在考察期内提高了,该因素显然在不同州之间没有差异;处理方法二假设:该变量(X2 )在不同时期之间有差异!但对不同个体都相等。这也是固定效应模型,只是在时间上固定;处理方法二固定效应模型的参数估计:与前述相同: 1、两个体之间相减,再回归(适用于n=2); 2、引入(T-1)个虚拟变量的回归; 3、去中心化回归;处理方法三对每一个个体多观测几期(T期)于是有X2,i1, X2,i2,X2,iT 假设:该变量(X2 )在不同时期都相等!但对不同个体之间有差异。但这个差异是随机的!而不是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论