计量经济学课件:面板数据模型_第1页
计量经济学课件:面板数据模型_第2页
计量经济学课件:面板数据模型_第3页
计量经济学课件:面板数据模型_第4页
计量经济学课件:面板数据模型_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

面板数据模型8.1面板数据模型概述时间序列数据或截面数据都是一维数据,而面板数据(PanelData)是同时在时间和截面空间上取得的二维数据。与一般的混合横截面时间序列数据不同,面板数据是对多个不同个体在不同时期的观测。伴随着经济理论、计算机技术、统计方法和数据采集技术的发展,PanelData得到了越来越广泛的应用。面板数据用双下标变量表示。例如:8.1面板数据模型概述面板数据可以根据个体维度和时间维度的大小分为两种类型:(1)N大T小,一般称短面板,常见于各种微观调查数据;(2)N小T大,一般称长面板,常见于宏观数据。面板数据因同时含有时间序列数据和截面数据,所以其统计性质既带有时间序列的性质,又包含一定的横截面数据特点。因此,以往采用的计量模型和估计方法就需要有所调整。用面板数据建立的模型通常有3种,即:混合(pool)估计模型、固定效应模型和随机效应模型。模型(8.1.1)常用的有如下三种情形:8.1面板数据模型概述对于情形1,称为无个体影响的不变系数模型,其在横截面上无个体影响、无结构变化,可由普通最小二乘法估计给出a和b的一致有效估计,即相当于多个时期的截面数据放在一起作为样本数据。对于情形2,称为变截距模型,由于在横截面上存在个体影响,而不存在结构性的变化,同时又考虑到个体差异影响是否在模型中被忽略,因此还可将模型进一步分为固定效应影响和随机效应影响两种情况。对于情形3,称为变系数模型,除了存在个体影响外,在横截面上还存在结构变化,因此结构参数在不同横截面单位上是不同的。8.1面板数据模型概述8.1.1混合估计模型如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同时间之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。混合估计模型的特点是对每个截面和时间,α和β均相同。8.1.2固定效应模型8.1面板数据模型概述8.1.3随机效应模型8.2固定效应回归固定效应模型中有个虚拟变量系数和个解释变量系数需要估计,因此总共有个参数需要估计。当不是很大时,可直接采用普通最小二乘法进行估计。但是当很大时,直接使用方法的计算量就变得非常大,甚至有可能超过计算机的存储容量。8.2固定效应回归

式(8.2.1)减去各截面时间上的均值,即组内均值,可得:得出:

该估计方法也称为最小二乘虚拟变量(Least-SquaresDummy-Variable,LSDV)估计。8.3随机效应回归

8.4检验和不同设定面板数据模型设定时,必须考虑样本数据在个体间的差异(异质性),时间上的变化(时变性),以及各可观测影响因素(即各解释变量)的效应变化(系数的改变性)。就线性回归模型而言,理论上通常划分为两类:一类具有相同斜率系数的模型,即不变系数模型;另一类是变系数模型。对不变系数模型还要检验截距是否相同。8.4.1模型选择的检验通常使用协方差分析检验,主要检验如下两个假设:对面板数据模型(8.1.1)有三种类型的约束条件,分别是:由于斜率不相等时讨论截距是否相等意义不大,故一般不考虑模型(8.4.2)对应的约束类型。8.4检验和不同设定8.4.1模型选择的检验可以使用约束回归检验的F统计量来检验。在参数约束成立下,

8.4检验和不同设定8.4.2固定效应和随机效应的Hausman检验通过比较固定效应变截距模型:和随机效应变截距模型:

8.4检验和不同设定8.4.2固定效应和随机效应的Hausman检验Hausman构造Wald统计量W:

8.5应用例8.5.1

酒精税和交通事故死亡率在美国每年有4万起高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。在凌晨1点-3点期间,有25%的司机饮酒,而饮酒司机发生交通事故的次数是不饮酒司机的13倍。现有1982-1988年48个州共计336组美国公路交通事故死亡人数与啤酒税的数据。本案例研究酒精税和关于酒后驾车的法律规定对交通死亡事故的影响。使用stata16打开在目录“D:\stata16\shuju\chap08”中的“0801.dta”数据文件,命令如下:use“D:\stata16\shuju\chap08\0801.dta”,clear然后对横截面观测值变量和时间序列观测值变量进行定义生成面板序列。在Command界面输入如下命令:xtsetstateyear/*注意区分面板数据和时间序列数据有关变量序列的设定*/上述命令含义为定义state为横截面观测值变量,year为时间序列观测值变量。8.5应用(1)混合估计模型的估计由于混合估计模型的原理依旧是最小二乘法,因此在Command界面输入回归命令:regressmrallbeertaxEnter键确认后得到结果:图8.5.1混合估计模型的估计8.5应用(2)固定效应模型的估计固定效应模型主要进行组内估计,在Command界面输入固定效应模型回归命令为:xtregmrallbeertax,fe其中,“fe”是“fixedeffects”的缩写,表示固定效应估计量。estimatesstorefe/*为了后面分析方便,将固定效应的结果进行储存*/Enter键确认后得到结果:图8.5.2固定效应模型的估计8.5应用上表中,第一、二行为常规的回归结果输出表,第三行表示扰动项的标准差,其中sigma_u表示个体效应标准差,rho是指个体效应的方差占比混合误差方差。本例中,rho=0.93,故混合扰动项的方差主要来自于个体效应的变动。最后表底F检验表示对48个州的个体差异的总体F检验。结果表明,至少在某些个体之间存在着差异。(3)随机效应模型的估计从固定效应模型的回归结果中,可以看出个体效应的存在。但个体效应也可能以随机效应形式存在,为此我们需要对随机效应模型进行回归。在Command界面输入命令:xtregmrallbeertax,reestimatesstorereEnter键确认后得到结果:图8.5.3随机效应模型的估计8.5应用由于样本数据在个体间的差异、时间上的变化,使得面板数据模型形式的设定具有不确定性。因此根据前面理论知识可知,常用的有两种检验方法,分别为F检验和豪斯曼检验。其中,F检验针对斜率和截距都相同或斜率相同和截距不同进行检验;而豪斯曼检验是针对斜率相同和截距不同的变截距固定系数模型检验,进而确定是固定效应还是随机效应。下面通过例子在Stata中的操作予以检验和解释。第一种是对面板数据利用F检验,由于Stata中没有直接用于求解F统计量的命令,下面以公式的构造进行分步骤求解。首先,对F3统计量中的三个回归残差平方和进行计算:第一步,计算模型(8.1.1)估计的残差平方和S1,分别对不同地区进行时间序列回归,得到各个回归残差平方和,然后进行加权求和。在Command窗口输入如下命令:sortstate/*按照地区进行排序*/statsby_b_see(residuals),by(state)saving(D:\stata16\shuju\chap08\080101.dta,replace):regressmrallbeertax其中,statsby表示分组回归的命令,能将每一组所回归的数据置于一张表中,_b、_se分别表示回归后的系数和对应的标准误,by(state)是指按照区域进行分组回归,saving()表示前面生成变量所存储的位置,最后是所要进行的回归。注意:regressmrallbeertax是连着前面:的。8.5应用Enter键后,回归系数估计及标准误和残差保存于080101.dta中,stata结果显示:这里有一段被删除由于目的是为了对各个体的残差平方进行计算求和,思路是现根据估计参数进行计算拟合值,然后实际值减去拟合值,从而得到残差,最后对残差进行平方求和。在Stata中的command窗口中输入如下命令:mergem:1stateusing“D:\stata16\shuju\chap08\080101.dta”/*将分组回归的结果合并到原始数据文件中,同时注意路径是英文下双引号*/genmhat=_b_cons+_b_beertax*beertax/*mhat是回归预测值,该步是进行拟合值拟合*/genresid=mrall-mhategenSSR=sum(resid^2)/*对所有残差平方和进行求和*/Enter键后,可见数据编辑器中有S1(SSR)的求解结果:8.5应用图8.5.4分组回归残差平方结果8.5应用从上图中计算可知,各个分组回归的残差平方和即S1的值为6.35e-08。第二步,计算模型(8.4.1)估计的残差平方和S2,由于模型(8.4.1)所表明的是变截距的固定效应模型,则对应的残差平方和即为图8.5.2所对应的结果,通过在command中进行数据标识,其命令为:xtregmrallbeertax,fepredicte2,regenrss2=sum(e2^2)计算结果显示S2=1.784e-06。第三步,计算模型(8.4.3)估计的残差平方和S3。由于截距和系数都是不变的,即为混合回归模型,则对应的残差平方和即为图8.5.1所对应的结果。通过在command中进行数据标识,其命令为:regressmrallbeertaxpredictu2,regenrss3=sum(u2^2)计算结果显示S3=9.875e-07。8.5应用第四步,根据式(8.4.5)和(8.4.6)中F1和F3统计量的公式进行计算(N=48,T=7,K=1),在Command中输入如下命令为:di"F1="(rss2-SSR)*240/(SSR*47)di"F3="(rss3-SSR)*240/(SSR*47*2)enter键后得如下结果:接下来,我们从如何进行软件操作的角度,介绍豪斯曼检验的软件操作。假设使用的模型是变截距固定系数模型。从图8.5.3最后一行的rho结果来看rho=0.881,个体效应也可能以随机效应的形式存在,那么是使用固定效应还是随机效应,还需要进行豪斯曼检验。8.5应用可以利用前面已经储存了相应的估计结果fe和re,或者重新再估计一下,然后进行豪斯曼检验。在Command界面输入命令:xtregmrallbeertax,feestimatesstorefextregmrallbeertax,reestimatesstorerehausmanfere,constantsigmamore图8.5.5豪斯曼检验结果从上述图8.5.4的结果可以发现,P值接近于0,即个体效应与解释变量不相关,所以应该认为是固定效应,而不是随机效应。8.5应用例8.5.2

我国城镇居民消费模型(1)模型设定根据经典模型中关于消费函数模型的讨论,以城镇居民人均消费支出为被解释变量,以城镇居民人均可支配收入和前期人均消费支出为解释变量。因为我国不同地区居民平均收入水平差距较大,为了将地区之间的影响引入模型,采用面板数据作为样本数据。选择北京、山西、内蒙古、辽宁、上海、福建、江西、河南、湖南、广东、费州、四川、陕西、新疆等14个省市区2014-2018年共70组数据,并消除了价格因素。由于样本数据在个体间的差异、时间上的变化,使得面板数据模型形式的设定具有不确定性,因此根据前面理论知识可知,首先是对模型设定形式的检验,即F检验;然后对固定效应还是随机效应进行检验,即豪斯曼检验。下面通过例子在Stata中的操作予以解释和检验。首先是对面板数据利用F检验,由于Stata中没有直接用于求解F统计量的命令,下面以公式的构造进行分步骤求解。打开文件“0802.dta”,首先对数据进行预处理,在Command窗口输入如下命令:8.5应用encodeprovince,gen(provi)/*将字符型变量province转化为连续取值变量provi*/xtsetproviyear/*对横截面观测值变量和时间序列观测变量进行定义生成面板序列*/然后,对F3统计量中的三个回归残差平方和进行计算:第一步,计算模型中的S1,分别对不同省份进行时间序列回归,得到各个回归残差平方和,然后进行加权求和。在Command窗口输入如下命令:sortprovi/*按照省份进行排序*/statsby_b_see(residuals),by(provi)saving(D:\stata16\shuju\chap08\080201.dta,replace):regressYX1X2其中,statsby表示分组回归的命令,能将每一组所回归的数据置于一张表中,_b、_se分别表示回归后的系数和对应的标准误,by(provi)是指按照省份进行分组回归,saving()表示前面生成变量所存储的位置,最后是所要进行的函数的回归。Enter键后,数据保存于e(residuals)中,结果如下所示。8.5应用由于存储的数据占用了正在执行的数据文件,即上述命令saving

(D:\stata16\shuju\chap08\080201.dta,replace)所表达的含义,所以当正在执行的数据文件在关闭时,需将其保存于另外一个文件夹中,这里将其存于D:\stata16\shuju\chap08\080201.dta路径下;而原有的0802的数据集将会被所生成的e(residuals)所取代。由于目的是为了对各个体的残差平方进行计算求和,思路是现根据估计参数进行计算拟合值,然后实际值减去拟合值,从而得到残差,最后对残差进行平方求和。在Stata中的command窗口中输入如下命令:useD:\stata16\shuju\chap08\080201.dta/*打开带有原始数据的数据文件*/mergem:1proviusingD:\stata16\shuju\chap08\0802.dta/*将分组回归的结果合并到原始数据文件中*/genmhat=_b_cons+_b_X1*X1+_b_X2*X2/*mhat是回归预测值,该步是对拟合值进行拟合*/genresid=Y-mhategenSSR=sum(resid^2)/*对所有残差平方和进行求和*/Enter键后,可见数据编辑器中有S1(SSR)的求解结果:8.5应用图8.5.6分组回归结果8.5应用从上图中计算可知,各个分组回归的残差平方和即S1的值为S1=6354924第二步,计算模型(8.4.1)估计的残差平方和S2。由于模型(8.4.1)所表明的是变截距模型,所以要在回归模型中引入截距虚拟变量,再对回归得到的残差平方和进行计算,command中输入如下命令:regressYX1X2vipredicte2,regenrss2=sum(e2^2)计算结果显示S2=12677051。第三步:计算模型(8.4.3)中的S3。由于截距和系数都是不变的,即为混合回归模型,所以,要先估计混合回归模型,再对得到的残差平方和进行计算,command中输入如下命令:regressYX1X2estimatesstoremlpredictu2,regenrss3=sum(u2^2)计算结果显示S3=19963386。8.5应用第四步:根据F统计量的定义式进行计算,在Command中输入如下命令为:genF1=(rss2-SSR)*26/(SSR*28)diF1genF3=(rss3-SSR)*39/(SSR*28)diF3Enter键后得如下结果:F1(26,28)=0.9238F3(39,28)=2.9827查F分布表,给定10%的显著性水平,得到临界值:F(39,28)=1.57F(26,28)=1.63由于F3>1.57,所以拒绝H3,由于F1<1.63,所以接受H1。因此模型应该采用模型2的形式,为一变截距模型。那么具体固定效应变截距模型还是随机效应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论