

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、面板数据模型1面板数据定义。时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(paneldata)也称时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(crosssection)上看,是由若干个体(entity,unit,individual)在某一时刻构成的截面观测值,从纵剖面(longitudinalsection)上看是一个时间序列。面板数据用双下标变量表示。例如yiti=
2、X2,,Nt=1,2,TN表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变必(i=1,2,N)是横截面上的N个随机变量;若固定i不变,yt,(t=1,2,.,T)是纵剖面上的一个时间序列(个体)。图1N=7,T=50的面板数据示意图例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yit,i=1,2,,N;t=1,2,,T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测
3、值,则称此面板数据为平衡面板数据(balancedpaneldata)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalancedpaneldata)。注意:EViwes3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别
4、见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。110001000090008000700060005000400030002000资料来源:中国统计年鉴1997-2003。CPAHCPJLCPSDCPBJ-CPJSCPSHCPFJ;CPJXCPSXCPHBiCPLN«CPTJCPHLJCPNMGCPZJ1996199719981999200020012002140004000120001000080006000.IPAH,IPJL_IPSDIPBJIPJSIPSHIPFJ上IPJXIPSXIPHBIPLN
5、IPTJIPHLJIPNMG:IPZJ2000'''''1996199719981999200020012002表11999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996199719981999200020012002CP-AH(安徽)3282.4663646.1503777.4103989.5814203.5554495.1744784.364CP-BJ(北京)5133.9786203.0486807.4517453.7578206.2718654.43310473.12CP-FJ(福建)4011.
6、7754853.4415197.0415314.5215522.7626094.3366665.005CP-HB(河北)3197.3393868.3193896.7784104.2814361.5554457.4635120.485CP-HLJ(黑龙江)2904.6873077.9893289.9903596.8393890.5804159.0874493.535CP-JL(吉林)2833.3213286.4323477.5603736.4084077.9614281.5604998.874CP-JS(江苏)3712.2604457.7884918.9445076.9105317.862548
7、8.8296091.331CP-JX(江西)2714.1243136.8733234.4653531.7753612.7223914.0804544.775CP-LN(辽宁)3237.2753608.0603918.1674046.5824360.4204654.4205402.063CP-NMG(内蒙古)2572.3422901.7223127.6333475.9423877.3454170.5964850.180CP-SD(山东)3440.6843930.5744168.9744546.8785011.9765159.5385635.770CP-SH(上海)6193.3336634.183
8、6866.4108125.8038651.8939336.10010411.94CP-SX(山西)2813.3363131.6293314.0973507.0083793.9084131.2734787.561CP-TJ(天津)4293.2205047.6725498.5035916.6136145.6226904.3687220.843CP-ZJ(浙江)5342.2346002.0826236.6406600.7496950.7137968.3278792.210资料来源:中国统计年鉴1997-2003。表21999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价
9、格)地区人均收入1996199719981999200020012002IP-AH(安徽)4106.2514540.2474770.4705178.5285256.7535640.5976093.333IP-BJ(北京)6569.9017419.9058273.4189127.9929999.70011229.6612692.38IP-FJ(福建)4884.7316040.9446505.1456922.1097279.3938422.5739235.538IP-HB(河北)4148.2824790.9865167.3175468.9405678.1955955.0456747.152IP-H
10、LJ(黑龙江)3518.4973918.3144251.4944747.0454997.8435382.8086143.565IP-JL(吉林)3549.9354041.0614240.5654571.4394878.2965271.9256291.618IP-JS(江苏)4744.5475668.8306054.1756624.3166793.4377316.5678243.589IP-JX(江西)3487.2693991.4904209.3274787.6065088.3155533.6886329.311IP-LN(辽宁)3899.1944382.2504649.7894968.1645
11、363.1535797.0106597.088IP-NMG(内蒙古)3189.4143774.8044383.7064780.0905063.2285502.8736038.922IP-SD(山东)4461.9345049.4075412.5555849.9096477.0166975.5217668.036IP-SH(上海)7489.4518209.0378773.10010770.0911432.2012883.4613183.88IP-SX(山西)3431.5943869.9524156.9274360.0504546.7855401.8546335.732IP-TJ(天津)5474.9
12、636409.6907146.2717734.9148173.1938852.4709375.060IP-ZJ(浙江)6446.5157158.2887860.3418530.3149187.28710485.6411822.0012图215个省级地区的人均消费序列(纵剖面)图315个省级地区的人均收入序列(file:4panel02)20001400012000100008000600040002468101214CP1996iCP1999CP2002CP1997二二CP20004"CP1998CP200114000120001000080006000400020002468101
13、214+IP1996二二IP1999IP2002二:IP1997二二IP2000IP1998IP2001图415个省级地区的人均消费散点图图5(每条连线表示同一年度15个地区的消费值)15个省级地区的人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的收入值)IP(1996-2002)用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。15个地区7年人均消费对收入的面板数据散点
14、图见图6和图7。图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图7中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。-CPAHCPBJCPFJCPHB»CPHLJCPJLCPJSCPJXACPLNCPNMGCPSDCPSHCPSX*CPTJCPZJ图6用15个时间序列表示的人均消费对收入的面板数据12000'CP1996=CP19974A"CP1998”CP1999”CP2000-V口'CP20019.*CP2002Jk.1A4A一h铲""萨AJ.IP(1996-2
15、002)10000-8000-6000-4000-2000-2000400060008000100001200014000图7用7个截面表示的人均消费对收入的面板数据(7个截面叠加)为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图9给出该15个省级地区1996和2002年的消费对收入散点图。可见6年之后15个地区的消费和收入都有了相应的提高。110001100010000-9000-8000-7000-6000-5000-4000-oC
16、PBJCPNMG10000-9000-8000-7000-6000-6000-4000-京和内蒙古1996-2002年消费对收入时序图oCP1996CP2002图口-20000400000001200016000图匹北2000-2屮面板数据的估计。1:用面板数据建立的模型通常有3种。即混合估计模型、固定效应模型和随机效应模型。2.1混合估计模型。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。如果从时间和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型,y
17、it=a+B七+勺7,i=1,2,N;t=1,2,Ta和卩不随变化。称模型(1)为混合估计模型。996和2002年15个地区的消费对收入散点图(1)以例1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下DependentVariable:CP?Method:PooledLeastSquaresDate:12/03/04Time:22:06Sample:19962002Includedobservations:7Numberofcross-sectionsused:15Totalpanel(balanced)obseivations:105VariableCoeffic
18、ientStd.Errort-StatisticProb.C129.631363.692592.0352650.0444IP?0.7587260.00952279.601890.0000R-squared0.984036Meandependentvar4917.608AdjustedR-squared0.983001S.D.dependentvar1704.704S.E.ofregression216.4270Sumsquaredresid4024500.F-statistic6349.204Durbin-Watsonstat0.784107Prob(F-statistic)0.000000图
19、10EViwes估计方法:在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选NewObject功能,从而打开NewObject(新对象)选择窗。在TypeofObject选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。在窗口中输入15个地区标识AH(安徽)、BJ(北京)、ZJ(浙江)。工具栏中点击Sheet键,从而打开SeriesList(列写序列名)窗口,定义变量CP?和IP?,点击OK键,Pool(混合或合并数据库)窗口显示面板数据。在Pool窗口的工具栏中点击Estimate键,打开PooledEstimation(混合估计)窗口如下图。图
20、11在DependentVariable(相依变量)选择窗填入CP?;在Commoncoefficients(系数相同)选择窗填入IP?;Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击Noweightingo点击PooledEstimation(混合估计)窗口中的OK键。得输出结果如图10。相应表达式是CP.=129.6313+0.7587IP.itit(2.0)(79.7)R2=0.98,SSEr=4824588,t0.05(103)=1.9915个省
21、级地区的人均支出平均占收入的76%。如果从时间和截面上看模型截距都为零,就可以建立不含截距项的檢=0)的混合估计模型。以二变量模型为例,建立混合估计模型如下,yit=卩x,t+£.t,i=1,2,N;t=1,2,T(2)对于本例,'因为上式中的截距项有显著性(t=2.0>t0.05(103)=1.99),所以建立截距项为零的混合估计模型是不合适的。EViwes估计方法:在PooledEstimation(混合估计)对话框中Intercept(截距项)选择窗中选None,其余选项同上。2.2固定效应模型。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是
22、不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixedeffectsregressionmodel)。固定效应模型分为3种类型,即个体固定效应模型(entityfixedeffectsregressionmodel)、时刻固定效应模型(timefixedeffectsregressionmodel)和时刻个体固定效应模型(timeandentityfixedeffectsregressionmodel)下面分另U介绍。(1) 个体固定效应模型。个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截
23、面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型,表示如下,y.t=卩1Xt+Y1W1+丫2W2+SWN+£ift=1,2,,T(3)其中f1,如果属于第i个个体,i=1,2,.,N。W=s.0,其他&it,i=1,2,.,N;t=1,2,.,T,表示随机误差项。yit,x.,i=1,2,.,N;t=1,2,.,T分别表示被解释变量和解释变量。模型(3)或者表示为y1t=Y1+P1x1t+s1t,i=1(对于第1个个体,或时间序列),t=1,2,Ty2t=丫2+P1x2t+s21,i=2(对于第2个个体,或时间序列),t=1,2,,TyNt=Yn+P1xNt+
24、163;Nt,i=N(对于第N个个体,或时间序列),t=1,2,T写成矩阵形式,广丫1C儿=(1兀1)p1+S1=丫1+兀1卩+£1y1打=(1XN)pJ+SN=yN+XP+SN上式中y.,y.,x.都是Nxl阶列向量。卩为标量。当模型中含有k个解释变量时,卩为kx1阶列向量。进一步写成矩阵形式,上式中的元素1,0都是Tx1阶列向量。面板数据模型用OLS方法估计时应满足如下5个假定条件:(1) E(£|x,x,,x.T,a.)=0。以x,x,x.T,a.为条件的&的期望等于零。.t.1.2.T.1.2.T.t(2) (%订,x.2,.,x.T),(y.1?y.2,y
25、.T),.=1,2,N分别来自于同一个联合分布总体,并相互独立。(3) (x.t,.)具有非零的有限值4阶矩。(4)解释变量之间不存在完全共线性。(5)Cov(&£.|x.,x.,a.)=0,心s。在固定效应模型中随机误差项&在时间上是非自相.t.s.t.s.t关的。其中x.t代表一个或多个解释变量。.t对模型(1)进行OLS估计,全部参数估计量都是无偏的和一致的。模型的自由度是NT1N。当模型含有k个解释变量,且N很大,相对较小时,因为模型中含有k+N个被估参数,一般软件执行OLS运算很困难。在计量经济学软件中是采用一种特殊处理方式进行OLS估计。估计原理是,先用每
26、个变量减其组内均值,把数据中心化(entity-demeaned),然后用变换的数据先估计个体固定效应模型的回归系数(不包括截距项),然后利用组内均值等式计算截距项。这种方法计算起来速度快。具体分3步如下。(1) 首先把变量中心化(entity-demeaned)。仍以单解释变量模型(3)为例,则有y.=Y.+卩ix+.=1,2,.,N(4).1.ti=1,2,.,N。公式(1)、相减得,(5)其中y=lfy,x=丄为x,芦=丄为£,.T.t.T.t.T.t=1t=1t=1s-y)=卩代-x.)+%£丿(£.t-口=,上式写为令©,-y.)=,,(x.t
27、-x)=,y=31.+(6)用OLS法估计(1)、(6)式中的卩,结果是一样的,但是用(6)式估计,可以减少被估参数个数。(2) 用OLS法估计回归参数(不包括截距项,即固定效应)。在k个解释变量条件下,把用向量形式X表示,则利用中心化数据,按OLS法估计t公式计算个体固定效应模型中回归参数估计量的方差协方差矩阵估计式如下,(7)Var(B)=2(X'X)-1p'P八其中E2=ntn'"是相对于的残差向量。(3) 计算回归模型截距项,即固定效应参数iii(8)以例1(file:panel02)为例得到的个体固定效应模型估计结果如下:DependentVaria
28、ble:CP?Method:PooledLeastSquaresDate:11/07/04Time:20:52Sample:19962002Includedobservations:7Numberofcross-sectionsusEd:15TotalpaneI(h日bnuid)observations:105VariableCoefficientStd.Errort-StatisticProb.IP?0.6975610.01269254.96029.0000FixedEffectsAH-C479.3084BJ-C1053.180FJ-C467.9690HB-C361.3774HU-C345.
29、9127JL-C540.1185JS-C480.4183JX-C195.9182LN-C622.0415NMG-C306.0658SD-C381.4997SH-C782.6001SX-C440.7252TJ-C562.0436ZJ-C714.2344R-squared0.992488Meandependentvar4917.600AdjustedR-squared0.991222S.D.dependentvar1704.704S.E.ofregression159.7184Sumsquaredresid2270386.Durbin-Watsonstat1.609517注意:个体固定效应模型的E
30、Viwes输出结果中没有公共截距项。图12EViwes估计方法:在EViwes的PooledEstimation对话框中Intercept选项中选Fixedeffects。其余选项同上。(1) EViwes输出结果中没有给出描述个体效应的截距项相应的标准差和t值。不认为截距项是模型中的重要参数。(2) 当对个体固定效应模型选择加权估计时,输出结果将给出加权估计和非加权估计两种统计量评价结果。(3) 点击View选Residuals/Table,Graphs,CovarianceMatrix,CorrelationMatrix功能可以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方
31、差矩阵,残差序列的相关系数矩阵。从结果看,北京、上海、浙江是消费函数截距(自发消费)最大的3个地区。相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过F检验来完成。原假设H。:不同个体的模型截距项相同(建立混合估计模型)。备择假设H:不同个体的模型截距项不同(建立个体固定效应模型)。F统计量定义为:(SSESSE)/(NT2)(NTN1)(SSESSE)/(N1)F=ru=ru(9)SSE/(NTN1)SSE/(NTN1)uu其中SSEr,SSEu分别表示约束模型(混合估计模型)和非约束模型(个体固定效应模型)ru的残差平方和。非约束模型比约束模型多了N-1个被估参数。(混合估计模
32、型给出公共截距项。)注意:当模型中含有k个解释变量时,F统计量的分母自由度是NT-N-k。用上例计算,已知SSE=4824588,SSE=2270386,ru(SSESSE)/(N1)(48245882270386)/(151)182443F=ru=7.15SSE/(NTN1)2270386/(105151)25510=1.81F0.05(14,89)u因为F=7.15>F0.05(14,89)=1.81,所以,拒绝原假设。结论是应该建立个体固定效应模型。(2)随机效应模型在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。也可以通过对误差项的分解来描述这种信息的缺失。yi
33、t=a+卩1Xt+£it(14)其中误差项在时间上和截面上都是相关的,用3个分量表示如下。8.=u.+v+w(15)ititit其中u.N(0,Qu2)表示截面随机误差分量;vtN(0,町)表示时间随机误差分量;w厂N(0,J2)表示混和随机误差分量。同时还假定u.,v,w.之间互不相关,各自分别不存在截面自相关、.t.t时间自相关和混和自相关。上述模型称为随机效应模型。随机效应模型和固定效应模型比较,相当于把固定效应模型中的截距项看成两个随机变量。一个是截面随机误差项(u.),一个是时间随机误差项(v)。如果这两个随机误差项.t都服从正态分布,对模型估计时就能够节省自由度,因为此条
34、件下只需要估计两个随机误差项的均值和方差。假定固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,而且对均值的离差分别是u.和v,固定效应模型就变成了随机效应模型。.t为了容易理解,先假定模型中只存在截面随机误差项u.,不存在时间随机误差分量(v),.ty-t=a+卩1Xt+(Wt+u)=a+卩1Xt+8t(16)截面随机误差项u.是属于第个个体的随机波动分量,并在整个时间范围(t=1,2,,T)保持不变。随机误差项u.,w.应满足如下条件:tE(u)=0,E(wt)=0E(w.2)=G2,itwE(ui2)=Gu2,iuE(wituj)=0,包括所有的i,t,j。E(w.t
35、wjs)=0,i丰j,t丰sE(u.uj)=0,i丰j因为根据上式有£=W+U.ititi所以这种随机效应模型又称为误差分量模型(errorcomponentmodel)。有结论,E(£it)=E(wit+uj)=0,ititj(16)式,yit=a+久x,t+(w.+u),也可以写成y,t=(a+u)+久x,t+w.fO服从正态分布的截距项的均值效应a被包含在回归函数的常数项中:""uE(£2)=E(w+u)2=G2+G2,ititjwuE(££)=E(w+u,)(w+U.)=E(wW+u.w+wu.+U2)=G2,t丰s
36、itisitiisiitisiisitiiu令0=E(££')=ii(G2+G2)wuG2uG2u(G2+G2)wuG2uG2G2uG2(G2+g2)uwu16=Gw?LtxT)+G"21(Tx1)1(Tx1)其中1(切是(TxT)阶单位阵,1(閃)是(Txl)阶列向量。因为第i期与j期观测值是相互独立的,所以NT个观测值所对应的随机误差项的方差与协方差矩阵V是g0o100V=o00=01000=INxN00-000-001_其中INxn表示由(Txl)阶列向量为元素构成的单位阵,其中每一个元素1或0都是(Txl)阶列向量。0表示科罗内克积(Kroneck
37、erproduct)。其运算规则是aBaBaBll12lKaBaBaBA0B=21222KNxK-aBaBaB_N1N2NK检验个体随机效应的原假设与检验统计量是H0:Gu2=0。(混合估计模型)0u比:G2丰0。(个体随机效应模型)1uLM=NT2(T-1)it-t=1另另u-1“ju2iti=1t=1NT2(Tl)濟-=1lu2it-i=1t=1NT2(T-1)T2uu1八1uu2其中u%表示由个体随机效应模型计算的残差平方和。uu表示由混合估计模型计算的残差平方和。统计量LM服从1个自由度的%2分布。可以对随机效应模型进行广义最小二乘估计。以观测值方差的倒数为权。为了求权数必须采用两阶段
38、最小二乘法估计。因为各随机误差分量的方差一般是未知的,第一阶段用普通最小二乘估计法对混合数据进行估计(采用固定效应模型)。用估计的残差计算随机误差分量的方差。第二步用这些估计的方差计算参数的广义最小二乘估计值。如果随机误差分量服从的是正态分布,模型的参数还可以用极大似然法估计。仍以例1为例给出随机效应模型估计结果如下:图15DependentVariable:CP?Method:GLS(VarianceComponents)Date:12/04/04Time:14:12Sample:19962002Includedobservations:7Numberofcross-sEutionsused:15Tota
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 桃树造林规划方案范本
- 矿山安全监测与火灾防控考核试卷
- 弹簧在汽车油门踏板的反馈和控制性能考核试卷
- 莞城区水库清淤施工方案
- 证券从业资格证行业竞争策略试题及答案
- 旧房地基维修施工方案
- 水下作业的深海地质研究新技术考核试卷
- 考生必知的知识点证券从业试题及答案
- 2025年投资组合理论试题及答案
- 2024年微生物检测技师真题及答案
- 2025年04月包头医学院公开招聘28名事业单位工作人员笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 《美的电器审计案例》课件
- 2025-2030中国冰鞋行业市场发展分析与发展趋势及投资风险研究报告
- 2024年美容师考试相关法律法规知识试题及答案
- 2025新疆交投集团所属子公司招56人笔试参考题库附带答案详解
- 综艺节目赞助合同书
- 三级精神病医院基本标准(2023版)
- 高尔夫球场浇灌施工方案
- 出纳员工考核试题及答案
- 节假日期间医疗安全
- 智能交通系统在城市管理中的应用与前景
评论
0/150
提交评论