面板数据相关文件_第1页
面板数据相关文件_第2页
面板数据相关文件_第3页
面板数据相关文件_第4页
面板数据相关文件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、面板数据I变截距模型Poole ros Sect 数据Pooledcsseti数据是指不同时点(可能)不同截面的数据。而面板数据是指不同时点相同截面的数据。在面板数据中,同一截面不同时点的观测值可不能是独立的。因为,这些数值可能受到共同因素的阻碍。Paeldaa也叫做longitdnl da。混合数据增加了样本容量,因此提高了可能的精度和检验功效。同时,混合数据也被用于考察变量分布随着时刻的变化,或者变量之间的关系随着时刻的变化规律。考察的方法是加入时刻虚拟变量。例:NionalOnin Rerh Ceers Genera ocal Srve搜集了1972194年妇女就业、家庭等相关数据。利用

2、数据分析家庭小孩个数的变化规律。操纵变量包括:教育程度、年龄、种族、地区、生活环境(农村、城镇、小都市等)。(数据文件:rl.raw)kis = + 1 euc+ 2age + 3 ag rae + 5 farm+ wn + D7 + 8 D76 9 D78 + 1D80+11 82 +1 8 例:同意教育程度对工资的阻碍以及工资的性不差异 (Fle:psfl;at fle:ps7_85.raw)模型设定:g(wage) = 0 + y85+ euc+3 y85edc 4eer + 5 uion 6female y5 fmale ut 模型可能:结论分析:例:废物焚化厂对周边房屋价格的阻碍 (

3、Fie:kimc.wf;data fi: kelmc.a)Kiel dMcClin (19)研究了废物焚化厂对周边(Nrh ndovr, Maschusetts)房屋价格的阻碍。1978年有消息流传要在NorhAndover建立废物焚化厂,191年正式动工(195年正式运营)。利用197年、11年的房屋价格数据检验:废物焚化厂周边的房屋价格低于远处的房屋价格。房屋价格为实际价格(排除物价指数的阻碍)。要分析废物焚化厂对周边房屋价格的阻碍,不能简单回归如下模型:rpc = 0 1 nearn +u, 比如利用181年的数据进行回归,那么1体现了1年近处价格与远处价格的差异,但1没有体现焚化厂对近

4、处房屋价格的阻碍。因此,要分析焚化厂对近处房屋价格的阻碍,应该观看近处与远处的房屋价格在181的差异年是否比1978年的差异有了明显的变化。方程设定如下:prce 0 +1 y81 + 2 nerinc+ (y8nerc) +u,其中,neac为0-1虚拟变量。10,nearin =0,rpice =0 + u。因此,0体现了18年远处的房屋平均价格。y8=0,nearinc1,rpice =0+2 + 。因此,(0+2)体现了197年近处的房屋价格,2体现了1978年近处房屋价格与远处房屋价格的差异。81=1,nac=,rprice =0 +1 + 。(0+1)体现了91年远处的房屋价格,体

5、现了远处房屋价格在81年与78年的差异。811,nearinc =,rie =0 + 1 +2+ 3 +u。(+1+2+ 3)体现了981年近处的房屋价格,(+ 3)体现了181年近处与远处的房屋价格差异。如此能够清晰地看出,3体现了近处与远处的房屋价格在1981的差异年是否比198年的差异。问题就归结于检验的显著性。练习题: 回归方程,进行检验并解释其含义。og(rprice) = + 1 1 2nearnc + (y81nearinc)+ u加入其它操纵变量(房龄、距市中心距离、卧房数目等)重新回归方程进行检验。面板数据定义时刻序列数据或截面数据差不多上一维数据。例如时刻序列数据是变量按时

6、刻得到的数据;截面数据是变量在截面空间上的数据。面板数据是同时在时刻和截面上取得的二维数据。因此,面板数据(pnl daa)也称时刻序列截面数据(tme series ndcross secindata)或混合数据(pool ata)。面板数据示意图见图。面板数据从横截面(crossseio)上看,是由若干个体(enity,ui, ndvdul)在某一时期构成的截面观测值,从纵剖面(longiudial section)上看每个个体差不多上一个时刻序列。面板数据用双下标变量表示。例如y t,i = 1,2, , ; t = , ,TN表示面板数据中含有N个个体。T表示时刻序列的最大长度。若固定

7、不变,i., ( i 1, 2, , )是横截面上的个随机变量;若固定i不变,y. t, ( 1, 2, , T)是纵剖面上的一个时刻序列(个体)。例如1990-00年3个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由年农业总产值数据组成的一个时刻序列。面板数据由30个个体组成。共有个观测值。关于面板数据yi t,i 1, 2,, N; t 1, , ,T,假如从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,或者每个个体的观测值个数是相同的,则称此面板数据为平衡面板数据(balancepanel ata)。若在面板

8、数据中缺失若干个观测值,则称此面板数据为非平衡面板数据(unaaced pneldta)。例1:16-20年中国东北、华北、华东5个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表。数据是年的,每一年都有15个数据,共15组观测值。人均消费和收入两个面板数据差不多上平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观看分不见图2和图3。从横截面观看分不见图和图5。横截面数据散点图的表现与观测值顺序有关。图和图中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。表 999-202年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费

9、1961997199819992002012002P-A(安徽) 282.466 36.150 37.410 389.581 4203554495.17447834P-BJ(北京) 51.97623048 6807.45 743.57 82062718654.433 173.12C-F(福建)41175 4853.441 519041 5314.51 52.769.36 5.005CP-HB(河北)39.9 388319 896.78 41028 436155 4454630.45CP-HL(黑龙江) 2904.687 3077.989 9.90 9.9 890.580 419.07 4493

10、.53PJ(吉林) 2833321 326.42 3477.56 373640807.961481.560 4998.874CP-JS(江苏) 371.260 5.788 498.4 076.1 57.82 5488.2969.31CP-JX(江西)274.24 3136.733234.465 3531.75312.2 391480 45.7CP-LN(辽宁)3237.275 8.060 391 446.584.420 454.420 5402063C-NM(内蒙古) 5234291723127.6333475.942 77345 170.5 4508-SD(山东) 440.64 39.57

11、48.974456.878 5011.976 5159. 563.70P-SH(上海) 61933 663183 6866.410 125.80 861.89 3.1010411.4CPSX(山西) 2133 1329 3314.097 350.008 393.908 41327 4787.561CP(天津) 23.20 5047.72 5498.503 59.613 61.62 904368 720.843C-ZJ(浙江) 53422340008 623.40 60079 6950.71376327 892资料来源:中国统计年鉴97-2003。表 99202年中国东北、华北、华东15个省级地

12、区的居民家庭人均收入数据(不变价格)地区人均收入9919199899200020IAH(安徽)410.251 4027 47.470 5178.528 526.7530.9 69.333IJ(北京) 6.974905 82.41 9127.999.700 1229.6 12692.38IP-FJ(福建) 48473 604.94460.5 92.109729.393 42573 235.538IP-(河北) 41428240.986517.17 6940 5678.195 555.0456747.5IPLJ(黑龙江) 18.497 318.31 4251. 44.045 4997.84 538

13、2086143.56I-(吉林) 49.95 404114.565 4571.439 87.96 271.95 29161IP-S(江苏) 474.54 568.830 6054.7 6624.31 693.43773.578243.59IP-(江西) 3869 399.49 40927 487.606 50.3153.688639.311IP-L(辽宁) 3899.14432.25049.89 98.164 363.15 59010 67.088-MG(内蒙古) 318.414 3774.804 438.6 48009506.22 502.873 038.922IP-D(山东) 4.94 0

14、49.407 542.5 84.909 77.016 695.527668.36IP-S(上海) 4895 89.0 7.100 077001143201883.6 1318388I-SX(山西)3431.94 869.952 4156.92 4360056.78 401.54 3573IP-TJ(天津) 44.963 409.0714627 7734.911.193 85.470 9375.060IP-Z(浙江) 64.15758.288 86.341 503 917.28 10485.6 11822.00资料来源:中国统计年鉴1997-2003。 图2 15个省级地区的人均消费序列(纵剖面

15、) 图 1个省级地区的人均收入序列图4 1个地区的人均消费散点图(7个时期) 图5 5个地区的人均收入散点图(7个时期)(每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度5个地区的收入值)用P表示消费,IP表示收入。AH, BJ, FJ, H,LJ,JL, JS, X,LN, NMG, SD,SH, SX,TJ, ZJ分不表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。5个地区7年人均消费对收入的面板数据散点图见图6和图7。图中每一种符号代表一个省级地区的7个观测点组成的时刻序列,相当于观看15

16、个截面上两个变量的时刻序列数据的散点图。图7中每一种符号代表一个年度的截面散点图(共7个时期),相当于观看7个时期上两个变量的截面数据的散点图。图6 人均消费对收入的面板数据(15个时刻序列叠加)图7 人均消费对收入的面板数据(7个时期叠加) 为了观看得更清晰一些,图8给出北京和内蒙古96-202年消费对收入散点图。从图中能够看出,不管是从收入依旧从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市196年的大。图9给出该15个省级地区1996和002年的消费对收入散点图。可见年之后15个地区的消费和收入都有了相应的提高。 图 北京和内蒙古19-02年消费对收入时序图

17、 图 196和002年个地区的消费对收入散点图EVie文件讲明(taeviespnelcn.wfl)incme_*:名义收入;conume_* :名义消费;p_*:实际收入;p_:实际消费;p_*:价格指数。操作方法:建立工作文件(ie)建立面板(Obect)定义截面标示符(Define)定义变量名称(Sheet)拷贝数据(或通过Imprt导入数据)练习题:利用onsue.xls建立Evis工作文件观看不同截面的p(i)的时刻趋势图; (假如是建立pool,需要将Sacked文件按照时刻将原文件拆分,即新文件的结构是截面数据)观看不同截面的cp和ip的散点图;(需要建立stack文件,将不同时

18、期的横轴变量排列成一个变量;将不同时期的纵轴变量拆分成T个变量,然后用scar观看:即第一个变量对所有其他变量的散点图)观看不同时期上cp(ip)的截面图;(假如是建立pl,需要将Stack文件按照截面将原文件拆分,即新文件的结构是时刻序列数据)观看不同时期上cp和ip的散点图;(需要建立stak文件,将不同截面的横轴变量排列成一个变量;将不同截面的纵轴变量拆分成N个变量,然后用scatte观看:即第一个变量对所有其他变量的散点图)PanelDat的EVws操作1.建立Pane的方法()直接在lNew workle中完成(2)假如数据是以叠加的形式存放的,如下表所示注意:数据文件中必须存有截面

19、变量和时刻变量。能够采纳第二种方法。Step1:建立naed的工作文件 Step2:导入数据Step:Pro/Strure current page混合可能模型用面板数据建立的模型通常有三种,即混合可能模型、固定效应模型和随机效应模型。所谓混合可能模型是指斜率和截距双固定的模型。假如从时刻上看,不同个体之间不存在显著性差异。从截面上看,不同截面之间也不存在显著性差异,那么就能够直接把面板数据混合在一起用一般最小二乘法(OLS)可能参数。比如,在例1中,在每一年,不同省份的消费与消费的关系均相同;对每一个省份来讲,每年的消费与收入的关系也相同。在这种情况下,就能够使用混合可能模型。假如从时刻和截

20、面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型, , =1, 2, , N; =1, 2, T 和不随i,t变化。称模型(1)为混合可能模型。对混合可能模型能够通过三种S方法进行可能。组内可能量个体的均值为, i , 2, , SEQ公式 * ABIC 1其中,(i = 1, 2, , N)。模型的离差形式为: SE 公式*RAIC 2OLS可能量为:称为组内可能量(Wthin grop stimto)。组间可能量变量的总均值为个体的均值离差形式为:OL可能量为:称为组内可能量(Within grou stiator)。又被称为LSDV可能量(Lat suares

21、dumy varibls)或协方差可能量(oaianc sator)。OLS可能量个体的均值离差形式为:其中,OLS可能量为:能够证明,。因此,OLS可能量又能够写作因此,OLS可能量为组内可能量与组间可能量的加权和。截距项的可能量为:以例1中15个地区1996和2002年数据建立关于消费的混合可能模型,得结果如下:= 2.13 +07587 Iit (20) (.7) R2 .8, SSEr =482588, 0 (3)= 1.15个省(市)的平均边际消费倾向为0.76。固定效应模型个体固定效应模型在面板数据中,假如不同的截面或不同的时期对应的截距项不同,那么称之为变截距模型。变截距模型能够

22、分为固定效应和随机效应模型两种。首先来看固定效应模型。个体固定效应模型的设定模型设定为: , i=1,, , ; t =1, 2, T 其中,i为不随时刻变化的不可观测的随机变量,用于反映个体之间的差异。假如i与X相关,则称为固定效应模型(entyfi fecsregressonmodel)。即: ,= 1, 2,, T SEQ 公式 RBIC 3将(2)式中每个方程写成矩阵形式, SE 公式 *RABIC4其中,,, =1,2,N SEQ公式 * ARABIC 5将(4)式进一步表示为: E 公式* ARIC 6即: EQ 公式* ARABI 个体固定效应模型组内可能假定:,由于i与相关,因

23、此不能直接用方法可能,LS可能量不具有一致性。由于不随着时刻而变化,因此能够通过离差的形式将其消除。模型两边取均值,可得: 其离差形式为:离差形式将i消除掉了,不存在误差项与X相关导致的不一致问题。组内可能的一大优点是,不论i与X是否相关,由于i不随时刻变化,因此组内离差会将i消除掉。因此,组内可能量是无偏的、一致的。但组内可能的一大缺点是,凡是不随时刻变化的变量,比如性不、种族、地理位置等,都会在组内离差转换时被消除掉。因此,组内可能无法可能这种变量的阻碍。组内可能的矩阵表述两端乘以矩阵Q, SEQ 公式 * ARAI 8注意,Q为对称幂等矩阵,且Q0。能够得到: SEQ公式 *ARABIC

24、 9应用OLS方法得到的OLS可能量: EQ 公式 ARABIC 10是无偏的,当N或T时,是一致的。其协方差矩阵为:。个体固定效应模型LS可能在固定效应中,传统的观点将视作与一样的未知参数,用于反映不同方程的不同截距项。这能够通过加入截面虚拟变量的方式进行可能。这能够通过重新表述如下矩阵来体现。关于N个截面,需要加入N-1个截面虚拟变量。因此其可能量称为SDV(Leas ques Dummy Variables)可能量。当较大时,这种可能方法损失了大量的自由度。因此,这种方法适用于当N较小的情况。关于来讲,LS可能量与组内可能量完全相同。LSV还能够可能出i。而且采纳SD可能能够更直观地计算

25、可能量的自由度。是无偏的,当N或T时,是一致的。也是无偏的,但仅当时,才具有一致性。当T固定,而N时,的LSV可能量不具有一致性。因为,每增加一个截面,i也增加一个未知参数。个体固定效应模型的设定检验LSDV的另一个好处是能够通过F统计量对个体效应的显著性进行检验。原假设H0:不同个体的模型截距项相同(建立混合可能模型)。备择假设H1:不同个体的模型截距项不同(建立个体固定效应模型)。统计量定义为: SQ 公式* ARAI 11其中k表示解释变量的个数(不包括常数项),SSEr,SSEu分不表示约束模型(混合可能模型)和非约束模型(个体固定效应模型)的残差平方和。非约束模型比约束模型多了N-1

26、个被估参数。(混合可能模型给出公共截距项。)用上例计算,已知SSE =482458,SSEu = 27086,F= .5F0.5(1, ) =1.1因为F= 715 0.05(4, 89) = 1.8,因此,拒绝原假设。结论是应该建立个体固定效应模型。时期固定效应模型模型设定为: , i1, 2, , N; t = 1,2, , 其中,t为不随个体变化的不可观测的随机变量,用于反映不同时期的差异。假如t与X相关,则称为时期固定效应模型(time ixedeects regressio moel)。即: ,i= 1, 2, ,N SQ 公式 *ARAIC 2将上式中每个方程写成矩阵形式, Q公式

27、* ARABIC 13或者表示为其中,, SEQ 公式* ARABIC4将上式进一步表示为: E 公式 AIC15即: S 公式* RBI 16时期固定效应模型的组内可能由于t与X相关,因此不能直接用LS方法可能,LS可能量不具有一致性。由于t不随着个体而变化,因此能够通过离差的形式将其消除。模型两边取均值,可得:其离差形式为:离差形式将t消除掉了,不存在误差项与X相关导致的不一致问题。与个体固定效应相类似,时期固定效应模型的组内可能优点是,不论t与X是否相关,由于t不随个体变化,因此组内离差会将消除掉。因此,组内可能量是无偏的、一致的。但组内可能的一大缺点是,凡是不随个体变化的变量,比如政策

28、、气候等,都会在组内离差转换时被消除掉。因此,组内可能无法可能这种变量的阻碍。组内转换的矩阵表述利用相似的方法定义矩阵Q, SEQ 公式 * AABIC 17注意,为对称幂等矩阵,且Qe=。两边同时乘以Q能够得到: EQ公式 *ARABIC 18应用OS方法得到的OLS可能量: Q公式 *AIC 19是无偏的,当N或T时,是一致的;其协方差矩阵为: SQ 公式 AC20也是无偏的,但仅当时,才具有一致性。时期固定效应的LSDV可能假如将t视作与一样的未知参数,用于反映不同方程的不同截距项。这能够通过加入时期虚拟变量的方式进行可能。这能够通过重新表述如下矩阵来体现。为了幸免多重共线性,关于T个截

29、面,需要加入T-1个截面虚拟变量。因此其可能量称为LSDV(e Sqaes mmiables)可能量。当较大时,这种可能方法损失了大量的自由度。因此,这种方法适用于当较小的情况。关于来讲,LV可能量与组内可能量完全相同。LSDV还能够可能出t。而且采纳SDV可能能够更直观地计算可能量的自由度。是无偏的,当N或T时,差不多上一致的。也是无偏的,但仅当N时,才具有一致性。当N固定,而T时,t 的LSV可能量不具有一致性。因为,每增加一个时期,也增加一个未知参数。时期固定效应的LSV可能假如采纳LSDV可能,能够通过F统计量对时期固定效应的显著性进行检验。H:关于不同横截面模型截距项相同(建立混合可

30、能模型)。1:关于不同横截面模型的截距项不同(建立时期固定效应模型)。F统计量定义为:F= SE 公式 * RAIC 21其中SEr,SSEu分不表示约束模型(混合可能模型的)和非约束模型(时期固定效应模型的)的残差平方和。非约束模型比约束模型多了T-k个被估参数。用上例计算,已知SE4824588,SSEu= 0843,F=3.9F005(6, 87) 2.2因为 3.19 F0.0(, 89) = 22,拒绝原假设,结论是应该建立时期固定效应模型。双因素固定效应模型模型设定为: ,=1, ,; t = 1, , T 其中,i为不随时刻变化的不可观测的随机变量,用于反映个体之间的差异;t为不

31、随个体变化的不可观测的随机变量,用于反映不同时期的差异。假如i、与相关,则称为时期个体固定效应模型(tme nd eity fxed effecs regresion odl)。矩阵表示为双因素固定效应的组内可能由于i、t与相关,因此不能直接用S方法可能,LS可能量不具有一致性。但能够通过离差的形式将其消除。对模型在不同时期和不同个体上分不求均值,得到离差形式,组内转换后的方程差不多不包含i、,能够直接利用LS方法进行可能。组内可能的矩阵表述仍然采纳Walce an Hussan(199)的组内转换方法。令其中,I表示单位矩阵,e表示所有元素为1的列向量,J表示所有元素为1的(TT)矩阵,,。

32、注意观看矩阵的特点,Q为幂等对称矩阵。两边同时乘以Q,可得:双因素固定效应的LSDV可能能够采纳加入虚拟变量的方法来可能。然而关于个体效应和时期效应必须加入(N-)+(T-1)个虚拟变量。这会丧失大量自由度,并容易引起多重共线性问题。的LSDV可能量与组内可能量完全相同。、的可能量分不为:假如满足上述模型假定条件,对模型(2)进行OL可能,全部参数可能量差不多上无偏的和一致的。双因素固定效应的设定检验假如将、视作未知参数,能够通过F统计量对时期、个体固定效应的显著性进行检验。:,。即关于不同横截面,不同序列,模型截距项都相同(建立混合可能模型)。H:存在明显差异或存在明显差异,即不同横截面,不

33、同序列,模型截距项不相同(建立时期个体固定效应模型)。F统计量定义为:F= 其中SEr,SSEu分不表示约束模型(混合可能模型的)和非约束模型(时期个体固定效应模型的)的残差平方和。非约束模型比约束模型多了N+T2个被估参数。用上例计算,已知SEr= 482488,SSu= 20560,F= 5.6F0.05(20, 1)= 164因为= .6 0.5(14, 89) = 1.64,拒绝原假设,结论是应该建立时期个体固定效应模型。给定时刻效应,能够检验个体效应的显著性。H0:,给定。现在无约束模型仍然为混合可能模型,而受约束模型则为仅带有时刻虚拟变量的模型。构建F统计量。类似地,给定个体效应,

34、能够检验时刻效应的显著性。H0:,给定。现在无约束模型仍然为混合可能模型,而受约束模型则为仅带有个体虚拟变量的模型。构建F统计量组间可能实践中另外一种被经常引用的可能量是组间可能量。与组内可能不同,组间可能是利用均值方程进行可能。不论把和视作随机变量依旧待估参数,个体固定效应或时期固定效应的组间可能方程差不多上一样的。在个体固定效应模型中,组间可能是可能如下方程:在时期固定效应模型中,组间可能是可能如下方程: 在双因素固定效应模型中,组间可能能够通过两种方式进行。假如把和视作随机变量,可能方程为:假如把和视作待估参数,则可能方程为:显然,假如和与X相关,那么组间可能量是不一致的。随机效应模型在

35、模型, i =1,2,, N; t=1, , 假如和为随机变量,则称为随机效应模型。其中,称为个体随机效应,称为时刻随机效应。差不多假定:,令,则依照上述假定,。因此,随机效应模型又被称作误差成份模型(error copnent)或方差成分模型(variance comonent)。单因素随机效应模型当模型中仅存在个体随机效应,, i =1,2, ; t=1,2, T则称为个体随机效应模型。将其写作, i 1,,,N;t=, 2, ,T其中,每个个体所对应方程的矩阵表达式为:, i=1, 2, , 其中,。所有N个方程的矩阵表达式为:其中,。其中,。的协方差矩阵为:其逆矩阵为:在上述假定下,的

36、协方差矩阵为:组内可能(协方差可能)在随机效应模型中,仍然能够采纳Q矩阵,,OLS可能能够得到的协方差可能量。在随机效应模型中,不论N或T,均是无偏和一致的,但不再是有效的。因为同一个个体在不同时期上的观测值存在相关。这时,需要利用L可能方法。组间可能,,GL可能因为均包含,因此,同一截面内不同期的误差项存在相关。即,为了得到参数的有效可能量,必须使用GS方法。GLS可能量为:其中,,。要得到参数的G可能量,首先要可能出vi的协方差矩阵V。依照Wansbek-pten(82,193)和Madala(1971),将写作:令,,则,其中。注:矩阵P和Q的性质:矩阵P的性质:对称幂等矩阵,即P =

37、P,Pm =P。依照定理:幂等矩阵的秩等于其迹,能够证明Rnk(P) = tr(P) 1设X为由个变量(X1, X, , K)的观测值组成的矩阵,PX得到的矩阵表示X的均值,即其第k列的元素均为变量的均值。P = 矩阵的性质:对称幂等矩阵,即 = Q,m = Q。ank(Q) =tr(Q) = T-1设X为由K个变量(1, X2, , X)的观测值组成的矩阵,QX得到的矩阵表示的离差,即其第k列的元素均为变量X的离差。Qe 另外,Q= 0,P+ I。事实上,对任意实数r,因此,协方差矩阵的逆矩阵能够写作:将其带入GLS可能量公式中,可得:实践中,成份方差和是未知的,因此,需要首先得到和的一致可

38、能量,然后再将其带入LS可能量表达式。这便是可行的GLS方法(GL)或者称之为两步GLS(Twotep GS)。专门多学者提出了和的不同的可能方法。常用的有三种方法:wmAra(1972), Waace-Hussain(1969)和Wansbee-Kapteyn(193)。由矩阵P和Q的性质,可得: (5) (6)由(5)能够得到的可能量: 由(6)能够得到的可能量: Wlace-Hussai(1969)利用OS可能残差作为的替代。Wansbeek-Kp(192)则利用组内可能(LSDV或固定效应可能)的残差作为v的替代。Swamy-Aroa(12)采纳两步回归法进行可能,即利用组内(即固定效

39、应)和组间可能的残差项。第一步是进行组内回归 ,1,2,N如前所述,这等价于在方程两边同时乘以矩阵Q,然后用OL进行回归。即 令其残差项表示为,则的可能量为:第二步是进行组间回归,方程两边同时乘以矩阵,即回归方程 这等价于在方程两边同时乘以矩阵,然后用进行回归。即: 令其残差项表示为,则的方差可能量:事实上,S可能量能够表述为组内可能量与组间可能量的加权和的形式。因此,可能量又能够写为:利用分块矩阵,可得到的LS可能量:其中,。由组内可能量和组间可能量:,可将GLS可能量表示为:其中,,因此,LS可能量是组内可能量与组间可能量的加权和。假如,则,从而退化为。假如,则,从而退化为。假如相关于处于

40、主导地位,则;假如相关于处于主导地位,则。也确实是讲,忽略了组间的变动,而忽略了组内变动,OLS可能量给予和以相同权重。双因素随机效应模型假如 中的个体效应和时期效应差不多上随机的,称之为双因素随机效应模型。令,依照差不多假定,且 因此, 的协方差矩阵为: 令 其中Q均为对称幂等矩阵,两两正交,且1 Q2+Q3 Q4=I。能够将的协方差矩阵重新表述为: 关于任意实数r,都存在 因此,在模型两边同时乘以可得, 其中,。 转换后模型的随机扰动项为同方差,且任意观测值之间不存在相关性:由Q的彼此正交的特征,可得 再次利用的彼此正交的特征,可得 因此, 将转换后的模型直接利用OL方法进行可能,即得到G

41、LS可能量。由可得的可能量公式: 。其中,u能够采纳不同的可能方法。依照Wallae andHsain(196),直接用OL残差项代替。依照Amemiya(19),用组内转换(见双因素固定效应可能)可能得到的残差项代替。Samyan Arra(972)则采纳三步回归法。第一步采纳组内转换方法,原模型两边同时乘以Q1,即用对回归,从而得到的可能量 注:残差项残差平方和为: 第二步是个体组间回归,原模型两边同时乘以Q3,即用对回归,得到的可能量 进而得到的可能量。第三步是时期组间回归,即用对回归,得到的可能量 进而得到的可能量。事实上,GLS可能量能够等价地表示为: 其中,,。由组内可能量、个体组

42、间可能量和时期组间可能量将GLS可能量重新表述为: 其中, 当时,;当时,;当时,;当时,,。差分可能关于两期的面板数据,其中,i表示不可观测成分,用于反映不随时刻变化的不可观测变量。假如i与X相关,那么OS可能量是有偏的。为了得到其他参数的一致可能量,能够通过差分的方法消除i。两式相减可得:在差分方程中,i被消除掉了。能够利用LS方法进行可能。例:失业率对犯罪率的阻碍(File:crime.fl;data fil: crime2.raw)rmrit = 1 d1+ nemi + i+ uit其中,Crmrt=(crimes/pop)00: 犯罪率(犯罪次数/千人);D7:虚拟变量,2年为0,

43、7年为1。Unem:失业率(%)。数据文件包含了46个都市1982年和198年的犯罪率数据。假如是三期(或三期以上)的面板数据,差分后得到那个地点我们要注意虚拟变量差分项的结构,关于三期的面板数据来讲,更适应的表示方法是加入常数项而省略一个虚拟变量,即模型设定为:关于一般的面板数据模型,其一阶差分模型为:例:CowelladTumbul (99)利用Nrth arolina90个乡镇1981187的数据(数据文件:CIM4.RAW)。模型设定如下:其中,被解释变量为犯罪次数/人,解释变量除了时刻虚拟变量之外,还包括:prbarr表示被逮捕的概率,prconv表示犯罪后被宣判的概率,prbps表

44、示宣判后坐牢的概率,avgn表示服刑的时刻,polpc表示警察人。利用差分法可能上述模型。综上所述,我们把各种不同可能量总结如下。不论是固定效应或随机效应,在固定效应中不论是把或视作代估参数依旧视作随机变量,组内可能量总是无偏、一致的。在固定效应模型中,组内可能量是有效可能量。因此,组内可能量也被直接称作固定效应可能量。组间可能量是利用组均值进行可能,在固定效应模型中或与X相关,因此组间可能量不具有一致性。而在随机效应模型中,或与X不相关,因此组间可能量具有一致性,但没有有效性。GLS可能量是处理异方差或自相关的重要方法。在随机效应模型中,或与X不相关,但会导致误差项的自相关,GLS可能量是一

45、致有效可能量。差分可能量是处理个体效应模型(固定效应或随机效应)的重要可能方法。在两期面板数据中,差分可能量与组内可能是等价的。但在多期面板数据中,差分可能量不是有效可能量。Hausman检验Hausma检验不论是固定效应模型依旧随机效应模型,一个关键的假定是。vit包含有不能直接观测的变量i,假如与解释变量Xit相关,则这一假定就被违背了。GLS可能量是有偏的且不一致的。然而组内可能通过转换将i从模型中删除掉,因此其可能量是无偏的、一致的。Hasma(178)证明,关于参数的两个一致可能量和,是有效可能量而是无效可能量,则与的协方差为,即 usman(1978)通过比较和来检验原假设H0:。

46、在原假设成立的条件下,是一致、有效可能量,而则是一致、无效可能量。但在备择假设下,是不一致的,而是一致的。在固定效应与随机效应的检验中,。检验统计量则是基于。假如H0成立,有 SEQ公式* ARBIC s1 依照可能量的方差公式:,,。Hauma统计量为:实践中,将和都换成其一致可能量即可。在原假设成立的条件下,在随机效应模型中,GLS可能量具有一致性和有效性;而假如原假设不成立,在固定效应模型中采纳Withn可能量具有一致性和有效性。因此,假如同意原假设,则采纳随机效应模型,并利用LS可能方法。而假如拒绝原假设,则采纳固定效应模型,并采纳ithn可能方法。usman检验的替代形式事实上,usan检验能够通过其他几种等价的替代形式进行。Hasman an Taylr(1981)证明,Hauma统计量能够通过如下几种等价形式来完成:对应的Hausma统计量为:, i1,3而Bltai(199)证明,上述几个统计量等价于其中,其他内生性检验rela(993)提出了另外一种内生性检验,异方差自相关稳健内生性检验。模型检验数据的可混合性检验(olablty)随机效应模型中个体或时刻效应的检验关于随机效应模型的设定检验,即是否存在个体效应或时刻效应。原假设包括以下几

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论