TC数据模型.doc_第1页
TC数据模型.doc_第2页
TC数据模型.doc_第3页
TC数据模型.doc_第4页
TC数据模型.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

面板数据模型一、 面板数据的概念面板数据是时间序列数据和截面数据相结合的二维数据,为方面起见,暂且将之统称为TC数据(即时间截面二维数据的意思),以我国31个省份1991-1999年的GDP数据为例,则每一个年度称为一个截面,每个省份称为一个个体,每一个年度的31个省份的GDP数据(31个)就是截面数据,每一个省份的9年的GDP数据(9个)就是时间序列数据,即GDP这个变量在时间维度有9个取值,在截面维度有31个取值,这些数据合在一起就是TC数据,共31*9=279个。如果每个截面包含相同数量的个体,则称之为平衡TC数据,否则为非平衡TC数据。面板数据的主要优点有:1. 有利于降低多重共线性程度。增加数据纬度的同时也增加了样本容量,样本容量增加可以增加变量之间的差异,降低变量间的相关程度,从而降低共线性程度。2. 可以进行模型效应分析,更准确地理解统计结果的实际含义。二、 面板数据模型的种类面板数据模型分为Pooled Data模型和Panel Data模型二类,Pooled Data模型适用于研究时期较多个体较少的TC数据,须为每个个体命名,研究目的侧重于个体差异或时期趋势;Panel Data模型适用于研究个体较多、时期较少的TC数据,不须为每个个体命名,研究目的侧重于由时期差异或个体推断总体。另外,Pooled Data模型允许各时期的个体不相同,Panel Data模型要求各时期的个体相同。例如:pooled datat=1:A B C D F t=2:A B D Epanel datat=1:A B C D Et=2:A B C D E三、 模型的基本形式1. Pooled Data模型,2. Panel Data模型,其中,可以是非线性的。比较分析:由于研究目的不同,所以前者允许系数可变,后者假定系数不变。四、 模型形式的分类根据模型是否存在个体效应(即不同的个体是否有不同的模型),可分为效应模型和无效应模型两类,其中,Pooled Data模型的效应模型又分为变系数模型和变截距模型两种;Panel Data模型的效应模型只有变截距模型一种。所以,Pooled Data模型有3种,Panel Data模型只有2种。1. 效应模型(1) 变系数模型如果对不同的(),和都不相同,则称为个体(时期)效应变系数模型,可表示为:或:变系数模型等价于在模型中纳入“单独的个体哑变量项”和“个体哑变量与自变量的交叉项”来体现个体差异。该模型用于描述:x和y的关系不仅在个体之间存在显著差异,而且x对这种差异有显著影响,或者说,x是产生这种差异的影响因素。这种结论是普通回归模型难以得到的(因为代表个体的哑变量须设置很多“二分变量”)。(2) 变截距模型如果对不同的(),只是不相同,但相同,则称为个体(时期)效应变截距模型,可表示为:或:变截距模型等价于在模型中纳入“单独的个体哑变量项”来体现个体差异。该模型用于描述:x和y的关系在不同个体存在显著差异。2. 无效应模型如果对不同的(),和都相同,则称为混合模型,可表示为:该模型用于描述:x和y的关系与个体或时期均无关。模型效应包括固定效应和随机效应2种,当个体就是总体时,则称之为固定效应模型(FE);当个体是来自总体的随机样本时,则称之为随机效应模型(RE)。对于平衡数据,Eviews可以估计“双向FE”或“双向RE”,非平衡数据则不能。五、 模型选择1. 模型形式选择(1) Pooled Data模型形式选择-F检验1) 假设:假设模型为变截距模型:假设模型为混合模型2) 统计量其中,S1、S2、S3分别表示变系数模型、变截距模型和混合模型的残差平方和,N是样本个数,K是外生变量个数,T是时期总数。(注:S1和S2均采用FE模型计算,可从回归结果中取得,然后手工计算F1和F1)3) 检验规则(A) 如果F2小于临界值(p值大于0.05),则不否定H02,应选择混合模型;(B) 如果F2、F1均大于临界值(两个p值均小于0.05),则否定H02和H01,应选择FE变系数模型;(C) 如果F2大于临界值但F1小于临界值(F2的p值小于0.05,但F1的p值大于0.05),则否定H02但不否定H01,应选择FE变截距模型。.参考F检验的Eviews操作: 估计变系数模型(无约束模型),做F检验(View/Fixed/Random Effects Testing/Redundant Fixed Effects - Likelihood Ratio 下同),P值记为p1;估计变截距模型(相对混合模型而言,也是无约束模型),做F检验,P值记为p2。 当p1临界值,但p2临界值时,则不否定“截距”约束,也不否定“斜率”约束,故采用混合模型(2) Panel Data模型形式选择- Likelihood Ratio检验Panel Data模型形式包括变截距模型(效应模型)和混合模型(无效应模型)两种。1) 假设:模型为混合模型(约束模型),:模型为FE变截距模型(未约束模型)2) 统计量式中,S1、S2分别表示FE变截距模型和混合模型的残差平方和。如果p值小于0.05,则拒绝原假设,选择FE变截距模型,反之则选择混合模型。Eviews操作:先估计FE变截距模型,然后做Likelihood Ratio检验(View/Fixed/Random Effects Testing/Redundant Fixed Effects Likelihood Ratio.)。如果P值0.05,则拒绝混合模型,接受FE变截距模型。注:(1)Panel data 模型的混合模型是在Panel Options 页的效应定义菜单中选择“None”选项来设置。(2)该检验也适合于Pooled Data模型中的混合模型和FE变截距模型之间的选择。由于变系数模型太复杂,实际应用很少采用,因此一般只考虑是采用混合模型还是FE变截距模型。该检验也称为“F检验”、“FE显著性检验”等。2. 模型效应选择前面在选择模型种类时都是按照FE计算的,而RE模型的含义更具有普遍性,所以如果可能的话,应尽量采用RE模型的结果。由于软件的局限,模型效应的选择目前只适合于变截距模型,不适合于变系数模型,变系数模型就不用选择了,一律采用FE。变截距模型效应可按照下列步骤选择:(1) 根据研究对象和目的不同作定性选择如果研究对象就是样本/个体本身,目的也是比较样本之间的特点,或样本量和时期数都较小时,则应选择FE;如果研究对象是总体,目的是通过样本推断总体,则应选用RE。(2) Hausman检验(RE合理性检验)Eviews操作:先估计RE模型,然后做Hausman检验(View/Fixed/Random Effects Testing/Correlated Random Effects - Hausman Test.)。如果P值0.05,则拒绝原假设“RE与解释变量不相关”,即拒绝采用RE模型。参考:不相关的假设下,固定效应和随机效应模型是一致的,但固定效应不具有效性;反之,则随机效应模型不具一致性,而应采用固定效应模型。六、 模型估计1. 异方差如果存在个体/时期异方差(例如,个体/时期个数大于时期/个体个数时),在Eviews中可选用“个体/时期加权回归法”(cross-section/period weight)估计模型。2. 自相关如果同时存在个体/时期异方差和自相关,在Eviews中可选用“个体/时期近似不相关加权回归法”(cross-section/period SUR)估计模型。七、 单位根检验和协整检验1. 单位根检验共6种检验方法,按照原假设不同可分为三类:(1) 假设存在相同单位根。LLC(Levin, Lin & Chu),Breitung(2) 假设存在不同的单位根。IPS(Im, Pesaran, Shin),ADF-Fisher,PP-Fisher(3) 假设不存在相同的单位根。Hadri参考:只要有两种不同的单位根检验方法(相同根与不同根检验)检验结果不存在单位根就可以接受“序列平稳”,不要求所有检验都通过。Eviews操作:在pool对象窗口中,View Unit Root Test2. 协整检验如果基于单位根检验的结果发现变量之间是同阶单整的,即可进行协整检验。通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。Pedroni、Kao、Johansen的方法。零假设是没有协整关系Eviews操作:在pool对象窗口中,ViewCointegration Test八、 Eviews操作举例例1建立我国城镇居民消费函数的面板数据模型(数据文件:E:zy统计学时间序列 pooldata.wf1或paneldata.wf1)。在excel中按如下格式输入数据,并保存为paneldata.xls。地区RegionYearCONSCONS1INC安徽1199425513048安徽11995272825513275安徽11996282727283536安徽11997284128273537安徽11998289628413658安徽11999306528963979北京2199441345085北京21995427941345315北京21996437742795601北京21997473943775668北京21998493847396002(一)Panel Data模型1. 数据文件建立方法一:(1) 新建工作文件:file/new/workfile(2) 将paneldata.xls读入到Eviews中。ProcImportRead Text-Lotus-Excel方法二:(1) 新建工作文件:file/new/workfile(2) 将paneldata.xls读入到Eviews中。ProcImportRead Text-Lotus-Excel(3) 修改数据格式ProcStructureResize Current Page,或双击Range:1742. 模型形式选择估计个体FE变截距模型Dependent Variable: CONSMethod: Panel Least SquaresDate: 03/24/10 Time: 23:40Sample (adjusted): 1995 1999Cross-sections included: 29Total panel (unbalanced) observations: 142VariableCoefficientStd. Errort-StatisticProb.C585.0825109.38005.3490820.0000CONS10.1024680.0584521.7530310.0824INC0.5815850.03143118.503680.0000注:如果想得到标准化系数,则须自己动手对变量进行标准化转换,eviews命令为:新变量名=(X-mean(原变量名)/stdev(原变量名) Effects SpecificationCross-section fixed (dummy variables)R-squared0.994624Mean dependent var3234.430Adjusted R-squared0.993171S.D. dependent var916.4458S.E. of regression75.73195Akaike info criterion11.68260Sum squared resid636621.5Schwarz criterion12.32789Log likelihood-798.4646F-statistic684.5609Durbin-Watson stat2.153824Prob(F-statistic)0.000000观察变截距情况View/Fixed/Random Effects/Coss-section EffectsREGIONEffect1.000000-89.338302.000000297.92733.00000097.832914.000000-132.43505.000000505.17056.000000160.67817.000000-57.451048.000000-56.562549.000000-133.248010.00000-132.546811.00000-163.882712.0000042.0916913.0000058.3527214.00000-93.3745115.000001.87092416.00000-219.176818.00000-7.73219719.00000-244.668220.00000-76.9002921.00000-66.7685422.00000-123.410323.00000-135.986224.00000-9.67728825.00000325.302226.0000097.8486327.0000066.8953928.00000-177.743229.0000046.8001430.00000278.8408Likelihood Ratio检验Redundant Fixed Effects TestsEquation: UntitledTest cross-section fixed effectsEffects TestStatisticd.f.Prob.Cross-section F3.249093(28,111)0.0000Cross-section Chi-square85.002864280.0000P值0.05,则拒绝混合模型,接受个体FE变截距模型。本例的研究对象是各地区本身,因此没必要进行关于RE合理性的Hausman检验估计时期FE变截距模型Dependent Variable: CONSMethod: Panel Least SquaresDate: 03/24/10 Time: 23:53Sample (adjusted): 1995 1999Cross-sections included: 29Total panel (unbalanced) observations: 142VariableCoefficientStd. Errort-StatisticProb.C3.22426027.539950.1170760.9070CONS10.4884720.04590010.642190.0000INC0.4291260.03524212.176470.0000Effects SpecificationPeriod fixed (dummy variables)R-squared0.991373Mean dependent var3234.430Adjusted R-squared0.990990S.D. dependent var916.4458S.E. of regression86.99212Akaike info criterion11.81755Sum squared resid1021630.Schwarz criterion11.96326Log likelihood-832.0462F-statistic2585.584Durbin-Watson stat1.716525Prob(F-statistic)0.000000View/Fixed/Random Effects/Period EffectsDATEIDEffect1995-01-0150.398591996-01-01-32.991331997-01-014.7281601998-01-01-33.826921999-01-0112.45479Likelihood Ratio检验Redundant Fixed Effects TestsEquation: UntitledTest period fixed effectsEffects TestStatisticd.f.Prob.Period F4.517949(4,135)0.0019Period Chi-square17.83978640.0013P值0.05,则拒绝混合模型,接受时期FE变截距模型。3. 模型效应选择Hausman检验Correlated Random Effects - Hausman TestEquation: UntitledTest period random effectsTest SummaryChi-Sq. StatisticChi-Sq. d.f.Prob.Period random16.18582120.0003* Warning: estimated period random effects variance is zero.P值0.05,则拒绝采用时期RE模型。结论:采用panel data模型估计时,应选择个体FE变截距模型和时期FE变截距模型(二)Pooled Data模型1. 数据文件建立(1) 新建工作文件:file/new/workfile(2) 新建pool对象:objects/new object/pool或输入命令: pool pool1(3) 定义个体(省份)名称输入命令:pool1.define ANH BJ FUJ GAS GUD GUX GUZ HUN HEB HUN HLJ HUB HUN JIL JIS JIX LIL NMG LIX QIH

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论