版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图11.1.1面板数据示意图
图11.1.1面板数据示意图1
例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yit,i=1,2,…,N;t=1,2,…,T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balancedpaneldata)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalancedpaneldata)。
例11.1.11996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入(不变价格)数据见表11.1.1和表11.1.2。数据是7年的,每一年都有15个数据,共105组观测值。表11.1.11996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)例如1990-2000年30个省份的农业总产值数据。2面板数据模型经典课件3表11.1.21996-2002年中国15个省级地区的居民家庭人均收入数据(不变价格)表11.1.21996-2002年中国15个省级地区的居4
人均消费和收入的面板数据从纵剖面观察分别见图11.1.2和图11.1.3。从横截面观察分别见图11.1.4和图11.1.5。用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。人均消费和收入的面板数据从纵剖面观察分别见图15图11.1.215个省市人均消费序列(纵剖面)
图11.1.215个省市人均消费序列(纵剖面)6图11.1.315个省市人均收入序列
图11.1.315个省市人均收入序列7图11.1.415个省市人均消费散点图
(每条连线表示同一年度15个地区的消费值)图11.1.415个省市人均消费散点图8图11.1.515个省市人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的收入值)图11.1.515个省市人均收入散点图(7个横截面叠加)9
15个地区7年人均消费对收入的面板数据散点图见图11.1.6和图11.1.7。图11.1.6中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图11.1.7中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。图11.1.6用15个时间序列表示的人均消费对收入的面板数据15个地区7年人均消费对收入的面板数据散点图10图11.1.7用7个截面表示的人均消费对收入的面板数据(7个截面叠加)
图11.1.7用7个截面表示的人均消费对收入11
图11.1.8给出北京和内蒙古1996-2002年消费对收入散点图。图11.1.9给出15个省级地区1996和2002年的消费对收入散点图。图11.1.8北京和内蒙古1996-2002年消费对收入时序图
图11.1.8给出北京和内蒙古1996-2002年消12图11.1.91996和2002年地区消费对收入散点图
图11.1.91996和2002年地区消费对收入1311.1.2面板数据模型的基本类型设yit为被解释变量在横截面i和时间t上的数值,
xjit为第j个解释变量在横截面i和时间t上的数值,uit为横截面i和时间t上的随机误差项;bji为第i截面上的第j个解释变量的模型参数;ai为常数项或截距项,代表第i横截面(第i个体的影响);解释变量数为j=l,2,…,k;截面数为i=1,2,…,N;时间长度为t=1,2,…,T。其中,N表示个体截面成员的个数,T表示每个截面成员的观测时期总数,k表示解释变量的个数。则单方程面板数据模型一般形式可写成:11.1.2面板数据模型的基本类型14面板数据模型经典课件15
对于平衡的面板数据,即在每一个截面单元上具有相同个数的观测值,模型样本观测数据的总数等于NT。当N=1且T很大时,就是所熟悉的时间序列数据;当T=1而N很大时,就只有截面数据。面板数据模型划分为3种类型:
(1)无个体影响的不变系数模型:ai=aj=a,bi=bj=b对于平衡的面板数据,即在每一个截面单元上具有相16
这种情形意味着模型在横截面上无个体影响、无结构变化,可将模型简单地视为是横截面数据堆积的模型。这种模型与一般的回归模型无本质区别,只要随机扰动项服从经典基本假设条件,就可以采用OLS法进行估计(共有k+1个参数需要估计),该模型也被称为联合回归模型(pooledregressionmodel)。
(2)变截距模型:ai≠aj,bi=bj=b
这种情形意味着模型在横截面上存在个体影响,不存在结构性的变化,即解释变量的结构参数在不同横截面上是相同的,不同的只是截距项,个体影响可以用截距项ai(i=1,2,…,N)的差别来说明,故通常把它称为变截距模型。这种情形意味着模型在横截面上无个体影响、无结17(3)变系数模型:ai≠aj,bi≠bj
这种情形意味着模型在横截面上存在个体影响,又存在结构变化,即在允许个体影响由变化的截距项ai(i=1,2,…,N)来说明的同时还允许系数向量bi(i=1,2,…,N)依个体成员的不同而变化,用以说明个体成员之间的结构变化。我们称该模型为变系数模型。(3)变系数模型:ai≠aj,bi≠bj1811.1.3面板数据模型的优点
1.利用面板数据模型可以解决样本容量不足的问题
2.有助于正确地分析经济变量之间的关系
3.可以估计某些难以度量的因素对被解释变量的影响11.2模型形式设定检验11.1.3面板数据模型的优点19
建立面板数据模型首先要检验被解释变量yit的参数ai和bi是否对所有个体样本点和时间都是常数,即检验样本数据究竟属于上述3种情况的哪一种面板数据模型形式,从而避免模型设定的偏差,改进参数估计的有效性。主要检验如下两个假设:
如果接受假设H2,则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2,则需检验假设H1。如果接受H1,则认为样本数据符合变截距、不变系数模型;反之,则认为样本数据符合变系数模型。建立面板数据模型首先要检验被解释变量yit的20
下面介绍假设检验的F统计量的计算方法。首先计算变截距、变系数模型(11.1.6)的残差平方和S1。如果记下面介绍假设检验的F统计量的计算方法。21面板数据模型经典课件22面板数据模型经典课件23面板数据模型经典课件24面板数据模型经典课件25面板数据模型经典课件2611.3变截距模型
该模型允许个体成员上存在个体影响,并用截距项的差别来说明。模型的回归方程形式如下:11.3变截距模型2711.3.1固定影响变截距模型
1.最小二乘虚拟变量模型(LSDV)及其参数估计11.3.1固定影响变截距模型28其中其中29面板数据模型经典课件30面板数据模型经典课件31
例11.3.1
利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2),试研究这些地区的居民家庭消费行为。(1)建立合成数据库(pool)对象或混合数据库对象;(2)定义序列名并输入数据;(3)估计无个体影响的不变系数模型;(4)估计变截距模型。(1)建立合成数据库(pool)对象在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选NewObject功能,从而打开NewObject(新对象)选择窗(见图11.3.1)。例11.3.1利用1996-2002年中国东北、华北32图11.3.1Pool对象定义对话框图11.3.1Pool对象定义对话框33
在TypeofObject选择区选择Pool(混合数据库),在NameofObject选择区命名CS(初始显示为Untitled),点击OK,从而打开Pool对象说明窗口。在窗口中输入15个地区标识AH(安徽)、BJ(北京)、…、ZJ(浙江)。如图11.3.2所示。
在TypeofObject选择区选择Pool(混合数34图11.3.2Pool对象说明窗口图11.3.2Pool对象说明窗口35(2)定义序列名并输入数据在新建立的Pool(混合数据)窗口的工具栏中点击Sheet键,从而打开SeriesList(列出序列名)窗口,定义时间序列变量CP?和IP?,如图11.3.3。点击OK键,从而打开Pool(混合数据库)窗口,输入数据,输入完成后的情形见图11.3.4。图11.3.3序列列表对话框(2)定义序列名并输入数据图11.3.3序列列表对话框36图11.3.4序列的堆栈形式数据表图11.3.4序列的堆栈形式数据表37
(3)估计无个体影响的不变系数模型模型形式为
其中:a为15个省市的平均自发消费倾向,b为边际消费倾向。在Pool窗口的工具栏中点击Estimate键,打开PooledEstimation(混合估计)窗口如图11.3.5。(3)估计无个体影响的不变系数模型其中:a为15个省市的38图11.3.5合成数据模型定义对话框图11.3.5合成数据模型定义对话框39
在对话框左上部的DependentVariable选择窗填入被解释变量CP?;在中部的Commoncoefficients(系数相同)选择窗填入解释变量IP?;Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;Intercept选项代表截距的处理方式。None代表模型不包含截距,Common指所有截面单元具有相同截距,Fixedeffects与Randomeffects分别表示截距变动的固定效应和随机效应。本例选择窗点击Common。对话框Weighting(权数)选项是模型的估计方法。本例选择不加权,点击Noweighting。完成合成数据模型定义对话框后,点击OK键,得输出结果如表11.3.1。表11.3.1无个体影响的不变系数模型估计结果在对话框左上部的DependentVariable选择40面板数据模型经典课件41
表11.3.1结果表明,回归系数显著不为0,调整后的样本决定系数达0.98,说明模型的拟合优度较高。从结果看,平均消费倾向为0.76,表明15个省级地区的人均消费支出平均占收入的76%。(4)变截距模型模型形式为
其中:ai为15个省市的自发消费倾向,用来反映省市间的消费结构差异,b为边际消费倾向。
EViews估计方法:在EViews的PooledEstimation对话框中Intercept选项中选Fixedeffects。其余选项同上。得输出结果如表11.3.2。表11.3.2变截距模型估计结果表11.3.1结果表明,回归系数显著不为0,调整后的样本决42面板数据模型经典课件43
表11.3.2中给出了变截距模型估计结果,表中的系数0.697561为边际消费倾向,后面三项是估计标准误、检验统计量值和相伴概率。表中下半部是各地区截距估计值。输出结果的方程形式是安
徽:CP_AH=479.3076014+0.6975614547*IP_AH北
京:CP_BJ=1053.179629+0.6975614547*IP_BJ福
建:CP_FJ=467.9678362+0.6975614547*IP_FJ河
北:CP_HB=361.3764747+0.6975614547*IP_HB黑龙江:CP_HLJ=345.9120278+0.6975614547*IP_HLJ吉
林:CP_JL=540.1174754+0.6975614547*IP_JL江
苏:CP_JS=480.417445+0.6975614547*IP_JS江
西:CP_JX=195.9175812+0.6975614547*IP_JX辽
宁:CP_LN=622.0405359+0.6975614547*IP_LN内蒙古:CP_NMG=306.0650134+0.6975614547*IP_NMG表11.3.2中给出了变截距模型估计结果,表中的系数0.44山东:CP_SD=381.4986769+0.6975614547*IP_SD上海:CP_SH=782.5988793+0.6975614547*IP_SH陕西:CP_SX=440.7243659+0.6975614547*IP_SX天津:CP_TJ=562.8424811+0.6975614547*IP_TJ浙江:CP_ZJ=714.233227+0.6975614547*IP_ZJ
表11.3.2结果表明,回归系数显著不为0,调整后的样本决定系数达0.99,说明模型的拟合优度较高。从估计结果可以看出,对于本例中的15个省市来说,虽然居民边际消费倾向相同,但是其居民的自发消费存在显著的差异,其中北京、上海、浙江是居民自发消费最高的3个地区,而居民自发消费最低的是江西,其次是内蒙古。山东:CP_SD=381.4986769+0.645
对于随机效应模型或者变系数模型,用EViews建模过程大同小异,只是结果输出窗口中的参数估计格式有所区别。
EViews5.1版本的面板数据模型估计(PoolEstimation)窗口分成了两个模块:Specification(设定)和Option(选择),但基本功能与早期版本无本质区别,主要选择都集中在Specification(设定)模块中,见图11.3.6。熟悉了图11.3.5中选择方法对图11.3.6对话框不难理解。对于随机效应模型或者变系数模型,用EViews建模46图11.3.6EViews5.1合成数据模型定义对话框图11.3.6EViews5.1合成数据模型定义对话框47
在EstimationMethod(估计方法)选项区内有三个选项框:
(1)Cross.section(横跨个体)中包括None(不选)、Fixed(固定)、Random(随机),分别用来做非个体效应、个体固定效应和个体随机效应的设定(见图11.3.6)。
(2)Period(时点)中也包括None(不选)、Fixed(固定)、Random(随机)三项选择,分别用来进行非时点效应、时点固定效应或时点随机效应设定。
(3)Weight(权数)可以在5种加权方法中做选择。在EstimationSettings(估计方法设定)区包括两种估计方法:一种为LS(最小二乘)方法;一种为TSLS(两阶段最小二乘)方法。
EViews5.1估计结果如表11.3.3所示。表11.3.3各地区自发消费对平均自发消费偏离的估计结果在EstimationMethod(估计方法)选项区内48面板数据模型经典课件49
从表11.3.3可知,515.6133为15个省市的平均自发消费水平,表中的系数0.697561为边际消费倾向,后面第3行至第17行数据为各地区自发消费对平均自发消费的偏离,用来反映省市间的消费结构差异。平均自发消费水平与各地区自发消费对平均自发消费的偏离之和为各地区自发消费。表11.3.3回归结果与表11.3.2回归结果本质上是相同的。
2.非平衡数据的固定影响模型
在所获得的面板数据中,一些个体成员的数据较多而另一些个体成员的数据较少。这种情况下的面板数据被称为非平衡数据。从表11.3.3可知,515.6133为15个省市的50面板数据模型经典课件51
3.固定影响变截距模型的广义最小二乘估计在固定影响变截距模型中,如果随机误差项不满足等方差或相互独立的假设,则需要使用广义最小二乘法(GLS)对模型进行估计。下面只介绍个体成员截面异方差和同期相关协方差两种情形。
(1)个体成员截面异方差情形的GLS估计
个体成员截面异方差是指各个体成员方程的随机误差项之间存在异方差,但个体成员之间和时期之间的协方差为零,对应的假设为:3.固定影响变截距模型的广义最小二乘估计52面板数据模型经典课件53
(2)同期相关协方差情形的SUR估计
同期相关协方差是指不同的个体成员i和j的同时期的随机误差项是相关的,但其在不同时期之间是不相关的,相应的假设为
需要指出的是同期相关协方差是允许同一时期即t不变时,不同个体成员之间存在协方差。如果把假设式(11.3.14)中的第一个表达式写成向量和矩阵的形式:(2)同期相关协方差情形的SUR估计需要指出54
此时这种个体成员之间存在协方差的方差结构有些类似于个体成员方程框架下的近似不相关回归(seeminglyunrelatedregression,SUR),因此将这种结构称为个体成员截面SUR(cross-sectionSUR)。
此时这种个体成员之间存在协方差的方差结构有些类似于个55面板数据模型经典课件564.固定影响变截距模型的二阶段最小二乘估计4.固定影响变截距模型的二阶段最小二乘估计5711.3.2随机影响变截距模型
1.随机影响变截距模型的形式
与固定影响模型不同,随机影响变截距模型把变截距模型中用来反映个体差异的截距项分为常数项和随机变量项两部分,并用其中的随机变量项来表示模型中被忽略的、反映个体差异的变量的影响。模型的基本形式为:11.3.2随机影响变截距模型58为了分析方便,可以将模型(11.3.19)写成如下形式:为了分析方便,可以将模型(11.3.19)写成如下形式:59
可见,随机影响变截距模型的误差项为两种随机误差之和,方差为各随机误差的方差之和。
2.随机影响变截距模型的估计
在式(11.3.21)中可以看出NT个观测值的扰动协方差矩阵为
可见,随机影响变截距模型的误差项为两种随机误差之和,60
在实际分析中,成分方差几乎都是未知的。因此,需要采用可行广义最小二乘估计法(feasiblegeneralizedleastsquared,FGLS)对模型进行估计,即先利用数据求出未知成分方差的无偏估计,然后再进行广义最小二乘估计。在实际分析中,成分方差几乎都是未知的。因此,需要采用可行61
例11.3.2
利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2),试建立随机影响变截距模型,研究这些地区的居民家庭消费行为。模型形式为
EViews估计方法:在EViews的PooledEstimation对话框中Intercept选项中选Randomeffects(随机效应截距项,见图11.3.6),其余选项同上。例11.3.2利用1996-2002年中国东北、62图11.3.6合成数据模型定义对话框
图11.3.6合成数据模型定义对话框63随机影响变截距模型输出结果如表11.3.4。表11.3.4随机影响变截距模型估计结果随机影响变截距模型输出结果如表11.3.4。64面板数据模型经典课件65表11.3.5各地区随机影响的变截距模型估计结果地区随机影响估计值地区随机影响估计值安徽-2.55辽宁112.12北京367.04内蒙古-133.14福建-54.24山东-100.87河北-104.84上海126.18黑龙江-101.77陕西-22.79吉林54.91天津10.09江苏-32.28浙江106.09江西-223.95
表11.3.5各地区随机影响的变截距模型估计结果地区66
从表11.3.5给出的估计结果可以看出,在15个省市中,自发消费最高的为北京,其次为上海,最低的是江西,其次是内蒙古,该结果与例11.3.3中所得到的结果基本一致。
11.3.3随机效应模型的检验
在实际应用中,究竟是采用固定效应模型还是采用随机效应模型,这需要进行模型设定检验。
1.LM检验。Breush和Pagan于1980年提出R检验方法。其检验原假设和备择假设:
如果不否定原假设,就意味着没有随机效应,应当采用固定效应模型。对于原假设,检验的统计量是:从表11.3.5给出的估计结果可以看出,在15个省市672.豪斯曼(Hausman)检验。WilliamH
Greene于1997年提出了一种检验方法,称为豪斯曼(Hausman)检验。检验的统计量是:2.豪斯曼(Hausman)检验。WilliamH68
例11.3.3
利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据(见表11.1和表11.2)。(1)利用豪斯曼检验选择面板模型,研究居民家庭消费行为。(2)面板单位根检验。
(1)利用豪斯曼检验选择面板模型:由个体固定效应回归结果(表11.3.3)式知:例11.3.3利用1996-2002年中国东北、69EViews5.1可以直接进行Hausman检验。在表11.3.4输出结果窗口中点击View键,选Fixed/RandomEffectsTesting/CorrelatedRandomEffect-HausmanTest功能,如图11.3.8,可以直接获得如表11.3.6的Hausman检验结果(主要结果)。EViews5.1可以直接进行Hausman检验。在表1170图11.3.7Hausman检验图11.3.7Hausman检验71表11.3.6Hausman检验结果表11.3.6Hausman检验结果72
表11.3.6中第1部分给出的是Hausman检验结果。Hausman统计量的值是14.7875,相对应的概率是0.0001,说明检验结果拒绝了随机效应模型原假设,应该建立个体固定效应模型。14.79与上面计算的21.22有差别,是由于两种计算的误差不同所致。表中第2部分给出的是Hausman检验中间结果比较。0.697561是个体固定效应模型对参数的估计,0.724569是随机效应模型对参数的估计。0.000049是相应两个参数估计量的分布方差的差(Var(Diff))。综上分析,1996~2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的69.76%。随地区不同,自发消费(截距项)存在显著性差异。表11.3.6中第1部分给出的是Hausma73
(2)面板单位根检验在工作文件窗El中打开CP变量的15个数据组,点击View键,选UnitRootTest功能(如图11.3.8),打开GroupUnitRootTest对话框如图11.3.9,共有6个选项区。图11.3.8
(2)面板单位根检验图11.3.874图11.3.9图11.3.975①Testtype选项区共包括6种检验方法,分别是LLC,Breitung,IPS,FisherADF,FisherPP,Hadri检验。默认的状态是6种检验结果综合(Summary)。检验方法的下拉菜单见图11.3.10。图11.3.10①Testtype选项区共包括6种检验方法76
②Testforunitrootin选项区包括3个选项,可以对水平序列(Level)、一次差分序列(1stdifference)、二次差分序列(2nddifference)进行检验,默认的选择是对水平序列检验单位根。③Includeintestequation选项区有3个选项。检验式中包括截距项、截距项与趋势项,不包括确定性项。④Option(选择)选项区对是否使用平衡面板做出选择。⑤Laglength选项区指单位根检验式中差分项的滞后长度。可以给出6种评价准则。⑥Spectralestimation选项区中核(Kernel)估计给出3种选择。选择默认值,点击图11.3.9窗口中的OK键,得15个地区的CP序列的单位根检验综合结果如表11.3.7。5种检验方法的结论都认为15个CP序列存在单位根。②Testforunitrooti77表11.3.7面板单位根检验结果表11.3.7面板单位根检验结果7811.4变系数模型
变系数模型的基本形式如下:11.4变系数模型79面板数据模型经典课件8011.4.1固定影响变系数模型
1.不同个体之间随机误差项不相关的固定影响变系数模型截面个体的N个单方程,利用各横截面个体的时间序列数据采用经典的单方程模型估计方法分别估计各单方程中的参数。
2.不同个体之间随机误差项相关的固定影响变系数模型11.4.1固定影响变系数模型截面个体的N个单方程,利用81面板数据模型经典课件82
例11.4.1
利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2),试建立固定影响变系数模型,研究这些地区的居民家庭消费行为。模型形式为
其中:ai为15个省市的自发消费倾向,bi为边际消费倾向,两者用来反映省市间的消费结构差异。
EViews估计方法:在PooledEstimation(混合估计)窗口中的DependentVariable(相依变量)选择窗填入CP?;在Commoncoefficients(系数相同)选择窗保持空白;在Crosssectionspecificcoefficients(截面系数不同)选择窗填入IP?;在Intercept(截距项)选择窗中选Fixedeffects(也可以做其他选择);在Weighting(权数)选择窗点击Noweighting。点击PooledEstimation(混合估计)窗口中的OK键。固定影响变系数模型输出结果如表11.4.1。例11.4.1利用1996-2002年中国东北、83表11.4.1固定影响变系数模型估计结果
表11.4.1固定影响变系数模型估计结果84面板数据模型经典课件85
表11.4.1中给出了变系数模型估计结果,表11.4.1上部第2列是各地区的边际消费倾向估计值,后面3列是估计标准误、检验统计量值和相伴概率。表11.4.1中部是各地区截距估计值。表11.4.1下部是整个回归方程的拟合优度、F统计量、DW统计量等指标。输出结果的方程形式是安
徽:CP_AH=161.6170366+0.7600529617*IP_AH北
京:CP_BJ=36.21736713+0.8065556921*IP_BJ福
建:CP_FJ=1274.326672+0.5830460912*IP_FJ河
北:CP_HB=319.354881+0.705311265*IP_HB黑龙江:CP_HLJ=595.8939202+0.6444699411*IP_HLJ吉
林:CP_JL=117.7833817+0.7875706843*IP_JL江
苏:CP_JS=708.9157069+0.6623656882*IP_JS表11.4.1中给出了变系数模型估计结果,表11.486江
西:CP_JX=652.3219323+0.6019851277*IP_JX辽
宁:CP_LN=195.599025+0.7812790991*IP_LN内蒙古:CP_NMG=-106.6406618+0.7858190681*IP_NMG山
东:CP_SD=502.169392+0.677398964*IP_SD上
海:CP_SH=1051.031432+0.6717297747*IP_SH陕
西:CP_SX=568.1459927+0.669777312*IP_SX天
津:CP_TJ=197.1228368+0.7457127261*IP_TJ浙
江:CP_ZJ=1328.261149+0.6276611695*IP_ZJ江西:CP_JX=652.3219323+0.687
在计算变系数模型中的个体影响时,不同的软件给出的个体影响形式不同。Eviews5.0软件,给出的个体影响反映的是各个体成员对总体平均状态的偏离。
EViews5.0估计结果如表11.4.2所示。表11.4.2各地区自发消费对平均自发消费偏离的固定影响变系数模型估计结果
从表11.4.1结果表明,回归系数显著不为0,F统计量较大(p值显著),调整后的样本决定系数达0.99,说明模型的拟合优度较高。从估计结果可以看出,15个省级地区的居民家庭消费需求结构具有明显的差异。在15个省市中,边际消费倾向最高是北京,其次是吉林、内蒙古两省区,而边际消费倾向较低的是江西,最低的是福建。在计算变系数模型中的个体影响时,不同的软件给出的个88面板数据模型经典课件89面板数据模型经典课件90
从表11.4.2可知,回归系数与表11.4.1中相同。表11.4.2上半部第1行中的常数项506.808为15个省市的平均自发消费水平,表11.4.2下半部数据为各地区自发消费对平均自发消费的偏离,用来反映省市间的消费结构差异。平均自发消费水平与各地区自发消费对平均自发消费的偏离之和为各地区自发消费。表11.4.2回归结果与表11.4.1回归结果本质上是相同的。
2.不同个体之间随机误差项相关的固定影响变系数模型从表11.4.2可知,回归系数与表11.4.1中相91面板数据模型经典课件92面板数据模型经典课件93
相对于混合估计模型来说,是否有必要建立变截距、变系数模型,可以通过F检验来完成。即检验样本数据究竟属于哪一种面板数据模型形式。主要检验如下两个假设:相对于混合估计模型来说,是否有必要建立变截距、变系数94面板数据模型经典课件95面板数据模型经典课件963.含有AR(p)项的固定影响变系数模型对于含有AR(p)项的固定影响变系数模型,经过适当的变换,可以将其转换成基本的固定影响变系数模型进行估计。例如,含有AR(1)项的固定影响变系数模型的基本形式如下:3.含有AR(p)项的固定影响变系数模型97
利用前面所介绍的固定影响变系数模型的估计方法,能够实现对于变形后的模型(11.4.8)的估计。类似,对于含有AR(p)项的固定影响变截距模型,也可以经适当变换转变为基本的固定影响变截距模型进行估计。
11.4.2随机影响变系数模型
1.随机影响模型的形式考虑如下形式的变系数模型:利用前面所介绍的固定影响变系数模型的估计方法,能够实现对于98面板数据模型经典课件99面板数据模型经典课件100
2.随机影响模型的估计
在实际分析中,这两项方差几乎都是未知的,因此需要采用可行广义最小二乘估计法(FGLS)对模型进行估计,即先利用数据求出未知方差的无偏估计,然后再进行广义最小二乘估计。2.随机影响模型的估计在实际分析中,这两项方差10111.5案例分析
根据凯恩斯的绝对收入假说,利用我国29个省市(不包括重庆和西藏)的城镇居民可支配收入、消费数据(见表11.5.1、表11.5.2)建立城镇居民消费函数,对各省市的居民消费结构进行对比分析。模型中的被解释变量CS为城镇居民人均全年消费支出,解释变量YD为城镇居民人均全年可支配收入(单位:元/人),变量均为年度数据,样本区间为1991-2004年。
表11.5.129个省市地区的城镇居民家庭平均消费支出数据(单位:元/人)11.5案例分析102面板数据模型经典课件103面板数据模型经典课件104面板数据模型经典课件105面板数据模型经典课件106面板数据模型经典课件107面板数据模型经典课件108面板数据模型经典课件109面板数据模型经典课件110
利用1991~2004年29个省级地区城镇居民家庭年人均消费性支出和年人均可支配收入数据,用EViews建立面板数据估计模型步骤如下。
11.5.1建立合成数据库(Pool)对象
首先建立工作文件。在打开工作文件窗口的基础上,点击EViews主功能菜单上的Objects键,选NewObject功能,从而打开NewObject(新对象)选择窗。在TypeofObject选择区选择Pool(合并数据库),并在NameofObject选择区为混合数据库起名CS(初始显示为Untitled)。如图11.5.1,点击OK键,从而打开混合数据库(Pool)窗口。在窗口中输入29个地区的标识AH(安徽)、BJ(北京)、…、ZJ(浙江),如图11.5.2。利用1991~2004年29个省级地区城镇居111图11.5.1Pool对象定义对话框
图11.5.1Pool对象定义对话框112图11.5.2Pool对象说明窗口
图11.5.2Pool对象说明窗口11311.5.2定义序列名并输入数据
在新建的混合数据库(Pool)窗口的工具栏中点击Sheet键(第2种路径是,点击View键,选Spreadsheet(stackeddata)功能),从而打开SeriesList(列出序列名)窗口,定义时间序列变量CS?和YD?(?符号表示与CS和YD相连的29个地区标识名)如图11.5.3。点击OK键,从而打开混合数据库(Pool)窗口,(点击Edit+-键,使EViews处于可编辑状态)输入数据。输入完成后的情形见图11.5.4。图11.5.4所示为以截面为序的阵列式排列(stackeddata)。点击Order+-键,还可以变换为以时间为序的阵列式排列。11.5.2定义序列名并输入数据114图11.5.3序列列表对话框
图11.5.3序列列表对话框115图11.5.4序列的堆栈形式数据表
图11.5.4序列的堆栈形式数据表11611.5.3估计模型
点击Estimation键,随后弹出PooledEstimation(混合估计)对话窗(见图11.5.5)。图11.5.5合成数据模型定义对话框
11.5.3估计模型图11.5.5合成117
先对PooledEstimation(混合估计)对话窗中各选项功能给以解释。
DependentVariable(被解释变量)选择窗:用于填写被解释变量。
Sample(样本范围)选择窗:用于填写样本区间。
BalancedSample(平衡样本)选择块:点击打勾后表示用平衡数据估计。
Commoncoefficients(系数相同)选择窗:用于填写对于不同横截面斜率相同的解释变量和虚拟变量。
Crosssectionspecificcoefficients(截面系数不同)选择窗:用于填写对于不同横截面斜率不同的解释变量。先对PooledEstimation(混合估计)对118
Intercept(截距项)选择窗:从中可以选None(无截距项)、Common(个体相同截距项)、Fixedeffects(固定效应个体不同截距项)、Randomeffects(随机效应截距项)。
Weighting(权数)选择窗:从中可以选Noweighting(等权估计)、Crosssectionweights(按截面取权数)、SUR(似不相关回归)、iteratetoconvergence(迭代至收敛)。“等权估计”的方法是所有的观测值都给以相等的权数;“按截面取权数”的方法是以横截面模型残差的方差为权数,属于广义最小二乘法估计。“似不相关回归”的方法是利用横截面模型残差的协方差进行广义最小二乘法估计,该法将自动修正横截面中出现的异方差和短期自相关;“迭代至收敛”方法当选择广义最小二乘法估计时,点击此键将保证参数估计一直到收敛为止。Intercept(截距项)选择窗:从中可以选Non119
用EViews可以估计固定效应模型、随机效应模型、带有AR(1)参数的模型、截距不同回归系数也不同的面板数据模型。用EViews可以选择普通最小二乘法、加权最小二乘法(以截面模型的方差为权)、似不相关回归法估计模型参数。可以在Commoncoefficients选择窗和Crosssectionspecificcoefficients选择窗中填入AR(1)项。估计过程中的缺省方法是等权(Noweighting)估计。还可以选择Crosssectionweights(按截面取权数)和SUR(似不相关回归)。用EViews可以估计固定效应模型、随机效应模120
下面分别建立无个体影响的不变系数模型、变截距模型和变系数模型等,然后从中选择一个比较理想的模型作为我国的城镇居民消费函数,并对各省市的居民消费结构进行对比分析。
1.无个体影响的不变系数模型
模型形式为
其中:a为29个省市的平均自发消费倾向,b为边际消费倾向。
EViews估计方法:在图11.5.5合成数据模型定义对话框左上部的DependentVariable选择窗填入被解释变量CS?,在中部的Commoncoefficients(系数相同)选择窗填入解释变量YD?,Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;Intercept选项选择窗点击Common,对话框Weighting(权数)选项点击Noweighting。完成合成数据模型定义对话框后,点击OK键,得输出结果如表11.5.3。下面分别建立无个体影响的不变系数模型、变截距模型121表11.5.3无个体影响的不变系数模型估计结果表11.5.3无个体影响的不变系数模型估计结果122
从表11.5.3结果看,回归系数显著不为0,调整后的样本决定系数达0.99,说明模型的拟合优度较高。从结果看,平均消费倾向为0.76。
2.固定效应变截距模型模型形式为
其中:ai为29个省市的自发消费倾向,用来反映省市间的消费结构差异,b为边际消费倾向。
EViews估计方法:在EViews的PooledEstimation对话框中Intercept选项中选Fixedeffects。其余选项同上。得输出结果如表11.5.4。表11.5.4固定效应变截距模型估计结果从表11.5.3结果看,回归系数显著不为0,调整后的123面板数据模型经典课件124
表11.5.4中给出了变截距模型估计结果,表中的系数0.741232为边际消费倾向,后面三项是估计标准误、检验统计量值和相伴概率。表中下半部是各地区截距估计值。输出结果的方程形式见表11.5.5。表11.5.5我国城镇居民消费函数(固定效应变截距模型)表11.5.4中给出了变截距模型估计结果,表中的系数0.125面板数据模型经典课件126地区代号居民消费函数内蒙古NMGCSNMG=162.82+0.74*YDNMG宁夏NXCSNX=372.01+0.74*YDNX青海QHCSQH=353.89+0.74*YDQH四川SCCSSC=440.09+0.741*YDSC山东SDCSSD=68.52+0.74*YDSD上海SHCSSH=317.66+0.74*YDSH陕西SHXCSSHX=423.57+0.74*YDSHX山西SXCSSX=149.89+0.74*YDSX天津TJCSTJ=262.11+0.74*YDTJ新疆XJCSXJ=168.08+0.74*YDXJ云南YNCSYN=335.55+0.74*YDYN浙江ZJCSZJ=267.56+0.74*YDZJ地区代号居民消费函数内蒙古NMGCSNMG=162.127
表11.5.5结果表明,回归系数显著不为0,调整后的样本决定系数达0.99,说明模型的拟合优度较高。从估计结果可以看出,对于本例中的29个省市来说,虽然它们的居民消费倾向相同,但是其居民的自发消费存在显著的差异,其中北京、广东是居民自发消费最高的2个地区,而居民自发消费最低的是江西。
3.随机效应变截距模型模型形式为
其中:a为29个省市的平均自发消费倾向,b为边际消费倾向,vi为随机变量,代表i地区的随机影响,用来反映省市间的消费结构差异。
EViews估计方法:在EViews的PooledEstimation对话框中Intercept选项中选Randomeffects(随机效应截距项),其余选项同上。随机影响变截距模型输出结果如表11.5.6。表11.5.5结果表明,回归系数显著不为0,调128表11.5.6随机影响变截距模型估计结果
表11.5.6随机影响变截距模型估计结果129面板数据模型经典课件130回归结果如下:回归结果如下:131表11.5.7各地区随机影响的变截距模型估计结果地区随机影响估计值地区随机影响估计值安徽-37.56江西-223.49北京241.54辽宁116.04福建-80.39内蒙古-95.39广东229.89宁夏88.53甘肃44.55青海72.49广西40.14四川147.56贵州-22.82山东-179.78河北-122.46上海34.14河南-126.33陕西133.76黑龙江-100.94山西-106.75海南-93.33天津-11.20湖北120.50新疆-91.55湖南77.67云南55.03吉林1.80浙江-8.11江苏-103.53
表11.5.7各地区随机影响的变截距模型估计结果地区132
从表11.5.7给出的估计结果可以看出,在29个省市中,自发消费最高的为北京,其次为广东,最低的是江西,该结果与表11.5.5中所得到的结果基本相一致。
4.Hausman检验与面板数据单位根检验在表11.5.6输出结果窗口中点击View键,选Fixed/RandomEffectsTesting/CorrelatedRandomEffect-HausmanTest功能,可以直接获得如表11.5.8的Hausman检验结果(主要结果)。从表11.5.7给出的估计结果可以看出,在29个省133表11.5.8Hausman检验结果表11.5.8Hausman检验结果134
表11.5.8中第1部分给出的是Hausman检验结果。Hausman统计量的值是4.264457,相对应的概率是0.0389,说明检验结果拒绝了随机效应模型原假设,应该建立个体固定效应模型。图中第2部分给出的是Hausman检验中间结果比较。0.741232是个体固定效应模型对参数的估计,0.742728是随机效应模型对参数的估计。0.000001是相应两个参数估计量的分布方差的差(Var(Diff))。综上分析,1991~2004年中国29个省级地区城镇居民人均消费和人均可支配收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的74.12%。随地区不同,自发消费(截距项)存在显著性差异。表11.5.8中第1部分给出的是Hausman检验结135
面板数据是单位根检验:以变量CP为例。在工作文件窗口中打开CP变量的29个数据组,点击View键,选UnitRootTest功能,打开面板数据单位根检验(GroupUnitRootTest)对话框如图11.5.6,共有6个选项区。面板数据是单位根检验:以变量CP为例。136图11.5.6单位根检验定义对话框图11.5.6单位根检验定义对话框137选择默认值,点击图11.5.6窗口中的OK键,得29个地区的CP序列的单位根检验综合结果如表11.5.9。5种检验方法的结论都认为29个CP序列存在单位根。选择默认值,点击图11.5.6窗口中的OK键138表11.5.9面板单位根检验结果表11.5.9面板单位根检验结果1395.固定效应变系数模型(OLS法)
模型形式为
其中:ai为29个省市的自发消费倾向,bi为边际消费倾向,两者用来反映省市间的消费结构差异。
EViews估计方法:在Commoncoefficients(系数相同)选择窗保持空白;在Crosssectionspecificcoefficients(截面系数不同)选择窗填入YD?;在Intercept(截距项)选择窗中选Fixedeffects;其余选项同上。固定影响变系数模型输出结果如表11.5.10。表11.5.10固定影响变系数模型估计结果5.固定效应变系数模型(OLS法)其中:ai为140面板数据模型经典课件141面板数据模型经典课件142
表11.5.10中给出了变系数模型估计结果,表11.5.10上部第2列是各地区的边际消费倾向估计值,后面3列是估计标准误、检验统计量值和相伴概率。表11.5.8中部是各地区截距估计值。表11.5.8下部是整个回归方程的拟合优度、F统计量、DW统计量等指标。输出结果的方程形式见表11.5.11。表11.5.11我国城镇居民消费函数(固定影响变系数模型)地区代号居民消费函数安徽AHCSAH=264.33+0.73*YDAH北京BJCSBJ=212.92+0.78*YDBJ福建FJCSFJ=518.84+0.69*YDFJ广东GDCSGD=301.393+0.77*YDGD甘肃GSCSGS=117.55+0.79*YDGS广西GXCSGX=521.11+0.70*YDGX贵州GZCSGZ=252.64+0.74*YDGZ河北HBCSHB=279.95+0.71*YDHB河南HENCSHEN=460.74+0.66*YDHEN黑龙江HLJCSHLJ=304.10+0.71*YDHLJ海南HNCSHN=176.86+0.74*YDHN表11.5.10中给出了变系数模型估计结果,表11.143地区代号居民消费函数湖北HUBCSHUB=132.79+0.80*YDHUB湖南HUNCSHUN=14.37+0.81*YDHUN吉林JLCSJL=152.90+0.77*YDJL江苏JSCSJS=531.35+0.68*YDJS江西JXCSJX=333.51+0.67*YDJX辽宁LNCSLN=142.64+0.80*YDLN内蒙古NMGCSNMG=170.70+0.74*YDNMG宁夏NXCSNX=101.30+0.81*YDNX青海QHCSQH=256.56+0.76*YDQH四川SCCSSC=126.18+0.81*YDSC山东SDCSSD=297.96+0.70*YDSD上海SHCSSH=471.56+0.72*YDSH陕西SHXCSSHX=13.06+0.84*YDSHX山西SXCSSX=297.07+0.71*YDSX天津TJCSTJ=280.54+0.74*YDTJ新疆XJCSXJ=-31.84+0.78*YDXJ云南YNCSYN=192.84+0.77*YDYN浙江ZJCSZJ=522.97+0.71*YDZJ地区代号居民消费函数湖北HUBCSHUB=132144
表11.5.10结果表明,回归系数显著不为0,F统计量较大(p值显著),调整后的样本决定系数达0.996,说明模型的拟合优度较高。从估计结果可以看出,29个省级地区的居民家庭消费需求结构具有明显的差异。在29个省市中,边际消费倾向最高是陕西,其次是四川、宁夏、湖南,而边际消费倾向较低的是江西,最低的是河南。以上建立了无个体影响的不变系数模型、变截距模型和变系数模型,样本数据究竟属于哪一种面板数据模型形式,需要通过F检验来完成。表11.5.10结果表明,回归系数显著不为0,F统计145面板数据模型经典课件146型拟合样本。6.固定影响变系数模型(GLS法)
以上建立的消费函数模型使用的是普通最小二乘法,由于各省市的城镇居民消费结构存在一定程度上的差异,所以可以使用广义最小二乘法GLS(Crosssectionweights),即以横截面模型残差的方差为权数对模型进行估计。
EViews估计方法:在Crosssectionspecificcoefficients(截面系数不同)选择窗填入YD?,在Intercept(截距项)选择窗中选Fixedeffects,在Weighting(权数)选择窗选择Crosssectionweights(按截面取权数),其余选项同上。固定影响变系数模型(GLS法)输出结果如表11.5.12所示。表11.5.12我国城镇居民消费函数估计结果(固定影响变系数模型GLS法)型拟合样本。147面板数据模型经典课件148
输出结果的方程形式见表11.5.13。表11.5.13我国城镇居民消费函数(固定影响变系数模型GLS法)地区代号居民消费函数安徽AHCSAH=264.33+0.73*YDAH北京BJCSBJ=212.92+0.78*YDBJ福建FJCSFJ=518.84+0.69*YDFJ广东GDCSGD=301.33+0.77*YDGD甘肃GSCSGS=117.55+0.79*YDGS广西GXCSGX=521.11+0.70*YDGX贵州GZCSGZ=252.64+0.74*YDGZ输出结果的方程形式见表11.5.13。地区代号居民消费149地区代号居民消费函数河北HBCSHB=279.95+0.71*YDHB河南HENCSHEN=460.74+0.66*YDHEN黑龙江HLJCSHLJ=304.10+0.71*YDHLJ海南HNCSHN=176.86+0.74*YDHN湖北HUBCSHUB=132.79+0.80*YDHUB湖南HUNCSHUN=14.373+0.81*YDHUN吉林JLCSJL=152.90+0.77*YDJL江苏JSCSJS=531.35+0.68*YDJS江西JXCSJX=333.51+0.67*YDJX辽宁LNCSLN=142.64+0.80*YDLN内蒙古NMGCSNMG=170.70+0.74*YDNMG宁夏NXCSNX=101.30+0.81*YDNX青海QHCSQH=256.56+0.766*YDQH四川SCCSSC=126.18+0.81*YDSC山东SDCSSD=297.96+0.70*YDSD上海SHCSSH=471.56+0.72*YDSH陕西SHXCSSHX=13.06+0.84*YDSHX山西SXCSSX=297.07+0.71*YDSX天津TJCSTJ=280.54+0.74*YDTJ新疆XJCSXJ=-31.84+0.781*YDXJ云南YNCSYN=192.84+0.77*YDYN浙江ZJCSZJ=522.97+0.71*YDZJ地区代号居民消费函数河北HBCSHB=279.9150
在输出结果的下方给出了评价总体估计效果的统计量,由于估计方法选择的是Crosssectionweights的GLS估计,所以结果中给出了加权和未加权两种情况下的评价统计量。从这部分结果可以看出,与OLS法相比,利用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年芳纶纤维合作协议书
- 2024年路机车项目合作计划书
- 小学一年级描写季节的作文10篇
- 小学一年级关于秋天的手抄报文字内容
- 小学二年级语文作文(十篇)
- T145-生命科学试剂-MCE
- Sulfamonomethoxine-Standard-生命科学试剂-MCE
- 高中英语走遍美国第五课中英文对照素材
- 2025届高考数学统考一轮复习课后限时集训71算法与程序框图理含解析新人教版
- RS485水表使用说明书范本
- 高考倒计时 二百天大有可为-高三冲刺班会
- 第3讲 决策课件
- 吉林师范大学《复变函数与积分变换》2021-2022学年第一学期期末试卷
- 传染病实验室检查的质量控制
- 广东开放大学2024年秋《国家安全概论(S)(本专)》形成性考核作业参考答案
- 2024级高一上期期中测试数学试题含答案
- 期中测试卷(1~3单元)(试题)2024-2025学年五年级上册数学人教版
- 四川省成都市2024年七年级上学期期中数学试卷【附答案】
- 期中易错密押卷(第1-5单元)(试题)-2024-2025学年五年级上册数学人教版
- 六年级上册《如何写好作文开头和结尾》省公开课获奖课件说课比赛一等奖课件
- 咸宁房地产市场月报2024年08月
评论
0/150
提交评论