如何分析变量之间的相关关系计量经济学界... - 浙江_第1页
如何分析变量之间的相关关系计量经济学界... - 浙江_第2页
如何分析变量之间的相关关系计量经济学界... - 浙江_第3页
如何分析变量之间的相关关系计量经济学界... - 浙江_第4页
如何分析变量之间的相关关系计量经济学界... - 浙江_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、城市化水平对流通业发展影响的Panel Data证据* 本文获国家社科基金项目(编号06BTJ008)、浙江工商大学现代商贸研究中心项目(编号0502)、浙江省高校重点人文社科研究基地(统计学)、浙江省重点学科(浙江工商大学统计学)资助。朱发仓 苏为华内容摘要:本文从模型建立的背景出发,并从理论上论证了1960-2003年间城市化和流通业的关系已经发生了结构变化,并用Granger检验进行因果分析。最后用1980-2004年的面板数据研究了城市化与流通业水平的关系,研究表明我国城市化水平每增长1个百分点会使流通业增长1.1936个百分点;而且中部的城市化水平对流通业的弹性最高为1.8827,东

2、部次之为1.0952,西部最小为0.9274。关键词:城市化 流通业 模型结构 Panel Data作者简介:朱发仓,浙江工商大学 博士 310012 苏为华,浙江工商大学统计与数学学院院长 教授 博导 310012引言晏维龙教授在财贸经济杂志2006年第3期发表了中国城市化对流通业发展影响的实证研究一文,该文从城市的经济职能角度研究城市化与流通业发展的关系,以协整理论为工具,利用1960-2003年中国城市化率和流通业发展的年度数据,通过自回归分布滞后模型建立误差修正模型,并以此作为定量分析城市化对流通业发展影响的基础,得出城市化每增长1个百分点会促使流通业增长2.436个百分点。文章着眼于

3、长期、整体关系,研究1960-2003年之间城市化与流通业的数量关系,是一个非常好的思路。我们认为,该文甚称是至今为止国内定量研究城市化和流通业发展相互关系的经典之作,颇具借鉴意义,阅后深受启发。我们由此而想到,40多年来我国经历了巨大的社会变革,变量之间的函数关系强度与形式一般会发生程度不等的变化,如果能够分时段来研究也不失为一种有益的思路;另外,由于我国幅员辽阔,城镇化水平和流通发展水平因地区而异,仅用时间序列数据来分析有可能会忽略不同截面个体的影响,进而导致模型估计方面的系统性偏误,若改用Panel Data建立统计模型则可以避免这一点。正是基于以上两点的思考,本文将用Panel Dat

4、a模型分阶段分析我国城市化水平对流通业发展的影响。一、分阶段研究城市化水平与流通业发展的必要性利用比较长的时间序列数据建立误差修正模型,这样可以增加样本容量,减少由于样本太少产生的参数估计误差,降低共线性。但是当经历了巨大的社会变革时,变量之间的关系往往会发生变化,这时序列跨度太大反而对模型的解释力不利。而1960-2003我国的社会、经济、政治等大环境发生了天翻地覆的变化,这种变化对于模型的影响是不可不考虑的。1.模型赖以生存的背景发生了变化第一,流通业在改革开放前后“判若两人”。首先是商业运行的环境、运行机制发生了变革。重生产、轻流通和“重农轻商”的思想在我国有很深的基础,建国后直到198

5、0年,受限于计划经济的模式,商品和流通不但没有得到重视,反而受到压制和批判,流通被看成“末端”产业,处于完全从属于生产的依附地位。相应的我国经济属于短缺经济时代,生活资料和生产资料完全按计划供应,是典型的 “粮票时代”;改革开放以后,随着市场经济的发展,流通业逐步由“末端”产业转变为“先导”产业,对生产的“依附”关系转变为“决定”关系。目前,流通领域是市场化程度最高的领域, 96%的消费品、95%的农副产品和88%的生产资料已经放开价格由市场的供求关系来决定,流通对生产的主导作用正在日益增强。在不同的政治背景、宏观经济背景下、不同体制背景下商业的运行机制和规律肯定不同,因此在整个时期建立回归方

6、程是不恰当的。第二,1980年后商业主体改变了“国有”一统天下的局面,商业业态“琳琅满目”;商业客体即商品更加丰富,流通渠道的重要性日益突出 祝合良 现代商业经济学 北京 首都经济贸易大学出版社(第二版)209,商品的流通特点及规律也发生了变化。这也说明分阶段研究的必要性。第三,我国的城市化历程发生了变化。在经济学中,城市化的含义是由于工业化引起的劳动力由农业向非农产业转移、并伴随人口由农村向城市集中的过程。建国后我国开始了大规模工业化建设,城市化进程明显加快。但是由于国家在各个时期的指导方针不同,城市化走的是一条曲折的道路。城市化历程大体可分为四个基本阶段:正常推进阶段(1949-1956年

7、);剧烈波动阶段(1957-1965年);徘徊停滞阶段(1966-1978年);加速阶段(1979年至今) 李珍刚 建国后我国城市化进程的回顾与前瞻 广西民族学院学报(哲学社会科学版)1998.10。在不同的阶段,城市与交易效率的关系以及城市的经济功能肯定是不同的。也就是说模型的结构是不同的,那么在整个时期内建立模型的做法就是不恰当的,得到的结论也就会与现实相差较大。为了从数量上判定两个时期内城市化与流通业发展的关系是否变化,下面用CHOW检验来说明这个问题。2. 城市化与流通业关系变化的实证检验:CHOW检验 Damodar N, Gujarati 著 张涛译 经济计量学精要 机械工业出版社

8、 2000当变量涉及到时间序列时,自变量和因变量之间的关系有可能发生结构性的变化,结构性变化可能是由于内部因素引起,也可能是外部因素引起, CHOW检验是邹至庄教授提出的,用于判断模型的结构是否在预先给定的时点发生了变化的一种方法。这种方法是把时间序列数据分为两部分,其分界点就是检验模型是否发生结构变化的临界点。根据数据散点图的拐点以及社会背景,笔者选取1980年作为分界点,分析1980年前后城镇化水平和流通业发展的关系是否发生了变化。运用CHOW检验时要估计三个方程:时期1:1960-2004年, (1)时期2:1960-1980年, (2)时期3:1980-2004年, (3)首先估计方程

9、(1)、(2)和(3),分别求出残差平方和、和。检验统计量,其中为估计参数的个数。检验的原假设是方程(2)和(3)的结构统计相同(即模型参数对应相等)。在原假设成立下,上述统计量服从自由度为的分布。如果计算的统计量大于临界值,就否定原假设,即认为模型结构发生了变化。笔者选取城镇人口占总人口的比重来衡量我国的城市化水平 殷存毅在外来投资与城市化发展中谈到城市化率较为通用的定义及测度方法有3种,目的是通过某一具有本质意义的、最具有象征性的便于统计分析的指标来反映和描述城市化水平。人口和非农经济在空间上的聚集是城市的重要特征,因此人口、劳动力、土地成了测度城市化水平的关键指标。(一)城市人口占总人口

10、的比重,该指标为世界公认,但是部分学者认为我国的户籍制度对城市人口的统计不科学,不能真正反映城市化水平。(二)城市建成区用地占城市总面积的比重。(三)非农业人口占总人口的比重。,用批发、零售及餐饮业的GDP来衡量流通业发展水平,并用批发、零售及餐饮业的生产总值指数统一折算成1952年的不变价,为剔除异方差影响,对实际数据取对数,分别记为和。数据来源于新中国55年统计资料汇编(国家统计局综合司编,中国统计出版社2005)。经过分析计算我们得到,相伴概率,在显著性水平0.01下,临界值,因此否定原假设,认为参数不相等,模型的结构发生了变化。所以笔者有足够的理由认为1980年前后两个时期我国城市化与

11、流通业发展的关系发生了巨大的变化。那么分段建立模型进行分析就显得十分必要,鉴于数据的可得性以及对目前的实际借鉴意义,本文后面将用1980-2004年的各省份的面板数据进行分析。二、城市化和流通业发展的Granger因果检验对事物进行定量分析之前首先要定性分析,回归分析讲究因果关系。所以笔者认为有必要对城市化和流通业发展进行因果检验。如何分析变量之间的相关关系,计量经济学界尚有争议。Granger提出的Granger因果检验是判断一个变量的变化是否是另一个变量变化的原因的一种方法。它的实质是检验一个变量的滞后变量是否可以引入到其他变量方程中,检验时要估计以下的回归: 和 (4)他们的原假设分别为

12、:,第一个回归方程的检验统计量为,它服从分布,其中是方程不含的滞后变量的残差平方和,是回归方程的残差平方和。第二个回归方程的检验统计量类似。如果计算的统计量值大于理论临界值,则拒绝原假设,即能Granger引起;否则接受原假设。需要注意的是“能Granger引起”这种表达方式并不意味是的效果或者结果。Granger因果检验度量对进行预测时,的前期信息对预测的均方误差MSE的减少是否有贡献,并以此作为因果关系判断的基准,用和不用的前期信息相比,MSE无变化,称在Granger意义下对无因果关系,反之,当的前期信息对MSE的减少有贡献时,称在Granger意义下对有因果关系 高铁梅 计量经济分析方

13、法与建模 北京 清华大学出版社260-261。而估计后的模型一般用于预测或则政策评价,因此笔者认为首先对城市化和流通业发展进行Granger因果检验是必要的和必需的,检验结果见表1。从表1 的Granger因果检验结果可以看出,我们可以在5.04%的显著性水平下认为城市化Granger引起流通业的发展,但是流通业的发展不是城市化的Granger原因(判断相伴概率P值在三个滞后期下最高为0.3221)。进行Granger因果检验分析能让我们看清两者之间的关系,为实证部分分析提供经验基础。表1. 城市化和流通业发展的Granger因果检验原假设滞后期滞后期滞后期结论234F统计量P值F统计量P值F

14、统计量P值LNUL不能Granger引起LNCGDP3.26310.04922.86740.05042.83330.0406拒绝原假设LNCGDP不能Granger引起LNUL1.69750.19671.76170.17251.21910.3221接受原假设注:数据来源:新中国55年统计资料汇编,国家统计局综合司编 中国统计出版社2005三、基于Panel Data模型的实证分析利用时间序列建立模型进行分析会漏掉不同截面之间的联系,也会忽落不同个体之间的差异。我国东、中和西部区域经济水平相差巨大,生产力分布不均衡性造成城市分布、城市化水平的不均衡性。在东部科学技术、经济发达的东部地区大城市多,

15、城市化水平较高。同样流通业的发展水平也高,中西部在这两方面较低。所以,仅用时间序列分析城市化与流通业之间的关系会产生系统误差,这种系统误差使得估计的参数有偏,同时使预测的精度大打折扣,为了减少这方面的影响,下面使用Panel Data来分析城市化与流通业之间的关系。1.Panel Data计量模型Panel Data 就是将时间序列数据和截面数据结合起来分析问题的一种方法,国内有人译成面板数据、平行数据、综列数据、混合数据。它指的是在不同时期、不断反复观测横截面个体得到的数据集。它能够提供更多的信息、更多的变化、更少共线性、更多的自由度和更高的估计效率,能够估计比较复杂的模型来模拟经济行为。单

16、项Panel Data计量模型的基本形式如下: (5)式中为因变量,为自变量,为参数向量, ,分别表示时间变量和截面个体变量,k为自变量个数。依据截距向量和系数向量的不同限制要求,可以分为三类 高铁梅 计量经济分析方法与建模 北京 清华大学出版社 304:一类是联合回归模型(Pooled regression model),假定模型中在个体成员上既无个体影响又无结构变化,即对于各个体成员方程,截距和斜率向量均相同,这时相当于将各个体成员的时间序列数据堆积在一起作为样本数据,用OLS可以估计出参数的一致且有效估计;另一类是变截距模型。模型的形式为: ,模型假定在个体成员上存在个体影响但没有结构变

17、化,并且个体影响可以用截距的差别来说明,也就是说,该模型的截距项不同但是斜率项相同,故称为变截距模型;第三类是变系数模型。模型的形式为: ,模型假定即存在个体影响,又存在结构变化,即在允许个体影响由变化的截距项来说明的同时还允许斜率向量依据个体成员的不同而变化,用以说明个体成员之间的结构变化。不同形式的模型的估计方法是不同的,下面依据应用最为广泛的变截距模型为例来说明。变截距模型依据个体效应的不同处理形式分为固定效应模型和随机效应模型。如果将模型中的看成固定常数,则为固定效应模型,形式为: (6)其中,常用的参数估计量有:最小二乘虚拟变量估计量(LSDV)、内部估计量和协方差估计量等。使用时首

18、先要检验是否存在固定个体效应,即检验个描述个体效应的虚拟变量的参数是否显著为0,原假设是:,检验统计量为,其中和分别是最小二乘虚拟变量法和联合回归模型的判定系数,它在原假设成立时服从自由度为的分布。如果将看成随机的变量则为随机效应模型,形式为: (7)其中,当扰动项的方差结构已知时用广义最小二乘法(GLS)估计,未知时用可行的广义最小二乘法(FGLS)估计。同样使用前也要检验是否存在随机个体效应,即检验截面方差是否为0,原假设是,Breusch和Pagan于1980年给出了LM检验,其中是联合回归的残差平方和。一般来讲,估计随机效应模型的难度要比估计固定效应模型大得多。此外还要判断使用上述两类

19、模型中的那一个,一般来讲,判断固定效应还是随机效应关键在于面板数据的数据内容,数据收集的方式,数据来源的背景。如果研究对象涉及成百上千个样本,这些个体可以看成从一个大总体中随机抽样的样本,那么随机效应比较合适;如果研究对象仅涉及少数样本,研究的兴趣也集中在这些个体身上,那么固定效应比较合适。可以说固定效应模型是依赖于样本效应进行推断的模型,随机效应模型是考虑总体效应进行推断的模型 Cheng Hsiao 2003, Analysis of panel data .M Second edition Cambridge University Press。需要注意的是当比较大时,将看成固定效应还是随

20、机效应差别不大 这种情况下后者得到的斜率估计量在时收敛于前者得到的估计量,然而,当有限比较大时,对模型不同的设定会产生参数估计值的巨大差别。基于两者的差别是否统计显著,Hausman在1978年给出了判定固定效应还是随机效应的Hausman 检验 本质上,Hausman检验是检验个体效应与自变量是否相关,当与效应相关时,模型称为固定效应模型,当与效应不相关时,称为随机效应模型,只不过检验是通过比较参数估计量的差来实现的,详见Cheng Hsiao 2003, Analysis of panel data .MSecond edition Cambridge University Press,检

21、验统计量为:,其中是两种模型下得到参数估计量的差。检验的原假设为参数之间的差别不是系统引起的。当原假设被拒绝时,随机效应模型产生有偏估计量,违背了高斯-马尔科夫假设,因此使用固定效应模型。2.实证分析笔者用城镇人口占总人口的比重度量城市化水平,用批发零售餐饮业的GDP作为流通业发展水平的度量,并用批发零售餐饮增加值的定基指数(1952=100)折算成不变价产值,并且取对数消除异方差,记为和。数据来源于新中国55年统计资料汇编(国家统计局综合司编,中国统计出版社2005)。鉴于对目前经济的现实意义,笔者选用1980-2004年我国各个省份的城市化与流通业发展的面板数据 由于数据的可得性,我们剔除

22、了吉林和陕西,河北、浙江的城镇人口数据分别从省年鉴获得。,本文所有分析采用STATA7.0软件。固定个体效应模型回归结果: (8)(28.64) (17.3),括号中为统计量值,检验个体效应的统计量为,相伴概率为0.0000。所以存在个体效应,即不同省份之间的差异对于我们建立的模型是有影响的,使用固定个体效应模型是正确的。并且参数通过t检验。由于描述各个省份特征的虚拟变量太多(28个),这里没有给出它们的参数估计值。同样随机个体效应模型的回归结果是: (9)(17.12) (9.73),检验个体效应的统计量为,相伴概率为0.0000,因此我们认为存在个体效应,使用随机效应模型是正确的。为了在方

23、程(9)和(10)之间选择,我们进行了Hausman 检验,检验结果,相伴概率为0.0119,而5%显著性水平下的临界值是5.99,所以我们最终的分析以固定个体效应模型为准。双对数模型的参数含义就是弹性,因此我们认为就全国的情况来看,城市化水平每增长一个百分点能带来批发零售餐饮业的GDP增长1.1936个百分点。和晏维龙教授的结果(2.436)相比,显然差别很大,我们认为可能是以下几方面的原因造成的。首先,一般而言城市化对城市流通业带动作用相对较大,对农村流通业的作用相对较小。近几年我国城市化进程较快,城市流通业发展也较快,但是农村流通发展相对缓慢,此处我们考虑城市化对流通业的整体影响,所以,

24、整体带动作用并不大。其次,就改革前后两个时期来讲,前期在计划经济体制下,流通业发展还是比较快的,但是经济发展依靠资本密集型重工业,重工业对农业人口的非农化拉动小,城市化发展慢。那么从相对数(弹性)的角度就表现为单位城市化水平变动拉动单位流通业变动高,但是绝对影响低;改革以后,城市化和流通业经过快速发展以后日益达到“平稳期”,这是相对带动作用(弹性)虽然不大,绝对拉动作用仍然大于改革之前的时期。再者,除了城市化外,影响流通业发展的因素还很多,比如商业政策等,城市化也不仅仅影响流通业的发展,这也是城市化对流通带动作用小的原因。 城市的经济职能在于其作为集中的交换场所促进了交易频率的提高、交易费用降

25、低,从而使流通业不断发展,经而带动经济的发展。那么西部的经济发展中,城市化对流通业作用和其他地区相比有何不同呢?为了具体揭示城市化与流通业发展关系的区域差异性,我们按照地理区域将全国分成东部、中部和西部,分别考察。回归的结果见表2。表2 东部、中部和西部的面板数据回归结果 相关的估计结果很多,本表仅给出由F统计量和Husman统计量判断且整理后的固定个体效应模型结果,同时因为个体效应虚拟变量太多,我们这里主要关注斜率项,所以没有给出它们的估计量,如果读者需要,我们可以提供东部中部西部参数/统计量值t统计量参数/统计量值t统计量参数/统计量值t统计量LNCGDP1.09526.991.88771

26、8.90.92749.35常数项2.611518.83.935628.191.0147.69F统计量43.86-219.84-111.69-相伴概率0.0000-0.0000-0.0000-Hausman统计量6.12-5.01-9.6-相伴概率0.0134-0.025-0.0019-注:F统计量是指检验固定个体效应模型的检验统计量,相伴概率是指该统计量的相伴概率。从表2中的Hausman检验统计量值以及相伴概率可知应该选择固定效应模型,从F统计量的值和相伴概率可以判断个体效应显著,应该使用变截距模型(正是因为这两点原因,为节省篇幅此处笔者仅给出最后的判断结果);并且模型参数通过t检验。比较方

27、程(8)和表2中参数的差异性,可以发现城市化水平对流通业发展影响最大的是中部地区,城市化每增长一个百分点会使批发零售餐饮GDP增长1.8877个百分点。这仿佛与东部经济最发达,流通业最先进的实际相矛盾。其实不然,我们的模型参数的含义是弹性,只是说明东部城市化水平带动流通业的相对能力比中部弱,这是由于东部地区的经济发展虽然已经进入现代经济增长的轨迹,但是受土地、空间、资源、能源、环境等方面的约束,发展的潜力、对流通业发展的相对带动能力低于中部,其绝对水平还是处于第一位的。西部地区的弹性处于全国最低水平,中部地区对于西部地区经济发展的示范作用是很明显的,那就是推行城市化战略,以城市化促进流通业的发

28、展,从而带动地区经济大发展。四、结论本文论证了1960-2003年之间城市化与流通业水平之间的关系已经发生了结构性的变化,并用Granger因果检验对城市化与流通业水平进行因果分析。最后文章使用1980-2004年之间的面板数据就全国以及分地区探讨了城市化与流通业水平的关系,发现固定个体效应模型能很好拟合城市化与流通业水平的关系,实证结果表明我国城市化水平每增长1个百分点会带动流通业增长1.1936个百分点;分地区的回归结果表明中部地区城市化对流通业的带动能力最强为1.8827,东部次之为1.0952,西部最小为0.9274。这对于西部发展的示范性在于:大力促进城市化进程,发挥城市的聚集效应和拉动作用,以城市化带动流通业乃至经济的发展。当然,本文也有不足的地方,譬

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论