中关村科技园区海淀园税收收入影响因素实证分析_第1页
中关村科技园区海淀园税收收入影响因素实证分析_第2页
中关村科技园区海淀园税收收入影响因素实证分析_第3页
中关村科技园区海淀园税收收入影响因素实证分析_第4页
中关村科技园区海淀园税收收入影响因素实证分析_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中关村科技园区海淀园税收收入影响因素与预测实证分析北京科技大学经济管理学院 陈金保 刘明珠 张芬芳北京市海淀区地方税务局 孙琼 摘要:本文采用常用的多元线性回归,主成分分析等方法对中关村科技园区海淀园税收收入影响因素和税收预测做了实证分析。分析表明,由于高科技园区的特殊性,gdp对园区税收总额不具有足够的解释力,影响税收收入的最重要的因素是园区入驻企业数。因此,加大招商引资力度、营造园区良好的经营环境,以吸引更多企业入园就显得尤为重要。另外,本文也提出:在影响因素分析中,尤其是存在严重多重共线性的情况下,主成分分析方法是一种比较可行的简单、实用的方法。一、引言中关村科技园区海淀园作为中国第一个

2、国家级高新技术产业开发区,短短二十年的时间,迅速发展成为全市,乃至全国的高新技术核心区,也是海淀区税收收入的重要来源。因此,对中关村科技园区的税收收入影响因素进行分析,并对税收收入进行预测,对政府制定财政政策和产业扶持政策、培养园区税源、促进园区的持续发展具有十分重要的意义。目前,我国对于税收收入影响因素的研究绝大多数是分析宏观税收和宏观经济指标之间的关系。现有文献研究主要集中在以下几个方面:一是分析税收与宏观经济指标之间的关系。巩晖(2006)以gdp为经济变量建立回归模型描述了河南省的税收弹性,分析了gdp与税收增长的相关关系;张伦俊(2000)建立了第一、第二产业增长率和第三产业增长额对

3、税收收入增量之间的线性回归模型;王乃静,李国锋(2002)用山东省数据对税收收入对数与gdp对数之间的协整关系进行了研究,研究结果表明,税收收入对数与gdp对数之间存在着长期稳定的协整关系。董承章(1998)建立系统的税收影响因素分析模型,用于研究和确定影响税收的主要因素及影响程度,得出影响税收总额的主要因素依次为:社会消费品零售总额、滞后2年的固定资产投资额、国民生产总值、滞后1年的固定资产投资、当年的固定资产投资、当年的货币投放量、和国内生产总值的结论。二是对税收收入建立预测模型。漆莉莉(2005)应用逐步回归法建立税收收入预测模型,得到我国税收收入主要取决于gdp,储蓄余额,财政支出,并

4、用19812001年的数据进行了实证检验。王伟(2002)应用回归分析和时间序列分析对我国十五期间的税收收入做出定量预测,包括二次指数模型,指数增长模型和逻辑增长模型,还采用马尔可夫预测技术对税收收入进行结构分析和预测。张伦俊运用组合模型(先以gdp为自变量回归,然后考虑税收收入自身的自回归),对我国的税收收入进行预测。从现有文献来看,大多数研究都是对整个国家或某个省市的总体税收进行定性或定量的研究,分析税收和宏观经济之间的关系,对科技园区的税收收入影响因素的分析和税收预测,目前在国内还存在空白。由于高科技企业的特殊性和高新技术产业区的产业聚集特性,以上研究的结论不一定适用于科技园区的税收分析

5、。因此,从实证角度出发,运用数理统计分析方法,研究高科技园区税收收入影响因素,并为税收预测工作提供模型和方法具有现实的意义。本文将采用常用的多元线性回归,主成分分析等方法对中关村科技园区海淀园税收收入影响因素和预测方面做出探索性分析。数据选取2002年1月2007年12的月度税收收入数据(国税和地税税收总计)和各经济指标数据,运用spss统计软件和decisiontime时间序列软件,分析科技园区税收与常规经济指标、科技园区特有因素指标之间的关系。然后在实证分析的基础上,建立税收收入预测模型。并用2008年1-4月的月度税收数据对预测模型进行验证和比较。二、税收收入影响因素分析1、税收收入与g

6、dp关系分析巩晖(2006)和张伦俊(2003)的研究都表明,全国或特定省份的税收收入与gdp之间存在长期的紧密的相关关系。曾志慧、唐军等人(2007)的研究更是发现全国的税收总额和gdp之间相关系数大于0.98,而且gdp对税收的解释度大于99%。因此,我们有必要首先分析中关村科技园区海淀园的税收总额与gdp之间的关系。选取2002年1月到2007年12月的季度数据,运用spss计算得到税收收入与gdp之间的相关系数为0.822,p值为0,相关性显著。以gdp为自变量建立一元线性回归方程: (2-1) (0.017) (6.782)r square 0 .67642standard erro

7、r 41974.13501f= 45.98983 signif f = .0000以gdp为自变量建立对数回归方程: (2-2) (-0.026) (5.804)r square 0.605standard error 0.27855f=33.689 signif f = .0000虽然园区税收与gdp相关系数为0.822,相关关系显著,线性回归的r2 也可以达到0.67。然而,从已有文献发现,无论是研究整个国家的税收和gdp的关系,还是对省市地方的税收与gdp进行的拟合,其r2均达到0.9以上,估计标准误差不超过四位整数,相关系数更是接近于1。张伦俊(2005)在建立gdp与税收收入的简单相

8、关模型中,r2=0.941;程毛林(1998)利用tsp软件建立gdp与税收收入之间的回归模型中r2值达到了0.995,两者对数模型的r2值也达到了0.9784,误差也很小。另外,在回归方程(2-1)和(2-2)中,所建立的方程的参数t检验都不能全部通过,可见,拿园区gdp去预测科技园区的税收收入是不可行的。以上分析表明,园区的税收与gdp之间的关系远不如全国或特定省份二者之间的关系紧密,园区gdp对园区税收总额不具有足够的解释力。2、税收收入影响因素定量分析(1)因变量的选取。税收收入主要受宏观经济、企业经营发展状况、税收政策、征管措施等因素的影响,结合科技园区的特点,并考虑数据的可获取性,

9、初步选定以下指标(表1)。表1 科技园区税收收入影响因素指标初步选取指标分类具体指标名称宏观经济指标gdp、全区工业总产值、城市居民人均可支配收入、城市居民人均消费性支出、全社会固定资产投资额、社会消费品零售总额、企业出口总额、财政支出、实际利用外资额、出口创汇总额、科技园区工业总产值企业经营状况指标利润总额、企业总收入政府扶持政策指标科技活动经费支出、园区企业入驻总户数注:园区企业入驻总户数既反映了园区的产业聚集效应,也反映了政府营造良好税收环境和招商引资的力度。科技活动经费支出既包括政府投入科研经费,也包括企业自筹科研经费,反映了园区企业的创新能力。将以上选取的指标与园区税收收入进行相关性

10、分析,发现只有gdp、全区工业总产值、城市居民人均可支配收入、全社会固定资产投资额、社会消费品零售总额、财政支出、企业总收入、科技活动经费支出、园区企业入驻总户数等9项指标与税收收入相关性显著。另外,考虑gdp=投资+消费+净出口+政府支出,也就是说gdp本身已经包含了全区工业总产值、全社会固定资产投资额、社会消费品零售总额和财政支出几个经济指标的经济含义,而且gdp只有季度数据,没有月度数据。因此,本文选取全社会固定资产投资额(x1)、社会消费品零售总额(x2)、财政支出(x3)、企业总收入(x4)、科技活动经费支出(x5)、园区企业入驻总户数(x6)这六个重要税收收入影响指标。(2)滞后期

11、的选择通过相关性分析,各指标滞后期选取如表2表2 各指标滞后期指标名称滞后期全社会固定资产投资额(x1)1社会消费品零售总额(x2)1财政支出(x3)1企业总收入(x4)1科技活动经费支出(x5)1企业总户数(x6)0(3)多元线性回归模型运用spss软件,以以上选取的6个指标为自变量,以园区税收收入为因变量,建立多元线性回归方程: (2-3) (-0.307) (0.867) (0.509) (2.542) (0.957) (4.415) (0.338), , , , 该回归方程拟合优度为0.815,整个方程回归性显著。可是除了科技活动经费支出和财政支出的系数能通过t检验之外,其余因变量的系

12、数都无法t通过。另外,方差膨胀因子2.452vif9.915,说明方程中的因变量存在严重的多重共线问题,这也是因变量的系数无法全部通过t检验的原因所在。通过相关性分析,也发现社会消费品零售总额、企业总户数与科技活动经费支出这三个变量强相关,而全社会固定资产投资、企业总收入与财政支出也具有显著的相关性。因此,上面得到的回归方程可以用于做预测分析,但不能用来做经济现象的解释。(4)主成分分析模型为解决因变量存在严重的多重共线性问题,下面利用主成分分析法来建立新的模型。从表3看出,可以提取2个主成分,即m=2,两个因子的总贡献率为88.985%(超过85%)。因子f1的特征根为4.245,贡献率为7

13、0.743%,因子f2的特征根为1.094,贡献率为18.241%。 因此,选取两个因子包含了各变量的大部分信息,信息丢失的程度很小。从表4(旋转后的因子载荷矩阵)可知社会消费品零售总额、科技活动经费支出、企业总户数在第一主成分上有较高载荷;全社会固定资产投资、财政支出、企业总收入在第二主成分有比较高的载荷。表3 方差分解主成分提取分析表component initial eigenvaluesextraction sums of squared loadingsrotation sums of squared loadingstotal% of variancecumulative %tot

14、al% of variancecumulative %total% of variancecumulative %14.24570.74370.7434.24570.74370.7432.85147.51747.51721.09418.24188.9851.09418.24188.9852.48841.46888.9853.3545.89394.877 4.1672.77697.654 5.0861.42999.083 6.055.917100.000 表4 旋转后的因子载荷矩阵 component12滞1固定投资.227.936滞1消费总额.948.227滞1财政支出.483.700滞1企业

15、收入.250.931滞1科技经费.864.346企业总户数.926.288表5 因子得分系数矩阵 component12滞1固定投资-.194.498滞1消费总额.431-.180滞1财政支出.023.267滞1企业收入-.180.487滞1科技经费.346-.079企业总户数.399-.135根据表5(因子得分系数矩阵)可以写出因子表达式:f1=-0.194zx11-1+0.431zx2t-1+0.023zx3t-1-0.180zx4t-1+0.346zx5t-1+0.399zx6t(2-4)f2=0.498zx1t-1-0.180zx2t-1+0.267zx3t-1+0.487zx4t-1

16、-0.079zx5t-1-0.135zx6t (2-5)spss自动生成并保存各观测量的因子得分,因此,我们将这两列因子得分(f1、f2)与总税收(tax)进行回归,得到如下回归方程: (2-6) (34.989) (13.298) (10.818), , , , 可见,方程拟合优度达到了0.807,且f检验与t检验均通过了,而且非常显著,dw接近2,没有自相关作用,该主成分分析拟合效果是非常好。为了得到各自变量对因变量的具体贡献大小,需要进一步得到tax关于各因变量xi的回归方程,具体步骤如下:将方程(2-4)、(2-5)代入(2-6)中,得到tax关于zxi的方程(2-7)因为,(i=1,

17、2,3,4,5,6) (2-8)运用spss的descriptives过程求出各因变量的均值和标准差,代入(2-8)中,再将(2-8)代入方程(2-7),即可得到tax关于xi的方程,结果如下: (2-9)方程(2-6)显示,因子f1对税收收入的影响作用大于因子f2对税收的影响。即社会消费品零售总额、科技活动经费支出、企业总户数这三个指标对税收收入影响大于全社会固定资产投资、财政支出、企业总收入这三个指标对税收收入的影响。方程(2-19)反映了税收收入与各因变量之间的数量关系,可以发现各自变量前的系数均为正,说明模型中的各经济指标对税收都是有促进作用,也完全符合经济学解释。通过主成分分析,我们

18、可以得出社会消费品零售总额、科技活动经费支出、企业总户数这三个指标对税收收入影响作用很大的结论,这与实际经验结果一致。其中,科研经费投入每增加1%,园区的税收收入将会增加0.05932%;而增加1%的企业总户数,园区当年的税收收入将增加2.87824%。尤其我们要注意到的是,园区企业入驻数对税收的影响,比其他所有因素的影响系数加总还大。因此,加大招商引资力度、营造园区良好的经营环境、或提升园区的核心竞争力以增强产业聚集效应,都对税收的发展具有十分重要的意义。从实际情况看,科技活动经费支出是政府财政支出的一部分,政府为了实现宏观经济目标,通过减免税政策,政府补贴,政府资助等方式以支持、鼓励某些行

19、业、产品的发展,吸引更多的企业入驻园区,虽然在短期内会减缓税收收入的增长,但壮大了潜在税源,促进了经济的发展。三、税收收入预测及模型比较(1) 时间序列预测观察历年来科技园区税收收入的变化情况,发现税收增长变化不仅与“时间”关系密切,而且依赖于自身特点变化比较明显,具有明显的时间序列特性,这于长期以来我国采用“基数法”制定税收计划有很大关系。为此,下面采用时间序列分析软件decision time建立时间序列模型。decision time 的优点在于自动选择并生成最优时间序列模型,直接输出模型结果,给出拟合曲线和模型参数,并可以直接得到预测值。由程序运行结果可知,模型arima(0,0,0)

20、(0,1,1)具有最佳拟合效果。各参数均通过t检验,其,拟合效果也非常好,其拟合曲线如图1。图1 arima模型预测结果与实际值拟合曲线(2)模型比较为了检验三个模型的有效性和实用性,分析三个模型的预测精度。本文运用三个模型分别对2008年1-3月份税收收入(样本期间外数据)进行预测,然后与实际税收数据进行比较,得出各自的预测误差和相对误差率(表5),并计算三个模型2002年1月至2007年12月预测值(样本期间内数据)的平均相对误差(表6)。表5 三个模型对税收收入的预测误差比较年月线性回归模型主成分分析模型时间序列模型误差(万元)误差率误差(万元)误差率误差(万元)误差率200801608

21、80.3727.6%75843.3834.3%27740.212.6% 2008024269.7064.6%5593.0686.0%-465.9-0.5% 200803-6745.75-8.6%-985.534-1.2%-1447.5-1.8% 表6 三个模型的参数比较r20.8150.8070.9113误差标准差.21841.22036200712预测值的平均误差率-.3.48%-.2.69%-.2.60%由上表可见,三个模型中,线性模型的平均预测误差率为-3.48%,主成分分析模型的平均预测误差率为-2.69%,时间序列模型的平均误差率为-2.60%,三个模型的预

22、测误差都控制在5%以内,其中时间序列模型的平均预测误差率最小,更接近实际值。三个模型的r2分别为0.815,0.807,0.911,以时间序列模型的拟合度最高。用没有参加模型拟合过程的08年1-3月份的各经济指标进行预测,发现三个模型2008年1月份的误差都较大,这可能与奥运经济带来的巨大影响有关,但也反映了时间序列模型准确度比其他两种方法高。因此,由于税收收入的时间序列特性,做园区的税收预测时还是用arima模型更合适。三、结论及讨论1、拿海淀gdp去预测科技园区的税收收入是不可行的。以上分析表明,园区的税收与gdp之间的关系远不如全国或特定省份二者之间的关系紧密,海淀gdp对园区税收总额不具有足够的解释力。2、影响园区税收收入的重要因素有园区入驻企业总户数、财政支出和科技活动经费支出,尤其是园区入驻企业总户数这一指标影响系数很大。因此,加大招商引资力度、营造园区良好的经营环境,以吸引更多企业入园就显得尤为重要。3、在影响因素分析中,尤其是存在严重多重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论