




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数理统计大作业数理统计大作业数理统计大作业数理统计大作业编制仅供参考审核批准生效日期地址:电话:传真:邮编:应用数理统计(论文)国家财政收入的逐步回归分析指导教师院系名称学号学生姓名2012年11月18日摘要财政收入是国民经济基础,是实现国家职能的财力保证。本文采用SPSS统计软件中的逐步回归分析方法,得出影响我国财政收入的显著性变量,建立国家财政收入回归模型,并将所得的模型给予合理的经济解释。关键字:国家财政收入,逐步回归,SPSS1引言财政收入是指国家财政参与社会产品分配所取得到的收入,是实现国家职能的财力保证。影响财政收入的因素有很多,包括工业总产值、农业总产值、建筑业总产值、社会商品零售总额、人口数、受灾面积等等。在经济模型的建立中,其中有些自变量对问题的研究可能并不重要,有些自变量数据的质量可能很差,有些变量可能和其它变量有很大程度的重叠。如果用回归模型把这些变量都包含进来不但会使模型计算复杂,而且往往会扩大估计方差,降低模型精度,直接影响到回归方程的应用。另外,选进太多的自变量又会造成共线性的存在。因此,本文采用线性回归中的逐步回归方法,利用SPSS多元统计软件得出影响我国财政收入的显著性变量,剔除了不显著的变量,并且克服了变量间的多重共线性,得出了一个较合理的财政回归模型。2初始模型的建立及数据分析自变量与因变量的提出本模型是研究1997年至2011年国家财政收入与主要影响因素之间的定量关系。本文选取财政收入Y(亿元)为因变量,自变量选取如下:第一产业国内生产总值X1(亿元),第二产业国内生产总值X2(亿元,第三产业国内生产总值X3(亿元),社会消费品零售总额X4(亿元),人口数X5(万人),受灾面积X6(万公顷)。根据《中国统计年鉴》获取1997-2011年共十五年的统计数据,见表1。表11997-2011年财政收入与部分项目的统计数据年份YX1X2X3X4X5X6财政收入(亿元)第一产业国内生产总值(亿元)第二产业国内生产总值(亿元)第三产业国内生产总值(亿元)社会商品零售总额(亿元)人口总数(万人)受灾面积(万公顷)199719981999200020012002200320042005200620072008200920102011做散点图,设定理论模型作数据散点图,并进行线性拟合,观察因变量与自变量之间关系是否有线性特点。散点图和线性拟合结果如图1所示。图1因变量与各自变量的散点图从散点图1中可以初步看出,国家财政收入与第一、二、三产业国内生产总值、人口数、消费品零售总额这些因素都有较好的线性关系。而财政收入与受灾面积之间没有线性关系,可在逐步回归之前将其去除。建立线性回归分析模型如下:Y=a+b1X1+b2X2+b3X3+b4X4+b5X5;其中a为常数项,b1、b2、…、b5为偏回归系数。3逐步回归分析概述回归分析回归分析是一种非常实用的统计方法,研究变量与变量之间定量的相关关系,寻找变量之间的数学表达式,并且利用概率统计的知识,对此关系进行分析,来判别所建立关系表达式的有效性。回归分析应用很广,可利用建立的经验公式进行预测或控制等等。线性回归分析线性回归分析是描述一个因变量与一个或多个自变量之间的线性依存关系。多元回归分析方法比较与选择应用多元线性回归方法对社会经济现象的数据进行统计分析或者预测具有实际的研究价值。但是由于各个变量之间关系的复杂性,如何在为数众多的许多个影响因素中选择对所关心的因素具有显著影响的各个因素,并且不包含对因变量的影响不显著的因素是一个很有实际意义的问题。具有这种优点的回归方程,被称为“最优”回归方程。选择“最优”回归方程的方法有多种多样,具体包括:(1)全部比较法:从所有可能的因子组合的回归方程中选择最优方程。这种方法固然可以找到一个最优者,然而当因子众多时,不仅计算繁冗,而且费用也大,在实际中是不宜采用的。(2)向后剔除变量法(BackwardElimination):从包含全部因子的回归方程中,逐次剔除不显著因子,也称为“只出不进法”。这种方法在因子不多而且不显著因子也不多的情况下可以采用,但是因子众多时,特别是当不显著因子比较多时,其计算量也很大。(3)向前挑选变量法(ForwardSelection):从一个因子开始,逐个引入回归方程,因子在引入后概不剔除,也称为“只进不出法”。这种方法对已经引进的因子在建立过程中变得不很重要的情况没有反映。(4)逐步回归法(StepwiseRegression):又称为“有进有出法”。这种方法在逐个将因子选入回归方程的过程中,如果发现先前被引入的因子在其后由于某些因子的引入而失去其重要性时,可以从回归方程中随时予以剔除,直到最后被选入的因子对因变量都有显著影响为止。逐步回归分析法先对全部自变量按其对Y影响程度的大小排队,从大到小逐个依次引入回归方程,并随时检验,及时将由于引入新自变量而变得作用不显著者剔除,剔除后再引入新变量,再检验,再剔除直至最后。4线性回归的结果及分析以国家财政收入为因变量,以第一、二、三产业国内生产总值、人口数、消费品零售总额为自变量,运用SPSS软件进行逐步回归法(stepwise)线性回归分析。将数据导入SPSS软件的DataEditor表中,选择分析选项中的回归-线性命令,将国民总收入设置为因变量(Dependent),其余各影响因素设置为自变量(Independent(s)),选择统计方法(Method)为逐步回归法(Stepwise)。自变量的输入与移除自变量的输入与移除的标准为:F值小于等于进入模型,大于等于移出模型。从表2中可以看出第三产业国内生产总值(亿元),人口数(万人),这两个自变量经过逐步回归过程被选择进入了回归方程。选择的过程是:最先引入了变量X3,建立了模型1;接着引入变量X5,没有变量被剔除,建立了模型2(含有X3,X5);没有新变量被引入,故最终的模型中含有变量X3,X5。表2输入/移去的变量a模型输入的变量移去的变量方法1第三产业国内生产总值(亿元).步进(准则:F-to-enter的概率<=.050,F-to-remove的概率>=.100)。2人口总数(万人).步进(准则:F-to-enter的概率<=.050,F-to-remove的概率>=.100)。a.因变量:财政收入(亿元)模型概要表3模型汇总c模型RR方调整R方标准估计的误差更改统计量R方更改F更改df1df2Sig.F更改1..998.998.998113.0002.999.999.001112.008a.预测变量:(常量),第三产业国内生产总值(亿元)。b.预测变量:(常量),第三产业国内生产总值(亿元),人口总数(万人)。c.因变量:财政收入(亿元)表3给出了各模型的拟合情况。其中,复相关系数(R)代表自变量或自变量的线性组合能多大程度上解释因变量,复相关系数平方值(R方)说明回归模型自变量的变异在因变量中所占比率,接近1最好。修正的复相关系数平方值(调整R方),是为了消除变量数量的影响,给出修正的复相关系数平方值。从表中看出两种模型的拟合度都很好,而模型2的复相关系数R=,复相关系数平方值R2=,调整R方为,标准估计的误差为。可见模型2的拟合度较高,变量X3,X5的作用显著。回归方程的显著性检验表4Anovac模型平方和df均方FSig.1回归1.000残差.80613总计142回归2.000b残差.45512总计14a.预测变量:(常量),第三产业国内生产总值(亿元)。b.预测变量:(常量),第三产业国内生产总值(亿元),人口总数(万人)。c.因变量:财政收入(亿元)表4显示两种模型的方差分析结果。方差分析结果表明,当回归方程为模型1、2时,其显著性概率值均小于,即拒绝总体回归系数均为0的原假设。因此,最终的回归方程应当包含X3、X5这2个自变量,且方程拟和效果很好。表5已排除的变量c模型BetaIntSig.偏相关共线性统计量容差VIF最小容差1第一产业国内生产总值(亿元).281.055.523.006.006第二产业国内生产总值(亿元).083.348.734.100.003.003社会商品零售总额(亿元).178.257.325.006.006人口总数(万人).008.154.1542第一产业国内生产总值(亿元).128b.955.360.277.005.004第二产业国内生产总值(亿元).105b.577.576.171.003.003社会商品零售总额(亿元).529.004.003a.模型中的预测变量:(常量),第三产业国内生产总值(亿元)。b.模型中的预测变量:(常量),第三产业国内生产总值(亿元),人口总数(万人)。c.因变量:财政收入(亿元)表5显示方程外各模型变量的有关统计量,即标准化偏回归系数Beta、回归系数显著性检验的t值、P(Sig)值、偏相关系数PartialCorrelation、共线性统计的容差ColinearitystatisticTolerance。可见,模型2方程外的各变量偏回归系数经检验,P值均大于,故不能引入方程。回归系数的确定表6系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准误差试用版零阶偏部分容差VIF1(常量).000第三产业国内生产总值(亿元).525.006.999.000.999.999.9992(常量).014第三产业国内生产总值(亿元).560.012.000.999.997.418.154人口总数(万人).196.008.908.154a.因变量:财政收入(亿元)表6显示各模型的偏回归系数B、标准差Std.、常数Constant、标准化偏回归系数Beta、回归系数显著性检验的t值和P(Sig)值。按照线性回归模型建立的方程为:Y=+方程中的常数项a=,偏回归系数b3=、b5=,经t检验a、b3、b5的P值分别为、、,按α=水平,均有显著性意义。回归模型的残差分析对回归模型的残差进行分析,残差的积累概率图(P-P图)(图2)基本围绕在假设直线(正态分布)周围,说明残差分布基本符合正态分布,说明财政收入这个因变量基本上可以用线性回归方法建立模型。且回归标准化残差的柱状图(图3)中,标准化残差基本都分布在(-3,3)之间,没有超过默认值3,说明模型对数据的拟合效果较好。图2回归标准化残差的标准P-P图图3回归标准化残差柱状图5讨论模型检验按照线性回归模型建立的方程为:Y=+利用此最优回归方程对2010年国民总收入进行预测并和实际值做比较。表72010年财政收入预测年份X3第三产业国内生产总值(亿元)X5人口总数(万人)Y财政收入实际值(亿元)Y'财政收入预测值(亿元)偏差2010%表7给出了运用已经建立的逐步回归模型对2010年财政收入的预测结果以及实际财政收入值。通过对比我们可以发现,预测的结果与实际情况比较接近,但还是存在一定的偏差,这可能是我们对财政收入的影响因素考虑过少造成的,因此,这是我们以后对模型改进时所要考虑的方面。模型解释从回归模型中看出,第三产业对财政收入的影响较为显著。这正与国家积极调整产业结构,倡导服务业全面发展的经济政策相符合。第三产业发展迅速,增加了国家收入弹性,特别是金融、期货交易、房地产业、仓储物流业、软件等现代服务业和高薪产业的发展及近年来奥运会、亚运会、世博会对旅游业的带动,极大提高了服务业对财政收入的贡献。而人口数对财政收入的贡献为负线性关系。这与近年来我国人口老龄化趋势,人口基数仍在上涨及社会福利提高有关。众所周知,人口基数不变或稍微增大时,人口老龄化,必然导致就业人口相对比例减少,再加上近年来医保、社保等社会保障及福利支出的相对提高,使国家政府给予大量财政补贴,因而人口数对财政收入的贡献为负相关。而第一产业和第二产业均被剔除回归模型,这可能与近几年我国的惠农政策及经济转型政策有关。在第一产业(农业)方面,近几年为了实现小康型社会主义和建设社会主义新农村,国家政府坚持把支持“三农”作为预算安排和财政工作的重点,巩固、完善和强化了各项强农惠农财税政策,突出加强农业基础,促进农业发展和农民增收,扎实推进社会主义新农村建设。实现传统农业的全面升级,从而保证了农业经济的持续稳定发展。这样作为曾经的农业大国,惠农政策的财政补贴与其产业带来的财政贡献抵消,因而第一产业总产值X对财政收入y的影响不显著。再看第二产业(工业和建筑业),对财政收入也不显著。近几年奥运会、亚运会、世博会使国家投入不少成本,加上钢铁等传统行业的产能过剩使国家补贴外销,以及建设高新技术产业,投入大量研发生产成本而至今仍未盈利或盈利较少等等原因均使原本作为财政收入支撑的第二产业对财政收入的贡献很不显著。总之,我们应该看到我国产业结构的不合理及发展方向:第二产业的支撑地位不够,第三产业发展仍有余地
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专升本自我鉴定500字(9篇)
- 中学学生会主席的年度竞选演讲稿范文(16篇)
- 实习个人总结(17篇)
- 大学军训600字感想(16篇)
- 豆浆机买卖合同(4篇)
- 物业经理的工作计划(5篇)
- 绩效提升合同范本
- 产品分期买卖协议(14篇)
- 商品房过户合同协议
- 商场商铺出租合同协议
- 医院培训课件:《产前准备-为顺产做准备》
- 《管理学原理》(课件)
- 长城汽车2025人才测评答案
- 幼儿园法制教育讲座
- 河道的管理和防护课件
- 绿化作业安全教育培训
- 《中华人民共和国产品质量法》知识培训
- 技能人才评价命题技术规程
- 中职不等式的试题及答案
- 深信服aES产品技术白皮书-V1.5
- 浙江省金华义乌市稠州中学2024-2025学年九年级下学期3月独立作业英语试卷(原卷版+解析版)
评论
0/150
提交评论