数理统计spss线性回归分析_第1页
数理统计spss线性回归分析_第2页
数理统计spss线性回归分析_第3页
数理统计spss线性回归分析_第4页
数理统计spss线性回归分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北京航空航天大学研究生课程论文逐步回归法建立国家财政收入回归模型sy1107405 秦金涛摘要:论文建立含有总人口x1(万人)、农林牧渔业总产值x2(亿元)、国内工业生产总值x3(亿元)、国内建筑生产总值x4(亿元)、社会商品零售总额x5(亿元)、就业人员x6(万人),受灾面积x7(万公顷)、能源生产总量x8(万吨标准煤)、共8个因素的国家财政收入回归模型,应用逐步回归法,通过统计软件spss13.0的计算,分析各个因素对国家财政收入的影响程度。关键词:国家财政收入、回归模型、逐步回归法、spss软件摘要:论文建立含有总人口x1(万人)、农林牧渔业总产值x2(亿元)、国内工业生产总值x3(亿元

2、)、国内建筑生产总值x4(亿元)、社会商品零售总额x5(亿元)、就业人员x6(万人),受灾面积x7(万公顷)、能源生产总量x8(万吨标准煤)、共8个因素的国家财政收入回归模型,应用逐步回归法,通过统计软件spss13.0的计算,分析各个因素对国家财政收入的影响程度。关键词:国家财政收入、回归模型、逐步回归法、spss软件。引言国家财政收入的影响因素有很多,例如:工农业产值、总人口、受灾面积等等。有些因素对国家财政收入的影响大,而有些影响却很小;有些与国家财政收入呈线性关系,有些则呈其他复杂的曲线关系。本论文仅仅讨论各个因素与财政收入的直线关系,使用逐步回归法建立模型。通过spss12.0的计算

3、分析,达到深入学习多元线性回归模型和初步应用数理统计软件的学习目的。逐步回归分析和模型的建立逐步回归分析的主要计算步骤(1) 确定检验值在进行逐步回归计算前要确定检验每个变量是否显著的检验水平, 以作为引人或剔除变量的标准。(2) 逐步计算计算全部候选变量中最大f值的p值引入最小值, 检验是否剔出,再次计算p值,满足条件再次引入,直至没有变量可以引入。逐步计算的每一步总是先考虑剔除变量, 仅当无剔除时才考虑引入变量。本例中建立含有总人口x1(万人)、农林牧渔业总产值x2(亿元)、国内工业生产总值x3(亿元)、国内建筑生产总值x4(亿元)、社会商品零售总额x5(亿元)、就业人员x6(万人),受灾

4、面积x7(万公顷)、能源生产总量x8(万吨标准煤)、共8个因素的国家财政收入回归模型如下:其中b0、b1、b2、b3、b4、b5、b6、b7、b8均是未知参数,是不可观测的随机误差。 应用spss17.0计算分析1.原始数据输入年份财政收入y(亿元)总人口x1(万人)农林牧渔业总产值x2(亿元)国内工业生产总值x3(亿元)国内建筑生产总值x4(亿元)社会商品零售总额x5(亿元)就业人员x6(万人)受灾面积x7(万公顷)能源生产总量x8(万吨标准煤)19956242.212112120340.924950.65793.7523613.8680654582412903419967408122389

5、22353.729447.68282.2528360.2689504699113303219978651.112362623788.432921.49126.4831252.969820534271334601998987612476124541.934018.410061.9933378.17063750145129834199911444.112578624519.135861.511152.8635647.97139449980131935200013395.212674324915.840033.612497.639105.7720855468813504820011638612762

6、726179.643580.615361.5643055.47302552215143875200218903.612845327390.847431.318527.1848135.97374047119150656200321715.312922729691.854945.523083.8752516.37443254506171906200426396.5129988362396521029021.45595017520037106196648200531649.2913075639450.976912.934552.167176.67582538818216219200638760.21

7、3144840810.891310.941557.16764107640041091232167200751321.7813212948893110534.951043.71892107699048992247279200861330.3513280258002.2130260.262036.81108487.77748039990260552200968518.313347460361135239.976807.74132678.47799547214274618表 1中国统计年鉴20102.计算结果及分析2.1各变量间的pearson相关性由相关系数表(见spss文件output1的out

8、put1- correlations表)可知变量人口x1(万人)、农林牧渔业总产值x2(亿元)、国内工业生产总值x3(亿元)、国内建筑生产总值x4(亿元)、社会商品零售总额x5(亿元)、就业人员x6(万人),受灾面积x7(万公顷)、能源生产总量x8(万吨标准煤)与财政收入y(亿元)的pearson相关系数依次为0.892,0.995,0.998,0.996,0.994,0.902,0.419,0.975。显著性检验单尾p值(相关系数为0的概率)除x7 外其他均为0。初步分析x1,x2,x3,x4,x5,x6,x8对财政收入影响较大,x7影响不大。2.2逐步回归法各变量的引入和剔除由spss17

9、.0计算得到下表:表2 逐步回归法各变量的引入和剔除上表给出了逐步回归法各变量的引入和剔除以及引入和剔除的标准。变量进入方程的标准:当候选变量中最大f值的p值小于或等于0.050时,引入相应的变量;已进入方程的变量中,最小f值的p值大于或等于0.10时,剔除相应的变量。由上表中可以看出,逐步回归法最先引入变量x3(国内工业生产总值),建立了模型1,没有变量被剔除,故模型1中含有变量x3;接着引入了变量x4(国内建筑生产总值),没有变量被剔除,故模型2中含有变量x3和x4;接着引入了变量x8(能源生产总量),没有变量被剔除,建立了模型3,故模型3中含有变量x3、x4和x8。2.3各模型的拟合情况

10、由spss17.0计算得到下表:表3 各模型的拟合情况由上表可以看出:从模型1到模型3,复相关系数(r)、判定系数(r square)、调整判定系数(adjusted r square若作用不显著的变量引入方程,则该系数减小)逐渐增大,而估计值的标准误差(std. error of the estimate)逐渐减小。故模型3是六个模型中最好的。模型3的复相关系数(r)为0.999,判定系数(r square)为0.999,调整判定系数(adjusted r square)为0.999,估计值的标准误差(std. error of the estimate)为748.4398。模型3 的复相关

11、性非常显著。2.4各模型的方差分析结果由spss17.0计算得到下表表4各模型的方差分析结果由上表可以看出:模型3经过方差分析,f=3400.564 p=0.000,按=0.1水平,认为y(财政收入)与x3(国内工业生产总值)、x4(国内建筑生产总值)和x8(能源生产总量)之间有直线关系。2.5偏回归系数表5 各模型的偏回归系数由上表可得:根据模型3建立的多元线性回归方程为:y=1656.647+0.411x3+0.396x4-0.070x8。方程中的常数项b0为1656.647,偏回归系数b1为0.411,b2为0.396,b3为0.070。经t检验,b1 ,b3, b6的p值均为0.000

12、 ,b2的p值为0.041,按=0.10水平,具有显著性意义。多元线性回归方程为:y=1656.647+0.411*x3+0.396*x4-0.070*x82.6未引入统计量的检验表6 方程外各模型变量的有关统计量每次在模型中加未引入变量中p值小于1最小的一个,在模型3种可以看出未引入变量x1,x2,x5,x6,x,7 的p值为0.372,0.823,0.632,0.723,0.672发现均大于0.10不能引入,模型合理。结论在回归方程求出来后,我们分别用2000年和2009年的数据进行检验。由表1可知:2000年,国内工业生产总值x3为40033.6(亿元),国内建筑生产总值x4为12497

13、.6(亿元),能源生产总量x8(万吨标准煤)为135048.0。代入回归函数可得:y* =13606.1462,而实际数据y = 13395.2,误差率为1.5%。2009年,国内工业生产总值x3为135239.9(亿元),国内建筑生产总值x4为76807.7(亿元),能源生产总量x8(万吨标准煤)为274618.0。代入回归函数可得:y* =68432.8351,而实际数据y=68518.3,误差率0.12%。故可以认为得到的回归函数的拟合效果较好。由上述分析可以得出以下结论:(1)y(财政收入)受x3(国内工业生产总值)、x4(国内建筑生产总值)和x8(能源生产总量)影响显著,它们之间有直线关系。多元线性回归方程为:y=1656.647+0.411x3+0.396x4-0.070x8(2)对y(财政收入)的影响程度由大到小依次为:x3(国内工业生产总值)、x4(国内建筑生产总值)x8(能源生产总量)由逐步回归法的建模过程可得。 因此,工业企业是我国的纳税大户,工业企业的发展对我国的财政收入具有巨大促进作用。我国建筑业建筑业作为国家的支柱产业,其占财政收入的比重也比较大,应该保持其稳定的发展态势。能源是制约经济发展的重要因素。可能是为保证我国的能源供应(较低价供应),我国的能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论