数理统计回归分析大作业_第1页
数理统计回归分析大作业_第2页
数理统计回归分析大作业_第3页
数理统计回归分析大作业_第4页
数理统计回归分析大作业_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 应用数理统计第一次大作业 回归分析姓 名: 学 号: 班 级: 2014-12-20国家财政收入的多元线性回归模型摘 要:本文以多元线性回归为出发点,选取我国自1990至2009年连续20年的财政收入为因变量,初步选取了7个影响因素,并利用统计软件PASW Statistics 17.0对各影响因素进行了筛选,最终确定了能反映财政收入与各因素之间关系的回归方程:从而得出了结论,最后我们用2010年的数据进行了验证,得出的结果(86482.00)在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。关键词:多元线性回归,逐步回归法,财政收入,SPSS 0符号说明变 量符号财政收入Y

2、工 业X1农 业X2进出口总额X3建 筑 业X4人 口X5商品销售额X6国内生产总值X7 1 引言定义:所谓回归分析法,是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。 回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。通常线性回归分析法是最基本的分析方法,遇到非线性回归问题可以借助数学手段化为线性回归问题处理。回归分析法预

3、测是利用回归分析方法,根据一个或一组自变量的变动情况预测与其有相关关系的某随机变量的未来值。进行回归分析需要建立描述变量间相关关系的回归方程。根据自变量的个数,可以是一元回归,也可以是多元回归。根据所研究问题的性质,可以是线性回归,也可以是非线性回归。本文应用逐步回归的方法进行分析。中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健

4、康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建

5、筑业,零售贸易总额,进出口总额,人口总数等。文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。2解决问题的方法和计算结果2.1 样本数据的选取与整理本文在进行统计时,查阅中国统计年鉴2010中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这十九年的国内总产值、工业总产值、人口总数、建筑业、农业、商品零售总额、进出口总额等因素为自变量,分析它们之间的联系。根据选择的指标,从中国统计年鉴2010查选数据,整理如表2-1所示。2010年的数据是在网上搜索到的。表2-1

6、 1990-2009年财政收入及其影响因素统计表年份工业(亿元)农业(亿元)进出口总额(亿元)建筑业(亿元)人口(万人)社会商品零售总额(亿元)财政收入(亿元)国内生产总值(亿元)199018689.227662.15560.113451143338300.12937.118718.3199122088.6881577225.81564.31158239415.63149.4821826.2199227724.219084.79119.62174.411717110993.73483.3726937.319933969310995.511271.03253.511851714270.44348

7、.9535260.0199451353.0315750.520381.94653.311985018622.95218.148108.5199554946.8620340.923499.95793.812112123613.86242.259810.5199662740.1622353.724133.88282.212238928360.27407.9970142.5199768352.6823788.426967.29126.512362631252.98651.1478060.8199867737.1424541.926849.71006212476133378.19875.9583024

8、.3199972707.0424519.129896.211152.912578635647.911444.0888479.2200085673.6624915.839273.212497.612674339105.713395.2398000.5200195448.9826179.642183.615361.512762743055.416386.04108068.22002110776.4827390.851378.218527.112845348135.918903.64119095.72003142271.2229691.870483.523083.812922752516.32171

9、5.25135174.02004201722.193623995539.127745.31299885950126396.47159586.72005251619.539450.9116921.834552.013075667176.631649.29185808.62006316588.9640810.8140971.441557.11314487641038760.2217522.72007405177.1348892.9166740.251043.71321298921051321.78267763.72008130260.233702.0179921.518743.2132802116

10、03261330.35316228.82009135239.935226.0150648.122398.813347414894068518.30343464.72010707772.1660361.0202923.095206.013705415455483080.00397983.02.2 模型的建立与分析 DataSet0 从散点图中看出,国内生产总值、工业生产总值、进出口总额、建筑业、商品零售总额这5个变量与财政收入总量基本呈线性分布;而人口总数虽然也与财政收入存在正比的关系,但是从直观上看线性关系不显著,并且人口因素呈现指数关系。农业与财政收入总量的线性关系不十分明显。因此为使得到的

11、模型有显著的线性关系,在选取进入回归模型的自变量时,就要进行筛选。下面给出筛选过程。RegressionNotesOutput Created20-十二月-2014 19时35分52秒CommentsInputDataF:数理作业收入.savActive DatasetDataSet1Filter<none>Weight<none>Split File<none>N of Rows in Working Data File20Missing Value HandlingDefinition of MissingUser-defined missing val

12、ues are treated as missing.Cases UsedStatistics are based on cases with no missing values for any variable used.SyntaxREGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS BCOV R ANOVA COLLIN TOL CHANGE ZPP /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT VAR00008 /METHOD=STEPWISE VAR00001 VAR00003 V

13、AR00004 VAR00006 VAR00007 /RESIDUALS DURBIN.ResourcesProcessor Time0:00:00.032Elapsed Time0:00:00.032Memory Required3020 bytesAdditional Memory Required for Residual Plots0 bytesDataSet1 F:数理作业收入.savVariables Entered/RemovedaModelVariables EnteredVariables RemovedMethod1建筑业.Stepwise (Criteria: Proba

14、bility-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).2进出口总额.Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).a. Dependent Variable: 财政收入Model SummarycModelRR SquareAdjusted R SquareStd. Error of the Estimate1.997a.995.9941518.619532.

15、998b.996.9951348.53313a. Predictors: (Constant), 建筑业b. Predictors: (Constant), 建筑业, 进出口总额c. Dependent Variable: 财政收入Model SummarycModelChange StatisticsR Square ChangeF Changedf1df2Sig. F ChangeDurbin-Watson1.9953273.184118.0002.0015.827117.0271.088c. Dependent Variable: 财政收入ANOVAcModelSum of Square

16、sdfMean SquareFSig.1Regression7.549E917.549E93273.184.000aResidual4.151E7182306205.273Total7.590E9192Regression7.559E923.780E92078.377.000bResidual3.092E7171818541.599Total7.590E919a. Predictors: (Constant), 建筑业b. Predictors: (Constant), 建筑业, 进出口总额c. Dependent Variable: 财政收入CoefficientsaModelUnstand

17、ardized CoefficientsStandardized CoefficientsBStd. ErrorBetatSig.1(Constant)1169.872479.7272.439.025建筑业.919.016.99757.212.0002(Constant)817.357450.3331.815.087建筑业.806.049.87516.541.000进出口总额.044.018.1282.414.027a. Dependent Variable: 财政收入CoefficientsaModelCorrelationsCollinearity StatisticsZero-order

18、PartialPartToleranceVIF1建筑业.997.997.9971.0001.0002建筑业.997.970.256.08611.683进出口总额.965.505.037.08611.683a. Dependent Variable: 财政收入Excluded VariablescModelBeta IntSig.Partial Correlation1工业.021a.909.376.215进出口总额.128a2.414.027.505商品销售总额-.215a-1.663.115-.374国内总产值.284a2.026.059.4412工业-.051b-1.543.142-.36

19、0商品销售总额-.062b-.399.695-.099国内总产值.141b.835.416.204a. Predictors in the Model: (Constant), 建筑业b. Predictors in the Model: (Constant), 建筑业, 进出口总额c. Dependent Variable: 财政收入Excluded VariablescModelCollinearity StatisticsToleranceVIFMinimum Tolerance1工业.5531.810.553进出口总额.08611.683.086商品销售总额.01760.479.017

20、国内总产值.01376.062.0132工业.2014.967.031商品销售总额.01095.518.006国内总产值.009117.017.009c. Dependent Variable: 财政收入Coefficient CorrelationsaModel建筑业进出口总额1Correlations建筑业1.000Covariances建筑业.0002Correlations建筑业1.000-.956进出口总额-.9561.000Covariances建筑业.002.000进出口总额.000.000a. Dependent Variable: 财政收入Collinearity Diagn

21、osticsaModelDimensionVariance ProportionsEigenvalueCondition Index(Constant)建筑业进出口总额111.7061.000.15.152.2942.411.85.85212.6221.000.05.01.012.3572.709.89.02.013.02111.228.06.97.98a. Dependent Variable: 财政收入Residuals StatisticsaMinimumMaximumMeanStd. DeviationNPredicted Value2146.809369392.664120556.7

22、45519946.2837320Residual-2180.210212561.83057.000001275.5846420Std. Predicted Value-.9232.448.0001.00020Std. Residual-1.6171.900.000.94620a. Dependent Variable: 财政收入将X4建筑业和X3进出口总额纳入自变量时得到的模型效果最为显著,回归方程如下:3 结论本次大作业,根据查阅中国统计年鉴,列举了影响财政收入的7个因素。从直观上考虑,人口总量、农业两个因素与财政收入存在线性关系,所以特意把这两个变量列到其中,但是散点图和回归效果显示这2个因素并没有进入逐步回归模型中,由此看来,这两项因素与财政收入存在的关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论