![北航数理统计回归分析大作业._第1页](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/d25c5bde-ba6f-480e-9879-3acb480cfcbb/d25c5bde-ba6f-480e-9879-3acb480cfcbb1.gif)
![北航数理统计回归分析大作业._第2页](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/d25c5bde-ba6f-480e-9879-3acb480cfcbb/d25c5bde-ba6f-480e-9879-3acb480cfcbb2.gif)
![北航数理统计回归分析大作业._第3页](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/d25c5bde-ba6f-480e-9879-3acb480cfcbb/d25c5bde-ba6f-480e-9879-3acb480cfcbb3.gif)
![北航数理统计回归分析大作业._第4页](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/d25c5bde-ba6f-480e-9879-3acb480cfcbb/d25c5bde-ba6f-480e-9879-3acb480cfcbb4.gif)
![北航数理统计回归分析大作业._第5页](http://file2.renrendoc.com/fileroot_temp3/2021-10/24/d25c5bde-ba6f-480e-9879-3acb480cfcbb/d25c5bde-ba6f-480e-9879-3acb480cfcbb5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、应用数理统计第一次大作业学号: 姓名: 班级: 2013年12月国家财政收入的多元线性回归模型摘 要本文以多元线性回归为出发点,选取我国自1990至2008年连续19年的财政收入为因变量,初步选取了7个影响因素,并利用统计软件pasw statistics 17.0对各影响因素进行了筛选,最终确定了能反映财政收入与各因素之间关系的“最优”回归方程:从而得出了结论,最后我们用2009年的数据进行了验证,得出的结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。关键词:多元线性回归,逐步回归法,财政收入,spss 0符号说明变 量符号财政收入y工 业x1农 业x2受灾面积x3建
2、筑 业x4人 口x5商品销售额x6进出口总额x7 1 引言中国作为世界第一大发展中国家,要实现中华民族的伟大复兴,必须把发展放在第一位。近年来,随着国家经济水平的飞速进步,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就
3、很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。本文从国家统计信息网上选取了1990-2009年这20年间的年度财政收入及主要影响因素的数据,包括工业,农业,建筑业,批发和零售贸易餐饮业,人口总数等。文中主要应用逐步回归的统计方法,对数据进行分析处理,最终得出能够反映各个因素对财政收入影响的最“优”模型。2解决问题的方法和计算结果2.1 样本数据的选取与整理本文在进行统计时,查阅中国
4、统计年鉴2010中收录的1990年至2009年连续20年的全国财政收入为因变量,考虑一些与能源消耗关系密切并且直观上有线性关系的因素,初步选取这十九年的国内总产值、工业总产值、人口总数、建筑业、农业、受灾面积和商品零售总额等因素为自变量,分析它们之间的联系。根据选择的指标,从中国统计年鉴2010查选数据,整理如表2-1所示。表2-1 1990-2009年财政收入及其影响因素统计表工业(亿元)农业(亿元)受灾面积(千公顷)建筑业(亿元)人口(万人)社会商品零售总额(亿元)财政收入(亿元)国民生产总值(亿元)199018689.227662.13847413451143338300.12937.1
5、18718.3199122088.688157554721564.31158239415.63149.4821826.2199227724.219084.7513332174.411717110993.73483.3726937.319933969310995.5488293253.511851714270.44348.9535260.0199451353.0315750.5550434653.311985018622.95218.148108.5199554946.8620340.9458215793.812112123613.86242.259810.5199662740.1622353.
6、7469898282.212238928360.27407.9970142.5199768352.6823788.4534299126.512362631252.98651.1478060.8199867737.1424541.9501451006212476133378.19875.9583024.3199972707.0424519912578635647.911444.0888479.2200085673.6624915.85468812497.612674339105.713395.2398000.5200195448.9826179.65221515361.
7、512762743055.416386.04108068.22002110776.4827390.847119.118527.112845348135.918903.64119095.72003142271.2229691.854506.323083.812922752516.321715.25135174.02004201722.193623937106.25627745.31299885950126396.47159586.72005251619.539450.938818.22534552.013075667176.631649.29185808.62006316588.9640810.
8、841091.4141557.11314487641038760.2217522.72007405177.1348892.935972.2351043.71321298921051321.78267763.72008130260.233702.056234.2618743.213280211603261330.35316228.82009135239.935226.050223.5122398.81334741489468518.30343464.72.2 模型的建立与分析将数据录入统计软件excel,建立统计数据库,先建立财政收入与各变量的散点图,如图2-1至图2-7所示。图2-1 财政收入
9、与工业总产值的散点图图2-2 财政收入与农业总产值的散点图图2-3 财政收入与受灾面积的散点图图2-4 财政收入与建筑业的散点图图2-5 财政收入与人口总数的散点图图2-6 财政收入与商品零售总额的散点图 图2-7 财政收入与国内总产值的散点图从散点图中看出,国内生产总值、工业生产总值、农业、建筑业、商品零售总额这四个变量与财政收入总量基本呈线性分布;而人口总数虽然也与财政收入存在正比的关系,但是从直观上看线性关系不显著,并且人口因素呈现指数关系。受灾面积与财政收入总量的关系不明显。因此为使得到的模型有显著的线性关系,在选取进入回归模型的自变量时,就要进行筛选。下面给出筛选过程。(1)将国内生
10、产总值、农业、工业生产总值、建筑业和商品零售总额纳入自变量,逐步回归法,输出结果如图2-8(a)(b)所示。从结果可以看出,该回归的f值为1600.595,查表得,显而易见,回归的显著性很好;但是由于在这里我们要分析的是影响财政收入的具体产业,而该结果只说明了财政收入与国民生产总值的相关性很好,并不能说明问题的根本所在。所以在下面的分析中我们将剔除国民生产总值这个因素做进一步的分析。anovab模型平方和df均方fsig.1回归7.506e917.506e91600.595.000a残差8.441e7184689341.382总计7.590e919a. 预测变量: (常量), 国民生产总值b.
11、 因变量: 财政收入模型汇总b模型rr 方调整 r 方标准估计的误差更改统计量durbin-watsonr 方更改f 更改df1df2sig. f 更改1.994a.989.9882165.489.9891600.595118.000.200a. 预测变量: (常量), 国民生产总值b. 因变量: 财政收入图2-8(a)(b) 输出结果(2)将工业生产总值、农工、建筑业和商品零售总额纳入自变量,逐步回归法,输出结果如图2-9(a)(b)(c)所示。anovab模型平方和df均方fsig.1回归4.757e914.757e930.215.000a残差2.834e9181.574e8总计7.590
12、e919a. 预测变量: (常量), 农业b. 因变量: 财政收入模型汇总b模型rr 方调整r 方标准估计的误差更改统计量durbin-watsonr 方更改f 更改df1df2sig. f 更改1.792a.627.60612546.807.62730.215118.000.390a. 预测变量: (常量), 农业b. 因变量: 财政收入 图2-9(a)(b)(c) 输出结果从结果可以看出,该回归的f值为30.215,查表得,显而易见,回归的显著性很好;但是对回归系数的显著性来说,从直方图中可以看出,采用以上三个变量作为自变量得到的线性模型仍不是很好。这个模型也不是理想中的模型,所以下面我们
13、试图根据我们的判断对样本数据进行筛选,力求得出比较理想的模型。(3)下面我将农业这个变量暂且剔除,只采用工业、建筑业和商品零售总额作为自变量,采用逐步回归法,输出结果如图2-10(a)(b)所示。从结果可以看出,该回归的f值为20.219,查表得,显而易见,回归的显著性很好;但是对回归系数的显著性来说,建筑业的t检验值为0.0002,查表得,显然回归系数的显著性不好。以上检验得到的与利用p值法(图中的sig值)得到的检验结果相符。因此,采用以上三个变量作为自变量得到的线性模型仍不是很好。同时可以看出,只对建筑业做回归分析时,f值为20.19,查表得到,这证明一元回归模型和回归系数的显著性都很好
14、。anovab模型平方和df均方fsig.1回归4.015e914.015e920.219.000a残差3.575e9181.986e8总计7.590e919a. 预测变量: (常量), 建筑业b. 因变量: 财政收入模型汇总b模型rr 方调整r 方标准估计的误差更改统计量durbin-watsonr 方更改f 更改df1df2sig. f 更改1.727a.529.50314092.439.52920.219118.000.546a. 预测变量: (常量), 建筑业b. 因变量: 财政收入图2-10(a)(b) 输出结果(4)只将工业和商品零售总额纳入自变量,输出结果如图2-11(a)(b)
15、所示。anovab模型平方和df均方fsig.1回归3.498e913.498e915.390.001a残差4.092e9182.273e8总计7.590e919a. 预测变量: (常量), 工业。b. 因变量: 财政收入系数a模型非标准化系数标准系数tsig.共线性统计量b标准 误差试用版容差vif1(常量)4994.3655206.020.959.350工业.132.034.6793.923.0011.0001.000a. 因变量: 财政收入图2-11(a)(b) 输出结果从上图结果中可以看出,对这两个变量做回归分析时,f值为15.39,证明一元回归模型和回归系数的显著性都很好。2.3 分
16、析结果由以上筛选和分析过程可以看出,财政收入y分别对x7国内总产值、x1工业总产值、x4建筑业及商品零售总额x6进行一元回归分析时,其回归的显著性都很好,但是综合为一个多元回归模型时,则出现了某些系数不显著的现象。综合比较选取的几个多元模型,将x4建筑业和x6商品零售总额纳入自变量时得到的模型效果最为显著,回归方程如下:其中,。3 结论本次大作业,根据查阅中国统计年鉴,列举了影响财政收入的7个因素。从直观上考虑,人口总量与受灾面积与财政收入存在线性关系,所以特意把这两个变量列到其中,但是散点图和回归效果显示这2个因素并没有进入逐步回归模型中,由此看来,这两项因素与财政收入存在的关系可能不是严格
17、线性的,或者这种线性关系是长期的线性关系。另外,在对进入模型的5个因素进行回归时发现,因变量对单独变量的回归性很显著,但是整合成多元回归出现了某些回归系数不显著的现象,具体原因可能是由于数据选取的太少,未能体现出长期线性这一特点。虽然得到的几个模型系数都不是很显著,但经综合比较,选取了一个较为显著的模型作为最“优”解。对得到的最“优”回归模型做预测,置信度为95%。查阅中国统计年鉴,得到2009年的x4建筑业为22398.8(亿元),x6商品零售总额为14894(亿元),y财政收入为68518.30(亿元),将自变量带入回归方程:预测区间为,其中。代入数值得到置信度为95%的预测区间为,与查得
18、的2009年能源消耗总量68518.30(亿元)比较接近。得到的数据模型显示财政收入与建筑业、商品零售额有着密切的关系,这也很符合目前国家的经济状况。不过由于调研时间有限,上述回归模型存在一些不足,还需要不断查阅资料加以改进。但在一定程度上体现了与选取的自变量之间的线性关系,并能对因变量做出近似的预测。综合来看,数据模型基本达到了预期的目的。参考文献1 孙海燕,周梦,李卫国,冯伟. 应用数理统计m. 北京:北京航空航天大学数学系, 1999.2 张建同,孙昌言. 以excel和spss为工具的管理统计m. 北京:清华大学出版社,2002.3 国家统计局.2010年中国统计年鉴m. 中国统计出版社,20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 苏科版数学九年级下册《6.1 图上距离与实际距离》听评课记录
- 现代市场营销从传统到数字化的转型
- 物理学经典理论在教育游戏中的应用
- 2025年度互联网+合伙开店合同协议
- 物联网平台的安全架构与防护技术
- 未来社区中的现代科技与传统生活
- 现代人如何通过中医实现身心和谐
- 现代办公楼宇如何利用先进的大气治理技术实现绿色办公
- 2025年度环保工程顾问专业聘用合同
- 【基础卷】同步分层练习:四年级下册语文第1课《古诗词三首》(含答案)
- 人教版五年级上册小数除法竖式计算练习练习300题及答案
- 综合素质提升培训全面提升个人综合素质
- 如何克服高中生的社交恐惧症
- 城市轨道交通列车网络控制及应用 课件 项目6、7 列车网络控制管理系统、城轨列车网络控制及应用
- 聚焦任务的学习设计作业改革新视角
- 2024高二语文期末试卷(选必上、中)及详细答案
- 2022中储粮油脂有限公司招聘试题及答案解析
- 分布式光伏项目规划设计方案
- 计算机软件确认控制程序
- 造价员安全生产责任制
- 桥梁桩基专项施工方案-
评论
0/150
提交评论