论文:基于数据挖掘技术的市财政收入分析预测模型_第1页
论文:基于数据挖掘技术的市财政收入分析预测模型_第2页
论文:基于数据挖掘技术的市财政收入分析预测模型_第3页
论文:基于数据挖掘技术的市财政收入分析预测模型_第4页
论文:基于数据挖掘技术的市财政收入分析预测模型_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、泰迪杯大学生数据挖掘竞赛论文报告第1 页,共 31 页竞赛作品资料包括以下两部分,请分别压缩后在“会员中心”统一提交:1、论文正文要求用 word2003 格式整理,压缩成“论文正文.zip”2、源数据(组委会提供的源数据外) 、过程数据、程序及模型文件,压缩成“附件资料.zip”所选题目: 基于数据挖掘技术的市财政收入分析预测模型基于数据挖掘技术的市财政收入分析预测模型综合评定成绩: 评委评语评委评语:评委签名:评委签名: 泰迪杯大学生数据挖掘竞赛论文报告第2 页,共 31 页基于数据挖掘技术的广州市财政收入分析基于数据挖掘技术的广州市财政收入分析摘摘要要:地方财政收入的稳定增长对于地区经济

2、的发展具有重要作用。而地方财政收入的稳定增长对于地区经济的发展具有重要作用。而财政收财政收入是衡量一国政府财力的重要指标,入是衡量一国政府财力的重要指标,近几年来近几年来, ,政府公共财政在经济和社会发政府公共财政在经济和社会发展中扮演的角色越来越重要。如何调整和优化现有的财政支出和规模结构,展中扮演的角色越来越重要。如何调整和优化现有的财政支出和规模结构,服务于地方经济建设的发展服务于地方经济建设的发展, ,一个重要的表现就是地方财政收入的不断增加。一个重要的表现就是地方财政收入的不断增加。地方财政收入的稳定增加地方财政收入的稳定增加, ,客观上也会不断推动地方经济的进一步发展。客观上也会不

3、断推动地方经济的进一步发展。财政支出作为作为一种重要的经济调控手段,其规模大小和使用方向的财政支出作为作为一种重要的经济调控手段,其规模大小和使用方向的不同会造成不同的经济效益,而财政支出对于经济的影响近年来一直是当前不同会造成不同的经济效益,而财政支出对于经济的影响近年来一直是当前数据挖掘的热点,因为政府财政支出的热点不仅反映了财政政策的重点,还数据挖掘的热点,因为政府财政支出的热点不仅反映了财政政策的重点,还能够有效引导私人需求,对经济增长和结构升级又都重要意义。随着我国的能够有效引导私人需求,对经济增长和结构升级又都重要意义。随着我国的经济不断发展,我国的财政支出也在不断的扩张,而广州市

4、作为改革开放的经济不断发展,我国的财政支出也在不断的扩张,而广州市作为改革开放的前沿城市,具有较强的经济实力,对国家的经济增长提供了极大的贡献,因前沿城市,具有较强的经济实力,对国家的经济增长提供了极大的贡献,因此,对广州市这样一个模板城市的财政收入和支出分析对于一个城市的发展此,对广州市这样一个模板城市的财政收入和支出分析对于一个城市的发展具有重要的意义,然而不同时期的财政支出对不同时期的经济发展需求不一具有重要的意义,然而不同时期的财政支出对不同时期的经济发展需求不一样,因此,本文根据广州市进年年来的财政数据做了系统的统计与分析,并样,因此,本文根据广州市进年年来的财政数据做了系统的统计与

5、分析,并对其未来所有支出部门做了预测,有助于我国的财政支出更有效的服务于经对其未来所有支出部门做了预测,有助于我国的财政支出更有效的服务于经济发展济发展关键词:数据挖掘关键词:数据挖掘 财政支出财政支出 促进经济促进经济泰迪杯大学生数据挖掘竞赛论文报告第3 页,共 31 页The thesis titleAbstract: A brief description of the abstractThe stability of the local fiscal revenue growth plays an important role in the development of regiona

6、l economy. Fiscal revenue is an important index to measure a countrys government financial resources, in recent years, the government public finance in the economic and social development is playing an increasingly important role. How to adjust and optimize the structure of fiscal expenditure and sc

7、ale of the existing, services in the development of local economic construction, is an important part of the performance of local fiscal revenue increased. The stability of the local fiscal revenue increase, objectively also will continue to promote the further development of local economy.Fiscal sp

8、ending as a kind of important economic control measures, the size and direction of use of different can lead to different economic benefits, and the effect of fiscal expenditure to economic has always been the hot spot of the current data mining in recent years, because the government fiscal spendin

9、g hotspot not only reflects the focus of fiscal policy, also can effectively guide the private demand for economic growth and structure upgrade and are of great significanceexpenditure of our country are also constantly, and guangzhou as the forefront of reform and opening up city, with strong econo

10、mic strength and growth provides a tremendous contribution to the economy of the country, therefore, for the guangzhou city as a template for fiscal revenue and expenditure analysis is of important significance for the development of a city, but in different periods of fiscal expenditure is not the

11、same as the demand for different periods of economic development, therefore, this paper, based on the financialdata of guangzhou into a year to do the statistics and analysis of the system, and the department has made the forecast and the future of all spending, help to Chinas fiscal spending is mor

12、e effective in the service of economic development泰迪杯大学生数据挖掘竞赛论文报告第4 页,共 31 页Key words: Data mining Public finance expenditure泰迪杯大学生数据挖掘竞赛论文报告第5 页,共 31 页目 录1.研究目标研究目标 .62.分析方法与过程分析方法与过程.62.1. 总体流程.62.2. 具体步骤.62.3. 结果分析.73.结论结论.74.参考文献参考文献 .7泰迪杯大学生数据挖掘竞赛论文报告第6 页,共 31 页1. 挖掘目标挖掘目标本次建模目标是利用广州市统计局积累下来的海

13、量真实数据,采用数据挖掘技术,分析各类支出数据的相互关系、发现事件之间的内部关联,构建反映支出与收入之间的模型,挖掘出当前对支出的影响的当前热点,需要实现以下的具体目标 (一)对数据选取、收集 数据选取的目的是确定目标数据,从广州市统计局获取最近的财政支出和收入的数据。(二)数据整理 数据整理是对选出的数据进行再处理,检查数据的完整性及一致性,消除噪声及与数据挖掘无关的冗余数据,根据时间序列和已知的变化情况,利用统计等方法填充丢失的数据。数据整理包括以下内容:1.数据选择。搜索所有与财政支出对象有关的内部和外部数据信息,根据财政支出的目的从中选择出适用于数据挖掘的数据。2.在原数据的基础上,寻

14、找依赖于发现目标的表达数据的有用特征,以缩减数据规模,从而在尽可能保持数据原貌的前提下最大限度地精简数据量。3.数据转换。选取合适的知识发现算法,合适的模型和参数,建立分析模型,并将数据转换成为该分析模型。(三)数据挖掘并得出预测结论 根据一系列的数据挖掘算法即数学模型,得出客观的科学依据,为财政局的规划提供重要参考材料。 2. 分析方法与过程分析方法与过程2.1. 总体流程总体流程泰迪杯大学生数据挖掘竞赛论文报告第7 页,共 31 页本题分析主要步骤如下一,对数据进行选取,搜集。本题分析主要步骤二,对选出和搜集的数据进行抽取,根据项目需求对数据进行清洗,消除与项目无关的冗余数据。三,数据分析

15、,对经过整理的数据建立数学模型, 采用相应的数据挖掘方法进行关键数据的抽取,并得到正确的结论。2.2. 具体分析过程及操作步骤具体分析过程及操作步骤问题一:通过工具 Rstudio 导入选取出的数据,并对其进行操作,从大量的,不完全的,有噪声的,模糊的,实际应用数据中,通过回归分析方法,寻找变量之间的关系,运用这种关系对数据进行控制,提取出隐藏在其中的有效数据的,利用这些数据做回归模型的显著性检验,回归系数的显著性检验等,根据对数据进行多元线性回归,逐步回归,正态检测等可分析、识别出影响财政收入的关键影响因素,具体操作步骤如下所示:1.导入数据 fujian=read.csv(C:/Users

16、/RWY/Desktop/数据挖掘赛题/地方财政收入汇总.csv) fujian 年份 地方财政收入合计 公共财政收入 增值税 营业税 企业所得税 个人所得税 城市维护建设税1 1999 1881388 1761499 288972 433360 277375 133621 1169732 2000 2199077 2005460 350495 479698 309764 185625 1290753 2001 2719058 2461941 443213 540075 483421 254892 1527394 2002 2690984 2458737 526377 613161 23641

17、6 159684 1648925 2003 3005475 2747707 581898 650119 268360 153080 1734526 2004 3384477 3028692 528365 793520 326556 167379 1999907 2005 4088545 3712633 816119 892678 373397 198017 2284198 2006 4767231 4270831 967265 1027971 455820 231794 2684209 2007 8389925 5237862 1115007 1235374 596693 泰迪杯大学生数据挖掘

18、竞赛论文报告第8 页,共 31 页295316 32520810 2009 11076649 7026527 1375085 1516049 732282 389824 36111811 2010 13991612 8726470 1594182 1777343 935248 472154 42662212 2011 15351387 9794768 1573830 1625593 1061594 462098 85388213 2012 15796804 11023961 1758311 1747616 1075045 439592 92415014 2013 20881374 114180

19、44 2216017 1623520 1155923 489777 1013703 房产税 印花税 契税 行政事业性收费收入1 77562 21159 145254 300722 90776 28124 99776 388653 109140 30106 97903 857624 134061 35561 114520 1359195 146223 42490 171699 1713976 168904 67625 204895 1937437 200221 64862 221754 2019978 239285 80913 251382 2349499 262053 110676 30694

20、0 25300010 349616 154364 464568 27129311 416964 194584 610978 65165112 512657 211024 575560 68584013 612254 219623 581872 72219014 648012 260946 798657 806981 attach(fujian)2.线性关系图 par(mfrow=c(3,3) plot(地方财政收入合计公共财政收入);abline(lm(地方财政收入合计公共财政收入) plot(地方财政收入合计增值税);abline(lm(地方财政收入合计增值税) plot(地方财政收入合计营

21、业税);abline(lm(地方财政收入合计营业税) plot(地方财政收入合计企业所得税);abline(lm(地方财政收入合计企业所得税) plot(地方财政收入合计个人所得税);abline(lm(地方财政收入合计个人所得税) plot(地方财政收入合计城市维护建设税);abline(lm(地方财政收入合计城市维护建设税) plot(地方财政收入合计房产税);abline(lm(地方财政收入合计房产税) plot(地方财政收入合计印花税);abline(lm(地方财政收入合计印花税) plot(地方财政收入合计契税);abline(lm(地方财政收入合计契税) plot(地方财政收入合计

22、行政事业性收费收入);abline(lm(地方财政收入合计行政事业性收费收入)2.多元线性回归的汇总输出 lm.test_new=lm(地方财政收入合计公共财政收入+增值税+营业税+企业所得税+泰迪杯大学生数据挖掘竞赛论文报告第9 页,共 31 页个人所得税+城市维护建设税+房产税+印花税+契税+行政事业性收费收入) summary(lm.test_new)#查看回归系数和模型的检验结果Call:lm(formula = 地方财政收入合计 公共财政收入 + 增值税 + 营业税 + 企业所得税 + 个人所得税 + 城市维护建设税 + 房产税 + 印花税 + 契税 + 行政事业性收费收入)Resi

23、duals: 1 2 3 4 5 6 7 8 9 10 11 130734 -331440 100282 287608 -73537 28738 -153519 -77698 64031 42644 -10229 12 13 14 -24768 4711 12443 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 3.713e+06 1.486e+06 2.498 0.0879 .公共财政收入 4.454e+00 1.129e+00 3.946 0.0290 *增值税 7.929e+00 1.717e+00 4.618

24、 0.0191 *营业税 -1.152e+01 2.724e+00 -4.229 0.0242 *企业所得税 3.482e+00 4.042e+00 0.861 0.4523 个人所得税 -2.204e+01 1.148e+01 -1.919 0.1508 城市维护建设税 -5.495e+00 4.516e+00 -1.217 0.3107 房产税 -6.289e+01 1.524e+01 -4.126 0.0258 *印花税 1.341e+02 3.303e+01 4.059 0.0270 *契税 -1.650e+01 7.616e+00 -2.166 0.1189 行政事业性收费收入 -1

25、.589e+00 1.480e+00 -1.073 0.3618 -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 295700 on 3 degrees of freedomMultiple R-squared: 0.9995, Adjusted R-squared: 0.9978 F-statistic: 600.2 on 10 and 3 DF, p-value: 0.00010063.绘制四个相关系数图 plot(lm.test_new,1)#残差,普通残差与拟合值的残差图 plot(lm.t

26、est_new,2)#QQ 图,若残差是来自正态总体分布的样本,则 QQ 图中的点应该在一条直线上 plot(lm.test_new,3)#标准化残差开方与拟合值的残差图(对于近似服从正态分布的标准化残差,应该有 95%的样本点落在-2,2的区间内。这也是判断异常点的直观方法) plot(lm.test_new,4)#(cook 统计量值越大的点越可能是异常值,但具体阀值是多少较难判别)泰迪杯大学生数据挖掘竞赛论文报告第10 页,共 31 页4.逐步回归 step(lm.test_new)#用 step 实现变量选择Start: AIC=353.16地方财政收入合计 公共财政收入 + 增值税

27、+ 营业税 + 企业所得税 + 个人所得税 + 城市维护建设税 + 房产税 + 印花税 + 契税 + 行政事业性收费收入 Df Sum of Sq RSS AIC 2.6237e+11 353.16- 企业所得税 1 6.4900e+10 3.2727e+11 354.25- 行政事业性收费收入 1 1.0075e+11 3.6312e+11 355.71- 城市维护建设税 1 1.2950e+11 3.9187e+11 356.77- 个人所得税 1 3.2207e+11 5.8444e+11 362.37- 契税 1 4.1034e+11 6.7271e+11 364.34- 公共财政收入

28、 1 1.3621e+12 1.6245e+12 376.68- 印花税 1 1.4406e+12 1.7030e+12 377.34- 房产税 1 1.4891e+12 1.7515e+12 377.73- 营业税 1 1.5640e+12 1.8264e+12 378.32- 增值税 1 1.8649e+12 2.1272e+12 380.46Call:lm(formula = 地方财政收入合计 公共财政收入 + 增值税 + 营业税 + 企业所得税 + 个人所得税 + 城市维护建设税 + 房产税 + 印花税 + 契税 + 行政事业性收费收入)Coefficients: (Intercept

29、) 公共财政收入 增值税 营业税 3.713e+06 4.454e+00 7.929e+00 -1.152e+01 企业所得税 个人所得税 城市维护建设税 房产税 3.482e+00 -2.204e+01 -5.495e+00 -6.289e+01 印花税 契税 行政事业性收费收入 1.341e+02 -1.650e+01 -1.589e+00 该程序步骤的相关建模图如下所示: 泰迪杯大学生数据挖掘竞赛论文报告第11 页,共 31 页泰迪杯大学生数据挖掘竞赛论文报告第12 页,共 31 页因此,根据以上对数据的处理结果以及建模图可分析、识别得出结论:主要影响地方财政收入的因素有:公共财政收入,

30、增值税,营业税,企业所得税,房产税,印花税。问题二:利用时间序列及指数平滑预测对影响地方财政收入的数据进行分析处理,可以对广州市 2015 年的财政总收入及各个类别收入进行预测,具体步骤如下所示:1.导入数据 fujian=read.csv(C:/Users/RWY/Desktop/数据挖掘赛题/影响财政收入的主要因素.csv) fujian年份 地方财政收入合计 增值税 营业税 企业所得税 房产税 印花税 公共财政收入泰迪杯大学生数据挖掘竞赛论文报告第13 页,共 31 页1 1999 1881388 288972 433360 277375 77562 21159 17614992 200

31、0 2199077 350495 479698 309764 90776 28124 20054603 2001 2719058 443213 540075 483421 109140 30106 24619414 2002 2690984 526377 613161 236416 134061 35561 24587375 2003 3005475 581898 650119 268360 146223 42490 27477076 2004 3384477 528365 793520 326556 168904 67625 30286927 2005 4088545 816119 8926

32、78 373397 200221 64862 37126338 2006 4767231 967265 1027971 455820 239285 80913 42708319 2007 8389925 1115007 1235374 596693 262053 110676 523786210 2008 8431400 1287226 1279793 756412 305843 132520 613219411 2009 11076649 1375085 1516049 732282 349616 154364 702652712 2010 13991612 1594182 1777343

33、935248 416964 194584 872647013 2011 15351387 1573830 1625593 1061594 512657 211024 979476814 2012 15796804 1758311 1747616 1075045 612254 219623 1102396115 2013 20881374 2216017 1623520 1155923 648012 260946 11418044 attach(fujian)The following objects are masked from fujian (pos = 3): 地方财政收入合计, 房产税

34、, 年份, 企业所得税, 印花税, 营业税, 增值税The following objects are masked from fujian (pos = 7): 地方财政收入合计, 房产税, 年份, 企业所得税, 印花税, 营业税, 增值税The following objects are masked from fujian (pos = 8): 地方财政收入合计, 房产税, 公共财政收入, 年份, 企业所得税, 印花税, 营业税, 增值税2.绘制时间序列图泰迪杯大学生数据挖掘竞赛论文报告第14 页,共 31 页 fujian=ts(fujian,start=1999) par(mfcol

35、=c(1,2),cex=0.5) plot(fujian,2,xlab=时间,ylab=地方财政收入合计,type=n) grid(col=lightblue) points(fujian,2,type=o,xlab=时间,ylab=地方财政收入合计) plot(fujian,3,xlab=时间,ylab=增值税,type=n) grid(col=lightblue) points(fujian,3,type=o,xlab=时间,ylab=增值税) plot(fujian,4,xlab=时间,ylab=营业税,type=n) grid(col=lightblue) points(fujian,

36、4,type=o,xlab=时间,ylab=营业税) plot(fujian,5,xlab=时间,ylab=企业所得税,type=n) grid(col=lightblue) points(fujian,5,type=o,xlab=时间,ylab=企业所得税) plot(fujian,6,xlab=时间,ylab=房产税,type=n) grid(col=lightblue) points(fujian,6,type=o,xlab=时间,ylab=房产税) plot(fujian,7,xlab=时间,ylab=印花税,type=n) grid(col=lightblue) points(fuj

37、ian,7,type=o,xlab=时间,ylab=印花税) plot(fujian,8,xlab=时间,ylab=公共财政收入,type=n) grid(col=lightblue) points(fujian,8,type=o,xlab=时间,ylab=公共财政收入)3.指数平滑预测 fujian=ts(fujian,start=1999) dfczzchjforecast=HoltWinters(fujian,2,beta=FALSE,gamma=FALSE) dfczsrhjforecastHolt-Winters exponential smoothing without trend

38、 and without seasonal component.Call:HoltWinters(x = fujian, 2, beta = FALSE, gamma = FALSE)Smoothing parameters: alpha: 0.9999202 beta : FALSE gamma: FALSECoefficients: ,1a 20880968 zzsforecast=HoltWinters(fujian,3,beta=FALSE,gamma=FALSE) zzsforecastHolt-Winters exponential smoothing without trend

39、and without seasonal 泰迪杯大学生数据挖掘竞赛论文报告第15 页,共 31 页component.Call:HoltWinters(x = fujian, 3, beta = FALSE, gamma = FALSE)Smoothing parameters: alpha: 0.9999587 beta : FALSE gamma: FALSECoefficients: ,1a 2215998 yysforecast=HoltWinters(fujian,4,beta=FALSE,gamma=FALSE) yysforecastHolt-Winters exponentia

40、l smoothing without trend and without seasonal component.Call:HoltWinters(x = fujian, 4, beta = FALSE, gamma = FALSE)Smoothing parameters: alpha: 0.999953 beta : FALSE gamma: FALSECoefficients: ,1a 1623526 qysdsforecast=HoltWinters(fujian,4,beta=FALSE,gamma=FALSE) qysdsforecast=HoltWinters(fujian,5,

41、beta=FALSE,gamma=FALSE) qysdsforecastHolt-Winters exponential smoothing without trend and without seasonal component.Call:HoltWinters(x = fujian, 5, beta = FALSE, gamma = FALSE)Smoothing parameters: alpha: 0.9999538 beta : FALSE gamma: FALSECoefficients:泰迪杯大学生数据挖掘竞赛论文报告第16 页,共 31 页 ,1a 1155919 fcsfo

42、recast=HoltWinters(fujian,4,beta=FALSE,gamma=FALSE) fcsforecast=HoltWinters(fujian,6,beta=FALSE,gamma=FALSE) fcsforecastHolt-Winters exponential smoothing without trend and without seasonal component.Call:HoltWinters(x = fujian, 6, beta = FALSE, gamma = FALSE)Smoothing parameters: alpha: 0.9999328 b

43、eta : FALSE gamma: FALSECoefficients: ,1a 648009.6 yhsforecast=HoltWinters(fujian,7,beta=FALSE,gamma=FALSE) yhsforecastHolt-Winters exponential smoothing without trend and without seasonal component.Call:HoltWinters(x = fujian, 7, beta = FALSE, gamma = FALSE)Smoothing parameters: alpha: 0.9999202 be

44、ta : FALSE gamma: FALSECoefficients: ,1a 260942.7 ggczsrforecast=HoltWinters(fujian,8,beta=FALSE,gamma=FALSE) ggczsrforecastHolt-Winters exponential smoothing without trend and without seasonal component.Call:HoltWinters(x = fujian, 8, beta = FALSE, gamma = FALSE)Smoothing parameters:泰迪杯大学生数据挖掘竞赛论文报

45、告第17 页,共 31 页 alpha: 0.9999257 beta : FALSE gamma: FALSECoefficients: ,1a 114180154.历史数据的拟合值 dfczsrhjforecast$fittedTime Series:Start = 2000 End = 2013 Frequency = 1 xhat level2000 18813882199052 21990522002 2719016 27190162003 2690986 26909862004 3005450 30054502005 3384447 33844472006

46、 4088489 40884892007 4767177 47671772008 8389636 83896362009 8431397 84313972010 11076438 110764382011 13991379 139913792012 15351278 153512782013 15796768 15796768 zzsforecast$fittedTime Series:Start = 2000 End = 2013 Frequency = 1 xhat level2000 288972.0 288972.02001 350492.5 350492.52002 443209.2

47、 443209.22003 526373.6 526373.62004 581895.7 581895.72005 528367.2 528367.22006 816107.1 816107.12007 967258.8 967258.82008 1115000.9 1115000.92009 1287218.9 1287218.9泰迪杯大学生数据挖掘竞赛论文报告第18 页,共 31 页2010 1375081.4 1375081.42011 1594172.9 1594172.92012 1573830.8 1573830.82013 1758303.4 1758303.4 yysforec

48、ast$fittedTime Series:Start = 2000 End = 2013 Frequency = 1 xhat level2000 433360.0 433360.02001 479695.8 479695.82002 540072.2 540072.22003 613157.6 613157.62004 650117.3 650117.32005 793513.3 793513.32006 892673.3 892673.32007 1027964.6 1027964.62008 1235364.2 1235364.22009 1279790.9 1279790.92010

49、 1516037.9 1516037.92011 1777330.7 1777330.72012 1625600.1 1625600.12013 1747610.3 1747610.3 qysdsforecast$fittedTime Series:Start = 2000 End = 2013 Frequency = 1 xhat level2000 277375.0 277375.02001 309762.5 309762.52002 483413.0 483413.02003 236427.4 236427.42004 268358.5 268358.52005 326553.3 326

50、553.32006 373394.8 373394.82007 455816.2 455816.22008 596686.5 596686.52009 756404.6 756404.62010 732283.1 732283.12011 935238.6 935238.62012 1061588.2 1061588.22013 1075044.4 1075044.4泰迪杯大学生数据挖掘竞赛论文报告第19 页,共 31 页 fcsforecast$fittedTime Series:Start = 2000 End = 2013 Frequency = 1 xhat level2000 775

51、62.00 77562.002001 90775.11 90775.112002 109138.77 109138.772003 134059.32 134059.322004 146222.18 146222.182005 168902.47 168902.472006 200218.89 200218.892007 239282.37 239282.372008 262051.47 262051.472009 305840.06 305840.062010 349613.06 349613.062011 416959.47 416959.472012 512650.57 512650.57

52、2013 612247.30 612247.30 yhsforecast$fittedTime Series:Start = 2000 End = 2013 Frequency = 1 xhat level2000 21159.00 21159.002001 28123.44 28123.442002 30105.84 30105.842003 35560.56 35560.562004 42489.45 42489.452005 67622.99 67622.992006 64862.22 64862.222007 80911.72 80911.722008 110673.63 110673

53、.632009 132518.26 132518.262010 154362.26 154362.262011 194580.79 194580.792012 211022.69 211022.692013 219622.31 219622.31 ggczsrforecast$fittedTime Series:Start = 2000 End = 2013 泰迪杯大学生数据挖掘竞赛论文报告第20 页,共 31 页Frequency = 1 xhat level2000 17614992005442 20054422002 2461907 24619072003 24

54、58737 24587372004 2747686 27476862005 3028671 30286712006 3712582 37125822007 4270790 42707902008 5237790 52377902009 6132128 61321282010 7026461 70264612011 8726344 87263442012 9794689 97946892013 11023870 110238705.观测值和拟合值图 par(cex=0.7) plot(fujian,2,type=o,xlab=时间,ylab=地方财政收入合计) lines(fujian,1-1,

55、dfczsrhjforecast$fitted,1,type=o,lty=2,col=blue) legend(x=topleft,legend=c(观测值,拟合值),lty=1:3,cex=0.8) plot(fujian,3,type=o,xlab=时间,ylab=增值税) lines(fujian,1-1,zzsforecast$fitted,1,type=o,lty=2,col=blue) legend(x=topleft,legend=c(观测值,拟合值),lty=1:3,cex=0.8) plot(fujian,4,type=o,xlab=时间,ylab=营业税) lines(fu

56、jian,1-1,yysforecast$fitted,1,type=o,lty=2,col=blue) legend(x=topleft,legend=c(观测值,拟合值),lty=1:3,cex=0.8) plot(fujian,5,type=o,xlab=时间,ylab=企业所得税) lines(fujian,1-1,qysdsforecast$fitted,1,type=o,lty=2,col=blue) legend(x=topleft,legend=c(观测值,拟合值),lty=1:3,cex=0.8) plot(fujian,6,type=o,xlab=时间,ylab=房产税)

57、lines(fujian,1-1,fcsforecast$fitted,1,type=o,lty=2,col=blue) legend(x=topleft,legend=c(观测值,拟合值),lty=1:3,cex=0.8) plot(fujian,7,type=o,xlab=时间,ylab=印花税) lines(fujian,1-1,yhsforecast$fitted,1,type=o,lty=2,col=blue) legend(x=topleft,legend=c(观测值,拟合值),lty=1:3,cex=0.8) plot(fujian,8,type=o,xlab=时间,ylab=公

58、共财政收入) lines(fujian,1-1,ggczsrforecast$fitted,1,type=o,lty=2,col=blue) legend(x=topleft,legend=c(观测值,拟合值),lty=1:3,cex=0.8)6.获得 2014 年和 2015 年的的各预测值 library(forecast)泰迪杯大学生数据挖掘竞赛论文报告第21 页,共 31 页 dfczsrhjforecast1=forecast.HoltWinters(dfczsrhjforecast,h=2) dfczsrhjforecast1 Point Forecast Lo 80 Hi 80

59、Lo 95 Hi 952014 20880968 18860732 22901204 17791284 239706522015 20880968 18024037 23737899 16511669 25250267 zzsforecast1=forecast.HoltWinters(zzsforecast,h=2) zzsforecast1 Point Forecast Lo 80 Hi 80 Lo 95 Hi 952014 2215998 2050501 2381495 1962893 24691042015 2215998 1981955 2450041 1858060 2573936

60、 yysforecast1=forecast.HoltWinters(yysforecast,h=2) yysforecast1 Point Forecast Lo 80 Hi 80 Lo 95 Hi 952014 1623526 1471717 1775335 13913541623526 1408840 1838212 1295192 1951859 qysdsforecast1=forecast.HoltWinters(qysdsforecast,h=2) qysdsforecast1 Point Forecast Lo 80 Hi 80 Lo 95 Hi 95

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论