数学建模案例分析_第1页
数学建模案例分析_第2页
数学建模案例分析_第3页
数学建模案例分析_第4页
数学建模案例分析_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Statistics建模大赛案例分析9:02我国经济增长与经济结构、财政收入、居民收入关系之研究Topic9:02我国经济增长与经济结构、财政收入居民收入关系之研究赛题要求论证经济增长、经济结构、与财政收入、居民收入的匹配度.分析经济增长、财政收入、经济结构、与居民收入之间关系变动的数量特征和趋势.探讨影响居民收入的各种因素论证所建模型的适用条件、合理性、和可靠性根据所建模型,对2010年我国经济增长、经济结构、居民收入、财政收入进行区间预测在建模过程中,讨论近两年金融危机和宏观调控对经济增长、经济结构、财政收入、居民收入之间关系变动的影响.提出相应结论和观点9:02案例研究思路经济增长预测模

2、型Party1:问题提出和研究现状Part 2:定性分析及匹定性分析及匹配度分析配度分析Part 5:结论Part3:经济增长模型的建立和检验Part 4:9:02Part One引言引言9:02问题的提出和研究现状.如何对敏感数据的匹配性进行定量分析,科学解释数据之间的匹配关系,如何正确预测重要指标的发展趋势9:02Part Two基本统计分析基本统计分析9:02一、定性分析l 定性分析思路对命题中四个经济指标的发展现状做描述性分析。l 统计方法统计图、统计表。9:02-0.4-0.200.20.40.60.00100,000.00200,000.00300,000.00400,000.00

3、第一产业第二产业第三产业GDP名义增长率总体经济发展经济增长和经济结构变动分析9:02主要影响指标变动分析财政收入 、居民收入0.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%1996199719981999200020012002200320042005200620072008GDP名义增长率财政收入增长率城镇人均可支配收入增长率农村居民纯收入增长率9:02区域经济发展分析东、中、西部199519952000200020082008东部东部中部中部西部西部东部东部中部中部西部西部东部东部中部中部西部西部GDPGDP比重比重49.0 49.0 37.6 37.6 52

4、.8 52.8 52.8 52.8 33.6 33.6 13.6 13.6 58.2 58.2 27.4 27.4 14.4 14.4 财政收入占比财政收入占比5.3 5.3 4.9 4.9 5.5 5.5 7.1 7.1 5.6 5.6 6.6 6.6 9.8 9.8 6.9 6.9 9.2 9.2 城镇居民收入占比城镇居民收入占比1.8 1.8 1.6 1.6 1.0 1.0 1.4 1.4 1.2 1.2 1.0 1.0 1.6 1.6 1.3 1.3 1.0 1.0 农村居民收入占比农村居民收入占比2.62.62.02.01.01.02.32.31.81.81.01.02.22.21.

5、71.71.01.0第三产业比重第三产业比重35.4 35.4 31.7 31.7 33.3 33.3 41.7 41.7 37.3 37.3 40.0 40.0 41.7 41.7 34.6 34.6 36.7 36.7 9:02二、匹配度分析l 匹配度分析研究GDP与其他经济指标发展的匹配关系。l 统计方法匹配度的定量计算方法和相关标准参考:9:02匹配度的计算步骤:GDP与产业结构匹配度建模思想:利用距离测算我国实际数据与匹配条件下标准数据之间的差异性。9:02匹配度的计算步骤:GDP与产业结构匹配度建模步骤:l 参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:人均人均GD

6、P(美元)(美元)20030040060010002000第一产业比重3630.426.721.818.616.3第二产业比重19.623.125.52931.433.2第三产业比重44.446.547.849.25050.59:02匹配度的计算步骤:GDP与产业结构匹配度建模步骤:l 参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:人均人均GDP(美元)(美元)20030040060010002000第一产业比重3630.426.721.818.616.3第二产业比重19.623.125.52931.433.2第三产业比重44.446.547.849.25050.59:02匹配

7、度的计算步骤:GDP与产业结构匹配度建模步骤:l 参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:32.6ln31.6yx18.6ln79.37yx 26.0ln11.0yx010203040506005001000150020002500第一产业比重 第二产业比重 第三产业比重 9:02匹配度的计算步骤:l 参阅国际匹配标准,拟合与我国GDP水平相匹配的产业结构标准值:GDP与产业结构匹配度建模步骤:标准值标准值实际值实际值年度人均GDP(美元)一产业二产业三产业一产业二产业三产业200726750.11510.36360.52130.1290.476 0.3959:02匹配度

8、的计算步骤:l 计算标准值和实际值之间的欧式距离,并归一化为(0,1)GDP与产业结构匹配度建模步骤:三维空间两点三维空间两点a(x1,y1,z1)与与b(x2,y2,z2)间的欧氏距离:间的欧氏距离: 该距离的值域范围为0到29:02匹配度的计算步骤:l 计算标准值和实际值之间的欧式距离,并归一化为(0,1)GDP与产业结构匹配度建模步骤:标准值标准值实际值实际值年度人均GDP(美元)一产业二产业三产业一产业二产业三产业200726750.11510.36360.52130.1290.476 0.395222(0.1151 0.129)(0.36360.476)(0.52130.395) /

9、 20.1199559:02匹配度的计算步骤:GDP与居民收入、财政收入匹配度建模思想:设匹配度量化取值为(0,1),当相关指标占GDP的比例达到理想标准时,匹配度为0;但相关指标占GDP比例为0时,匹配度为1;并设匹配度随指标比例在(0,1)上非线性变动(二次函数曲线 )。2()yaxb9:02匹配度的计算步骤:GDP与居民收入、财政收入匹配度建模步骤:以收入为例查阅文献得到居民收入的理想值为占GDP总量59.5%,得到二点: (0,1) 、(0.595,0)拟合曲线得方程组221(0)0(0.595)abab 22.82466 (0.595)yx2008年城镇居民收入占比为0.263183

10、,带入得到匹配度为0.3110349:02三、灰色关联分析l 目的研究GDP与其他经济指标间的关联紧密程度。l 统计方法灰色关联系数9:02灰色关联系数的计算步骤l 数据规范化剔除量纲影响原始数据:处理后数据:(1),(2),( )iiiixxxx n(1)(2)( )(,)(1)(1)(1)iiiiiiixxx nyxxx9:02灰色关联系数的计算步骤l 计算各时刻关联系数参考数列:比较数列:0000(1),(2),( )yyyyn(1),(2),( )iiiiyyyy n1,2,im0(1)(1)iyy0(2)(2)iyy0( )( )iy ny n0maxmax( )( )iiky ky

11、 k0minmin( )( )iiky ky k序列差:9:02灰色关联系数的计算步骤l 计算各时刻关联系数 0000minminmaxmax( )maxmaxiiiiiy ky ky ky kky ky ky ky k 9:02灰色关联系数的计算步骤l 计算关联度1( )niiirk9:02灰色关联系数的计算步骤案例计算结果:以GDP为参考序列:城镇收入农村收入三产比重财政收入二产比重以财政收入为参考序列:GDP城镇收入农村收入三产比重二产比重9:02灰色关联系数的计算步骤案例计算结果:以城镇收入为参考序列:农村收入GDP三产比重二产比重财政收入以农村收入为参考序列:城镇收入三产比重GDP二

12、产比重财政收入9:02Part Three经济增长模型的建立和检验经济增长模型的建立和检验9:02一、模型构建目标及变量选择l目标研究各经济指标对经济增长的影响。l 变量选择被解释变量:GDP解释变量:财政收入、农村居民人均纯收入、城镇居民人均可支配收入、经济结构9:02二、模型构建方法l模型一:GDP和收入偏最小二乘回归(Partial Least-Squares Regression)。l 模型二:经济增长和产业结构模型多元回归9:02偏最小二乘(PLS)原理介绍u多元线性回归的困惑:l样本容量要求很高: 一般应大于30,或大于自变量个数的5-10倍l当出现严重的多重共线性问题时9:02偏

13、最小二乘(PLS)原理介绍u常用解决方法:l逐步回归l主成份回归l岭回归 在克服多重共线对系统回归建模干扰的努力中,1983年,S.Wold和C.Abalno提出了偏最小二乘分析。9:02偏最小二乘(PLS)原理介绍u偏最小二乘的特点:l可用于多变量对多变量建模l能在多重共线情况下进行建模l允许样本量小于自变量个数情形下的建模l最终模型包含所有变量,易于解释和辨识系统信息9:02偏最小二乘(PLS)原理介绍u建模原理:偏最小二乘=主成份分析+典型相关+多元回归9:02偏最小二乘(PLS)原理介绍u知识链接主成份分析:主成份分析:就是用少数的几个综合指标来代表原来的多项指标,而且几个综合指标之间

14、是独立的。12pxxx111 11221221 122221 122ppppppppppya xa xa xya xa xaxya xaxa x第一主成份第二主成份 . (各成分间独立,且按包含原指标信息量排队)9:02偏最小二乘(PLS)原理介绍u知识链接典型相关分析:典型相关分析:找到两组变量间联系,通过一组变量的线性组合与另一组变量线性组合的关联关系来体现。12pxxx12qyyy第一对典型变量1U2UKU1V2VKV11 11221ppa xa xa x21 12222ppa xa xax1 122pppppa xaxa x2112222qqb yb yb y1111221qqb yb

15、 yb y2112222qqb yb yb y 第二对典型变量 第K对典型变量9:02偏最小二乘(PLS)原理介绍uPLS建模原理:自变量集:因变量集:12( ,)px xx12(,)qy yy建模步骤:l 在自变量集中提取第一主成份 ,同时在因变量集中也提取第一主成份 ,要求 和 相关程度达到最大;然后建立因变量与 的回归,并判断精度;1t1u1u12,qy yy1t1t9:02偏最小二乘(PLS)原理介绍uPLS建模原理:自变量集:因变量集:12( ,)px xx12(,)qy yyl继续提取第二对主成份,获得 和 ,建立因变量 和 的回归,判断精度,如不满足继续提取。 2t2u12,qy

16、 yy1t2t9:02偏最小二乘(PLS)原理介绍uPLS建模原理:自变量集:因变量集:12( ,)px xx12(,)qy yyl若最终提取r个主成份 , 偏最小二乘将通过建立 与 的回归式,然后再表示为 与原自变量的回归方程式,即最终结果。 12, ,rt tt12,qy yy12, ,rt tt12,qy yy主成份 个数的选择方法交叉有效性检验 9:02偏最小二乘(PLS)原理介绍u交叉有效性检验 :留一交叉验证2( )( )( )iji jjiPRESS hyyh越小越好221( )/(1)(1 0.95)0.0975hQPRESS hSS h (1)SS h 为所有样本拟合h-1各

17、成分时的回归误差平方和9:02偏最小二乘(PLS)原理介绍u回归系数显著性检验t检验jackknife方差估计:211()()njiinVarni为去掉第i各样本后回归所得系数估计值9:02偏最小二乘(PLS)的实现uR中的PLS包的加载将PLS下载到指定目标,运行R程序,并加载PLS包。(注意:无需解压) library(pls)#载入程辑包:pls9:02偏最小二乘(PLS)的实现uPLS在R中实现代码Step1Step1:导入数据,并进行数据的标准化:导入数据,并进行数据的标准化#inde.txt 自变量 de.txt 解释变量,数据事先存储于F盘x-read.table(file=f:

18、data1/inde.txt,header=TRUE) #读入自变量数据;y-read.table(file=f:data1/de.txt,header=TRUE) #读入因变量数据; normy-scale(y) #数据标准化normx-scale(x) #数据标准化normy #显示数据normx #显示数据9:02进行进行plspls回归,并进行交叉验证,选择成分数回归,并进行交叉验证,选择成分数偏最小二乘(PLS)的实现uPLS在R中实现代码Step2Step2:进行:进行plspls回归,并进行交叉验证,选择成分数回归,并进行交叉验证,选择成分数pls1-plsr(normynorm

19、x,validation=LOO,jackknife=TRUE)#进行PLS估计summary(pls1) #显示回归结果(包括PRESS,与解释变异度)其中,validation=“LOO”表示使用留一交叉验证计算PRESS,jackknife=TRUE表示使用jackknife方法计算回归系数方差,(为做回归系数显著性检验);没给定主成份个数,默认使用所有成分回归,以备选择。 validationplot(pls1)#函数 validationplot()显示不同成分数下留一交叉验证的预测误差平方根 9:02偏最小二乘(PLS)的实现uPLS在R中实现代码Step3Step3:根据选择成分

20、数,重新建立模型:根据选择成分数,重新建立模型pls2 library(e1071)#载入程辑包:e10719:02二、支持向量回归R语言实现9:02#数据预处理后提前存储于F盘下四个文本文档中:try.txt 训练集数据test.txt 检测集数据9:02二、支持向量回归R语言实现9:02Step1Step1:导入数据:导入数据try-read.table(file=“f:data2/try.txt”,header=TRUE) #读入训练集数据;test-read.table(file=“f:data2/test.txt”,header=TRUE) #读入 检测集数据;try-as.matr

21、ix(try) # 数据转换矩阵形式test-as.matrix(test) # 数据转换矩阵形式9:02二、支持向量回归R语言实现9:02Step2Step2:采用几种常见核函数建模并比较:采用几种常见核函数建模并比较svm1-svm(y.,try,kernel=linear) #使用线性核函数建模;svm2-svm(y.,try,kernel=sigmoid) #使用sigmoid核函数建模; svm3-svm(y.,try,kernel=radial)#使用高斯核函数建模; svm4-svm(y.,try,kernel=polynomial) #使用多项式核函数建模;fy1-predict(svm1,test)fy2-predict(svm2,test) fy3-predict(svm3,test)fy4-predict(svm4,test)9:02二、支持向量回归R语言实现9:02Step2St

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论