Lasso回归模型区域可持续发展_第1页
Lasso回归模型区域可持续发展_第2页
Lasso回归模型区域可持续发展_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Lasso回归模型区域可持续发展以四川省为例,构建区域社会经济可持续发展模型。首先采用PCA方法计算近15年四川省的可持续发展水平;再根据可持续发展水平指标体系获取27个指标数据,通过相关性分析、交叉验证递归特征消除与Lasso回归相结合的方法进行特征筛选;最后采用Lasso回归构建可持续发展模型,结果表明:模型训练集精度达到99.74%,结构风险较小,加入的L1正则化增强了模型的泛化能力;构建的模型能够较好地应用到中短期区域社会经济可持续发展水平的预测,对于区域可持续发展的研究具有一定的应用价值。关键词PCA;区域可持续发展水平;递归特征消除;Lasso回归区域可持续发展是全球面临的中心问题

2、之一,区域社会经济可持续发展水平直接影响了可持续发展战略的实施。本文以四川省为研究区域,利用主成分分析法、Lasso回归等算法构建和优化经济社会可持续发展模型,时间跨度为2004年到2018年共计15年,社会发展、资源和环境发展数据来自国家统计局、四川省统计局等多家单位。1指标体系构建可持续发展的评估通常基于可持续发展指标(SDI)4。与可持续发展相关的评估方法和指标选择模型有所不同,一个关键问题是指标数据的可用性以及可用统计信息中的不确定性1。根据文献5的总结分析,可持续发展指标始终包括三类指标,即经济发展,社会发展,资源和环境发展,故本文主要参考文献6构建相应的指标体系见表1。2区域可持续

3、发展水平计算采用主成分分析法(PCA)计算四川省的区域可持续发展水平。为了消除量纲和方向性,首先对于正向型指标(值越大越好)按照公式1进行规范化处理,对于负向型指标(越小越好)按照公式2进行规范化处理2之后按照公式3将其转换为服从均值为0、标准差为1分布的数据。根据27个指标数据间的相关系数,可以进一步计算出相关系矩阵的特征值与主成分的贡献率、累积贡献率;然后按照选择的新指标个数累积能代表原指标信息的90以上为止;原则,提取主成分;最后构造综合得分函数,并求出四川省2004-2018年的得分。计算出的得分即为当年的可持续发展水平,输出结果如下。3特征筛选基于搜集到的数据具有不同的量纲,为了使不

4、同量纲的量也能进行比较以及满足回归模型构建的需要,且不改变因子数据的分布,采用最大最小平移方法对数据进行无量纲化处理,将数据压缩在0,1区间上。显然所有的都在区间上,同时也消除了量纲的影响。首先基于相关性分析结果初步筛除与可持续发展水平相关性弱的指标。进行相关性分析可以发现,除了城市人口密度、客运量和人均水资源共三个指标的相关系数小于0.6,剩余24个指标均与区域可持续发展水平高度显著相关。其中人均水资源指标与可持续发展水平的相关系数仅为0.262、p值为0.345,相关性很弱,而城市人口密度、客运量与可持续发展水平的相关系数分别为0.552和-0.56,相关性不高;根据相关系数矩阵可以得到关

5、于指标间的相关性热力图,据图可以很清晰地看出,城市人口密度(X13)、客运量(X15)和人均水资源(X24)对可持续发展水平的影响很弱。进一步对初筛后指标数据采用具有交叉验证的递归特征消除(RFECV)确定影响因素个数,并基于确定的影响因素个数采用Lasso回归方法识别影响可持续发展水平的关键因素。其中通过RFECV算法可以得到最佳特征个数为12个,进一步得到Lasso回归识别结果见图2,从图中可以确定反映区域经济发展的第一生产总值、反映社会发展的民事专利申请和授权、反映资源环境状况的废水总量等12个指标为关键影响因素。4模型建立及结果分析将得到的关键指标作为本文的建模因子,然后探讨因子数据与可持续发展水平间的线性关系。通过12个因子数据与可持续发展水平间的散点图可以看出,各个因子数据与可持续发展水平均存在很强的线性关系,且影响方向基本统一,故适合建立线性回归模型;其次由前面的相关性分析可以发现,因子数据间也存在线性关系,即存在共线性问题。由前文分析,简单的线性回归无法完成此时模型的构建,故为了防止过拟合问题,增加模型的泛化能力,考虑采用正则化则方法。所以本文采用Lasso回归来构建可持续发展模型3。经过调参优化与模型求解,可以得到可持续发展模型如下:经计算,该模型输出的训练集精度达到了99.74%,结构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论