国土空间变化监测分析与系统实现_第1页
国土空间变化监测分析与系统实现_第2页
国土空间变化监测分析与系统实现_第3页
国土空间变化监测分析与系统实现_第4页
国土空间变化监测分析与系统实现_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、国土空间变化监测分析与系统实现摘要土地利用的变化是近些年比较热门的研究方向。在大力发展建设的过程中因城 市盲目扩张易造成资源浪费、土地闲置、建设重复、制度与实际不相协调等问题。 为了建设高质量的城市,需要对土地的发展规律有所理解。对于土地利用发展变 化问题的研究主要集中在构建高可用的模型,深入地挖掘土地发展的特征,以实 现在宏观规划方面的有效调控,实现土地利用的协调、健康和可持续地发展。从 土地利用变化的研究来看,主流的方法是基于元胞自动机模型,依据不同的方式 来构造土地利用转化模型来对土地利用变化进行模拟。本文以成都市11个市辖区为研究区域,在多个角度对土地利用的变化情况做 了分析。分析土地

2、利用变化的驱动因子并在此基础上构建了 GCForest-CA模型, 对研究区未来5年后的变化做了预测。依据上述研究设计并实现了国土空间变化 分析系统。本文的研究主要包括以下几个方面:(1)提取研究区范围2008年、2013年 和2018年三年卫星数据,通过解译后,获得三期土地利用分类图,对土地在数量、 空间分布、形态、与人口和经济发展的协调性等方面做了分析。(2)从自然地理、 区位因素、人文因素、政策因素等多个角度,选取包括高程、坡度、坡向、河流、 多级道路、铁路、地铁、两级站点、人口密度、总体规划等多个驱动因素,并对 驱动因素与土地类型变化情况做了逻辑回归分析。(3)基于上述研究,构建了 G

3、CForest-CA模型,利用该模型对2023年土地变化情况进行了预测分析。本文的研究结论主要如下:(1)研究区处于持续发展中,建设用地面积在不 断地增长,主要往北部扩展,在形态上不断地朝着分散的形势在发展,紧凑程度 不断下降,呈现非均衡地向外扩张的趋势,其发展模式有一定的盲目性。(2) 土 地利用的变化在5年时间间隔内其发展变化的规律具有连续稳定的特性。(3) GCForest-CA模型对土地利用的预测总体精度达84%,总体的Kappa系数为0.8。(4)在2023年,城镇用地会进一步增长,增速保持稳定,水域和林地基本保持 不变,农用地面积会减少。城镇的集约程度会进一步下降,城市边界复杂度会

4、上 升。非均衡扩张趋势加大,城市发展盲目程度有所上升。关键词:土地利用变化,元胞自动机,GCForest-CA,国土空间变化分析系统,成 都市市辖区ABSTRACTThe change of land use is a relatively popular research direction in recent years. In the process of vigorous development and construction, the blind expansion of the city will result in waste of resources, idle land,

5、duplication of construction, and inconsistency between the system and the reality. In order to build a high-quality city, it is necessary to grasp the law of urban development. The research on this problem mainly focuses on building high-availability models, and deeply exploring the characteristics

6、of urban development, in order to better understand the process and mechanism of urbanization, thereby realizing effective regulation in macro-planning and realizing land. Coordinated, healthy and sustainable development. From the study of land use change, the mainstream method is based on the model

7、 of cellular automata, and the land use transfbmiation model is constructed according to different ways to achieve the simulation of land use change.This thesis takes the Chengdu city center circle (including 11 municipal districts) as the research area, analyzes the changes of land use from multipl

8、e angles, analyzes the driving factors of land use change, and builds the GCForest-CA model to forecast for changes in the study area over the next five years.The research in this thesis mainly includes the following aspects: (1) Collected three years of satellite data in the study area in 2008, 201

9、3 and 2018, and after interpretation, obtained the three-stage land use classification map for the land and analyzed the changes of land in area, spatial distribution, geographical shape and coordination with population and economic development. (2) From the perspectives of natural geography, locati

10、on factors, human factors, policy factors, Multiple drivers factors, including elevation, slope, aspect, river, multi-level roads, railways, subways, two-level sites, population density, overall planning, are selected. Logical regression analysis was carried out on the driving factors and land type

11、changes. (3) Based on the above research, the GCForest-CA model was constructed, and the model was used to predict and analyze the land change in 2023.The conclusions of this thesis are as follows: ( 1 ) The circle of Chengdu city center is developing continuously and despersedly, the construction l

12、and area is continuously increasing, mainly expanding to the north, and the compactness is continuously decreasing. The expansion of urban is unbalanced and blind. (2 ) The change of land use has a continuous and stable nature in the development and change of the five-year interval. (3) The overall

13、accuracy of the GCForest-CA model for land use prediction is 84%, and the overall Kappa coefficient is 0.8. (4) In 2023, urban land use will further increase, the growth rate will remain stable and waters and forest land will remain unchanged, and the area of agricultural land will decrease. The deg

14、ree of intensification of cities and towns will farther decline, and the complexity of urban boundaries will increase. The trend of non-equilibrium expansion has increased, and the degree of blindness in urban development will be increased.Keywords: Land Use, CA, GCForest-CA, Land Spatial Change Ana

15、lysis System, Chengdu Municipal District TOC o 1-5 h z HYPERLINK l bookmark31 o Current Document h 第一章绪论1 HYPERLINK l bookmark34 o Current Document h 1.1研究工作的背景与意义1 HYPERLINK l bookmark37 o Current Document h 1.2国内外研究历史与现状2 HYPERLINK l bookmark40 o Current Document h 1.3本文的研究内容与创新点3 HYPERLINK l book

16、mark49 o Current Document h 1.4研究方法和技术路线3 HYPERLINK l bookmark52 o Current Document h 1.4.1研究方法3 HYPERLINK l bookmark58 o Current Document h 1.4.2技术路线4 HYPERLINK l bookmark61 o Current Document h 1.5本论文的结构安排5 HYPERLINK l bookmark64 o Current Document h 第二章相关基础理论介绍6 HYPERLINK l bookmark67 o Current D

17、ocument h 2.1元胞自动机6 HYPERLINK l bookmark70 o Current Document h 2.1.1元胞自动机的基本概念6 HYPERLINK l bookmark73 o Current Document h 2.1.2元胞自动机的结构6 HYPERLINK l bookmark82 o Current Document h 2.2多粒度级联森林算法9 HYPERLINK l bookmark85 o Current Document h 2.2.1级联森林9 HYPERLINK l bookmark88 o Current Document h 2.2

18、.2多粒度扫描10 HYPERLINK l bookmark94 o Current Document h 2.2.3整体结构11 HYPERLINK l bookmark97 o Current Document h LOGISTIC 回归分析12 HYPERLINK l bookmark101 o Current Document h Logistic回归的基本原理12 HYPERLINK l bookmark105 o Current Document h ROC 曲线12 HYPERLINK l bookmark109 o Current Document h 2.4遥感图像处理13

19、HYPERLINK l bookmark112 o Current Document h 2.4.1遥感图像预处理13 HYPERLINK l bookmark119 o Current Document h 2.4.2遥感图像分类14目视解译14监督分类14非监督分类14 HYPERLINK l bookmark122 o Current Document h 第三章研究区概述及数据处理15 HYPERLINK l bookmark125 o Current Document h 3.1研究区域概述15 HYPERLINK l bookmark128 o Current Document h

20、 3.2遥感图像分类处理16 HYPERLINK l bookmark131 o Current Document h 3.2.1遥感数据源概述16 HYPERLINK l bookmark134 o Current Document h 土地利用类别划分163.2.3遥感图像分类16 HYPERLINK l bookmark138 o Current Document h POI数据收集处理18 HYPERLINK l bookmark142 o Current Document h 3.4夜间灯光数据处理19 HYPERLINK l bookmark147 o Current Docume

21、nt h 3.5本章小结2 1 HYPERLINK l bookmark150 o Current Document h 第四章土地利用扩展变化分析23 HYPERLINK l bookmark153 o Current Document h 4.1概述23 HYPERLINK l bookmark156 o Current Document h 4.2人口、经济发展分析23 HYPERLINK l bookmark159 o Current Document h 4.2.1人口增长情况23 HYPERLINK l bookmark162 o Current Document h 4.2.2经

22、济增长情况23 HYPERLINK l bookmark165 o Current Document h 土地增长情况分析2 4 HYPERLINK l bookmark169 o Current Document h 土地类型分布情况24 HYPERLINK l bookmark172 o Current Document h 土地利用转移矩阵25 HYPERLINK l bookmark186 o Current Document h 土地增长幅度与速度分析27 HYPERLINK l bookmark190 o Current Document h 4.3.4城镇用地的空间形态分析29

23、HYPERLINK l bookmark193 o Current Document h 土地空间变化情况分析31 HYPERLINK l bookmark196 o Current Document h 土地空间扩展弹性分析32 HYPERLINK l bookmark199 o Current Document h 4.4本章小结33 HYPERLINK l bookmark202 o Current Document h 第五章 融合GCFOREST和CA模型的土地利用变化分析3 4 HYPERLINK l bookmark205 o Current Document h 5.1模型简介

24、34 HYPERLINK l bookmark208 o Current Document h 5.2影响因子分析34 HYPERLINK l bookmark211 o Current Document h 5.2.1地理因素35高程35坡度35坡向36 HYPERLINK l bookmark217 o Current Document h 5.2.2区位因素37到行政中心的距离37到河流的距离375.223到道路的距离38到地铁站点的距离40到公交站点距离41到大型商业点的距离42到铁路的距离43 HYPERLINK l bookmark223 o Current Document h

25、5.2.3人文因素44 HYPERLINK l bookmark226 o Current Document h 5.2.4驱动因子回归分析45 HYPERLINK l bookmark233 o Current Document h 5.3约束性条件46 HYPERLINK l bookmark236 o Current Document h 5.4模型训练47 HYPERLINK l bookmark239 o Current Document h 5.4.1类别不均衡处理47SMOTE 算法47数据处理47 HYPERLINK l bookmark246 o Current Docume

26、nt h GCForest-CA模型训练及校正48GCForest 模型训练48GCForest-CA 模型校正49 HYPERLINK l bookmark264 o Current Document h 土地利用转化结果验证50数值验证505.432空间验证51 HYPERLINK l bookmark268 o Current Document h 5.4.5 土地利用预测与分析52土地利用变化预测52土地面积变化分析55城镇空间形态变化分析56城镇各方向增长变化分析57 HYPERLINK l bookmark274 o Current Document h 5.5本章小结58 HYP

27、ERLINK l bookmark277 o Current Document h 第六章国土空间变化分析系统设计59 HYPERLINK l bookmark280 o Current Document h 6.1系统概述59 HYPERLINK l bookmark283 o Current Document h 6.1.1需求分析59 HYPERLINK l bookmark286 o Current Document h 6.1.2系统软件架构和开发环境60 HYPERLINK l bookmark289 o Current Document h 6.2系统设计60 HYPERLINK

28、 l bookmark292 o Current Document h 6.2.1系统设计目标60 HYPERLINK l bookmark300 o Current Document h 6.2.2系统设计架构60 HYPERLINK l bookmark303 o Current Document h 6.3系统功能模块设计61 HYPERLINK l bookmark311 o Current Document h 6.3.1基本地图操作63 HYPERLINK l bookmark314 o Current Document h 6.3.2统计分析63 HYPERLINK l book

29、mark317 o Current Document h 6.3.3指标计算65 HYPERLINK l bookmark320 o Current Document h 6.3.4专题地图66 HYPERLINK l bookmark325 o Current Document h 6.3.5预测分析68 HYPERLINK l bookmark329 o Current Document h 6.4系统测试70 HYPERLINK l bookmark332 o Current Document h 6.4.1测试环境70 HYPERLINK l bookmark337 o Current

30、 Document h 6.4.2功能测试71 HYPERLINK l bookmark345 o Current Document h 6.5.3性能测试74 HYPERLINK l bookmark348 o Current Document h 6.5本章小结7 4 HYPERLINK l bookmark351 o Current Document h 第七章总结及工作展望75 HYPERLINK l bookmark354 o Current Document h 7.1总结75 HYPERLINK l bookmark362 o Current Document h 7.2工作展望

31、76 HYPERLINK l bookmark368 o Current Document h 致谢77 HYPERLINK l bookmark371 o Current Document h 参考文献7 8攻读硕士学位期间取得的成果8 2发表的学术论文82 HYPERLINK l bookmark445 o Current Document h 参与的科研项目82缩略词表GCForestmulti-Grained Cascade Forest多粒度级联森林CACellular Automata元胞自动机ROCReceiver Operating Characteristic接受者操作特性曲

32、线POIPoint Of Interest兴趣点SMOTESynthetic Minority OversamplingTechnique合成少数类过采样技术MASMulti-Agent System多智能体DNDigital Number数字量化值JSONJavaScript Object NotationJS对象简谱POIPoint Of Interest兴趣点AUCArea Under Curve曲线下面积TPRTrue Positive Rate真正例率FPRFalse Positive Rate假正例率IGBPInternational Geosphere BiosphereProg

33、ramme国际地圈与生物圈计划IHDPInternational Human DimensionProgramme on Global EnvironmentalChange全球环境变化的人文领 域计划LUCCLand-Use and Land-Cover Change土地利用/ 土地覆盖缩略词中文涵义英文全称第一章绪论1.1研究工作的背景与意义人类的一切生产生活都基于土地这一载体。人类的活动对国土空间的变化有 直接的影响,其中,对城市土地利用的范围、分布、格局影响最为直接和剧烈。 对农用地、林地等的影响则通过所在地域的生物整体影响生物的多样性和土地表 面植被的覆盖情况以及土地的面积等。随着国

34、家经济的不断向前发展,城市化进 程的逐步稳固推进,越来越多的乡镇人口开始向城市聚集、转化,继而带来更多 的问题,人类活动不断地影响着全球的水环境、资源分布、生物的分布以及其他 种类的环境质量,不断地危及陆地生态系统的承载能力和适应能力。而在城镇发 展中,由于存在规划考虑不全面,土地制度本身不适应实际情况和土地功能安排 符合实际内在规律等原因1,造成城市化的质量不高,存在土地资源没有得到合理 有效地使用的情况,城市空间扩展粗暴而盲目、建设存在重复、土地闲置严重等 严重问题2】。国际地圈与生物圈计划(International Geosphere Biosphere Programme, IGBP

35、 )和“全球环境变化的人文领域计划(International Human Dimension Programme on Global Environmental Change, IHDP)在二十世纪 90 年代联合提出 “土地利用/土地覆盖(Land-Use and Land-Cover Change, LUCC)研究计划, 全球学者开始关注土地利用/土地覆盖的研究3。该项目主要提出如下几个研究方 向:(1)基于对研究区域土地利用的转化规律的理解,依照经验构建区域土地利 用转变模型。(2)通过对土地利用变化的结果的直接观察来进行模型的研究工作。(3)在上两步的基础上,建立全球区域的模型研究来

36、预测土地利用转化情况。成都市是西部的特大城市,是重要的高新技术产业基地,重要的物流中心和 交通枢纽中心,尤其在近些年在政策的影响下,成都市发展进程进一步加快。在 快速的发展期,城镇的发展模式和发展水平会在很长一段时间内影响未来城市居 民的生产生活,也会对未来农业、林地等其他类型土地的变化产生深远的影响。 因此,有必要在建设变化剧烈的阶段对城市的发展模式有深入的了解,在深入地 研究人类活动对土地利用/土地覆盖的影响下,可以更好的预测土地的变化,进而 一定程度上地预测与评估未来环境变化,在此基础上,可以有效地进行人工修正 和干预。1.2国内外研究历史与现状LUUC于1995年被提出以来引起了国内外

37、学者的广泛关注,成为热点研究问 题之一。土地利用变化的过程非常复杂,其驱动因素包含自然地理因素、区位因 素、政策法规和人文因素等多方向、多维度因素。对土地利用转变的过程模拟大 多采用元胞自动机来实现。元胞自动机(Cellular Automata, CA)是一种离散的动力学模型,其“自下而 上”的思路、并行计算的特点适合土地利用转化模拟这种复杂情况,可以有效地 模拟城市土地利用的转化规律,其本身不是一套具体的方法而是概念模型。20世纪40年代末,元胞自动机的概念被提出,20世纪60年代末,元胞自动 机在地理学上得到应用4。Flowerdew等人将元胞自动机模型应用到了城市扩展的 模拟之中。而后

38、,在1970年Tobler将CA模型应用到了模拟底特律城市扩张的 变化研究中,取得了很好的效果可。90年代开始,Clarke等提出了 SLEUTH模型, 模拟了美国加利福利亚旧金山海湾区等城市的扩展,并对其未来扩展情况进行预 测7。而后,学者开始将多类影响因子引入到土地利用变化的模拟演技之中,以弥 补影响因子单一的不足。其后,为提高数据处理、空间分析的效率,学者们将地 理信息系统(GIS)应用到CA模型中,GIS与CA的进一步结合,很好地增强了 CA模型的能力,降低了 CA模型的复杂度。Kheder等将模糊理论和元胞自动机相 结合,实现了高精度的模拟效果8。其后,为了进一步弥补政府、个体和相关

39、利益 团体等因素对土地转化影响,Jamal等人在元胞自动机模型中引入多智能体(Multi-Agent System, MAS)的概念,成功模拟了德黑兰的城市扩张四。为了模 拟纵向的发展规律,Benguigui等提出了城市3DCA模型网。为了反映真实的不规 则图斑特性,Andreas等人提出将泰森多边形应用于元胞划分中成。元胞自动机模型在我国的研究晚于国外,我国在20世纪90年代末开始元胞 自动机的广泛研究mi。周成虎等人提出了 GeoCA-Urban模型,并提出了地理元胞 自动机的概念IM,黎夏等将神经网络应用于该框架下用以解决元胞自动机转换规 则复杂的问题,提出了 ANN-CA模型,成功地实

40、现了对广东东莞城市扩张的模拟I% 张显峰等在前人的基础上,提出了 LESP模型,对包头市的扩张进行了模拟mi。史 文中等人利用泰森多边形对空间进行划分,提出了 Voronoi-based CA模型,解决 了栅格数据计算数据量过大的问题16。何春生等人综合了系统动力学在宏观影响 因素上的优势和元胞自动机在微观模拟方向的优势,建立了土地利用情景变化动 力学模型,以中国北方13个省为研究区域,模拟了该区域20年的土地利用变化网。 尤莉娟等在元胞自动机模型的基础上,结合Markov模型建立了 CA-Markov模型, 对城市扩张的情况进行了模拟,但是,该模型没有考虑到变化的非自然因子网。 陈凯等在土地

41、利用转换规则模拟上引入了随机森林算法,与逻辑回归构建的转换 概率模型进行对比,效果有较大提升I,。为了进一步提高对城市化的复杂过程的 模拟能力,遗传算法,粒子群算法,蚁群算法等相继被应用在土地转换规则模拟 上2。,21。余强毅等将多智能体(MAS)应用于土地利用的转化研究中,弥补了前 人对人为因素考量的不足22。秦静等基于NetLogo 3D建模工具,构建了三维元胞 自动机模型23。1.3本文的研究内容与创新点本文以研究区2008、2013和2018年卫星影像数据为基础,基于ENVI和ArcGIS 软件对遥感图像进行预处理和分类,得到研究区三年土地利用分类图集。在研究土地利用驱动因子后,收集了

42、从自然因素到人文政策因素等多个 驱动因子数据并对道路和公交站点数据做了分级处理。本文对土地利用数量、土地空间格局、与人口经济发展协调性等方面的 变化做了详细的分析。本文基于多粒度级联森林算法(mutli-Grained Cascade Forest, GCForest) 算法,构建了 GCForest-CA模型,模拟了 2018年土地利用在空间上的格局,并且, 将得到的预测结果与实际结果的差异性做了定量分析,预测的结果的总体精度为 84%, Kappa系数为0.8,在数量和空间上的一致性较好。本文基于以上研究,设计实现了基于Web的国土空间变化分析系统。 本文的创新点如下:本文在数据源上采用除

43、了自然地理因素外,充分考虑了人文因素的影响, 引入了人口、经济、商业点、交通等因素以及政策相关的允许建设区域图、有条 件建设区域图,引入灯光数据得到较为细致的人口密度数据。本文考虑到模型构建训练的效率和对非线性转化规则的模拟能力,使用 GCForest模型作为CA的状态转换规则的模拟方法,依据动态的数据构造相对动 态变化的模型,一定程度上避免了静态数据不能充分体现发展规律的问题。1.4研究方法和技术路线141研究方法本文以遥感影像分类图为基础,结合遥感地理学理论、GIS相关技术、元胞自 动机理论和深度森林等多种技术,获得研究区内的三年土地利用分类图集,在数 量和空间上分析土地利用变化情况,在研

44、究和分析了土地利用转变的影响因子后, 在自然因素、区位因素、人文、政策因素等各个维度上选取了多个影响因子,构 建模型对土地利用情况进行了模拟,具体的研究方法包括以下几种:遥感和GIS遥感应用主要是对收集到的卫星遥感影像数据进行遥感图像的预处理和目视 解译分析,构建标签进行图像分类,最后统一获得各类别的结果栅格图像数据。 GIS部分主要做数据格式统一和空间分析的处理。本文采用栅格与矢量并用的方式 依情况进行处理。元胞自动机元胞自动机具有在离散空间上演化模拟的优点,它本身是一套模型框架。本 文结合GCForest的拟合复杂规则的能力和元胞自动机空间演化能力,构建 GCForest-CA模型用以模拟

45、研究区范围内的土地利用变化的情况。GCForest 模型GCForest主要被用于模拟CA模型的转化规则,充分利用其对非线性复杂系 统的拟合能力扩展CA的能力,简化CA模型构建的复杂度。1.4.2技术路线本文在综合相关理论研究的基础上,研究了土地利用的驱动因子,通过收集 和处理相关数据构建了融合GCForest和CA的模型,用以模拟土地利用的演变规 律,其具体的技术路线见下图1-1。V图1-1技术路线图1.5本论文的结构安排本文的章节结构安排如下:第一章简单介绍文章的研究背景和意义以及本文的研究内容和创新点,最后 介绍了研究技术和方法。第二章介绍本文相关的基础技术原理。第三章针对相关数据处理进

46、行详细描述,介绍了遥感图像的分类方法和过程, 兴趣点数据获取和处理以及灯光数据去噪和修正的原理和过程。第四章基于土地利用分类结果数据,构建土地利用的转移矩阵,详细分析了 各类型土地的转化情况,各个类型土地在数量和速度上的转化情况以及各类型土 地在空间格局上变化情况。第五章基于元胞自动机原理,构建土地利用变化模拟模型,对模型的精度进 行验证和校正,并用校正的模型预测未来土地利用在空间上格局分布。第六章介绍国土空间变化分析系统的构成和设计详情。第七章为全文总结部分,针对本文的主要研究结论、研究进展和不足以及未 来研究方向等方面做了阐述。第二章相关基础理论介绍2.1元胞自动机2.1.1元胞自动机的基

47、本概念元胞自动机是一种动力学模型,它将整个空间划分为细小空间,空间之间相 互作用且在时间、空间和状态上都是离散的,元胞自动机本身没有严格的函数定 义,是一个方法框架,由一系列模型构造规则构成I。满足该规则的模型都可以 认为是元胞自动机模型。元胞自动机的每个元胞只取有限个状态,都遵循同样的 转化规则,其状态与相邻的元胞有很大的关系,状态随着转换规则的转换而转变。 大量的元胞通过相互之间的作用构成复杂的动力学系统。2.1.2元胞自动机的结构元胞自动机可以拆分为六个基本组成部分,分别为:元胞空间、元胞、邻域、 元胞状态、转换规则和离散时间SI。用数学表达式表示为:A = (LqS,N,F)(2-1)

48、其中,表示元胞自动机模型系统,乙表示CA的元胞空间,d表示元胞的空间维 度,S表示元胞的状态集合,其取值为有限的、离散的数据集,N表示某个元胞邻 域内所有元胞状态的集合,E表示元胞系统的局部转换规则。转换规则元胞空间图2-1元胞自动机原理图元胞自动机系统在明确了元胞此状态与下一时刻状态的转化的规则,元胞与其邻域内的元胞相互之间通过转换规则相互作用,可以模拟出复杂的系统行为。 元胞自动机系统的具体描述为:元胞元胞自动机最小的构成单元是元胞,在地理系统的模拟中,元胞一般是以网 格单元的形式呈现,在具体的土地利用模拟中,每一个元胞在理论上表示一块用 地图斑,具有真实的物理意义,每一个元胞都有有限个状

49、态,在土地利用变化模 拟的情形下,元胞状态可以是土地的利用类型。元胞空间元胞空间就是元胞所在的空间,每一个元胞在元胞空间里是相对独立的,元 胞在空间上的集合就构成元胞空间。元胞空间不是无限扩展的空间,其各个方向 都需要在计算中时定义相应的边界条件。元胞自动机的空间划分方式可以大致分 为非规则划分和规则划分两种方式,非规则划分不要求元胞空间的划分在大小和 形状上的一致性,在模拟复杂的实际地理场景具有优势,然而,该方式在模拟操 作上具有一定难度,规则的划分方式,要求划分单元在形状大小上有一致性。规 则的元胞空间的划分方式一般有三种,可以是三角形划分、正方形划分或者六边 形划分,见下图2-2,三角形

50、划分主要优势在于元胞的相邻元胞数目较少,在处理 时数据量相应较少,而其缺点在于不利于计算机处理,六边形划分,缺点在于划 分过于复杂,优点则在于邻接元胞较多,比较能够体现出地理图斑本身在各个方 向上的不一致性,而更符合实际的物理情形。正方形的划分方式则介于两者之间。 划分方式较为简单,又便于在计算机中处理。在地理应用中,数据一般以栅格的 方式存在,采用正方形网格具有易于操作的优势,本文采用正方形网格划分元胞 空间。(b)(c)图2-2元胞划分方式(a)三角形元胞空间划分;(b)正方形元胞空间划分;(c)六边形元胞空间划分元胞状态元胞状态是有限离散值,一个元胞状态用来描述个体的属性特征,元胞状态

51、的取值是互斥的,在同一时刻,元胞状态只能取状态集合中的某一个值。在实际 的土地利用变化模型中,元胞状态为土地利用类型。元胞邻域元胞的邻域指的是由该元胞在元胞空间上与之相邻的元胞构成的区域。元胞 的状态受其邻域内的元胞的状态的影响,元胞的邻域的形状有多种,最基本的形 状有如下三种。如下图2-3所示。图2-3元胞自动机邻域形状(a)冯诺依曼型邻域;(b)摩尔型邻域;(c)扩展摩尔型邻 域从左至右为冯诺依曼型、摩尔型和扩展摩尔型,其中,第一种类型中心元胞 的下一状态跟直接的上下左右四个位置的元胞有关系,但是,这种模型过于简单, 在摩尔型和扩展摩尔型中,中心元胞的下一状态与周围的元胞均有关系,两者的

52、区别在于邻域的半径不同。转换规则转换规则定义了元胞当前时刻状态转换到下一刻的状态的转移函数E,用数 学表达式表示为:r:5;+1 = /(s;, S)(2-2)其中,S;+1表示下一时刻的元胞状态,S;表示当前时刻的元胞状态,S表示当前时 刻的邻域内的元胞的状态。元胞自动机的转换规则是模型的核心部分,它决定了系统的运行的方向以及 模型的整个运行过程,直接影响了最终的结果。元胞自动机加入了转换规则才能 实现复杂的动态过程模拟。离散时间元胞自动的离散时间部分指的是一个具有时间变化特征的数字序列,该序列 具有离散性和先后性。在具体的模拟研究中,序列为时间间隔相同的连续整数值。 元胞在,时刻的状态以及

53、其相邻元胞在同时刻的状态共同决定了 t+1时刻的元胞状O2.2多粒度级联森林算法多粒度级联森林算法(mutli-Grained Cascade Forest, GCForest)是南京大学周 志华教授在2017年提出的一种基于决策树的一种深度学习算法口司。该算法基于随 机森林模型,随机森林是集成学习算法中优秀的算法之一。随机森林主要基于 bagging方法,该方法是基于多个互相独立的弱学习器的独立训练结果,最后,综 合多个分类结果,采用投票的方式得到最终的结果o GCFrorest算法具有开销较小, 运行效率高的特点,在处理数据量比较大的情况时,可以大量地减少训练时间, 并且,相对于基于神经网

54、络的深度学习算法来说,具有很少的超参数,对参数树 的设置不敏感,具有很高的鲁棒性。另外,神经网络在针对小数据集时,容易因 为模型过于复杂而过拟合,GCForest算法可以自动调节层数,在小数据训练集也 可以达到很高的拟合性能。2.2.1级联森林级联森林是由多层随机森林模型构成,级联层中的每一层都处理来自上一层 的结果,该思路来自于深度神经网络在结构形式和表征学习方面的强大能力。经 过多层次的处理可以更加合理地表征特征的关系内涵。图2-4级联森林图2句从图2-4看出,级联森林包含有多个随机森林(蓝色部分表示)和多个完全随 机森林(黑色部分表示),每个随机森林包含有1000棵决策树,每一层的不同类

55、 型的随机树可以增加对数据处理的差异性,来保持其数据的多样性,多样性越明 显,则集成学习得到的结果更为可靠。每一层最终处理得到的结果会作为下一层 的输入数据,而当前层的结果的维度由分类的类别数决定,如果类别为3,则会输 出一个3维的向量。每个完全随机树在树的每一个节点上通过随机选择输入数据 的特征总数量的平凡根作为候选,通过计算GINI指数来作为特征划分的依据。x依据图2-5,当输入数据为x时,每个随机树都会得到一个分类的类别概率向 量,向量的维度由分类的类别数据决定,如3分类则产生一个3维的向量结果。 然后,对所有的结果向量求其平均值,作为下一个层级的输入。为了降低过拟合 的概率,每个森林产

56、生的类向量由K折叠交叉验证法产生。每一层计算完成,验 证当前模型的精度,与未扩张到该层得到模型精度进行比较,如果没有显著的提 升,则模型训练终止,否则,进行下一层扩展。2.2.2多粒度扫描深度神经网络在特征关系的寻找上有非常突出的能力,受到深度神经网络的 启发,GCForest采用多粒度扫描来提高特征提取的效果。具体的流程可见下图2-6。假设输入的数据是400维的向量,扫描窗口是100维,随着滑动窗口的移动, 可以产生301个100维的向量,对于图像则可表示为20 x20的图斑,窗口可以表 示为10 x10的结构,则可以生成121个10 x10的结果。处理后,可以大大增加数 据之间的特征关系。

57、100维向量400维向W一S维向量随机森林随机森林3维向量 3维向量Bonn903维向量9S维向说图2-6多粒度扫描262.2.3整体结构图2-7整体流程图26400维向量从图2-7看出,假设输入的数据是个400维的向量,采用多种维度的窗口对原 始数据进行扫描,100维的窗口可以产生301个100维的数据,同理对于200维和 300维的窗口,然后将得到的数据输入到随机森林和完全随机森林模型中去训练, 假设分类结果为3维,每一随机树可以产生301x3维向量,同层有棵随机树, 则结果构成903x维向量,然后,将该向量输入到下一层中,继续训练,直到满 足停止扩展的条件,模型扩展结束,这时,计算多个3

58、维分量综合的平均值,选 择最大的那个作为输出的结果,即说明取该类别的概率值最大。在该模型中,可以发现随机森林中决策树的数量增多则模型越复杂,级联层 数越多越复杂。Logistic回归分析Logistic回归分析是一种离散分类变量回归模型。它适用于离散、不连续的结 果的分析。在研究土地利用变化的驱动因子时,可以将不变的区域点设置为0,将 变化的点设置为1。按照分类的类别的个数不同,可分为二分Logistic回归和多分 Logistic回归。本文使用二分Logistic回归。Logistic回归的基本原理在二分Logistic回归模型中,假设事件发生的概率为P,假定因变量为匕自 变量有Vi, V2

59、-,匕,则右1的概率可以描述为:In 厂彳=炫+,+ +札七(2-3)其中,伽为常数项,0,7=(1,2,时是对应的回归系数。=腐+*【;+ +凡七,则尸=1 1(2-4)1 + e该概率值实质上是一个阶跃函数,是把8映射到0,1区间内,而实现二分类 的目的。而8本身为一个线性回归模型。因为该线性回归模型的结果输入到非线性 阶跃函数中,所以整个模型是非线性的,当上式的值在0, 1之间变化时,尸值会 有很大的变化,值很大或者很小,P不会有很大的变化。Exp(B)为优势比,是exp0)的表示法,从逻辑回归的定义可以看出,Exp(B) 与P/(l-P)正相关,也就是Exp(B)越大,则P越大,即因变

60、量7=1的概率最大。 Exp(B)l,则表明Y=1是有优势的。ROC 曲线ROC 曲线(Receiver Operating Characteristic, ROC)主要用来对二分类模型 的性能进行评估,该曲线与两个参数有关:真正例率(True Positive Rate, TPR) 和假正例率(False Positive Rate, FPR),真正例率是所有为正例的样本被判定为 正例的比率,假正例率为所有负例样本中被判定为正例的比率。ROC曲线越靠近 坐标系的左上角区域试验的准确性越高,越靠近右下角则反之。评价模型的优劣, 可以通过计算曲线下面积(Area Under Curve, AUC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论