基于决策树分类的美国Lanier lake湖区土地利用信息提取_第1页
基于决策树分类的美国Lanier lake湖区土地利用信息提取_第2页
基于决策树分类的美国Lanier lake湖区土地利用信息提取_第3页
基于决策树分类的美国Lanier lake湖区土地利用信息提取_第4页
基于决策树分类的美国Lanier lake湖区土地利用信息提取_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

地理与环境科学学院学年论文《基于决策树分类的美国Lanier水库土地利用信息提取》基于决策树分类的美国Lanierlake湖区土地利用信息提取摘要:遥感作为近几十年迅速发展起来的一门综合性技术学科,己经在许多领域发挥了重大作用。对遥感数据进行专题分类处理以得到土地利用等专题信息是遥感最广泛的应用领域之一。尽管土地利用遥感分类方法不断发展,但分类技术却始终跟不上遥感技术本身的发展[1]。随着计算机技术和遥感技术的发展,计算机自动分类已经成为遥感影像信息提取和分类的主要手段。本论文以美国Lanierlake湖区为研究区,利用TM1-7多波段遥感影像为数据源,围绕遥感影像,采用决策树分类方法,对不同波段得到的光谱信息进行综合分析,充分利用其中的光谱信息、地学知识以及作图者的经验知识进行土地利用分类,得到精度很高的土地利用分类数据,从而更好地为地方土地有效利用提供决策依据。1引言由于遥感技术具有覆盖范围大、周期短、能反映动态变化、受地面条件限制少,获得的信息量大且成本低、收益大等优点。现代土地覆盖制图多通过野外实地调查和室内遥感信息判读分析来全面掌握土地资源自然属性、利用属性及其利用程度等空间区域特点[1]。光谱反射中存在的同物异谱和异物同谱现象,单纯地利用光谱反射特性或图像亮度值提取地物,尤其针对两类反射特性相似的地物,势必造成分类的混淆和错误。这就是传统分类方法在处理复杂的多维属性时在地形和地物过于破碎和复杂的情况下精度不高的根本原因。而决策树分类法在处理多维属性时可以确定各属性(包括相关的环境特性如几何、纹理以及数字地形模型等背景信息)的重要程度。实验证明使用决策树分类方法分类得到的Lanierlake湖区的土地利用精度达到98%以上(与ERDAS软件提供的标准数据做比较),从而可以利用决策树提取必要的属性进行土地利用分类是可取的方法。2研究区概况与研究资料2.1研究区概况Lanier是佐治亚州的一个人造湖,由军队开挖,面积很大,主要为了蓄水,也是1996年美国亚特兰大奥运会的划艇比赛地。原来湖水很丰沛,还修了水坝,定期往下游佛罗里达和亚拉巴马放水,以使那里的渔民维持生计。近些年亚特兰大缺水也很严重,现在已经限制私人自己洗车,或者用水浇花园和草地。缺水以后,不再往下游放水,也引起了三个州之间的纠纷。如今Lanier湖,水面确实很低,沿岸的石头和红土已经显露出来。湖面不是一望无际,而是被一个个的“小岛”分隔开,小岛是由沙土和繁茂的树木构成的小沙丘,水少了,显得它们高了出来。很长的湖岸线被当地人分割成各自的地盘,来停留他们自己的船。Lanier湖是超过300万亚特兰大市民的主要饮用水源地。在干旱期间,佛罗里达州希望能够从Lanier湖获得足够多的水,以确保阿巴拉契克拉湾的鱼类、蚌类以及牡蛎的繁殖和收获。亚拉巴马州希望能够从Lanier湖获得足够多的水,以确保Dothan附近的核电站的正常运行。Lanier湖的地位是不可替代的。佐治亚州、亚拉巴马州和佛罗里达州展开激烈争辩,核心论题就是是否有权请求获得更多的Lanier湖水源。2.2研究资料采用LandsatETM+遥感影像作为影像数据源。按照美国LandsatETM+影像数据处理流程[3]要求,对该影像进行反射率还原,在接下来的分类试验中比较了反射率还原影像与原始影像的分类结果;然后对原始影像和反射率还原影像进行几何校正,校正精度为0.5个像元;依据各种地物在不同波段下的影像具有不同的发射特征,且具有一种特定的规律,按照各种地物的发射特征,找到其中的规律[2]。本论文基于决策树分类以期对美国Lanierlake湖区土地利用进行信息提取。3分析与实验3.1分类前预处理计算机遥感图像分类是统计模式识别技术在遥感领域中的具体应用。提取待识别模式的一组统计特征,然后按照一定的准则作出决策,从而对数字图像予以识别。遥感图像分类的主要依据是地物的光谱特征,即地物电磁波辐射的多波段测量值,由于同物异谱和同谱异物现象的普遍存在,原始亮度值并不能很好地表达类型特征,需要对数字图像进行运算处理,以寻找能有效描述地物类别特征;需要对数字图像进行运算处理,以寻找能有效描述地物类别特征的模式变量,然后利用这些特征变量对数字遥感影像进行运算处理,以寻找能有效描述地物类别特别的模式变量,然后利用这些特征变量对数字图像进行分类。分类是对图像上每个像素按照亮度接近程度给出对应类别,以达到大致区分遥感影像中多种地物的目的。分类基本过程为:收集与分析地面参考信息与有关数据,对数字图像进行辐射校正和几何纠正;根据应用目的及图像数据的特征制定分类系统,确定分类类别;找出代表这些类别的统计特征;对遥感图像中各像素进行分类;分类精度检查;分类后处理。3.2决策树分类思想计算机分类实现的思想基础:同类地物具有相同(似)的光谱特征,不同地物的光谱特征具有明显的差别,但由于影响地物光谱特征的因素很多,所以影响的判读分类都是建立在统计分析的基础上的:同类地物的图像灰度概率在单波段(一维空间)符合正态分布规律;多维图像(即多波段)中的一个像元值(灰度)向量,在几何上相当于多维空间中的一个点,而同类地物的像元值,既不集中于一点,也绝非是杂乱无章的分布,而是相对地密集在一起,形成一个点群(一个点群就是地物的一种类别),一般情况下,点群的边界不是截然的,有少部分重叠和交错的情况。决策树分类的思想是针对各地物不同的信息特点,将其按照一定的原则进行层层分解。通过一系列二元决策将每个元素进行归类直到最后满足所有的二元分类标准,在每个决策点即节点处将像元分为两类,然后再进行下一步分类。在决策树分类中可以使用多种多样的具有决策意义的数据。在演算结果的树状图里,每个内部节点(IntervalNode)代表对某属性的测试,其下的每个分支(Branch)代表此属性的一个可能值,或多个可能值的集合。最后每个叶节点(LeafNode)对应的是一个目标类别(TargetClass)。3.3TM影像特征分析TM影像数据具有可见光—热红外(0.45~12.5μm)7个谱段。各个波段具有如下特点:TM1(0.45~0.52μm)蓝波段。该波段位于水体衰减系数最小部位,对水的穿透力最大(对清洁水可达30m),可获得更多水下细节,用于判别水系及浅海水域制图;位于绿色植物叶绿素的吸收区,对叶绿素含量反映敏感。用于海水叶绿素含量监测,常绿与落叶植被的识别与制图,土壤与植被的区分。TM2(0.52~0.60μm)绿波段。该波段位于健康绿色植物的绿色反射率附近,对植物的绿反射敏感,可用以识别植物类别和评价植物生产力;对水体有一定穿透力(一般10~20m),可反映水下特征、水体浑浊度、沿岸泥沙流、水下地形、沙洲、沿岸沙地等,并对水体污染的研究效果好。TM3(0.63~0.69μm)红波段。该波段位于叶绿素的主要吸收带,可用以区分植物类型、覆盖度,判断植物生长状况、健康状况等;位于不同含沙浓度水体辐射峰值附近,对水中悬浮泥沙反映敏感,用于研究泥沙流范围及迁移规律,对水体的穿透力约为2m左右。此外,该波段对裸露地表、植被、土壤、岩性、地层、构造、地貌、人文特征等可提供丰富的信息,为可见光最佳波段。TM4(0.76~0.90μm)近红外波段。该波段位于植物的高反射区,反映大量植物信息,故对植物的类别、密度、生长力、病虫害等的变化最敏感,用于植物识别分类、生物量调查及作物长势测定,为植物通用波段;处于水体强吸收区,用于勾绘水体,区分土壤湿度及寻找地下水、识别与水有关的地质构造、地貌(潮间带、潮水沟、古河道、边滩等)、土壤岩石类型等均有利。TM5(1.55~1.75μm)中红外波段。该波段位于两个水的吸收带之间,受两个吸收带的控制,反映植物和土壤水分含量敏感,利于植物水分状况研究和作物长势分析等,从而提高了区分不同作物的能力;对岩性及土壤类型的判定也有一定作用。此外,该波段雪比云反射率低,色调暗而形成较大反差,易于区分雪和云,特别是那些可见光、近红外、热红外波段均难以区分的小而薄的云。一般说来,TM5信息量大,利用率高。TM6(10.4~12.5μm)热红外波段。探测常温的热辐射差异。根据辐射响应的差异,可进行植物胁迫分析、土壤湿度研究、农业与森林区分、水体、岩石等地表特征识别以及监测与人类活动有关的热特征,进行热测定与热制图[2]。TM7(2.08~2.35μm)中红外波段。该波段位于水的吸收带之间,受两个吸收带的控制,对植物水分敏感;包含了粘土化矿物吸收谷(2.2μm附近)及碳酸盐化矿物吸收谷(2.35μm附近),对岩石、特定矿物反映敏感,用于区分主要岩石类型、岩石的水热蚀变、探测与交代岩石有关的粘土矿物等,为地质学家追加的波段,以增加地质探矿方面的应用。TM的1,2,3,4,5,7波段均与地物信息密切相关,只有TM6热红外波段与地表的温度相关,且分辨率不同于其它六个波段(为60m),且对于TM6热红外波段的应用要求先进行辐射校正,在影像表现上又有热扩散现象。故本文研究不采用TM6数据。3.4波段组合1.TM321(RGB):均是可见光波段,合成结果接近自然色彩。对浅水透视效果好,可用于监测水体的浊度、含沙量、水体沉淀物质形成的絮状物、水底地形。一般而言:深水深兰色;浅水浅兰色;水体悬浮物是絮状影象;健康植被绿色;土壤棕色或褐色。可用于水库、河口及海岸带研究,但对水陆分界的划分不合适。这种RGB组合模拟出一副自然色的图象。有时也用于海岸线和烟柱的探测。对研究区域也进行3,2,1波段组合(图1),进行真彩色合成,从合成的图像上可以很容易得到,得到绿色植被的覆盖范围,建设用地反射率很大,也可以分离出来。但是居民点和道路信息很难分离。图1321波段真彩色合成图2453波段假彩色合成2.TM453(RGB):2个红外波段、1个红色波段。对内陆湖泊及河流分辨清楚。植被类型及长势可由棕、绿、橙、黄等色调分别。能区分土壤含水量(水分越多则越暗)。用于土壤湿度和植被状况的分析。也很好的用于内陆水体和陆地水体边界的确定。对研究区域进行波段4,5,3组合(图2),进行假彩色合成。从图上可以得到明显的水路陆分布,对道路的区分度也较好。3.TM742(RGB):植被基本都是绿色,城市呈现品红色或紫色,草地淡绿色,森林深绿色(针叶林色调比阔叶林暗)。能区分土壤和植被的含水量。适用于水/陆边界划分、土/植被边界划分,但不适于植被分类。土壤和植被湿度内容分析;内陆水体定位。植被显示为绿色的阴影。对研究区域进行742波段假彩色合成(图3),可以把建设用地和植被覆盖区域明显的分离出来,但是对于植被覆盖的类型很难区分,道路和居民点用地也很难区分。图3742波段假彩色合成图4432波段的标准假彩色合成4.TM432(RGB):标准假彩色。植被呈现各种红色调。深红色/亮红色为阔叶林,浅红色为草地等生物量较小的植被。密集的城市地区为青灰色。最适合用于植被分类。红外假色。在植被、农作物、土地利用和湿地分析的遥感方面,这是最常用的波段组合。对研究区域进行432波段的标准假彩色合成(图4)。从图上我们可以得到建设用地与植被覆盖区的界限,更能得到各种不同植被覆盖区的差异,从而分辨出植被覆盖区的类型。

5.TM543(RGB):城镇和农村土地利用的区分;陆地/水体边界的确定(图5)。图5543波段的假彩色合成图6457波段的假彩色合成

6.TM457(RGB):探测云,雪和冰(尤其在高维度地区)(图6)。图7研究区lanierTM影像TMimagery(RGB543)本研究中对TM多波段影像进行辐射校正,图像配准和几何精纠正。进行图像拉伸和边缘增强处理,以增强图像的目视效果,提高解译精度。根据TM影像波段组合知识基础,选择TM影像的波段(band)组合:5、4、3(RGB)获得近似自然彩色的合成影像,便于提高图像的直观目视效果(图7)。3.5决策树分类研究对7个波段TM图像现场采样,将样本记录下来,分别计算样本的均值,标准差等,然后判断概个波段各类别率密度曲线的相交情况看其是否可分,若可分利用概率密度曲线交点作为阈值,最后生成二叉决策树。在研究区lanierTM影像TMimage(RGB543)上,根据该影像的解译能力并结合实际调查,将研究区土地利用类型分为:eq\o\ac(○,1)水体Water、eq\o\ac(○,2)林地Forestland、eq\o\ac(○,3)耕地Agriculturalland、eq\o\ac(○,4)居民区Residential、eq\o\ac(○,5)道路Highway五大基本地物类型:eq\o\ac(○,1)水体Water:水体色调较暗,表现为蓝色和深蓝色,河流和沟渠一般呈带状和线状;eq\o\ac(○,2)林地Forestland:在影响上表现为亮绿色的均值斑块;eq\o\ac(○,3)耕地Agriculturalland:在影像上表现为质地均匀的绿色,格网状排列;eq\o\ac(○,4)居民区Residential:以房屋建筑物为主,间杂有其他地物而构成的土地利用类型。从色调上来说,为紫红色,分布呈片状;eq\o\ac(○,5)道路road:与居民区颜色较为相像,主要为粉色,形状为线状;基于特征提取与分析的研究区土地利用类型专家知识决策树分类规则定义:eq\o\ac(○,1)水体Watereq\o\ac(○,2)林地Forestlandeq\o\ac(○,3)耕地Agriculturallandeq\o\ac(○,4)居民区Residentialeq\o\ac(○,5)道路Highway水体(表一)林地(表二)耕地(表三)居民区(表四)道路(表五)特征提取与分析1光谱特征分析典型地物样点反射率统计表(表六)采样均值统计表(表七)2各土地覆盖/利用类型光谱响应均值曲线(图8)图8各土地覆盖/利用类型光谱响应均值曲线不同地物在各波段上有不同的亮度特征值和不同的光谱特征,但单波段特征值难以准确区分各种地物类型,还需要做组合波段以及波段运算。因此计算NDVI(归一化植被指数)(图9):NDVI=NDVI=图9归一化植被指数NDWI(归一化水体指数)(图10):NDWI=NDWI=图10归一化水体指数NDBI(归一化建筑指数)(图11):NDBI=NDBI=图11归一化建筑指数3.5分类技术流程IFNDVI>-0.4ANDNDVI<-0.2THEN(水体)水体{ndvi}gt-0.4and{ndvi}lt-0.2ELSE(耕地、林地、居民区、道路)IFNDVI>0.34ANDNDVI<0.65THEN(耕地、林地)耕地、林地{ndvi}gt0.34and{ndvi}lt0.65ELSE(居民区、道路)IFTM4>74ANDTM4<127THEN(林地)林地b4gt74andb4lt127ELSE(耕地)IFTM6>140ANDTM6<146THEN(居民区)居民区b6gt140andb6lt146ELSE(道路)ELSE(未利用地)决策树分类研究3.5.1本研究先使用ERDASIMAGINE软件对与各种波段组合进行多次尝试,来找到最佳的阈值区。经过多次对比,将阈值设为0.3,即NDVI>0.3的像元被归为植被。3.5.2分别选择多个耕地和林地样本,经过对样本区的分析,最终得出耕地和林地在各个波段反射率的最小值、最大值、均值和标准差。经过对表中数据的分析,我们发现耕地和林地在TM第4波段的反射率有较大差异,耕地的反射率明显大于林地的反射率。3.5.3通过对表中数据的详细对比分析,发现只有一个湖区,所以对湖水不必做分类。3.5.4根据上述分析,构建区分各个地物类型的决策树,得到下图的决策树判断树(图12)。图12决策树的建立在计算机中实现上述决策树,得到如图13所示美国Lanierlake湖区的土地利用分类。图13决策树分类结果图14ERDAS提供的标准分类4精度评定由于美国Lanierlake湖区的土地利用分类在ERDAS中提供了精度相对很高的分类结果。因此我们把ERDAS提供的分类结果看作是与原来地物的真是反映,即把把它的精度看作为100%(虽然不太准确,但在没有实地资料的情况下可以将其近似的看作是实地),这样只要比较决策树分类结果和ERDAS提供的模板就可以得到本文决策树分类的精度(各地物面积为遥感影像的像元个数)。用ERDAS的模板分类得到的地物分类如图14所示。统计ERDAS提供的各种地物的面积,得到表十一的结果。表十一ERDAS分类的标准地物面积统计ERDAS软件提供的美国Lanierlake湖区土地利用分类水体24883林地24810湖区湿地河流落叶林火炬松林常叶林湿地松林168354082396611176583333744427耕地168852居民地28517道路1784总面积基本农田一般耕地居民地商业区公路铁路475611212912373147861518266248846对使用决策树分类结果的各种地物面积进行统计,得到表十二的结果。表十二决策树分类的各种地物面积统计水体林地耕地居民地道路总面积2574925958174085298651822257479有上面两表,对各种地物的面积进行比较,得到各种地物在使用决策树分类的精度大小(表十三)。表十三决策树分类结果的各地物精度大小水体林地耕地居民地道路总面积标准2488324810168852285171784248846决策树2574925958174085298651822257479差值866114852331348388633精度96.52%95.37%96.90%95.27%97.87%96.53%通过上表可以明显的得到,精度最大的道路,达到了97.87%,精度最差的居民地,精度也达到了95.27%,按照面积总量精度高达96.53%。为确保精度科学性,利用公式[2]求其平均值作为决策树分类的精度,得到分类精度为96.43%,精度较高,可以为此地区的生活生产提供决策依据。5结语通过决策树分类的美国Lanierlake湖区土地利用状况,有很高的精度,便于有关部门决策。决策树的高精度、低主观性也使得对目前研究土地利用方面的分类,加之遥感影像的动态观测可以为人类生活提供相对准确的土地利用变化,为政府部门提供相对准确、及时的决策依据。由于决策树分类方法可以生成便于理解的规则且计算量相对来说不是很大,可以处理连续和种类字段,还可以清晰的显示字段重要性,所以可以生成精度较高的分类方法。但由于决策树对连续数据比较难处理,对时间序列的数据以及当分类类别比较多时,精度会成线性关系下降,价值决策树对分类者的遥感知识及逻辑思维要求相对较高,故不太适合广泛的应用于现实生活中。参考文献:[1]张自宾,武文波,金卓.辽宁工程技术大学.基于决策规则的遥感影像土地利用信息提取测绘科学.(辽宁工程技术大学,辽宁阜新)DOI:10.3771.1307.28.07.080[2]McIverDK&FriedM.AUsingpriorprobabilitiesindecisiontreeclassificationofremotelysenseddata[J].RemoteSensingofEnvironment2002,81:253261[3]袁荫堂.概率论与数理统计p61.中国人民大学出版社[j].中国北京.2009.6[4]陈述彭等.陆地卫星影像中国地学分析图集[M].科学出版社[5]赵英时等.遥感应用分析原理与方法[M].科学出版社[6]汤国安,张友顺等.遥感数字图像处理[M].科学出版社[7]曾志远等.卫星遥感图像计算机分类与地学应用研究[M].科学出版社[8]田永庆,闵祥军.植被指数研究进展[J].地球科学进展,1998(13)[9]陈述彭,童庆禧,郭华东.遥感信息机理研究[M].科学出版社[10]党安荣等.遥感图像处理方法[M].清华大学出版社[11]李彤,吴骅.采用决策树分类技术对北京市土地覆盖现状进行研究.(北京师范大学地理学与遥感科学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论