基于决策树遥感图像分类方法浅析 毕业论文.doc_第1页
基于决策树遥感图像分类方法浅析 毕业论文.doc_第2页
基于决策树遥感图像分类方法浅析 毕业论文.doc_第3页
基于决策树遥感图像分类方法浅析 毕业论文.doc_第4页
基于决策树遥感图像分类方法浅析 毕业论文.doc_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

毕业设计(论文)学 生 姓 名: 学 号: 专 业:摄影测量与遥感系 部:资 源 科 学 系设计(论文)题目:基于决策树遥感图像分类方法浅析指 导 教 师: 2012 年 6 月 7日摘 要:在遥感技术的研究中,通过遥感图像判读识别各种目标地物是遥感技术发展的一个重要环节,无论是专业信息获取、动态变化预测,还是专题地图制作和遥感数据的建立都离不开分类。早期的分类技术是目视解释,其时效性、可重复性差,解释结果也因人而异,很难进行比较和转换。近年来随着计算机技术的飞速发展,计算机识别自动分类已逐渐替代了早期的分类技术,成为遥感应用的一个重要的组成部分,也是当前遥感发展的前沿。而且,遥感图像的信息提取与分类一直是遥感技术领域研究的一项重要内容。遥感图像分类应用中,监督与非监督分类的传统分类方法以及人工神经网络分类、专家系统分类等新方法都以影像光谱特征为基础,然而,由于影像本身存在“同物异谱、异物同谱”现象,这种纯粹依赖地物光谱特征的分类方法往往会出现较多的错分、漏分情况。众多研究表明,结合影像光谱信息和其他辅助信息,可以大大提高分类精度。本论文采用决策树分类技术对遥感图像进行分类,阐述了决策树的概念、决策树的分类方法、原理及基于专家知识的决策树遥感图像分类方法,探讨了决策树在遥感数据分类方面的优势,从而提高了遥感图像的分类精度。关 键 词:决策树;分类;遥感影像目 录1、 绪 论11.1 研究背景11.2 研究目的与意义11.2.1 研究目的11.2.2 研究意义22、 遥感图像分类方法及研究进程22.1遥感图像分类概述22.2 传统分类方法22.2.1监督分类法22.2.2非监督分类法32.3 遥感图像新型分类方法32.3.1非监督分类与监督分类的结合32.3.2人工神经网络分类法32.3.3决策树分类法42.4 决策树分类法原理42.4.1决策树分类器42.4.2决策树算法42.5本章小结63、 基于决策树遥感图像分类63.1 概 述63.2 决策树的使用83.2.1 ndvi植被指数83.2.2规则获取83.2.3 输入决策树规则83.3 决策树分类后处理103.4 本章小结124、 决策树分类法优缺点分析124.1 利用不同方式提取植被信息124.2 决策树分类法的优点分析144.3 决策树分类法的不足之处145、 总结与展望145.1 总 结145.2展 望15参 考 文 献16致 谢17i 1、绪 论1.1 研究背景 决策树分类方法作为一种基于空间数据挖掘和知识发现的监督分类方法,突破了以往分类树或分类规则的构建要利用分类者的生态学和遥感知识先验确定,其结果往往与其经验和专业知识水平密切相关的问题。它通过决策学习过程得到分类规则并进行分类,分类样本属于严格“非参”,不需要满足正态分布,可以充分利用gis数据库中的地学知识辅助分类,大大提高了分类精度。目前,决策树分类方法已经开始应用于各种遥感影像信息提取和土地利用、土地覆盖分类中。在美国usgs、epa等部门联合实施的“美国土地覆盖数据库”1计划(nlcd 2001)中,决策树分类技术不仅被应用于土地分类,而且应用于城市密度信息提取和林冠密度信息提取,土地利用分类精度达到了73-77%,城市密度信息提取精度达到83-91%,树冠精度到78-93%,其制图效率比原有的方法提高了50%,完全满足大规模土地分类数据产品生产要求。1.2 研究目的与意义1.2.1 研究目的过去遥感影像分辨率不高,像元混杂十分严重,因而,传统遥感图像分类方法,如监督分类或非监督分类,都是根据地物的光谱信息进行的,并未考虑像元之间的相关性,空间信息利用很少,这是基于像素分类方法的瓶颈所在。这种方法无法解决“同物异谱”,“同谱异物”的难题,并且分类精度受到局限。用传统的统计模式方法分类的效果不甚理想,因而人们不断研究新的分类放大。例如模拟人脑思维方式提出的人工神经网络分类;针对地物特征和模糊性提出的模糊聚类分类等,虽然这些方法在一定程度上提高了分类精度,达到了更好的效果,但是它们仍然是以遥感图像的光谱特征为基础的。在实践中,由于各种因素的影响,如地面起伏对地物光谱反射强度的影响;像素的分辨率低而造成的混类像素影响;分类中只考虑单个像素光谱特征而未考虑相邻像素类属的相关性及结构特征等因素,都会使常规的计算机分类效果不够理想。因此需要采取一些辅助的处理措施,如引入地面的高程、坡度、坡向信息等,以设法改善分类效果。本文采用基于决策树的算法,将其应用到图像自动分类中,能够很好的解决这个难题,达到更好的分类效果。1.2.2 研究意义随着遥感空间技术的发展,遥感影像的分辨率越来越高。分辨率在10m以内的影像一般称为高分辨遥感影像。这些数据具有丰富的空间信息、地物几何结构和纹理信息。并且,在高分辨率影像中,有意义的地物大多由非单一像元组成,且相邻像元间的相关性高2。对这种数据,如仅利用传统的基于光谱的分类方法,就会造成空间数据的大量冗余。基于决策树算法的分类方法突破了传统分类方法的瓶颈,先以加入形状因子的方式对影像进行多尺度分割,将相关性高的像元融合在一起,形成同质图斑,然后用面向对象的方法对地物进行认知,主要是根据图像确定合理的分割参数及建立有意义的分类知识库。2、遥感图像分类方法及研究进程2.1遥感图像分类概述对遥感图像进行分类是把遥感图像中的像元点按照不同类别进行划分,或者按照专题进行划分。分类后的每个图像空间的子区域都代表着一种实际地物3。遥感影像按照传统的计算机分类有两种分类方法,一种是统计模式法:例如最大拟然法和 k-最近判别法;另一种句法模拟法。随着遥感技术的不断发展,一些采用句法模拟法的新分类方法越来越多的出现包括决策树法、人工神经网络法以及专家系统等。2.2 传统分类方法2.2.1监督分类法对于遥感图像的样本区域中地物类别的属性在分类之前人们已经具有了先验知识是监督分类的重要特征。即采用线性判断、平行多面体、最大拟然、最小距离等方法对先从遥感影像中取出的图像样本进行分类,这些样本要涵盖所有区域的各类地物。首先对选取的样本建立判别函数得到训练区,通过训练区区获得各类别的数据,然后对遥感图像进行整体分类。训练区域的选取是整个监督分类最关键的环节之一,训练区域的选择质量影响着遥感图像分类能否收到一个良好的效果。在训练区域选择是应当要充分的考虑到选取区域中地物的分布特征和光谱特征。需要有大量的野外实地调查和选取足够的样本以达到判别函数建立的要求4。2.2.2非监督分类法非监督分类是依靠系统聚类,按照相似性将一组像素分类,尽可能的缩小同类别像素间的距离,同时尽量扩大不同类别像素间的距离。初始分类的参数设定和迭代调整是该算法的关键问题,其主要算法包括 isodata 法、分级集群法以及 k-均值算法等。将遥感图像中的地物按照其光谱特征进行分类,由于能够较少的受到人为因素的影响,而且不需要全面了解地面信息和地物属性,而且操作方法相对简单、算法成熟,在研究数据的自然集群分布时采用非监督分类法具有较强的实用性,因此在初步分析图像环节该分类法得到广泛应用。监督和非监督这两种分类方法相比较,监督分类法表现出一定的优势。但是它也不能够完全避免误分、漏分情况的出现。这种传统的分类方法不仅对在分类之前需要人工目视解释的配合,而且非常依赖地物属性的先验知识。2.3 遥感图像新型分类方法新的分类方法主要有决策树分类法、非监督分类与监督分类的结合、人工神经网络分类法等。这些新分类法的应用于传统的分类方法相结合,有效的减少了误分、漏分,提高了分类精度。2.3.1非监督分类与监督分类的结合监督分类与非监督分类各有其优缺点,实际工作中,常常将监督法分类与非监督法分类相结合,取长补短,使分类的效率和精度进一步提高。基于最大似然原理的监督分类方法的优势在于如果空间聚类呈现正态分布5,那么它会减小分类误差,而且,分类速度较快。监督法分类主要缺陷是必须在分类前圈定样本性质单一的训练样区。而这可以通过非监督法来进行。即通过非监督法将一定区域聚类成不同的单一类别,监督法再利用这些单一类别区域“训练”计算机。通过“训练”后的计算机将其他区域分类完成,这样避免了使用速度比较慢的非监督法对整个影像区域进行分类,使分类精度得到保证的前提下,分类速度得到提高。2.3.2人工神经网络分类法人工神经网络分类方法是模拟人类大脑的神经系统和思维功能,并进行简化建立的数学模式6。这种分类方法是不需要具备统计分布的先验知识,不需要对复杂的不规律的数据进行处理,也不需要对分类过程中的数据源的先验权限进行预定义,而且较容易与其他辅助信息实现结合。与传统分类方法相比,人工神经网络分类法更容易获得具有较高精度的分类结果,尤其是对于复杂类型的土地覆盖分类,该分类方法的优点能得到更好的体现。2.3.3决策树分类法基于分层分类的指导思想,将不同地物的属性特点按照一定的原则进行逐步分解。根据研究人员对相应区域地物特征的了解,在对每一次进行分解时,可以按照波段以及不同的波段组合分类。按照遥感图像的不同特性采用决策树分类,将分类和决策通过树型结构进行表示,从而发现其规律。首先通过训练区域的数据建立判别函数7,然后按照所取的不同值建立分支完成树型结构,在其分支的子集中还可以再次建立子结点,形成最终的决策树。2.4 决策树分类法原理2.4.1决策树分类器决策树分类器是一种多级分类方法,在机器学习、知识发现等领域得到了广泛应用。对于一个分类问题或规则问题,决策树的生成是一个从上至下,分而治之的过程。这种方法在数据处理的过程中,将数据按树状结构分成若干分枝,每个分枝包含数据的类别归属共性,这样可以从每个分枝中提取有用信息,形成分类规则。2.4.2决策树算法决策树是通过对训练样本进行归纳学习,生成决策树或决策规则,然后使用决策树或决策规则对新的数据进行分类的一种数学方法。决策树是一个树型结构,它是由一个根节点(root node)、一系列内部结点(internal)及叶节点(leaf nodes)组成。每一个节点有一个父节点和两个或多个子结点,节点间通过分支相连。在分类时常以两类别的判别为基础,分层次逐步比较,层层过滤,直到最后达到分类的目的。如图2-1所示:一次比较总能分割成两个组,每一组新的分类图像又在新的决策树下可再分。如此不断地往下细分,直到所要求的“终极”(叶节点)类别分出为止。于是在“根级”与 “终极”之间就形成了一个分类树结构,在树结构的每一分枝处总可以选择不同的特征用于进一步细分。这就是决策树分类器特征选择的基本思想。 任何一次分类在分类树中都叫做一次决策结点,分类过程可以有多个决策点,每个决策点的决策函数可以来源于多种类型的数据。在决策树分类方法中常使用的分类特征为光谱数据,用光谱数据计算出指数(如植被指数)、光谱运算值、主成分等参变量,用于决策分类。 r t1 t2 b aaa tnaaa cde根节点分 支叶节点 图 2-1 决 策 树 分 类 器 原 理 决策树分类器的特征选择过程不是由“根级”到“终极”的顺序过程,而是由“终极”到“根级”的逆过程8,即在预先已知“终极”类别样本数据的情况下,根据各类别的相似程度逐级往上聚类,每一级聚类形成一个树节点。在该节点处选择对其往下细分的有效特征。由此往上发展到“根级”,完成对各级各类组的特征选择。在此基础上,根据已选出的特征,从“根级”到“终极”对整个图像进行全面的逐级往下分类。对于每一级处的特征选择,为了使一个可分离性准则既能用于特征选择,又适用于聚类,可使用bhattacharyya距离准则(简称b距离准则)来表征两个类别ci和cj之间的可分性,其表达式为:di j=1/8(mi-mj)t(i+j)/2-1(mi-mj)+(1/2)ln|(1/2)( mi-mj)|/(| mi |1/2+| mj |1/2)式中mi,mj-ci和cj类集群的均值向量,i,j-ci和cj的协方差矩阵,di j -ci和cj之间的b距离。依据上述分类思想,以样本数据为对象逐级找到分类树的结点并且在每个结点上记录选出的特征图像编号及相应判别函数的参数,从而有可能反过来顺着从“根级”到“终极”的过程,按di j0,则x属于ci,否则x属于cj的判别规则,逐级地在每个结点上对样本数据以外的待分类数据进行分类,这便是决策树分类法的原理。从中可以看出,判别函数的确定是与特征选择密切相关的,一旦分类结束,不仅各类之间得到区分,同时还确定了各类类别属性。如图2-2所示: b162?水体:class 1b399?ndvi0.5?b255? .道路:class2居民地:class3ynynynyn图 2-2 二叉树分类器示意图2.5本章小结传统的遥感图像分类方法,仍然是目前较为广泛和普遍应用的分类方法,但随着遥感技术的不断发展,近年来出现的新的分类方法能够更准确的提取目标地物,改进了图像的分类,在实际应用也在越来越多的与传统方法相结合使用。随着计算机技术与遥感技术的相互融合,遥感信息的获得会越来越精确、迅速,新的算法、分类方法的研究会不断深入,遥感图像分类的精度必定会得到更显著的提高。3、基于决策树遥感图像分类3.1 概 述遥感影像通过亮度值或象元值的高低差异(反映地物的光谱信息)及空间变化(反映地物的空间信息)来表示不同地物的差异,这是区分不同影像地物的物理基础9。目前影像都是基于数字,影像信息的提取方法的发展历程可分为如图3-1所示,目前这四类方法共存。图3-1 影像信息提取发展阶段基于专家知识的决策树分类是基于遥感影像数据及其他空间数据,通过专家经验总结、简单的数学统计和归纳方法等,获得分类规则并进行遥感分类10。分类规则易于理解,分类过程也符合人的认知过程,最大的特点是利用的多源数据。如图3-2所示,影像+dem就能区分缓坡和陡坡的植被信息,如果添加其他数据,如区域图、道路土地利用图等,就能进一步划分出哪些是自然生长的植被,哪些是公园植被。图3-2 专家知识决策树分类器说明图专家知识决策树分类的步骤大体上可分为四步:知识(规则)定义、规则输入、决策树运行和分类后处理。知识(规则)定义:规则的定义是讲知识用数学语言表达的过程,可以通过一些算法获取,也可以通过经验总结获得。规则输入:将分类规则录入分类器中,不同的平台有着不同规则录入界面。决策树运行:运行分类器或者是算法程序。分类后处理:这步骤与监督/非监督分类的分类后处理类似。3.2 决策树的使用3.2.1 ndvi植被指数ndvi(normalized difference vegetation index,归一化植被指数,标准差异植被指数)表达式:ndvi=(p(nir)-p(red)/(p(nir)+p(red)和植物的蒸腾作用、太阳光的截取、光合作用以及地表净初级生产力等密切相关。ndvi的应用:检测植被生长状态、植被覆盖度和消除部分辐射误差等;-1=ndvi0.3, slope20, aspect270class2(非朝北缓坡植被):ndvi0.3, slope20, 90=aspect0.3, slope=20,class4(水体):ndvi=0.3, 0b420class5(裸地):ndvi=20class6(无数据区,背景): ndviclassification-decision tree-build new decision tree,首先我们按照ndvi的大小划分第一个节点,单击node1,跳出如图对话框,name为ndvi,在expression中填写:ndvi gt 0.3。点击ok后,会提示你给ndvi指定一个数据源,如图3-3所示,点击第一列中的变量,在对话框中选择相应的数据源,这样就完成第一层节点 。其中,no veg 表示没有植被信息,veg表示地物有植被信息。图3-4所示为原图,图3-5所示为经过第一步划分的决策树成果图。 图3-3 指定数据源 图3-4 原图 图3-5 决策树分类后图第一层节点根据ndvi的值划分为植被和非植被,如果需要进一步分类的话根据坡度划分成缓坡植被和陡坡植被。在veg图标上右键,选择add children。单击节点标识符,打开节点属性窗口,name为slopepost classificationclass statistics:包括每一类的点数、最小值、最大值、平均值以及类的每个波段的标准差等。其中每一类的最小值、最大值、平均值以及标准差可以以图的方式进行显示。可以显示出每一类的直方图,并且计算其协方差矩阵、相关矩阵、特征值和特征矢量等图3-7分类统计显示图(2)两个分类结果的比较:envi:classificationpost classificationconfusion matrix:分类结果的精度,显示在一个混淆矩阵里。通过用分类结果与地表真实图像(ground truth image)相比较来计算混淆矩阵。分类结果记录了总体精度、准确度、kappa系数、混淆矩阵、commission 误差(每类中额外像元占的百分比)和冗长误差(类左边的像元占的百分比)等等。当用地表真实图像计算混淆矩阵时,还可以输出每类图像中没有被正确分类的那些像元。如图3-8所示为针对两个分类结果的比较:图3-8分类后处理图(其中class1表示陡坡植被,class2表示缓坡植被)3.4 本章小结决策树分类算法具有灵活,直观,清晰,运算效率高等特点, 在遥感分类问题上表现出巨大的优势12。 随着人工智能技术和理论的发展, 当前遥感图像分类技术也向更高层次发展,地学知识和地理信息的辅助决策可以大大提高遥感图像分类和信息提取的精度,其中专家系统是解 决这一问题的有效途径.因此,将决策树算法与基于知识的专家系统相结合将引起关注。4、决策树分类法优缺点分析4.1利用不同方式提取植被信息本文以某tm遥感数据(图4-1)作为数据源,分别利用监督分类法、非监督分类法与决策树分类法就针对植被信息的提取进行对比。对比过程中发现:利用监督分类法(图4-2)对植被信息的提取首先要选取感兴趣区,监督分类只能识别训练样本中定义的类别,得到的结果内容缺失严重,人为主观因素较强,从而影响分类结果。而利用决策树分类法进行植被信息的提取不需要提取感兴趣区,决策树分类法的树状分类结构对数据特征空间分布也不需要预先假设某种参数化密度分布,只需根据二叉树单一的决策树结构按照决策树输入规则,便可对目标图像提取出相应的地物。如(图4-3)所示。图4-1 tm图像原始数据 图4-2 利用监督分类提取植被信息 图4-3利用决策树提取植被信息在实验过程中同样发现:利用非监督分类法(图4-4)对于地物的信息的提取是整体的提取,对于单一的地物信息,例如植被信息的提取,需要进行大量分析及后处理才能得到可靠结果,并且存在同物异谱,异物同谱的现象导致集群组与类别的匹配难度加大。相较之,决策树分类法对于单一的地物信息提取方便且匹配度高,其分类结构简单明了,对于输入数据的空间特征和分类标志具有更好的弹性,在对数字图像数据特征的分割上很好的体现了其优势。如图4-5所示: 图4-4非监督分类提取植被信息 图4-5利用决策树提取植被信4.2 决策树分类法的优点分析(1)决策树学习方法是解决实际应用中分类问题的数据挖掘方法之一,能够从无次序、无规则的事例中推理出决策树表达形式的分类规则。决策树学习过程中不需要操作人了解很多背景知识,只要训练样本能够用“属性结论”的方式表达出来,就能使用该算法来学习13。决策树学习或得的分类知识易于表达和应用。目前国外已经有学者利用决策树学习方法获取知识并应用于空间分析与研究过程。(2)决策树算法对于输入数据的空间特征和分类标志具有更好的弹性,它应用于遥感数据分类的优势主要在于对数字图像数据特征的分割上,其分类结构简单明了,尤其是二叉树结构的单一决策树结构十分容易解释。4.3 决策树分类法的不足之处基于决策树的分类方法目前在国内仅仅处于研究阶段,并且存在样本依赖度大14、分类决策规则与专家系统不宜结合、不能充分利用分类地物的空间特征等缺点,需要通过进一步深入研究,改善分类效果,提高分类效率,实现更友好方便的人机界面,满足计算机自动分类流程化自动化的要求。5、总结与展望5.1 总 结基于决策树的分类方法与传统自动分类方法相比,不需要数据集正态分布的假设,可以重复利用gis数据库中的多源信息15,因此具有更高的分类精度和适应能力,并易于实现计算机自动分类的流程化和自动化。分类过程中加入dem、坡度坡向等gis数据可以提高分类精度,特别是在山区、丘陵地形区域。但是,辅助数据的分辨率或者比例尺必须与待分影像接近,否则反而会影像分类效果。遥感图像分类是遥感图像解译中的一项关键技术,始终受到许多专家学者的热切关注,它是遥感领域的一个重要研究方向。而遥感影像的监督分类和非监督分类方法,是影像分类的最基本、最概括的两种方法。传统的监督分类和非监督分类方法虽然各有优势,但是也都存在一定的不足。新方法、新理论、新技术的引入,为遥感影像分类提供了广阔的前景,但是不可能存在任何一种分类算法在所有情况下优于其他方法,必须根据具体问题选择合适的分类算法。因此对已有算法的改进或应用其他领域的知识来设计一些新的算法是遥感图像分类方法研究中的重点。5.2展 望通过本文研究发现:决策树算法应用于遥感图像分类尚处于探索阶段,大部分都是理论上针对某一具体应用的探讨,目前研究成果比较少参考16,还没有较为通用的软件诞生。本文则在探索理论的基础上理解到,进一步的工作就是将决策树算法与其他技术,如神经网络相结合,与基于知识的专家系统相结合,以期获取更高的分类精度和更好的分类效率。并且,本论文在运用决策树对遥感图像分类过程着重在对植被信息的提取,以期对居

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论