环境遥感技术及应用(田静毅)第五章遥感图像的计算机分类课件_第1页
环境遥感技术及应用(田静毅)第五章遥感图像的计算机分类课件_第2页
环境遥感技术及应用(田静毅)第五章遥感图像的计算机分类课件_第3页
环境遥感技术及应用(田静毅)第五章遥感图像的计算机分类课件_第4页
环境遥感技术及应用(田静毅)第五章遥感图像的计算机分类课件_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 遥感图像的计算机分类遥感信息的提取主要由人工或计算机进行。人工信息提取也称图像判读,将在第六章介绍。本章主要介绍遥感图像的计算机分类。1 遥感图像的计算机分类 Computer Classification of RS Image2 监督分类方法Supervised Classification3 无监督分类方法Unsupervised Classification4 模糊理论与专家系统的应用Application of Fuzzy theory & Expert System掌握:概念:特征空间、监督分类、非监督分类、训练、训练场地、训练样本、模式、模式识别。遥感图像的分类原理。监督

2、分类中选择训练样本的要求。监督分类中主要的识别分类方法及其各自特点。了解:模式识别的任务与方法(分类)。训练场地的选择方法。识别分类判别函数的特点。1 遥感图像的计算机分类1. 遥感图像分类原理遥感图像计算机分类以遥感数字图像为研究对象,在计算机系统支持下,综合运用地学分析、遥感图像处理、地理信息系统、模式识别与人工智能技术,实现地学专题信息的智能化获取。利用遥感图像进行分类(classification)是以区别图像中所含的多个目标物为目的,对每个像元或比较匀质的像元组给出对应其特征的名称,这些名称称为分类类别(class)。在分类中所注重的是各像元的灰度及纹理等特征。用这样的多个特征量(特

3、征矢量)所定义的空间叫特征空间(feature space)。分类也可以说是按照若干分类基准对特征空间进行分割,对其中所含的像元或匀质区域给出相同的名称。The Procedure of Image Classification2. 遥感图像分类方法根据所采取的方法途径不同,遥感图像分类包括:监督分类(Supervised Classification)非监督分类(Unsupervised Classification)监督分类 根据已知训练场地提供的样本,通过选择特征参数,建立判别函数,然后把图像中各个像元点归化到指定类中的分类方法。1、训练(training)指计算机对遥感图像进行自动识别

4、、分类的学习过程。2、训练样本(training sample)又称“训练组”或“训练区”。指监督分类法中由先验类别选取的已知样本。它用来建立分类标准。监督分类对所要分类的地区必须要有先验的类别知识,即已知遥感图像上的样本区内的地物的类别,该样本区为训练区。我们具体地确定各类地物各波段的亮度值,并据此确定特征参数,建立判别函数。监督分类一般是在图像中选取有代表性区域作为训练区,由训练区数据得出各个类别的统计数据,然后根据这些统计数据对整个图像进行分类。2 监督分类方法1. 监督分类的内容 学习过程:利用训练样本的特征值求解判别函数的过程称为监督分类的学习过程。 识别分类过程:利用判别函数对未知

5、类别样本进行分类的过程。(1)学习过程对所使用图件的要求: 时间性:在确定数字图像与地形图(或土地利用图、地质图、航片等其他图)的对应关系时,所用的两类图件在时间上应一致,即同一时间的图件。 空间性:上述两类图件在空间上应很好匹配。b. 对训练样本的要求:类别:选择的训练场地所包含的类别在种类上应与研究地域所要区分的类别一致。不连续性:训练场地各样品在地理空间上可以是不连续的。代表性:训练场地样品在各类地物面积较大的中心部分进行选取,而不应在各类地物的混交地区和类别的边缘选取,以保证数据的单纯性(均一物质的亮度值)。分布:各类训练场地样本应该是正态分布,训练样本应尽量满足这一要求,即直方图是单

6、峰,不能是双峰。数量:要使各类训练样本能够提供各类的足够信息和克服各种偶然因素的影响,各类训练样本应该有足够样品数。训练样品的个数与所采用的分类方法、特征空间的维数、各类的大小和分布等有关。训练样本的选择方法a. 特征库法:从已建立的样本特征库中取出同样环境下同种物类的数据。b. 外推法:从地形图、土地利用图、植被图等图件上直接选取训练样本。具体做法是将几何粗校正好的数字图像与比例尺相同的地形图配准后,在数字图像上勾画出各类地物的边界,提取样本。监督分类中训练样本的选择要求(2)识别分类过程识别分类及其判别函数的特点: 识别分类又称判别分析分类,是根据某个判别函数的函数值对自变量进行分类的统计

7、分析方法。在图像处理中,判别函数一般是指一组以各波段的像元值X j为自变量的函数,其函数值可以作为分类界线。识别分类方法 判别分析可以采用不同的判别函数及分析方法。监督分类主要有以下三种识别分类方法:最小距离法(minimum distance classifier)平行六(多)面体法(parallelepiped/box classifier)最大似然法(maximum likelihood classifier)最小距离法是根据最小距离原则进行分类的方法。在资源遥感分类中,该方法应用较多。原理:首先由训练组数据得出每一类别的均值向量及标准差向量,然后以均值向量作为该类在多维空间的中心位置,

8、计算输入图像中每个像元到各类中心的距离,到哪一类中心距离最小,则该像元就归入哪一类。最小距离分类法的原理最小距离分类中常用的距离函数有两个:欧几里德距离:街道距离: 其中, 为第i 类在第i 波段的均值,n为波段数,xi为像元在第i 波段的像元值。最小距离分类法原理简单,分类精度不很高,但计算速度快,它可以在快速浏览分类概况中使用。平行六(多)面体法是在三维(或更多维)特征空间中,每类形成一个平行六面体(或多面体),即产生一个盒子,盒子一般以每类均值坐标点为中心,1、2、1.73倍标准差(在每个变量上)为棱长,以使分类满足要求。待分个体(样本)落入某平行六面体(或多面体),盒子中,则归属某一类

9、,否则被拒绝。平行六面体分类法的原理平行六(多)面体监督分类方法便于直观理解如何分割特征空间,以及待分类像素如何与分类类别相对应。遥感图像不同波段之间相关程度较高,一些点群在空间直角坐标系中分布呈现不规则的椭球形,其长轴相当于平行多面体的对角线方向。容易造成2类互相重叠,混淆不清。解决的办法是,把一个自然点群分割成几个较小的平行多面体,使之更加逼近实际概率分布,提高精度。最大似然法它是应用最广泛的监督分类方法,分类中所采用的判别函数是每个像元值属于每一类别的概率或可能性。其基本原理是对每个像元计算其落于各先验类别的概率。概率最大的相应类别,即为该像素的所属类别。现以图所示的二维观测为例。设欲根

10、据这些数据和先验知识求像点X属于A、B、C中的哪一类,则X属于A的概率为:式中:P(X/A)为先验已知值,是在已知地类A内获得X的条件概率; P(A)为先验已知值,系在那个地区内, A地类出现的先验概率.实验 监督分类将germtm.img分为:for_1, for_2.(在453波段组合下为红色,红中夹绿)con_1, con_2 .(在453波段组合下为青色,淡蓝色)water(在453波段组合下为黑色,深蓝色)步骤:定义分类模板(Define Signatures)评价分类模板(Evaluate Signatures)进行监督分类(Perform Supervised Classific

11、ation)评价分类结果(Evaluate Classification ) 1.定义分类模板(Define Signature Using signature Editor) ERDAS IMAGINE的监督分类是基于分类模板来进行的,而分类模板的生成、管理、评价、和编辑等功能是由分类模板编辑器来负责的。毫无疑问,分类模板生成器是进行监督分类一个不可缺少的组件。 在分类模板生成器中,生成分类模板的基础是原图像。因此,显示图像的视窗也是进行监督分类的重要组件。第一步:显示需要进行分类的图像第二步:打开分类模板编辑器ERDAS图标面板工具,点击Signature Editor菜单项 在viewe

12、r中点击图标定义分类模板 (1)在raster工具面板单击图标 ,进入多边形aoi绘制状态;(2)在图像窗口中选择红色区域(某地类),绘制一个多边形aoi;(3)在signature editor窗口,单击create new signature 图标,将多边形aoi区域加载到signature editor分类模板属性表中;(4)在图像窗口中选择另一个红色区域,再绘制一个多边形aoi;(5)同样在signature editor窗口,单击create new signature 图标,将多边形aoi区域加载到signature editor分类模板属性表中;(6)重复上述两步操作过程,选择图

13、像中您认为属性相同的多个红色区域绘制若干多边形aoi,并将其作为模板依次加入到signature editor分类模板属性表中;(7)按下shift键,同时在signature editor分类模板属性表中依次单击选择class字段下面的分类编号,将上面加入的多个红色区域aoi模板全部选定;(8)在signature editor工具条,单击merge signature 图标,将多个红色区域aoi模板合并,生成一个综合的新模板,其中包含了合并前的所有模板像元属性;(9)在signature editor菜单条,单击edit/delete,删除合并前的多个模板;(10)在signature e

14、ditor属性表,改变合并生成的分类模板的属性;包括名称与颜色分类名称(signature name)(11)重复上述所有操作过程,根据实地调查和已有研究成果,在图像窗口选择绘制多个黑色区域aoi(水体),依次加载到signature editor分类属性表,并执行合并生成综合的水体分类模板,然后确定分类模板名称和颜色;(12)同样重复上述所有操作过程,绘制多个其他类型的aoi,加载、合并、命名,建立新的模板;(13)如果将所有的类型都建立了分类模板,就可以保存分类模板。(保存为*sig文件) 2、评价分类模板可能性矩阵法 在Signature Editor对话框: 在signature Ed

15、itor中选择所有类别 菜单条:Evaluation Contingency 打开Contingency Matrix对话框然后,IMAGINE文本编辑器(Text Editor)被打开,分类误差矩形矩阵将显示在编辑器中供查看统计,显示分类误差数据 3、执行监督分类 Main/classification/supervised classification 在supervised classification面板中定义以下参数 在Supervised Classification对话框中,需要确定下列参数:确定输入原始文件(Input Raster File): germtm.img定义输出分

16、类文件(Classified File): Classify.img确定分类模板文件(Input Signature File): fenleiban.sig选择输出分类距离文件:Distance File(用于分类结果进行阈值处理)定义分类距离文件(Filename): distance.img选择非参数规则(Non_parametric Rule):Feature Space选择叠加规则(Overlay Rule):Parametric Rule选择未分类规则(Unclassified Rule):Parametric Rule4、分类后处理(1)聚类统计 分类结果中会产生一些面积很小的图

17、斑,有必要对这些小图斑进行剔除。聚类统计是通过对分类专题图像计算每个分类图斑的面积、记录相邻区域中最大图斑面积的分类值等操作,产生一个clump类组输出图像,其中每个图斑都包含clump类组属性。Clump类组输出图像是一个中间文件,用于进行下一步处理。Main/image interpreter/gis analysis/clump命令,打开clump对话框。定义下列参数:文件坐标类型(coordinate type):map;确定聚类统计邻域大小(connect neighbors):8;(2)去除分析 去除分析是用于删除原始分类图像中的小图斑或clump聚类图像中的小clump类组。El

18、iminate将删除的小图斑合并到相邻的最大的分类当中,经过eliminate处理后,将分类图斑的属性值自动恢复为clump处理前的原始分类编码。Main/image interpreter/GIS analysis/eliminate命令,打开eliminate对话框。定义下列参数:文件坐标类型(coordinate type):map;确定最小图斑大小(Minimum)为16pixels。确定输出数据类型(output)为Unsigned 8 bit。(3)栅格文件转换成矢量文件Main/vector命令,打开vector utilities对话框单击raster to vector按钮,

19、打开raster to vector对话框,确定需要转换的栅格图像和转换产生的矢量图层,单击ok完成转换。 3 非监督分类 一种无先验(已知)类别标准的分类法。对于待研究的对象或区域,没有已知类别或训练样本作标准,而直接依据样品观测资料的内在联系进行分类。 与监督分类相反,判决中所用到的各种可能类别是利用数据的固有特征而不是根据训练样本来确定的。 无监督分类不需要已知类别的训练数据,而是根据像元间的类似度大小进行合并分类。 非监督分类法的理论根据是同类样品具有内在的相似性。在影像上,同类物体在同样的条件下应具有相同的光谱信息特征,从而集群在同一个光谱空间区域里,不同类别物体因其光谱信息特征不同

20、而集群在不同的光谱空间区域里。 由于一幅复杂的图像中,分类训练区有时并不能完全包括所有的波谱样式,这就造成了一部分像元找不到归属。在实际工作中为进行监督分类而确定类别和选取训练区也是不易的,因而在开始分析图像时,用非监督分类方法来研究数据的本来结构及其自然点群的分布情况是很有价值的。非监督分类方法1. 非监督分类的方法无监督分类的主要方法是聚类分析。聚类(Cluster)是把一组像素按照相似性归成若干类别,即“物以类聚”。它的目的是使得属于同一类别的像素之间的距离尽可能的小而不同类别上的像素间的距离尽可能的大。1. 无(非)监督分类的方法聚类分析(cluster analysis)也叫集群分析

21、,是依据特征空间中相似性样品集合于一定空间范围而形成集群的原理,确定一种反映个体间内在联系的分类结构(谱系图或树状图)。即按照亮度值向量或波谱样式在特征空间聚集的情况划分点群或类别的分类方法。从几何角度看,一个点群或类别是在N(波段数)维的特征空间里某个众数(概率取最大数的点为众数)的周围数据点(像元)相对密集的区域,亮度值向量之间具有更大的相似性,因此聚类分析首先需要确定对于这种相似性的度量。可以作为这种相似性度量的基本数据特征有两个,一是在特征空间中亮度值向量的距离,也可称为相似距离;一是在特征空间中不同区域的数据点密度(像元数目)。同一点群中的距离应该比不同点群中两个样式之间的距离小得多

22、。点群与点群之间是像元比较稀疏的地区。地物类别与点群亦不是完全等同的,一个点群可能包含不同地物类,一个地物类也可能包括几个点群。在缺乏已知类别的训练数据,也不知道有多少类的情况下,由程序来划分符合实际的点群或类别是一个复杂的课题,一般不可能一次完成,需要经过一个反复的检验过程,而且要由分析人员提供一定的参数来控制这个过程。非监督分类的方法一个典型的聚类分析程序包括:选定初始聚类中心用最小距离原则进行归类循回式的检查和修改输出分类结果1) 选定初始聚类中心初始聚类中心亦叫“种子(Seed)”,是在程序开始时选定几个均值向量,作为假定的聚类中心,并不一定是真正的聚类中心。选定方法有两种: (1)按

23、照一定的算法由程序本身来产生; (2)由用户根据经验或图像直方图的情况直 接提供均值向量数据。2)用最小距离原则进行归类选定了聚类中心后,就要计算每个像元到各个中心之间的距离,用最小距离的原则把像元规划到不同的集群或类别。在最小距离分类中常用的距离函数:欧几里德距离、街道距离由确定聚类中心到按最小距离归类,构成一个循回。但是,按初始聚类中心划分的点群总是不完善的,还要经过不止一次的检验和修改;每一次都要改变一些聚类中心,然后重新计算距离和归类,这样经过若干次的反复,便使之渐趋完善。从节省运算时间出发,当然希望循回少一些为好。一般来讲,如果初始聚类中心比较接近地物类别的实际,可以经过少数几个循回

24、就可达到分类的要求。3)检查和修改聚类中心根据规定的参数来检查前一循回中归类的结果。决定进行再分裂、合并或者取消某些集群。再分裂:(1)已有的集群数小于参数“预期的集群数”;(2)某一类的像元数大于参数“一类中的最大像元数”,或标准差超过了参数“最大标准差”;(3)当一个均值的点群或类别的第j个波段的标准差Sj超过了最大标准差时,就分裂为两个新的集群中心。合并:把原来已分为两个集群的像元合并到一起,重新计算其中心(均值)。(1)两个集群之间的统计距离小于确定的阈值(最小集群间距);(2)集群的数目超过了规定的“最大分类数”。取消:一集群中心像元数太少,小于参数“一类中最少像元数”时,这一点群被

25、取消,其成员分散到相邻的集群中去。4)输出分类结果输出的分类结果取决于具体的数据特征和分析人员的要求。并不是循回次数越多越好。一般在达到预先次数,或所有像元已经归入适当地类别,不需要再分裂或合并时,就算完成了。有时程序中规定了一个移动距离阈值,即前后两个循回间各类均值向量的平均移动距离,用像元值的单位表示,小于这个值就停止。2. 常用的聚类分析方法聚类分析常用方法有:分级集群法动态聚类法1)分级集群法 分级集群法采用“距离”评价每个像元在空间分布的相似程度,把它们的分布分割或者合并成不同的集群。每个集群的地理意义需要根据地面调查或者与已知类型的数据比较后方可确定。 分级集群法的分类过程如下:确

26、定评价各样本相似程度所采用的指标,可采用前面介绍的几种距离。初定分类总数n。计算个体间的距离;根据距离最近的原则判定归并到不同类别归并后的类别作为新类,与剩余的类别重新组合,然后再计算并改正其距离。重复样本间相似度的评价和归并,直到所有像素都归入到各类别中去。 分级集群法是分级进行的,在迭代过程中没有调整类别总数的措施,如果一个像元被归入到某一类后,就排除了它再被归入到其他分支类别中的可能性,这样可能导致对一个像元的操作次序不同,会得到不同的分类结果,这是该方法的缺点。分级集群法的特点:2)动态聚类法在初始状态给出图像粗糙的分类,然后基于一定原则在类别间重新组合样本,直到分类比较合理为止,这种

27、聚类方法就是动态聚类。ISODATA (Iterative Self-Organizing Data Analysis Technique)迭代自组织数据分析技术方法在动态聚类法中具有代表性。按照某个原则选择一些初始类聚类中心。在实际操作中,要把初始聚类数设定得大一些,同时引入各种对迭代次数进行控制的参数,如控制迭代的总次数、每一类别最小像元数、类别的标准差、比较相邻两次迭代效果以及可以合并的最大类别对数等,在整个迭代过程中,不仅每个像元的归属类别在调整,而且类别总数也在变化。在用计算机编制分类程序时,初始聚类中心可按如下方式确定:设初始类别数为n,这样共有n个初始聚类中心,求出图像的均值M和

28、方差,按下式可求出初始聚类中心: ISODATA方法k=1,2,n,为初始类中心编号,n为初始类总数。计算像素与初始类别中心的距离。把该像素分配到最近的类别中。动态聚类法中类别间合并或分割所使用的判别标准是距离,待分像元在特征空间中的距离说明互相之间的相似程度,距离越小,相似性大,则它们可能会归入同一类。这里的距离可以采用前面介绍的几种距离。计算并改正重新组合的类别中心。如果重新组合的像素数目在最小允许值以下,则将该类别取消,并使总类别数减1。当类别数在一定的范围,类别中心间的距离在阈值以上,类别内的方差的最大值为阈值以下时,可以看作动态聚类的结束。当不满足动态聚类的结束条件时,就要通过类别的

29、合并及分离,调整类别的数目和中心间的距离等,然后返回到上一步,重复进行组合的过程。监督/非监督分类方法比较 根本区别点在于是否利用训练样区来获取先验的类别知识监督分类根据训练样区提供的样本选择特征参数,建立判别函数,对待分类点进行分类。因此,训练场地选择是监督分类的关键。对于不熟悉区域情况的人来说,选择足够数量的训练样区带来很大的工作量,操作者需要将相同比例尺的数字地形图叠在遥感影像上,根据地形图上的已知地物类型圈定分类用的训练样区。由于训练样区要求有代表性,训练样本的选择要考虑到地物光谱特征,样本数目要能满足分类的要求,有时这些还不易做到,这是监督分类不足之处。相比之下,非监督分类不需要更多

30、的先验知识,它根据地物的光谱统计特性进行分类。因此,非监督分类方法简单,且分类具有一定的精度。严格说来,分类效果的好坏需要经过实际调查来检验。当光谱特征类能够和唯一的地物类型(通常指水体、不同植被类型、土地利用类型、土壤类型等)相对应时,非监督分类可取得较好分类效果。当两个地物类型对应的光谱特征类差异很小时,非监督分类效果不如监督分类效果好。3. 分类后处理不管是监督分类还是非监督分类,其结果都会产生一些面积很小的图斑。无论从专题制图的角度还是实际应用的角度,都有必要对这些小图斑进行剔除。处理方法如下:聚类统计(Clump )过滤分析(Sieve )去除分析(Eliminate ) 分类重编码(Recode)聚类统计(Clump )通过对分类专题图像计算每个分类图斑的面积、记录相邻区域中最大图斑面积的分类值等操作,产生一个Clump类组输出图像,其中每个图斑都包含Clump类组属性。这是一个中间结果,供下一步处理使用。对经Clump处理后的Clump类组图像进行处理,按照定义的数值大小,删除Clump图像中较小的类组图斑,并给所有小图斑赋予新的属性值0。显然,这引出了一个小图斑归属问题。可以与原分类图对比确定新属性。过滤分析(Sieve )去除分析(Eliminate )用于删除原始

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论