版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
遥感图像分类2015年4月遥感图像分类1图像分类基本概念和原理遥感图像分类过程非监督分类方法监督分类方法分类后处理内容大纲图像分类基本概念和原理内容大纲2遥感图像分类是图像信息提取的一种方法遥感图像分类是遥感数字图像处理的重要环节,也是遥感应用最广泛的领域之一遥感图像自动识别分类提取信息的类型举例分类土地覆盖、树种识别、植被和农作物变化检测土地覆盖变化物理量的提取温度、大气成分、高程、土壤含水量指标提取植被指数、浑浊指标特定地物和状态的提取山火、水灾、线形构造、遗迹探察遥感图像分类是图像信息提取的一种方法遥感图像自动识别分类提取3在特征空间中,依据像元相似度的大小,归类相似的像元,分离不相似的像元,并给每一个像元赋类别值的过程分类的总目标是将图像中所有的像元自动进行土地覆盖类型或土地覆盖专题的分类什么是遥感图像计算机分类?在特征空间中,依据像元相似度的大小,归类相似的像元,分离不相4计算机分类实例原始遥感图像对应的专题图像计算机分类实例原始遥感图像对应的专题图像5遥感图像遥感图像计算机分类流程框图色调、颜色、阴影、形状、纹理、大小、位置、图型、相关布局遥感图像特征集基于光谱的基于空间关系的统计分类结构分类模糊分类神经网络分类小波分析专家系统遥感图像计算机分类光谱模式识别空间模式识别新方法遥感图像遥感图像计算机分类流程框图色调、颜色、阴影、形状、纹6计算机分类较目视解译的优势?将影像数据的连续变化转化为地图模式,以提供给用户有意义的信息获得关于地面覆盖和地表特征数据的更深刻的认识较目视解译客观,在分析大数据集时比较经济可对复杂的多波段数据及其相互关系进行有效分析计算机分类较目视解译的优势?将影像数据的连续变化转化为地图模7光谱特征空间光谱特征空间:以各波段图像的亮度分布为坐标轴组成的空间同类地物在特征空间形成一个相对聚集的点集群不同类地物的点集群在特征空间内一般是相互分离的
光谱特征空间光谱特征空间:以各波段图像的亮度分布为坐标轴组成8SPOT影像SPOT影像9真实二维特征空间示例1-21-31-42-32-43-4真实二维特征空间示例1-21-31-42-32-43-410特征空间中的距离“物以类聚”,而图像分类的依据通常是像元之间的相似性。相似性通常又采用“距离”来度量。距离可以有不同的具体定义几何距离:欧式距离、绝对值距离统计距离:马氏距离特征空间中的距离“物以类聚”,而图像分类的依据通常是像元之间11几何距离:欧氏距离几何距离:欧氏距离12X到集群中心在多维空间中距离的绝对值之总和来表示几何距离:绝对值距离X到集群中心在多维空间中距离的绝对值之总和来表示几何距离:13统计距离:马氏距离马氏距离几何意义:X到类重心之间的加权距离,其权系数为协方差统计距离:马氏距离马氏距离几何意义:X到类重心之间的加权距14图像分类方法按人工干预的程度不同,可以分为:非监督分类法监督分类法图像分类方法按人工干预的程度不同,可以分为:15分类步骤选择合适的分类算法用所选算法分割特征空间根据像元在特征空间中的定位对每一个像元赋类别值对分类结果进行精度评价分类步骤选择合适的分类算法16在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要根据像元间相似度的大小进行归类合并(将相似度大的像元归为一类)的方法根据图像数据本身的统计特征及点群的分布情况,从纯统计学的角度对图像数据进行类别划分非监督分类在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别17利用事先定义的参数确定特征空间中类别的位置,然后确定单个像元是否属于某个类别聚类利用事先定义的参数确定特征空间中类别的位置,然后确定单个像元18一般的聚类算法是先选择若干个点作为聚类的中心每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各点归于各聚类中心所代表的类别,形成初始分类然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止聚类过程一般的聚类算法是先选择若干个点作为聚类的中心聚类过程19按照某个原则选择一些初始聚类中心计算像元与初始类别中心的距离,把像素分配到最近的类别中聚类过程按照某个原则选择一些初始聚类中心聚类过程20计算并改正重新组合的类别中心过程重复直到满足迭代结束的条件聚类过程计算并改正重新组合的类别中心聚类过程21仅凭遥感影像地物的光谱特征的分布规律,即自然聚类的特性,进行“盲目”的分类其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性;其类别的属性是通过分类结束后目视判读或实地调查确定的非监督分类仅凭遥感影像地物的光谱特征的分布规律,即自然聚类的特性,进行22简单集群分类方法K-均值法(K-meansAlgorithm)Cluster分类法迭代自组织数据分析技术方法(IterativeSelf-OrganizationDataAnalysisTechniques,ISODATA)主要的非监督分类方法简单集群分类方法主要的非监督分类方法23K-均值法通过自然的聚类,把它分成8类K-均值法通过自然的聚类,把它分成8类24K-均值算法的聚类准则是使每一聚类中,像元到该类别中心的距离的平方和最小基本思想:通过迭代,逐次移动各类的中心,直至得到最好的聚类结果为止K-均值法K-均值算法的聚类准则是使每一聚类中,像元到该类别中心的距离25(1)确定类别数并各类的初始中心:z1(0),z2(0),…,zK(0),K为类别数。初始中心可任意选取初始中心的选择对聚类结果有一定影响,初始中心的选择一般有以下方法:①根据问题的性质,用经验的方法确定类别数K,从数据中找出从直观上看来比较适合的K个类的初始中心②将全部数据随机地分为K个类别,对计算每类的重心,将这些重心作为K个类的初始中心K-均值法(1)确定类别数并各类的初始中心:z1(0),z2(0),26(2)择近分类,即将所有像元按照与各中心的距离最小的原则分到K个聚类中心(3)计算新中心。待所有样本第i次划分完毕后,重新计算新的集群中心zj(i+1),j=1,2,…,K(4)如果聚类中心不变,则算法收敛,聚类结束;否则回到(2),进入下一次迭代K-均值法(2)择近分类,即将所有像元按照与各中心的距离最小的原则分到27优点:实现简单缺点:过分依赖初值,容易收敛于局部极值在迭代过程中没有调整类数的措施,产生的结果受到所选聚类中心的数目、初始位置、类分布的几何性质和读入次序等因素影响较大初始分类选择不同,最后的分类结果可能不同K-均值法优点:实现简单K-均值法28IterativeSelf-OrganizationDataAnalysisTechniques“迭代自组织数据分析技术方法”的简称可以自动地进行类别的“合并”和“分裂”,从而得到比较合理的聚类结果
ISODATAIterativeSelf-OrganizationDa29(1)初始化,设置参数;(2)选择初始聚类中心;(3)按一定规则(如距离最小)对所有像元分配类别;(4)计算并改正重新组合的类别中心;(5)类别的分裂和合并;(6)如果达到迭代次数或者两次迭代之间类别均值变化小于阈值,则结束迭代;否则,重复(3)-(6);(7)确认类别,对结果进行精度评估ISODATA基本同K-均值法,但K-均值法的类别数是从始至终固定的,而ISODATA方法则是动态调整类别数的(1)初始化,设置参数;ISODATA基本同K-均值法,但K30K:希望得到的类别数θN:所希望的一个类中样本的最小数目θS:类的分散程度的参数(如标准差、方差)θC:类间距离的参数(如最小距离)L:每次允许合并的类的对数I:允许迭代的次数ISODATA参数的设定决定类的“分裂”与“合并”
结束迭代的条件K:希望得到的类别数ISODATA参数的设定决定类的“分31合并(类数-1)每一类中的像元个数少于期望的类别最少像元数θN类别的个数大于期望的类别数K的2倍分裂(类数+1)类别的标准差大于类别标准差阈值θS类别的个数小于期望的类别数K的1/2当类别数在一定范围内,类别中心间的距离在阈值以上,类别内的方差的最大值在阈值以下ISODATA调整类别数的准则合并(类数-1)ISODATA调整类别数的准则32两次迭代之间,如果上一次和这一次的中心不变,或者变化小于一个阈值,说明聚类结束如果迭代次数达到了预设值I,那么即使不收敛,也强行结束ISODATA判断迭代结束两次迭代之间,如果上一次和这一次的中心不变,或者变化小于一个33类别数:20迭代次数:20ISODATA类别数:20ISODATA34类别数:10迭代次数:10ISODATA类别数:10ISODATA35优点:不需要预先对待分类区域有广泛的了解需要较少的人工参与,人为误差的机会减少小的类别能够被区分出来缺点:盲目的聚类难以对产生的类别进行控制,得到的类别不一定是想要的类别计算速度慢非监督分类方法的特点优点:非监督分类方法的特点36确定每个类别的样区学习或训练确定判别函数和相应的判别准则计算未知类别的函数值按规则进行像元的所属判别监督分类的思想确定每个类别的样区监督分类的思想37监督法分类首先需要从研究区域选取有代表性的训练场地作为样本根据已知训练区提供的样本,建立判别函数,据此对样本像元进行分类,依据样本类别的特征来识别非样本像元的归属类别监督法分类首先需要从研究区域选取有代表性的训练场地作为样本38监督法分类主要步骤选择训练样本区确定类别数对每类选择足够多的有代表性的样本分类前分析样本区质量选择合适的分类算法分类结果的精度评价监督法分类主要步骤39准确性——确保选择的样区与实际地物的一致性代表性——考虑到地物本身的复杂性,所以必须在一定程度上反映同类地物光谱特性的波动情况统计性——选择的训练样区内必须有足够多的像元训练样区的选择准确性——确保选择的样区与实际地物的一致性训练样区的选择40选择训练区选择训练区41训练区与特征空间的联系训练区与特征空间的联系42水新城区老城区耕地植被
选择样本区域水新城区老城区耕地植被选择样本区域43建立类别的判别函数水老城区新城区植被红255绿255••••耕地0•蓝255
将样本数据在特征空间进行聚类建立类别的判别函数水老城区新城区植被红255绿255••••44主要的监督分类方法距离判别函数和距离判别规则最小距离分类法最近邻分类算法平行六面体分类法概率判别函数和贝叶斯判别规则最大似然分类法主要的监督分类方法距离判别函数和距离判别规则45基本思想是设法计算未知矢量X到有关类别集群之间的距离,哪类距离它最近,该未知矢量就属于那类距离判决函数偏重于集群分布的几何位置距离判别规则是按最小距离判别的原则最小距离分类法基本思想是设法计算未知矢量X到有关类别集群之间的距离,哪类距46最小距离分类法最小距离分类法47以一个包括该集群的“盒子”作为该集群的判别函数判决规则为若未知矢量X落入该“盒子”,则X分为此类,否则再与其它盒子比较这种分类法在盒子重叠区域有错分现象,错分与比较盒子的先后次序有关平行六面体分类法基本思想以一个包括该集群的“盒子”作为该集群的判别函数平行六面体分类48平行六面体分类法平行六面体分类法49最大似然分类法地物类数据在特征空间中构成特定的点群,每一类的每一维数据都在自己的数轴上为正态分布,该类的多维数据就构成了一个多维正态分布,各类的多维正态分布模型各有其分布特征利用各类的已知数据(训练区),求出均值、方差及协方差等特征参数,从而求出总体的概率密度函数在此基础上,对于任何一个像元,通过求出每个像素对于各类别的归属概率(对于待分像元x,从属于分类类别k的概率),把该像素分到归属概率最大的类别中去最大似然分类法地物类数据在特征空间中构成特定的点群,每一类的50最大似然分类法最大似然分类法51最大似然分类法利用概率判别函数与贝叶斯判别规则进行分类优点:考虑特征空间中类别的形状、大小和定位缺点:计算量大,计算时间长假定地物光谱特征呈正态分布最大似然分类法利用概率判别函数与贝叶斯判别规则进行分类52根据应用目的和区域,有选择的决定分类类别,避免出现一些不必要的类别可以控制训练样本的选择可以通过检查训练样本来决定训练样本是否被精确分类,从而避免分类中的严重错误,分类精度高避免了非监督分类中对光谱集群的重新归类分类速度快监督法分类的优点根据应用目的和区域,有选择的决定分类类别,避免出现一些不必要53主观性由于图像中间类别的光谱差异,使得训练样本没有很好的代表性训练样本的获取和评估花费较多人力时间只能识别训练中定义的类别监督法分类的缺点主观性监督法分类的缺点54面向对象的分类方法人工神经网络分类法决策树分类法专家系统分类法基于GIS的遥感图像分类方法模糊分类方法数字图像分类新技术面向对象的分类方法数字图像分类新技术55基于像素级别的信息提取以单个像素为单位,过于着眼于局部而忽略了附近整片图斑的几何结构情况,从而严重制约了信息提取的精度面向对象的分类方法首先对图像数据进行影像分割,影像的最小单元不再是单个的像素,而是一个个对象(图斑),后续的影像分析和处理也都基于对象进行优点:面向对象的遥感信息提取,综合考虑了光谱统计特征、形状、大小、纹理、相邻关系等一系列因素,因而具有更高精度的分类结果面向对象的分类方法基于像素级别的信息提取以单个像素为单位,过于着眼于局部而忽略56遥感图像分类课件57遥感图像分类课件58遥感图像分类课件59遥感图像分类课件60决策树分类采取逐次分类的方法,先确定特征明显的大类别,对每一大类再作进一步的划分,直到所有类别全部分出为止在不同层次可以更换分类方法,也可以更换分类特征,以提高这类别的可分性决策树分类法城市非建筑物建筑物裸地植被树木草地决策树分类采取逐次分类的方法,先确定特征明显的大类别,对每一61将原有的GIS数据和各种土地利用类型变化的先验性知识综合集成用于新的遥感图像的分类中,不仅可以促进GIS数据更新的自动化,而且还可以得到比常规最大似然法高的分类精度基于GIS的遥感图像分类方法将原有的GIS数据和各种土地利用类型变化的先验性知识综合集成62遥感影像经分类后形成的专题图,用编号、字符、图符或颜色表示各种类别分类后处理原始遥感图像对应的专题图像遥感影像经分类后形成的专题图,用编号、字符、图符或颜色表示各63用光谱信息对影像逐个像元地分类,在结果的分类地图上会出现“噪声”分类后处理用光谱信息对影像逐个像元地分类,在结果的分类地图上会出现“噪64产生噪声的原因有原始影像本身的噪声,在地类交界处的像元中包括有多种类别,其混合的幅射量造成错分类,以及其它原因等另外还有一种现象,分类是正确的,但某种类别零星分布于地面,占的面积很小,我们对大面积的类型感兴趣,因此希望用综合的方法使它从图面上消失分类后处理产生噪声的原因有原始影像本身的噪声,在地类交界处的像元中包括65分类后处理多数平滑:平滑时中心像元值取周围占多数的类别(少数服从多数原则)分类后处理多数平滑:平滑时中心像元值取周围占多数的类别(少数66平滑前后的一个例子平滑前后的一个例子67分类精度评价混淆矩阵Kappa系数制约分类精度的因素提高分类精度的方法分类后的误差分析分类精度评价分类后的误差分析68混淆矩阵是由n行n列组成的矩阵,用来表示分类结果的精度混淆矩阵是通过将每个像元的位置和地面参考验证信息与计算机分类结果中的相应位置和类别来比较计算的混淆矩阵(ConfusionMatrix)混淆矩阵是由n行n列组成的矩阵,用来表示分类结果的精度混淆矩69混淆矩阵的每一列代表了地表实测值(参考验证信息),每一列中的数值等于地表真实像元在分类图像中对应于相应类别的数量混淆矩阵的每一行代表了计算机的分类信息,每一行中的数值等于计算机分类像元在地表真实像元相应类别中的数量混淆矩阵混淆矩阵的每一列代表了地表实测值(参考验证信息),每一列中的70有150个样本数据,这些数据在计算机分类结果中被分成3类,每类50个。分类结束后得到的混淆矩阵为:类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3类2的50个样本有45个分类正确,2个错分为类1,3个错分为类3类3的50个样本有49个分类正确,0个错分为类1,1个错分为类2混淆矩阵实际类别类1类2类3行和分类类别类1435250类2245350类3014950列和455154有150个样本数据,这些数据在计算机分类结果中被分成3类,每71矩阵主对角线上的数字就是分类正确的像元数,主对角线上的数字越大,分类精度越高;主对角线以外的数字就是错分的像元数,这些数字越小,错分率就越小,精度就越高精度评估的指标总精度用户精度生产者精度(制图精度)混淆矩阵矩阵主对角线上的数字就是分类正确的像元数,主对角线上的数字越72总精度:由正确分类的总像元数(沿着主对角线上的元素的和)除以所包含的总像元数来计算(43+45+49)/150=91.3%混淆矩阵总精度:由正确分类的总像元数(沿着主对角线上的元素的和)除以73用户精度由每一类别被正确分类的像元数目除以被分作该类的总像元数(行元素之和)这个数字表示一个像元被分到指定类别的可能性,这个指定类别代表了地面的实际类别类1的用户精度:43/50=86%类2的用户精度:45/50=90%类3的用户精度:49/50=98%混淆矩阵用户精度由每一类别被正确分类的像元数目除以被分作该类的总像元74生产者精度由每一类中正确分类的像元数(位于主对角线上)除以该类用做训练样区的像元数目(列元素之和)这个数字表明指定覆盖类型的训练样区集的像元被分类后,它的效果有多好类1的生产者精度:43/45=96%类2的生产者精度:45/51=88%类3的生产者精度:49/54=91%混淆矩阵生产者精度由每一类中正确分类的像元数(位于主对角线上)除以该75例:森林类别的生产者精度为84%,用户精度为60%。表示在分类结果中有84%的森林被正确的分类为森林,但所有分类为森林的地区只有60%的地区真正属于森林这个类别混淆矩阵例:森林类别的生产者精度为84%,用户精度为60%。混淆矩阵76m=误差矩阵中行的数量(即总的类别数)xii=第i行第i列上的像元数量(即主对角线上正确分类的数量)xi+=在第i行的总像元数量x+i=在第i列的总像元数量N=用于精度评估的总像元数量Kappa系数Kappa系数77分类总体精度与Kappa的区别:总体精度只用到了位于对角线上的像元数量Kappa则既考虑了对角线上被正确分类的像元,又考虑了不在对角线上的各种漏分和错分错误Kappa系数分类总体精度与Kappa的区别:Kappa系数78遥感图像的制约地物本身的复杂性传感器的性能分类方法的制约目前的分类方法是基于统计的方法,计算机处理的对象是单个像元,属于单点分类地物空间结构的信息没有利用制约分类精度的因素遥感图像的制约制约分类精度的因素79同物异谱:同类地物具有不同的光谱特征。例如:同一类作物,生长状态不同,光谱特征有差异同谱异物:不同的地物可能具有相似的光谱特征。例如:不同的植被类型可能有相似的光谱特征制约分类精度的因素不同含水量的土壤的波谱曲线
不同叶绿素浓度海水的波谱曲线
同物异谱:同类地物具有不同的光谱特征。例如:同一类作物,生长80目视判读用到的信息与计算机自动分类所用信息的区别目视判读计算机自动分类处理对象多个像元的组合单个像元面积的估算粗略的精确的波段最多3个波段没有限制分别灰阶的能力大约十几个灰阶能够充分利用所有灰阶地物形状可以利用存在限制,依赖于算法空间信息可以利用存在限制非遥感信息可以利用(图像融合)可以利用,程度不够处理时间慢快结果重现差好目视判读用到的信息与计算机自动分类所用信息的区别目视判读计算81目视判读用到的信息与计算机自动分类所用信息的区别目前计算机能够利用的信息还是很有限的目视判读用到的信息与计算机自动分类所用信息的区别目前计算机能82一方面从地物本身的复杂性着手,一方面从分类方法着手提高分类前预处理的精度决策树分类,即分层分类混合分类多种信息的复合与GIS的集成基于对象的遥感图像分类提高分类精度的方法一方面从地物本身的复杂性着手,一方面从分类方法着手提高分类精83遥感图像分类的基础是什么?影响分类精度的因素有哪些?比较最大似然法与最小距离法的优缺点比较K均值法与ISODATA法的优缺点比较监督分类与非监督分类的优缺点思考题遥感图像分类的基础是什么?思考题84遥感图像分类2015年4月遥感图像分类85图像分类基本概念和原理遥感图像分类过程非监督分类方法监督分类方法分类后处理内容大纲图像分类基本概念和原理内容大纲86遥感图像分类是图像信息提取的一种方法遥感图像分类是遥感数字图像处理的重要环节,也是遥感应用最广泛的领域之一遥感图像自动识别分类提取信息的类型举例分类土地覆盖、树种识别、植被和农作物变化检测土地覆盖变化物理量的提取温度、大气成分、高程、土壤含水量指标提取植被指数、浑浊指标特定地物和状态的提取山火、水灾、线形构造、遗迹探察遥感图像分类是图像信息提取的一种方法遥感图像自动识别分类提取87在特征空间中,依据像元相似度的大小,归类相似的像元,分离不相似的像元,并给每一个像元赋类别值的过程分类的总目标是将图像中所有的像元自动进行土地覆盖类型或土地覆盖专题的分类什么是遥感图像计算机分类?在特征空间中,依据像元相似度的大小,归类相似的像元,分离不相88计算机分类实例原始遥感图像对应的专题图像计算机分类实例原始遥感图像对应的专题图像89遥感图像遥感图像计算机分类流程框图色调、颜色、阴影、形状、纹理、大小、位置、图型、相关布局遥感图像特征集基于光谱的基于空间关系的统计分类结构分类模糊分类神经网络分类小波分析专家系统遥感图像计算机分类光谱模式识别空间模式识别新方法遥感图像遥感图像计算机分类流程框图色调、颜色、阴影、形状、纹90计算机分类较目视解译的优势?将影像数据的连续变化转化为地图模式,以提供给用户有意义的信息获得关于地面覆盖和地表特征数据的更深刻的认识较目视解译客观,在分析大数据集时比较经济可对复杂的多波段数据及其相互关系进行有效分析计算机分类较目视解译的优势?将影像数据的连续变化转化为地图模91光谱特征空间光谱特征空间:以各波段图像的亮度分布为坐标轴组成的空间同类地物在特征空间形成一个相对聚集的点集群不同类地物的点集群在特征空间内一般是相互分离的
光谱特征空间光谱特征空间:以各波段图像的亮度分布为坐标轴组成92SPOT影像SPOT影像93真实二维特征空间示例1-21-31-42-32-43-4真实二维特征空间示例1-21-31-42-32-43-494特征空间中的距离“物以类聚”,而图像分类的依据通常是像元之间的相似性。相似性通常又采用“距离”来度量。距离可以有不同的具体定义几何距离:欧式距离、绝对值距离统计距离:马氏距离特征空间中的距离“物以类聚”,而图像分类的依据通常是像元之间95几何距离:欧氏距离几何距离:欧氏距离96X到集群中心在多维空间中距离的绝对值之总和来表示几何距离:绝对值距离X到集群中心在多维空间中距离的绝对值之总和来表示几何距离:97统计距离:马氏距离马氏距离几何意义:X到类重心之间的加权距离,其权系数为协方差统计距离:马氏距离马氏距离几何意义:X到类重心之间的加权距98图像分类方法按人工干预的程度不同,可以分为:非监督分类法监督分类法图像分类方法按人工干预的程度不同,可以分为:99分类步骤选择合适的分类算法用所选算法分割特征空间根据像元在特征空间中的定位对每一个像元赋类别值对分类结果进行精度评价分类步骤选择合适的分类算法100在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要根据像元间相似度的大小进行归类合并(将相似度大的像元归为一类)的方法根据图像数据本身的统计特征及点群的分布情况,从纯统计学的角度对图像数据进行类别划分非监督分类在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别101利用事先定义的参数确定特征空间中类别的位置,然后确定单个像元是否属于某个类别聚类利用事先定义的参数确定特征空间中类别的位置,然后确定单个像元102一般的聚类算法是先选择若干个点作为聚类的中心每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各点归于各聚类中心所代表的类别,形成初始分类然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止聚类过程一般的聚类算法是先选择若干个点作为聚类的中心聚类过程103按照某个原则选择一些初始聚类中心计算像元与初始类别中心的距离,把像素分配到最近的类别中聚类过程按照某个原则选择一些初始聚类中心聚类过程104计算并改正重新组合的类别中心过程重复直到满足迭代结束的条件聚类过程计算并改正重新组合的类别中心聚类过程105仅凭遥感影像地物的光谱特征的分布规律,即自然聚类的特性,进行“盲目”的分类其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性;其类别的属性是通过分类结束后目视判读或实地调查确定的非监督分类仅凭遥感影像地物的光谱特征的分布规律,即自然聚类的特性,进行106简单集群分类方法K-均值法(K-meansAlgorithm)Cluster分类法迭代自组织数据分析技术方法(IterativeSelf-OrganizationDataAnalysisTechniques,ISODATA)主要的非监督分类方法简单集群分类方法主要的非监督分类方法107K-均值法通过自然的聚类,把它分成8类K-均值法通过自然的聚类,把它分成8类108K-均值算法的聚类准则是使每一聚类中,像元到该类别中心的距离的平方和最小基本思想:通过迭代,逐次移动各类的中心,直至得到最好的聚类结果为止K-均值法K-均值算法的聚类准则是使每一聚类中,像元到该类别中心的距离109(1)确定类别数并各类的初始中心:z1(0),z2(0),…,zK(0),K为类别数。初始中心可任意选取初始中心的选择对聚类结果有一定影响,初始中心的选择一般有以下方法:①根据问题的性质,用经验的方法确定类别数K,从数据中找出从直观上看来比较适合的K个类的初始中心②将全部数据随机地分为K个类别,对计算每类的重心,将这些重心作为K个类的初始中心K-均值法(1)确定类别数并各类的初始中心:z1(0),z2(0),110(2)择近分类,即将所有像元按照与各中心的距离最小的原则分到K个聚类中心(3)计算新中心。待所有样本第i次划分完毕后,重新计算新的集群中心zj(i+1),j=1,2,…,K(4)如果聚类中心不变,则算法收敛,聚类结束;否则回到(2),进入下一次迭代K-均值法(2)择近分类,即将所有像元按照与各中心的距离最小的原则分到111优点:实现简单缺点:过分依赖初值,容易收敛于局部极值在迭代过程中没有调整类数的措施,产生的结果受到所选聚类中心的数目、初始位置、类分布的几何性质和读入次序等因素影响较大初始分类选择不同,最后的分类结果可能不同K-均值法优点:实现简单K-均值法112IterativeSelf-OrganizationDataAnalysisTechniques“迭代自组织数据分析技术方法”的简称可以自动地进行类别的“合并”和“分裂”,从而得到比较合理的聚类结果
ISODATAIterativeSelf-OrganizationDa113(1)初始化,设置参数;(2)选择初始聚类中心;(3)按一定规则(如距离最小)对所有像元分配类别;(4)计算并改正重新组合的类别中心;(5)类别的分裂和合并;(6)如果达到迭代次数或者两次迭代之间类别均值变化小于阈值,则结束迭代;否则,重复(3)-(6);(7)确认类别,对结果进行精度评估ISODATA基本同K-均值法,但K-均值法的类别数是从始至终固定的,而ISODATA方法则是动态调整类别数的(1)初始化,设置参数;ISODATA基本同K-均值法,但K114K:希望得到的类别数θN:所希望的一个类中样本的最小数目θS:类的分散程度的参数(如标准差、方差)θC:类间距离的参数(如最小距离)L:每次允许合并的类的对数I:允许迭代的次数ISODATA参数的设定决定类的“分裂”与“合并”
结束迭代的条件K:希望得到的类别数ISODATA参数的设定决定类的“分115合并(类数-1)每一类中的像元个数少于期望的类别最少像元数θN类别的个数大于期望的类别数K的2倍分裂(类数+1)类别的标准差大于类别标准差阈值θS类别的个数小于期望的类别数K的1/2当类别数在一定范围内,类别中心间的距离在阈值以上,类别内的方差的最大值在阈值以下ISODATA调整类别数的准则合并(类数-1)ISODATA调整类别数的准则116两次迭代之间,如果上一次和这一次的中心不变,或者变化小于一个阈值,说明聚类结束如果迭代次数达到了预设值I,那么即使不收敛,也强行结束ISODATA判断迭代结束两次迭代之间,如果上一次和这一次的中心不变,或者变化小于一个117类别数:20迭代次数:20ISODATA类别数:20ISODATA118类别数:10迭代次数:10ISODATA类别数:10ISODATA119优点:不需要预先对待分类区域有广泛的了解需要较少的人工参与,人为误差的机会减少小的类别能够被区分出来缺点:盲目的聚类难以对产生的类别进行控制,得到的类别不一定是想要的类别计算速度慢非监督分类方法的特点优点:非监督分类方法的特点120确定每个类别的样区学习或训练确定判别函数和相应的判别准则计算未知类别的函数值按规则进行像元的所属判别监督分类的思想确定每个类别的样区监督分类的思想121监督法分类首先需要从研究区域选取有代表性的训练场地作为样本根据已知训练区提供的样本,建立判别函数,据此对样本像元进行分类,依据样本类别的特征来识别非样本像元的归属类别监督法分类首先需要从研究区域选取有代表性的训练场地作为样本122监督法分类主要步骤选择训练样本区确定类别数对每类选择足够多的有代表性的样本分类前分析样本区质量选择合适的分类算法分类结果的精度评价监督法分类主要步骤123准确性——确保选择的样区与实际地物的一致性代表性——考虑到地物本身的复杂性,所以必须在一定程度上反映同类地物光谱特性的波动情况统计性——选择的训练样区内必须有足够多的像元训练样区的选择准确性——确保选择的样区与实际地物的一致性训练样区的选择124选择训练区选择训练区125训练区与特征空间的联系训练区与特征空间的联系126水新城区老城区耕地植被
选择样本区域水新城区老城区耕地植被选择样本区域127建立类别的判别函数水老城区新城区植被红255绿255••••耕地0•蓝255
将样本数据在特征空间进行聚类建立类别的判别函数水老城区新城区植被红255绿255••••128主要的监督分类方法距离判别函数和距离判别规则最小距离分类法最近邻分类算法平行六面体分类法概率判别函数和贝叶斯判别规则最大似然分类法主要的监督分类方法距离判别函数和距离判别规则129基本思想是设法计算未知矢量X到有关类别集群之间的距离,哪类距离它最近,该未知矢量就属于那类距离判决函数偏重于集群分布的几何位置距离判别规则是按最小距离判别的原则最小距离分类法基本思想是设法计算未知矢量X到有关类别集群之间的距离,哪类距130最小距离分类法最小距离分类法131以一个包括该集群的“盒子”作为该集群的判别函数判决规则为若未知矢量X落入该“盒子”,则X分为此类,否则再与其它盒子比较这种分类法在盒子重叠区域有错分现象,错分与比较盒子的先后次序有关平行六面体分类法基本思想以一个包括该集群的“盒子”作为该集群的判别函数平行六面体分类132平行六面体分类法平行六面体分类法133最大似然分类法地物类数据在特征空间中构成特定的点群,每一类的每一维数据都在自己的数轴上为正态分布,该类的多维数据就构成了一个多维正态分布,各类的多维正态分布模型各有其分布特征利用各类的已知数据(训练区),求出均值、方差及协方差等特征参数,从而求出总体的概率密度函数在此基础上,对于任何一个像元,通过求出每个像素对于各类别的归属概率(对于待分像元x,从属于分类类别k的概率),把该像素分到归属概率最大的类别中去最大似然分类法地物类数据在特征空间中构成特定的点群,每一类的134最大似然分类法最大似然分类法135最大似然分类法利用概率判别函数与贝叶斯判别规则进行分类优点:考虑特征空间中类别的形状、大小和定位缺点:计算量大,计算时间长假定地物光谱特征呈正态分布最大似然分类法利用概率判别函数与贝叶斯判别规则进行分类136根据应用目的和区域,有选择的决定分类类别,避免出现一些不必要的类别可以控制训练样本的选择可以通过检查训练样本来决定训练样本是否被精确分类,从而避免分类中的严重错误,分类精度高避免了非监督分类中对光谱集群的重新归类分类速度快监督法分类的优点根据应用目的和区域,有选择的决定分类类别,避免出现一些不必要137主观性由于图像中间类别的光谱差异,使得训练样本没有很好的代表性训练样本的获取和评估花费较多人力时间只能识别训练中定义的类别监督法分类的缺点主观性监督法分类的缺点138面向对象的分类方法人工神经网络分类法决策树分类法专家系统分类法基于GIS的遥感图像分类方法模糊分类方法数字图像分类新技术面向对象的分类方法数字图像分类新技术139基于像素级别的信息提取以单个像素为单位,过于着眼于局部而忽略了附近整片图斑的几何结构情况,从而严重制约了信息提取的精度面向对象的分类方法首先对图像数据进行影像分割,影像的最小单元不再是单个的像素,而是一个个对象(图斑),后续的影像分析和处理也都基于对象进行优点:面向对象的遥感信息提取,综合考虑了光谱统计特征、形状、大小、纹理、相邻关系等一系列因素,因而具有更高精度的分类结果面向对象的分类方法基于像素级别的信息提取以单个像素为单位,过于着眼于局部而忽略140遥感图像分类课件141遥感图像分类课件142遥感图像分类课件143遥感图像分类课件144决策树分类采取逐次分类的方法,先确定特征明显的大类别,对每一大类再作进一步的划分,直到所有类别全部分出为止在不同层次可以更换分类方法,也可以更换分类特征,以提高这类别的可分性决策树分类法城市非建筑物建筑物裸地植被树木草地决策树分类采取逐次分类的方法,先确定特征明显的大类别,对每一145将原有的GIS数据和各种土地利用类型变化的先验性知识综合集成用于新的遥感图像的分类中,不仅可以促进GIS数据更新的自动化,而且还可以得到比常规最大似然法高的分类精度基于GIS的遥感图像分类方法将原有的GIS数据和各种土地利用类型变化的先验性知识综合集成146遥感影像经分类后形成的专题图,用编号、字符、图符或颜色表示各种类别分类后处理原始遥感图像对应的专题图像遥感影像经分类后形成的专题图,用编号、字符、图符或颜色表示各147用光谱信息对影像逐个像元地分类,在结果的分类地图上会出现“噪声”分类后处理用光谱信息对影像逐个像元地分类,在结果的分类地图上会出现“噪148产生噪声的原因有原始影像本身的噪声,在地类交界处的像元中包括有多种类别,其混合的幅射量造成错分类,以及其它原因等另外还有一种现象,分类是正确的,但某种类别零星分布于地面,占的面积很小,我们对大面积的类型感兴趣,因此希望用综合的方法使它从图面上消失分类后处理产生噪声的原因有原始影像本身的噪声,在地类交界处的像元中包括149分类后处理多数平滑:平滑时中心像元值取周围占多数的类别(少数服从多数原则)分类后处理多数平滑:平滑时中心像元值取周围占多数的类别(少数150平滑前后的一个例子平滑前后的一个例子151分类精度评价混淆矩阵Kappa系数制约分类精度的因素提高分类精度的方法分类后的误差分析分类精度评价分类后的误差分析152混淆矩阵是由n行n列组成的矩阵,用来表示分类结果的精度混淆矩阵是通过将每个像元的位置和地面参考验证信息与计算机分类结果中的相应位置和类别来比较计算的混淆矩阵(ConfusionMatrix)混淆矩阵是由n行n列组成的矩阵,用来表示分类结果的精度混淆矩153混淆矩阵的每一列代表了地表实测值(参考验证信息),每一列中的数值等于地表真实像元在分类图像中对应于相应类别的数量混淆矩阵的每一行代表了计算机的分类信息,每一行中的数值等于计算机分类像元在地表真实像元相应类别中的数量混淆矩阵混淆矩阵的每一列代表了地表实测值(参考验证信息),每一列中的154有150个样本数据,这些数据在计算机分类结果中被分成3类,每类50个。分类结束后得到的混淆矩阵为:类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3类2的50个样本有45个分类正确,2个错分为类1,3个错分为类3类3的50个样本有49个分类正确,0个错分为类1,1个错分为类2混淆矩阵实际类别类1类2类3行和分类类别类1435250类2245350类3014950列和455154有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全生产资金提取和使用管理制度
- 2024停车场收费管理合同
- 探究型学习活动设计 小学数学研究性学习方案
- Nortadalafil-Standard-生命科学试剂-MCE
- N-N-Dicyclohexylcarbodiimide-DCC-Standard-生命科学试剂-MCE
- 工程造价预算合同
- N-Desmethyl-Apalutamide-15N-d4-生命科学试剂-MCE
- 西部陆海新通道建设全国引领性劳动和技能竞赛乘务员技能大赛考试题库(含答案)
- 吉林血液净化护理知识竞赛考试题库(含答案)
- 换热站建设工程施工方案
- 2024年山东省淄博市中考道德与法治试卷真题
- GB/T 44723-2024氢燃料内燃机通用技术条件
- 2022年11月软考(高级)网络规划设计师上午真题
- 2024年中远海运物流限公司直属单位招聘高频难、易错点500题模拟试题附带答案详解
- 第1课 课题二《中外节日·中秋节和感恩节的比较》(教案)-2024-2025学年六年级上册综合实践活动浙教版
- 2024年共青团团课考试测试题库及答案
- 能源岗位招聘面试题与参考回答2024年
- 团队协作课件教学课件
- 2024-2025学年二年级上册语文第四单元测试卷(统编版)
- 2023-2024学年四年级上册信息技术第一单元第1课《身边的数据》教学设计浙教版2023
- 福建省龙海市龙文区2022-2023学年五年级上学期期末英语试题
评论
0/150
提交评论