遥感图像分类_第1页
遥感图像分类_第2页
遥感图像分类_第3页
遥感图像分类_第4页
遥感图像分类_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、遥感图像分类任课教师:杨晓霞2013年3月2图像分类基本概念和原理计算机分类的概念判别函数与判别规则影像空间与特征空间特征空间中的距离遥感图像分类过程监督分类方法非监督分类方法提高分类精度的方法内容大纲内容大纲遥感图像分类是图像信息提取的一种方法遥感图像分类是遥感数字图像处理的重要环节,也是遥感应用最广泛的领域之一遥感图像自动识别分类遥感图像自动识别分类提取信息的类型提取信息的类型举例举例分类分类土地覆盖、树种识别、植被和农作物土地覆盖、树种识别、植被和农作物变化检测变化检测土地覆盖变化土地覆盖变化物理量的提取物理量的提取温度、大气成分、高程、土壤含水量温度、大气成分、高程、土壤含水量指标提取

2、指标提取植被指数、浑浊指标植被指数、浑浊指标特定地物和状态的提特定地物和状态的提取取山火、水灾、线形构造、遗迹探察山火、水灾、线形构造、遗迹探察在特征空间中,依据像元相似度的大小,归类相似的像元,分离不相似的像元,并给每一个像元赋类别值的过程分类的总目标是将图像中所有的像元自动进行土地覆盖类型或土地覆盖专题的分类什么是遥感图像计算机分类?什么是遥感图像计算机分类?计算机分类实例计算机分类实例原始遥感图像对应的专题图像遥感图像遥感图像计算机分类流程框图色调、颜色、阴影、形状、纹理、大小、位置、图型、相关布局遥感图像特征集基于光谱的基于空间关系的统计分类 结构分类 模糊分类 神经网络分类 小波分析

3、 专家系统遥感图像计算机分类光谱模式识别空间模式识别新方法为什么使用计算机分类?为什么使用计算机分类?将影像数据的连续变化转化为地图模式,以提供给用户有意义的信息获得关于地面覆盖和地表特征数据的更深刻的认识较目视解译客观,在分析大数据集时比较经济可对复杂的多波段数据及其相互关系进行有效分析光谱特征空间光谱特征空间光谱特征空间:以各波段图像的亮度分布为坐标轴组成的空间同类地物在特征空间形成一个相对聚集的点集群不同类地物的点集群在特征空间内一般是相互分离的 SPOT影像影像真实二维特征空间示例真实二维特征空间示例1-21-31-42-32-43-4特征空间中的距离特征空间中的距离“物以类聚”,而图

4、像分类的依据通常是像元之间的相似性。相似性通常又采用“距离”来度量。距离可以有不同的具体定义几何距离:欧式距离、绝对值距离统计距离:马氏距离图像分类方法图像分类方法按人工干预的程度不同,可以分为:监督分类法非监督分类法分类步骤分类步骤 选择合适的分类算法 用所选算法分割特征空间 根据像元在特征空间中的定位对每一个像元赋类别值 对分类结果进行精度评价确定每个类别的样区学习或训练确定判别函数和相应的判别准则计算未知类别的样本观测值函数值按规则进行像元的所属判别监督分类的思想监督分类的思想判决函数:当各个类别的判别区域确定后,用来表示和鉴别某个特征矢量属于哪个类别的函数判别规则:判断特征矢量属于某类

5、的依据。当计算完某个矢量在不同类别判决函数中的值后,我们要确定该矢量属于某类必须给出一个判断的依据。 这种判断的依据,称之为判别规则判决函数和判决规则判决函数和判决规则监督法分类监督法分类首先需要从研究区域选取有代表性的训练场地作为样本根据已知训练区提供的样本,通过选择特征参数(如像素亮度均值、方差等),建立判别函数,据此对样本像元进行分类,依据样本类别的特征来识别非样本像元的归属类别监督法分类监督法分类主要步骤选择训练样本区确定类别数对每类选择足够多的有代表性的样本分类前分析样本区质量选择合适的分类算法分类结果的精度评价准确性确保选择的样区与实际地物的一致性代表性考虑到地物本身的复杂性,所以

6、必须在一定程度上反映同类地物光谱特性的波动情况统计性选择的训练样区内必须有足够多的像元训练样区的选择训练样区的选择选择训练区选择训练区训练区与特征空间的联系训练区与特征空间的联系水新城区老城区耕地植被 选择样本区域建立类别的判别函数建立类别的判别函数水水老城区老城区新城区新城区植植被被红255绿255耕地耕地0蓝255 将样本数据在特征空间进行聚类将样本数据在特征空间进行聚类主要的监督分类方法主要的监督分类方法距离判别函数和距离判别规则最小距离分类法最近邻分类算法平行六面体分类法概率判别函数和贝叶斯判别规则最大似然分类法最小距离分类法最小距离分类法最近邻法最近邻法基本思想是设法计算未知矢量X到

7、有关类别集群之间的距离,哪类距离它最近,该未知矢量就属于那类距离判决函数偏重于集群分布的几何位置距离判别规则是按最小距离判别的原则 最小距离分类法最小距离分类法平行六面体分类法平行六面体分类法以一个包括该集群的“盒子”作为该集群的判别函数判决规则为若未知矢量X落入该“盒子”,则X分为此类,否则再与其它盒子比较这种分类法在盒子重叠区域有错分现象,错分与比较盒子的先后次序有关平行六面体分类法基本思想平行六面体分类法基本思想最大似然分类法最大似然分类法最大似然分类法最大似然分类法地物类数据在特征空间中构成特定的点群每一类的每一维数据都在自己的数轴上为正态分布,该类的多维数据就构成了一个多维正态分布各

8、类的多维正态分布模型各有其分布特征利用各类的已知数据(训练区),求出均值、方差及协方差等特征参数,从而求出总体的概率密度函数在此基础上,对于任何一个像元,通过求出每个像素对于各类别的归属概率(对于待分像元x,从属于分类类别k的概率),把该像素分到归属概率最大的类别中去最大似然分类法最大似然分类法利用概率判别函数与贝叶斯判别规则进行分类优点:考虑特征空间中类别的形状、大小和定位缺点:计算量大,计算时间长假定地物光谱特征呈正态分布根据应用目的和区域,有选择的决定分类类别,避免出现一些不必要的类别可以控制训练样本的选择可以通过检查训练样本来决定训练样本是否被精确分类,从而避免分类中的严重错误,分类精

9、度高避免了非监督分类中对光谱集群的重新归类分类速度快监督法分类的优点监督法分类的优点主观性由于图像中间类别的光谱差异,使得训练样本没有很好的代表性训练样本的获取和评估花费较多人力时间只能识别训练中定义的类别监督法分类的缺点监督法分类的缺点非监督分类的思想主要非监督分类方法K-均值法ISODATA非监督分类的特点分类后处理分类后的误差分析内容大纲内容大纲在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要根据像元间相似度的大小进行归类合并(将相似度大的像元归为一类)的方法根据图像数据本身的统计特征及点群的分布情况,从纯统计学的角度对图像数据进行类别划分 非监督分类非监督分类 利

10、用事先定义的参数确定特征空间中类别的位置,然后确定单个像元是否属于某个类别聚类聚类一般的聚类算法是先选择若干个点作为聚类的中心每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各点归于各聚类中心所代表的类别,形成初始分类然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止聚类过程聚类过程按照某个原则选择一些初始聚类中心计算像元与初始类别中心的距离,把像素分配到最近的类别中聚类过程聚类过程计算并改正重新组合的类别中心过程重复直到满足迭代结束的条件聚类过程聚类过程仅凭遥感影像地物的光谱特征的分布规律,即自然聚类的特性,进行“盲目”的分类其分类的结果

11、只是对不同类别达到了区分,但并不能确定类别的属性;其类别的属性是通过分类结束后目视判读或实地调查确定的非监督分类非监督分类K-均值法(K-means Algorithm)迭代自组织数据分析技术方法(Iterative Self-Organization Data Analysis Techniques,ISODATA)主要的非监督分类方法主要的非监督分类方法K-均值法均值法通过自然的聚类,把它分成8类K-均值算法的聚类准则是使每一聚类中,像元到该类别中心的距离的平方和最小基本思想:通过迭代,逐次移动各类的中心,直至得到最好的聚类结果为止K-均值法均值法(1)确定类别数并各类的初始中心:z1(0

12、), z2(0), zK(0),K为类别数。初始中心可任意选取初始中心的选择对聚类结果有一定影响,初始中心的选择一般有以下方法:根据问题的性质,用经验的方法确定类别数K,从数据中找出从直观上看来比较适合的K个类的初始中心将全部数据随机地分为K个类别,对计算每类的重心,将这些重心作为K个类的初始中心K-均值法均值法(2)择近分类,即将所有像元按照与各中心的距离最小的原则分到K个聚类中心(3)计算新中心。待所有样本第i 次划分完毕后,重新计算新的集群中心zj(i +1), j=1, 2, , K(4)如果聚类中心不变,则算法收敛,聚类结束;否则回到(2),进入下一次迭代K-均值法均值法优点:实现简

13、单缺点:过分依赖初值,容易收敛于局部极值在迭代过程中没有调整类数的措施,产生的结果受到所选聚类中心的数目、初始位置、类分布的几何性质和读入次序等因素影响较大初始分类选择不同,最后的分类结果可能不同K-均值法均值法Iterative Self-Organization Data Analysis Techniques“迭代自组织数据分析技术方法”的简称可以自动地进行类别的“合并”和“分裂”,从而得到比较合理的聚类结果 ISODATA(1)初始化,设置参数;(2)选择初始聚类中心;(3)按一定规则(如距离最小)对所有像元分配类别;(4)计算并改正重新组合的类别中心;(5)类别的分裂和合并;(6)如

14、果达到迭代次数或者两次迭代之间类别均值变化小于阈值,则结束迭代;否则,重复(3)-(6);(7)确认类别,对结果进行精度评估ISODATA基本同K-均值法,但K-均值法的类别数是从始至终固定的,而ISODATA方法则是动态调整类别数的K :希望得到的类别数N :所希望的一个类中样本的最小数目S :类的分散程度的参数(如标准差、方差)C :类间距离的参数(如最小距离)L :每次允许合并的类的对数I :允许迭代的次数ISODATA参数参数的设定的设定决定类的“分裂”与“合并” 结束迭代的条件合并(类数-1)每一类中的像元个数少于期望的类别最少像元数N类别的个数大于期望的类别数K的2倍分裂(类数+1

15、)类别的标准差大于类别标准差阈值S 类别的个数小于期望的类别数K的1/2当类别数在一定范围内,类别中心间的距离在阈值以上,类别内的方差的最大值在阈值以下ISODATA调整类别数的准则调整类别数的准则两次迭代之间,如果上一次和这一次的中心不变,或者变化小于一个阈值,说明聚类结束如果迭代次数达到了预设值I ,那么即使不收敛,也强行结束ISODATA判断迭代结束判断迭代结束类别数:20迭代次数:20ISODATA类别数:10迭代次数:10ISODATA优点:不需要预先对待分类区域有广泛的了解需要较少的人工参与,人为误差的机会减少小的类别能够被区分出来缺点:盲目的聚类难以对产生的类别进行控制,得到的类

16、别不一定是想要的类别计算速度慢非监督分类方法的特点非监督分类方法的特点监督分类的缺陷在于,必须在分类前确定样本,难度大、效率低通过非监督法将一定区域聚类成不同的单一类别,监督法再利用这些单一类别区域“训练”计算机使分类精度得到保证的前提下,分类速度得到了提高非监督分类与监督分类的结合非监督分类与监督分类的结合遥感影像经分类后形成的专题图,用编号、字符、图符或颜色表示各种类别分类后处理分类后处理原始遥感图像对应的专题图像用光谱信息对影像逐个像元地分类,在结果的分类地图上会出现“噪声”分类后处理分类后处理产生噪声的原因有原始影像本身的噪声,在地类交界处的像元中包括有多种类别,其混合的幅射量造成错分

17、类,以及其它原因等另外还有一种现象,分类是正确的,但某种类别零星分布于地面,占的面积很小,我们对大面积的类型感兴趣,因此希望用综合的方法使它从图面上消失分类后处理分类后处理分类后处理分类后处理多数平滑:平滑时中心像元值取周围占多数的类别(少数服从多数原则) 平滑前后的一个例子平滑前后的一个例子分类精度评价混淆矩阵Kappa系数制约分类精度的因素提高分类精度的方法分类后的误差分析分类后的误差分析混淆矩阵是由n行n列组成的矩阵,用来表示分类结果的精度混淆矩阵是通过将每个像元的位置和地面参考验证信息与计算机分类结果中的相应位置和类别来比较计算的混淆矩阵(混淆矩阵(Confusion Matrix)6

18、3混淆矩阵的每一列代表了地表实测值(参考验证信息),每一列中的数值等于地表真实像元在分类图像中对应于相应类别的数量混淆矩阵的每一行代表了计算机的分类信息,每一行中的数值等于计算机分类像元在地表真实像元相应类别中的数量混淆矩阵混淆矩阵有150个样本数据,这些数据在计算机分类结果中被分成3类,每类50个。分类结束后得到的混淆矩阵为:类1的50个样本有43个分类正确,5个错分为类2,2个错分为类3类2的50个样本有45个分类正确,2个错分为类1,3个错分为类3类3的50个样本有49个分类正确,0个错分为类1,1个错分为类2混淆矩阵混淆矩阵实际类别类1类2类3行和分类类别类1435250类224535

19、0类3014950列和455154矩阵主对角线上的数字就是分类正确的像元数,主对角线上的数字越大,分类精度越高;主对角线以外的数字就是错分的像元数,这些数字越小,错分率就越小,精度就越高精度评估的指标总精度用户精度生产者精度(制图精度)混淆矩阵混淆矩阵总精度:由正确分类的总像元数(沿着主对角线上的元素的和)除以所包含的总像元数来计算(43+45+49)/150=91.3%混淆矩阵混淆矩阵用户精度由每一类别被正确分类的像元数目除以被分作该类的总像元数(行元素之和)这个数字表示一个像元被分到指定类别的可能性,这个指定类别代表了地面的实际类别类1的用户精度:43/50=86%类2的用户精度:45/5

20、0=90%类3的用户精度:49/50=98%混淆矩阵混淆矩阵生产者精度由每一类中正确分类的像元数(位于主对角线上)除以该类用做训练样区的像元数目(列元素之和)这个数字表明指定覆盖类型的训练样区集的像元被分类后,它的效果有多好类1的生产者精度:43/45=96%类2的生产者精度:45/51=88%类3的生产者精度:49/54=91%混淆矩阵混淆矩阵例:森林类别的生产者精度为84%,用户精度为60%。表示在分类结果中有84%的森林被正确的分类为森林,但所有分类为森林的地区只有60%的地区真正属于森林这个类别混淆矩阵混淆矩阵m =误差矩阵中行的数量(即总的类别数)xii=第i行第i列上的像元数量(即主对角线上正确分类的数量)xi+=在第i行的总像元数量x+i=在第i列的总像元数量N =用于精度评估的总像元数量Kappa系数系数1121()()mmiiiiiimiiiNxx xKNx x分类总体精度与Kappa的区别:总体精度只用到了位于对角线上的像元数量Kappa则既考虑了对角线上被正确分类的像元,又考虑了不在对角线上的各种漏分和错分错误Kappa系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论