版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、遥感与图像处理基础遥感与图像处理基础浙江大学地理信息科学研究所浙江省资源与环境信息系统(GIS)重点实验室非监督分类一、概述非监督分类 (Unsupervised Classification ) 以不同影像地物在特征空间中类别特征的差别为依据的一种无先验(已知)类别标准的图像分类,是以集群为理论基础,通过计算机对图像进行集聚统计分析的方法。根据待分类样本特征参数的统计特征,建立决策规则来进行分类。而不需事先知道类别特征。把各样本的空间分布按其相似性分割或合并成一群集,每一群集代表的地物类别,需经实地调查或与已知类型的地物加以比较才能确定。是模式识别的一种方法。一、概述 非监督分类是指人们事先
2、对分类过程不施加任何的先验知识,而仅凭数据(遥感影像地物的光谱特征的分布规律),即自然聚类的特性,进行分类;其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性,亦即:非监督分类只能把样本区分为若干类别,而不能给出样本的描述;其类别的属性是通过分类结束后目视判读或实地调查确定的。 非监督分类也称聚类分析。一般的聚类算法是先选择若干个模式点作为聚类的中心。每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各模式归于各聚类中心所代表的类别,形成初始分类。然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止。与监督法的先学习后分类不同,非监督
3、法是边学习边分类,通过学习找到相同的类别,然后将该类与其它类区分开。二、分类方法K-means是聚类算法中最具代表性的一种算法亦属数据挖掘范畴2、 ISODATA 算法 1、 K-means聚类算法二、分类方法 聚类属于非监督学习,相对于监督学习都是有类别标签y的,即样例中已经给出了样例的分类;而聚类的样本中却没有给定y,只有特征x一个通俗的例子: 假设宇宙中的星星可以表示成三维空间中的点集,聚类的目的是找到每个样本x潜在的类别y,并将同类别y的样本x放在一起。比如星星,聚类后结果是一个个星团,星团里面的点相互距离比较近,星团间的星星距离就比较远了。关于聚类二、分类方法关于 聚类 聚类算法可以
4、用来完成对l维特征向量的分组。对应于相同地面类型的点,如水,将其聚类在一起形成一组。一旦这样分组以后,分析人员就可以通过每一组中的样本点和地面数据的参考信息相联系来识别地面类型。二、分类方法聚类二、方法1K-means在聚类问题中,给我们的训练样本是 ,每个 ,没有了y。 K-means算法是将样本聚类成k个簇(cluster),具体算法描述如下:1、 随机选取k个聚类质心点(cluster centroids)为。2、 重复下面过程直到收敛 对于每一个样例i,计算其应该属于的类 对于每一个类j,重新计算该类的质心 。K是我们事先给定的聚类数, 代表样例i与k个类中距离最近的那个类, 的值是1
5、到k中的一个。质心 代表我们对属于同一个类的样本中心点的猜测K-means聚类算法二、分类方法K-means聚类算法 示意过程对n个样本点进行K-means聚类的效果,下图以k取2为例二、分类方法K-means面对的第一个问题是如何保证收敛,前面的算法中强调结束条件就是收敛。定性描述收敛性: 定义畸变函数(distortion function)K-means聚类算法二、分类方法迭代自组织数据分析算法 在k-均值算法的基础上,增加对聚类结果的“合并”和“分裂”两个操作,并设定算法运行控制参数的一种聚类算法。ISODATA 算法 Iterative Selforganizing Data Ana
6、lysis Techniques Algorithm“合并”操作:当聚类结果某一类中样本数太少,或两个类间的距离太近时,进行合并。“分裂”操作:当聚类结果某一类中样本某个特征类内方差太大,将该类进行分裂二、方法2- ISODATAISODATA 算法 思想 Isodata,迭代自组织分析,通过设定初始参数而引入人机对话环节,并使用归并与分裂的机制,当某两类聚类中心距离小于某一阈值时,将它们合并为一类,当某类标准差大于某一阈值或其样本数目超过某一阈值时,将其分为两类。在某类样本数目少于某阈值时,需将其取消。如此,根据初始聚类中心和设定的类别数目等参数迭代,最终得到一个比较理想的分类结果二、分类方
7、法ISODATA 算法 特点 使用误差平方和作为基本聚类准则设定指标参数来决定是否进行“合并”或“分裂”设定算法控制参数来决定算法的运算次数具有自动调节最优类别数k的能力算法规则明确,便于计算机实现二、分类方法ISODATA 算法 特点 三、分类方法其他分类方法n纹理分类n分层分类策略n模糊分类n人工神经网络分类四、分类步骤非监督分类的基本步骤(1)确定分类数量(2)选择集群类别中心点(3)计算机处理运算类别中心点(4)计算机像元归类(5)计算机重新分类五、分类方法的几点注意 散点图的运用二维散点图(2、5月数据) 多维空间散点图显示了三个波段数据五、分类方法中的几点注意 距离量算是非监督分类的核心距离量算的类型有:l殴几里得距离测量l绝对值距离计算两个像元在不同波段中亮度差的绝对值之和 不同分类方法的精度差异n分类算法选择要考虑方便、实用、运算速度与精度的权衡n没有哪个分类器对所有的分类结果是完美的,需要考虑地面类别与分类器的最佳组合模式。五、分类方法中的几点注意辅助数据和辅助方法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论