版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、遥感专题信息提取遥感专题信息提取洪金益洪金益中南大学地球科学与信息物理学院中南大学地球科学与信息物理学院emailemail:1高等课堂2高等课堂3高等课堂la teachers guide to internet resources for remote sensing4高等课堂l遥感影像地学理解与分析l遥感专题分析与地学图谱l遥感数字影像处理与地理特征提取l卫星遥感图像计算机分类与地学应用研究lenvi用户使用手册ler mapper users manuallpci users manuallerdas users manual5高等课堂1、遥感专题信息提取的基本理论、遥感专题信息提取的
2、基本理论2、遥感专题信息提取的原则和方法、遥感专题信息提取的原则和方法3、遥感专题信息提取在不同研究领域中的应用、遥感专题信息提取在不同研究领域中的应用4、遥感专题信息提取应用实例、遥感专题信息提取应用实例6高等课堂遥感专题信息提取是采用遥感图像处理方法,根据提取目的,以遥感资料为基础信息源,提取与主题紧密相关的一种或几种要素的信息。7高等课堂lthe electromagnetic spectrum ranges from the shorter wavelengths (including gamma and x-rays) to the longer wavelengths (inclu
3、ding microwaves and broadcast radio waves). thereare several regions of the electromagnetic spectrum which are useful for remote sensing.8高等课堂9高等课堂for most purposes, the ultraviolet or uv portion of the spectrum has the shortest wavelengths which are practical for remote sensing. this radiation is j
4、ust beyond the violet portion of the visible wavelengths, hence its name. some earth surface materials, primarily rocks and minerals, fluoresce or emit visible light when illuminated by uv radiation.10高等课堂visible spectrumthe light which our eyes - our remote sensors - can detect is part of the visib
5、le spectrum. it is important to recognize how small the visible portion is relative to the rest of the spectrum. there is a lot of radiation around us which is invisible to our eyes, but can be detected by other remote sensing instruments and used to our advantage. the visible wavelengths cover a ra
6、nge from approximately 0.4 to 0.7 m. the longest visible wavelength is red and the shortest is violet. common wavelengths of what we perceive as particular colours from the visible portion of the spectrum are listed below. it is important to note that this is the only portion of the spectrum we can
7、associate with the concept of colours.11高等课堂12高等课堂 violet: 0.4 - 0.446 m blue: 0.446 - 0.500 m green: 0.500 - 0.578 m yellow: 0.578 - 0.592 m orange: 0.592 - 0.620 m red: 0.620 - 0.7 m13高等课堂primary coloursblue, green, and red are the primarycolours or wavelengths of the visiblespectrum. they are def
8、ined as such because no single primary colour can be created from the other two, but all other colours can be formed by combining blue, green, and red in various proportions. although we see sunlight as a uniform or homogeneous colour, it is actually composed of various wavelengths of radiation in p
9、rimarily the ultraviolet, visible and infrared portions of the spectrum. the visible portion of this radiation can be shown in its component colours when sunlight is passed through a prism, which bends the light in differingamounts according to wavelength.14高等课堂infraredthe next portion of the spectr
10、um of interest is the infrared (ir) region which covers the wavelength range from approximately 0.7 m to 100 m - more than 100 times as wide as the visible portion! the infrared region can be divided into two categories based on theirradiation properties - the reflected ir, and the emitted or therma
11、l ir. radiation in the reflected ir region is used for remote sensingpurposes in ways very similar to radiation in the visible portion. the reflected ir covers wavelengths from approximately 0.7 m to3.0 m. the thermal ir region is quite different than the visible and reflected ir portions, as this e
12、nergy is essentially the radiation that is emitted from the earths surface in the form of heat. the thermal ircovers wavelengths from approximately 3.0 m to 100 m.15高等课堂16高等课堂microwavethe portion of the spectrum of more recent interest to remote sensing is the microwave region from about 1 mm to 1 m
13、. this covers the longest wavelengths used for remote sensing. the shorter wavelengths have properties similar to the thermal infrared region while the longer wavelengths approach the wavelengths used for radio broadcasts. because of the special nature of this region and its importance to remote sen
14、sing in canada, an entire chapter (chapter 3) of the tutorial is dedicated to microwave sensing.17高等课堂知识决策数据有效信息18高等课堂基础科学、应用基础科学定量地学描述遥感科学定量遥感 高新技术高新技术(传感器、遥感平台设计制造传感器、遥感平台设计制造)遥感:遥感:高新技术驱动的对地观测的一场革命高新技术驱动的对地观测的一场革命观测时空尺度 物理学定律、定理 数学生态学化学计算机科学 国民经济持续发展,社会需求,国民经济持续发展,社会需求, 环境保护,全球变化,减灾防灾环境保护,全球变化,减灾
15、防灾尺度效应分形、分维.反演、优化.遥感在多学科交叉中的定位19高等课堂横看成岭侧成峰远近高低各不同不识庐山真面目只缘身在此山中 - 苏东坡论遥感的尺度效应观察角度效应苏东坡论遥感的尺度效应观察角度效应20高等课堂遥感系统遥感系统从垂直方向来说,光线从垂直方向来说,光线(电磁波)(电磁波)穿越大气、穿越大气、植被,到达土壤,再反射穿越植被、穿越大气,植被,到达土壤,再反射穿越植被、穿越大气,达到卫星传感器。影响这一过程的因素,数不达到卫星传感器。影响这一过程的因素,数不胜数。我们可以用明代一位诗人观察到的现象胜数。我们可以用明代一位诗人观察到的现象来作一个简单的说明:来作一个简单的说明:夕阳方
16、照桃花坞 柳絮飞来片片红21高等课堂 大家一般的先验知识认为柳絮是白的,为大家一般的先验知识认为柳絮是白的,为什么诗人观察到柳絮是红的呢?什么诗人观察到柳絮是红的呢?诗人作了解释:诗人作了解释: 1、夕阳夕阳 光穿越大气的光学路径较长,短波段散光穿越大气的光学路径较长,短波段散射严重,直射光偏红,所以射严重,直射光偏红,所以“夕阳红夕阳红”,“残阳如血残阳如血”。 2、下垫面下垫面桃花坞桃花坞,“灼灼桃花灼灼桃花”盛开,不盛开,不是一个大叶模型的下垫面,而是一个是一个大叶模型的下垫面,而是一个红色的下垫面红色的下垫面,反反射光偏红射光偏红。 3、气溶胶气溶胶柳絮本身是柳絮本身是全波谱反射全波谱
17、反射,此时此时反反射夕阳红射夕阳红,反射桃花红反射桃花红,所以柳絮成了所以柳絮成了片片红片片红。 当然这只是一个简单的当然这只是一个简单的定性模型定性模型,但我们可以看出但我们可以看出影响遥感信息产生过程的主要因素之多影响遥感信息产生过程的主要因素之多。22高等课堂 从水平方向上来说从水平方向上来说,陆地表面在遥感像元尺度上几乎,陆地表面在遥感像元尺度上几乎总是总是混合像元混合像元,前面前面1米分辨率的天安门广场上,我们可以看到米分辨率的天安门广场上,我们可以看到人影,我开玩笑说是比较胖的同志,其实我相信看到的人影,我开玩笑说是比较胖的同志,其实我相信看到的是比较密是比较密的人群的人群。大家也
18、许认为。大家也许认为大戈壁大戈壁或或沙漠沙漠可以认为是可以认为是 “纯纯” 像元像元,但其实也包含,但其实也包含砾石的阴影砾石的阴影。我在沙漠上实测砾石的。我在沙漠上实测砾石的承承照面和背阴面,温差大约照面和背阴面,温差大约 10 摄氏度以上。摄氏度以上。 对对1公里像元尺度来说,地形的起伏常常公里像元尺度来说,地形的起伏常常不可忽略。不可忽略。 所有这些所有这些,使遥感定量反演命中注定是使遥感定量反演命中注定是一个病态反演一个病态反演。23高等课堂数据有效信息知识更新与积累决策帮助提取24高等课堂1、概念:地学是对以我们所生活的地球为研究对象的学科的统称,通常有地理学、地质学、海洋学、大气物
19、理、古生物学等学科。2、研究目的:研究地学的目的是为了更好的开发和保护地球表面的自然资源,使人地关系向着有利于人类社会生活和生产的方向发展。25高等课堂1、计算机视觉知识2、地图制图知识3、地学知识4、方法知识26高等课堂计算机视觉知识是指从图像上可以获得的视觉信息,数字化地图的颜色、地物形状大小、空间结构和空间关系等知识都属于计算机视觉知识,它们是识别和提取信息的最基本的依据。专题信息提取首要的是从图像上发现相关视觉知识,才能结合相关专题信息提取的方法,提出相应的提取策略。27高等课堂方法知识是在信息提取过程所用到的相关方法,即如何利用图像上所发现的知识,提取所需信息的系列算法。28高等课堂
20、地图制图知识主要针对各种人工绘制的地图而言,人工绘制的地图必然遵循制图的相关约定规则。如我国规定1: 1万、1: 2.5万、1:5万、1: 10万、1: 25万、1: 50万比例尺地形图,均采用高斯克吕格投影。1: 2.5至1: 50万比例尺地形图采用经差6度分带,1: 1万比例尺地形图采用经差3度分带,国家基本地形图,每种比例尺 都 有 统 一 的 图 式 符 号 和 编 制 规 范29高等课堂地图是对现实世界的抽象表达,地理事物的时空分布规律和客观事物之间的关系必然在地图上反映出来。如遥感图像在时间上受季相节律的影响,作物的生长、植物的盛枯、冰雪的消融等变化都会在图像上反映出来:遥感图像信
21、息因受区域的水平地带性和垂直地带性的影响,能反映出区域的水热条件的差异;水田和旱地的分布与地形和水源分布密切相关,水田主要分布在水源丰富,地势平坦的地方;居民地的分布与河流分布密切相关,居民地多分布在水源丰富的河流沿岸。诸如此类的地理事物的时空分布规律和客观事物之间的关系知识都是专题信息提取中的重要知识源。30高等课堂1、目视解释2、计算机自动识别分类31高等课堂32高等课堂l遥感信息科学的发展,为土地利用,环境监测,地质灾害监测提供了全新的研究手段,标志着空间信息和环境灾害信息获取和分析处理方法的一场革命及一门新兴学科的兴起,遥感信息科学的理论,技术和方法在国民经济发展中有着广泛的应用,在资
22、源,环境,灾害的调查,监测,分析平谷和预测方面发挥着重要作用,尤其高分辨率遥感影像在大范围空间地物的识别与提取方面应用直接影响地物测绘的自动化水平。更为重要的是随着现代化建设的快速发展,资源,环境数据增加和快速更新工作量加大,这更需要一种能快速提取大范围空间信息的信息获取技术手段,而遥感影像中获取数据能地理信息系统的数据获取和自动更新的需要,为国民经济的快速发展提供动态基础数据和科学决策依据,在国民经济中发挥重要作用。33高等课堂 遥感影像是通过亮度值或像元值的高低差异(反映地物的光谱信息)及空间变化(反映地物空间信息)而表示不同地物的差异的,如不同类型的植被、土壤、岩石及水体等等,这是我们区
23、分不同影像地物的物理基础。遥感影像分类就是利用计算机通过遥感影像中各类地物的光谱信息和空间信息进行分析,选择特征,并用一定的手段将特征空间划分为互不重叠的子空间,然后将影像中的各个像元划归到各个子空间去。 遥感影像分类的理论依据:遥感影像中的同类地物在相同的条件下(纹理、地形、光照及植被覆盖、等等)应具有相同或相似的光谱信息特征和空间特征,从而表现出同类地物的某种内在的相似性,即同类地物像元的特征向量将集群在同一特征空间区域;而不同地物的光谱信息特征或空间信息特征不同,因而将集群在不同的特征空间区域。 34高等课堂 影像分类的原则 (1)对多变量影像不能孤立地根据个别变量的数值进行分类,而要从
24、整个向量数据特征出发,即像元点在多维特征空间中的位置及集群情况,或者按空间集群的分布进行分类。 (2)一个集群(类)在特征空间的位置用它的均值向量表示,即该集群的中心,其离散程度用标准差向量(均方差向量)或协方差矩阵来衡量。 (3)分类的实质是把多维特征空间划分为若干区域(子空间),每个区域相当于一类,即位于这一区域内的像元点归属于同一类。 35高等课堂l遥感影像的分类顺序和方法l(1)首先根据目的及影像数据的特性确定分类类别。有时也通过从训练数据中提取的影像特征确定分类(非监督分类)l(2)找出这些具有特征的类别的特征量。l(3)为了找出分类的基准,需要提取出对应于分类类别的训练数据。l(4
25、)为了测定总体特征,可采用对影像中代表给定类别的部分进行采样,从而测定总体特征的方法(监督测定)或用聚类等方法对特征相似的像元进行分类,从而测定其特征的方法(非监督分类)。非监督分类不是预先确定不是预先确定类别而是根据归类的结果确定类别。l(5)使用设定的分类基准对各像元进行分类。包括对每个像元进行分类和对每个预先分割的匀质区域进行分类。36高等课堂l(6)把已知的训练数据及分类类别与分类结果进行比较,确认分类的精度及可靠性。此外,作为道路及建筑物等土地覆盖类别的集合,可以设定市街区这样的种类,因而可进行类别与种类的对应。由于遥感影像的分类结果可应用于了解地球环境等各种用途,所以精度与可靠性是
26、非常重要的。l 在遥感影像分类中,按照是否有已知训练样本的分类数据,分类方法又分为两大类:即监督分类与非监督分类。l 监督分类的思想是:首先根据类别的先验知识确定判别函数和相应的判别准则,其中利用一定数量的已知类别的样本(称为训练样本)的观测值确定判定函数中待定参数的过程称为学习(learning)或训练(training),然后将未知类别的样本的观测值代入判别函数,再依据判别函数准则对该样本的所属类别做出判定。l 目前比较成熟的监督分类方法是基于统计的分类。除此之外,还有模糊识别分类、神经网络分类法等。当然,监督分类要比非监督的精度要高、准确性好,但是,监督分类的工作量无疑要比37高等课堂l
27、非监督分类的工作量大得多。首先,监督分类有一事先确定训练场地和选择非监督分类的工作量大得多。首先,监督分类有一事先确定训练场地和选择训练样本的工作,要求训练样本要有一定的代表性,而且要有足够的数值;训练样本的工作,要求训练样本要有一定的代表性,而且要有足够的数值;另外,对于遥感影像分类来说,由于各种地物的光谱辐射的复杂性以及干扰另外,对于遥感影像分类来说,由于各种地物的光谱辐射的复杂性以及干扰因素的多样性,有时仅仅考虑在某一特定时间和空间内选取训练样本还是不因素的多样性,有时仅仅考虑在某一特定时间和空间内选取训练样本还是不够的,为了提高精度,有时还必须多选择一些训练样本。够的,为了提高精度,有
28、时还必须多选择一些训练样本。l遥感影像的非监督分类是在没有先验类别知识(训练场地)的情况下,根据遥感影像的非监督分类是在没有先验类别知识(训练场地)的情况下,根据影像本身的统计特性及自然点群的分布情况来划分地物类别的分类处理,也影像本身的统计特性及自然点群的分布情况来划分地物类别的分类处理,也叫叫“边学习边分类法边学习边分类法”。该方法是在计算机分类过程中,边分类边学习边建。该方法是在计算机分类过程中,边分类边学习边建立并进行分类决策的,无需事先知道各类地物的类别统计特征,也无需经过立并进行分类决策的,无需事先知道各类地物的类别统计特征,也无需经过学习过程,一般只是提供少数阀值对分类过程加以部
29、分控制。值得指出的是,学习过程,一般只是提供少数阀值对分类过程加以部分控制。值得指出的是,所分各类的含义是什么并不能由该分类方法得出,而要根据地面实况调查和所分各类的含义是什么并不能由该分类方法得出,而要根据地面实况调查和比较来决定。比较来决定。l 监督分类和非监督分类的最大区别在于:监督分类首先给定类别,而非监督分类和非监督分类的最大区别在于:监督分类首先给定类别,而非监督分类则由影像本身的统计特征来决定。监督分类则由影像本身的统计特征来决定。l 主要的分类方法为多级切割分类法、决策树分类法、最小距离分类法、主要的分类方法为多级切割分类法、决策树分类法、最小距离分类法、最大似然分类法、专家系
30、统的方法等。最大似然分类法、专家系统的方法等。38高等课堂一、分类处理流程图39高等课堂l一)、最大似然分类法 1、最大似然法的基本思想和数学原理 最大似然将卫星遥感多波段数据的分布当作多维正态分布来构造函数。基本思想是:各类的已知像元的数据在平面或空间中构成一定的点群;每一类的每一维数据都在自己的数轴上形成一个正态分布,该类的多维数据就构成该类的一个多维正态分布;各类的多维正态分布模型各有其分布特征,例如:所在位置、形状、密集或离散的程度等。有了各类的多维分布模型,对于任何一个未知类别的数据向量,都可以反过来求它属于各类的概率,比较这些概率的大小看属于哪一类的概率大,就把这个数据向量或像元归
31、为该类。 40高等课堂l假定第k类只有 个波段(波段1)数据 (一维随机变量),那么它的正态分布密度函数为l式中: 是第k类( )波段 数据的一维正态分布密度函数,由这个分布密度函数能够看出在第k类中随机变量 出现各种可能值的概率的大小; 是随机变量 的平均值; 是随机变量 的标准差; 是圆周率,通常取为3.14159。l 再假定第k类有两个波段(波段1和波段2)的数据 和 (二维随机变量),那么第k类的正态分布密度函数是二维正态分布密度函数。1x_22()11(/)exp22iiikiixxp xg1(1-1)1(/)kp xgkg11x_x1x11x1x2x41高等课堂l式中 是第k类的二
32、维正态分布密度函数,由它可以看出在第k 类中二维随机变量 出现各种可能值概率的大小; 和 分别是 和 的平均值; 和 分别是波段1和波段2的数据 和 的方差, 为协方差。121222112212_221122121122112211221211221(,/)() (2 )()()2()()exp1kp xxgxxxxxxxx 12(,/)kp x xg12( ,)x x_1x_2x1x2x211x2x12(1-2)42高等课堂l 如果第k类有3个或更多的数据,那么原则上可以仿照式(1-1)和式(1-2)表示第k类的三维或更多维正态分布密度函数。但是表达式太复杂,我们用向量和矩阵来表示符号,对于
33、多维的,比如说m维的正态分布密度函数,可以表示为:l式中:m是波段数, 是第k类的m维正态分布密度函数,由它可以看出在第k类中m 维随机变量x(像元的m维数据向量)出现各种可能值的概率的大小。像元的m维数据向量可以表示为:112121( /)exp()()2(2 )kkkkkmsp x gxsx(1-3)1(/)kp xg43高等课堂l 是第k类每个波段的均值 所构成的均值向量l 是向量 转置向量 是矩阵 的逆矩阵。 是矩阵 的行列式。 是第k类m个波段值的协方差矩阵,如下式:12mxxxxk_kjkjx_11_22_kkkkkkmkmxxx()x()kx1ks1ksksks1ks(1-4)(
34、1-5)44高等课堂l式中, 是第k类的像元数; 是第k类的类内离差矩阵.如下式l式中, 是第k类的类内方差;而 及 是第k类的类内协方差11kkkswn111212122112kkk mkkk mkkmkmkmmwkwkn1122,kkkmm111,kk m211,kkm(1-6)(1-7)45高等课堂l如果一共要分g 个类,那么对每一类都可根据该类的已知m个波段的数据,按式(1-3),估计出该类的m维分布密度函数.由它们可以看出在各类中m维随机变量x(像元的m维向量)出现各种可能值的概率的大小.l 有了g个概率密度函数,对任何一个已知的m维数据向量x(即一个像元)都可以反过来计算它属于g个
35、类中第k类的概率.根据逆概率公式,即贝叶斯公式有() ( /)(/ )( )kkkp gp x gp gxp x(1-8)46高等课堂 式中, 是任何一个m维数据向量(像元)属于第k类的概率; l 是第k类的m维正态分布密度函数,即式(1-3); 是所考虑的全部数据中出现该数据向量x的概率; 是第k类在所考虑的全部数据中出现的概率,称为先验概率.g个类的先验概率的总和等于1.l 对任何一个m维数据向量 x ,都可用(1-8)分别计算它们属于各类的概率,然后比较所得各概率的大小,从而把该数据向量 x判归概率最大的那一类。l 因为式(1-8)中的 只考虑全体而不考虑类,因而与类无关,所以我们判别归
36、类时可以不考虑它,只需比较式(1-8)的分子 、 的大小就可以了。此时令( )p x(/ )kp gx( /)kp x g( )p x()kp g(/ )() ( /)kkkp gxp gp x g()kp g( /)kp x g (1-9)47高等课堂l又因式(1-9)中的 难于计算,故对式(1-9)两边取自然对数:l即112121ln (/ )ln () ln()()2(2 )kkkkkkmsp gxp gxsxln (/ )ln ()ln ( /)kkkp gxp gp x g( /)kp x g112111211ln()ln)22(2 )kkkkkkkkmsp gx sx ss(1-1
37、0)48高等课堂l式中,向量 和 分别是向量 和 的转置向量。l 假定所有各类的协方差矩阵都相等,即 ,则可用所有各类的总体的协方差矩阵 来代替各个l或l式中: 即总像元数; 是各类的类内离差矩阵,如式(1-7) 是总的类内离矩阵。如下式: x111gkkswwngngx1122111(1)(1)(1)(1)gkkkkksnsnsnsnsn gn gsks12ksss12knnnnkww111gkkswwngng(1-11)(1-12)(1-13)49高等课堂l当各类的像元数 都相等,即 时l用 代替(1-10)中的各个 得到 又因为式(1-16)中等号右边第2项和第3项与类无关,所以判归类时
38、可不考虑它们。只需考虑第1、4、5项就可以了。12111()gkkksssssgg12gnnnnknks112_111211ln (/ ) ln ( ) ln22(2 )kkkkkmspg xpgx s x x sss1(1)swng(1-14)(1-15)(1-16)50高等课堂l这时可令:l如果各类的先验概率相等,那么式(1-17)第1项各类数值相等,即与类无关,判别分类又可不考虑它们。此时也可令l为了书写简化,令111ln()2kkkkkfp gx ss*()kkpp g1112kkkkfx ss11122okkkkkcsc 1kkcs(1-17)(1-18)(1-19)(1-20)(1
39、-21)51高等课堂l于是式(1-17)可写成l式(1-18)可改写成l注意:上面的 是一个 维向量,而 是一个数值。l式(1-22)和式(1-23)就是第 类的判别函数。考虑先验概率时用式(1-22);不考虑先验概率时用式(1-23)l根据 可以返回去求得 ,即*0lnkkkkfx ccpmkf121(/ )kkkkffkgffffkeep gxeeeek0kkkfx cckc0kc(/ )kp gx(1-22)(1-23)(1-24)52高等课堂l用式(1-24)计算有时会在计算机上益出,可以改用下式:l式中, 是各个 中数值最大的 。l 比较算得的每个数据向量 (即每个像元)的各类的 l
40、 的数值的大小,哪一类的数值最大,即属于哪一类的概率最大,就将该向量 (即该像元)判归该类.l 显然,哪一类的 最大也就是哪一类的 最大。因此,实践中也不求 ,而直接比较各类判别函数值 ,看哪一类数据向量 或像元判归该类。kfmaxmax1(/ )ffkkkkkgffkep gxemaxkfxx/xp gxxkfkf/xp gx/xp gxkf(1-25)53高等课堂l二)、最小距离分类法二)、最小距离分类法l 最小距离分类法是监督分类的方法之一。首先利用样最小距离分类法是监督分类的方法之一。首先利用样本数据计算出每一类别的均值向量及标准差(均方差)向量,本数据计算出每一类别的均值向量及标准差
41、(均方差)向量,然后以均值向量作为该类在特征空间中的中心位置,计算输然后以均值向量作为该类在特征空间中的中心位置,计算输入影像中每像元到各类中心的距离。到那类中心距离最小,入影像中每像元到各类中心的距离。到那类中心距离最小,则该像元就归入到哪一类。应用最广的且比较简单的距离函则该像元就归入到哪一类。应用最广的且比较简单的距离函数有;欧几里德距离和绝对距离(混合距离)。具体分类过数有;欧几里德距离和绝对距离(混合距离)。具体分类过程如下:程如下:54高等课堂ij 设p为影像的波段(变量)数, 为影像中一个分类像元,其中 为像元 在第 个波段的像元值(灰度值), 为第 类在第 波段的均值,则像元
42、与各类间的距离可通过如下良种方法之一获得: 欧几里德距离 绝对距离 11fjiijidxm121fjiijidxmixijmixxx55高等课堂l 分类时,根据前面求出的距离,把像元 归入到 最小的那一类.l 直接应用前述的距离能够比较简单地实现监督分类,单有明显的缺陷:l 首先不同类别的灰度值的变化范围即其方差大小是不同的,不能简单地用像元到类中心的距离来划分像元的归属.如下图中的待分类像元,按像元到类中心的距离应归属于 类而实际上应属于变差范围大的 类 xjdus56高等课堂121fjiijidxm图(2-1)方差最小距离分类法的影响待分像元类中心57高等课堂l第二,自然地物类别的点群分布
43、不一定是圆形或球形的,即在不同方向上半径是不同的,因而距离的量度在不同方向上应有所差异.l考虑到以上的因素,在距离的算法上可作如下改进,从而改进分类的精度,例如:l 对欧几里德距离的改进l 对绝对距离的改进l式中, 为第 类第 波段的标准数,当然也可以用 代替上两式的 ,或者用其他加权方法.1221/fjiijijidxm121/fjiijijidxmiijjij58高等课堂l使用最小距离法对影像进行分类,起精度取决于对已知地物类别的了解和训练统计的精度.一般来说,这种分类的效果比较好,而且计算简便,可对像元扫描分类.l 应当指出,最小距离监督分类还可以选用门限阀值 ,具体为:若选择出来的最小
44、距离 小于门限阀值 ,则判别像元 归入第 类,若选择出来的最小距离 大于 ,则判别像元 为拒绝类,即不归属任何类.门阀值 的选择与各特征波段的标准差有关,先求标准差,然后根据专业知识和经验来考虑门限阀值的设定. xxtdxdxdtdtdtdg59高等课堂l一)、isodata分类法lisodata法或迭代法聚类的实质是先给出一个并不怎么正确的初始分类,然后用某种原则反复修改和调整分类,以逐步逼近一个正确的分类.l(一) isodata分类法的基本思路和运算步骤l 下面用具体的算例来说明迭代法分类的步骤,同时叙述这一方法的相关参数,为了简单阐明,这里使用假定数据,而不用书记遥感图像的像元数据和具
45、体的专业应用实例.l 假定有16个像元,即像元数n=16;各像元都有3个波段的值,即波段数或特征数m=3数据如表1.1所示.60高等课堂l迭代的基本思想如下:l 1、确定初始聚类中心的数目l 初始类树数目为 (initial class number),原则上可以随机地假定,但是在像元较少的情况下,初始数目不宜定得过大。l 对表1.1的数据,我们规定先分5类,即 =5,若以 表示第0次分类的第k类,则5个初始类分别表示为: 0kg0g0g 0000012345,ggggg61高等课堂l2、确定初始聚类中心值l 即各类初始的各波段的初值。初始类数目 定下后就要给每类的各波段假定初始值。分类用m个
46、波段,每个类就要指定m个值,构成m维向量。 个m维向量是像元的初始归类中心。l 确定初始类中心的方法很多,最简单的方法是从各像元中选出 个被认为有代表性的像元,分别将它们的波段值作为初始分类的波段值。也可估计指定。l 表1.1中的像元各个3个波段的值,我们要分5类,故得指定5个三维向量 。考虑到原始数据的值基本在0到12之间,故初始值也应在这个范围内,我们又令各类之间保持一定距离,且为了简化,令同一类的各波段值相等。于是定出5个类的初始类中心值 如下|:0g0g0k0g12345,62高等课堂l3 3、定义像元与各聚类中心的距离、定义像元与各聚类中心的距离l 距离这个参数有多种形式,或多种距离
47、定义。例如绝对距距离这个参数有多种形式,或多种距离定义。例如绝对距离,欧氏距离,马氏距离等,它们各有计算公式,对上例,我离,欧氏距离,马氏距离等,它们各有计算公式,对上例,我们选择易于计算且效果也好的绝对值距离们选择易于计算且效果也好的绝对值距离| |: 0102030405222444666888101010(2-1)63高等课堂l式中: 是像元编号; 是波段编号; 是类编号; 是像元 到第 类聚类中心的距离; 是像元 第 波段的值; 是第 类第 波段的值。l 4、进行第1次分类或1次迭代l 按定义的距离,分别计算各个像元与各初始聚类中心的距离,比较每个像元到各类的距离值,把它们分别归到距离
48、最近的类里去。l 对上例,按式(2-2)计算表1.1中各像元到初始聚类中心式(2-1)的距离,例如,像元1到各初始聚类中心 的距离l :jj0ijmikkjjdxkiikdijxkjiikj0k1kdk(2-2)64高等课堂l类推得到比较可知,最小,即像元与第个初始聚类中心的距离最近,所以就把像元归入第类,表示第次分类结果的第类其余类推l进行类似的计算可知:属于第类的有第、号像元;属于第类的有第、属于第类的有第、号像元;属于第类的有第、号像元;属于第类的有第第、号像元。111123111111213131|5 24 25 28jjjdxxxx 12g12d1314154,10,16ddd111
49、123122212213231|5 44 45 48jjjdxxxx 02 14g 12g 13g 11g 12g 15g65高等课堂像元全部计算归类完毕,就完成了第次分类,或称第次迭代。结果如表1.2。本次结果与初始聚类中心的比较也见表1.2。第次分类的修改第次迭代第次分类结果带有很大的主观性,因而是很粗糙的,与实际相差较远。这就是要对她进行修改,调整。方法有多种。其中之一是计算第次分类得到的各类的重心各类的以各波段的均值为分量构成的向量,将它们作为第次分类的聚类中心,重算各类像元与这些新聚类中心的距离,并把各像元归到距离最近的类中心去。全部像元经过这样重新计算和归类后,就完成了第次分类或第
50、次迭代。对上例以表1.2中“本次第j像元的均值”所组成的向量作为第次分类的聚类中心,即: 1kg 1kki66高等课堂 11121314151.81.30.84.04.03.86.05.56.08.08.08.011.012.010.8(2-3)67高等课堂按式()计算表1.1中各像元与各类新聚类中心式()的距离,并将各像元归入距离最近的类,得第次迭代分68高等课堂l类结果(表1.3)69高等课堂l6、分类修改第次一致更多次迭代一般来说,分类经过次修改仍然得不到满意结果,需要进一步修改,进行第次一致更多次迭代。通常是把第次分类得到的重心,作为第次迭代分类的聚类中心,对各像元重算距离,重归类。如
51、此逐次分类迭代,直到获得稳定的分类结果为止。面前例,我们以第次迭代分类结果得到的重心,作为第次分类迭代聚类中心: 21222324251.30.70.33.83.83.46.05.56.08.37.78.311.713.011.0 2k70高等课堂按式()计算表1.1中各像元与各类新聚类中心式()的距离,得第次迭代分类结果表(1.4)71高等课堂l由表.4可见,第次分类结果各像元的归类情况与第次分类结果完全一样,各类各波段的均值与第次结果响应波段巨值之差为零。每一类包括的像元数和像元构成已不再变化,这说明,经过若干次动态变化之后,分类已经达到稳定,分类过程到此结束。l(二)控制迭代聚类过程的参
52、数l上述的分类过程是单纯的情况。要得到好的分类结果,还需要一系列的环节和规定相应的参数来控制迭代聚类过程。l一般来说,迭代聚类中类的数目应在分类过程中按实际数据的特征发生变化,即发生类的分裂和合并。这是靠分类时给出一些特定的参数来实现的。l最常用的参数有以下几种:72高等课堂l、最多像元数l分类过程中任何一个类所能包括的像元数的最大数目。如迭代到某一步,某一类所包括的像元数超过这个值,该类就须分裂成两类,然后再进行下一次分类迭代。l、最少像元数l在分类过程中任何一个类应该包括的像元的最小数目。如分类迭代到某一步,某一类包括的像元低于此值,这个类就须与距离最近的另一个类合并,然后再进行下一次分类
53、迭代。l、最大标准差l分类过程中任何一个类的任何一个波段所能用允许的标准差的最大值,如果分类迭代到某一步,某类的标准差超过此值(说明这个类所包括的各个像元彼此差别太大),这个类必须分成两类后再进行下一次分类迭代。73高等课堂l、最小间距l分类过程中任何两类之间所能允许的最小类间距离(两个类的重心之间的距离),如果距离太小说明它们性质太相近,那么这两个类须合并成一类再进行下一次分类迭代。l拒绝阀l在研究范围大时,研究者对实际情况不能很好的了解的情况下,有个别类是人们未认识,未掌握的,这些特殊的未知类的各个像元总是在分类迭代过程中按相应原则,归属相应的类里区,而实际情况它根本不属于该类,这就引入一
54、个阀值,如某一个像元与任何一个聚类中心的距离都大于阀值,那么这个像元不能轨道任何一个聚类中去,应归入未知类。l、停止阀l分类达到一定次数,当满足要求的精度时,应当停止下一次迭代,根据需要我们设置一个精度,当迭代达到这一精度我们就停止迭代。l74高等课堂l二)二)kk均值分类法均值分类法lk均值分类法(k-means)与isodata法类似,也是迭代聚类法。说道二者间的关系,应该说isodata法是k-mean法相对要简单些,它只要求分类者给出一个欲分类别数,不要求给出最少类别数和最多类别数,此方法程序自动计算出均匀分布于数据空间中的各个类均值(向量),作为初始类均值向量,或叫种子或吸引者,然后
55、进行迭代聚类,用最小距离原则将各个像元分别分到离各初始均值中最近的那个均值所属的类中。然后再计算类均值,再进行归类。使用者也需规定最大迭代次数和变化阀。还可以选择性地规定标准差或距离阀值,使不满足此条件的像元归入未知类。如果不规定这两个阀值,那么所有像元都被归类。l但k-均值法除了需要分类者先给定欲分类数以外,与isodata法还有两个点不同:、不是所有像元都分类完毕后再进行各类类均值的计算,还而是每重新分类一个像元就计算一次均值;、不需要进行类的合并和分裂。75高等课堂l遥感图象反映的某一区域特定地理环境中的综合信息,它综合地反映了地球系统各要素的相关性。l遥感地学相关分析,指的是充分认识地物间相关性,在遥感图像上寻找目标识别的相关因子,建立直接解译标志和间接解译标志,推断和识别目标本身。76高等课堂-地学(地理,地质,气象等)背景知识-遥感图像的尺度特征-混合像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化工行业员工绩效考核
- 市场行业策划员工作总结
- 瞄准高效输出的年度目标计划
- 2024年广西壮族自治区北海市公开招聘警务辅助人员辅警笔试自考题1卷含答案
- 2024年河北省承德市公开招聘警务辅助人员辅警笔试自考题2卷含答案
- 2021年浙江省宁波市公开招聘警务辅助人员辅警笔试自考题2卷含答案
- 美丽家庭事迹材料
- 河南省郑州市(2024年-2025年小学六年级语文)部编版随堂测试(上学期)试卷及答案
- 广西北海市(2024年-2025年小学六年级语文)统编版小升初模拟(上学期)试卷及答案
- 2025年家电配线组件项目规划申请报告
- 学术不端行为治理研究
- 广东省广州市海珠区2023-2024学年九年级上学期期末物理试题(含答案)
- 企业文化、战略与电力能源知识参考题库练习卷含答案(一)
- 福建南平武夷高新技术产业控股集团有限公司招聘笔试冲刺题2024
- 2024年设备维修部管理制度(6篇)
- 精神科护理工作计划例文
- 2024山地买卖合同模板
- 河北省承德市2023-2024学年高一上学期期末物理试卷(含答案)
- 【初中化学】二氧化碳的实验室制取教学课件-2024-2025学年九年级化学人教版上册
- 出租车行业服务质量提升方案
- 景区安全管理教育培训
评论
0/150
提交评论