遥感数字图像处理-第五章 遥感数字图像的计算机分类一_第1页
遥感数字图像处理-第五章 遥感数字图像的计算机分类一_第2页
遥感数字图像处理-第五章 遥感数字图像的计算机分类一_第3页
遥感数字图像处理-第五章 遥感数字图像的计算机分类一_第4页
遥感数字图像处理-第五章 遥感数字图像的计算机分类一_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章遥感数字图像计算机分类一、遥感数字图像计算机分类的一般原理二、遥感分类的常用判别函数三、遥感数字图像的分类方法四、遥感数字图像的分类后处理五、光谱特征分类中的辅助处理技术六、遥感图像计算机分类新方法1.一、遥感数字图像计算机分类的一般原理遥感图像解译

2.一、遥感数字图像计算机分类的一般原理遥感图像解译

遥感图像数据专题图像专题地图专业应用解译方法计算机分类目视解译光谱规律地学规律解译者的经验解译标志(亮度、色调、位置、时间、纹理、结构等)景物类型属性识别、分类提取信息、识别地物3.图像分类的目的

将图像中每个像元根据其不同波段的光谱亮度、空间结构特征或其他信息,按照某种规则或算法划分为不同的类别。遥感图像分类利用计算机技术来模拟人类的识别功能,对地球表面及其环境在遥感图像上的信息进行属性的自动判别和分类,达到提取所需地物信息的目的。4.计算机分类是通过模式识别理论,利用计算机将遥感图象自动分成若干地物类别的方法。如土地覆盖/土地利用分类、森林类型分类、植被类型分类、岩性分类、……

数据→信息(遥感数据---地物信息)主要数据类型:1、原始光谱数据;2、光谱变换后数据;3、非遥感数据5.理论依据

在理想条件下,图像中同类地物在相同的条件下应具有相同或相似的光谱信息特征和空间信息特征,从而表现出同类地物的某种内在相似性,即同类地物像元的特征向量将集群在同一特征空间区域,而不同地区的光谱信息特征或空间信息特征应不同,因而将集群在不同的特征空间区域。6.遥感图像分类的实质

图象分类过程的总目标是,将图象中所有像元自动地进行土地覆盖类型或土地覆盖专题的分类。7.影响遥感图像分类精度的因素大气状况的影响:吸收、散射。下垫面的影响:下垫面的覆盖类型和起伏状态对分类具有一定的影响。其他因素的影响:云朵覆盖;不同时相的光照条件不同,同一地物的电磁辐射能量不同;地物边界的多样性。

8.统计模式识别的概念和基本问题模式(pattern):在多波段图象中,每个象元都具有一组对应取值,称为象元模式,即一个像元对应多个值(地理信息的多维性)。特征(feature):在多波段图象中,每个波段都可看作一个变量,称为特征变量。特征变量构成特征空间。波段:光谱波段其它派生波段(纹理、上下文关系、波段比等)辅助数据(ancillarydata)(非遥感数据,如DEM、土壤类型)特征提取(featureextraction):通过变换找出最能反映地物类别差异的特征变量用于分类的过程9.模式识别

是人们沿着仿生学的道路,用计算机系统作为工具来模拟人类的感知和识别智能,它是人工智能的一个分支。xn

分类器(或称判决器),可以根据一定的分类规则,把某一测量矢量X划入某一组预先规定的类别之中去。

自然模式接收器(传感器)分类器(判决器)x2x1结果….模式识别系统的模型10.遥感图像目视判读与计算机分类的比较

相同点:目的一致;不同点:目视判读——直接利用人类的自然识别智能;计算机分类——利用计算机模拟人类的识别能力。遥感图像的计算机分类

它是对地球表面及其环境在遥感图像上的信息进行属性的识别和分类,从而达到识别图像信息所相应的实际地物,提取所需地物信息。11.遥感图像的模式特征及其分类方法

光谱特征纹理特征↓↓基于光谱特征的统计识别方法基于纹理特征的统计识别方法(主要)(次要、补充)12.统计模式识别的基本含义

(1)把识别对象的特征的每一个观测量视为从属于一定分布规律的随机变量;(2)在多维观测的情况下,把识别对象特征的各维观测值的总体视为一个随机矢量,每一个随机矢量在一个多维特征空间中都有一个特征点与之相对应;(3)所有特征点的全体在特征空间中将形成一系列的分布群体,每个分布群体中的特征点被认为具有相似特征,并可以划为同一类别;(4)找到各个分布群体的边界线(面)或确定任意特征点落入每个分布群体中的条件概率,并以此依据来确定特征点(或相应的识别对象)的分类。

13.光谱特征向量与特征点集群

基于统计模式识别的分类方法监督分类与非监督分类分类处理与增强处理的异同共同点:增强和提取遥感图像中目标物的信息不同点:增强处理→增强视觉效果→提高图像的可解译性(定性)图像分类→地物类别的区分(定量信息)14.光谱特征向量与特征点集群

——图像波段总数——地物图像点在第波段图像中的亮度值光谱特征向量

光谱特征变量:由于受外界各种因素的影响,使得同类地物的成像亮度值总是带有随机误差,导致图像亮度值(即光谱特征)的观测值为一个随机变量(x)。

光谱特征向量:同名地物点在不同波段图像中亮度的观测量构成一个多维的随机向量(X),称为光谱特征向量。即15.光谱特征向量与特征点集群

光谱特征空间为度量地物的光谱特征,建立的以各波段图像的亮度分布为子空间的多维空间。16.光谱特征向量与特征点集群

特征点集群每个地物点依其在各个波段所具有的光谱值可以在一个多维空间中找到一个相应的特征点,但由于随机性所致,同类地物的各取样点在光谱特征空间中的特征点将不可能表现为一个点,而是表现为一个相对聚集的点集群,不同类地物点集群在特征空间中一般相互分离,这些点集群称为特征点集群。17.特征点集群在空间中的分布情况

最理想情况

不同类别集群至少在一个特征子空间(某一波段图像)中的投影(即亮度范围)是完全可以相互区分开的——可以用简单的图像密度分割实现。BiBj水植被土壤18.典型情况

不同类别地物的集群,在任一个子空间都有重叠现象存在,但在总的特征空间中却是可以完全分开的。即单波段的图像不能实现图像的分类,只有利用多波段图像在多维空间中才能实现精确分类。

水植被土壤19.一般情况

不论是在总的特征空间还是任一子空间,不同类别的集群之间总有重叠现象,这时重叠部分的特征点所相应的地物,在分类时会出现不同程度的分类误差,这是遥感图像分类中最常见的现象。

水植被土壤20.地物与光谱特征空间的关系21.计算机分类的基本原理基本原理

不同的地物具有不同的光谱特征,同类地物具有相同或相似的光谱特征→将图像中的每个像元或区域划归为若干类别是的一种,即通过光谱特征分析→选择特征参数→将特征空间划分为不重叠的子空间→将影像像元划分到各个子空间→实现分类图象分类:基于数字图象中反映的同类地物的光谱相似性和异类地物的光谱差异性。依据是遥感图像像素的相似度。距离相关系数22.计算机分类的基本原理基本思想

同类地物的光谱特征比较接近,在特征空间中的点聚集在该类的中心附近;多类目标聚集多个点族。分类算法的核心

判别函数判别准则

方法

判别函数:找到一个函数使fAB(X)=0判别准则:fAB(X)>0,X为A类;

fAB(X)<0,X为B类类别界面23.计算机分类处理的一般过程图像变换及特征选择分类器的设计初始变量参数的确定每个像素的分类判决分类编码图像、结果检验分类结果输出原始图像数据的预处理准备阶段分类判决输出几何校正、辐射校正量化、采样、增强等特征选择(FeatureSelection)特征提取(FeatureExtraction)精度评价可靠性评价24.二、遥感分类的常用判别函数距离判别函数

欧氏距离:N,波段数;dij第个i像元与第j个像元在N维空间中的距离;xik为第个k波段上第i个像元的灰度值。相当于高维空间内向量所表示的点到点之间的距离。由于特征向量的各分量的量纲不一致,通常需要先对各分量进行标准化,使其与单位无关,比如对亮度值和NDVI两个单位不同的指标使用欧式距离可能使结果失效。优点:简单,应用广泛(如果也算一个优点的话)缺点:没有考虑分量之间的相关性,体现单一特征的多个分量会干扰结果。25.绝对距离:明可夫斯基距离(Minkowski):欧氏距离和绝对距离可统一表示为:明可夫斯基距离存在的主要问题明氏距离与特征参数的量纲有关(解决办法:标准化处理)明氏距离没有考虑特征参数间的相关性26.为了更一步理解这些距离的差别,我们做下面一个实验:选取一个点作为中心点,用上述的三个距离公式分别计算周围的每一个点到这个中心点的距离,将距离相同的点用同一种颜色表示,那么得到下面的三个图:图1.欧氏距离

图2.曼哈顿距离

图3.闵可夫斯基距离(p=10)

从三个图中可以看出,三个不同的距离公式,对中心的逼近方式也不一样:欧式距离是以同心圆的方式向中心靠近;曼哈顿距离是以倾斜45度角的正方形的方式向中心靠近;闵可夫斯基距离(p=10)则是以四个角度光滑的四边形的方式向中心靠近。27.分类实验:在维数为2维的平面空间中(只有横轴方向x和纵轴方向y两维空间),有一块128×128的区域,在这个区域中有已知的A(110,18),B(30,18),C(110,88),D(90,58),E(25,123)五个点,以这五个点为5个类别的中心,将这个128×128的区域里面的所有的点,用上面的三个不同的距离计算方法,对它们进行最小距离分类,结果如图图4.欧氏距离分类

图5.曼哈顿距离分类

图6.闵可夫斯基距离(p=10)分类从三个图中可以看出来,不同距离算法,类别中心对周围点的作用域是不相同的。28.马氏距离(Mahalanobis)1)度量两个服从同一分布并且其协方差矩阵为C的随机变量X与Y的差异程度2)度量X与某一类的均值向量的差异程度,判别样本的归属。此时,Y为类均值向量.优点:1)独立于分量量纲2)排除了样本之间的相关性影响。缺点:不同的特征不能差别对待,可能夸大弱特征。29.相似系数(余弦距离)表示当前像元的向量与类向量之间的光谱夹角。像元i到类k的距离公式为:相似系数为1,表明两个向量重合,但并不代表两个向量之间的欧氏距离为0。特点:将地面光谱作为已知类,比较图像光谱与地面光谱的相似性,相似系数具有更好的效果。dik为像元i到类k的距离,p为波段数,xij为像元i在j波段的值,Mkj为类k在j波段的中心。

30.最大似然法判别函数(Bayes准则)基本思想(1)地物类数据在特征空间中构成特征点集群;(2)每类地物每一特征均为正态分布,多个特征构成多维正态分布;(3)按正态分布规律用最大似然判别规则进行判决,得取分类结果。31.Bayes准则及判别函数X属于wi类的概率,又称后验概率,即像元X出现在wi的最大概率32.假设有两类,如图。概率判别函数的判别边界为d1(X)和d2(X),当使用概率判别函数进行分类时,不可避免会出现错分现象,分类错误的总概率由后验概率函数重叠部分下的面积给出。错分概率是类别判别分界两侧做出不正确判别的概率之和。Bayes判别边界使这个数最小,因为这个判别边界无论向左还是向右都将包括不是1类便是2类的一个更大面积,从而增加总的错分概率。故:Bayes判别规则是错分概率最小的最优准则。33.最大似然法和最小距离法分类错分比较假设有两类w1和w2,其后验概率分布如图。最小距离按欧氏距离或计程距离计算(因马氏距离不仅与均值向量有关,还与协方差矩阵有关,更复杂)。结论:最大似然法的错分概率小于最小距离法总的错分概率。对马氏距离而言,判别边界有可能不是两上均值向量的中点,其判别边界与集群的分布形状大小有关。34.三、遥感数字图像的分类方法分类执行方式:监督分类、非监督分类分类模型或分类器:统计分类、模糊分类、邻域分类、神经网络分类等。35.监督分类(supervisedclassification)通过选择代表各类别的已知样本(训练区)的象元光谱特征,事先取得个类别的参数,确定判别函数,从而进行分类。在监督分类中,先定义信息类,然后检验它们的光谱可分性。36.监督分类(supervisedclassification)训练区的作用已知覆盖类型的代表样区用于描述主要特征类型的光谱属性其精度直接影响分类结果37.训练区的选择要求训练场地所包含的样本在种类上要与待分区域的类别一致。训练样本应在各类目标地物面积较大的中心选取,这样才有代表性。如果采用最大似然法,分类要求各变量正态分布,因此训练样本应尽量满足这一要求,训练样本的个数至少要n+1个(n是特征空间的维数)训练样本的数目应能够提供各类足够的信息和克服各种偶然因素的影响图件时间和空间上的一致性38.训练区选择的关键A、类别数如果特征空间(波段数)的维数是n,则预分类的类别数一定要>n+1,甚至可以达到3n。

B、代表性训练样本应该反映该类地物的亮度特征;且需注意同类地物空间分布的不连续性(如,可以分别在2块草地中选取训练样本)。C、亮度分布从亮度特征角度而言,对于同一类地物具有不同亮度特征情况,通常都要选取(同物异谱)。39.D、纯度的把握一般来说,在已知类别的中间部位纯度较高;如果过纯,则方差过小,导致许多此类地物的像元被拒分;如果不纯,则方差过大,导致不是此类地物的像元被分到该类别中,导致出现“错分”的情况;把握纯度的方法:读像元的亮度值,确定该类地物的亮度分布区间;同时,注意其它地物亮度值与其近似部分的像元亮度分布区间,依“错分损失最小”的原则,确定“分类界限”。

40.训练区的选择41.水体高层建筑水泥地面裸地林地选择训练样区--直接在图像上选取42.TMBand38284969901435567788TMBand4水泥地面水体选择训练样区—在特征空间上选取43.训练样本中的各个像素在特征空间中的分布情况Band1DNsBand1DNsCluster1Cluster2Cluster3Band1DNsBand1DNs44.最小距离分类法

最小距离分类法是以特征空间中的距离作为像元分类的依据。原理简单,计算速度快,分类精度不高。Step2–foreachunclassifiedpixel,calculatethedistancetoaverageforeachtrainingarea45.特点:原理简单,容易理解,计算速度快。缺点:因只考虑每一类样本的均值,而不用管类别内部的方差(每一类样本的分布),也不用考虑类别之间的协方差(类别和类别之间的相关关系),所以分类精度不高。主要用途:一般不用它作为分类对精度有高要求的分类,但它可以在快速浏览分类概况中使用。.改进方法.多级切割分类法通过设定在各轴上的一系列分割点,将多维特征空间划分成分别对应不同分类类别的互不重叠的特征子空间的分类方法。对于一个未知类别的像素来说,它的分类取决于它落入哪个类别特征子空间中。多级切割分类法要求训练区样本的选择必须覆盖所有的类型。运用多级分割法分类前,需要先进行主成分分析,或采用其他方法对各轴进行相互独立的正交变换。.用多级切割法分割三维特征空间.平行多面体分类02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest12

要求分割面总是与各特征轴正交,如果各类别在特征空间中呈倾斜分布,就会产生分类误差。可先采用各轴的正交变换后,再进行多级分割。50.最大似然比分类法(MaximumLikelihood)通过求出每个像素对于各类别的归属概率,把该像素分到归属概率最大的类别中去的方法。假定训练区地物的光谱特征和自然界大部分随机现象一样,近似服从正态分布。利用训练区可求出均值、方差以及协方差等特征参数,从而可求出总体的先验概率密度函数。然后,每一个像素归为某一类别的归属概率可求出。.02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest1202550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest..使用最大似然比分类法的注意事项各类别的训练数据至少要为特征维数的2-3倍以上,这样才能统计出具有较高精度的均值、方差与协方差;如果2个以上的波段相关性很强,那么方差协方差矩阵的逆矩阵就不存在,或非常不稳定。在训练数据几乎都取相同值的均质性数据组的情况下也是如此。此时,最好采用主成分分析法,把维数减到仅剩相互独立的波段。当总体分布不符合正态分布时,不适于采用以正态分布的假设为基础的最大似然比分类法。其分类精度也将下降。54.分类结果55.非监督分类法不必使用训练样区数据作为分类的基础。通过检验大量的未知像元并根据多光谱空间中的自然集群将它们分为若干类。基本前提:同种地物类型的值在测量空间上应该相互接近,而不同的地物类型应该具有比较明显的可分性,即:假定遥感影像上同类物体在同样条件下具有相同的光谱信息特征。主要方法:采用聚类分析方法,聚类是把一组像素按照相似性归成若干类别,即“物以类聚”。非监督分类(unsupervisedclassification)56.主要目的是使得同一类别的像素之间的距离尽可能的小而不同类别上的像素间的距离尽可能的大。分类标准的确定不需要人的参与,由计算机根据自动按照某一标准(例如距离最短)自动进行。需要确定要分几种类别,或者类似的输入条件。分类后的结果,还需要再给出具体的涵义,即先分类后确定属性。。区别:监督分类法确定有用信息类别,然后再检验它们的光谱可分性;而非监督分类法先确定光谱的可分性,然后再确定它们的有用信息。57.分类算法的思路

先选择若干个模式点作为聚类的中心,每一个中心代表一个类别,按照某种相似性度量方法将各模式归于各聚类中心所代表的类别,形成初始分类。然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止。58.

根据事先指定的某一准则,而进行计算机自动判别归类,无须人为干预,分类后需确定地面类别。在非监督分类中,先确定光谱可分的类别,然后定义它们的信息类。59.非监督分类的核心:初始类别参数的选定(基准类别集群中心(数学期望),集群分布的协方差矩);迭代调整。非监督分类的主要过程60.非监督分类基本过程确定初始类别参数计算像元至集群中心距离确定像元类别计算新的类别均值向量均值中心变化?计算结束否是61.初始类别参数的选定方法像素光谱特征的比较法图像抽样任一像元f1作为第一类别给定阈值T第i像元fi与第一类比较|f1-fi|<TYNfi属于f1类Fi产生新的f2类62.总体直方图均匀定心法——在总体直方图的基础上选定类别中心63.64.最大最小距离选心法(效果最好)选心原则:各初始类别之间尽可能保持远距离65.先抽样,设有n个样本,计算步骤:66.非监督分类的主要算法ISODATA法(迭代自组织数据分析技术)基本思想:在初始类别参数选定的基础上,通过逐步趋近求出实际的基准类别参数。67.算法流程:68.69.70.71.

总结:以初始类别为“种子”进行自动迭代聚类过程,它可以自动地进行类别的“合并”与“分裂”,其各个参数也在不断地聚类调整中逐渐确定,并最终构成所需要的判别函数。因此,基准类别参数的确定过程,也正是利用光谱特征本身的统计性质对判别函数的不断调整和“训练”的过程。72.K-mean算法基本思想:通过迭代,移动各个基准类别的中心,得到最好的聚类结果。聚类准则(收敛条件):使每一聚类中,多模式点到该类别的中心的距离的平方和最小。即:对于图像中互不相交的任意一类,计算该类中的像素值与该类均值差的平方和。将图像中所有类的差的平方和相加,并使相加后的值达到最小!73.第i类中,所有像元到该类中心差的平方和总类数m,所有像元到该类中心差的平方和74.K-mean算法的计算步骤:75.K-mean算法与ISODATA算法的区别:(1)ISODATA算法它不是每调整一个样本的类别就重新计算一次各样本的均值,而是在把所有的样本都调整完之后才重新计算。(2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论