遥感图像分类方法的研究与精度评定_第1页
遥感图像分类方法的研究与精度评定_第2页
遥感图像分类方法的研究与精度评定_第3页
遥感图像分类方法的研究与精度评定_第4页
遥感图像分类方法的研究与精度评定_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

遥感图像分类方法的研究与精度评定.绪论1.1选题背景遥感图像是按一定大小的比例,真实和客观地记录并反映地表上的物体电磁波辐射的强弱情况,它是遥感进行探测并按一定的方式获得的相应信息的一种表现的形式[1]。遥感技术的核心问题是根据在遥感图像上地物表现出的电磁辐射强弱的不同,对地物进行判读以后,然后对地面物体的所属情况和分布的特征进行一一识别。我们在探讨遥感技术时,遥感图像的分类在提取专题信息,监测动态变化,制作专题地图,建立遥感数据库等方面都起着重要的作用。遥感图像的应用随着试用地方的变化而发生相应的变化,所以对遥感图像处理提出了更多更细的要求,因此图像分类环节的位置日益突出,许多经典的分类方法和算法也在多年的努力和发展中应运而生。遥感图像分类主要通过两种方法,一种是传统的目视解译,一种是计算机分类。最先出现的分类技术是图像目视解译分类,这种方法通过对遥感图像上的一系列特征进行处理,例如综合分析、比较、推理和判断,最后对有必要的信息进行提取。它的优点是灵活性较好,空间相关信息的获得更容易,但缺点是如果需要知道确切的位置有点困难,时效性差,不能够进行重复,并因人引起的差异较大。目前,目视解译被广泛应用在对精度较高图像的判读中,如达到米级高分辨率遥感图像,原因就在于计算机分类的精度比目视解译的相应精度要低。计算机遥感图像分类是就是将图像的所有像元按其性质分为若干个类别的过程,同时也是模式识别技术在遥感领域中的具体应用[2]。计算机遥感影像分类方法主要包括句法模式方法和统计模式方法。统计识别模式,如K-最近判别法、最大似然法等是分类方法中一般较常见的。句法方法在近年来发展的分类新方法中较多的被采用,这类方法有模糊数学方法、决策树分类法、专家系统法、人工神经网络方法等。确定不同地物类别间的判别接口和判别准则是计算机遥感图像分类的中心任务,它的优势主要在于可以重复进行,准确知道确切的位置,需要的时间较短,有效率。目前的遥感图像分类应用的现状是传统的模式识别分类方法被应用较多。遥感图像自身所有的空间分辨率以及同种地物不同光谱分辨率或者不同地物同种光谱分辨率的影响,同时很多分错的情况例如错分、漏分都会降低分类的精度。但目前很多改进后的算法大大提高了分类的精度。此外,很多新的分类方法在国内外也相继出现,例如人工神经网络分类法(ArtificialNeuralNetwork)、模糊分类法、支撑向量机分类法(SupportVectorMachine)、决策树分类法(DecisionTreeClassifier)以及亚像元分类法(SubpixelClassification)[3]。本文的目的主要在于对这些分类方法和算法进行一个完整的概括,对遥感图像分类提供一些基础理论,其中重点介绍了距离分类方法,并且对精度进行了评定[3]。1.2我国遥感技术分类现状从上个世纪70年开始,从第一颗地球资源卫星(ERTS-1)发射成功,人类开始了一个新纪元即研究以计算机作为辅助工具,解译卫星遥感图像。解译主要是对卫星的数字图像进行位置配准和几何校正,早期这些都是通过数字图像处理软件来实现的,并这个基础之上从遥感图像中获取有关地物的信息是通过人和计算机的共同协作来实现的。采用这种方法的实质却依然是遥感图像的目视判读方法,因为它对图像解译人员的解译水平和经验依赖程度较大,并没有找到实现在遥感图像分类的更好的方法。统计模式识别方法是遥感图像计算机分类方法的一种,在20世纪80年代后开始占据重要的位置,它的特点是利用地物的相应光谱特征在图像中不同表现对影像中的地物相应的进行分类。这些方法促进了遥感图像利用计算机进行分类的快速发展。上个世纪90年代一直到现在,以前采用的大量遥感图像分类的方法仍然被应用,例如,在遥感图像分类中,采用的支撑向量机和神经网络等方法具有很大的优势[4]。1988年,遥感图像分类中增加了神经网络算法。它具有对信息的分布式进行存储,并依靠自己并充分发挥自身优势等一些较好的特点,才在遥感图像分类的领域中被人们广泛的使用。又如Mural.H(1997)提出了基于知识发现和神经网络的分类的新方法,而贾永红等发现了基于BP神经网络的多源遥感影像的分类方法[5],支撑向量机是由Vapnik提出的。刘志刚对基于支撑向量机的非监督分类遥感影像分类新方法进行了探讨[6]。遥感影像在进行空间特征提取时产生了一种新的方法,这种方法以支撑向量机(SVM)为基础,并且把SPOT全色波段影像上城市特征的主要信息的提取为应用实例,综合比较了各种特征提取方法,证明了不仅在可表达性、特征空间高维不限制、学习速度、自适应能力等方面具有优势,而且具有比较高的分类精度。自从模糊集理论提出以来,在模糊信息处理方面的应用理论有了很重大的进步,模糊模式识别方法也应运而生。它能够在语音识别、图像分割以及文字识别中陆续的被使用,经过试验获得了很好的效果。因为地球表层的信息具有复杂和易获得的特点,而且地表的信息是无限的,所以遥感信息之间的复杂以及遥感信息在传递过程中所受到限制较大相关,所以实际上遥感图像所具有的信息不单单是单纯的地物信息,往往在地形情况较复杂的或者是空间分辨率低的影像单元中能看到多种地物的综合反映情况。基于模糊模式识别的这一主要特点成了遥感影像分类研究中的重要特征。而且,还有像莫源富对从山区获得的遥感图像提出了相应的按照分区进行的分类法,并充分利用GIS的强大功能,对其分类进行辅助,在遥感图像的识别方面取得了很大的进步。2遥感图像2.1遥感概念遥感就是在不与物体直接相接触下,对自然现象或目标物很远距离进行感知的一门新的探测技术。从具体方面来讲就是,利用在空中以及外大气层的各种平台,应用相应传感器获得能够反映地物表面特征的各种信息数据,通过进行传输,经过变换和相应的处理,把有用的信息提取出来,从而实现了研究地物空间的性质以及形状和位置的变化及其与环境的相互关系的一门现代应用技术科学[7]。根据上面的说法,人以及动物都具有一定的遥感能力。比如,人眼能够对物体进行识别的过程本身就是一种遥感识别的过程,它是通过识别物体亮度、色调,物体的大小以及形状等相应的信息,用来判别物体的分类及属性。蝙蝠能够用发射出的超声波以及接收到反射波来判别出障碍物的属性、方位以及距离。2.2遥感图像的几何处理2.2.1遥感图像的几何变形遥感图像变形的几何变形是指原始图像上与在参照系统中的表达要求的各地物的几何位置、形状、方位等特征不一致时产生的变形[8]。我们一般将变形误差分为两类,一是内部误差,二是外部误差。内部误是由于传感器自身的性能特性的指标偏移量所造成的。内部误差随着传感器结构的不同而不同,通过重新检核的方式在地面上可以测定出它的特点,它的误差值较小。外部变形误差是指传感器自身处于正常的状态下,除了传感器自身以外的其他各种因素所引起的误差。遥感图像的变形主要是由以下因素引起的:第一,地球自转的影响,第二,传感器外方位元素变化的影响,第三,地球曲率引起的图像变形,第四,地形起伏引起的像点位移,第五,大气折射引起的图像变形,第六,传感器成像方式引起的图像变形。对遥感图像进行的几何校正,一般说来可分为以下几个步骤:(1)确定所用的校正方法通过图像中用于的进行几何校正的一些数据和几何畸变的相应特性,选取用于几何校正相应的方法。校正方法一般有多项式法、共线方程法、随机场内的插值法等。由于多项式法具有使用上较为方便,原理比较通俗易懂的特点,且在各种类型的图像上都可以应用,因而多项式法在遥感图像几何校正的空间变换上较多被采用。这里主要是指相应系统的校正,即与传感器构造特征相关联的校准数据,如焦距的大小等,还有测出的传感器的一些值代入到能够用来消除图像几何变形的理论校正公式中来实现目的。(2)确定校正的公式公式利用控制点的地图坐标和图像坐标之间的关系,被用来确定所应输出的地图坐标和给定的图像坐标之间的坐标变换,主要用于对图像的非系统性进行校正。而坐标变换式经常采用l、2次等角的变换,2、3次投影的变换或采用高次多项式变换。利用最小二乘法对控制点的地图坐标值和图像坐标值可以求出坐标变换式相应的系数。(3)验证所采用的校正方法及校正公式的相应精度校正后,我们检查几何畸变是否得到充分的校正,若不能得到很好地校正,我们要对其原因进行分析,这样更为有效的几何校正方法才能被提出来,第二次校正才能被实施。(4)数据重采样和线性内插为了使输入的未校正图像和校正后输出图像的像元相互对应,要进行重新采样。重采样主要有两种方法,即:计算出输入图像的各个像元点的位置和输出图像坐标系相应位置的变化,并把各像元的数据投影到相应的位置上;而对输出图像的各像元的位置在输入图像坐标系的相应位置的变化进行逆运算,得到该位置上的像元的数据。在重新采样这种方法中,由于用于计算的对应位置的坐标值是小数,要求出新的像元值就必须考虑周围的像元值,然后通过线性内插的方法获得。几何校正常用的内插方法包括:3次卷积内插法(CC:cubicconvolution)、最邻近内插法(NN-nearestneighbor)以及双线性内插法(BL:bi.1inear)。2.2.2遥感图像增强图像增强的实质是加大目标和其周围背景图像之间的差距。遥感图像增强是计算机自动分类的一种预处理方法,为了特定目的,使遥感图像中的一些信息更加醒目,减少受不必要信息的干扰,使判读图像更加容易。图像增强的目的主要有:改变图像灰度范围及灰度等级,相应的提高图像对比度;抑制噪声,使图像变得平滑;突出地物的边界和线性形状地物,合成彩色的图像;锐化所需图像;压缩较大图像的数据量,突出所需要的主要信息等。目前,空间域和频率域的处理是遥感图像增强处理技术中较为常用的两大类。首先对图像进行傅里叶变换,然后修改变换后的频率域图像的频谱来达到增强图像的目的,这就是频率域图像增强。空间域图像增强是通过改变单个像元及邻近像元的灰度值来增强图像,主要包括点运算的图像增强和邻域运算的空间增强。(1)对比度变换如果要改变图像像元的亮度值,那么就要将图像之间的差距减小,并且这种改变在运算过程中有一个变换函数,从而可以符合一定的数学规律。直方图调整,线性变换以及非线性变换等是对比度扩展中较为常见的方法。一般情况下,我们用的更多的则是线性变换,因为它在处理图像增强方面很具有优势。①所谓线性变换是把函数变化成为线性关系或者变为分段的线性关系,如:(2-1)在2-1式中,a,b为所需测定的系数值。我们需要将范围扩大,经常把函数变为原图像的相应亮度值的动态范围。②非线性变换是在变换函数是非线性的情况下来定义的。对数变换、指数变换、平方根变换等是非线性变换中较为常见的方法,它们各有自己的优势和缺点。其数学表达式:(2-2)(2-3)(2-4)式中,a,b,c为可选择的控制参数,控制曲线的截距、变化率、起点等。它们可以使动态范围的可选择性加大,变换的方式也更加灵活。对于低亮度值区域的扩展一般用对数变换进行。而指数变换的效果是压制暗区而突出亮区。因而二者互为逆运算的操作。平方根变换可以改变方差和均数的病态分布或图像数据相应的偏态分布,可以对高亮度值和低亮度值区域均都可以进行改善。查表法是非线性变换中一种较为常见的方法,因为它虽然简单,但是效果却非常好。它会列一个个的表格,用此来代表亮度值的输出与输入间的变换关系,在其中一个已知值已知的情况下,要想知道其对应的输出值,只需要查一下表格即可。③直方图的调整是指通过对函数的关系的变换,求出所要求的直方图,并调整原图像的亮度值。直方图的调整包括直方图匹配、直方图均衡化以及直方图的正态化。(2)彩色的合成①假彩色合成方法假彩色合成是指利用人眼看不到的红外波段来把某些图像进行的彩色合成,这种情况主要是由于在摄影测量中如果需要用到许多波段,那么一副完整的图像不可能全部都在三原色的波长范围内。②真彩色合成方法如果对同一地物进行拍摄,拍出用红、蓝、绿三原色进行合成的三张图像,同时使用的滤光片是红、蓝、绿三原色,那么得到的颜色将会非常接近天然色,这被称作真彩色合成。方案的选择在影像合成过程中占据重要位置,因为它决定了彩色影像是否显示某一方面的信息或者能够显示出较丰富的信息。现在以陆地卫星Landsat的TM卫星影像为例子,标准假彩色合成方案是指在进行彩色影像合成时,分别把蓝、绿、红三种颜色赋予给2,3,4波段。为了能够更好地贴合实际地应用,我们的分析调试是根据应用目的的不同来决定的,这样得到的最后方案才能更具有优势,同样的,目视效果也更加完美。(3)滤波空间的滤波(spatialfiltering)就是指在空间频率域图或像空间(x,y)对输入的图像应采用若干滤波函数来去获得改进后的输出图像,即我们要增强或抑制图像中的某些频率特征以及空间的信息,例如抑制低频信息而增强高频信息,即用来突出图像的纹理、线条、边缘等。其效果能够改善影像的质量,包含让高频噪声消失或者使其干扰降到最低。空间滤波技术的思路有以下几条:①加权处理从原图像获得的边缘信息,再与原图像进行相迭加;②处理原图像中的模糊成分,再与原图像进行迭加;③为了使图像产生特定的效果,例如平滑或尖锐,我们必须引进一特定的函数,然后再对图像进行加权处理[9]。我们采用的更多的是空间卷积技术来进行运算,也就是逐块的进行局部运算,在原图像上移动“活动窗口”。(4)主成分分析(K—L变换)K—L变换是一种线性变换的方法,离散Karhunen—Loeve变换的简称,也被叫作主成分变换,它的主要目的是压缩数据和增强信息,以不同的变量为基础,尽量保证有用的信息仍然能够存在。它是对某一多光谱图像X,利用K_,变换矩阵A进行线性组合,而产生一组新多光谱图像Y的操作,表达式为:Y=AX(2-5)其中X代表着变换前多光谱空间的像元向量,Y为变换后主分量空间的像元向量,A为变换矩阵,因此,公式可写为:(2-6)对图像中每一像元向量逐个乘以矩阵A,便得到新图像中的每一像元向量,A的作用是给多波段的像元亮度加权系数,实现线性变换。由于变换前各波段之间有很强的相关性,经过K—L变换组合,输出图像Y的各分量Yi之间将具有最小的相关性。(5)穗帽变换(K-T变换)K—T变换是Kauth—Thomas变换的简称,形象的称为穗帽变换。缨帽变换旋转坐标空间,但旋转后的坐标轴不是指到主成分的方向,而是指到另外的方向,这些方向与地物有密切的关系,特别是与植物生长过程和土壤有关。缨帽变换既可以将大量繁杂的信息简单化,又可以对农作物的特点进行深刻了解,其变换公式为:Y=BX(2-7)这里B为变换矩阵,Y为变换后的新坐标空间的像元向量,x为变换前的多光谱空间的像元向量。它旋转后的方向与地面景物有着密切的关系,而不是指向主成分方面,它是旋转了坐标空间的线性变换。(6)HIS彩色空间变换HIS是色调(H:hue)、明度(S:saturation)和饱和度(I:intensity)的色彩模式,又称HLS,(hue,tightness,saturation)。这里的色调,即人们视觉的颜色;明度,即光的明亮程度;饱和度,即颜色的纯度,饱和度越高,纯度越高,颜色越浓。这种彩色模式完全与人眼睛视觉效应。这种模式的定量化是通过近似的颜色立体来实现的。在某些情况下,图像可从常用的红绿蓝表达方式转换到HLS表达方式,RGB与HLS两种色光表示方法的参数可以通过特定模型相互转换。2.3特征提取和特征选择面对众多的复杂的特征,如何快速有效地找出我们所需要的是特征提取及选择的基本任务。对被识别对象进行处理,将基本的特征提取出来是特征的形成的形式,它可以是用仪表或传感器测量来的,也可以是计算出来的,这样得到的特征叫被叫做原始特征。特征选择就是直接从一组相应的特征中挑选出一类最有效的特征来降低空间维数的过程。原始特征的样本可能处在一个高维的空间中,因此它的数量可能很大,或者,通过变换或映射的方法在低维空间中来表示样本,这个过程就是特征提取。特征提取的方法主要如下:(一)对子集进行选择,即针对分类地物的特征,对所有测出的波段进行处理,提取一些波段当做特征。波段的选取可用经验进行选择,也可根据下面的公式进行选择。(2-8)在上式中Si为第i个波段的标准方差,如果Si越小,那么该波段图像的信息量也就越少;砥表示第i以及第J个波段之间的相关联的系数,如果Rij越小,那么两个波段之间的相互独立性越高。则OIF值越小,波段的组合越差。(二)对于主成分的分析,用K-L变换的结果去选取M个能量较大的分量去取代原来的那些D个分量。并通过K-L的变换,把原有向量各分量之间的相关性消除了,进而才有可能把那些带有很少信息量的坐标轴去掉来降低特征空间维数。(三)比值处理,即把各波段的数值运算作为一个新特征,例如植被指数以及相应的比值等。线性相互组合,即得到新特征向量的每个分量为原来D个分量的线性的相互组合。(五)有用信息的提取。在进行模式识别时,光有波谱信息的参与是不行的,因为遥感图像中许多空间结构信息例如纹理信息等,而纹理信息可用来提高分类的精度。纹理的测度可能用马尔可夫随机场、小波变换的方法、半变差函数的方法。而特征的选择是对于特定的专题信息的提取而说的,如果选择的特征过少,那么分类器的设计以及实现就比较简单,但是它分类的精度不够高;如果选择的特征过多,分类器的设计以及实现就比较复杂,分类的效果也不是好。3.遥感图像分类遥感图像的分类,又称遥感模式识别,通常模式识别是指把具有某种空间或集合特征的东西,或者许多同类物体用某种固定的相关行式重复进行布置。在模式识别的应用中,不管任何一组有意义的测量都能够成为一种模式,例如因为不同地物有不同的有不同的波长辐射,那么把它们的的响应特性的组合起来就可以能够看成是不同光谱数据的测量模式。简单的说,一个模式可以看成一个多维空间中的一个相应的点。模式识别就是对需要进行分类或识别的对象展开一系列的测量然后利用某种分类将这些测量所构成的模式采用判决规则判别出某一类别的过程。又因为自然界的变化丰富多彩,空间以及时间每时每刻都在变化、再加上遥感仪器的噪声以及自身所具有的误差等的影响,这就导致了即使地物在类型上再相似,在模式矢量中,它们也不可能一模一样,它们在空间分布呈点群状而不是单独的一点。3.1遥感图像分类原理计算机遥感图像的分类模式识别技术的目的是对图像上的每个像元给出对应类别。图像的分类就是相应的模式分类(PatternClassification)在图像处理过程中的具体应用,它的主要功能就是将图像数据从二维灰度空间变换到目标模式空间之中。图像分类器(ImageClassifier)就是给定一个二值均匀测度函数P,如果在图像中相应的区域满足一定意义下的均匀特性,则该区域的P值是真,反之为假。图像的一个分类就是为了获得图像的一个划分,其中代表第i类属性的区域值,该划分应满足:(1),其中f(x,y)包含像素点的总集(2)是连通的(3)如果相邻,且,但。理想的分类器应具有以下的性质:(1)鲁棒性(Robustness),如果微小地改变了输入的数据,那么将不会有什么反应,即输出结果的有效性受到微小输入变化或随机噪声的影响,一般地,应使分类后不同的图像区域间性质的差异应尽量变大,而应该把区域内部性质保证平稳。(2)分类过程的可重复性是在相同数据的情况下,如果换由其他测试者来执行,那么得到的结论将会是相同的。图像的分类过程主要包含4个步骤,(1)图像数据预处理(Preprocessing),就是利用对观测数据作成像处理,并且针对图像的量化、采样、几何矫正、去噪声以及预滤波等处理。(2)训练集的选择,即训练样本是从待处理数据中抽取出具普遍性并且具有代表性的数据。(3)特征提取(FeatureExtraction)是从很多的样本数据中特征矢量提取出来,实现样本空间与特征空间的相互转换,并且特征的提取应该能反映出观测目标的特征。(4)图像分类运算(Classification)就是利用特征矢量集利用特定的分类器在特征空间进行划分的基础之上去完成了分类工作。3.2监督分类监督分类是在我们对遥感图像上样本区内地物的类别已知的基础上,把这些样本类别的特征当做来识别非样本数据的类别的依据。所谓监督分类就是根据我们知道的判别类别和样本类别的经验知识,确定出判别函数以及判别准则,其中利用一定数量的已知类别的样本观测值把待定参数求解出来的过程称之为训练或学习,然后把未知类别的样本的所有观测值代入到这个函数中求出的判别函数,再根据相应的判别准则对该样本的所属类别做出判定。3.2.1监督分类的步骤监督分类的一般步骤如下:(1)首先把感兴趣的类别数确定出来。确定对哪些相应的地物进行分类,这样就可以建立起地物的先验知识库。(2)特征选择和特征变换。特征变换就是原图像通过一定的数字变换生成一组新的特征图像,这一组新的特征影像信息集中在少数几个特征图像上,这样数据量有所减少。遥感图像自动分类中主要的特征变换有主分类变换、哈达玛变换、生物量指标变换、比值变换以及穗帽变换等。最常用的特征变换是主分量变换。(3)选择一定的训练样区。因为监督分类都是从训练样区获得关于类别的数字特性的,因此选择的训练样区的一定要一定的代表性。训练样区的选择很重要,因为它将会影响到分类结果的准确性。同时训练样区的选择要有代表性、准确性以及具有一定的统计性。代表性一方面要考虑到地物本身的复杂性,另一方面指所选择区为某一类地物的代表,所以必须能够在一定程度上反映相应的一类类地物光谱特性的波动情况变化;准确性就是要确保实际地物与所选择的样区一致性;统计性是指在训练样区内选择出足够的像元,保证用此计算出的类别的参数符合统计学的相应规律。在应用中,每一类别的样本数量包含数量级左右。(4)把判别规则以及判别函数确定出来。因为训练样区被选定的话,就可以利用所建立起的训练样区中的参照样本把其对应的地物类别的光谱特性进行统计出来。图像分类运算就是根据判别函数和判别准则对非训练样本区进行分类,对特征向量集进行划分、完成分类识别工作。(5)根据判别规则和判别函数对非训练样区的图像区域进行分类。完成以上步骤,然而我们可以提取一幅分类之后的编码影像,每一编码对应的类别属性也应该被知道。这样不仅达到了类别之间区分的目的,而且类别也被识别出来。3.2.2最大似然分类法最大似然分类(maximumlikelihoodclassification)就是在两类或两类以上的判决中,用概率统计的方法并根据其最大似然比贝叶斯的判决准则法把非线性判别函数集建立起来,并且假定各类分布函数的均为正态分布,并选择一定的训练区,然后计算各待分类样区的归属概率的大小,从而进行分类的一种图像分类方法。

最大似然分类法有严密的理论础,对于呈正态分布的类别判别函数易于建立,综合应用了每个类别在各波段中的均值,它的方差以及与各波段之间的协方差,具有较好的统计效果,所以它一直被人们认为是较先进的分类方法之一[10]。

最大似然法在传统的遥感图像分类中应用的比较广泛。该方法是通过对感兴区域的计算以及做出统计,得到各类别的方差以及均值等参数,从而把一个分类函数确定出来,再将待分类图像中的各个值像元代入到各个类别的分类函数中去,并把函数返回值最大的类别当做成所有被扫描像元值的归属性类别,进而达到所需分类的效果[9]。它主要的过程如下:(1)确定所使用的波段数、特征分类数以及分类的地区,检查是否对所用的各波段或者其特征分量进行了相应的位置配准;(2)根据已掌握的典型地区的地面情况在图像上选择训练样区;(3)计算参数,根据选出的各类训练样区的图像数据计算和确定先验概率;(4)分类,将训练样区以外的图像像元逐个逐类代入公式,对于每个像元分几类就计算几次,最后比较相应大小,选择最大值得出类别;(5)产生分类后的图,并且给每一类别规定一个适量的值,如果分为了10类,那么就规定每一类分别为1,2,……10,用类别值分类之后的像元值所取代,最后我们得到的分类图像就是所需要的专题图像。由于最大灰阶值在数值上等于类别数值,所以在监视器显示时需要给各类别添上不同的颜色;(6)如果在分类中产生的错误较多,就需要重新选择训练区再重复做以上的各步,直到其结果令我们满意为止。3.2.3平行多面体分类方法平行多面体分类的方法(Parallelpipedciassifier)就是根据把设定在各轴上相应的值域分割出多维特征空间的方法[10]。此方法需要通过选择一定的训练区,并且对分类类别的特征与状况要详细了解,并用较高的精度对每个分类类别的光谱特征下限值和上限值进行设定,以便形成特征的子空间。平行多面体分类的方法必须要求训练样区样本能够覆盖所有的类型,并利用它的待分类像素的光谱值与各个类别特征子空间的每一维上的相应的值域进行内外判断,并检查它落入哪个类别特征子空间中,一直到完成各像素的分类。用这种方法进行分类就需要由训练组数据学习而产生一定基本的统计量信息,包括每个类别的标准向量以及均值向量。若有n个波段,m个类别,用代表第i类第j波段的均值,为对应的标准差,为x在j波段的像元值。对于某一个类别i(i=1,2,…,m)当像元x满足:(3-1)如果像元在所有波段的灰度都符合上述条件,就把像元x归入第i列,即Class(x)=i;反之不能归入已知类别,即Class(x)=0。式中T为人为规定的一个阀值,和概率分布出发差不多,应该采用几个标准差作为可信的分类边界,T越大则一个类的范围也就越大。这种方法简单,计算速度相对比较快。但是主要问题是实际地物类别数据点分布的点群形态用按照各个波段的均值为标准差划分的平行多面体有很大的不一致,也就造成俩类的重叠,混淆不清的情况出现。3.2.4最小距离分类方法最小距离分类法是以特征空间的距离作为像素分类的依据。首先从训练样本数据当中来得出每一类别的协方差矩阵和均值向量,然后把各类的均值向量当作该类在多维空间中的中心位置。计算输入图像中的每个像元到各类的距离,到哪一类中心的距离最下,则该像元就属于哪一类别。因此,在这类分类方法中距离就是一个判别函数。距离判别函数分类并不像贝叶斯判决函数那样来对于于集群分布的统计特性偏重,而是偏重于分类的几何位置,其通用判决形式如下:若对于所有可能的j=1,2,…,m,ji有di(X)>dj(X),则X属于类。在实践中三种距离判别函数:(1)马氏(Mahalanobis)距离:(3-2)(2)欧氏(Euchidena)距离:(3-3)(3)计程(Taxi)距离:(3-4)为了提高遥感图像的分类精度,就需要综合利用多波段卫星图像,因此图像融合是很好的方案之一。又因为所考察的地物在遥感图像上的图斑比较零散,而且灰度值的范围很宽,因此在两个目标之间,目标和其背景之间往往就属于非线性分类或线性不可分的问题,这也是对分类精度影响的一个很重要原因。因此出现了一种自适应最小距离的算法并且在它基础上的用核空间理论进行了改进自适应最小距离算法。它的原理是把样本集合进行分解,获得样本分布估计;然后,把在实际分类中待分类的点到每一类的相应距离根据分解的结果求出来,把此作为分类依据。通过用核空间理论改进的自适应最小距离算法来引入核空间理论,将在输入空间中不能进行线性分类问题映射到一个可以进行线性分类的高维空间,并利用核函数性质避免了其在高维空间中运算的复杂性,因此很好的解决了非线性分类的问题。最小距离分类原理较简单,虽然分类的精度不高,但计算的速度很快,它可以使用在快速浏览分类概况中。3.3非监督分类非监督分类(UnsupervisedClassification)是一种无先验(已知)类别标准的图像分类是利用不同影像中地物在特征空间中类别特征的差别作为依据的分类,它是以集群为理论作为基础,用计算机对图像进行集聚统计分析的分类方法。可以根据待分类样本特征参数的统计特性,建立起一定的决策规则并用来进行分类。它不需要事先知道类别的特征。它把各样本的空间分布按其一定的相似性进行合并或分割成一群集,每一群集代表着各自的的地物类别,它需经实地进行调查或则与已知类型的地物相互比较才能够确定出,它是模式识别的一种分类方法。3.3.1K-均值聚类法K-means算法的工作原理:首先从数据集中随机选取K个点当作初始聚类中心,然后把各个样本到聚类中的距离计算出来,然后把样本归到离那个聚类中心最近的类别中[11]。把新形成的每一个聚类的数据对象的平均值计算出来就可得到新的聚类中心,如果相邻两次的聚类中心没有发生变化,则说明样本调整结束,而且聚类准则函数已经收敛。在每次迭代中都要考察每个样本的分类是否正确是本算法的一个特点。若不正确,就要进行调整,当全部样本调整完成后,再修改聚类中心,进入下一次迭代工作。如果在某一次迭代算法当中,所有的样本被正确的分类后,则不会被调整,聚类中心也不会有变化,这标志着聚类准则函数已经收敛,则算法结束。开始开始选择m个中心所有像元分到m个集群中心计算新的集群中心聚类中心不变结束图3-1K均值算法框图3.3.2ISODATA算法聚类分析ISODATA(IterativeSelf-OranizingDataAnalysisTechniquesAlgorithm)与K-均值算法的区别在于:第一,它不会因为一个样本的类别改变就重新计算一次各类样本的均值,它重新计算一次各类样本的均值是在每次把所有样本都调整完毕之后才进行的;第二,ISODATA算法实现聚类分析有两种:一种是是自动地进行类别的“合并”以及“分裂”,得到的聚类结果变得合理,另一种调整样本的所属的类别[12]。3.3.3平行管道法聚类分析地物的光谱特性曲线是这种方法的基础,假定同类地物的光谱特性曲线相似是判别的标准。设定一个相似阀值,这样,同类地物在特征空间上表现为以特征曲线为中心,以相似阀值为半径的管子,此所谓的“平行管道”。这种聚类方法实质上是一种基于最邻近规则的试探法。具体算法步骤如下:第一步,我们从多光谱遥感图像中任意选择一个样本矢量(分量为各波段亮度值)作为第一类的特征矢量,同时将该样本矢量对应的像元标定为第一类。第二步,设置光谱响应相似性度量阀值T。第三步,依次从多光谱遥感图像中读取一定的样本矢量,设为X,X=(假设取得了四个波段的遥感图像)。并与已经形成的各个类别的特征矢量比较,分别计算:,若与与与,则称该样本矢量所对应的像元标记为第i类,即重复第三步,否则应该转入第四步操作。第四步,将X设为第i+1类的特征矢量,同时将X对应的像元标记成为第i+1类。类别数增加1,转至第三步操作。第五步,所有像元聚类完毕,输出标记类别图像。这种方法的优点是计算简单。3.4计算机自动分类的新方法3.4.1神经网络分类法该方法是利用计算机对人类进行模拟学习的过程,使得分类趋于自动化和人脑化,遥感图像分类也就更趋于人类的思维,神经网络的分类方法,在一定程度上消除了传统遥感分类所共有的模糊性和不确定性[13]。神经网络方法的两大用途有:一是学习训练及设计分类器,二是特征抽取与选择。近年来,不同学者分别提出应用小波神经网络和径向基函数神经网络、Hopfield网络(用于优化)、BP网络、Kohonen网络(用于非监督分类)等分类方法。小波分析的基本思想:用一族函数去表示或接近信号或函数,则这些函数被称为小波函数系,它的构成是通过改变小波函数的不同尺寸形成的。小波变换具有很多优点例如线性叠加性、局域正则性、平移共变性、能量守恒性、尺度共变性等优点。这种小波函数网络条理清晰,收敛速度也较快,只要把网络训练好,它的分类适应性将会很强。神经网络之所以在多波段遥感图像分类日益被选择应用,是因为有以下特点:①神经网络具有很强的学习能力,可以取代最大似然法分类;②神经网络无需就概率模型作出假定;③神经网络可以在特征空间中形成高度的非线性决策边界,因而在特征中的统计数字资料明显偏离假设的高斯统计数字资料情况时仍然优于参数贝叶斯分类方法;④神经网络算法适用于空间模式识别的各种问题的处理。3.4.2模糊分类法3.4.2.1模糊分类的原理遥感图像中的像元在一定程度上都是混合的像元,因为混合像元分解的重要性已为遥感界所认同。目前所形成的的模糊理论及其方法,在不准确信息、不明确界限的分析方面提供了对应的概念和方法。在遥感图像分类中,模糊方法分类充分体现了它的优势例如分类精度以及分析混合像元的效率。3.4.2.1模糊分类的步骤运用模糊分类法来进行遥感图像分类的一般步骤如下:首先训练样本的模糊分割矩阵写出来:假设训练样本总数为n个,变量数为m个,G是预先确定出来的类别数,则训练样本中的模糊分割矩阵为以下其中表示像元Xj对第i类的隶属度。2.求出模糊均值向量和模糊协方差矩阵3.4.3专家系统分类法遥感图像解译专家系统是人工智能技术与模式识别相结合的产物。专家系统分类法是通过人工智能技术的应用和解译人员的经验知识实现对遥感图像目视判读的的模拟,来达到解译图像的目的。专家系统可以看成是人工智能的一个重要分支,采用人工智能语言进行分类例如PROLOG、LISP、以及C语言等,它是将在某一领域专家分析的方法及经验,用于对对象的多种属性进行详细的分析、并进行判断,;来确定分类事物的归属性。而推理机(InferenceEngine)和知识库(KnowledgeBase)是它的主要内容,这是因为多种与影像解译有关的经验以及知识在知识库中存储,而专家的经验以及知识在知识库中按照某种表达形式,例如IF<条件>THEN<假设><CF>(其中CF为可信度)表示,这样使很多知识在一起就组成一个知识库。将待处理对象的所有属性按照某种形式放在一起就组成一个事实,进而形成一个事实库。又将知识库中的每一点知识与事实库中的每一个事实进行相应的匹配,如果一个事物的属性信息满足或则大部分都满足知识库中的条件时,那么就可以按知识中的THEN根据置信度来确定事物的归属。专家系统方法通过对一定的领域内专家分析方法进行总结,从而可以包含更多的信息,因而具有更强大的功能。专家系统分类法是模拟人类组合各种带有因果关系的知识进行推理并得出相应结论来作为分类的思想。专家系统一般包括知识库和推理机两个无关的部分。求解问题所需要的专业领域的知识的整体称作知识库,从领域专家那获得的知识在专家系统中占据举足轻重的位置,也就是可以通过用户的加入来提高知识库中知识的质量水平,那么专家系统的性能也会随之提升。我们在对遥感影像做出分类时,首先把遥感数据和空间数据都放在推理集中,推理机就根据在知识库中存储的专家知识对新输入的数据进行相应的推理并做出判断,把它们归入相应的分类类别之中。和以统计像元分析为主的传统分类技术相比,转机系统分类技术取得了巨大的进步,它不仅分析研究了单像元的多光谱特征,还依靠专家系统综合相关的空间关系和其它的上下文信息,地标高度、坡向、坡度及覆盖形状等,采取综合利用空间运算的能力解释影像并确定专题类型[14]。3.4.4支持向量机SVM分类法支持向量机是在统计学习理论基础上建立的,对于有限的样本信息,我们既要考虑到模型的复杂性,也要考虑到我们自身的能力问题,发展起来的一种新的模式识别方法,它具有传统统计分类法和神经网络分类所不具有的优势,具有较高的泛化能力[15]。大量的实验表明,SVM虽然是在分类中属于较新的方法,但分类精度比较高。同时统计学习理论的发展需要一个很长的过程,许多重要的问题还亟待解决,如VC维的预算和估计现在仍然让我们苦恼。3.4.5决策树分类法决策树分类法就是利用决策树或决策规则进行分类的。决策树分类方法原理是:决策树由一个根结点,、一系列的内部结点(分支)及终结点(叶)构成,每一结点只有一个父结点,但是可以有二个或多个子结点。按照一系列的规律将该节点处的数据集处在任何一个内部节点可以划分为两个子集,采用这种方法把所有的数据都分为预期设定的各个子集。同一般分类方法相比,决策树分类法的优势主要如下:决策树分类的条理相对清晰,方便理解,计算的效率高,准确度也很高等特点。决策树分类法因为具有非参数化的特点,所以灵活性更高。同时,决策树分类方法的统计分布方法和尺度会随着多源数据的性质不同而发生相应的改变,或者说是在复杂的情况下,遥感影像的特征的空间分布,得到的结果将会比较理性。对于非线性关系和较多的高维数据可以有效的进行处理。有效地解决属性缺失问题和抑制训练样本噪声。决策树分类的算法具有灵活,直观,清晰,健壮,运算效率高等特点,在遥感分类问题上表现出巨大的优势。近年来人工智能技术发展迅速,目前遥感图像分类技术向更高层次发展,地理信息和地学知识的辅助作用对遥感图像分类和信息提取精度的提高起了很大的作用,专家系统可以很好的解决这一问题。因此,将以知识为基础的专家系统与决策树算法相结合将取得很好的效果。4精度评定一幅专题图进行分类后,下一步我们就要对其精度进行检核,也就是遥感图像的定量分析的一个重要的环节。一般来说,准确地检核整幅分来图的每个像元的正确与否是很难进行的,因此对分类的误差进行估计可以采用抽取个别样本的方法。采集样本的方式有以下:①特定的实验场;②从经过监督分类的训练样区选取;③随机取样。第一种在纯化监督训练样区方面占据的明显的优势,但不是作为检核分类图最后精度的最好的方式。第二种比较好,它是一些用来分析的特别选定的试验场。它们主要在各个区域均匀地、有目的地分布,但是也有不少无规则分布的场地,不仅在数量上比较多,而且分类也比较多,测定后的数据通常在计算机中储存,但是也需要实时测定一些数据。第三种完全随机取样,但是有时采样区的性质和制图类别的设计要考虑特殊应用的研究区域,取随机像元群而不是取单个像元使在地图或航片上确定样区位置更加容易。根据地面的测量来获得样区内的有用信息,评定地图或者航片的分类精度大多是利用混淆矩阵来完成的。将统计分类图类别和实际类别区分开来,通过上面介绍的几种方法可以获得实际类别。比较结果可以用表格的方式展出,如表4-1所示。表4-1混淆矩阵类别12…n合计12n合计其中:为第i类错分到j类的个数;为分类所得的第i类的总和;为实际观测的第j类的总和;P为样本数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论