版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1引言随着卫星遥感图像和航空遥感图片分辨率的不断提高,人们可以从遥感图像中获得更多的有用的数据和信息。伴随着“数字地球”概念的提出,越来越多的民用场合需要用到遥感图像,包括资源调查,自然灾害观测、大气气象预报等。由于不同场合遥感图像的应用对遥感图像处理提出了不同的要求,所以图像处理中重要的环节一一图像分类也就显得尤为重要,经过多年的努力,形成了许多经典的分类方法和算法。本文主要研究和讨论了遥感图像分类技术的分类方法和算法,并且作了简要的评价。2图像分类技术遥感图像是按一定比例尺,客观真实地记录和反映地表物体的电磁辐射的强弱信息,是遥感探测所获得的遥感信息资料的一种表现形式。所以,遥感技术应用的
2、核心问题是根据地物辐射电磁辐射强弱在遥感图像上表现的特征,判读识别地面物体的类属及其分布特征。遥感图像特征取决于遥感探测通道、地物光谱特征、大气传播特征及传感器的响应特征等因素。只要了解这些因素对遥感图像特征的影响,则可按图像特征判读地面物体的属性及其分布范围,实现遥感图像的分类识别。遥感图像分类主要依据是地物的光谱特征,既地物电磁波辐射的多波段测量值,这些测量值可以用作遥感图像分类的原始特征变量。分类是对图像上每个像素按照亮度并接近程度给出对应类别,以达到大致区分遥感图像中多种地物的目的。图像分类是模式分类(PatternClassification)在图像处理中的应用,它完成将图像数据从二
3、维灰度空间转换到目标模式空间的工作。分类的结果是将图像根据不同属性划分为多个不同类别的子区域。图像分类器(ImageClassifier)的定义如下:给定一个二值均匀测度函数P,如果图像中某个区域满足一定意义下的均匀特性,则该区域P值为真,否则为假。对图像的一个分类就是获得图像的一个划分其中代表第i类属性的区域,该区域应满足:,其中是像素点的总集;是连通;如果,相邻,且P()=True,P()=True,但P(U)=False。理想的分类器应具有两种性质:分类过程的可重复性,由其他测试者采用相同数据能够获得相同的结论;鲁棒性(Robustness),对输入数据的微小改变不敏感,即输入的微小变化
4、或随机噪声不会影响输出结果的有效性;一般地,分类后不同的图像区域之间性质差异应尽可能地大,而区域内部性质应保证平稳特性。图像分类过程主要有4个步骤,如下图:图一:图像分类流程图像数据的预处理:对观测数据作成像处理,以及图像的几何矫正、量化、采样、预滤波、去噪声等处理;训练集选择:从待处理数据中抽取出具普遍性、代表性的数据作为训练样本;特征提取:从样本数据中提取特征矢量,完成样本空间到特征空间的转换,特征应反映观测目标的特性;图像分类运算:基于特征矢量集采用特定的分类器对特征空间进行划分,完成分类工作;模式分类一般分为统计模式分类和结构模式分类:统计分类着重于定量的统计方法;结构模式分类则基于描
5、述模式的结构信息、结构特征,利用形式语言中的规则进行分类。从分类前能否获得训练样本类别这一先验信息角度划分,还可以将模式分类分成两大类:有监督分类(SupervisedClassification)和无监督学习分类(UnsupervisedLearning)。21监督分类监督分类是一种常用的精度较高的统计判决分类,在已知类别的训练场地上提取各类训练样本,通过选择特征变量、确定判别函数或判别规则,从而把图像中的各个像元点划归到各个给定类的分类方法,这种分类方法就是监督分类。主要步骤包括:1)选择特征波段;2)选择训练区;3)选择或构造训练分类器;4)对分类精度进行评价;有间督的分类方法可以分为分
6、布无关方法和与分布有关的统计分类。分布无关方法无需任何有关于观测目标先验概率分布的知识,是一种启发式的学习分类过程,又称无参数的分类。统计分类方法则基于一定的先验概率分布模型,这种分类方法假定数据的概率分布参数待确定,一般概率分布模型多采用多变量Gaussian分布,因此最终的参数估计就简化到仅需要获得均值矢量,协方差矩阵。常用的与分布无关的分类方法有:及近邻法:对于一个样本x,如果它的K个最近邻样本中属于类W的最多,则x就应被归为W。K近邻法要求有较大的训练集以保证算法的收敛性决策树法:有点是分类数较大时,决策树方法性能比较优越,且不论特征空间是否线性可分,决策树算法均能保证收敛。分布有关的
7、统计分类方法主要有贝叶斯分类器(BayesianClassifier)、最大似然度分类。图二:有监督的分类有监督分类主要有最小距离分类、马氏距离分类、Parallelpipe、最大似然分类等方法。下面来加以讨论。211最小距离最小距离(又称光谱距离)判别规则。计算象素矢量与每一个模板的平均矢量的光谱距离.用光谱距离分类的等式是建立在欧氏距离的基础上的,公式如下:其中:n:波段数(维数);k:某一特征波段;i:某一聚类中心;:第i类样本均值;:第i类中心第k波段的象素值;d(x,)濛素点x到第i类中心Mi的距离;分类步骤:最小距离判别方法的主要步骤如下:确定地区和波段,配准备分量;选择训练区;根
8、据各训练区图像数据,计算;将训练区外图像像元逐类代入上式按判别规则比较大小,得到类别;产生分类图像;检验结果,如果错误较多需要重新训练区;输出专题图像。这种方法的优点是,由于每一个象素总归有一个样本平均值与之最为靠近,因此不存在不分类的象素;计算量小,只计算均值参量,而且矩阵计算也比较简单,因此这种方法节省计算机机时;另外,这种方法只用均值一个参数,避免用协方差矩阵,就避免了在样本数较少的情况下,协方差矩阵计算不准确而引起的误差。缺点是,有些不应分类(按用户指明的某一限度)的象素被分类,但这一问题可以通过设定阈值除去那些离分类最远的象素得以缓解;没有考虑到类型的变化性,如城市类型的象素,其差异
9、很大,可能与模板的平均值之间的距离就要大些,如果用这种判别规则,有些本属于城市类型的象素,则可能误分;相反对于内部变化较小的类型如水体,就可能分类象素过多,即把本不属于这类的象素归入这类,因为属于该类的象素与其平均值的距离肯定比不属子该类的象素与其平均值的距离近。2.1.2Mahalanobis距离(马氏距)除用于等式中的协方差矩阵不一样,Mahalanobis距离与最小距离相似。这种距离定义考虑了变量间(样本)相关性的影响,是一种更广义的距离定义。等式中已计算了方差与协方差,因此内部变化较大的聚类组将产生内部变化同样较大的类,反之亦然。例如:正确分类的象素可能与其平均值的距离大于属于水体类型
10、的象素值与其平均值的距离,因为对水体类型来说,一般内部变化不大。马氏距公式如下:其中:D:Mahalanobis距离;C:某一特定类;X:象素的测量矢量;:类型C的模板的平均矢量;:类型C的模板中象素的协方差矩阵;T:转置函数;象素将被归入到D值最小的类型C中。马氏距离分类方法的主要步骤:确定需要分类的地区和使用的波段和特征分类数,检查所用各波段或特征分量是否相互已经位置配准;根据已掌握的典型地区的地面情况,在图像上选择训练区;计算图像的协方差矩阵;根据选出的各类训练区的图像数据,计算各类均值,确定分类半径;分类,将训练区以外的图像像元逐个逐类地代入公式,对于每个像元,分几类就计算几次,最后比
11、较所得马氏距离的大小,选择最大值得出类别;产生分类图,给每一类别规定一个值,如分10类,就定每一类分别为1,21(分,类后的像元值便用类别值代替,最后得到的分类图像就是专题图像。由于最大灰阶值等于类别数,在监视器上显示时需要给各类加上不同的彩色;检验结果,如果分类中错误较多,需要重新选择训练区再作以上各步,直到结果满意为止。这种方法的优点是,考虑到类型的内部变化;在必须考虑统计指标的场合,比最小距离法更有用。缺点是,在协方差矩阵中使用较大的值易于导致对模板(Signature)过渡分类,如果在聚类组成训练样本中象素的分布离散程度较高,则协方差矩阵中就会出现大值;计算起来比最小距离法慢;Maha
12、lanobis距离是参数形式的,意味着每一输入波段的数据必须是正态分布的。213平行体分类通过设定在各轴上的一系列分割点,将多维特征划分成分别对应不同分类类别的互不重叠的特征子空间的分类方法。这种方法要求通过选取训练区,详细了解分类类别(总体)的特征,并以较高的精度设定每个分类类别的光谱特征上限值和下限值,以便构成特征子空间。对于一个未知类别的像素来说,它的分类取决于它落入哪个类别特征子空间中。如落入某个特征子空间中,则属于该类,如落入所有特征子空间中,则属于未知类型,因此平行体分类方法要求训练区样本的选择必须覆盖所有的类型,在分类过程中,需要利用待分类像素光谱特征值与各个类别特征子空间在每一
13、维上的值域进行内外判断,检查其落入哪个类别特征值方体中,直到完成各像素的分类这种方法的优点是,快捷简单,因为对每一个模板的每一波段与数据文件值进行对比的上下限都是常量;对于一个首次进行的跨度较大的分类,通常比较有用,这一判别规则可以很快缩小分类数,从而避免了更多的耗时计算,节省了处理时间(如最小距离、Mahalanobis距离或最大似然)。缺点是由于平行六面体有“角”,因此象素在光谱意义上与模板的平均值相差很远时也被分类。214最大似然/贝叶斯分类与分布有关的统计分类方法主要有最大似然/贝叶斯分类。最大似然分类是图像处理中最常用的一种监督分类方法,它利用了遥感数据的统计特征,假定各类的分布函数
14、为正态分布,在多变量空间中形成椭圆或椭球分布,也就是和中个方向上散布情况不同,按正态分布规律用最大似然判别规则进行判决,得到较高准确率的分类结果。否则,用平行六面体或最小距离分类效果会更好。最大似然/贝叶斯分类公式如下:其中:D:加权距离(可能性);c:某一特征类型;X:象素的测量矢量;:类型C的样本平均矢量;:任一象素属于类型C的百分概率(缺省为110,或根据先验知识输入);:类型C的样本中的象素的协方差矩阵;II:的行列式;的逆矩阵;ln:自然对数函数;T:转置函数;分类步骤:确定需要分类的地区和使用的波段和特征分类数,检查所用各波段或特征分量是否相互已经位置配准;根据已掌握的典型地区的地
15、面情况,在图像上选择训练区;计算参数,根据选出的各类训练区的图像数据,计算和,确定先验概率;分类,将训练区以外的图像像元逐个逐类代入公式,对于每个像元,分几类就计算几次,最后比较大小,选择最大值得出类别;产生分类图,给每一类别规定一个值,如果分10类,就定每一类分别为1,2.10,分类后的像元值便用类别值代替,最后得到的分类图像就是专题图像.由于最大灰阶值等于类别数,在监视器上显示时需要给各类加上不同的彩色;检验结果,如果分类中错误较多,需要重新选择训练区再作以上各步,直到结果满意为止。这种方法的优点是,对符合正态分布的样本P聚类组而言,是监督分类中较准确的分类器,因为考虑的因素较多;与Mah
16、alanobis距离一样.通过协方差矩阵考虑了类型内部的变化。缺点是,扩展后的等式计算量较大,当输入波段增加时,计算时间相应增加;最大似然是参数形式的,意味着每一输入波段必须符合正态分布;在协方差矩阵中有较大值时,易于对模板分类过头,如果在聚类组或训练样本中的象素分布较分散,则模板的协方差矩阵中会出现大值。22非监督分类非监督分类是在没有先验类别知识的情况下,根据图像本身的统计特征及自然点群的分布情况来划分地物类别的分类处理。监督分类可以有效地开发数据内容,但需要充足的信息可以决定地表信息的先验概率,不但监督分类训练样区的选择需要各种丰富的知识与经验,且需要当地土地覆盖的一些具体资料信息。主要
17、步骤包括:1)定义一系列参数如最大类别数、迭代终止条件;2)执行分类;3)为各个类分配颜色和具有实际意义的名称;4)对分类精度进行评价。非监督分类是在没有先验类别作为样本的条件下,主要根据像元间相似性的大小进行归类合并的方法。它主要有:K平均分类(Kmeans)、ISODATA方法。221K平均分类K平均分类方法假定被用来表示样本空间的聚类中心的个数是预先知道的。这种假定本身在某种程度上限制了这一方法的利用。它使聚类域中所有样本到聚类中心的距离平方和最小,这是在误差平方和准则的基础上得来的。K平均算法由下述步骤组成:(1)任意选择k个初始聚类中心,一般选择给定样本集的前k个样本作为初始聚类中心
18、;第k次迭代,若,式中i=1,2.k,i科,则xe,为聚类中心是的样本集.于是分配各样本x到k个聚类域;(3)由(2)的结果,计算新的聚类中心这样使中的所有点到新的聚类中心的距离平方和最小。(4)若,算法收敛,程序结束。否则转入第二步。聚类中心数K、初始聚类中心的选择、样本输入的次序,以及样本的几何特性等均影响k平均算法的进行过程.对这种算法虽然无法证明其收敛性,但当模式类之间彼此远离时这个算法所得的结果是令人满意的。222ISODATA分类方法ISODATA是IterativeSelf-OrganizingDataAnalysisTechniquesA的缩写,A是为发音的方便而加入的,ISO
19、DATA意为迭代自组织数据分析技术ISODATA算法是利用合并和分开的一种著名的聚类方法。它从样本平均迭代来确定聚类的中心,在每一次迭代时,首先在不改变类别数目的前提下改变分类。然后将样本平均矢量之差小于某一指定阈值的每一类别对合并起来,或根据样本协方差矩阵来决定其分裂与否.主要环节是聚类、集群分裂和集群合并等处理。算法原理:1指定和输入有关的迭代限值参数:K要求的聚类中心数;个聚类中心域中至少具有样本个数的阈值;标准差的阈值;归并系数,聚类中心间距离的阈值;L能归并的聚类中心对的最大数;I允许迭代次数。另在执行算法前,应先指定C个初始聚类中心,表示为;C不一定等于所要求的聚类中心数K;可为给
20、定模式中的任意样本。2具体步骤(1)定算法的参数;配N个样本到C个聚类中心.若,i=1,2.C,i主j,则xU其中fj表示分到聚类中心的样本子集,为中的样本数;(3)对任意的j,则去除并使C=C-1,即将样本数比ON少的样本子集去除;,新聚类中心(5)计算聚类域中的样本与它们相应的聚类中心的平均距离(6)计算总的平均距离其中N为样本集中的样本总数;(7)判别a)若这是最后一次迭代,置,且转到第十一步;b)若C2K或这是偶次迭代,则转第十一步,否则继续;(8)标准差其中n是样本模式的维数,是中第K个样本的第i分量,是的第i分量。的每个分量表示中样本沿主要坐标轴的标准差;(9)找中的最大分量,j=
21、1,2,C,用表示;(10)如果对任意的,j=1,2,C,存在有a)和或b)则分裂成两个新的聚类中心和,删去,并使C=C+1。对应于的分量上加上一给定量,而的其它分量保持不变来构成。对应于的的分量上减去,而的其它分量保持不变来构成。规定是的一部分,=K,oK1。选择的基本要求是,使任意样本到这两个新的聚类中心和之间有一个足够可检测的距离差别,但又不能太大,以致使原来的聚类域的排列全部改变。如果发生分裂则转第二步,否则继续;(11)计算所有聚类中心的两两距离(12)比较距离与参数,取出L个,的聚类中心,其中(13)从着手,开始一对对归并,算出新的聚类中心删去和,并使C=C-1。注意:仅允许一对对
22、归并,并且一个聚类中心只能归并一次。经实验得出,更复杂的归并有时反而产生不良的后果。(14)如果是最后一次迭代则算法结束,否则a)如果用户根据判断要求更改算法中的参数,则转第一步;b)如果对下次迭代参数不需要修改,则转第二步;每次回到算法的第一步或第二步就计为一次迭代,I=I+1。ISODATA法的实质是以初始类别为“种子”施行自动迭代聚类的过程.迭代结束标志着分类所依据的基准类别已经确定它们的分布参数也在不断的“聚类训练”中逐渐确定,并最终用于构建所需要的判决函数。从这个意义上讲,基准类别参数的确定过程,也是对判决函数的不断调整和“训练”过程。这种方法的优点是、聚类过程不会在空间上偏向数据文
23、件的最顶或最底下的象素,因为它是一个多次重复过程:该算法对蕴含于数据中的光谱聚类组的识别非常有效,只要让其重复足够的次数,其任意给定的初始聚类组平均值对分类结果无关紧要;缺点是,比较费时,因为可能要重复许多次;没有解释象素的空间同质性。223贝叶斯学习、最大似然度分类无监督分类方法还有贝叶斯学习、最大似然度分类。无监督的贝叶斯方法和最大似然度方法与有监督的贝叶斯学习以及最大似然度方法基本相同,唯一的区别在于无已确知类别的样本可供参。3遥感图像分类技术遥感图像分类的研究目标主要有地面房屋、车辆、地面植被、海洋冰、大气云层等目标。数据来自于机载雷达、星载雷达,如SPOT,LANDSAT等SAR或光
24、学雷达。针对具体遥感特定图像的分类,我们往往需要获得较大量的图像数据,尤为关键的是还要得到作为最后校验数据标准的地面信息,否则无法衡量分类的精确度和提取较为准确的特征矢量。目前,遥感应用中使用较多的仍是传统的分类方法,即监督分类和非监督分类两类分类方法。随着计算机计算能力的迅速提高,专家系统和神经网络等一些原先工程实现困难的新方法也在遥感图像处理中开始发挥作用。因此,多学科的交叉是遥感图像分类发展的重要方向,以期对遥感图像分类方法的研究有新的突破。参考文献:黄宁等,遥感图像分类技术研究,华北工学院测试技术学报,2001.年第15卷,第2期,P87-91;刘亚岚遥等,遥感图像分区自动分类方法研究
25、,遥感学报,2002年9月,第6卷第5期,P357-362;谭衡霖等,雷达遥感图像分类新技术发展研究,国土资源遥感,2001年第3期,P1-7;曾如珠,遥感图像分类识别的探讨,泉州师范学院学报(自然科学),2000年7月,第18卷第7期,P36-39;潘建刚等,遥感图像分类方法的研究,首都师范大学学报(自然科学版),2004年9月,第25卷第3期,P88-91;BaatzM,SchabpeA.ObjectOrientedandMultiScaleImageAnalysisinSemanticNetworksA.In:Proc.ofthe2ndInternationalSymposiumonOp
26、erationalizationofRemoteSensing,August16th-20th1999.Enschede.ITC.TatemAJ,LewisHG,AtkinsonP,etal.SuperresolutionTargetIdentificationfromRemotelySensedImagesUsingaHopfieldNeuralNetworkJ.IEEETransactionsonGeosciencesandRemoteSensing,2001,39(4):781796.YuX,ReedIS,StockerAD.ComparativePerformanceAnalysiso
27、fAdaptiveMultispectralDetectorsJ.IEEETransonSignalProcessing,2003,41:235240.KruseFA,LefkoffAB,BoardmanJB,TheSpectralImageProcessingSystem(SIPS)-InteractiveVisualizationandAnalysisofImagingspectrometerDataJ.RemoteSensingofEnvironment,1993,44:145163.JensenJR.IntroductoryDigitalImageProcessing:ARemoteSensingPerspective.Publisher:PrenticeHallM.EnglewoodCliffs,NewJersey,1986.HarsanyiJC,ChangCI.HyperspectralImageClassificationandDimensionalityReduction:AnOrthogonalSubspace
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO 16971-1:2024 EN Ophthalmic instruments - Optical coherence tomographs - Part 1: Optical coherence tomographs for the posterior segment of the human eye
- 淮阴师范学院《土壤污染及其防治》2023-2024学年第一学期期末试卷
- 淮阴师范学院《中学音乐课教学案例分析》2023-2024学年第一学期期末试卷
- 淮阴师范学院《初等数学研究》2023-2024学年第一学期期末试卷
- DB2310-T 140-2024牡丹江地区森林可持续经营规程
- 宝石中英对照词汇-总和
- 春节前安全检查与培训考核试卷
- 油炸食品制造业中的员工健康与安全管理考核试卷
- 打印技术在建筑领域的应用考核试卷
- 广东省广州市白云区2024-2025学年四年级上学期期中英语试卷
- 部编版道德与法治 四年级上册 单元作业设计《为父母分担》
- 核酸的生物合成 完整版
- 第一章-教育及其本质
- 天然气巡检记录表
- 食品进货台账制度范本(3篇)
- 甲苯磺酸瑞马唑仑临床应用
- 中国古代文学史PPT完整PPT完整全套教学课件
- 车牌识别一体机安装调试教程
- Python语言学习通超星课后章节答案期末考试题库2023年
- 海报设计教学课件完整版讲课讲稿
- 年产30万吨碳酸钙粉建设项目可行性研究报告
评论
0/150
提交评论