遥感技术与应用-6-遥感专题信息提取_第1页
遥感技术与应用-6-遥感专题信息提取_第2页
遥感技术与应用-6-遥感专题信息提取_第3页
遥感技术与应用-6-遥感专题信息提取_第4页
遥感技术与应用-6-遥感专题信息提取_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

遥感技术与应用-6-遥感专题信息提取第六章遥感专题信息提取

第一节遥感图像解译概述一、遥感图像解译(ImageryInterpretation)的概念遥感图像是地物电磁波特性的实时记录。遥感图像能够提供给解译者的信息有:目标的光谱特征信息主要由地物的类别、性质的差异决定目标的空间位置特征目标随时间的动态信息不同的目标,在上述性质和特征上是不同的所以,遥感图像解译定义为:根据遥感图像所提供的影像特征及其对应目标的特点进行推理和判断将目标识别出来,并进行定性、定量分析的工作就称为遥感图像解译(判读)遥感图像解译(判读)的本质就是:利用遥感图像提供的各种数据,再结合解译者的学识和经验,确定空间什么位置(Where-Position)有什么目标(What-Qualitative)有多少(How-Quantitative)但是,遥感图像上的信息并非直接呈现出来,而是通过图像上复杂形式的色调、结构及它们的变化表现出来,因此要正确的认识它们必须具备相应的知识

二、图像解译的背景知识专业知识指需要熟悉所解译的学科及相关学科的知识。包括对地物成因联系、空间分布规律、时相变化以及地物与其他环境要素间的联系等知识。比如遥感地质探矿,首先需具备地层、构造、蚀变带等与找矿直接相关的地质知识和经验,还需要了解植物分布、土壤等相关知识。地理区域知识指区域特点、人文自然景观等。每个区域有其独特的区域特征,即地域性,它影响到图像的图型结构等,它能直接帮助识别地物和现象遥感系统知识解译者必须了解每一图像是怎样生成的;不同遥感器是如何描述景观特征的,它使用的何种电磁波段,空间分辨率是多少等等,怎样从图像中获得有用的信息等遥感图像解译与日常目视观察有3点不同:A遥感图像通常为“顶视-鸟瞰”,而不同于日常生活中的透视B遥感图像常用可见光以外的电磁波段,而大多数我们熟悉的特征是在可见光谱段,可以表现得十分不同C遥感图像常用一种不熟悉或变化的比例和分辨率描述地球表面因此,对于初学者需要多对照地形图、实地或熟悉地物观测,以增强立体感和和景深印象,纠正视觉误差,积累图像判读经验遥感图像的解译过程是地面目标成像过程的逆过程,即从地面实况的模拟影像中提取遥感信息、反演地面原型的过程三、遥感图像解译的两种方式目视解译(VisualInterpretation)借助人眼的观察和人的智能,结合一些量测工具(测微尺、放大镜、立体镜等)来识别图像中的目标。特点:解译者的学识和经验在判读中起主要作用,精度高,但难以对海量空间信息的定量化分析2计算机图像理解(ComputerImageryUnderstanding)以计算机软硬件为支撑,利用模式识别技术(PatternRecognition)和人工智能(ArtificialIntelligence)技术,建立图像解译专家系统(ExpertsSystem)从而让计算机模拟人工解译过程,“读取遥感图像上的特征”,进而确定图像上的目标。特点:速度快,处理方式灵活多样,整个处理过程通常是以人机交互方式进行,对计算机技术和算法要求较高,识别的精度通常不及目视解译第二节遥感图像目视解译标志一、解译标志的概念解译标志(InterpretationMark):遥感图像上能帮助人们识别不同目标的那些影像特征;直接解译标志:能在遥感影像上直接看到可供判读的影像特征称为直接判读标志,如形状、大小、阴影、纹理、色调等;间接解译标志:指运用某些直接解译标志,根据地物的相关属性等地学知识,间接推断出的影像标志,如根据道路与河流相交处的特殊影像特征,可以判断渡口;根据植被、地貌与土壤的关系,来识别土壤类型和分布(如温带针叶林区多为灰化土)二、常用的解译标志色调(Tone)指地物反射、辐射电磁波的性质和能量强弱在影像上的表现说明两点:a解译者必须了解该解译图像中影像色调的支配因素如可见光和近红外图像均反映地物“反射”波谱特征的差异,涉及地物的物质组成、水分含量等;而热红外图像则反映地物“发射”波谱特征的差异,是地物温度差异的记录;雷达图像反映地物后向散射能量的差异,涉及到地物介电常数、表面粗糙程度等物理性质

b影像色调受到多种因素的影响除了受目标本身的波谱特征因时因地、因环境变化而变化外,还受到成像高度、成像时间(光照角度、强度)、遥感器观察角度、成像后处理等多种因素的影响,因此使用色调标志时要特别小心影响影像色调变化的因素:(1)地物本身的颜色(2)地物表面的结构表面结构不一致,其光滑程度有差异,反光能力就不同,反映在影像上的色调就不相同

a光滑表面(镜面反射—SpecularReflection)若传感器照射方向与太阳入射方向一致,此时影像呈暗色调;若传感器照射方向逆着镜面反射的方向,则影像呈亮色调

b无光泽表面(粗糙表面,漫反射—DiffuseReflection)各方向上光线被均匀散射开来,因此无论哪个方向得到的影像色调均一

c起伏不平的表面阳坡(Adret-SunnySlope)影像色调亮阴坡(Ubac-ShadySlope)影像色调暗(3)地物本身的反光能力(4)湿度的大小通常湿度越大则影像色调越暗利用此特征可以监测土壤湿度(5)摄影季节的不同春季植物色调浅,夏季色调深阴影(Shadow)指因倾斜照射,地物自身遮挡光源而造成影像上的暗色调阴影分为本影和投落阴影,前者是地物背光面在影像上呈现的暗色调构像,有助于获得目标的立体感;后者是地物背光方向地物投射到地面的暗斑在影像上的构像,它反映地物的侧面形态,可以根据侧影的长度及照射角度反算地物的高度但是,因为阴影的遮盖会掩盖一些信息,给解译工作带来不便大小(Size)指地物长、宽、高、面积、体积等在影像上的记录地物影像的大小不仅能求得地物的数量特征,而且对判读地物的性质也有帮助。例如,单轨铁路和双轨铁路从形状上往往不易区分,但通过量算其宽度则很容易区分地物影像的大小取决于影像的比例尺大小。因此,解译前要获得影像的比例尺形状(Shape)是目标物的外形、轮廓

a遥感图像记录的是目标物的顶面形状,不同于地面看的侧面形状

b自然形成物往往形状复杂,不规则,轮廓边界呈现较圆滑自然的曲线如河曲冲击扇、火山锥等;人为活动的产物一般具有规则的几何形状,拐角明显呈一定角度,如田块、果园、城镇建筑物等

c影像的比例尺和分辨率对形状影响较大,小比例尺时,往往呈现的是综合体的形状纹理(Texture)是指具有不同色调和形状的细微影像按某种规则排列组合的集合,这种细微影像称为纹理基元。它往往是指图像上地物表面质感(平滑、粗糙、细腻等)如“花格子衬衫”(强调单个事物的重复规则排列,如果园果树的株行距、集约化程度高的田块排列,贵州山区梯田的排列)图案(Pattern),即图型结构,是指多个人工目标重复排列的空间形式,它反映地物目标的空间分布特征。如建筑物、道路、绿化带形成的住宅区的图案位置(Site)即地理位置,它反映地物所处的地点与环境,地物与周边的关系如菜地多分布于居民点周围与河流两侧;机场多在大城市郊区的平坦地;堤坝与道路(形色难分),堤在河流两侧并与之平行,道路与居民点相连;有的植物生长于高地,有些只能生长在湿地组合(Association)指某些目标的特殊表现和空间组合关系,它不同于那种严格按图型结构显示的空间排列,而指物体间一定的位置关系和排列方式,即空间配置和布局如砖场由高烟囱、取土坑、堆砖场等组合而成;军事目标可能有雷达站、军车、军营及周围的配套的军事设施等第三节遥感图像的目视解译一、目视解译的原则从应用的目的出发,总体观察,全面分析图像特征。坚持先易后难,由粗入细,由整体到局部的原则应充分利用各种解译标志,包括直接标志和间接标志,相互补充,彼此验证随着多光谱和多平台遥感技术的发展,应尽可能创造条件开展多波段、多时相、多类型遥感图像的对比分析二、目视解译的基本过程准备阶段根据解译的目的和经费的支撑选择适当空间分辨率、时相、光谱分辨率的遥感数据并进行波段组合进行彩色增强;尽量收集到质量好、现势性较强的地形图及有关专业图件和文字资料;编写解译标志表及说明草稿(这是一编检索表的过程,工作量大);野外选择典型地区进行粗查,为建立合理的解译标志表打好基础。室内图像解译阶段按解译的基本原则进行,对无法解译或把握不大的区域应记录下来,有待野外验证野外验证与补充解译阶段成果整理与制图总结阶段三、遥感解译过程的复杂性(Complexity)1遥感图像显示的是某一特定地理环境的综合体,这种综合表现在两个方面:

a地理要素的综合它反映的是地质、地貌、水文、土壤、植被、社会生态等多种自然、人为要素的综合,这些因子是密切相关、交织在一起,往往难以区分

b遥感信息本身的综合遥感图像可以是不同时间、空间、光谱、辐射分辨率的综合遥感数据对应的地理环境又是一个复杂的、多要素的、多层次的、具有动态结构和

明显地域差异的开放巨系统,它在时间和空间上是不断变化的,因而遥感信息中的诸要素是相互关联、复杂变化的因此,遥感解译过程是复杂的,主要体现在:1地物波谱特征是复杂的,它受多种因素控制,本身也因时因地而变化2自然界存在着大量的“同物异谱”和“同谱异物”现象3地物的时空属性和地学规律是错综复杂的,各要素、各类别之间的关系是多种类型的地带性规律:由于太阳辐射随纬度分布的规律性,造成沿纬度的水平地带性现象,由于温度、湿度等随地形高度分布的规律性造成沿高度的垂直地带性现象,植物从播种到成熟的季节性变化规律等;有的具有随机性、不确定性,如自然灾害;有的具有模糊性存在过渡渐变关系,如气候带、草场类型的变化等为了提高解译过程的正确性、可靠性,必须补充必要的辅助数据(Ancillary)和先验知识(PrioriKnowledge)-指地学、生物学、物理学、数学等专业知识,在GIS的支持下,发展一系列相关的、多层次的、综合的应用分析方法,进行遥感与地学综合分析第四节模式识别(PatternRecognition)概述遥感图像的计算机分类是模式识别技术在遥感领域的具体应用,是遥感图像应用处理的重要内容和关键技术之一。首先提及关于模式识别的基本概念一、基本概念类别(Category)是与概念(Concepts)或原型(Prototype)相关的“自然”状态或对象种类。假定有c个类别,,也称为解释空间(InterpretationSpace)。解释空间有概念驱动(Concept-Driven)的属性,如类别的联合、交叉等2模式(Pattern)是对象的“物理”描述。通常是信号、图像或简单的数值表。也常把模式称为对象、案例或样本。特征(Feature)是从模式得到的对分类有用的度量、属性或基元(Primitive)所以特征选取是门艺术。二、模式识别的方法数据聚类(Clustering)是用某种相似性度量的方法将数据组织成有意义的和有用的各组数据。数据聚类不需要利用已知类的信息,它是一种非监督学习的方法,解决方案是数据驱动的统计分类(StatisticalClassification)最为经典的模式识别方法,在选取训练区的基础上,估计出每类型的统计特征参数(均值向量和协方差矩阵),从而确定每类型的概率分布密度函数,进而建立判别函数,实现对待分像元进行分类。这种分类方法是建立在多元变量的多元正态分布的假设基础上的。这是一种监督学习方法。神经元网络(ArtificialNeuralNetwork)是以数学算法结合计算机程序来模拟人的物理神经元之间的联系方式和思维过程,通过反馈控制的方式来调整神经元之间的联系权重,进而使神经元的实际输出无限的逼近期望输出,这一过程通过迭代方式来训练神经元网络。这是一种非线性的数学方法,并且是与“模型无关”,也就是它无须对数据的分布作出假设。存在的不足(1)关于神经网络的数学解释很复杂(2)对于一些重要的决策,设计者常常没有理论依据,因此必须进行大量的试验,并从试验的失败中得到启发从而不断改进神经网络(3)从神经网络得不到任何的语义的信息4结构模式识别其基本思想是:任何一个具有意义的物理模式都具有良好的结构性,它是由许多已知类别和性质的子模式或源模式(也称模式基元),按照一定的规则构成的组合件,所以一旦知道生成规则和子模式、源模式,便可由“模式描述”语句的文法推理出一个用字符串来表示的模式集合。若所研究的模式被包含在此集合内,就认为该模式被识别出来了。此法至今在遥感图像识别分类中尚未得到实际应用,有待进一步开发5模糊模式识别人在进行识别时可以根据一些模糊的印象就能做到比较准确的判断。然而,计算机是建立在0、1二值逻辑基础上的,它对事物的分析的结论是“非假”即“真”。这种二值逻辑不适宜处理模糊事物。根据人辨识事物的思维逻辑,吸取人脑的识别特点,模糊集合论(FuzzySetTheory)把数学从二值逻辑转向连续逻辑这就更接近人类大脑的识别活动了。由此产生了一种相当独特的识别方法:模糊识别第五节遥感图像计算机分类概述一、遥感图像计算机分类的概念就是将遥感图像中每个像元根据其在不同波段的光谱亮度、空间结构特征或其他信息按照某种规则或算法划分为不同的土地覆盖类型专题的技术过程。二、遥感图像计算机分类(模式识别)的种类光谱模式识别(SpectralPR)是指根据像元到像元的光谱信息来自动划分土地覆盖类型的分类过程的总称。它只考虑了地物在光谱辐射方面的差异。空间(结构)模式识别(SpatialorStructuralPR)是指图像像元根据和它周围像元的空间关系来进行图像分类。空间关系主要是指:图像的结构、像元的近似度特征的大小、形状、方向性、分形维、扁率、重复度和上下关系等空间特征。这种方法比光谱模式识别过程更复杂,而且计算算法上更精深。时间模式识别(TemporalPR)是指在特征鉴别中将时间作为一种辅助信息,利用多时相的遥感数据动态的进行土地覆盖类型的分类说明:遥感图像分类没有唯一“正确”的方法,因此可以将它们结合在一起运用,形成混合模式(HybridPattern)三、遥感图像计算机分类的方式按照在分类过程中分类者的参与程度,将分类分为两种方式:监督分类(SupervisedClassification)非监督分类(UnsupervisedClassification)四、遥感图像计算机分类的原理这样,图像中的任何一个像元就可以用一n维的光谱值向量来描述:式中:xji代表第j个波段上第i号像元的亮度值

i=1,2,…,N,N代表每个波段图像中像元的个数这样,任何一像元点的光谱向量对应着n维欧氏空间的一个点若某两个像元属于同一地物类型,则它们在欧氏空间中就应该集结在一起;相反,若两个像元分别属于不同的地物类型,则它们在欧氏空间中就应该彼此分离。分类图像(类码标记图像)假设分割A、B两个点集的曲面(图中是两维变量因此是直线)表达式为:则方程称为A、B两类的判别边界(DecisionBoundary)在已经确定以后,特征空间中任意一点是属于A类?还是属于B类?根据几何学知识可知:当时当时

上述的确定样本点所属类别的规则称为判别准则(DecisionCriteria),称为判别函数(DecisionFunction)遥感图像分类算法的核心就是确定判别函数和相应的判别准则,为了保证所确定的判别函数能够将各类地面目标在特征空间中的点分割开来,通常是在一定的准则(如Bayes分类器中误分概率最小准则等)下求判别函数和相应的判别准则。五、特征选择与特征变换在遥感图像分类之前,为了压缩参与分类多光谱图像数据的维度和找到那些对识别感兴趣的地物类型最为有效的“特征图像”,通常需要进行特征选择(FeatureSelection)和特征提取(FeatureExtraction)。在分类时我们总是希望用最少的影像数据取得最好的分类结果,这样就需要从多光谱图像中选择最佳的特征影像组合进行分类,这就称为特征选择。将原始多光谱图像通过一定的数学变换(如主成分、缨帽变换、植被指数变换等)生成一组进行了信息融合的新的特征图像,这种技术手段就称为特征变换。特征选择时,除了凭借研究者的定性判断进行特征选择外,通常可用一些定性的指标计算来帮助进行特征选择,这些指标主要有:距离测度(DistanceMeasure)距离是最基本的类别可分性的测度,如果所选择的特征图像能使感兴趣的目标类别的类内距离最小,而与其它类别的类间距离最大,则用这组特征图像设计的分类器分类效果一定很好如果将所有的特征图像都计算这一参数值,通过比较找到参数值最大的那个特征图像,即是最佳的分类特征图像变换离散度(TransformDivergence)衡量遥感数据各地物类型可分性好坏的数量指标常采用变换离散度和JM距离。离散度(Divergence)是具有分布重叠度的两个类型之间可分性的数量测度。若遥感图像中各类型的光谱矢量遵从或近似遵从多元正态分布,则图像中每两个类型之间的离散度定义为:式中:表示求矩阵的迹,和分别是第i类型和第j类型的协方差矩阵和分别为第i类型和第j类型的光谱均值向量实际应用时,常采用变换离散度公式定义光谱类型间的可分性,变换离散度定义为:当需要研究M个类型之间的可分性时,通常是考察M个类别间的平均离散度,它定义为:

式中:M是选定地物的类型数,是第i类型的的先验概率。

最优指数公式OIF(OptimumIndexFormula)在前面假彩色合成时已介绍ClassificationAccuracyAssessmentAnotherareathatiscontinuingtoreceiveincreasedattentionbyremotesensingspecialistsisthatofclassificationaccuracyassessment.Historically,theabilitytoproducedigitallandcoverclassificationsfarexceededtheabilitytomeaningfullyquantifytheiraccuracy.Infact,thisproblemsometimesprecludedtheapplicationofautomatedlandcoverclassificationtechniquesevenwhentheircostcomparedfavorablywithmoretraditionalmeansofdatacollection.Thelessontobelearnedhereisembodiedintheexpression“Aclassificationisnotcompleteuntilitsaccuracyisassessed”.ClassificationerrormatrixOneofthemostcommonmeansofexpressingclassificationaccuracyisthepreparationofaclassificationerrormatrix(sometimescalledaconfusionmatrixoracontingencytable).Errormatricescompare,onacategory-by-categorybasis,therelationshipbetweenknownreferencedata(groundtruth)andthecorrespondingresultsofanautomatedclassification.Suchmatricesaresquare,withthenumberofrowsandcolumnsequaltothenumberofcategorieswhoseclassificationaccuracyisbeingassessed.`Table7.3isanerrormatrixthatanimageanalysthaspreparedtodeterminehowwellaclassificationhascategorizedarepresentativesubsetofpixelsusedinthetrainingprocessofasupervisedclassification.Thismatrixstemsfromclassifyingthesledtrainingsetpixelsandlistingtheknowncovertypesusedfortraining(columns)versusthepixelsactuallyclassifiedintoeachlandcovercategorybytheclassifier(rows) Severalcharacteristicsaboutclassificationperformanceareexpressedbyanerrormatrix.Forexle,onecanstudythevariousclassificationerrorsofomission(inclusion).Noteintheabovetablethatthetrainingsetpixelsthatareclassifiedintotheproperlandcovercategoriesarelocatedalongthemajordiagonaloftheerrormatrix(runningfromupperlefttolowright).Allnon-diagonalelementsofthematrixrepresenterrorsofomissionorcommission.Omissionerrorscorrespondtonon-diagonalcolumnelements(e.g.,16pixelsthatshouldhavebeenclassifiedas“sand”wereomittedfromthatcategory).Commissionerrorsarerepresentedbynon-diagonalrowelements(e.g.,38“urban”pixelsplus79“hay”pixelswereimproperlyincludedinthe“corn”category).Severalotherdescriptivemeasurescanbeobtainedfromtheerrormatrix.Forexle,theoverallaccuracyiscomputedbydividingthetotalnumberofcorrectlyclassifiedpixels(i.e.,thesumoftheelementsalongthemajordiagonal)bythetotalnumberofreferencepixels.Likewise,theaccuraciesofindividualcategoriescanbecalculatedbydividingthenumberofpixelsinthecorrespondingroworcolumn.Whatareoftentermedproducer’saccuraciesresultfromdividingthenumberofcorrectlyclassifiedpixelsineachcategory(onthemajordiagonal)bythenumberoftrainingsetpixelsusedforthatcategory(thecolumntotal).Thisfigureindicateshowwelltrainingsetpixelsofthegivencovertypeareclassified.User’saccuraciesarecomputedbydividingthenumberofcorrectlyclassifiedpixelsineachcategorybythetotalnumberofpixelsthatwereclassifiedinthatcategory(therowtotal).Thisfigureisameasureofcommissionerrorandindicatestheprobabilitythatapixelclassifiedintoagivencategoryactuallyrepresentsthatcategoryontheground.Notethattheerrormatrixindicatesanoverallaccuracyof84%.However,producer’saccuraciesrangefromjust51%to100%anduser’saccuraciesvaryfrom72%to99%.Furthermore,thiserrormatrixisbasedontrainingdata.Itshouldberememberedthatsuchproceduresonlyindicatehowwellthestatisticsextractedfromtheseareascanbeusedtocategorizethesameareas.Iftheresultsaregood,itmeansnothingmorethanthatthetrainingareasarehomogeneous,thetrainingclassesarespectrallyseparable,andtheclassificationstrategybeingemployedworkswellinthetrainingareas.Thisaidsinthetrainingsetrefinementprocess,butitindicateslittleabouthowtheclassifierperformselsewhereinascene.Oneshouldexpecttrainingareaaccuraciestobeoverlyoptimistic,especiallyiftheyarederivedfromlimiteddatasets.Afurtherpointtobemadeaboutinterpretingclassificationaccuraciesisthefactthateveracompletelyrandomassignmentofpixelstoclasseswillproducepercentagecorrectvaluesintheerrormatrix.Infact,sucharandomassignmentstatisticisameasureofthedifferencebetweentheactualagreementbetweenreferencedataandanautomatedclassifierandthechanceagreementbetweenthereferencedataandarandomclassifier.Conceptually,K=(observedaccuracy–chanceagreement)/(1-chanceagreement)Thisstatisticservesasanindicatoroftheextenttowhichthepercentagecorrectvaluesofanerrormatrixaredueto“true”agreementversus“chance”agreement.Astrueagreement(observed)approaches1andchanceagreementbetween0and1.Forexle,akvalueof0.67canbethoughtofasanindicationthatanobservedclassificationis67percentagebetterthanoneresultingfromchance.Akvalueof0suggeststhatagivenclassificationisnobetterthanarandomassignmentofpixels.Incaseswherechanceagreementislargeenough,Kcantakeonnegativevalues---anindicationofverypoorclassificationperformance.(Becausethepossiblerangeofnegativevaluesdependsonthespecificmatrix,themagnitudeofnegativevaluesshouldnotbeinterpretedasanindicationofrelativeclassificationperformance)六、分类结果的质量评价在遥感图像的分类问题中常以混淆矩阵(ConfusionMatrix)来表示分类结果的精度混淆矩阵定义如下:(Usually,thismatrixwasderivedfromthevalidationdataset(groundtruth)theuserspecified.)式中:mij表示本应属于第i类结果被分入第j类中去的像元总数

n表示总的类别数所以,该矩阵的主对角线上的元素值越大则说明分类的效果越好若通过分类获取了上述混淆矩阵,可以计算基本的精度估计量:1总体分类精度正确分类的总像元数(主对角线上元素的和)与参加分类评价的总像元数(矩阵中所有元素之和)之比,表示为用户精度每一类别被正确分类的像元数量除以被分作该类的总像元数(列元素之和),表示为生产者精度每一类别被正确分类的像元数量除以该类用作分类训练的总像元(行元素之和),表示为

一、无监分类的概念在对研究区不了解的情况下,只是依据每一类型地物所具有的相似性(Similarity,类似度

),把反映各类型地物特征值的分布按相似分割和概率统计理论将各像元归并成不同的空间集群,然后结合地面实地调查来确定各集群的地物类型从而达到识别分类目的的分类方法。其数学基础是:多元统计的聚类分析(ClusteringAnalysis)第六节遥感图像计算机无监分类Kappa分析二、非监督分类的特点分类者不需要对研究区有广泛的了解和熟悉,但分类结束后仍需要一定的知识或地面调查来确定各集群的地物覆盖类型人为误差的机会减少,因为分类者参与的程度低,只需要事先设定几个参数即可非监督分类产生的光谱集群组并不一定对应于分析者想要的类别分析者较难对产生的类别进行控制三、非监督分类的算法K-Mean算法其基本思想是通过迭代,逐次移动各类别的中心,直到后一次获得的各类的中心与前一次聚类获得的中心不再发生移动为止。具体步骤:假设图像上的目标要分成m类,m事先由分类者指定(1)适当地选取m个类的初始中心,初始中心的选择对聚类的结果有一定的影响,初始中心的选择一般有以下方法:1)根据问题的性质,根据经验确定类别数m,从数据中找出从直观上看来比较合适的m个类的初始中心

2)将全部数据随机地分成m个类别,计算每个类别的重心,将这些重心作为m个类的初始聚类中心(2)在第K次迭代中,对任一样本X按如下方法把它调整到m个类别中的某一类别中去。对于所有的,如果:(3)由第(2)步得到类新的中心(4)对于所有的则迭代结束,否则转到第二步继续进行迭代YN开始选择m个聚类中心z1,z2,…,zm所有像元分到m个聚类中心计算新的聚类中心聚类中心不变结束K均值算法框图说明:这种方法的聚类结果受所选聚类中心的数目及其初始位置以及模式分布的几何性质和读入次序等因素影响,并且在迭代过程中没有调整类别数的措施ISODATA算法

ISODATA(IterativeSelf-OrganizingDataAnalysisTechniquesAlgorithm,迭代自组织数据分析技术算法),它与K-Mean算法有两点不同:第一,它不是每调整一个样本的类别就重新计算一次各类样本的均值,而是在每次把所有样本都调整完后才重新计算一次各类样本均值,前者被成为“逐个样本修正法”,后者被成为“成批样本修正法”第二,ISODATA算法可以自动进行类别的“合并”与“分裂”,从而得到类别数比较合理的聚类结果,所以类别数是动态的A分类前预定义参数(1)打算分类的最大类别数Cmax和最小类别数Cmin(2)迭代过程中,最大类别保持不变的像元数量百分比,当达到这个百分比时,

ISODATA算法停止(3)每个类别中最小的像元数量、最大的标准方差(4)最小的集群均值间距离,如果两个类别间距离小于这个值,则两类合并(5)集群分散值,通常为0BISODATA算法的基本步骤(1)初始随机选取Cmax个中心(2)计算其它像元到这些中心的距离,按照最小距离规则将各像元划分到其对应的类别中去(3)重新计算每个类别的均值,按照前面定义的参数合并或分裂相关类别(4)重复(2)、(3),直到达到最大不变像元百分比或最大迭代次数为止第七节遥感图像的计算机有监分类一、有监分类的概念利用对研究区已有类别的先验知识从遥感图像上选取若干有代表性的训练区作为样本据此估计出各类别的统计特征参数(主要是指均值向量和协方差矩阵)进而建立判别函数,然后利用判别函数实现对待分类像元进行分类的方法。有监分类的数学基础:多元统计的判别分析(DiscriminantAnalysis)训练区(TrainingArea):是分类者事先已知地物的类别然后从遥感图像上相应位置“圈定”的一定数量像元所构成的样区,其目的是用来对计算机进行“训练”,让计算机学习到描述不同类别地物特征(主要是统计特征,均值向量和协方差矩阵)为建立基于统计学的判别函数打下基础。训练区选取的好坏决定分类的成功与否,因此选训练区是“艰辛的、科学的、艺术的”分类者选训练区的要求:A代表性通常在每种类型地物所对应图像的中心地带选训练区,避免不同类型在边缘相交处相互混杂,使训练区像元光谱“不纯”B完备性是指选取训练区类型数要与待分的类型数相对应;对于某些类别,如水体,可能有清洁的、含泥沙的水、富营养化的水,每种都必须选,综合后共同体现水体的“统计特征”分类者选训练区的方式:A多边形(Polygon)或区域方式选取:适用于大片集中分布的地物类型B多边形线(Polyline)方式:适用线状分布的地物,如道路、河流等C点方式(Point):适用于零星的小面积分布的地物类型上述选训练区的方式可以交互使用二、有监分类的过程根据对研究区的了解(先验知识),从图像中选择有代表性的训练区(样本)对选出的样本依据选用的分类器进行统计分析处理,提取各类型的数据特征并以此建立适用的判别准则使用该判别准则逐个判定各像元点的类别归属输出经过类码标注的分类结果图像图像数据判决准则像元归类输出分类结果图像选训练样区样本统计分析各类数据特征遥感图像有监分类工作流程示意图三、有监分类的算法1最小距离法(MinimumDistance):利用所选训练样本估计出每一类型的均值向量和协方差矩阵;然后以均值向量作为该类在特征空间中的中心位置,计算每个待分类像元到各类中心的距离,然后将此像元归并到距离最小的一类中去。此方法的判别准则是——距离设n维多光谱图像中任一待分类像元Xi用n维向量表示为:则该像元到第K类中心的距离可用下面公式计算获得:欧氏距离2马氏距离法——马哈拉诺比斯(Mahalanobis)距离式中:Xi是第i个待分类像元的亮度值向量Mk是第k个类别中心的亮度均值向量CovarianceMatrix马氏距离由于乘上了协方差矩阵的逆,因此它具有“统一量纲”的效应;当协方差矩阵退化为单位阵(IdentityMatrix)时,马氏距离就变成了欧氏距离3Bayes判别准则前面介绍的距离判别方法计算简单,结论明确,简单实用。但其缺点是:判别方法与各类出现的概率大小无关,同时与误判之后造成的损失无关。而Bayes判别可以很好的克服上述缺点原理:假定先考虑两个总体G1和G2,它们分别具有概率密度函数f1(x)和f2(x),设G1和G2出现的先验概率为P1=P(G1),P2=P(G2),P1+P2=1A先验概率(PrioriProbability):未观测前已知某一样本X来自于每个总体的概率,如前面的P1、P2B条件概率(ConditionalProbability):已知在总体G1和G2出现的条件下,观测到样本X的概率P(X/Gi)i=1,2称为条件概率C后验概率(PosterioriProbability):已知样本X出现的条件下,它是来自于总体Gii=1,2的概率,也就是样本属于总体的概率P(Gi/X)由Bayes定理有:从上式看P(X)是一个与类别无关的公共因子,在比较后验概率时不起作用,判别时可以将它去掉。所以它的判别准则就是:比较上式的大小:先验概率P(Gi)

,通常根据各种先验知识(具体问题的实际情况、历史上积累的资料等)给出,或假设它们相等条件概率P(X/Gi),由于遥感问题中像元亮度值正态分布假设的合理性及非正态问题可以通过数学方法转化为正态问题来处理,因此都假定满足正态分布的条件

一元正态分布的概率密度函数写为:遥感图像分类往往是多光谱,多元变量,服从多元正态

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论