(地图制图学与地理信息工程专业论文)基于svm邻近同化滤波模型的冰冻湖泊水体精确提取研究.pdf_第1页
(地图制图学与地理信息工程专业论文)基于svm邻近同化滤波模型的冰冻湖泊水体精确提取研究.pdf_第2页
(地图制图学与地理信息工程专业论文)基于svm邻近同化滤波模型的冰冻湖泊水体精确提取研究.pdf_第3页
(地图制图学与地理信息工程专业论文)基于svm邻近同化滤波模型的冰冻湖泊水体精确提取研究.pdf_第4页
(地图制图学与地理信息工程专业论文)基于svm邻近同化滤波模型的冰冻湖泊水体精确提取研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(地图制图学与地理信息工程专业论文)基于svm邻近同化滤波模型的冰冻湖泊水体精确提取研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论文题目:基于s v m 邻近同化滤波模型的冰冻湖泊水体精确提取研究 专业:地图制图学与地理信息工程 硕士生:李晶晶 指导教师:贾建华 摘要 。签名,垄显叠 ( 签名) 曼童笙 本文依托于国家科技基础性工作专项重点项目“中国湖泊水质、水量和生物资源调 查”( 2 0 0 6 f y l l 0 6 0 0 ) 子课题“中国湖泊卫星遥感调查 ,采用小样本学习、抗噪声性 能好、学习效率高的支持向量机( s v m ,s u p p o r tv e c t o rm a c h i n e ) 方法来提取多光谱遥感 影像冰冻湖泊水体。支持向量机最大特点是根据结构风险最小化原则,尽量提高学习机 的泛化能力,即由有限的训练集样本得n 4 , 的误差能够保证对独立的测试集仍保持小的 误差,s v m 在遥感信息提取方面,特别是在缺少先验知识的情况下,具有较高的推广能 力。 本文分析了冰冻湖泊水体的光谱特征,说明了传统遥感影像分类方法不能达到较高 精度的原因,在此基础上利用m a t l a b 支持向量机工具箱建立了s v m 提取模型,并选择 了东北地区的查干湖和长白山天池c b e r s 多光谱遥感影像进行了提取试验。试验表明, 两湖提取精度支持向量机较最大似然法提高了3 9 3 。但仅应用s v m 方法提取冰冻湖泊水 体,提取结果小图斑多、分类不完整,因此本文在原来模型的基础上加入了邻近同化滤 波方法,有效剔除了小图斑。 综合s v m 令b 近同化滤波模型提取冰冻湖泊水体的研究过程,本文得出的结论如下: ( 1 ) 查干湖湖面整体冰冻;据实地考察和相关文献,长白山天池西部由于湖底受 温泉影响,湖水冬季不封冻,从影像上看天池西部呈深蓝色的部分就是未冰冻的湖泊水 体。应用s v m 邻近同化滤波提取模型,不仅实现了对全部冰冻湖泊水体的精确提取, 对冰水混合的湖泊水体也同样适用,所以本文的提取模型对冰冻情况复杂的湖泊水体精 确提取有着广阔的应用前景。 ( 2 ) 与长白山天池相比,查干湖结冰湖面破碎度较高,由于处在破碎部分的像元 光谱复杂,最大似然法难以达到较高的提取精度。在同样训练区样本下,与最大似然法 相比,s v m 提取精度提高了5 3 6 ,由此可以看出s v m 具有较强的小样本学习能力, 提取精度高。 ( 3 ) 为剔除湖边浅水沼泽和冰冻期湖面雪等干扰地物的影响,本文提出邻近同化 滤波方法,这也是本文的创新之处。经邻近同化滤波模型处理后,提取结果小图斑较少, 类别完整。 本文在如下两方面还需要进一步研究: ( 1 ) 长白山天池处在山区,从图4 1 7 可以看出,其南部的山体阴影影响并未有效 去除掉,因此提取山区型冰冻湖泊水体时,如何有效剔除山体阴影的影响有待于进一步 研究。 ( 2 ) 选择邻近同化滤波模板的大小时需要根据实际情况人为设定,模板选择太大 会导致分类失真,选择太小又不能有效除去干扰地物,因此如何选择合适的同化滤波模 板有待于进一步研究。 关键词:支持向量机;邻近同化滤波;最大似然法;冰冻湖泊水体;遥感信息提取 研究类型:应用研究 s u b j e c t :t h ea c c u r a t ee x t r a c t i o no ff r o z e nl a k ew a t e rb a s e do n s v m - n e i g hb o r i n gf i l t e ra s s i m i l a t i o nm o d e l s p e c i a l t y :m a pc a r t o g r a p h y a n dg e o g r a p h i ci n f o r m a t i o ne n g i n e e r i n g n a m e :l ij i n g j i n g i n s t r u c t o r :j i aj i a n h u a a b s t r a c t ( s i g n a t ur e ) ( s i g n a t u r e ) t h i sa r t i c l ei sb a s e do nt h ep r o g r a ms e r v e yo fl a k e si nc h i n a , w h i c hi st h es u b - t o p i c so f t h ep r o g r a ms u r v e yo fw a t e rq u a l i t y ,v o l u m ea n db i o l o g i c a lr e s o u r c eo fl a k e si nc h i n a w h i c hi sb e l o n g e dt on a t i o n a lf u n d a m e n t a lr e s e a r c hp r o g r a mo fc h i n a , a n da d o p t ss v m ( s u p p o r tv e c t o rm a c h i n e ) t oe x t r a c tm u l t i - s p e c t r a lr e m o t es e n s i n gi m a g eo ff r o z e nl a k e w a t e r t h i sm e t h o di sl e a r n i n gf r o ms m a l ls a m p l e ,g o o da tn o i s ep r o o fa n dq u i t ee f f i c i e n t t h e m o s tp r o m i n e n tf e a t u r eo fs v mi st oi m p r o v et h eg e n e r a l i z a t i o na b i l i t yo ft h el e a r n i n g m a c h i n ea sm u c ha sp o s s i b l ea c c o r d i n gt ot h es t r u c t u r er i s km i n i m i z a t i o np r i n c i p l e ,w h i c h m e a n si ft h em a c h i n eg e t ss m a l le r r o r sf r o ml i m i t e dt r a i n i n gs e t ss a m p l ei tc a na l s ob ei n s u r e t ok e e ps m a l le r r o ri nt h ec a s eo fi n d i v i d u a lt r a i n i n gs e t t h em e t h o do fs v mp o s s e s s e sg r e a t g e n e r a l i z a t i o na b i l i t yi nt h ef i e l do fr e m o t es e n s i n gi n f o r m a t i o ne x t r a c t i o n , e s p e c i a l l yw h e n w ea r el a c ko fap r i o r ik n o w l e d g e 1 1 1 i sa r t i c l ea n a l y z e ds p e c t r a ls i g n a t u r eo ff r o z e nl a k ew a t e r ,a n de x p l a i n e dt h er e a s o n w h yt h e yc a l l tg e th i g h e ra c c u r a c yw h e nu s i n gt h et r a d i t i o n a lr e m o t es e n s i n gi m a g e c l a s s i f i c a t i o nm e t h o d s o nt h i sb a s i s ,w r i t e re s t a b l i s h e dt h es v me x t r a c t i o nm o d e lb y u t i l i z i n gt h em a t l a b - s v mt o o l k i t s ,a n de x e c u t e dt h ee x t r a c t i o ne x p e r i m e n to nc b e r s m u l t i - s p e c t r a lr e m o t es e n s i n gi m a g ei nl a k eb a l a p a na n dh e a v e np 0 0 1 1 1 1 ee x p e r i m e n t s h o w st h a tt h ee x t r a c t i o na c c u r a c yi n c r e a s e s3 9 3 w h e nu s i n gs v mm e t h o dt h a nu s i n g m a x i m u ml i k e l i h o o d b u ts v mm e t h o da l s oh a si t sw e a kp o i n t s ,w h i c ha r es m a l l e r e x t r a c t i o nr e s u l t ,m o r em a r k sa n dt h ei n c o m p l e t ec l a s s i f i c a t i o n s ot h i sa r t i c l ea d d e dt h e n e i g h b o r i n gf i l t e ra s s i m i l a t i o nm e t h o dt ot h ee x i s t e dm o d e l ,w h i c he l i m i n a t e ss m a l lm a r k s e f f i c i e n t l y a f t e rc o m b i n i n gt h er e s e a r c hp r o c e e do fe x t r a c t i n gt h ef r o z e nl a k ew a t e rb ym e a n so f s v ma n dn e i g h b o r i n gf i l t e ra s s i m i l a t i o n c o n c l u s i o n sc o m ea sf o l l o w : ( 1 ) t h es u r f a c eo fl a k eb a l a p a ni sf r o z e nc o m p l e t e l y a c c o r d i n gt ot h ef i e l ds u r v e ya n d r e l a t i v ed o c u m e n t s ,t h eh e a v e np o o ld o e s n tg e tf r o z e ni nw i n t e ro w i n gt ot h eh o t s p r i n gi nt h e b o t t o m i nt h ei m a g e s ,t h en a v yb l u ep a r ti nt h ew e s ts e c t i o ni st h el a k ew a t e rw i t h o u tf r o z e n t h i ss v m n e i g h b o r i n gf i l t e ra s s i m i l a t i o nm o d e ln o to n l yc a ne x t r a c tt h ec o m p l e t e l yf r o z e n i a k ew a t e rp r e c i s e l y ,a n da l s ow o r ki ni c e w a t e rm i x e dl a k ew a t e r t h e r e f o r e t h ee x t r a c t i o n m o d e li nt h i sa r t i c l eh a sv a s ta p p l i c a t i o ni ne x t r a c t i n gp r e c i s e l yt h ec o m p l i c a t e s i t u a t i o nl a k e w a t e r ( 2 ) c o m p a r i n gt ot h a ti nh e a v e np o o l ,t h ed e g r e eo ff r a g m e n t a t i o ni nt h ef r o z e ns u r f a c e o fl a k eb a l a p a ni sh i g h e r b e c a u s et h ep i x e ls p e c t r ai nt h eb r o k e np a r ta r eq u i t ec o m p l i c a t e , m a x i m u ml i k e l i h o o dm e t h o dc a n tw o r ko u th i l g he x t r a c t i o na c c u r a c y i nt h ec o n d i t i o no f s a m es a m p l e ,s v mc a l li n c r e a s et h ea c c u r a c ya b o u t5 3 6 t h a nm a x i m u ml i k e l i h o o d i t s h o w st h a ts v mi sb e t t e ra ts m a l ls a m p l el e a r n i n ga b i l i t y a n dh a sh i g h e re x t r a c t i o na c c u r a c y ( 3 ) i no r d e rt oe l i m i n a t et h ea f f e c t i o nf r o ms h a l l o wm a r s ha r o u n dt h el a k ea n dt h es n o w o nt h el a k es u r f a c ei ni c e p e r i o d ,t h i sa r t i c l ea l s op r o v i d e de x t r a c t i o ne x p e r i m e n ti n n e i g h b o r i n gf i l t e ra s s i m i l a t i o nm e t h o d t l l i si sa l s ot h eb i g g e s ti n n o v a t i o no ft h i sa r t i c l e t h er e s u l ts h o w st h a tt h ei m a g ei ss m a l l e r ,m a r k sa r el e s sa n dc l a s s i f i c a t i o ni sc o m p l e t e i ts t i l ln e e d sd e v e l o p m e n ti nt h ef u t u r ei nt h ef o l l o w i n gt w oa s p e c t s : ( 1 ) h e a v e np o o l i si nt h em o u n t a i na r e a , a n df i g u r e4 17s h o w st h a tt h ea f f e c t i o nf r o m t h es h a d o wo fm o u n t a i ni ns o u t hh a s n tb e e ne l i m i n a t e d t h e r e f o r e d u r i n ge x t r a c t i n gt h e f r o z e nl a k ew a t e ri nm o u n t a i na r e a , i ts t i l ln e e d sr e s e a r c ho nh o wt oe l i m i n a t et h ea f f e c t i o no f m o u n t a i ns h a d o w ( 2 ) 帅e nc h o o s et h es i z eo fa s s i m i l a t i o nf i l t e r i n gt e m p l a t e ,i ts h o u l db ed e c i d e d d e p e n d e n t l ya c c o r d i n gt ot h ep r a c t i c a ls i t u a t i o n i ft h es i z ei st o ob i g ,t h ec l a s s i f i c a t i o nw i l lb e d i s t o r t e d ;i fi t st o os m a l l ,t h ei n t e r f e r e n tc a n n o tb ee l i m i n a t e de f f i c i e n t l y s oi ts t i l ln e e d s r e s e a r c ho nh o wt oc h o o s es u i t a b l ea s s i m i l a t i o nf i l t e r i n gt e m p l a t e k e yw o r d s :s u p p o r tv e c t o rm a c h i n en e i g h b o r i n gf i l t e ra s s i m i l a t i o n m a x i m u ml i k e l i h o o df r o z e nl a k ew a t e r r e m o t es e n s i n gi n f o r m a t i o ne x t r a c t i o n t h e s i s :a p p l i c a t i o nr e s e a r c h 要错技丈学 学位论文独创性说明 本人郑重声明:所呈交的学位论文是我个人在导师指导下进行的研究工作及 其取得研究成果。尽我所知,除了文巾加以标注和致谢的地方外,论文中不包含 其他人或集体已经公开发表或撰写过的研究成果,也不包含为获得西安科技大学 或其他教育机构的学位或证书所使用过的材料。与我一同t 作的同志对本研究所 做的任何贡献均已在论文中做了明确的说明并表示了谢意。 学位做储躲档赭吼哆厂 学位论文知识产权声明书 龇髑肌删撇:玩 t 1 绪论 1 1 选题背景和意义 1 绪论 精确获取湖泊信息,为人类了解湖泊资源现状,揭示自然因素及人类活动对湖泊水 域的影响规律,以及合理开发、利用、保护、治理湖泊水域资源有着极其重要的意义。 从1 9 5 8 年到1 9 8 7 年,我国陆续开展了全国第一次湖泊资源调查,获得湖泊的大量基础 数据,取得了良好的社会效益和经济效益。但是,由于当时科学技术条件的限制,第一 次湖泊资源调查在湖泊位置和数量的确定上大都以人工实地调查为主。人工调查虽然能 在第一线获取湖泊地面资料,但是在确定湖泊边界、湖泊位置的精度上存在不足;特别 是我国幅员辽阔,有很多地方自然条件严酷,人工一线作业困难,致使第一次调查缺失 了许多湖泊信息。近年来,随着经济发展,人为对自然湖泊的扰动增加,加之全球气候 变化的显著影响,我国湖泊萎缩严重,湖泊变化明显,有些湖泊已经或正在消失。2 0 0 7 年国家科技基础性工作专项重点项目“中国湖泊水质、水量和生物资源调查正式启 动,标志着对我国湖泊资源的第二次调查进入了系统实施的新阶段。此次调查在第一次 湖泊调查工作基础上,将针对我国不同区域湖泊资源与环境变化的特点,以掌握我国湖 泊水量、水质与生物资源变化及其形成原因为核心,以野外调查、定位观测和遥感监测 为手段,以全国湖泊遥感普查与外流湖区主要湖泊重点调查为主要途径,对全国面积大 于1 o k m 2 的湖泊,对湖泊数量、面积和分布现状进行遥感调查,为全面、系统地掌握我 国湖泊现状及其变化情况,为国家经济可持续发展和生态安全,提供可靠的、系统的、 规范的科学数据和决策依据。 本文依托于“中国湖泊水质、水量和生物资源调查 子课题“中国湖泊卫星遥感调 查 ,利用遥感对地观测技术进行湖泊调查,具有覆盖面广、宏观性强、快速、多时相、 丰富的综合信息等优点,湖泊遥感调查结合地面实地验证能够有效保证湖泊调查的空间 精度和及时更新的需要,大大降低了调查成本。目前,利用卫星遥感图像提取湖泊信息 已成为研究湖泊的重要手段之一,遥感信息提取作为遥感技术的一个重要分支,多年来 一直受到遥感界研究人员的普遍重视n 1 。遥感信息提取是在定性和定量化地学模型基础 上,建立与目标相对应的数据间映射关系,并导出地物的物理量、识别目标及其空间分 布的过程乜1 。遥感分类是信息提取的重要手段,目前遥感图像分类主要有目视解译和计 算机模式识别技术。目视解译方法既需要图像目视判读者具有丰富的地学知识和目视判 读经验,又需要大量的时间去判读,其劳动强度大,信息获取周期长,有关地学专题遥 感图像解译质量受目视判读者的经验、对解译区域的熟悉程度等各种因素制约。常用的 计算机模式识别技术主要包括监督分类和非监督分类口1 ,这些常规的统计分类方法依据 西安科技大学硕士学位论文 的都是数理统计学理论,如i s o d a t a 、最大似然法等。由于是基于数理统计理论,所以 常规统计算法一般在样本数目趋于无穷大时,才能获得较好的分类精度,但是在实际工 作中样本的数目往往是有限的,所以这些分类方法难以取得理想的分类效果。除无监督 学习和聚类、最大似然估计法外,近年来贝叶斯决策法、b p 神经网络这两类机器学习 算法被广泛地应用到遥感影像分类的研究中,取得了很好的结果h 刊。但另一方面,这两种 方法也存在一些固有的缺陷:贝叶斯决策法需要不同种类地物分布的先验概率;b p 神 经网络方法需要精细复杂的网络结构,初始输入参数的微小变化对收敛速度的影响很 大。 基于上述缺点,v a p n i k 等人在统计学习理论的基础上提出了支持向量机( s v m , s u p p o r tv e c t o rm a c h i n e ) 理论。支持向量机作为一种最新的也是最有效的统计学习方法, 近年来成为模式识别与机器学习领域一个新的研究热点盯q 。s v m 的最大特点是根据结 构风险最小化原则,尽量提高学习机的泛化能力,即由有限的训练集样本得到的小的误 差能够保证对独立的测试集仍保持小的误差,这种具有小样本学习、抗噪声性能好、学 习效率高的s v m 方法在遥感信息提取方面,特别是在缺少先验知识的情况下,具有较 高的推广能力u 2 | 。 本文将支持向量机应用于多光谱遥感影像冰冻湖泊水体信息提取,该方法与传统的 最大似然估计法相比提取精度高,不仅可以应用于冰冻湖泊水体信息提取,还可以应用 于冰水混合湖泊水体信息提取,是一种普适性较高的多光谱遥感影像冰冻湖泊水体提取 方法,尤其对于冬季结冰湖泊水体、海拔较高且常年结冰的湖泊水体信息提取有着广阔 的应用前景。 1 2 国内外研究进展 支持向量机的主要内容是在1 9 9 2 年到1 9 9 5 年间才基本完成,现在仍处在不断发展 的阶段n 钔。目前,m t t 人工智能实验室、微软研究院、德国g m d 等众多的科研机构 已经成为了研究s v m 的主要力量,并取得了大量的实验成果。在早期的c o r t e sc 和v a p n i k v n 等人将支持向量机应用到手写数字识别并取得理想的对比结果后,在人工智能和模 式识别领域出现了大量的应用s v m 的实验报告和应用系统,应用的范围涉及到手写体 识别、面像识别、特定的目标监测、影像的分类和检索、生物信息处理等各个领域n 纠6 j 。 特别在遥感信息分类提取方面,目前s v m 主要应用在土地利用分类、混合像元分解 l 8 3 、遥感影像融合9 1 、多光谱高光谱遥感分类凹1 等。 国内很多学者将将s v m 应用于遥感信息提取,如谭琨等构建了基于s v m 的高光谱 遥感图像分类模型,并用北京昌平区的o m i s 高光谱遥感影像进行了提取实验,结果表 明这种分类器结构简单、收敛速度快、具有很高的分类精度幢;何灵敏将s v m 应用于 e t m 遥感影像信息分类,结果表明s v m 相比神经网络和最大似然法更能挖掘图像像元 2 1 绪论 的临域特征,使图像的分类结果更为合理瞳引;杨青生将s v m 用于土地利用变化模拟前 的数据预处理,结果表明s v m 能反映城市的非线性特征,为复杂城市土地利用变化模拟 提供了一种十分有用的工具啪3 ;张风丽等将s v m 用于环青海湖地区的草地光谱分类最 佳时相选择分析,结果表明s v m 仅用8 个光谱波段就可以实现精确提取,体现了小样 本学习的优势m 3 。不过总体来看,国内对于s v m 的应用还处于起步阶段,很多应用方 向仍处于探索中。 1 3 研究内容与技术路线 冬季有的湖泊会结冰,有的湖泊海拔较高,湖面常年结冰,这些冰冻湖泊水体同一 般湖泊水体相比光谱跨度大,而且不同冰冻湖泊水体的影像上不可避免的存在一定的 “噪声,即结冰湖面的破碎程度不同,处在破碎部分的像元的光谱特征也不同,所以 造成光谱不稳定,传统的提取方法难以达到较高的精度。本文将支持向量机应用于多光 谱遥感影像冰冻湖泊水体信息提取,建立了基于s v m 邻近同化滤波模型,并选择了东 北地区的查干湖和天池c b e r s 多光谱遥感影像进行了提取试验,最后将该模型的提取 结果与传统的最大似然估计法提取结果进行精度对比。 本文的技术路线如下: 图1 1 技术路线图 s v m 邻近同化滤波模型流程图如下: 3 西安科技大学硕士学位论文 图1 2s v m 邻近i 司化滤波模型流程 1 4 章节结构 第一章,绪论。详细阐述了选题背景和意义、国内外研究进展、研究内容与技术路 线。 第二章,传统遥感影像分类方法介绍。概述了传统遥感影像分类的基本原理、步骤 以及遥感影像分类特征选取,对比分析了最小距离分类、马氏距离分类、平行体分类、 最大似然分类等常用的分类方法,最终确定了最大似然法作为本文的对比算法。同时本 章分析了冰冻湖泊水体的光谱特征,说明了传统分类方法不能有效将冰冻湖泊水体提取 出的原因。 第三章,基于s v m 邻近同化滤波模型的构建。本章论述了s v m 理论基础,从线 性可分和线性不可分两方面介绍了s v m 提取模型,详细说明了s v m 邻近同化滤波模型 的核心思想、实现环境和实现代码。 第四章,提取实验与对比分析。本章介绍了研究区概况与数据源,并且用s v m 邻 近同化滤波模型与最大似然法提取了查干湖和天池的冰冻湖泊水体,然后进行了精度评 价和对比分析。 第五章,结论与展望。总结了s v m 应用在冰冻湖泊水体方面的结论,就同化滤波 模型的进一步应用提出了展望。 4 嘉趟 2 传统遥感影像分类方法介绍 2 传统遥感影像分类方法介绍 2 1 传统遥感影像分类过程 2 1 1 分类概述 ( 1 )遥感图像的解译 遥感图像数据的应用常常是将遥感数据解译,最后形成各种专题图像或专题地图供 地学工作或其他工作使用。这种解译有两种方法:一种是目视解译方法,即凭借光谱规 律、地学规律和解译者的经验从影像的亮度、色调、位置、时间、纹理、结构等各种特 征推出地面的景物类型;另一种就是计算机解译的方法,就是对遥感图像上的信息进行 属性的识别分类,从而达到识别图像信息所对应的实际地物,提取所需地物信息的目的。 它实际上是计算机模式识别技术在遥感技术领域的具体应用。与遥感图像的目视判别技 术相比较,目的一样但手段不同,目视判别是直接利用人类的自然识别智能,而计算机 分类是利用计算机技术来模拟人类的识别智能。 ( 2 )光谱特征 。 为了将各个波段影像中像元的亮度值与地面景物特征联系起来,必须发现其中的规 律性。由地物反射率曲线可知,不同的波段地物的反射率有差异。图2 1 是雪、小麦、沙 漠、湿地反射率曲线的例子,按m s s 波段l ,2 ,3 ,4 分段,可以看出各波段中它们 反射率的差异。 反 錾 i l 。0 f f - - ! 。, 1q , 灸 , v 艇 一歹 一。 厂、 、 ? k 湿地 波k 雩,沙溃、湿地,小麦反射渡漪曲线 图2 1 地物反射率差异图 任意选取卫星影像同一景物的两个或两个以上波段,以每一波段的亮度( 灰度) 为轴 做多光谱空间,可以发现对应于地面同一类地物的像元点在多光谱空间内位置都很接 5 西安科技大学硕士学位论文 近,有聚集的倾向。图2 1 中,凡同一地类的地物,如湿地,亮度接近,在波段l 亮度 最小,在波段3 亮度也最小,因此在二维波段1 3 空间中,湿地位置在左下角区域; 而小麦亮度在波段1 较小,在波段3 却较大,位于光谱空间的左上角等。这种同类聚 集的特性说明,如果按照地物类别聚集的规律把多光谱空间划分为若干个子空间,每一 子空间包含有一个类别,这样就可以把图像中未知的像元进行分类,把他们分配到各自 的子空间中去。 这种完全按照光谱特征在多光谱空间聚集的类别,称为光谱类别;与地物实际景观 对应的类别又可称为信息类别。光谱类别如能直接与实际地物对应,则又是信息类别, 如图中的雪地、沙漠、小麦和湿地都是信息类别与光谱类别一一对应的。由于自然界的 情况是复杂的,反映在图像像元亮度中的信息常常是多种影像的综合,而同一种地物也 有许多区别。如湿地,由于所含水分的不同,在光谱空间会形成不同的光谱类别:如土 壤,由于土壤类型不同也会形成不同的光谱类别。有时在同一种光谱类别中有不同的信 息类别,例如:干湖床的明亮表面与大沙丘陡峭的向阳坡面的光谱不易分开,这称为异 物同谱。因此,当利用光谱特性分类得到光谱类别后,还要找到光谱类别与信息类别的 关系,把每一种光谱类别与信息类别对上号,或将光谱类别进一步区分为信息类别,才 能得到正确的分类结果乜副。 ( 3 ) 遥感图像的计算机分类 图像分类过程实际上是将图像中的每个像元点或区域归属于若干个类别中的一类, 或若干个专题要素中的一种,它完成将图像数据从二维狄度空间转换到目标模式空间的 工作。分类结果是将图像空间划分为若干个子区域,每个子区域代表一种实际地物。 常见的分类方法一般为统计模式识别的方法,如最大似然法、k 最近判别法等。近 年来蓬勃发展的分类新方法有人工神经网络方法、模糊数学方法、专家系统法、决策树 分类法、支持向量机法等心引。 监督分类和非监督分类 遥感图像的统计分类一般分为两种方法:监督分类和非监督分类。前者是基于对于 遥感图像上样本区内的地物的类属已有先验的知识,即已经知道它所对应的地物类别, 于是可以利用这些样本类别的特征作为依据来判断非样本数据的类别;后者则是遥感图 像地物的属性不具有先验知识,纯粹依靠不同光谱数据组合,在统计上的差别来进行“盲 目分类”,事后再对己分出各类的地物进行确认的过程。 分类处理与增强处理 图像增强处理与图像分类处理都是为了增强和提取遥感图像中的目标信息。图像增 强处理主要是增强图像的视觉效果,提高图像的可解译性。因此可以说,图像增强处理 给目视解译提供的信息是定性的。而图像分类则着眼于地物类别的区分,所以说图像分 类给目视解译提供的是定量信息。 6 2 传统遥感影像分类方法介绍 遥感图像分类处理的特点 多波段、多时相是遥感对地观测的特点之一,一景影像常常包含多个波段,周期性 的观测有时使得参加分类的遥感图像集中包含多个时相的图像,在遥感图像分类处理 时,波段之间的运算也可产生一些新的变量。因此,遥感图像分类是多变量的图像分类, 是把多维特征空间划分为互不重叠子空间过程,是在多维空间中进行的。 图像分类前,首先要对图像进行预处理,包括图像校正、图像增强以及特征选择等 过程。特征选择实际上就是确定分类的信息源。多光谱图像一般有波段多、数据量大等 特点,在分类时,特别是用最大似然分类方法,要对每一类计算均差和协方差矩阵,以 及判别式的比较,计算量是非常大的。实际上,并不是每一个波段都是分类时最好的信 息源,有时一些波段之间高度相关,因此,有选择地去掉一些分类贡献不大的波段,对 分类精度影响不大。在分类时所使用的波段或波段组合称为特征,所以,这个选择过程 称为特征选择。这种选择出来的、新的对于表示类别可分性更为有效的变量称为特征参 数,n 个特征参数组成n 维特征空间。 2 1 2 分类基本原理 遥感图像分类就是把图像中的每个像元或区域划归为若干类别中的一种,即通过对 各种地物的光谱特征分析来选择特征参数,将特征空间划分为互不重叠的子空间,然后 将影像内各个像元划分到各个子空间中去,从而实现分类。 如图2 2 所示,假设多光谱图像有n 个波段,则位置的像元在每个波段上的灰度值可 以构成一个矢量x = ( x 1 ,x 2 ,x 1 ) 1 ,x 称作该像元的特征值,包含x 的n 维空间称为特征 空间。这样n 个波段的多光谱图像便可以用n 维特征空间中的一系列点来表示。在遥感图 像分类问题中常把图像中的某一类目标称为模式,而把属于该类中的像素称为样本的观 测值,下面以两个波段的多光谱图像为例,说明遥感图像分类的基本原理啪1 。 波段1 波段2 波段n 图2 2 多波段多光谱图 如果将多光谱图像上的每个像素用特征空间中的一个点来表示,这样多光谱图像和 特征空间中的点集具有等价关系。通常情况下,同一地面目标的光谱特性比较接近,因 此在特征空间中的点聚集在该类的中心附近,多类目标在特征空间中形成多个点簇,如 图2 3 所示。 7 西安科技大学硕士学位论文 图2 3 多光谱图像分类原理 假设图像上只包含两类目标,记为a ,b 两个互相分开的点集,这样将图像中两类 目标区分开来,等于在特征空间找到一条曲线( 对于多光谱图像,需要找到若干个曲面 将a ,b 两个点集分割开。假如分割a ,b 两个点集的曲线表达式为厂一日( x ) ,则方程: 办从x ) = 0 称为a ,b 两类的判别界面。 在判别界面确定后,特征空间中的任意点是属于a 类还是属于b 类,根据几何知识 可知: 如果当办“x ) 0 时,x 属于a ,那么当办曰( x ) o 时,煸于b 。 式( 3 2 ) 称为判别准则,办文x ) 称为判别函数。遥感图像分类算法的核心就是确定判别函 数和响应的判别准则。 2 1 3 分类的一般步骤 遥感图像计算机分类处理的基本过程,如图3 4 所示,包括原始图像的预处理、训练 区的选择、特征选择和特征提取、分类、检验结构以及成果输出等。 l 原始图像预处理 上 l 训练区选择 士 i 特征选择与提取 上 分类 i 检验结果 0 l 成果输出 图2 4 遥感图像计算机分类处理流程图 8 2 传统遥感影像分类方法介绍 ( 1 ) 原始图像预处理 原始图像的预处理就是指对观测数据做成像处理,以及图像的几何纠正、辐射纠正、 量化、采样、滤波、去噪声等处理,以便获得一幅比较清晰、对比度强、位置准确的图 像以提高分类精度。 ( 2 ) 训练区选择 从待处理数据中抽取具有普遍性、代表性的数据作为训练样本。训练区选择得准确 与否、训练样本数量是否足够,关系到分类精度的高低。在监督分类中,训练区选择得 最好的办法是选择一、两个典型区域,各类地物都有,进行实地调查。调查时,对照实 地将分类影像一一识别,在图上标好,再到计算机上将这些数据提出。如果受客观条件 的限制,可以借助地图、航片或其他专题资料进行选择。在上述资料都没有的情况下也 可以先进行非监督分类,在分类结果中选择训练区。 ( 3 ) 特征选择和特征提取 特征选择是从众多特征中挑选出可以参加分类运算的若干个特征,如t m 影像波段 的选择。特征提取是在特征选择之后,利用特征提取算法从原始特征中求出最能反映其 类别特征的一组新特征,完成样本空间到特征空间的转换。通过特征提取既可以达到数 据压缩的目的,又提高了不同类别特征之间的可区分性。 ( 4 ) 图像分类运算 图像分类运算就是根据影像特点和分类目的设计或选择恰当的分类器及其判别准 则,对特征矢量进行划分,完成分类工作。图像分类阶段是计算机处理的核心阶段。 ( 5 ) 检验结果 主要是对分类的精度与可靠性进行评价。遥感信息由于受传感器、空间分辨率和光 谱分辨率等的限制,常常得到混合的信息。有时地物本身就是混合在一起的,例如植被 覆盖下的土壤,因此不存在理想的分类器,加上“同物异谱”、“异物同谱 现象的存 在,错分的情况普遍存在,所以分类后都必须进行检验,错分像元所占的比例越小,则 分类结果越佳啪) 。 ( 6 ) 结果输出 包括分类结果图像的输出以及分类结果的统计值,例如各类别的地物占地面积、类 别集群的统计值和方差等。 2 1 4 分类特征选取 设计一个模式识别系统,首先需要用各种可能的手段对识别对象的性质进 行测量,然后将这些测量值作为分类用的特征。对于遥感图像分类来说,其主要的分类 依据是地物的光谱特性,随着遥感技术的发展,通过各种方式获得的遥感图像不断增加, 例如t m 数据有7 个波段的图像,加上s p o t 卫星以及其他的遥感系统所获取的数据,能 9 西安科技大学硕士学位论文 够用于分类的图像数量是相当多的。尽管每一种图像都不同程度地包含新的信息,但是 就某些指定地物类别的分类而言,并不是全部的原始图像都有用。 如果将大量原始的测量数据不作分析,直接作为分类特征,不仅数据量太大,计算 复杂,浪费计算机处理时间,而且分类的效果也不一定好。在具体某一类别的区分过程 中,有些原始图像所提供的信息不仅对于这种分类特征多带来的分类效果下降现象,有 人称之为“特征维数灾难 。为了设计效果好的分类器,一般需要对原始的测量值进行 分析处理,经过选择和交换组成识别特征,在保证一定精度的前提下,减少特征维数, 使分类器的工作又快又准确。 特征处理的方法可以分为两大类,即特征选择和特征交换。所谓特征选择指的是从 原有的m 个测量值集合中,按某一准则选择出一个n 维( n 可以表示任何 函数集;l ( y ,f ( x ,w ) ) 为由于用f ( x ,w ) 对y 进行预测而造成的损失,不同类型的学 习问题有不同形式的损失函数。预测函数也称作学习函数、学习模型或学习机器。 有三类基本的机器学习问题,即模式识别、函数逼近和概率密度估计。 对模式识别问题,输出y 是类别标号,两类情况下y = o ,1 ) 或 l ,1 ) ,预测函数 称作指示函数,损失函数可以定义为 ,厂c x ,w ,2 t :至;二;:三:;: 。3 3 , 使风险最小就是b a y e s 决策中使错误率最小。在函数逼近问题中,y 是连续变量( 这 里假设为单值函数) ,损失函数可定义为 三( y ,厂( x ,w ) ) 2 一( x ,1 4 ) ) 2 , ( 3 4 ) 即采用最小平方误差准则。而对概率密度估计问题,学习的目的是根据训练样本确 定x 的概率密度。记估计的密度函数为p ( x ,w ) ,则损失函数可以定义为 l ( p ( x ,w ) ) = 一l o gp ( x ,w ) ( 3 5 ) 3 1 2 经验风险最小化 在上面的问题表述中,学习的目标在于使期望风险最小化,但是,由于我们可以利 用的信息只有样本( 3 1 ) ,( 3 2 ) 式的期望风险并无法计算,因此传统的学习方法中采 用了所谓经验风险最小化( e r m ) 准则,即用样本定义经验风险 r 雌p 缸) = 玉帆( x 州) ) , ”卢l ( 3 6 ) 作为对( 3 2 ) 式的估计,设计学习算法使它最小化。对损失函数( 3 3 ) ,经验风险就是 训练样本错误率;对损失函数( 3 4 ) ,经验风险就是平方训练误差;而采用损失函数( 3 5 ) 的e r m 准则就等价于最大似然方法。 事实上,用e r m 准则代替期望风险最小化并没有经过充分的理论论证,只是直观 上合理的想当然做法,但这种思想却在多年的机器学习方法研究中占据了主要地位。人 们多年来将大部分注意力集中到如何更好地最小化经验风险上,而实际上,即使可以假 定当n 趋向于无穷大时( 3 6 ) 式趋近于( 3 2 ) 式,在很多问题中的样本数目也离无穷 大相去甚远。那么在有限样本下e r m 准则得到的结果能使真实风险也较小吗? 1 5 西安科技大学硕士学位论文 3 1 3 复杂性与推广能力 e r m 准则不成功的一个例子是神经网络的过学习问题。开始,很多注意力都集中 在如何使r e m p ( w ) 更小,但很快就发现,训练误差小并不总能导致好的预测效果。某 些情况下,训练误差过小反而会导致推广能力的下降,即真实风险的增加,这就是过学 y - j ( o v e r f i t t i n g ) i h - 题。 之所以出现过学习现象,一是因为样本不充分,二是学习机器设计不合理,这两个 问题是互相关联的。设想一个简单的例子,假设有一组实数样本 x ,y ) ,y 取值在【0 ,1 】 之间,那么不论样本是依据什么模型产生的,只要用函数f ( x ,口) = s i n ( 口x ) 去拟合 它们( 口是待定参数) ,总能够找到一个口使训练误差为零,如图3 2 所示,但显然得到 的这个“最优函数 不能正确代表原来的函数模型。出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论