(计算机软件与理论专业论文)基于内容遥感影像检索技术研究.pdf_第1页
(计算机软件与理论专业论文)基于内容遥感影像检索技术研究.pdf_第2页
(计算机软件与理论专业论文)基于内容遥感影像检索技术研究.pdf_第3页
(计算机软件与理论专业论文)基于内容遥感影像检索技术研究.pdf_第4页
(计算机软件与理论专业论文)基于内容遥感影像检索技术研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机软件与理论专业论文)基于内容遥感影像检索技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着遥感影像数据的迅速增长,遥感影像数据库的规模也在迅速增加,如何 从众多的大型遥感影像数据库中,快速浏览和高效检索到感兴趣的目标影像,己 经成为遥感影像信息提取和共享的瓶颈难题。将基于内容的图像检索技术有效地 应用于遥感影像检索领域,具有重要的理论意义和实用价值。鉴于此,本文研究 基于内容的遥感影像检索技术。研究内容有: 1 ) 通过分析遥感影像检索中的一些特殊性,结合大量实验,重点研究适合于 遥感影像的特征提取和相似性度量技术。提出了一种综合图像主颜色和分块颜色 矩特征进行检索的新方法,有效提高了检索效率。分析了基于经典灰度共生矩阵 的纹理特征用于遥感影像检索时的不足,将改进的灰度平滑共生矩阵应用于遥 感影像的纹理分析中。并将构造的一组c r a b o r 滤波器用于遥感影像的纹理检索, 证明了该方法在遥感影像检索中具有很好的适用性。本文还分析了形状特征提取 在遥感影像检索中的必要性,探讨了图像的形状不变矩特征的提取方法,通过两 组实验,证明了不变矩特征用于遥感影像检索时,有较高的检索准确率。 2 1 研究了多特征融合检索中的相似性度量以及特征归一化等技术,并将其应 用于遥感影像的检索中,实践表明融合多种视觉特征的检索技术提高了检索效 率。 3 ) 研究了图像检索领域的相关反馈技术,针对本文中的特征融合检索,提出 了一种有效的基于向量空间模型中权值调整的相关性反馈算法,通过实验分析, 证明该方法具有高的反馈效率和准确率,有效提高了系统的检索性能。 4 ) 基于以上研究,本文设计实现了一个遥感影像检索原型系统,其中用到本 文诸多研究成果,具有良好的扩展性。 关键诃:基于内容的图像检索遥感影像特征提取特征融合相关反馈 a b s t r a c t w i t ht h er a p i dg r o w t ho f r e m o t es e n s i n gi m a g ed a t aa m o u n t ,t h es c a l eo f r e m o t e s e n s i n gi m a g ed a t a b a s ei n c r e a s e sr a p i d l y h o wt oq u i c k l yb r o w s ea n de f f i c i e n t l y r e t r i e v et h et a r g e ti m a g e sf r o mt h ed a t a b a s eo fl a r g e - s c a l er e m o t es e n s i n gi m a g e s b e c o m et h eb o t t l e n e c ki nr e m o t es e n s i n gi m a g ei n f o r m m i o nr e t r i e v a la n ds h a r i n g i t h a sv e r yi m p o r t a n tt h e o r e t i c a la n dp r a c t i c a lv a l u et ou s et h ec o n t e n t - b a s e di m a g e r e t r i e v a lt e c h n o l o g yi nt h er e m o t es e n s i n gi m a g er e t r i e v a lf i e l d i nv i e wo ft h i s ,t h i s t h e s i sr e s e a r c h e st h et e c h n i q u eo fc o n t e n t - b a s e dr e m o t es e n s i n gi m a g er e t r i e v a l t h e c o n t e n to f t h e s t u d yw i l lb es h o w n a sf o l l o w : 1 ) b ya n a l y z i n gt h ec h a r a c t e r i s t i c so f r e m o t es e n s i n gi m a g er e t r i e v a l ,t h ef e a t u r e e x t r a c t i o na n ds i m i l a r i t ym e a s u r 即f l e n tt e c h n o l o g ya r es t u d i e dt h r o u g hal o to f e x p e r i m e n t s an e wr e t r i e v a lm e t h o dw h i c hi n t e g r a t e st h ed o m i n a n tc o l o rf e a t u r ea n d s e g m e n tc o l o rm o m e n t si sp r o p o s e d a n di tc a ne n h a n c et h er e t r i e v a le f f i c i e n c y a f t e r a n a l y z i n gt h es h o r t a g eo ft h et e x t u r ef e a t u r eb a s e do nc l a s s i cc o - o c 圮u r r e n e om a t r i x , t h ei m p r o v e dg r a y - s m o o t hc o - ( o c u l t e n c em a t r i xi sp r o p o s e dt ou s ei nt h ea n a l y s i so f r e m o t e s e n s i n gi m a g e s f u r t h e r m o r e ,ag r o u p o fg a b o rf i l t e r sa r eu s e di n t e x t u r e - b a s e dr e m o t es e n s i n gi m a g er e t r i e v a l i ti sp r o v e dt h a tt h em e t h o dh a sa g o o d a p p l i c a b i l i t y t h i st h e s i sa l s oa n a l y z e st h en e c e s s i t yo f t h es h a p ef e a t u r ee x l r a c t i o ni n r e m o t es e n s i n gi m a g er e t r i e v a l a n dt h ee x t r a c t i o nm e t h o do ft h em o m e n ti n v a r i a n ti s p r e s e n t e d t h ee x p e r i m e n t so ft w og r o u p si n d i c a t et h a tt h em e t h o di se f f i c i e n ti n r e m o t es e n s i n gi n l a g er e t r i e v a l 2 ) t h et e c h n i q u e so ff e a t u r ef u s i o n , i n c l u d i n gs i m i l a r i t ym e a s u r e m e n ta n d n o r m a l i z a t i o no ff e a t u r e sa n ds oo n , a r es t u d i e d a n dt h e s et e c h n i q u e sa l ea p p l i e dt o r e m o t es e n s i n gi m a g er e t r i e v a l t h ee x p e r i m e n t si n d i c a t et h a tt h et e c h n i q u eo f c o m b i n i n gk i n d so f f e a t u r e si ni m a g er e t r i e v a lc a na c h i e v eg o o de f f e c t s 3 1r e l e v a n c ef e e d b a c kt e c h n i q u e sw h i c ha r er e l a t e dt ot h ei m a g er e t r i e v a la r e s t u d i e d ar e l e v a n c ef e e d b a c ka l g o r i t h mb a s e do i lw e i g h ta d j u s t m e n ti nt h ev e c t o r s p a c em o d e l ,w h i c hi sa i m e dt ot h ef e a t u r e s i n t e g r a t e ds e a r c hi s p r o p o s e d a f t e r e x p e r i m e n t a la n a l y s i s , i ti sp r o v e dt h a tt h i sm e t h o dc a ni m p r o v et h es 3 s t e m p e r f o r m a n c ew i t hh i g hf c e d b a c ke f f i c i e n c ya n da c c u r a c v 4 ) b a s e do nt h ea b o v e ,t h i st h e s i sc o n s t r u c t sap r o t o t y p er e m o t es e n s i n g i m a g er e t r i e v a ls y s t e m ,w h i c ht a k e sa d v a n t a g eo f m a n yr e s e a r c hr e s u i t si nt h i s t h e s i sa n dh a sb e t t e rs c a l a b i l i t y 1 ( e y r o r 凼:c o n t e n t - b a s e di m a g er e t r i e v a l ( c b i r ) ,r e m o t es e n s i n g i m a g e f e a t u r e e x t r a c t i o n ,f e a t u r ef i l s i o i lr e l e v a n c ef e e d b a c k m 西北大学学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻读学位期 间论文工作的知识产权单位属于西北大学。学校有权保留并向国家有关部门或 机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。学校可以将本 学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存和汇编本学位论文。同时,本人保证,毕业后结合学位论 文研究课题再撰写的文章一律注明作者单位为西北大学。 保密论文待解密后适用本声明。 学位论文作者签名:j ;! 裨 指导教师签名:碰 埘年,月,日年口月,上日 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工作及 取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,本 论文不包含其他人已经发表或撰写过的研究成果,也不包含为获得西北大 学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:前痹咩 溯年二月,罗日 西北大学硕士学位论文第1 章绪论 第1 章绪论 1 1课题背景及研究意义 本课题源于“十一五”国家科技支撑计划重点项目“综合风险防范( i r g ) 关 键技术研究与示范”( 2 0 0 6 b a d 2 0 8 0 2 ) 。 随着航空航天技术、传感器技术、网络技术、数据库技术的飞速发展,可获 取的遥感影像数据正在以惊人的速度( 指数级) 急剧增长,例如,陆地卫星 ( l a n d s a t ) 两星期内就可以将全球拍摄一遍;美国宇航局( n a s a ) 实施的地球行 星项目每天可以产生1 0 0 0 g b 的数据。遥感影像数据的迅速增长为其在环境监测、 灾害管理、森林预警、农情监测、城市规划等众多领域日益广泛的应用创造了非 常有利的前提条件。然而,如何从众多的大型遥感影像数据库中,快速浏览和高 效检索到感兴趣的目标仍然是一件繁琐、艰难的工作,己经成为遥感影像信息提 取和共享的瓶颈难题。 早在2 0 世纪7 0 年代,数据库专家就开始研究如何对图像数据进行有效的管 理,其主要方法是基于文本的图像检索f l 】,即对于图像库中的每一幅图像,需要人 工对其提前进行归纳和注释,图像检索完全依赖于图像的名称、编号、人工注释 等信息。传统的图像检索方法有两个难以克服的缺点:一是每一幅图像都需要人 工进行注释,因此,较大的图像数据库需要大量的人力;二是人工注释具有很强 的主观性,即使对于同一幅图像,不同人有着不同的看法,而且,一旦人工注释 完成就很难更新和改变。因此,有限的、固定的人工注释很难满足不同用户的需 求。 基于内容的图像检索( c o n t e n t - b a s e di m a g er e t r i e v a l ,c b 取) 技术正是在这种 背景下,成为近年来国内外图像数据库技术研究中的一个新的热点【2 1 ,它克服了 传统的基于文本的图像检索中人工标注效率低、主观性强等缺点,有着广泛的应 用前景,并将成为2 l 世纪必须攻克的关键技术之- - 3 1 。 所谓基于内容的图像检索,是指根据图像中物体( 或区域) 的颜色、形状、纹 理、空间位置关系等特征以及这些特征的组合来查询图像。这项技术既充分体现 了图像的信息特点,又充分结合了传统数据库技术。事实上,基于内容的图像检 l 西北大学硕士学位论文基于内容遥感影像检索技术研究 索技术已经得到了非常广泛的应用,如:知识产权保护、新一代网上搜索、犯罪 与安全预防、医学和遥感影像的分析和处理、远程教育以及个人相册管理等方面。 基于内容的遥感影像检索技术可以克服传统图像检索的低效率、主观性及工 作量大等缺点,有助于满足不具备特殊领域知识( 如遥感、医学等) 的非专业人员 使用,研究将其应用于遥感影像的检索实践中,可为遥感数据的管理提供一种新 的处理手段和方向,对于促进遥感影像信息提取和共享的简单化和高效化,具有 十分重要的理论意义和实用价值。 1 2基于内容的遥感影像检索技术研究现状 基于内容的遥感影像检索是遥感影像处理、图像数据库技术、计算机视觉、 模式识别等领域相结合的国际前沿课题。近十余年来,人们对于基于内容的图像 检索技术开展了深入的研究 4 - 8 1 ,并且已经取得了一些有目共睹的进展,在某些 领域的应用有了一些阶段性成果。然而专门针对遥感影像的研究进展却相对缓 慢,无论是理论体系还是应用系统,都远不成熟。目前绝大多数遥感影像库检索 系统仍然仅提供了文本方式的查询接口。将c b r 应用于遥感影像检索领域仍然 是遥感影像处理和管理领域的一个研究热点和难点【 ”。 这主要是遥感影像自身的特殊性造成的。与普通图像如邮票、商标以及医学 图像相比,遥感影像更复杂、变化更大,遥感影像库通常是由不同波段、不同分 辨率、不同时相、不同尺度和不同测量手段等情况下遥感观测到的多源空问数据 组织成的多源遥感数据库,遥感影像数据的多样性、复杂性、海量性和多种检索 的应用需求等特点都对基于内容的遥感影像检索技术提出了更高的要求。这些构 成了研究基于内容的遥感影像库检索的意义和难点所在,从根本上决定了基于内 容的遥感影像库检索不同于基于内容的图像检索技术在普通多媒体和医学等其 它领域的应用,一些目前研究相对广泛、且普遍适用于多媒体领域( 包括风景、 动植物、商标、邮票、机器部件等) 和医学领域的数据模型及相关技术不能简单 直接地应用于基于内容的遥感影像库检索中。因此,研究基于内容的遥感影像库 检索涉及的各项关键技术势在必行。 2 西北大学硕士学位论文第1 章绪论 1 3本论文主要研究内容及组织 1 3 1 研究内容 综上所述,研究基于内容检索在遥感影像数据库中应用的各项关键技术仍处 于起步阶段。结合项目和个人的实际情况,本文的研究主要围绕以下几个方面展 开: 1 ) 总结基于内容的图像检索的特点及其所涉及的各项关键性技术,分析其应 用于遥感影像检索中的一些特殊性。 2 ) 针对遥感影像自身的特点,本文着重研究各种适合于遥感影像的影像特征 提取算法和检索算法。通过提取各种颜色、纹理和形状特征进行基于内容的遥感 影像检索,并对部分算法进行改进,提出一些创新性思想,将其应用于基于内容 的遥感影像检索原型系统中。 3 ) 研究多特征融合检索中的相似性度量以及特征归一化等技术,将其应用于 遥感影像的检索中。 4 ) 研究图像检索领域的相关反馈技术,针对本文中的多特征融合检索,提出 有效的相关性反馈算法积累用户评价,优化检索,使系统能够更准确的满足检索 需求。 5 ) 基于以上研究,设计实现一个遥感影像检索原型系统,方便地实现本文中 介绍的各种检索算法以及相关反馈算法,并对其中的各种算法进行性能评价和度 量。 1 3 2 论文组织 本文共分为五个章节: 第一章:绪论,介绍论文的选题背景、研究意义、相关领域的国内外研究现 状和论文的主要研究内容及组织结构。 第二章:基于内容的遥感影像检索技术分析,总结基于内容的图像检索技术 的特点及其所涉及的部分关键技术。通过分析遥感影像的特征,探讨基于内容的 图像检索技术在遥感领域应用的特殊性及相应的解决办法,同时,研究遥感影像 检索中的预处理技术和图像分解技术。通过大量实验,重点研究适合于遥感影像 3 西北大学硕士学位论文基于内容遥感影像检索技术研究 检索的视觉特征提取和相似性度量方法,并提出一些创新性算法,给出特征向量 的归一化算法。 第三章:基于特征融合和相关反馈技术的遥感影像检索技术研究,本章主要 研究图像检索中的多特征融合和相关反馈算法。在第二章中所介绍的各种特征提 取技术的基础上,提出了综合颜色、纹理和形状特征的遥感影像检索技术,给出 了各特征向量间的相似性度量和归一化算法。最后,针对文中的特征融合检索, 提出了一种有效的基于向量空间模型中权值调整的相关性反馈算法,通过实验分 析,证明该方法具有高的反馈效率和准确率,有效提高了系统的检索性能。 第四章:遥感影像检索原型系统的设计及实现,介绍在论文研究基础上开发 的一个原型系统的基本情况,该系统具有良好的扩展性。 第五章:总结与展望,对全文做了一个总结,客观地评价了作者的研究工作 及取得的成果,同时展望了进一步开展研究所需要的工作。 4 西北大学硕士学位论文第2 章基于内容的遥感影像检索技术分析 第2 章基于内容的遥感影像检索技术分析 本章中具体研究如何将基于内容的图像检索技术应用于遥感影像的检索中。 在分析遥感影像检索中的一些特殊性的基础上,着重研究适合于遥感影像检索的 特征提取和相应的相似性度量技术。 2 1基于内容的图像检索 2 1 1 基于内容图像检索的特点及系统结构 所谓基于内容的图像检索( c o n t e n tb a s e di m a g er e t r i e v a l ,c b i r ) 是指由软件 对图像进行自动分析,根据图像中物体或区域的颜色( c o l o r ) 、形状( s h a p e ) 或纹理 ( t e x t u r e ) 等底层视觉特征以及这些特征的组合,作为特征向量存入图像特征库; 在进行图像检索时,对每一幅给定的查询图像进行图像分析,提取特征向量,利 用相似性匹配算法计算查询示例图像与特征库中图像特征向量的相似度,根据相 似度的大小输出检索结果。基于内容的图像检索技术的主要特点有: 1 ) 从媒体内容中提取信息线索。基于内容的检索突破了传统的基于表达式检 索的局限,利用图像内容特征建立索引进行检索。 2 ) 基于内容的图像检索,由于内容表达的不精确性,必然是一种近似的检索, 结果中往往出现误检和遗漏。 3 ) 大型数据库的快速检索。在实际的多媒体数据库中,不仅数据量巨大,而 且种类和数量繁多,因此要求c b i r 技术快速的实现对多媒体信息的检索。 4 ) 作为一种多媒体技术,它具有很强的交互性,即用户可以参与检索过程。 典型的基于内容的图像检索系统的结构如图2 1 所示: 1 ) 图像获取,即获取图像组成图像库,包括图像格式及大小转换等预处理功 能。 2 ) 特征提取,即提取图像的颜色、形状及纹理等特征作为特征向量存入图像 特征库。 3 ) 数据库由图像库和特征库组成。 4 ) 查询接口,即根据用户的查询要求,选择合适的检索方法及参数设定。 5 西北大学硕士学位论文基于内容遥感影像检索技术研究 图2 1 基于内容图像检索系统结构 5 ) 图像检索,即利用相似性距离函数将示例图像的特征与特征库中的对应特 征进行相似性匹配来进行相似性检索。 6 ) 结果显示,即将与示例图像最相似的图像按照相似程度由大至小排列输 出。 基于内容的图像检索技术的关键在于特征提取,以及在图像特征基础上进行 的相似性匹配算法,它是计算机图像处理、图像理解、计算机视觉、模式识别和 数据库技术的有效结合【1 2 】。 2 1 2 图像的视觉特征 图像特征的提取与表达是基于内容的图像检索技术的基础。在图像检索中, 通常所说的视觉特征是指用于描述所有图像共有的特征,与图像的具体类型无 关,主要包括色彩、纹理、形状以及结构等。通常,有多种不同的表达方法用以 表达特定的图像特征。由于人们主观认识上的千差万别,对于某个特征并不存在 一个所谓的最佳的表达方式。事实上,图像特征的不同表达方式从各个不同的角 度刻画了该特征的某些性质。 2 1 3 图像检索中的相似性度量 图像相似性度量是图像检索中的一个关键步骤,在基于内容的图像检索当 中,查询的结果是按照相似程度排列的一系列的图像。通常基于图像特征相似性 的度量可分为几何矩阵模型和集合理论模型。 1 ) 几何矩阵模型: 由于图像的视觉特征大多可以表示成向量的形式,故常用的相似性度量方法 6 西北大学硕士学位论文第2 章基于内容的遥感影像检索技术分析 都是向量空间模型( v e c t o rs p a c em o d e l ) ,即将视觉特征看作是向量空间中的点, 通过计算两个点之间的接近程度来衡量图像特征间的相似度,进而计算两幅图像 之间的相似程度。以下是目前常用的几种基于该模型的距离度量方法: l l 距离和k 距离 如果图像特征的各分量之间是正交无关的,而且各维度的重要程度相同,两 个特征向量a 和b 之间距离可以用l 1 距离或者l 2 距离( 也称为欧拉距离) 来度量。其 中l l 距离定义如式( 2 一1 ) : d i = a i - b l l “ ( 2 1 ) 其中n 是特征向量的维数。类似地,k 距离可定义如式( 2 2 ) : d 22 “一e ) 2 ( 2 - 2 ) 欧拉距离是一个应用非常普遍的距离度量,计算简单,且与参考系统的旋转 不变量相关。当考虑不同维特征分量具有不同重要性时,则使用加权欧拉距离, 定义如式( 2 - 3 ) : d 22 翱4 一e ) 2 ( 2 3 ) 直方图相交 上述两种距离度量方法常用来计算颜色直方图之间的距离。度量直方图距离 的另一种方法是直方图相交( h i s t o g r a mi n t e r s e c t i o n ) 。假设i 和q 是两个含:f i - n + b i n 的颜色直方图,则它们之间的相交距离定义如式( 2 4 ) : m i n ( i j ,g ) ( 2 - 4 ) l l 直方图的相交是指两个直方图在每个b i n 中共有的像素数量。有时,该值还 可以通过除以其中一个直方图中所有的像素数量来实现标准化,从而使其值属于 【0 ,1 】的值域范围。 m i n k o w s k y 距离 m i n k o w s k y 距离是一个距离函数系列,其定义如式( 2 5 ) : 几r 一 肚1 善”垦1 9 ( 2 4 ) 在个别维数中,可利用非负权重万;进行不同的加权计算。其数学表达式如 式( 2 6 ) : 7 西北大学硕士学位论文基于内容遥感影像检索技术研究 m a h a l a n o b i s 距离 又称为马氏距离。它是一个计算复杂的权重欧几里德距离。它根据一个协方 差矩阵c 来定义,如式( 2 7 ) : d = ( 4 一旦) 7 c 。( 4 ,一e ) ( 2 - 7 ) c 。1 是c 的协方差逆矩阵,如果c 是恒等矩阵,那么距离就变成欧几里德距离 了。 2 ) 集合理论模型: 在实践过程中,许多人发现距离度量方法与人对相似性的感知判断之间存在 一定差距,相似性度量中的正定性、对称性和三角不等性度量公理也同样存在一 些争议。因此又提出了集合理论模型。在这类模型中最著名的就是特征对照模型, 可表示如式( 2 8 ) : s ( a ,b ) = f ( a n 曰) 一万( 4 一曰) 一( 曰一4 ) ( 2 - 8 ) 其中a ,b 分别为对象a ,b 的特征集合,伪单调递增函数,用来反映特征的 显著性,衡量指定特征对相似性的贡献。上式表示对象a b 的相似性是特征值与 不同特征的函数值之差。很显然,上式不具备对称性特点。实验表明这种模型能 够较好的描述人类对相似性的判断。但是这种模型的致命缺点是可计算性太差, 不适合在计算机上应用。目前,如何将两种方法结合起来使计算机能更好的模仿 人类对相似性进行判断,引起了人们的关注【”】。 2 1 4 检索算法的评价准则 对于特定的图像库,需要选择一种或多种最有效的图像特征和相似度算法。 这需要对不同条件下的检索效果进行全面地评价,比较不同方法的优劣,找出最 有效的方法。对于有效性的评价可以从两个方面来考虑:一是人的主观感受;二 是有一个量化的评价标准,但是人的主观感受由于受其主观性和个体性的影响, 很不容易把握,因此量化的评价标准是一种较直观,且具有通用性的检索有效性 的评价方法。随着图像检索技术研究的深入,研究者们提出了若干公认的图像检 索算法的评价准则【1 4 - 1 8 1 。 1 ) 查全率和查准率 8 眄 = d 西北大学硕士学位论文第2 章基于内容的遥感影像检索技术分析 查全率与查准率是信息检索中的标准评价方法,现在已被越来越多地使用在 基于内容的图像检索当中。q b i c q b 就使用了该方法。 以下用图2 2 的a ,b ,c ,d 的关系来说明检索过程的查全率和查准率: 图2 2a + 6 + c + d = qa + c = a + b = 矗 图2 2 中,q 为整个图像数据库,集合a 代表相关图像的集合,集合口代表检 索出的图像集合,则查准率和查全率可分别表示如式( 2 9 ) 和( 2 - 1 0 ) : 查准率p 叫= 訾= 南 查全率r = p ( b i a ) - 訾= 熹 ( 2 - 1 0 ) 用户在评价查询结果时,可以预先确定某些图像作为查询的相关图像,然后 根据系统返回的结果来计算查准率和查全率。这两个指标的值越高说明检索方法 的效果越好。可以看出,查全率反映检索的全面性,而查准率则反映检索的准确 性,因此可以用查全率和查准率来评价系统的有效性。 2 ) 排序值评价法 设q 为一幅查询图像,g l , g :,晶为图像检索算法输出与q 相关的且从主观 上认为相似的图像,r a n k ( g ;) ,i = 1 , 2 ,万是它们在检索结果中对应的排序值,则 定义如式( 2 11 ) 和( 2 1 2 ) 两个衡量检索算法的性能的指标: ( i ) a v e r a g e ,一m e a s u r e = 去朋础慨) ( 2 1 1 ) 以百 ( 窑) a v e r a g e p 一所哪腓= 三n 争智上r a n k ( g i ) ( 2 - 1 2 ) 其中,第一个指标定义了所有相关图像在检索结果中的平均排序,显然,此 指标越小,检索算法的准确率越高。第二个指标定义了所有相关图像在靠前排列 的紧密程度,此值越大越好,如果所有的相关图像都排在最前面,则此指标取值 为1 。 另外还有一些系统中采用了基于“开销时间”的比例的评价标准( 时间是指 找到正确图像所需的时间) ;m p e g - 7 也提供了一个检索评价尺度a n m r r ( a v e r a g e 9 西北大学硕士学位论文基于内容遥感影像检索技术研究 n o r m a l i z e d m o d i f i e d r e t r i e v a lr a n k ) 1 1 9 】。“u 等捌也提出了一种图像检索性能评价标 准的建立方法,通过人工方法获得g r o u n d t r u t h ,然后定义量化的评价方法。这项 工作可以看作是m p e g - 7 在这方面的补充。 2 2 基于内容的图像检索技术在遥感影像中应用的一些特殊性 自c b r 思想提出以来,它已经在医学图像、多媒体等领域取得了大量研究 成果,并在一些原型和商业系统中得到成功应用。然而专门针对遥感影像的研究 却相对较少,究其原因,遥感影像库实际上是一个空间数据库,遥感影像数据的 多样性、复杂性和海量性等特点从根本上决定了基于内容的图像检索技术应用于 遥感领域时,在影像数据的组织、特征描述、相似性匹配等方面都有其不同于普 通多媒体和医学等领域的特殊性。一些目前研究相对广泛、且普遍适用于多媒体 领域( 包括风景、动植物、商标、邮票、机器部件等) 和医学领域的数据模型及相 关技术不能简单直接地应用于基于内容的遥感影像库检索中。通过查阅大量相关 文献,总结了c b r 应用于遥感影像的一些特殊性,主要包括以下几个方面: 1 ) 遥感影像具有数据量大( 一幅单波段图像的数据量大都超过1 0 0 m ) 的特点, 因此,合理地组织存储图像数据是有效读取和检索图像的关键,遥感影像的这些 特点也决定了遥感影像的检索任务大多是面向子图像的检索。因此需在一般图像 检索研究的基础上,设计遥感影像的分解策科”1 。 2 ) 由于影像之间可能存在旋转关系,因此需要提取一些计算简单的,具有旋 转不变性质的影像特征作为检索标准;由于遥感影像的采集平台、拍摄方位、拍 摄距离、气象条件很难保持多次一致性,所以提取对图像偏移、旋转、对比度变 化、尺度变化等具有恒定性的特征在遥感影像检索领域就具有很强的实用性。 3 ) 对于遥感影像,除了可以像普通图像检索一样进行特征提取外,还需要综 合考虑元数据,如地理位置、波段、不同传感器参数和比例尺等因素与图像内容 的关系,以及考虑遥感影像幅面大、细节多而涉及到的存储开销和查询效率等问 题。 4 ) 对于多媒体和医学领域的图像,图像中的主要纹理或对象构成了图像的主 体,所计算出的图像特征就反映了图像中主要对象的特征【2 扪。而遥感影像作为 1 0 西北大学硕士学位论文第2 章基于内容的遥感影像检索技术分析 对地球表面地理现象的一种描述,不存在明显的主题信息,单纯利用颜色特征或 颜色布局特征( 如全局统计特征如直方图等) 对于遥感影像而言缺乏足够的内容 表达能力。目前人们普遍认为纹理特征是遥感影像的识别和分析中最为基本和最 为重要的特征之一,因此对于基于内容的遥感影像检索的研究成果主要集中在遥 感影像纹理特征的描述和提取,具体方法包括g a b o r 滤波器、小波变换等。 5 ) 由于遥感影像数据量比较庞大,图像内部结构复杂,将其所有特征都进行 描述和存储的开销太大,所以通常在遥感影像检索系统中,通过建立典型特征库 以缩小特征数据量。这是一般的图像检索系统如q b i c 等通用系统所没有的, q b i c 中的检索是直接在整个特征数据索引上进行的。 6 ) 遥感影像检索系统在查询方式上,通常采取两步查询策略:先根据用户提 供的元数据在元数据库中进行搜索,得到一个图像的候选集,对用户给出的查询 样例计算其特征,然后在已经被元数据搜索所缩小的特征空间中搜索相似的特征 类型,从而根据特征库与图像库的连接关系找到相应的图像。 2 3多源遥感影像的预处理及分块组织 2 3 1 遥感影像的预处理 由于空间传感器所固有的畸形和噪声等特性,空间影像图像必须要经过预处 理后才能被有效地加以利用。多源影像数据预处理涉及到许多方面,包括:1 ) 数据的校正,例如几何校正,正射校正等。2 ) 数据的还原与降噪,降维,数据转 换和抽取等。例如空间图像的降噪,空间数据降噪等。3 ) 图像的均衡化,例如彩 色空间图像灰度化,空间图像灰度直方图,空间图像反色,空间图像反差调整, 空间图像平滑,空间图像锐化等。 对于多波段遥感影像,由于影像的不同波段之间往往存在着很高的相关性, 从直观上看,就是不同波段的影像很相似,因而从提取的有用信息的角度考虑, 有相当大一部分数据是多余和重复的。处理多波段数据常用到主成分分析( p c a , p r i n c i p a lc o m p o n e n ta n a l y s i s ) ,它在遥感影像处理中又称作k - l 变换。k - l 变换的 作用就是保留主要信息,降低数据量,从而达到增强或提取某些有用信息的目的 【2 3 1 。其基本原理是由原图像矢量的协方差矩阵求出一个变换矩阵,经变换形成新 西北大学硕士学位论文基于内容遥感影像检索技术研究 的主分量波段,它可以更准确、更具代表性地揭示多波段数据结构内部的地学信 息。k - l 变换着眼于变量之间的相互关系,尽可能不丢失主要信息,用少量综合 指标( 汇集多个变量的测量值) 进行描绘的方法。把p 个变量( p 维) 的测量值汇集 于m 个( m 维,m p ) 主成分。 在多光谱图像中,由于各个波段的数据间存在相关的情况很多,通过采用 k - l 变换可以把图像中所含的大部分信息用少数波段表示出来,不丢失主要信 息,但数据量大大减少。多源遥感影像数据库中的图像可能来自不同传感器、由 不同波段组成,为了提取多波段遥感数据的特征,可以通过k - l 变换将多波段图 像转化为单波段图像。 2 3 2 遥感影像数据的分块组织 遥感影像数据合理有效的分块组织策略是影响到遥感影像数据库基于内容 检索精度的一个不可忽视的重要因素【1 1 】,主要有以下两个方面的原因:1 ) 遥感影 像具有数据量大的特点。因此,合理地组织存储图像数据是有效读取和检索图像 的关键。2 ) 在基于内容的遥感影像库检索中,目标影像往往是空间无缝、包含多 个复杂目标的大幅面影像,而查询影像则一般仅包含一种或少数几种纹理特征并 且尺寸较小,在查询影像的纹理特征和目标影像的整体纹理特征之间做相似性比 较是没有意义的,基于内容的遥感影像库检索实际上是查询影像和目标影像局部 区域之间的相似性比较。因此,合理、有效地图像分块组织对遥感影像检索系统 是很有必要的,需在一般图像检索研究的基础上,设计遥感影像的分解策略,通 过分解处理提高其特征向量表达特定目标的能力。 目前常用的遥感影像数据分块方法包括t i l e 分块、g u a d 树t 2 4 1 、q u i r t - 树结构 分块等。t i l e 和g u a d 树分块组织方法采用不重叠区域分块技术。t i l e 分块的思想 是将遥感影像库的目标影像从左至右、从上至下分成规则、不重叠且大小相等的 子图像块( 例如2 5 6 x 2 5 6 ,1 2 8 x 1 2 8 ,6 4 x 6 4 等) 。g u a d 树结构是基于空间划分组织数 据的一类索引机制,常用于对海量栅格数据建立空间索引。它将己知范围的空间 划分为四个大小相等的子空间,如果需要可以将每个或其中几个子空间继续划分 下去。g a u d - 树结构在图像纹理特征检索方面已有应用。通过g a u d 树分解创建纹 理特征库的具体步骤【1 l 】是:对于如图2 3 所示的g a u d - 树结点,首先设定一个距离 西北大学硕士学位论文第2 章基于内容的遥感影像检索技术分析 阈值,计算父结点预备切分得到的四个子结点两两之间的所有距离( 1 和2 ,2 1 4 , 4 1 3 ,3 1 1 ,l 和3 ,2 1 4 ) ,如果不满足所有距离值都小于距离阈值的情况,那 么继续划分这个父结点,否则,不再继续划分,记录该父结点为一个叶子结点。 i2 34 圈2 3g u a d - 柱j 结点 对以上过程进行递归,直到满足以下列出的任一结束条件:1 ) 子图像块的尺 寸小于某个预设尺寸阈值( 如6 4 x 6 4 或3 2 x 3 2 ) ;2 ) 子图像块之间的距离小于某个 距离阈值;3 ) g a u d 树分解级数达到某个阈值条件。 g a u d 一树创建完成后,提取g a u d - 树的所有叶子结点的纹理特征建立纹理特征 库,纹理特征向量与g a u d - 树的叶子结点所表示的子图像块一一对应。图2 4 为从 一幅s p o t5 遥感影像上截取的2 5 6 x 2 5 6 大小的子图的分解效果图,约束性条件为 子图像块的尺寸等于1 6 x1 6 时不再继续划分。g a u d - 树第k 级分解,可以产生的最 大子图像块的个数为4 个。g u a d 树结构在图像纹理特征检索方面已有应用。由 图可见,g u a d 树分解建立的纹理特征库在一定程度上实现了遥感影像基于纹理 同质区域的分割,且减少了特征库中向量的个数。 图2 4g u a d 树分解效果图 这两种分块组织方式非常简单直观,便于采用已经成熟的商用数据库管理系 统( 如m i c r o s o f ts q ls e r v e r ) 管理分块遥感影像数据。但是由于它们都采用了不重 叠分块策略,当查询影像的范围同时覆盖多幅相邻但具有不同纹理特征的图像区 域时,检索精度很低。e d w a r dr e m i a s 和gs h e i k h o l e s l a m i 等人t 2 5 】提, m , n o n a - t r e e 结 构以及将n o n a - t r e e 结构应用于图像纹理检索的思想,并对包括n o n a - t r e e 分解产生 1 3 西北大学硕士学位论文基于内容遥感影像检索技术研究 的最大子图像块数和查询影像被目标影像区域覆盖的面积在内的参数进行了分 析,提高了检索精度。 2 4基于颜色特征的遥感影像检索 图像的颜色特征是对图像灰度分布的描述方法,是图像非常重要的视觉特 征。相对于几何特征而言,颜色具有一定的稳定性,其对缩放、平移、旋转具有 相当强的鲁棒性。因而利用颜色特征进行图像检索受到重视,并最早得到利用。 在遥感影像中,地物的电磁波辐射能量及变化在图像上表现为图像的灰度( 又称 亮度) 及其变化,灰度是地物电磁波辐射能量大小的直接反映,是地物识别的重 要依据。不同的地物亮度值存在差异,例如在s p o t 3 图像上,植物的灰度值大于 水的灰度值。因此,本文中分别提取了描述图像灰度分布的各种颜色特征,并通 过实验分析了其在遥感影像中的适用性。 2 4 1 颜色空间和颜色特征的表达 颜色是图像视觉中最重要的感知特征之一,也是应用中最为广泛的视觉特 征。相对于其它各种视觉和几何特征,颜色特征具有大小、方向和旋转不变性, 有较高的鲁棒性,因此颜色是描述图像最有效的特征之一。目前颜色特征的提取 方法主要有:颜色直方图、颜色矩、颜色集、颜色聚合向量及颜色相关图等表示 方法。对图像颜色特征的表达涉及到若干问题。首先,需要选择合适的颜色空间 来描述颜色特征;其次,要采用一定的量化方法将颜色特征表示为向量的形式。 2 4 1 1 颜色空间 通常要选择一定的颜色表达方式来表示图像的颜色特征,而某个颜色表达方 式又依赖于特定的颜色模型。换句话说,当一个颜色表达方式定义在某个颜色空 间上时可能有比较好的检索效果,而定义在其它颜色空间时效果可能较差,所以 颜色空间和颜色特征的表达方式十分重要。 最常用的颜色空间是r g b 颜色空间,原因在于大部分的数字图像都是用这 种颜色空间表达的。然而,r g b 空间结构并不符合人们对颜色相似性的主观判 断。因此,有人提出了基于h s v 空间、l u v 空间和l a b 空间的颜色直方图, 1 4 西北大学硕士学位论文第2 章基于内容的遥感影像检索技术分析 因为它们更接近于人们对颜色的主观认识。其中h s v 空间是直方图最常用的颜 色空间。它的三个分量分别代表色彩( h u e ) 、饱和度( s a t u r a t i o n ) 和值( v a l u e ) 。 从r g b 空f 至i h s v 空间的转化公式如式( 2 1 3 ) 至u 式( 2 一1 8 ) : v2 m a x ( r ,g ,6 ) ( 2 1 3 ) j = 【v m i n ( r ,g ,b ) l ”( 2 - 1 4 ) h = 5 + 6 矿,= m a x ( r ,g ,b ) a n d g = m i n ( r ,g ,6 ) 1 一g 。矿r = m a x ( r ,g ,b ) a n d g m i n ( r ,g ,6 ) l + 7 矿g 2 m 缸( ,g , b ) 4 ”d 62 m i n ( r ,g ,6 ) ( 2 - 1 5 ) 3 一b 。 矿g = m a x ( r ,g ,6 ) a n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论