(计算机应用技术专业论文)基于颜色特征的图像检索方法的研究及系统实现.pdf_第1页
(计算机应用技术专业论文)基于颜色特征的图像检索方法的研究及系统实现.pdf_第2页
(计算机应用技术专业论文)基于颜色特征的图像检索方法的研究及系统实现.pdf_第3页
(计算机应用技术专业论文)基于颜色特征的图像检索方法的研究及系统实现.pdf_第4页
(计算机应用技术专业论文)基于颜色特征的图像检索方法的研究及系统实现.pdf_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于颜色特征的图像愉索方法的研究及系统实现摘要随着多媒体技术与网络技术的迅猛发展,图像数据来源的不断扩大,数字图像容量正以惊人的速度增长。这些数字图像中包含了大量有用的信息,为了能够从海量的图像数据库中准确、快速地找到用户所需要的内容,基于内容的图像检索( c o n t e n t b a s e di m a g er e t r i e v a l ,c b i r ) 技术得到了广泛关注,并且已成为困际学术界研究的一个热点。基于内容的图像检索是利用颜色、纹理、形状等底层特征和语义等高层特征进行检索图像,由于图像背景通常占据图像的较大部分,在提取图像特征的过程中,对图像中主要目标的特征造成了一定影响,使得基于全局特征的图像描述不能很好地反映图像的语义特征。经典的颜色直方图法虽具有计算简单、平移、旋转、尺度不变等特性,而且抗噪声能力强,偶其无法反映颜色的位置特性,难以区分颜色组成相似但是空问分布不同的图像。针对以上问题,在参考了大量国内外最新研究成果和进行深入探索实验之后,本文在概述图像检索的背景意义、研究现状和应用领域的基础上,综述了图像检索的系统结构、检索方法的技术分类、相似性度量方法和系统性能评价方法,重点介绍了基于颜色特征的图像检索,并提出一种新的检索方法:利用o t s u 法对图像分割米提取目标区域,该方法更加有利于基于内容的图像检索;在基于颜色特征的检索方面,选用h s v 颜色空间,并介绍了r g b 空i 日j 与h s v 空间的转化方法。为了降低颜色特征的维数和系统开销,对颜色空间进行量化以降低维数。并且使用了一种改进的扇形图像分割方法,该方法首先将图像进行分块,然后结合颜色直方图进行特征提取,选用颜色的三阶中心距作为特征向量,计算其绝对值距离,进行相似度匹配,对图像进行检索。本文的方法不仅排除了背景像素点的干扰,而且对目标图像中像素点的颜色位置进行了定位,能够较为准确地提取图像中的显著区域,并且应用到图像的检索中,实验结果表明,基于对目标图像进行扇形分割的图像检索方法其效果优于一般的基于全局特征的图像检索,尤其在查准率上明显优于颜色直方图的检索方法。关键词:图像检索( c b i r ) ;颜色直方图;图像分割;特征提取:特征向量;相似性度量i i皋于颜色特征的图像榆索方法的研究及系统实现a b s t r a c tw i t ht h er a p i dd e v e l o p m e n to ft h em u l t i m e d i at e c h n o l o g ya n dt h en e t w o r kt e c h n o l o g y ,i m a g ed a t as o u r c e sc o n t i n u et oe x p a n d ,a n dt h ew o r l d sd i g i t a li m a g ec a p a c i t yi sg r o w i n ga ta na l a r m i n gr a t e t h e s ed i g i t a li m a g e sc o n t a i nag r e a td e a lo fu s e f u li n f o r m a t i o n ,i no r d e rt of i n dt h ec o n t e n to fu s e rr e q u i r e m e n t sf r o mt h em a s s i v ed a t a b a s eq u i c k l ya n da c c u r a t e l y , c o n t e n t - b a s e di m a g er e t r i e v a l ( c b i r ) t e c h n o l o g yh a sb e e nw i d e l yc o n c e r n e da n db e c o m eah o ts p o to fr e s e a r c h c o n t e n t b a s e di m a g er e t r i e v a lm a k e st h eu s eo fc o l o r , t e x t u r e ,s h a p ea n do t h e ru n d e r l y i n gc h a r a c t e r i s t i c sa n ds e m a n t i c o fo t h e rh i g h l e v e lc h a r a c t e r i s t i c st os e a r c hi m a g e s i n c et h eb a c k g r o u n do ft h ei m a g eu s u a l l yo c c u p yt h el a r g e rp a r to ft h ei m a g e ,i m p a c t st h ef e a t u r e so ft h em a i no b je c t i v eo fi m a g ei nt h ep r o c e s so ff e a t u r ee x t r a c t i o n ,i m a g e sd e s c r i b e db a s e do ng l o b a lf e a t u r e sa r en o tw e l lr e f l e c tt h ei m a g eo ft h es e m a n t i cf e a t u r e c l a s s i c a lc o l o r - b a s e dh i s t o g r a mi se a s yt oc o m p u t e ,i n s e n s i t i v et ot r a n s l a t i o n ,r o t a t i o na n ds c a l e ,a n dq u i t er e s i s t a n tt on o i s e sa sw e l l b u ti tc a n tr e f l e c ts p a t i a li n f o r m a t i o no ft h ec o l o lp r o n et of a l s eh i t sw h e nd i s t i n g u i s h i n gi m a g e si nl a r g ed a t a b a s ew i t hs i m i l a rc o l o rc o m p o s i t i o nb u td i f f e r e n ts p a t i a ld i s t r i b u t i o n i no r d e rt os o l v et h i sp r o b l e m ,a f t e rr e f e r e n c i n gt oal a r g en u m b e ro ft h el a t e s tr e s e a r c hr e s u l t sa n dc o n d u c ti n - d e p t he x p l o r a t i o ne x p e r i m e n t s ,t h i sa r t i c l eo u t l i n e st h eb a c k g r o u n da n ds i g n i f i c a n c eo fi m a g er e t r i e v a l ,r e s e a r c hs i t u a t i o na n da p p l i c a t i o na r e a s ,r e v i e w st h es y s t e ms t r u c t u r eo ft h ei m a g er e t r i e v a l ,t h et e c h n i c a lc l a s s i f i c a t i o no ft h er e t r i e v a lm e t h o d ,s i m i l a r i t ym e a s u r e m e n tm e t h o d sa n ds y s t e mp e r f o r m a n c ee v a l u a t i o n ,f o c u s e so ni n t r o d u c i n gt h ei m a g er e t r i e v a lb a s eo nc h a r a c t e r i s t i c so fc o l o la n dw ep r e s e n ta ni m a g er e t r i e v a lm e t h o db a s e do nc o l o rf e a t u r ea n ds h a p ef e a t u r e i tc a nu s eo t s um e t h o dt od e t e r m i n et h ea p p r o p r i a t et h r e s h o l d ,g e tt h eb a c k g r o u n da n dt h et a r g e ti m a g eb yi m a g es e g m e n t a t i o n a sf o rc o l o r - b a s e di m a g er e t r i e v a l ,t h ep a p e rs e l e c th s vs p a c e ,a tt h es a m et i m et h et r a n s f o r m a t i o nb e t w e e nr g bs p a c ea n dh s vs p a c ei sp r e s e n t e d i no r d e rt or e d u c et h ed i m e n s i o no fc o l o rf e a t u r e ,q u a n t i f i c a t i o no ft h ec o l o rs p a c et or e d u c et h ed i m e n s i o n i m a g eb l o c kf i r s t l ym a k i n gt h eu s eo fa ni m p r o v e df a ns e g m e n t a t i o ns t r a t e g y , a n dt h e nf e a t u r ee x t r a c tc o m b i n i n gc o l o rh i s t o g r a m ,a n du s et h e s ef e a t u r e st oi m a g er e t r i e v a l t h i sm e t h o dn o to n l yc a nr u l eo u tt h ei n t e r f e r e n c eo fb a c k g r o u n dp i x e l s ,b u ta l s op o s i t i o nt h ep i x e lo ft h ec o l o rp o s i t i o no ft h et a r g e ti m a g e e x p e r i m e n t a lr e s u l t ss h o wt h a tt h i si m p r o v e da p p r o a c hi sb e t t e rt h a nt h es i m p l eu s eo fc o l o rh i s t o g r a mi na na c c u r a t es u r v e y k e yw o r d s :c o n t e n t b a s e di m a g er e t r i e v a l ;c o l o rh i s t o g r a m ;i m a g es e g m e n t a t i o n ;f e a t u r ee x t r a c t i o n ;e i g e n v e c t o r ;c o m p a r a b i l i t ym e a s u r e m e n ti i i曲阜师范大学博士硕士学位论文原创性说明( 在口划“ )本人郑重声明:此处所提交的博士口硕士曰论文基于颜色特征的图像检索方法的研究及系统实现,是本人在导帅指导下,在曲阜师范大学攻读博士口硕士叼学位期间独立进行研究工作所取得的成果。论文中除注明部分外不包含他人已经发表或撰写的研究成果。对本文的研究工作做出重要贡献的个人和集体,均已在文中已明确的方式注明。本声明的法律结果将完全由本人承担。作者签名:蓬互磊日期:沙叩占弓曲阜师范大学博士硕士学位论文使用授权书( 在口划“”)基于颜色特征的图像检索方法的研究及系统实现系本人在曲阜师范大学攻读博士口硕士囤学位期间,在导师指导下完成的博士口硕士留学位论文。本论文的研究成果归曲阜师范大学所有,本论文的研究内容不得以其他单位的名义发表。本人完全了解曲阜师范大学关于保存、使用学位论文的规定,同意学校保留并向有关部门送交论文的复印件和电子版本,允许论文被查阅和借阅。本人授权曲阜师范大学,可以采用影印或其他复制手段保存论文,可以公开发表论文的全部或部分内容。作者签名:司羔亨考剔稚辄乏等、不7( j ( 日期:日期:卅毛,弓1 。毛6 。恭f 二颜色特征的图像偷索方法的研究及系统实现1 1 选题背景和意义第一章绪论随着计算机网络技术、多媒体技术和国际互联网技术的飞速发展,每天都有大量的信息在不断地产生和使用。在各种多媒体数据中,各行各业对图像的使用越来越广泛,所产生的图像数据也越来越多,图像信息资源的管理和检索显得r 益重要。图像数据库的研究将对多媒体数字图书馆、卫星遥感图像、医学图像管理和计算机辅助设计和制造、罪犯识别系统、地理信息系统、商标版权的管理等多方面提供有力的支持。图像数据库研究的核心技术是对图像如何准确地查找,即图像检索,是近年来海量信息处理已经面临的“瓶颈”。基于内容的检索是最具有本质性的图像检索技术,已成为国内外研究的热点。1 2 图像检索的研究现状( 一) 图像检索技术自2 0 世纪7 0 年代便丌始成为一个活跃的研究领域。早期的图像检索技术主要是对图像进行人工文字注解,对图像物理特征、内容特征等进行文字标注或标引,建立类似于文本文献注录的索引数据库,通过检索数据库获得图像编号,继而获得实际的图像,把图像检索转化为了文本检索1 2 j | u j 题。目前,互联网上的图像搜索,如g o o g l e 、百度等著名的搜索引擎,大多仍是采用这种对图像标注文本,+ 根据文本进行匹配检索的方式( 二) 到了2 0 世纪9 0 年代早期,随着大规模的图像数据不断涌现,基于文本的图像检索技术越来越不能满足海量图像数据库的检索需要,存在着以下较多的弊端:( 1 )图像内容的文本描述由手工完成,处理工作繁莺、检索速度慢、效率低,随着图像数据的来源同益广泛,这种文本描述的方法显得费时费力。( 2 ) 文本标注具有很大的主观性,不同的人对同一副图像的理解可能有所不同,因此当用户输入的查询关键词和数据库中图像的关键词不一致时,很可能查询不到自己需要的图像。( 3 )文本描述不能充分描述和揭示图像所蕴含的信息,简单的文本标注词很难将图像的内容描述清楚,特别是一些信息如形状、纹理等也很难用文本来描述。( 4 )由于媒体信息是发布在网络环境中的,不同国家不同民族很难用一种语言对图像进行加注标识,而且对图像语义的理解也存在很大的差异。为了解决基于文本关键字的图像检索存在的以上问题,研究人员相继提出了基于内容摹f 颜色特征的图像柃索方法的研究及系统实现的图像检索p j ( c o n t e n t - b a s e di m a g er e t r i e v a l ,c b i r ) 。基于内容的图像检索是根据其可视特征,包括颜色、纹理、形状、位置、大小等,从图像库中检索出与查询描述的图像内容相似的图像,利用图像可视特征索引,可以大大提高图像系统的检索能力。这种“以图找图的查询模式是对“以关键字找图”的一大突破。( 三) 近几年来,国内许多科研机构和院校展开了关于基于内容的图像、音频、视频检索方法的研究,也取得了可喜的成果。清华大学计算机系于1 9 9 7 年研制了一个i n t e r n e t 上的静态图像的基于内容检索的原型系统,该系统是结合国家8 6 3 高技术研究发展项目“w e b 上基于内容的图像检索”的基础上开发的,该项目的研究目标是开发能在i n t e m e t i n t r a n e t 环境下,通过友好的人一机界面,以颜色、纹理等图像底层特征或样本图像检索图像的方法和工具。国防科技大学多媒体研发中心设计丌发了一个基于内容的视频新闻节目浏览检索系统n e w sv i d e oc a r ( n e w sv i d e oc o n t e n ta n a l y s i s & r e p r e s e n t a t i o n ) 。该系统设计了一个通用的新闻视频处理框架,并在该框架的指导下进行新闻视频的自动分析与处理,其目的是通过镜头探测、故事单元探测、字幕探测、人脸探测、语音识别等多种技术对新闻视频进行多特征融合的处理,完成新闻视频的自动分析与编目功能,帮助用户解决新闻视频数据无法处理以及难以管理的问题,从而实现用户对新闻视频语义层次上的查询与检索。另外,浙江大学、华中科技大学、上海交通大学、中科院计算机研究所等院校机构都在开展基于内容的图像检索这方面的研究,在此不再一一列举。下面再介绍国外几个比较经典的图像检索系统例如i b m 的q b i c 、r e t r i e v a lw a r e 图像查询系统和u i u c 的m a r s 系统【4 1 等。1 q b i c 系统国际商用机器公司i b m 的q b i c ( q u e r yb yi m a g ec o n t e n t ) 是第一个商业化的基于内容图像检索系统,它的系统框架和结构对后来的图像检索系统具有深远的影响。它的系统结构包括图像入库、特征计算、查询阶段。支持基于例子图像、手绘图像、选择的颜色、纹理等的查询。q b i c 是少数几个考虑高维特征索引的系统。q b i c 中使用的颜色特征有平均( r ,g b ) 、( y i ,q ) 、( l ,a ,b ) 和m t m 坐标及k 个元素的颜色直方图。它采用的纹理表示是粗糙度、对比度和方向度的结合。它的形状特征包括圆形度、偏心度及一组代数距不变量。在它的新系统中,基于文本的关键字查询与基于内容图像检索结合在一起。2 r e t r i e v a lw a r e 系统r e t r i e v a lw a r e 是由e x c a l i b u r 公司开发的一种基于内容图像检索引擎。在r e t r i e v a lw a r e的早期版本中,可以看到该系统的重点在于运用神经网络算法实现图像检索。在比较新的版本中,颜色、形状、纹理、颜色布局等特征开始用于检索中。它还允许组合使用上述这些特征,并且用户可以自由调整每种特征的权重。3 m a r s 系统2基f 颜包特征的图像捡索方法的研究及系统实现m a r s ( m u l t i m e d i aa n a l y s i sa n dr e t r i e v a ls y s t e m ) 是多媒体分析和检索系统,是美国伊利诺斯大学的分校u i u c 开发的。m a r s 系统在图像检索领域萨式提出了相关反馈的体系结构。并在检索中不同层次上结合了该技术,包括查询矢量优化、自动匹配工具选择和自动特征适应。m a r s 的研究焦点不在于找到单一的最佳特征表达,而是研究如何把不同的视觉特征组织成为一个可以动态适应于不同应用和不同用户的有意义的检索机制。1 3 图像检索的应用领域图像检索技术推动了图像技术的蓬勃发展,适应当今信息时代的飞速发展,其应用非常地广泛,包括:( 1 ) 知识产权保护。科技的飞速发展使得人们越来越关注知识产权的保护问题,许多知识产权的载体都是图像,其中最明显的就是艺术作品和商标。商标知识产权体现在专用的文字描述和专用的图形标记两个方面。为了防止侵权,需要通过非常严格的商标审查程序来确认新申请的候选商标与已注册商标是否过分相似。( 2 ) 新一代网上搜索和数字图书馆。网络正逐渐渗透到人们的日常生活中,除了文本资源外,网上还存在非常丰富的图像资源。新一代的网上搜索引擎应该具有协助用户从海量而且无序的网上图像资源中寻找符合自己要求的图像的能力。另外,日益成熟的数字图书馆正在改变传统的图书馆概念。历史资料的存储以及人们对资料的查阅和浏览方式也在发生本质的改变。因而,对数字图书馆中的多媒体数据,图像分析和检索技术是非常有用的,也是必须的。( 3 ) 医学分析、网络会珍和遥感图像的分析和处理。例如医生需要通过检查医学数据库中的2 一d 放射照片以分析一个新病人的病情和发展或发现多个病人刚的某种相似病症。特别是对远程会诊,基于内容的图像检索可提高效率并且可以节省大量的网络传输费用。( 4 ) 犯罪和安全预防。安全部门可以将人的主要特征( 如指纹和脸部) 的图像存储在数据库中,通过指纹识别和人脸识别就有可能从大量的指纹库或者人脸库中自动识别出特定的目标,帮助办案人员尽快找到犯罪嫌疑人。互联网上也存在一些不健康的内容,特别是一些低级趣味的图片,基于内容的图像检索技术完全可以应用到类似的具有图像过滤需求的应用中。1 4 本文的主要研究工作本文在系统地分析了图像检索技术的体系结构、技术分类以及所面临的相关问题后,归纳总结了基于内容的图像检索的特征提取方法、相似性度量方法和性能评价方法,重点围绕图像颜色特征的提取及相似性度量展开了研究,并在后面章节中介绍了反馈技术在图基于颜色特i i i = 的图像检索方法的研究及系统实现像检索中的应用。本文在第三章重点讨论和比较了几种常见的颜色空f h j 模型,对图像检索中颜色空间的选取进行了研究。针对颜色直方刚5 j 特征只考虑颜色在图像整体上的分布,只包含了像素点颜色的总量信息而没有反映其相对空间位置的缺陷,本文在融合颜色、空间多种特征的基础上提出了一种新的检索方法。首先将图像利用大津法 6 , 7 1 分割为目标和背景两部分,提取出目标图像,抛歼了背景图像对图像检索的影响,然后对目标图像进行扇形等距分割,得到每个扇形区域的每种颜色的直方图,分别计算目标图像中每种颜色的三阶中心矩作为特征向量,并计算其绝对值距离,进行相似性匹配。最后,本文还建立了一个图像检索系统,作为检索算法的测试平台。本系统采用了示例查询的方式,检索时采用动态的图像数据库,即人为指定存有图像的文件央作为图像库,对图像库中的图像逐一提取特征与示例图像的特征进行匹配。通过给出检索实例,对改进的图像检索方法和原来单纯利用颜色直方图的检索方法进行了实验比较,并进行了性能分析。4基于颜也特征的图像榆索方法的研究及系统实现第二章基于内容的图像检索方法2 1 基于内容的图像检索技术简介基于内容的图像检索是在图像数据库中找出满足特定视觉描述的图像的过程,其主要思想是根据图像的视觉特征来进行检索,它的基本实现方法是利用图像数据库存储和管理图像数据( 包括图像特征和原图像) ,然后将c b i r 技术作为数据库的引擎引入图像数据库中,提供基于内容的图像检索功能。传统的图像检索过程,先通过人工对图像文字标注,再用关键字来检索图像,这种依据图像描述的字符匹配程度提供检索结果的方法,既耗时又主观多义,不能提供相似性检索。不仅如此,传统数据库检索技术的检索结果和信息的组织方式还与查询结果的显示方式有关,因而无法按照查询结果的相似程度进行输出。基于内容的图像检索技术则可以很好的解决这一问题。2 2 基于内容的图像检索体系结构特征提取子系统查询子系统图2 1 典型的图像检索系统结构( 1 ) 预处理包括图像格式的转换、规格化,图像的增强、复原与去嗓等功能。( 2 ) 目标标识即标识出图像中用户感兴趣的区域或对象,以便针对目标进行特征提取并查询。( 3 ) 特征提取包括提取图像颜色、纹理、形状、空l 日j 位置关系等特征。基于颜色特征的图像榆索方法的研究及系统实现( 4 ) 数据库由图像库、特征库和知识库1 4j 组成。图像库为数字化的图像信息,特征库包含自动提取的内容特征,知识库包含专门和通用知识,有利于查询优化和快速匹配,知识库中知识表达可以更换以适用于各种不同的应用领域。( 5 ) 查询接口提供一个友好的用户界面。包括可视化的输入手段和结果浏览功能。( 6 ) 检索引擎中包括一个有效可靠的相似性测度函数集。( 7 ) 检索引擎通过索引过滤模块达到快速检索的目的。2 3 基于内容图像检索方法的技术分类( 一) 基于颜色特征的检索方法基于颜色特征的图像检索方法,最基本的思想是利用颜色空问直方图的匹配。由于颜色特征是人类认知物体的一个主要特征,且颜色特征具有平移、尺度、旋转不变性,因此颜色特征也是图像检索中应用最为广泛的视觉特征,对这类方法的进一步研究集中在:1 )表示颜色特征的颜色模型与人的视觉特征一致性研究;2 ) 降低表示颜色特征维数【8 】的方法;3 ) 与其它视觉特征结合进行多特征检索研究等几个方面。( 二) 基于纹理特征的检索方法纹理特征是图像的重要特征之一。其本质是刻画像素的邻域灰度空间分布规律。基于纹理特征的图像检索在区分有相似颜色的区域时是非常有用的,如树叶和草地,天空和海洋等等。纹理特征对于检索卫星图像及文本图像非常有效,一般应用于图像的内容较为丰富,物体和背景不易分割的情况下的检索。各种各样的技术已经被用来计算纹理的相似性,使用最多的方法是基于图像的二阶统计量。通过选择点对的相对亮度,计算出表征图像纹理的测度,如粒度、对比度、规则性和方向性。或周期性、自由度。小波纹理和分形理论的发展,为纹理分析提供了新的工具。( 三) 基于形状特征的检索方法在计算机视觉中,形状特征是描述高层视觉特征( 如目标、对象等) 的重要手段,而目标、对象对获取图像语义尤为重要。要把图像的底层特征与高层特征有机的结合起来,必须有好的形状特征描述与提取算法的支持。形状的提取一般有两类方法,一是对图像进行分割,得到一系列区域,每个区域看成一个物体,区域本身或其边界曲线表示所提取的形状;另一类方法是首先提取图像的边缘点,得到一系列曲线,用这些曲线来表示所提取的形状。在几种常用的形状匹配【9 l 方法中:边界方向直方图法较为简单,但存在相似性判断误差较大的缺点;小波系数法能有效克服这一缺陷,但对尺度的变化过于敏感,缺乏尺度的不变性;而小波变换模极大值法则具有平移、尺度、旋转不变性,检索效果能很好地适应各种需求。( 四) 基于空问位置关系的检索方法空间关系是指空间对象之间具有空间特性的关系,主要包括拓扑、方向、度量关系。6基j :颜色特征的图像榆索方法的研究及系统实现在图像数据库中,了解图像中对象和对象之间空间关系是区别不同图像的一种重要方法。随着人们对图像中对象的不断关注,基于对象空间关系的查询显得越来越重要。因为对象空间关系特征的自动抽取是非常困难的,所以基于空问关系图像检索大多采用人工绘制草图的查询方法,对基于对象空间关系图像检索方法进行深入研究的到目前为止还不太多。( 五) 基于语义的图像检索图像的含义就是图像的高层语义,它包含了人们对图像内容的理解,这种理解足无法直接从图像的视觉特征获得的,而要根据人的知识来判断。图像的底层特征与图像的高层语义表达之间存在着巨大的“语义鸿沟”。目前基于语义的图像检索方法分为两大类:一是自动语义标注,该方法利用已标注过的图像数据库作为训练集,采用机器学习或者统计学习方法对图像进行标注;二是基于语义空间的图像检索方法,它不需要已标注过的图像数据库,而是通过相关反馈的方法建立高层语义空间,进而创建底层特征空间和该语义空间之间的映射,将待查询的图像转变为语义空间中的表示形式,从而实现图像在语义空间中的检索。( 六) 其它检索方法综合特征检索就是综合图像的颜色、形状、纹理或空间位置关系等特征表示,计算图像特征向量。各个特征间应有一个权重关系,由用户根据需要进行调整,以适于不同情况的查询。在实际应用中,综合特征检索有许多优点,一是可以达到不同特征的优势互补的效果,二是可以提高检索的灵活性和系统的性能,满足实际应用的需要。另外,还有基于语义特征的检索方法l l 。图像内容越深层的语义描述需要越深层的图像理解。如何从简单的图像特征来获取高层特征,以满足基于语义的相似性要求是这个层次检索的研究重点和难点【l l l 。2 4 基于内容图像检索的相似性度量方法在基于文本的检索方法中采用的是文本的精确匹配,而基于内容的图像检索则要通过计算查询( 样本图像) 和候选图像之间在视觉特征上的相似度进行匹配。因此,定义个合适的视觉特征相似性度量方法对检索的效果无疑有很大的影响。这里利用颜色直方图来说明几种常用相似性度量方法【l2 。,这些方法完全可以推广应用到图像的其他特征中。( 一) 直方图相交距lt设q 为查询例图,t 为目标图像,门a 表示查询直方图;,2 ,表示目标直方图。则两图像之i 日j 的匹配值加w 一,可借助直方图相交距来计算,定义如式( 2 1 ) 所示:吖 2 m i n 仍。h , 聊 )n 仍。【聊】, 聊”a ,( g ,卜1 _ f m - 1i h l = h l m ( 2 1 m = 07基j :颜色特征的图像枪索方法的研究及系统实现另一柙彤式阴且乃例删父距为:m l,、m i n ( 历。, 聊】,厉, 历】)眈( g ,) _ 1 。气砑( 二) 欧几罩得距离直方图l 、h j 的距离可使用一般的欧氏距离函数d :g ,f ) 来衡量,2 排( 笔咖m 聊 眄也可以使用加权距离柬衡量,定义如式( 2 - - 4 ) 所示:咖,= ( 笔w z 咖m 万舯m = 怍裁磊茹( 2 2 )定义如式( 2 3 ) 所示:( 2 3 )( 2 4 )如果采用归一化直方图,贝l l w , 1 ,即加权距离要小于欧氏距离。( 三) 中心距法对直方图来说,均值是其零阶距,更高的距也可用于匹配。对一副灰度级数为三的图像,其直方图为h ( 0 ,对于彩色图像,三为其量化级别数,则该图像的前三阶中心距分别用下式表示为:,m = 办( f )( 2 5 )蛤e 1 圭附彬丁( 2 6 )肝e 1 。鲰卜m 。玎沪7 ,( 四) - - & 距前面的相似性算法只是直方图的一对一的特征比较,实际一幅图像的某一颜色特征与相邻颜色都有关系,二次距采用一对多的算法来比较不同直方图,定义如式( 2 - - 8 ) 所示:d 。= h q - 材a ( h 。一乃,) ( 2 - - 8 )8暴于颜色特征的图像 令索方法的研究及系统实现设彳= l 4 。j ,aj ) 表示死中第i 个元素与庇,中第j 个元素的相似程度。4 ,2a ,且么。= l 。( 4 1 ) 直方图的余弦距与欧几里得最相近的是余弦距。余弦距根据两个向量的夹角的余弦值计算它们之间方向的差异,作为其距离度量。定义如式( 2 - - 9 ) 所示:。 小一一踹2 5 基于内容图像检索的性能评价图像检索系统有效性评价可以从以下两个方面来考虑:一是人的主观感受;二是有一个量化的评价标准。而人的主观感受则由于受其主观性和个体性影响,很不容易把握,因此量化的评价标准是一种较直观,且具有通用性的检索有效性的评价方法。常用的量化评价标准为以下两种:( 一) 查全率和查准率众所周知,任何一项技术都是由该领域中相应的评价标准来推动的,一个好的评价标准会引导相关技术向正确的方向发展。在人们对图像检索需求多元化和专业化的推动下,基于内容的图像检索技术日趋成熟,这就需要通过系统科学、合理有效的评价标准束评价每种算法的优劣。检索策略性能评估的比较通用的几个准则是有效性、效率和灵活性。它们分别代表查找与示例图像相似的图像的成功率、检索的速度及对不同应用的适应性。目前对检索效果的评价则更多地放在检索结果的正确与否上,即检索的有效性上。常见的也是应用最广的评价标准是:查全率( r e c a l l ) 和查准率【1 3 】( p r e c i s i o n ) 。查全率是指在一次查询过程中,用户所查到的相关图像的数目和数据库中与目标图像相关的所有图像数目之比;查准率是在一次查询中所查到的相关图像数目同该次查到的所有图像数目之比。用公式分别定义如下:a 代表正确检索出的相关图像数目;c 代表漏检的相关图像数目;b 代表检索出的无关图像d 代表证确排除掉的无关图像q 为整个图像数据库,a 代表相关图像的集合,b 代表检索出的所有图像。则查准率查全率唧c 枷,= 訾= 南娜= 等= 熹由此可见,查准率则反映检索的准确性,而查全率反映检索的全面性,因此可以用查9基于颜色特征的图像榆索方法的研究及系统实现全率和查准率来评价系统的有效性。但其局限性在于没有考虑检索结果中相似图像所处的位置。查准率和查全率越高说明枪索系统的效果越好。但是查准率和查全率是一对矛盾,相互制约,当查全率较高时,查准率就会降低,反之亦然。因此一般检索系统要求通过调整,使查准率和查全率两者达到一个最优平衡。( 二) 排序评价方法设查询的返回图像幅数为n ,在n 幅返回图像中,n 詹为相关图像的数目,p ,为相关图像的排序序号,v4 为实际的相关图像数,则评价参数的确定如下所述。1p检索到的相关图像的平均排序k 。为:k = 气手一p ,理想的相关图像的平均排序为:k := 尘丢失的相关图像率为:m :址nak :表示理想情况下,即返回相关图像全部排在最前面的平均序号。k ,越接近k :表示查询效果越好。蚴了譬雠一黼憾= 志陆一掣对于最理想的检索,k ,是0 。2 6 本章小结本章概括介绍了基于内容的图像检索的体系结构、技术分类、相似性度量方法以及检索系统的性能评价。1 0基于颜色特征的图像检索方法的研究及系统实现3 1 引言第三章基于图像颜色特征检索颜色是图像最基本和直观的特征,也是图像检索中应用最为广泛的视觉特征。与其它特征相比,颜色特征的提取也相对容易,因而,基于颜色特征的图像检索受到广泛的重视和研究。颜色具有很好的稳定性,颜色特征对图像本身的尺寸、方向和视角的依赖性较小,具有很强的鲁棒性,同时在许多情况下,颜色也是描述一幅图像最简便且有效的特征。对于利用颜色特征进行图像检索要解决的三个关键问题是:颜色的表示,颜色特征的提取和相似性度量。颜色表示有多种方式,比如颜色直方图、累积颜色直方图、主颜色、平均颜色等等,但是这些表示方式没有描述出颜色的分布信息,两个相同或很相似的颜色直方图可能对应f l j i 幅内容完全不相同的图像,这样容易造成误检现象。可能检索出很多“假的”匹配图像。可以采用颜色斫i 局( c o l o rl a y o u t ) 的方法使颜色特征包含有空间信息。在检索过程中,主要可以采用以下两种检索方式:一是直接示例查询的方式,即用户给出示例图像,系统通过提取示例图像的颜色特征与图像库中己经离线提取完成的颜色特征进行相似度比较,以得到颜色相似的图像。二是基于图像的颜色主色调进行查询。由用户给出图像的一个或者几个主色调,将这些主色调作为查询的主要特征进行相似度匹配,以查找出图像库中类似的主色调的图像。3 2 颜色模型及其转化所谓颜色模型【1 4 峙旨的是某个三维颜色空间中的一个可见光子集,它包含某个色彩域的所有色彩。通过理论研究和实践结果,人们现在对颜色的物理本质已有了相当的了解。其中,白光可以分解成一系列从紫到红的连续光谱,这些不同颜色实际上是不同频率的电磁波,只是人们将不同频率的电磁波感知为不同的颜色,从这个角度上看,颜色是一维的量,即只有频率的不同。但在人的眼睛看来,颜色是一个三维的空间,所有的颜色都可以看作三个基本的颜色红、绿、蓝的不同组合,即三基色原理。区分颜色也常用到三种基本特征量:色调、饱和度和亮度。色调与混合光谱中的主要光波长相联系,饱和度则与一定色调的纯度有关。一般,任何一个色彩域都只是可见光的子集,任何一个颜色模型都无法包含所有的可见光。常见的颜色模型有r g b 、c i e 、c m y c m y k 、h s i 、n t s c 、y c b c r 、h s v模型等。常用的颜色模型可分为两类。一类面向诸如彩色显示器或打印机之类的设备( 可以与具体设备相关,也可独立于具体设备) 。另一类面向视觉感知或颜色处理分析为目的的应用,* j i 断n 特目像倚毒方法的,e 缱囊脱如动画中的彩色图形,荐种罔像处理算法等。在奉文中婴讨论的模型,前者对应jr g b模型,而后者则对应j - h s v 模魁。3 2 1r g b 颜色模型r g b 模型是l 前常用的种彩色信息表达方式,它使用红、绿、蓝:原色的亮度束定景表示颧色。陵模j 弘也称为加色混色模型,足以r g b 色光互相叠_ | 1 柬实现混色的方法,郇五合十缸不: | 等发光伴的艟示。其混色效果如圈31 所示j 笸套jj j|、j 自| ji? 8 “,? j + i ,? 7胁( 1 ,解即舢,基r 颜色特征的图像榆索方法的研究及系统实现绿、蓝色。而另外三个顶点则对应于二次色黄色、青色以及品红。3 2 2h s v 模型所谓h s v 颜色模型,就是色调( h u e ) 、饱和度( s a t u r a t i o n ) 、亮度( v a l u e ) 颜色模型。通道问各自独立,色调h 用来区分颜色成分。不同颜色对应不同的波长,色调就描述了颜色的波长,用颜色的名称表示,例如:红色、黄色、蓝色等。饱和度s 用来量度颜色的纯度。饱和度表征颜色的深浅程度,饱和度越高,颜色越深,如深红,深绿。饱和度参数是色环的原点( 圆心) 到彩色点的半径长度。由色环可以看出,在环的边界上颜色饱和度最高,其饱和度值为l ;在中心的则是中性( 灰色) 影调,其饱和度为o 。亮度v 表示颜色的亮度信息。就是人眼感觉到的光的明暗程度,光波的能量越大,亮度就越大。颜色的色调和饱和度说明了颜色的深浅,合称色度。和h s v 空间类似的颜色空间还有h s i ,h s l 等。h s v 颜色空间可以看作是倒胃的圆锥形,长轴表示亮度v ,通过用百分比度量,从黑0 到白1 0 0 ,体现光线的明暗程度。离开长轴的距离表示饱和度s ,即颜色的统一纯度,它也用百分比来表示。从0 到完全饱和的1 0 0 。围绕着轴的危度是色调h ,它用1 8 0 度1 8 0 度或者0 度 - 3 6 0 度度餐,色调尤其影响着人类的视觉判断,如图3 3 所示:青ivk、黄弋打k孔品红一一os图3 3h s v 颜色空间h s v 颜色空间的每个分量直接对视觉感受起作用,从这个意义上说,h s v 是均匀的颜色空间。感觉色调属性,可以看出图像区域接近于某种已经感知的颜色,如红、蓝等。如果光谱能量分布的主要波长变化了,相应颜色的色调也随着发生变化。饱和度是区域的颜色强度和区域亮度的比例、饱和度在从灰色、淡彩色直到饱和色之间变化。光谱能量分布越集中在某个波长,则相应颜色越饱和。人类的颜色视觉系统对饱和度较高的颜色的感觉基于颜色特征的图像榆索方法的研究及系统实现更强烈,而且在颜色分量中,人类视觉系统对色调的感觉更加敏锐。3 2 3r g b 空间到h s v 空间的转换由于一般情况f 获取的图像都足在r g b 空i f j 描述的,但在图像检索的应用中,h s v空间模型更适合于人的视觉感知。因此,在图像处理中一般把图像从r g b 空间模型转换到h s v 空间模型,设协是r g b 颜色空间中的7 仑颜色点,是h s v 颜色空间的个颜色点,从r g b 到h s v 的变换丁。使得m2t 。h ) ,则转换公式如下:,n1 ,一m m ( r ,g ,d jv = m a x ( r ,g ,d ,s = 。定义厂2i = 赢v 丽- r 丽g 2 丁i 忑v 丽- g 磊面6 。5 了j 五v 丽- b 而h =5 + b 若,= m a x ( r ,g ,6 ) r g = m i n ( r ,g ,b )1 一g若,= m a x ( r ,g ,6 ) 且g m i n ( r ,g ,b )1 + r若g = m a x ( r ,g ,6 ) 且b = m i n ( r ,g ,b )3 一b 若g = m a x ( r ,g ,6 ) 且6 m i n ( r ,g ,b )3 + g 若b = m a x ( r ,g ,6 ) 且,= m i n ( r ,g ,b )5 一r 其他h _ h z 。o这里,g ,b 【o 2 5 5 ,h 【o 3 6 0 ,5 【o 1 】,v 【o 1 】在r g b 与h s v 之问的变换公式有多种形式,上面介绍的是其中一种。这些变换方式的基本思想都是类似的。一般而占,对一种从r g b 空间转换到h s v 空间的方法,只要该方法保证转换后的色调h 是一个角度,饱和度s 和亮度v 相互独立,并且这个转换是可逆的,那么这种方法就是可行的。3 3 颜色特征的提取与表达颜色特征的表达方式有多种,一般常用的表示为:颜色直方图、二值颜色集、模糊颜色直方图等。1 4綦1 :颜色特托的图像榆索方法的研究及系统实现3 3 1 颜色直方图颜色直方图是图像的重要统计特征,它表示了数字图像中每一个狄度级与该狄度级出现的频率问的统计关系。它用横轴表示颜色值,用纵轴表示具有相同颜色值的像素个数在整幅图像中所占的比例。直方图提供了图像颜色值的分布情况,给出了图像灰度值的整体描述。它适合于描述那些难以进行自动分割的图像。颜色直方图计算简单,而且具有尺度、平移以及旋转不变性。目前几乎所有的基于内容的图像检索系统都包含基于颜色直方图的检索方法。h ( k 1 :丝k :o ,l ,三一l?1n上式中n 是图像像素的总数,l 是特征可取值的个数,k 代表图像的特征取值,船t 是图像中具有特征值为k 的像素个数。在直方图特征提取中,全局颜色直方图是最常用的一种表示方法。全局颜色直方图的主要性质有:直方图中的数值都是统计而来,描述了该图像中关于颜色的数量特征,可以反映图像颜色的统计分布和基本色调。任一幅图像都能唯一的给出一幅与它对应的全局直方图,但不同的图像可能有相同的颜色分布,从而就具有相同的直方图,因此全局直方图 1 4 】与图像是一对多的关系;如将图像划分为若干个子区域,所有子区域的直方图之和等于全局直方图。3 3 2 二值颜色集图像或图像区域有关颜色的内容可以用更

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论