




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要基于内容的图像检索是采用图像内容来进行图像查询,是多媒体检索中的热门课题。其主要思想是根据图像所包含特征( 如颜色、纹理、形状、空间关系、语义) 来建立图像的特征矢量,然后根据图像的特征矢量进行相似查询。基于区域的图像检索技术是基于内容图像检索的一个重要研究方向,其主要思想是利用图像分割技术把图像分成多个区域,对每一个区域都单独的提取特征,然后用单一匹配或多区域匹配来进行图像查询。基于区域的图像检索是比基于全局特征的图像检索的更高层次的图像检索技术。基于区域的图像检索提取的是区域的特征,这样就可以描述图像中的目标对象,通过有效的描述目标对象的特征,可以提高图像检索的精度。本文首先简要的介绍了基于内容的图像检索的发展历史和关键技术。接着对颜色空间和图像分割相关技术进行了研究,然后提出了基于聚类和基于区域生长的图像分割算法,在区域生长的算法中,针对种子点的自动选择提出了自己的算法。对这两种算法分别进行了实验。最后,对基于区域的彩色图像检索进行了深入的研究,针对分割后的图像,提取每一个区域的颜色、形状和空间位置特征。最后介绍了一种多区域匹配算法基于综合区域匹配算法( i r m ) ,并将i r m 的算法进行了改进,针对m m 算法中的权值问题提出了自己的权值算法,并通过实验证明了改进算法的有效性。我们在v c 6 0 平台上开发出了图像分割系统和基于内容的图像检索系统。在该系统上对本文的算法进行了实验,实验结果表明了文中所提算法的有效性。关键词:基于区域的图像检索,图像分割,区域生长,特征提取,区域匹配a a s t r a c tc o n t e n t - b a s e di m a g er e t r i e v a li sak i n do fr e t r i e v a lt h a tu s e sc o n t e n to fa l li m a g ef o ri n f o r m a t i o ns e a r c h ,a n di ti sa ni m p o r t a n td i r e c t i o ni nm u l t i m e d i ar e t r i e v a lf i e l d i t sm a j o rm e t h o di st oc r e a t ef e a t u r ev e c t o rb ym e a n so fe x t r a c t i n gi m a g ef e a t u r e ,s u c ha sc o l o rf e a m r e ,t e x t u r ef e a t u r e ,s h a p e f e a t u r e ,s p a c ef e a t u r ca n ds e m a n t i cf e a t u r e ,a n dr e t r i e v e i n gt h ei m a g eb ym e a n so fm e a s u r e i n gt h ef e a t u r ev e c t o r s r e # o n b a s e di m a g er e t r i e v a li sa ni m p o r t a n td i r e c t i o ni nc o n t e n t - b a s e di m a g er e t r i e v a lf i e l d i t sm a j o rm e t h o di st os e g m e n tt h ei m a g ei n t os e v e r a lr e g i o n su s i n gi m a g es e g m e n t i o nm e t h o d ,a n de x t r a c tf e a t u r ef o re v e r yr e g i o n ,a n dr e t r i e v et h ei m a g eu s i n gs i n # e - r e # o nm a t c h i n go rm u l t i r e g i o nm a t c h i n gm e t h o d t h et e c h n o l o g yo fr e # o n b a s e di m a g er e t r i e v a li saa d v a n c e dr e t r i e v a lm e t h o df o rc o n t e n t b a s e di m a g er e t r i e v a l ,b e c a u s er e # o n b a s e di m a g er e t r i e v a le x t r a c t st h er e # o nf e a t u r e ,t h e ni tc a nd e s c r i b et h eo b j e c ti nt h ei a m g e ,a n di tc a ni m p r o v et h er e t i e v a lp r e c i s i o ni ft h eo b j e c tc a nb ed e s c r i b e de f f e c t i v e l y t h i sp a p e ri n t r o d u c e s t h eh i s t o r ya n dm a i nm e t h o d so fc o n t e n t b a s e di m a g er e t r i e v a l a n dw er e s e a r c ho nc o l o rs p a c ea n dt h et e c h n o l o g yo fi m a g es e g m e n t i o n w ep r o p o s eac l u s t i n gi m a g es e g n e t i o nm e t h o da n dar e g i o ng r o w i n gi m a g es e g m e n t i o n ,w ep r o p o s e das e e da u t o m a t i c a l l ys e l e c t e dm e t h o df o rs e e ds e l e c t e d u s i n gi m a g ec o l o rf e a t u r e w ec o m p a r et h et w om e t h o db yd o i n ge x p e r i m e n t w ee x t r a c tc o l o rf e a t u r e ,s h a p ef e a t u r ea n ds p a c ef e a t m ef o re v e r yr e g i o n i nt h el a s t ,w ei n t r o d u c eam u l t i - r e g i o nm a t c h i n gm e t h o d i n t e g r a t e dr e g i o nm a t c h i n g ( i r m ) ,a n dw ei m p r o v et h em e t h o db yp r o p o s e i n go u rm e t h o d ,a n dw ev e r i f yt h em e t h o d se f f e c t i v e n e s sb yd o i n ge x p r i m e n t w ee x p l o r eai m a g es e g r n e t i o ns y s t e ma n dac o n t e n t - b a s e di m a g er e t r i r e a ls y s t e mu n d e rv c 6 0p l a t f o r mw ed oal o to fe x p e r i m e n to nt h es y s t e mt ov e r i f yo u ra l g o r i t h mp r o p o s e di n tt h i sp a p e r t h er e s u l t sp r o v eo u ra l g o r i t h m se f f i c i e n c y k e y w o r d :r e # o n - b a s e di m a g er e t r i e v a l ,i m a g es e g m e n t i o n ,r e # o ng r o w i n gi m a g es e g m e n t i o nf e a t u r ee x t r a c t ,r e # o nm a t c h i n g独创性声明本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:瘗盛越日期:丕纽。f f学位论文使用授权书本人完全了解武汉理工大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权武汉理工大学可以将本学位论文的全部内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存或汇编本学位论文。同时授权经武汉理工大学认可的国家有关机构或论文数据库使用或收录本学位论文,并向社会公众提供信息服务。( 保密的论文在解密后应遵守此规定)研究生( 签名) ;捣导师( 签武汉理工大学硕士学位论文1 1 研究背景和意义1 1 1 研究背景第1 章绪论计算机科学与技术、信息科学技术和多媒体的发展,使数字图像日渐成为人们日常生活不可缺少的部分,图像的数量也越来越庞大,图像的应用也越来越广泛。大量图像的出现使得图像的管理和查询显得越来越重要。图像检索成为图像领域的关键技术之一卜引。图像检索的研究始于二十世纪七十年代,最初的图像检索是基于文本的图像检索,这种图像检索的思想是把每一幅图像都用关键字进行标注,检索的方法就是比较查询图像和待查询图像的关键字。这种方法有很大的弊端:图像的标注是人为的,加入了人的情感因素,每一个人的情感有所不同,对同一副图像的描述也不尽相同,当然所标注的关键字就有可能不同,造成误差。再者,对于少量的图像集来说,这种人工的标注有可能实现,但是对于数量及其庞大的图像集来说,这种人工的标注方法很难完成。图像检索发展到二十世纪九十年代以后,基于内容的图像检索( c o n t e n t b a s e di m a g er e t r i e v a l ,简称c b i r ) 应运而生,全球掀起了c b i r 的研究狂潮。基于内容的图像检索的思想是:根据图像所描述的内容,提取图像的低层或高层特征,然后根据特征匹配来达到检索的目的。基于内容的图像检索解决了基于文本的图像检索的弊端,对图像的描述完全有计算机根据指定的算法来完成,不仅消除了人为的情感因素,减小了误差,而且可以处理大量的图像集。近些年,c b i r 得到了广泛的研究和长足的发展。c b i r 常用的检索方法就是利用图像的颜色、形状、纹理、空间关系等基本低层视觉特征进行检索,或者利用图像的高层特征语义来特征进行检索。1 1 2 研究意义随着基于内容的图像检索技术的发展,基于内容的图像检索的应用领域越来越广泛。下面简要介绍一下基于内容的图像检索的几个典型应用领域【3 1 。( 1 ) 商标产权的保护随着科技和网络技术的发展,知识产权的保护问题越来越受人们的关注。许多知识产权都是以图像为载体,比如商标、广告、海报等。商标的产权主要体现武汉理工大学硕十学位论文在文字和图形。对于文字的审查,可以通过字符串的匹配和字符变换来实现。对于图形的审查可以通过使用基于内容的图像检索技术来实现。对于大量的商标图像库来说,利用基于内容的图像检索技术来实现商标检索意义非常。( 2 ) 网上搜索引擎网络的飞速发展,使得网络逐渐渗透到人们的生活中,网上出现了大量的图像资源。网上搜索引擎的主要功能就是从大量的网上资源搜索符合用户要求的资源。( 3 ) 预防与打击犯罪随着互联网的发展,网上出现了一些不良内容,如黄色图片、电影和网站等,负面影响很大。利用基于内容的图像检索技术就可以实现对这些图像的搜索并进行过滤,以免让青少年浏览,影响青少年的身心健康。办案人员可以利用图像检索技术打击犯罪,他们可以利用犯罪嫌疑人的特征,如指纹特征、d n a 特征、脸部特征等作为查询事例,在相应的图像库中查找与犯罪嫌疑人相似的特征,从而确认犯罪嫌疑人的身份。除此之外,基于内容的图像检索技术还可以应用到医学图像处理、遥感图像处理等方面。基于内容的图像检索技术有四个研究热点。一是基于图像全局特征的图像检索。二是基于区域的特征的图像检索。三是基于用户相关反馈的图像检索。四是基于语义的图像检索。本文研究的内容是属于基于区域的图像检索范畴。基于区域的图像检索就是首先把图像分割成不同的区域,然后提取各个区域的特征,然后用区域的特征进行图像匹配。基于区域的图像检索比基于全局特征的图像检索技术要更加先进一些,用区域的特征来代替全局特征更有利于描述图像的对象,使得查询结果更为精确。1 2 国内外研究现状从9 0 年代中期开始,基于内容的图像检索技术逐渐成为活跃的研究领域。每年都有相关的国际会议召开,各种国际一流的学术杂志均以此为主题,出版论文专辑;到目前为止,已经成功建立了基于内容的图像检索系统的通用框架,并且,按照这一框架,通过采用各有千秋的基于内容的图像检索技术,已有不少性能各异的c b i r 研究原型系统和商业应用系统面世。其中,比较有代表性的c b i r系统主要有:1 、q b i cq b i c 是由i b m 公司推出的、最早的c b i r 系统。其采用的系统框架和技术2武汉理t 大学硕十学位论文对后来基于内容的图像检索系统的发展具有深远的影响。q b i c 支持基于样图的查询,草图的查询和用户选择颜色和纹理的模式的查询。颜色特征使用k = 6 4 的平均颜色直方图特征;纹理特征是t a m u r a 纹理表示的一种改进,综合了粗糙度、对比度和方向性的特征;形状特征包括面积、圆形度、离心率、主轴方向和一系列代数不变矩( i n v a r i a n tm o m e n t ) 。q b i c 是少数考虑了高维特征索引的系统之一,其索引模块先使用k - l 变换降低特征维数,再用r 树构造多维索引结构。q b i c还将基于关键词的检索和图像内容检索结合在一起。q b i c 的演示系统在h t t p :w w w q b i c a l m a d e n i b m t o m 。2 、v i r a g ev i r a g e 是由v i r a g e 公司开发的基于内容的图像检索引擎。支持基于颜色、颜色布局、纹理和形状的可视化样图查询。v i r a g e 进一步支持上述四种查询的任意组合,用户可以根据需要调整各个特征的权值。最近,v i r a g e 开始研究在一些专业领域的应用,如脸部检索及癌细胞检测等。此外,g u p t a 还提出了一种查询语言 g u p t a ,1 9 9 7 。v i r a g e 的演示系统在h t t p :w w w v i r a g e c o r n c g i b i n q u e r y - e 。3 、v i s u a l s e e k 和w e b s e e kv i s u a l s e e k 是由美国哥伦比亚大学开发的视觉特征引擎,其姊妹系统w e b s e e k 是基于互联网的文本图像搜索引擎。主要研究图像中区域的空间关系特征和基于压缩域的视觉特征提取。它使用颜色集和由小波分析提取的纹理特征。为加快检索速度,他们提出了二进制树( b i n a r yt r e e ) 的索引算法。使用w 曲s p i d e r 技术从互联网上收集图像和视频信息,按主题分类和索引以供浏览和检索。演示系统在h t t p :w w w e e c o l u m n b i a e d u - s f c h a n g d e m o s h t m l 。4 、p h o t o b o o k由m i t 媒体实验室开发的用于交互式浏览和搜索图像库的工具。其检索使用形状、纹理和面部外形三种特征,同时还能结合文本关键字进行查询。在p h o t o b o o k 的最近的扩展版本f o u r e y e s 中,考虑到没有一个单独的特征可以很好地表示一组任意的图像集,提出了一个基于统计学习的“模型团体”( s o c i e t yo fm o d e l s ) 的概念,提供了基于用户提供的图像进行特征的交互性学习的方法。试验表明该方法对图像的交互式标注非常有效。除了以上介绍的c b i r 系统外,比较成功的类似系统还有:e x c a l i b u r 公司开发的r e t r i e v a l w a r e 图像检索引擎,u c s b a l e x a n d r i ad i :g i t a ll i b r a r y ( a d l ) 的n e t r a原型系统、u cb e r k l e y 大学的c h a b o t 系统,伊利诺斯大学开发的m a r s ( m u l t i m e d i aa n a l y s i sa n dr e t r i e v a ls y s t e m ) 等。另外,国内一些院校也己开始了对c b i r 技术的深入研究。浙江大学从1 9 9 5 年开始进行多媒体图像检索的研究,开发了基于图像颜色的检索系统p h o t o n a v i g a t o r ,并将基于颜色的c b i r3武汉理工大学硕士学位论文技术较为成功地应用于敦煌壁画数据库的研究和开发。另外,国防科技大学等高校也对c b i r 领域进行多年的深入研究。1 3 基于内容的图像检索概述基于内容的图像检索技术根据图像的特征,如颜色、形状、纹理、空间关系等低层特征或者高层的语义特征来建立特征向量,通过图像之间特征向量的相似度来确定检索结果。基于内容的图像检索技术涉及到应用数学、图像处理、模式识别、人工智能和计算机视觉等学科领域【4 l o1 3 1 系统结构基于内容的图像检索系统可以分成两个子系统:特征提取和图像查询。如图2 1 所示。图1 1 基于内容的图像检索系统结构图像数据经过预处理后进行特征提取,也可以先标识出目标区域,然后提取目标区域的特征。图像库中的特征提取之后就形成了特征库。用户根据查询接口选择一幅图像作为示例图像来进行检索,也可以在图像库外部选择一幅图像,提取特征,然后进行检索。其中预处理主要是对图像进行增强、去噪、修复等。目标标识就是从一整幅图像中提取图像所描述的对象,去掉背景区域。特征提取就是提取全局特征或区域特征,主要有颜色形状、纹理、空间关系、语义等。4武汉理工大学硕士学位论文数据库中的图像库就是原始的图片。特征库就是图片提取特征后的数据信息。知识库就是包含专业或者是通用的知识。查询接口就是系统为用户提供一个友好的界面。检索引擎就是一些测量相似性的一些函数。索引过滤就是为检索引擎提供快速检索。1 3 2 图像特征的描述图像检索中常用的视觉特征主要包括图像的颜色、形状、纹理、空间关系、语义等。下面简要介绍一下这些特征1 5 矧。1 3 2 1 颜色特征一幅图像给人的最直接的感觉就是颜色信息,所以颜色特征是图像特征应用最多的特征之一。颜色特征使用广泛的原因还与其具有先天优点有关,颜色特征具有尺度,旋转和平移不变性,并且颜色特征的表达很简单,很容易提取。常见的颜色特征有直方图、聚合向量、相关图、颜色矩、主色等。( 1 ) 颜色直方图颜色直方图就是一个二维坐标,横轴表示颜色,纵轴表示比例。颜色直方图描述的是图像中每种颜色的像素个数占图像总的像素个数的比例。颜色直方图也有缺点,它不能描述图像对象的具体位置,不同的图像可以有相同的直方图。颜色直方图的描述如下:设图像,是大小为mx n 的图像,其中图像,中的颜色量化值分别为厶,厶,乙。对于像素点p ( x ,j ,) ,令厶表示其颜色,那么对于颜色厶,i e m ,图像,的直方图为:眦】t 薹魏以彤p 巍( 1 1 )这样的颜色直方图就具备旋转和平移不变性,要想使其具备尺度不变性,还要对其进行归一化:m 】一嬲( 1 - 2 )归一化后的颜色直方图具备了尺度、旋转和平移不变性。( 2 ) 颜色聚合向量颜色直方图缺点之一就是不能够表达图像对象的空间位置,为了弥补直方图的这个缺点,p a s s 于1 9 9 6 年提出了颜色聚合向量。颜色聚合向量将图像的像素分为两种,一种是聚合像素,一种是非聚合像素。聚合像素是这样定义的:当某个颜色值或者是相似的颜色值的像素所占的连续区域的面积比例大于某一个阈5武汉理工大学硕士学位论文值时,则该区域的所有像素就是聚合像素,不满足此条件的像素都为非聚合像素。这样就可以统计出每一种颜色的聚合像素和非聚合像素并组合在一起就得到了向应的颜色聚合向量。聚合向量描述如下:假设图像有,种颜色,其中第f 颜色的的聚合像素数量为,非聚合像素数量为,则图像的颜色聚合向量表示为 ( 强,) ,( 2 ,m :) ,( 佛,) 。 ( 啊,) ,( 慢,) 9 o - 9 ( 协,) 就是颜色聚合向量特征。颜色聚合向量可以描述颜色分布的空间信息。( 3 ) 颜色相关图颜色相关图就是一个颜色对索引表,颜色对用o ,) 表示,o ,力的第d 个距离表示颜色为f 的像素和颜色为,的像素之间的距离小于d 的概率。如果对任意的颜色f 和颜色,都来统计其距离分量的概率,则颜色相关图的计算量将大的惊人,为了简化计算,我们只对同一种颜色来统计颜色相关图,也就是只统计颜色为珀勺颜色相关图( f ,i ) 。颜色相关图描述了图像的颜色分布情况,它可以描述某种颜色的面积情况。经过大量的实验,表明了颜色相关图检索效果要比颜色直方图和颜色聚合向量要好的多。( 4 ) 颜色矩s t r i e k e r 和o r e n g o 提出了一种简单而且有效的颜色特征表示方法,就是颜色矩。图像的颜色可以用它的矩来表示。由于颜色信息主要集中在颜色的低阶矩中,所以只用一、二、三阶矩就可以描述几乎所有的颜色信息。一阶矩主要表达的是颜色的均值信息,二阶矩主要表达的是颜色的方差信息,三阶矩主要表达的是颜色的斜度信息。颜色矩的数学描述如下:均值:以= j lj 羹f j以2j方差:q 一斜度:墨一( 1 3 )( 1 4 )0 - 5 )其中石表示象素- 的颜色值为f 的概率,n 为图像中象素点的个数。( 5 ) 主色调法对于颜色特征来说,图像中的所有颜色并不一定都是有用的,对于某一个颜色值,如果拥有该颜色值的像素数量占图像总数量的比例很低的情况下,我们就可以忽略其存在。也就是我们只对拥有的像素比例值比较高的颜色值感兴趣,我6武汉理工大学硕士学位论文们只提取这些颜色值的特征,忽略其他颜色。这就是主色调法。主色调法可以降计算的复杂度,减少噪声影响,而且对图像检索的效果基本上没什么影响。1 3 。2 2 纹理特征纹理是对物体表面细节的总称。计算机图形图像学中的纹理通常指的是物体表面的纹理即使物体表面呈现凹凸不平的沟纹。它的本质是描述像素的领域灰度空间分布规律。纹理特征是图像的常用特征,其广泛应用于医学图像分析、遥感图像分析等领域。纹理的研究方法有很多,下面介绍一下常用的纹理描述方法。( 1 ) 基于统计学的方法纹理的统计法是通过描述图像灰度的分布来达到提取纹理特征的目的。比如灰度直方图法,它属于颜色直方图的一种。前面已经研究过,颜色直方图不能描述颜色的空间信息,同样灰度直方图也不能够描述纹理的空间信息。为了解决这个问题,h a r a l i c k 等人提出了共生矩阵的方法,他利用能量、相关性和熵等统计特征来描述纹理特征。t a m u r a 等人用纹理特征的六个分量来描述纹理特征,他们分别是:对比度、规整度、粗糙度、线象度、对比度、方向性。( 2 ) 基于频域的纹理分析法频谱法的思想就是将图像原始数据转换到频域中,然后在频域中提取纹理特征。比较常用的频谱法有傅里叶变换法、g a b o r 滤波、小波变换等等。( 3 ) 结构分析法结构法认为纹理是由纹理基元组合而成,这种组合是具有一定规律的。这种组合规律就是就是图像的纹理特征。纹理基元只能够描述图像局部的纹理特征,要想得到图像的全部纹理特征,需要对不同的纹理基元进行统计分析。( 4 ) 模型法模型法的主要思想是通过图像模型来确定图像的纹理特征,比较成熟的图像模型主要有马尔可夫随机场、分形模型、多尺度子回归模型等等。模型法有一个缺点:需要通过设置参数来表达纹理特征。1 3 2 3 形状特征在计算机图形图像技术中,形状是描述图像目标对象的主要特征,对象对于描述语义来说是有很大意义。要想把图像的低层特征和语义特征相结合就必须有好的形状特征的描述方法。形状特征的描述以图像分割为基础。目前,图像分割和形状提取是一个难题,关键是图像分割没有统一的标准,不同的图像可能需要不同的算法来进行分割。因此,形状特征的描述也比较困难。常用的形状描述方有基于轮廓特征的方法和基于区域特征的方法。( 1 ) 基于轮廓特征的方法7武汉理工大学硕士学位论文轮廓特征就是对象的边界特征,常用的表示对象边界特征的方法主要有链码表示法、网格表示法、距离直方图、边界方向直方图、边界矩、傅里叶描述子等。傅里叶描述子是典型的边界特征描述子。它的主要思想就是先将对象的边界信息转换到频域,然后再在频域中提取图像的边界信息。傅里叶描述子具有平移、旋转和制度不变性。傅里叶描述方法如下:图像,中对象d 的边缘点( x ,y ) 的坐标转换到复数空间u + 少,这样,一个点f绕边界一周可以确定一个复数序列:c ( f ) 一材( f ) + j ( f )f o ,1 ,n - 1( 1 - 6 )c ( i ) 经过傅立叶变换得到c ( w )c ( w ) 专荟c ( d e x p 【一_ ,撕f 1i o ,k 一1 ( 1 - 7 )c ( w ) 就是边界特征的傅立叶描述子,傅里叶边界特征相似性度量方法用如下公式:d ( q ,a 2 ) 一( 1 - 8 )其中,t u 和f 2 j 分别是对象口1 和a 2 的边界特征,d ( c 6 ,a 2 ) 则是对象q 和a 2 的边界特征的相似度。( 2 ) 基于区域特征的方法对象的轮廓特征主要是针对对象的边界特征,对象的区域特征主要是描述对象的内部特征。区域特征主要有区域面积比、狭长度、圆形度、离散度、离心率、基于矩的方法、g e n e r i c 傅里叶变换等。下面简要介绍几种区域特征描述方法。1 区域面积比p区域面积是对象区域像素数目占图像所有像素数目的百分比,它反映的是对象的尺度特征。p :黧燃( 1 - 9 )j 暑一,图像像素总数2 离散度 ,4 娑二翌翌!m 埘nxm a x ( w i d t h ,h e i g h t )、7其中,表示对象区域中的像素的总个数,m a x ( w i d t h ,h e i g h t ) 表示对象区8武汉理工大学硕士学位论文域水平方向和垂直方向上最大的长度。3 偏心率孝偏心率也称为伸长度和离心率,它在一定程度上可以描述对象区域的紧凑性,具有旋转不变性。其计算公式为:( 1 - 1 1 )其中彳一他( 并+ 彳) ,bt ( 孑+ # ) ,分别是刚体绕x , y , zn n n 动惯量,日一啊一是惯性积。4 紧密度c :,2c i 一4 n s( 1 - 1 2 )其中,是对象区域边缘点的周长,即像素数目,s 是对象区域的面积,即像素总数。当形状为圆时,此时紧密度的值为1 。对象区域形状越接近圆形,其紧密度越小。5 基于矩的方法区域的矩是由所有属于区域内的点计算出来的。对于数字图像f ( x ,y ) ,力而言,p ,q 阶矩定义为:聊朋一x p y 9 f ( x ,y ) ( 1 - 1 3 )f ( x ,y ) 的p + q 阶中心矩定义为:6 朋- ( x 一;) ,( y - y ) 9 厂( x ,夕) ( 1 - 1 4 )驴。,蠢( x 一孔一刀( 1 - 1 5 )其中x = 鸭o ,y 一l ,即为质心坐标。厂o ,y ) 的归一化的中心矩可表示为:,7 胛。否未尝等品万,p + g 。2 ,3 ,( 1 - 1 6 )1 9 6 2 年k m h u 首次提出用7 个不变矩来表示图像形状特征。该特征具有平移、旋转和尺度不变性。破一,7 2 0 + 吼1 2( 1 1 7 )戎一2 0 一叩0 2 ) 2 + 铆三9( 1 1 8 )武汉理工大学硕士学位论文九一( 1 7 3 0 一3 仇2 ) 2 + ( 3 叩2 1 一叩0 3 ) 2( 1 1 9 )丸- ( 刀+ r h 2 ) 2 + ( 叩2 l + ,7 0 3 ) 2( 1 - 2 0 )妒黧裟嚣麓嚣m 2 1 ,+ ( 3 ,7 2 。一) 卿2 。+ 3 ) 【3 + 仇2 ) 2 一研2 ,+ ) 2 】九l 国一吼:) 【( + r h z ) 2 一向:t + ) 2 】( 1 2 2 )+ 4 吼l ( ,7 3 0 + 仇2 ) 聊2 l + ,7 0 3 )、。驴麓二恕l 慧荔2 - 麓嚣,m 劲+ ( 孤。一) 2 。+ 7 7 0 3 ) 【3 ( + 编:) 2 一2 。+ ) 2 】1 9 3 4 年z e r n i k e 提出了z e r n i k e 矩,不变矩是一种原始信息不可恢复的编码方式,而z e m i k e 矩可以看成是一种可恢复原始信息的编码,关于z e r n i k e 矩,这里不再详述。1 3 2 4 空间关系特征空间关系是指对象之间的某种空间特性的关系,空间关系主要分为对象问的拓扑关系、对象的方向关系、二维投影间隔关系。1 图像中对象间的拓扑关系拓扑关系指的是在拓扑变换下的拓扑不变量。例如,对象之间的拓扑在图像的平移、旋转、尺度的变换下保持不变,这就是拓扑不变性。e g e n h o f e r 构造出了一个由点集的边界、内部、余弦之间的交集组成的九元组,以此作为描述两个点集之间的拓扑空间关系的框架。2 图像中对象的方向关系方向关系又叫做方位关系,它定义了空间对象的方位。1 9 8 7 年p e u q u e t 和z h a n 提出了基于锥形的方向关系描述模型,1 9 9 6 年f r a n k 提出了基于投影的方向关系描述模型。3 二维投影间隔关系二维投影关系是一种用符号来表示空间对象间的方相关系。1 3 2 5 语义特征前面所介绍的颜色、形状、纹理和空间关系特征是图像的低层特征,它们是根据图像的数据信息来进行图像检索,没有考虑到图像所要描述的含义。这种含义我们把它称作是高层语义特征,它包含了人对图像的理解。含义是不能够直接从图像的低层特征中提取的。图像的低层特征与高层特征之间存在则会语义鸿沟,图像语义检索的全部问题都是为了解决语义鸿沟。解决这个问题主要有两种1 0武汉理工大学硕士学位论文方法:一是用关键字标注图像;二是创建低层特征与高层语义特征之间的映射关系。图像语义特征可以分为场景语义、行为语义和情感语义三大类:( 1 ) 场景语义:指图像所处的地理位置、天气状况等背景信息。例如一幅图像描述了一个人走在晴天的沙滩上,这里人是对象,沙滩和晴天就是场景语义。( 2 ) 行为语义:指的是对象所表现出来的动作。例如田径比赛场上正在比赛的运动员,其中运动员是对象,运动员的正在奔跑,奔跑就是行为语义。( 3 ) 情感语义:主要是指人对图像的感觉,如喜、怒、哀、乐等。1 3 3 相似性度量图像检索中,图像特征提取之后就进行图像的相似性度量,相似性度量在图像检索中起着至关重要的作用【7 埘。相似性度量的方法有很多种。下面来介绍几种常用的相似性度量方法。在这里我们以颜色直方图特征为例来说明图像相似性的方法。设q 为示例图像,为待查询图像,表示示例图像的颜色直方图;红表示待查询图像的颜色直方图。这些方法完全不仅可以应用于颜色特征,还可以应用到其他特征。1 m i n k o w s k i 距m l1q ,( g ,f ) 一( l m 朋】一曩7 ) i ( 1 - 2 4 )2 直方图相交距m im i n ( m 瑰【聊】)i ,( g ,) 。1 一旦量l 1 河= i 一( 1 - 2 5 )芝3 欧几里得距欧几里得距是r = 2 时求得的m i n k o w s k i 距m 一1l砬( g ,) 一( ( 【历卜勺【聊】) 2 ) 互( 1 - 2 6 )4 z 统计距( 1 - 2 7 )武汉理工大学硕士学位论文( ) ;m 磊- 1 培丽h j m ( g ,f ) ;【肌】培而( 1 - 2 8 )另外,还有矩、直方图的余弦距、二次距计算、m a h a l a n o b i s 距交互信息距、高斯距离等。1 3 4 算法评价评价一种图像检索算法的好坏要有一套标准的评价原则,到目前为止,图像检索算法的评价方法有很多,它们的功能也不同【9 1 。下面就准确率、查准率查全率、a n m r r 做简单介绍。1 3 4 1 准确率设图像q 所在的相关图像集为g ,图像检索算法自动输出了t 个相似图像,其中命中g 的有n 幅图像,此次检索的准确率定义为:设查询图像为,图像库中与,相似的图像个数为m ,在检索系统输出的图像中,与,相似的图像个数为r r l ,则准确率p 为:p 罟x 1 0 0 ( 1 - 2 9 )由此,平均多个查询的检索准确率就可以度量算法的检索性能。该方法适合大型图像数据库的图像检索,若图像库测试集已经提前进行了分类,如c o r e li m a g eg a l l e r y 等类型的数据库,就可以简单地将每一个图像类型作为其中每一幅图像的相关图像,由此来度量算法的检索准确率。在实际的检索系统中,检索的准确率与图像数据库有很大的关系,即使同一算法根据相同的评价方法在不同的数据库中计算出的检索准确率都可能会存在较大的差异。1 3 4 2 查准率和查全率查准率( p r e c i s i o n ) 是指在图像检索后,系统所输出的相似图像数目占所有输出的图像数目的比例。查全率( r e c a l l ) 指系统输出的查询结果中相似图像数目占图像库中所有相似图像数目的的比例。查准率和查全率是基于内容的图像检索系统中应用最多的一种评价准则。设,是一幅查询图像,n 是图像库中与,相似的图像数目,n 为一次检索后,系统输出的与图像,相似的图像个数,t 为系统输出的总的图像个数。则其查准率r ,和查全率只可分别定义为:母;号(1-30)1 2武汉理工大学硕士学位论文只。一n。丁( 1 3 1 )在一般的情况下,蜀和b 越大,图像检索系统的算法就越好,但是,这两个指标不可能两全其美,它们是相互制约的关系。查全率要求升高时,查准率则会下降,查准率要求升高时,查全率会下降。所以,只能使查全率和查准率尽可能的平衡。a n m r r ( a v e r a g en o r m a l i z e dm o d i f i e dr e t r i e v a lr a n k ) 是m p e g 7 推荐的一种性能评价方法。其评价方法如下:设n ( q 。x i 一1 ,2 固) 表示图像库中所有与查询图像吼相似的图像数目,令m = m a x ( 9 1 ) ,( g :) ,n ( q q ) ,k = m i n 4 n ( q f ) 2 m ) ,设与查询图像相似的图像在检索结果序列中所处的位置为翮后( 七) p ! 手k 。,( 1 - 3 2 )翮后( 七 k 1 1 ;七 ka n m r r 计算如下:。嗲i r a n k _ ( k ) - 0 5 - o 5 ( g f )彳n m r 肛三o 薹鱼k 盟4 - 0 5 丽- 05 丽x ( 1 - 3 3 )角( 9 1 )1 4 内容安排本论文接下来的内容主要做以下安排:第2 章主要对颜色空间进行研究,主要研究r g b 空间到h s v 空间的转换,并在此基础上将颜色进行量化。第3 章主要概述彩色图像分割,对目前的图像分割方法进行研究,并提出一种模糊聚类分割算法和一种区域生长的分割方法。第4 章对基于区域的彩色图像进行研究,提取区域特征,并进行相似性检索。提出区域匹配的改进算法,并用实验证明改进算法的有效性。第5 章是对本论文的一个总结和对相关课题的一个展望。1 3武汉理工大学硕士学位论文第2 章颜色空间根据人眼的视觉结构,所有的颜色都可以看做是红绿蓝三个基本的颜色的不同组合。区分颜色的常用的三个基本特性量是亮度、色调和饱和度。亮度与物体的反射率有关。对于彩色图像来说,颜色中掺入的白色越多就越明亮,掺入黑色越多亮度就越小。色调指的就是颜色的类别,如红色和黄色属于不同的色调。饱和度就是颜色的饱和程度,饱和度越大,颜色越深【1 们。2 1 颜色空间分类为了正确的使用颜色特征,需要建立颜色空间。目前的颜色空间主要分为两类:一类是面向电视机、打印机之类的硬件设备的颜色空间,如r g b 、y c r c b 、c y m 、y u v 等。第二类是面向彩色处理的颜色空间,如h i s 等。下面介绍一些常用的颜色空间,以及从r g b 到它们之间的转换。2 1 1y u v 颜色空间刚u - 篡01 4 7 巍- 02 8 9 剐- - 04 3 6grb弘,il = 1 i( 2 1 )【y j 【o 6 1 5 - 0 5 1 5 - o 1 0 0 j 【j2 1 2y c r c b 颜色空间cyr】=呈0:259090。0三0三48177。8三0。:01841。3】gcb0 1 6 8 70 3 3 1 30 5 0 0 0br】c 2 - 2 ,liilliil = i一一1 il( 2 2 )ili 一一iiiljljlj2 1 3h sl 颜色空间1 4武汉理工大学硕士学位论文,代+ “+ 拶,_ 一3s 。1 一m i n ( r , g , b )h 。a t c c o s 坐垒竺墅兰坐兰4 ( e g ) 24 - ( 只一b x o b )2 1 4h s v 颜色空间( 2 3 )h s v 用色调、亮度和饱和度表达颜色,从r g b 到h s v 的转换是非线性的。h s v 空间具备自然性,而且具备相当的一致性。因此,可以定义一个h s v 量化的颜色q ,以产生同时具备紧凑性和完整性的颜色集。r g b 空间到h s v 空间的转化如下:设 ,m a x ( r ,g ,6 ) ,则1 ,一5 ( 2 - 4 )s 。v - m i n ( _ r , 一g , b ) ( 2 - 5 ) 一( 5 + 6 ) ,矿r = m a x ( r ,g ,6 )a n dg ;m i n ( r ,g ,6 )( 1 - 9 9 ,f ,- 一m a x ( r ,g ,6 )a n dg m i n ( r ,g ,6 )o + r 1 ) ,fgi m a x ( ,g , b ) 册d6 _ m 毗g , b )( 3 - b 1 ) ,矿g m a x ( r ,g ,6 )a n db m i n ( r ,g ,6 )、7( 3 + 9 9 ,fb m a x ( r ,g ,6 )a n d ,nm i n ( r ,g ,6 )( 5 一,) ,o t h e r w i s eh 一6 0 x h ( 2 - 7 )其中:山瓦而v t _ r ,g f 西,瓦而v - b2 1 颜色量化大多数彩色图像都是真彩色的格式,所谓真彩色值的是r g b 中的每一个颜色分量用8 位长度来表示,则真彩色一共有2 2 4 种颜色。虽然用真彩色来表示图像可以使图像的颜色不失真,但是给图像处理带来了庞大的计算复杂度,因此采用真彩色进行图像处理和检索是不现实的。颜色量化就是用较少的颜色来近似的表示颜色集,它大大减少了计算的复杂度。颜色量化主要分为均匀量化和非均匀武汉理工大学硕士学位论文量化。均匀量化中,颜色空间被分为相等的空间,每一个空间只用一种颜色表示。而非均匀量化是将颜色空间划分成一系列的空间,各个空间并不一定相等。颜色的量化方法很多,主要有统一量化方法、流行色量化方法、中位切割量化方法、颜色对聚类量化方法、基于八叉树结构的颜色量化方法和基于方差分析的颜色量化方法。这里主要介绍一种h s v 的量化方法。颜色空间从r g b 到h s v 转换后,得到的颜色值用h ,s ,v 表示,其中为:0 s h s 2 n ,0 ss s l ,0 s ,1 。然后对h s v 空间进行非均匀量化,从而得到1 6 6 种颜色,量化后的颜色值用q 表剥1 1 j 。具体颜色量化算法如下:( 1 ) 当, 0 2 5 时,认为该颜色为黑色,即q = 0 。( 2 ) 当s 0 2i e iv 0 2 5 时,颜色认为是彩色,将h 均匀量化成1 8 个值,对应取值h = 0 ,1 ,1 7 ,把s 均匀量化成3 个值,对应取值s = o ,1 ,2 ,v 均匀量化成3 个值,对应取值v - - 0 ,l ,2 ,这样共得到1 6 2 种颜色值,其量化值为:q = 9 x h + 3 x s + v + 4 。这样图像中的每个像素值都可用q ( 0 s qs 1 6 5 ) 值来表示。1 6武汉理工大学硕士学位论文第3 章彩色图像分割3 1 图像分割概述图像分割是图像处理的关键技术,图像分割的结果直接影响了分割后的图像分析和特征提取【1 二1 4 1 。3 1 1 图像分割的定义在不同的阶段,人们对图像分割的定义提出了不同的解释。目前为止,通过集合定义的图像分割的定义普遍为人们接受。定义如下:设r 为图像的整个区域,对r 的分割就是把r 分成n 个非空子集蜀,心,皿,这n 个非空子集满足以下条件:( 1 ) u 足一r( 2 ) 爻于f = l 2 ,p ( r ) = t r u e( 3 ) 对v f ,f _ ,有rnr j 一( 4 ) 对v f ,f j ,p ( ro r j ) - f a l s e( 5 ) 对f = 1 , 2 ,r 是连通的区域条件( 1 ) 表示分割后的所有子区域的并集就是原来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 没有签劳动合同补偿协议
- 合同协议写作
- 社团合作合同范本
- 工地合同解除协议
- 劳动合同和就业协议书
- 集装箱码头服务协议合同
- 车有事故怎么写合同协议
- 个体联营协议合同
- 广告协议委托合同范本
- 医药销售合同协议
- 【公开课课件】《农业区位因素及其变化》
- (必会)军队文职(数学1)近年考试真题题库(含答案解析)
- 小学女生生青春期心理健康教育五六年级(共14张课件)
- 疫苗预防接种知识竞赛题库及答案2022
- 【贸易战背景下华为公司危机应对措施及其启示18000字(论文)】
- 水泥标准培训考核2024
- 图书馆运营管理服务投标方案(技术方案)
- (落地式、悬挑式脚手架)设备设施风险分级管控清单
- DL∕T 5046-2018 发电厂废水治理设计规范
- DL∕T 1084-2021 风力发电场噪声限值及测量方法
- NB-T47023-2012长颈对焊法兰
评论
0/150
提交评论