版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、-PAGE . z.摘要随着多媒体及网络技术的开展,互联网中的图像等多媒体信息的数量在迅速增加。如何在庞大的多媒体数据资源海洋中搜索到自己所需要的图像,随之成为一个函待解决的问题。近年来基于容的图像检索技术己经成为了研究的热点,该技术具有传统文本检索方式所无法比较的优越性,目前已被应用于多媒体通信、生物识别、知识产权保护等方面,具有广阔的开展前景。本课题设计了基于颜色特征的图像检索系统,该系统主要包括两个关键步骤:颜色特征的提取和相似度匹配。本文中首先采用应用广泛的HSV颜色空间来表示图像的颜色特征,对颜色分量进展非等间隔量化形成特征矢量;然后用欧式距离度量函数进展图像的相似性匹配;最后在MA
2、TLAB平台下编程实现了基于颜色特征的检索系统。根据用户输入的样本图像与图像库中的图像进展特征匹配,找出与样本图像距离比较小的假设干幅图像,并按照图像之间的距离由小到大的顺序显示给用户。关键词: 图像检索;直方图;颜色特征;MATLAB-. zABSTRACTWith the development of multimedia technology, In Internetthe number of images and other multimedia information in the rapidly increasing. How to locate the useful image
3、in the vast multi-media is a great technology problem.In recent years, Content-based image retrieval has bee a research focus, the technology has the superioritywhich the traditional te*t retrieval methods can not match. It has been widely used in multimedia munications, biometrics, intellectual pro
4、pertyprotection and so on, and has broad prospeets for development.This topic is designed based Color Image Retrieval System,which includes two key steps: color feature e*traction and similarity matching. In this article was first used widely HSV color space to represent color feature image.We carri
5、ed out color ponents quantification of non-interval to form feature vector;Then use the Euclidean distance metric function to match the similarity functionof the image. Finally, this system should be implemented under the platform of the MATLAB by programming.Under user input sample image to conduct
6、 feature matching with image which in library images. In this system, It also can identify the images that have a short distance to the sample images, And in accordance with the distance between the images displayed to the user in the order from small to big.Keywords: Image Retrieval;HistogramAlgori
7、thm; Color Features;MATLAB -. z目录 TOC o 1-3 h z u HYPERLINK l _Toc264449470摘要 PAGEREF _Toc264449470 h IHYPERLINK l _Toc264449471ABSTRACT PAGEREF _Toc264449471 h IIHYPERLINK l _Toc2644494721绪论 PAGEREF _Toc264449472 h 1HYPERLINK l _Toc2644494731.1选题背景及现状 PAGEREF _Toc264449473 h 1HYPERLINK l _Toc264449
8、4741.2基于颜色特征图像检索的特点及开展趋势 PAGEREF _Toc264449474 h 2HYPERLINK l _Toc2644494751.3论文构造 PAGEREF _Toc264449475 h 5HYPERLINK l _Toc2644494762颜色模型及转换 PAGEREF _Toc264449476 h 6HYPERLINK l _Toc2644494772.1概述 PAGEREF _Toc264449477 h 6HYPERLINK l _Toc2644494782.2颜色模型 PAGEREF _Toc264449478 h 6HYPERLINK l _Toc264
9、4494792.2.1 RGB颜色模型 PAGEREF _Toc264449479 h 6HYPERLINK l _Toc2644494802.2.2HSV颜色模型 PAGEREF _Toc264449480 h 8HYPERLINK l _Toc2644494812.3颜色模型转换 PAGEREF _Toc264449481 h 9HYPERLINK l _Toc2644494823颜色特征提取的方法 PAGEREF _Toc264449482 h 11HYPERLINK l _Toc2644494833.1颜色直方图 PAGEREF _Toc264449483 h 11HYPERLINK
10、l _Toc2644494843.2累加直方图 PAGEREF _Toc264449484 h 13HYPERLINK l _Toc2644494853.3颜色矩 PAGEREF _Toc264449485 h 15HYPERLINK l _Toc2644494864颜色特征检索匹配算法 PAGEREF _Toc264449486 h 17HYPERLINK l _Toc2644494874.1直方图相交法 PAGEREF _Toc264449487 h 17HYPERLINK l _Toc2644494884.2欧式距离法 PAGEREF _Toc264449488 h 17HYPERLIN
11、K l _Toc2644494894.3二次式距离 PAGEREF _Toc264449489 h 18HYPERLINK l _Toc2644494905基于颜色特征的图像检索系统的设计和实现 PAGEREF _Toc264449490 h 19HYPERLINK l _Toc2644494915.1开发工具的选取 PAGEREF _Toc264449491 h 19HYPERLINK l _Toc2644494925.2系统框架 PAGEREF _Toc264449492 h 19HYPERLINK l _Toc2644494935.3性能评价 PAGEREF _Toc264449493
12、h 27HYPERLINK l _Toc264449494总结与展望 PAGEREF _Toc264449494 h 30HYPERLINK l _Toc264449495致 PAGEREF _Toc264449495 h 31HYPERLINK l _Toc264449496参考文献 PAGEREF _Toc264449496 h 32HYPERLINK l _Toc264449497附录: PAGEREF _Toc264449497 h 34-. z绪论伴随着信息社会的迅速开展,图像多媒体信息的来源不断扩大。文献中,图像信息也被称为信息技术中的一等公民(first-class citize
13、ns)。目前,各种图像数据库(包含各类专用图像数据库、Internet 图库等)中都有大量的图像,其中少则几十上百,多则成千上万,这些图像数据库随着时间的推移还会不断地膨胀。怎样从这些海量数据中快速提取感兴趣的目标图像,己经成为制约信息获取、流动的关键问题之一。因此,对图像数据检索技术的研究己经成为信息技术处理领域的一个重要而又关键的问题,它不但具有很高的研究价值,更具有广泛的应用前景,并将为信息高速公路、数字图书馆和数字地球等方案的成功实施奠定坚实的理论根底。而本文是把图像检索技术的一个重要手段:基于颜色特征的图像检索技术作为研究的重点。选题背景及现状随着Internet网络技术的不断开展,
14、网络用户越来越多,网络已成为目前最重要的信息来源之一。事实上,来自网络的信息量比任何一种渠道的信息量都要大。所涉及的领域之广、更新速度之快和搜集本钱之低也是其他任何手段无法比较的。网络将会改变人类的一切,这已不是谣言,而是一个不争的事实。但是,网络确实是一个名副其实的双刃剑,利用好它可以发挥它无穷的威力;反之,就会给自己带来无穷的祸患,给国家带来巨大的损失。从广义上讲,网络就是一个巨型数据库,人人都可以从中取到自己所需的东西。利用搜索引擎合法的在网上搜索特定信息本身就是网络的建立目的之一。目前,国外许多研究者正在研究基于网络的信息收集和检索技术。特别是随着网络的普及,数据检索和收集显得越来越重
15、要,已成为人们到达特定目的最有效的方法和手段之一。随着我国社会经济的开展,使得从公共媒体到家庭娱乐、从自然科学到社会科学,每一个领域都渗透着对多媒体技术和因特网技术的应用,都要求对各种资料的智能化的管理。国较有代表性的系统有:大学计算机系研究的基于图像颜色的检索系统Photo Navigator、清华大学的Internet上静态图像的基于图像容检索的原形系统、中科院计算技术研究所数字化技术研究室开发的Image Hunter系统、邮电学院研制的基于纹理和颜色特征的实验系统等。这些系统的框架和查询的处理过程都很相似,只是采用的特征和搜索方法各具特色,性能也互有差异。国外著名系统如:IBM公司的Q
16、BIC系统,是IBM公司与20世纪90年代开发制作的图像和动态景象检索系统,是第一个商用基于容的图像检索系统,它的系统构造及所采用的技术对后来的检索系统有很深远的影响。QBIC支持基于例如图像、用户构造的略图、选择颜色、纹理等的查询。另外国外其他典型系统代表有:Virage公司的VIR工程系Photo book系统、哥伦比亚大学的Visual SEEK和WEB SEEK查询系统以及美国伊利诺斯大学的MARS系统等。基于颜色特征图像检索的特点及开展趋势在图像的形状,颜色,纹理等特征中,颜色特征是最可靠,最显著,最稳定的视觉特征,也是人识别图像的主要感知特征,相对于几何特征而言,颜色对图像中子对象
17、的大小和方向的变化都不敏感,具有相当强的鲁棒性。同时,在许多情况下,颜色又是描述一幅图像最简便而有效的特征,人们对于一幅图像的印象,往往从图像中颜色的空间分布开场。所有这些都促使颜色成为基于容的图像检索所采取的主要手段之一,而本文正是着重于这一点,把基于颜色特征的图像检索技术作为本文的研究容。目前,基于颜色特征的图像检索的研究主要是借助图像的颜色特征来进展的,其根本工作原理是在建立图像库时,分析输入图像,提取图像的颜色特征作为特征向量,与图像一起存储在数据库中。图像检索时,则提取给定查询例图像的特征或由用户指出要查询图像的特征,与数据库中的特征向量进展匹配,并根据匹配结果返回相应图像。如图1-
18、1所示: 基于颜色特征的图像检索系统构造图。图1-1 基于颜色特征图像检索系统构造图基于颜色特征的提取和检索是一个逐步求精的过程,存在着一个特征调整、相似匹配的过程,如图1-2所示:1提查询要求。用户查找一个数据对象时,利用系统人机界面提供的输入方式形成一个查询条件。2相似性匹配。用户提交的查询要求经处理形成查询特征,将查询特征与数据库中的特征按照一定的匹配算法进展匹配。3返回查询结果。满足一定相似性的一组候选结果按相似度大小排列返回给用户,因此,系统人机界面要有显示浏览查询结果的功能。图1-2基于容图像的原理图基于颜色特征的图像检索具有以下主要特点:(1) 从图像容中由计算机自动提取视觉特征
19、,并根据这些特征从图像数据库中查找、检索出具有相似特征的图像数据。(2) 使用相似匹配代替准确匹配。在基于颜色特征的图像检索中,通常采用相似匹配方式,从而获得类似图像,并不断缩小检索围,直至定位于所要求的目标,与传统数据库检索的准确匹配不同。(3) 直观的可视化查询方式,交互性强。基于颜色特征的图像检索通常采用例检索方式。(4) 满足多层次的检索要求。系统通常包含图像库、特征库,用户可以向系统提交与所需查询的图像一致或类似的例图进展特征的检索。基于颜色特征的图像检索技术当前的开展趋势可以概括为以下几个方面: 改良现有的基于颜色特征的图像检索技术。包括继续完善图像的相似性度量、特征提取和描述等问
20、题。 相关反应技术。人们对图像检索结果的判定具有一定的主观性,所提取的特征还不能完整而准确地描述图像容。因此很难一次搜索就得到满意的检索结果。图像的检索技术需要根据具体应用场合和使用者不同而调整,这样便可以将用户的特殊需求反应给系统,以使检索效果更接近用户的要求。高维索引技术。图像检索系统想有更好的扩展性,要利用高维索引技术。论文构造本文的容构架介绍如下:第一章 绪论,主要介绍了课题背景和当前国外研究现状,说明了基于颜色特征的图像检索技术的原理和基于颜色特征的图像检索的特点和开展趋势,明确了本文的主要研究容。第二章 描述常用的RGB、HSV颜色模型,并且比较了两种颜色模型的异同,提出了二者的转
21、换原因、转换公式。第三章 分析了几种常用的颜色特征提取方法:颜色直方图、累加直方图、颜色距等,并对其做了相关比较。第四章 介绍了常用的基于颜色特征的特征匹配算法:直方图相交法、欧氏距离法和二次式距离法。把欧式距离法作为本文所用的匹配算法。第五章 系统功能的设计与实现,根据本文所提出的方法实现了一个基于颜色特征的检索系统,并通过系统实验根据其检索效果进展了比较和性能分析。-. z颜色模型及转换概述颜色模型是指*个颜色空间中的一个可见光子集,它包含*个颜色域的所有颜色,颜色模型的用途是在*个颜色域方便的指定颜色,由于每个颜色域都是可见光的子集,所以任何一个颜色模型都无法包含所有的可见光。常见的模型
22、包括HSV色调、饱和度、亮度V,RGB(红、绿、蓝),CMYK青,洋红,黄,黑以及CIE组织的L*a*b等。本文在此只探讨HSV与RGB两种常用的颜色空间模型。颜色模型 RGB颜色模型RGB颜色模型又称RGB颜色空间,它是一种色光表示模式,是使用最多、最熟悉的颜色模型。计算机定义R、G、B三种颜色成分的取值围是0-255,0表示没有刺激量,255表示刺激量达最大值。R、G、B均为255时就合成了白光,R、G、B均为0时就形成了黑色。R、G、B为三原色,各个原色混合在一起可以产生复合色,如图2-1所示。绝大局部的可见光可以用R、G和B三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色
23、、洋红和黄色。因为RGB颜色合成产生其它颜色,它们也称为加色。 图2-1 RGB三原色混合效果把R、G、B三种色彩作为任何色彩的根本色的理论即为三原色原理,原理指出:(1)自然界的可见颜色都可以用三种原色按照一定的比例混合得到,反之,任意一种颜色都可以分解为三种原色。(2)作为原色的三种颜色应该相互独立,即其中任何一种都不能用其他两种混合得到。(3)三原色之间的比例直接决定混合色调的饱和度。(4)混合色的亮度等于各原色的亮度之和。根据R G B三原色原理,由R G B三原色可构成一类颜色空间,各种颜色的光均可以通过R、G、B三种基色混合而成。RGB颜色模型通常采用图2-2 所示的单位立方体来表
24、示,在正方体的主对角线上各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。(0,0,0)为黑色,(1,l,1)为白色。正方体的其它六个角点分别为红、黄、绿、青、蓝和品红。 图2-2 RGB颜色模型 RGB色度系统在计算机彩色输入输出设备中的应用非常普遍。常见的如CRT显示器,它利用红、绿、蓝色的荧光粉显示颜色,RGB三色荧光点被不同强度的电子束击中,就会产生各种色彩,通过控制电子束的强弱和通断,则可以形成各种绚丽多彩的画面。扫描仪和数码照相机也都是工作于RGB颜色空间的,它们捕捉的是图像的红色、绿色和蓝色信息。RGB颜色空间的缺点是:改变一个颜色时,三个通道上的颜色全部需要修改:它不是
25、均匀视觉的颜色空间,颜色空间上的距离,并不代表人眼视觉上的颜色相似性。2.2.2 HSV颜色模型HSV颜色空间是一种面向视觉感知的颜色模型,HSV空间能够较好的反映人眼对色彩的感知和鉴别能力。它直接对应于人眼颜色视觉特性三要素,即色调H、饱和度S和亮度V,通道间各自独立。色调H表示从一个物体反射过来的或透过物体的光波长,即是光的颜色,不同波长的光呈现不同的颜色,具有不同的色调。饱和度S表示颜色的深浅程度,饱和度高颜色深,如深蓝。饱和度低则颜色浅,如浅蓝。饱和度的深浅与颜色中参加白色的比例有关,它反映了*种颜色被白色冲淡的程度,白色成分为O,则饱和度为1 OO,只有白色,则饱和度为O。亮度V表示
26、人眼感觉到的光的明暗程度,与物体的反射率成正比。用一个三维空间锥体可以将色调、饱和度、亮度表示出来如图2-3示:色调H被表示为绕圆锥中心轴的角度,饱和度S被表示为从圆锥的横截面的圆心到这个点的距离,亮度V被表示为从圆锥的横截面的圆心到顶点的距离。 图 2-3 HSV颜色模型HSV颜色空间具有两个大特点:其一,亮度分量与图像的彩色信息无关:其二,色调和饱和度分量与人感受颜色的方式是严密相连的。颜色模型转换HSV颜色空间是一个均匀颜色空间,其转换是一个非线性变换。一幅图像中的RGB值(R,G,B)通过非线性转换可转换到HSV空间值(H,S,V)。一般情况下获取的图像都是在RGB空间描述的,但是RG
27、B空间构造并不符合人们对颜色相似性的主观判断,所计算出来的两种颜色之间的距离无确表征人们实际所感知到的两种颜色的真实差异。而HSV颜色空间由色调(H)、饱和度(S)、亮度(V)三个分量组成,与人眼的视觉特性比较接近,其中亮度表示颜色的明暗程度,主要受光源强弱影响;色调表示不同颜色,如红、绿、黄;而饱和度表示颜色的深浅如深红、浅红。显然,HSV空间要比RGB空间更直观,更容易承受。因此,为了更符合人眼的视觉特征,经常需要做颜色空间的转换,将RGB颜色空间转换为HSV颜色空间,转换公式如公式。= 2.1= 2.2 = 2.3 ma*=ma*(,) min=min(,)设定义为:则v=255 (2.
28、4) (2.5) 这里,。设HSV空间颜色C=(h,s,v和C=(h,s,v,则色彩C和色彩C的相似性S可以定义为公式: (2.6) S0,1 ,C,C越相似,S数值越趋近于1。C,C之间的距离最大时,这时的数值就越趋近于0。颜色特征提取的方法颜色是一种能简化目标提取和分类的重要描述符,对颜色的特征表达依赖于所用的颜色模型,最好选择与人的感觉相一致的颜色空间。最早采用颜色进展图像检索是由Swain和Ballard提出的基于颜色直方图的检索方法,其核心思想是在一定的颜色空间中对图像中的各种颜色出现的频数进展统计,然后图像之间相似的问题就转化成比较图像直方图之间的相似性问题。常用的颜色特征提取表示
29、方法有:颜色直方图、累加直方图和颜色矩等。在本文中我们把颜色直方图作为研究的重点,并在此根底上实现基于颜色特征的图像检索系统。颜色直方图颜色直方图就是根据图像中每个像素出现在色彩空间的概率统计而成的,计算颜色直方图需要将颜色空间划分为假设干个小的颜色区间,每个区间成为直方图的一个柄(bin)。然后,通过计算颜色落在每个小区间的像素数量可以得到颜色直方图。横坐标表示颜色的色彩的值,纵坐标表示每个小的颜色区间中所对应的图像像素的总和。它的优点就在于它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。颜色直方图是
30、在许多图像检索系统中被广泛采用的颜色特征表示法。在RGB颜色空间中,颜色直方图可以看成是一个离散函数,即 3.1 其中,k表示图像的特征取值,L表示特征可取值的个数,n表示图像中具体征值为k的像素个数,n表示图像像素的总个数。为了更好的使用颜色直方图,应对直方图的性质有所了解:位置无关性:直方图描述了每个灰度级的像素的个数,但不能为这些像素在图像中的位置提供任何线索。当一幅图像被压缩为直方图后,所有的空间信息将全部丧失。因此,任一特定的图像具有唯一的直方图,例如图3-1中a、b、c、d四幅图像,如果阴影局部具有一样的灰度值而且面积相等,则这四幅图像的直方图却是完全一样的,这说明了不同的图像可能
31、具有完全一样的直方图。图3-1 直方图的位置无关性叠加性:如果一幅图像由两个不连接的区域组成,并且每个区域的直方图己知,则整幅图像的直方图是该两个区域的直方图之和。显然,该结论可推广到任何数目的不连接区域。总体性: 图3-2 直方图的总体性直方图是总体灰度的概念,从直方图中可以看出图像整体的性质。如图3-2所示:直方图A表示图像总体偏暗:直方图B表示图像总体偏亮;直方图C表示图像的灰度动态围太小,许多细节必然分辨不清楚;直方图D表示图像灰度级分布均匀,给人以清晰、明快的感觉。本文采取的方法是用HSV空间的颜色直方图来描述图像的整体颜色特征,一幅图像的颜色一般很多,尤其是真彩色图像,直方图矢量的
32、维数会很多,假设对HSV空间的进展适当的量化后再计算直方图,则可以节约存储空间和减少计算复杂度。因此需要对HSV三个分量按照人的颜色感知进展量化,一般采用非等间隔量化的方法,非等间距量化就是对颜色空间每一通道的划分不采用等分的方法。如果颜色划分过于粗略,则会造成一定的检索误差;如果颜色划分过细,则计算量较大。应该兼顾检索误差与计算量,对HSV三个分量选取一个适宜的量化标准。在实际运算中对H、S、V三维特征矢量取不同的权值组合成一维特征向量以便于计算。在这三个矢量中,人眼对于颜色的划分主要依据色调H,其次是饱和度S,最后才是亮度V。同时根据H、S、V的量化级数和其频带宽度可组合成一维矢量L: L
33、=H+V (3.2)其中,Q和Q分别是分量S和V的量化级数。通过该方法即将H、S、V三维特征矢量组合成了一维矢量。累加直方图在许多应用中,图像检索结果只能由人来做主观评价。人眼对颜色的分辨能力是有限的,例如对色调(H)的微小变化不敏感。换言之,在一样亮度和饱和度下,色调在一定围微小的变化,人眼无法觉察。如何适应人的这个视觉特性,人们首先想到了加大量化间隔,将相近的颜色量化到H轴同一坐标上。有实验说明,采用一般直方图,当量化间隔时,检索效果有很大改善。但这种简单量化存在两个严重问题,首先,对两个相近颜色,这种量化既可能将它们量化到同一个H坐标上,也可能量化到不同的两个H坐标上。可见,简单的加大量
34、化间隔会导致误检。再者,色调(H)的分布有其自身的特殊性,从视觉角度来看,其相似性的分布并非均匀分布,如蓝色的相近色的分布围要比黄色的更宽些,简单的等间隔量化并不适合色调(H)信号。一般直方图方法对每个颜色分量平等对待,没有考虑颜色轴上相邻颜色的相似性,在一些情况下可能会漏检。如有三幅单色图像,颜色分别为红色、粉红色和蓝色,用欧式距离对三幅图像进展度量,结果粉红图像与红色图像的相似程度等同于蓝色图像与红色图像的相似程度,这不符合人的视觉感觉。在图3-3中给出的三幅图像的直方图,人的视觉感觉很容易判断H和H较相似,而它们与H的区别显著,但是结果却不如人意。图3-3 三幅直方图累加直方图可以较好的
35、解决这一问题。累加直方图是以颜色作为横坐标,纵坐标为颜色累加出现的频数,以此绘出的图形。这样图像的累加直方图空间可以定义为: 3.3表示种颜色的像素的累加频数: 图3-4 图3-3直方图对应的累加直方图可见,在累加直方图中,相邻颜色在频数上是相关的。累加直方图消除了一般直方图中常见的零值,也克制了一般直方图量化过细过粗检索效果都会下降的缺陷。颜色矩另一种非常简单而有效的颜色特征表示方法是由Stricker和Rengo所提出的颜色矩(ColorMoments)。这种方法的根底在于图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此仅采用颜色的一阶矩、二阶矩和三
36、阶矩就足以表达图像的颜色分布。与颜色直方图相比,该方法的另一个好处在于无需对特征进展向量化。颜色的三个低阶矩在数学上可以用公式,表达: = 3.4= 3.5= 3.6其中f表示像素j的颜色值为i的概率,N为图像中像素点的个数。 假设用Q,I表示两幅图像,则它们矩的距离公式为:= 3.7其中是用户指定的加权系数,i表示颜色通道。 颜色矩己经成功地应用于许多基于容的图像检索系统(如QBIC),特别是对于图像中只包括一个目标的时候非常有效,由于采用9个数值(三个颜色坐标轴,每个坐标轴包括三个颜色矩),所以相对于其它颜色特征而言,采用颜色矩表示颜色特征是一个非常有效的表示方法。虽然传统的颜色直方图方法
37、与其他方法相比不能很好的表达图像的空间特征,但却是最简单、最广泛使用的方法。-. z颜色特征检索匹配算法基于文本的检索方法采用的是文本的准确匹配,而基于颜色特征的图像检索则是通过计算查询图像(例如图像)和数据库图像在视觉特征上的相似程度进展匹配。因此,定义一个适宜的相似性度量方法对于图像检索的效果有很大影响。常用的相似度方法是向量空间模型(VectorsPacemodel),即将视觉特征看作是向量空间中的点,通过计算两个点之间的接近程度来衡量图像特征间的相似度。在基于颜色特征的图像检索中,经常用到的相似性度量方法,即特征匹配算法有以下方法: 直方图相交法、欧氏距离法和二次式距离方法。直方图相交
38、法令H(K)和H(K)分别为查询图像和数据库图像的*一特征统计直方图,则两幅图像之间的相似度可借助直方图相交来计算,即公式:= 4.1 该算法于1990年由Swain和Ballad提出, 由于它比二次型距离算法简便,因此,这一算法目前仍被广泛采用。欧式距离法 直方图间的距离可使用一般的欧式距离函数来衡量,即公式:= (4.2)也可以适用加权距离来衡量,即公式:= (4.3)如果采用归一化直方图,则=l,即加权距离要小于欧式距离。二次式距离二次式(quadratic distance)距离Hafner J.et 1995考虑到了不同颜色之间存在的相似度。所以在颜色直方图的比较上一般比使用欧式距离
39、或是直方图相交距离更为有效。二次式距离的计算方式如下,两个颜色直方图Q之间的二次式距离可以表示为: D=(Q-I)A(Q-I) (4.4)这种方法通过引入颜色相似性矩阵A,其中A=a表示直方图中下标为i和j的两个灰度值之间的相似度。颜色相似性矩阵A可以通过对色彩心理学的研究中获得。因为颜色直方图本身就包含了不同颜色之间的相似性因素,因此可以直接地使用欧式距离或直方图相交距离。而本文中主要运用了欧式距离来度量其相似度。-. z基于颜色特征的图像检索系统的设计和实现开发工具的选取软件开发越来越强调软件的可移植性、易修改、易维护、可扩大性、可复用性等特点,传统的构造设计思想己经不能适应强大的软件需要
40、,取而代之的是面向对象设计思想的产生。相对于传统的构造化设计思想,面向对象的数据封装性、继承性和多态性等特点使得复杂的程序开发变得简单高效,充分表达了现代软件工程的需要,并己成为软件开发的必然趋势。本系统就是采用面向对象的技术设计完成的。根据对实验系统中的颜色模型、特征提取算法等方面的设计,基于颜色直方图的图像检索实验系统。在具体的系统开发过程中,考虑到网络可扩展性与使用方便性,本文选用MATLAB程序设计语言,在Windows *P下完成。MATLAB的功能非常强大,它可以用于完成以下工作:1数据的分析和可视化。2数值的符号计算。3工程与科学绘图。4控制系统设计。5数字图像信号处理。6变成、
41、应用开发、图形用户界面设计。MATLAB语言有如下特点:1编程效率高,扩大能力强。2用户使用方便,方便绘图。3语句简单,涵丰富。4高效方便的矩阵和数组运算。系统框架该系统支持用户以给定例如图的方式检索本地图像库中的相似图片,用户只需根据提示选择例如图和想要检索的图像库,系统会自动对例如图和图像库进展特征提取,生成直方图,并计算例如图与图像库中每幅图片的相似度,最后按相似度大小排序输出显示给用户。本系统主要包括特征提取,特征匹配,结果显示三大模块,特征匹配和结果显示可以看作一个模块,总体框图5-1所示:。图5-1基于颜色特征检索的系统框架1特征提取模块特征提取算法应简单易用,且具有自动提取的功能
42、,所选择的特征应尽可能表达原始图像的信息。同时,可以借助一些先进的数学工具来提取图像特征,如基于泛函分析和小波分析的特征数据表示等。总之,特征提取是检索方法成功与否的关键步骤。如图5-2所示: 图5-2 特征提取流程图通过Matlab程序实现对输入一幅彩色图像,绘制直方图,最后输出原来的输入图像和原图像的直方图。以下图5-35-5分别给出了实验结果: 图5-3输入的原来图像图5-4 RGB三原色颜色直方图图5-5 颜色直方图2特征匹配模块关键图与图像库中的一幅图片通过特征提取模块分别得到其直方图后,通过特征匹配模块计算相似度,再将图片库中每幅图片与关键图的相似度传递给图像显示模块排序输出。如图
43、5-6所示: 图5-6 颜色特征匹配3图像显示模块该模块从特征匹配模块的匹配结果中获得与关键图最为匹配的几幅图像的路径信息,根据该信息将图像显示给用户,如图5-7所示: 图5-7所示检索结果在对系统进展了屡次调试运行后,系统根本到达设计目标,以下图5-85-11所示为四次检索结果的实例。可以看到,根据用户提供的查询关键图,系统从用户选择的图像库中检索到与关键图相似的图片并排序返回给用户。实验中选择了600多幅图像作为测试图像,根本到达了预期效果。左边一幅为待查询图,其余从左到右相似度依次减小。以大海为例的检索结果为:图5-8以大海为例的检索结果以沙滩为例的检索结果为: 图5-9 以沙滩为例的检
44、索结果以绿树为例的检索结果:图5-10 以绿草为例的检索结果以河流为例的检索结果:图5-11 以河流为例的检索结果性能评价(1) 查全率Reacall与查准率Precision是信息检索中的标准评价方法,现在已被越来越多地使用在基于容的图像检索当中。以下用图5-12的a,b,c,d的关系来说明检索过程的查全率和查准率:图5-12 a,b,c,d关系示意图(图中a+b+c+d=Q a+c=A a+b=B)图中Q为整个图像数据库,A代表相关图像的集合,B代表检索出的图像集合。则查准率 5.1 查全率 5.2 即表示的意思如下:查全率的主要是在一次查询过程中,用户所查到的相关图像的数目和数据库中与目
45、标图像相关的所有图像数目之比;而查准率主要指在一次查询过程中所查到的相关图像数目同该次查到的所有图像数目之比。用户在评价算法的时候,可以预先选定含有特有目标的图像作为一组相关的图像,然后根据返回的结果计算查全率和查准率。查全率和查准率越高,说明该检索算法的效果越好。分别对大海 、沙滩、绿树和河流用本文中的系统进展屡次检索,对检索结果中查全率、查准率的数据进展统计,检索结果如下表5-1所示:表5-1 检索结果用查全率R作为* 轴,查准率P作为y 轴,绘制一条查准率-查全率曲线,简称为PVR曲线。如图5-13a所示:设PVR曲线为,则与-轴围成的面积为: 5.3 称为PVR指数。如图5-13b所示
46、:据研究,该指数越大,图像检索性能越好。 图5-13a PVR曲线 图5-13b PVR指数由P,R,可得E。E越大,图像检索性能越好;E越小,图像检索性能越差。如果E=1,则图像检索性能到达最正确,其PVR曲线为如图5-13c所示: 图5-13c 由此可以看出,查全率反映检索的全面性,而查准率则反映检索的准确性,因此可以用查全率和查准率来评价系统的有效性。该方法的局限性在于没有考虑检索结果中相似图像所处的位置,同时,高的准确率与查全率并不一定说明一个系统工作得好,这还要视具体的应用而定。(2) 匹配百分比对匹配问题,理想情况下是正确图像是检索结果中的第一个。通常用下面的式子评价匹配效果:MP
47、=100% 5.4 其中N为图像库中目标图像的总数,R代表在检索结果中的排位。(3) 排序评价方法 设查询的返回图像幅数为N,在N幅返回图像中,为检索到的相关图像的数目,为相关图像的排序序号,为实际的相关图像数,则评价参数如下: 检索到的相关图像的平均排序为理想的相关图像的平均排序为相关图像的丧失率r 为表示理想情况下的平均排序, 越接近,表示查询效果越好。总结与展望本文先谈了图像检索技术的当前的国外现状,这也主要是说明该课题研究的必要性。接着又探讨了目前基于容的图像检索技术中的关键技术和检索原理和检索流程,为下面进一步的研究打下理论根底。主要介绍的是其中的颜色特征理论和颜色直方图理论,又对利
48、用直方图算法所用到的根底理论进展介绍,对其中涉及到的颜色模型、颜色直方图、颜色特征提取、相似性度量等进展了研究。并建立了相应的图像检索实验系统,实现了利用颜色特征进展图像检索,取得了良好的效果,该系统可视性好、检索直观、方便,可支持例如查询。并探讨了不同颜色的物体在图像检索中的查准率和查全率,证明了这种方法的有效性。目前,基于容的图像检索主要利用图像的视觉特征进展检索,而利用图像语义特征的图像检索,也是今后图像检索开展的重点方向在基于容的图像检索领域,在诸多研究方面,如视觉特征提取、多特征组合检索,以及高维索引的构造等己经取得定进展,然而依然还有许多有待进一步解决的问题:(1) 从自动分析到人
49、机交互。基于计算机视觉的模式识别系统和图像检索系统的根本区别在于后者中人的参与是不可缺少的。早期人们强调全自动意义上的单一最正确特征选择,现在更强调交互式系统。(2) 高效存储及检索技术。网络扩展的一个副产品是多媒体,特别是图像和视频数据的海量膨胀。为了保证检索速度和效率,需要不断的研究高性能的数据存储及检索方法,包括高维索引技术。通用的面向一般应用的存储及检索模型将对图像检索系统的实用起到极大的促进。(3) 性能评价及测试标准。任何技术都是由其相应领域的性能评价的准则向前推动的。由于图像及视频容不但丰富,而且具有很大程度上的主观性,其检索性能的评价准则制定起来具有相当的难度。-. z致随着毕
50、业设计论文撰写的完毕,我的大学生活也走到了尾声。在此,我想对我的家人、我的教师和同学们表达由衷的意。感教育过我的众多教师们。是你们引领我们在知识的海洋中航行,教授了我们则多的专业知识。教师们渊博的专业知识、严谨的治学态度、精益求精的工作作风和诲人不倦的高尚师德对我们都将产生深远的影响。同时衷心地感我的导师王科平教师给予的悉心指导、教导和鼓励。王科平教师花费了大量的时间和精力,在论文的整个完成过程中,包括选题、收集相关资料、算法的设计到最终的论文撰写,王教师都给予了悉心的指导。使我不仅在专业知识方面得到进一步提升,更从中学会了从学术的角度,结合实践的需要进展探讨研究,做到学以致用。值此,谨向王科
51、平教师给我的教导和关心表示衷心的感。感我的同学及朋友们。大学期间我们同学习同娱乐,一起成长一起进步建立了深厚的友谊。尤其在最后的毕业设计阶段,大家在一起交流经历和方法让我又学到了很多知识。还要感我的母校理工大学。它为我们提供了一个这样舒适宜人的生活学习环境。我们将牢记明德任责的校训,好学力行的学风热情百倍得投入到工作中去。最后向我的父母表示深深的感,感他们对我的养育之恩以及在学习、生活各方面所给予我的支持和鼓励,他们的关爱是我十几年来求学的强大动力,也是我能顺利地完成学业的坚强保障。衷心的感他们!-. z参考文献1 阮秋琦.数字图像处理学.:电子工业,2000.1331402 王晓丹,吴崇明.
52、基于MATLAB的系统分析与设计.:电子科技大学,2000.1091723 君顶,珊.图像低层特征提取与检索技术.:电子工业,2009.49844 周明权,耿,韦娜.基于容图像检索技术.:清华大学,2007.113 ,17555 王禹,弼强,郭志刚等.基于广义直方图的图像检索方法.计算机工程与应用,2002.81836 忠伟,章毓晋.利用颜色特征进展图像检索.电子技术应用,1999.19207 夏德深,傅德胜.现代图像处理技术与应用.:东南大学,1997.8 Michael Swain and Dana Ballard. Color inde*ing. International Journa
53、l of puterVision,1991.9 朱虹等.数字图像处理根底.:科学,2005.16817310 有锋.基于颜色和纹理特征的图像检索相关算法研究:硕士学位论文.2009.151711 人厚,平安.精通MATLAB综合辅导与指南.:交通大学,1998.30035712 贾永红.数字图像处理.:大学,2003.101213 朱志刚,石定机.数字图像处理.:电子工业,2002.14 J Hatner, H S Sawheny, et al. Efficient color histogram inde*ing for quadratic form distance functions .
54、IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995. 17(7):729735。15 Rafael C.Gonzalez,Richard E.Woods著阮秋琦,阮宇智等译:数字图像处理.:电子工业,2003.16 网冠科技:MATLAB 6.0时尚创作百例.:机械工业,2002.17 韦娜,耿,周明全.结合颜色和空间信息的图像检索算法J.计算机应用与软件, 2003.20(8):3418 君顶,珊著.图像底层特征提取与检索技术.:电子工业, 2009.117,4973附录:颜色特征提取程序如下:定义 col
55、orhist = colorhist(rgb)% 颜色直方图计算% 输入: M*N*3的RGB图像数据% 输出: 1*256 的颜色直方图 = (H*S*V = 16*4*4)% 作为通用的颜色直方图描述rgb=imread(E:可以用的程序glasgow.jpg,jpg);BW = rgb;R=BW(:,:,1);REDcounts,* = imhist(R);G=BW(:,:,2);Greencounts,y = imhist(R);B=BW(:,:,3);Bluecounts,z = imhist(R);figure;subplot(131);imhist(R);title(histog
56、ram of Red);subplot(132);imhist(G);title(histogram of Green);subplot(133);imhist(B);title(histogram of Blue);Histcounts=REDcounts+Greencounts+Bluecounts;Histogramdata=Histcounts;% 检查输入if size(rgb,3)=3 error(3 ponents is needed for histogram);end% 非间隔量化% H量化成16级;% S量化成4级;% V量化成4级;% 转换到HSVhsv = uint8(255*rgb2hsv(rgb);imgsize = size(hsv);i0=round(0.05*imgsize(1); i1=round(0.95*imgsize(1);j0=round(0.05*imgsize(2); j1=round(0.95*imgsize(2);
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度个人贷款合同电子合同续签服务3篇
- 2025年度个人货车租赁合同绿色物流服务标准3篇
- 2025年度个人房屋室内装修设计与施工环保评估合同4篇
- 2025年度个人房产投资合作合同范本2篇
- 二零二五年度新型面包砖研发与应用合作协议4篇
- 征收补偿协议书(2篇)
- 2025年度个人旅游住宿无息分期支付合同2篇
- 铁矿粉供应与采购合同2025版5篇
- 财务季度报告模板
- 2024年注册城乡规划师考试题库附参考答案(满分必刷)
- 中央2025年国务院发展研究中心有关直属事业单位招聘19人笔试历年参考题库附带答案详解
- 外呼合作协议
- 小学二年级100以内进退位加减法800道题
- 保险公司2025年工作总结与2025年工作计划
- GB/T 33629-2024风能发电系统雷电防护
- 2024淘宝天猫运动户外羽绒服白皮书-WN8正式版
- 记账实操-砂石企业账务处理分录
- 2024届四川省泸州市江阳区八年级下册数学期末学业质量监测试题含解析
- 全球250个国家中英文名称及缩写
- 深静脉血栓(DVT)课件
- 2023年四川省广元市中考数学试卷
评论
0/150
提交评论