版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、. . . 基于容的图像检索方法的研究摘要近年来,随着多媒体技术和计算机互联网技术的快速发展,数字图像的数量正以惊人的速度增长。面对日益丰富的图像信息海洋,人们需要有效地从中获取所期望得到多媒体信息。因此,在大规模的图像数据库中进行快速、准确的检索成为人们研究的热点。为了实现快速而准确地检索图像,利用图像的视觉特征,如颜色、纹理、形状等来进行图像检索的技术,也就是基于容的图像检索技术(CBIR)应运而生。其中,颜色特征作为图像的一种重要的视觉特征,已得到广泛的应用。本文主要研究基于图像颜色特征的检索。选用基于颜色直方图的算法,并利用Visual Basic程序设计语言和Access数据库技术设
2、计实现了基于颜色直方图算法的图像检索系统。主要做法是:采用符合人类视觉特征的HSV颜色空间来表示图像的颜色特征,利用人对颜色的感知来对颜色分量进行非等间隔的量化并形成特征矢量,用相似性度量函数进行图像的相似性匹配,从而实现图像的检索。关键字:图像数据库;CBIR;颜色直方图;相似距离The Research of Content-based Image Retrieval MethodABSTRACTWith the rapid development of multimedia and computer network technique, the quantity of digital i
3、mage and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information.Currently, rapid and effective searching for desired image from large-scale image databases becomes an hot research topic. In order to retrieve image
4、 quickly and accurately using image visual features such as color, texture, shape,which named content-based image retrieval (CBIR) came into being. Among them, the color features as an important visual features of the image has been widely used. This paper studies the retrieval based on image color
5、characteristics. Using algorithm based on color histogram, and the Visual Basic programming language and Access Database Design toimplement the image retrieval system based on color histogram algorithm. The main approach is: to represent the image's color characteristics consistent with human vi
6、sual characteristics of the HSV color space, using the perception of color to the color component unequal interval quantization and to form a feature vector, using measure function to match image similarity, in order to achieve image retrieval.Key words: Image database; CBIR; Color histogram; Simila
7、rity distance23 / 28目录前言11.1课题背景与研究意义11.2基于容的图像检索技术研究的现状和发展方向11.3本文主要研究容22基于容的图像检索32.1概念32.2特点32.3CBIR过程的一般框架33图像特征提取与相似性度量53.1图像的文件格式53.2颜色模型63.2.1RGB颜色空间63.2.2HSV颜色空间73.2.3RGB 颜色空间到 HSV 颜色空间的转换73.3颜色量化83.4颜色直方图83.5基于子块颜色直方图算法93.6图像的相似性度量103.6.1图像的相似度103.6.2相似度计算公式104基于颜色特征的图像检索系统设计和实现124.1系统结构设计12
8、4.2图像特征数据库设计124.3系统开发环境124.4系统流程134.5系统的实现134.5.1图像的获取134.5.2图像特征的提取144.5.3图像的检索165总结18参考文献19致20前言1.1课题背景与研究意义近年来,伴随着计算机网络技术和多媒体数据库技术的迅猛发展,特别是大量图像数据的广泛应用,实现图像检索成为多媒体数据库中最基本也是最普遍的要求。传统的图像检索是基于文本方式,对图像库中的每一幅图像使用关键字进行标记,然后利用文字属性的匹配进行对图像的检索。这种基于文本的图像检索需要人工注解的工作量很大,且文本描述很难准确的表达图像中丰富的信息,常常会因为不同人对同一容的描述方式不
9、同而千差万别,造成检索的准确程度降低。在信息需求的不断增加和日益迫切的今天,原始的图像检索系统已经远远不能满足要求。因此,基于容的图像检索技术的研究越来越成为人们研究的热点。特别是多媒体容描述接口MPEG-7MPEG的全名为Moving Pictures Experts Group,中文译名是动态图像专家组。的制定和完善,更加推动了这一技术的开发和运用。基于容的图像检索技术对促进图像技术的发展具有重要的作用。首先,在检索图像的准确度上,基于容的图像检索技术把图像的颜色、形状、纹理等视觉特征作为图像的容来查找和匹配图像,通过算法实现图像特征的提取和图像间的相似性匹配,提高了检索结果的准确性。其次
10、,随着数据库技术研究的深入、计算机视觉以与人工智能的发展,我们可以对图像的这些特征进行自动的提取和匹配,大大减少了人工的工作量,从而在提高检索准确度的同时,降低了图像检索所需要的时间。目前,这项技术已经广泛应用于图像的网络搜索、遥感、数字图书馆、计算机辅助设计、地理信息系统、商标管理等诸多领域,具有广阔的应用前景。1.2基于容的图像检索技术研究的现状和发展方向目前,对图像的检索在图像索引与研究中应用最为广泛,基于图像颜色特征、纹理特征、形状特征和物体空间方位的检索方法是比较成熟的几种。近年来,基于容的图像检索引起了多交叉学科研究人员的注意。在国外,特别是在美国等发达国家,这项技术已成为一个研究
11、热点。一些科研部门、高等院校、商业公司甚至于政府机构都纷纷投入大量人力和物力进行系统的研究和开发,以期取得领先地位。目前已经推出了一些CBIR系统的产品,如美国的IBM公司、Virage和Excalibur都已经开发出了的基于图像容的相似性特征的图像库检索引擎,并在网上提供了演示站点。国的研究主要集中在基于图像颜色的查询,也有一部分基于纹理和形状的查询。自20世纪90年代以来,基于容的图像检索成为一个研究热点。目前,该技术已成功应用于人脸识别技术;针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。除此之外,它还可以解译影像数据中的建筑、村庄、耕地等不同种类的地形信息,实现对遥感图像的检索
12、。基于容的图像检索技术研究的发展方向主要有:(1)两类图像检索技术的结合传统的图像搜索引擎主要侧重于对图像容的文本描述,而图像库检索技术则更侧重于通过算法对图像容的特征的提取和匹配,它们虽然侧重不同却相互补充。如果能将二者结合起来,取长补短,则图像检索技术必将会有新的进展。(2)对基于容的编码技术的研究自20世纪90年代起,国际上就有了对基于容的图像检索技术的研究。从基本的颜色检索,到综合利用多种图像特征进行检索,推出了大量原型系统。其中,部分已经投入到实际应用中并取得良好效果。在Internet环境下,MPEG专家组制定了一个基于容的多媒体描述方案,即MPEG-7标准,对各种不同类型的多媒体
13、信息容的描述方式进行了标准化定义,从而实现CBIR与TBIR(基于图像文本特征的检索)的互连。总之,该项技术在实际中的应用会越来越广泛,而且必将在各个领域当中占据主导地位,并带动相关产业的发展,促进多媒体信息化的交流。1.3本文主要研究容本文在介绍基于颜色特征的图像检索技术的基础上,将颜色直方图作为研究重点,对CBIR技术进行了较为全面的研究,以多媒体图像数据库为平台,将CBIR作为一种信息检索技术,应用到图像数据库中,作为检索引擎来实现基于颜色特征的图像检索功能。(1)详细讨论了常见的颜色特征表示方法以与从RGB模型到HSV模型的转换和颜色特征的提取方法,采用符合人类视觉感知特征的HSV模型
14、来提取颜色特征,并按照人的视觉分辨能力将颜色量化为36柄的一维特征向量。(2)运用相似性度量算法,用户可以根据自己的兴趣,针对不同的区域,灵活地调整权重系数,更准确地实现图像颜色特征的匹配。(3)在开发工具上,选用Visual Basic 6.0程序设计语言,对图像进行了定义,完成图像特征的读入和提取,用Access数据库存放图像的特征索引向量,并通过颜色匹配算法实现基于图像颜色特征的检索功能。2基于容的图像检索2.1概念基于容的图像检索(CBIR)是指根据图像颜色、纹理、形状等视觉特征,从已定的图像库中查找含有特定特征的图像。与传统的图像检索手段不同,它融合了图像理解技术,在输入图像的同时将
15、其相应的特征向量也存入特征库。在进行图像检索时,对每一幅给定的关键图,进行图像分析,并提取图像的特征向量。将该图像的特征向量和特征库中的特征向量进行匹配,根据相似距离的大小在图像库中进行搜索就可以得到所需要的检索图了。2.2特点CBIR 方法利用图像的视觉特性,实现了用图像来检索图像。这比利用传统的文字标注等要有效的多。基于容的图像检索是根据图像的颜色 、形状、纹理等特征以与这些特征的组合来查询图像的,这是计算机图像处理和数据库技术的很好的结合。它具有以下几个显著的特点1:(1)用于检索的是反映图像容的各种量化特征;(2)使用基于相似性度量的近似查询;(3)大多采用实例查询QBE(Query
16、By Example)方法。对于基于容的图像检索有三个关键:一是要选取恰当的图像特征;二是要采取有效的特征提取算法;三是要有准确的特征匹配算法。2.3CBIR过程的一般框架CBIR系统可以看作是一个用户和图像数据库之间的一个界面或通道2,其过程的一般框架可以描述为如图2-1。用户界面查询描述匹配验证提取图像库图2-1基于容的图像检索各模块的作用:(1)查询模块:为用户提供多样的查询手段,以支持用户进行多种类型的查询;(2)描述模块:将用户查询的外部表达转化成为对图像信息容的部表达和描述;(3)匹配模块:将查询描述与库中被查询信息的描述进行匹配,确定它们容的一致性和相似性;(4)提取模块:把满足
17、既定条件的信息自动的从库中提取出来;(5)验证模块:为用户提供方便的验证手段以评价提取的效果。目前,很多基于容的图像检索系统中还包含有用户反馈机制,其主要功能是收集检索出的图像信息,根据用户自己的期望,对搜索到的图像进行粗略的判断,然后修改查询信息并提交给查询模块。3图像特征提取与相似性度量基于容的图像检索系统在进行图像检索的过程中,将关键图和被检索的图像进行图像分析,提取出这些图像的特征向量,再将关键图的特征向量和被检索的图像的特征向量进行相似性匹配,根据相似距离检索到期望的图像。由这个工作原理可知,该系统的关键点包括:选取恰当的图像格式,以便提取其有效的颜色特征;选择准确的特征匹配算法,从
18、而实现图像的相似性匹配。因此,如何恰当的提取颜色特征,以与对颜色特征如何进行有效地抽取和匹配也就成为CBIR研究领域的重点。3.1图像的文件格式本文采用的图像格式是BMP格式。BMP文件是常见的图像文件格式之一,是 Windows 操作系统中的标准文件格式。由于不进行图像压缩,所以BMP图像文件能够表达丰富的色彩信息。BMP图像文件的结构可以分为四个部分:文件头数据结构、文件信息数据结构、调色板以与图像数据。其中,文件头的长度为固定值54个字节;调色板数据对所有的不超过256色的图像模式都需要进行设置,即使是单色图像模式也不例外;图像数据既可以采用一定的压缩算法进行处理,也可以不必对图像处理软
19、件进行压缩处理,这不仅与图像文件的大小有关,而且也与对应的图像处理软件是否支持经过压缩处理的BMP图像文件相关3。图像文件的文件头和文件信息头的定义形式如下:(1)文件头(BITMAPFILEHEADER)Public Type bitmapfileheaderbftype As Integerbfsize As Longbfreserved1 As Integerbfreserved2 As Integerbfofbits As LongEnd Type该程序中定义了BMP文件的类型、大小,以与图像数据的偏移量,即从文件头开始多少个字节后是图像数据的起始。(2)文件信息头(BITMAPINF
20、OHEADER)Public Type bitmapinfoheaderbisize As Longbiwidth As Longbiheight As Longbiplanes As Integerbibitcount As Integerbicompress As Longbisizeimage As Longbixpelspermeter As Longbiypelspermeter As Longbicirused As LongBMP文件信息头基本上包含图像的所有重要的信息,包括宽度、高度和每像素的位数。3.2颜色模型所谓颜色模型2是指某个三维颜色空间中的一个可见光子集,包括某个颜色
21、域的所有颜色。常见的颜色模型包括RGB(红、绿、蓝),HSV(色调、饱和度、亮度),CMYK(青、洋红、黄、黑)等。其中,HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域。3.2.1RGB颜色空间RGB 颜色空间是一种常用的颜色空间。目前,图像采集系统以与彩色显示器等硬件显示设备大都采用了 RGB 颜色空间来表示颜色。数字图像一般也都采用这一颜色空间来表示。如图 3-1所示,RGB颜色模型是三维直角坐标颜色系统的一个单位正方体。它以红(R)、绿(G)、蓝(B)作为三基色。在空间坐标系的原点上,三基色的亮度均为零,此时代表黑色;当三基
22、色同时达到最高亮度时为白色;由等量的三基色组合而成的颜色是灰色,这些灰色点均落在RGB彩色立方体的对角线上。白黑品红蓝青红黄绿图3-1RGB颜色空间虽然RGB空间模型在实际生活中广泛应用,但是它并不具有视觉一致性,不符合人对颜色的感知心理,且RGB颜色空间上的距离并不代表人眼视觉上的差异。因此,需要用另一种符合人的视觉感知的颜色模型来表示颜色。3.2.2HSV颜色空间蓝2400品红H绿1200黄青红00SVHSV颜色空间具有视觉一致性,它比RGB颜色空间更符合人的视觉特性。HSV颜色空间把常见颜色表示为三种属性:色调 H(Hue)、饱和度S(Saturation)和亮度 V(Value)。HS
23、V模型对应于圆柱体坐标系的一个圆锥子集。圆锥的顶面对应于V=1,色调H又绕V轴给定,饱和度S取值从0到1,由圆心向圆周过度。H表示色调信息,即所处的光谱颜色的位置,通常由颜色名称来辨别,如红、橙、黄、绿等,它用角度-180180或0360来度量。饱和度S为一比例值,指颜色的深浅程度,围从0%到浓度完全饱和的100%,它表示所选颜色的纯度和该颜色最大的纯度之间的比率,即在纯色中包含白色光的成分。V表示色彩的明亮程度, 0%为最暗的黑色,而100%为最亮的白色3。HSV颜色模型如图3-2所示。图 3-2HSV 颜色空间模型HSV颜色空间直接对应于人眼色彩视觉特征的三要素,通道之间各自独立,因此可以
24、独立感知各颜色分量的变化,其中色调尤其影响着人的视觉判断。因此在基于容的图像检索中,应用这种颜色空间模型会更适合用户的视觉判断。3.2.3RGB 颜色空间到 HSV 颜色空间的转换一般情况下,人们认识到的图像都是在RGB颜色空间描述的,但在图像检索的应用过程中,HSV空间模型更适合于人的视觉感知。因此,应该将图像从RGB空间模型转换到HSV空间模型4。设r,g,b0,1,2,255,由RGB颜色空间模型到HSV颜色空间模型的转化为:设v=max(r,g,b),定义r,g,b为:r=v'-rv'-min(r,g,b),g=v'-g'v'-min(r,g,b
25、), b=v'-bv'-min(r,g,b),则 v=v/255,v0,1S=v'-minr,g,bv',max(r,g,b)min(r,g,b) 0 , maxr,g,b=min(r,g,b) ,S0,1 (3-1)5+b,若r=max(r,g,b)且g=min(r,g,b)。1-g,若r=max(r,g,b)且gmin(r,g,b)60h= 1+r, 若g=max(r,g,b)且b=min(r,g,b) ,S=0, &S0,0.251, S0.25,1 (3-2)3-b,若g=max(r,g,b)且bmin(r,g,b)3+g,若b=max(r,g,
26、b)且r=min(r,g,b)5-r, 否则 这里r,g,b0,255,h0,3604。3.3颜色量化颜色量化是指确定一组颜色以表示图像的颜色空间,然后确定从颜色空间到选定颜色集合的映射,即将颜色空间映射到一个给定大小的子集中,并使其总体误差最小。因为 CBIR 中采用的HSV颜色空间具有视觉一致性的特点,而且人眼分辨颜色的能力是有限的5。因此,在量化时可以考虑按照人的颜色感知对颜色空间进行非等间距的量化,量化结果为:0,H0,601,H60,120 0, V0,0.3H= 2,H120,180 ,S=0, &S0,0.251, S0.25,1 , V= 1, V0.3,0.8 (3-
27、3)3,H180,240 2, V0.8,14,H240,3005,H300,360量化结束后,可以将HSV颜色空间划分为LHLSLV个相似色空间,其中量化级数LH=6,LS=2,LV=3。故把三个分量合并成一个一维的特征矢量就是L=LS×LV×H+LV×S+V=6H+3S+V。这样H、S、V三个分量分布在一维矢量上,L的取值围为0,35,即颜色量化后的图像可以得到36柄的一维颜色直方图3。3.4颜色直方图对于基于颜色的图像检索系统,关键问题之一是对颜色特征的提取。目前,大部分基于颜色的检索系统都是以比例分布作为颜色的基本特征,这也就是图像的颜色直方图。颜色的直方
28、图特征是图像检索领域中提出最早、算法最简单,而且具有尺度不变性和旋转不变性2,因此成为使用最为广泛的颜色特征之一。它是在确定颜色空间的基础上,统计出图像中每种颜色分量的像素数占图像总像素数的比值,从而得到图像各种颜色分量的比例分布直方图,将其转换成为一维的特征向量,作为这幅图像的特征。颜色直方图是颜色信息的函数,它表示图像中具有同颜色级别的像素的个数,其横坐标是颜色级别,纵坐标是颜色出现的频率,即像素的个数。颜色直方图是一种概率统计的方法。它将图像中各颜色像素的个数进行统计,并用直方图的形式表达出来,具体定义为:H(P)=(hc1(L),hc2(L),hc3(L),hci(L))其中,hci(
29、L)=|Lci|N,|Lci|表示图像中所有颜色为Ci的像素的个数。这种颜色直方图只反映了图像中所占的百分比,而丢失了图像颜色的空间分布信息,也就是说两幅颜色空间分布完全不同的图像(如天空和海洋)仍可以具有一样的直方图,这势必造成检索的误差。这时,可以加进颜色的空间分部信息。3.5基于子块颜色直方图算法一般颜色直方图在算法上比较简单,但图像检索时却不够准确,因为颜色直方图相似的图像可能容差别很大。这时便可以通过利用基于子块颜色直方图算法来实现图像的检索。将图像划分为几个单元,然后分别计算这些单元颜色直方图。在计算图像的相似距离时,先计算每图像中每个单元之间的距离,然后将这些距离组合起来,便可以
30、得到图像与图像的距离。基于子块颜色直方图的图像检索方法可以采用一种比较简单的固定划分策略,将图像分解成为若干个大小一样并且互相不重叠的单元区域。同时,用户可以对自己感兴趣的子块增大权重,提高检索准确率。通常情况下,主要容位于图像的中间区域,图像的四周大多是背景画面。因此可以采用这样一种分块方法3:41325图3-3分块策略由此划分方法可知:图像的主要区域位于第5块,其余的标号为1、2、3、4的属于背景。在特征的提取过程中,提取第5块的主颜色,提取1、2、3、4块的平均颜色,剩下图像的四角部分对图像特征影响不大,往往可以忽略。提取特征的方法为:(1)计算各个分块的一般颜色直方图设二维数组LI,j
31、中存放的是图像各像素点量化后的HSV颜色值,其中i,j为各像素点坐标。数组PicCenterk中存放中心区域的一般直方图,k为量化后的HSV颜色值。(2)然后计算第5块(中心区域)的主颜色m5主颜色是指图像中出现次数最多的那种颜色,即main=取下标(maxhc)。将设定好的颜色区域窗口沿直方图从左向右移动,并记录窗口颜色的总频数。得到总频数最大的窗口位置时,此窗口颜色的加权平均值即为图像的主颜色,即main=ci×hci/hci。(3)计算1、2、3、4块的平均颜色ei,i=1,2,3,4平均颜色是一般直方图颜色的加权平均:mean=c=035c×hc/c=035hc。(
32、4)图像分块颜色特征向量由第5块的主颜色和1、2、3、4块的平均颜色共同组成了分块颜色特征向量:F=m5,e1,e2,e3,e4。3.6图像的相似性度量在基于容的图像检索中,特征的相似距离的度量也是需要解决的重要问题之一。只有在得到了图像的特征后进行特征的相似性度量,才能有效的根据相似距离进行比较,准确地实现图像检索。3.6.1图像的相似度为了达到图像检索的目的,需要对提取的特征进行相似度计算。相似度是以数值的形式来表示两幅图像之间的相似程度的度量结果,即相似距离。将图像的特征看作是坐标空间中的点,两个点的接近程度即相似度通常用他们之间的距离表示,不同类型的特征数据所采用的相似性度量函数是不一
33、样的,相似度公式的选择的恰当与否对检索的精确度有很大的影响。合适的距离算法的选择,有助于基于容的图像检索的性能提高。3.6.2相似度计算公式图像颜色特征相似关系的研究通常使用的是几何模型。对于几何相似距离的数学表达形式可以采用以下几种表示方法2:(1)欧式距离公式欧式距离是一个常见的判断两个对象相似的公式,图像X和图像Y之间的距离定义为:Sim(X,Y)=|X-Y|=i=1nxi-yi(xi-yi) (3-4)当Sim(X,Y)越大时,两幅图像在这一特征上的差异就越大,反之两幅图像就越相似。但是由于欧式距离在计算中没有考虑颜色间的相似性,不符合人的视觉感受,可以采用直方图二次型距离法克服这一缺
34、陷。(2)直方图的二次型距离这种计算距离的公式中加进了颜色相似矩阵,其形式为D (Hm,Hk) = (Hm-Hk)T A (Hm-Hk),矩阵An×n=aij,权aij表示Hm中第i个元素Hmci,与Hkcj的相似程度,aij=aji且aii=1,其中Hm为目标图像颜色直方图,Hk为库中颜色直方图。(3)分块颜色特征向量计算法对于分块颜色特征,可以采用下式计算相似距离:D(Q,T)=w5mQ-mTmQ-mT+i=1,2,3,4wi(eQ-eT)(eQ-eT) (3-5)wi=0.4, & 当i=5时 0.15, 当i=1,2,3,4时其中wi为加权系数,以上wi值为系统所设定
35、的初值,用户可以根据图像实际情况设置不同的加权系数。4基于颜色特征的图像检索系统设计和实现4.1系统结构设计在系统的实现上,将系统结构划分为图像入库子系统和图像检索子系统。图像处理与分析特征提取图像处理与分析图像特征库特征提取相似匹配输入图像检索图像图4-1图像检索系统的组成结构图图像入库部分的主要功能是图像获取、图像特征的提取和读入。在图像获取过程中,采用BMP图像组成图像数据库,用户可随意选择需要的图像。提取特征时,将BMP图像的RGB颜色空间转换为HSV空间并提取图像的颜色特征作为索引,写入图像特征数据库中。图像检索部分是完成基于图像颜色的检索。运用颜色特征匹配算法,通过相似性距离函数将
36、待检索图像的特征和特征库中的对应特征进行匹配,实现图像的检索,并最终把检索结果显示出来。4.2图像特征数据库设计在CBIR系统的设计过程中,还需要考虑图像数据库中图像存放的形式与图像数据库的格式。图像特征数据库用于存放图像库中各图像的颜色特征。在这里,将得到的一维直方图特征作为图像的特征向量存放到Access相应的特征表中,组成特征数据库。可将Access数据表的模式设计为(No,t0,t1,t2,t35,文件名称,相似距离),其中t0t35字段用来存放每图像的一维直方图特征向量。文件名称字段存放检索出来的图像的名称。相似距离字段存放的是待检索图和图像库中图像之间的相似距离,用数字表示出来。4
37、.3系统开发环境Visual Basic 6.0是微软公司推出功能强大的面向对象的可视化的程序设计语言。它具有强大的图像处理功能,如Image控件,Picture Box控件等。同时,VB6.0还使用两种数据访问技术:JET数据库引擎和ODBC技术,这是数据访问的核心部分。而且数据库引擎能够把数据控件和数据访问对象所提出的数据库操作转变成对数据库的物理操作。4.4系统流程根据对实验系统中的图像数据库结构与其算法、颜色模型、距离度量函数等方面的设计,开发了图像检索系统。检索系统流程图如图4-2。开始选择关键图像特征提取相似度计算输出检索结果用户系统图4-2检索系统流程图4.5系统的实现4.5.1
38、图像的获取图像入库的界面如图4-3所示,用户可以自由添加图像,并将该图像的颜色特征读入图像特征数据库中,形成自定义的特征库。除此之外,用户还可以自主选择待检索的关键图。图4-3图像入库界面4.5.2图像特征的提取特征提取是把图像的颜色特征信息提取出来存入图像特征数据库,以此特征来进行对待检索图像的检索。在这个过程中,先将图像的RGB模型转换成HSV模型,量化后得到36柄的一维直方图,其算法如下:For i = 0 To 35 t(i) = 0Next iFor j = 0 To YPos - 1For i = 0 To XPos - 1r = PicCol(i, j, 2): g = PicC
39、ol(i, j, L): b = PicCol(i, j, 0)v1 = Max(r, g, b): v = v1 / 255If v1 = Min(r, g, b) Thenr1 = 0: g1 = 0: v1 = 0: s = 0Elser1 = (v1 - r) / (v1 - Min(r, g, b)g1 = (v1 - g) / (v1 - Min(r, g, b)b1 = (v1 - b) / (v1 - Min(r, g, b)s = (v1 - Min(r, g, b) / v1End IfIf r = g And g = b Thenh1 = 5 - r1ElseIf r =
40、 Max(r, g, b) And g = Min(r, g, b) Thenh1 = 5 + b1ElseIf r = Max(r, g, b) And g <> Min(r, g, b) Thenh1 = 1 - g1ElseIf g = Max(r, g, b) And b = Min(r, g, b) Thenh1 = 1 + r1ElseIf g = Max(r, g, b) And b <> Min(r, g, b) Thenh1 = 3 - b1ElseIf b = Max(r, g, b) And r = Min(r, g, b) Thenh1 = 3
41、+ g1Elseh1 = 5 - r1End IfEnd Ifh = h1 * 60Select Case h '量化HSV模型Case 0 To 60hh = 0Case 60 To 120hh = 1Case 120 To 180hh = 2Case 180 To 240hh = 3Case 240 To 300hh = 4Case 300 To 360hh = 5End SelectSelect Case sCase 0 To 0.25ss = 0Case 0.25 To 1ss = 1End SelectSelect Case vCase 0 To 0.3vv = 0Case
42、0.3 To 0.8vv = 1Case 0.8 To 1vv = 2End SelectL_PicCol(i, j) = 6 * hh + 3 * ss + vvt(L_PicCol(i, j) = t(L_PicCol(i, L) + 1Next iNext j这里给出一幅示例图像,如图4-4中的“国旗”图像,利用上述算法得到的该图像的36柄一维直方图,并将其作为特征向量读入图像特征数据库,如表4-1所示。图4-4示例图像表4-1示例图像的特征向量Not0t1t2t3t4t5t6t7t81000000000t9t10t11t12t13t14t15t16t17t180007808936193
43、711t19t20t21t22t23t24t25t26t27t28020008600000t29t30t31t32t33t34t35074141087204.5.3图像的检索在用户自主选择好图像特征信息库,将图像的颜色特征都读入其中后,便可以选择一待检索的图像,根据待检索图像和图像特征信息库中的图像之间的相似距离来检索出与待检索图像颜色特征最为相近的图像来,并按照相似距离的大小排列显示。图像检索的算法为:Public Sub Search() Dim sumRecord As Integer Dim distance As Long Dim similar(6) As String Set m
44、ycon = New connection mycon.Open "provider=Microsoft.Jet.oledb.4.0;data source=" & App.Path & "图像特征数据库图像特征.mdb;persist security info = false" Set rtezh = New Recordset rtezh.Open "select * from tezheng", mycon, adOpenKeyset, adLockPessimistic sumRecord = rtezh.R
45、ecordCount Do Until rtezh.EOF = True distance = 0 For a = 0 To 35 distance = distance + (rtezh.Fields(a + 1) - t(a) * (rtezh.Fields(a + 1) - t(a) Next a distance = Sqr(distance) rtezh.Fields(38) = distance rtezh.Update rtezh.MoveNext Loop rtezh.Close End Sub这里将另一幅“国旗”图像作为待检索图像,“开始检索”后,图像库中各图像与待检索图像相
46、似距离由欧式距离算法得到,并按照相似距离由小到大将图像进行排列。如图4-5所示。图4-5图像检索界面本系统可以自行建立若干幅图像的图像库与特征数据库,支持一般直方图的特征检索方法,对待检索图像和图像库中的图像之间的有了较好的匹配,并通过界面显示出图像间的相似距离和检索结果的路径。5总结本文在研究国外基于容的图像检索技术的历史发展和应用状况的基础上,在图像的众多视觉特征中,选用图像的颜色特征进行提取和检索。主要进行了以下工作:(1)选择图像的格式,定义其文件信息。本文选用Windows环境下的标准图像格式BMP图像格式,通过文件结构的分析,对其进行了文件头和文件信息的定义,为系统功能的实现确定了
47、图像标准。(2)概括常见的几种颜色空间,对RGB和HSV颜色空间进行了重点阐述,并介绍了这两种颜色空间的转换以与HSV空间量化方法。(3)在一维颜色直方图的基础上,介绍了基于子块的颜色直方图的改进算法,通过用户自主选择感兴趣的区域,自主调整权重系数,使图像的检索结果更加符合用户视觉感知。在实现CBIR系统的两个关键问题是:图像容的特征提取和基于容特征的图像相似性匹配方法。本文对颜色特征的研究和探索,实现了设计预期的基本功能,对于基于容的图像检索技术的发展具有一定的参考价值和意义。但是对于基于容的图像检索系统,仅仅按照颜色特征得到的检索结果图和人的视觉观察还不完全吻合,且本系统的待检索图像和被读
48、入图像有一定的图像格式和像素的要求。如果能够结合形状、纹理等视觉特征,在不同的检索条件下,采用不同的特征或者几种特征的组合形式,且打破系统的图像像素的束缚,就能够显著提高系统的性能。参考文献1周.基于颜色特征的图像检索系统的研究与实现D.:大学,2003:132余芳.基于颜色特征的图像检索技术研究D.:中国石油大学计算机学院,2007:9153王冰.基于颜色特征的图像检索方法研究D.:大学控制学院,2005:23304斌.基于颜色容的图像检索J.情报杂志,2000,19:50515冬梅.基于颜色直方图的图像检索技术应用研究D.:河海大学计算机与信息工程学院,2004:29306闫乐林,亓莱滨,
49、蔡平胜.一种基于容的图像检索系统的设计与实现J.计算机技术与发展,2009, 12:2052087朱从旭.Visual Basic程序设计综合教程M.:清华大学,2009:651138周颖.Visual Basic 6.0实例精通M.:清华大学,2000:871099史永利.中文版Access2007宝典M.:电子工业,2008:16724310Minakshi Banerjee, Malay K. Kundu, Pradipta Maji et al.Content-based image retrieval using visually significant point features
50、J. Fuzzy sets and Systems, 2009, 160:3323334111Remco C. Veltkamp, Mirela Tanase.Content-Based Image Retrieval Systems: A SurveyJ. Department of Computing Science, Utrecht University, 2000, 34:305112吕学安.浅析VB中用数据库存取图像的方法J.教育学院学报,2010,11:183184致在此论文完成之际,我由衷地感大学四年来关心、帮助和支持我的人们。特别感我的指导老师许静老师,从论文的选题到最终完稿,
51、许静老师花费了大量的时间和精力,帮助我攻克课题上的一道又一道难题。同时,许静老师以渊博的专业知识、严格的学术标准和严谨的教学态度影响着我,使我最终能坚持完成此论文,并在专业知识方面有了进一步提升,更加注重学以致用。感大学电子信息工程学院的各位老师以与一起相处、学习的同学,与他们的交流学习开阔了我的视野,促进了我的进步。最后,对评阅此论文的老师们表示感,能够得到你们的点评,我深感荣幸。附录1 存取BMP图像程序:Public PicColor(800, 600, 2) As BytePublic BF As BITMAPFILEHEADERPublic BI As BITMAPINFOHEADERPublic PictureFileName As StringPublic PictureNameSave As StringPublic PicCol(800, 600, 2) As BytePublic M
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 合肥保时捷购买合同范例
- 乐山劳务派遣合同范例
- 小区购新房合同范例
- 广告制作包吃住合同范例
- 学校煤炭供应合同范例
- 双方共同投资合同范例
- 2024年重庆客运考题
- 2024年河北客运资格证应用能力试题
- 2024年北海客运资格证仿真试题
- 2024年河源客运从业资格证考试一点通
- 信息技术应用于高三化学复习课教学的研究的开题报告
- 国开《人文英语1》单元自测unit1-8习题答案整理合集
- 2023上海高三高考英语模拟试卷20套(含答案)
- 罗大佑的歌词集
- 世界经济形势与政策论文2000字三篇
- 康复护理学综述
- QC成果提高钢结构屋面防水施工合格率汇报图文结合
- 植物种群及其基本特征
- 药物性肝损伤指南
- 《生物化学》重点讲解及习题(含答案详解)
- 【企业招聘管理研究国内外文献综述】
评论
0/150
提交评论