版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本科生毕业论文(设计)题 目: 基于颜色特征的图像检索算法的实现 姓 名: XXXX 学 院: XXXXXX 专 业: 计算机科学与技术 班 级: XXX级计算机(X)班 学 号: XXXXXXXX 指导教师: XXX 职称: 副教授 201X 年 5 月 18 日XXXXXXXXXX教务处制目录摘要.1关键字.11 绪论.11.1 基于内容的图像检索的概念.11.2 基于内容的图像检索的发展历史.11.3 基于内容的图像检索的特点和主要应用.11.4 基于内容的图像检索的关键技术.21.5 国内外研究现状.31.5.1 国外研究现状.31.5.2 国内研究现状.42 基于颜色特征的图像检索方
2、法.42.1 颜色度量体系.42.2 颜色空间.52.2.1 RGB颜色空间.52.2.2 HSV颜色空间.52.2.3 CMY颜色空间.63 颜色特征的表达.73.1 颜色直方图.73.2 累加直方图.84 图像特征的相似性匹配.94.1 距离度量方法.94.2直方图的交集的方法.94.3 欧式距离法.95 图像检索算法实现.105.1程序开发运行环境.105.2 程序检索逻辑.105.3 算法具体实现.115.4 实例演示.146 全文总结与展望.156.1 全文总结.156.2 展望.15致谢.15参考文献.16英文摘要.16 基于颜色特征的图像检索算法的实现计算机科学与技术专业学生 X
3、X指导老师 XX摘要:文章介绍了一种基于颜色特征的图像检索技术的算法并给出了程序实现。首先介绍了基于内容的图像检索技术、发展历史及基于内容的图像检索技术的特点和主要应用,并在此基础上探讨了该领域所用到的一些关键技术。文章着重探讨了图像的颜色空间、图像特征提取及图像相似性度量等内容,并利用matlab技术实现了一个简单图像检索的程序。文章最后则对当前基于内容图像检索技术研究热点和今后的发展方向进行简单的阐述。关键字:基于内容的图像检索;颜色特征;颜色直方图;相似度度量方法1 绪论1.1 基于内容的图像检索的概念基于内容的图像检索1(Content Based Image Retrieval, C
4、BIR)是一项从图像数据库中找出与检索式内容相似的图像的检索技术。它利用从图像中自动抽取出来的底层特征,如颜色、纹理、轮廓和形状等特征,进行计算和比较,检索出符合用户需求的结果图像集。目前图像检索系统技术实现的基础是对底层特征信息的计算和比较,也即是“视觉相似”。1.2 基于内容的图像检索的发展历史图像检索技术的发展2可以分为两个阶段,第一阶段始于70年代,当时的图像检索是通过人工的标注来实现的,随着计算机技术和通信网技术的发展,特别是因特网的快速发展,图像数据的容量越来越大了,这种“以关键字找图”的方法越来越不适应检索技术的发展了。由于图像内容的丰富内涵以及人们对图像内容进行抽象时的主观性不
5、同的人对同一幅图像有不同的理解,这就引入了主观多义,不利于检索。为了克服文本标注检索的弊端,90年代研究者提出了基于内容的图像检索,其方法是:根据图像的颜色特征、纹理特征、形状特征以及空间关系等作为索引,计算查询图像和目标图像之间的相似距离,然后按相似度匹配进行检索,这种技术很大程度地利用了人们的视觉客观特性,避免不同人对图像主观理解的不同而达不到理想的搜索效果。从研究方向的层面来看,基于内容的图像检索可分为三层:第一层是根据图像的底层特性来进行检索,如颜色、纹理,形状等等,涉及图像信息处理、图像分析和相似性匹配技术;第二层是基于图像对象语义,如图像中实体及实体之间的拓扑关系的检索,对象级检索
6、技术建立在下层特征基础上,并引入了对象模型库、对象识别和人工智能等图像理解技术;第三层是基于图像的抽象属性如行为语义,情感语义和场景语义的推理学习来进行检索。需要用到知识库和更加有效的人工智能和神经网络技术。这三个层次由低到高,与人的认知接近,下一个层次通常包含了比上一个层次更高级的语义,更高层的语义往往通过较低层的语义推理获得。尽管经过了多年的研究,较为成熟的基于内容的图像检索技术目前仍处于底层水平,由于底层研究是上层研究的基础,为了给上层建立准确、有效的图像特征提取方法,底层的研究仍在不断的发展。1.3 基于内容的图像检索的特点和主要应用基于内容的图像检索技术有以下特点3:一是它突破了传统
7、的基于表达式检索的局限,从媒体内容中提取信息线索。利用图像内容特征建立索引进行检索,使得检索更加有效,适应性更强。二是基于内容的图像检索是一种近似匹配,即按照某种相似性度量,比较图像特征间的差异度。相似度较低的图像将作为检索结果返回给用户。三是它是大型数据库的快速检索。在实际的多媒体数据库中,数据量巨大,而且种类和数量巨大,因此要求CBIR技术快速地实现对多媒体信息的检索。四是以相关反馈为有效手段。为了提高检索的准确性,整个过程是个逐步逼近和相关反馈的过程。用户的交互性增强了表达查询、评价查询结果和基于评价结果进行进一步检索的能力。CBIR己经成功地应用于一些专门领域。典型应用领域4包括:(1
8、)搜索引擎:随着各种电子商务网站的发展,图像搜索引擎将成为这些网站的重要工具。(2)家庭用图像检索:数码科技使得普通家庭也会产生成千上万的图像,家庭图像检索系统将是家庭PC的一个基本工具。(3)数字图书馆:数字图书馆实际上是一个数字信息资源库,其中有字符数值库、文本库、声音库、图像库等。因此,如何快速、高效地从数字图书馆中找出用户所需的信息就成为现代图书馆研究的热点和关键技术之一。(4)商标检索系统:可在收录了己注册商标的数据库中查找是否有与注册商标类似的,防止商标权受侵害。(5)法律及公安:它是图像数据库技术的一个重要应用领域。典型的例子有:面部数据库、指纹数据库、犯罪纪录数据库以及建筑物保
9、安数据库等。我国在“人脸”及“指纹”数据库建立方面已做了不少工作,并有一批实用性的成果投入应用。(6)邮票资料库:主要用于邮票资料的管理与查询,也可以提供邮票鉴定等更高级的应用服务。(7)教育与培训:在教育与培训领域,例如远程教学、交互式培训、自学教育及雇员再教育等有着广阔的应用前景。国外在培训系统领域已投入了大量的经费,开展了相关课题的研究工作。我国多媒体教学研究工作也已经开展,网上教学与辅导已进入实用阶段,这些都为图像数据库应用于教育培训领域提供了广阔的前景。(8)工业与商业:工业应用包括企业多媒体信息系统、CAD/CAM等商业应用有电子商务、在线广告、在线购物、股票等。(9)保健及医疗:
10、图像数据库在该领域中应用范围很广,除了专用的图像管理与检索系统外,还包括建立多媒体医疗信息管理系统,将庞杂的医疗数据管理起来.这些数据包括病历、病人的图像信息(如X光片、CT扫描及MRI照片等)以及描述手术过程的视频信息等。它为现有的医学系统带来了一场革命,其中最有前景的应用是远程医疗(Telemedicine)、远程外科手术(Tele-surgery)及远程诊断(Tele-diagnoses)等。1.4 基于内容的图像检索的关键技术5目前,对于通用的静止图像检索,用于检索的特征主要有颜色(Color)、纹理(Texture)、形状(Shape)等,其中颜色、纹理、形状应用尤为普遍;活动视频检
11、索脱胎于序列图像分析中的技术。本文主要研究对静止图像检索,其中数据库是专用的图像库。对于目标图像和检索图像进行颜色空间转换、亮度图像的边缘提取和二值分割、提取目标区域的颜色特征。颜色内容包含两个一般的概念,一个对应于全局颜色分布,一个对应于局部颜色信息。按照全局颜色分布来索引图像可以通过计算每种颜色的像素的个数并构造颜色灰度直方图来实现,这对检索具有相似的总体颜色内容的图像是一个很好的途径。局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。比如Smith等提出了颜色集合(color set)方法来抽取空间局部颜色信息并提供颜色区域的有效索引。运用颜色直方图进行检索有如
12、下三种方式:(1)指明颜色组成-该法需要用户对图像中的颜色非常敏感,而且使用起来也不方便,检索的查准率和查全率并不高,因此暂时不做进一步开发。(2)指明一幅示例图像-通过与用户确定的图像的颜色直方图的相似性匹配得到查询结果,这是该课题研究方法的根本。(3)指明图像中一个子图-分割图像为各个小块,然后利用选择小块来确定图像中感兴趣的对象的轮廓,通过建立更复杂的颜色关系(如颜色对方法)来查询图像,该方法是进一步优化检索的一个设想。在颜色空间选取方面,最常用的颜色空间是RGB颜色空间。通常,人们采用欧氏距离来刻画两种颜色之间的差异,RGB空间存在的一个严重问题是其中所计算出来的两种颜色之间的距离无法
13、正确表征人们实际所感知到的这两种颜色之间的真实差异。HSV空间比较直观并且符合人的视觉特性。HSV颜色模型有两个重要的特点作为基础。首先,V分量与彩色信息无关,其次H和S分量与人感受彩色的方式紧密相连,其中H分量尤其影响人类的视觉判断。这些特点使得HSV模型非常适合基于人视觉系统对彩色感知特性的图像处理。得到图像特征的统计直方图后,不同图像间的特征匹配可借助计算直方图间的距离来进行。一般意义上直方图匹配方法有直方图相交法,直方图匹配法,欧氏距离法,中心矩法,累积直方图匹配法共6种。本文重点讨论欧氏距离法,并将其作为系统编程实现的主要方法。所以,颜色特征的图像检索关键技术路径如图1:相似度量特征
14、提取颜色空间图1 颜色特征的图像检索关键技术路径1.5 国内外研究现状61.5.1 国外研究现状基于内容的图像检索技术是当前研究的热点,许多著名杂志如IEEE Trans.On PAMI 、IEEE Trans.On Image processing 等纷纷设专刊介绍该领域研究的最新成果,著名的国际会议如:IEEE conference of CVPR 、 ACM conference on multimedia等纷纷设立专题交流最新的研究成果。各大研究机构和公司都推出了他们的系统:(1)IBM的QBIC系统 IBM的QBIC是第一个商业化的基于内容的图像检索系统,它的系统结构包括图像入库、特
15、征计算、查询阶段三部分,允许使用例子图像、用户构建的草图和图画、选择的颜色和纹理模式、镜头和目标运动和其他图形信息等,对大型图像和视频数据库进行查询。 它的系统框架和结构对后来图像检索系统具有深远的影响。(2)新加坡大学和MIT媒体实验室的Photobook系统 该系统是用于交互式浏览和搜索图像库的工具。图像在装入时按形状、纹理和人脸的面部外形三种特征自动分类,同时还能结合文本关键字进行查询,图像根据类别通过显著语义特征压缩编码。 (3)Virage公司的Virage系统该系统是基于内容的图像搜索引擎,比QBIC更进一步,支持基于颜色、颜色布局、纹理和结构(对象边界信息)及这四个原子查询的任意
16、组合。VirageVirageEngine主要有3方面的功能:图像分析、图像比较和图像管理,技术的核心是VirageEngine以及在图像对象层上的操作。(4)美国哥伦比亚大学的VisualSEEK系统 VISualSEEK图像查询系统是一个可视化的图像特征搜索引擎,实现了互联网上的基于内容的图像/视频检索系统,它由四部分组成:图形用户界面、服务器应用、图像检索服务器、图像归档。在VisualSEEK中,整幅图的颜色分布使用全局颜色直方图,区域颜色的索引采用二进制颜色集的表达方法。它采用基于小波变换的方法来表示图像的纹理特征。1.5.2 国内研究现状相对国外而言,国内在这方面的研究起步相对较晚
17、:I.浙江大学从95年开始进行多媒体图像检索的研究,完成了基于颜色和基于形状的图像原型系统,总体设计思想是允许用户找到包含特定颜色、纹理和形状的图像。II.中科院计算技术研究所开发了一个图像检索原型系统“ImageSeek,作为“中国数字图书馆示范工程”课题的一个关键技术。该系统实现了基于文本、颜色、纹理特征的图像检索。III.杭州贝尔研发的具有自主知识产权的智能图像检索系统,通过提取图像的颜色、纹理和形状等特征,实现了基于图像内容的快速智能检索,被列入2001年信息产业部重点科研计划。2 基于颜色特征的图像检索方法2.1 颜色度量体系颜色度量体系7(color system),也叫做颜色制或
18、者叫做颜色体制,实际上就是人们组织和表示颜色的方法。组织和表示颜色的方法主要有两种:一种是颜色模型,一种是编目系统。颜色模型是用简单的数值方法描述所有颜色的一套规则和定义,可使人们方便地描述任何一种颜色,颜色模型通常用颜色空间描述,如RGB、CMY和CMYK,从这个意义上说,颜色模型和颜色空间互为同义词。任何一种颜色都可用三种基本颜色按不同的比例混合得到,显示彩色图像用RGB相加混色模型:颜色=R(Red 百分比)+G(Green 百分比)+B(Blue 百分比)颜色空间是表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。颜色空间通常用三维模型表示,空间中的颜色能够看到或者使用颜
19、色模型产生。颜色空间中的颜色通常使用代表三个参数的三维坐标来指定,这些参数描述的是颜色在颜色空间中的位置,其颜色要取决于使用的坐标。对于颜色空间的构造需要满足三个要求:完备性(Completeness),颜色空间应能描述人能感知的所有颜色;一致性(Uniformity ),颜色在空间度量的差异和感知的差异相吻合;唯一性(Uniqueness),颜色空间中颜色在感知上彼此不同。2.2 颜色空间82.2.1 RGB颜色空间面向硬设备的最常用颜色模型是RGB模型。在RGB模型中,所有颜色都可看作是3个基本颜色,即红(R,red),绿(G,green)和蓝(B,blue)的不同组合。将这三种颜色成分分
20、别人为地分成0到255共256个等级,0表示没有刺激量,255表示刺激量达到最大值。R、G、B均为255时表示白光,均为0时表示黑色。这样,我们就能表示出256256256(约1600万)种颜色。如图2所示,采用三维直角坐标系,红、绿、蓝为原色,各个原色混合在一起产生复合色。绝大部分的可见光谱可以用红、绿、蓝R(、G、B)三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色、洋红和黄色。因为RGB颜色合成产生白色,它们也称为加色。将所有颜色加在一起产生白色,也就是说,所有光被反射回眼睛。加色用于光照、视频和显示器。RGB颜色模型通常采用单位立方体来表示,在正方体的主对角线上,各原色的
21、强度相等,产生由暗到明的白色,也就是不同的灰度值。(0,0,0)为黑色,(l,1,1)为白色。正方体的其它六个角点分别为红、黄、绿、青、蓝和品红,需要注意的一点是,RGB颜色模型所覆盖的颜色域取决于显示设备荧光点的颜色特征,是与硬件相关的。在显示屏上显示颜色定义时,往往采用这种模式。图像如用于电视、幻灯片、网络、多媒体,一般使用RGB模式。虽然RGB彩色模型被广泛应用于CRT设备显示彩色图像,但它并不是一个均匀视觉的颜色空间,不符合人对颜色的感知心理,而且,RGB颜色空间上的距离并不代表人眼视觉上的颜色知觉差异。但在对彩色图像进行特征提取时,需要用数量来描述颜色的差别,因此需要用另一种符合人的
22、视觉心理的视觉彩色模型来表示颜色。图2 RGB颜色模型2.2.2 HSV颜色空间HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域。它把彩色信号表示为三种属性:色调H(Hue)、饱和度S(Saturation)和亮度V(value),其中亮度又称LightneSS或Intensity,所以HSV空间还有HLS和HIS这两种叫法。 HSV模型的色调H表示从一个物体反射过来的或透过物体的光的波长,更一般地说,色调是由颜色名称来辨别的,如红、橙、黄、绿等,它用角度-180180或O360来度量。亮度V是颜色的明暗程度,通常用百分比度量,O%
23、为最暗的黑色,而100%为最亮的白色。饱和度S指颜色的深浅程度,即在纯色中包含的白色光的成份。例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。饱和度S也用百分比来度量,从浓度最小的O%到浓度完全饱和的100%。色调H和饱和度S分量合起来定义了颜色的色度(Chromatieity)特性。HSV颜色模型用Munsell三维空间坐标系统表示,其示意图如图3所示。图3 HSV颜色模型 Munsen颜色空间具有以下己经被人的眼睛所证实的特点: (1)坐标之间的心理感知独立性(PereeptualIndependenee),即人可以独立感知各颜色分量的变化。(2)线性伸缩性(LinearS
24、ealability),人眼可感知的颜色差异与HSV颜色分量的相应值上的欧几里德距离(EuelideanDIStanee)是成比例的。因为HSV颜色空间根据色调H的值来区分不同的颜色,因此在HSV的三个分量中,H分量是尤为重要的,它可以很好地模拟人类对颜色的识别和记忆过程。2.2.3 CMY颜色空间以红、绿、蓝的补色青(Cyan)、品红(Magenta)、黄(Yellow)为原色构成的CMY颜色模型,常用于从白光中滤去某种颜色,又被称为减性原色系统。CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型所对应的子空间几乎完全相同。差别仅在于前者的原点为白,而后者的原点为黑。前者是定义在白色中减
25、去某种颜色来定义的一种颜色,而后者通过从黑色中加入颜色来定义一种颜色。CMY模型以打印在纸张上油墨的光线吸收特性为基础,当白光照射到半透明油墨上时,部分光谱被吸收,部分被反射回眼睛。理论上,青(Cyan)、品红(Magenta)和黄(Yellow)色素能够合成吸收所有的颜色并产生黑色。因为所有打印油墨都会包含一些杂志,这三种油墨实际上产生一种土灰色,必须与黑色油墨混合才能产生真正的黑色。将这些油墨混合产生颜色称为四色印刷。减色(CMY)和加色(RGB)是互补色,每对减色产生一种加色,反之亦然。如图4所示。图4 CMY颜色模型认知科学及视觉心理学证明,人类不能像计算机显示器那样只使用RGB成分感
26、知颜色,因此,选择一个适合于人类视觉特征的颜色空间可以改善检索效果。由于在进行基于内容的图像检索时,查询要求往往是按照用户的主观视觉感受而发出的,因此在进行图像之间颜色差异的比较时,CBIR系统一般采用具有视觉一致性的颜色空间。所谓视觉一致性,是指对两种不同的颜色,它们在颜色空间中坐标的距离与它们在观察者的颜色感知空间中的距离是大致相同的。HSV空间具有这样的特性9。因此本系统选用HSV颜色模型。3 颜色特征的表达3.1 颜色直方图 (1)颜色直方图的定义颜色直方图9是颜色信息的函数,其核心思想是在一定的颜色空间中对图像各种颜色出现的频数进行统计,颜色直方图描述的是不同色彩在整幅图像中所占的比
27、例,而并不关心每种色彩所处的空间位置,即图像的对象或物体。它的优点就在于它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。颜色直方图可以基于不同的颜色空间和坐标系,最常用的是RGB颜色空间,因为大部分的数字图像都是用RGB颜色空间表达的。基于RGB颜色空间表示时,彩色图像的直方图可以用R、G、B三个单色的直方图或联合分布直方图来表示。用三个单色直方图表示时,各个直方图表示的是图像在这种颜色分量的统计分布,总共有三个不同的概率分布。而彩色图像用一个RGB颜色直方图表示时,其统计的是不同颜色出现的频数,以色彩
28、作为横坐标,纵坐标为色彩出现的频数。在RGB颜色空间中,颜色直方图可以看成是一个离散函数,即 ()其中,k表示图像的特征取值,L表示特征可取值的个数,凡表示图像中具体征值为k的像素个数,n表示图像像素的总个数。(2)颜色直方图的特性 旋转不变性和缩放不变性:颜色直方图是表示图像中颜色分布的一种方法,它的横轴表示颜色等级,纵轴表示在某一个颜色等级上具有该颜色的像素在整幅图像中所占的比例,直方图颜色空间中的每一个刻度表示了颜色空间中的一种颜色,因此,颜色直方图具有与身俱来的旋转不变性和缩放不变性,如图5所示。位置无关性:直方图描述了每个灰度级的像素的个数,但不能为这些像素在图像中的位置提供任何线索
29、。当一幅图像被压缩为直方图后,所有的空间信息将全部丢失,因此,任一特定的图像具有唯一的直方图,但并非一一对应,而是一对多,不同的图像有可能具有相同的直方图特征。叠加性:如果一幅图像由两个不连接的区域组成,并且每个区域的直方图己知,则整幅图像的直方图是该两个区域的直方图之和。该结论可推广到任何数目的不连接区域的情形。直方图是总体灰度概念,从直方图中可以看出图像整体的性质:如图像的明暗程度、图像的亮度等。再如图像的灰度动态范围太小会使许多细节分辨不清楚,而灰度级分布均匀,则会给人以清晰、明快的感觉。 图5 颜色直方图的旋转不变性和缩放不变性3.2 累加直方图10当图像中的特征并不能取遍所有可取值时
30、,统计直方图中会出现一些零值。这些零值的出现会对计算直方图的相交带来很大影响,从而使得算出的匹配值并不能正确的反映两图间的颜色差别。累加直方图是以颜色作为横坐标,从坐标原点到该颜色的所有颜色的像素出现的频数为纵坐标绘出的图形。这样图像的累加直方图向量H可以定义为:表示C1Ck种颜色的像素的累加频数:我们已经计算出图像的一般直方图,可以方便地计算图像累加直方图。这样,最后得到的累加直方图特征向量为:4 图像特征的相似性匹配4.1 相似度匹配方法11图像检索的效果很大程度上取决于匹配算法的优劣。基于文本的检索方法中使用的是文本的精确匹配,而基于内容的图像检索则通过计算查询和候选图像之间的视觉特征的
31、相似度来完成。以一定的计量或测量方法来判断图像内容是否相关。图像特征提取大多数可以表示为向量形式,因此常用的图像比较方法都是基于向量空间模型,即将图像特征看作向量空间中的两个点,通过比较两个点之间的距离来衡量其相似度。按照距离公理,在定义距离测度时要满足距离公理的四个条件:自相似性、最小性、对称性、及三角不等性。设 D 为距离函数,x、y、z 为三个特征向量,则所有的距离函数都满足的条件表示为:(1)D ( x,y ) = D ( y,x ) = 0(自相似性)(2)D ( x,y )D ( x,x )0(最小性)(3)D ( x,y ) = D ( y,x)(对称性)(4)D ( x,y )
32、 + D ( y,z )D ( x,z )(三角不等性)图像的相似度度量,既是图像检索技术中的一个关键问题,也是其中的一个难点。常见的方法有:直方图相交法、直方图欧氏距离、直方图余弦距离、二值集hammimg距离、直方图二次距离度量、二值集二次距离、直方图Mahalanobis距离。以下只简要介绍系统中常用的直方图的交、直方图欧氏距离两种距离度量方法。4.2直方图的交集的方法直方图的交集算法,根据颜色索引检索出查询图像的颜色直方图,将其与图像库中的每一图像的直方图取交集,根据交集的值来选出最佳匹配图像。直方图交集的公式如下:D(Ha,Hb)= 其中Ha为查询图像直方图,Hb为图像库中的任一图像
33、直方图,为两图像的匹配值。,它的值越接近1,则两图像越相似。直方图交集方法能对两幅图像进行详细的比较,然而对于许多合成的图像,如商标等,它们有大量的一致颜色,三维直方图只有几个域的值很高,而其它许多域的颜色信息变化有限。因而,对于这样的图像进行过细的比较是不必要的。又由于在扫描图像时容易产生一些噪音,所以这种过细的比较容易产生错误的结果。4.3 欧式距离法我们可以利用欧基里德距离公式(Euclidean Distance)来计算距离。对于两个 N维直方图x,y,两者的欧氏距离可以表示如下: 此距离公式虽然简单,但是与特定的颜色分布无关,有一种方法可以引入相关权值A,这里A是一个维矩阵,此时距离
34、公式可以表述如下: 为了简化计算,将直方图x,y规范化使其满足: 矩阵,权表示颜色i与颜色j之间的相似度。若取z=x-y,则有,取定了距离公式后,我们需要确定A的取值,且要保证此矩阵A能够使,我们用表示颜色i与颜色j在RGB颜色空间的距离。 取。 有 因为.5 图像检索算法实现5.1 程序开发运行环境Matlab是集数值计算、符号运算及图形处理等强大功能于一体的科学计算语言作为强大的科学计算平台,它几乎能够满足所有的计算需求,它具有如下的优势与特点: 友好的工作平台和编程环境;简单易用的程序语言;强大的科学计算及数据处理能力;出色的图形处理功能。5.2 程序检索逻辑特征提取待匹配图像按相似度排
35、列的检索结果集计算相似度图像库特征提取图6程序检索逻辑图我们可以从图6中抽象出三个层次或者功能模块:(1) 颜色空间内特征提取对图像数据进行特征提取,可以选择任何一种能够达到检索要求的颜色空间和特征表达方式。(2) 图像匹配(相似度计算)在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识别的图像的特征与数据库中的哪些图像的特征最接近。(3) 结果输出将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。5.3 算法具体实现(1)颜色空间的选择及颜色的矢量量化通常, 人们采用欧氏距离表示两种颜色之间的差异, 最常用的RGB颜色空间存在一个严重问题是其中所计算出来的两种颜色之
36、间的距离无法正确表征人们实际所感知到的这两种颜色之间的真实差异。例如:距离为50的(0,0,0)与(50,0,0)两种颜色认为是同一黑色,而距离为50的(200,200,0)和(150,200,0)则认为是两种差异很大的颜色(黄色和绿色)。本文在处理颜色特征时采用了HSV颜色空间, 该模型较好符合人眼的感知特征。从RGB空间转换到HSV空间的具体过程可参考相关文献。在理论上, 抽取图像的颜色特征时使用真彩色将产生最小的误差。但是, 特征抽取和特征匹配的计算量以及特征的存储都将随实际颜色数目增多而非线性膨胀, 因此, 使用真彩色在实际检索过程中是不现实的。实验表明, 增加颜色直方图的维数可以有效
37、提高检索的精度, 但当维数增加到一定程度时, 检索的精度提高很小而且可能下降. 因此在保持一定精度的前提下, 通过减少颜色的维数来达到节省特征存储空间的目的。在系统实现时, 我们根据H S V空间的特征, 在降低直方图的维数并保留足够的颜色信息前提下, 对 HSV空间进行非均匀量化, 得到77种代表颜色。首先将图像中每一像素的r ,g,b值转换为h,s,v值(h0,360,s0,1,v0,1),然后按照图7的颜色量化和编码方法计算:图7按照上面的方法将颜色空间共划分为 77种颜色, 这 77种代表色的量化方法有效地压缩了颜色特征并且较好的符合人眼对颜色的感知。代码实现如下:M,N,O = si
38、ze(Image);h,s,v = rgb2hsv(Image);H = h; S = s; V = v;h = h*360;%将hsv空间非等间隔量化:% h量化成8级;% s量化成3级;% v量化成3级;for i = 1:M for j = 1:N if h(i,j)315 H(i,j) = 0; end if h(i,j)20 H(i,j) = 1; end if h(i,j)40 H(i,j) = 2; end if h(i,j)75 H(i,j) = 3; end if h(i,j)155 H(i,j) = 4; end if h(i,j)190 H(i,j) = 5; end i
39、f h(i,j)270 H(i,j) = 6; end if h(i,j)295 H(i,j) = 7; end endendfor i = 1:M for j = 1:N if s(i,j)0 S(i,j) = 0; end if s(i,j)0.2 S(i,j) = 1; end if s(i,j)0.7 S(i,j) = 2; end endendfor i = 1:M for j = 1:N if v(i,j)0 V(i,j) = 0; end if v(i,j)0.2 V(i,j) = 1; end if v(i,j)0.7 V(i,j) = 2; end endend(2)将三个颜
40、色分量合成为一维特征向量:L = H*Qs*Qv+S*Qv+v;Qs,Qv分别是S和V的量化级数, L取值范围0,71,取Qs = 3; Qv = 3,并计算L的直方图,代码实现如下:for i = 1:M for j = 1:N L(i,j) = H(i,j)*9+S(i,j)*3+V(i,j); endendfor i = 0:71 Hist(i+1) = size(find(L=i),1);endT=Hist;(3)计算图像库中每一幅图像与查询例子图像的欧式距离,代码实现如下:diff = (T0-T).2; EulerDistance = sqrt( sum( diff(:) ) );
41、 w(k)=EulerDistance;end(4)按颜色的相似性大小显示查询结果图片,代码实现如下:B,IX=sort(w,2);A=dir(D:graduate designtest_pictures*.jpg);for n=1:10 subplot(3,4,n); I=imread(strcat(D:graduatedesigntest_pictures,A(IX(n).name); imshow(I);end5.4 实例演示第一步,运行程序弹出对话框,选择待匹配图像,如图8所示;图8第二步,程序继续执行,最后在弹出窗口上按与待匹配图像相似度从大到小的顺序显示图像,如图9所示。图96 全
42、文总结与展望6.1 全文总结随着多媒体技术的发展,包括图像、音频、视频等信息的多媒体数据大量涌现,如何从大量的信息中快速、有效地检索到所需的内容,已经成为多媒体技术研究中的热点问题。本文对基于内容的图像检索技术作了较全面的研究和介绍,重点研究了基于颜色特征的图像检索方法,并对其中涉及到的颜色模型,颜色直方图,颜色量化,相似性度量等进行了较深入研究。在对基于颜色特征的图像检索方法的研究基础上,作者用matlab语言编写了一个简单的图像检索演示程序,实验证明,该程序实现了图像检索的基本功能,但基于颜色特征的图像检索仅是从图像的低层特性出发,这些方法具有计算简单、对平移和旋转不敏感等优点。但是直方图
43、不能反映空间位置的变化,两幅景色相似但是空间位置完全不同的图像,得出的直方图是一模一样的。另外是颜色量化误差的影响较大,以致差别细微的颜色可能会得出无差别或差别很大的两种决然不同的颜色直方图。因此,如何有效地综合颜色、纹理、形状、空间位置关系以及语义特征来对图像进行查询势必会成为一个热门研究方向。6.2 展望人们对颜色索引和检索方法的研究己经相当多,它们都分别从不同的方面对基于颜色的图像检索问题进行了研究。目前主要存在的问题:(1)人对颜色特征的视觉感知方面考虑的仍然不够,虽然目前大多数基于颜色特征的图像检索采用了和人对颜色感知相一致的HSB颜色空间,但关于两种颜色之间的相似度的定义和视觉上人
44、对相似颜色的判定仍有一定的差距。(2) 从颜色特征的表示来看,各种形式的颜色直方图是最常采用的表示方法,一般指定相同的颜色集,采用几十到上百维的高维直方图。实际上人对两幅图像画面的颜色的相似性判定主要考虑少数几种主要的颜色。不同的图像有不同的颜色集,对于包含不同颜色集的两幅图像之间的相似性判定仍需进一步研究。(3)为进一步提高颜色特征的检索效果,要从颜色物理、视觉、心理几方面进行综合深入研究。CBIR系统在技术上可分为图像处理技术和数据库技术两大方面。在图像处理技术方面,更加准确有效地描述图像内容的数据模型是今后长期需要解决的重要方面。然而目前,通过建立合理的用户查询界面,利用相关性反馈,是实
45、现趋向基于语义查询的切实可行的有效方法;在数据库技术方面,CBIR系统正产生深刻变化,如DBMS中对物理磁盘的管理技术、索引技术等底层技术都向着支持多媒体数据和更开放的方向发展。基于内容对图像信息的查询、检索在国内外仍处于研究探索阶段,随着应用的需求其研究将会不断深入,满足不同应用的实用系统也将陆续出现,将其应用于各个领域必将带来极大的益处。致谢本文是在XX老师的悉心指导下完成的,衷心感谢他在论文的写作期间给与我的热情帮助和指导。XX老师渊博的知识,认真负责的工作作风,平易近人的态度让我获益匪浅。在此,向XX老师表示最衷心的感谢和最诚挚的敬意。 还要感谢我的同学XX,他在我的论文写作过程中提出
46、了很多建设性的意见,并给了我很多启发。 感谢XXXXXXXXXXX计算机系的全体领导和老师,你们深厚的学术功底和诲人不倦的高尚师德将让我受用一生。 感谢计算机科学与技术专业XXXX级X班全班同学给予我的关心、友谊和帮助,是你们给了我美好而难忘的学习生活。 最后,我要衷心感谢我的父母,是你们一直默默地给与我理解与支持,给与我勇敢面对困难的勇气和力量,让我能够顺利地完成学业。参考文献1洪安祥.基于内容的图像检索若干论题研究D.浙江:浙江大学,2007:1-36.2M Flickner,HSawhney,WNiblack.Query by image and video content:the QB
47、IC systemJ.IEEE Computer,2007,28(9):23-32.3顾燕.基于内容的图像检索方法及其实验系统设计D.江苏:河海大学,2009:3-10.4刘士林.基于内容的图像检索J.佳木斯大学学报.2008,19(3):259.5徐杰,施鹏飞.基于内容的图像检索技术J.中国图像图形学报.2008,8(9):978.6王冰.基于颜色特征的图像检索方法研究D.山东:山东大学,2007:2-11.7高升.基于颜色特征的图像检索方法及系统实现D.北京:北京邮电大学,2006:4-5.8张洁.基于颜色特征的图像检索系统设计与实现D.吉林:吉林大学,2006:10.9刘德龙.基于颜色特征的图像检索系统设计与实现D.武汉:华中师范大学,2007:12.10孙君顶编著.图像低层特征提取与检索技术M.北京:电子工业出版社,2009:5-40.11周明全,耿国华,韦娜著.基于内容图像检索技术M.北京:清华大学出版社,2007:4-35.英文摘要Color-based Image Retrieval TechnologyComputer science and technology XXXXXXTutor XXXXXXXAbstract: This paper describes the image retrieval algorithm based on color fe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省淮南市潘集区2024-2025学年八年级上学期期中考试英语试题(含答案无听力原文及音频)
- 机动三轮车相关行业投资规划报告范本
- 化妆品原料相关行业投资方案范本
- 电池材料用化学品行业相关投资计划提议
- 离合器分离轴承行业相关投资计划提议
- 脑梗塞的抗凝治疗指南
- 【初中地理】气温和降水(第2课时)课件-2024-2025学年湘教版地理七年级上册
- 重症护理小组年终总结
- 在XXXX年党建引领企业高质量发展创新实践推进会上的讲话范文
- 物联网与公安工作
- 实验与探究-无限循环小数化分数课件
- 开放式小区物业管理方案(精选8篇)
- 《突发事件应对法》理论考试题库(含答案)
- 国家开放大学酒店管理概论作业1-4答案
- 景观植物设计-3-各类植物的种植设计课件
- 客运驾驶员安全指引课件
- 经理课后答案1-4(仅作参考)
- 创思维与方法思维标准课件
- 数字经济实体经济融合课件整理
- 团委书记岗位竞聘报告课件
- 新发传染病形势及应对策略
评论
0/150
提交评论