图像检索算法研究与实现_第1页
图像检索算法研究与实现_第2页
图像检索算法研究与实现_第3页
图像检索算法研究与实现_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.图像检索算法的研究与实现摘要: 在互联网高速发展的今天,人们的搜索内容已不仅仅局限与对文本的搜索,很多时候我们需要搜索图像,这就需要一种能够快速和准确的寻找图像的技术,这就是本文描述的图像检索技术。从历史的发展来看,图像检索主要经历了两个阶段,基于文本的图像检索和基于内容的图像检索。基于内容的图像检索可以分为两类,一类为物理特征,包括颜色、纹理、形状等;另一类为语义特征。本文概述物理特征,主要对语义特征展开说明。关键字:图像检索 基于内容 基于语义 情感语义 相关反馈技术随着多媒体技术和数字照相机,扫描仪,打印机这些数字图像设备的普及,全世界的数字图像数量正以惊人的速度增长,每天都会产生数以

2、百万计的图像。随着互联网的发展,越来越多的人更加方便,快捷地接触到这些图像,人们面临的不是缺少图像媒体的内容,而是如何在浩如大海的图像媒体中寻找自己需要的信息。这就需要一种能够快速和准确地寻找图像的技术,这就是所谓的图像检索技术。1一、 图像检索方法的分类从图像检索发展的历程来看主要经历了两个阶段:基于文本的图像检索和基于内容的图像检索。基于内容的图像检索实现了自动化、智能化的图像检索和管理,主要利用了图像中的一些可视化信息。“以图找图”的特点引起人们的兴趣。所用的图像特征分两类:一类为底层特征或物理特征,如颜色、纹理、形状等;另一类为高层特征或语义特征,即图像内容的语义描述及各类物理特征之问

3、的逻辑关系。目前基于内容的图像检索技术主要以图像底层特征的相似性匹配检索为主,辅助以图像语义特征。具体分类如图1所示。2图1 图像检索算法分类图(一) 基于文本的图像检索算法基于文本的图像检索技术是通过关键字或自由文本进行描述,查询操作是基于该图像的文本描述进行精确匹配或概率匹配。此方式简单、易于理解,但检索时要指明文本特征。由于人工注释图像的主观性和不准确性等弊端,因此这种传统的图像检索方法并不能满足用户的需要。(二) 基于内容的图像检索算法基于内容的图像检索把图像处理、图像识别、数据库三个领域的技术成果结合起来,融合了图像理解技术,提供了更加有效的检索途径。目前,基于内容的图像检索技术在国

4、内外已经取得了不少的成就。1. 基于颜色的图像检索算法颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征4。2. 基于纹理的图像检索算法纹理特征通常定义为局部特征 ,它描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性 ,并不能完全反映出物体的本质属性 ,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同 ,纹理特征不是基于像素点的特征 ,它需要在包含多个像素点的区域

5、中进行统计计算。3. 基于形状的图像检索算法基于形状特征的图像检索主要是检测出目标的轮廓线或分割出目标的轮廓, 并针对其进行形状特征的提取或直接针对图像寻找适当的矢量特征。形状描述应该在尽可能区别不同目标的基础上对目标的平移、旋转和尺度变化来操作。目前, 虽然已经提出了许多形状分析方法, 但要将其有效地运用于图像检索上还有一些问题亟待解决, 如算法的效率和复杂性,形状特征的提取与描述等5。4. 基于语义的图像检索算法语义图像检索是更合理的图像检索方式。虽然目前基于内容的物理特征的图像检索作为一项倍受关注的技术在研究和商业方面都取得了一定成果, 但由于它只利用了图像本身固有的物理信息, 因此,

6、它只在特定的应用领域,如指纹识别、商标检索等方面获得成功。图2 图像内容层次模型图2所示的图像内容层次模型中,语义位于最高层:第3层。第2层和第3层之间的差别被许多学者称为“语义鸿沟”。语义鸿沟的存在是目前基于内容的图像检索系统还难以被普通用户接受的原因。在某些狭窄的专业领域,比如指纹识别和医学图像检索中,将图像低层特征和高层语义建立某种联系是可能的,但是在广泛领域内,低层视觉特征与高层语义之间并没有很直接的联系。如何最大限度地减小图像简单视觉特征和丰富语义之间的鸿沟问题,是语义图像检索研究的核心。其中的关键技术,就是如何获取图像的语义信息6。图像语义包括空间关系语义、对象语义、场景语义、行为

7、语义和情感语义。其中情感语义是最高层的语义,通常用形容词来描述,其涉及到人的认知模型、文化背景和美学标准等。以用户情感为线索的图像检索,目的在于令检索系统能更好地理解和把握用户心理感觉上对图像检索的要求,令检索结果更接近于用户的情感需求。此方法既有助于抓住用户观赏图像时的情感变化,为合理地分析用户在检索获取这些图像时的提问提供依据,还有助于对现有基于内容检索提供有益的补充,弥补现有研究在情感语义特征捕捉中的不足,以期更全面地揭示图像特征。情感图像检索主要涉及以下四个方面的研究内容: 1)定义图像的感性特征,即抽取图像中较容易引起用户情感变化的特征; 2)定义用户情感信息的描述方式,即用户用来表

8、达心理的形容词(也称为印象语,Impression Words)在计算机中的处理和表达方式; 3)计算图像感性特征与用户情感需求之间的语义相关性,即建立用户高层次的情感信息和图像低层次的感性特征之间的联系,也即建立情感用户模型; 4)通过学习机制,根据用户的不同,自适应调整情感用户模型,提高检索的准确性,即个性化情感用户模型。7情感图像检索的方法是从学术角度考虑,如何让计算机更好的模拟人类的情感,而研究难度较大,检索效率不高,难以完成对图像高层语义的理解任务等缺点造成了当前图像检索具有一定的局限性。因此,采取通过相关反馈的方法来获取更多的用户查询信息,被公认为行之有效的方法,并在许多图像检索系

9、统中得到应用。相关反馈技术最早是在文本领域中提出来的。通过一种人机交互机制使得计算机能够不断了解用户对查询结果的满意度,并通过不断修改查询表达来得到更好的检索结果。相关反馈技术的基本思想是:在检索过程中允许用户对检索结果进行评价和标记,指出结果中哪些是与查询图像相关的,哪些是不相关的,然后将用户标记的相关信息作为训练样本反馈给系统进行学习,以指导下一轮检索,从而使得检索结果更加符合用户的需要9。相关反馈作为提高检索性能的一种有效的手段 ,已成为图像检索系统中密不可分的一部分。相关反馈具有以下主要优点:1)简易性。这种方式解除了用户的负担,在查询提交阶段不再需要人工构建查询表达式,不再需要由用户

10、指定精确的权值。只需要用户和系统的交互,在系统返回的结果中指出他认为相关和不相关的图像。2)可控性。在查询的过程中可以强调一些重要的关键词,减弱另外一些关键词的影响,以反映用户对语义的需求。而且还可将查询进一步细化,分解成一系列有意义的、易于理解的小过程,采用渐进的方式来满足查询。尽管相关反馈技术对于检索性能有很大的提高,但也存在一些问题:如何建立一个和相关反馈结合的、“友好”的用户接口;如何解决检索效率和查准率相抵触的情况;如何对图像的关键词进行标注等。人的认知角度来看,人对图像的描述和理解主要是在语义层次进行的。如何获取和描述图像的语义信息,使其尽可能与人对图像内容的理解一致,是图像检索的关键所在。可以预言,基于语义的图像检索是未来Internet上图像检索系统的主导技术。虽然基于颜色、纹理等视觉特征的检索系统在一些领域应用得很好,但在Internet这个庞大而杂乱的图像库中,语义检索才是用户最愿意使用的。如何获取图像的语义信息,是Internet图像检索的一个研究重点。8参考文献1熊回香.基于内容的图像检索技术的发展方向J信息检索技术,20042冯国光.齐影虹,肖扬波基于内容的图像检索技术综述J科技广场,20073胡必鑫.基于内容图像检索中颜色特征描述J.计算机工程与应用,2005.4倾明. 基于颜色和纹理特征图像检索技术的研究J.科学技术与工程,2009.5付玮.基于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论