基于纹理特征的图像检索_第1页
基于纹理特征的图像检索_第2页
基于纹理特征的图像检索_第3页
基于纹理特征的图像检索_第4页
基于纹理特征的图像检索_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、摘要随着计算机技术和网络技术的发展,以及多媒体的推广应用,产生了大量的各式各样的图像。如何有效地对这些图像进行分析、存储和检索是一个急待解决的问题。基于内容的图像检索技术能有效地解决这一问题,成为研究的重点。图像检索的研究目的就是实现自动化、智能化的图像查询和管理方式,使查询者可以实现方便、快速、准确地查找。纹理是图像的一个主要视觉特征,也是基于内容图像检索系统中的一个重要手段。本文对基于纹理特征的图像检索技术进行了研究,并通过实验验证了检索算法的有效性。图像的特征提取是图像检索的关键技术之一。本文将灰度共生矩阵用于图像的纹理特征提取。设计并实现了一个基于纹理特征的图像检索系统。给出了系统的流

2、程图,并介绍了系统的查询模块、特征提取模块、匹配模块和图像显示模块及其各个模块的功能。系统采用欧氏距离法作为图像的相似性度量,采用灰度共生矩阵算法提取图像的纹理特征。最后通过实验对给定的图像进行检索。关键词:图像检索,纹理特征,共生矩阵目 录1 前言11.1 图像检索的发展现状11.2 图像检索技术分类31.3 研究内容与章节安排52 图像检索的基本原理62.1 检索系统通用框架62.2 检索系统关键技术7特征提取7高维索引92.3 检索查询方式102.3.1外部图例查询10内部图例查询10草图查询112.4 图像的相似性度量11概述112.4.2相似性测度112.4.3非几何相似性测度132

3、.4.4小结142.5 本章小结153 基于纹理特征的图像检索算法研究163.1 纹理特征概述163.2 基于小波变换的纹理特征提取18图像的小波变换18小波基的选择20小波基的正则性阶数21小波变换的级数223.3 基于灰度共生矩阵的纹理特征23灰度共生矩阵23灰度共生矩阵特征提取273.4 基于灰度一梯度共生矩阵的纹理特征27灰度一梯度共生矩阵27灰度一梯度共生矩阵特征提取283.5 本章小结294 图像检索系统设计与实现304.1 系统模块和功能304.2 系统流程314.3 主要算法说明31基于灰度共生矩阵的纹理特征提取算法31纹理特征计算的代码344.4 实验及结论39检索系统的评价

4、指标39实验结果及分析40本章小结425 总结与展望435.1 总结435.2 展望43致谢44参考文献451 前言随着互联网技术向宽带、高速、多媒体方向的发展,人类正快速进入一个信息化的时代。各种信息工具、技术、载体等应运而生。在众多类型的信息资源中,图像具有直观、形象、易于理解和信息量大等特点,成为资源库的重要组成部分。同网络信息一样,由于图像数量巨大,种类繁多,加之排列方式错综复杂,这给图像检索带来了困难。近年来,基于内容的图像检索技术有了长足的发展。基于内容的图像检索能有效的对图像进行管理和检索,这项技术既充分体现了图像的信息特点,又充分结合了传统数据库技术,它的应用对解决信息膨胀,有

5、效快速地利用多媒体信息有很好的实用价值。图像的内容包括图像的颜色、纹理、形状等视觉特征和语义特征。其中,纹理特征作为最为显著的视觉特征之一,它是一种不依赖于颜色或亮度反映图像中同质现象的视觉特征。纹理特征包含了物体表面结构组织排列的重要信息,以及与周围环境的联系。因此在基于纹理的图像检索中得到了广泛应用。1.1 图像检索的发展现状自90年代以来,基于内容的图像检索已经成为了一个非常活跃的研究领域。从目前的研究现状来看,基于内容的图像检索可分为3层。下层是基于颜色、纹理、形状等反映图像基本物理特征的检索,是最直接也是最基本的层面,用到图像信息处理、图像分析和相似性匹配技术。中间层是基于图像对象语

6、义的检索,如图像中实体及实体之间的空间关系的检索,对象级检索技术建立在下层特征基础上,并引入了对象模型库、对象识别和人工智能等图像理解技术。最上层是基于图像概念级语义的检索,其技术建立在对象层语义特征提取的基础上,引入了对象和场景之间的逻辑、情感等高层语义的描述及识别,需要用到知识库和更加有效的人工智能和神经网络技术。到目前为止,已有许多商业的或是用于研究的图像检索系统问世。QBIC(Query ByImage Content)图像检索系统是IBM公司90年代开发制作的图像和动态景象检索系统,是第一个基于内容的商业化的图像检索系统。用户无须提供文字检索词,只要输入以图像形式表达的图像检索要求就

7、可以检索出一系列相似的图像。Virage是由Virage公司开发的基于内容的图像检索引擎。同QBIC系统一样,它也支持基于色彩、颜色、布局、纹理和结构等视觉特征的图像检索。Jerry等人还进一步提出了图像管理的一个开放式框架,将视觉特征分为通用特征(如颜色、纹理和形状)和领域相关特征两类。Photobook是美国麻省理工学院的多媒体实验室所开发的用于图像查询和浏览的交互工具。它由两个子系统组成,分别负责提取形状、纹理、面部特征。因此,用户可以在这两个子系统中分别进行基于形状、基于纹理和基于面部特征的图像检索。VisualSEEK是基于视觉特征的检索工具,WebSEEK是一种面向www的文本或图

8、像搜索引擎。这两个检索系统都是由哥伦比亚大学开发的。VisualSEEK同时支持基于视觉特征的查询和基于空间关系的查询。WebSEEK包括两个主要模块:图像视频采集模块,主题分类和索引模块、查找、浏览和检索模块。Netra系统是加利福尼亚大学的A1exandria数字化图书馆项目(AlexandriaDigital Library)中用于图像检索的原型系统。它从分割后的图像区域中提取颜色、纹理、形状和空间位置信息,并依靠这些信息从数据库中查找相似的区域。Netra在研究方面的主要特点包括:采用了基于Gabor滤波器的纹理特征:基于神经网络的“图像词典”的构造和基于边缘流的图像分割。MARS(M

9、ultimedia AnalysiS and Retrieval System)是美国伊利诺斯大学开发的,它无论在研究角度还是应用领域都和其他的图像检索系统有很大的差异。MARS是计算机视觉、数据库管理系统以及传统的信息检索技术多个领域交叉的结果,它的主要特点包括:数据库管理系统和信息检索技术的结合;索引技术和检索技术的融合以及计算机和人的融合。MARS系统的重点在于根据实际的应用环境和用户的需要,在检索框架中动态地组合和调整各种不同的图像特征。MARS在图像检索领域正式提出了相关反馈的体系结构。相关反馈技术在各种层次上融合到检索的过程中,包括查询向量的优化,相似度算法的自动选择,以及图像特征

10、权重的调整。国内的一些研究单位已相继开展了基于内容的图像检索的研究工作,并开发了一些实验系统。主要有清华大学在视频检索方面的研究,国防科大在多媒体数据库检索系统方面展开研究,浙江大学也于1995年开始了这方面的研究工作。西北大学可视化技术研究所从1998年开始研究基于内容的图像检索,研究成果在医学影像数据库和数字考古博物馆中已有应用,理论研究和具体实践都取得了可喜的进展。中科院计算机所智能信息处理重点实验室智能科学课题组开发的多媒体信息检索系统Mires开始尝试在药植物数据库、遥感图像检索系统等方面展开应用。2002年,吴冬生、吴乐南提出对JPEG图像的DCT系数利用多分辨率小波变换的形式进行

11、重组,对整个数据库中的所有图像的DCT系数重组得到的若干子带,分别建立子带能量直方图,而后采用Norton顺序建立图像的索引,并采用B树结构组织图像数据库用于图像检索。1.2 图像检索技术分类基于内容的图像检索技术实际上是一种模糊查询技术,通过对图像提取一定的特征,找出在特征空间中与查询要求最接近的图像。基于内容的图像检索技术通常需要明确两个问题:一、如何提取特征,二、特征如何匹配。图像特征(即内容)的提取是基于内容的图像检索(CBIRContent-Based ImageRetrieval)的基础。对于基于内容的检索系统,根据其处理的对象可以将其分为静止图像检索和活动视频检索。本论文主要讨论

12、可视化静态图像特征的提取。根据所提取的特征不同,当前基于内容的图像检索技术可以分为以下几类:1基于颜色特征颜色是图像内容组成的基本要素,是人识别图像的主要感知特征之一,相对与其它特征,颜色特征非常稳定,对于图像的平移、尺度、旋转变化不敏感,具有很强的鲁棒性,而且颜色特征计算简单,因此基于颜色的查询是基于内容的图像检索中应用最广泛的方法。2基于纹理特征纹理是图像的一个重要的特征。准确的纹理定义并不存在,一种定义认为纹理是由纹理基元按某种确定性的规律或者只有某种统计规律排列组成的。另一种更为模糊的定义是纹理是由大量或多或少有序的相似基元或模式组成的一种结构。使用数学或信息论的方法抽取的纹理度量称为

13、纹理特征,纹理特征可用来对图像中的空间信息进行定量的描述。纹理分析的方法主要分为两类:结构方法和统计方法。结构方法假定图像由较小的纹理基元排列而成,只适用于规则的纹理结构。统计方法又可进一步分为传统的统计方法、基于模型的方法和基于频谱分析的方法。传统的统计分析方法始于20世纪70年代早期的二阶灰度统计特征的共生矩阵方法。80年代开始,基于随机场模型的技术被用于纹理分析。随机场模型包括圆同步自回归(Circular Simultaneous Autoregressive)模型和高斯马尔可夫随机场(GMRF,GaussianMarkov Random Field)模型。多尺度的思想促进了基于频谱分

14、析方法的发展,特别是基于Gabor滤波器的技术在纹理分析中被广泛采用。在实际的检索系统中应用的纹理特征方法一般有:象素域法、共生矩阵法、视觉纹理特征表达法、分形编码法、小波变换法等。3基于形状特征基于对物体的形状特征进行检索是基于内容检索中最具挑战性的问题之一,因为寻找符合人眼感知特性的形状特征并不是件简单的工作。形状特征的重要原则是对位移、旋转、尺度变换的不变性,人们出于识别和检索的目的,总是趋向于忽略这种变化。形状特征的描述一般可分为两类:基于边界和基于区域。前者利用的是形状的外边界,后者利用的是整个形状区域。描述方法有:边界方向直方图、傅立叶描述符、矩不变量、Chamfer匹配、Turn

15、ing函数、小波描述算子以及2D,3D形状表达等。傅立叶描述符用傅立叶变换后的边界作为形状特征,用较少的参数可以包纳很复杂的边界。矩不变量是使用基于区域的矩(与变换无关)作为形状特征。4基于边缘草图基于边缘草图的查询是用户提交一幅想要查询的物体的大致轮廓,由系统找出与此轮廓相匹配的图像。草图的查询可以通过计算图像的边缘图来实现,这种方法的缺点是没有方向和尺度的不变性,类似的图像可能因为方向和尺度的不同而被遗漏,这种问题需要有复杂的边缘表示和匹配算法来消除。5基于空间关系的对于包含多目标的图像,目标之间的空间关系是又一种描述图像内容的特征。描述物体问的空间关系首先需要对图像进行目标分割和识别,然

16、后可将图像转化成采用2维串2D String)编码的符号图像,2维串描述物体间的关系是通过一系列算子(上、下、左、右等),图像的检索问题变成了一个2维串匹配的问题。2维串的匹配是基于一个简单的分级方案,然而用于生成2维串的算法需要对象分割和识别,计算量相当大。6基于非视觉特征的现在运行的商用系统通常采用关系型数据库,这些系统中图像的属性包括图像来源、拍摄时间和地点、媒介类型、分辨率、输入设备、压缩方式、以及与图片相关的注释信息,注释信息对于用户来说是非常自然的描述,然而这种特征描述因人而异,而且无法自动提取,给检索系统带来很大的困难。1.3 研究内容与章节安排1 在前言中,主要介绍国内外图像检

17、索技术的历史发展、最新进展及应用状况,最后介绍图像检索技术的分类。2 第二章介绍图像检索的基本原理。介绍检索系统的通用框架,检索系统的关键技术、检索的查询方式及其特点及图像的相似性度量。3 第三章介绍基于纹理特征的图像检索算法。详细介绍基于灰度共生矩阵的纹理特征提取算法。5 第四章介绍检索系统设计与实现。介绍系统模块和各模块的功能,检索系统的流程,并对主要算法进行详细说明,最后通过实验对给定的图像进行检索。6 第五章总结与展望。总结论文,并提出了论文下一步的工作以及图像检索系统的发展方向。2 图像检索的基本原理基于内容的图像检索遵循概率排队的规则,根据用户的查询需要,对查询样本和库中图像分别计

18、算相关特征,并比较特征的相似性,最后按相似性值由大到小排列库中图像,完成一个查询过程。这一新的研究方向涉及图像处理(Image Processing),图像识别(Image Recognition)和图像数据库(Image Database)技术,把这3个领域的研究成果进行有效的结合是该技术取得成功的基础。基于内容的图像检索技术由于能够根据图像的可视内容产生查询,从而方便了用户,检索时针对不同的具体应用,使用一种特征或组合几个特征进行检索。基于纹理特征的图像检索是基于内容图像检索的一个方面,因此,本章将讨论基于内容的图像检索系统的通用框架、关键技术、检索查询方式及检索特点。2.1 检索系统通用

19、框架基于内容的图像数据库检索系统是一种重要的多媒体信息处理技术。一般把基于内容的图像数据库检索系统看作是介于信息用户和数据库之间的一种信息服务系统。系统的通用框架如图21所示。多 媒 体 数 据 库信息用户查询描述匹配验证提取图2-1 基于内容的图像检索系统通用框架(1)查询模块对用户提供多样的查询手段,以支持用户根据不同应用进行各种类型的查询工作。(2)描述模块系统将用户的查询要求转化为对图像内。容比较抽象的内部表达描述,即以一定的计算机可以方便表达的数据结构描述给定图像的内容。这是基于内容的图像检索系统的关键模块,如何描述图像,直接关系到检索系统的性能。(3)匹配模块将查询描述与图像库中被

20、查询图像进行内容匹配和比较,以确定它们在内容上一致性和相似性。这个匹配结果将传给提取模块。匹配模块所使用的方法与描述方法密切相关。(4)提取模块根据匹配的结果,在内容匹配的基础上将所有满足给定条件的图像自动地从图像库中提取出来。(5)验证模块提取的图像是否满足用户要求还需验证。如果验证效果不满意,新一轮的查询可以通过修改查询条件而重新开始。2.2 检索系统关键技术基于内容的图像检索系统的关键技术为:图像的特征提取和图像数据索引结构的构造。下面分别介绍这两个关键技术。特征提取特征抽取是基于内容的图像检索的基础,目前比较成熟的特征是颜色、纹理、形状和物体间方位关系。这些特征具有计算简单,性能稳定的

21、特点,但这些特征都有一定的局限性。1 颜色颜色是一种重要的视觉信息属性,在图像查询与检索中是种很有用的特征。相对于其它特征,颜色特征非常稳定,对于旋转、平移、尺度变化,甚至各种变形都不敏感,表现出相当强的鲁棒性,而且颜色特征计算简单,因此成为现有检索系统中应用最广泛的特征。颜色检索的基本思想是将图像间的相似度归结为颜色直方图之问的距离。这方面奠基性的工作是Swain和Ballad提出的直方图求交算法,它计算两幅图像三维颜色直方图的每一个颜色单位,并进行细致的比较。Mehtre等人提出距离算法和参考颜色表方法,实验表明,每幅图像只需保留很少几种主要颜色就能得到很好的结果。为了得到与人的感觉类似的

22、相似性度量,一些研究者还提出采用其它的颜色空间模型和距离测度。Zhang等人采用了符合人眼感觉的HSV(HueSaturation Value)模型,Baraldi等人在进行直方图匹配时引入了二次型距离。另外,在提高检索对于光照的稳定性及空间分布信息的引入等方面,也出现了很多算法。2 纹理纹理是与物体表面材质有关的图像特征,目前也是基于内容的图像检索系统中的一个重要手段。纹理分析一直是计算机视觉中的一个重要研究方向,其方法主要分为两类:结构方法和统计方法。结构方法假定图像由较小的纹理基元排列而成,它采用句法分析方法,只适用于规则的结构纹理。统计方法又可进一步分为传统的统计方法、基于模型的方法,

23、以及基于频谱分析的方法。传统的统计分析方法始于20世纪70年代早期,Haralick等人提出了基于二阶灰度统计特征的共生矩阵方法。之后,Tamura以人的主观心理度量为标准,提出了6个基本的纹理特征,这些特征与人的感受较一致,在许多图像检索系统中得到应用。20世纪80年代,基于随机场模型的技术被用于纹理分析中。Kashyap等人提出用CSAR模型提取旋转不变的纹理特征。麻省理工大学的Photobook中采用了随机场的二维分解技术,得到周期性、方向性和随机性三种特征,用于纹理图像检索。多尺度的思想促进了基于频谱分析方法的发展,特别是基于Gabor滤波器的技术在纹理分析中被广泛采用,Gabor滤波

24、器可以通过调整获得图像不同方向和尺度的纹理信息。Lee等人把它用于图像检索,并把它与小波变换方法作了比较。3 形状形状基于图像内物体形状的检索是基于内容检索当中一个最具挑战性的问题之一,因为寻找符合人眼感知特性的形状特征不是一件简单的工作。首要的困难是要将不同物体从图像中分割出来,这是计算机视觉中的一个困难问题。形状的描述也是困难的问题,常用的方法有傅立叶描述子、矩不变量、各种简单的形状因子(如面积、圆度、偏心度、主轴方向)等。除了这些全局特征以外,有时也用一些局部特征(如直线段、圆弧、角点、高曲率点等),来解决遮挡问题。除这些常规方法外,人们还提出了许多基于不变性和变换的方法。由于基于简单特

25、征的方法无法对形状作细致的匹配,也不能解决广泛存在的变形问题。因此实际系统中常常只用它们来作初步的过滤,最终的匹配结果由一些更复杂的方法给出,如变性模板、弹性匹配等。4 区域与目标由于颜色、纹理的检索仅适合部分图像检索的情况,且检索的正确率不高,而且在很多情况下,人们感兴趣的并不是整幅图像,而是图像中的某些区域或目标。因此,近几年来人们提出了基于区域或目标的图像表示和检索方法,在这类方法中通常需要完成图像分割,然后再利用感兴趣部分的图像信息进行检索。高维索引为了使基于内容的图像检索能真正地适合于大规模的图像集合,需要研究有效的多维索引技术,这里有如下两个难题需要解决。(1)高维度特征向量的维度

26、通常具有10²的数量级。(2)非欧拉相似性度量计算由于欧拉度量可能不适合对某些视觉内容的人类感知的仿真,因此需要支持其它的各种相似性度量方法,如直方图求交等。为解决高维索引问题,一种有前途的方法是首先减少维度,然后使用能支持非欧拉相似性度量的多维索引技术。1 维度压缩有两种方法可用于维度压缩:一种是KL变换,另一种是列向聚类。KL变换及其变种己广泛用于人脸识别、特征图像以及信息分析。Ng等人采用特征图像的方法来进行维度压缩。Faloutsos等人提出了KL变换的快速近似算法进行维度压缩,研究结果表明,大多数实际图像集(视觉特征向量)可以作维度压缩,而且在检索质量上不会引来明显的退化。

27、Chandrasekaran等人提出了一种低秩单值分解法,在执行KL变换时非常有效,且在数值上是稳定的。由于图像检索系统是一个动念系统,新的图像会不断地添入到图像集合之中,该算法具有处理动态的索引更新能力。除了KL变换之外,聚类是另一个进行维度压缩的有力工具,聚类技术广泛用于模式识别、语音分析和信息检索之中。通常,相似的对象(模板、信号和文档)被聚在一起以执行识别或者分组,这种聚类称为行向聚类,当然也可进行列向聚类以达到维度压缩的目的。2 多维索引技术多维索引技术的研究主要在3个领域,即计算几何、数据库和模式识别。最流行的多维索引技术有K-d树,R树及其变种R+树、R树,四叉树,聚类法,神经网

28、络法等。多维索引技术始于70年代中期,当时引入的方法是Kd树和四叉树,然而其性能远不尽人意。由于地理信息系统和计算机辅助设计系统中对空间索引的迫切要求,Guttman提出了R树的索引结构,之后R树的多个变种被相继提出。过去,大多数关于树的索引技术是为传统的库查询提出的,而不是为图像检索中的相似查询提出的。因此,目前多维索引的重点集中在图像检索中新的特征和需求上,即如何标识与改进适合于表达高维度特征向量的索引技术,其中二种有前途的方法是聚类法和神经网络法。2.3 检索查询方式在不同的应用环境中,用户可能会进行不同类型的查询工作。因此,由用户的不同需求产生了多种查询方式,下面分别介绍。外部图例查询

29、外部图例查询(Query by External Pictorial)中的示例图像来源于检索系统的外部,也就是说给定的图像不是数据库中存储的图像。用户可以数字化一张照片,也可以在Internet或别的什么地方找到一幅质量比较好的图片作为示例,要求系统在数据库中搜索相似的图像。外部图例查询的优点是易用性好,缺点是需要付出一定的努力向系统提供外部示例图像。内部图例查询内部图例查询(Query by Internal Pictorial Example)中的示例图片是从检索系统的数据库中选出的。当没有可用的外部示例图片时,用户可以从可用的图像集合中选择查询图片。系统在其它方面的功能与外部示例图片基本

30、一致。内部图例查询的优点是用户不再为获得一个外部示例图片而烦恼,缺点是仍然需要用户付出努力在数据库中找到一幅合适的示例图片。草图查询草图查询(Query by Sketch)是图例查询的一种形式,其中的示例图像由用户创建,用户为他希望得到的图像勾画一张草图。用户在查询画布上组织或编辑一些预定义的图片元素以创建一幅示例图像。因此,检索系统必须为用户提供一些图像部件和画图工具。与自然图像相比,人工创作的草图具有更高的抽象性,用户只需勾画出他所寻找的图片的重要部分,在这方面草图查询要比其它使用已有图片的图例查询更具优势。草图查询的缺点是它要求用户或多或少要有一些艺术才能,因此,草图查询在大多数的场合

31、下仅用来指出图像中对象的位置或一些对象的全局属性。可见,草图查询的优点是用户可以根据需要指出最重要、最感兴趣的图像细节,缺点是草图的创建比较困难,而且很难建立草图与图像之间的映射关系。2.4 图像的相似性度量概述在基于内容的图像检索中,两幅图像是否相似是指图像的特征向量是否相似。常用的图像相似性测度通常采用几何模型,将图像特征看作是向量空间中的点,通过计算两个点之间的接近程度来衡量图像特征之间的相似度。基于内容的图像检索算法主要有最邻近查询算法和区间查询算法,它们都依赖于距离函数或者相似性度量。在基于内容的图像检索中,例子图像查询是主要的查询方式。图像或者图像片段可以用一系列包含有d个特征(x

32、1,x2,.,xd)的集合来表示,这些特征包括纹理、形状、颜色以及它们之间的组合。在d维特征空间中,把特征聚合成为一个特征向量,可以根据不同坐标轴来标记相应的特征。为了支持最邻近查询和区间查询,特征空间必须与一个度量或者相似性测度相匹配。在图像相似性测度中,可以采用各种距离函数或者距离度量、统计学方法和非几何相似性测度方法。相似性测度假设在图像数据库中,用特征向量来表示任何一个图像特征,其中X和Y,分别是任意两个特征向量,它们满足图像相似性度量中的自相似性、最小性、对称性和三角不等性度量公理,它们之间的接近程度可以采用距离度量或者统计学方法来进行图像相似性判断。常见的距离度量有欧几里德距离、M

33、anhattan距离、Minkowsky距离、Mahalanobis距离等。(1)欧几里德距离欧几里德距离是一个应用非常普遍的距离度量。它的计算简单,并且与参考系统的旋转不变量相关。它的定义如下: (2-1)当发生数据丢失或者当所有特征向量不具备相同的权重时,那么就不能使用欧几里德距离来进行相似性测度。为了避免这种情况,在实际的应用过程中可以对欧几罩德距离进行归一化。归一化欧几里德距离的定义如下所示: (2-2) (2)Manhattan距离Manhattan距离又叫街区距离,它与欧几里德距离具有相同的计算复杂度,它的定义如下: (2-3) (3)Minkowsky距离Minkowsky距离的

34、定义如下: (2-4)Minkowsky距离是一个距离函数系列,它的参数为P。在个别维数中,利用非负权重可以进行不同的加权计算。它的数学表达式如下: (2-5) (4)Mahalanobis距离它是一个计算复杂的权重欧几里德距离。它根据一个协方差矩阵C来定义,它的定义如下所示: (2-6) C-1是C的协方差式逆矩阵,如果C是恒等矩阵,那么Mahalanobis距离就变成欧几里德距离。当特征向量的分向量之间没有相关性,可以对Mahalanobis距离进行简化。(5)相关系数它的定义如下: (2-7)其中=是数据库中所有向量的均值。如果把点X和Y,投影到单位半径为的球面上,量化为22p(X,Y)

35、,它就是投影区间的欧几里德距离。在投影区间中,对应于搜索空间的尺度和旋转不变量就是相关系数。它可以用于统计任意变量的偶合行为属性。(6)相对熵它仅仅应用于随机分布,它的定义如下所示: (2-8)仅仅当元素X和Y非负并且具有实际意义。因为它不具备对称性,也不满足三角形不等式,所以它不是距离度量。当它应用于图像检索的时候,可以把第一个独立变量作为查询向量,第二个独立变量作为数据库向量。(7)距离它仅仅应用于随机分布,它的定义如下: (2-9)当且仅当元素X和Y非负并且具有实际意义。它在计算量和分裂上的耗费很大。非几何相似性测度在实践过程中,许多人发现距离度量方法与人对相似性的感知判断之间存在一定差

36、距。相似性度量中的自相似性、最小性、对称性和三角不等性度量公理也同样存在一些争议。根据庄越挺、潘云鹤和吴飞编著的网上多媒体信息分析与检索介绍,在1977年,Tversky提出了著名的特征对比模型。在特征对比模型中,它不是把每个实体看作特征空间中的一个点,而是把每个实体用一个特征集合来表示。假设两个实体a和b,它们对应的特征集合分别用A和B来表示,两个特征集合之间满足匹配性、单调性和独立性假设。根据下述假设,Tversky提出的对比模型定理可以归纳为:如果满足匹配性、单调性和独立性假设的度量函数,一定存在一个相似性度量函数S和一个非负函数f,以及两个常量>0,对于实体a,b,c,d和它们的

37、特征集合A,B,C,D,有如下公式: (2-10)是一个反映特征显著性的函数,它用来衡量指定特征对相似度的贡献,时,相似函数是不对称的。小结欧几里德距离的优点是当对坐标轴进行正交旋转时,欧几里德距离保持不变,样本集合仍然能够保持原来的相似性结构。它的缺点是平方根的计算比较费时并且它的数值不是整数。Minkowsky距离的计算比较简单,应用比较广泛。Minkowsky距离受到特征向量的量纲影响很大。在图像检索过程中,必须对数据进行标准化处理以统一量纲,使它具备度量的可比性和一致性。Minkowsky距离包含了特征属性的差异,可以从总体上估计可视化非相似性。当特征向量具有不同取值范围,利用加Min

38、kowsky距离来进行图像相似性测度比较合适。Minkowsky距离没有考虑特征差异的组合,同时也没有考虑特征向量的多重相关性,特别是当两个特征具有高度相关性的时候,可能会对相似性测度产生很大影响。Mahalanobis距离的优点是它重视样本的统计特征,排除了样本间的相关性影响。Mahalanobis距离是Minkowsky距离的改进,它对于一切线性变换都具有不变性,克服了Minkowsky距离受量纲影响的缺点。非几何相似性度量吸收了几何相似性度量的优点,提出了一个广泛的理论衡量方法。在实际应用中,它只适用于具有明显特征的对象,同时在具体应用环境中还需要明确显著性函数的表达式。总之,图像相似性

39、测度一般采用几何模型,它对某些人类感受的相似性比较合适,与基于内容的特征描述比较相似。在很多情况下,基于几何模型的相似性测度与人类感受的相似性还存在很大差距。2.5 本章小结本章对基于内容的图像检索进行了一个简要的概述。分析了基于内容的图像检索系统的基本原理,介绍了基于内容的图像检索系统的通用框架、关键技术、检索查询方式和检索特点,最后介绍了图像的相似性度量。3 基于纹理特征的图像检索算法研究纹理是描述图像时常用的一个概念,类似于颜色,也常取决于感知。纹理特征是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征。它是所有物体表面共有的内在特性,例如,云彩、树木、砖、织物等都有各自的纹理特征。

40、纹理特征包含了物体表面结构组织排列的重要信息,以及它们与周围环境的联系。正因如此,纹理特征在基于内容的图像检索中得到了广泛应用,用户可以通过提交包含某种纹理的图像来查找含有相似纹理的其它图像。本章首先对纹理进行了概述,然后根据纹理的空间性质和频域性质对基于纹理特征的图像检索算法进行了研究,总结出有效的检索算法。3.1 纹理特征概述尽管纹理在影像分析中十分重要而又普遍,但是到目前为止,对纹理还没有一个确切的定义。人对纹理的感受是与心理效果相结合的,所以用语言或文字来描述纹理通常很困难。纹理具有区域性的特点,一个纹理需要用一个向量来表示,或者说一个纹理可用一个多维特征空间中的一个点表示。纹理可认为

41、是灰度在空间以一定的形式变化而产生的图案,是真实图像区域固有的特征之一。任何物体的表面,如果一直放大下去进行观察的话,一定会显现出纹理。从心理学的观点考虑,人类观察到的纹理特征有粒度(granularity)、方向性(directionality)和重复性 (repetitiveness)等。一般来说,纹理和图像频谱中高频分量是密切联系的,光滑的图像一般不认为是纹理图像。纹理是模式识别中用来辨别图像区域的概念。常使用区域的尺寸、可分辨灰度元素的数目以及这些灰度元素的相互关系来描述一个图像中的纹理区域。要分析纹理,需要确定一定的尺度,一幅纹理图像在较粗的尺度上可能看不出纹理来,需要到更细的尺度上

42、观察。一般来说,可以认为纹理是由许多相互接近的、互相编织的元素构成。所以,纹理描述可提供图像区域的平滑、稀疏、规则性等特征。基于以上说明,一般把纹理视为两种:结构纹理和统计纹理。定义1:纹理是在某一确定的图像区域中,以近乎周期性的种类和方式重复其自身的局部基本模式。在这一定义下,纹理由基本模式及其规则排列构成,这形成了结构法纹理分析的基本步骤。定义2:纹理是在某一确定的图像区域中,相邻像素的灰度(或色调、颜色)服从某种统计排列形成的一种空间分布。这一定义要求通过统计方法实现对纹理的描述。纹理分析指的是通过一定的图像处理技术抽取出纹理特征,从而获得纹理定量的或定性描述的处理过程。纹理分析包括检测

43、纹理基元和获得相关纹理基元排列分布方式的消息两大部分。在一个尺度上进行纹理的分析和测量,研究图像在小范围内的不规则性,称之为微纹理分析。纹理具有多尺度特性,不同的尺度可对应不同的纹理结构,在多尺度或多分辨率上分析纹理,称之为宏纹理分析。常用的纹理分析方法有三种:统计分析方法、结构分析方法和频谱分析方法。一般来说,统计分析方法应用于微纹理(micro-texture)图像的效果较好,而对宏纹理(macro-texture)图像需要结合统计和结构两类方法进行分析。频谱分析方法借助于傅立叶频谱的频率特征来描述周期的或近乎周期的二维图像模式的方向性。1.统计分析方法统计分析方法是最早在纹理分析中应用的

44、方法之一,也是目前研究较多、占主导地位的一种方法。它利用图像的统计特性求出特征值,基于图像特征空间一致性进行分析。主要包括通过自相关函数、灰度共生矩阵、滤波模板、随机模型(Markov随机场模型、Gibbs随机场模型)、分形模型等来计算纹理图像的特征值。此类方法通过计算图像中每个点的局部特征,从特征的分布中推导出一些统计量来刻画纹理,所以存在计算量大、分割精度差、抗噪能力差等缺点。该方法适合于广泛存在的自然纹理,也同样适于描述人工纹理,是目前较为成熟、实用的一类方法,在纹理特征提取中占主导地位。2.结构分析方法结构纹理分析方法认为纹理是由许多纹理基元组成的某种“重复性”的分布规则。结构分析方法

45、的基本思想认为复杂的纹理可由一些简单的纹理基元以一定的有规律的形式重复排列组合而成。当纹理基元大到足够单独的被分割和描述时,才有必要使用结构分析法。纹理结构分析通常分三步骤:一是图像增强;二是基元提取;三是计算纹理基元的特征参数及构成纹理的结构参数。3.频谱分析方法频谱分析方法借助于傅立叶频谱的频率特征来描述周期的或近乎周期的二维图像模式的方向性。对一个给定的图像,二维傅立叶变换显然能包含其全部的纹理信息。因此,如同从物体本身导出纹理特征一样,从频谱导出纹理特征也是很有用的。小波变换和Gabor滤波器是目前纹理分析中应用最为广泛的方法。在纹理分析领域,人们开展了深入的研究,结合多通道Gabor

46、滤波、小波变换、神经网络、MRF(随机场)、分形学等数学方法,对纹理分析提出了大量创新和改进,很大程度上提高了纹理分析的精度。如采用适合纹理分析的小波基对纺织品纹理进行缺损检测,Ajay Kumar和Granthan KH Pang等人将Gabor滤波用于有纹理现象的物体结构缺损检测,KNBhanu Prakash等人利用灰度共生矩阵对母体内胎儿的肺部超生图像检测其是否已到成熟期。近年来国内外一些学者提出了利用遗传算法、模糊集理论、分形理论和神经网络等进行纹理分析,也在某些领域获得了比较好的实验结果。从上述对纹理分析方法的发展和应用的介绍可以看出,基于统计的方法是应用最多的一种方法,小波变换、

47、Gabor滤波法适应了纹理本身的多尺度特性,是目前发展较快,应用较多的方法。本文主要应用灰度共生矩阵、小波变换和梯度灰度共生矩阵等数学方法进行纹理特征提取,并对基于纹理特征的图像检索进行讨论和研究。3.2 基于小波变换的纹理特征提取图像的小波变换用小波变换的方法分析纹理图像时,如果纹理尺寸较小或对比度不高,通常采用较高的分辨率;如果尺寸较大或对比强,只需要较低的分辨率。因此,当纹理尺寸大小不一、对比度有强有弱时,这种方法提取特征参数有较大的优势,也符合纹理识别的特点。小波在图像处理上的应用思路主要采用将空间或者时间域上的图像信号(数据)变换到小波域上,成为多层次的小波系数,根据小波基的特性,分

48、析小波系数的特点,针对不同需求,结合常规的图像处理方法(算法)或提出更符合小波分析新方法来处理小波系数,再对处理后的小波系数进行反交换(逆变换),将得到所需的目标图像。基于小波分析及其变换的图像处理过程可以用图3-1所示。小波正变换图像处理小波逆变换图像输入图像输出图3-1 小波与图像处理为了将小波变换应用于图像处理,需要有二维的小波函数和尺度函数。采用可分离变量的方法可以由一维小波函数(x)和尺度函数(x)构造所需要的二维小波函数,即: (3-1) (3-2) (3-3) (3-4)其中,是二维尺度函数,、是三个二维小波函数。每个小波上的H表示水平方向,V表示垂直方向,D表示对角线方向。由式

49、给出的尺度函数和小波函数,可以定义一个伸缩和平移的基函数: (3-5) (3-6) (3-7) (3-8)利用这些基函数就可对图像f(x,Y)进行分解。图3-2为图像的小波分解示意图。其中LLL2 HL2 HL1LH2 HH2LH1 HH1 LL1 HL1 LH1 HH1L H 原图像 图3-2 图像的小波分解示意图表示低频,H表示高频,下标1、2分别表示一层、二层分解。图像在每个尺度上被分解成四个子带,其中LL为低频子带,是原图像的平滑逼近;LH是沿水平方向的高频子带,反映图像的水平边缘情况;HL是沿垂直方向的高频子带,反映图像的垂直边缘情况;HH是沿对角方向的高频子带,反映图像的斜边缘情况

50、。图3-2表示的是金字塔结构的迭代分解情况,即在该结构分解中,仅分解LL子带来生成下一尺度的各频带输出,而不分解其它子带。因为小波变换后的能量主要集中在低频子带。小波基的选择从理论上讲,任何实正交的小波对应的滤波器组(H)均能实现图像的分解与合成,但是,并不是任何分解均能满足要求,同一幅图像用不同的小波基进行分解所得到的数据压缩效果是不同的。由于小波变换是将原始图像与小波基函数以及尺度函数进行内积运算,1989年Daubechies基于离散滤波器迭代的方法构造了紧支集的规范正交小波集,因而内积运算转换为信号和离散滤波器的卷积运算,小波变换中的小波基的选取转换为正交镜像滤波器QMF的选取。小波基

51、不是唯一的,对于小波基的选取(相当于对QMF的选取)一般情况下需考虑以下几个因素:(1)线性相位特性:以减少或消除重构图像在边缘处的失真。(2)紧支集特性:支集越短,小波变换的计算复杂度越低,便于快速实现。(3)消失矩特性:即(H), n=1,2,3,k-1。一般来说,k越大,小波变换后能量越集中于低频子带,而在高频子带中则会出现更多的0。(4)所处理图像与小波基的相似性。(5)综合考虑压缩效果和计算复杂度。图像小波分解后的各层小波系数都包含了图像中目标的信息,合适的选择小波基可使小波变换空间能量集中,这样有利于选取主要成份作为特征。研究表明在正交小波中,Haar小波在时域是不连续的,频域的局

52、部衰减特性也较差;Shannon小波恰好相反,频域是不连续的,时域衰减性不好;Daubechies小波不具有对称性(即不具有线性相位),以样条函数作尺度函数,然后正交得到的Battle-Lemarie小波不是紧支集的。Daubechies已经证明,既具有紧支集,又具有对称性的正交小波是不存在的。在利用小波对图像处理时,为了减少处理后图像的相位延迟,通常要求小波具有对称性,为此采用双正交小波。在图像压缩算法中应用的线性相位双正交小波基,有保留空间细节的位置和集中能量压缩信息的特性。小波基的正则性阶数从子带编码概念出发,将一维子带分解推广到二维,从而实现图像二维子带编码,其分解过程是靠精确重建滤波

53、器组来实现的。子带编码与小波变换编码都属于多分辨率编码(Mufti-resolution),它们的分解都相同,都可以用Mallat算法实现多级分解的递推运算。它们之间的重要区别是小波分解要求滤波器具有正交性,而子带编码却不要求。正则性是函数光滑程度的一种描述,也是函数频域能量集中的一种度量。函数的正则性有Sobolev定义和Holder两种定义形式。定义(sobolev)3.1 若则称函数具有r阶正则性。此定义用得非常广泛,且r的值可由估算出,但它没有表现的波形与正则性的关系且忽略了滤波器的相应信息。定义(Holder)3.2 设0<a<1,若对任意t,有则称的Holder的正则性阶数为a。其中c是一个与t,无关的常数。若的N阶导数满足上式且r=N+a,则称的Holder正则性阶数为r。小波函数或尺度函数的正则性与低通滤波器在的过零点数相关,但这种联系并不明显。尺度函数的正则性或多或少是其光滑度的测量,更为特殊的是,如果尺度函数是m次可微的,其m次导数是指数为a的Holder连续,那么它是a+m次正则的。对应的小波函数与尺度函数具有相同的正则性。小波的正则性与滤波器的长度成正比,滤波器越长,支集越大,正则性越好,光滑性越好,但小波变换的计算复杂度越高,实用性变差。在小波变换过程中,假定输入信号的一段光滑部分经过正则性很差的滤波。本身的不连续性将反映在离散小波变换(D

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论