现状概述及研究方案的确定_第1页
现状概述及研究方案的确定_第2页
现状概述及研究方案的确定_第3页
现状概述及研究方案的确定_第4页
现状概述及研究方案的确定_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、现状概述及研究方案的确定一、图像检索的目的和意义随着计算机应用的普及信息处理技术的发展,以文本、图像、声音和视频为主的媒体信息迅速成为信息交流和服务的主流,现代信息处理的对象和方法都有了很大的变化。大量各种信息被生成、采集、传输、流通和应用,我们正在快速进入一个信息化的社会。值得关注的是全世界的数字图像的容量正以惊人的速度增长,每天都会产生数以百万记的图像。随着互联网的发展,越来越多的人能够更加方便、快捷、经济地接触到这些图像媒体,人们面临的问题不再是缺少图像媒体的内容,而是如何在浩如烟海的图像世界中找到自己所需要的信息。如果没有对图像及视频数据的自动和有效地描述,大量信息将淹没在信息的海洋之

2、中,无法在需要时被检索出来。这就要求有一种能够快速而且准确地查找访问图像的技术,也就是所谓的图像检索技术。二、图像检索的主要研究内容和技术现状图像检索的过程就是图像特征的提取、分析及匹配。特征提取:提取各种特征,如颜色,纹理,形状等。根据提取的特征不同,采取不同的处理,比如提取形状特征,就需要先进行图像分割和边缘提取等步骤。选择合适的算法,并在效率和精确性方面加以改进,以适应检索的需要,实现特征提取模块。特征分析:对图像的各种特征进行分析,选择提取效率高、信息浓缩性好的特征,或者将几种特征进行组合,用到检索领域。特征匹配:选择何种模型来衡量图像特征间的相似度。检索进行查询的层次基本可分为三层:

3、(1)基于原始数据的查询。这是最低层次的查找,每一幅图像为象素点的简单有序的集合体,查询时相似性的度量标准是点对点的比较。这个层次的比较是非常具体的,只有在使用相对精确匹配时才有用。(2)基于特征的查询。这是较高层次的查询,在基于特征的层次上描述图像。图像特征包括原始属性:颜色、纹理、形状等,也包括脱离了原始性的抽象属性:灰度直方图,颜色直方图,空间频谱图。不同的特征可以被分成不同的特征矢量组。图像的区域划分基本上是根据特征矢量的不同特征,同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存

4、。查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。(3)基于语义的查询。这是最高层次的查询。可以看作是基于对象的查询。查询图像中包括的具体的物体,发生的场景,图像所描述的感性色彩等都属于这个层次的查询。目前实现图像检索的手段有很多,包括基于分数维的图像检索、基于多颜色空间的图像检索方法、基于内容的图像检索、基于区域的图像匹配算法的关键技术研究、基于颜色特征的图像检索方法等等。而且基于图像处理技术的日趋成熟,检索的效果也越来越好,但仍未上升到图像语义的图像检索阶段。三、研究方案图像检索需要匹配图像间相似度,因此需要设计度量图像间距离的模型。不同的特征可以被分成不同的特征矢量组。图

5、像的特征划分基本上是根据特征矢量的不同特征。同一个区域内的特征矢量具有相同的属性。在n维特征空间的查询,实质上就是目标特征矢量的相似性度量。数据库内的图像文件的特征矢量集以及抽取方法,被事先抽取并保存。查询时,使用给出的模板,图像按照库内保存的方法抽取目标特征矢量。于是检索的设计转移到了图像特征空间的设计上。图像的特征大体分三类:颜色、形状、纹理。其中图像数据中直接包含的信息就是颜色,具有相同颜色的像点在一起聚合成各种形状,在人的大脑中抽象成各种符号,如果计算机也会这种抽象的过程,那么所有的问题就解决了。因此设计图像特征空间就要包含这种抽象的过程,使计算机处理图像后的结果尽量接近人脑思考后的结

6、果。这既有可能会导致图像搜索上升一个层次语义层搜索。可以看出图像的语义抽象距离现在已经不再遥远了。作为图像的基本特征:颜色,人们针对它已经设计了很多种算法,包括颜色直方图、加权颜色直方图、颜色聚合度、模板匹配、模糊颜色连通直方图、颜色恒常性颜色检索等等,所有这些包括其中一些非常经典的算法的都没有很好的解决图像特征提取与匹配。因为他们往往都是依靠统计学对图像处理,而统计学一般都会舍弃统计中出现较小概率的事件从而达到较高效率的匹配,因此这样做在匹配结果上无论如何都不会使人满意。而且统计学往往只统计颜色信息往往就忽略了空间分布导致了损失了大量有用的图像信息。所以要设计一种N维模板,其中既包含颜色信息

7、又包含空间分布信息。在拥有这种模板后还要设计计算N维矢量间距离的算法。但是RGB颜色空间并非均匀的线性空间,实验结果证明,距离一定的两种颜色,随这两种颜色的不同引起人的色知觉的差异是不同的。也就是说,对一定距离的某两种颜色让人感到色知觉差异很大,但对另外两种一样距离的颜色,可能会让人感觉差异很小。而在对颜色进行聚类量化时,需要用数量来描述颜色间的差别,简称它为色差,那么RGB颜色空间显然不能满足要求。因此需要一个均匀的颜色空间,在这个3维空间中,每个点代表一种颜色,空间中两点之间的距离代表两种颜色的色差,距离越小,色差越小,反之,色差越大。因此在这里采用Lab色空间,它是1976年CIE(国际

8、照明委员会)推荐的一种近似的均匀色空间10。自身的优势:前面提到过Lab色彩模型的绝妙之处还在于它弥补了RGB色彩模型色彩分布不均的不足,因为RGB模型在蓝色到绿色之间的过渡色彩过多,而在绿色到红色之间又缺少黄色和其他色彩。另外,它的色域宽阔,它不仅包含了RGB,CMY的所有色域,还能表现它们不能表现的色彩。人的肉眼能感知的色彩,都能通过Lab模型表现出来,因此本实验中准备使用Lab色彩模型。试验中主要采用颜色直方图作为颜色特征采集方式,利用颜色特征进行图像检索的关键之一是颜色特征的提取。图像的颜色特征可以是各种颜色的比例分布以及颜色的空间分布等,目前,大部分的检索系统都采用颜色比例分布作为颜

9、色基本特征,这方面算法的研究,也多以此为基点,这就是图像领域中的直方图法。具体做法是,在确定颜色空间的基础上,统计每种颜色分量的像素数占图像总像素数的比例,得到图像各种颜色分量的比例分布直方图,最后把直方图作为图像的颜色特征进行图像检索。这里简要介绍一下颜色直方图:颜色直方图包含三种具体表达方式:一般直方图、累加直方图和二维直方图。1)一般直方图:记为图像P中某一特征(如Hue)值为Xj的像素的个数,为P中的总象素数。对作归一化处理,即图像P的该特征的直方图为 式中,n为某一特征取值的个数。事实上,直方图就是某一特征的概率分布。2)累加直方图:假设图像P某一特征的一般直方图为,令,该特征的累加

10、直方图为。3) 二维直方图:设图像大小为,由 采用或点阵屏画得到的图像为,它的大小也为,由x和y构成一个二元组。称二元组为图像的“广义图像”,广义图像的直方图就是二维直方图。二维直方图中含有原图像颜色的空间分布信息,对于两幅颜色组成接近而空间分布不同的图像,它们在二维直方图空间的距离相对传统直方图空间就会被拉大,从而能够好的区别开来。图像的匹配方法目前有很多,如何用数值来有效的表示图像在颜色上的相似度,这便是图像的相似性度量问题。在模式识别技术中,特征的相似性度量一般采用距离法,即用特征向量的空间距离来表示。在直方图检索中,通过对直方图之间的距离的设定,当它们的距离小于给定的阈值时,即认为符合

11、检索结果。常用的距离度量有绝对距离、欧式距离、马氏距离、二次距离与直方图相交距离。(1)绝对值距离(2)欧式距离(3)马氏距离式中,为直方图特征矢量的协方差矩阵。(4)二次距离绝对值距离与欧式距离在计算中,对直方图特征每个颜色分量平等对待,即没有考虑颜色间的相似性。而在计算直方图特征向量的欧式距离时考虑颜色相似矩阵,可采用二次距离度量。直方图二次距离度量形式如下:式中 表示色彩对和之间的相似度。(5)直方图相交距离设图相与在某色彩通道上的颜色直方图分别为和,其中,为亮度的水平数,则在通道上的直方图距离定义为式中,综合三个通道,则图象与之间的距离为四、预期达到的目标1、首先实现对图像简单处理,包括彩色图转灰度图、控制灰度图阀值、输出灰度直方图、灰度拉伸及均衡、图像平移、图像镜像、图像转置、图像缩放、图像旋转、傅立叶变换、离散余弦变换、图像灰度修正、图像平滑、中值滤波、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论