论文开题报告完成_第1页
论文开题报告完成_第2页
论文开题报告完成_第3页
论文开题报告完成_第4页
论文开题报告完成_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(2010 届)本科毕业论文(设计)题题院业级号名开 学专班学姓报告目:一种基于多特征融合的风景图像检索方法:数学与信息工程学院:计算机科学与技术(本):计科061200632225115:潘江云指导教师: 朱蓉开题日期:一、选题的背景、意义(所选课题的历史背景、国内外研究现状和发展趋势)背景:在当今的信息化时代,随着现代电子技术、计算机技术、网络通信技术和多媒体技术的迅 猛发展,大量的数字媒介被用来记录信息,数字图像是其中一种用以记录真实世界景象的重 要方式。在各行各业,包括在人们的社会生活中,各种内容的大规模数字图像库不断出现。有效的建立、管理和充分利用图像信息库资源,一直是国内外科技工作

2、者关注的问题。能够 有效的在庞大的图像数据库中搜索到需要的图像信息,是进行数字图像管理和分析的关键技 术。早在上个世纪七十年代,由于数据库管理系统的发展,人们就借助于传统的数据库管理技术对图像进行检索。这时候图像检索的一个典型框架是,首先对图像用文本进行注解,然后 用基于文本的数据库管理系统来进行图像检索。这样一来对图像的插叙就变成了基于标签的 查询。这种方法虽然简单,但有几个根本的问题影响对图像信息的有效使用:首先,由于图 像内容很难用文字标签完全表达,所以这种方法在查询图像中常会出现错误。其次,文字描 述是一种特定的抽象,如果描述的标准改变,则标签也得从新制作才能适合新查询的要求。话句话说

3、,特定的标签只适合特定的查询要求。最后,目前这些文字标签是靠观察者选出来 才加上去的,因此受主观因素影响很大,不同的观察者或同一观察者在不同条件下对同一幅 图像可能给出不同的描述,因而不够客观,没有统一标准,常会自相矛盾。图像数据库的核心技术是图像检索。图像检索则是近年来海量是、信息处理面临的“瓶颈”。 基于内容的检索最具有本质性,已经成为当前国内外研究的热点。图像检索技术的两大关键 图像特征的提取和相似性度量。在人类视觉属性中,纹理作为基本的视觉特征之一,分布十 分广泛。针对纹理的研究研究经历了相当长的时间,但对纹理的明确定义直至目前尚未出现,纹理应用于图像检索的时间也是相对短暂的。基于纹理

4、特征的图像检索是基于内容的图像检 索研究中的前沿技术。下面先来介绍一下基于内容的图像检索基于内容的图像检索技术是一种综合集成技术,涉及到认识科学、人工智能、模式识别、 图像处理、信息检索等多个领域。其中一些关键技术如特征提取、图像分割、对象提取、高 维索引等一直都是一个悬而未决的问题。基于内容的图像检索 (cbir )技术由机器自动提取包含图像内容的可视化特征:颜色、纹理、形状、轮廓、对象的位置和相关关系等,对数据库中的是、图像和查询样本图像在特征 空间进行相似匹配,检索出与样本相似的图像。意义:目前,各种数据库中存在大量的图像,少则几十上百,多则成千上万。并且这些图像数据库的研究对多媒体数据

5、旅游景点、卫星遥感图像、地理信息系统等提供了有力的支持。多媒体技术、internet 网络的迅速发展,使图像在人们的日常生活中的应用日益广泛。 公安部门的迅速破案,需要大量的罪犯图像信息作为辅助;天气预报的准确预测,离不开大 量卫星图像的支持。各种各样的应用的出现,使图像信息的使用也逐渐渗入到社会上的每一 个角落,图像已成为大众化数字信息的一种重要形式。如何组织、表达、存储、查询、管理 和检索这些海量的图像数据,是对传统数据库技术的一个重大挑战。因此,如何将数字图像 处理,建立高效的图像检索机制已成为目前迫切需要解决的问题。国内外研究动态及发展趋势:近十年来,每年都有相关的国际会议召开,国际上

6、重要的杂志也都对此发表了相关的专刊。很多的研究机构进行了相关的工作,取得了很多令人瞩目的成就,如 ibm公司的qbie系统, virage公司的vir图像工程系统等。与国外相对成熟的技术而言,目前国内研究部宽, 主要集中在基于图像的颜色、纹理等的查询部分。二、研究的基本内容与拟解决的主要问题提出一种多特征(颜色、纹理、形状、轮廓、对象的位置和相关关系等)融合的图像检索 方法。该方法能充分利用人类的视觉感知,将图像的多种低层特征相互结合,并通过适合的 相似性度量将数据库中的图像与待查询图像进行比较,用以检索出与待查询图像相似的图像。该方法在包含从internet 下载的风景图像数据集上进行实验,

7、以验证其可行性和有效性。三、研究的方法与技术路线、研究难点,预期达到的目标研究的方法:基于颜色的检索人们普遍认为颜色并不是刻划一个物体的关键特征,因而在传统的注重几何特征的计算机视觉研究中,颜色未能得到充分的重视。然而相对于各种几何特征, 颜色具有大小、方向、位置不变性,同时它也是描述图像最有效的特征之一。如果客户只希 望从库存中查到所有红色衣服的样本图像,则使用其它检索方式很难达到要求。qbic系统将基于颜色的检索作为缺省的检索方式。基于颜色检索主要采用颜色直方图的方法。颜色直方图代表3个颜色频道强度的联合概率,描述全局的颜色分布,对旋转以及位置变化不敏感。1990年,swain和balla

8、rd 提出了直方图交的算法,从而为颜色检索奠定了基础。图像相似度采用如下公式计算:颜色直方图能够反映图像的平均颜色信息,但不考虑空间位置信息。例如,在一幅全家福合影中,你站在父母的左边、右边,还是中间,并不会影响整幅图像的颜色分布,得到 的颜色直方图也是类似的。采用纯粹的基于颜色直方图的检索,并不能很好地区分这些在人 眼看来非常不同的图像。同时,要把每幅图像的颜色直方图信息存储下来,需要较大的空间。为解决这个问题,mehtre提出了一种参考颜色表的方法。该方法是一种有损压缩,并不能从 压缩直方图中恢复图像固有的信息。为解决颜色直方图不能描述空域信息的缺陷,需要引入空域信息。对于全局空域信息的引

9、入,先用canny算子得到边界图,然后对边缘点建立方向直方图。归一化后的方向直方图可 在一定程度上做到尺度不变和旋转不变。如果图像位置简单,还可做到与目标位置无关。对 于局部空域信息,将图像固定分为5个区域,对每个区域求其颜色直方图的前三阶矩。该法只对图像的微小旋转有不变性,不适应图像大的变化。也可采用类似纹理分析中灰度共生矩 阵方法,该法对视点变换、背景变化及焦距远近均不敏感。其它基于颜色的方法还有许多,如颜色相关向量法、颜色相关图法、颜色集方法、颜色聚类法等等。颜色相关向量法 (ccv方法)是greg pass提出的,将各颜色区段像素点总数分为相关和不相关两类,包含一定的空间信息。颜色相关

10、图法是jing huang提出的由颜色对组成 的表,表的第k个人口即颜色i在距离为k的范围内找到颜色j的像素点的概率。该方法对 图像旋转、位置变换敏感。颜色集法由john r. smith和shihfu chang提出,它将图像的 rgb空间转换为hsv一维空间,因为hsv空间比较符合人类的视觉感知特征。通过阈值过滤,大于阈值的为l ,小于阈值的为。该法可以保留图像的显著信息,便于索引的构造。w. y. ma提出的颜色聚类法(gla)将库中图像颜色聚类, 在预定误差范围内,将三维颜色空间量化为最 小数目的一维,使用颜色所占比例反映分割区域颜色分布。人类肉眼一般对主色调比较敏感,因此有人提出了基

11、于主色调的检索方法。通过系统提供的调色板选择颜色值,指定某种主色调进行检索。然而,人类肉眼的分辨率毕竟有限,在一 定范围内的颜色变化往往区分不出来。并且颜色在按色彩量化时会产生量化误差,从而使得 原本非常相似的颜色被量化到了不同的范围之内,导致图像匹配时漏选。采用正态分布拟和 法来获取指定颜色的扩展值,对主色调进行扩展,可弥补由于用户选择的随机性和量化等引 起的误差。基于纹理的检索所谓纹理,是指图像像素灰度集或颜色的某种规律性变化。纹理特征主要包括粗糙度、方向性、对比度以及规则性。基于纹理的检索适用于检索诸如水波、布匹、建材等类型的图像,通常采用统计方法、结构方法以及频谱分析方法进行。统计方法

12、主要用于分析像木纹、沙地、 草坪等细致而不规则的物体,根据图像像素间灰度的统计性质对纹理规定出特征以及特征与 参数间的关系。结构方法适于像布料或砖瓦等一类元素组成的纹理以及排列比较规则的东西, 根据纹理基元及其排列规则来描述纹理特征。统计方法通常在频率域和空间域上进行。在频率域上,主要采用傅立叶变换和小波分析。傅立叶变换在能量谱上反映图像粗糙度和方向性;小波分析中采用gabor滤波能够表现出最好的特征。在空间域主要采用haraliek 和shanmugam提出的共生矩阵法,共生矩阵的每个元素表示从灰度i像素点开始离开某固定位置 t的像素点灰度为j的概率。该法的缺点在于 矩阵很大且含有大量的冗余

13、信息。tamura是纹理分析的另一主要方法,它定义了粗糙度、方向、归整等6种特征,每种特征相互独立且可视。其优点在于几乎没有冗余信息,算法的 效率比较商。在纹理研究的早期,人们普遍认为统计方法优于频谱分析方法。8。年代,随机场模型开始用于纹理的分类和识别。kashyap采用基于圆对称自回归随机场模型的特征,用于自然纹理的分类,并取彳导了 91 %的正确率。f.s. cohen等采用gaussian markov随机场模型(gmrf), 对9种自然纹理的识别达到了99% 至100% 的正确率。d. k. panjwani和g. healy进一步采用gmrf模型用于彩色纹理图象的分割,也取得了较好

14、的效果。基于形状的检索形状是图像目标的显著特征之一,许多物体具有不同的颜色,但其形状总是类似的。例如,一套以国徽为主要图案的邮票,其形状大体都是圆形。再比如苹果 公司的商标,基本形状都是一个圆形缺一角的苹果,差别仅在于一些细微的地方,如苹果中 有无横线。形状包括面积、连通性、环形性、偏心率、主轴方向等特征。形状的表征方法很 多,包括本征方程、几何常量、fourier级数、力矩等等。浙大人工智能研究所在此基础上, 进一步提出了狭长度以及基于内角的特征量,对于形状检索有较好的效果。形状的局部特征即对连续边界的分割点集。图像分割需要利用物体区域内部某种同一性和均匀性进行划分,采用的经典算法包括门限法

15、、区域增长点、空间聚类法等。分割后得到物 体边界点的集合,进行付氏变换,得到复系数集合。系数在频域描述物体的形状,低频代表 形状属性,高频代表图像细节。目前出现有限元法、图灵函数、小波描述等。对于基于形状的检索来说,形状的表示和匹配是重点要解决的问题。在传统的计算机视觉中,曾先后用freeman链码、曲线、fourier 描述子、二次曲线及b样条等来描述平面曲线。 其后采用超二次曲线(super_quadrie) 以及小波描述来逼近形状: 在复杂(不连通)形状的表示 方面,提出了矩fourier 描述子方法,并将其用于汉字识别。也有人采用隐式多项式的表示 方法,并对其表示能力进行了分析。对于形

16、状匹配来说,hough变换例是较为经典的方法,它对于噪声和遮挡具有良好的抗干 扰性。但此法仅能解决形状的平移、旋转和缩放所带来的匹配问题,而对实际应用中广泛的 变形匹配问题无能为力。针对由关节点联结起来的活动物体,例如剪刀,mehrotra等提出了基于索引特征 的相似 形状检索方法fibssr (feature index based similar shape retrieval),专门用于此类物体的匹配。国防科大多媒体实验室提出了根据颜色特征进行形状检索的方法,该方法简单实用,非常适合于背景相对简单的图像形状检索。一般情况下,彩色图像中的对象与背景之间必然存在颜色上的差异。如果利用这种颜色

17、差异提取物体的形状边缘信息,相对而言比直接提取边缘 更为容易。通过将图像分块,每一子块分别计算直方图,选择有差异的比较对,形成颜色特 征差值表,比较时进行差值表的比较。相似度根据如下公式计算:为使图像对象对大小变化、旋转及光照不敏感,需要进行相应的改进。将颜色归一化处 理,使颜色分量不受光照及阴影的影响。同时对差值表的构造进行改进,只选取距离值大于 值的比较对以去除背景噪声干扰;为突出基于形状边缘的特点,减少对颜色变化敏感性,需 将颜色直方图进行平滑处理。基本组合的多特征检索图像内容具有各种视觉特征及视觉对象的空间关系等,而人在观察图像时也不只是观察一个特征,而是会同时看到图像的颜色、形状等多

18、个组合特征。正如前面所提到的,不同的特 征有不同的矢量表示方法,即使是同一特征,如颜色特征也有直方图特征、颜色矩、颜色集 等多种特征表示方法。在用单一特征进行检索时,可能出现非常相似两幅图,但在语义上相差很大。而采用组合 特征检索法时可以在颜色、纹理、形状等几种查询特征中选择两种或两种以上的特征进行组 合检索。基于多特征组合检索便于用户更灵活、更有效地表达检索要求, 提高检索的准确率。该检索方法可分两种情况进行:一种是异步组合检索,另一种是同步组合检索。(1)异步组合检索在异步组合检索中时, 针对示例图像,首先采用一种主要特征(比如颜色)进行检索,按相 似程度排序检索结果,然后从中挑选出新的示

19、例图像,以另一种特征(如纹理或形状)在进行检索,直到满足检索要求。异步组合特征检索从本质上来看仍是单一特征检索。与单一特征 检索不同的是,该方法在检索过程中,分别利用图像中不同特征的特点逐次进行相似性匹配, 可逐步缩小检索空间,不断提高检索精度。(2)同步组合检索在同步组合检索时, 针对示例图像,首先人工设置组合特征的归一化初始权重比,根据此初值进行第一次检索,按相似程度排序检索结果,然后从中挑选出新的示例图像。重新人工 设置组合特征的归一化权重比,再次进行检索,直到满足检索要求。基于组合检索方法与单一特征的检索相比,可以提高检索精度。其缺点是检索精度调整和提高的过程是一个工人干预的过程,这过

20、分依赖于人的主观判断,检索效率不高,不具有通 用性。因此,针对同步组合检索方法,对检索过程中特征的归一化自动进行调整,提高了人 机交互相关反馈检索方法。基于反馈技术最初应用于传统的文本信息检索,1998年rui yong等人首次将相关反馈技术应用于基于内容的图像检索。在他们设计的mars系统143中,用户将检索条件交给系统,系统将检索结果显示给用户,用户再把检索的个人评判信息反馈给系统。人机交互相关反馈 检索系统又经过一系列的反馈迭代,动态调整组合特征的归一化权重。由此决定检索过程中 采用何种特征组合及如何分配特征之间的权值,达到逐步提高检索精度的目的,因此相关反馈技术应用于基于内容检索的研究

21、逐渐受到人们的关注。技术路线:熟悉基于内容多特征的图像相关领域知识;研究现有基于内容的图像检索常用方法;研究现有的基于内容的图像检索算法;写检索算法研究报告;检索系统通用的框架图像检索系统框架研究难点:由于没有接触过图像学方面的知识,还有待于学习、深化;3.3.2由于没有学过C+和matlab进行编程,而且自身编程水平有限,要在短期内编出一个图像检索应用软件有很大的困难;在实现新的检索算法中,会遇到困难,检索方面的知识缺乏;预期达到的目标:本次课题预期达到的目标是采用融合多种图像视觉特征(例如:颜色、纹理、形状、轮廓、位置、相互关系等)的手段实现对来自网络的风景图像数据的自动检索;分析出基于多

22、 特征融合的图像检索方法的优越性和需要考虑的几个方面;成功运用matlab开发语言对提出的方法加以编程实现并编制具备图像检索的完整处理过程及相关效果显示的检索应用软件。四、论文详细工作进度和安排第一阶段:第七学期第10周至第14周阅读有关参考文献;完成毕业论文(设计)文献综述、开题报告、外文翻译的撰写工作;初步拟定实现系统需要采取的研究方法和技术路线;完成系统开发语言和开发平台的学习。第二阶段:第七学期第15周至第18周继续查询并收集资料;确定系统需要完成的主要功能,绘制系统的总体流程图;完成毕业论文大纲的撰写。第三阶段:寒假期间进行系统详细功能与组成模块的设计阶段,完成测试用例等的准备工作;

23、开始撰写毕业论文的初稿。第四阶段:第八学期第1周至第3周进入系统具体开发与代码编制阶段;撰写毕业论文的初稿。第五阶段:第八学期第4周至第6周系统功能基本实现,进入系统测试、改进及优化的阶段;继续撰写并修改毕业论文。第六阶段:第八学期第7周至第10周进入系统的完善阶段;继续撰写并修改毕业论文。第七阶段:第八学期第11周至第12周提交毕业论文;准备毕业答辩各项事宜。五、主要参考文献:(所列出的参考文献原则上不少于10篇,并应有不少于 2篇的外文文献)参考文献格式:1niblack w., barber r., equitz w.,et al. the qbic project: querying images bycontent color, texture, and shape

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论