版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、项目编号: 2015007CALIS 全国农学文献信息中心研究项目结题报告项目名称:基于内容图像检索技术在数字图书馆中的应用项目关键词:图像检索、数字图书馆、基于内容项目单位(盖章):大连海洋大学图书馆通信地址 :大连市沙河口区黑石礁街52 号大连海洋大学项目主持人:邢旭峰联系电话xf电子邮件:提交日期:2016年 5月 20 日项目结题验收单1 专家验收表项目名称主持人所在单位专家意见基于内容图像检索技术在数字图书馆中的应用邢旭峰职务 /职称中级(加盖公章)本课题以图像等多媒体信息检索为研究方向,在收集并分析了目前已有的数字图书馆中使用的图像检索技术后,对图像特征匹
2、配及相似度计算进行了研究,并以面向海量图像数据的检索技术作为研究重点,主要解决如何面向海量图像数据实现图像检索。该部分研究包含了三个方面:图像索引技术的研究、快速反馈处理方法的研究、图像特征与文本信息相结合的快速检索方法的研究。本课题通过对图像索引技术的探索研究,目的是要解决如何在复杂的高维特征向量基础上构建索引,并且所构建的索引能有效的提升图像检索速度。该研究可以在图书馆图书的检索、数字安全、版权保护等方面提供非常有利的支持,为数字图书馆的发展提供了有利的支持,特别是在大数据来临的时代,数字图像检索技术可以有效的解决数字图书馆中图片冗余、查找困难、管理困难等问题。听取项目组汇报后, 验收专家
3、组本着公正、 公平的原则对该项目进行了验收,经审议一致通过!(如需要可增加页数)专家签字郭显久卢笑明王本欣张红白丽杰职务/职称第一章研究背景、目的及意义数字图书馆是伴随着计算机技术、存储技术和Internet技术的发展和普及而逐步兴起的。在 20世纪 90年代 ,欧美发达国家逐步开始把数字图书馆列入发展计划。数字图书馆是传统图书馆在信息时代的发展,它不但包含了传统图书馆的功能,向社会公众提供相应的服务,还融合了博物馆、档案馆等其他信息资源,提供综合的公共信息访问服务。数字图书馆将成为未来社会的公共信息中心和枢纽, 数字化将是未来图书馆的发展方向。数字图书馆不同于传统意义上的图书管理软件系统。传
4、统意义上的图书管理软件系统是典型的 MIS 软件 , 由前台和后台组成,它负责保存、查询图书的库存和借阅状况, 统计图书信息。其数据库中的基本信息是指图书的名称、作者、出版社等图书属性, 而不是图书内容。它仅仅为图书管理人员提供了一种方便的管理手段,为读者提供了一种方便的查询图书的手段,但不能替代纸介质图书。 而数字图书馆从内容上讲,具有传统意义上的图书管理和图书的功能;从载体上看 , 不仅有传统的纸介质书籍的内容, 而且可以包括图像、音频、视频等多媒体信息。随着存储技术、 网络技术发展 , 数字图书馆系统中的信息存储不再是问题, 但多媒体信息的检索仍是当前的技术难点。文本信息借助于传统的关系
5、数据库系统可以非常方便地实现图书的查询等管理,用户可以输入关键词等方式实现信息的检索。但图像等多媒体信息很难通过关键词方式实现准确的检索。为了更好的服务于读者、让读者在数字图书馆中快速、便捷的检索到需要的信息,在数字图书馆中使用基于内容的图像检索技术势在必行。直方图作为图像的特征2;曹莉华等人提出在对HSV色彩空间进行非均匀量化的基础上建立 72 柄颜色直方图进行图像检索3 ;目前最新研究是苏小红等人提出的基于凸包的颜色直方图4 。在形状特征提取方面, 早期的研究包括: 基于狭长度的形状表示 5 ,边界轮廓特征的提取 6 ,形状背景描述符 7 ,形状区域的划分 8,及基于矩的特征表示 9等。目
6、前最新研究是, 基于 Rando变换来描述形状特征10 。在纹理特征提取方面,早期研究包括:灰度共生矩阵方法11 、 Gabor滤波的应用12 、基于LBP 算法的特征表示13 等。目前该方向的最新研究主要是基于Wavelet特征表示和高斯分布的纹理图像检索 14 。除了以上三种常用的底层视觉特征之外,近年的研究更多集中于局部特征的提取 15 。局部特征的提取一般分为两个步骤,首先进行兴趣点检测,其次在兴趣点的基础上提取特征描述。兴趣点是指图像中信息含量较高的点,这些点能很好的表示图像的基本特征。传统的兴趣点检测算法包括:Harris算法 16 ,KLT 算法 17 ,Loupias算法等。基
7、于兴趣点的图像检索技术最新研究有:基于KLT 特征点匹配的检索算法,Harris特征点与SIFT 特征相结合的检索方法,多尺度特征点及其匹配技术等。(2) 、图像特征匹配及相似度计算的研究:在提取图像特征之后,通过特征匹配即可计算图像间的相似度。常用的特征匹配方法一般有两种,一是特征向量间的距离计算,所得到的距离值与图像间相似度成反比关系;二是特征向量间的匹配程度计算,所得到的匹配程度与图像间相似度成正比关系。在距离计算方面,传统的方法有: Hafner 等人提出以颜色直方图之间的二次距离作为图像相似性度量的方法等;最新的方法有: Frome等人提出的局部距离函数及全局一致性的距离函数;Wei
8、 Liu 等人提出了半监督距离测量学习算法等。传统方法主要优点是简单且容易实现,缺点是精确性较差;最新方法主要是将反馈学习引入到距离测量中用来修正距离函数,这样将大大提高结果的精确性,但需要反馈过程。(3) 、用户反馈处理的研究:在对底层视觉特征的提取与特征匹配的研究过程中,人们已开始逐渐认识到图像底层特征与其上层语义之间存在一定鸿沟,从而有了“语义鸿沟”的概念。如何弥补“语义鸿沟”改善图像检索如何弥补“语义鸿沟”改善图像检索结果成为近几年的研究热点。在当前研究中,主流方法是通过引入用户反馈机制来弥补 “语义鸿沟” 。所谓用户反馈是指, 用户在初次检索结果中标示出哪些结果符合其查询意图,那些结
9、果为错误结果。将标示后的结果反馈给查询系统,系统可以根据这些结果对查询方案进行修正,从而给出更加准确的检索结果。近几年在反馈处理问题上多采用机器学习的方法, 其中包括: 基于支持向量机的方法, 基于 EM算法的方法等。 目前最新研究主要集中在,如何构建有效的核函数,从而使基于核的学习算法更加适用于反馈的处理。另外,目前关于检索反馈的最新研究热点主要集中在用户反馈的表现形式。在检索应用中若要求用户直接提供较多的反馈信息,将大大降低用户体验。因此可针对用户的点击行为进行分析与挖掘,从而得到辅助信息来进一步精确检索结果。目前该研究主要针对文本信息检索,可以考虑将其迁移到图像检索方面。将数字图书馆与基
10、于内容的图像检索技术进行融合,势必促进数字图书馆的大力发展,特别是在大数据来临的时代,数字图像检索技术可以有效的解决数字图书馆中图片冗余、查找困难、管理困难等问题。第二章研究内容及方法(思路、方法、具体内容)主要具体研究内容1. 基于内容的数字图书馆图像数据库数据模型结构设计:支持基于内容检索的图像数据库系统的数据模型结构,由于研究的角度不同,可以分为图像数据库的体系结构和框架结构。较完善的图像数据库的体系结构是Chang SK 提出的五层结构 : 用户视图、语义特征视图、图像特征视图、特征表达、特征的组织和检索。但是由于数字图书馆的图像数据有其自身的特点,所以应设计一套适应于数字图书馆的图像
11、检索数据模型。2. 面向海量图像数据的检索技术的研究:该部分工作属于重点研究内容,主要解决如何面向海量图像数据实现图像检索任务。该部分研究包含了三个方面:图像索引技术的研究、快速反馈处理方法的研究、图像特征与文本信息相结合的快速检索方法的研究。图像索引技术的研究主要是解决如何在复杂的高维特征向量基础上构建索引,并且所构建的索引能有效的提升图像检索速度。3. 集成验证平台及典型应用的实现:该部分工作主要是通过搭建集成验证平台来对研究中所得到的成果进行验证与改进,并在最终研究成果基础上构建典型应用系统,从而为研究成果的进一步应用推广打下坚实的基础。将图像检索技术应用到实际中时,需要针对实际中的问题
12、进行进一步的研究。主要问题包括:异构图像检索技术的研究、基于辅助信息的图像检索技术研究。异构图像检索技术的研究,是指使用检索服务的各式各样终端的图像捕获能力是不同的,因此图像质量也是不一样的。为此需要检索技术能有效的处理不同质量的图像,且不会因为图像质量不同而影响检索结果。基于辅助信息的图像检索技术研究,是指在用户使用检索服务时,可以捕获到例如地理位置信息、用户偏好信息等相应的额外信息,通过这些信息可以进一步精确检索结果。第三章结论与建议与传统的数字图书馆数据检索技术相比,基于内容的数字图书馆图像管理系统所采用的新技术与所处的复杂的网络环境对数据安全有着很高的要求和标准。可以说,基于内容的数字
13、图书馆图像管理系统是未来数字图书馆的发展方向,也是未来智慧图书馆、数字图书馆以及移动图书馆所必须要依靠的技术之一。这项技术可以在图书馆图书的检索、数字安全、版权保护等方面提供非常有利的支持,未来的图书馆一定是智能化、小型化以及数字化的发展方向,本研究为数字图书馆的发展提供了有利的支持。第四章项目成果( 1) 提出了具备空间辨别力的词袋模型 (Bag-of-Word) 海量图像检索算法传统的 BoW 算法有很多的优点,例如平移不变性、缩放不变性等,但是传统的BoW 检索模型也存在很多的问题,例如所提取的特征不具备空间信息、语义信息等。一般情况下,人们比较关心查询图像中的前景信息,希望弱化背景信息
14、在视觉词汇表中的体现。但是传统的BoW算法, 在整个图像范围内提取特征,这就忽略了人的视觉特性,以导致查全率、 查准率比较低。为了解决以上问题,我们提出一种具备空间辨别力的BoW海量图像检索算法。方法中首先提出了可以使用显著性图的方法提取出图像中的前景信息,弱化图像中的背景信息。在提取出了图像中的前景信息后,所使用的sift特征主要集中在所提取出的前景中,这样就弱化了背景信息或者是噪声对检索效果的影响( 如图1) 。利用这样的特征,重新利用显著性值构建视觉词汇表,取得了比较好的检索结果。图1( 2) 提出了具有自适应阈值的图像感兴趣区提取模型有效的提取出图像中的感兴趣区对于目标识别有着重要的意
15、义,现在国际上采用较多的方法是图像分割技术,但目前图像分割技术进展缓慢。为此,许多专家学者提出利用图像的显著性图来感知图像中的目标,但大多数的提取显著性图的方法都存在着许多问题,例如提取的显著性图不明显,特别是图像中背景过于复杂的情况下效果较差;提取的显著性区域过于琐碎,不能有效的突出图像中的显著性目标。为了解决以上问题,我们自己提出了一种新的显著性图提取方法。在这个方法中,我们设计了自适应阈值来区分图像中的前景与背景,利用设定的阈值,可以有效的剔除图像中的背景区域,目标区域的提取效果有显著提高(如图 2)。图 2( 3) 提出了一种新的包含有多种特征的词袋模型 (BoW) 视觉词汇表目前大多
16、数的图像检索框架采用的是使用一个单独特征来进行图像匹配,特别是在词袋模型中更为普遍。但是使用单独的特征进行匹配,普遍产生的问题是,对于某一类图像,效果较为理想,而相对于其他种类的图像,则效果较差,鲁棒性不高。因为不同的图像对于不同的特征,图像的相似度差异较大。为了解决这个问题,我们提出使用多种特征同时构造词袋模型的视觉词汇表,并利用自动阈值合理分配多种特征间的权重比例。大量实验证明,重新构造的视觉词汇表更能表示一幅图像,并取得了不错的实验效果。(4)发表论文情况(1) Junfeng Wu ,Zhiyang Li ,Wenyu Qu,Yujie Xu,Yuanyuan Li,Image Ret
17、rieval via Discriminative Spatial Bag-of-Word Scheme, Journal of Multiple-Valued Logic and Soft Computing,2016(12),accepted(2) Junfeng Wu ,Zhiyang LI ,Wenyu Qu,Yuanyuan Li,A New Bag-of-Words ModelUsing Multi-cue Integration for Image Retrieval ,International Journal of Computational Science and Engi
18、neering,2016(6),accepted第五章参考文献1 Arnold W.M. Smeulders, Marcel Worring, Simone Santini, Amarnath Gupta, and Ramesh Jain. Content-Based Image Retrieval at the End of the Early Years. IEEE Trans. Pattern Analysis and Machine Intelligence, V ol 22(12), 2000.2 Swain M J and Ballard D H. Color Indexing.
19、International Journal of Computer Vision, Vol.7(1),1991.3 曹莉华 , 柳伟 ,李国辉 . 基于多种主色调的图像检索算法研究与实现 . 计算机研究与发展 , Vol.36(l), 1999.4 苏小红 ,丁进 , 马培军 . 用兴趣点凸包和 SVM 加权反馈实现图像检索 . 计算机学报 , Vol.32(11),2009.5 邬浩 ,潘云鹤等 . 基于对象形状的图像查询技术. 软件学报 , Vol.9(5), 1998.6 K.B. Sun, B.J. Super. Classification of Contour Shapes Usi
20、ng Class Segment Sets. Proceedings of Computer Vision and Pattern Recognition (CVPR), 2005.7 G. Mori, S. Belongie, J. Malik, Efficient Shape Matching Using Shape Contexts. IEEE Trans. Pattern Anal. Vol 27 2005.8 Feng Jing, Mingjing Li, Hong-Jiang Zhang, Bo Zhang. An Efficient and Effective Region-Ba
21、sed Image Retrieval Framework. IEEE Trans. Image Processing. V ol 13 2004.9 G.A. Papakostas, Y .S. Boutalis, D.A. Karras, B.G. Mertzios. A New Class of Zernike Moments forComputer Vision Applications. Information Science. Vol 177 (13) 2007.10 Nacereddine N, Tabbone S, Ziou D and HamamiL. Shape-Based
22、 Image Retrieval Using a NewDescriptor Based on the Radon and Wavelet Transforms. 20th InternationalConference on PatternRecognition. 2010.11 Gotlieb C C and Kreyszig H E. Texture Descriptors Based on Co-occurrence Matrices. Compute Vis Graph Image Process. Vol 51, 1990.12 Dunn D, Higgins W E. Optimal Gabor Filters for Texture Segmentation. IEEE Transcations on Image Processing Vol 4, 1995.13 Ojala T, Pietikainen M and Maenpaa T. Multiresolution Gray Sca
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年钢材运输合同模板
- 三方供货协议范本2024年
- 个人购房担保借款合同一式几份2024年
- 2024年银行证券指定交易协议书范本
- 2024年赞助的合同范本
- 2024年屋面防水合同协议
- 2024年房地产营销承包合同
- 2024年一般货物出口合同范本格式(附英文)
- 2024年马铃薯生产购销合同范本
- 2024年厦门市城市房屋拆迁补偿安置协议书私(侨)房(含非住宅)
- 五金模具项目商业计划书
- 河北医疗服务价格手册指南
- 220kV变电站消防工程 投标方案(技术方案)
- 乡镇环保各项管理制度
- 公路工程检测技术 课件 任务2.1无机结合料稳定材料检测
- 立体几何与空间向量专项练习
- 小学数学四年级上册第12周含有中括号的四则混合运算
- 2023中国电力行业自主可控发展研究报告
- 新技术的挑战和风险大于好处英语作文
- 华为人力资源管理手册
- 江西省宜春市2023-2024学年六年级上学期期中数学试卷
评论
0/150
提交评论