




已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
我国图书馆关联数据研究综述【摘要】图书馆关联数据是真正意义上的数据开放,不仅对本馆用户开放,而且对全球的网络用户开放。文章回顾了关联数据的起源及其发展历程,认为当前我国图书馆关联数据理论研究主要集中在基于本体和关联数据的书目组织语义化研究、基于关联数据的图书馆数字资源语义融合研究、概念和理论的普及、领域应用的原理和可行性分析、知识产权解决方案以及关联数据发布技术、标准规范的研究、工具的使用和与前沿技术结合,关联数据的图书馆创新服务研究和绿色关联数据研究等方面,这些研究领域和代表性的观点对今后我国图书馆关联数据理论的研究和实践有一定的推动作用。【关键词】关联数据;数据开放;关联数据发布技术1 引言数字图书馆是传统图书馆的延伸,全文数字资源和在线资源逐渐成为图书馆的用户阅读、学习和研究的主体。在图书馆里,数百个数据库以各自的检索方式存在着,用户在信息爆炸的环境下,要找到他们真正需要的信息很困难。目前,各图书馆往往采用不同的硬件平台、操作系统、通信协议、数据库系统和数据描述标准,且多实行的是独立维护和管理馆藏资源,因而造成大量分布式异构数据的生成。为了能够将这些分散的数据融合在一起,方便用户查询,节约用户时间,图书馆界采取了一些解决措施,如基于OPac集成资源、基于跨库检索系统集成资源、基于资源导航集成资源、基于信息链接集成资源等,但都只能解决结构上的异构,无法化解语义异构难题。且目前进行的资源融合针对的多是同一知识单元(文献资源),无法实现相互关联的不同知识单元(文献资源、知识组织资源等)之间的融合,所以目前图书馆数字资源所能达到的融合程度还不尽如人意。1关联数据则对长期以来困扰人们海量信息聚合性不足提供了解决的思路和原则。关联数据是一组共享数据的最佳集合,它强调数据的相互关联和相互联系。采用RDF(Resource Description Framework)资源描述框架,利用URI(统一资源标识符)命名数据,在网络上发布和部署实例数据和类数据,通过超文本传输协议(HTTP)揭示并获取这些数据。22 关联数据概述随着Web3.0时代的到来,万维网(World Wide Web)的发明者伯纳斯李(TimBerners-Lee)于1998年在“Design Issues,中提出了语义网(Semantic Web)的构想。语义网使现有网络上的信息具有计算机可理解的语义,支持计算机进行大规模智能化处理,并且有助于人机对话与协同工作,让计算机为人类提供更多更好的服务。关联数据(Linked Data)来自于2006年被称为“互联网之父” Tim Berners-Lee的万维网体系架构笔记关联数据笔记,Tim Berners-Lee在文中分析了Web的发展与演变,提出了发展数据网络的思想,而数据网络的核心和关键就是关联数据。维基百科的定义:“关联数据是一种推荐的最佳实践;用来在语义网中使用URI和RDF发布、分享、连接各类数据、信息和知识。”Tim Berners-Lee提出了关联数据的四个原则(1)使用URI作为事物名称。(2)使用HTTP URI使人们能找到这些事物。(3)当人们查找URI时,通过RDF,SPARQL的形式来提供URI的有用信息。(4)包含指向其它URI的链接,以使人们能发现更多信息。2007年5月W3C关联开放数据项目启动,号召人们将现有的数据公布成关联数据,并将不同数据互联起来,BBC、世界银行、纽约时报也加入到关联数据的出版发行之列,在图书馆界,2008年瑞典国家图书馆率先将LIBRIS(瑞典联合目录)发布为关联数据。LIBRIS共包含约600万条书目记录、200万条馆藏记录及20万条规范记录,为超过170家大学图书馆、公共图书馆、博物馆和档案馆提供在线编目服务,同时为了加强和外部数据的关联,LIBRIS还创建了到LCSH(美国国会标题表,)和维基百科(Wikipedia/DBpedia)等的相关链接,为图书馆界关联数据的发布及应用提供了宝贵的经验。3之后,美国国会图书馆、OCLC、德国国家经济图书馆、OCLC、德国经济国家图书馆、德国国家图书馆、欧洲核子研究中心图书馆、欧洲国家图书馆的数字资源门户Europeana,英国的哈德斯菲尔德大学图书馆等也对关联数据进行了实践运用。2010年5月28日,W3C宣布成立图书馆关联数据孵化小组(Library Linked Data Incubator Group),以通过汇集图书馆界内外参与语义网活动(重点在关联数据)的人,孵化小组的成立标志着图书馆应用关联数据走向国际化、规范化和组织化。42011年6月2-3日,在美国旧金山举办了宗旨为“促进关联开放数据公布途径的实用性和可行性”的国际图书馆、档案馆和博物馆关联开放数据峰会,超过85个团体参加了峰会。53 国内图书馆关联数据的研究现状3.1国内图书馆关联数据研究发展概况目前,我国尚没有真正意义上将书目数据发布为关联数据的应用和实践。2008年12月于上海举行的“数字环境下图书馆前沿问题研讨班”上,上海图书馆副馆长刘炜作了题为“语义互操作与关联数据”的报告。2010年8月上海市图书馆学会将在普陀区图书馆举行的“图书馆前沿技术论坛”的主题定为“关联数据和书目数据的未来”。据有关专家调研,我国香港公共图书馆、澳门中央图书馆和台湾地区图书馆都没能实现真正意义上的关联数据化。如我国国家图书馆目前还没有进行书目数据的关联化进程,用户检索到的书目数据还是传统的MARC数据格式,虽然点击责任者、出版者、主题等能够浏览相关信息,但必须二次检索才能检索到更全面的书目或责任者信息,没有实现数据之间的关联化。作为最早关注关联数据及其应用的国内团队之一上海图书馆研究团队于2011年主持了国家社会科学基金项目“关联数据的理论和应用研究”,继2012年1月在中国图书馆学报上发表了第一批研究专题:图书馆关联数据:机会与挑战;关联数据开放应用协议;RDA与关联数据;关联数据发布技术及其实现以Drupal为例6-8,这个研究团队由刘炜、夏翠娟、林海青、楼向英、张春景、赵亮、胡小菁、钱国富、徐昊、朱雯晶等组成。第一批概念成果以概念和理论的普及、领域应用的原理和可行性分析、知识产权解决方案以及关联数据发布技术的初步探索为主。第二批研究专题发表在2013年第4期现代图书情报技术上,这些研究成果深入到图书馆具体应用的实施、标准规范的研究、工具的使用和与前沿技术结合等方面,如:刘炜、夏翠娟和张春景大数据与关联数据:正在到来的数据技术革命一文从时下十分热门的“大数据”概念入手,着重探讨这两类数据技术的区别与联系,区分了“大”关联数据和“关联的”大数据两类不同的应用,对目前采用大数据技术发布关联数据的方法和路径做了梳理,并展望了这两类数据技术在图情领域的发展前景;夏翠娟在RDB2RDF标准及应用研究一文对W3C新推出的RDB2RDF推荐标准进行了细致的研究,包括其逻辑框架、语法特点、使用方法、实施方案、应用前景等,可为图书馆中大量基于RDB的遗留系统介入关联数据应用提供参考。10朱雯晶、夏翠娟和刘炜在SILK关联发现框架综析一文对SILK关联发现框架进行了深入的分析,考察了其不同的应用组件、关联发现引擎与分块技术等核心内容,并结合实例,介绍了对两个数据源进行分析的方法以及关联发现的过程,为关联数据应用中常见的瓶颈问题多数据源的关联发现及实施,提供了一种可选的解决方案。11钟远薪、李田章和刘炜在OPAC混搭关联数据应用研究一文则从关联数据消费的角度,以OPAC系统混搭外部关联数据源为例,研究了在典型的图书馆应用环境中,如何利用外部关联数据源扩充与优化图书馆的传统服务,是深入到领域应用层面的有益尝试;OPAC只是图书馆数据的一个典型代表,进一步可以扩展到各类图书馆的资源发现应用。12中国科学技术信息研究所白海燕等是国内较早跟踪关联数据技术,并积极探索其应用可能性的团队,曾经有多个国家级项目与此有关,2010年成功申请了国家社会科学基金项目“图书馆资源组织语义化研究”,全面研究了关联数据的实现技术,并进行了基本开发试验。目前基于上述成果又发展了资源整合和服务整合的研究开发,分别立项了“基于关联数据的服务融合与资源扩展”和“基于DOI的科研资源整合研究”等项目,该所在十二五规划中计划基于关联数据技术,全面调研关联数据在NSTL服务系统中的应用场景,探讨利用该技术进行知识组织系统的构建、知识关系抽取、海量文献自动标引、检索结果的扩展、异类资源整合检索、多维分面信息资源的组织与检索、数据融合与混搭等前沿领域应用的可能性。13黄永文在2010年第5期现代图书情报技术发表关联数据在图书馆中的应用研究综述,简要介绍关联数据产生和发展的背景、关联数据的定义、基本原则及应用框架,从资源发现服务、数据融合与语义检索服务、学术研究和学术交流作用、跨机构的关联数据的开放与复用等方面分析关联数据驱动的图书馆Web的应用现状,最后对图书馆应用关联数据服务方式、质量和有效性方面提出几点建议。14南华大学徐华在2011年第8期图书馆学研究发表了关联数据在国外图书馆中的应用及其借鉴意义,他认为,借鉴国外经验,将图书馆资源发布为关联数据,并利用关联数据实现数据融合,更好地实现知识单元的组织,利用的过程中应注意隐私权的保护。15范炜在图书情报知识2012年第3期发表走向开放关联的图书馆数据,认为关联数据为图书馆资源开放与关联提供了新的技术环境和发展契机。在W3C图书馆关联数据孵化小组LLD的系列报告基础上,系统评述图书馆数据的类型与应用,提出图书馆关联数据的宏观语义模型并作分层论述,总结先导项目的探索经验,最后对开放关联过程中的若干关键问题进行识别。16罗铮、 张赞梅和陈伟莉在2012年第5期图书馆杂志发表高校图书馆应用关联数据的意义及注意事项,认为关联数据在我国高校图书馆尚属于较新的研究领域。关联数据可以使高校图书馆加强数据资源整合、加强教科研交流、扩展图书馆平台、提升社会服务能力、加强利用与再利用。高校图书馆应该抓住这一历史机遇,合理利用关联数据改善用户界面,提高交互性能、有效解决无效链、注意保护隐私等。17中山大学资讯管理学院陈定权、肖鹏在2013年第3期图书情报知识发表了关联数据文献研究述评,文章整理2008年以来与关联数据相关的174篇会议文献,将它们分为总述类、关联数据的发布、互联和应用、关联数据的架构建设等五个主题,呈现关联数据的发展现状并以此探讨关联数据的未来发展趋势。183 图书馆关联数据理论研究的主题范围及主要观点3.1关联数据的项目开发和技术实现中国科学技术信息研究所白海燕等以书目对象基于形式形态多样性、生命周期变化性、复合对象复杂性的序化问题作为书目语义化组织的研究起点,提出并初步实践基于本体构建语义关联、通过关联数据的一致化语义描述方法(RDFS/OWL)和统一存取机制(SPARQL)进行语义化组织的方法。19在另一篇文章中,白海燕等研究了基于关联数据的基本原则和发布方法,分析介绍DBpedia的实现技术:通过对WikiText格式数据进行语法解析和流程控制,实现对自由文本进行的结构化数据抽取和RDF表达,并基于URI参引、SPARQL查询和RDF文件转存等多种方法,实现多样化的Web数据获取;采用基于属性和基于模式的自动关联算法,与众多数据集之间实现关联。203.2基于关联数据的图书馆数字资源语义融合研究南京大学硕士生王薇在毕业论文基于关联数据的图书馆数字资源语义融合研究中介绍了语义网的基本技术,重点对本体和关联数据在图书馆领域的应用加以论述;介绍了图书馆资源融合的现状和缺陷,分析了基于本体和关联数据解决语义异构的资源融合方式,进而提出了一个基于关联数据进行图书馆数字资源语义融合的框架构想,并具体分析了如何实现此种融合方式;之后通过基于本体的语义融合、基于关联数据的语义融合、基于关联数据的应用三个层次对图书馆数字资源语义融合的框架进行具体实现;最后通过与其他文献资源查询系统C CALIS联合目录公共检索系统、中国知网CNKI数据库)的实际对比,展现基于关联数据融合图书馆数字资源的优势。3.3关联数据以概念和理论的普及及其技术应用关联数据以概念和理论的普及、领域应用的原理和可行性分析,知识产权解决方案以及关联数据发布技术,而后深入到图书馆具体应用的实施、标准规范的研究、工具的使用和与前沿技术结合等方面。上海图书馆研究团队以刘炜、夏翠娟为代表,以其研究成果增速快、量大和质量高引起学者的关注,这一团队是我国图书馆界研究关联数据的一只主要的不可忽视的科研力量。2012年1月在中国图书馆学报上发表了第一批研究成果后,于2013年4月又在现代图书情报技术上发表了第二批研究专题。3.4 数字图书馆中层关联数据的创建与发布华中师范大学信息管理学院王忠义、夏立新、石义金和郑森茂认为当前人们知识获取的查询结果集成度不高,数字图书馆提供服务粒度过大,通常需要对获取的文章、书等进一步阅读才能定位到所需的知识的位置,大大增加了用户认知负担和时间成本。为实现数字图书馆馆藏资源目录数据(中粒度)的中层关联数据的创建和发布,对现有关联数据创建与发布方法进行研究的基础上,针对目录数据自身特点,采用自动标引、主题词映射等技术实现目录数据的结构化,借助目录体系与文本匹配实现关联数据的关联发现,借助D2R最终实现中层关联数据的创建与发布。213.5基于关联数据的图书馆创新服务研究华侨大学杨爱武认为关联数据在图书馆服务中的应用以满足用户需求创新服务才是用户最终的评判标准。CALIS、 CASAL和共享工程等项目都无法真正实现将图书馆所有文献资源共享,而如果将图书馆的所有信息发布为关联数据,用户则可通过URI来查找世界上任何一家图书馆资源。传统的图书馆服务只局限于书目、MARC数据等,知识信息的揭示深度不够;现有的图书馆检索系统如OPAC等,读者均只能实现作者、主题、题名等服务,但不能提供相关链接或关联的知识检索等。因此要实现关联数据的图书馆创新需从信息资源的发布服务、发现服务、检索服务和异构融合服务方面创新。223.6绿色关联数据研究郑州大学信息管理系郭少友、尚雨、魏朋争和毛金龙在2012年第23期图书情报工作发表绿色关联数据:概念、要求与工程,认为现有的关联数据存在一定的问题:如出现断链、包含语法错误、数据不可访问、使用未定义的类和属性、使用过时的类和属性和数据类型和值不符等等,这些问题无疑会污染数据网络环境,影响用户对关联数据的无障碍使用。作者对绿色关联数据的概念、要求、绿色关联数据的关键步骤等提出了具体要求。关联数据提供者可采用工程化方法来生产、发布和维护绿色关联数据,严格按照绿色关联数据的要求来规范数据需求分析、数据设计、数据测试、数据维护等关键步骤的具体实施,并建立数据更新通知机制和数据评价机制来进一步提高关联数据的绿色化水平。234 结语关联数据(Linked Data)作为一种新的语义发布工具,是目前数字资源的揭示和利用的一项重要技术,在整合孤立的数据、提供开放的元数据服务、实现语义互操作、实现数据的Web服务等方面具有广阔的应用前景。关联数据提供了发布文件和数据的典范,使数据也成为网络中的重要成分,它更有利于使网络拓展为全球化的共享信息空间。图书馆作为社会信息资源的宝库,作为存贮、开发、利用的机构,利用关联数据,既能用技术改变信息资源的组织、利用和检索服务,也能从根本上改变图书馆在社会信息服务机构中日益下降的地位,能够极大地吸引用户利用图书馆资源,提高文献利用率,提高服务水平和服务质量。关联数据理论给图书馆带来了机遇,也带来了挑战。参考文献:1王薇.基于关联数据的图书馆数字资源语义融合研究D. 南京大学2013:12Structured Dynamics LIC.Linked Data FAQ EB/OL2013-10-15. /linked_data.html3Antlers Sderbck,Marlin Malmsten. LIBRIS-Linked Li- brary DataJ.Modalities,2008,(5):19-20.4W3C. W3C Library Linked Data Incubator Group EB/ OL .2013一10-17 .hup://2005/Incubator/lld/.5LOD-LAM. Home EB/OL . 2013一10-17 .hup:/lod-lam.neL/summiL/.6林海青;楼向英;夏翠娟.图书馆关联数据:机会与挑战J.中国图书馆学报, 2012(1):58-677张春景;刘炜;夏翠娟;赵亮.关联数据开放应用协议J.中国图书馆学报, 2012(1):43-488刘炜;胡小菁;钱国富;张春景;夏翠娟.RDA与关联数据J.中国图书馆学报, 2012(1):34-429刘炜;夏翠娟. “关联数据与大数据”专题序J.现代图书情报技术, 2013(4):110刘炜;夏翠娟;张春景.大数据与关联数据:正在到来的数据技术革命J.现代图书情报技术,2013(4) :2-91朱雯晶;夏翠娟;刘炜.SILK关联发现框架综析J.现代图书情报技术, 2013(4):18-2412钟远薪;李田章;刘炜.OPAC混搭关联数据应用研究J.现代图书情报技术 2013(4):25-2913白海燕等基于本体和关联数据的书目组织语义化研究J.现代图书情报技术,2010(9):18-2714黄永文.关联数据在图书馆中的应用研究综述J.现代图书情报技术.2010(5):1-715徐华.关联数据在国外图书馆中的应用及其借鉴意义J.图书馆学研究J.2011(8):87-8916范炜.走向关联数据的图书馆数据图书情报知识J.2012(3):94-10217罗铮等.高校图书馆应用关联数据的意义及注意事项J.图书馆杂志,2012(5):51-5318陈定权等.关联数据文献研究述评J .图书情报知识, 2013(3)19白海燕;乔晓东.基于本体和关联数据的书目组织语义化研
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 一年级体育下册 第八课换物赛跑教学设计
- 小学音乐湘艺版一年级上册(演唱)火车开啦 郊游教学设计及反思
- 批发市场客户忠诚度提升考核试卷
- 石油化工产品批发考核试卷
- 跨境电商礼仪培训
- 环保型船舶防污剂的合成与应用考核试卷
- 五年级下册6.设计我们的小船教学设计及反思
- 玩具行业企业家精神与领导力培养实践考核试卷
- 员工批判性思维训练考核试卷
- 教师培训收获成果汇报
- 中国政法大学社会主义市场经济概论重点归纳及复习试题(杨干忠版)
- 煤矿顶板事故防治(1)
- 《蚂蚁和西瓜》课件
- 计量支付用表承包人
- 调Q技术与锁模技术(课堂PPT)
- 快速制作会议座次表、会场座位安排
- 公司财务报表模板(word版本)
- 北京牌匾标识设置管理规范北京城管理委员会
- 工厂利器管制办法
- 郫县征地拆迁补偿安置暂行办法
- 专业拜访技巧
评论
0/150
提交评论