关联数据及其在数字图书馆中的应用,图书馆管理论文_第1页
关联数据及其在数字图书馆中的应用,图书馆管理论文_第2页
关联数据及其在数字图书馆中的应用,图书馆管理论文_第3页
关联数据及其在数字图书馆中的应用,图书馆管理论文_第4页
关联数据及其在数字图书馆中的应用,图书馆管理论文_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关联数据及其在数字图书馆中的应用,图书馆管理论文本篇论文目录导航:【题目】【第一章】【第二章】关联数据及其在数字图书馆中的应用【第三章】【第四章】【总结/以下为参考文献】第二章关联数据及其在数字图书馆中的应用第一节关联数据概述关联数据给数字图书馆的发展带来了广阔的机遇,它让数字图书馆有可能根据一种泛化的规范形式来提供数据信息服务,进而到达真正地将自个融入到整个数据信息世界中去的最终目的。近年来数字图书馆的关联数据应用有了一定的发展,但总体上讲当前研究、应用以及使用仍还处于起步阶段。关联数据在各个领域中的应用正在被专家学者们探寻求索与发现,并将不断获得新的成果。一、关联数据的内涵关联数据是国际互联网协会〔W3C〕如今推荐的一种能够用来发布和连接各类数据、信息和知识的数据规范。关联数据的目的是期望在已有的万维网的数据资源基础上,构建出一个能够反映出包含自然、社会和精神世界的所有数据资源的关联数据网络。关联数据通过对各种事物的本身数据及其互相之间关系数据进行关联数据化,使所有数据变为机器可读的描绘叙述数据,以期将知识海洋信息数据网络演化为互相关联的、丰富的语义数据信息网络系统。进而变得使任何人都能够利用整个互联网数据资源的强大的运算能力,在更大的数据范围内,高效、准确、可靠地查找、共享、利用这些具有互相关联的关系的数据信息和知识组织。根据关联数据的实现技术来看,关联数据是一种能够在万维网上提供发布任何资源的数据表示出方式。语义万维网将数据信息资源定义为任何能够用URI来标识的东西,并将数据信息资源分为可表示出数据信息资源和不可表示出数据信息资源两类。可表示出数据信息资源是指能够表示出任何信息数据的资源,通常是以某种编码文件的形式而存在的数据;不可表示出数据信息资源则是指世界中的各类信息实体的对象,能够是自然界、人类社会以及人类意识所创造的精神世界〔概念、观念、抽象实体等〕的所有实体信息对象。关联数据是通过HTTP和URI两种方式结合来表示和存取数据信息资源的。假如这个数据信息资源是可表示出的数据信息资源,则能够直接通过传统的Web方式获取;假如是不可表示出的数据信息资源,则将会链接到一个数据是以RDF/XML编码、用以指代该不可表示出数据信息资源的数据文件,而不是其他任何格式的普通文档。这个RDF/XML编码的数据文件包含了关于这个不可表示出数据信息资源的所有元数据的具体描绘叙述和与其相关的实体数据信息对象的具体数据关联关系的描绘叙述。各种对象之间的数据关联关系通常能够用本体数据信息语言来进行编码,如今很多数据领域应用的数据信息知识体系都有标准规范的,利用可重用的本体数据信息,可方便用来建立实体对象之间的数据信息关联关系①。二、关联数据的关键技术我们如今知道,关联数据是一种建立在Web技术之上的技术。而Web技术则主要是牵涉三个方面的内容:HTTP、URI和.〔1〕HTTP〔Hypertexttransportprotocol,超文本传输协议〕,是一种具体定义阅读器和万维网服务器之间相互通信的Web规则。它是通过Internet向万维网传递文档的数据传送协议。HTTP是整个网络信息资源流通的通行证。〔2〕URI〔UniformResourceIdentifier,通用资源标识符〕,是一种用于万维网上定位数据信息资源的标识符。URI一般是由三部分组成的:访问数据资源的命名机制〔Scheme〕、存放数据资源的主机名〔Authority〕、数据资源本身的名称〔由途径〔Path〕表示〕。例如下面的这个URI地址,这个地址表示的是这是一个能够通过HTTP协议访问的数据信息资源,这个数据信息资源位于主机上,它最终是通过途径/40访问②。〔3〕〔HypertextMarkupLanguage,超文本标记语言〕,是一种能够用于描绘叙述当下网页文档的标记语言。之所以称为超文本标记语言,其实是由于它的文本文档中包含了所谓超级链接点。所谓是的超级链接,其实就是一种URL〔UniformResourceLocator,统一资源定位符〕形式的指针,用户通过激活〔点击〕这个指针,就可使正在使用的阅读器方便地获取新的网页地址,进而获取到新的信息。而这个在阅读器中应用正是获得的最重要最广泛的的应用之一。HTTP、URI和三者之间是共同存在互相作用来共同产生服务的。假如把万维网比喻为一张互相交织的巨型大网,则是这张网上的一个个的交点,URI是就是这一个个交点的位置的标识符,用来标记这些交点,且是每个交点的唯一地址,而HTTP则是这个大网上的每一条交织的线,将整张大网上的一个个交点串联交织在一起,进而构成一个大的整体。而关联数据希望实现的目的就是构建一个互通互联合构化数据化的跟一个巨型大网般的大型语义网。语义网是用RDF形式来描绘叙述数据信息网络资源的,因而采用关联数据的语义网一般要求采用RDF形式的数据模型,并利用URI来命名每个详细的数据信息资源实体,并发布和部署这些数据信息资源,进而最终揭示并获取这些数据信息资源。关联数据只是一种应用RDF格式模型的数据处理技术。这个数据模型既要求以URIs形式来命名所有的数据信息对象,有要求所有的数据信息资源能够通过HTTP协议来能够访问获取。上文中提到了RDF〔ResourceDescriptionFramework,资源描绘叙述框架〕,这是一种用于描绘叙述现有信息网络上的各种数据信息和数据资源的标记性语言。RDF不只是一种语言,它同时还是一个数据框架。能够用来描绘叙述网络信息数据资源,诸如网页的标题、作者、日期、内容以及版权信息等一系列的数据信息。我们能够将数据信息置于RDF文件之中,这样的话,这些数据信息资源就有可能被计算机程序〔如spiders〕从网络信息资源数据库中搜索、发现、摄取、挑选、分析和处理。关联数据是语义网数据信息处理的一个简化方案。它以三元组模型:RDF模型及其各类扩展的模型〔即RDFS、SKOS、OWL等〕来描绘叙述各种数据信息及其之间的互相关系的。关联数据技术通过利用通用的万维网协议和规范,即HTTP和URI等,来进行发布和存取信息数据资源。所以基于关联数据的语义网数据信息处理,本质是万维网数据信息资源发布的一种方式。它通过HTTP协议便能够参引到应URI地址命名所有数据信息资源,然后以RDF语言的形式来语义化的描绘叙述数据信息资源,以到达使RDF链接指向相关数据信息资源并能够揭示数据信息资源之间的各种具体的语义关系,最后通过使用RDF来触发阅读器最终实现关联数据的信息数据资源访问。三、关联数据的基本原则蒂姆伯纳斯李〔TimBerners-Lee〕作为关联数据的发明者,他在提出了关联数据概念的同时,还提出了与关联数据有关的四项基本原则,这四项基本原则比拟全面地概括出了关联数据的基本特性:〔1〕关联数据是用URI来为任何对象做标识名称。〔2〕人们能够利用关联数据详细定位到对象,这一经过是通过HTTPURI来实现的,并且对象之间能够互相参引。〔3〕当查询对象的URI时,关联数据是以RDF形式或SPARQL的形式标准来为用户提供有意义的信息。〔4〕关联数据尽可能多的向用户提供相关的链接,将对象的URI指向其他的URI,以便能够发现更多的对象。太多地使用空白节点和文字不能起到实现关联数据的效果,这就要求人们在开创建立的关联数据RDF文件尽可能的不使用空白节点〔blanknodes〕和少使用普通文字〔Literal〕①。四、关联数据的发展现在状况及趋势关联数据最初是作为语义网的一个分支被认识的。随着最近几年遭到各领域的广泛关注和研究,关联数据的研究热度己经超过其上位词语义网,并己发展成为推动语义网发展的重要气力之一②,逐步得到了学术界和部门的广泛关注,包括报纸行业、图书馆行业等在内的很多行业机构都开场利用关联数据来为用户提供相关的服务。关联数据最经典的应用莫过于从2007年1月就开场启动的关联开放数据项目〔OpenLinkedData〕。这个项目的目的是试图利用关联数据的四项基本原则将已经存在并能够公开使用的信息资源数据集合转化成RDF格式的信息资源数据集合以供信息数据库使用,然后信息数据库通过读取RDF格式的信息资源数据并将它用HTTP来进行信息数据的传递,最终来到达改善信息数据网络的终极目的①。伴随着关联数据项目的研究和应用逐步深切进入和广泛,以及关联数据的逐步普及,很多大型机构如很多着名的大型数据库、大型网站甚至很多图书馆都积极的介入研究并进行了广泛的应用。为了使更多的用户在寻找数据信息时愈加容易的获取所需要的数据信息内容,W3CSWEO②组织开启了关联开放数据社区项目〔LinkingOpenDatacommunityproject〕,这个项目的目的是力求将当前能够利用进行关联数据的所有信息资源数据库的开放信息数据集合起来全部转化成RDF格式来进行长久保存。并将来自于不同关联数据库的关联数据资源之间建立起RDF格式的链接进行联络整合,然后继而扩展到了整个数据信息资源网络。如关联数据云图项目〔LinkingOpenDataCloudDiagram〕所呈现给我们的信息③,截至2020年9月,这个关联数据云图己经建立起并保存了295个数据信息资源关联数据集,这些信息资源数据集中包含了大概310亿个RDF形式的三元组,并产生了5.04亿个RDF形式的链接。这个关联数据云图的信息资源数据的关联数据集合还在不断的变得愈加强大愈加丰富。将来语义网与关联数据的强强联合而发挥出的宏大作用越来越吸引人们的关注,如今各行各业都在积极的介入到信息数据资源的关联数据这一行动中来,他们希望能够开放出更多的基于关联数据的信息数据资源以供外界使用。第二节关联数据在数字图书馆中的应用一、媒体资源库的构建关联数据媒体资源库中用到的主要数据处理技术是FRBR技术,即书目记录的功能需求技术。这个技术是国际图书馆协会联合会〔IFLA〕的一个进行媒体资源库研究的研究组于1998年提出的。FRBR技术的提出是为了提供愈加清楚明晰的信息数据资源库的构造化框架建设,改变如今书目存储等数据资源库的构造的扁平化缺陷。这个技术的提出,能够用来建立各个媒体数据资源库之间和媒体资源库包含的各个数据之间的基础构造框架,这个技术的提出具有改变现有核心技术提高媒体信息数据资源库利用的重大意义。数字图书馆的主要构成还是数字化处理后的图书,而图书是人类知识信息结晶的最重要的表现形式,媒体资源库的FRBR技术同样能够用来改变数字图书馆中图书之间的构建形式。数字图书馆中的每一本书都不是孤立存在的,他们之间是能够用一定的逻辑关系来关联起来的,比方图书馆分类法,利用FRBR技术就能够研究分析这些图书之间的关系以及这些图书和用户需求之间的关系,通过FRBR技术对这些关系进行处理之后,数字图书馆中的图书之间变有了新的架构体系,而与用户的需求之间也构成了立体的架构体系,这样当用户使用数字图书馆时,便有了愈加立体的使用感观,这样数字图书馆的服务将会变得更好。基于关联数据的媒体特色信息数据资源库的组织与框架的建构,主要是由两部分组成。华而不实一部分是有信息数据资源保存管理、元数据管理、信息数据资源存储方式管理、信息数据资源连接管理、数据信息资源传输管理等五个方面组成的管理部分;另一部分则是对数据信息资源的数据本身的知识组织,对于数据的知识组织显示通过各种分类法对所有的资源数据进行分类组织,到达科学的分类,然后利用FRBR技术和关联数据技术对已经分类好的资源数据进行立体的构建和数据关联化①。这样最终的基于关联数据的媒体特色信息数据资源库将变的立体而又富有联络,便于用户的使用。将关联数据应用在数字图书馆媒体信息数据资源库中,能够是用户分享构造化的关联数据项分享文件一样简便快速,当用户进行检索时,用户的检索内容能够从最初的数据向各种关联的数据靠拢,进而想用户提供愈加丰富的相关媒体信息数据资源。二、数字资源的融合数字图书馆的数字资源融合是为了帮助用户快速、有效地从分布在不同地点的信息源中获取信息,信息资源持有者和服务者都在不断尝试各种方式将同一主题信息以及相关信息进行集成,构成一个性能更优、服务更好的资源体系,为用户提供一个统一获取分布异构信息数据的途径。将关联数据应用到数字资源中来,实际上是关联数据在语义网中的应用的实现。关联数据作为语义网的最佳实践,在资源融合与分享方面有宏大的发挥空间。由于现前阶段网络信息的语义性缺失的缺点现在状况,故提出关联数据的概念以试图通过发布和链接构造化的数据使分散的异构的数据实现语义关联,进而促进传统信息系原网络向分享数据网络的转变。关联数据作为实现数据之网的主要推动手段,天然具有融合资源的优势。关联数据能够融合资源成为真正无缝链接、无限开放的整体,还能够通过与本体技术的结合加强资源之间的语义相关性。当前关联数据用于资源融合的领域主要是企业资源融合、金融数据融合和网络资源融合等。利用关联数据来融合企业信息。通过应用关联数据,采用RDF、SKOS转换数据格式,以URI命名信息单元,进而构建一个有效的语义关联的企业IT系统。不仅帮助大型公司将其成百上千的信息系统和数据库有序整合关联,而且能够链接外部开放的有益数据。关联数据通过对来自于不同数据源的数据和相关信息进行关联整合,而且能够将多个不同的分布式异构的信息资源数据进行关联整合,然后向用户返回关于用户所需要的所有数据的相关信息,并向用户推送不同的数据源产生的相关数据,这样用户在能够获得本身所需数据的同时还能够获得更丰富的相关数据。关联数据的应用大大提升了数字图书馆进行分布式异构数据关联整合的快速性。经过关联数据整合之后,数字图书馆的数据形式能够发布成关联数据的形式,并且能过将数据链接到该数字图书馆领域以外的其他相关数据源,比方各大网站、各大数据库等,能够拓展数字图书馆的资源存储并提升数字图书馆的服务质量,而且能够将数字图书馆的资源转化为一种容易理解的形式传递给图书馆领域外的用户,使他们的操作利用数字图书馆愈加简单方便,这项举措使进行关联数据的数字图书馆的影响远远超过了传统的普通数字图书馆,并且能够使数字图书馆在其他信息服务领域的地位大大提升,最大化的提升数字图书馆资源的利用价值。三、知识的组织利用关联数据这种数据发布技术,能够将知识组织中系统的概念、词汇以及概念间的互相关系关联成为网络数据资源。知识组织系统的关联数据网络化,能够使知识组织系统发挥更大的作用。概念框架是指一些概念的集合,以及可选的对概念之间的语义数据关系的声明.SKOS〔SimpleKnowledgeOrganizationSystem〕,也就是简单的知识组织系统,主要用于表示各种较为简单的NKOS〔网络知识组织系统〕,比方叙词表、分类法、主题词表、术语表等各种类型的概念框架。从这两个概念中我们能够总结出,概念框架包容了除本体数据之外的所有NKOS①。传统的知识的组织系统是在语词的概念的表示出和组织的符号系统基础上进行组织运行的,这里的每一个款项单元都是一个语词信息。由于SKOS的核心集大多也是使用RDFs来进行定义的,所以基于关联数据的知识组织系统是通过转化成SKOS来进行操作的。知识组织系统利用SKOS的方式是SKOS建模,而SKOS建模则是先以概念为基础的。这里的每个概念都有唯一的一个标示符来替代,也就是讲知识组织系统在转换成SKOS进行运行时,词表里的每一个概念都能够被抽象出来转化成为能够被标识的唯一的资源个体。所以传统的知识组织系统转换成使用机器可理解的SKOS形式的基于关联数据的知识组织系统时,要在SKOS模型上再进行修改,这里的每个款项不再是一个语词,而是变成了一个概念,而且这个概念有其唯一的URI标示。使用SKOS的建模方式方法促进了传统的知识组织系统向语义网环境下的知识组织系统的转化,并且提供了具体的转换的标准以及低成本的转化的途径。进行过SKOS转化后的基于关联数据的知识组织系统有了统一的语言标准来利用和共享新的知识组织系统。这些语言标准可以以独立进行使用,可以以与其他愈加严格规范的知识描绘叙述语言进行结合使用②。基于关联数据的知识组织系统采用SKOS基于概念的建模方式方法,既能够保证传统知识组织系统转换为基于关联数据的知识组织后能够继续生存和发挥作用,可以以最终实现本机器系统真正的理解利用,实现与Web服务的结合。基于关联数据的知识的组织系统,为处于不同系统的知识组织系统的整合提供了丰富有力的数据基础与系统运行方式。通过各种类型的知识组织系统之间进行互相映射和匹配,最后能够整合各个知识组织系统,构成一个大的基于关联数据的知识组织系统,最终使得语义互操作成为可能。四、面向用户的服务数字图书馆面向用户的服务也就是数字图书馆对用户的知识服务。关联数据是通过对处于不同数据源的同一个数据对象进行关联整合,通过整合能够把多个不同的分布式异构数据源关联整合成关联的数据访问,然后讲关于该关联

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论