(模式识别与智能系统专业论文)web环境下基于openurl的开放式参考链接系统的设计.pdf_第1页
(模式识别与智能系统专业论文)web环境下基于openurl的开放式参考链接系统的设计.pdf_第2页
(模式识别与智能系统专业论文)web环境下基于openurl的开放式参考链接系统的设计.pdf_第3页
(模式识别与智能系统专业论文)web环境下基于openurl的开放式参考链接系统的设计.pdf_第4页
(模式识别与智能系统专业论文)web环境下基于openurl的开放式参考链接系统的设计.pdf_第5页
已阅读5页,还剩92页未读 继续免费阅读

(模式识别与智能系统专业论文)web环境下基于openurl的开放式参考链接系统的设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

坝i + 论文 w e b 环境下基十o p e n u r l 的开放式参考链接系统的设计 摘要 p 5 3 1 6 s 8 自从w e b 诞生以来,超链接一直是其最重要的组成部分之一。随着w e b 的 迅速发展,人们提出了参考链接的概念,本质上存在内在联系的内容通过参考链 接联系在一起,这种链接在资源发现过程中扮演着重要角色。信息服务的提供者 越来越期望能够将不同领域内相互有联系的资源连接在一起,为用户提供与当前 所访问资源相关的增值扩展服务。 针对这种需求,在分析当前的参考链接机制和链接框架所存在的一些问题 后,本文提出了建立基于o p e n u r l 框架的开放链接系统来实现不同信息源和目 标信息系统之间的参考链接。 本文较为详细地阐述了如何在现有系统环境下实现对o p e n u r l 链接框架的 支持。我们通过在信息系统中引入三个主要模块来实现资源引用处o p e n u r l h o o k 的嵌入,使现有信息系统成为o p e n u r l 链接框架中的信息源;而丌放链 接解析服务器则是本文的设计重点,我们给出了解析服务器的整体框架及各个模 块的设计,实现了从接收o p e n u r l 解析请求、过滤并生成合适的扩展服务到产 生最终的相关资源链接整个开放链接过程。为支持这个过程,我们设计了知识库 和扩展服务评估程序,并基于x m l 和r d f 设计了通用请求对象、链接模板以 及目标资源服务描述机制。 关键词:参考链接,开放链接,扩展服务,链接服务器,元数据,可扩展标记语 言,资源描述框架 坝j 论义 w e b 环境下基于o p e n u r l 的开放式参考链接系统的设计 a b s t r a c t s i n c ew e bw a sb o r n ,h y p e r l i n kh a sb e e no n eo f t h em o s ti m p o r t a n tc o m p o n e n t s o fw 曲a l lt h et i m e w 胁t h er a p i dd e v e l o p m e n to f w e b p e o p l ep r o p o s e dt h ec o n c e p t o fr e f e r e n c el i n k i n g :h y p e d i n k sl i n kt o g e t h e rr e s o u r c e st h a th a v ei n n e rr e l a t i o n s h i p s t h i sk i n do fl i n ki sp l a y i n ga ni m p o r t a n tr o l ed u r i n g t h ep r o c e s so fr e s o u r c ed i s c o v e r y t h ep r o v i d e r so fi n f o r m a t i o ns e r v i c e se x p e c tt h a tr e s o u r c e s ,w h i c hh a v es o m ek i n do f r e l a t i o n s h i pi nd i f f e r e n ta r e a s ,c a r lb el i n k e dt o g e t h e rt oo f f e rv a l u e a d d e ds e r v i c e sf o r u s e r s a i m i n g t ot h a td e m a n d ,a f t e ra n a l y z i n gt h ep r o b l e m so fc u r r e n tr e f e r e n c el i n k i n g m e c h a n i s m sa n df r a m e w o r k s ,w e p r o p o s e d t ob u i l da n o p e n u r lb a s e do p e n r e f e r e n c el i n k i n gs y s t e mt or e a l i z et h er e f e r e n c el i n k sb e t w e e nd i f f e r e n ts o u r c ea n d t a r g e ti n f o r m a t i o ns y s t e m s t h i sp a p e re x p l a i n si nd e t a i lh o wt or e a l i z es u c hk i n do fo p e nl i n k i n gs y s t e m u n d e rt h ee x i s t i n gi n f o r m a t i o ns y s t e me n v i r o n m e n t t h r o u g hi n t r o d u c i n gt h r e en e w m o d u l e si nt h ei n f o r m a t i o ns y s t e m ,w ei m p l e m e n t e di n s e r t i o no ft h eo p e n u r lh o o k i n t ot h ep l a c e sw h e r er e s o u r c er e f e r e n c e sm a yo c c u r b yd o i n gs o ,w ec a nm a k e c u r r e n ti n f o r m a t i o ns y s t e mb e c o m et h ei n f o r m a t i o ns o u r c eo ft h eo p e n u r ll i n k f r a m e w o r k t h ed e s i g no fl i n ks e r v e ri st h ek e y s t o n eo ft h i sp a p e r w ep r e s e n t e dt h e d e s i g no ft h ew h o l ef r a m e w o r ka n de a c hm o d u l eo ft h el i n ks e r v e ra n dr e a l i z e dt h e w h o l eo p e nl i n kp r o c e s si n c l u d i n gr e c e i v i n gt h eo p e n u r lr e s o l v er e q u e s t ,f i l t e r i n g a n dp r o d u c i n ga p p r o p r i a t ee x t e n d e ds e r v i c e sa n df i n a l l yp r e s e n t i n gt h eu r ll i n kt o t h e t a r g e t i n t e r r e l a t e dr e s o u r c e i no r d e rt o s u p p o r tt h i sp r o c e s s ,w ed e s i g n e da k n o w l e d g e b a s ea n de v a l u a t i o np r o c e d u r ef o re x t e n d e ds e r v i c e s i na d d i c t i o n ,w e d e s i g n e dg e n e r i cr e q u e s to b j e c t ,l i n kt e m p l a t ea n dt a r g e tr e s o u r c es e r v i c ed e s c r i p t i o n m e c h a n i s mb a s e do nx m la n dr d f k e y w o r d :r e f e r e n c el i n k i n g ,o p e nl i n k i n g ,e x t e n ds e r v i c e ,l i n ks e r v e r ,m e t a d a t a ,x m l r d f 2 坝l j 论文 w e b 环境下基于o p e n u r lf 1 , y 开放式参考链接系统的改汁 1 绪论 i n t e r n e t 的迅速发展使得人类的智慧以数字化信息的方式在全球范围内得以 快速传播与发展,i n t e r n e t 己成为人们搜索、收集信息最快速、最主要来源之一。 人们在i n t e m e t 上检索信息主要通过两种途径:( 1 ) 通过各种网络搜索引擎,使 用与所要检索的内容相关的主题或关键字来进行查询;( 2 ) 通过在己获耿的内容 中的参考链接( r e f e r e n c el i n k ) 或相关链接( r e l a t e dl i n k ) 来检索与当前内容 相关的信息。网络搜索引擎的主要优势在于搜索范围大,检索速度快,而其主要 缺点在于查准率不高,无用信息与有用信息相比过多,使用者经常需要在成百上 千的检索结果中过滤出自己所要的信息。而使用参考链接或相关链接来进行信息 收集所得的结果显然比使用通用搜索引擎更准确,因为参考链接一般都经过筛 选,其链接信息都与当前获得的信息内容相关,其缺点在于链接的相关信息少, 只局限于信息服务提供者所编制的链接范围,另外由于需要查询者在不同的资源 间跳转查询,因此查询效率相对不高。此外,用户在使用链接的过程中,会遇到 很多问题,根据g v u ( o r a p h i c ,v i s u a l i z a t i o n ,& u s a b i l i t yc e n t e r ) 最近一次对w e b 服务存在的问题的调查统计结果,排在第三位的大问题是:人们在浏览互联网时 常遇到不再有效的链接,或称死链接( b r o k e nl i n k ) ,导致无法获取自己所需的 信息。 可见,作为w e b 的重要组成部分,链接机制是极具价值同时又迫切需要改进 的一项内容。为了给互联网用户提供更快、更好的信息服务,需要对现有的链接 方式加以改进,在这里,我们重点讨论检索信息的第二种方式:参考链接机制。 1 1 参考链接的概念 参考链接( r e f e r e n c el i n k i n g ) 从广义上来说是指从一个信息对象到另一个 信息对象之间的链接。这种链接可以在多种应用环境中存在,如从某段引文到该 引文出处( 如某篇科学文献) 的链接,从分类目录或书目到相应资源的链接,内 嵌在e m a i l 中对某个资源的引用链接,从某个w e b 服务站点资源到另一个站点资 源的链接,这些都可以被视为参考链接。而其中非常普遍而又非常重要的种参 考链接,就是学术研究领域的信息系统资源间的链接,特别是学术期刊文献蒯的 参考链接,其最直接的表现形式为某篇文献的末尾存在大量对其它文献或信息资 源的参考引用,这种参考链接的一个重要特性就是其所指向的目标资源与当前资 源有着较大程度的相关性因此这种链接对资源发现起着非常重要的作用。 f i ! ;! f 论文 w e b 环境下基于o p e n u r l 的开放= l = i = 参考链接系统的改汁 1 2 当前的参考链接机制与应用框架 从参考链接的定义来看,参考链接是w e b 中普遍存在的种资源j t 白j 的链接。 由于这种链接所连接的资源间存在高度的相关性,因此在信息发现过程中具有很 高的价值,特别在学术领域,如果能为资源提供高相关性、高稳定性、易于生成 及使用的参考链接,那么研究人员可以以很高的效率来取得所需资源,完成自己 的应用研究。 参考链接的价值早就被人们注意到,现在已有很多链接机制用来实现参考链 接。虽然不同系统的链接机制不尽相同,但主要可以归为两种类型:静态链接 ( s t a t i cl i n k i n g ) 机制、动态链接( d y n a m i cl i n k i n g ) 机制;而根据链接的应用环境 的不同,链接的应用框架可以分为封闭式链接( c l o s e dl i n k i n g ) 框架以及开放式链 接( o p e nl i n k i n g ) 框架。 1 2 1 静态链接( s t a t i cl i n k i n g ) 机制 静态链接是指在某个资源内部的所有参考链接都是预先计算生成好的,并存 放在一个链接数据库中,以便供客户端调用。 静态链接的最简单实例就是资源内部的参考链接都是人工预先编制好的 u r l 链接。一般来说这种链接多存在于静态网页中,链接的创建者预先已经知 道链接目的资源的地址,因此可以直接编制在网页中。 静态链接较为复杂的情况是由参考数据库和地址数据库构成的参考链接系 统。一个静态链接系统的一般模型如图1 2 1 1 所示: 图1 2 ,1 1 静态链接系统的一般模型 坝i 。论文w e b 环境下基于o p e n u r l 的开放式参考链接系统的改汁 在这个静态链接系统中,每一个绛d f l l ( w o r k ,如某一篇科学论文) 都被赋予 一个唯一的标示符( i d e n t i f i e r ) ,并且每一个作品都有一个或多个电子拷贝,每 一个拷贝都对应着一个u r l 地址。信息的提供者( 这里假设为出版者) 提供跟 每一个作品相关的元数据( m e t a d a t a ) 。这些信息都被存放在数据库中( 图1 2 1 1 的方框部分) ,在这个模型中,有两个重要的数据库:参考数据库和地址数据库。 参考数据库( r e f e r e n c ed a t a b a s e ) 参考数据库中包含了与每一个作品相关的元数据,这些元数据至少应包 含对作品作常规引用时所需的信息。当客户端需要访问所引用的某一个资源 时,其向参考数据库发送一个引用请求,参考数据库根据引用请求中的元数 据来匹配出一系列合适的标示符,返回给客户端。 地址数据库( l o c a t i o nd a t a b a s e l 地址数据库存放着每个引用对象内容存放的地址。通常每个被引用资源 会存放在多个地址。客户端将获得的标示符发送给地址数据库,地址数据库 配备出一个或多个u r l 地址。客户端从u r l 地址中选择一项访问目标内容。 这里给出的一般模型与实际的应用系统会有一些异同,实际系统可能在资源 引用时直接使用标示符,从而省去对参考数据库的查找:标示符也可以用特殊的 算法来计算生成,典型的例子是a s t r o p h y s i c sd a t as e r v i c e ( a d s ) 的b i b c o d e 标 示符;参考数据痒与地址数据库也可以合二为一;现有的系统对同一个资源一般 只返回一个u r l 地址。不管怎样,它们有一个共同的特点,就是资源与u r l 链 接都是预先匹配好的,无论是直接给出目标资源的地址,还是通过元数据到标示 符再到u r l ,或是跳过元数据由标示符到u r l ,所有的信息都是预知的,或者 说受控的。正因为信息是受控的,静态链接才可能形成。 1 2 2 动态链接( d y n a m i cl i n k i n g ) 机制 一般来说,静态链接系统都是集中式的或自支持的系统,系统中的信息都是 可控的( 可以由系统内的程序取得或创建) 。而在某些服务系统中,用于获得所 引用的目标资源地址的中间信息不是都属于当前服务系统的可控范围,不是所有 的数据都可以预先获得或由程序创建,因此也就无法根据可控数据得知或计算得 到对目标资源的参考链接。在这种情况下,就没有预先定义好的u r l 地址返回 给用户。这种非集中式的系统需要一种动态链接机制。动态链接是指对资源间的 参考链接并不预先编制,链接关系通过一种动态方式来进行,信息间的链接是在 用户请求时即时产生的,而非一固化在某个数据库中。 动态链接的一个实例系统是d o is y s t e m | 2 i j o d o i 系统的一个简要示意图如 图1 2 2 1 所示: 倾i t 论义w e b 王:f 、境下基于o p e n u r l 的开放武参考链接系统的设汁 图1 2 2 1d o i 系统的简要示意图 在信息服务系统a 中的某个信息资源内部,对其它资源的引用通过使用数字 对象标示符( d i g i t a l o b j e c t i d e n t i f i e r , d o i ) 来标记,当使用者需要访问所引用的 资源时,可以点击d o i 标示符,d o i 解析请求可以h t t p 协议或以h a n d l es y s t e m p r o t o c o l 协议向外发送给相应的解析器去解析。h t t p 方式的请求将通过d o i 代理 服务器( d o ip r o x ys e r v e r ) 转发给真正的解析服务器一- - h a n d l es e r v i c ef o rd o i 去解析。以h a n d l es y s t e mp r o t o c o l 协议发送的请求可以直接被h a n d l es e r v i c ef o r d o i 系统解析。解析系统对该d o i 进行解析后返回由该d o i 所标示的对象所在 的一系列u r l 地址。这些地址由出版者等一些信息服务系统提供给d o i 服务器, 并时常更新。作为最初提供资源的的信息系统a 来说,它并不需要预先知道某 个被引用资源究竟在那个地址。即便知道某个可用地址,这个地址也可能被其它 信息系统时常更新而失去效用,由于信息的不可控性,使用静态链接地址库的方 式对信息系统a 来说是不合适的。相对独立的d o i 系统为数字对象之间的链接 提供了分布式的灵活解决方案。 而基于o p e n u r l 的s f x 系统则提供了另一种动态链接机制。s f x 系统的简 要示意图如图1 2 2 2 所示: 坝卜论土w e b 环境下基于o p e n u r l 的开放式参考链接系统的设计 图1 2 2 2s f x 系统的简要示意图 s f x 将提供链接的信息系统称为链接源系统,在链接源系统的某个资源内 部,对其它资源的引用通过插入一个o p e n u r lh o o k 来实现,其在网页上表现 为一个图片、按钮或是编制好的u r l 链接。当用户点击该h o o k 时,链接解析 请求被发送给相应的s f x 解析服务器,s f x 解析服务器判断出与所引用对象相 关的一系列可用的扩展服务列表,将其返回给用户。用户在其中选择自己所需的 服务,进一步的链接请求被发送给s f x 解析服务器,此时s f x 解析服务器计算 出链接到目标服务资源的u r l 地址,用户根据这个地址得到所引用的资源。 s f x 系统与d o i 系统不同,d o i 系统中,对象引用用统一资源标示符d o i 来标示,从对象的唯一标示符开始解析对象;而s f x 使用o p e n u r l 来标示对象 引用,在o p e n u r l 包含了与对象特征相关的元数据。d o i 系统只能返回在统一 注册机构注册过的与d o i 关联的信息系统的地址;而s f x 系统可以根据对象元 数据所描述的对象特征来给出与对象相关的各种扩展服务。 动态链接机制的一大优点就是其灵活性:链接并不通过预置的u r l 与某个 资源地址绑定,用户可以通过动态创建的链接来获取最新的相关资料。 坝f + 论文w e b 环境下皋于o p e n u r l 的开放式参考链接系统的醚汀 1 2 3 封闭式链接( c l o s e dl i n k i n g ) 框架 在很多情况下,信息系统的资源间的参考链接对象仅局限于该信息系统内的 资源集合,信息系统的构建者不允许信息系统的使用机构对链接的机制和环境进 行修改。这样的链接框架被称为“封闭式链接框架”。下面是封闭式链接框架的 一些特点: 指定式链接:这种链接方式通常都预先指定了链接的最终目标。如从一 个文摘数据库中的某项记录链接到对应的全文,从一篇论文的引文链接 到一个预先确定的文献目录描述信息。 链接的范围受限:许多链接方案都受系统内部的资源集范围的限制,即 不能超出自己已授权资源的范围。 链接忽略本地使用环境:一个信息系统开发出来后,可能在不同的环境 下被应用,如某个o p a c 系统被不同的图书馆运用。当最终用户请求参 考资源时,链接从信息系统直接传递给用户,系统的使用机构无法对该 链接进行额外的操作。 1 2 4 开放式链接( o p e nl i n k i n g ) 框架 开放式链接框架是相对于封闭式链接框架而言的。开放式链接框架并不预先 指定链接的最终目标,也不限定被链接的资源的范围,如何实现具体的链接可以 由第三方系统自己来完成,也就是说,资源的提供者和链接服务的提供者将分离 开来,这体现了其开放性的含义。在1 2 2 节中提到的s f x 系统就是采用开放式 链接框架的一个例子。 1 3 现有的链接方式存在的问题 现有的信息系统大多采用封闭式链接框架和静态链接机制。用于w e b 环境中 的超连接一一u r l 经常扮演参考链接的角色。采用u r l 作为静态链接的好处是 在受控的封闭式环境下,预先设置好的静态链接能够快速有效地链接到指定的目 标。以u r l 直接作为参考链接有其先天的缺陷:一个u r l 标示的是一个作品的 实例,如篇论文的一份电子拷贝,而不是该作品本身。因为u r l 指示的是一 个特定的地址( 1 0 c a t i o n ) ,所以当某个资源的地址发生改变时,原始的u r l 将 失去效用,当大量的地址发生改变时或链接被时常更新时,链接维护工作将变得 非常困难。 f 矾l 。论立 w e b 环境下基于o p e n u r l 的开放式参考链接系统的发汁 封闭式链接框架的一大缺点是它不允许第三方( 如图书馆) 对链接加以控制, 以便为用户提供本地化的参考链接服务。其链接的资源范围有限,局限于系统的 授权资源,为种资源所能提供的扩展服务的范围通常受到信息系统的提供机构 和使用机构之间的商业协议的限制。 现有的链接方式存在的另一个主要问题是链接脱离上下文环境 ( n o n c o n t e x t 。s e n s i t i v e ) 。简单来说,已建立的链接框架没有考虑到使用者使用 链接的上下文环境。n o n c o n t e x t s e n s i t i v e 型链接的一个实例化问题就是合适的拷 贝问题( a p p r o p r i a t ec o p yp r o b l e m ) :当使用者跟随信息系统a 中某个参考链接时, 这个链接通常是指定式链接,也就是说,使用者将被带到默认的信息系统b ( 也 可以是系统a 本身) 的目标资源t 处,然而,目标信息系统b 的这个资源t 可 能处于使用者的授权访问资源范围之外,即便使用者有权限访问另外一个信息系 统c 内同样个目标资源t 的拷贝t ,由于链接机制的限制,系统无法知道t 的存在,因而使用者也就无法访问到合适的拷贝t ,。当一个参考链接可以连接 到多个信息服务时,合适拷贝问题则泛化为合适的扩展服务问题( a p p r o p r i a t e e x t e n d e d s e r v i c e s p r o b l e m ) ,也就是说,当使用者使用参考链接时,系统能否为 使用者提供其所能访问的些合适的服务。 1 4 基于o p e n u r l 的开放链接框架 为了解决上述的链接机制存在的问题,研究人员提出并发展了o p e n u r l 链 接框架。图1 4 1 给出了o p e n u r l 链接框架的概念模型: 坝_ j 论文 w e b 环境下基于o p e n u r l 的开放式参考链接系统的设汁 图1 4 1o p e n u r l 链接框架的概念模型 从图中可以看出,传统链接系统的的单一链接层面在o p e n u r l 链接框架中 被拆分为两个层面:扩展服务层丽和元数据层面。在o p e n u r l 链接框架中,引 入了一个重要的独立于链接资源的扩展服务层面,在这个层面中分布着多个链接 服务器系统。链接服务器的引入将信息服务的提供者和链接服务的提供者分离丌 来,信息服务的提供者不再构建和维护资源之间的参考链接,而是在每个资源参 考点提供与被引用资源相关的元数据信息,当需要链接到相关资源时,元数据信 息将通过o p e n u r l 传递给置于上层的链接服务器系统,链接服务器根据资源的 元数掘信息来判断出合适的参考链接,将使用者带到合适的资源处。另外,出于 在扩展服务层面存在多个链接服务器,用户可以选择适合自己的链接服务器,如 自己有资源访问权限的图书馆的链接服务器系统,这样当需要访问参考资源时, 用户可以在自己熟悉的应用环境下获得合适的信息支持。 与传统的链接方式相比,o p e n u r l 链接框架主要解决了以下问题: 1 提供一套体系结构使得第三方能够提供附加的、适当的链接,生成一 系列合适的扩展服务。 2 歼放链接将信息服务的提供者和链接服务的提供者分离:信息服 8 w e b 环境下举十o p e n u r l 的开放式参考链接系统的设计 务的提供者并不指定链接的目标资源或服务究竟是什么,而是提供与 被引用资源相关的元数据及上下文信息,参考链接的生成将交给链接 服务器去完成 3与静态链接系统相比,可以更加动态、容易地实现和维护链接 4 , 通过o p e n u r l 规范来提供一套传送元数据的机制 1 4 1o p e n u r l 发展历程简介 1 9 9 9 至2 0 0 0 年,h e r b e r tv a nd es o m p i e 在g h e n t 大学和l o sa l a m o s 实验室 的图书馆进行研究期间,研制出o p e n u r l 框架。2 0 0 0 年初,h e r b e r tv a n d e s o m p e l ,h o c h s t e n b a c h 和b e i t a r i e 出版了o p e n u r l 互用性规范的草本。作为 实验内容的一部分,一个链接服务器原型被设计出来并在h o c h s t e n b a c h 和v a n d es o m p e l 的协作下得到发展,这为s f x 的出现奠定基础。2 0 0 0 年美国e xl i b r i s 公司推出s f x 技术框架,用于实现在不同来源、不同类型数据库之阳j 及这些 数据库与图书馆o p a c 之间建立有机的联系,使图书馆信息资源形成一个整体。 美国及一些欧洲的图书馆已是s f x 用户。2 0 0 1 年3 月,n i s o ( 国家信息标准化 组织) 成立o p e n u r l 标准委员会,定义o p e n u r l 的标准。与此同时,v a nd e s o m p e l 和b e i t a r i e 已经将原来为学术领域的资源链接而设计的o p e n u r l 概念 抽象出来,形成更为通用的b i s o n - f u t 6 模型。2 0 0 2 年3 月,n 1 s o 发布了应用范 围更广的o p e n u r l1 ,0 版本。 1 4 2 用于s f x 的o p e n u r l 规范 作为最初的o p e n u r l 实验系统,s f x 现已发展为商业化的应用系统,被多 个机构采用。然而,s f x 采用的仍然是早期为学术信息领域设计的o p e n u r l 01 标准( 其内部版本为o p e n u r l 1 o f 一2 0 0 0 0 5 1 6 ) 。该规范的e b n f ( 扩展巴得范 式) 见附录a 。 在该规范中,o p e n u r l 由b a s e u r l 和q u e r y 两大备份组成。b a s e u r l 指定了接收o p e n u r l 作为输入的链接服务器的地址;q u e r y 部分的信息供链 接服务器来判断生成合适的链接。 q u e r y 部分由一些对对象的描述信息区组成,主要有来源描述 ( o r i g i n d e s c r i p t i o n ) 及对象描述( o b j e c t d e s c r i p t i o n ) 两部分。 o r i g i n d e s c r i p t i o n 描述了提供元数据、生成o p e n u r l 的信息系统的有 关信息,o b j e c t d e s c r i p t i o n 包含了与被引用对象相关的些信息。 o b j e c ,i - d e s c r i p t i o n 由全球标示符区( g l o b a l i d e n t i f i e r z o n e ) 、时 颂 论文 w e b 环境下基于o p e n u r l 的开放式参考链接系统的设计 象元数据区( o b j e c t m e t a d a t a z o n e ) 和本地标示符区 ( l o c a l i d e n t i f i e r z o n e ) 构成。 全球标示符限定在四种类型:d o i 、p m i d 、b i b c o d e 、o a i 。 对象元数据区由多对元数据标签和值来构成。在该版本规范中限定了元数据 标签的构成如下: m e t a t a g := ( g e m e j a u l a s t j a u f i r s t j a u i n i t j a u i n i t l j a u i n i t m c o d e n j i s s n l | e i s s n | i s b n i t i t l e 。l s t i t l e l a t i f l e f v o l u m e i p a r t i i s s u e i s p a g e i e p a g e 。i p a g e s l 。a r t n u m l s i c i i b i c i l s s n l q u a r t e r i d a t e ) 本地标示符区则可包含由用户自定义的一些信息。 1 4 3b i s o n f u t 6 模型介绍 用于s f x 的o p e n u r l 规范显然存在应用范围的局限性。其o p e n u r l 的构 成部分比较简单,尤其是它限定了可用的元数据标签,这使得该规范仅能运用在 学术领域的某些信息系统中。h e r b e r tv a nd es o m p l e 等在随后的研究中提出了 b i s o n f u t 6 4 】模型,与早期的o p e n u r l 框架相比,该模型更为一般化。 在b i s o n f u t 6 模型中,学术信息环境下的资源间的参考链接的概念被一般化 了,被参考( 引用) 的资源可以是各种出版作品( c d s ,c d - r o m s ,音频文件,视 频文件等等) ,可以是各种实体对象( 城市,汽车,人,公司等等) 以及可在 w e b 网页上引用的抽象概念。这些被引用的对象在b i s o n f u t 6 模型中被称为 “r e f e r e n t ”。 表1 ,4 1 3 1 比较了o p e n u r l 框架和b i s o n f u t 6 模型中的概念术语: 基于w e b 的学术信息环境 被引用的学术作品 对学术作品的引用 引用学术作品的h o o k 为 o p e n u r l : + 对作品的标准化引用 一般而言的w e b 环境 r e f e r e n t 对r e f e r e m 的引用 引用r e f e r e n t 的h o o k 为 c o n t e x t o b j e c t : * y 4r e f e r e n t 的描述符 ( d e s c r i p t o r ) 0 顺+ 论文 w e b 环境下基于o p e n u r l 的开放式参考链接系统的设计 + 对上下文环境的标准化引用 + h o o k 转变为链接: l i n k = o p e n u r l 服务组件 ( s e r v i c ec o m p o n e n t ) 扩展服务:参考链接 被引用的学术作品:作为 o p e n u r l 目标的解析服务器: 提供o p e n u r l 的信息服务系 统 + 对上下文实体的描述符 h o o k 转变为链接: l i n k = o p e n r e s o l u t i o n l i n k 解析器( r e s o l v e r ) 服务( s e r v i c e s ) 实体( e n t i t i e s ) 表1 4 ,3 1 o p e n u r l 框架和b i s o n f u t 6 模型中的概念术语的比较 b i s o n f u r 6 模型引入了下列术语: 1 e n t i t y 一个实体是一个可以由描述符d e s c r i p t o r 来表述的东西 2 d e s c r i p t o r 一一描述符是用来表述e n t i t y 的手段,描述符包含以下类型: e n t i t y i d :实体标示符由一个对命名空间( n a m e s p a c e ) 的引用以及在该命 名空间内唯一的实体标示符构成。 m e t a d a t a i d :元数据标示符由一个对命名空间的引用及在该命名空间内唯 一的实体元数据的标示符构成: m e t a d a t a d e s c r i p t i o n :- - 个元数据描述是由一个对元数据方案( m e t a d a t a s c h e m a ) 的引用以及一个遵照该元数据方案来表示的实体描述构成。 m e t a d a t a - d e s c r i p t i o n p o i n t e r :元数据描述指示器由一个对元数据方案的 引用以及一个遵照该元数据方案来表示的实体元数据信息的位置指示器 构成。 p r i v a t e z o n e :未指定使用方式的区域,供系统设置自定义参数。 3 c o n t e x t o b j e c t 一一从抽象概念来说,一个上下文对象( c o n t e x t o b j e c t ) 是 用于引用的一个结构,它包含: 个核心实体,称为r e f e r e n t ; r e f e r e n t 被引用时处于引用环境的些实体 因为实体由描述符d e s c r i p t o r 来表述,所以c o n t e x t o b j e c t 也是描述符的 容器,其核心是对r e f e r e n t 的描述符。图1 4 3 1 描述了c o n t e x t o b j e c t 的概 念,图1 4 3 2 给出了c o n t e x t o b j e c t 、c o n t e x t o b j e c t 内的实体以及实体的描 硕i 论文 w e b 环境下基于o p e n u r l 的开放式参考链接系统的设计 述符之恻的关系。 图1 4 3 1 c o n t e x t o b j e c t 的及其内部的实体 图1 4 3 2 c o n t e x t o b j e c t 、实体及描述符之间的关系图 一个c o n t e x t o b j e c t 能够包含对下列实体的描述符: r e f e r e n t :r e f e r e n t 是被引用的实体。它处于c o n t e x t o b j e c t 的核心,并且 在每个c o n t e x t o b j e c t 中至少需要包含一个r e f e r e n t ,系统主要是根据 r e f e r e n t 的描述符来生成最终的服务( s e r v i c e ) 的。 r e s o l v e r :r e s o l v e r 是将r e f e r e n t 的描述符解析成一系列扩展服务的w e b 服务程序。当c o n t e x t o b j e c t 被编码成o p e n r e s o l u t i o n l i n k 时需要在 c o n t e x t o b j e c t 中给出r e s o l v e r 的描述符。 r e f e r r e r :r e f e r r e r ( 引用者) 是指提供对r e f e r e n t 的引用的w e b 服务。 r e f e r r i n g e n t i t y :r e f e r r i n g e n t i t y ( 引用实体) 是r e f e r r e r 内部的一个原子 实体,它包含了对r e f e r e n t 的引用。 坝i + 论义 w e b 环境下基于o p e n u r l 的开放式参考链接系统的设计 r e q u e s t e r :r e q u e s t e r ( 请求者) 是指请求对r e f e r e n t 的描述符进行解析的 用户或用户代理。r e q u e s t e r 可以是在网络设备上工作的某个人,也可以 是一个计算机程序。 s e r v i c e t y p e :s e r v i c e t y p e 表述了扩展服务的类型。s e r v i c e r y p e 可以用来 指示r e q u e s t e r 所需的解析后的服务类型。 4 o p e n r e s o l u t i o n l i n k - - 一一个r e f e r e n t 的c o n t e x t o b j e c t 不象o p e n u r l 一样 是一个h t t p 请求,在b i s o n f u t 模型中,对r e f e r e n t 的c o n t e x t o b j e c t 编 码成h t t p 请求得到的是o p e n r e s o l u t i o n l i n k 。c g p l ,从一个c o n t e x t o b j e c t 生成o p e n r e s o l u t i o n l i n k 可以有多种方法,也就是说,b i s o n f u t 6 模型并 没有规定对c o n t e x t o b j e c t 编码的具体形式。 5 r e s o l v e r 一一上文已经对r e s o l v e r 解释过,r e s o l v e r 接收o p e n r e s o l u t i o n l i n k 作为输入,输出一系列s e r v i c e 。 6 s e r v i c e 一- - b i s o n f u r 6 模型并没有阐述s e r v i c e 的概念,s e r v i c e 是r e s o l v e r 解析的结果,b i s o n f u t 模型交给r e s o l v e r 的实现者去决定什么可以成为 一项服务。 可见,早期的o p e n u r l 规范中只允许3 类主要实体: 0 b j e c t - d e s c r i p t i o n 、0 g i n d e s c r i p t i o n 以及b a s e u r l ,而在 b i s o n f u t 6 模型中引入了其它一些实体和概念,使得该模型能适用于更为广泛的 w e b 环境。 1 4 4o p e n u r l l 0 规范简介 在b i s o n f u t 6 模型的基础上,o p e n u r l 发展成为现在的1 0 版本,该版本规 范参见附录b 。在该版本中,沿袭了b i s o n f u t 6 模型中的很多概念,可以晚 o p e n u r l1 0 是b i s o n f u t 模型的具体化规范。在该规范中,以h t t p ( s ) g e t 格式详细描述了o p e n u r l v 1 ,0 的构成规则。其主要规则概述如下( 使用e b n f i s o i e cl4 9 7 7 :1 9 9 6 ( e ) t ”j 格式) : o p e n u r l h t t p g e t = r e s o l v e r ? q u e r y : q u e r y = r e f e r e n t , r e q u e s t e r 】, r e f e r r e r 】, r e f e r r i n g - e n t i t y 】, s e r v i c e - t y p e 】, a d m i n i s t r a t i o n ; 可见,o p e n u r lv 1 0 中,沿用了b i s o n f u t 6 模型中包含在c o n t e x t o b j e c t 中 的r e s o l v e r ,r e f e r e n t ,r e q u e s t e r ,r e f e r r e r ,r e f e r r i n g - e n

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论