![数字资源统一编程的最多信息基础设施数字资源唯一标识符体系系统分析_第1页](http://file4.renrendoc.com/view/7ef0866f83de9f6062459414b04f6e56/7ef0866f83de9f6062459414b04f6e561.gif)
![数字资源统一编程的最多信息基础设施数字资源唯一标识符体系系统分析_第2页](http://file4.renrendoc.com/view/7ef0866f83de9f6062459414b04f6e56/7ef0866f83de9f6062459414b04f6e562.gif)
![数字资源统一编程的最多信息基础设施数字资源唯一标识符体系系统分析_第3页](http://file4.renrendoc.com/view/7ef0866f83de9f6062459414b04f6e56/7ef0866f83de9f6062459414b04f6e563.gif)
![数字资源统一编程的最多信息基础设施数字资源唯一标识符体系系统分析_第4页](http://file4.renrendoc.com/view/7ef0866f83de9f6062459414b04f6e56/7ef0866f83de9f6062459414b04f6e564.gif)
![数字资源统一编程的最多信息基础设施数字资源唯一标识符体系系统分析_第5页](http://file4.renrendoc.com/view/7ef0866f83de9f6062459414b04f6e56/7ef0866f83de9f6062459414b04f6e565.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数字资源统一编程的最多信息基础设施数字资源唯一标识符体系系统分析
1唯一标记的全球发展现状数字资源的唯一识别特征是根据统一的规则和程序授予数字资源的唯一和永久名称,并被图像地称为数字资源的编码或密码。数字资源唯一标识符能够实现数字资源统一编号、规范管理、精确定位和透明利用,是数字时代重要的信息基础设施。因数字资源唯一标识符建设涉及数字资源的采集、组织、整合、保存和服务等整个生命周期,也涉及到数字资源生产、发行、保存和服务的所有行业和领域,该体系建设难度异常之大,成功实现并应用该系统,一直是各国数字资源规范管理的标志,也是数字化社会先进水平的重要标志之一。目前,各国积极开展数字资源唯一标识符的探索和建设,世界范围内数字资源唯一标识符体系的建设以IDF的DOI系统为主,已有上千万个分配并解析的DOI号码,8个DOI注册代理机构和几百个使用单位,跨越美国、欧洲、澳大利亚以及一些非英语国家,应用领域也扩展到政府部门。万方数据是DOI的中文代理,CALIS和CNKI参照DOI技术,构建了内部标识体系。国家图书馆全面分析了数字资源唯一标识符体系,制定了《数字资源唯一标识符标准规范》、《唯一标识符应用指南》等标准,规范了唯一标识符数据命名规则、注册和解析方式等内容,自主研发了一套数字资源唯一标识符系统平台,并在系统部署、建设、服务和管理架构上做了大量的探索和实践,为大规模开展唯一标识符体系建设提供了有益的参考和借鉴。2u3000唯一的识别系统架构2.1分布式网络架构数字资源唯一标识符系统采用四层架构实现分布式、可伸缩、可扩展的系统功能,其中SOA架构、可扩展机制、安全机制和通信机制贯穿四层,如图1所示。2.1.1u3000基础设施层基础设施层是系统运行的支撑环境,由服务器、存储设备、网络组成。2.1.2互联网用户标识核心构成数据管理层是针对底层数据的管理和服务层,为上层数据访问提供服务。分为唯一标识符系统管理核心、搜索引擎/服务两大部分,其中唯一标识符系统管理核心包含数据管理、同步管理、存储管理和日志管理几个部分;全文检索搜索引擎/服务包括索引创建、维护管理,提供全文检索服务。2.1.3标识维护模块系统业务的实现层,包括唯一标识符生成、URL维护、唯一标识符解析、注册数据维护、系统配置、系统监控、用户管理、唯一标识符维护、日志管理、统计管理等模块。2.1.4u3000数字资源系统接口面向用户提供应用界面及接口集服务,其中接口集不仅为国内各行业数字资源信息系统预留了对接接口,还为国外数字资源系统(如Handleu3000System、DOI系统等)预留互相解析接口,以实现中文数字资源与国外数字资源的快速读取。2.2支持行业平级扩展方式和分层、分级的分布式部署模式基于SOA架构和分布式松散耦合的组件方式,使得系统形成可伸缩、可扩展的部署架构。系统在通信机制方面采用TCP/IP的机制建立通信方式,在安全机制方面采用安全验证、授权等方式,保证系统安全稳定运行。系统支持独立部署、平级并行部署、分层分级部署三种模式,既可以独立部署在图书馆、博物馆、出版机构、广电总局等各个行业的机构单位内,也支持行业内外不同机构的平级扩展方式部署以及分层、分级的分布式部署连接方式。每个部署机构形成独立的自治域,既可自主管理本区域命名授权下所有唯一标识符的注册和解析服务,也可以选择数据同步方式,将保存在本区域的唯一标识符数据同步到上层部署机构节点。对于每个部署机构节点本区域注册的唯一标识符可以直接在本区域系统进行解析,对于非本地注册的唯一标识符可通过调用其他区域的唯一标识符系统实现递归查询解析。数字资源唯一标识符系统在全国的规划部署可以采用全国唯一标识符中心节点系统和区域节点系统的分层分级部署模式,如图2所示。全国唯一标识符中心节点,可以管理多个区域机构节点,通过数据同步接口,各个区域机构节点的唯一标识符数据最终同步到全国唯一标识符中心节点,中心节点保存所有区域机构节点提交的注册数据,从而实现数字资源跨行业跨区域的解析调用服务。3唯一网络格式的作用唯一标识符系统建设的核心是底层数据建设,它支撑着整个唯一标识符体系,对唯一标识符的功能和应用服务起着决定性的作用。具体来讲,唯一标识符的建设模型主要包括数据注册、数据查重、数据更新维护、数据同步等。3.1资料和注册方式唯一标识符系统注册元数据信息主要包括数据来源系统编号、系统内部唯一编号、MARC记录唯一编号、题名、创建者、ISBN(ISSN)、出版者、出版时间、资源类型、描述信息、颗粒度等数据项。系统的注册方式包括界面提交和接口提交两种模式,既可以进行单条注册也可以进行批量注册。系统接收到提交的注册元数据信息后,对信息进行合法性校验,其中任何一个数据项有误,系统将返回错误结果,校验合法的数据,系统会进行相应的查重,发现重复会返回错误结果,对于查重通过的数据将生成唯一标识符号CDOI。3.2级查重机制系统建设采用一级查重和二级查重并用的机制。如果采用一级查重机制,在查重过程中,字段完全匹配的时候,系统认为是重复数据,其他情况则认为是非重复数据,生成CDOI。如果采用二级查重机制,用户设定查重权重个数。当一级查重字段全不等或者部分核心字段不等时,不进行二级查重,直接生成唯一标识符号CDOI。当一级查重字段全相等时,进行二级查重,若二级查重字段的相等个数大于等于设置的权重个数时,判断为重复数据,若二级查重字段的相等个数小于设置的权重个数时,判断为相似数据,需要人工判断是否为重复数据。一级查重机制相对简单,但会因数据问题造成的重复数据生成CDOI,二级查重机制,准确性相对比较高,但人工干预量大。因此在实际实施过程中,可根据资源特点和实际情况,配置合适的查重机制。3.3cdoi注册元数据维护已经生成CDOI的数字资源注册元数据信息有些数据(如URL地址)在系统的运行过程中可能会经常发生变化,因此系统提供CDOI注册元数据信息维护功能。用户可通过界面方式或接口方式对已生成CDOI的注册元数据字段项(含URL地址),进行单条或者批量维护操作,如删除、编辑修改、导出等操作。另外可通过数据变更同步接口,将变更CDOI元数据信息及时同步到上层区域机构节点。3.4步和注册数据同步系统采用分布式上传的方式实现数据同步,主要包括变更数据同步和注册数据同步。系统采用异步处理机制实现同步业务,即将一些同步业务通过异步方式加入工作队列中,在系统空闲的时候再从队列中获取工作任务进行处理,保证业务高峰期的系统响应能力。4创建解析机制唯一标识符系统的最重要功能是对外提供服务,解析机制是唯一标识符服务的重要组成部分,是实现数字资源跨系统互操作的基础。具体来讲主要包括解析服务、代理调用服务。4.1注册元数据提交唯一标识符解析分为正向解析和逆向解析。正向解析是向唯一标识符系统提交唯一标识符CDOI获取对象的注册元数据信息(如URL地址)。逆向解析是通过向唯一标识符系统提交唯一标识符注册元数据相关字段值,获取当前对象的CDOI,进一步定位到资源对应的URL地址。4.1.1cdoi解析正向解析分为简单解析和多重解析。简单解析要求每个唯一标识符解析只有一个解析结果,如只定位到一个URL地址;多重解析允许一个唯一标识符可解析到多个结果,用户可手工选择解析结果。系统提供界面提交和接口两种方式实现正向解析。在具体解析过程中采用递归解析机制,系统先对发送的CDOI按照编码规则进行分析,如属于在本系统注册的唯一标识符,则直接解析;否则向相应的区域机构节点提交解析请求、获取解析结果,如果所请求的区域结构节点服务器没有响应(超时),将向顶层节点发出解析请求并获得解析结果。4.1.2逆向解析请求逆向解析是根据唯一标识符注册元数据信息解析获取CDOI,用户可通过界面提交和接口两种方式实现逆向解析。若不选择服务节点,则默认在本区域节点下进行逆向解析请求。如果所请求的区域节点在规定时间(可配置)内无响应(超时),则向顶层服务节点接口发送逆向解析请求,当有多个解析结果,用户可以手工选择。在采用接口方式进行逆向解析时,用户需通过XML格式提交必要的注册元数据信息。4.2标识的相互识别、解析转换唯一标识符系统提供代理调用服务接口,通过网关转换和调用系统的解析接口,实现数字资源唯一标识符系统与国内外其他DOI系统之间唯一标识的相互识别、解析转换,有利于实现国内外不同领域内数字资源的共享访问,双方系统接口遵照XML标准。双方唯一标识系统在通过数字资源唯一标识符进行资源互访的时候,可根据请求的资源唯一标识符调用网关服务,网关服务节点将对发送的唯一标识请求按照对方系统的编码规则进行唯一标识转换,转化为对方系统能够解析唯一标识编码后,对方系统的解析接口将对信息进行校验、解析,定向到资源对应的URL。5图书馆是数字资源唯一标识近年来,各个领域产生的数字资源日益丰富,数字资源唯一标识在各个领域的作用日益凸显,它为各个领域数字资源服务提供了支撑机制,是各个领域在网络环境里发现、确认、调用、连接数字资源的基础。图书馆履行搜集、加工、存储、研究、利用和传播知识信息的职责,它在数字资源产业链中扮演着非常重要的责任,是数字资源唯一标识符重要应用行业和领域。下面我们以数字图书馆建设为应用实例,从数据流向、接口交互方面,介绍数字资源唯一标识符系统如何与数字资源生产、组织、发布、检索服务等系统实现紧密挂接。如图3所示。5.1唯一标记用户文献数字化等采集系统在向数字资源组织系统提交成品数据之前,需到唯一标识符系统注册登记资源唯一标识符。可以通过调用唯一标识符系统注册接口的方式或者界面注册的方式,进行单条或者批量注册。对注册成功的数据生成唯一标识符保存在唯一标识符系统元数据表中,并返回注册成功的数字资源唯一标识CDOI给相应的采集系统。5.2唯一标识获取在数字图书馆建设的流程中,文献数字化等采集系统注册唯一标识符成功之后,将已经具有唯一标识符CDOI的成品数字资源提交给数字资源组织系统。在数字资源组织系统内部根据CDOI进行元数据信息进一步检查、处理和加工完善,若在对数字资源进行深度加工时产生了新增对象数据,则需要对新增数据申请唯一标识符,数字资源组织系统向唯一标识系统发送元数据注册信息,调用唯一标识注册接口获取CDOI。另外组织系统在对数据加工处理过程中,若发现唯一标识符注册元数据信息有误,可以通过调用唯一标识符系统更新维护接口,实现对注册元数据数据字段信息的更新。5.3数据库内容更新数字资源组织系统主要依据CDOI与发布和服务系统进行数据交互。数字资源组织系统向发布与服务系统提交加工后的元数据和对象数据,发布与服务系统将数字资源在网上发布后,会形成统一资源定位符URL地址。数字资源发布与服务系统可通过调用唯一标识符系统更新维护接口进行URL地址登记更新。唯一标识符系统根据CDOI维护其对应注册元数据项(不包含URL)的信息,系统会对更新维护接口传入的CDOI信息,进行合法性校验,如果任何一项数据校验错误直接返回错误结果;合法校验通过之后,会对元数据进行查重,对查重通过的数据进行URL更新。5.4资料解析和展示方式用户通过统一元检索系统、OPAC等系统检索出来的数字资源,在概要显示页面或者详细信息展示页面,可向唯一标识符系统发送数字资源CDOI,调用其解析接口进行正向解析,获取相关注册元数据信息,进一步定位到对象数据URL地址,进行全文阅览。5.5资源cdoi获取版权授权信息CDOI实现了发布与服务系统和版权信息系统的对接功能。发布与服务系统向版权系统发送数字资源CDOI来获取版权授权信息,如资源的时间范围、空间范围以及地域范围。如果版权系统注册的版权信息数据缺少唯一标识CDOI,则通过向唯一标识符系统发送相关注册元数据信息字段,调用唯一标识符系统的解析接口,进行逆向解析,获取数字资源唯一标识符CDOI。6唯一标识系统由唯一标识符系统以及相关标准构成的数字资源唯一标识符体系是高效的、可扩展的、开放的体系。该体系具有很广泛的适用性,可以成为数字资源所有应用领域的全局性基础设施,不仅适用于图书馆行业,还可应用于国内博物馆、美术馆、数字资源生产商、出版商等行业数字资源唯一标识符的注册解析。此外,该系统预留了与国内外其他唯一标识符系统(如国际DOI联盟-IDF申请,中文DOI注册中心)进行交互的接口,可实现中文数字资源与国外数字资源的互相注册、解析调用和快速读取。目前
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高绝缘高导热氮化铝陶瓷基片项目发展计划
- 2024-2025学年第二学期工作计划
- 夏季施工噪音控制措施
- 护理教育中的诊断与教学措施
- 2025年社会养老保障服务项目合作计划书
- 2025年资料承包合同
- 2021-2026年中国吡哌酸片行业市场全景调研及投资规划建议报告
- 科技创新项目进展整改措施
- 2025年章鱼花项目投资可行性研究分析报告
- 2025年一对一学员辅导协议
- 天津人社局解除劳动合同证明书
- (高清正版)JJF(浙)1090—2014薄片千分尺校准规范
- 2020年采购部年度目标计划 采购部工作目标
- 阳光分级阅读高一上The Emperor Penguin课件
- 黑水虻幼虫的营养成分表
- 国家农产品质量安全监督抽查抽样单
- 高校教师个人总结3000字数
- 离心式压缩机功率公式
- 柴油机突然停机的原因及判断处理
- 参保人员就医流程doc
- 微观经济学图示分析汇总分解(共17页)
评论
0/150
提交评论