




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、CALIS学位论文子项目相关标准规范王 燕2007.09.27提 纲 CALIS数字对象唯一标识符命名规范 CALIS元数据仓储唯一标识符命名规范 CALIS元数据唯一标识符命名规范 OAI CALIS OAI与METS记录格式与发布规范 CALIS OAI与METS数据导出规范 参建馆本地系统配置信息 示例CALIS数字对象唯一标识符命名规范 简称:CALIS-OID 符合URN的标准,是URN的一个子集 两个概念 简单数字对象:指具体的物理文件 复杂数字对象:逻辑概念,是若干简单数字对象的集合语法 复杂数字对象的CALIS-OID语法: urn:CALIS:馆数字代码馆数字代码-Colle
2、ctionName.CollectionName/ObjID 简单数字对象的CALIS-OID语法:urn:CALIS:馆数字代码馆数字代码-CollectionName.CollectionName/ObjID.type.format 说明 命名方式“urn”应全部采用小写字母 CALIS-OID的长度最长不应超过255个字符 复杂数字对象与其所含的简单数字对象的CollectionName 、ObjID无继承关系 CALIS-OID中的元素 馆数字代码 CollectionName ObjID Type format馆数字代码 采用由中华人民共和国教育部高等学校图书情报工作指导委员会编写的
3、高校图书馆数字代码表 以北京大学为例,其代码为211011,第一位数字“2”代表高等院校;第二位数字“1”代表地区;第三位数字“1”代表省市;第四到六位代表“011”代表学校。 高校图书馆数字代码表请查看CALIS主页: http:/ 对于学校分校区的情况,可在6位数字代码后加上一位字母以示区别,如211010A、211010B等 对于没有馆数字代码的成员馆,请向高教司条件处李晓明老师()申请,获得馆数字代码方可加入CALIS各项目集合名称(CollectionName) 必备,可嵌套 采用信息资源名称规范列表中资源的英文简称 对学位论文项目来说,该名称为“ETD”ObjID 要求ObjID符
4、合网络资源的命名规则: 使用ASCII code 命名; 文件名称大小写不敏感; 不使用不使用 “%”、“/”、“?”、“#”、“*”、“-”、“.”、“:”字符。字符。 如在镜像、备份等情况下,发生数字对象的拷贝情况,原则上使用相同的ObjIDType 对于简单数字对象,类型type是必备的,表明该对象的用途资源名称资源名称Collection-Name表现形式或用途表现形式或用途Type学位论文ETD文摘ABjournal article abstract前24页P浏览级全文A全文图像,保存级L全文图像,浏览级T非图像格式的全文Format 对于简单数字对象,文件格式(format)也属必
5、备项目,指明该数字对象的文件类型 文本文本 TXT、PDF、HTML、XML、SGML、DJVU、DOC、RTF、CEB、PPT、PDG、KDH、NH、CAJ; 图像图像 TIF、GIF、JPG、PNG、PCD、MrSID、EPS、FLA、SWF、SVG、VML、VRML; 音频音频 WAV、MID、RMI、MP3、WMA、RA; 视频视频 MPG、AVI、MOV、WMV、RM; 如不在列举中的,请向CALIS技术中心报告,获准后推行CALIS-OID示例北京大学的某一篇学位论文:学位论文作为一个复杂对象ourn:CALIS:211011-ETD/S02024前16页ourn:CALIS: 2
6、11011-ETD/S02025.P.PDF对应论文全文ourn:CALIS: 211011-ETD/S02025.T.DOCCALIS-OID示例北大名师库中的某位名师:假设北大为了建设名师库,另外建了一些资源库,如书目库、图片库、视频库、音频库等这些数字资源名师这个复杂对象ourn:CALIS:211011-teacher/Teacher0452该名师的照片(网上浏览,中精度)ourn:CALIS:211011-picture/pic219.M.JPG该名师的照片(网上浏览,缩略图)ourn:CALIS:211011-picture/pic219.S.JPG该名师的著作(电子书)ourn:
7、CALIS:211011-ebook/book156.REB.CEB该名师的一段录像(流式播放)ourn:CALIS:211011-video/video67.VM2.RM该名师的一段音频(本地播放)ourn:CALIS:211011-audio/audio23.L.MP3从这个例子可以看出,为了建设名师库,其数字资源可以来自不同的库,为了避免出现一个数字资源有多个CALIS-OID,仍旧采用该数字资源原来的CALIS-OID已有资源标识符的处理办法 对新建资源,要求强制采用CALIS唯一标识符方案 对已数字化并已有ObjID的资源,可按集合、type、format成批注册,形成一个ID对照表
8、。要求所有系统对新建资源支持CALIS数字对象唯一标识符,对原有资源只要通过ID对照表可解析即可CALIS元数据仓储唯一标识符命名规范 对于高校图书馆中的资源仓库的唯一标识符,其命名规范如下: oai:lib.高校域名:仓库简名 (推荐) oai:馆代码:仓库简名 (推荐) 仓储的命名应具有全国乃至全球范围内的唯一性,为多个仓库的联合奠定基础 说明: 要求以”oai:”开头 仓库简名前加冒号 其它内容由参建馆自行定义 但要保证整个元数据仓储的唯一标识符是全球唯一的 例:北大学位论文仓储的唯一标识符: oai:etd oai:etdCALIS元数据唯一标识符命名规范简称“MetaID”MetaI
9、D的语法为:仓储唯一标识符 “-” LocalPrefix “/” 应用系统内部元数据标识其中LocalPrefix为应用系统本地前缀,可自行定义示例北大学位论文仓储唯一标识符:oai:etdo某条学位论文记录:oai:etd-ETD/innerMetaIdo其中innerMetaId可以是学号OAI OAI(Open Archives Initiative) 是一种检索协议,国际标准 两个概念 DP(Data Providers) 支持OAI-PMH并以此方式提供元数据的管理系统 SP(Service Providers) 通过OAI-PMH收割元数据,并在此基础上提供增值服务。SP中包含一
10、个基于OAI-PMH的元数据收割器(Harvester),也称HPDP与SP的关系 OAI记录 OAI记录有三个部分 Headero Uniqueindentifer 唯一标识符,即MetaIDo Datestamp 仓储中某一个条目的创建、删除或最后修改时间 Metadata o 元数据,规定都必须支持DC,是否支持其他元数据格式由仓储自行决定 Abouto 可选部分,内容一般是关于元数据部分的数据,例如使用权限等,可自行定义。这部分的结构协议中不做规定,但CALIS给出了其具体定义OAI请求请求名请求名用法解释用法解释GetRecord从仓储中获取单个的元数据记录 Identify用来获取
11、仓储相关的及一些附加信息,包括管理,标识,社团的专门信息ListIdentifiers 是ListRecords的缩简格式,只获取记录的header部分而非记录整体 ListMetadataFormats获取仓储中可用的元数据格式。可选参数限制到某个特定元数据条目的可用元数据格式 ,响应将包括每种格式元数据前缀及其SCHEMA的URLListRecords从仓储中收割多条记录 ListSets获取仓储的set层次结构,以用于选择性收割 OAI-DP提供两种数据发布方法 GetRecord ListRecords CALIS OAI与METS记录格式与发布规范 CALIS OAI Record
12、V1.0记录格式 V1.0发布方式及其特点 CALIS OAI Record V2.0 记录格式 V2.0发布方式及其特点CALIS OAI RecordV1.0记录格式 元数据(metadata)通过“CALIS_OBJ:objInfo”来建立与相应数字对象的对应关系 CALIS OAI Record的应用方式 作为OAI数据导出文件的数据记录格式 导出的XML记录文件中含有一条Record记录 作为OAI-DP发布的数据记录格式 OAI-DP提供两种数据发布方法o 采用OAI-DP中的GetRecord方法进行单条元数据发布 o 采用OAI-DP中的ListRecords方法进行多条元数据
13、发布GetRecord方法进行单条元数据发布 GetRecord的响应结果中含有一条Record记录 ListRecords方法进行多条元数据发布 ListRecords的响应结果中含有一至多条Record记录 About元素 about元素可重复,about具有一个子元素,即objInfo objInfo有四个子元素 calisOid type约定为root、middle、leaf和single之一 datestamp是数字对象在资源系统里维护的数字对象创建或修改的时间,注意格式为”YYYY-MM-DDThh:mm:ssZ”如2004-02-19T03:09:23Z,时间要换算到格林尼治时间
14、,即零时区时间。 deleted是字符串类型,true表示对象已经被删除,false表示对象仍然存在About元素 只有元数据,无数字对象时 about/objInfo中的子元素calisOid、type、datestamp和deleted可以不含任何值,留空即可 否则 calisOid和type是必然存在的 datestamp和deleted可以没有值,无值时留空即可元数据的MetaId元数据的MetaId元数据的时间戳元数据的时间戳复杂对象CALIS-OID复杂对象CALIS-OID复杂对象CALIS-OID复杂对象CALIS-OID所对应的METS包的类型所对应的METS包的类型数字对象
15、的时间戳数字对象的时间戳数字对象的删除标志数字对象的删除标志Mets包XML片断 V1.0的发布方式 基于OAI +METS+ MQ(Message Queue)的发布方式 自动发布 本地系统的元数据通过OAI-DP发布。OAI-DP所发布出来的OAI Record采用CALIS Record V1.0格式 本地系统的数字对象通过METS-DP+MQ发布。METS-DP负责将数字对象封装成METS数据包,然后通过MQ服务器发布出去 元数据和数字对象之间的关系通过OAI Record中的CALIS_OBJ:objInfo 子元素所包含的MetaID进行关联V1.0的发布方式 手动发布 本地系统管
16、理员用OAI数据导出工具将OAI-DP中的元数据导出成为包含OAI Record数据的XML文件。该文件中的数据格式为“CALIS OAI Record V1.0” 本地系统管理员用METS数据导出工具将METS-DP中的数字对象数据导出成为包含METS Record数据的XML文件 管理员手工将上述两类文件通过FTP上传至CALIS子项目中心,由CALIS子项目中心完成数据汇总工作OAI harvester与METS harvester的联动 OAI harvester把从DP新收割的元数据的identifier(即MetaId)和CALIS-OID(元数据所对应的复杂对象的CALIS-OI
17、D)传给METS harvesterMETS harvester根据元数据的时间戳和数字对象的时间戳以及删除状态与已经收割的数字对象比较,判断数字对象有无更新,以决定是否收割对应的数字对象同时,METS harvester应该从OAI harvester获得相应数字对象的类型,以决定采取何种策略对该数字对象进行收割V1.0发布方式的特点 需要对OAI记录和METS记录进行检查和校验 必备性 正确性 一致性等 OAI记录与METS记录需要分别收割CALIS OAI Record V2.0 记录格式CALIS OAI Record V1.0格式 CALIS OAI Record V2.0格式(含M
18、ETS包 )若当前元数据存在对应的METS包,则在about段中直接添加METS包。METS包本身的格式不变(仍遵循“CALIS METS Record V1.0格式”) CALIS OAI Record V2.0样板数据片断 CALIS OAI Record V2.0 记录格式若当前元数据不存在对应的METS包,则将about段去掉 CALIS Record V2.0格式(不含METS包) V2.0的发布方式 基于纯OAI 的发布方式 自动发布 本地系统将相关的元数据和数字对象按CALIS Record V2.0格式封装为一条OAI记录,通过OAI-DP对外发布 手动发布 本地系统管理员采用
19、新的OAI数据导出工具将本地系统中的元数据和数字对象合并为一条OAI记录导出为OAI记录文件。该文件中的数据格式为“CALIS OAI Record V2.0” METS-DP中的数字对象数据无需再单独导出 管理员手工将上述类型的文件通过FTP上传至CALIS子项目中心,由CALIS子项目中心完成数据汇总工作V2.0发布方式的特点 OAI-DP用于对外发布数据 METS-DP只需为OAI-DP提供数字对象的封装功能 OAI-DP所发布的OAI Record数据遵循CALIS OAI Record V2.0格式 在OAI Record数据内,metadata和METS存在同一个中,能够自动保证元
20、数据和数字对象的对应关系 但OAI Record仍需要保证数据的必备性、内容正确性以及数据内部的一致性 当数字对象文件太大时,收割可能出现错误,建议如提供数字对象文件给CALIS的,文件不要超过80Mharvester身份验证身份验证 仓储应该具有对harvester进行身份合法性验证的功能。有两种方案: IP验证 判断请求的harvester是否在合法的IP范围内。合法的IP范围应该可以由管理员设定。(必须提供) 帐号验证 harvester管理员先到仓储注册一个帐号,填写harvester信息。然后harvester凭帐号登录并进行收割。(可选) 可以使用必备的一种,也可以同时使用两种CA
21、LIS OAI与METS数据导出规范 为了防止网络传输等问题导致的OAI、METS不能收割等情况,制定OAI、METS数据导出规范 要求本地系统能够导出OAI、METS数据成文件,通过FTP手工上传 作为OAI、METS数据收割方式的补充 OAI数据的导出要求 每条元数据记录导出成一个xml格式文件(*.xml),每个xml文件符合schema : http:/ 文件名采用以下格式: 先拼接字符串:完整MetaID20位零时区文件导出时间.oai.xml 再对此字符串进行application/x-www-form-urlencoded MIME格式转换即不合法字符“:”转换成%3A ;不合法
22、字符“/”转换成%2F 示例: 元数据MetaID:oai:etd-dr/A1002 拼接字符串:oai:etd-dr/A10022005-10-02T10:25:30Z.oai.xml 最终导出文件名:o oai%3A%3Aetd-dr%2FA10022005-10-02T10%3A25%3A30Z.oai.xmlMETS数据的导出要求每个METS包导出成一个xml格式文件(*.xml),每个xml文件符合schema : /standards/mets/version13/mets.xsd 符合CALIS METS包结构规范文件名采用以下格式: 先拼接字符
23、串:完整MetaID20位零时区文件导出时间.mets.xml 再对此字符串进行application/x-www-form-urlencoded MIME格式转换即不合法字符“:”转换成%3A ;不合法字符“/”转换成%2F示例: 元数据MetaID:oai:etd-dr/A1002 拼接字符串:oai:etd-dr/A10022005-10-02T10:25:30Z.mets.xml 最终导出文件名:o oai%3A%3Aetd-dr%2FA10022005-10-02T10%3A25%3A30Z.mets.xml V2.0模式只需遵循OAI数据的导出要求参建馆本地系统配置信息序号序号配置
24、项目配置项目取值方取值方式式配置说明配置说明示例示例1图书馆名称北京大学图书馆2图书馆代码规定值符合教育部规定的馆代码。2110103图书馆英文缩写自定义由各馆自行定义。PUL4本地仓储名称规定格式对于学位论文数据库,每个馆通常有一个相应的本地仓储。其命名规范如下: 本地仓储名称本地仓储名称 = 学校名称 + 学位论文数据库北京大学学位论文数据库5本地仓储标识规定格式与上述本地仓储对应。在全国唯一。其格式如下: 本地仓储标识本地仓储标识 = oai: + 馆代码 + :ETDoai:ETD6本地前缀(即子库前缀)自定义一个仓储可以包含1-多个子库。每个子库前缀由厂商(或者参建馆)自行定义。在该仓储内唯一。派生信息:派生信息:Me
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保安集体用工合同样本
- 出租闲置桌子合同标准文本
- 出售车合同标准文本
- 债权清收合同标准文本
- 低价协议转让合同样本
- 农场蔬菜大棚承包合同标准文本
- 外出安全课件大班
- 出售防水器材合同样本
- 健身合同标准文本标准文本
- 共享瑜伽合同范例
- 2025-2030轨道车涂料行业市场现状供需分析及投资评估规划分析研究报告
- 《印度文化与历史:大学人文课程教案》
- 老年防诈骗知识讲座课件
- 湖北省部分高中联考协作体2023-2024学年高二下学期期中考试物理试卷(含答案)
- 中学2021年秋季开学疫情防控工作方案及要求4篇
- DB33-T 1411-2024 水利工程文化融合导则
- 档案管理制度培训宣贯
- 农机质量跟踪调查表
- 刑民交叉案件的司法认定
- DB11-T 1448-2017 城市轨道交通工程资料管理规程
- 2025年度股权合作协议书新版:跨境电商平台股权合作协议
评论
0/150
提交评论