




已阅读5页,还剩53页未读, 继续免费阅读
(档案学专业论文)基于oais的数字档案馆元数据体系构建.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 中文摘要 随着计算机技术和网络技术的迅猛发展,数字信息资源积增,使得数字信息 资源的长期保存任务受到广泛的关注。元数据的构建作为各种保存方案的基础性 工作被提出,而元数据设计的资源指向性,使得以数字档案馆建设为依托的元数 据研究得以开展。 本文在以数字信息资源长期保存为背景和长远目的的基础上,分析了o a i s 参考模型,并依据其功能模型设计、提出了数字档案馆框架;在此框架内,分析 了数字档案馆元数据的构建问题,目的是为我国数字档案馆及其元数据在建设设 计之初就考虑到数字信息的长久保存,把元数据的设计与数字档案馆建设结合起 来,使得数字资源的保存得到重视,在同一个框架o a i s 下开发保存系统和制订元 数据格式,将能够促进不同领域系统间的互操作和信息的共享,进而为数字信息 资源的长期保存打好坚实的基础。 关键词:o a i s ;数字档案馆;元数据;框架体系 黑龙江大学硕士学位论文 a b s t r a c t w i mt h ec o m p u t e rt e c h n o l o g ya n dt h er a p i dd e v e l o p m e n to fn e t w o r kt e c h n o l o g y , d i g i t a li n f o r m a t i o nr e s o u r c e sb yt h ep l o t ,m a k i n gt h en u m b e ro fl o n g - t e r mp r e s e r v a t i o n o f 砌o r m a o o nr e s o u r c e sb yaw i d er a n g eo fa t t e n t i o nt a s k s c o n s t r u c t i o no fm e t a - d a t a a st h eb a s i sf o rav a r i e t yo fp r e s e r v a t i o nw o r kp r o g r a mw a sp r o p o s e d ,a n dt h e r e s o u r c e sm e t a - d a t a p o i n to ft h ed e s i g n ,m a k i n gt h e c o n s t r u c t i o no f d i g i t a l a r c h i v e s b a s e dr e s e a r c hc a l lb ec a r r i e do u tm e t a d a t a i nt h i sp a p e r , t ol o n g t e r mp r e s e r v a t i o no fd i g i t a li n f o r m a t i o nr e s o u r c e sf o rt h e p u r p o s eo ft h eb a c k g r o u n da n dl o n g t e r mb a s i s ,t h ea n a l y s i so ft h eo a i sr e f e r e n c e m o d e la n df u n c t i o n a lm o d e lb a s e do ni t sd e s i g n ,p u tf o r w a r daf r a m e w o r kf o rd i g i t a l a r c h i v e s ;w i t h i nt h i sf r a m e w o r k ,a na n a l y s i so fm e t a d a t ad i g i t a la r c h i v e s c o n s t r u c t i o no ft h eq u e s t i o nf o r t h ep u r p o s eo fc h i n a sd i g i t a la r c h i v e sa n dt h e i r m e t a d a t aa tt h eb e g i n n i n go fc o n s t r u c t i o no nt h ed e s i g n ,t a k i n gi n t oa c c o u n tt h e l o n g - t e r mp r e s e r v a t i o n o fd i # t a li n f o r m a t i o n ,t h em e t a - d a t ao ft h e d e s i g na n d c o n s t r u c t i o no fd i g i t a la r c h i v e st o c o m b i n e ,m a k i n gt h ep r e s e r v a t i o n o fd i g i t a l r e s o u r c e sa r ev a l u e di nu n d e rt h es a m ef r a m e w o r kf o rt h ed e v e l o p m e n to fo a i s p r e s e r v a t i o ns y s t e ma n dt h ed e v e l o p m 6 n to fm e t a d a t af o r m a t , d i f f e r e n ta r e a sw i l lb e a b l et op r o m o t ei n t e r o p e r a b i l i t yb e t w e e ns y s t e m sa n di n f o r m a t i o ns h a r i n g ,a n dd i g i t a l i n f o r m a t i o nr e s o u r c e sf o rt h el o n g - t e r mp r e s e r v a t i o no fag o o ds o l i df o u n d a t i o n k e y w o r d s ;o a i s ;d i g i t a la r c h i v e s ;m e t a d a t a ;a r c h i t e c t u r e 1 1 黑龙江大学硕士学位论文 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研 究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得墨蕉江太堂或其他教育机构的 学位或证书而使用过的材料。 学位论文作者签名:司暂巷。勿 签字日期:毋形尹年占月i n e t 学位论文版权使用授权书 本人完全了解墨蕉堑太堂有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本 人授权墨蕉堑太堂可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或其他复制手段保存、汇编本学位论文。 学位论文作者签名:糕死 导师签名:阉确良 签字日期:。哆年多月1 0 e t 签字日期:p 坩尸年多月日 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 绪论 绪论 选题目的与意义 随着信息化、网络化环境的形成,数字资源已经成为人们获取信息的主要载 体。但数字信息由于自身特点及外部环境的变化使得数字信息随时可能消失。因 此,长期保存这些信息活动得以重视,技术策略、管理策略纷纷提出,但无论是 哪种策略,都不可回避的基础是对数字信息的记录、保存、识别的元数据的创建 与维护。尽管国内外一些项目提出了自己的元数据格式,例如c e d a r s 数据、n e d l i b 元数据、l c d i g i t a lr e p o s i t o r y 元数据、r l g 元数据、p a n d o r a 元数据、n l a 元数 据以及中文元数据标准等,“但目前在数字信息长期保护方面还没有统一或通用的 元数据格式。 现在,国内数字档案馆正如火如荼的建设中,数字档案馆的建设是一种典型 的构建信息资源数字长期保存系统的过程,基于开放框架和标准进行设计和建设, 是保证档案对象能够相对独立于系统、技术、媒介等的变化而得到长期可靠保存 和持续利用的基本保证。作为数字信息资源保存的主阵地,如何在建设设计之初 就考虑到数字信息的长久保存,如何把元数据的设计与数字档案馆建设结合起来, 数字资源的保存得到重视,在同一个框架o a i s 下开发保存系统和制订元数据格 式,促进不同领域系统间的互操作和信息的共享,是本论文的研究初衷。 本文通过对数字档案馆基于o a i s 模型在系统框架建设、元数据体系构建的分 析,达到理论上丰富数字档案馆及其元数据建设理论;实践上,为o a i s 参考模型 在档案领域的应用提供了借鉴,为数字档案馆建设及元数据体系的构建提供一种 思路。 本课题国内外研究现状 国外进行数字资源长期保存研究与实践已有若干年,多是以项目形式开展的, 而且多是图书情报领域。各项目基本都是采用自定的元数据体系,如英国c e d a r s 。丁丽鸽,程大帅我国数字信息资源保存研究综述 j 四川图书馆学报,2 0 0 7 ,( 5 ) 1 - 黑龙江大学硕士学位论文 项目中的元数据体系、澳大利亚p a n - d o r a 项目的元数据体系、欧洲七国国家图书 馆和三家出版社合作的n e d l i b 项目的元数据体系、美国国会图书馆数字图书馆所 用的m e t s 元数据体系、新西兰的n e n z 元数据方案。这些项目都以o a i s 参考模型 为基础构建的。 我国图书馆、情报界对元数据标准进行了大量的研究。在o a i s 成为i s o 标准 后,基于o a i s 的元数据体系框架研究也给予了高度的关注。国家图书馆的中文 元数据方案及军队院校数字图书馆应用软件系统( m i l i t a r ya c a d e m yd i g i t a l l i b r a r ya p p l i c a t i o ns o f t w a r es y s t e m ,简称m d l s ) 也遵循了o a i s 参考模型。 但这些元数据标准项目均是以图书馆机构为研究、建设主体,虽然构建了多种资 源的中文元数据体系,但都基于d c 元数据为核心元数据集展开的。 在国外信息管理界及国内图情界掀起了o a i s 研究“热 的同时,o a i s 却没 有引起我国档案界的足够关注。在写本研究现状时,曾就中国期刊网关于o a i s 进行文献检索,以o a i s 为题名进行跨数据库检索,从1 9 9 4 年至今,只有2 0 篇文 章,其中档案领域发表的仅有7 篇;以o a i s 为关键词,其它条件相同,有3 0 篇, 档案界发表有1 1 篇。从时间上档案领域这些文章都是在2 0 0 7 年以后才发表的, 图书馆情报界在2 0 0 1 年就开始关注开放档案信息参考模型;从研究内容上看,大 部分是对o a i s 的介绍,或者是对模型与数字档案馆建设的设想,对于遵循此模型 构建数字档案馆元数据体系还无人深入涉及,而且更没触及实践操作层面。数字 档案馆,无论其定义如何,从其社会职能上讲,它无疑是数字信息长期保存的一 个主阵地,然而,我国近年来对数字档案馆的研究及讨论,主要集中在概念、功 能、特征、涉及技术、建设现状、简单对策等相关问题,对数字档案信息资源的 长久保存的问题涉及甚少,还没有专门针对数字档案文件长久保存的标准规范, 已有的某些规定还都局限在具体的保管环境和技术参数的选择上( 电子文件归档 与管理规范、档案管理软件功能要求暂行规定) 。2 0 0 8 年国家社会科学项目, 也把“基于o a i s 的电子文件长久保存研究”列入其中。 “从国际研究态势和我国实践现状出发,我国档案界应该而且必须研究o a i s 参考模型及其应用,这种迫切性和必要性随着参考模型成为长期保存的国际标准 绪论 得到加强。我国学者在全面介绍o a i s 参考模型的基础上,应当就该模型对数字档 案长久保存、电子文件真实性、完整性和可靠性、数字档案馆建设、档案资源与 其他资源的互操作与集成、数字时代传统档案理论发展等问题做全面、深刻的探 究。 研究方法、思路和创新点 研究方法: 1 系统分析法。本文利用系统分析法,在开放档案系统模型的基础上分析数 字档案馆功能与结构,在此基础上分析数字档案馆元数据体系构成,体系内各元 数据之间的关系及相互操作。 2 案例分析法。对国外有代表性的一些元数据构建项目进行分析,考察其构 建方法,借鉴其优势部分,为本文提供实践依据。 3 范例展示法。通过基于o a i s 的数字档案馆及元数据的构建,以实例进一 步展示。 研究思路: 论文思路以数字信息资源长期保存为目的,分析目前保存的各种影响要素, 指出元数据问题是其重要的影响方面,也是基础因素,这是第一章主要内容。而 档案领域要参与到数字资源长期保存中,从档案馆建设入手,引入o a i s 参考模型, 并以模型为参照,构建了一种数字档案馆框架,这是第二章的内容。在这一框架 基础上,以元数据构建为切入点,参照0 a i s 的信息模型,分析数字档案馆元数据 体系的构建。这是第三章的内容。最后,总结了本研究存在的不足及未来发展趋 势。 创新点: 1 构建一个基于o a i s 功能模型的数字档案馆框架; 2 参照中文元数据规范的设计,分析确定元数据方案的制定并以实例介 绍。 章燕华,徐海静o a i s 的一冷一与一热一我国档案界研究之理性反思 j 档案学研究,2 0 0 7 ,( 2 ) - 3 - 黑龙江大学硕士学位论文 第一章o a is 、元数据与数字信息资源长期保存 随着计算机技术、网络技术的发展,数字信息正以几何级增长速度成为各机 构重要的信息资源。由于数字信息在技术、管理和利用等方面的特殊性,如何实 现它们的长期保存与获取、利用,即数字信息长期保存成为迫切需要解决的问题。 第一节数字信息资源长期保存概述 数字信息资源的长期保存已经受到信息界的广泛关注,开展了一些保存项目, 从中我们总结相关影响因素及建设经验。数字信息由于自身特点及外部环境的变 化使得数字信息随时可能消失。因此,长期保存这些信息活动得以重视,技术策 略、管理策略纷纷提出,但无论是哪种策略,都不可回避的基础是对数字信息的 记录、保存、识别的元数据的创建与维护。 一、数字信息资源长期保存及其意义 随着科学技术的发展,信息资源的生成形式、传递方式、利用手段等都发生 了深刻的变革,信息数字化、服务网络化促使数字信息资源保存( d i g i t a l p r e s e v a t i o n ) 活动应运而生。国内外一些图书馆、高校、研究机构等都开展了不 同程度的探索性活动。 目前国际上对数字资源长期保存并没有一个公认一致的定义,通常的表述是: 为保证数字比特流可长期维护和其内容可长期获取及利用的必要活动,其功能是 保证人们可长期、方便、安全和可靠地获取和使用数字资源,包含长期存储、长 期可获取和长久真实完整三层含意。 现在我们正处在数字化网络化时代,数字资源已经成为人们获取信息的重要 载体,是人类共同的财富。但其自身特点及所依赖的网络和存储介质不隐定等因 素,致使数字信息资源的持续使用面临着严峻的挑战。数字信息资源保存意义重 大。因此数字资源长期保存是保护人类文化遗产,为社会持续稳定发展提供知识 保障,保证人们现在和将来安全、方便地使用各种数字信息。这一重要课题的解 4 第一章o a is 、元数据与数字信息资源长期保存 决,不但对数字图书馆、数字档案馆的发展极为重要,同时也是保存人类数字化 文化遗产的需要。因此,对数字信息资源保存问题进行研究具有重要的理论意义 和实践意义。 二、数字信息资源长期保存面临的问题及解决策略 数字信息资源长期保存面临着诸多方面的影响,针对这些方面的影响人们也 采取了一系列的措施,以保证数字资源的长期可利用。 ( 一) 面临的问题 1 。载体问题 数字信息资源一般依赖于一定的物理载体,常用的数字存储介质一般有磁带、 磁盘、光盘等,由于各种媒体材料的不同及其不稳定性,致使载体本身保存寿命 低于纸质载体; 2 技术问题 数字信息存储依赖于一定的计算机软、硬件的技术,计算机硬件或软件的更 新升级,信息存储格式的多样性和变化性容易造成原有的数字信息不能被新的硬 件设备和软件系统读出; 3 自身变化问题 数字信息不是一经形成就不再变化了,一般都会动态变化的,信息间又可相 互链接,致使信息的固化、版本确认、原源归属、真实性查考、内容组织等都面 临诸多难题; 4 管理问题 数字信息资源保存的知识产权法律、管理机制尚不完善,因此在数字资源生 命周期的每一个阶段中,都需要考虑到相应的管理、知识产权及相关的法律问题, 如权利许可、权利转移、内容转移与存储、备用服务以及相应的经济与管理问题 都有待解决。 ( 二) 解决策略分析 1 技术策略 黑龙江大学硕士学位论文 i 目前对于数字资源的保存在技术上有三种策略:一是对原硬件、软件和操作 系统进行仿真;二是定期把数字信息从上一代计算机迁移到下一代计算机上;三 是多重备份,在位于异地的多台机器上分别备份保存。不管是采用“仿真 还是 “迁移”策略,元数据都被用于记录迁移历史、文本信息被创建的环境信息以及 后人理解数字对象所应具备的技术环境等信息。 2 管理策略 数字信息的保存是一项复杂的系统工程,涉及方方面面的因素,需要解决政 策、法律、组织方面的问题,其中涉及的管理策略有:一是采用开放描述方式, 把数字资源的存储、描述、组织和传递采用第三方可获取的形式描述;二是技术 框架与整体解决方案,技术解决是数字信息资源长期保存的根本方法,但单纯依 靠技术不能解决数字资源长期保存的全部问题,从数字信息的选择( 内容的选择 和格式的选择) ,存储媒体的保护与选择原则,制定数字信息长期保存的标准等宏 观的管理角度考虑保存问题,可以说技术的方法的选择更趋于综合化,并根据资 源的不同选择不同的保存策略。 三、档案馆在数字信息资源长期保存中的作用 档案馆是保存人类真实记录的主阵地,在信息数字化、办公自动化浪潮的推 动下,大量的电子文件、数字化信息成为档案馆接收的主要内容及形式,而且可 以预见,在不远的将来,数字信息将是各档案馆的主要保存资源形式。因此,档 案馆将会是数字信息资源长期保存的主要机构。因此,档案馆对于如何保证信息 的长期可利用有着十分重要的作用。 第二节元数据与数字信息资源长期保存 元数据作为描述数字信息本身及其环境的数据,在数字信息长期保存中起着 重要的作用。 第一章o ais 、元数据与数字信息资源长期保存 一、元数据与保存元数据 ( 一) 元数据概述 当计算机网络普遍应用后,为了更有效的组织网络信息资源,起源于计算机 科学领域的元数据受到信息界的广泛关注。可以说,数字资源的出现和网络操作 平台的应用,催生了元数据。而作为一个概念,迄今为止,还没有一个统一的定 义。最常见的定义是:关于数据的数据。这里前一个“数据 是指各种资源,后 一个“数据 是指对资源进行描述的结构化数据。国际图书馆协会联盟( i f l a ) 认为,元数据是关于数据的数据,是可用于帮助网络电子资源的识别、描述和定 位的数据。虽然这个定义针对网络资源提出,但不可否认元数据来自数字信息世 界,它意味着元数据能够采用多种形式,以不同的级别存在,为了满足不同的目 的,可以通过多种方式生成。尽管元数据定义的表述有很多种,但定义各方都不 可否认以下几点: 1 元数据作为一个概念是新的,但就其所涵盖的事物而言并不是全新的,而 且元数据也不一定是数字形式的。图书馆的书目记录就是一种元数据。记录中的 题名、作者、出版商、主题等标识信息是最明显的元数据。档案领域中的文件形 成者( 文件来源) 、形成时间、载体形式等都是元数据的体现。 2 元数据不仅可以描述信息对象,能够帮助人们了解信息对象的背景环境、 管理过程、信息处理、保存利用等方面的情况。 3 元数据的生成可以是人为提供也可以由信息管理系统自动生成,并伴随着 所描述对象或生成系统的不断发展而变化。 上述元数据的认识,使得其在提高信息资源的检索效率、明确资源的原始情 境、促进信息资源的利用开发、保障资源所有者的正当权益和权限管理、维护信 息资源的长久保存和获取方面都有着不可替代的重要作用。 ( - - ) 数字信息长期保存的元数据 刘嘉元数据导论 m 北京:华艺出版社。2 0 0 2 一 黑龙江大学硕士学位论文 关于保存元数据,国内外学者给出了一些定义,下面表格列出了国内学者论 及保存元数据的文章: 表卜1 保存元数据相关文章 序 文献标题来源作者年期 号 数字信息保存元数据研究进展及 l 情报理论与实践 秦金聚2 0 0 7 2 启示 数字化储存长久保存与取用策略 2 情报控索周宇2 0 0 7 1 0 保存元数据 3 p r e m i s 保存元数据体系分析 现代图书情报技 高嵩,张智雄 2 0 0 6 4 术 一个基于o h i s 和d c 的保存兀数据 4 图书馆学刊王松林 2 0 0 5 i 方案 牛金芳,郑小 5清华大学图书馆保存元数据方案大学图书馆学报2 0 0 3 2 惠,曾婷等 6 论保存兀数据大学图书馆学报牛金芳,吴开华 2 0 0 2 2 7 数- 7 信恩长期保存的兀数据研冤情报学报盛小平 2 0 0 2 8 8 关于数字信息长期保存的元数据四j i图书馆学报梁娜,张晓林2 0 0 2 1 综合以上论文中作者提出的定义,不难发现,虽然关于定义的表述不同,但 都包含两点:( 1 ) 保存元数据是一种信息,这种信息有自身的结构;( 2 ) 保存元 数据的作用是描述数字资源保存特征。因此,我们采用在p r e m i s 保存元数据体 系分析中,作者提出的保存元数据的定义:“保存元数据是支持数字保存处理过 程的信息框架,是为了实现对数字对象进行长期保存、维持数字资源的长期可生 存能力( v i a b i l i t y ) 、可呈现能力( r e n d e r a b i l i t y ) 和可理解能力 ( u n d e r s t a n d a b i l i t y ) 所需的信息”。o ( - - ) 保存元数据在数字信息资源长期保存中的作用及意义 1 保存元数据在数字信息资源长期保存中的作用,可以分为微观及宏观两方 面。在微观方面,就如保存元数据定义中表述的那样,它的核心作用就是描述数 字资源长期保存特征。p r e m i s 认为,保存元数据应当支持和记录数字保存的处理 过程,它们应当具有以下主要功能 : ( 1 ) 创建来源记录及记录变化过程; o 高嵩,张智雄p r e m i s 保存元数据体系分析 j 现代图书情报技术,2 0 0 6 ,( 4 ) o 高嵩,张智雄p r y m i s 保存元数据体系分析 j 现代图书情报技术,2 0 0 6 ,( 4 ) 8 第一章o ais 、元数据与数字信恩资源长期保存 ( 2 ) 详细描述真实状态; ( 3 ) 记录数字对象经历的技术处理; ( 4 ) 对数字对象的技术细节进行描述; ( 5 ) 描述数字对象的起源环境; ( 6 ) 指定权限管理信息。 可以说,保存元数据从功能角度而言,已经渗透到了管理、技术等方面。而 这些功能,又为数字信息资源长期保存的实现提供了元数据方面的思考。 2 宏观方面,可以说是元数据对整个数字信息资源长期保存的意义,数字资 源的保存工作在同一个框架下开发保存系统和制订元数据格式,将能够促进不同 领域系统间的交流和资源的共享。 ( 1 ) 使数字资源的数字生成、方便利用、数字保存和长久获取这一完整的数 字信息生命周期得以实现,能加快数字资源取代纸质资源的主导地位进程。数字 资源的方便性与风险性同在,这给数字资源以数字形式长久保存带来困难,正如 2 0 0 0 年哈佛大学图书馆副馆长到清华大学图书馆访问时指出,电子资源虽有众多 优点,但是它的长期保存问题一天不解决,哈佛图书馆就一天不会大力收藏电子 资源,期刊仍然以纸质为主。可以说,数字形态资源的发展依赖保存元数据的发 展,保存元数据可以促进各种形式的数字资源得以在更广泛的空间发展。 ( 2 ) 对数字档案馆、数字图书馆等数字保存机构的建设、发展,地位的提升 都有着不可估量的作用。这一点与数字资源的广泛利用是相应的。 二、目前数字信息资源常用的元数据标准 元数据标准需要在元数据标准框架的规范指导下设计进行,它是描述某类资 源的具体对象时所有规则的集合。因资源类型不同而元数据标准也有所区别。但 每一实体对象在描述时都涉及到相应的数据项、数据项定义、置标著录规则和信 息系统的技术要求。 目前国外已经产生并在实际中应用或试验的元数据标准有二十余种。其中, 数字信息资源比较常用的元数据标准有以下七种: 黑龙江大学硕士学位论文 表1 2 数字信息资源常用元数据标准 适用的资料类型 目的 c d w a 艺术品对艺术品的分类编目 删 艺术、建筑、史前古器物、民间方便描述艺术类可视化资源 文化等艺术类可视化资源 g i l s政府的公用信息资源方便公众查找定位公用的信息资源 f g d c 地理空间信息为n s d i 制作、共享地理信息 d u b l i n 网络资源资源发现 c o f e e a d 档案和手稿资源,包括文本和电针对电子文本全文的编码标准 子文档、可视化材料和声音记录 t e l 对电子形式全文的编码和描述电子形式交换的文本编码标准 元数据标准实现的功能都包括对资源的描述、管理、定位和评估。但是由于 它们分别适用于不同类型的信息资源,其使用者和所针对的用户范围也有所不同, 因此在元素及数据项的设置上,个性化的特点就非常突出。 三、基于长期保存的档案元数据建设项目 永久保护真实的电子文件国际研究项目( i n t e r p a r e s ) 、英国分布式数字档案 原型系统( c e d a r s c u r le x e m p l a r si nd i g i t a la r c h i v e s ) 、美国国家电子文件 档案馆项目( e r a ) 、欧洲数字版本存缴和长期保护系统( n e d l i b ) 项目及我国制 定的电子文件元数据规范等都是在信息环境下,为电子文件、数字档案长期 保存所进行的,这些项目都与o a i s 参考模型有关。此外,还有澳大利亚网络文献 资源存取与保护( p a n d o r a ) 项目。下面简要的介绍一下这几个项目在元数据建设 方面的情况。 i n t e r p a r e s 项目的目标是利用档案领域的专业工具,总结并开发永久保存电 子文件必需的理论和方法,然后制定相关模型、政策及标准。其中的元数据模板 包括五方面:( 1 ) 载体元数据模块,包括载体的识别( 现行载体、归档载体) 、载 体特征( 类型、构成的物理材料、规格) 、载体为接收信息所作的准备、载体的存 取类型、载体的存贮密度与容量等;( 2 ) 文件类型的外部元素模块,指人类的习 惯用语、显现特征( 如文本、图形、图像、声音等特征) 、专门符号、印记( 如电 第一章o ais 、元数据与数字信息资源长期保存 子署名等) ;( 3 ) 文件类型的内部元素模块,指责任者、来源、日期、形成地点、 接收者、活动描述等;( 4 ) 标注元数据模块,指文件在流转过程中所作的各种附 注( 如接收情况、办理情况、归档情况等) ;( 5 ) 背景元数据模块,指涉及到的各 种环境信息,有管理、技术、法律等背景信息。 :“? 一_ 1 r ? 。_ r _ _ 。 : 一 ,; : 一i z 一+ +1 3 :、,f i 貅融据铲嚣外;产嚣吲锵季誓i 背? 黼i ; 部元素 爹部元素爹i一+ 搴!。 图1 - 1i n t e r p a r e s 项目的元数据模板 c e d a r s 项目主要目标是研究数字保存的问题,致力于确认数字信息收藏体系 长期保护的战略框架和具体方法,并在此基础上建立支持数字资源长期保存的元 数据。c e d a r s 元数据的框架主要包括两个方面:( 1 ) 保护描述信息( p r e s e r v a t i o n d e s c r i p t i o ni n f o r m a t i o n ) ,此信息含确认信息、环境信息、起源信息、固化信 息;( 2 ) 内容信息( c o n t e n ti n f o r m a t i o n ) ,此信息含表述和数据对象两部分。 如下图所示: 磐囊j 嘴镣扣 确认信 ( 资源标识符及元数据目录) 黟嘲襟擎擀潮 ! 数据怼塞圭亟至境的羞裂一 严”曩”:询砭臂慧墨? 4 ( 确认信息内容完整、可靠 信息) 童;鼍 “叠:。表述信息劳警j 驾 j 。( 存档资源的结构及语义) 黔辫骂露溺罗掣 ( 保存原始数字资源的比特 图1 - 2c e d a r s 的元数据框架图 e r a 项目主要是为了解决以电子形式日益增长的政府文件的保管问题,建设 者们希望通过这个电子文件档案馆的建立,“能够无限期地保存任何类型的电子文 黑龙江大学硕士学位论文 件,使其不受生成格式的制约,用户也能够在目前和未来使用的计算机系统上阅 读到这些文件。 e r a 项目中,在其实体分类、功能设定、数据流和管理行为等方面都依赖o a i s 参考模型提供的整体框架,在元数据的设计方面也是基于o a i s 参考模型进行的。 n e d l i b 项目定义了一种基于o a i s 模式的数字版本存缴和保护系统( d e p o s i t s y s t e mf o r e l e c t r o n i cp u b l i c i o n s ,d s e p ) ,它与o a i s 标准模型不同的是,在o a i s 基础上加了一个保护模块( p r e s e r v a t i o n ) 。保护模块针对原有应用系统不能使用 的情况,对所存储的数据流进行保护。该项目共定义了八组元素来描述数据对象 及其保护要求。如下图所示: 本j 作! 称;本:称 l 。i 霉l 。 1 图卜3n e d l i b 的元数据框架 字; 签i 名。 中文元数据方案采用了0 a i s 参考模型为总体框架结构,参考了美国国会图书 馆( 简称l c ) 、澳大利亚国家图书馆( 简称n l a ) 、c e d a r s 项目、d u b l i nc o r e ( 简称 d c ) 、n e d l i b 项目等较为成熟的元数据集。在保证总体框架结构的前提下,保持 和d c 项目的对应关系,方便现有元数据得以有效利用。中文元数据方案的总体框 架如下图所示:圆 李音美国将创建电子文件档案馆 j 中国档案,2 0 0 0 ( 7 ) :5 0 圆肖珑,赵亮中文元数据概论与实例 m 北京图书馆出舨社,2 0 0 7 ( 4 ) :1 1 1 2 仪验和。 p:t“k懿轻轻艟强船曩 z = 珊一资源定位符一;,。oi 僻识符 一1n私#ll# 兰版者 一;:。”t*h口n_-e 耕作日期 w,;o;,o。o 俅题 。 v:illl 作者, 协:,_;。8。-tl 腰本。 称 。;:十&go#o*口i墨 本称 o,of3*5r&rw-g 曝设备要求 :,;尊t2&u8 媒体要求 纂爱。 第一章0 a is 、元数据与数字信息资源长期保存 图卜4 中文元数据方案的总体框架 通过上述元数据项目的分析,我们发现现有项目中,在数字资源长期保存元 数据格式方面都有着一些共同特点,如下图所示: 图卜5 数字资源长期保存元数据格式 这里,有一个o a i s 参考模型出现,下一节我们详细介绍。 o 宛玲数字资源长期保存的管理机制 m 北京:北京图书馆出版社,2 0 0 6 型 黑龙江大学硕士学位论文 第三节o a i s 参考模型概述 一、o a i s 的含义 o a i s ( r e f e r e n c em o d e lf o ra no p e na r c h i v a li n f o r m a t i o ns y s t e m ,开放档案信 息系统) 参考模型是由空间数据系统咨询委员会( c c s d s ) 制定的标准,2 0 0 3 年参考模型最终作为i s o 的标准( i s 0 1 4 7 2 1 :2 0 0 3 ) 颁发,其主要目的是为具有 数字信息长期保存和利用责任的档案机构和非档案机构提供数字信息长期保存和 利用的基本概念、术语、基本信息模型、功能模型和指南;可以说o a i s 是一个 由人和系统组成的,承担信息长期保存并将信息提供给目标团体( d e s i g n a t e d c o m m u n i t y ) 责任的存档机构。 二、o a i s 参考模型的目标 提供概念框架 首先是为保存处理机构为长期保存处理数字信息方面所需理解的存档概念提 供了一个框架;其次是为非存档机构有效参与保存工作提供所需的概念框架; 提供功能框架 为数字信息保存机构提供数字信息保存所涉及的功能框架; 提供信息模型 为所描述的特定信息资源提供信息概念,为表达信息在系统中传递、流转而 提供相应内容; 提供扩展基础 为其它长期保存的非数字形式信息扩展提供一个基础。 三、模型的适用范围 o a i s 参考模型没有定义任何实施上述概念的特殊方法,也不假设或局限于任 何特定软硬件环境、系统与数据库设计范例、系统与数据库管理系统开发方法、 数据定义与命令语言、系统与用户界面、实现技术、所需载体等,也即一切都是 第一章o a is 、元数据与数字信息资源长期保存 开放的,平台、规范、技术和环境。具体设计、实施的机构以o a i s 参考模型为指 导,从其提供的服务及内容方面进行参考。因此,在设计数字资源长期保存系统 时需要根据资源类型、需求等对参考模型中的功能进行选择和重新组合。 四、构架o a i s 的任务 接收信息,与信息生产者协商并接收其提供的适当信息; 控制信息,能够拥有对信息的足够控制以实现长期保存的目标; 可理解性,确定存档信息的目标团体并能保证它们能够理解这些信息; 独立性,保证被保存的信息在需要时不依赖于信息生产者的帮助可独立识别; 备灾保存,保证信息能够在所有可能的意外情况出现时被保存,并保证信 息的完整性、真实性、原始性; 获取信息,要确保用户能够获取被保存的信息。 五、o a i s 的角色( 参与者) o a i s 的参与者是指与o a i s 系统交互的实体( 如下图所示) ,包括: 信息形成者( p r o d u c e r ) :可以是个人、机构或信息系统,他们提供需要保 存的信息; 管理者( m a n a g e m e n t ) :是制定o a i s 总体政策的实体,并处理日常的档案 管理活动( 具体的档案管理活动由a d m i n i s t r a t i o n 模块来实现) ; 信息用户( c o n s u m e r ) :利用o a i s 所保存信息的实体,可以是信息的形成 者、目标对象或其他个人。 信息形成者 p r o d u c e r 信息用户 c o n s u m e r 管理者 m a n a g e m e n t 图1 6o a i s 的角色模型 ” 。一 黑龙江大学硕士学位论文“ 本章小结 本章通过对数字信息资源长期保存现状的分析,指出元数据尤其是保存元数 据是解决数字资源长久保存的重要基础,也分析了档案馆及元数据在保存活动中 的重要性。通过分析元数据建设的国际项目,引入元数据设计及o a i s 参考模型, 并对其进行了简单介绍。进而为后面章节详细分析o a i s 参考模型及数字档案馆的 建设打好基础。 第二章基于o a i s 功能模型的数字档案馆系统框架 第二章基于0 a ls 功能模型的数字档案馆系统框架 第一节o a ls 参考模型 o a i s 参考模型具体由功能模型、信息模型和信息包在各功能模块之间的转换 三部分构成。有学者曾用一幢建筑物和里边的货物来比喻该模型:建筑物内不同 的房间储存不同的货物,货物也可在房间之间流动,货物进入建筑物时需要包装、 分配在不同的房间,需要时再按一定的规则标准提取。下面详细介绍一下各个组 成部分。 一、功能模型 o a i s 参考模型共包含六大功能模块,如下图所示: - 一_ - _ 。一一一一一一一一一一4 一一一一一- 一一。一一一。一一一一一一一一一一一一一一一一- - - 。- - - - - - _ 一一一一一一一一 一一 图2 - 10 a i s 参考模型 。章燕华,刘霞o a i s 参考模型一数字资源长期保存的概念框架 j 浙江档案,2 0 0 7 ,( 3 ) 黑龙江大学硕士学位论文 1 接收功能( i n g e s t ,又叫摄取功能) 接收功能模块从信息形成者处收集或接收按照一定格式规范组织的存交信息 包( s u b m i s s i o ni n f o r m a t i o np a c k a g e ,s i p ) ,接收功能不单纯接收,还要检验,对 检验合乎提交规范要求的信息建立相应元数据( 不合格的要修复或反工) ,将合格 的存交信息包和元数据交给数据管理模块( d a t am a n a g e m e n t ) ,经过数据管理模 块处理,就转换为按照长期保护规定格式组织、包含专门的长期保护处理元数据 的存储信息包( a r c h i v a li n f o r m a t i o np a c k a g e ,a i p ) ,然后交给档案存储模块进行 保存,到此,信息系统就完成了信息的接收功能。 2 数据管理功能( d a t am a n a g e m e n t ) 模型的第二个功能模块是“数据管理 ,它的功能主要是存储关于数字信息单 元的元数据和关于长期保护处理政策、程序、技术和系统的元数据,并提供对这 些数据的基础检索与管理。 3 档案存储功能( a r c h i v a ls t o r a g e ,有些也翻译成“长期存储”) “实际存储按a i p 要求组织的数字信息,负责数据更新、技术仿真或数据迁移, 负责建立具体存储与存取系统,并在检索传递模块要求时将a i p 提供给该模块。 在技术仿真和数据迁移过程中,可能形成新的数字内容单元,可能需要与接收模 块协作重新建立有关元数据并送交数据管理模块。囝 4 检索传递功能( a c c e s s ) 将通过“接收 、“数据管理 、“数据存储 处理和形成的数字信息( a i p ) 转换为适合用户利用的传递信息包( d i s s e m i n a t i o ni n f o r m a t i o np a c k a g e ,d i p ) ,并 提供用户检索元数据和索取数字信息单元的界面和相应的检索服务机制,同时还 可涉及到身份认证和授权管理等功能。 5 保存规划功能( p r e s e r v a t i o np l a n n i n g ) “监控o a i s 环境,并为保证在技术过时等环境下o a i s 系统仍长期可用而提供 建议的服务和功能模块。具体包括评估存档内容和定期建议存档信息迁移、就存 档机构标准和政策提出建议、监控技术发展及用户服务需求和知识储备的变化、 o 张晓林元数据研究与应用【m 北京:北京图书馆出版社,2 0 0 2 一1 8 第二章基于o a is 功能模型的数字档案馆系统框架 制定具体的迁移计划、软件原型、测试计划以保证管理迁移日标的实施等。棚 6 系统管理功能( a d m i n i s t r a t i o n ) 通过有关政策、规范、程序、工作流等来监测和控制整个长期保存系统的运 行和各个模块的运行。 综上所述,可以看出0 a i s 参考模型除具有一般信息系统功能外,还在数字信 息长期保存上有针对的设计了相应功能,如下表所示 : 表2 - 10 a i s 的功能 o a i s 的功能 一般功能针对保存的功能 接收 管理( 包括各种政策) 数据管理 档案存储 存取 保存计划 公共服务 二、信息模型 一、i j ,西1 天三e 开放档案信息系统( o a i s ) 模型认为:完善的数字保存系统必须确保被保存 的信息对于目标团体而言是独立可理解的,也就是说,应当确保目标团体在没有 信息生产者( 专家) 帮助的情况下,仍能够独立地理解被保存的信息。为了实现 这一目标,在保存系统中既要保存存档对象,也要保存对象的描述和说明信息, 为此,0 a i s 提出了“信息模型”的概念,用以描述数字保存系统中存在的各类信 息,规范数字保存系统中的信息类型和信息包组成。 提到信息模型,我们有必要先明确几个概念及其关系。 1 数据对象( d a t ao b j e c t ) ,可以定义为可以交换的任何知识,而这种知识 总可以用一定的数据形式来传达。例如,一张照片,我们说它只是一个数据对象, 如果不加任何说明性的文字或数据,这张照片所传达的信息就不易被人理解,因 此,共同理解的文字说明是这种信息的一种数据表达形式。图书也一样,所用的 书写语言,需要有知道这种语言规则的人们才能理解。 。张晓林元数据研究与应用 m 北京:北京图书馆出版社,2 0 0 2 o 冯湘君浅析0 a i s 与数字档案馆元数据建设 j 山西档案,2 0 0 7 ,( 2 ) 国宋显彪数字信息的长期保存 d b i ) i i 大学硕士学位论文,2 0 0 5 ,( 4 ) 一 黑龙江大学硕士学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 塔里木大学《汉唐研究》2023-2024学年第二学期期末试卷
- 上海科学技术职业学院《血液学检验技术》2023-2024学年第一学期期末试卷
- 彩钢顶翻新施工方案
- 2025至2031年中国木材横切用锯片行业投资前景及策略咨询研究报告
- 天津天狮学院《医学的法律边界》2023-2024学年第二学期期末试卷
- 2025年私人住宅租赁合同标准范本
- 混凝土回收改造施工方案
- 2025办公室租赁合同(商业大厦)
- 排水井清掏施工方案
- 2025年餐饮加盟合同模板
- 项目进度管理与监控的工作计划
- 中国慢性冠脉综合征患者诊断及管理指南2024版解读
- 2025广西柳钢集团招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2025年河南测绘职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 人工智能与教育融合-深度研究
- 工装治具流程图
- 2025-2030年中国抗哮喘市场现状调研及投资发展潜力分析报告
- 2024年河南艺术职业学院高职单招职业适应性测试历年参考题库含答案解析
- 贝壳好赞服务协议书
- 养老院敬老院福利医养机构消防知识培训科普讲座教学课件
- 2024中国互联网养车市场发展报告
评论
0/150
提交评论