(教育技术学专业论文)信息资源标准化及应用研究.pdf_第1页
(教育技术学专业论文)信息资源标准化及应用研究.pdf_第2页
(教育技术学专业论文)信息资源标准化及应用研究.pdf_第3页
(教育技术学专业论文)信息资源标准化及应用研究.pdf_第4页
(教育技术学专业论文)信息资源标准化及应用研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

磺士擘位论文 m a s 疆t e r st h e s i s 中文摘要 伴随i n t e m e t 及信息技术的发展,近几年各高校图书馆纷纷根据本校的学科优 势,引进数字资源,开发特色资源系统和数据库,使其图书馆信息资源建设初具规 模。然而在数字化进程中,各种重复开发、重复投入现象严重,造成文献信息冗余。 形成这种状况的原因很多,其中一个重要的因素就是信息资源标准化的问题。从信 息资源建设实践来看,主要体现在元数据标准、编目相关标准难以适应发展需要。 针对上述情况,论文从图书馆角度,对元数据标准、信息资源描述标准以及图 书编目标准的优势及不足进行了全面分析,提出相关解决策略。然后,对相关标准 的实际应用进行了重点研究。论文主要内容包括: 第一部分介绍了研究背景及意义、研究现状及存在问题以及本文的研究内容与 组织结构; 第二部分研究了元数据标准、编目相关标准、信息资源描述标准的分类,揭示 了这些标准的关系,创制了信息建设相关标准关系图; 第三部分研究了元数据、元数据相关标准及信息资源描述标准的特性、存在问 题及解决策略,重点研究了q 啦m a r c 的沮,描述,实现了c n m a r c 向沮。的 批量转换; 第四部分研究了著录、标引标准及检索标准的特性、存在问题及解决策略,重 点研究了c a l i s 成员馆著录原则及汇文系统相关应用,并结合湖北工业大学工作实 践,建立了汇文系统编目模型: 第五部分,开发了基于c n m a r c 帆检索系统,实现c n m a r a m 几数据的 检索和利用,改进了传统m 触屺检索工作流程; 第六部分,对全文进行总结,并对今后工作做出展望。 论文主要工作: ( 1 ) 研究了信息资源建设相关标准的关系,创制了信息资源建设相关标准关 系图; ( 2 ) 研究了c 讧a r c 的儿描述,完成了c n m a r c 向儿的批量转换; ( 3 ) 研究了c a l i s 成员馆著录原则及汇文系统,建立了汇文系统编目模型: ( 4 ) 开发了基于c n m a r c 沮。检索系统,实现c 套n 讧a r c 叼 l 数据的检索 和利用,改进了传统眦c 检索工作流程。 关键词:信息资源;标准化;元数据标准;m a r c ;d c ;儿; 磺士擘位谴丈 m a s t e r gt h e 8 i s : a b s t r a c t w i mt h ed e v e l o p m e n to fn l ei n 胁a l i o nt 幽0 1 0 踽a l lo ft h eu n i v e r s i 妙n b 谢e s i n 的d l l c ed i 西t a lr e s o u r c e sa n dd e v e l o pc h a r a c t e r i s t i cr e s o u r c e ss y s t e m sa n dd 枷b a s e sb y t h ea d v 强t a g eo ft h es l l b j e c t si nm e s ey e a r s t h ec o 趣沲强g t i 0 i 毽o f 也ei n f o m a t i o n r e s 伽鹏e so f m el i b 耐c sh a v eb e g u i it os h a p e b u ti nm ep r o c e s so f r 豁o u r c e sd i 蕾垃z 撕0 n , l er e p e a t so f 廿1 ed e v e l o p m e n t 锄dm ec o n s t n l c t i o n sa r ev d ys 萌o u s o n ei m p o r t a n t f a c t o ri st l l es t a n d a i l d i z a t i o no fd i 西t a lr e s o l l 】呛e s f r o mt h ec o n 曲n l c t i o n so fi n l 0 n n a t i o n r e s o u r c e s ,i tm a i l 姆r e n e c t e di nm a tm em e t a d a :t as 砌a r d s ,c 删o g u i n gs 伽出m i sa r e d i 伍c u l tt oa d a :p tt h en e e do f 廿l ed e v e l o p m e n t f 如m 也ep e r s p e c t i v eo f 曲捌睇t h i sp a p e rc 伽 1 p r e h e i l s i v e l y 姐a 1 ) ,z e dm ea d v 锄t a g e 觚dm e1 a c ko fm e t a d a t as t a n d a r d s ,也es t a n d a r d so fi i l f o m a t i o nr e s o u e sd e s c r i p d o n a l l db o o l 【c a t a l o g u es t a n d 御d s ,g a 、他r e l e w m ts o 】u t i o n st oa d d r c s s 也ea :b ) v es i t i l a 矗o n a n d m e n ,i tf o c u s e d0 na p p l i c a t i o no ft h er c l e v 觚ts t a l l d a 冒d s t h em a i l lc o m e n to f 也i sp a p e r i n c l u d e st l l ef o n 咖ga s p e c t s h li a r tl ,i ti n 加d l l c e dt t l er e s e a r c hb a c 咖u n d s i g 面丘c a r l c e r e s c 毒瞒hs t a 乇l s , p b l e m s ,廿1 ec o n t e n ta n dt 1 1 eo r g a l l i z a :t i o n a ls t m c 眦 h lp a n2 ,i tr e s e a r c | h e dt 1 1 ec 1 雒s i f i c a t i o n so fn l em 就a d a t as t a n d a m s ,c a t a l o g u i n g s t 删sa n d也es t 锄d a r d so fi n 】 曲n a t i o nr c s o l e sd e s 嘶p t i o n ,r e v e 2 l l c dt h e r e l a t i o l l s l l i po ft h e s es t a n d a r 司l sa n dc r e a t e dm er e l a t i 0 1 1 sp l a no ft 1 1 er e l e v a n ts t 胁d a “i so f t h ec o n s 缸1 l c t i o n so fi i d b n n a d o nr c s o u r c e s h lp a r t3 ,i tr e s e 诎e dt 1 1 ec h a r a c 毫e d s t i c s ,p 唾曲l e m s 缸l ds o l u t i o n 鲍阿t e 酉e so ft h e m e t a 妇毛m e t a d a t as t a n d 莉sa i i dm es t a 】瞄a r d so fi 芏l f o 珊a t i o nr e s 伽r c c sd 咖t i o n i t 矗) c u s e do nm ed e s c r i p t i o no fa 卟i 舢5 诵t l l 讯,a n dc o m p l e t c dt 1 1 eba t i 出c 伽e r s i o n 舶mc n m a r ct ox m l hp a r t4 ,i tr e s e 缸c h e dm ec h 姗c t e r i s t i c so ft h er e c o r d ,i n d i e x i n ga n d 删删 s t 髓出幽曲,r r e a l e dt 1 1 ep i r o l b l 锄sa n dg a v es o l u t i o ns 位a t e 百e s nf 0 c u s e do n 也ep 血c i p l e s o ft h ec a l i sm e 玎曲e 巧o fh b r a r i 豁a n dt h eh u i w 醯s y s t e mo fb o o bm 粕a g e m 髓:t c o m b i l l e dw i m 血ep r a c t i c eo f 也eh 妣iu 幽e r s _ 时o ft e c h n o l 0 鼢i tc o m p l e 丽a c a t a l o 星面gs y s t 锄m o d e lb a s e do n 也eh u i w e ns y s t e m i l lp a r t5 ,i tc r e a t e d 他r e t r i c v a ls y s t e mb a s e do nc n m a r c 咀r e a l i z e dt 1 1 e r e t r i e v a l 狮dt h el l s eo fc 卜m a r c 订ld a t a 狐di m p m v e dt 1 舱仃a d m o n a lm a r c 硕士学位论文 i 正a s t e r 8 t h e 窖瑙 僦e y a lw o r k n o 、 l i i lp a n 6 ,i ts 啪a r i z e dt l l e 如l lt e x ta n dp s p e c t e dm e w o r k t h em a i l lr e s e a r c ho ft l l i sp a p e ri n c l u d e st h ef 0 u 例泊唱a s p e c t s ( 1 ) i tr e s e a r c h e dt h er e l a t i o n s h i po ft l l er e l e v a n ts t a n d a r d so ft 1 1 ec o n s t m c t i o n so f i n 两珏【l a t i o nr e s o l l r c e sa n dc r e a t e d 也er e l a t i o n sp l a no f 廿l er e l e v 疵舳d a r i b ( 2 ) i tr e s e a r c h e dt h ed e s 嘶p t i o no f q o 眦c 研m 皿a n d c o n l p l e t e dt h eb a t c h 咀v e r s i o n 丘o mc n a i a r ct 0x m 巴 ( 3 ) nr e s e a r c h e dt h ep 血1 c i p l e so f 廿l ec a l i sm e i n b e 璐o fl i b r a r i e s 觚dn l eh l l i w 醯 s y s t e mo fb o o k sm a n a g e m e n ta n dc o i n p l e t e dac 砌o g i n gs y 砒e mn 1 0 d e lb a s e do n 也e h u i w 妇s y s t e m ( 4 ) i tc r e a t e dt l l er e t r i e v a ls y s t e mb a s e do n 删a r c x m 匪,r e a l i z e dt h er 酏叵e v a l 趾dm eu s eo fq 心乱墩c 沮。d 犯la n di n l p r 0 v e d 廿1 e 衄u d i t i 伽mm 6 眦r c t r i e v a l w r o r 幺f l o 砒 k e yw o r d s :m f 0 1 搬a t i o nr e s o u r c e s ;s t 觚蛐a t i o n ;m 晚妇as t a n d a r d ;m 6 d 托; d c ;龇; 硕士孝往论文 m a s t e r st h e s i s , 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名:勿冰社 日期:7 砀年月7 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权 中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通 过网络向社会公众提供信息服务。 作者签名:李哆钞江 日期:炒驴6 月3 日 导师签名:吾i 徽 1 日期:2 乱艿年石月妒日 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c 舡j s 高校学位论文全文数据库中全文发布,并可按“章程 中的 规定享受相关权益。同意论文提交后滞后:口半年;口一年;口二年发布。 作者签名:瘁动够仁 日期:甜6 肜日 导师签名:主t 1 瘸鼋 日期:加年6 月舻日 顼士擘位论文 m a s 口e r s ,r h e s i s 1 1 研究背景与意义 1 引言 伴随n e m e t 及信息技术的发展,近几年各高校图书馆纷纷根据本校的学科优 势,引进数字资源,开发特色资源系统和数据库,使其图书馆信息资源建设初具规 模。但是,从信息资源建设实践来看,元数据标准、编目相关标准难以适应发展需 要,主要体现在以下方面: ( 1 ) 元数据标准方面:现有的撇c 标准无法解决出现的新问题,如随书资 料的处理问题,有必要对现有标准加以扩展;同时,c 格式众多,不同类型的 m a r c 数据相关字段定义并不完全相同,给m a r c 数据跨系统、跨平台的共享和 交流造成了极大障碍。 ( 2 ) 编目相关标准方面:从世界范围来看,编目规则的统一是大势所趋,国 际编目原则的最终目标是要在世界范围内建立一套统一的编目体系。但是,国内图 书馆界在编目上分为五大系统:全国联合编目中心、c s 、中科院系统、社科院 系统和上海图书馆系统,这五大系统的编目规则都不尽相同,给图书馆数据的交流、 传输与利用带来了一定的障碍。 目前,世界各国对图书馆信息建设的重视,使电子图书数字信息资源的数量、 种类和类型迅速增加,成为网络的主流信息。对于信息资源的共享、挖掘、控制、 组织和检索,也成为网络界和图书情报领域关注和努力解决的问题,必须建立一套 基于数字信息和网络服务的标准,在保证相当检索、精度与准确的前提下,方便快 速地建立对浩如烟海的数字信息的描述。 1 2 研究现状及存在问题 ( 1 ) 元数据与信息资源描述标准 传统的m a r c 在交流和共享方面存在缺陷,难以适应信息资源发展的需要; 同时,新的元数据标准、数据描述标准( 如d c 、x m l 、耐) f 等) 不断涌现,对 m 1 6 眦形成较大的冲击。但是,实践已经证明:在短时间内,一方面无法统一和全 面修订m a r c ;另一方面新出现的标准,无论是d c 、酒l 还是r d f ,都无法取 代m c 。 硕士学位论文 m a s 玎e 琏st h e 囱蔑 在这种情况下,近年来关于m a r c 元数据互操作的研究很多,主要集中在元 数据格式的映射、数字对象方式,建立标准的资源描述框架三种方案上。由于元数 据的映射不可能完全对应,转换中会使一些数据丢失,应用效率明显受到限制:数 字对象方式研究进展尚不明晰,在我国的应用尚需时日。而眦c 作为一种成熟 的元数据标准,有其独特的优势,尤其在信息资源描述方面的详尽性是其它元数据 标准无法比拟的。因此,保持m 触屺的固有优势,建立标准的资源描述框架方案 可行性更强。 目前,在图书馆界和信息界,采用基于讧l 来实现m 触屺元数据的互操作是 使用较多的方案。m a r c 2 1 和i j n 蹦a r c 的小描述的研究在国外已基本形成标 准,但这些新标准均不支持q 吼队r c 。因此,对于c 压a r c 的儿描述的研究 具有很强的现实意义。 ( 2 ) 图书编目标准 面对分布、异构、变化和开放的数字信息资源与服务环境,建立统一的标准与 规范描述体系,按照统一的原则、框架和基本方式,规定应遵循的各个层次的标准 与规范,从而支持在整个数字信息环境中有效使用、广泛获取和长期保存信息。但 是,国内存在着众多的编目体系,最具代表性的是全国联合编目中心与c n l i s 联合 编目中心。前者是公共图书馆的代表,后者是高校图书馆的代表,这两大系统几乎 覆盖了全国绝大多数公共馆和近5 0 的高校馆。两大系统存在较大的分歧,一方面 不利于图书馆数据的交流与传输,另一方面还给广大用户在使用图书馆上带来了一 定的障碍。 因此,与国际大趋势相合,建立一套统一的编目体系,已经到了刻不容缓的地 步。 1 3 研究内容与组织结构 本论文拟从图书馆角度,对元数据标准、信息资源描述标准以及图书编目标准 的优势及不足进行全面分析,提出解决策略。以相关标准的实际应用为研究重点, 从以下四个方面开展工作: ( 1 ) 研究信息建设相关标准的关系,创制信息建设相关标准关系图; ( 2 ) 研究q m 的讧l 描述,完成c n m a r c 向帆的批量转换; ( 3 ) 研究c - s 成员馆著录原则及汇文系统,建立汇文系统编目模型; ( 4 ) 开发基于c 1 呵m a r c 沮。检索系统,实现q o 心l 数据的检索和 利用,改进传统m a r c 检索工作流程。 2 项毒学位论文 m a s 玎e 窿s t h e 8 r s 本文组织结构如下: 1 引言,介绍研究的背景和意义、研究现状及存在问题以及研究内容与组织结 构; 2 信息资源相关标准,研究元数据标准、编目相关标准、信息资源描述标准 的分类,揭示这些标准的关系,创制信息建设相关标准关系图; 3 元数据相关标准及应用研究,研究元数据、元数据相关标准及信息资源描 述标准的特性、存在问题及解决策略,重点研究删a r c 的咀,描述,实现了 咖a r c 向讧l 的批量转换; 4 图书编目相关标准及应用研究,研究著录、标引标准及检索标准的特性、 存在问题及解决策略,重点研究c a l i s 成员馆著录原则及汇文系统相关应用,并结 合湖北工业大学工作实践,建立汇文系统编目模型; 5 基于q 崾m a r 诬i ,数据的检索系统的设计与实现,开发基于q 呱蔓a r c 汪l 检索系统,实现c 卜m l a r c 沮。数据的检索和利用,改进传统m 触犯检索工作流 程; 6 总结,对全文进行总结,并对今后工作做出展望。 3 疆士学位论文 a 跗e 盛st h e s r 基 2 信息资源相关标准 长期以来,信息资源建设方面形成了多种标准,供图书馆、出版商、各数据提 供商等多家单位共同遵循。其中,与信息资源关系最密切的包括元数据标准、图书 编目相关标准、数据描述标准等。 2 1 元数据相关标准 元数据( m e t a d a t a ) 即数据的数据( 鼢u c t 嘶甜d a :t aa b o u td a t a ) ,是用来描述数 字化信息资源并确保这些数字化信息资源能够被计算机自动辨析、分解、提取和分 析归纳的一种框架或一套编码体系。【1 】作为描述数字图书馆信息资源的数据,元数 据是所有数字信息资源建设项目的重要基础,需要规定描述数字信息资源在具体范 围内规定实际应用的标准与规范。 迄今为止,围绕着h n 也和沮。的信息环境,在不同的领域中有多种元数据 标准格式。其中,与图书馆信息资源建设方面最相关的有以下两种: ( 1 ) 最早普遍使用的元数据标准:m 触配; ( 2 ) 描述和管理大量网络信息资源的元数据标准:都柏林核心集; 2 1 1 机读目录标准 即m 触犯( m a c h i l l er ea d a _ b l ec a t a l o g u e ) ,是图书馆自动化系统之间传输和交 换机读目录数据时共同遵循和使用的标准记录格式。它规定了书目数据在机读介质 上的表示和标识方法,是图书馆信息资源建设所依据的主要标准,也是各馆进行计 算机编目的主要依据。制定m 触5 配标准的目的是为了实现书目数据的规范,充分 开发和利用文献资源,从而促进书目信息交流与共享。 m a r c 格式众多,很多国家都有自己的m 6 眦格式,但这些m _ 眦格式基本 上是由u s m a r c 、i 删a r c 、m 设c 2 l 发展而来。 目前,我国中文图书机读目录标准一般采用q 蝴a r c ,西文图书机读目录标 准则采用u s m a r c 、i 酣蹦a r c 、m 6 戚2 1 三种格式。现对这四种m a r c 格式分 别加以描述: ( 1 ) u s m 魄r c 即美国机读目录标准,又称l c m m 屺,产生于美国国会图书馆。作为一种计 算机技术发展早期形成的数据格式,这一格式在定义时比较充分地照顾到图书馆书 4 疆士学位论文 h “蝴l r s1 l n 翅疑 目数据在文献形式描述、内容描述、检索等方面的需要。 随着信息资源数字化、网络化的发展,l c 和o c l c 多次对u s m a r c 进行修 改,使其可用于网络信息资源的编目,为著录和标引网络资源提供了依据。比如: 1 ) 扩大网络信息的涵盖范围。原来u s m 蛾c 对网络资源的涵盖范围小,只包 括电脑文件和软件等,现已扩大到电子资源资料、联机系统与服务资源等; 2 ) 增加了8 5 6 字段,用以实现从书目信息到文献本身全部信息的检索。该字 段记载了被链接的电子资源的主机地址、电子资源名等具有检索、获取意义的信息, 建立了从书目记录向全文、多媒体电子资源的链接。 ( 2 ) i 殓删a r c 即国际机读目录标准,由国际图联( 吼,a ) 推出,是许多国家m a r c 标准产 生的基础。 1 9 7 1 年8 月,疆a 开始设计一种通用m a r c 格式,以实现各国机读目录数据 共享。1 9 7 3 年,国标标准化组织( i s o ) 将这种m a r c 格式结构作为国际标准 ( i s 0 2 7 0 9 一1 9 7 3 ) 正式颁布。为了使各国m 触汇之间能够对应,i s o 于同年制订了 磁带上文献目录信息交换格式( i s o2 7 0 9 ) ,要求所有的m a r c 格式都必须符合 i s 0 2 7 0 9 标准。为了防止失控和方便国际交换,国际图联1 9 7 7 年研制出“u i l i v e r s a l m a r cf o m a t ,简称i 删a r c 。 各国m 触蛇格式的发展促使i 肘m a r c 的持续发展。首先,i 肘a r c 被视 作一种交换格式,各国可以根据自身的需要分别编制翻译软件,实现i 烈聊a r c 格 式与本国m a r c 格式之间的自由转换,从而引进和输出书目数据。此外,有些还 没有形成m a r c 格式的国家和地区可以直接采用i 删a r c 作为标准。 ( 3 ) k 酗r c 2 l m 触屺2 l 是以机读形式表示和传输书目记录和相关信息的标准,是由一系列的 代码和内容指示符组成,其目的是为了定义五种类型的数据:书目数据、馆藏数据、 规范数据、分类数据和社会信息。它由美国国会图书馆与加拿大国家图书馆联合编 写,是一个将u s m a r c 和c a n m a r c 相融合的格式。 m 触屺2 1 共有五种执行格式,即:m 触屺2 1 书目数据格式、m a r c 2 1 馆藏数据 格式、m a r c 2 1 规范数据格式、m 舭k 2 1 分类数据格式和m a r c 2 1 社会信息格式。 m 虹蛇2 1 的书目数据格式是对编码描述、检索和控制不同形式信息资源的数据元素 进行详细说明;馆藏数据格式对如何编码各种形式信息资源的馆藏数据与位置数据 进行详细说明;规范数据格式对如何编制用于识别书目记录中的内容并保持其唯一 性和一致性的规范记录予以了说明,目的是通过编制规范记录实现对书目记录的控 硕士学位论文 m a s t e 曩8 下h e s 璐, 制:分类数据格式用于编码分类号、相关说明等数据元素,按分类数据格式建立的 分类记录可被用于维护和发展类表:社会信息格式则是用于说明如何建立与事件、 项目、服务等相关的非书目信息记录,这些信息可整合到公共查询目录中供用户查 询。 ( 4 ) c n :m 眦 1 9 8 6 年,我国开始参照i 腻m a r c 编写中国的m 舢屺格式。1 9 9 2 年,北京图 书馆自动化发展部编写的中国机读目录通讯格式( c h i n a 撇cf 0 彻a t ,简称 心黝匕螂) 问世。1 9 9 6 年2 月6 日,中华人民共和国文化行业标准中国机读目 录格式( c 缸n am 舭犯f o 珊a t ) 正式发布,1 9 9 6 年7 月1 日起实施。该标准制定 目的是推进书目数据的规范与统一、加速我国文献信息网络的建设以及实现国内外 书目信息的共建共享。 2 0 0 4 年,北京图书馆出版社出版了国家图书馆编的新版中国机读目录格式使 用手册( n e 、vc h i n a 燃f o m a tm 卸u a l ) 。2 0 0 5 年7 月,在新版中国机读目 录格式使用手册基础上修订而成的中国机读目录格式( c h i l l am a r cf o m a t ) 国家标准通过专家评审,并已上报全国信息与文献工作标准化技术委员会和国家标 准化管理委员会。 中国机读目录格式国家标准虽然依据i 烈a r c 编写,但是根据我国信息 资源的发展和用户需求情况,增加和删减了一些字段和附录,在编排格式和体例结 构上也更遵循我国国家标准的编写习惯。 2 1 。2 都柏林核心集 即d u b l i nc o r e ,简称d c ,是一项描述信息资源的国际标准,为网上资源的辨 识、检索而制定的一种著录格式。 1 9 9 5 年3 月1 日至3 日,第一届元数据研讨会在美国俄亥俄州的都柏林镇 ( d u b l i n ) 召开,d u b l 证c 0 r e 因此而得名。这届研讨会最主要的成果是设定了一个 用于揭示网络资源类文件对象的最小元数据元素集,即都柏林核心元数据元素集, 简称d c 。它由1 3 个元素组成,分别是:s u b j e c t ( 主题) 、t i u e ( 题名) 、au t b o r ( 作 者) 、p u b l i s h e r ( 出版者) 、0 1 1 l c r a g 咖( 相关责任者) 、d a t e ( 出版日期) 、o b j c c t 聊e ( 对象类型) 、f o 肋a t ( 格式) 、i d 训丘e r ( 标识符) 、r e l a t i o n ( 关联) 、s o u r c e ( 来 源) 、协g i l a g e ( 语种) 、c 0 v e r a g e ( 覆盖范围) 。这1 3 个元素在以后的d c 发展中 从名称到内容都有了很大的变化。 随着d c 影响范围的不断扩大,在由i o i n 和o c l c 在英国的w 幽访c k ( 沃 6 硕士学位强文 m a s 贯e 盛8 啦8 璐 维克) 召开的第二届元数据研讨会( 1 9 9 6 年4 月1 日至3 日) 上,与会者就当时网 络资源揭示中需要不同元数据来描述不同资源的现实情况提出了沃维克框架 ( w a 谢c kf r 锄e 、7 l r o 出) ,它是为了适应各种不同类型元数据包的容器结构的概念模 式。这个框架和m e t ac 0 n t 即t ( m c f ) 框架,成为资源描述框架r d f 发展的核心。 另外,在原来1 3 个元素的基础上新增两个元素:d e s c 却t i 锄( 说明) 和硒g h t s ( 权 限) 。1 5 个元素的形成标志着都柏林核心集发展的结束和应用阶段的开始。 2 2 图书编目相关标准 2 2 1 文献著录、标引标准 ( 1 ) 文献著录标准 国际图联所编制的国际标准书目著录( i s b d ) ,使得不同国家编目数据的互 换及著录项目的识别成为可能,也为手工的目录数据转换为机读数据奠定了基础。 依据i s b d ,我国于1 9 9 6 年1 0 月出版了中国文献编目规则,为我国文献编目工 作提供了标准,构建了由著录法和标目法组成的编目工作系统。著录法规定客观描 述文献特征的著录原理与方法,是实现各类型文献书目记录标准化的依据;标目法 则提供了关于检索点的规范原则与技术,是实现各种书目检索与规范控制的依据。 ( 2 ) 文献标引标准 文献标引,即把文献的内容和某些具有检索意义的特征用检索标识记录下来的 文献处理过程称为标引,包括分类标引和主题标引。分类标引,即利用某种分类法 及其使用规则,按照文献内容及某些外表特征,赋予文献分类号,以便将文献款目 或文献实体排列成与分类法的分类体系一致的系统的过程;主题标引则是以主题词 作为检索标识的标引。 文献标引标准历来最难统一,各图书馆在长期实践中形成了本馆的标引依据的 适用本。针对这种情况,中国情报文献标准化技术委员会开展了一系列标准化活动, 如:推荐中国图书馆分类法和汉语主题词表作为候选的国家标准分类法和 叙词表,目前l :中国图书馆分类法虽未转为正式标准,但全国大多数的图书情报 机构都在使用它,实际上占有国家标准分类法的地位;制订汉语叙词表编制规则、 多语种叙词表编制规则、文献主题标引规则、档案分类标引规则等并以国 家标准的形式正式公布,文献分类标引规则、同类书排列书次号编制规则等 也作为标准草案提出。 7 额士单位论文 m a 5 日l 窿s ,r h e 甜 2 2 2 信息资源检索标准一z 3 9 5 0 标准 图书馆主要采用m 触屺格式交换书目数据。但是,m 触地格式仅仅用于图书 馆系统问数据交换,眦c 格式不能取代系统的内部格式。这些异构系统要想在网 络环境下实现互联,必须采用z 3 9 5 0 协议。 z 3 9 5 0 ( 信息检索应用服务定义和协议规范,h l f 0 1 1 i l a t i o nr e t r i c v a la p p l i c a t i o n s e 耐c ed e f i l l i t i o n 锄n dp r o t o c o ls p e c i 丘c 撕0 n ) ,是由美国图书馆界1 9 8 8 年开始设计的 计算机数据库网络互联通讯协议,用于支持网络环境下的分布式数据库查询,让使 用者以相同的接口与使用方式,查询不同主机、不同系统的数据库。z 3 9 5 0 第3 版 已于1 9 9 6 年被i s o 正式确定为信息检索的国际标准( i s 0 2 3 9 5 0 一1 9 9 6 ) 。 z 3 9 5 0 是开放系统互连参考模型( o s h u m ) 的应用层协议,论及面向连接的、 程序间的通讯问题,它使得用户在一台计算机( c l i e m ) 上检索存储在另一台计算机 ( s e f v e r ) 中的信息,而不必关心这些信息是如何存储和组织的。目前,它已经被 广泛的被图书馆界作为一种访问分布式数据库的方法。 2 3 信息资源描述标准一。标准 沮。标准( e x t e 搬i b l em 砌【u pl 釉g i l a g c ,可扩展标识语言标准) ,它是国际标 准s g m l ( s t a l l d a r dg e r a lm 碰( u pl 趾g i l a g e ,标准通用标记语言) 的一个子集, 是从s g m l 发展而来的一种新的标记语言,它的标准定义于1 9 9 8 年2 月由w 3 c 批准通过。 沮。的目标不在于给w 曲页面增加趣味性,而在于它想通过一种方法对文档 和数据进行结构化处理,用结构化的办法处理去认为难以处理的非结构化的信息, 从而使其能在部门、客户和供应商之间进交换。订l 通过d t i ( d 0 c u m e n t 聊e d e 缸i t i o n ,文档类型定义) 、x s l ( e x t e n s i b l es t y l el 趾g u a g e ,可扩展的样式语言) 和i l ( e x t 黜i b l ei ,i n k i n gl 觚g t l a g e ,可扩展的链接语言) 等方式实现了数据的内 容与形式分离,从而为基于w 如的各种应用提供了一个描述数据和交换数据的有效 手段。 2 4 信息资源建设相关标准的关系 元数据标准是信息资源建设标准的基础,是形成各种元数据的依据;图书编目 标准是制作、编辑、利用m p 衄数据流的工具;m 触犯数据流必须依据m 6 眦元 数据标准,并通过z 3 9 5 0 标准进行共享和交流。这些标准的具体关系见图2 1 。 8 硬士孝住论定 m a s t e r st h e 8 i 毪 2 5 本章小结 图2 1 信息资源建设相关标准的关系 ,本章对元数据标准、图书编目相关标准以及帆标准进行了简要描述。首先, 介绍了这些标准的分类:元数据标准主要包括m 触屺和d c ,而m a r c 在我国的 应用主要包括u s m p 浓c 、m a r c 2 l 、1 7 n 刀a r c 以及i 肘刀a r c 等四种形式;图 书编目相关标准包括著录、标引标准与z 3 9 5 0 标准,标引标准包括分类标引标准和 主题标引标准等。其次,揭示了这些标准的相互关系。 9 顼士学位论文 m a s 【t e 展st h e 8 墙, 元数据相关标准及应用研究 随着信息资源数字化的发展,虽然传统的m c 在交流和共享方面存在缺陷, d c 、帆、r d f 等新的标准不断涌现,但是,实践已经证明,新的标准难以取代 m a r c 。因此,保持m 越屺的固有优势,利用新技术解决其不足可行性更强。 3 1 元数据及信息资源描述标准特性比较研究 3 1 1 元数据相关标准特性 元数据最本质、最抽象的定义为:d a t a a b o u t d a t a ( 关于数据的数据) ,它是一 种广泛存在的现象,在许多领域有其具体的定义和应用。 在图书馆和信息界,一般从两个角度来定义元数据:一是强调结构化,元数据 是提供关于信息资源或数据的一种结构化数据,是对信息资源的结构化的描述;二 是突出其功能,元数据是用来规定数字化信息组织的一种数据结构标准,描述信息 资源或数据对象,其目的在于使用户能够发现资源、识别资源、评价资源,对相关 的信息资源进行选择、定位和调用,追踪资源在使用过程中的变化,从而实现信息 资源的整合、有效管理和长期保存。 ( 1 ) 元数据特征 作为描述数字图书馆信息资源的数据,具有以下特征: 1 ) 元数据是一种编码体系,是根据某种标准对文献中的词及其他元素进行编 码,从而揭示、描述文献的基本元素的集合; 2 ) 元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系; 3 ) 元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框 架。所谓机器可理解,就是指利用元数据体系,使得计算机系统可以自动辨析、分 解、提取和分析归纳数字化信息资源的基本特征。 ( 2 ) 元数据应用目的 1 ) 确认和检索( d i s c o v e 巧锄di d e n t i 丘c 撕o n ) ,主要解决如何帮助人们检索和确 认所需要的资源,数据元素往往限于作者、标题、主题、位置等信息,d u b l i nc o 阳 是其典型代表; 2 ) 著录描述( c a t a l o 西n g ) ,用于对数据单元进行详细、全面的著录描述,数据 元素包括内容、载体、位置与获取方式、制作与利用方法、相关数据单元方面等, 数据元素数量往往较多。m _ 6 则、g i l s 和f g d c c s d g m 是这类元数据的典型代 l o 硕士学位论文 m a s ;t t e 醢8t h e 8 i 釜 表; 3 ) 资源管理( r e s o u r c ea d m i l l i s 仃a t i o n ) ,支持资源的存储和使用管理,数据元 素除比较全面的著录描述信息外,还往往包括权利管理( 砒出s i 啊v a c y m a n a g e m e n t ) 、电子签名( d i 百t a ls i 印a n ) 、资源评鉴( s e a lo f a p p r o y a l r a t i l l j g ) 、 使用管理( a c c e s sm a i l a g e h 燃l t ) 、支付审计( p a y m e n ta n da c c o 岫t i n g ) 等方面的信 息; 4 ) 资源保护与长期保存( p r e s e a t i o na n da r c h i v 堍) ,支持对资源进行长期保 存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、 保护条件、转换方式( m i 酣i o nm e t h o d s ) 、保存责任等内容。 3 1 2m a r c 相关特性 作为最早形成的元数据格式,在定义时比较充分地照顾到图书馆书目数据在文 献形式描述、内容描述、检索等方面的需要,在图书馆信息资源建设中发挥了巨大 的作用。虽然随着信息资源数字化的发展,m a r c 在交流和共享方面存在不少缺陷, 但在现阶段,m 6 眦依然是应用最多、最广泛的元数据格式。 ( 1 ) m 触的2 7 0 9 结构 按照i s 0 2 7 0 9 标准规定,每条m _ 虹记录均由记录头标区、地址目次区、数 据字段区和一个记录分隔符组成。 记录结构: 记录头标区:2 4 个字符长,由定长数据元素构成,包含记录处理所需数据; 地址目次区:由若干个目次项和一个字段分隔符组成,每个目次项由3 个数字 的字段号、4 个数字的字段长度和5 个数字的起始字符位置构成。每个目次项共占 1 2 个字符位。 地址目次区结构: 溉稳糖堍 数据字段区:由若干个固定长和可变长字段组成,字段之间由字段分隔符隔开, 是著录资料信息的具体内容。除0 0 1 和0 0 5 无指示符和子字子段标识外,其余字段 都具有如下结构: 疆士举位论史 m a s t e 瓢st h e s i s : 霸豢糍灞潞毒黉豸融字赛鬟 分隔符:包括字段分隔符和记录分隔符。 ( 2 ) m a r c 的优点 m a r c 定义很详细,字段数定义了上千条,有效地促进了图书馆编目工作的规 范性。它充分考虑到图书馆书目数据在文献形式描述、内容描述、检索等方面的需 要,表现为:字段数量多;著录详尽;可检索字段多;定长与不定长字段结合,灵 活实用;保留主要款目及传统编目的特点;扩充修改功能强;并能在实践中不断发 展完善。m 触的最大优势就是宇段、子字段采用数字、字母定义,没有语言障碍 和文化障碍。 3 1 3d c 相关特性 d c 元数据充分吸纳了图书情报界的分类、编目、文摘等经验,在利用计算机、 网络的自动搜索、标引、索引、检索等研究成果的基础上发展起来的。它是描述、 支持、发现、管理和检索网络资源的信息组织方式,其最大特点是元素是结构化的、 有层次的,支持字段检索,提供对特定资源足够全面的描述信息,使用户不用真正 链接到检索资源本身就能对资源有全面的了解。 d c 整个元素都是可扩展的,每个元素具有可重复性和选择性。虽然d c 允许 自定义元素的存在,但是为了顾及信息交流和交换的需要,使用上仍以基本的1 5 个元素为基础,然后利用新的修饰词来定义新的要求。 ( 1 ) d c 的结构 在第五届都柏林元数据研讨会上,s t i i a r tw c i b e l 和舳ah 1 l 【a l 将1 5 个d c 元素 依据其所描述内容的类别和范围分为3 组元素和标识如表3 1 所示: 表3 1d c 元素集 内容描述知识产权外形描述 题名( t i t l e )创建者( c r e a t o r )日期( d a t e ) 主题( s u q e c t ) 出版者( p u b l i s h e r )类型( 聊e ) 说明( d e s c r i p t i o n )其他责任者( c o n t r i b u t o r )格式( f o m a t ) 来源( s o u r c e )权限( 斑曲t s )标识( i d e n t i f i e r ) 语种( l a n g u a g e ) 关联( r e l a t i o n ) 覆盖范围( c 0 v e r a g e ) 1 2 顼毒学柱论文 m a s 口腿st 娩8 琏, ( 2 ) d c 元素的含义 d c 的1 5 个元素依据其所描述内容的类型和范围分为三组: 1 ) 对资源内容的描述:包括标题、主题、描述、来源、语言、关系和层次; 2 ) 对知识产权的描述:包括创建者、出版者、其他责任者( 含投稿者)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论