《信息组织与信息构建》第五章 数字信息资源的微观组织_第1页
《信息组织与信息构建》第五章 数字信息资源的微观组织_第2页
《信息组织与信息构建》第五章 数字信息资源的微观组织_第3页
《信息组织与信息构建》第五章 数字信息资源的微观组织_第4页
《信息组织与信息构建》第五章 数字信息资源的微观组织_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息组织与信息构建第五章数字信息资源的微观组织目录contents第一节第二节第三节数字信息资源组织概述数字信息资源编码标准元数据及其描述标准学习目标了解数字信息资源的特点;掌握数字信息资源组织的编码标准及其应用规则;掌握不同元数据标准的功能及应用规则;理解并认识数字信息资源几种常用的组织方式及其优劣势。第一节数字信息资源组织概述第一节二、数字信息资源的组织一、数字信息资源的概念、类型和特点数字信息资源组织概述

(一)数字信息资源的概念数字信息资源是用户可通过计算机本地或远程读取、使用,以数字形式存储在光、磁载体上的图像、文字、声音、视频等信息,如电子邮件、专题讨论小组和论坛、电子布告板新闻、电子期刊等。一、数字信息资源的概念、类型和特点

(二)数字信息资源的类型和特点数字信息资源的品种类型很多,按不同的标准可分成不同的类别:(1)按数字信息资源的分布来分类主要有两大部分,即现实资源和虚拟资源。所谓现实资源是指存放于图书馆的数字化文献,有光盘、磁盘、磁带等各种载体形态;虚拟资源又称网络资源或联机资源,它是指通过图书馆的计算机系统及通信网络才能获取的数字化文献。(2)按数字信息资源加工制作者来分类,可分为出版机构出版的电子出版物、图书信息机构制作的数据库、网络公司及社会各团体制作的数据库等。一、数字信息资源的概念、类型和特点

(二)数字信息资源的类型和特点(3)按用户存取的方式分类,可分为:第一,检索型:这是用户利用数字图书馆的主要方式,通过题名、著者、主题词、关键词、分类号等途径进行检索,先索取书目、索引、文摘等,进而取得原文,此外还可通过搜索引擎进行检索,找到有关网址,获取有关资料。第二,邮件型:图书馆根据用户的需求采用电子邮件的方式进行信息传递。第三,揭示板型:这是以非特定的大多数网络用户为对象的、非即时的信息传递方式,如网络新闻等。第四,广播型:这是在网络上向特定的使用者即时提供图像和声音的传递方式。第五,电话型:这是指以某些特定的个人和群体为对象即时传递信息的方式,如用户进行的网上咨询等。一、数字信息资源的概念、类型和特点

(二)数字信息资源的类型和特点(4)按信息交流方式分类,可分为:第一,非正式信息,如电子邮件、专题讨论小组和论坛、电子会议、电子布告板新闻等。第二,半正式出版物,如从各种学术团体和教育机构、企业和商业部门、国际组织和政府机构的网站上所能查到的“灰色”信息。第三,正式出版物,通过互联网,用户可以查询到各种数据库、联机杂志和电子杂志、电子版工具书、报纸、专利信息等。一、数字信息资源的概念、类型和特点

(一)数字信息组织的要求随着数字信息资源的种类日益增多,数据库成分日益复杂化,全文信息的比重也在逐渐增大,过去主要适用于文本信息的信息组织方法已不再使用。这些非结构化信息,不像书目信息那样格式化、规范化,如何提示和描述其内容特征,以及如何实现非文本信息数据库规模生产和低成本化等,都对传统的组织方式提出了挑战。二、数字信息资源的组织1.数字信息组织的动态性、多模式要求

(一)数字信息组织的要求传统的信息组织方式大多是以人工方式进行的,其中著录、标引以及分类表、主题词表的编制和维护等都是烦琐的手工劳动。而今网上大量的全文本信息、多媒体信息等时效性信息不允许出现过多的中间和加工环节,因此要求实现信息组织的自动化,如自动分类,自动标引,自动编制分类表、主题词表,以及目录、索引、文摘编制和管理自动化等。2.数字信息组织的自动化要求二、数字信息资源的组织

(一)数字信息组织的要求在网络环境下,用户成分逐渐多样化、复杂化,不同年龄、层次的人都可以通过计算机终端直接利用网络信息资源。由于多数用户缺乏计算机数据处理知识和必要的信息检索技能,所以要求信息组织方式简便易行,能应对复杂多变的用户环境,满足普通用户的检索需要,实现较高的网络利用率。3.数字信息组织的透明化、易用性要求二、数字信息资源的组织

(一)数字信息组织的要求首先,数字信息在内容上没有一个统一的体系和结构,更新周期不一,信息质量得不到保证,冗余信息泛滥,网上资源庞杂和真伪并存。其次,网络的互动性、离散性表现在数字信息资源上就是有序化程度低。虽然目前互联网已有许多卓有成效的搜索引擎(如Yahoo、Google等),但由于网络信息易编辑,缺乏质量控制等多种因素,造成信息精确度不高。所有这些都需要通过数字信息组织的精确性来解决。4.数字信息组织的精确性要求二、数字信息资源的组织

(一)数字信息组织的要求互联网是一个多网络、无主管的分散型互联结构,网上信息资源是一种混乱无序的分布状态。信息网络是对数字信息资料进行存储、加工和利用的协作系统,系统间的交流与网络资源充分利用要求各方面的整体配合,因此网络化的前提条件就是在数字信息组织与加工等方面采用一系列标准,实现数据格式、描述语言和标引语言的标准化等。5.数字信息组织的标准化、兼容性要求二、数字信息资源的组织

(二)数字信息资源组织的目标为满足上述数字信息资源组织的要求,我们必须建立一个全新的信息组织框架,以实现以下数字信息组织的目标。(1)能根据语义、应用和结构的需要对任何数字信息资源的内容(包括数据、文件、规则、过程、体制)进行定义、标记、描述、识别、验证和解释。(2)能运用逻辑、语义、语法或结构方法对这些信息内容进行指向、确认、检索和传递。(3)能运用逻辑、语义、语法或结构方法对这些信息内容及其集合进行过滤、拾取、链接、合并、集成或重组。(4)能按照语义关系、知识体系、应用需要或用户对象,对信息内容的组织格式和表现形式进行定义、标记、识别和转换。二、数字信息资源的组织

(二)数字信息资源组织的目标(5)能以计算机可识别、解析和理解的方式实现前面四种功能,支持智能代理对信息内容及其交流处理过程的自动处理。(6)能在多语种分布式开放环境中实现前面四种功能。(7)能根据用户的具体需要和应用环境,调整前面四种功能及其实现方式,能根据新的媒体形式、文献形式、技术能力和系统形态调整和发展上述能力及其实现方式,能以方便、经济和灵活的方式实现上述能力及其调整。二、数字信息资源的组织第二节二、常用的记录编码标准一、替代记录与编码数字信息资源编码标准一、替代记录与编码所谓替代记录是指描述信息的元数据记录,即能在任何信息检索系统中代表信息包裹的记录。替代记录通过指定标签、数字、字母或文字完成编码以揭示一条一条的信息。替代记录编码的用途在于:第一,它能提供一个访问替代记录所代替的内容的方法。第二,它能按要求显示记录。第三,它允许在同一文件中查找和显示多种语言和字体。第四,它能够方便传递数据。替代记录是早期信息组织的产物。当前,由于硬件存储容量和运算能力的改善,电子全文文献的输入和输出的问题得到了解决,有人认为,资源的数字化形式既已存在,就可舍弃替代物而以资源本身作为资源发现的基础。对此,林奇(Lynch)、米切尔森(Michelson)等人提出以下四点作为反驳:(1)替代记录通常比藏品本身小很多,在寻找资源的过程中更容易处理;(2)就知识产权而言,信息提供者可能更愿意提供替代物,而非直接提供藏品本身;(3)目前的技术仍然无法做到以非文本对象作为搜寻或自动选取的基础;(4)替代物可提供不存在于藏品本身的信息(如主题、物理描述等)。由此可见,即使在当下,替代记录仍有其存在的必要性。一、替代记录与编码(一)MARC(机读目录)(二)

SGML(标准通用标记语言)(三)

HTML(超文本标记语言)与XML(可扩展标记语言)(四)

DTD(文献类型定义)二、常用的记录编码标准

(一)MARC(机读目录)A可变格式可变长字段的记录格式:这种格式兼容性强,伸缩性大,字段的设置可多可少。每个字段采用可变长的记录格式,更适合书目信息处理的特点。此外,有些字段本身是固定长的,则采用固定长字段的记录格式。B采用目次方式:这是可变长字段存取的标识符——值编组的格式。这种格式可节省大量的计算机进行数据值比较的时间,提高处理速度。另外,它可方便字段顺序的改变和字段内容的修改。MARC(machine-readablecataloging,机读目录)起源于美国。1965年1月提出“标准机器可读目录记录款式的建议”,即MARCI格式,

MARC记录的总体结构特点如下:

(一)MARC(机读目录)C每条MARC记录分三个区:头标区、目次区和数据区。数据区又由控制区和可变区组成,所以有时也称为四个区。D物理记录和逻辑记录的关系:MARC格式采用固定长字段不定形式的记录数据的方式。每个物理记录的长度是4096个字节。因此,经常在一个字段中存放多个MARC记录,或一个MARC记录分存于两个或两个以上字段中。但是,不管一个MARC记录有多长,都仅有一个头标区和目次区。MARC211几种主要的MARC格式UNIMARC格式2CNMARC格式3(一)MARC(机读目录)

1MARC212000年,美加两国通过协商就MARC的格式达成一致,产生了二者共同遵循的MARC格式——MARC21。MARC21并不是一个新的格式,而是为适应各类型文献记录在不同系统间的交换以及实现格式一体化的需要而产生的。它由美国国会图书馆与加拿大国家图书馆联合编写,而且是一个将USMARC和CANMARC相融合的MARC格式。MARC21是以机读形式表示和传输书目记录和相关信息的标准,是由一系列的代码和内容指示符组成的,其目的是为了定义五种类型的数据:书目数据格式、馆藏数据格式、规范数据格式、分类数据格式和社会信息格式。(一)MARC(机读目录)

1MARC21MARC21书目数据格式(bibliographicformat)——对编码描述、检索和控制不同形式信息资源的数据元素进行详细说明。MARC21馆藏数据格式(holdingformat)——对如何编码各种形式信息资源的馆藏数据与位置数据进行详细说明。MARC21规范数据格式(authorityformat)——对如何编制用于识别书目记录中的内容并保持其唯一性和一致性的规范记录予以说明,目的是通过编制规范记录实现对书目记录的控制。MARC21分类数据格式(classificationdataformat)——用于编码分类号、相关说明等数据元素,按分类数据格式建立的分类记录可被用于维护和发展类表。MARC21社会信息格式(communityinformationformat)——用于说明如何建立与事件、项目、服务等相关的非书目信息记录,这些信息可整合到公共查询目录中供用户查询。(一)MARC(机读目录)

2UNIMARC格式UNIMARC是“国际机读目录通信格式”的简称,是由国际图书馆协会联合会制定的一种供国际交换用的机读目录数据交换格式。这一格式将内容标识符标准化,克服了各国使用本国MARC系统的标识符的专指性,且减少了手工目录的痕迹。各国的书目机构将本国MARC格式的书目记录转换为UNIMARC格式,供其他国家使用,实现国际数据交换,而各国国内的书目记录格式仍可保留各自国家的MARC格式。因此许多国家都使用UNIMARC格式作为国际机读书目记录交换的格式,如欧盟已经接受UNIMARC作为联盟内所有国家采用的MARC标准以实现书目记录的统一和共享。(一)MARC(机读目录)

3CNMARC格式中国机读目录(WH/T0503-96)通常称为CNMARC。它是由国家书目机构编制、中华人民共和国文化部于1996年发布的文化行业标准,主要用于中国国内图书情报部门和其他国家书目机构间的书目信息交换。CNMARC格式是以UNIMARC为依据的,凡是UNIMARC中定义的字段适合于中国出版物的有关规定都予以保留,并补充了中国出版物特有的而UNIMARC中没有的字段定义。CNMARC的结构原理与USMARC格式相同,每一条MARC记录都由头标区、目次区、数据区、可变区四个部分组成,每一个可变字段包括若干子字段。CNMARC的数据字段被划分为若干功能块,字段标识符的第一位数字标识字段的功能。(一)MARC(机读目录)

3CNMARC格式记录头标区:CNMARC格式的头标区和USMARC格式相同,是按照国际标准ISO2709—1981的规定,固定为24个字符长,由定长数据元素构成,包含记录处理所需数据,为记录提供某些基本参数。它含有ISO2709定义的关于记录结构的数据和为ISO2709的特定形式而定义的几项数据元素。这些数据元素有:记录类型、目录级别、在层级中的位置、记录完整程度以及是完全采用或部分采用ISBD(国际标准著录)规则。地址目次区:CNMARC格式规定,在记录头标区之后为地址目次区。目次区的每个款目包含三部分:三位数字表示的字段号、四位数字表示的数据字段长度和五位数字表示的字段起始字符位置。除此之外,不允许有其他字符。通过目次区可以查找MARC记录中某一特定字段的起始字符位置,一般供系统分析员排除该记录的故障时使用,编目员或用户并不直接使用目次区的数据。(一)MARC(机读目录)

3CNMARC格式数据字段区(可变长字段区):由若干定长和变长字段构成,每个字段之间由字段分隔符隔开。除001和005字段无指示符和子字段标识符外,其余字段都具有如下结构(见图5—1)。图5—1字段结构每个字段(00—字段除外)均由两个指示符以及随其后的任意数目的子字段组成。每个子字段的开头为一个子字段标识符,即一位子字段分隔符和一位标识该子字段的子字段代码。每条记录的长度,限定最大为99999个字符,也可以由交换双方协商确定。(一)MARC(机读目录)指1指2$a数据……字段分隔符

SGML是用于文献标记的国际标准,符合国际标准ISO8879—1986。它是一套设计标记语言的规则,描述文献的结构,以便于文献能够跨越计算机平台被交换,利用实体(事物、对象)、元素和属性(性质)的形式定义数据。SGML规定由分隔符(delimiter)和标识符(tag)组成的标记。分隔符为固定的符号(如<、>、/),用于组织标识符(如<author>就是一个标识符)。标识符通常出现在元素的前后,形式为:<标识符>元素</标识符>。比如:<author>EdwardGaynow</author>SGML采用…或‘…’为属性值划定界限,比如:<quotelang=‘spa’>Quepasa</quote>标识符可以实现层层嵌套,以下为一套取自TEI的嵌套的标识符:FileDesc><titleStmt><title>…<title></author></titleStmt><publicationStmt>…</publicationStmt>(/fileDesc>(二)SGML(标准通用标记语言)

HTML(hypertextmarkuplanguage)是超文本标记语言,简单易学,通过标记来定义文档内容以什么样的形式显现,只描述信息的显示方式而未对信息内容本身进行描述,标记的集合是固定的,用户不能增加对自己有意义的标记。

XML(extensiblemarkuplanguage)是SGML的一个分支。由于HTML过于简单,应用起来难以达到满意的效果,为弥补HTML的不足,人们开始开发XML以解决上述问题。XML是SGML的一个子集,继承了SGML80%的功能,降低了20%的复杂程度,使开发变得经济,因而有更好的互操作性。XML与HTML的不同在于:XML可自由定义标记来表现文档内容,突破了HTML固定标记集合的约束,使信息内容表现得以完整;XML的不足在于通用性和安全性能比HTML差一些。(三)HTML(超文本标记语言)与XML(可扩展标记语言)

文献类型定义(documenttypedefinition,DTD)是SGML的一种应用。它是遵从下列在SGML标准中可以找到的标记规则而形成的。DTD定义了文件特殊类型的结构,它规定:(1)所有可能成为特殊文件类型部分的单元;(2)单元名称以及它们是否可重复;(3)排列单元的顺序;(4)单元的内容(以通常的方式,而非特殊方式);(5)可被省略的标记类型;(6)标识符属性及其默认值;(7)可被允许的实体的名称。

(四)DTD(文献类型定义)第三节三、内容描述标准——DC一、元数据元数据及其描述标准二、RDF——元数据的“容器”四、专业领域的元数据方案

简单的元数据定义是“dataaboutdata”,即有关数据的数据,这是人们普遍认同的一个定义,也是具有最广泛外延的一个定义。然而,由于不同的专业领域所针对的对象不同,人们对元数据的描述也是有区别的。在地理界,元数据是由表示数据特性的信息组成,用于为数据产品提供文献;在数据仓库中,元数据的概念是指关于数据的数据,用以描述数据仓库的数据和环境;政府信息领域则认为元数据是构成政府信息定位服务(governmentinformationlocatorservice,GILS)体系分布式信息资源的目录,用来描述信息资源的内容、位置、服务方式、存取方法等。尽管不同专业领域对元数据的定义各有不同,但其本质是一样的,即元数据是一种有效的信息资源组织和管理的工具,是一种编码体系,它可以帮助人们检索和确认所需要的信息资源,可以对数据单元进行详细、全面的著录描述,可以支持信息资源的存储和使用管理,支持对信息资源进行长期保存。

一、元数据(一)元数据的内涵1.依据结构性、完整性以及专业性元数据分类2.根据用户类型元数据分类3.根据所支持的功能元数据分类第一,直接采用原始资料的资源描述格式,一般性的网络资源查寻工具属此类。第二,使用结构化资料,可支持字段查询,如都柏林核心元素集。第三,使用完整的资源描述架构,用来记录文件或描述一组对象,以及它们彼此间的相互关系,例如编码标准EAD等。可以分为技术元数据和商业元数据。技术元数据被提供给数据仓库的技术人员,供其在数据仓库的开发和维护中使用;商业元数据是商业用户在数据仓库中寻找他们所需商业信息的一个辅助。可分为有助于发现和确定资源的描述性元数据(descriptivemetadata)、支持资源管理信息的管理性元数据(administrativemetadata)和将一个复杂或复合资源各部分结合到一起并且使整体可用的结构性元数据(structuralmetadata)。一、元数据(二)元数据的种类元数据的种类繁多,依据不同的标准可以将元数据分为不同的种类。

元数据的特点具体如下。(1)描述性:按一种约定俗成的规则来描述对象,以组织和管理信息资源。(2)动态性:元数据能随着所描述对象的变化而变化。(3)多样性:指元数据的类型多样。(4)复杂性:元数据既可以是集合概念,也可以是个体概念,元数据中还可以包括其他的元数据;对不同的描述对象,元数据项是可选的,即强制性的元数据与选择性的元数据共存。(5)多层次性:这是由于元数据所描述对象是多层次的以及元数据使用对象的多层次性决定的。(6)支撑性:元数据对于维护所描述对象的原始性、完整性和长期使用性是必不可少的,具有支撑作用。一、元数据(三)元数据的特点

RDF(resourcedescriptionframework)是W3C于1999年颁布的一个互联网建议。它的功能是利用当前存在着的多种元数据标准来描述各种网络资源,形成人机可读,并可以由计算机自动处理的文件。RDF的目标是建立一个供多种元数据标准共存的框架。在这个框架中,能够充分利用各种元数据的优势,并能够进行基于Web的数据交换和再利用。因此,RDF可以看做一个元数据的“容器”,其关键是框架结构。RDF框架由RDFDataModel、RDFSchema和RDFSyntax三个部分构成。RDFDataModel形成对资源的形式描述;RDFSchema定义描述资源时需要的属性类型及其意义、特性;RDFSyntax则把形式描述通过其宿主语言XML转换成计算机可以理解和处理的文件。二、RDF——元数据的“容器”(一)RDF的概念与构成

RDFDataModel又称RDF的数据模型,它包括三个对象类型:(1)资源。所有以RDF表示法来描述的东西都叫做资源,它可能是一个网站、一个网页,也可能只是网页中的某个部分,甚至是不存在于网络的东西,如纸本文献、器物、人等。在RDF中,资源以统一资源标识来命名,统一资源定位器、统一资源名称都是URI的子集。(2)属性。属性是用来描述资源的特定特征或关系的,每一个属性都有特定的意义,用来定义它的属性值、它所描述的资源形态,以及和其他属性之间的关系。RDF的属性、属性值在概念上和传统的属性、属性值是相同的。(3)陈述。特定的资源以一个被命名的属性与相应的属性值来描述,称为一个RDF陈述,陈述可以理解为“资源R具有值为V的属性P”,其中资源是主词,属性是述词,属性值则是受词。陈述的受词可能是一个字符串,也可能是其他的资料形态或是一个资源二、RDF——元数据的“容器”(二)RDFDataModel

RDFDataModel又称RDF的数据模型,它包括三个对象类型:(1)资源。所有以RDF表示法来描述的东西都叫做资源,它可能是一个网站、一个网页,也可能只是网页中的某个部分,甚至是不存在于网络的东西,如纸本文献、器物、人等。在RDF中,资源以统一资源标识来命名,统一资源定位器、统一资源名称都是URI的子集。(2)属性。属性是用来描述资源的特定特征或关系的,每一个属性都有特定的意义,用来定义它的属性值、它所描述的资源形态,以及和其他属性之间的关系。RDF的属性、属性值在概念上和传统的属性、属性值是相同的。(3)陈述。特定的资源以一个被命名的属性与相应的属性值来描述,称为一个RDF陈述,陈述可以理解为“资源R具有值为V的属性P”,其中资源是主词,属性是述词,属性值则是受词。陈述的受词可能是一个字符串,也可能是其他的资料形态或是一个资源二、RDF——元数据的“容器”(二)RDFDataModel

下图显示了一个常见的资源描述框架数据模型二、RDF——元数据的“容器”(二)RDFDataModel可见,资源描述框架的基本数据模型通常由资源、属性类型和值组成

RDF定义了一种通用的框架,以不变应万变,来描述Web上的各种资源。它基于如下的假设:任何一个可被标识的“资源”都可以被一些可选择的“属性”描述(如尺寸、名字、制作者等),每一个属性的描述都有一个“值”二、RDF——元数据的“容器”(二)RDFDataModel例如,陈述“李明是这个轴承厂的厂长”,轴承厂是被描述的资源,它的一个属性是“厂长”,而这个属性的值是“李明”。这里“李明”这个节点可能还有一些属性,如年龄、性别等,可以继续对“李明”这个节点进行描述。

都柏林核心元素集(Dublincoreelementset)简称都柏林核心(DC),是目前发展比较成熟的元数据之一,在图书信息界及网络界得到了广泛的认可。因此,本书以它为例对元数据作具体介绍。1995年,联机计算机图书馆中心(OnlineComputerLibraryCenter,OCLC)和国家超级计算机应用中心(NationalCenterforSupercomputerApplications,NCSA)联合召开了第一次都柏林核心元素集会议,创建了只包含能够描述数字信息资源基本特征的都柏林核心,并明确了元素的描述语义。此后都柏林核心工作小组经过多次研讨,使“都柏林核心元素集”日趋完善,并取得了一些成果。都柏林核心由15个核心元素组成:题名(title)、作者或创造者(creator)、主题词和关键词(subject)、出版者(publisher)、内容描述(description)、其他责任者(contributor)、日期(date)、资源类型(type)、资源格式(Format)、资源标识(identifier)、关联(relation)、资料来源(source)、语言(language)、内容范围(coverage)、权限管理(rights)。三、内容描述标准——DC(一)都柏林核心简介与资源内容相关的元素1都柏林核心的15个基本字段,它们可以被分为三组从知识产权角度看,与资源相关的元素2与资源外部属性相关的元素3三、内容描述标准——DC(二)都柏林核心结构

1.与资源内容相关的元素(1)题名:作品被赋予的一个或多个名称。(2)主题与关键词:作品的主题或主要概念的关键词,以及代表与本对象重要相关的人物、地点、事件或其他背景资料等信息的词汇。(3)内容描述:文件的摘要或影像资源的内容叙述。(4)资料来源:作品的其他衍生来源。(5)语言:作品本身所使用的语言。(6)关联:与其他作品的关联,或所属的系列和档案库。(7)内容范围:作品所涵盖的时期和地理区域。三、内容描述标准——DC(二)都柏林核心结构

2.从知识产权角度看,与资源相关的元素(8)作者或创造者:作品的构思及创作者,可以是一位以上的个人或机构。(9)出版者:负责发行作品的个人或机构,同时也可以著录主要的资助单位或政府机关。此外,发行者与其他重要代理商也可著录于此。(10)其他责任者:除著者外,也可著录对作品创作有贡献的其他相关人士或机构(例如编者或译者),还可著录赞助者、捐赠者及负责人。描述自然标本时,也可在此著录标本制作者。(11)权限管理:作品版权声明和使用规范。三、内容描述标准——DC(二)都柏林核心结构

3.与资源外部属性相关的元素(12)日期:作品公开发表的日期,建议使用格式:YYYYMMDD。这个日期不一定与内容范围字段所定义的资源内容所涵盖的日期或期间相同。在描述自然标本时,字段值可著录鉴定、观察及采集的相关日期。(13)资源类型:作品的类型或所属的抽象范畴,例如文字、声音、影像、实体对象、事件、原件或代理对象等。(14)资料格式:本字段描述存取、呈现或使用此作品时,可能所需的软硬件工具。(15)资源标识:用来有效辨识此作品的文字或号码,例如URI、ISSN、ISBN等。以上每个字段都是可选的,也是可以重复的,并且各字段的排列顺序是任意的,没有特殊意义。每一个字段可以通过“堪培拉限定词”进一步扩展。例如都柏林核心在类型(type)上定义了8种不同形态:text;image;sound;dataset;software;interactive;event;physicalobject。三、内容描述标准——DC(二)都柏林核心结构

根据都柏林核心的结构,我们不难看出它所具有的功能。

(1)查找:都柏林核心的设计主要是为了支持数字信息资源的发现或查找,其元素意在成为用户查找数字信息资源的最重要的依据。

(2)识别:都柏林核心中存在一些与信息资源的识别相关的检索,包括日期、类型、格式和识别符等,如“日期”能够提供

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论