版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一、信息组织含义:马张华(2008):所谓信息组织,也称信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。信息组织:也称信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述与序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。数据:一般是指经过直接观察获得的事实,它是无生命的、未经过处理的。确切地说,是“以正式的、适合人类或自动方式交流、转换、处理的对于事实、概念、程序的表达”信息:经过人类处理的数据,是人们通过惯常方式赋予
2、数据意义得到的结果,是接收者对数据背景和规则的解读知识:是信息接收者通过对信息的提炼和推理而获得的正确结论,是信息与经验(知识准备)的结合。信息体:可组织的记录信息,并不涵盖所有的信息。记录信息体包括的不仅仅是文本,还包括视频及声音记录、图像、图形和网页等非文本的记录信息。信息组织的处理对象:信息体在本课程中与文献或资料的含义接近,通常是指一切以记录形式存在的信息载体,比如各种传统的印刷型信息资源、缩微型、机读型资源以及实体/非实体资源(网络信息资源)等。信息组织的范围不仅仅局限于传统的文献资源,它还包括与信息组织相关的一切要素,如信息资源、信息产品、信息设备、信息人员、信息法规和制度、信息机
3、构等可以被序化和整理的对象。信息组织的常用方法 分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法;从学科的角度集约信息,便于族性检索 主题组织法:一般指直接以表示文献主题的语词做标识,提供字顺检索途径,并主要采用参照系统揭示词间关系的标引和检索文献的方法;从事物角度集约信息,便于特性检索 分类主题一体化组织法:将分类法和主题法结合起来使用的方法信息组织的类型 按信息的表现形式划分(1)文字信息组织广义的文字包括各种语言文字、各种编码,如ASCII码、国际电报与单元代码及计算机中的二进制数字编码等一些符号的约定这些文字、符号、代码均是信息的表述形式,其内容再现于它们的结构属性中如基本笔
4、画的不同组合、字和字母的不同组合、二进制码“0”和“1”的不同排列等,分别代表不同的信息内容(2)图像信息组织图像(形)是一种视觉信息,它比文本信息更直接,易于理解图像本身有形状、大小、颜色、光亮度、对比度及存储格式通常情况下,我们通过表现图像的各种要素按照视觉的需要来组织图像信息,有时也按照对图像的存储格式的需要来组织例如,目前为了提高网速,Web网页上的图像一般都使用.gif、.jpg等格式(3)音频信息组织声音可以进行编码和压缩,可以通过A/D转换将声音数字化并输入到计算机中处理,再通过D/A转换输出一般按照听觉的需要或声音的记录方式来组织声音信息(4)视频信息组织视频信息可分解为图像信
5、息加声音信息,可以看成是无数张图像帧按照一定的流向(顺序)排列组合,外加音频组配而成对视频信息的组织实际上就是对图像和音频信息的组织 按信息的加工程度划分(1)一次信息组织一次信息是人们研究或创造性活动成果的直接记录一般指公开出版的图书、期刊、论文、研究报告、会议文献、学位论文、专利说明书、网上未经过再加工的数字化信息等一次信息组织是指采用一定的逻辑结构和语言规则,将大量零星的信息单元组织成能够反映著者、编者对事物和概念认识的一次信息(如图书、论文)的信息组织方式(2)二次信息组织二次信息是对一次信息加工后产生的有序化、系统化的信息如目录、题录、简介、文摘、索引、书目数据库等二次信息组织是在一
6、次信息的基础上加工整序而成的信息组织方法主要采用选择、提炼、浓缩等方法,编撰和建立各种形式的目录、文摘、索引等检索工具与存取系统其主要功能是规范和控制社会信息的流向,组织序化文本与数字化的信息二次信息组织的目的是建立各类信息检索系统,它是通过对一次信息的内容属性和外部特征进行有效揭示、描述、排序和存储来实现的二次信息的重要作用不仅在于报道,更重要的是为查找一次信息提供线索。印刷型文献的形式:如传统的书目、索引、文摘等数字化的方式:如各类书目型数据库(包括题录型和文摘型),互联网上的搜索目录和搜索引擎等(3)三次信息组织三次信息如综述、评述、学科年度总结、进度报告、文献指南、百科全书、年鉴等三次
7、信息组织是在一、二次信息的基础上,经过分析、综合等深加工而成的信息组织方法 按信息的传播载体划分(1)非数字信息组织(印刷型信息组织)非数字信息是指以印刷型文献信息源为主的各种类型的文献,文献信息源是信息组织的主要对象按照物质载体的不同:印刷型、缩微型、视听资料等;按照编辑出版形式的不同特点:图书、期刊、会议资料、专门报告、专利资料、政府出版物、学位论文、产品样本、档案、标准、新闻报纸等分类组织法、主题组织法字顺组织法、时间空间组织法、随机组织法等(2)数字信息组织数字信息是指在网络环境下未以传统文献载体形式出现的信息源如程序执行代码、单机或局域网或互联网上的网页、超文本、超媒体、数字图书馆、
8、虚拟图书馆等对这类信息的组织称为数字信息组织或网络信息组织1)网络一次信息的组织方法超文本方法:信息的非线形排列;非顺序性浏览功能;信息表达形式的多样性自由文本方法:主要用于全文数据库的组织,对非结构化的文本信息进行组织和处理;用自然语言深入揭示文献的知识单元主页方式:将有关某机构或个人的各种信息集中组织在一起,是对某机构或人物等各类对象的全面介绍2)网络二次信息的组织方法搜索引擎方法:Internet上专门提供查询服务的一类工具,它利用被称做Robot、Spider等名称的自动化处理软件,定期或不定期地在网上爬行,通过访问网络中公开区域的每一个站点,对网络信息资源进行收集,然后利用索引软件对
9、信息进行自动标引,创建一个详尽的、可供用户进一步按关键词查询的Web页索引数据库;Baidu、Google主题树方法:将信息资源按照某种事先确定的概念体系分门别类地逐层加以组织,用户先通过浏览的方式层层遍历,直到找到所需要的信息线索,再通过信息线索连接到相应的网络信息资源;Yahoo!、Sohu搜索引擎方法优点:收集的信息丰富广博缺点:质量良莠不齐,查准率较低主题树方法优点:主题树屏蔽了网络信息系统相对于用户的复杂性,提供了一个基于树浏览的简单、易用的网络信息检索与利用界面;信息检索由用户按照规定的范畴分类体系,逐级查看,按图索骥,目的性强,查准率高缺点:必须事先建立一套完整的范畴体系3)网络
10、三次信息的组织方法通过一次、二次信息组织方式实现数字信息资源的序化与优化,有时依旧很难满足人们对信息的精约化与集成化的需要对网上二次信息资源进行组织与控制,形成网上三次信息资源帮助用户更快捷地找到合适的搜索引擎、目录指南或指示数据库等,这就是“目录之目录”的三次信息资源组织管理模式典型代表是多元搜索引擎中的搜索引擎目录,如北斗星网络搜索 按信息的认识层次划分(1)语法信息组织从人类对信息的认识层次上看,由于人类具有感受力,能够感知事物运动状态及其变化方式,由此获得的信息称为语法信息语法信息组织是以信息的形式特征为依据的信息组织方法字顺组织法:从字、词角度集中排列有关信息,可满足人们检索的一般要
11、求;音序法、形序法和两法并用三种形式代码法:代码一般使用拉丁字母和阿拉伯数字,如专利代码和商品代码地序组织法:获得有关地域方面的信息;一般有文字法和图文法两种形式时序组织法:获得历史信息和从历史角度获取信息;编纂工具书、著书立说、甚至写一篇文章等(2)语义信息组织由于人类具有理解力,能够领悟事物运动状态及其变化方式的逻辑含义,由此获得的信息称为语义信息语义信息组织方法是研究信息的内容特性而对信息进行描述的一种方法,也即以信息的内容特征为依据的信息组织方法分类组织法对知识分类体系的反映,从学科角度集约信息,便于族性检索实物分类带有更多的专业(或行业)特性和效用原则;文献分类以知识分类为基础,结合
12、了文献实体属性和信息利用的实际;知识分类法是人类认识客观世界的科学方法,对其他两种分类法有着指导意义主题组织法建立在自然语言基础之上的、从事物角度集中信息,便于特性检索标题法、单元词法、叙词法和关键词法等(3)语用信息组织由于人类具有明确的目的性,能够判断事物运动状态及其变化方式的效用,由此获得的信息称为语用信息语用信息组织是以信息的效用特征为依据的信息组织方法权重值信息组织法按照信息的重要性来组织信息报纸在版面安排上,总是把最重要的信息放在头版头条的位置;电视节目的安排上,总是把重要节目放在黄金时间播出;城市规划、行业决策、质量评估等概率组织法在未全知信息情况下对信息进行组织的方法如预测文体
13、活动胜负、期货交易等二、信息组织的理论和方法学基础:理论基础 方法学基础系统科学理论 语言学耗散结构论 逻辑学协同论 知识分类学知识组织的理论信息自组织理论逻辑学原理在信息组织中的应用1)概念的种类概念是反映对象的一般属性和本质属性的思维形式是思维的最基本单元,其内容是客观的,由词来表现,并具有民族特点科学概念是形成科学理论体系的基础,各门学科借助于不同的科学概念来表达各自的发现结果以及所要阐述的基本原理2)概念的概念的内涵和外延内涵是指所有组成该概念的事物的本质属性外延是指具有这种本质属性的所有事物的总和“图书分类法”“中国图书馆分类法”、“杜威十进制分类法”、“美国国会图书馆分类法”等概念
14、的内涵和外延之间的关系:此消彼长,内涵扩大,则外延缩写;内涵缩小,则外延扩大在信息组织中,利用概念的内涵和外延对各种信息进行标引和检索,依据概念的限制和概括及概念之间的关系,通过概念的划分、概念的分析和综合开展信息组织工作。对概念的划分可以建立等级性的概念体系对概念的分析和综合,则可以将复合主题概念分解成若干个子概念,并通过对子概念的组配表达复合主题概念,进行概念逻辑运算常见的布尔逻辑运算符:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT)3)概念之间的关系概念之间按照是否存在共有的外延,概念关系可以分为相容关系和不相容关系两种相容关系是指至少有一部分外延相同的概念之间的关系,包括同一关系、
15、包含关系、交叉关系等不相容关系是指不存在共有外延的概念之间的关系,可以分为不同论域之间的不相容关系和同一论域的不相容关系。前者对于信息组织而言无实际意义,信息组织关注的是同一论域的不相容关系,可以分为并列关系、反对关系和矛盾关系检全率 查全率、命中率 指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比检准率 查准率、相关率 指系统实施检索时检出的与某一检索提问相关的信息资源量与检出的信息资源总量之比例:一数据库中共有文献100篇,其中有60篇文献与“信息组织”相关,所实施的检索共检出40篇文献,经核查,检索出的40篇文献中有30篇与“信息组织”相
16、关,那么该系统的检全率和检准率分别是多少?检全率:30/60,即为50%检准率:30/40,即75%检全率与检准率之关系:反比关系三、信息描述:指根据信息组织和检索的需要,对信息资源的主题内容(如分类、主题)、形式特征(如题名、著者、来源出处、出版地、出版者、出版时间等)、物质形态(如文献类型、页册数、图表、开本、装订、价格等)等进行分析、选择、记录的活动款目:依据一定的方法和规则,对文献外表形式、物质形态和内容特征所作出的客观描述传统文献检索系统编制中文献著录的结果,也称著录款目记录记录是指表述事物的特征,具有完整的含义,从内容和使用的角度能被作为一个整体来识别的一组相关数据项的组合中国文献
17、编目规则(第二版)在编目领域,通常将以机读形式存储于目录数据库中的目录数据称为“记录”一条“记录”相当于手工编目中的一条“款目”目录将款目(或记录)按照一定的规则有序地排列起来便形成了目录款目和记录是一种文献的缩影,目录是一批文献的缩影元数据元数据是关于数据的数据,或关于数据的结构化的数据,可以作为信息资源的基本记录用来组织检索系统元数据描述的对象:各种不同的资源类型,如图书、期刊、磁带、录像带、缩微品、论文、科技报告以及各种形式的网络信息资源等描述的成分:通常是从信息资源中抽取出来的用于说明其特征、内容的数据,如题名、责任者、出版数据、相关说明等,以结构化的方式记录信息著录法将信息实体的有关
18、特征著录下来是信息著录,有关如何著录的具体规定和具体做法就是信息著录法信息著录法是对信息资源特征进行描述记录的依据图书著录 图书的著录项目我国的普通图书著录规则(GB3792.2-85)规定了八大著录项,它们是书名和责任者项目、版本项、出版发行项、载体形态项、丛编项、附注项、标准书号及有关记载项、提要项。 在96年出版的中国文献编目规则则完全按照ISBD的规定,只保留了著录正文中的七项,取消了提要项 ,并将标准书号及有关记载项改为标准书号与获得方式项 著录依据著录项目规定信息源题名与责任说明项书名页、无书名页的版权页版本项书名页、版权页出版发行项书名页、版权页载体形态项整个出版物丛编项丛编/专
19、著书名页、版权页、封面、出版物其他部分附注项任何信息源标准编号与获得方式项任何信息源重要的著录依据书名页:书名页一般记载有完整的书名、责任者、出版者的全称和所在地。版权页(内容有):在版编目数据:一般位于版权页的上方。翻译书的原名、责任者的原名、版本说明、出版年、原版次等:一般也位于版权页的上方。版次:制版的次数,是版本内容变更的重要记录印次:印刷的次数。从第一版第一次印刷起累计计数,版次变更,印次仍要累计统计。印数:某一文献同一版型一次印刷的总册数。 印张:一份出版物所需要的印刷纸张数。开本:常见的有32开,大32开,16开等。书号:1987年之前为统一书号。1987年以后为中国标准书号。中
20、国标准书号由“国际标准书号(International Standard Book Numbers,简称ISBN)”和“图书分类-种次号”两部分组成。书名、责任者名称出版者名称、出版者详细地址、发行者、印刷者、出版时间、印刷时间等。著录格式书本式著录格式卡片式著录格式 各著录项目的著录方法正书名著录规则(1)依据规定信息源所载的书名形式著录,如文字、顺序、拼写、重音符号和其他发音符号等均照录,无法照录的图形及符号可用相应的文字代替,并置于方括号中,同时在附注项中说明。 例:文献信息编目 真实性1/2 Gone with the wind 爱心(2)书名中含有表示语法关系的标点和起标点作用的空格
21、时,一般要照录。 例:世界经济地理上册 活动 意识 个性(3)书名中含有独立的字母或缩写词,无论是否含有表示缩写的圆点,著录时都不能空格。 例:Cataloging U.S.A. Cataloging USA.三(2)与MARC格式有关的重要概念MARC(Machine Readable Catalogue)是“机器可读目录”(机读目录,机读编目格式)是以代码形式结构和特定结构记录在计算机存储载体上的,可用计算机识别与阅读的目录记录相当于卡片目录(手工编目)中的“款目”,是一本书的所有书目信息(包括内容特征与形式特征信息)的详细记录,一本书一个记录字段相当于卡片目录中的“著录大项(基本描述项目
22、)”,是指由字段标识符标识的被定义的字符串。如记录中包括的题名与责任说明字段、版本说明字段、丛编项字段等数据字段。一个字段中可包括一个或若干个子字段。子字段相当于卡片目录中的“著录子项目(描述子项目)”,是指变长数据字段内所定义的数据单元,如载体形态字段下分有“篇幅”、“其它形态细节”等子字段定长字段是指长度固定的字段,其所含字符个数已经预先作了规定,而且在计算机处理的过程中不会改变。定长字段主要反映系统控制号与文献的一些基本特征。如CNMARC格式中的100通用处理数据字段就是定长字段,记录36位固定长编码数据变长字段是指长度不定的字段,其所含字符个数未作预先规定,可随字段值的大小变化变长字
23、段主要反映手工编目款目中各著录项目的内容变长字段又可分为变长控制字段与变长数据字段,可包含一个或多个数据元素或子字段如CNMARC格式中的215载体形态项字段就是变长字段,记录文献的形态特征方面的信息,包括ISBD载体形态项的数量、单位、图表及其它形态细节、尺寸、附件等字段(或子字段)的重复性是指同一字段或子字段可以在同一个记录或字段内重复使用。内容标识符是指用于表示数据元素或提供有关数据元素附加信息的编码CNMARC等格式的内容标识符分为三种:字段标识符、子字段标识符、字段指示符此外还设有必要的分隔符号字段标识符是用于识别字段的字符代码,可使用数字、字母等形式的符号,用以区别不同字段CNMA
24、RC格式的字段标识符采用三位数字组成的代码,从001到999。同一功能块的字段,一般均以相同的数字开头。以主题分析块为例,各字段标识符均以数字“6”开头,如600为个人名称主题字段,601为团体名称主题字段,605为题名主题字段,606为普通主题字段,607为地名主题字段,690为分类字段等。子字段标识符是用以识别变长数据字段中不同子字段的代码。CNMARC格式的子字段标识符由两个字符表示。第一个是定义符,为国际标准ISO 2709中规定的专用符号,格式印刷文本中以“$”表示,用于分隔不同的子字段;第二个字符为一位拉丁字母或阿拉伯数字。两个字符结合起来标识特定的子字段。如CNMARC中“690
25、中国图书馆分类法分类号”字段中,“$a”子字段代表中图法的分类号,“$v”子字段代表所用中图法的版次字段指示符是指与变长字段连用的字符,用于提供某些数据的操作信息指示符位于字段标识符之后,按该字段规定及数据特点输入。字段指示符的值一般为数字或空位。指示符分定义和未定义两种情况。未定义的指示符用空格表示,输入时打空格键例如CNMARC的600个人名称主题字段中,第一指示符未定义,第二指示符为名称形式指示符,以0标示直序方式记录,以1表示倒序方式记录,其指示符及其含义分别为:0 表示该人名以直序方式记录1 表示该人名以倒序方式记录分隔符分割不同数据集合,分为记录分隔符和字段分隔符,标志记录或字段的
26、终止记录分隔符与字段分隔符均由计算机自动生成MARC记录基本格式记录头标区地址目次区数据字段区记录分隔符定长字段变长字段记录头标区24个字符固定长,除5-8字符位外,其它均由计算机系统自动生成,用于满足记录处理和标识书目实体本身的需要地址目次区一条记录内所有数据字段的索引,由计算机自动生成数据字段区用以记录有关文献的各种信息,主要由人工输入,定长字段和变长字段分别供不同数据输入时使用数据字段区:用以记录有关文献的各种信息,包括编目数据、主题数据、分类数据等方面,是书目记录的主体,主要由人工输入也称变长字段区,是指若干个定长和变长数据字段的集合,每个字段之间由字段分隔符隔开定长字段 主要指一些控
27、制字段,像001、005、006等这些控制字段均不设字段指示符和子字段标识符,只设一个字段分隔符作为结束变长字段是记录书目数据的主要地方包含字段指示符、子字段标识符和长度不固定的子字段数据元素具体ppt0xx 标识块包含标识记录或编目文献的标识号001记录控制号010国际标准书号(ISBN) 011国际标准连续出版物号(ISSN)1XX 编码信息块本信息块记录定长编码数据元素 100一般处理数据 101 文献语种 102 出版国别 105 编码数据字段:专著性文字资料 106 编码数据字段:文字资料形态特征 110 编码数据字段:连续出版物100一般处理数据本字段是用于记录各种载体文献的定长编
28、码数据。本字段必备,不可重复指示符 指示符1:未定义,空位 指示符2:未定义,空位子字段说明 $a 通用处理数据,不可重复:固定长36位,每一数据元素应填写在其固定的字符位置上,若填写时某一字符位置数据元素不能提供,则应在相应的字符位置上用填充字符“#”补齐101 文献语种用于记录文献题名及其正文的语种代码。如为译著,还需揭示其原著语种。本字段必备,不可重复指示符 指示符1:翻译指示符。表示文献为原著或译著或含有译著. 0 原著语种 1 译著 2 包含译文(编译文献选用此代码,若仅仅是文献中的文章摘要等翻译,不应用此代码。) 指示符2:未定义,空位子字段说明 $a 正文语种,可重复; $b 中
29、间语种,可重复; $c 原著语种,可重复; $d 提要或文摘语种,可重复; $e 目次页语种(与正文语种不同时),可重复; $f 题名页语种(与正文语种不同时),可重复; $g 正题名语种(与正文语种不同时),不重复; $i 附件语种(非文摘或提要),不重复.105 编码数据字段:专著性文字资料用于著录专著性印刷型语言文字资料的编码数据(也即包含有关图书的数码数据), 集中著录的连续出版物没有此字段。CALIS联合目录规定本字段为图书完全级记录的必备字段,不可重复指示符 指示符1:未定义,空位 指示符2:未定义,空位子字段说明 $a :专著编码数据,不重复本字段内容由定长数据元素构成,共13个
30、字符106 编码数据字段:文字资料形态特征包含关于图书载体形态的编码数据,以一个字符位的代码,表示所著录图书的物理介质及形态,不可重复指示符 指示符1:未定义,空位 指示符2:未定义,空位子字段说明 $a 记录内容为载体标识,不重复载体标识代码d 大型印刷品(大于35cm)e 报纸形式f 盲文点字本g 微型印刷品(小于5cm) h 手写稿i 多种媒体(如:有录音带的普通印刷出版物) j 小型印刷品(小于10cm)r 一般印刷品z 其它形式的文字资料如:106#$ar 该文献为一般印刷品110 编码数据字段:连续出版物本字段记录连续出版物的编码数据,包括集中著录的丛书、年鉴、年刊及其它连续出版物
31、。本字段选择使用,不可重复。当记录头标区第7字符位为s时,采用此字段。本字段应按照所要编目的连续出版物的实际情况,如实录入相应代码。2xx著录信息块本信息块包括ISBD所规定的、除附注项与国际标准书号外的主要著录项目 200 题名与责任说明项 205 版本项 207 资料特殊细节:连续出版编号 210 出版发行项 215 载体形态项 225 丛编项200题名与责任说明项与传统著录中的题名与责任者项相对应。按照所编目的文献上出现的形式如实照录文献的正题名、并列题名、其它题名信息、责任说明等。本字段必备,不可重复指示符 指示符1:题名有无检索意义指示符此项规定表明编目机构编制的记录是否把第一个$a
32、子字段的正题名作为检索点处理1 题名有意义,题名作检索点0 题名无意义,该题名不宜作检索点 指示符2:未定义,空位子字段说明 $a 正题名,可重复(取自题名页的主要题名)著录时原则上按照规定信息源所载题名如实照录。正题名中所含标点、符号、数字、汉语拼音、外文字母及其起语法标点作用的空位原则上客观照录。为避免与本项著录用标识符混淆,正题名所含方括号应改用圆括号;正题名中所含“/”用半角录入,不加任何空位。例1: 200 1#$a80386/80486原理及应用$f艾德才,#李文彬编著 例2: 200 1#$a台湾科索沃$f俞利著 $b 一般资料类别标识一般资料标识字段包含一个概括性词语。它以编目
33、机构所采用的语言和形式,说明出版物所属的资料类别。本字段可重复,一般普通图书不使用 $c 不同责任者的正题名,可重复与第一题名责任者不同的另一著者作品的主要题名。二者包括在同一文献内,又无共同题名 $d 并列正题名,可重复出现在$a或$c子字段的正题名的另一种语言和/或文字的题名,凡记入本字段的并列题名,需同时记入510字段。 $e 其他题名信息,可重复副题名和其他题名信息。它从属于作品的正题名。对于每个其他题名信息和并列的其他题名信息,本子字段可重复。本子字段不包括书籍题名、封面题名以及在主要信息源意外找到的其他题名。应著录在与其相关的题名之后的$ e子字段。 $f 第一责任说明,可重复 $
34、g 其他责任说明,可重复注:责任说明应著录在其负有责任的相应题名之后如:200#1#$a小东西$e法语注释读物 $f(法)都德 (A.Daudel)原著$g(法)亚马扎克改编 $g杨松荫注释 $h 分辑号作品分辑或分册的编次,是由一种通用的辑、册等名称标识的,本字段可重复 $v 卷标识用于标识本实体与另一实体相关的特定分卷册 $z 并列题名语种$d子字段的并列题名的语种代码标识。如果$d是重复的,则本字段也应重复,语种标识顺序反映并列题名书序。本字段(包括重复的)总是出现在200字段的末尾 $A 正题名汉语拼音其数据可由计算机自动生成205 版本项包括有关文献的版本说明、附加版本说明及与本版有
35、关的责任说明。本字段选择使用,可重复。指示符 指示符1:未定义,填空格 指示符2:未定义,填空格子字段说明 $a 版本说明,不可重复使用标准著录用的词、短语或一组字符,说明出版物的版本情况。附加版本说明计入$b $b 版次和附加版本说明,可重复本子字段包含下列有关版次或附加版本的说明:1)一种既定版本的正规标识2)在内容上有别于所属的大型版本的其他版次3)子字段$a中版本名称的交替标识 $d 并列版本说明,可重复并列版本说明是指与$a子字段中的版本说明在语言或文字上不同的说明。 $f 与版本相关的责任说明,可重复与该版本相关的主要责任说明。它可能伴随子字段$a、$b或$d出现 $g次要责任说明
36、, 可重复与该版本相关的次要责任说明,它伴随子字段$f出现207资料特殊细节:连续出版编号当已知连续出版物的卷期和年代范围时,本字段包含其首期和末期的编号和/或年代范围,本字段选择使用,不可重复指示符 指示符1:未定义,填空格 指示符2:规则编号指示符 本指示符表示卷期编号和年代范围是否规则。 0 规则 1 不规则 $a 编号:年代和卷期标识,可重复著录连续出版物的编号或/和年代标识 $z 卷期号出处,可重复当卷期编号不是取自连续出版物实体本身时,本字段为卷期编号出处的注释实例207 #0$av.1,no.1(1980,2)207 #0$av.1,no.1(1960,2)v.6,no.2(19
37、66,6)210出版发行项本字段著录有关文献的出版、发行和制作方面的信息。本字段选择使用,不可重复。指示符 指示符1:未定义,填空格 指示符2:未定义,填空格子字段说明 $a 出版、发行地,可重复文献出版者或发行者所在的城市或其他地点的名称 $b 出版者、发行者地址,可重复对于不太有名的出版者或发行者,通常将其完整的邮政地址标示在圆括号或方括号内 $c出版者、发行者名称,可重复出版者或发行者名称可采用易于识别的简略形式。如需说明发行者的职能,可著录在本字段的方括号内 $d出版、发行日期本字段包含出版日期或估计出版日期、版权日期或制作日期,亦可包括开放式日期或跨段区间日期(起讫年) $e制作地文
38、献的制作地,例如图书的印刷地。如果该地名鲜为人知或有失准确或过时,可根据国际标准书目著录(ISBD)的规定,在方括号内补充说明 $f制作者地址对于不太有名的制作者,通常将其完整的邮政地址著录在本子字段。 $g制作者名称制作者名称,例如印刷者,可采用易于识别的简略形式 $h制作日期文献的制作日期,用于补充出版日期例1 210 #$a郑州$c中州古籍出版社$d1991.2 出版地不是取自主要信息源,著录在方括号内例2 210 #$a芒市(云南)$c德宏民族出版社$d1991? 出版地不太有名,而地区名是(编目员)补充的,出版日期不确定例3 210 #$a北平北京 $c不详 $d1944.5 出版地
39、采用旧称或有误,而且出版者不详215载体形态项本字段含有作品形态特征方面的信息。本字段选择使用,可重复。指示符 指示符1:未定义,填空格 指示符2:未定义,填空格子字段说明 $a特种资料标识和文献的数量及单位,可重复文献所属特定资料类型的名称和/或表示其组成部分的编号,如著录页数或/和卷册数、图书文字等 $c图及其它形态细节,不重复有关文献的载体形态数据,例如:插图的细节、是否彩色或有无声音等在本字段的其他子字段或附注字段中未记载的数据 $d尺寸,可重复文献的线性尺寸和/或与使用该文献所需设备的尺寸规格 $e附件,可重复文献的附加资料简述,附件与文献同时使用225丛编项本字段著录丛编的正题名、
40、并列题名、其它题名信息、责任说明、分丛编名、卷册标识及有关丛编的其它信息。本字段选择使用,可重复。指示符指示符1:题名形式指示符丛编题名的检索点形式应记录在连接款目块的410字段。该指示符表示本字段的丛编题名是否与410字段中记录的检索点形式相同。0 与检索点形式不同编制记录的机构认为410字段中的检索点形式不同于225字段中的丛编说明1 无检索点形式没有确定检索点形式,因而410字段中无相应的题名2 与检索点形式相同(建议将已确定的检索点形式另计入410字段。)指示符2:未定义,填空格子字段说明 $a 丛编题名,不重复所编文献上出现的丛编题名 $d 并列丛编题名,可重复与出现在$a子字段丛编
41、题名相关的另一种文字和/或符号的丛编题名 $e 其他题名信息,可重复文献上出现的从属于$a、$d、$i等名称的副题名和其他题名信息 $f 责任说明,可重复出现在$a或$d中的题名的责任说明或出现在$h、$i中的丛编的编号部分或名称部分的责任说明 $h 分从编号,可重复本字段包含$a子字段所述丛编的分丛编号 $i 分丛编名称,可重复本字段包含$a子字段所述丛编的分丛编名称 $v 卷册标识,可重复本子字段包含$a子字段所述丛编的卷编号 $x 丛编的ISSN,可重复丛编的国际标准连续出版物号(ISSN)由8位数字表示,其第4-5位数字之间为一个连字符。“ISSN”四个字母可省略,输出时由程序自动生成
42、。 $z 并列题名语种,可重复本子字段包含出现在$d子字段中的并列题名的语种识别代码(例3) 例1 200 1#$a(康熙)宁远县志$f(清)冯同宪辑$c清水县志$f ( 清 )刘俊声辑225 2#$a中国西北文献丛书$f吴坚主编$h第一辑$i西北罕见方志文献$h总1-63$v第三十七卷$v37410 #0$a中国西北文献丛书$1700 0$a吴坚$4主编 例2225 2#$a万有文库$h第一集$v第223种225 1#$a国学小丛书所编文献丛属于两种丛编。其中第二种未使用检索点,所以第一指示符置为14xx连接款目块本著录块能够清楚地揭示出相关记录之间的层次关系(总集、分集、单册和单册分析,丛
43、书及其包含的各个分册)、平行关系(同一作品不同语种、不同载体形态的记录)和时间关系(先前块目和后续款目)。 410 丛编 423 合订题名指示符 指示符1:未定义,填空格 指示符2:附注指示符指示符2用以标识提供记录的机构是否利用此字段的数据产生附注。如果不需作附注,则此指示符置为0。 0 不作附注 1 作附注子字段说明 $1连接数据每个$1子字段均包含具有字段号、指示符和子字段代码的完整的数据字段。每个嵌套的字段均可重复。410丛编1)用于实现著录实体与含有该实体的丛编的连接,当200字段所著录的图书是某丛编的一个单册时,用本字段来实现其与丛编的向上连接本字段可重复例: 200 1#$a经济
44、政策信息410 #0$12001#$a复印报刊资料2)410字段用于记录丛编的检索点形式。即当225字段第1指示符的值为0和2时,记录中可能会出现410字段具体来说为0时,丛编题名与检索点形式不同;为2时,丛编题名与检索点形式相同。而当225字段的第1指示符的为1时,丛编题名无检索点,不出现410字段。实例200 1#$a比较法学的新动向225 2#$a比较法学丛书410 #0$12001#$a比较法学丛书注:编目文献是单册文献,属于比较法学丛书。 丛书的著录形式(225字段)与其确定的检索点形式(410字段)一致,因此225字段第1指示符的值为2。410字段第2指示符0,表示不需要该连接字段
45、数据生成附注。如果410字段第2指示符为1,则表示需要该连接字段数据生成附注。423合订题名用于实现本著录实体与同其一起发行的另外的书目实体(如:与之合订、合刊的作品)的连接实例 200 1#$a史记三书正伪$f(清)王元启撰 423 #1$12001 $a史记毛本正误$f(清)丁晏撰$1700 1$a丁晏$4撰6xx主题分析块本记录块著录的是根据不同体系(包括主题法和分类法)构成的文献的主题数据。本记录块包含三部分(主题标目、主题分析、分类号),共20个字段;本字段选择使用690 中国图书馆分类法分类号(CLC)本字段包含分配给文献的分类号,该号按中国图书馆分类法给出。本字段可重复。指示符
46、指示符1:未定义,填空格 指示符2:未定义,填空格子字段说明 $a 分类号分类号取自中国图书馆分类法分类表,不可重复 $v 版次 子字段$a 中的分类号取自该版,不可重复元数据著录法 元数据(Metadata) “关于数据的数据”(data about data)或“描述数据的数据”(data that describes data)或关于数据的结构化的数据,是对数据进行组织和处理的基础 元数据描述的对象包括不同的信息资源类型,既包括图书、期刊、磁带、录像带、缩微品,也包括其中的论文、科技报告以及各种形式的网络信息资源等 元数据描述的成分从信息资源中抽取出来的用于说明信息资源特征、内容的数据,
47、如题名、责任者、出版数据、相关说明等元数据款目=信息资源众多元数据->检索系统(如目录、索引、数据库、搜索引擎等)元数据的功能描述 基本职能,通过对信息资源的描述,揭示信息资源的形式特征和内容特征。描述的详细与深入程度则根据不同元数据格式而不同定位主要指通过对信息资源的位置信息的描述,帮助人们了解信息资源所在之处的信息,方便信息资源的获取。此外,一旦确定信息资源的位置元数据后,也可以确定该信息资源在整个信息资源集合中的位置,这是定位的另一层含义。检索在著录过程中,通过描述信息资源的主要特征,并赋予检索点,建立信息资源之间的联系,有利于从多途径、多角度检索到该信息资源选择通过对信
48、息资源的描述,使用户无需浏览信息资源本身,就能对信息资源的内容有所了解、认识,结合使用环境,用户可以选择符合要求的资源。评估 利用统计工具,对信息资源的版本、使用、保存管理等信息进行统计分析,方便资源的建立与管理者更好地组织资源,了解该信息资源在同类资源中的重要性。管理元数据元素除包含比较全面的著录描述信息外,还往往包括权利管理、电子签名、资源评鉴、使用管理、支付审计等管理方面的信息。保存元数据中往往包括详细的格式信息、制作信息、保护条件、转换方式、保存责任等内容,从而支持对资源的保护与长期保存。元数据格式:DCDC元数据的元素未限定的都帕林核心集共包括15个元素,这15个元素不含子
49、元素、命名域或其他限定词,均为可选择、可重复和可扩展的。依据其所描述内容的类别和范围可分为三组: 资源内容描述类:题名、主题、说明、来源、语种、关联和覆盖范围 知识产权描述类:创建者、出版者、其他责任者和权限 外部属性描述类:日期、资源类型、格式和资源标识符。DC元数据的限定词 对DC元素的内容和语义做进一步的限定或说明,以丰富DC的内涵并不断扩充其应用的范围 限定或规范不能改变元素本身的含义,只能根据各自的需要进行有针对性的限定目前对DC的元素限定词主要有三类: 语言(lang) 模式(scheme) 类型(type)DC元数据的限定词 语言(lang) 指明元素值的描述元素的语言,并非所描
50、述的信息资源本身的语言 如lang=en(注:此元素是指用英文著录的 模式(scheme) 指明元素值的选取遵从已有的或正在讨论中的一个体系架构中的合法值,比如分类表,主题词表或各类代码表。 如scheme=M(注:指出这个主题来自LCSH(国会图书馆主题词表) 类型(type) 指明目前元素的值是何种类型的值,指定了给定元素的一个方面,一般以子元素限定的方式来描述。例如Creator元素的个人名字,团体名字等等属性 如creator.personal name=“C.J.Wu” (注:更明确地界定了此元素的属性是著者)四、信息资源分类根据信息资源内容属性和其他特征,将各种类型的资源分门别类地
51、、系统地组织和揭示的方法从主题内容角度组织和揭示信息资源的一种方法信息资源分类法(亦称文献分类法,分类语言)根据类目之间关系组织起来的,并配有一定标记符号的类分信息资源的工具包括建立分类体系和依据建立的分类体系组织信息资源两个方面分类法的类型按照编制方式§ 体系分类法(等级列举式、列举式分类法、枚举式分类法)§ 分面组配式§ 列举组配式根据类目体系展开的维度§ 单维:传统分类法§ 多维:网络分类法根据其涉及的学科领域的范围不同§ 综合性分类法§ 专业分类法根据其适用的文献类型§ 图书分类法、期刊分类法、标准文献分类
52、法、专利分类法、报纸分类法、资料分类法、网络资源分类法根据类分文献的规模§ 大型分类法、中小型分类法等体系分类法概念:§ 通常将类目体系组织成一个树状结构,按照划分的层次,逐级列出详尽的专指类目,并在以线性形式显示时,以缩格表示类目的等级关系§ 通常依据传统的知识分类体系编制主表类目之间的关系从属关系v 指类目体系中的一个类与其直接划分出来的子类之间的关系,亦称隶属关系v 类系:通过连续划分形成的一系列具有从属关系的类目v 在具有从属关系的类目中,被区分的类称为上位类,亦称母类;区分出来的类被称为下位类,又称子类v 通常在分类表中,上位类一定包含其所属的下位类,下
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 脊椎动物-五爬行纲课件
- 2025年安徽省职教高考《职业适应性测试》考前冲刺模拟试题库(附答案)
- 《JavaWeb应用开发》考试复习题库(含答案)
- 打鼾的科学原理课件
- 2025年朔州陶瓷职业技术学院高职单招职业适应性测试近5年常考版参考题库含答案解析
- 2025年新疆建设职业技术学院高职单招职业适应性测试近5年常考版参考题库含答案解析
- 《钢铁生产流程详解》课件
- 沪教版(上海)七年级地理第一学期中国区域篇(上)2.5《广西壮族自治区》听课评课记录
- 10kV配电站房项目建设的进度控制与风险管理
- 茅台的阴阳合同
- 2025年个人土地承包合同样本(2篇)
- (完整版)高考英语词汇3500词(精校版)
- 网络货运行业研究报告
- 人教版七年级英语上册单元重难点易错题Unit 2 单元话题完形填空练习(含答案)
- 2024-2025年突发紧急事故(急救护理学)基础知识考试题库与答案
- 左心耳封堵术护理
- 2024年部编版八年级语文上册电子课本(高清版)
- 合唱课程课件教学课件
- 2024-2025学年广东省大湾区40校高二上学期联考英语试题(含解析)
- 旅拍店两人合作协议书范文
- 2024-2030年电炒锅项目融资商业计划书
评论
0/150
提交评论