信息组织重点_第1页
信息组织重点_第2页
信息组织重点_第3页
信息组织重点_第4页
信息组织重点_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章1. 什么是信息组织? P1信息组织,亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其成为有序化集合的过程。2. 数据数据是原生态的,即未经过处理的。信息则是经过人类处理的数据。3. 检索工具的类型 P6按照系统中所用的标识是否进行控制,检索工具可以分为受控检索系统与自然语言检索系统两种。按照系统中标识组配的特点,检索系统可以分为先组式和后组式两种。4. 检索语言检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。5. 信息组织的研究领域总体上包括三个层次。a) 理论层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。b) 规范层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。c) 方法层面:指信息资源组织技术方法,包括操作的技术方法、信息组织的管理、具体标引规则、描述规则等。其作用是按照信息资源组织的要求进行操作、实现信息资源系统的组织。第二章检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。检准率亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检出的信息资源总量之比。对词汇的控制通常包括:①同义控制;②词义控制;③词间关系控制;④还包括词量控制,词组选择和使用的控制,以及专指度控制等。常用的相关因素包括:引用关系、链接关系、用户需求。相容关系是指至少有一部分外延相同的概念之间的关系,包括:①同一关系;②包含关系;③交叉关系。不相容关系是指不存在共有外延的概念之间的关系,包括:①矛盾关系;②反对关系;③并列关系。第三章信息描述的含义:是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质资源形态等进行分析、选择、记录的活动。元数据:是关于数据的数据(或关于数据的结构化的数据)。信息描述的目的:以元数据为中介,对信息资源进行各种操作。信息描述的作用:①识别②定位③检索④选择描述信息源:(又称著录信息源、著录根据)指进行信息资源描述是描述信息的来源和出处。检索点:指检索信息资源所使用的题名、责任号、分类号、主题词等各种供检索使用的数据。参照法:是指引用户从检索工具中的一个标目或款目去查找另一个标目或款目的方法。参照法分为①单纯参照②相关参照③一般参照。规范控制的作用:①有利于以统一的方式加以记录;②以规范、通用的形式加以记录③方便检索和标引④有助于实现国际书目共享。名称规范档通常由规范款目,参照款目,说明款目三种款目类型组成。第四章1、信息描述操作应该做到:准确:即对信息资源的描述应真实反映其内容特征,通常应根据描述对象提供的数据加以记录,必要时,也可以参考其他来源对有关的数据加以纠正,使用户可以通过描述,对信息资源的特征有一个准确的了解。规范:指信息资源的描述应严格遵守相应的描述规范,并在可能时依据相关的规范文档或控制词表。完备:描述项目应比较完备,使得可以从信息资源的各种特征出发进行检索操作。2、信息描述的操作程序通常为:查重、描述、标引、复核并输入系统3、传统的文献著录规则和《都柏林核心集》两种描述规范相比,相同之处是:两者都设置了完备的描述项目,可以比较完整地揭示一信息资源的基本特征;两者都对描述的等级、标识以及规范的使用作出相应的规定,可以准确、一致的方式进行描述;两者都具有比较强的扩充性、兼容性,可以充分满足各种信息资源描述的需要和不同系统之间转换的需要。不同之处是:《都柏林核心集》具有简明性、灵活性、选择性、语法独立、可重复性、可扩展性、兼容性第五章信息资源分类:是指根据信息资源的内容属性和其他特征,将各种类型的资源分门别类地、系统地组织和揭示的方法。分类:是指依据事物的属性或特征进行区分和类聚,并将区分的结果按照一定的次序予以阻止的活动。信息资源分类的特征:①是按照内容特征的互相关系进行组织的;②是从一定角度出发组织和揭示信息资源的;③采用一定的标记符号作为排序工具;④往往通过类目索引提供从字顺角度查找类目的途径。信息资源分类的作用:①进行资源组织,各国的文献单位一般都将分类排架作为文献排架的基本形式;②建立分类检索工具;③分类统计;④兼容工具。信息资源分类法按照其编制方式,通常可以区分为1.等级列举式2.分面组配式3.列举-组配式三种类型。等级列举式分类法的特点是:1.分类结构显示直观,易于把握、便于使用;2.类目设置比较均衡,并可以根据实际使用需要对类目的等级进行适当调整;3.标记简明,适于分类排架,也可以用于组织分类检索工具。复分表:由共性子目构成,供主表有关类目共同使用的表,称为复分表,亦称副表、辅助表、共性区分表。复分表是分面组配的一种基本使用形式。利用复分表处理共性区分问题的作用是:1.缩小类表的篇幅;2.加强类表的伸缩性;3.增强类表的规律性。复分表的使用范围,可分为通用复分表和专类复分表两类。编号制度:按照号码的组成方式,分类标记一般可以分为1.顺序标记制;2层累标记制;3.顺序-层类标记制;4.分面标记制。(我国的《中图法》基本采用层累标记制)类目索引根据其不同特点,可以分为1.直接索引,2.相关索引,3主题词索引等横向关系的揭示和处理的基本做法包括:1.设置交替类目;2.建立参照;3.设置选择类目;4.设置选择类表;5.规定类目的归属。第六章分类法全名简称编制方式《杜威十进分类法》(DeweyDecimalClassification)DDC等级列举式《国际十进分类法》(UniversalDecimalClassfication)UDC列举—组配式《美国国会图书馆图书分类法》(LibraryofCongressClassification)LCC等级列举式《冒号分类法》(ColonClassification)CC分面组配式《中国图书馆分类法》《中图法》等级列举式雅虎主题指南(Yahoo!SubjectDirectiory)Yahoo!指南等级列举式DDC的基本大类及其序列来源于美国圣路易市图书馆的哈利斯分类法,该分类法是依据17世纪英国哲学家培根的知识分类思想建立的。《杜威法》的复分表共有6个:①标准复分表;②地理区域、历史时期、人物复分表;③文学复分表;④语言复分表;⑤人种、种族、民族复分表;⑥语种表。《国际十进分类法》(UDC),亦译作通用十进分类法,是一部著名的列举—组配式分类法。UDC与DDC、LCC一起,号称世界三大分类法,是目前欧洲使用最广的文献分类法。《冒号分类法》(简称CC)是印度图书馆学家阮冈纳赞编制的一部综合性分面分类法,在此后的发展过程中完善了分面分类理论。作为一个实用的分类工具,CC的使用仅限于印度的一些图书馆,但CC提出的分面分类理论,对世界分类法的发展具有巨大而深远的影响。(注:CC法理论意义>实践意义)《中图法》的类目体系是一个层层展开的分类系统。其基本大类(22个)以科学分类为基础,结合文献分类的需要,在5个大部类的基础上展开,分别是:①马克思主义、列宁主义、毛泽东思想;②哲学;③社会科学;④自然科学;⑤综合性图书。《中图法》的通用复分表共有八个,分别是:①总论复分表;②世界地区表;③中国地区表;④世界时代表;⑤中国时代表;⑥世界种族与民族表;⑦中国民族表;⑧通用时间、地点复分表。第七章分类标引又称为归类,是指依据一定的分类语言,对信息资源的内容特征进行分析、判断、选择,赋予分类标识的过程。使用本,是指特定的文献标引机构直接作为分类依据的分类法文本。分类标引的基本分类规则信息资源的分类应根据信息资源的性质,按照其各自的特点进行。信息资源的分类必须能体现分类法的逻辑性、等级性、次第性;信息资源必须归入最切合其内容的类;类分的文献必须归入用途最大的类;不能单凭题名、篇名的意义归类;应注意标引的思想性;第八章主题法含义:主题法师分类法以外另一种从内容角度标引和检索信息资源的方法。一般是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。特征:直接以语词作为检索标识以字顺作为主要途径以特定的事物、问题、现象,即主题为中心集中信息资源往往是通过参照系统等方式揭示主题词之间的关系主题法的类型按照主题法的选词方式,可以分为标题法、元词法、叙词法、关键词法;叙词法:是以从自然语言中提炼出来的、经过严格处理的语词(叙词)作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。是在一种综合多种检索语言技术方法的基础上发展起来的词汇控制系统。(叙词:指经过规范化处理的、以基本概念为基础的表达文献主题的词和词组,国内亦称主题词)叙词表的系统显示是一种通过改变编排方式,满足标引人员和用户从各种不同角度使用叙词的辅助工具。现代叙词表中,包括范畴索引、词族索引、轮排索引、分类主题一体化词表等形式。范畴索引:亦称分类索引,范畴表,是一种按照词汇所属学科或范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具。作用:⑴提供从内容角度查词的途径,便于从分类角度查找与某一范畴有关的叙词;⑵可以作为概略分类的依据,类分信息资源,编制分类检索工具;⑶是编表选词、处理词间关系的工具,在词汇分类的基础上处理,有助于提高词汇控制⑷的有效性和可操作性。词族索引:亦称等级索引,指将众多词族按族首词(款目词)字顺组织编制的索引。(词族:指一组具有属分关系的叙词按族系关系组织的词汇集合。)作用:⑴可从词族出发查词,自由扩大或缩小查找范围,改善标引和检索的效果;⑵可在计算机检索系统中,自动进行上位词登录;⑶可通过等级关系限定词义。轮排索引:亦称轮排表,是将词表中的叙词、非叙词按词素的字顺排列,含有同一词素的词组集中显示于一处的词汇表。作用:⑴增加检索入口。便于从词素角度出发查找词组,提高查词的速度;⑵专指叙词的选择。将具有同一词素的叙词集中在一起,有助于用户通过判断,选择最为专指的叙词用于标引;⑶词间关系处理。有助于利用词面成族的特点,发现遗漏的词汇或词间关系处理中存在的问题,以便加以改进。分类主题一体化词表:是一种实现分类语言和主题语言兼容互换的系统。通常在一个检索语言系统中,对分类表部与主题词表部的术语、参照、标识、索引四部分实施统一的控制,以满足分类标引、主题标引的需要。分类主题一体化词表的作用是:可以作为分类标引和主题标引的工具,同时进行分类标引和主题标引,两种标引数据可以相互转换,节省人力物力;用户可以通过它在一个检索系统中同时进行分类检索和主题检索,充分利用两者的优点,改进检索效果;可以通过两种的结合,改进和完善对类表的编制,包括改进选词的全面性和均匀性、构造词间关系的完整性、准确性,改进词表编制的质量和统一管理;可以成为不同检索语言之间兼容互换的工具。叙词表的语词可以分为后组词和先组词两类。后组词指以单元概念的语词形式收入词表的词,及单词;先组词是直接以复合概念的语词形式收入词表的词,即词组。词形控制:是指根据主题标引和检索的需要对语词形式及构成成分作出规定,以保证排列效果,方便检索。叙词表中叙词之间主要有三种关系:等同关系、属分关系和相关关系。等同关系:等同关系指一叙词与含义相同或相近,可以相互替代的语词之间的关系,又称同一关系、用代关系。等同关系除用来揭示同义词、准同义词之间的关系外,还可以使用于组代关系,指示一专指的非叙词和相应叙词组配形式之间的关系,以提高标引的一致性,降低标引的难度。属分关系:等级关系指上位概念叙词和下位概念叙词之间的一种关系,又称属分关系。相关关系:是叙词之间除等同关系、等级关系之外语义相关的一种关系,又称类缘关系。第九章国内外主要主题词表一览词表名简称类型《美国国会标题表》LCSH综合性标题表《医学标题表》MeSH专业叙词表《汉语主题词表》《汉表》综合性叙词表《中国分类主题词表》《中分表》综合性分类主题词表《社会科学检索词表》《社科检索词典》多学科分面叙词表《美国国会标题表》全称《美国国会图书馆标题表》,是目前世界上规模最大,使用最广的主题词表(标题表)。(P223,第九章)《汉表》(《汉语主题词表》)作为我国第一部大型综合性汉语叙词表,在我国主题标引和检索的发展过程中,具有不可替代的地位和作用,其特点(优点)是:结构完备词汇丰富探索了词表编制方法探索了叙词表的实际使用方法国内文献单位在机读目录,在版编目数据中都使用《汉表》的主题词,是国内广泛使用的综合性主题标引工具。(P241)《汉表》的辅助索引包括范畴索引,词族索引,轮排索引和英汉对照索引四种。《中国分类主题词表》包括《分类号—主题词对应表》和《主题词—分类号对应表》两部分。(P238,第九章)第十章主题标引的方式整体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论