信息组织的复习资料(重点)_第1页
信息组织的复习资料(重点)_第2页
信息组织的复习资料(重点)_第3页
信息组织的复习资料(重点)_第4页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章导言1、信息组织:亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、处理、序化,并以适当的方式加以提供的活动。2、信息组织的目的:是根据使用需要建立起信息资源收藏系统和检索工具,以便信息资源开发和利用。作为一种为了检索利用的需要对信息资源进行有序化组织的活动, 它是与信息检索活动密切联系的。3、信息组织与信息检索的关系(P3)(1) 信息组织是信息检索的基础和前提。(2) 信息检索是信息组织的出发点和归宿。总之,信息组织与信息检索是密切联系, 相辅相成的两个环节。 要使信息组织取得较好的效果,必须充分了解系统的检索需要,根据信息资

2、源的特点和用户的使用要求加以实施。4、按照检索工具的对象和特点,可以分为以下类型:(1)文献目录:是以文献集合中的文献单元为对象,对其进行记录、报道与揭示的工具,包括文献收藏和数目。 前者以一个或多个文献单位收藏的文献为对象加以描述和揭示; 后者则以某一领域、地域或者时限内出版的文献为对象进行组织,为用户提供较为全面的文献信息。(2)索引 : 是以文献集合中的文献单元或者文献中的信息单元为揭示对象的检索工具, 包括图书索引、期刊索引、报纸索引、专利索引、标准索引、档案索引、会议文献索引、词语索引、书后索引等。(3)机读数据库:是由文献资源为对象的机读记录的有序集合。这是一种依托现代计算机技术,

3、以机读形势建立的索引系统。(4)网络搜索引擎:这是一种以网络信息资源为研究对象的检索系统,实际上是数据库的一种特殊形式。5、按照依据的标识特征,检索工具可以分为两种:一类以信息资源的外部特征为检索依据, 提供从资源形势出发进行检索的途径。 常见的这类标识包括:责任者名、题名、机构名、出版地、出版社、标准书号、专利号、档案号、文献登录号等。另一类则以表达信息主题内容标识为依据, 提供从内容角度进行检索的途径。 主要有分类法和主题法两种。分类法以表达信息资源内容的标记符号为标识, 按照主题之间的关系进行系统组织; 主题法直接以表达文献内容的词语为标识,依据主题字顺等方式检索途径。按照系统中标识组配

4、的特点,检索系统可以分为先组式和后组式两种。信息组织的常见类型( P7)6、对信息资源处理的基本做法是:(1)对信息资源的特征进行描述。(2)对信息资源的内容进行浓缩。(3)提供检索点。7、检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。8、信息组织活动包括两个基本的方面:(1)信息组织的操作。指根据信息资源的内容和特征,对信息资源进行描述、标引、并将其组织进相应系统的过程。(2)信息资源组织规范。这是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作的依据。第二章信息组织原理1、信息组织的主要目的是为了

5、有效地检索和利用。一般认为下述因素是一个信息组织系统必须考虑的重要因素:( 1)检全率( 2)检准率( 3)检索速度和系统的及时性( 4)系统的易用性(5) 检索的成本效益2、检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。可以表示为:检全率 =检出相关信息资源量 / 系统相关信息资源总量 *100%表示系统检出相关信息资源的能力。3、检准率亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。可以表示为:检准率=检出相关信息资源量 / 检出信息资源总量*100%表示检索系

6、统排除与检索提问无关信息资源的能力。检索系统的检全率与检准率之间是一种互逆关系。 因为检全率高, 必然会检出一些内容关联程度较低的信息资源, 从而影响系统的检准率; 反之提高检准率, 则要求排除与检索提问关联程度较低的信息资源,必然会反过来影响系统的检全率。4、检索速度:指用户实施检索时获得检索结果花费的时间。5、系统的及时性:检索工具能否在较短时间内将信息资源纳入系统,以较快速度提供使用。6、系统的易用性:系统是否便于进行描述和标引操作,是否需要掌握复杂的专门技能才能使用,在处理过程中是否可以得到各种减少处理差错的提示和帮助等。7、描述控制:描述记录一般概要记录下一资源各种基本特征的数据,可

7、以以浓缩的方式集中反映资源的特征和内容。(1)描述项目的控制:根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。描述项目应该充分反映信息资源的基本特征和数据。(2)描述文字的控制:规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。(3)描述级别的控制: 规定对信息资源进行描述的详略程度。 应根据不同的使用对象和需求、信息资源的特点、设备条件加以确定。(4)描述格式的控制:包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。8、词汇控制:词汇控制是根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其

8、相关性的过程。9、词汇控制包括下述内容:同义控制:即对字面形势不同,含义相同的词进行控制,使一个概念只能用一个语词表达:目的是克服一义多词现象,将同一内容、特征的资源集中在相同的标识下。词义控制:即对同形异义词和语意含糊的词进行控制, 使得词义明确, 一个词语之表示一个概念,客服克服一词多义现象。常用措施:加限义词、增设含义注释和范围性注释等方法。词间关系控制:指揭示词汇之间的各种联系,使其还曾为一个语义相关的系统。10、句法控制:根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。11、句法控制的内容: 1、引用次序:指复合主题标引和检索时,各个主题因素的组

9、合次序2、辅助符号:是检索语言解释主题概念之间关系意义,进行检索操作的标识形式3、句式转换:简单地说,就是转换语词的排列顺序。12、辅助符号是检索系统进行句法控制的重要句法手段,它根据系统的特点和使用需要设置,可分别用于先组式检索系统和后组式检索系统。13、常见的组配符号有以下几种:(1)关系符号用于揭示语词组配中形成的关系类型的符号,常用于先组式检索系统。(2)逻辑组配符号使用逻辑符号对组配关系实施控制,可以进行各种演算,实施精确查找,常用于后组式检索系统。(3)联系符号用于揭示同一文献主题之间联系强度的专用符号,目的是防止主题词之间出现错误的组配关系,常用于后组式检索系统。(4)职能符号用

10、以表明主题标识在组配中的句法职能的辅助符号,作用是明确主题标识的句法含义,防止出现错误的组配关系。14、句式转换的形式通常有三种:(1)轮排转换。即依次将检索语句中每一个有检索意义的语词轮流在排检位置上出现,并对句子中其他语词在保持原有相对位置的情况下随着移动。(2)链式转换。即通过逐次拆卸链环的方式,依次将检索检索语句中每一个有检索价值的语词作为检索语句的入口。(3)分析转换。 即每次抽取少量主题词组配标题,使所有检索价值的词都可以成为检索入口。15、概念之间的关系:(1) 同一关系:具有相同外延的概念之间的关系。(2) 包含关系:一个概念在另一个概念外延之中,并且是另一个概念的组成部分。(

11、3) 交叉关系:部分外延重合的概念之间的关系。(4) 不相容关系:不存在共有外延的概念之间的关系。(5) 矛盾关系:外延之和等于上位概念的两个不相容概念之间的关系。(6) 反对关系:外延之和小于属概念的两个相互对立概念之间的关系。(7) 并列关系:一个属概念下几个不存在共有外延的并列种概念之间的关系。16、信息资源组织的特点:信息资源组织除应采用逻辑的方法, 以知识分类为基础外, 同时还必须根据信息资源的特点和检索需求进行控制,一般应考虑以下各方面因素:(1)文献保证原则:文献保证亦称文献根据,指信息资源组织应根据信息资源类型、数量等因素进行相应控制。(2)用户保证原则:所谓用户保证,即是指根

12、据用户需要进行描述控制和词汇控制。(3)与设备条件相适应:信息组织中的规范控制是在一定的设备条件下使用的,只有与设备条件的特点相一致,才能取得较好的实际效果。第三章信息描述1、信息描述:信息描述 , 亦称信息资源描述 , 是指根据信息组织和检索的需要 , 对信息资源的主题内容、形式特征、物质形态等进行分析、 选择、记录的活动。 在传统文献检索系统的编制中,信息描述又称为文献著录或书目著录, 是信息资源组织的重要内容。 信息描述的结果, 是获得描述记录,亦即元数据,用作信息资源的代替物组织检索工具。2、元数据:所谓元数据是关于数据的数据,或关于数据的结构化的数据。3、信息描述的作用:(1)识别:

13、确认并对要进行组织的信息资源进行个别化描述,使用户能识别该组织的资源对象( 2)定位:提供信息资源位置的信息,以便供用户访问时使用(3)检索:通过在描述数据中提供检索点,方便用户对资源的检索和利用( 4)选择:通过记录信息资源的各种特征,诸如主题、作者、资源类型、篇幅、出版或发布信息以及日期等,供用户对信息资源的使用价值进行判断,决定是否选择该资源4、信息描述的规范:为了一致、有效地对信息资源进行描述,便于不同机构之间的信息交换,信息描述通常应依据一定的描述规范进行。 (书目文献领域描述标准化的努力最为典型。文献描述标准,亦即文献著录标准。 )5、著录格式:指描述记录内各个描述项目的记录次序和

14、表述方式。6、描述信息源:又称著录信息源、著录根据,指进行信息资源描述时描述信息的来源和出处。7、检索点:检索信息资源所使用的题名、责任者、分类号、主题词等各种供检索使用的数据。8、题名检索点:建立题名目录的依据,可以从题名角度查找信息资源局,是检索文献的重要途径之一。9、参照法的基本类型:( 1)单纯参照、( 2)相关参照、(3)一般参照。(1) 单纯参照,又称直接参照,从不用作标目的标识去查找用作标目的标识。(2) 相关参照,又称兼互参照,从一个使用的标目去参考另一条或几条相关标目的参考(3) 一般参照,又称普通参照,是提供关于一定编目事项的说明,介绍用户使用系统的方法。9、规范文档:一种

15、根据信息组织的需要,对元数据记录的标目进行控制、跟踪、维护的工具,包括名称规范档、主题规范等。10、规范控制的作用:( 1)有利于以统一的方式加以记录。 ( 2)以规范、通用的形式加以记录(3)方便标引和检索( 4)有助于实现国际书目共享。11、名称规范档: 是一种对描述记录中的名称标目进行规范控制的工具。 其处理的范围, 包括人名、机构团体名、著作题名等。12、对几种基本名称类型的规范: (1)人名规范控制( 2)团体责任者规范控制( 3)题名规范控制13、计算机编码的作用:(1)控制显示方式( 2)提供检索点( 3)促进资源共享14、 MARC格式:机读编目格式是根据文献特点和文献机构之间

16、信息交换的需要建立的标准化的计算机可读形式。我国使用的是中国机读目录格式 ,简称 CNMARC。15、机读目录格式中,一个书目记录通常由以下四部分组成: ( 1)记录头标区( 2)地址目次区( 3)数据字段区( 4)记录分隔符16、标记语言的作用:为了方便计算机处理文档,例如标记前的文档,标记后的文档。17、标记语言: 标记语言是指在文本文件中使用一个代码集, 用于指示计算机在打印机或显示器上编排文件的格式,以及文件中的索引和链接内容等。18、标记语言的分类:一般通用的标记语言、特殊用途的标记语言。19、 SGML:描述电子文件的结构及内容的国际标准,文献的一种计算机语言的一种元语言。20、

17、SGML与 XML、 HTML的关系: HTML是由 SGML定义的,是 SGML在 WWW上的具体应用, XML是 SGML的子集。21、 XML:SGML的子集的一种元语言。它的优越性:扩展性,数据的显示与处理分离,支持异构系统间的通信,更有意义和更准确地搜索第四章信息描述工作1、为了保证元数据的质量,信息描述操作必须客观的反映信息资源的特征,严格遵守元数据规范进行操作,一般应做到: ( 1)准确。即对信息资源的描述应真实反映其内容特征,通常应根据描述对象提供数据加以记录, 必要时,也可以参考其他来源对有关的数据加以纠正, 使用可以通过描述,对信息资源的特征有一个准确的了解。 (2)规范。

18、指信息资源的描述应严格遵守相应的描述规范,并在可能时依据相关的规范文档或控制词表。 ( 3)完备。描述项目应比较完备,使得可以从信息资源的各种特征出发进行检索操作, 文献单位对传统文献的描述一般应按照系统规定的描述级别进行, 对各种电子资源, 特别是网络资源的描述, 也应该利用相关条件句对各种特征进行充分记录,尽可能保证基本数据的完备。2、信息描述工作的方式: (1)按照描述的资源对象,分为文献编目、档案编目、博物馆藏品编目、网络资源编目( 2)按照其处理的方式,分为原始编目和复制编目( 3)按照编目采用的组织形式,集中编目和共享编目3、在版编目:在文献出版过程中进行编目,使编目数据得以与文献

19、一起提供,方便文献机构使用。4、共享编目:两个或多个编目机构共同进行编目活动,通过各个参加机构通力协作,使编目结果为各参加机构共享的一种编目形式。5、OCLC:该机构原为美国俄亥州图书馆中心, 后来发展为对全美和各国进行书目服务的机构。中国高等教育文献保障体系(简称 CALIS)6、信息描述工作程序:( 1)查重( 2)描述(3)标引( 4)复核7、Connexion 系统的特点:(1)编目工作界面功能完备、形式简明、友好,能同时提供 DC、MARC方式的编目界面,使用者可以通过它方便地对网络资源进行各种与描述有关的操作。 ( 2)具有通过协作编目方式建立的资源目录,该目录的所有记录同时也进入

20、 OCLC的 Worldcat ,可以通过资源目录或 Worldca 检索已有的描述记录, 供编目操作时查重或作为信息描述的参考之用。(3)可以自动获取网络资源已有的元数据信息, 只要输入有关该资源的 urL 或各种相关数据,系统就能够自动获取网络资源的基本信息,在编目界面上显示,供进行各种必要的处理。(4)根据设计,可以通过系统与 DDC、国会标题表、人名规范文档等建立联系,并利用上述工具进行规范标引。(5)处理结果可以方便地实现不同格式如 DC格式、 MARC格式、 HTML语言方式、 XML语言方式。8、题名:创建者或出版者赋予信息资源的名称。9、责任者指对信息资源的生产负有责任的个人或

21、团体,是区别信息资源的的一个重要特征。第五章分类法1、分类及信息资源分类的特征分类 : 是指依据事物的属性或特征加以区分和类聚,并将区分的结果按照一定的次序进行组织的活动,分类是人类思维的基本形式,是认识世界的基本方法。信息资源分类的特征:(1)按照内容特征对的相互关系进行组织的。 (2) 从一定角度出发组织和揭示信息信息资源的( 3)采用一定的标记符号作为排序工具( 4)往往通过类目索引提供从字顺角度查找类目的途径。2、信息资源的作用:(1)进行资源组织( 2)建立分类检索工具( 3)分类统计 (4) 兼容工具3、分类法:一种从主题内容角度组织和揭示信息资源的方法,是分类方法在信息资源组织中

22、的应用。4、分类表:亦称信息资源分类表,是根据类目之间关系组织起来的,并配有一定标记符号的类分信息资源的工具。 分类表是分类法的具体体现, 它与分类规则一起构成分类语言, 是进行分类工作的依据和规范,十分关键。由于它的重要作用,人们习惯上也直接将它称为分类法。5、信息资源分类法按照其编制方式,通常可以区分为: ( 1)等级列举式分类法( 2)分面组配式分类法( 3)列举组配式分类法6、等级列举式分类法:等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法,亦称列举式分类法、枚举式分类法。特点:从一定的角度出发有层次地揭示信息资源,类目展开比较系统;分类结构显

23、示直观,易于把握、便于使用;标记简明,号码单纯,适于分类排架,也可以用于组织分类检索工具。不足: 揭示专门主题能力差, 往往无法满足确切分类的需要, 不能充分揭示现代文献中大量存在的细小专深主题;类表具有一定的凝固性,不便于根据需要随时改变、调整检索途径,不能进行多角度检索;无法根据现代科学的发展自动生成新类,难以与科学的发展保持同步;大型列举类表一般类目详尽、篇幅较大,对类表管理的要求较高。7、分面组配式分类法:以简单概念组成复合类目的分类法。特点:标引专指度较高,可以通过基本概念的组配,充分揭示信息资源中的复合主题;标记表达性强,可以表达出主题成分所属的分面,便于根据不同需要,调整组配次序

24、,进行多元检索;对科学发展的适应性强, 可以通过组配方式, 表达新产生的复杂主题, 有利于与科学的发展保持同步;类表的篇幅较小,便于管理、修订等。不足:分面类表的类目体系是隐含的,直观性不如等级列举式分类法;检索工具中的类目是根据组配建立的,类目分布往往不够均衡;标引难度较高,要求分类人员有较高的专业素养;分面标记的成分一般比较复杂, 号码冗长,不适宜用于组织文献排架, 主要用于组织检索工具。8、列举组配式分类法:是上述两种编制方式的结合,是一种在详尽类表的基础上,广泛采用各种组配方式的分类法,亦称半分面分类法。特点:以列举式类表为基础,具有一定的直观性广泛采用组配方法,基本上可以达到分面类表

25、同等标引水平。不足:列举式类表的管理修订工作,需要较大的工作量类目之间的组配要求使用多种辅助符号,标记复杂、冗长9、主表:是基本大类、简表、详表的合称。10、基本部类: 基本部类是为分类法的合理展开对知识范畴所作的最概括、 最本质的划分。 依据一定的知识分类体系来确定。11、简表:又称为基本类目表、主要类目表,是由分类表的基本类目组成的表。通常是在基本大类下展开的二、三级类目,在基本大类和详表之间起承上启下的作用。作用:(1)帮助用户迅速了解整个分类法的概况,通过它的引导,方便地在详表相应门类中查找相应的类目( 2)可供概略分类使用12、详表:是由详细列出的子目组成的类目表, 是分类法的主体和

26、正文, 类分信息资源的真正依据。13、复分表:为了增强类表的细分程度,缩小类表的篇幅,分类法一般将这些共性子目抽出,单独编列成表, 供有关类目进一步区分时共同使用。 这种将主表中按同一标准对类目划分产生的一系列相同子目抽出,单独编列,供主表有关类目共同使用的表,称为复分表,亦称副表、辅助表、共性区分表。14、复分表的作用:( 1)缩小类表的篇幅( 2)加强类表的伸缩性(3)增强类表的规律性15、复分表使用的注意事项:除有明确规定外,一般必须结合主表类目使用;是否使用复分表,应根据复分表中的说明以及类目下的注释确定;文献单位可以根据需要对复分表的使用加以调整, 但一经确定, 就应严格遵守, 不得

27、随意变动,以保持复分表使用的一致性。由于复分表使用意味着新的分类成分的插入,一般还应注意标记配置方面的有关规定。16、标记符号:亦称分类号,是分类法中用于标识类目的代号。17、分类号的作用: 具有固定类目次序, 显示类目之间关系的作用, 是分类法的重要组成部分。现代文献分类法正是通过以分类标记为中介, 将分类体系有效地用于组织文献收藏和建立检索工具。18、分类号的要求:( 1)简明性( 2)表达性( 3)容纳性( 4)助记性19、编号制度:(1)顺序标记制( 2)层累标记制( 3)顺序层累标记制( 4)分面标记制20、说明与注释: 有关分类表体系结构及使用方法的说明性文字。 分类法通过它说明类

28、表的编制原则、类目体系的特点以及使用方法等。通常包括如下三种形式:编制说明、大类说明、类目注释21、类目索引:一种按主题字顺方式,从主题名称指向分类号或相应类目,帮助分类人员利用类目表的辅助工具。 这种工具在每个类名及同义词后记录该类的分类号, 将所有的条目按字顺排列,通过将分类体系的系统排列转变成字顺排列, 从而可以从表达主题的语词出发找到相应的分类号,克服类目查找的困难。22、类目体系通过层层划分建立起来: 1、确定引用次序逐层划分类目 2、类目的排列 3、确定类名 4、类目的配号 5、类间关系的揭示和处理23、类目:又称为类,通常是指一组具有某一共同属性的事物对象的集合。是分类体系的基本

29、构成单元。类目的划分,即分类,是指依据一定的属性或特征对类目的外延进行区分,生成一组子目的过程。这是类目体系建立的基本方法。24、类目体系的建立: 类目体系的建立, 是从基本大类出发, 按照区分对象的属性, 层层划分,层层展开得到的。25、类目划分遵循的一般规则: (1)每次划分只使用一个标准(2)划分应该穷尽被区分类的外延( 3)划分后各子类应相互排斥,界限分明26、引用次序:指复合主题在标引和检索中,不同主题因素的组配次序。具体如下:27、引用次序的作用: 引用次序决定着类目体系以何种方式集中信息资源以及提供什么样的检索途径问题,是与分类体系的性能和适用性密切联系的。28、对同位类进行系统

30、排列的作用:可以揭示类目之间联系,方便相关类目的查找;有助于结合类目的排列, 明确类目的含义; 只要在系统排列中采用统一方式, 就可以增加类目排列的一致性和可预见性。29、类名:分类体系中表达类目概念的名称,它规定类目的含义和范围,是分类语言中表示类目概念的词汇单元。分类法的类名通常由单词或词组构成,用以表达学科、专业、事物对象及其方面等。30、选择类名的要求:(1)科学:一般不选俗称、旧称、不通用的同义词、简称、不准确的流行语等。(2)简明:一般略去子类中的上位概念。(3)确切:贴切揭示类目的内涵和外延,无法做到时通过类目注释补充说明。(4)通用:符合用户的使用习惯31、类名的确定:中图法对

31、除基本大类以外的大部分类目都采用缩减的形式予以命名,即将表示上位类含义的部分去掉,这样对大多数类目来说,只从类名字面是无法判断其含义的,必须结合上位类的意义才能准确判断其意义。32、(1)从属关系性质:指类目体系中一个类与其直接区分出来的子类之间的关系。特点:从属关系类目之间存在一种限定关系,即上位类的属性或特征必然存在于下位类之中,或对下位类产生限定作用。33、并列关系的性质:指类目体系中同位类之间构成的关系。特点:同位类之间由于都带有上位类的属性或为上位类所限定, 具有相互联系的一面。 同时,它们之间又各有自己的特有属性,因此又是相互排斥的。34、交替关系的性质:指交替类目与相应使用类目之

32、间形成的关系。特点:通常在一些知识门类具有多重从属关系, 同时隶属于两个或两个以上的学科或部门时使用。 交替类目是一种供选择使用的类目,它与使用类目之间是一种同一关系。35、相关关系的性质:指类目之间除从属、并列、交替等方式以外的其他联系。36、横向关系揭示的作用: 因为类目之间的关系不是简单的多对一或一对多的从属关系, 而是多对多的网状关系, 同时同级类之间也存在或近或远的联系, 要科学地组织类目体系, 就必须对这些复杂的关系加以揭示。 而且这样地揭示也增加了检索入口, 方便了用户使用分类工具进行检索。37、网络分类法与传统文献分类法的不同: ( 1)揭示角度不同( 2)类目的设置特点不同(

33、 3)展开的形式不同( 4)同位类的排列方式不同( 5)适用特点不同38、网络分类法不同于传统类目体系的组织和揭示形式:( 1)改进主题之间多维关系的(2)从多个角度组织信息资源( 3)进行轮排,亦即多表列类( 4)设置镜像类目( 5)动态组织分类体系( 6)用于联结不同的检索系统( 7)联结说明与规则系统第七章分类标引工作1、分类标引:信息资源进行分类组织的基础和前提,对信息资源的开发利用具有重要的意义。2、分类标引的意义:分类标引工作是对信息资源进行分类组织的基础和前提。通过对信息资源赋予分类标识, 信息机构就可以将各种信息资源纳入相应知识门类, 建立起相应的分类检索系统并提供各种检索途径

34、供用户查找。3、分类标引的要求:(1)准确:其一归类要正确,将信息资源归入对应的学科和专业;其二,归类确切,要将信息资源归入分类体系中最专指、最切合其内容的类目。(2)充分:即指恩那个根据使用需要,充分揭示有检索价值的信息资源主题。(3)一致:即对同一主题内容资源的标引结果应一致。(4)适用:标引应考虑系统的特点和用户的检索需要,使标引结果使用。4、分类标引的工作程序:查重主题分析归类给号审核(1)查重:查重通常在进行信息资源描述操作时统一进行。主要查核该标引对象是否为已经处理过的信息资源。(2)主题分析:要标引信息资源的主题内容,必须对资源的内容特征进行分析,确定需要揭示的主题概念。(3)主

35、题概念转换 - 归类:所谓归类,是指将主题分析的结果归入分类体系中相应的门类。一般应以特定的分类表为工具,根据其特点进行(4)确定标识 - 取号:根据确定的类目给予相应的分类号。(5)审核:在结束文献标引前,必须对每种文献的标引结果进行审核。5、一般分类规则:1. 单主题信息资源的分类标引: 单主题信息资源是论述某一特定事物对象的资源。 根据其论述特点又分为简单单主和方面单主题等类型。分类时,一般应按照该资源对事物、对象研究的学科角度,再根据论述的内容范围加以标引。具体方法如下:(1)简单单主题信息资源,指只论述一基本主题的资源,一般应按照主题对象的学科性质归类。(2)方面单主题信息资源,指论

36、述一主题一个或多个方面的资源,应根据其论述的方面以及各个方面之间关系归类。(3)论述主题两个或者两个以上方面的信息资源,应根据不同方面之间的关系, 确定其归属。2. 多主题信息资源的分类标引: 主题信息资源是指同时论述两个或多个事物对象的资源, 一般应按照论述的主题对象及其关系,区别情况分类。根据主题之间的关系,多主题资源包括并列关系、从属关系、联结关系等基本类型。3. 丛书、多卷书的分类标引:丛书的分类标引多卷书的分类标引4. 词典、百科全书、年鉴、手册的分类标引综合性词典、百科全书、年鉴、手册等的分类标引专科性词典、百科全书、年鉴、手册的分类标引语文词典的分类标引5. 目录、索引的分类标引

37、综合性目录、文摘、索引的分类标引专科性目录、文摘、索引的分类标引专书索引的分类标引6. 关于对著作的研究、注释的标引科学著作的评论、研究、注释的分类标引马列经典作家著作的评论、研究的分类标引文学作品的评论、研究的分类标引缩写、节选文献的分类标引7. 特种文献的分类标引技术标准和专利文献的分类标引的分类标引技术报告、学位论文的分类标引8. 非书资料的分类标引9. 网络信息资源的分类标引同类书排列的类型1. 常见的同类书排列类型:按到馆次序顺排按题名字顺排按出版的年代排按分编的先后次序排按著者姓名字顺排2. 按分编次序排:亦即按种次号排。所谓种次号,是指按照同类书分编先后,按每一种书为计数单位顺序

38、编制的号码。第 8 章主题法1、主题法:分类以外另一种从内容角度标引和检索信息资源的方法。2、目前国内外采用的主题法的类型很多,一般都具有下述特征: ( 1)直接以语词作为检索标识(2)以字顺作为主要检索途径 ( 3)以特定的事物、 问题、现象,即主题为中心信息资源 ( 4)往往是通过参照系统等方式揭示主题之间关系的。3、标题法:一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。4、元词法:克服标题法的不足发展起来的一种主题法类型,它是以元词作为主题标识,通过字面组配的方式表达信息资源主题的主题法。5、叙词法:是以从自然语言中精选出来的、经过严格处理的语词作为文献主题标识,

39、通过概念组配方式表达文献主题的主题法类型。6、字顺表:一种由众多叙词款目和飞叙词款目按字顺排列的一览表。7、范畴索引:亦称分类索引,范畴表,是一种按照词汇所属学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅助工具。8、词族索引:指一组具有属分关系的叙词集合。9、轮排索引:亦称轮排表,是将词表中的叙词按词素的字顺排列,使含有同一词素的叙词集中显示于一次的词汇表,是一种从词素的角度查找叙词的辅助工具10、叙词语言是在自然语言的基础上进行词汇控制的结果, 它广泛吸收了多种检索语言的技术和措施,对词汇的规范较为完备。11、叙词语言的词汇控制一般是根据标引和检索的需要进行的,包括词汇选择、词形

40、控制、词义控制、词间关系控制等基本方面。12、等同关系:指以叙词与含义相同或相近, 可以相互替代的语词之间的关系, 亦称同一关系、用代关系。13、等级关系:指上位概念叙词和下位概念叙词之间的一种关系亦称属分关系。14、相关关系:是叙词之间除等同关系、等级之外语义相关的一种关系,亦称为类缘关系。第九章国内外主题词表介绍1、美国国会标题表是美国国会图书馆在编目实践的基础上编制起来的标题表。2、汉语主题词表 是在中国科技情报所和北京图书馆主持下, 根据现代文献标引和检索的需要编制的一部大型综合性叙词表,3、中国分类主题词表在中图法和汉表主题词对应的基础上编制的分类法4、汉表的特点:(1)结构完备。(

41、2)词汇丰富( 3)探索了词表编制的方法(4)探索了叙词表的实际使用方法( 5)国内文献单位在机读目录、在版编目数据中都使用汉表的主题词,是国内广泛使用的综合性主题标引工具。5、汉表的不足:(1)在结构上,印刷型词表因篇幅巨大,组成分散,加之编排不紧凑,整体性较差( 2)在词汇上,存在个别专业收词过多,不同专业之间收词数量不平衡的问题。 (3)词间关系处理上,汉表等同率低于国内外同期专业词表平均值、基本上不设与组代词的等同项,无关联词数量大等,是影响词表易用性的比较突出的不足。 ( 4)汉表没有设置统一的管理机构,未确定明确的修订方针,缺乏健全的管理机制从而影响了词表的发展和使用。6、中国分类

42、主题词表的特点:(1)通过将中图法类目与汉表主题词的对应,建立起了一个分类语言与主题语言结合的一体化工具,可以利用它,同时进行分类主题的标引和检索,简化操作程序,降低标引难度,改进标引和检索的质量。(2)其分类法部分是将中图法 、资料法融为一体的类目体系,可以同时供图书资料标引使用,在作为图书标引工具时, 资料法部分的类目,可以作为中图法对应类目的说明对待。(3)其主题法部分,除收入原有的虚词外,还包括今年来中文图书奖标引中新增的虚词和对应表编制时的新增词,以及分类号 - 主题词对应表中出现的主题词组配形式,是汉表叙词比较完善的版本。(4)改进了字顺表的款目结构,改进了排检方法,采用音序和字形

43、结合排序,符合人们查找习惯,使得编排紧凑,便于查找,易于使用。不足1. 本表中的类目和对应主题词之间只有一种先组语言和后组语言之间的兼容互换关系,很难进行精确转换2. 类目的处理由人工按照概念关系的理解转换而成,存在随意性和不一致性,影响对应的质量第十章主题标引和主题检索工具1. 主题标引:是依据一定的主题词表或主题标引规则,赋予文献语词标识的过程。2. 主题标引与分类标引的异同相同:( 1)揭示的对象相同( 2)依据数据来源相同( 3)操作程序相同( 4)基本处理方法相同。不同:(1)主题分析的角度不同 (2) 转换途径不同:属于后组式检索语言 (3) 标识不同:分类号,主题词 (4) 揭示

44、的特点不同3. 标引方式 : 是根据文献特点和使用需要确定的标引和揭示文献主题的形式。包括:4、整体标引:一种概括揭示文献基本主题内容的标引。5、全面标引:一种充分揭示文献论及的所有有检索价值的主题概念的标引。6、对口标引:一种只揭示文献中适合本专业需要的主题内容的标引。7、综合标引:一种以集合型信息资源的整体为单位进行的概括性标引8、分析标引:一种根据信息资源中部分片段或集合型信息资源的构成单元进行的标引9、主题分析:指根据文献标引和检索的需要,对文献主题内容进行分析,提炼主题概念的过程。10、主题分析的特点:(1)、不必受学科体系限制,比较直接。(2)、不受等级列举形式的束缚, 对主题成分

45、揭示比较充分, 可以在深入分析主题构成的基础上,对主题概念做出取舍,通常在分析文献主题类型,主题结构的基础上,根据主题标引的需要进行。11、分析主题类型(1)单主题和多主体(2)单元主题、复合主题(3)主要主题和次要主题(4)专业主题和非专业主题(5) 显性主题和隐性主题12、我国国家标准中提出的主题分面公式:A 主体因素( A1研究对象、 A2 材料、 A3 方法、 A4 过程、 A5 条件等)B 通用因素C 空间因素D 时间因素E 文献类型因素13、主题标引规则:( 1) 主题标引的查询规则(2)组配标引的组配规则14、主题标引的查询规则:采用正式叙词标引。选取最专指的叙词标引。组配标引。

46、上位叙词标引。靠词标引。例 : 将“藏书剔除”,标引为:“图书登录”。增词标引。自由词标引。标引数量: 一般每种图书的标引词数量保持在个之间, 机检系统主题词数量可适当增加。15、组配标引:是指将两个或两个以上叙词按照一定的逻辑关系结合在一起,表达文献主题。限定组配的类型:特称限定组配。方面限定组配。说明语限定组配。联结组配。16、主题检索工具:主题检索系统大多采用后组方式,有的也利用标引成果,在显示检索结果的同时提供标引题浏览的功能, 往往在一定机读编目格式的基础上, 通过一定软件进行操作的。17、按照采用的设备条件,分为:手检主题工具,包括主题目录和主题索引;主题机检系统,可以是不同对象的数据库。18、按照组配先后,分为:先组式检索系统,通常需要预先建立标题;后组式检索系统,不必预先建立标题,根据用户的检索式组配检索。19、按照是否控制,分为:控制系统;自然语言系统20、主题检索系统的功能设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论