《信息组织与信息构建》第四章 信息组织流程与系统设计_第1页
《信息组织与信息构建》第四章 信息组织流程与系统设计_第2页
《信息组织与信息构建》第四章 信息组织流程与系统设计_第3页
《信息组织与信息构建》第四章 信息组织流程与系统设计_第4页
《信息组织与信息构建》第四章 信息组织流程与系统设计_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息组织与信息构建第四章信息组织流程与系统设计目录contents第一节第二节第三节信息组织流程与系统功能主题分析信息描述与标引

分类法系统第四节主题法系统第五节学习目标了解信息组织系统的构成及功能;理解并掌握主题分析的意义和要求;认识信息描述与标引对信息组织的意义;理解并掌握信息分类法不同类型的特点及应用规则;理解叙词法的结构与功能之间的关系以及在网络信息组织中的应用规则。第一节信息组织流程与系统功能

一、信息组织流程与系统功能一个信息系统执行三个基本的功能:存储(数据组织)、检索(基于询问)和显示(界面设计)(见图1)这三个功能缺一不可,并且每一个功能的实现都依赖于其他两个功能(见图2)。图1,信息组织系统功能图图2,系统各功能实现关系

一、信息组织流程与系统功能由此可以看出,信息组织的业务流程至少包括以下几个方面的内容:对信息体的主题分析,按规范进行描述著录,给予一定控制规范标识,最后进行排序显示并构成信息检索系统的过程。信息组织与信息检索各业务流程图第二节二、主题分析的目的和意义一、主题的含义和结构主题分析

一、主题的含义和结构信息体主题可以定义为:直接概括信息体中有参考和检索价值的单元内容的概念,它重点指向内容单元所论及的核心事物或论题,同时应兼顾用户需求对主题确定的影响。(一)主题的含义(二)主题结构主题结构,是指构成主题的概念因素的类型、数量及相互关系。通用主题结构可以描述为:任何主题至少有一个事物因素,最多有事物因素、特称因素、部分因素、方面因素、关联因素等五种因素。这些因素之间具有相对性,可以相互转换。

一、主题的含义和结构主题因素如下:(1)事物因素:表示某事物。(2)部分因素:与事物因素相结合表示事物的部分。(3)方面因素:与事物因素或事物及部分因素一起表示事物或其部分的方面。(4)特称因素:与事物因素组合表示某事物的“种”事物,与部分因素或方面因素组合表示事物部分或方面的“种”部分或方面。(5)关联因素:事物与事物、事物的某一(些)部分或方面与另一事物的某一(些)部分或方面的某种联系,可以归结到关联因素中。(一)主题分析的含义(二)主题分析的目的(三)主题分析的意义(四)主题分析的应用二、主题分析的目的和意义二、主题分析的目的和意义(一)主题分析的含义信息体的主题分析是指标引过程中了解和选择信息体内容、形成和分析主题概念的环节。它主要通过审读信息体并了解其内容及表现形式,选择内容单元而确定信息体的主题数量,进而概括出主题概念的过程。国外相关领域有时将标引符号的转换过程等视为主题分析的内容,这是与我国不同的地方。二、主题分析的目的和意义(二)主题分析的目的通过检索工具为信息体提供有意义的主题检索入口。类聚具有相同性质的信息体。将相似的信息体按某种逻辑顺序排列。提高检索效率,节省用户的时间。二、主题分析的目的和意义(三)主题分析的意义主题分析是文献标引不可缺少的环节。分析出的主题和主题因素的多少决定着标引深度。标引深度是指用标引语言揭示信息体内容的详尽程度。它可分解为标引网罗度(标引的主题多少)和标引专指度(各主题所用标识的多少或确切性),最终以标引所给的标识数量来衡量。析出主题概念或概念因素的准确性从根本上决定着标引的准确性。析出主题概念或概念因素是否符合用户的需要。它将影响标引的有效性和信息体的利用率。二、主题分析的目的和意义(四)主题分析的应用在实践中,主题分析应尽可能做到:不遗漏应该分析出的主题概念,也不过度析出主题概念,力图用准确的概念概括相应的内容。此外,尽管一些信息体的主题看似很容易确定,实际操作中可能却并不那么简单。主题分析过程本质上是一个主观性和客观性相统一的过程,主题分析的主体因素的变化,也是造成主题难以确定并且难以保持一致性的重要原因所在,如主题分析者的文化差异、分析使用方法的不同、标引深度的差异等都可能造成主题分析的不一致性,标引语言的使用只能部分地解决这方面的问题,而难以根本解决。第三节二、信息标引及其工作机制一、信息描述及其工作机制信息描述与标引描述,主要是通过记录信息形式特征来描述文献;标引,主要是通过记录信息内容特征来揭示文献。描述是标引的基础和前提,标引是描述的深化和延伸。一、信息描述及其工作机制(一)信息描述的基本概念信息描述是指根据信息组织和检索的需要对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。(二)信息描述的作用(1)识别:确认并对信息资源进行个别化描述。(2)定位:提供信息资源位置的信息(物理位置和虚拟位置)。(3)检索:为用户提供检索点,为信息资源专业人员提供组织检索工具的依据。(4)选择:根据著录项目信息,用户确定信息资源的使用价值。一、信息描述及其工作机制(三)信息描述的要求(1)准确:描述来源和描述项目内容要准确。(2)规范:描述过程(项目、格式、文字、符号、级别等)严格遵守描述规范。(3)完备:不同信息资源特征(如不同类型、不同级别、不同检索工具的需要等)要按照规定采用相应完备的著录项目。四)信息描述规范及实例介绍信息描述规范是指根据信息资源特点和检索工具需要而制定的一系列信息描述标准与规则的统称,是指在国家或国际范围内对信息资源描述的原则、内容、格式等制定的具有一定约束力的一系列规则与标准。一、信息描述及其工作机制(四)信息描述规范及实例介绍1.描述规范实例(1)ISBD。ISBD(InternationalStandardBibliographicDescription)项目的中文译名为《国际标准书目著录》。具体来说,ISBD系列包括:一、信息描述及其工作机制ISBD(G) 总则ISBD(PM) 印本乐谱ISBD(A) 古籍ISBD(CP) 部分分析法ISBD(M)专著、单行著作ISBD(CM) 地图资料ISBD(S) 连续出版物ISBD(NBM) 非书资料(四)信息描述规范及实例介绍(2)AACR2。AACR2(Anglo-AmericanCatalogingRules:2)中译名《英美编目条例(第2版)》,是英美国家对ISBD的调整和细化。它由两部分组成:一部分是关于著录,共13章,主要根据ISBD的版本对各种文献资料的著录格式作了规定;另一部分是关于标目、统一书名和参照,共6章,对著录标目、书名和参照款目的著录都分别作了规定。一、信息描述及其工作机制(四)信息描述规范及实例介绍(3)我国文献著录规则。著录总则是根据多种文献的共同特点将著录原则、内容、格式和标记符号作统一规定;《文献著录总则》包括:引言,名词、术语,著录项目,著录项目标识符和著录内容识别符,著录格式,著录详简级次,著录用文字,文献类型标识符,著录根据,著录项目细则。其中著录项目细则是《文献著录总则》的主体。一、信息描述及其工作机制(四)信息描述规范及实例介绍2.信息描述规范的具体内容(1)著录根据。著录根据主要指著录信息源、著录项目的选择以及著录的原则。著录信息源:指描述信息的来源和出处。因为在不同信息源记载有出入时,存在选择,需要注明信息的确切出处。选择项目:从何处获得描述数据,对同一描述项目,应以何处提供的描述信息为准,这也是决定描述质量的重要原则。著录原则:一般应根据文献类型,指定一个主要的信息源,在该信息源描述不充分时,再依据其他来源。一、信息描述及其工作机制(四)信息描述规范及实例介绍2.信息描述规范的具体内容(2)描述(著录)项目。描述项目是指揭示文献内容和特征的记录事项。它的组成可以根据描述项目与描述特征之间的关系分为基本描述项目与描述子项目两部分。以《文献著录总则》为例,其基本描述项目为9项:题名和责任者项,版本项,文献特殊细节项,出版发行项,载体形态项,丛编项,附注项,文献标准编号及有关记载项,提要项。相应描述子项目有28项。此外,相应的描述子项目是基本描述项目的细化,是深度揭示文献特征的重要依据(见下表)。一、信息描述及其工作机制一、信息描述及其工作机制基本描述项目子项题名和责任者项正题名并列题名副题名及说明题名文献类型标识第一责任者其他责任者版本项版次及其版本形式与版刻有关的责任说明文献特殊细节项

出版发行项出版地或发行地出版者或发行者出版年月或发行年月印刷地,印刷者,印刷年月载体形态项页数、卷(册)数图尺寸(开本)附件丛编项正丛书名并列丛书名副丛编名及说明丛编名文字丛编责任者国际标准连续出版物编号(ISSN)丛编编号基本描述项目子项附注项

文献标准编号及有关记载项国际标准文献编号中国标准文献编号装订价格提要项

标识项分类号主题词一、信息描述及其工作机制(四)信息描述规范及实例介绍2.信息描述规范的具体内容(3)描述符号与文字。《文献著录总则》中的辅助符号通常分为两种:著录项目标识符和描述内容识别符。著录项目标识符又称前置符,用来表示描述项目,置于著录项目之前,依次为:“.—”表示各大项符号。“=”表示并列题名,并列丛编名。“:”表示副题名及说明题名文字、出版者或发行者、图书及其他形态、副丛编名、价格。“/”表示第一责任者名。“;”表示不同著作方式的责任说明、同一责任者的合辑题名中的第二部分、第二出版地或发行地、尺寸、丛编编号。一、信息描述及其工作机制“,”表示分辑(卷)题名、相同著作方式的其他责任说明、出版日期、国际标准连续出版物编号、分段页码、其他载体形态。“.”表示分辑(卷)次,附属丛编。“∥”表示析出文献的出处。描述项目识别符使用时的规则如下:1)大项标识符“.—”占一格,小项标识符占两格。标识符前后不空格。描述文字回行时,标识符一般留在前一项末尾。在此情况下,符号“.—”可省略“—”。2)重复描述一个项目时,须重复添加该项目的标识符号。大项第一小项本身无标记符号,在重复时,应按有关规定添加。3)当某一著录项目省略或无著录内容时,同时删除其标识符。当后面的小项移动至大项前列时,省略其标识符号。一、信息描述及其工作机制内容识别符的作用是标识描述项目中的部分内容,通常位于描述项目的外部、中间或末尾,包括:“()”表示责任者机构名、中国责任者时代、外国责任者国别及姓名原文、印刷地、印制者、印制年、丛编项等。“[]”表示文献类型标识,自拟描述内容,如自拟题名、经考出的责任者名、出版时间等。“…”表示省略描述内容。“?”表示推测或不确定的内容。“·”表示不同责任者的合辑题名中第二部分及其责任说明、外文缩写。“~”表示起止连接。一、信息描述及其工作机制(四)信息描述规范及实例介绍2.信息描述规范的具体内容(4)描述格式与详略级次。描述格式是指各个描述项目排列的次序与要求(见图4)。

正题名=并列题名;副题名及说明文字/第一责任者:其他责任者.—编次及其他版本形式/与版本有关的责任者.—文献特殊细节.—出版地或发行地等.—数量及其单位:国际文献标准号图及其他形态;尺寸或开本+附件.—丛编项.—附注.—国际文献标准号;中国文献标准标号:价格提要:图4描述格式二、信息标引及其工作机制

(一)标引与标引语言1.标引含义所谓信息标引,又称信息揭示,是指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达它们,从而赋予文献检索标识的过程。信息标引过程通常被认为包括两个环节:首先是主题分析,了解文献的属性(内部和外部),用自然语言概括主题。其次是转换标识,用专门的标引(检索)语言中的标识(语词)表达概括信息体内容的主题概念或概念因素,构成一定的检索标识。二、信息标引及其工作机制

(一)标引与标引语言2.标引语言标引语言是根据标引和检索需要而编制的人工语言。标引语言又称检索语言、索引语言、受控语言或规范语言。它也是由词汇、语法构成。标引语言的语法是指构造和使用标识,以正确表达主题概念的一整套规则。如何使用单个的标识或标识的组织(组配)来正确表达主题概念,涉及许多标引规则,如分类号的编制规则、主题词的优选规则等。标引语法包括造词和用词的词法,以及使用多个词进行组合的句法等,前者体现在语言的词汇控制之中,后者体现在句法控制中。二、信息标引及其工作机制

(一)标引与标引语言3.标引语言的类型(1)依据构成原理可将标引语言分为分类语言、主题语言和代码语言,此为最基本的划分。运用不同标引语言产生不同的标引类型:分类标引和主题标引。(2)依据标识组合时间的先后可将标引语言分为:先组式语言和后组式语言。二、信息标引及其工作机制

(二)标引的方式1.依内容单元选择方式区分(1)整体标引:它是指对信息整体内容提取主题予以标引的方式。(2)全面标引:它是深入揭示文献信息中的各部分内容,全面提取各局部主题予以标引的方式。(3)对口标引:是指只选择文献中对本单位或本系统用户有检索和参考价值的部分内容,提取个别局部主题予以标引的方式,亦称重点标引。(4)分析标引:是指在整体标引的基础上,再细化部分内容的标引,以作补充标引。(5)互见标引:从多角度或多学科提取主题予以标引的方式。二、信息标引及其工作机制

(二)标引的方式1.依内容单元选择方式区分(1)整体标引:它是指对信息整体内容提取主题予以标引的方式。(2)全面标引:它是深入揭示文献信息中的各部分内容,全面提取各局部主题予以标引的方式。(3)对口标引:是指只选择文献中对本单位或本系统用户有检索和参考价值的部分内容,提取个别局部主题予以标引的方式,亦称重点标引。(4)分析标引:是指在整体标引的基础上,再细化部分内容的标引,以作补充标引。(5)互见标引:从多角度或多学科提取主题予以标引的方式。二、信息标引及其工作机制

(二)标引的方式2.依所用标识受控程度区分(1)受控标引:是使用受控语言(标引语言)中的标识所进行的标引。(2)自由标引:是使用自然语言语词作标识所进行的标引。(3)混合标引:是同时使用受控语言的标识和自然语言语词作标识所进行的标引,又称半控标引。另外,通常把多角度全面标引称为深标引;反之,则为浅标引。二、信息标引及其工作机制

(三)标引工作的程序人工标引工作的程序图第四节二、分类法的类型及特点一、分类法的意义分类法系统三、网络信息分类法一、分类法的意义

(一)信息资源分类的含义信息资源分类是一种从内容角度组织和揭示信息资源的方法,是分类法在信息资源组织中的应用。信息资源分类的主要依据来自两个方面:信息资源的本质属性和非本质属性。信息资源的本质属性是指载体上所记录的科学知识内容,它从根本上体现了信息资源的价值和使用价值;信息资源的非本质属性是指载体的外在形式特征,如载体形态、语种等。一、分类法的意义

(二)信息资源分类的意义(1)按照内容特征的相互关系进行组织是分类法在信息组织中的应用,它要求不仅要按资源内容进行区分和类聚,还要按照类目关系组成等级性系统,用户既可以按照等级系统查找所需内容,也可以根据类目之间的关系,扩大或缩小检索范围,由此及彼地查找相关资料。

(2)对信息资源的分类是从一定角度出发组织和揭示信息资源,由于信息资源主题内容的联系是多维的,分类法一般只从内容角度揭示其主要联系,而选择哪个联系作为主要揭示的联系,是根据信息资源用户的需求决定的。一、分类法的意义

(二)信息资源分类的意义(3)采用一定的标记符号作为排序工具。现代文献大多采用一定的标记符号系统——通常由数字或字母组成——表示类目之间的关系。标记符号的优点是简单、明了、通用性和排序性好,缺点是直观性差,必须与类名结合使用。(4)通过类目索引提供从字顺角度查找类目的途径。类目之间的关系体系有时也会给查找带来困难,主题数量在文献内的不断增加,使人们从主题关系角度查找类目增加了难度,类目索引的目的就是便于人们从字顺的角度查找类目,类目索引成为架起主题与分类号之间的桥梁。二、分类法的类型及特点

(一)等级列举式分类法等级列举式分类法,是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法,亦称列举式分类法、枚举式分类法。表现形式:类目体系组成一个树状结构,按照划分的层次,列出详细类目,以缩格表示类目等级关系,最后形成一个等级链。特点:分类结构显示直观,易于把握,便于使用;类目体系展开比较系统,并可做适当等级调整;标记简明,适于分类排架,适于组织分类检索工具。缺陷:揭示专门主题能力差,具有一定的凝固性,不便于调整检索途径和多角度检索,无法根据科学发展自动生成新类,不能保持与科学同步;篇幅较大,管理要求较高。二、分类法的类型及特点

(二)分面组配式分类法最常用的分面组配分类法是冒号分类法(CC)和布利斯书目分类法(BC2)。我国常用的中文范畴理论引用次序进行分面,具体为:(1)主体因素;(2)通用因素;(3)位置因素;(4)时间因素;(5)文献类型因素。表现形式:类表中按范畴列出各种基本概念(组面),分别配以相应号码,据主题分析,选择基本概念及标识号码,将标识组合、排序(先后次序按照分面公式)。特点:标引专指,可以通过概念组配,表达复合主题;标记表达性强,便于调整标记次序,多途径检索,易于适应科学的新发展;类表篇幅较小,便于管理和修订。不足:分面类表类目体系不够直观;检索工具中的类目是组配而成的,类目分布不均衡;标引难度较高,专业素质要求较高;分面标记成分复杂,号码冗长,不宜用于排架。二、分类法的类型及特点

(三)列举—组配式分类法列举—组配式分类法是上述两种编制方式的结合,是一种在详尽类表的基础上,广泛采用多种组配方式的分类法,亦称半分面分类法。特点:以列举式列表为基础,有一定的直观性;广泛采用组配方式,可以达到分面类表同等标引水平;管理列表工作量大,组配符号标记复杂、冗长。该分类法当前以《国际十进分类法》(UDC)和俄国的《图书馆书目分类法》为代表。三、网络信息分类法(一)网络信息的特点及其对分类法的影响(二)网络信息分类法与传统分类法比较(三)传统分类法在网络信息组织中的应用三、网络信息分类法(一)网络信息的特点及其对分类法的影响网络信息资源与传统信息资源相比有许多特点:数量巨大而且繁杂;内容范围涉及领域广泛;信息类型众多;更新频率快,且动态性高;由于大部分网络信息都是超文本链接,形成信息的非线性网状结构的信息集合体;在信息的流动方式上呈现出复杂的有序与无序并存的现象等等。网络信息技术环境的特点:TCP/IP、数字技术、多媒体技术、超文本、WWW、人工智能、数据库技术及相应的硬件等是网络信息技术环境的支撑,并且这个环境中的技术更新和变化速度之快是前所未有的。三、网络信息分类法(二)网络信息分类法与传统分类法比较1.分类法所涉及的知识范围不同2.分类法的分类对象不同3.分类法的功能存在差异4.分类法在编制方法上的不同三、网络信息分类法(三)传统分类法在网络信息组织中的应用1.应用现状分类法在网络信息组织中的应用大体有两种类型:一是以某个分类法为依据,经过必要的改造后作为组织网络信息的主体,多数建立浏览结构,基本以人工标引方式采用已有的分类法进行组织,应用的主要范围是大学、图书馆、学术性网站;二是在设计分类导航系统时,在整体上或局部上参考一个或几个文献分类法的类目体系,这是主要的应用形式,比如,以人工标引或自动标引方式采用的自编分类系统等文献分类法直接用于网络信息组织(网站、搜索引擎等)。三、网络信息分类法(三)传统分类法在网络信息组织中的应用2.传统分类法为适应网络信息组织的调整根据网络信息的特点和网络信息用户的需求,传统的文献分类体系通常需要做以下调整,以适应网络信息组织的需要。(1)可以增加必要的非学术信息类目,适应网络上的各类信息和多媒体资源,并适当按照用户的需求程度,突出信息量大、利用率高的类目。(2)应将按学科聚类和按主题聚类结合起来,满足不同层次用户需求的浏览查询需要。(3)考虑到网络用户的耐心程度较低,适当简化类目划分层次,尽量维持在2~3级左右。(4)尽可能揭示信息之间的横向关系,通过分面分析和多重列类,实现对一个类目的多标准划分。(5)应注重分类法的界面设计和功能体现,以保证适应网络环境的特点及网络用户的行为习惯,为用户提供更好的用户体验等。三、网络信息分类法(四)网络信息的自动分类问题1.自动分类的类型自动分类按分类的方式不同存在两种类型,一种是自动聚类,一种是自动归类。自动聚类和自动归类的主要区别:自动聚类不需要事先定义好分类体系,而自动归类则需要事先确定好类别体系,并且要为每个类别提供一批预先分好的对象作为训练文集,分类系统先通过训练文集学习分类知识,在实际分类时,再根据学习到的分类知识为需要分类的文献确定一个或者多个类别。三、网络信息分类法(四)网络信息的自动分类问题2.自动分类的程序自动分类的程序大体包括信息采集、文档表示、抽取分类特征、相似性匹配、网站信息整理等步骤,见下图文本自动分类过程主题法系统一、主题法的含义与特征二、主题法的种类三、叙词法原理四、主题法在网络环境中的应用第五节一、主题法的含义与特征(一)主题法的概念主题法是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。主题法包括标题法、单元词法、叙词法和关键词法等,它们共同组成主题法系统。主题法是信息资源的主题整序方法,是主题标引语言的统称。其中,主题词是主题法的主体,主题标引是主题法在信息组织中的应用。于是,各种各样的主题词表成为主题法发展演化的主体。一、主题法的含义与特征(二)主题法的特征(1)直接选用自然语言中的语词进行标引和检索,而不是像分类法那样采用一种抽象的号码系统作为检索标识。(2)以字顺为主要检索途径,通用性强。(3)以特定事物、问题、现象即主题为中心集中信息资源。(4)通过详尽的参照系统等方式揭示主题词之间的关系。二、主题法的种类(一)标题法1.标题法的含义最早的主题法就是标题法,它是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。其中,标题词是指经过词汇控制,用来标引文献的词或词组,通常是比较定型的事物名称,如图书分类法、信息组织、信息科学等。标题法的依据是标题表,目前最常用的是1909年诞生的《美国国会图书馆标题表》。杜威(Dewey)第一次采用标题法的原则编制出DC分类法的相关主题索引,这是把分类法与主题法相结合的一项重要举措。二、主题法的种类(一)标题法2.标题法的特点优点:采用列举式词表,形式直观;采用定组式标题,结构固定,含义明确;按照词表列举的标题和副标题进行标引,操作简便;通过参照方式对词汇进行控制,并揭示标题的相关性。不足:由于采用列举方式,往往造成收词量巨大、专指度相对不足、修订量大等问题;采用定组式标题,无法从多角度多因素检索。二、主题法的种类(二)元词法1.元词法的含义元词法是以元词作为主题标识,通过字面组配的方式表达文献主题的主题法。元词,是指用来标引文献主题的、最基本的、字面上不能再分的语词,如“马克思”、“图书馆”等。2.元词法的特点优点:元词法词表体积小;标引专指度高;便于从不同角度进行检索;适合对专指主题进行标引。不足:直接性差;不适宜用于查找基本单元主题外延很大的元词文献,如“经济”、“科技”等主题;采用字面组配方法,在与语义分解不一致时,容易产生误差;早期的元词法不建立参照系统,不利于相关资料的查找。二、主题法的种类(三)叙词法1.叙词法的含义叙词法是以从自然语言中精炼出来的,经过严格处理的语词作为文献主题标识,通过概念组配的方式表达文献主题的主题法类型。叙词是指经过规范化处理的、以基本概念为基础的表达文献主题的词和词组。以叙词表为依据,国外叙词数量超过千种,国内超过130种,目前常用的是《汉语主题词表》(以下简称《汉表》)。二、主题法的种类(三)叙词法2.叙词法与元词法的异同叙词法与元词法的相同点是将分面分类中的组配引入主题法,差异是以概念组配取代元词法的字面组配,二者有本质上的区别。对语词单位的要求不同。组配的原则方法不同。字面组配与概念组配实例分析。例如:“脑肿瘤”、“河北梆子”、“香蕉苹果”、“熊猫蚊香”。二、主题法的种类(三)叙词法3.叙词法的特点优点:结构完备,词汇控制严格;组配准确,标引能力强;检索效率高,可灵活组配,多途径检索;检索系统适应能力强,可同时适应手检和机检。不足:词表编制和管理的难度大,需花费较多人力、物力;文献标引需在概念分析的基础上进行,难度大,要求高,对标引人员的素质要求较高。二、主题法的种类(四)关键词法1.关键词法的含义关键词法是一种快速简便的检索方法,是指将文献原有的、能描述其主题概念的那些具有实质意义的词抽出,不加规范化或只作少量的规范化处理,按字顺排列,以提供检索途径的方法。关键词只出现在文献中,并能反映主题的重要语词,一般是具有实质意义的语词(入口词)。二、主题法的种类(四)关键词法2.关键词法与单元词法的不同(1)单元词的同义词和近义词是经过优选的,关键词保持用词原状,甚至对同一词的单复数和变格等词形变化不加统一而保持原状;同义词、近义词、一个词的不同形态并存;所有的关键词都是平等的,全部按字顺排列;若干关键词结合构成一条索引款目;全部关键词在检索系统中都彼此孤立,无任何联系。(2)关键词法在国外主要适用于计算机编制各种关键词索引,如单纯关键词索引、题内关键词索引、题外关键词索引等。二、主题法的种类(四)关键词法3.关键词法的特点优点:标引无须主题分析和查看词表,简便易行;标引和索引易实现自动化,保证信息更新的及时性;自然语词的使用,表现直观、专指关键词法。不足:自然语词的采用,规范化程度低,易造成漏检;关键词法不显示等级关系和相关关系,不易族性检索;由于检索系统编制效率的需要,关键词多限于从文献中特别是标题中抽取,由于部分文献标题不能充分反映文献主题而发生漏检。三、叙词法原理(一)叙词表的含义体系结构是以规范化的、受控的和动态性的叙词作为基本成分,以参照系统显示词间关系,并通过叙词的字顺表和辅助索引,用于标引、存储和检索文献的一种情报语言词汇表。叙词表的宏观结构见下图,三、叙词法原理(二)叙词表的结构1.字顺表字顺表基本构成单元包括叙词款目和非叙词款目,两者都由款目项、标注项及参照项组成。《汉表》叙词款目样例三、叙词法原理(二)叙词表的结构2.专有叙词表专有叙词表的类型包括人名、地名、机构名、产品型号等,如《汉表》中包括世界各国政区名称、自然地理区划名称、组织机构和人物四个专有叙词表。此外,建立典据文档和指定工具书也是常用的方法。3.双语种索引在我国,应用最多的还是英汉对照索引。这种索引在实际应用中也会涉及许多问题,如译名的单复数形式,译名与正式、非正式叙词的对应关系,外文词的排列等问题。三、叙词法原理(二)叙词表的结构4.范畴索引范畴索引编制内容通常包括以下几个部分:范畴索引类目的设置、范畴索引类目的组织、范畴索引类目标记的编码和确定范畴索引中的收入词范围。范畴索引的标记编码多数为单纯数字号码,一般是采用两个或两个以上数字表示一个划分等级,编码制多采用层累方式;范畴索引中的收入词通常全部是正式和非正式叙词,并且非正式叙词后保留Y项参照,原则上将同种含义的叙词与非叙词分入一类,每类词量大约40~80个为宜。对具有多个范畴属性的词,可同时在各类中重复反映。三、叙词法原理(二)叙词表的结构5.词族索引词族索引中收词规则比较严格,索引中的词须是具有明确属分语义关系的正式叙词。每个词族中都有一个族首词,主要是指那些能概括一族主题词的最上位概念的词。族首词通常满足以下条件:它在索引中只有“F”关系,没有“S”关系;同时,族首词必须是具有一定专业范围的族性检索意义的主题词。无专属的主题词不能选作族首词,例如,“学派”、“方法”、“设计”、“工艺”、“性质”、“设备”等。已确定的族首词,不得在其他词组中出现。三、叙词法原理(二)叙词表的结构6.轮排索引轮排索引又称轮排表,是将叙词表的全部叙词按其所含词素的字顺进行排列,使含有相同词素的叙词集中在一起的词汇表。这是一种从词素的角度查找叙词的辅助工具,词素即具有检索价值的单元概念。7.分类主题一体化词表分类主题一体化词表类型有三种。三、叙词法原理(二)叙词表的结构分面叙词表,通常由一部分面或半分面的分类表和一部字顺叙词表组成,有的还附有轮排索引及英汉对照索引。两部分类目和主题词一一对应,其中,字顺主题词起着分类表字顺索引的作用,分类表起着传统主题词表范畴索引和词族索引的作用,可以直接用来分类标引和主题标引,如《教育主题词表》、《社会科学检索词表》、《音像资料叙词表》等为分面叙词表。分面分类表字顺叙词表F.各类教育00554C教育事业FA..师范教育01754

C教师培训JQ700867进修课程NT701208FA6...职业师范教育02667

D职业技术师范教育

S职业教育FB02633

C职业学校GB02668师范教育FA01754S各类教育00554F高等师范教育00150......职业师范教育02667C教师培训00867进修课程01208职业教育FB02663D技术教育S各类教育00554F职业师范教育02667分面叙词表实例——《教育主题词表》三、叙词法原理(二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论