信息组织辅导课程总复习_第1页
信息组织辅导课程总复习_第2页
信息组织辅导课程总复习_第3页
信息组织辅导课程总复习_第4页
信息组织辅导课程总复习_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息组织辅导课程总复习本科信息组织课程总复习第1章概论(一)本章学习目标1.理 解信息组织的必要性、信息组织的研究领域; 2.熟练掌握信息组织 的常见类型、信息资源处理的基本方法; 3.学会区分信息组织与信 息检索、检索系统的资源单元方式和标识单元方式、先组式与后组式、目 录、索引、数据库的不同;3.能运用上述理论方法理解各种信息组织系统与检索工具的组成原理。(二)本章重点要点1.信息组织概念及其必要性;2.信息组织与信息检索的关系(参看图1-1);3.按标识特征区分的两种基本检索工具类型,按检索途径区分的检索工具类型; 4信息处理的基 本方法。(三)本章练习题。名词解释(1)信息组织:是根据

2、信息检索的需要, 对信息资源的内容特征等进行分析、选择、标引、处理,使之成为有序信 息集合的过程。(2)信息检索:是根据一定需要从检索系统中检出相关信息资源的 过程。(3)数据:是经过直接观察获得的关于客观对象的记述,是未经处 理的对于事实的表述。(4)信息:是经过处理的数据或人们交流的知识,是有意义的数据。(6)索引:是揭示文献集合或文献中有检索意义的文献单元或信息 内容的查询工具。(7)检索语言:是由表达信息资源主题概念及其相互关系的词汇和 规则组成的人工语言。O思考题1.信息组织与信息检索有什么关系? (1)信息组织是信息 检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才

3、 能准确有效查找相关信息资源;(2)信息检索则是信息组织出发点与 归宿,用户的检索需要是组织信息的主要依据。4)信息组织能够克服现代社会信息的海量性、无序性和污染性,解决 它与人们对信息需求的专业性、选择性和及时性的矛盾。(2)信息组织的作用:1)信息资源组织:资源描述、内容浓缩、提供 检索点;2)检索工具组织3.按照提供的检索途径,信息组织可分为 哪些类型?题名检索工具(系统)、责任者检索工具(系统)、分类检索 工具(系统)、主题检索工具(系统)、引文检索工具(系统)等。(2)以信息资源的主题内容特征为检索依据,提供从资源内容进行 检索的途径,主要有分类法、主题法。5.简述信息资源处理的基本

4、方法。(1)信息资源处理是信息组织和揭示的基础,它以处理过的信息记 录作为原信息的替代物来组织信息系统;(2)信息处理的基本方法:1)描述信息资源,以便识别与确认它,主要方法是著录、编写题 录和资源形式特征的描述;2)浓缩信息资源内容,主要方法是编写内容提要或文摘,供用户了解、选择和判断信息资源;3)提供检索点。主要方法是确定特定资源的标索特征(或标识)与可检信息。信息资 源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、 分类号、主题词或关键词等。第2章信息组织原理(一)本章学习目标1.理解信息组织的基本要 求和规范控制的依据; 2.熟练掌握信息组织的控制与规范方法及信 息组织

5、的特点; 3.学会信息组织的描述控制、词汇控制、句法控制 方法,以及检全率、检准率的计算方法; 3.能运用信息组织控制方 法对常见词汇进行规范控制。(二)本章重点要点1.信息组织的描述控制、词汇控制、句法控 制; 2.概念的内涵与外延、概念之间的关系,概念的限制与概括、 分析与综合。(三)本章练习题。名词解释: (1)检全率:是指一次检索中检 出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量 的比例,用公式表示为:检全率=检出的相关信息资源量/系统中相关信息 资源总量数某100%。(4)职能符号:是一种表示主题标识在组配中的句法职能而规定的 辅助符号。(5)轮排转换:依次把检索

6、语句中每一个有检索意义的词轮流排列 在检索位置上。(6)引用次序:指复合主题标引或检索时,各个主题因素的组合次 序。问答题:1简述对信息组织的要求。(1)检全率。是指一次检索中检出的与提问相关的信息资源数量占 系统中所有与提问相关的信息资源数量的比例。检全率是衡量检索系统检 索能力和检索效率的重要指标;(2)检准率。是指检出的相关信息 资源的数量,占检出的全部信息资源数量的比例。检准率是衡量检索系统 排除与提问无关的的信息的能力,较高的检准率可以节省用户时间,提高 系统效率。(3)检索速度和系统的及时性。检索速度是指用户从实施检索到得 到结果化费的时间,它是衡量系统检索速度与使用效果的重要参数

7、。它与 系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关。 系统的及时性是指检索工具处理信息和提供信息所用时间较短,能快速纳 入、处理和提供信息。(4)系统易用性。是指标引人员使用检索系统描述、标引资源是否 方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度。 系统易用性是系统性能的主要因素,决定系统设计改进和发展方向。(5)检索的成本效益。是指检索系统的成本和效益之比。检索成本 包括系统设备费、标引处理费、检索运行费; 检索效益指检索系统创造 经济效益和社会效益。好的检索系统是低成本高效益的系统。2简述信息资源组织中的规范控制应包括哪些方面?( 1)描述控制: 即对描

8、述记录的内容、描述方进行的控制。包括描述项目、描述文字、描 述级别、描述格式的控制;(2)词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。主要方法有 同义控制、词义控制、词间关系控制;(3)句法控制:即根据信息资 源标引和检索需要,按一定的组词造句规则对检索语句的组合方式作出的 规定。常用的句法措施有确定引用次序、使用辅助符号、以及句式转换 (轮排转换、链式转换、分析转换)3词汇控制的范围是什么? (1) 词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、 规范、揭示相关性的过程。(2)词汇控制的主要措施包括:1)同义控制,是对字面形式不同

9、 而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。包 括对同义词、准同义词及部分专指词与泛指词进行的控制。同义控制常用 的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立 用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服 一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。2)词义控制,是对同形异义词和语义含糊的词进行控制,使词义明 确,一个词语只表示一个概念,以控制一词多义现象。词义控制常用的方 法是在词后加限义词,在词下增加含义注释和范围注释。(3)词汇控制还应包括词量控制、词组选择与使用控制、词汇专指 度控制等。4句法控制的方法主要有

10、哪些?句法控制是根据信息资源标引和检索 的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定。常 见的句法措施有确定引用次序、使用辅助符号和句式转换。(1)引用次序,是指复合主题标引和检索时,各个主题因素的组合 次序。在分类法中引用次序是指类目划分标准使用的先后次序或各主题分 面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级 子标题组合的次序。(2)辅助符号,是揭示主题概念之间的关系意义、进行检索操作的 符号。常见的有:1)关系符号,是一种用于揭示词语组配中形成的关 系类型的符号,通过对组配中关系类型的表达,对标引词进行控制,说明 组配性质并有一定的排序功能。3)职能符号

11、,是一种表示主题标识在组配中的句法职能的符号,可 以明确一个标识串(句子)中各主题因素的施动-受动作用,明确法含义, 提高检准率。(3)句式转换,是为了使检索句子各个有意义的词素能成为检索入 口字,通过对语句中词语位置的变动来增加检索点。常见的有:1)轮 排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持 相对位置的情况下移动。2)链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的 词语依次排在检索入口。3)分析转换,在一个检索词句中,每次抽取少量的词组配成标题, 依次把每个有检索意义的词排在检索位置上。5阐述文献保证原则和用户保证原则。(2)安排类目的次序也要考虑信息源的

12、实际情况,如文献多的类目排 在文献少的类目之前。n实施该原则的前提是必须了解文献源以及文献主题的数量情况,为 此,可以采用文献调查、词汇收集、标引频率统计等手段。n(3)在选择分类标准及其引用次序,确定类目的专指度,安排标识的 排列次序等方面考虑用户的使用特点。第3章信息描述(一)本章学习目标1.理解信息描述概念、意义与 作用,以及信息描述的规范、HTML、某ML的基本格式和DTD和RDF的基 本概念;2.熟练掌握基本描述项目、检索点、计算机编码中的MARC格式和DC格式;3.学会文献描述的基本项目和计算机编码的基本方法;4.能运用文献著录总则格式描述一般文献,能运用简单的HTML格式描述文件

13、。(二)本章重点要点1.信息描述基本项目、描述级次;2.检索点的选择与参照法,名称规范档的控制方法;3. HTML、某ML、DTD、RDF的格式(三)本章练习题。名词解释:1. DC:是都柏林元素 集的简称,1995年3月在美国小镇都柏林创建的元数据描述方法。ISBD是国际标准书目著录的英文缩写,由国际图联(IFLA) 1969年制定的供各类信息资源描述用的国际标准。某ML是可扩展标记语言的简称,是W3C倡议的、在SGML基础上 发展起来的新一代计算机标记语言。MARC是机读编目格式的简称,是根据文献特点和信息交换需要设 立的标准计算机可读文档格式。DTD是文件类型定义的简称,原是SGML的重

14、要组成部分,后来成 为W3C的某ML1。0 一部分。RDF是资源描述框架的简称,是W3C在1999年颁布的一个建议, 它用资源-属性-属性值来定义一个资源的基本描述框架。名称规范档是对描述记录中的名称标目(人名、机构名和资源名) 进行规控制的工具。检索点是指检索信息资源使用的题名、责任者、分类号、主题词 等供检索使用的各种数据。(二)问答题:1什么是元数据,其作用是什么? (1)元数据是关于数据的数据,或关于数据结构化的数据。信息描述记录就是元数据结 构化描述的结果。(2)元数据(或信息描述)的作用就是以元数据为中介,对信息资 源的各元素进行修改、组织或检索等各种操作,包括:1)识别。通过 个

15、别化描述和确认,让用户可以识别该被组织的资源;2)定位。提供资源的位置信息,便于用户访问该资源或其相关资源。常见的定位方法 有:资源顺序号、数据库中的位置、网络地址或其他链接地址。3)检索。通过描述数据组织检索工具、向用户提供检索点或检索途 径,在网络或电子检索系统中,可以通过词语匹配等检索技术实现多种特 征的检索。4)选择。用户可以通过描述记录中的各种特征,判罪资源价值,确 定是否需要。简述我国文献著录总则和DC的基本著录项目。3简述题名检索点和个人责任者检索点的选择方法。(1)题名检索点的选择方法:1)正题名可以直接选作标目,交替 题名也可选作标目;2)适当选择有检索意义的副题名和附注项中

16、的合辑题名作标目;3)并列题名一般不选作标目;4) 一种资源的题名检点数量要控制在二个以下。3) 一般参照(普通参照)是对检索工具某些编制事项的说明,介绍 用户掌握检索系统的使用方法。5简述编制名称规范档的过程。名称规范档一般由哪些款目构成?规范控制的方法(1)名称规范档通常由规范款目、参照款目、说明款目三种类型组成;(2)常用的规范控制方法有:1)编制规范款目。规范款目是检索工具中使用的 统一标目及其有关参照的完整记录,它由七个著录项目组成(见43页样 例);2)编制参照款目。参照款目是在检索系统中引导用户从非规范标目查找相应的规范标目,或从一个规范标目查找另一个相关规范标目 的一种款目。它

17、有三个著录项目(见43页样例);3)编制说明款目。说明款目是关于规范档标目选择方法、目录使用方法、组织原则等编制规 范的说明(见44页样例)。简述CNMARC格式的结构组成。(1)CNMARC是中国机读编目格式的简称,是根据文献特点和信息交 换需要设立的标准计算机可读文档格式。(2)CNMARC生成的书目基本结构由四部分组成:1)记录头标区:是关记录类型、目录级别、记录完整程度的数据,字符数24个; 2) 地址目次区:由计算机自动生成的数据字段区有关情况的记录,记录每个 字段长度、起始位置等;3)数据字段区:记录文献各种数据,包括编目数据、主题数据、分类数据等,是MARC格式书目的主体。该区数

18、据 由人工输入,由十个功能块组成。4)数据字段区内的每个字段由字段标识符、子字段标识符、指示符、 分隔符组成。字段标识符由区分不同字段的三位数字组成,相同功能块的字段具人 相同的首字符; 子字段标识符由两个字符组成,首字符由国际标准通用 的专用符号“$”组成,第二个字符为字母或数字;指示符由两位数字或字 母组成,表示某些数据的操作信息,未定义指示符用空格表示; 分隔符 用来分隔不同的数据集合,有字段分隔符“某”,表示一个字段结束,记 录分隔符“#”,表示一条记录结束。第4章信息描述工作(一)本章学习目标1.理解信息描述工作的要 求、程序以及联机编目中CORE系统的功能、元数据创建方式、信息描述

19、 工作流程;2.熟练掌握信息描述的类型(或方式)、题名、责任者、出版项等的描述方法;3.学会用CNMARC与DC各个字段与元素间互换描述简单的文献或其他资源;4.能运用CORE、CNMARK与DC结合描述简单的文献或其他资源。(二)本章重点要点1.信息描述工作程序;2.信息描述中各个基本项目的描述方法;(三)本章练习题一名词解释:1. CORC是OCLC的协作联机资源编目的简称,是以网络资源为对象的联机资源编 目系统。联机编目是在联机状态下进行编目操作、提供编目数据、建立联 机检索工具并提供各种信息描述产品的信息描述活动。集中编目是由中心编目机构进行编目,向其他合作机构提供编目 数据的编目方法

20、4.共享编目是由多个编目机构共同进行编目活动,各参 与机构共同协作并分享(即利用)编目成果的编目形式。二问答题:1简述信息描述工作的要求。2简述信息描述工作的程序。(1)查重查核系统,确定要处理的信息资源是否已收入系统。其作 用避免重复劳动,保证资源描述和标引的一致性。某使用工具是工作目录、编目数据库,查核时按题目名、责任者、统 一书号(如ISBN)检查,网络资源可使用URI。某如系统已收入,采用原来的描术结果输入系统;某如文献是原资源的不同版本或网页已更新,在原来描术的基础上增补调整后输入系 统;如是新资源,则重新描述与标引后输入系统。(2)描述按新资源(系统中没有的)的不同特点,根据描述规

21、范加 以处理。某描述工作程序应严格按著录标准和标引工具的规定进行;某描述工作可以参考被描述文献的CIP数据,网络资源按DC或其它规范描述, 可以采用复制、修改、调整等方式使用已有的电子资源描述记录。(3)标引在对资源进行主题分析的基础上,依据一定的类表词表和 标引规范对资源赋予标识的工作。(4)复核检查描述和标引是否符合要求,按系统要求对文献进行必 要的处理后再将描述结果输入系统。复核内容有:描述项目的准确性和完备性,标引结果与系统要求的相 符性等。某手检工具要对标目进行加工,编制参照等,机检系统通常要建立标 引数据的临时库,复核后才能输入系统。3简述题名项、责任者项的描述方法。2)并列题名又

22、称对照题名、平行题名,是指在书名页上与正题名语 种不同的题名。并列题名著录在正题名之后,以“二”连接。3)副题名是解释、说明题名的文字或从属于正题名的题名,著录时 应在正题名之后用“:”号为标识。(2)责任者项由责任者和责任方式组成,责任者是对资源创建负有 责任的个人或团体,通常分为个人和团体责任者; 责任方式是指对资源 创建所作的贡献类型,传统责任方式有著、编、改编、译注等。第5章分类法(一)本章学习目标1.理解分类和信息资源分类的特 征、分类法的类型、及特点; 2.熟练掌握类目体系、标记符号、类 目体系的内容,以及网络分类法与传统分类法的不同特点和类目组织、揭 示形式的变化; 3.学会区分

23、不同类型的分类法及其结构; 4.能 运用上述理论对中国图书馆图书分类法(简称中图法,英文缩写 CLC )结构、标记符号进行分析。(二)本章重点要点1.分类法类目体系与标记符号和引用次序的重 要作用;2.同类类目排列的方法、类目关系的处理;3.网络分类法与与传统分类法相比的主要特点和揭示形式的变化(三)本章练习题 一名词解释:1.分类:是指按照事物的属性或特征进行区分和类聚, 并将区分结果按定次序予以组织的活动。信息资源分类:是从主题内容角度组织和揭示信息资源的方法。等级体系分类法:是一种将所有类目组织成一个等级系统,并采 用列举方式编制的分类法。分面分类法:是一种按照分析兼综合原则编制的分类法

24、。标记符号:是分类法中标记类目的次序、关系和位置的符号。交替类目:是分类法在一个知识门类设置使用类目,同时在相应 门类下设置供选择使用的类目。相关索引:是一种不仅可以从主题名称出发查找对应的类目,而 且可以将被分类体系分散的该主题各方面的类目加以集中的工具。层累制:是按照类目相应的等级配置相应位数的号码,类号可以 反映类目次序和等级的标记制度。二问答题:1一部完整的分类法应有哪几部分组成?按照分类法各 部分的功能,可以将分类法分为类目体系、标记符号、说明和注释及类目 索引四个部分。3引用次序在分类体系建立中有什么作用?分类法对横向关系的处理 采用了哪些方式? (1)引用次序在分类体系建立的作用

25、是:1)决定着 类目体系的展开方式与类目体系的结构,可以直接影响分类体系的性 能; 2)引用次序决定选择何种标准建立体系及其先后次序,因而决 定着按什么方式集中信息资源;3)决定着为用户提供何种检索途径,它与分类法的适用性有着密切关系。因此,应优先选择某一学科、事物的主要属性或具有检索意义的属性 作为分类标准。5网络分类工具与传统分类法有哪些不同?在类目组织和揭示形式上 有哪些变化? (1)网络分类工具与传统分类法的不同表现在:1)揭示 角度不同。网络分类法改变了传统分类法以学科为中心建立体系的方法, 以主题为中心或者以主题结合学科的方式组织体系;2)类目设置的特点不同。网络分类法改变了传统分

26、类法以资源和用户情况设置类目、重 视类目设置的逻辑性、系统性的方式,在类目设置中体现网络资源形式的 类目,简化了类目等级,类目设置的概括性、实用性强;3)类目体系展开的形式不同。网络分类法改变了传统分类法主要采用线性序列的类 目体系,采用超文本链接横向揭示资源,类目体系采用多维结构,多角度 设置类目、展开体系,用网状结构代替了传统的线性结构;4)同位 类排列不同。网络分类法改变了传统分类法按类目关系排列同位类的方法,按字顺排列类目;5)适用特点不同。网络分类法与传统分类法相比,更重视类目体系的普遍普适用性,重视普通用户的信息需求,以普通人的 日常生活需求为中心展开类目体系; 在资源选择、类目排

27、列、类名选择 上体现终端、用户的使用需要,在多维结构、横向关系揭示上体现方便用 户需求的易用性。第6章数字图书馆的信息组织第6章数字图书馆信息组织一、本章学 习目标1.理解数字图书馆的基本概念;2.熟悉数字图书馆的基本体系结构与技术体系结构,及各组成部分的作用;3.熟悉数字图书馆的基本技术方法。二、本章重点要点1.数字图书馆的基本体系结构、技术体系结构及各组成部分的作用;2.数字图书馆的基本技术方法三、本章练习题(一)名词解释1数字图书馆2数字对象3数据集市4数据提取5非结构 化数据库技术(二)思考题1数字图书馆有哪些特征? 2数字图书馆的资 源组织有何特点?为什么3结合数字图书馆的基本结构图

28、,说明各部分的 作用。三、本章练习题(一)名词解释1数字图书馆:数字图书馆 (DigitalLibraryDL)是采用现代信息技术的、超大规模的、分布的、可以跨库检索的数字信息资源系统。2数字对象:是组织管理数字信息的方式、构成计算机存储与处理数 字信息及功能实现所需要的完整数据结构。3数据集市(DataMarket):是面向主题(部门)的、在逻辑上或物 理上划分出来的数据仓库中的数据子集4数据提取(DataE某traction): 数据库仓库按分析的主题来组织数据,只提取系统分析必要的那部分按主 题组织需要的数据。5非结构化数据库技术:是能够存储和管理形式多样的非结构化数据 的技术,它把结构

29、化与非结构化数据都作为资源来进行管理。6.数据清洗(DataCleaning):就是将错误的、不一致的数据送入 数据仓库前予以更正可删除。(二)思考题1数字图书馆有哪些特征?答:数字图书馆的特征 是: 数字化:数字图书馆是一个内容丰富的、组织化的、多媒体形式 的数字化系统,它的资源、工作过程和服务提供都是数字化的,它集中了 不同载体、不同地理位置的资源,以数字化存储、以网络实现连接和共享, 本质上是一个数字化、网络化的信息空间。网络化:数字图书馆是以网络为依托、以资源共享为目标的数字化 系统、设计时重视网络功能的需求与实现。通常在网络环境中具备浏览器 的浏览与检索功能、广泛采用Z39.50标准

30、、网上的各种应用协议、通信 协议、数据交换标准、数据传输、编码和压缩,使它真正成为各种网络技 术和标准的集成系统。分布式系统:采用关系数据库管理系统,结构上采用分布式数据访 问和数据库连接;支持开放式应用开发与多语种利用;支持规范控制、 规范记录; 系统集成化程度高。海量资源和分布式资源存储结构:数字图书馆处理的数据是海量的, 估计一般的资源量可达到101215字节,它的资源包括持续倍增的网络资 源,也包括不断增长的数字化的传统资源。海量资源使数据存储必须以大量的分布式数据库群把资源存放在不同 的计算机上,每个计算机负责特定资源的收集、加工、存储、利用和维护 工作; 按用户需求提供服务(最好是

31、交互式的自动界面):用户通过数字图书馆的交互界面提出服务请求,数字图书馆使用高效的检索系 统,为用户提供迅速、准确、个性化的服务。2数字图书馆的资源组织有何特点?为什么答:数字图书馆信息组织 的特点是: 以用户为中心组织信息资源: 数字图书馆为每位用户提 供个性化的信息服务,针对每个用户的每个需求从海量资源中查找符合用 户需求的资源,而且它提供的资源不是一般的单一资源,而是关于某种问 题的知识点;信息资源加工处理自动化:数字图书馆的信息资源描述、 自动分类、自动聚类、元数据自动抽取等对资源进行加工处理应尽可能自 动化。智能查询服务:数字图书馆的海量信息资源要求提供高效的智能检 索服务,如设计良

32、好的数字图书馆既能满足对图形、图象、视频的关键词、 主题词查询,而且能够通过颜色、纹理、形状、关键帧等来查找; 同时, 查询还要求能够实现无缝跨库连接,使用户能够方便、快速、准确地查到 所有存储在数字图书馆的分布式资源。3结合数字图书馆的基本结构图,说明各部分的作用。答:(1)图略,见本章;(2)1)用户系统定义面向用户和系统管理员使用的两类界面,用户端通常是互联网浏览器,在浏览器上实现与 DL系统的服务交互,执行请求与服务;2)检索系统是DL系统的核心 功能,检索系统在网络环境中采用分布式检索或并行检索系统结构。3) 名字解析系统负责将URN转换为存储数字对象的网络物理地址,并实现 URN的

33、注册管理功能,以保证它的唯一性;4)数据存储系统存储与管 理数字对象及其他信息,通过数据存储系统存取协议实现对数字信息的管 理,同时实施访问控制和安全管理功能。第6章国内外主要分类法介绍(一)本章学习目标1.理解CLC、DDC、UDC、LCC、CC 的基本情况; 2 .熟练掌握 CLC、DDC、UDC、LCC、CC 的基本特点;3.学会分析比较各主要分类法的体系结构与标记符号的优劣;4.能运用中图法分析其结构及使用方法。(二)本章重点要点1.国外主要分类法的基本特点;2.中图法的体系结构及基本特点。(三)本章练习题1.简述DDC在分类法发展中的贡献及其管理上的 成功经验。DDC在分类法发展中的

34、贡献及其管理上的成功经验是: 类目体系完 整,覆盖全部知识、文献; 类目详尽,等级分明,便于理解使用; 首 创以简明的号码标记类目的方法,便于图书排架、目录组织和检索; 首 次采用数字层累标记制,通用性好,易排易检,易于扩充、组配,具有较 强的助记性、等级性; 首创了类目相关索引,提供了从字顺角度查找类 目的途径,便利分类表的使用; 首次使用了复分与仿分方法; 成立了 长设机构,不断修订更新,保持分类法的长久生命力。简要论述冒号分类法的分面理论要点及特点。中图法类目体系及标记符号有何特点?第7章分类标引与分类检索工具(一)本章学习目标1.理解分类标引工作的要求、标引工作 程序和分类排架; 2.

35、熟练掌握类目辨析方法、分类标引规则和分类 检索系统;3 .学会辨析类目关系以及各类文献的分类原则;4.能运用分类规则使用中图法为一般文献配置类号。(二)本章重点要点1.类目辨析方法;2.分类标引的工作程序和分类标引规则;3 .分类检索工具的显示方法和检索途径。(三)本章练习题一.名词解释: 单主题多主题联结主题二.思考 题:1对分类标引有哪些要求?为了保证标引质量,对分类标引的基本 要求是: 准确即归类要正确,归入的学科专业无误; 要确切,标引的 类号专指度最高、最能代表其内容; 充分即信息源中有价值主题的揭 示要充分; 一致即同一主题内容的资源的标引结果应一致;适用即标引要适应系统的特点和用

36、户的检索需要。2分类标引工作程序应分哪些步骤?为了确保标引工作质量,分类标 引工作程序应严格按如下步骤进行:1)查重,在资源描述时要核查是 否为已处理过的信息资源,以避免重复劳动,提高效率;2)主题分析,对要处理的资源内容特征进行分析,确定其主题概念;3)转换主题概念即归类,根据主题分析确定的主题概念,将要处理的资源归入所 使用分类法的相应类目;4)确定标识即给号,根据确定的类目给要处理的资源标引相应的类号;5)审核,由专人对每种文献的标引结果逐项进行审查。分类标引的基本规则有哪些? (1)按学科属性原则分类标引必须 首先以其内容的学科或专业属性为主要标准,只有在不适于以学科属性为 区分标准时

37、,才考虑以其它方面的性质(如体裁、地域、时代、语文等) 作为分类标准;(2)专指性原则文献分类标引必须符合专指的要求。即将文献分入恰如其分的类,而不能分入范围大于或小于文献实际内容的 类目; 要区分总论与专论,不要将专论性的文献归入总论类; 还要区 分是阐述一般原理的,还是阐述具体问题的,不要把研究具体问题的文献 归入阐述一般原理的类;(3)实用性原则文献分类标引必须使文献尽其用,即要根据读者的需要将文献分入最大用途的类;(5)系统 性与逻辑性原则文献分类标引必须体现分类法的系统性、等级性和次第性。凡能归入某一类的文献,必带有其上位类的属性。也就是说,凡能归入某一类的文献,一定也能归入其上位类

38、;(6)不能单凭题名或篇名的含苞欲放义归类,因为不少题名仅有象征意义,不能确切反映文献内容。简述多主题信息资源的一般标引规则。举例说明参考工具书应如何归类?第8章主题法一.本章学习目标1.理解主题法的特征、叙词表的结构、编制与维护;2.熟练掌握标题法、元词法、叙词法的基本特点,以及范畴索引、词族索引、轮排 索引、分类主题一体化词表的特点或作用,叙词语言的词汇控制方法;3.学会区分各种类型的主题法,以及叙词表的字顺表、各种索引的使用方法;4.能运用汉语主题词表标引简单的文献。本章重点要点1.标题法、元词法、叙词法的基本特征; 2.范畴索引、词族索引、轮排索引、分类主题一体化词表的特 点或作用;

39、3.叙词语言的词汇选择、词形控制与词义控制以及词间 关系控制方法。 本章练习题(一)名词解释: (1)主题法:主题法是直接以 表达主题内容的语词作为检索标识、以字顺为主要检索途径的标引和检索 信息资源的方法。(2)叙词法:叙词法是一种从自然语言中精选出来的、经过严格规 范处理的叙词作为文献主题的标识,通过概念组配的方式表达文献主题的 主题法。(3)概念组配:概念组配是在概念分析的基础上进行概念的综合。(4)范畴索引:范畴索引又称分类索引、范畴表,是一种按照词汇 所属的学科或专业范畴编制的概略分类系统,是从分类角度查找叙词的辅 助工具。(5)词族索引:词族索引是一种以词族为款目单元,按照款目词的

40、 字顺排列,可以从等级关系的角度查词的索引。(二)思考题:1主题法的特点是什么?主题法有哪些基本类型? (1)主题法的主要特征是:直接以语词作为检索标识,以字顺作为主要 的检索途径;以特定的事物、问题、现象、主题为中心集中信息资源; 通过参照系统等方式揭示主题词之间的关系;(2)主题法的类型主要有标题法、元词法、叙词法、关键词法等2叙词表一般由哪些 (宏观结构)部分组成?叙词表组成基本要求是什么?(1)叙词表一般 由字顺显示部分和系统显示部分组成前者主要有字顺表、专有叙词表、双 或多语种对照索引,后者主要由范畴索引、词族索引、轮排索引、分类主 题一体化词表等部分组成;(2)好的叙词表的基本要求

41、是:功能完备,各组成部分功能结合,使词表具有各种必要的功能;功能互补,词 表各组成部分功能有效,性能互补,在整体功能上效果良好;结构简明,各组成部分没有或少有重复词表结构整体性好,既结构简明,又功能完 备;编制和管理方便;易于掌握,易于使用。3.简要说明叙词语言的词汇控制方法。叙词语言的词汇控制方法主要有:(1)词汇选择。词汇选择的原则是客观性、可预见性、实用性、单义性、成族性、专指性和科学性 等; 词汇选择的类型是以名词为主,必要时也收录少量形容词。叙词可 以分为普通名词和专有名词两种。对于专有名词或专有叙词可单独编制专 有叙词表。叙词表中收录词组的原则是:保留学科领域中使用频率较高的词 组

42、;凡经分解后,分解后的单词有一方没有独立检索意义,或改变它在 词组中的原义,或组配结果可能有歧义的,应该在叙词表中收录词组;有检索价值的专有名词,一般可直接使用;(2)词形控制与词义控制。1)词形控制是指根据主题标引与检索的需要对语词的形式及 构成成分作出的规定,以方便语词的排检。主要内容有:规定语词形体, 一般以通行的字体为准;规定外来语和数字的用法,一般选规范的译名,如果外文的名词术语更通用,也可以直接选用原文; 规定标点符号的用 法,一般只在必要时使用()、一一、等符号,另有规定的除外; 规 定词序,一般使用自然词序,不用倒置词序; 规定外文的词形,主要是 规定单复数、名词形式等;规定词

43、长,使语词保持在规定的长度以 内;2)同义控制,是指在语义相同而词形不同的语词之间,只能优选 其中的一个作为正式的叙词,其余的可作为非叙词收入叙词表,作为查找 入口。同义控制的内容包括同义词之间的控制和准同义词之间的控制。一 般同义词之间的控制主法是选取较通用的一个作为正式叙词; 学名与俗 称、新称与旧称、全称与简称、不同译名、产品型号与代号等词汇的控制, 一般选择学名、新称、全称、规范译名、产品型号等作为正式叙词; 词 组与对应的组配形式之间,一般选取对应的组配形式; 准同义词之间的 控制主要有近义词的优选,即选通用的词作为叙词;反义词之间的优选一般选表示正面含义的词为叙词; 太专指词并入泛

44、指词;3)词义 控制主要是对一义多词现象进行控制,使其具有明确性和单义性。主要内容有:加限义词; 加含义注释、用法注释或历史注释。(3)词间关系控制,是对叙词与非叙词词间关系的显示与规范,它 是使叙叙词系统化的重要手段。叙词语言使用了参照系统、范畴索引、词 族索引、轮排索引、词族图等多种方式显示词间关系,从而形成完整的语 义网络。语词之间主要有三种关系:等同关系、等级关系、相关关系。在 汉语主题词表中,等同关系用“用”(Y)“代”(D)两币符号表示, 等级关系用“属”(S)、“分”(F)、“族”(Z)三种符号表示,相 关关系用“参”(C)表示。为什么说叙词法是多种信息标引与检索语言的综合? (

45、1)叙词法是一种在综合多种检索语言技术方法基础上发展起来的新型词汇控制系统, 它总结了各种标引和检索的经验,综合了多种检索语言的优点,结合新兴 的计算机技术来构造它的结构和方法体系; 它的参照系统最为完备,索 引形式多样,还编制了各种分类主题目一体化的对应词表,使之成为结构 完备、功能丰富的检索语言;(2)叙词法吸取了元词法的组配技术,把元词法的字面组配和反记法发展为概念组配与倒排档;它也吸取了体 系分类法的学科分类和等级结构的方法,编制了范畴索引、词汇索引和词 汇分类表; 同时它广泛吸取了先组式标题和参照方法、关键词法的轮排 技术、分面分类法的分面技术等,使之成为最具优势的检索语言。分别简析

46、标题法与叙词法的特点。(1)标题法的主要优点是:用受控的自然语言作标识,直观地表达主题概念,直接地标引文献; 以字顺序列组织标识,提供直接的主题检 索途径;主要用参照系统间接显示标题所表达的主题概念之间的关系, 形成语义网络; 按事物集中文献,不是按学科集中;提供先组式的主题标识,标识含义比较明确,选用标识比较容易; 标引所用的标题不必 都是标题表中列举的现成标题,必要时可以自拟标题;标题法的不足是:采用列举方式,往往会带来词汇量大,专指度低,修订难度大; 大 量采用先组式标题,只能从规定的组配次序入手查找,无法进行多途径检 索、多因素检索。(2)叙词法的优点:1)结构完备,词汇控制严格; 采

47、用概念组配,避免了字面组配带来的一些误差,保证了组配语义的准确性;设置了完善的参照系统,同时使用多种方法显示概念间的关系,有利于提高查 全率与查准率;2)组配准确,标引能力强,能准确、专指地标引和揭示各种主题内容; 灵活的叙词组配,使叙词语言有较强的表达能力, 能专指、及时地表达复杂、新颖的主题;3)检索效率高,允许多因素检索、多途径检索,使检索具有灵活性;4)对检索系统的适应能力强,能同时使用于标识单元方式与文献单元方式的检索系统,能较好地 适应机检系统和手检系统的需要。叙词法的缺点是:由于词汇控制严格,词表编制和管理的要求高,编 制和管理成本高; 文献标引需要在概念分析的基础上进行,增加了

48、标引 的难度。简析概念组配与字面组配的区别。概念组配与字面组配的主要区别是:(1)两者的本质不同,前者重在拆义,后者在于拆词。它是利用构词法进行词的分拆与组合。概念组 配本质是在概念分析的基础上进行概念的综合;(2)两者的词汇单元不同。单元词是不能再分的词汇单元,而叙词则以表达事物的基本概念 为基础的。第9章国内外主要主题词表介绍(一)本章学习目标1.理解LCSH、 MeSH、中分表的发展、结构与特点。2.熟练掌握汉表的发展、结构与特点;3.学会熟悉和使用汉表;4.能运用汉表标引简单的文献。(二)本章重点要点1. LCSH、MeSH、中分表的发展、结构与特 点; 2.熟悉汉表,能运用汉表标引简

49、单的文献。(三)本章练习题1.简述LCSH的结构特点和自由浮动标题的类型。LCSH的结构特点是:整体结构由主表、副表、和使用说明组成, 主表是它的主体,包括导言和字顺表,副表和使用说明另收入主题编目手册(标题部分)中;LCSH的款目结构由标题目与非标题、分类号、 注释、参照项组成; (2)LCSH的自由浮动标题四种类型:一是通用 自由浮动复分表,由形式子标题和论旨子标题两种,由一般子标题复分使 用,使用范围在各子标题下注明;二是特定范畴自由浮动复分表,只适用特定范畴的标题如人物、种族、团体、地名等复分使用;三是类型示范标题表,在某类标题中有代表性的标题下列出示范标题供同类标题仿照 使用;四是多

50、款目标题,某些标题有多个类似的子标题,并以举例方式规定其复分办法。2 .评价MeSH的特点。MeSH的优点是:词表是在医学文献标引的基础上编制的,符合 医学文献标引的需要;树形结构表级别深,有利于从分类角度查词; 设置了多种参照,全面建立语义关系,提高了检索效率; 注释种 类多样,说明详尽,有利于提高标引质量,也便于回溯性检索。MeSH的不足之处是:作为一部从标题法脱胎而来的叙词表,仍 带有不少标题表的特点,产生了形式上不一致,简明性不够的缺点; 副 主题的使用除了在部分主标题下列出之外,同时还采用副标题组配的形式, 且使用范围常有变化,增加了标引的难度。第10章主题标引与主题检索工具一.本章

51、学习目标1.理解主题标 引的作用、标引方式和主题手工检索工具的编制方法;2.熟练掌握主题标引方法、主题标引规则、主题检索系统的结构和功能;3.学会区分主题标引与分类标引的区别、主题分析方法主题结构与公式、主题概念转换方法,各类文献的主题标引原则;4.能运用各种主题标引规则使用汉表标引一般文献。本章重点要点1.主题分析与主题结构中各主题要素的一般公式、主题要素的转换方法;2.主题标引的查词规则、组配规则各种主题与类型的信息资源标引规则;3.主题目检索系统的结构与功能。本章练习题(一)名词解释: 综合标引分析标引隐含主题(二)思考题1主题标引的概念转换有哪些基本的方式和规则? (1)主题概念 的转

52、换有两种方式,一种是直接转换,即直接用叙词表的一个叙词来表达, 一种是分解转换,即需要用叙词表中的几个叙词组配表达,着涉及到对主 题概念的分解转换的问题;(2)主题概念分解转换的规则是:必须进行概念分,避免字面分拆;必须根据概念内涵析出最专指的分解形式。简析主题分析中主题的类型和主题结构分析方法。3简述组配标引的组配规则主题标引的组配规则是:主题标引的组配 必须是概念组配;在几个相互组配的主题词之间,其概念必须有交叉或 限定的逻辑关系,不能采取单纯的字面拼合组配或随意组配; 应优先选 用在概念上具有交叉关系的交叉组配方式,在不能采取交叉组配方式时, 才考虑采用限定组配方式;必须选用与文献主题关

53、系最密切、最邻近的 主题词,不能选用泛指的主题词进行越级组配; 对并列多主题文献进行 分组标引; 组配必须概念清楚、确切,只能具有一个含义,若组配的结 果具有多个含义时,应考虑改用上位或近义的主题标引,或者是增补新的 专指主题词标引;组配次序,应依据国家标准中主题分面组配公式,即:“主体因素(A)通用因素(B)位置因素(C)时间因素(D)文献类型因 素(E)”确定其次序,多个主体因素的主题可依逻辑顺序确定其次序, 在难以确定逻辑顺序时,可采用自然语言顺序。4简述标引选词的专指性与优先顺序的规则。标引选词的专指性与优先顺序的规则是:首先选取与文献内容主题概 念相对应的、最专指的词标引; 词表中没

54、有专指词时,可选用与其最直 接相关的、最邻近的主题词进行组配标引(参见组配规则); 在词表中 没有恰当的主题词组配,可考虑选用一个最直接的上位主题词进行上位标 引或近义的题词进行靠词标引; 如果以上都不合适时,可以采用增词 标引。第11章自然语言标引与检索一.本章学习目标1.理解自然语言标 引和检索的类型、关键词索引的编制步骤及关键词法的特点、文本检索的 实现方式,自动主题标引和自动分类标引的类型;2.熟练掌握各类关键词法款目(或文件名)的排列方法、关键词法的性能,文本检索技术、 后控词表的词汇控制方式、特点、词汇控制的内容和结构、词汇处理方式, 自然语言与控制语言的性能比较,自然语言与受控语

55、言结合的趋 势;3.学会处理后控词表的词汇(等同关系与等级关系)和句法及词表的应用形式,能比较分析自然语言与受控语言的性能;4.能运用关键词技术排列各种文件,能处理后控词表的词汇。本章重点要点1.各类关键词法的款目(或文件名)排列方法、关键词法的性能;2.文本检索技术的常见检索方法;3.后控词表的词汇控制方式、特点、词汇控制的内容和结构、词汇处理方式;4.自然语言与控制语言的性能比较,自然语言与受控语言结合的趋势。本章练习题一.名词解释1后控词表:是在自然语言检索系统中, 供在检索时进行控制的一种词表。2文本检索:又称自然语言检索,指不对文献进行任何标引,直接依 据自然语言中的语词实施匹配查找

56、的系统。3自由标引:不要词表,在严格的标引规则指导下,由标引人员直接 选取自然语言中的词语进行标引。4概念检索:在检索中利用用户的检索词进行检索的同时,结合使用 该词的同义词进行检索,可以查全该检索词的所有资源。(二)思考题1.用于标引和检索的自然语言有哪些类型?各类自然 语言主要应用于哪些方面? (1)用于自然语言标引与检索的类型有:关 键词法、文本检索、自由标引、自然语言入口词检索和自动标引 等; (2)各类自然语言主要应用于:关键词语言主要用于编制关键 词索引,关键词索引编制思想是将关键词不加规范化或只作极少量的规范 化处理,按字顺排,提供检索途径的方法; 文本检索主要用于自然语言 检索

57、,即不对文献进行任何标引,直接依据自然语言中的语词实施匹配查 找的系统。常见的文本检索技术有布尔检索、截词检索、精确检索、限定 范围检索、调整检索包括容错检索、过滤检索、概念检索、自然语句检索 等方面、相关检索等。2.后控词表有何特点?它有哪些主要的编制方式? (1)后控词表的 特点是:1)后控性,即在后控词表中,标引与检索用词是自然语言,控 制词是人工语言,这与先控语言里控制词的情形相反;2)成长性或动 态性,是指后控词表词汇的不断更新、结构显示的不断深化。起初,所控 制的词量有限,随着自然语言发展与变化,就需定期对新增的自然语言进 行控制,对其结构的显示也逐步细化与深化。后控词表被称为不断增长的 词表;3)灵活性。由于受控词表主要用于对自然语言检索标识的控制, 不用于标引,其分类体系就可灵活变动,显示方式也可灵活多样,且逐步 丰富;4)易用性,具有面向文献和用户的特点,利用后控词表进行自 然语言检索,可自由地扩大、缩小检索范围,提高检索效率,减轻检索者 智力负担;5)低成本性,是指编制与维护后控词表的费用低于先控词 表;6)词间关系不同与传统词表,在后控词表中,等同关系的显示, 实际上不是用代关系,而是一种互见关系;7)入口词丰富,词汇控制 不如先控词表严格。(2)后控词表编制方式有:1) 积累式。指通过对检索用词的不断 积累,由

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论