《信息组织学》储节旺编第五章主题组织_第1页
《信息组织学》储节旺编第五章主题组织_第2页
《信息组织学》储节旺编第五章主题组织_第3页
《信息组织学》储节旺编第五章主题组织_第4页
《信息组织学》储节旺编第五章主题组织_第5页
已阅读5页,还剩142页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章主题组织

5.1主题组织概述

5.1.1 主题组织内涵

主题组织是按照信息对象等所反映的主题特征的异同,用接近自然语言的能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。主题组织法主要适用于各种信息检索系统的记录单元的组织。5.1.2主题语言

⑴主题、主题词、主题词表

主题指信息对象所表达或反映的主要内容、问题或事物。按信息所表达的中心问题数量的多少,主题可分为单主题和多主题两种类型。单主题只含有一个中心问题,即只有一个主题;多主题指含有两个以上的中心问题,即有两个以上主题。

5.1.2主题语言(续)

⑴主题、主题词、主题词表

主题词是用于描述、存储、检索信息主题的受控词汇,是主题表中能表达一定意义的最基本词汇单元。主题词是以众多的事物概念为基础的,它是事物本质属性的概括,是一个类称概念。

主题词的选用主要依据三方面,即出现频率、标引频率、查找频率。具体来讲是应具有实际检索意义。5.1.2主题语言(续)

⑴主题、主题词、主题词表

主题词分为标题词、单元词、叙词和关键词。主题词具有概念性、控制性、组配性、语义性、动态性等特征。5.1.2主题语言(续)

⑴主题、主题词、主题词表

将主题词按一定方式、规则组织成的词汇表称为主题词表。主题表是主题组织法的运用结果,主题表习惯上也称为主题法,它与我们所说的主题组织法是不同的概念。主题词表按主题词的类型可划分为标题词表、单元词表和叙词表;5.1.2主题语言(续)

⑵主题语言要素

主题语言的要素,包括以下四个方面:

①语词标识:标识有两类即号码标识和语词标识,语词标识是采用自然语言中的但经过控制的名词术语作为描述文献主题的标识。

5.1.2主题语言(续)

⑵主题语言要素

②字顺系统:汉字字顺系统主要有音序和形序。③参照系统:是主题词表显示主题词语义关系的语义词网络。④主题检索工具:是根据主题语言原理编制的各种主题检索工具,主要是主题目录、主题索引、计算机中的主题词倒排档等。5.1.3主题语言分类

依标识的组配特点分

①先组式主题语言

从文献的实际主题出发,在编表和标引阶段将检索标识组配成固定的标题形式来表达文献主题。如分类体系语言标题语言

②后组式主题语言

在编表和标引时事先不把检索标识组配成固定的标题形式来表达文献主题,而是到检索时才临时选用检索标识并将他们组配起来进行检索。如单元词语言叙词语言关键词语言5.1.3主题语言分类(续)

⑵依使用前是否进行控制划分

①受控型主题语言

经过规范化处理,具有严谨的体系结构,并对同义词、多义词等加以控制的主题语言如标题语言单元词语言叙词语言

②非受控型主题语言

直接使用自然语言语词进行标引和检索的一种主题语言如关键词语言5.2标题词语言

5.2.1 标题词的内涵和词汇控制

标题词(SubjectHeading)是指经过规范化和标准化处理的简略表达信息对象论及或涉及的事物即主题的语词,是完全受控的一种主题标识,通常是比较定型的事物的名称。

标题词语言,是主题语言系统中最早的一种,它以选自自然语言中经过控制的语词术语作为标识,从语词控制角度看,它是一种先组式的。

5.2.1标题词的内涵和词汇控制

标题语言基本构成要素是主标题、副标题和说明语。例:

Books(主)——Reviews(Indirect)(副)Hereareenteredcollectionsofreview,worksonthetechniqueofwritingreviewareenteredundertheheadingbookreviewing.见《美国国会图书馆标题表》第九版5.2.2标题词的语义参照标题的语义参照是标题法揭示标题之间语义关系的一种重要手段。主要有单纯参照、相关参照和一般参照。

单纯参照是反映同义关系的参照,一般用“见(see)”、“见自(seefrom)”来显示等同关系。

相关参照是指两个具有等级或者相关关系而又是正式使用的标题词之间的参照,用“参见(seealso)”、“参见自(seealsofrom)”来显示。一般参照是一种概括性的举例性参照。5.2.2标题词的语义参照(续)

例:电脑 (非正式标题词)见 电子计算机 见(正式标题词)电子计算机 (正式标题词)见自 电脑 见自(非正式标题词)海洋学 (上位标题词)参见 海洋地质学 参见(下位标题词)5.2.2标题词的语义参照(续)

作为一种传统的的主题法,标题词表的特点有:(1)采用列举式词表(2)定组式标题结构(3)操作简便5.3单元词语言

5.3.1 单元词的内涵

单元词(uniterm)又称元词,它是从文献中抽取出来并经过控制处理的,能表达文献主题最小、最基本的在概念上不能再分解的,并能独立地描述文献所论及或涉及的事物——主题的词汇单位。

5.3.1 单元词的内涵比较系统地建立起单元词法理论和体系地是1951年陶伯的单元词卡系统,开创了后组式主题语言。单元词可以是一个单纯词,如“山”、“水”、“氧”、“玻璃”、“逻辑”、“火车”、“资料”、“马克思”、“乌鲁木齐”等,也可以是一个合成词,如“文字”、“图书馆”、“车床”、“隔音”、“公路”等。5.3.1 单元词的内涵(续)

任何复杂的概念都可由单元词的组合(配)而成。

在实际使用过程中,单元词法使用的单元词并非都是任意的,实际上它只选用经过规范化处理过的单元词来表示文献的主题。5.3.1 单元词的内涵(续)

组配就是从主题词表(但组配也适用于分类组织法)中选取若干个主题词,按照一定的概念组合关系和符号,把他们有机地结合起来,以表达更为专指的主题。组配时主要使用比号组配法和比孔组配法两种方法。单元词法中标题是组配构成的,而且是“后组式的”。

5.3.2 单元词的特点(续)

具体地说,单元词法的主要特点是:①

摆脱了标题法中每个标题只能选择一种标题形式作为正式标题的局限性,也就是可以同时使用多个单元词对同一份文献从不同的侧面分别进行标引;②

单元词之间不存在次序问题。但是这有可能会产生误检,例如在查找“学校图书馆”时,由于使用“图书馆”和“学校”这两个单元词进行组配,结果可能会把“图书馆学校”和“学校图书馆”的额外概念都检索出来。

5.3.2 单元词的特点(续)

具体地说,单元词法的主要特点是:

(3)组成“标题“的每一个单元词都是排检词,都可以作为检索入口,因而与标题法相比,单元词的检索途径较多。

(4) 利用对单元词的增加或减少,可以进行扩检或缩检。5.3.2 单元词的特点(续)

具体地说,单元词法的主要特点是:

(5)标引深度较高。单元词是一个标识(一个单元词)一张卡片,单元词的数量都有一定的限制。每张单元词卡片一般可以记录200个文献号码,而且还可以继续使用第2、3张卡片。如果采用比孔卡片,则可以记录更多的文献号码,因而可以大大提高文献的标引深度。例如,美国杜邦公司的几个检索系统,有许多文献标引了400多个单元词。

5.3.2 单元词的特点(续)

具体地说,单元词法的主要特点是:(6) 有利于向计算机检索方向发展。单元词法最初不编制词表,因而对词义的控制和词义的规范都不作要求,但是后来也编制了词表并使用语义参照系统。5.3.2 单元词的特点(续)

单元词的字面组配

序号字面组配

概念

1老人+头+皮鞋

老人头皮鞋

2岳西+高腔

岳西高腔

3香蕉+苹果

香蕉苹果

4牛+蛙

牛蛙

5田+鸡

田鸡

6联想+计算机

联想计算机

7岳西+翠兰

岳西翠兰

8青岛+啤酒

青岛啤酒

5.4 叙词语言

5.4.1叙词的涵义和特点

为了避免单元词法的上述缺陷,人们又研制了一种新的信息组织方法——叙词法。

叙词(descriptor,Subjectterms),它是经过词汇控制后,在信息组织中用来显示文献主题,在检索中用来构造提问式的一种检索词汇。

5.4.1叙词的涵义和特点叙词法是以受控的自然语言为语词基础,以字顺和分类系统为词汇显示的基本手段,以语词的概念组配而不是字面组配为重要特征的一种标引和检索文献的理论方法,又称其为描述词、叙述词,在国内也叫主题词。叙词法就是以叙词作为标识符号,标引和检索文献信息的一种检索方法。

5.4.1叙词的涵义和特点(续)1959年美国杜邦公司编制了第一部叙词表,其后,随着计算机的应用,叙词表的编制迅速发展,叙词语言成为受控信息组织和检索的主要语言。

叙词语言因其功能优良,20世纪60年代以来发展迅速,被称为当代信息组织检索语言的主流。5.4.1叙词的涵义和特点(续)

叙词法的主要特点是:(1)直接以规范化了的自然语言——叙词作为标识符号,直观性强;

(2)直接从论述和研究的具体对象和问题出发进行选词,并采用叙词组配来描述主题,专指性强;

(3)叙词法能随时加以增设修改,适应性强;

(4)对叙词主要采用字顺排列方式,查找迅速;5.4.1叙词的涵义和特点(续)叙词法的主要特点是:(5)主要采用后组式概念组配方法,灵活性强;

(6)对同一主题文献,可以作多维检索(多途径检索);

(7)叙词表中编制和建立了叙词语义关系的网络结构(叙词字顺索引的参照系统,叙词范畴分类系统、叙词等级系统,叙词词族图等),加强了叙词法的学科系统性和族性检索作用。5.4.2字面组配与概念组配的区别

⑴对词汇单位的要求不同

字面组配只要求参与组配的词与组配构成的词在字面形式上的一致,强调参与组配词语的单元性,要求采用最小的词汇单位-单词,而不用词组。隧道二极管雪崩二极管概念组配要求以表达基本概念的语词为标识,用于概念组配的语词既可以是单词,也可以是词组。隧道二极管雪崩二极管5.4.2字面组配与概念组配的区别

⑵本质不同

字面组配利用构词法进行词的分拆和组合,符合构词规律,但不一定符合概念逻辑。

概念组配在概念分析基础上进行概念综合,是符合概念逻辑的组配。概念组配所表达的概念与参加组配的各方所表达的概念在逻辑上是有联系的,往往表现为下位概念与上位概念的关系。

5.4.2字面组配与概念组配的区别

⑶概念组配类型

①交叉组配

使用两个或多个具有交叉关系的叙词进行组配

心理学教育学教育心理学

电视机录像机电视录像机

水生动物哺乳动物水生哺乳动物

5.4.2字面组配与概念组配的区别

⑶概念组配类型

②方面组配(限定组配)

将表示某一事物的叙词与表示事物方面(部分、属性、状态、过程、条件、关系等方面)的叙词进行组配

汽车发动机汽车发动机汽车操纵稳定性汽车操纵稳定性

汽车车辆保养汽车保养

5.4.2字面组配与概念组配的区别

⑶概念组配类型

③特称组配

用一个表示事物类称的属概念叙词与表达“种差”的叙词进行组配

种差:待表达的种概念比参与组配的那个属概念多出某种特征平面磨床卧式卧式平面磨床齿轮不锈钢不锈钢齿轮

5.4.2字面组配与概念组配的区别(续)

序号字面组配

概念

1老人头牌+皮鞋

老人头皮鞋

2岳西地方戏+高腔

岳西高腔

3香蕉味水果+苹果

香蕉苹果

4牛蛙

牛蛙

5田鸡

田鸡

6联想牌+计算机

联想计算机

7岳西翠兰

+茶叶岳西翠兰

8青岛牌+啤酒

青岛啤酒

序号字面组配

概念

1老人+头+皮鞋

老人头皮鞋

2岳西+高腔

岳西高腔

3香蕉+苹果

香蕉苹果

4牛+蛙

牛蛙

5田+鸡

田鸡

6联想+计算机

联想计算机

7岳西+翠兰

岳西翠兰

8青岛+啤酒

青岛啤酒

5.4.3叙词法的词汇控制

叙词主要用来通过组配而精确细致地表达文献主题,叙词法是迄今词汇控制最严格,采用的词汇控制手段最完备的一种主题法。(1)词类控制

①普通名词术语②特定事物的专有名词5.4.3叙词法的词汇控制

(2)词组控制

作为总的规则,应该是尽量将复词分解为单一概念词,但以不影响用户对词义的正确理解为准。

►不应选择作叙词的情形

①可由具有交叉关系的已定型简单概念词组配表达的较复杂概念,一般不应选用词组作叙词。喷气式垂直起落飞机用喷气式飞机+垂直起落飞机5.4.3叙词法的词汇控制

(2)词组控制

►不应选择作叙词的情形

②可用代表事物与事物方面的两个简单概念词组配表达的较复杂概念,一般不应选用词组做叙词。汽车设计用汽车+设计5.4.3叙词法的词汇控制

(2)词组控制

►不应选择作叙词的情形

③表示事物的部分,一般用表示事物整体的词与表示事务部分的词组配,而不用词组表达。汽车发动机用汽车+发动机5.4.3叙词法的词汇控制

(2)词组控制

►不应选择作叙词的情形

④表示文献类型的词一般不与表示事物、学科或论题的词组成词组叙词。数学辞典用数学+专科辞典5.4.3叙词法的词汇控制

(2)词组控制

►不应选择作叙词的情形

⑤专有名称一般不与普通名词组成词组叙词陶行知教育思想用陶行知+教育思想5.4.3叙词法的词汇控制

(2)词组控制

►应该选用词组作叙词的情形

①专有名词中国共产党十五届六中全会(2001)中华人民共和国刑事诉讼法5.4.3叙词法的词汇控制

(2)词组控制

►应该选用词组作叙词的情形

②在专业文献中出现频率较高,并且用户经常用于表达检索课题的词组一般应直接用词组作叙词。巡航导弹舰艇捕获粒子不稳定性航空航天医学试验设备5.4.3叙词法的词汇控制

(2)词组控制

►应该选用词组作叙词的情形

③分解出的单词有一方没有独立检索意义,或改变了它在词组中的原意,应该用词组做叙词。比例税蜂窝材料依赖脱氧核糖核酸的脱氧核糖核酸聚合酶5.4.3叙词法的词汇控制

⑶词形控制

►对同义不同形的词优选其中的一种形式作叙词,以避免信息分散而降低查全率。

①汉字形体的控制选择较广泛或有权威性规定的写法储罐(叙词)贮罐(非正式叙词)5.4.3叙词法的词汇控制

⑶词形控制

②外语词的形式和形态控制可数名词一般多用复数;专有名词及表示学科领域、工艺过程、事物属性的词多用单数。

Detectors探测器Chemicallasers化学激光器Chemistry化学Viscosity粘性Painting绘画Paintings图画5.4.3叙词法的词汇控制

⑶词形控制

③外来词的形体控制汉译名或原文与汉字结合

DMF

代二甲基甲酰胺ECHO病毒

代人肠细胞病变孤儿病毒5.4.3叙词法的词汇控制

⑷词义控制

主要对多义词,同形异义词和词义含糊而导致理解不一的词进行处理,使叙词的词义具有单一性和明确性①加限定词或限义符号指明多义词和同形异义词所属的范围(学科专业、事物类别、地域时间等)从而明确词义,使其具有单一性。标引和检索时,限定词连同圆括号都不能省略。5.4.3叙词法的词汇控制

⑷词义控制①加限定词或限义符号加限定词的方法:一是对多种含义都加以限定而使之区别;二是对本义或通用义不加限定,只对转义或其他义加限定。涡流(流体力学)涡流(气象)

巴黎和会(1918)巴黎和会(1946)稳定平台(导航)稳定平台(天线)稳定性稳定性(数学)5.4.3叙词法的词汇控制

⑷词义控制②加限定词或限义符号在汉表中用“P”缀于某些叙词之后,作为叙词的组成部分,表示某种化合物的衍生物,以区别于该化合物。次磷酸次磷酸(P)硫酸盐硫酸盐(P)5.4.3叙词法的词汇控制

⑷词义控制③用注释注释可以说明叙词字面所不能明确的含义,或者指示叙词的使用方法,或者注明叙词的始用日期及变化情况。

含义注释一般是对叙词的含义或包括的范围做出说明,有时就是提供叙词的定义封建社会学校注:封建社会的各种学校,如太学、书院、私塾等5.4.3叙词法的词汇控制

⑷词义控制③用注释

用法注释保证叙词的正确使用而做的说明称号等级(体育)注:作教练员、运动员、裁判员的等级称号组配用5.4.3叙词法的词汇控制

⑷词义控制③用注释

历史注释主要用于说明叙词收入词表的时间,或其变化情况,从使用沿革的角度表明该叙词与相关词的联系和区别。断层摄影术(增词时间:1989年)5.4.4叙词组配应注意的问题

组配时需要注意这几个问题:(1)要尽量使用词表中给出的主题词,只有词表中单个主题词不能够表达主题,才进行组配;

(2)要防止单纯字面组配,组配必须是概念组配;

(3)要防止多标识组配,必须选用与所表达的主题关系最密切、最邻近的主题词进行组配。

5.4.4叙词组配应注意的问题(续)

组配时需要注意这几个问题:

(4)要防止越级组配,也就是在标引时不能以粗(大概念——泛指词)代细(小概念——泛指词)或以细代粗。比如,在词表中有“美国”、“政策”、“对华政策”、“对外政策”几个主题词时,只能用“美国”与“对华政策”组配成“对华政策-美国”来标引“美国对华政策”。(5)要防止虚假组配。(6)要防止二义性组配。“信息-管理”——“管理-信息”5.4.5叙词的参照系统

■叙词法也使用参照系统来显示概念之间的相互联系,其方法与标题法中的基本相似。叙词表参照系统所用的符号主要有:

语义关系中文名称

中文简称拼音缩写英文缩写英文原文等同关系

叙词用Y

USE

Use

非叙词

D

UF

Usedforcombination

等级关系

上位叙词

属S

BT

Broadterm

下位叙词

F

NT

Narrowterm

族首词

Z

TT

Topterm

相关关系

相关叙词

C

RT

Relatedterm

5.4.5叙词的参照系统(续)

■⑴等同关系:

叙词与非正式叙词之间的关系

Y将非正式叙词引向叙词

D提示叙词所取代的非正式叙词煤气警报器

Y毒气警报器瓦斯警报器

Y毒气警报器毒气警报器

D煤气警报器瓦斯警报器5.4.5叙词的参照系统(续)

⑵等级关系:

上位叙词与下位叙词之间的关系

S上位叙词的指引符,用在下位叙词下,指出它所属的上位叙词

F下位叙词的指引符,用在上位叙词之下,指出它的下位叙词

S族首词指引符,用在依等级关系构成一族的,除族首词及族首词的直接下位词之外的其他叙词下,指出它所属词族的族首词(一族词中最泛指的上位词)5.4.5叙词的参照系统(续)

■⑵等级关系:断裂力学

F全面屈服断裂力学弹塑性断裂力学线弹性断裂力学

S固体力学

Z力学5.4.5叙词的参照系统(续)

⑶相关关系:叙词之间具有一定联系,方便标引人员在相关叙词的比较中选准标引用词;方便检索者从相关叙词中选准和选全表达检索课题的叙词,从而提高检索效率车站大型机床技术伪装

C站台C立式车床C天然伪装传真通信地基失效整训(军事)

C电报C地基变形C轮训(军事)辐照船舶操纵辛丑条约

C辐射改性C超声波接岸速度仪C李鸿章5.4.5叙词的参照系统(续)

Gongzi

jijinlun

工资基金论 05DCWagefundtheoryS庸俗分配论

Z政治经济学Gongzi

laodongzhe

工资劳动者 03BAWagelabour;Wage-earnerD雇佣劳动者

F店员工人

S劳动者5.4.6叙词表的结构

叙词表:在我国又称为主题词表,以特定的结构集合和展示经过规范化处理的叙词和非正式叙词,并显示它们之间的语义关系,作为叙词标引和检索依据的术语控制工具。5.4.6叙词表的结构(续)

叙词表:⒈字顺系统部分⑴主表:字顺表⑵附表:专有叙词表⑶辅助表(索引):①轮排索引②字顺索引③入口词表④双语种对照索引⒉逻辑系统部分辅助表(索引):⑴范畴索引⑵词族索引⑶叙词关系图⑷分类表5.4.6叙词表的结构(续)

叙词表:⒈字顺系统部分⑴主表:字顺表将众多叙词款目和非正式叙词款目按字顺排列的词汇表,又称为主表。基本功能是为标引和检索人员提供直接从概念名称的字面形式出发,按字顺迅速查找所需叙词的途径;并且通过参照系统及有关标注项帮助查词者判定叙词的含义,找到更恰当的词或更多的词。5.4.6叙词表的结构(续)

⑴主表:字顺表汉语拼音Dianzu

han款目主题词电阻焊

【66L】范畴号英文译名Resistancewelding

带项符号D接触焊非正式主题词分项符号F点焊缝焊下位主题词凸焊属项符号S加压焊上位主题词族项符号Z焊接族首词及族首词符号参项符号C电阻焊机相关主题词5.4.6叙词表的结构(续)

⒈字顺系统部分⑵附表:专有叙词表将专有名称叙词或非正式叙词款目按字顺排列,单独集中展示的词汇表。设立目的:

压缩字顺表的篇幅,方便从字顺表中查词

便于用户迅速查到所需的专有叙词,不必去词量较多的主表中查找5.4.6叙词表的结构(续)

⒈字顺系统部分⑶辅助表(索引):①轮排索引将叙词按照其语素的字顺轮流排列到检索入口,使含有相同词素的词集中在一起的索引。

按字面成族原理揭示叙词之间的联系;

提供查找词组叙词的多个字顺入口

将含有相同语素的词集中一处,增加发现叙词间联系和区别的机会5.4.6叙词表的结构(续)

⑶辅助表(索引):①轮排索引检索入口范畴号及用代参照页码及栏号(主表)航道71DD1056左

Navigablechannels

副航道71DD816右进港航道71DD1392左沿海航道71DD2905左5.4.6叙词表的结构(续)

⑶辅助表(索引):②字顺索引将叙词按字顺排列,不包含叙词款目中的其他项目的一种索引,是对字顺表的简化,提高查词速度。5.4.6叙词表的结构(续)

⑶辅助表(索引):③入口词表在少数情况下,如果非正式叙词数量接近或超过叙词时,或希望收录更多的非正式叙词时,编制入口词表将非正式叙词按字顺排列,并指出其对应叙词的索引。5.4.6叙词表的结构(续)

⑶辅助表(索引):④双语种对照索引将全部或大多数叙词和非正式叙词与其外语译名相对应,按外语译名字顺排列的索引

Pilotboats

领航船

Y引航船

Pilotcabins

驾驶舱

Y座舱5.4.6叙词表的结构(续)

⒉逻辑系统部分辅助表(索引):⑴范畴索引又称分类索引﹑范畴表,是按叙词表全部叙词和非正式叙词所属学科或范畴编制的词汇分类索引。

便于从学科或专业角度查找叙词在叙词表编制工作中发挥积极作用按范畴统计和控制词汇量

可用于组织分类主题目录式的检索工具5.4.6叙词表的结构(续)

⒉逻辑系统部分辅助表(索引):⑴范畴索引

45生物科学

45A普通生物学

45AA生物科学一般概念半咸水生物变性超渗透现象

45AB生命起源代谢起源核仁5.4.6叙词表的结构(续)

⒉逻辑系统部分辅助表(索引):⑵词族索引也称等级索引、族系表,是将字顺表中具有等级关系的叙词按属分等级构成词族,并按各词族的族首词字顺排列的词汇索引。提供从族首词出发,查找所需叙词的途径借助上下位词和同义词,明确词义在机检系统中,自动进行上位词登录,满足族性检索要求方便进行扩检和缩检5.4.6叙词表的结构(续)

⒉逻辑系统部分辅助表(索引):⑵词族索引

Cai

chan

财产03LE.不动产03LE.动产03LE.个人财产03LE..家庭财产03LE.国家财产03LE.集体财产03LE.遗产03LE5.4.6叙词表的结构(续)

⒉逻辑系统部分辅助表(索引):⑶叙词关系图词族图或语义关系图,用图形显示叙词之间关系的一种工具。5.4.6叙词表的结构(续)

⒉逻辑系统部分辅助表(索引):⑷分类表实现分类主题一体化的词表中,与字顺表相配合的分类表5.5关键词语言

5.5.1 关键词的涵义关键词是指在文献的标题、摘要或正文中出现的,对表达文献主题内容具有实质意义,能作为检索入口的、具有关键性描述作用的词汇。5.5.1关键词的涵义(续)1.关键词的特点关键词选取简单,语词基本不作控制。标引检索不需词表,因而特别适合于在信息量猛增现实情况下的信息组织和信息检索的需要,只编制禁用词表。关键词在关键词系统中彼此独立,对概念之间的关系不予显示。因而为按关键词进行信息组织提供了极大的便利。

5.5.1关键词的涵义(续)2.关键词的发展状况随着计算机在信息组织活动中应用的范围的扩大和应用力度的加强,关键词在信息组织、信息揭示和信息检索中必将发挥越来越大的作用。

目前,完全自然语言处理技术还有待提高,关键词作为一种近似的自然语言,能够在人工语言和自然语言中间起到沟通桥梁的作用。5.5.2关键词的类型

3.关键词法原理的应用不带上下文的关键词索引单纯关键词索引

、词对式关键词索引、简单关键词索引带上下文的关键词索引题外关键词索引、题内关键词索引、双重关键词索引5.5.2关键词的类型(续)

单纯关键词索引是将从文献的正文、摘要和题目中抽出的关键词按照字顺轮流领头进行排列、没有上下文修饰的一种索引。每一组关键词后著录文献号码,组成一个款目。

5.5.2关键词的类型(续)

其索引款目格式是:模式数字图书馆123数字图书馆模式123图书馆模式数字123关键词1

关键词2

……关键词n

地址

5.5.2关键词的类型(续)

词对式关键词索引是每次只取文献多个关键词中的两个配对构成索引款目并轮排的关键词索引。模式数字图书馆数字123模式123模式

123

图书馆123图书馆123数字1235.5.2关键词的类型(续)

简单关键词索引是只有一个关键词的关键词索引,一般每个关键词后会有许多个文摘号。模式123

124126129133数字123125126128131

图书馆1231241271301345.5.2关键词的类型(续)

题内关键词索引(Keywordincontextindex,KWIC)又称为上下文关键词索引,就是把关键词保留在文献的题目之内,关键词的上下文和词序都不变。在编制索引款目时将每一个关键词按照字顺轮流做检索标目,排在版面的固定位置,并用黑体字表示作为标目的关键词,其上下文(即前后文)均随之移动位置。

5.5.2关键词的类型(续)

其主要特点是在列出关键词时,保留了题目中的非关键词,而且词序不变。这样关键词与非关键词组成了一条短语,即一条上下文,因而便于明确关键词在题目中的含义。这种形式特别便于用计算机来编排处理。5.5.2关键词的类型(续)

其索引款目构成形式是:

联机计算机在核反应堆中的应用0001计算机与信息系统引论0002以计算机为基础的信息系统导论0003计算机在神经生物和行为学中的应用0004图书馆与计算机0005教育与计算机0006上文

关键词

下文

地址

5.5.2关键词的类型(续)

题外关键词索引(Keywordoutofcontextindex,KWOC)也称上下文索引,是单纯关键词索引的一种变体,是针对KWIC索引提出的改进形式。其编制原理与单纯关键词索引基本相同。不同的地方是把文献中抽出的一组关键词同时放在题目、号码上面,轮流领头进行排列,或者是单个关键词轮流放在题目、号码前面。在这种索引款目下,不仅著录文献号,还要著录文献的题目,以便读者选择文献时参考。

5.5.2关键词的类型(续)

其索引款目构成形式是:关键词

篇名

文献地址

5.5.2关键词的类型(续)

例:计算机、神经生物、行为学“计算机在神经生物学与行为学中的应用”0007神经生物、计算机、行为学“计算机在神经生物学与行为学中的应用”0007行为学、计算机、神经生物“计算机在神经生物学与行为学中的应用”00075.5.2关键词的类型(续)

双重关键词索引(DoubleKWICindex)一个款目有两个关键词作双重标目(一个主标目和一个副标目)的关键词索引。

主标目副标目上下文文献地址5.5.2关键词的类型(续)

双重关键词索引

数字模式/论数字图书馆的123

图书馆的模式/论数字123

模式数字图书馆的模式/论123

图书馆的模式/论数字123

图书馆数字图书馆的模式/论123模式/论数字图书馆的1235.6国内外主要主题词表简介

5.6.1《美国国会图书馆标题表》1.发展概况《美国国会图书馆标题表》(LibraryofCongressSubjectHeading,LCSH)是美国国会图书馆在编目实践的基础上编制起来的标题表。1986年以机读形式出现,称为主题规范档,同年出版第10版。5.6.1《美国国会图书馆标题表》目前LCSH有三种形式:其一,印刷本,按年度出版,现为20版,共收入25万条记录;其二,机读版,也以CD-ROM的形式,称为CDMARCSubject;其三,微缩版。LCSH每周更新,并将新主题及标题变化即使并入主题规范档,同时按月出版每月的更新。微缩版、CD-ROM版每月出版一次,收入在此期间的增补变化。5.6.1《美国国会图书馆标题表》(续)LCSH由主表,副表和使用说明三部分组成。其中,主表是标题表的主体。主表由众多规范化标题及各类参照按字顺排列,许多标题后附有《美国国会图书馆分类法》的分类号。

5.6.1《美国国会图书馆标题表》(续)

2.款目结构

LCSH的主表是由众多的标题款目和非标题款目按字顺排列的一览表。其款目由以下几部分组成:

①标题与非标题。标题款目中的标题词用黑体显示,包括主标题和副标题等不同类型,后随分类号、范围注释、参照项等,是词表中进行主题标引的依据。5.6.1《美国国会图书馆标题表》(续)2.款目结构

②分类号。约有近40%的标题后附有相应国会分类法的分类号,这些类号通常表示与主题词一致的最基本方面。③注释。主要用以对标题进行补充说明,规范使用方法。包括说明标题的含义,规定该标题编目时的使用范围,指明它与相关标题的界限,说明多义标题的确切含义等。5.6.1《美国国会图书馆标题表》(续)2.款目结构

④参照项。用与叙词法相似的参照项目及符号,明确区分等级关系和相关关系,使词间关系更加清楚,同时使用的SA(SeeAlso)作说明参照,用于揭示一组相关标题或指示查找相关标题的方法。

5.6.1《美国国会图书馆标题表》(续)3.主标题的类型①单词标题。即由一个单一的名词或动名词构成的标题。如economics(经济);②形容词短语标题。由形容词和相当于形容词的名词、动名词与名词组成。例:nuclearphysics(核物理学);

5.6.1《美国国会图书馆标题表》(续)3.主标题的类型③连词短语标题。即由连词相联结的短语标题,用于表示两个对应或密切联系的主题。如:emigrationandimmigration(移民迁出和移民迁入);

④介词短语标题。以介词联结,用于表示两个对应或密切联系的主题。如:boardsoftrade(贸易董事会);5.6.1《美国国会图书馆标题表》(续)3.主标题的类型⑤倒置标题。将一重要的词置于开头,便于集中。如:chemistry,organic(化学,有机);⑥自由浮动标题。可在指定范围内通过配置建立的短语标题。如:[Personalname]infiction,drama,poetry,etc.(小说、戏剧、诗歌中的某人)[Topicorplace]inart(艺术中的某论题或某地)[Topicorplace]inliterature(文学中的某论题或某地);

5.6.1《美国国会图书馆标题表》(续)3.主标题的类型⑦加限义词的标题。通常以表示学科、范畴、地区、时代的词加以限定,使其含义明确。如:cold(disease)correlation(statistics)analysis(philosophy);

5.6.1《美国国会图书馆标题表》(续)

4.子标题类型子标题,亦称副标题,主要用于通过与主标题的组配对复合主题进行标引和检索。①论旨子标题:主要通过对主标题或上位子标题的限定表示专指的子标题,用于表示上位标题的应用﹑活动﹑操作等②形式子标题:用于表示一主标题或上位子标题的表达或组织形式,通常是标题的最后一个成分。5.6.1《美国国会图书馆标题表》(续)

5.自由浮动标题

为了便于在主题标引的同时对标题进行有效控制,LCSH使用自由浮动复分表的形式进行组配。自由浮动复分表包括单独列表和采用类型标题的形式。具体包括下述类型:①通用自由浮动复分表。②特定范畴的自由浮动复分表。③类型示范标题表。④多款目标题。

5.6.1《美国国会图书馆标题表》(续)

6.LCSH的管理和辅助工具

LCSH的辅助工具有:《主题编目手册》(编目部分)(SubjectCatalogingManual:SubjectHeadings)、《编目服务公报》、《名称规范档缩微版累积本》(NameAuthoritiesCumulativeMicroficheEdition)或《CDMARC名称》、《自由浮动子标题字顺索引》((Free-floatingSubdivisions:AnAlphabeticallndex)。5.6.2《医学图书馆标题表》

1.《医学图书馆标题表》简介

《医学图书馆标题表》(MedicalSubjectHeadings,MeSH)是美国国家医学图书馆(U.S.NationalLibraryofMedicine,简称NLM)针对生物医学数据所整理出的主题词汇。

5.6.2《医学图书馆标题表》(续)

1.《医学图书馆标题表》简介

对同一概念采用固定的词汇表达方式,以达到控制词汇的目的。美国医学标题表是生物医学领域中使用最普遍,也是最为重视的标题表。如重要的医学数据库MedLine并是采用MeSH做为主题分析的根据。5.6.2《医学图书馆标题表》(续)

2.《医学图书馆标题表》结构

(1)字母顺序标题表(AlphabeticList)字母顺序标题表是将所有的医学标题以字母顺序排列呈现,并佐以交互参照(cross-references),这也是一般标题表最常使用的呈现方式。MeSH提供的交互参照有两种:see∕X及seerelated∕XR。

5.6.2《医学图书馆标题表》(续)

2.《医学图书馆标题表》结构

⑵树状结构标题表(TreeStructures)将所有标题词分类呈现,并建立每个类别内标题词间的层级关系。5.6.3《汉语主题词表》

《汉语主题词表》是我国第一部大型的综合性的叙词表,由中国科技信息研究所和北京图书馆负责主持,1975年开始编制,1980年正式出版。分为社会科学、自然科学和附表3卷,共10个分册,全表收录主题词108568个。其中正式主题词91158个,非正式主题词17410个,词族数3707个,一级范畴数58个,二级674个,三级1080个。

5.6.3《汉语主题词表》(续)

1991年自然科学部分出增订本,增补新词8221条,删除不适用词5434条。《汉语主题词表》分3卷10册:第一卷(2册)为社会科学部分,第二卷(7册)为自然科学部分,两部分均包括字顺主表、范畴索引、词族索引和英汉对照索引,第三卷为附表,包括世界各国政区名称、自然地理区划名称、组织机构名称及人物名称。《汉语主题词表》涵盖各个学科专业,收词量大,编制体例规范,对推动中国主题标引工作的开展和促进专业叙词表的编制起了重要作用。5.6.3《汉语主题词表》(续)

1.目的与功能

《汉语主题词表》是一部显示主题词与词间语义关系的规范化动态性的检索语言词表。它是沟通情报文献工作者与情报用户之间的思维桥梁,是自然语言与情报系统语言之间的媒介,同时又是人与计算机之间在进行情报存储与检索方面的联系工具。5.6.3《汉语主题词表》(续)

2.选词原则与范围

本词表作为一部大型综合性科技检索工具,收词范围包括自然科学、医学、农业、工程技术等各学科领域的主要名词术语,适合对各种科技书刊、研究报告、学术论文、会议录、专利、标准以及产品样本等图书情报资料进行叙词标引与检索。由于考虑到手工检索中一般使用组配的级别有限,本词表在选定词时,对词组型主题词的数量作了适当的增加。5.6.3《汉语主题词表》(续)

2.选词原则与范围

(1)选词原则

选定的主题词,主要是各学科领域文献中经常出现、在情报检索中有使用价值和一定的使用频率、能作为主题汇集一定量文献或具有叙词组配功能的名词术语;

选定的主题词,必须词形简练、词义明确、严格遵守一词一义原则,并且通过概念组配应能表达文献或用户查询的特定主题;5.6.3《汉语主题词表》(续)

2.选词原则与范围

(1)选词原则

③选定的主题词,应符合我国科技发展的实际需要,尽量与国内外主要科技主题词表相兼容,并应注意主题词的科学性与思想性。

5.6.3《汉语主题词表》(续)

2.选词原则与范围

(2)选词范围

①表示具体事物名称的名词术语,如汽车、变压器、反应堆等;②表示事物的状态或现象的名词术语,如强度、失真、土壤熟化等;5.6.3《汉语主题词表》(续)

2.选词原则与范围

(2)选词范围

③表示科学分类的名词术语,如电子学、建筑工程、水利工程等;④表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法等;⑤表示工艺方法、加工技术的名词术语,如铸造、锻造、激光切割等;5.6.3《汉语主题词表》(续)

2.选词原则与范围

(2)选词范围

⑥表示化学元素、化合物、金属材料与合金的名词术语,如钠、吡啶、醇聚四氟乙烯、等;⑦表示国家名称、地名、组织机构名称及人名的专有名词以及文献类型、文献载体的名词术语。5.6.3《汉语主题词表》(续)

3.《汉语主题词表》的专业词表

为了适应专业文献的主体标引,人们在《汉语主题词表》的基础上又开发出一些专业汉语主题词表,如《交通汉语主题词表》、《数学汉语主题词表》、《物理汉语主题词表》、《林业汉语主题词表》等。

5.6.4《中国分类主题词表》

1.发展简史

《中国分类主题词表》是在《中图法》编委会的主持下,从1987年开始由全国40个图书情报单位共同参加编制,1994年出版的一部大型文献标引工具书。

2001年5月在国家社科基金委员会批准立项为“数字信息资源组织工具的研发与应用”,《中国分类主题词表》第二版和电子版是该项目的主要研制成果,现已于2005年9月由北京图书馆出版社出版。

5.6.4《中国分类主题词表》(续)

2.构成及特点

第一卷为“分类号-主题词对应表”部分,是《中国分类主题词表》从分类到主题、从类号到叙词的对照索引体系;第二卷为“主题词-分类号对应表”部分,是《中国分类主题词表》从主题词到分类号,从标题到分类号的对照索引体系。5.6.4《中国分类主题词表》(续)

2.构成及特点

“分类号-主题词对应表”

O655.26非水溶液滴定法无机分析-非水滴定非水滴定O655.29其他方法无机分析-滴定无机分析-催化滴定;催化滴定无机分析-碘量法;碘量法无机分析-温度滴定;温度滴定5.6.4《中国分类主题词表》(续)

2.构成及特点第二卷为“主题词-分类号对应表”部分,是《中国分类主题词表》从主题词到分类号,从标题到分类号的对照索引体系。5.6.4《中国分类主题词表》(续)

2.构成及特点“主题词-分类号对应表”繁殖

Q132D增殖

.营养繁殖

..分根

…腹接

C育苗5.6.4《中国分类主题词表》(续)

为各图书情报单位学习、掌握和使用《中国分类主题词表》,提高文献主题标引和文献分类标引质量,由《中图法》编委会组织编写了《〈中国分类主题词表〉标引手册》。手册主要内容包括分类主题一体化检索语言;《中国分类主题词表》的编制及使用;文献标引的一般方法;各种主题形式和主题因素文献的标引;各类型文献的标引;主题检索工具附录。

5.6.4《中国分类主题词表》(续)

3.《中国分类主题词表》的主要特点是:(1)通过将《中图法》类目与《汉表》主题词的对应,建立起了一个分类语言与主题语言结合的一体化工具。(2)其分类法部分是将《中图法》、《资料法》融为一体的类目体系,可以同时供图书资料单位标引使用;在作为图书标引工具时,《资料》部分的类目,可以作为《中图法》对应类目的说明对待。

5.6.4《中国分类主题词表》(续)

3.《中国分类主题词表》的主要特点是:(3)其主题法部分,除收入原有的叙词外,还包括《汉表》等。(4)改进了字顺表的款目结构,改进了排检方法。

5.6.4《中国分类主题词表》(续)

4.《中国分类主题词表》电子版

5.7主题产品:百度的关键词竞价

5.7.1 关键词竞价的背景

据统计表明:★65-70%的网民点击搜索结果的第一页即前10条。★20-25%的网民点击搜索结果的第二页即第11-20条。★3-4%的网民点击第三页及以后的结果。5.7.2关于百度的关键词竞价

百度于是全球最大的中文搜索引擎。并于2001年8月,发布B搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式,2001年10月22日正式发布Baidu搜索引擎。百度拥有全球最大的中文网页库,每天处理来自一百多个国家的超过一亿人次的搜索请求。

5.7.2关于百度的关键词竞价(续)

关键字竞价排名,是指由用户(通常为企业)为自己的网页出资购买关键字排名,按点击计费的一种服务。通过竞价排名,搜索结果的顺序将根据竞价的多少由高到低排列,同时奉行不点击不收费的原则。

5.7.3关键词的选取

(1)选择与你的网站相关性比较大的关键词。当你的潜在客户查询相关产品信息时,搜索结果会立即链接到企业的网站主页上去。(2)选择一些不太热门的关键词,前提是这些关键词于你的产品和服务有关。(3)从客户的搜索的角度去选择关键词。(4)注意关键词的投资回报率。5.8主题组织发展简史

主题法最早可以可以追溯到我

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论