信息资源组织的主题描述语言_第1页
信息资源组织的主题描述语言_第2页
信息资源组织的主题描述语言_第3页
信息资源组织的主题描述语言_第4页
信息资源组织的主题描述语言_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息资源组织的主题描述语言第一页,共三十页,2022年,8月28日主题语言也称主题法,它是一种由受控的自然语言语词直接表达主题概念,按语词字顺排列主题概念,主要用参照显示概念之间关系的标引语言。

标题语言

单元词语言

叙词语言

关键词语言第二页,共三十页,2022年,8月28日3.1主题描述语言的沿革

3.1.1标题词描述语言标题语言是最早产生的一种主题语言。标题是主题标目(SubjectHeading)的简称,它是直接表达文献主题的标识,大多是对文献内容所论及事物名称及特征的规范表达。众多标题集合而成的主题标识系统,就是标题语言.

目前,使用最广的标题表是《美国国会图书馆标题表》。第三页,共三十页,2022年,8月28日标题语言的原理(1)标题的性质直接性直观性受控性语义关联性先组性示范性第四页,共三十页,2022年,8月28日先组式语言:是指在检索实施前已事先组配好的一种检索语言,用户只能用这种已经固定好的检索词组形式去完成检索,它有较好的直接性和专指性,但灵活度差,比如标题词语言。后组式语言:是指在检索实施前未事先组配好的、以单元词等形式出现的一种检索语言,

在检索时将它们临时组配起来,表达一定的概念,来完成检索。这种后组方式提供了灵活的组配方式,在计算机检索中的到广泛应用。

第五页,共三十页,2022年,8月28日(2)标题语言的特点受控语言字顺排列概念形成语义网络按事物集中先组式适应能力强(3)标题语言的类型单级标题、带说明的单级标题、多级标题倒置标题、带限定词标题、混合标题第六页,共三十页,2022年,8月28日(4)标题语言的范围和选词原则具有检索意义适当的专指度通用性和准确性唯一性第七页,共三十页,2022年,8月28日标题表(标题词表)是一部标题词典。(1)标题表的作用登录受控的标题和非标题按字顺和参照系排列说明标引和检索方法提供标引示范(2)标题表的结构(3)标题表款目的结构第八页,共三十页,2022年,8月28日第九页,共三十页,2022年,8月28日第十页,共三十页,2022年,8月28日叙词描述语言

(1)叙词语言的前身——单元词语言:是一种以单元词作为主题标识,通过字面组配的方式表达信息资源主题的主题法。单元词(Uuit),又称元词,是指用来标引信息资源主题的、最基本的、字面上不能再分的语词。如:火车、郑州、邓小平、图书馆、污染、天文学等。第十一页,共三十页,2022年,8月28日(2)叙词语言的原理:是一种使用规范处理的叙词作为文献主题的标识,通过概念组配的方式表达文献主题的主题语言。

叙词(Descriptor),国内又称主题词,是经过规范化处理的,以基本概念为基础的表达文献主题的词或词组。叙词语言目前是应用较广的一种主题语言,已成为受控语言的主流。我国使用最广泛的叙词表是《汉语主题词表》(简称《汉表》)。第十二页,共三十页,2022年,8月28日(3)叙词表:叙词表的结构体系字顺表的款目结构第十三页,共三十页,2022年,8月28日第十四页,共三十页,2022年,8月28日P115叙词款目格式

Computeraideddesign①

DT:January1983②

UF:CAD③

BT:Computerapplicationsdesign④

NT:Computeraidedlogicdesign⑤

RT:Computeraidedanalysis

Computeraidedengineering

Computeraidedmanufacturing

Computergraphics⑥

说明

①叙词(黑体字)

②DT:表示作为叙词使用的时间。

③UF:表示替代关系,UF后面为非叙词

④BT:表示广义叙词(即上位类叙词)

⑤NT:表示狭义叙词(即下位类叙词)。

⑥RT:表示相关叙词。

叙词表中,除上述参照关系符号外还有USE,USE后面为叙词。

第十五页,共三十页,2022年,8月28日3.1.3关键词描述语言

(1)关键词语言的原理:关键词是指那些出现在文献的标题以至摘要、正文中,对描述文献主题内容具有实质意义的语词,也即是对提示和描述文献主题内容来说是重要的、带关键性的那些语词。标题词、单元词都是要对自然语言加以严格的规范化处理,而关键词基本上不做规范,或者作极少量的规范化处理。其原理在于:1、直接抽取文献中的语词作为标识。2、不编制受控词表、不显示词间关系、只是编制禁用词表控制抽词。3、每个词是平等的,按字顺轮排。第十六页,共三十页,2022年,8月28日(2)关键词索引的类型:题内关键词(上下文关键词)题外关键词(关键词在题名外、即左边)双重关键词(用两个关键词)单纯关键词(仅仅用关键词标引一篇文献,现在的很多图书、论文都如此)词对式关键词(每次取一对关键词,标引深但易读)简单关键词(只用一个关键词)第十七页,共三十页,2022年,8月28日(3)关键词索引的性能:缺点:1、无规范,易漏检。2、难以进行族类检索3、对内容表达不充分,易误检和漏检4、机编情况下,产生大量冗余优点:1、没有词表、无需主题分析,简单2、容易实现自动化3、使用自然语言,比较直观、专指,提高查准率。第十八页,共三十页,2022年,8月28日3.2国内外主题语言应用实例

3.2.1《汉语主题词表》

《汉语主题词表》选词《汉语主题词表》的体系结构第十九页,共三十页,2022年,8月28日第二十页,共三十页,2022年,8月28日(略:信息检索讲授)3.2.2MeSH:《医学标题表》

(1)MeSH的结构及格式:

(2)MeSH的标题结构和种类:(3)INSPECThesaurus

《科学文摘》有以下多种出版形式:第二十一页,共三十页,2022年,8月28日3.3网络信息资源组织中主题语言的应用

3.3.1关键词法在搜索引擎中的应用主要通过高级查询功能实现。在搜索引擎那一章具体介绍。3.3.2现有主题词表在网络信息资源组织中的应用主要在一些国外专业数据库中使用。因为文献的专业化程度高,所以对文献区分的专业化要求高。其余通用一般使用关键词。第二十二页,共三十页,2022年,8月28日3.4网络信息组织的实例3.4.1OCLC编目和资源共享服务:OCLC是世界上最大文献信息服务机构之一。WORLDCAT是世界上最大的书目数据库。

3.4.2新华网信息组织

3.4.3中国价格信息网:

第二十三页,共三十页,2022

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论