《信息检索教程》第二章检索语言_第1页
《信息检索教程》第二章检索语言_第2页
《信息检索教程》第二章检索语言_第3页
《信息检索教程》第二章检索语言_第4页
《信息检索教程》第二章检索语言_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章检索语言第一节检索语言的概念和基础一、检索语言的概念传统意义上的检索语言仅指根据信息检索需要而创制的人工语言,又称情报语言、情报存储与检索语言、文献语言、文献工作语言、索引语言、标引语言、标引符号、标识系统等。二、检索语言的基础(一)概念逻辑概念逻辑,是一种科学思维方法,通过明确各种概念及其相互关系而揭示事物的本质属性及各种事物之间的联系与区别。(二)知识分类知识分类包括事物分类和学科分类。它是对千差万别的事物作系统研究的重要方法,是对各种事物之间的区别和联系从本质上、原理上进行揭示的重要手段,对信息的系统化具有重要的价值。一、检索语言的功能1.标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性2.对内容相同及相关的文献信息加以集中或揭示其相关性3.使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索4.便于将标引用语和检索用语进行相符性比较第二节检索语言的功能和分类二、检索语言的分类1.按描述文献的特征,可以分为描述文献外表特征的检索语言和描述文献2.按结构或原理,可分为分类语言、主题语言、代码语言和引文语言3.按信息标识的组合使用方法,可分为先组式语言和后组式语言4.按语言的规范程度,可分为人工语言和自然语言一、分类检索语言概述类是指具有共同属性的事物的集合,“物以类聚”是人们长期以来认识事物的一种方法。文献分类是依据文献所载知识信息的学科属性,对文献进行类别的划分,并进一步根据文献信息内容之间的内在联系,组织成科学的分类体系。第三节分类检索语言(一)分类检索语言的类型1.体系分类法2.组配分类法(二)分类检索语言的特点

分类检索语言是信息管理领域经典的检索语言之一,以1876年《杜威十进分类法》的问世为标志,已走过了一个多世纪的历程,形成了自成体系的一套信息组织和检索方法。二、分类检索语言结构

(一)类目1.类目的划分2.引用次序3.类目的排列4.类名的确定5.类目之间相互关系的处理(二)标记符号1.顺序制2.层累制3.混合制4.分面标记制(三)说明与注释说明与注释是对分类表结构及使用方法的揭示,用它来进一步阐述分类法的编制原理、特点和使用方法,明确类目之间的关系,确定类目的性质和范围,确定类分图书时的方法等。一、主题检索语言概述主题检索语言又称主题法。它采用语词直接作为文献主题标识,按字顺排列主题标识,提供各种检索词语的途径。第四节主题检索语言(一)主题检索语言的类型1.标题词语言2.单元词语言3.叙词语言4.关键词语言(二)主题检索语言的特点1.专指性高2.直观性好3.灵活性强二、标题词法和单元词法(一)标题词法标题词法是主题检索语言中使用最早的一种类型。标题词是从自然语言中选取的、经过规范化处理的、表示事物概念的词、词组或短语。(二)单元词法

单元词又称元词,是从自然语言中选取,经过规范化处理,表达主题最小的、最基本的、字面上不能再分的名词术语。三、关键词法关键词作为信息存储和检索依据的一种检索语言,是直接从原文的标题、摘要或全文中抽选出来的,具有实质意义的,未经规范化处理的自然语言词汇。但在实践中一般也要对关键词进行极少量的规范化处理。(一)关键词法的原理和特点关键词法是适应目录索引编制过程自动化的需要而产生的,出现比较早,广泛使用却是近二三十年的事。(二)关键词法的类型1.题内关键词索引题内关键词索引2.题外关键词索引题外关键词索引3.词对式关键词索引四、叙词法(一)叙词法一般原理叙词法是以表示单元概念的规范化语词为基础,以概念组配为基本原理,对文献主题进行描述的后组式检索语言。(二)叙词表的编制叙词表是叙词法的核心体现。目前,国内的叙词表已有七八十种之多。常用的有《汉语主题词表》、《化工汉语主题词表》、《机械工程主题词表》、《电子技术汉语主题词表》、《国防科学技术叙词表》等。五、主要主题词表介绍(一)《汉语主题词表》《汉语主题词表》是我国第一部大型的综合性的叙词表,由中国科技信息研究所和北京图书馆负责主持,1975年开始编制,1980年正式出版。(二)《中国分类主题词表》《中国分类主题词表》是在《中图法》编委会主持下,经全国40个单位160位专家学者的共同努力,历时8年编制而成的,于1994年6月正式出版。一、网络环境下的分类语言分类法比较全面和客观地反映了知识全貌及其内在的逻辑联系,它体系结构的系统性、标识符号的通用性以及族性检索功能,是其他信息检索语言所不具备的,也是无法取代的。第五节检索语言的发展二、网络环境下的主题语言主题法使用语词对信息进行揭示和组织,直接用语词标识信息内容,可以较好地满足用户的特性检索需求,主题语言在网络环境下仍然是一种重要的检索语言。三、自然语言的应用随着计算机技术的发展、计算机信息检索系统的广泛使用,自然语言在信息检索领域的应用开始流行起来。(一)概述自然语言指不经加工和规范的语言,自然语言直接取自文献本身,它包含词、词组或句子,没有烦琐规则的约束,不添加任何人工的色彩。(二)后控词表后控词表专门用于自然语言检索系统,主要是在检索输出时对同义词以及语义句法上的相关词进行控制,以实现自动扩检和转换的功能,也有人称之为只供检索的词表。【思考题】

1.什么是检索语言?2.怎样理解检索语言的基础是概念逻辑和知识分类?3.检索语言的功能有哪些?4.检索语言可以分为哪些类型?5.试述分类检索语言的特点和类型。6.简述分类检索语言的结构。说明类目之间的关系及表现形式。7.什么是标记符号?标记制度有哪些?8.试述引用次序在分类体系建立中的作用。9.常用的分类法有哪些?重点介绍其中两种。10.试述主题检索语言的特点和类型。11.分别简述单元词法、标题词法和关键词法。12.叙词法有什么特点?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论