信息资源检索基础知识_第1页
信息资源检索基础知识_第2页
信息资源检索基础知识_第3页
信息资源检索基础知识_第4页
信息资源检索基础知识_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字信息资源检索与利用第二讲第二讲 信息资源检索基础知识信息资源检索基础知识 第一节第一节信息检索系统信息检索系统第二节第二节信息检索语言信息检索语言第三节第三节信息检索方法信息检索方法第四节第四节 信息检索效果信息检索效果第一节第一节 信息资源检索概述信息资源检索概述 l信息资源检索概述信息资源检索概述l信息资源检索系统信息资源检索系统1 1.1.1信息资源检索概述信息资源检索概述 信息的检索过程主要是利用检索语言对检索信息的检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照提问进行标引,形成检索提问标识,再按照存贮所提供的检索途径,将检索提问标识与存贮所提供的检索途径,

2、将检索提问标识与文献特征标识进行匹配,两标识相符或基本文献特征标识进行匹配,两标识相符或基本相符的则为命中的检索结果。相符的则为命中的检索结果。标引:标引:就是通过标记指引人们方便、快捷地找到所需要的信息。通过对就是通过标记指引人们方便、快捷地找到所需要的信息。通过对文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名等),用以反映该文献的内容的过程。名、地名等),用以反映该文献的内容的过程。 检索系统检索系统-(检索、检索标识)(检索、检索标识)-线索线索-原文原文从信息资源集合中找出所从信息资源集合中找出所需信

3、息内容的过程。需信息内容的过程。 要求:高效、快速、准确、正确、全面、新颖要求:高效、快速、准确、正确、全面、新颖原始文献原始文献加工整理加工整理数据库数据库提提 问问检检 索索输输 出出 存存 储储检检 索索信息检索原理3.3.信息资源检索的类型信息资源检索的类型 l(1)(1)按检索内容划分按检索内容划分 文献信文献信息检索息检索数据信数据信息检索息检索事实信息检索 文献线索检索文献线索检索 文献文献全文全文检索检索 从检索系统存储的数据中从检索系统存储的数据中查出用户所需数据的检索查出用户所需数据的检索 对特定的事件或事实的检索 l (2)(2)按信息资源检索技术划分按信息资源检索技术划

4、分 全文文本检索全文文本检索 超文本检索超文本检索 超文本的检索是通过超文本链接来实现超文本的检索是通过超文本链接来实现的,超文本链接起信息导向作用,用户的,超文本链接起信息导向作用,用户在从一个页面转向另一个页面的过程中在从一个页面转向另一个页面的过程中获取自己所需要的信息。获取自己所需要的信息。多媒体检索多媒体检索 网络信网络信息检索息检索 是一种集合各种新型检索技是一种集合各种新型检索技术于一体,能够对各种类型,术于一体,能够对各种类型,各种媒体的信息进行跨时间、各种媒体的信息进行跨时间、跨地理检索的大系统。跨地理检索的大系统。指能够支持两种以上媒体的数据库检索指能够支持两种以上媒体的数

5、据库检索 通过计算机将文件的全貌包通过计算机将文件的全貌包括文字和图形、图像等信息括文字和图形、图像等信息转换成计算机可读形式,采转换成计算机可读形式,采用自然语言进行检索。用自然语言进行检索。 .1信息检索系统的概念信息检索系统的概念用于报道、存贮与查找信息的工具(用于报道、存贮与查找信息的工具(检索工具检索工具)检索系统检索系统 信息标引和存储信息标引和存储 信息的需求分析和检索信息的需求分析和检索.2信息资源检索系统的类型信息资源检索系统的类型 按著录方式著录方式划分 按存储介质存储介质划分 按检索手段检索手段划分手工检索系统、计算机检索系统、穿孔卡片系统

6、、缩微品检索系统脱机检索系统、联机检索系统、光盘检索系统、网络检索系统目录、题录、文摘、目录、题录、文摘、参考工具、全文数据库和搜索引擎参考工具、全文数据库和搜索引擎 目录目录是对一批相关文献外表特征的揭示是对一批相关文献外表特征的揭示和报道,是有序的文献清单和报道,是有序的文献清单。数字文献信息检索与利用/何晓萍主编.北京:机械工业出版社,2009.12256页;24厘米ISBN 978-7-111-29039-1I.数 II.何 III.数字技术-应用-情报检索-高等学校-教材 IV.G252.7.39卡片目录、书本目录著录格式卡片目录、书本目录著录格式 如下:如下:电子目录著录格式电子目

7、录著录格式 如下:如下:题录题录对文献外表特征的描述,题录一般以内容上独立的文献单元,如一篇文章或书中某一部分以至整个出版物作为其著录的基本单位。 题录著录格式题录著录格式 如下:030301007 网络时代的管理创新/高维钫(北京邮电大学文法经济学院)/经济管理.2002,13(6),53-55记录号记录号题名题名著者姓名著者姓名著者单位著者单位原文出处原文出处 与目录区别与目录区别著录对象不同著录对象不同目录目录单位出版物单位出版物题录题录单篇文献单篇文献不仅描述文献的外表特征,而且不仅描述文献的外表特征,而且还揭示文献的内容特征,是带有还揭示文献的内容特征,是带有文摘内容的、扩展了的题录

8、文摘内容的、扩展了的题录。文摘文摘 印刷版本文摘著录格式如下:印刷版本文摘著录格式如下:9807471 OODB中的模式更改框架刊,中/郭 江/计算机应用与软件.1997,14(3).23-34 模式演化是面向对象系统中的一个关键问题。由于OODB(面向对象数据库系统)的应用。参4文摘号文摘号题名文献类型文献类型文种文种著著者者姓姓名名原始文献的出处摘要参考文献数目l电子版本文摘著录格式电子版本文摘著录格式 如下:如下:著录项目著录项目著者著者篇名篇名出处出处摘要摘要l【 文摘 】详细研究了双螺杆中反应挤出聚合物的动力学模型、流动模型和传热模型。通过实验得到了双螺杆反应器中聚合物的停留时间分布

9、及平均停留时间。l问题:以下是不是一条文摘记录?问题:以下是不是一条文摘记录?第二节第二节 信息资源检索语言信息资源检索语言存储存储检索检索文献信息文献信息提问提问检索系统(数据库)检索系统(数据库)(语言语言)(语言语言)体系分类语言体系分类语言关键词语言关键词语言2.1检索语言的概念检索语言的概念 检索语言是信息资源存储和检索的共检索语言是信息资源存储和检索的共同语言。同语言。 其实质是从自然语言中精选出来并加其实质是从自然语言中精选出来并加以规范化的一套词汇符号,是概括信息资以规范化的一套词汇符号,是概括信息资源内容特征或外在特征及相互关系的概念源内容特征或外在特征及相互关系的概念标识体

10、系。标识体系。 2.2 检索语言的种类检索语言的种类2、按文献信息资源的特征划分按文献信息资源的特征划分 1、按规范化程度划分按规范化程度划分人工语言人工语言 人为对标引词和检索词人为对标引词和检索词加以控制和规范,使每个加以控制和规范,使每个检索词只能表达一个概念检索词只能表达一个概念自然语言自然语言直接从原始信息中抽取出自直接从原始信息中抽取出自由词作为检索点的检索语言由词作为检索点的检索语言检索语言的类型检索语言的类型表述文献外表表述文献外表特征的语言特征的语言表述文献内容表述文献内容特征的语言特征的语言题名题名(书名、刊名、篇名)(书名、刊名、篇名)责任者责任者(个人、机构名称)(个人

11、、机构名称)号码号码(如专利号、标准号、报告号、如专利号、标准号、报告号、ISBNISBN号、号、ISSNISSN号等号等)引文引文分类法分类法主题法主题法体系分类法体系分类法组配分类法组配分类法标题词语言标题词语言单元词语言单元词语言叙词语言叙词语言关键词语言关键词语言l分类语言分类语言类类性质上彼此相同的事物性质上彼此相同的事物物以类聚,人以群分物以类聚,人以群分 分类语言也称分类法,它是用分类号分类语言也称分类法,它是用分类号表达主题概念,依据知识分类将各主题概表达主题概念,依据知识分类将各主题概念按学科性质进行分类和系统排列成类目念按学科性质进行分类和系统排列成类目体系的标引语言。体系

12、的标引语言。体系分类法 直接体现知识分类的等级概念直接体现知识分类的等级概念科学分类科学分类基基础础对对象象文献内容的学科性质文献内容的学科性质按照知识门类的逻辑次序按照知识门类的逻辑次序知识知识类类1类类2类类3类类21类类22类类23上位类上位类同位类同位类下位类下位类v体系分类表通常由体系分类表通常由4 4个部分组成个部分组成 :v类目表:类目表:分类表、分类法的主体分类表、分类法的主体 v标记符号:标记符号:分类号、分类体系内类目的代表分类号、分类体系内类目的代表v说明和注释:说明和注释:揭示分类表的结构及使用方法揭示分类表的结构及使用方法 v类目索引:类目索引:类目一览表、每一标题后

13、面都注类目一览表、每一标题后面都注明相应的分类号明相应的分类号l C C 社会科学总论社会科学总论 C8 C8 统计学统计学 C91 C91 社会学社会学 C92 C92 人口学人口学 C93 C93 管理学管理学 C931C931 管理技术方法管理技术方法 .1 .1 管理数学管理数学 .2 .2 管理的方式方法管理的方式方法 C933 C933 领导学领导学 C934C934 决策学决策学 C935C935 管理计划和控制管理计划和控制 C936C936 管理组织学管理组织学 C939C939 应用管理学应用管理学将将T类展开类展开l T T 工业技术工业技术l TB TB 一般工业技术一

14、般工业技术 l 4 4 工业通用技术设备工业通用技术设备l 48 48 包装工程包装工程l 482 482 包装设计包装设计 l .1 .1纸、纸板纸、纸板l .2 .2林材林材l .3 .3塑料塑料l l . .其他其他l 485 485 包装类型包装类型l 486 486 包装机械设备包装机械设备l 487 487 包装技术检测包装技术检测l 488 488 包装工厂包装工厂l 489 489 各类产品包装各类产品包装TP自动化技术、计算技术自动化技术、计算技术TP1自动化基础理论自动化基础理论TP2自动化技术及设备自动化技术及设备TP3计算技术、计算机计算技术、计算机TP31计算机软件计

15、算机软件TP311程序设计、软件工程程序设计、软件工程TP312程序语言、算法语言程序语言、算法语言TP313汇编语言汇编语言TP316操作系统操作系统TP316.1分时操作系统分时操作系统TP316.2实时操作系统实时操作系统TP316.3批处理批处理TP20一般性问题一般性问题TP21自动化元件、部件自动化元件、部件TP23自动化装置与设备自动化装置与设备TP24机器人技术机器人技术TP27自动化系统自动化系统TP29自动化技术在各方自动化技术在各方面的应用面的应用主题语言主题语言 主题语言是采用表达某一事物或概念的名词主题语言是采用表达某一事物或概念的名词术语来标引、存储、检索的一种检索

16、语言。术语来标引、存储、检索的一种检索语言。 标题词语言标题词语言直接用规范化语词来标引文直接用规范化语词来标引文献主题,按字顺排列成词表。献主题,按字顺排列成词表。主副搭配主副搭配单元词语言单元词语言采用单元词通过组配采用单元词通过组配(字面)(字面)来表达文献的主题概念。单元来表达文献的主题概念。单元词是从文献中抽取的,能表达词是从文献中抽取的,能表达文献主题的最基本、不能再分文献主题的最基本、不能再分的单元词语。的单元词语。叙词语言叙词语言采用叙词通过采用叙词通过概念概念组配来表达组配来表达文献的主题概念。叙词是从文文献的主题概念。叙词是从文献内容中抽取的,能表达文献献内容中抽取的,能表

17、达文献内容基本概念的并经过规范化内容基本概念的并经过规范化的名词或术语。的名词或术语。 字面组配与概念组配在形式上有时相同,字面组配与概念组配在形式上有时相同,有时不同;而从性质上来看两者区别是很大的。有时不同;而从性质上来看两者区别是很大的。字面组配是词的分析与组合(字面组配是词的分析与组合(拆词拆词);概念组);概念组配是概念的分析与综合(配是概念的分析与综合(拆义拆义)。例如:)。例如: 字面组配字面组配 概念组配概念组配模拟模拟+ +控制控制-模拟控制模拟控制 模拟模拟+ +控制控制-模拟控制模拟控制 彩虹电器彩虹电器彩虹彩虹+ +电电器器彩虹牌商彩虹牌商品品+ +电器电器 第一例中,

18、无论是字面组配还是概念组第一例中,无论是字面组配还是概念组配,其结果都是配,其结果都是“模拟控制模拟控制”。 第二例中,根据字面组配原理,第二例中,根据字面组配原理,“彩虹彩虹”和和“电器电器”组配是组配是“彩虹、电器彩虹、电器”,而概念,而概念组配的结果应是组配的结果应是“彩虹品牌彩虹品牌”和和“电器电器”两两个词组配,才符合概念逻辑。个词组配,才符合概念逻辑。以关键词作为文献内容标识以关键词作为文献内容标识和检索入口的一种主题语言。和检索入口的一种主题语言。关键词是直接从文献中抽取关键词是直接从文献中抽取的,未经规范化处理的自由的,未经规范化处理的自由词。词。关键词语言关键词语言例:标引课

19、题例:标引课题“微机在企业管理中的应用微机在企业管理中的应用”l标题词标引标题词标引:企业管理企业管理-计算机应用计算机应用l叙词标引:叙词标引:企业管理、计算机应用企业管理、计算机应用l关键词标引:关键词标引:企业管理、微机、微机应用、计算机、计算机企业管理、微机、微机应用、计算机、计算机应用应用l分类标引:分类标引:C93C93、TP319TP319(中图法分类号)(中图法分类号)其他划分方式:其他划分方式:按组配方式按组配方式先组式语言先组式语言 指在检索前检索词已按固定关系组配好,并编制在词表中 后组式语言后组式语言 是指在检索前,检索词在词表中没有被预先组配,检索时用户可根据不同的检

20、索需求对某些词进行任意组配三、三、主要词表主要词表工程标题词表工程标题词表Ei叙词表叙词表INSPEC叙词表叙词表 汉语主题词表汉语主题词表 第三节第三节 信息资源检索方法信息资源检索方法v1、布尔检索技术布尔检索技术v2 2、截词检索技术、截词检索技术v3 3、邻近检索技术、邻近检索技术v4 4、字段检索技术、字段检索技术3.1布尔逻辑检索技术布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索方法 主要的布尔逻辑关系词有:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT)1)逻辑与l逻辑乘: “and”或“*”表示l组配方式:A*B或者A and B 表示两个概

21、念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息l作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率2)逻辑或l又称逻辑和:又称逻辑和:“or”、“+”l组配方式:组配方式:A OR BA OR B或者或者A AB B,表示检索含有,表示检索含有A A词,或含有词,或含有B B词,或同时包含词,或同时包含A A、B B两词的文两词的文章。章。l作用:放宽提问范围,增加检索结果,起扩作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率。检作用,提高查全率。3)逻辑非l又称逻辑差:又称逻辑差: “notnot” “- -”l组配方式:组配方式:A A

22、B B,表示检索出含有,表示检索出含有A A词而词而不含有不含有B B 词的文章。词的文章。l作用:逻辑非用于排除不希望出现的检索作用:逻辑非用于排除不希望出现的检索词,它和词,它和“* *”的作用相似,能够缩小命的作用相似,能够缩小命中文献范围,增强检索的准确性。中文献范围,增强检索的准确性。布尔逻辑检索举例l 例如检索:例如检索:“高分子聚合物高分子聚合物”l查询关键词:查询关键词:高分子、聚合物高分子、聚合物l检索表达式:检索表达式:高分子高分子 AND 聚合物聚合物l 例如检索:例如检索:“微型计算机微型计算机”方面的有关信方面的有关信息息l查询关键词:查询关键词:微型计算机、微机微型

23、计算机、微机l检索表达式:检索表达式:微型计算机微型计算机OR 微机微机 布尔运算符优先级布尔运算符优先级l 布尔运算符优先级比较布尔运算符优先级比较l有括号时:括号内的先执行;有括号时:括号内的先执行;l无括号时:无括号时:NOT AND ORl 例:检索例:检索“明清小说明清小说”的有关信息。的有关信息。l关键词:明、清、小说;关键词:明、清、小说;l检索表达式:检索表达式:(明(明 OR 清)清)AND 小说;小说;明明 AND 小说小说 OR 清清 AND 小说;小说;l错误表达式:错误表达式: 明明OR 清清AND小说;小说;明明 AND 清清AND小说;小说;明明 OR 清清OR小

24、说;小说;明明AND 清清OR小说;小说;布尔逻辑检索注意事项l在不同的数据库中,所使用的逻辑符号可能是不同的,有的用“and、or、not” 有的用“*、+、-”。l一些检索工具会完全省略任何符号和关系,直接把布尔逻辑关系隐含在菜单中。l一些网络检索工具如搜索引擎甚至用“、,、-”(即空格、逗号、减号)来表示。2.截词检索l主要应用于西文数字资源的检索l定义:是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。l作用:主要是提高查全率l截词符一般用“?”或“*”表示截词位置l按截词位置可分为前截词、后截词、前后截词和中间截词;l按截断字符数的不同,可分为有限截断和

25、无限截断。截词位置l 右截词,又称后截词、前方一致。允许检索词尾有若干变化。例如comput*将检索出computer 、computing、computerised、computerized、computerization等结果。l 中间截词,又称前后方一致。允许检索词中间有若干变化。例如wom*n,检索到woman、women的结果。英美的不同拼法,defen*e可同时检出defence和defense的结果。l 左截词,又称前截词、后方一致,允许检索词前有若干变化,例如*physics就可检索到physics、astrophysics、biophysics、chemophysics、ge

26、ophysics等词的结果。 ?Computer可检索computer、minicomputer、microcomputer等结果。前后截词l前后截词:词干的前后各有一个截词符,前后截词:词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形允许检索词的前端和尾部各有若干变化形式。如式。如?computer?computer?可检索?可检索computercomputer、computerscomputers、computerizecomputerize、computerizedcomputerized、computerizationcomputerization、minicomput

27、erminicomputer、minicomputersminicomputers、microcomputermicrocomputer、microcomputersmicrocomputers等结果。等结果。截词检索注意事项l 在不同的数据库和联机检索系统中,所使用的截词符号没有统一的标准,有的用“?”,有的用“*”,有的用“#”,用的用“”等。l 即便常用的“?”和“*”在不同的数据库中其用法也是不一定相同的。l 在允许截词的检索工具中,一般是指右截词,部分支持中间截词,左截词比较少见。l 我们将要使用的一些数据库,一般用“*”代表一个字符串,用“?”代表任意一个字符。3.邻近检索l 邻近

28、检索又称位置检索,主要是通过检索式中的专门符号来规定检索词在结果中的相对位置。l 例如检索“生物防治”的文献,若用检索式“biological*control”检索,则会将“抑制生物”(control biological)的文献也查出来,这显然不是所需文献。l 主要有相邻位置算符(W)、(nW)、(N),(nN),句子位置算符(S),字段算符(F),(L) (W)算符l (W)算符:(W)是with(word)的缩写,可简写为“( )”,表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号。l 如biological (W) c

29、ontrol相当于检索biological control,l CD (W) ROM相当于检索CD ROM或CD-ROM。 (nW) 算符l(nW) 算符:(nW)是n words的缩写,表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。l如wear (1W) material相当于检索wear materials、wear of materials等词。(N)和()和(nN)算符)算符l (N)是near的缩写,表示此算符两侧的检索词必须紧密相连,词序可变,词间不允许插入其他词或字母,但允许有一空格或标点符号。l (nN)表示两词间可插入最多n个词,词序可变,如检索式environ

30、ment (2N) protection 就可检索出包含“environment protection”、“environment of the protection ”、“environment of water protection”、“protection of forest environment”等内容的结果。linformation(1N)retrievall 可检出可检出: information retrievall retriveal of information(S)、(F)、(L)算符(1)(S)算符:(S)表示两个检索词须同时出现在文献记录的同一子字段中,两词的词序不限

31、,两词间插入词的数量不限。 (2)(F)、(L)算符:在联机检索中还有对同字段进行检索的(F)算符和(L)算符。(F)表示此算符两侧的检索词必须同时出现在信息记录的同一个字段内,两词的词序不限,两词间插入词的数量不限。用此算符时须指定所要查找的字段,如题名字段、文摘字段、叙词字段等。例如digital (F) computer/TI表示在题名字段(TI)中同时出现这两个检索词的才算命中信息。(L)算符要求检索词同在叙词字段中出现并且具有词表规定的等级关系, 因此,该算符只适用于有正式词表、且词表中的词具有从属关系的数据库或文档。 邻近检索对提高检索的查准率有重要作用,但网络检索中基本上只支持(

32、W)、(nW)和(N)、(nN)检索式。4.字段检索l字段检索是限定检索词在记录中出现的字段范围,检索时,计算机只对限定字段进行查找。字段检索l 字段检索分后缀方式和前缀方式。l TI(题名)、AB(摘要)、DE(主题词)、ID(标识词) su (主题词)KW(关键词)l AU(著者)、BN(国际标准书号)、SN(国际标准刊号)、CC(分类类目)、CS(机构)、DT(文献类型)或PT(出版物类型)、JN(刊名)或JA(刊号)、LA(语种)、PY(出版年)、SO(来源出版物)l 注意:不同的数据库其字段代码可能不同。例如l Title(ti): Wuhan Universityl url:l P

33、y=2009l La=englishl Link: l admission AND site:l AU=Wang li AND (CS=wuhan Univ.)第四节 信息检索策略与评价l检索策略与检索步骤检索策略与检索步骤l检索方式检索方式l检索点与检索词检索点与检索词l检索效果检索效果、4.1检索策略与检索步骤检索策略与检索步骤 广义广义为实现检索目标而制定的全盘计划或方案狭义狭义 检索式 2、检索步骤检索步骤 l 1、课题分析、课题分析l 2、选择检索系统(数据库)、选择检索系统(数据库)l 3 3、选择检索点和检索词、选择检索点

34、和检索词l 4 4、制定检索式、制定检索式l (由检索点、检索词、检索算符组成)(由检索点、检索词、检索算符组成)l 例:例:AB=金融网络金融网络 and AU=张杰张杰l 5、调整检索策略、调整检索策略l 6、获取原文、获取原文4.2检索方式检索方式 1、浏览方式浏览方式l分类浏览:分类浏览:按学科类别浏览。可点击按学科类别浏览。可点击“分类导航分类导航”或或“分类表分类表”中的任何一个类别,接着显示所点中的任何一个类别,接着显示所点击类别的下属子类,如此类推。击类别的下属子类,如此类推。l字顺浏览:字顺浏览:按检索词首字母为序,提供相应检索按检索词首字母为序,提供相应检索字段的浏览。如按

35、出版物名称字顺、著者姓名字字段的浏览。如按出版物名称字顺、著者姓名字顺等。顺等。 2、查询方式查询方式 l 初级检索:初级检索:也称快速检索、基本检索。利用初级检索系统能进行快速方便的查询,适用于不熟悉多条件组合查询或SQL语句查询的用户。 l 高级检索:高级检索:也称扩展检索。高级检索可进行多个条件的组合检索,即多个字段之间有一定逻辑关系(and,or, not)的检索。l 专家检索:专家检索:也称专业检索。检索式中可同时使用检索词、逻辑算符(如AND,OR,NOT,AND NOT)、字段标识符、邻近算符(如NEAR,ADJ等)、截词符等多种算符,创建更复杂的检索式。 l 二次检索:二次检索

36、:在结果中检索又称为二次检索,当检索结果太多,想从中精选出一部分时,可使用二次检索。4.3检索点与检索词检索点与检索词l 检索点(access point)是检索的出发点,以前常用“检索途径”(approach)这一术语。在计算机检索中,所有类型的检索点形式上都表现为“关键词”,但在数据库检索中,检索点和关键词的含义还是有所区别的。l文献信息特征是多方面的,用于文献检索的检索点很多,反映文献信息内容特征的有:分类检索和主题检索;反映文献外部特征的有:作者检索、名称检索和号码检索等。文献内容特征 分类检索 的检索点 主题检索 文献外部特征 作者检索 的检索点 名称检索 号码检索 分类检索:分类检

37、索:分类检索是从文献内容所属的学科类别出发来检索文献,它依据的是一个可参照的分类体系。 主题检索:主题检索:从反映文献内容的有关主题词出发来检索文献,主题是检索点,它对应文献主题概念。检索按主题词的音或形的字顺进行,其方式如查字典、词典。 主题词:主题词:有多种类型:有规范词和自由词,有单元词和多元词,有先组结构和后组结构等。主题词的合理选择与使用对检索结果的优劣直接相关。l 作者检索:作者检索:是从文献的作者姓名出发来检索其文献。 “作者”广义上还应包括:汇编者、编者、主办者、译者等,此外,还有代表机构、单位的团体作者,包括作者所在单位。l 名称检索:名称检索:是从各种事物的名称出发来检索文

38、献信息,包括书名、刊名、资料名、出版物名、出版社名、会议名、物质名称等等,也包括人名和机构名。检索的对象既包括对应的文献,也包括有关的信息、事项等。l 号码检索:包括文献的编号、代码等,它们是文献信息的一些特有的外部标识,号码检索点以号码特征来检索文献信息。号码多种多样,通常用数字、字母或用它们结合的形式或以分段的方式来表示其各部分的含义。如科技报告有报告号、专利文献有专利号等。2、检索词检索词 l检索词是表达信息需求的基本单元,也是与系统中有关数据库进行匹配运算的基本单元。检索词选择得当与否,会直接影响检索效果。l检索词可分为两类,一类是表示主题概念的名词术语(如叙词和关键词),或者是个人或

39、机构的名称(如作者姓名),另一类是某些特殊的符号(如分类号、代码等)。 3、检索功能1)加权检索加权检索 加权检索是某些检索系统中提供的一种定量检加权检索是某些检索系统中提供的一种定量检索技术,判定检索词或字符串在满足检索逻辑索技术,判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。后对文献命中与否的影响程度。 2)相似检索相似检索在检索过程中,人们会发现某个结果非常符合自己在检索过程中,人们会发现某个结果非常符合自己需要,因此希望能进一步检索到与该结果类似的需要,因此希望能进一步检索到与该结果类似的结果,我们称之为相似检索也称相关信息反馈检结果,我们称之为相似检索也称相关信息反馈检索。索。 3)精确匹配和模糊检索l 不同的数据库,检索途径设定的检索规则有所不同,有的检索途径允许用户用“任意一致”的方式检索,有的只允许用“完全一致”或“前方一致”的方式检索。l 完全一致”即精确匹配,要求输入的检索词,与数据库中的文献标识完全匹配,才能命中。l 如要查找作者“刘开扬”的文献,则必须准确输入“刘开扬”三字,如输入“刘”或“刘开”,则不能命中。l 一般在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论