信息检索基本知识_第1页
信息检索基本知识_第2页
信息检索基本知识_第3页
信息检索基本知识_第4页
信息检索基本知识_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息检索基本知识 第一节第一节 信息检索原理信息检索原理 第二节第二节 信息检索技术信息检索技术 第二章第二章 信息检索基础知识信息检索基础知识 信息检索基本知识 信息及其类型信息及其类型 1 信息检索及其类型信息检索及其类型 2 信息检索工具信息检索工具 3 信息检索方法及途径信息检索方法及途径 4 信息检索基本知识 一、一、 信息及其类型信息及其类型 信息检索基本知识 一、信息一、信息 中国国家标准GB489485关于信 息的定义: 信息是物质存在的一种方式、 形态或运动状态,也是事物的一 种普遍属性,一般指数据、消息 中所包含的意义,可以使消息中 所描述事件的不确定性减少。 狭义的理解,

2、信息是用来消除不 定性的东西。 信息论的创始人香农信息论的创始人香农 信息检索基本知识 二、信息的类型二、信息的类型 (一一)、按物质载体和记录形式分:、按物质载体和记录形式分: 1、刻写型:指古代各种非印刷型信息如甲、刻写型:指古代各种非印刷型信息如甲 骨、简策、帛书以及还没有正式付印的骨、简策、帛书以及还没有正式付印的 手稿。手稿。 信息检索基本知识 竹简,广泛应用于先竹简,广泛应用于先 秦至三国两晋时期秦至三国两晋时期 缣帛缣帛 始见于商,流行始见于商,流行 于秦汉时期。于秦汉时期。 结绳记事结绳记事 信息检索基本知识 2、印刷型:、印刷型:是以手写、打印、印刷等为记是以手写、打印、印刷

3、等为记 录手段,将信息记载在录手段,将信息记载在纸张纸张上形成的文上形成的文 献。是传统的文献形式,也称为纸介型。献。是传统的文献形式,也称为纸介型。 载体:纸张载体:纸张 实例:教科书实例:教科书 记录手段:油印、石印、记录手段:油印、石印、 铅印、胶印、复印铅印、胶印、复印 特点:可直接阅读,方便特点:可直接阅读,方便 使用;但难于实现机使用;但难于实现机 械化和自动化;收藏械化和自动化;收藏 文献占用空间大。文献占用空间大。 信息检索基本知识 3、缩微型:是利用缩微摄影技术,将原始文献、缩微型:是利用缩微摄影技术,将原始文献 高倍缩小记载在感光材料上形成的文献,如缩高倍缩小记载在感光材料

4、上形成的文献,如缩 微胶卷、缩微平片、缩微卡片等。微胶卷、缩微平片、缩微卡片等。 4、声像型:、声像型:是采用录音、录像、摄影、摄像等是采用录音、录像、摄影、摄像等 手段,将声音、图像等多媒体信息记录在光学手段,将声音、图像等多媒体信息记录在光学 材料、磁性材料上形成的文献,如音像磁带、材料、磁性材料上形成的文献,如音像磁带、 唱片、幻灯片等。唱片、幻灯片等。 5、机读型:是指利用计算机进行存储和阅读的、机读型:是指利用计算机进行存储和阅读的 一种信息形式,如磁盘、光盘、电子图书、电一种信息形式,如磁盘、光盘、电子图书、电 子期刊等。子期刊等。 信息检索基本知识 (二二) 按出版形式划分:按出

5、版形式划分: 图书图书期刊期刊特种文献特种文献 其它其它 标准标准 科技报告科技报告 政府出版物政府出版物 学位论文学位论文 专利文献专利文献 原始文献原始文献 会议文献会议文献 信息检索基本知识 (三三) 按信息的加工程度来分:按信息的加工程度来分: 1、一次文献一次文献 ( (原始文献原始文献):): 是作者以生产与科研工作成果为依据,而创作、是作者以生产与科研工作成果为依据,而创作、 撰写形成的文献。专著、论文、调查报告、档案等撰写形成的文献。专著、论文、调查报告、档案等 2 2、二次文献、二次文献 是指对一次文献信息进行加工、提炼、浓缩,而是指对一次文献信息进行加工、提炼、浓缩,而 形

6、成的工具性文献。书目、索引、文摘和数据库等形成的工具性文献。书目、索引、文摘和数据库等 信息检索基本知识 3 3、三次文献、三次文献 ( (参考性文献参考性文献) ) 是指对一次文献和二次文献的内容进行综合分是指对一次文献和二次文献的内容进行综合分 析、系统整理、高度浓缩、评述等深加工,而形析、系统整理、高度浓缩、评述等深加工,而形 成的文献。专题评述、百科全书、年鉴等成的文献。专题评述、百科全书、年鉴等 4 4、零次文献、零次文献 是指通过交流或听报告等所获得的信息,它们是指通过交流或听报告等所获得的信息,它们 通常未经记载或仅仅是一些零乱的笔记,如实验通常未经记载或仅仅是一些零乱的笔记,如

7、实验 记录、谈话记录、手稿等。记录、谈话记录、手稿等。 信息检索基本知识 二、二、 信息检索及其类型信息检索及其类型 一、一、信息检索的概念信息检索的概念 二、二、信息检索的类型信息检索的类型 信息检索基本知识 一、信息检索一、信息检索 信息检索:是指将信息信息检索:是指将信息 按一定的方式组织和存储起按一定的方式组织和存储起 来,并根据用户的需要找出来,并根据用户的需要找出 相关信息的过程。相关信息的过程。 信息检索信息检索 存储存储 检索检索 存储:是对信息进行著录、存储:是对信息进行著录、 标引、整序,编制检索工标引、整序,编制检索工 具和建立检索系统的过程。具和建立检索系统的过程。 检

8、索:是指面向信息需求检索:是指面向信息需求 而进行高度选择性的查找而进行高度选择性的查找 过程。过程。 信息检索基本知识 原始文献原始文献 加工整理加工整理 数据库数据库 提提 问问 检检 索索 输输 出出 存储存储 检索检索 信息检索基本知识 二、信息检索的类型二、信息检索的类型 (一)按检索内容划分(一)按检索内容划分 1 1、文献检索、文献检索 是以文献(包括文献、题录和全文)为检索对是以文献(包括文献、题录和全文)为检索对 象的信息检索。象的信息检索。 2 2、数据检索、数据检索 是以数据为检索对象的信息检索。要求从检索是以数据为检索对象的信息检索。要求从检索 系统存储的大量原始调查数

9、据和其它统计数据中查系统存储的大量原始调查数据和其它统计数据中查 出所需的数据资料的过程。出所需的数据资料的过程。 3 3、事实检索、事实检索 是以具体事项为检索内容的信息检索。是以具体事项为检索内容的信息检索。 信息检索基本知识 (二)按是否使用检索工具划分(二)按是否使用检索工具划分 1 1、直接检索、直接检索 就是指利用一次文献进行检索,这是以前比较常用的就是指利用一次文献进行检索,这是以前比较常用的 一种查找方法。所花时间多和精力大,检出文献少。一种查找方法。所花时间多和精力大,检出文献少。 2 2、间接检索、间接检索 就是指利用各种检索工具获得文献线索,再根据线索就是指利用各种检索工

10、具获得文献线索,再根据线索 去查找原始文献线索的方法。去查找原始文献线索的方法。 信息检索基本知识 (三)按信息检索手段划分(三)按信息检索手段划分 1 1、传统信息检索、传统信息检索 就是手工信息检索,是利用各种印刷型检索工具来就是手工信息检索,是利用各种印刷型检索工具来 查找文献的一种方法。查找文献的一种方法。 2 2、现代信息检索、现代信息检索 现代信息检索即计算机信息检索,是指利用计算机现代信息检索即计算机信息检索,是指利用计算机 和网络来处理和查找文献信息的检索方式。和网络来处理和查找文献信息的检索方式。 信息检索基本知识 三、三、 信息检索工具信息检索工具 检索工具:检索工具: 是

11、人们用来存储、报道和查找各类信息的工具。它是人们用来存储、报道和查找各类信息的工具。它 是通过对信息进行搜集整理、特征分析和组织加工后的是通过对信息进行搜集整理、特征分析和组织加工后的 产物。产物。 主要包括二次、三次印刷型手工检索工具,面向计主要包括二次、三次印刷型手工检索工具,面向计 算机和网络的各种数据库检索系统以及搜索引擎等各种算机和网络的各种数据库检索系统以及搜索引擎等各种 网络检索工具。网络检索工具。 信息检索基本知识 一、检索工具的功能一、检索工具的功能 1 1、报道功能、报道功能 2 2、存储功能、存储功能 3 3、检索功能、检索功能 信息检索基本知识 二、检索工具的特点二、检

12、索工具的特点 1 1、详细而又完整地记录了文献的外部特征和内部特征。、详细而又完整地记录了文献的外部特征和内部特征。 2 2、对所著录的文献,标引了可供检索的检索标识。、对所著录的文献,标引了可供检索的检索标识。 3 3、提供必要的检索手段,配备各种体系的索引。、提供必要的检索手段,配备各种体系的索引。 信息检索基本知识 三、检索工具的类型三、检索工具的类型 1 1、目录、目录 目录:是按照某种明白目录:是按照某种明白 易懂的顺序编排的文献易懂的顺序编排的文献 清单或清册,通常以一清单或清册,通常以一 个完整的出版单位或收个完整的出版单位或收 藏单位为著录的基本单藏单位为著录的基本单 元。元。

13、 如:如:全国新书目全国新书目 社科新书目社科新书目 2 2、文摘、文摘 文摘:是一种著录文献文摘:是一种著录文献 题录和内容摘要的检索题录和内容摘要的检索 工具。工具。 如:人大复印资料如:人大复印资料 3 3、索引、索引 索引:把一种或多种文索引:把一种或多种文 献中具有检索意义的特献中具有检索意义的特 征分别著录、排序并注征分别著录、排序并注 明出处以供查检的工具明出处以供查检的工具 书。索引的基本组织单书。索引的基本组织单 位是条目位是条目,每个条目一般每个条目一般 由序号、标识或索引词、由序号、标识或索引词、 注释、出处等若干环节注释、出处等若干环节 构成。构成。 如:美国如:美国科

14、学引文索引科学引文索引SCI 美国美国工程索引工程索引EI l按著录信息的特征划分:按著录信息的特征划分: 信息检索基本知识 目录、索引、文摘三者的关系:目录、索引、文摘三者的关系: 共同点是:共同点是: 三者都具有检索性,都是常用的检索工具。它们报道和提供各种三者都具有检索性,都是常用的检索工具。它们报道和提供各种 文献的有关特征,并指明出处,读者可根据这一信息找到所需原文献的有关特征,并指明出处,读者可根据这一信息找到所需原 始文献。始文献。 不同点是:不同点是: 1 1、三者反映的文献特征和层次不同:、三者反映的文献特征和层次不同: 目录反映文献整体的外在特征;索引反映整体文献中每一单元

15、文目录反映文献整体的外在特征;索引反映整体文献中每一单元文 献的特征;文摘反映单元文献的基本内容、观点和方法。献的特征;文摘反映单元文献的基本内容、观点和方法。 2 2、三者提供的资料不同:、三者提供的资料不同: 目录提供某一方面较成熟系统的知识,索引、文摘提供相对分散目录提供某一方面较成熟系统的知识,索引、文摘提供相对分散 的资料线索。的资料线索。 3 3、三者在使用方式上不同:、三者在使用方式上不同: 目录、索引不提供文献内容特征,文摘提供文献的内容特征。目录、索引不提供文献内容特征,文摘提供文献的内容特征。 信息检索基本知识 按检索方式分:按检索方式分: 印刷型检索工具和机器检索工具;印

16、刷型检索工具和机器检索工具; 按出版形式分:按出版形式分: 期刊式检索工具、书本式检索工具、卡片式期刊式检索工具、书本式检索工具、卡片式 检索工具、缩微式检索工具、机读式检索工检索工具、缩微式检索工具、机读式检索工 具等;具等; 按收录范围分:按收录范围分: 综合性检索工具、专题性检索工具;综合性检索工具、专题性检索工具; 按语种分:按语种分: 中文检索工具和外文检索工具。中文检索工具和外文检索工具。 信息检索基本知识 一、信息检索的方法一、信息检索的方法 二、信息检索的途径二、信息检索的途径 四、信息检索方法及途径四、信息检索方法及途径 信息检索基本知识 一、检索方法一、检索方法 1 1、直

17、接法:、直接法:又叫常规法又叫常规法, ,是指直接利用检索工具是指直接利用检索工具 (系统)检索文献信息的方法。这种方法实用面(系统)检索文献信息的方法。这种方法实用面 广,容易掌握,检索效率比较稳定,但容易受检广,容易掌握,检索效率比较稳定,但容易受检 索工具体系和质量等因素的影响。这是文献检索索工具体系和质量等因素的影响。这是文献检索 中最常用的一种方法。它又分为顺查法、倒查法中最常用的一种方法。它又分为顺查法、倒查法 和抽查法。和抽查法。 信息检索基本知识 2 2、引文法:、引文法:又称为扩展法,追溯法。是指不又称为扩展法,追溯法。是指不 利用一般的检索工具,而是利用已经掌握的文利用一般

18、的检索工具,而是利用已经掌握的文 献末尾所列的参考文献和引用文献,进行逐一献末尾所列的参考文献和引用文献,进行逐一 查找的一种最简便的扩大情报来源的方法。一查找的一种最简便的扩大情报来源的方法。一 般在没有适用的检索工具或已知的文献线索很般在没有适用的检索工具或已知的文献线索很 少的情况下使用。少的情况下使用。 “顺藤摸瓜顺藤摸瓜” 信息检索基本知识 3 3、循环法:、循环法:又称分段法、交替法,它是把上又称分段法、交替法,它是把上 述两种方法加以综合运用的方法。述两种方法加以综合运用的方法。 4 4、浏览法:、浏览法:为了消除时差,获得检索课题的为了消除时差,获得检索课题的 最新文献,直接去

19、浏览尚未收编到检索工具中最新文献,直接去浏览尚未收编到检索工具中 的原始论文期刊。浏览的方法主要是阅读有关的原始论文期刊。浏览的方法主要是阅读有关 检索课题的专业期刊和综合性核心期刊的目次检索课题的专业期刊和综合性核心期刊的目次 表或主题索引,遇到相关文献再进一步阅读原表或主题索引,遇到相关文献再进一步阅读原 文。文。 在检索过程中,应该综合运用各种检索方法在检索过程中,应该综合运用各种检索方法 信息检索基本知识 二、检索途径二、检索途径 检索途径又称检索入口。检索途径又称检索入口。 指用户在检索时,把所需信息的某种特指用户在检索时,把所需信息的某种特 征标志转换为检索标志,以此为入口进征标志

20、转换为检索标志,以此为入口进 行检索。行检索。 信息检索基本知识 文献特征文献特征 文献外部特征文献外部特征 (与信息内容(与信息内容 不相关或相关不相关或相关 度不大)度不大) 文献内容特征文献内容特征 (与信息内容密(与信息内容密 切相关)切相关) 责任者责任者 责任者单位责任者单位 刊名刊名 号码号码 引文引文 分类号分类号 主题词主题词 标题标题 信息检索基本知识 检索途径检索途径 信息外部特征信息外部特征 信息内容特征信息内容特征 著者途径著者途径 题名途径题名途径 机构途径机构途径 代码代码/序号途径序号途径 其他途径其他途径 分类途径分类途径 关键词途径关键词途径 主题途径主题途

21、径 信息检索基本知识 常用检索途径常用检索途径 作者(文章的责任者)作者(文章的责任者) 篇名(或题名)篇名(或题名) 机构(如浙江工业大学)机构(如浙江工业大学) 关键词(如污水处理、高层建筑)关键词(如污水处理、高层建筑) 主题词(规范化的主题概念,如用激光不用雷射)主题词(规范化的主题概念,如用激光不用雷射) 文摘(论文或图书的摘要或内容提要)文摘(论文或图书的摘要或内容提要) 引文(即参考文献)引文(即参考文献) 基金(如国家自然科学基金项目)基金(如国家自然科学基金项目) 刊名(期刊的名称)刊名(期刊的名称) 全文(或者全记录)全文(或者全记录) 信息检索基本知识 检索途径检索途径-

22、 -著者途径著者途径 许多检索系统备有著者索引、机构(机构著者许多检索系统备有著者索引、机构(机构著者 或著者所在机构)索引,专利文献检索系统有或著者所在机构)索引,专利文献检索系统有 专利权人索引,利用这些索引从著者、编者、专利权人索引,利用这些索引从著者、编者、 译者、专利权人的姓名或机关团体名称字顺进译者、专利权人的姓名或机关团体名称字顺进 行检索的途径统称为著者途径。使用的检索工行检索的途径统称为著者途径。使用的检索工 具有具有“著者目录著者目录”、“著者索引著者索引”等。等。 信息检索基本知识 检索途径检索途径- -篇名途径篇名途径 包括书名、刊名和篇名等途径。这是根据由包括书名、刊

23、名和篇名等途径。这是根据由 书刊名称或文章的篇名编成的索引或目录来书刊名称或文章的篇名编成的索引或目录来 查找文献的途径。使用的检索工具有查找文献的途径。使用的检索工具有“书名书名 目录目录”、“刊名目录刊名目录”、“会议资料索引会议资料索引” 等目录或索引。这类检索工具一般都按图书、等目录或索引。这类检索工具一般都按图书、 期刊、资料的名称字顺编排,多用于查找馆期刊、资料的名称字顺编排,多用于查找馆 藏图书和期刊。藏图书和期刊。 信息检索基本知识 检索途径检索途径- -分类途径分类途径 l 这是一种按学科分类体系来查找文献的途径,使用这是一种按学科分类体系来查找文献的途径,使用 的检索语言是

24、分类语言。使用的检索工具有的检索语言是分类语言。使用的检索工具有“分类分类 目录目录”、“分类索引分类索引”等。分类法反映事物之间的等。分类法反映事物之间的 隶属、派生和平行等关系,体现了知识的系统性,隶属、派生和平行等关系,体现了知识的系统性, 它能把同一学科的文献集中在一起,能较好地满足它能把同一学科的文献集中在一起,能较好地满足 族性检索的要求。当研究课题较大,需要全面了解族性检索的要求。当研究课题较大,需要全面了解 某一学科及其相关知识的时候,或者难于判定研究某一学科及其相关知识的时候,或者难于判定研究 课题所属主题范围的时候,通常利用分类索引,从课题所属主题范围的时候,通常利用分类索

25、引,从 分类的途径来查找文献。分类的途径来查找文献。 l 分类途径的缺点是新兴学科、边缘学科在分类时往分类途径的缺点是新兴学科、边缘学科在分类时往 往难于处理,查找不便。另外,从分类途径检索必往难于处理,查找不便。另外,从分类途径检索必 须了解学科体系,否则在将概念变换为分类号的过须了解学科体系,否则在将概念变换为分类号的过 程中常易发生错误,造成漏检或误检。程中常易发生错误,造成漏检或误检。 信息检索基本知识 检索途径检索途径- -主题途径主题途径 主题途径是一种按照文献的主题内容查找文主题途径是一种按照文献的主题内容查找文 献的途径。使用的语言是主题语言。使用的献的途径。使用的语言是主题语

26、言。使用的 检索工具有检索工具有“主题索引主题索引”、“关键词索引关键词索引”、 “叙词索引叙词索引”等。等。 主题法打破了传统的学科分类的框框,把分主题法打破了传统的学科分类的框框,把分 散于各个学科的有关文献集中于同一主题词散于各个学科的有关文献集中于同一主题词 之下,以文字作检索标识,索引按照资料内之下,以文字作检索标识,索引按照资料内 容的主题词或关键词的字顺排列,检索时就容的主题词或关键词的字顺排列,检索时就 象查字典一样,不必考虑学科体系。象查字典一样,不必考虑学科体系。 信息检索基本知识 检索途径检索途径- -序号途径序号途径 序号途径是指按已知的文献资料特有的号码特序号途径是指

27、按已知的文献资料特有的号码特 征来查找文献信息的途径。包括图书的国际标征来查找文献信息的途径。包括图书的国际标 准书号准书号(ISBN),(ISBN),期刊的国际标准刊号期刊的国际标准刊号(ISSN),(ISSN),专专 利说明书的专利号、合同号、标准号书目数据利说明书的专利号、合同号、标准号书目数据 库中的文件记录登陆号。使用的检索工具主要库中的文件记录登陆号。使用的检索工具主要 是号码索引。号码检索具有明确、简短、唯一是号码索引。号码检索具有明确、简短、唯一 性的特点,但是要事先知道文献的序号。性的特点,但是要事先知道文献的序号。 信息检索基本知识 检索途径检索途径- -引文途径引文途径

28、文献所附参考文献或引用文献,是文献文献所附参考文献或引用文献,是文献 的外表特征之一。利用这种引文而编制的外表特征之一。利用这种引文而编制 的索引系统,称为引文索引系统,它提的索引系统,称为引文索引系统,它提 供从被引论文去检索引用论文的一种途供从被引论文去检索引用论文的一种途 径,称为引文途径。径,称为引文途径。 信息检索基本知识 检索的基本步骤检索的基本步骤 确定检索要求和目标确定检索要求和目标 拟定检索对象范围主题拟定检索对象范围主题词词 选择检索工具及检索途径选择检索工具及检索途径 实施检索并显示检索结果实施检索并显示检索结果用检索技术优化检索结果用检索技术优化检索结果 选择输出(打印

29、、拷贝或发送至电子邮箱)选择输出(打印、拷贝或发送至电子邮箱) 信息检索基本知识 如何选择检索词如何选择检索词 利用主题词表 选取规范化的主题词或词组 利用印刷版的检索工具书 手工试检,根据检出文献的主题词标引情况,选 取合适的主题词。 选用自由词 由于词表规模的限制,不可能对某一专业作全面 检索时,应考虑选用自由词,尽可能多地选用与 课题有关的同义词,以防漏检。 信息检索基本知识 检索词选取时应注意的问题检索词选取时应注意的问题 避免冷僻词避免冷僻词 找出隐性概念找出隐性概念 使用核心概念使用核心概念 注意同义词近义词词型变化注意同义词近义词词型变化 信息检索基本知识 布尔逻辑检索技术布尔逻

30、辑检索技术1 截词检索技术截词检索技术2 邻近检索技术邻近检索技术3 字段检索技术字段检索技术4 信息检索基本知识 布尔逻辑检索是指通过标准的布尔逻辑关 系算符来表达检索词与检索词间的逻辑关 系的检索方法。 主要的布尔逻辑关系词有: 逻辑与(AND)、逻辑或(OR)、逻辑非(NOT) 信息检索基本知识 逻辑乘:逻辑乘:“and”and”或或“* *”表示表示 组配方式:组配方式:A A* *B B或者或者A and B A and B 表示两表示两 个概念的交叉和限定关系,只有同时个概念的交叉和限定关系,只有同时 含有这两个概念的记录才算命中信息含有这两个概念的记录才算命中信息 作用:增加限制

31、条件,即增加检索的作用:增加限制条件,即增加检索的 专指性,以缩小提问范围,减少文献专指性,以缩小提问范围,减少文献 输出量,提高查准率。输出量,提高查准率。 信息检索基本知识 又称逻辑和:又称逻辑和:“or”、“+” 组配方式:组配方式:A OR BA OR B或者或者A AB B,表示检索,表示检索 含有含有A A词,或含有词,或含有B B词,或同时包含词,或同时包含A A、B B 两词的文章。两词的文章。 作用:放宽提问范围,增加检索结果,作用:放宽提问范围,增加检索结果, 起扩检作用,提高查全率。起扩检作用,提高查全率。 信息检索基本知识 又称逻辑差:又称逻辑差: “not” “-”n

32、ot” “-” 组配方式:组配方式:A AB B,表示检索出含有,表示检索出含有A A词词 而不含有而不含有B B 词的文章。词的文章。 作用:逻辑非用于排除不希望出现的作用:逻辑非用于排除不希望出现的 检索词,它和检索词,它和“* *”的作用相似,能够的作用相似,能够 缩小命中文献范围,增强检索的准确缩小命中文献范围,增强检索的准确 性。性。 信息检索基本知识 例如检索:例如检索:“打印机驱动程序打印机驱动程序” 查询关键词:打印机、驱动程序查询关键词:打印机、驱动程序 检索表达式:打印机检索表达式:打印机 AND 驱动程序驱动程序 例如检索:例如检索:“微型计算机微型计算机”方面的有关信方

33、面的有关信 息息 查询关键词:微型计算机、微机查询关键词:微型计算机、微机 检索表达式:检索表达式:微型计算机微型计算机OR 微机微机 信息检索基本知识 布尔运算符优先级比较布尔运算符优先级比较 有括号时:括号内的先执行;有括号时:括号内的先执行; 无括号时:无括号时:NOT AND OR 例:检索例:检索“唐宋诗歌唐宋诗歌”的有关信息。的有关信息。 关键词:唐、宋、诗歌;关键词:唐、宋、诗歌; 检索表达式:检索表达式: (唐(唐 OR 宋)宋)AND 诗歌;诗歌; 唐唐 AND 诗歌诗歌 OR 宋宋 AND 诗歌;诗歌; 错误表达式:错误表达式: 唐唐 OR 宋宋AND诗歌;诗歌; 唐唐 A

34、ND 宋宋AND诗歌;诗歌; 唐唐 OR 宋宋OR诗歌;诗歌; 唐唐AND 宋宋OR诗歌;诗歌; 信息检索基本知识 注:三个逻辑算符和括号的配合使用,注:三个逻辑算符和括号的配合使用, 可将检索词组配成较为复杂的逻辑提问可将检索词组配成较为复杂的逻辑提问 式,以满足复杂概念信息检索的需要。式,以满足复杂概念信息检索的需要。 例如:(例如:(A* *B)C : 信息检索基本知识 请注意 在不同的数据库中,所使用的逻辑符号可能 是不同的,有的用“and、or、not” 有的 用“*、+、-”。 一些检索工具会完全省略任何符号和关系, 直接把布尔逻辑关系隐含在菜单中。 一些网络检索工具如搜索引擎甚至

35、用 “、,、-”(即空格、逗号、减号)来 表示。 信息检索基本知识 主要应用于西文数字资源的检索 定义:是指在检索式中用专门的符号 (截词符号)表示检索词的某一部分 允许有一定的词形变化。 作用:主要是提高查全率 截词符一般用“?”或“*”表示 2 截词检索技术截词检索技术 信息检索基本知识 按截词位置可分为前截词、后截词、 前后截词和中间截词; 按截断字符数的不同,可分为有限截 断和无限截断。 信息检索基本知识 右截词,又称后截词、前方一致前方一致。允许检索 词尾有若干变化。例如comput*将检索出 computer 、computing、computerised、 computerized、computerization等结果。 中间截词,又称前后方一致前后方一致。允许检索词中 间有若干变化。例如wom*n,检索到woman、 women的结果。英美的不同拼法,defen*e可 同时检出defence和defense的结果。 信息检索基本知识 左截词,又称前截词、后方一致后方一致,允许检索 词前有若干变化,例如*physics就可检索到 physics、as

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论