信息检索第2讲_第1页
信息检索第2讲_第2页
信息检索第2讲_第3页
信息检索第2讲_第4页
信息检索第2讲_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 信息检索原理及方法信息检索原理及方法第一节第一节 信息检索概述信息检索概述 一、信息检索的含义一、信息检索的含义信息检索通常是信息用户为处理解决各种问题而查找、识别获取相关的事实、数据、知识的活动及过程。完整的信息检索,还包括信息的存储。由此可知,信息检索的全过程应包括两个主要的方面: 1) 1)信息的标引和存储过程信息的标引和存储过程 对大量无序的信息资源进行标引处理,使之有序化,并按科学的方法存储,组成检索工具或检索文档,即检索系统的组织过程组织过程。 2) 2)信息的需求分析和检索过程信息的需求分析和检索过程 分析用户的信息需求,利用已组织好的检索系统,按照系统提供的方法与

2、途径检索有关信息,即检索系统的应用过应用过程程。二、信息检索的重要意义与作用二、信息检索的重要意义与作用信息检索的重要意义与作用主要体现在以下两信息检索的重要意义与作用主要体现在以下两方面方面: : 1 1、充分利用信息资源,避免重复劳动、充分利用信息资源,避免重复劳动科学研究具有继承和创造两重性,科学研究的科学研究具有继承和创造两重性,科学研究的两重性要求科研人员在探索未知或从事研究工作之两重性要求科研人员在探索未知或从事研究工作之前,应该尽可能地占有与之相关的信息,即利用信前,应该尽可能地占有与之相关的信息,即利用信息检索的方法,充分了解国内外前人和他人对拟探息检索的方法,充分了解国内外前

3、人和他人对拟探索或研究的问题已做过哪些工作、取得了什么成就、索或研究的问题已做过哪些工作、取得了什么成就、发展动向如何等等。这样才能做到心中有数,防止发展动向如何等等。这样才能做到心中有数,防止重复研究,将有限的时间和精力用于创造性的研究重复研究,将有限的时间和精力用于创造性的研究中。中。因此,信息检索是科学研究必不可少的前期工因此,信息检索是科学研究必不可少的前期工作。作。 2 2、为人们更新知识、实现终生学习提供路、为人们更新知识、实现终生学习提供路径径在当代社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。 掌握信息检索的方法与技能,是形成合理知掌握信息检索的方法与技能,是形

4、成合理知识和更新知识的重要手段,是做到无师自通、识和更新知识的重要手段,是做到无师自通、不断进取的主要途径。不断进取的主要途径。2.1.2 2.1.2 信息检索类型信息检索类型事实信息检索事实信息检索依检索内容划分依检索内容划分文献信息检索文献信息检索数据信息检索数据信息检索信信息息检检索索类类型型2.1.2 2.1.2 信息检索的类型信息检索的类型数据检索:数据检索:检索的结果是检索的结果是数据或数值数据或数值。 如某种材料的电阻;某变压器的如某种材料的电阻;某变压器的参数;化学分子式、数据图表等参数;化学分子式、数据图表等。 事实检索:检索的结果是事实检索:检索的结果是事实结论事实结论。查

5、询某一事物(事件)的性质、定义、查询某一事物(事件)的性质、定义、原理以及发生的时间、地点过程等。如某原理以及发生的时间、地点过程等。如某产品是哪个厂家生产,哪个牌子的最好;产品是哪个厂家生产,哪个牌子的最好;第一颗人造卫星是什么时候升空的第一颗人造卫星是什么时候升空的。年年鉴鉴文献检索:检索的结果是文献检索:检索的结果是文献资料文献资料。查找相关文献的内容、出处、收藏单位查找相关文献的内容、出处、收藏单位等。等。如系统地查找数控机床相关方面的文如系统地查找数控机床相关方面的文献。献。论文论文 文献检索是信息检索的核心部分。文献检索是信息检索的核心部分。从性质上说:从性质上说:文献检索是一种相

6、关性检索,检索的结果文献检索是一种相关性检索,检索的结果是与课题相关的文献或文献线索,而不直是与课题相关的文献或文献线索,而不直接解答用户所提出的技术问题本身;接解答用户所提出的技术问题本身;事实检索与数据检索则是确定性检索,检事实检索与数据检索则是确定性检索,检索的结果是用户所需的确切的数据或事实。索的结果是用户所需的确切的数据或事实。三、信息检索的类型与特点三、信息检索的类型与特点根据检索的目的和对象不同,信息检索可以分为书目信息检索、全文信息检索、数据信息检索和事实信息检索。1 1、书目信息检索、书目信息检索以标题、作者、摘要、来源出处、专利以标题、作者、摘要、来源出处、专利号、收藏处所

7、等为检索的目的和对象,检索号、收藏处所等为检索的目的和对象,检索的结果是与课题相关的一系列书目信息线索的结果是与课题相关的一系列书目信息线索.书目信息检索是一种书目信息检索是一种相关性检索相关性检索。 2 2、全文信息检索、全文信息检索 以论文或专利说明书等的全文为检索的目的和对象,检索的结果是与课题相关的论文或专利说明书的全部文本,检索结果也不直接解答用户提出的技术问题本身。因此,全文信息检索也是一种相关性检索相关性检索 3 3、数据信息检索、数据信息检索 以具有数量性质,并以数值形式表示的数据为检索的目的和对象,检索的结果是经测试、评价过的各种数据,可直接用于比较分析或定量分析。因此,数据

8、信息检索是一种确定性检索确定性检索。 4 4、事实信息检索、事实信息检索 以事项为检索的目的和对象,检索的结果是有关某一事物的具体答案。因此,事实信息检索是一种确定性检索确定性检索。 综上所述,综上所述,书目信息检索书目信息检索是从存储有标题项、作者是从存储有标题项、作者项、出版项或文摘项的检索系统中获取有关的信息项、出版项或文摘项的检索系统中获取有关的信息线索,如利用各种目录、题录和文摘检索系统。线索,如利用各种目录、题录和文摘检索系统。 全文信息检索全文信息检索是从存储整篇论文、专利说明书乃至是从存储整篇论文、专利说明书乃至整本著作的检索系统中获取全文信息,如利用各种整本著作的检索系统中获

9、取全文信息,如利用各种论文全文数据库、专利说明书全文数据库系统。论文全文数据库、专利说明书全文数据库系统。 数据信息检索数据信息检索是从存储有大量数据、图表的检索系是从存储有大量数据、图表的检索系统中获取数值性信息,如利用各种手册、年鉴、图统中获取数值性信息,如利用各种手册、年鉴、图谱、表谱等检索系统。谱、表谱等检索系统。 事实信息检索事实信息检索是从存储有大量知识信息、事实信息是从存储有大量知识信息、事实信息和数据信息的检索系统中获取某一事项的具体答案,和数据信息的检索系统中获取某一事项的具体答案,如利用各种百科全书、年鉴、名录等检索系统。如利用各种百科全书、年鉴、名录等检索系统。 2.3

10、检索语言 检索语言是用于描述信息系统中信息特征和表达用户信息提问的一种专门语言,是信息存储与检索共同遵循的规则。主题语言主题语言分类语言分类语言标题词语言标题词语言关键词语言关键词语言叙词语言叙词语言检检索索语语言言第二章第二章信息检索原理信息检索原理 一 信息检索基本原理: 是检索者的检索提问词与存储在检索系统中的检索标引词进行匹配对比,取 得一致即为检索命中,命中结果可从检索系统中以各种方式输出。检索者可根据此线索对原文进行判断、筛选,以获取自己所需要的信息。 二、信息检索效率二、信息检索效率 信息检索效率是研究信息检索原理的是评价一个检索系统性能优劣的质量标准,它始终贯穿信息检索和信息存

11、储的全过程。衡量检索效率的指标有查全率、查准率、漏检率、误检率、响应时间等。目前,人们通常主要以查全率和查准率这两个指标来衡量。 1、查全率、查全率 利用检索系统进行某一课题检索时,检索出的相关信息量(w)与该系统信息库中存储的相关信息量(x)的比率称为查全率(R),用公式可表示为:R=100% 2、查准率查准率 利用检索系统进行某一课题检索时,检出的相关信息量(w)与检出的信息总量(m)的比率称为查准率(p),用公式可表示为: p=100% mwxwxw 如何提高查全率?选择上位词和相关词;如:查找关于孙中山的文献,先用孙中山查,再用孙文、国父查找。调节检索式的网罗度,删除不必要的组面,如a

12、nd(并且);进行族性检索(分类检索或用or连接相关检索词);截词检索;com*代替computer增加检索途径。如何提高查准率?提高专指度(用下位词或换专指性强的自由词) 用逻辑乘“*”(and) 或 not 相关检索项;如查找克林顿,但不要关于莱温斯基的信息。检索式:克林顿 not 莱温斯基用文献外部特征限制输出结果(在中文图书中查找); 用“二次检索”“条件检索”排除误检 限制检索字段,指定邻接和优先关系。 从检索要求来说,希望查全率和查准率都同时达到100%,即系统中存储的所有相关信息都被检索出(w=x=m),这是最为理想的效果。但事实上很难达到全部检出和全部检准的要求,而只能达到某个

13、百分比,总会出现一些漏检和误检。因此,在实际检索过程中,必须同时兼顾查全和查准,不可片面追求某一方面。 三、信息检索系统三、信息检索系统 信息检索系统是拥有一定的存储、检索技信息检索系统是拥有一定的存储、检索技术设备,存储有经过加工的各类信息,并能为术设备,存储有经过加工的各类信息,并能为信息用户检索所需信息的服务系统。信息用户检索所需信息的服务系统。 因此,信息检索系统具有吸收信息、加工信因此,信息检索系统具有吸收信息、加工信息、存储信息和检索信息等功能。息、存储信息和检索信息等功能。 检索系统是手工检索系统和计算机检索系统。检索系统是手工检索系统和计算机检索系统。 1 1、手工检索系统、手

14、工检索系统 手工检索系统又称传统检索系统,是用人工查找信息的检索系统。其主要类型有各种书本式的目录、题录、文摘和各种参考工具书等。 2、计算机检索系统计算机检索系统 计算机检索系统又称现代化检索系统,是用计算机技术、电子技术、远程通信技术、光盘技术、网络技术等构成的存储和检索信息的检索系统。 按使用的设备和采用的通信手段,可分为联机检索系统、光盘检索系统和网络检索系统。 2.4计算机信息检索技术计算机信息检索技术 计算机信息检索技术是用户信息需求和文献计算机信息检索技术是用户信息需求和文献信息集合之间的信息集合之间的匹配比较技术匹配比较技术。 由于由于信息检索表达式信息检索表达式是用户需求与信

15、息集合是用户需求与信息集合之间匹配的依据,之间匹配的依据, 检索表达式是运用各种检索表达式是运用各种逻辑运算符号逻辑运算符号、位置位置逻辑算符逻辑算符、截词符截词符、及其他限制符号等,把、及其他限制符号等,把检索词连接组配起来,确定检索词之间的关检索词连接组配起来,确定检索词之间的关系,准确表达检索课题的内容的算式。系,准确表达检索课题的内容的算式。2.4.1布尔逻辑检索布尔逻辑检索 布尔逻辑检索是用布尔逻辑算符将检索词、短语或代码布尔逻辑检索是用布尔逻辑算符将检索词、短语或代码进行逻辑组配指定文献的命中条件和组配次序用以检索进行逻辑组配指定文献的命中条件和组配次序用以检索出符合逻辑组配所规定

16、条件的记录。是计算机检索系统出符合逻辑组配所规定条件的记录。是计算机检索系统中最常用的一种检索方法。中最常用的一种检索方法。 布尔逻辑组配是现行计算机检索的基本技术,主要布尔逻辑组配是现行计算机检索的基本技术,主要通过通过“与与(and,*)”、“或或(or,+)”、“非非(not,-)”将检索将检索词联络起来。词联络起来。AandB逻辑与。逻辑与。A和和B都为真时,都为真时,结果才为真结果才为真,即:,即:A*B,逻辑含义用图表示是:,逻辑含义用图表示是:AorB逻辑或。逻辑或。A或或B中只要有一个中只要有一个为真时,结果就为真,即:为真时,结果就为真,即:A+BAnotB逻辑非。逻辑非。A

17、为真、为真、B为为假时,结果才为真,即:假时,结果才为真,即:A-B布尔逻辑运算符的运算次序布尔逻辑运算符的运算次序 括号优先括号优先与计算机编程中一样与计算机编程中一样(AORB)ANDCNOTD 不同的系统次序有差别不同的系统次序有差别,但总的来说一般次,但总的来说一般次序为:序为:NOTANDOR 例例A:查找有关信息检索的非英文文献查找有关信息检索的非英文文献信息信息information检索检索retrieval英文英文english(信息信息and检索检索)not英文英文(informationandretrieval)notenglish分析实例:分析实例:上海零售业的现状与发展

18、趋势上海零售业的现状与发展趋势上海上海 零售业零售业 现状现状 发展趋势发展趋势上海上海 and 零售业零售业 and (现状现状 or 发展趋势发展趋势)2.4.2截词检索截词检索 截词包括后截、中截、前截等。用?作为截词截词包括后截、中截、前截等。用?作为截词符符(有些系统用有些系统用*),主要包括下列情形:,主要包括下列情形: 如如wom?n可以检索出:可以检索出:woman,women 如如coumput?可以检索出可以检索出Compute,Computer,Computing,computable如:如:transplant?可以检索出:可以检索出:transplant、transplanted、transplanter如:如:comput?可以检索出:可以检索出:compute;computer;computing%?*“%国庆国庆”将检索出所有字段为将检索出所有字段为张国庆张国庆、欧欧阳国庆阳国庆、国庆国庆等的记录。等的记录。如:如:“热电材料热电材料%”将检索出将检索出热电材料梯度化热电材料梯度化、热电材料及其梯度化热电材料及其梯度化等的记录。等的记录。 联机检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论