《信息资源检索(第二版)》第2章 信息检索基本理论_第1页
《信息资源检索(第二版)》第2章 信息检索基本理论_第2页
《信息资源检索(第二版)》第2章 信息检索基本理论_第3页
《信息资源检索(第二版)》第2章 信息检索基本理论_第4页
《信息资源检索(第二版)》第2章 信息检索基本理论_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章

信息检索基本理论目录2.1信息检索基本原理

2.1.1信息检索的含义与原理

2.1.2信息检索的发展历史

2.1.3信息检索的类型

2.1.4信息检索工具

2.2信息检索方法、途径与步骤

2.2.1信息检索方法

2.2.2信息检索途径

2.2.3信息检索步骤2.3信息检索效果的评价2.3.1信息检索效果的评价

2.3.2提高信息检索效果的方法课前思考

某海军陆战队在原始森林进行为时一个月左右的生存实验,具体要求如下:第一,每个队员除了身上穿的衣服外,随身只能带三件物品,每件物品不能超过二公斤;第二,队员都是由飞机空降到半径为1000公里原始森林的中心地带,要求在一个月时间内从森林里走出来。问题:队员带哪三件物品合适?理想的答案:钢刀、火石、指南针人类要在世界上生存与发展要获取物质、能量、信息三大要素。上面例子中的指南针就是我们获取信息的一种工具,有了它,陆战队员们就可以用它获取走出原始森林的方向,没有它,可能一辈子都走不出原始森林。指南针指引的方向就是一种信息,即方向信息和方位信息。

2.1信息检索基本原理

2.1.1信息检索的含义与原理1950年莫尔斯在论文《把信息检索看作是时间性的通讯》中首次提出信息检索(一词。他指出:“信息检索是一种时间性的通讯形式”,“在时间上从一个时刻通往一个较晚的时刻,而在空间上可能还在同一地点”,并强调“信息接受者是最活跃的一方”。信息检索是从任何集合中识别和获取信息的过程及其所采取的一系列方法和策略。从信息检索的全过程来看,信息检索具有广义和狭义两重含义。广义信息检索包括两个过程,一是信息资源的存储,就是对有关信息进行选择,并对信息特征进行著录、标引和组织,建立信息数据库的过程;二是信息的检索,就是根据信息检索提问制定检索策略,利用信息数据库查找所需信息内容的过程。狭义的信息检索仅指后一部分。信息检索的本质是一个信息匹配的过程,即用户的信息需求和特定信息集合的比较、选择的过程。也就是说,信息检索是用户根据自己的信息需求提出的主题概念或提问表达式与一定的信息系统的信息语言相适应的过程,如果两者相匹配,所需信息就被检中,否则检索失败。信息检索的基本原理信息集合I匹配与选择特征化表示特征化表示需求集合D个人问题

与知识信息检索的作用(1)能够高效、全面地掌握有效信息。(2)能够提高科研效率。(3)能够提高信息素质。

2.1.2信息检索的发展历史

信息检索起源19世纪前期。(1)手工检索系统(1876—1954年)(2)脱机批处理检索(1954—1965年)(3)联机检索与光盘检索(1965—1991年)(4)网络化联机检索(1991年至今)2.1.3信息检索的类型(1)按检索对象区分(按信息检索结果的内容划分)按信息检索结果的内容划分,信息检索可分为文献信息检索、数据检索及事实检索。文献信息检索是以获得各种类型文献信息为目的的、包括文献信息线索检索和文献信息全文检索。数据检索是指从各种数值数据库和统计数据库储存的数据中查找用户所需的数据信息。事实检索是以事实作为检索对象,针对特定的事件或事实的检索。信息源用户用户接口创建数据库提问处理/检索匹配词汇管理工具DBDBDB标引处理信息选择与采集数据库生成数据库查询(2)按信息检索的方式划分

按照检索的操作方式,信息检索分为手工检索和计算机检索。1)手工检索:手工检索以手工操作的方式,利用检索工具书进行信息检索。2)机器检索:机器检索以机械、机电或电子化的方式,利用检索系统进行信息检索。计算机信息检索原理

示意图手工检索与计算机化检索的对比

手工检索

计算机化检索

信息集合

文字型检索工具

机读数据库

需求集合

文字型检索课题

形式化表示的

提问式

匹配选择

眼看、手翻、脑子

判断

计算机程序(3)按检索性质划分按照检索的性质,信息检索分为全文检索、超文本检索和超媒体检索。全文检索是将存储于数据库中的本书、整篇文章中的任意内容信息查找出来的检索。超文本检索是对每个节点中所存信息及信息链构成的网络中信息的检索。超媒体检索是对存储的文本、图像、声音等多种媒体信息的检索。2.1.4信息检索工具信息检索必须借助于一定的检索工具。检索工具是指用以报道、存储和查找文献信息线索的工具。信息检索工具的古代形态可以上溯到我国汉代刘向编撰的《七略》。现代意义的检索工具则是伴随世界信息的增加和科学技术的发展从19世纪逐步兴起的,以期刊式文摘和索引为主,包括各种工具书和计算机检索系统。检索工具具有广义和狭义之分。广义的检索工具是指用来报道、存储和查询文献信息的一切工具与设备,可分为手工检索工具、机械检索工具和计算机检索工具。狭义的检索工具则主要指手工检索工具,也称印刷型检索工具或书本式检索工具。(1)手工检索工具手工检索工具是手工检索信息资料的凭借工具和入门依据,一般分为以下几大类。1)目录2)题录3)索引4)文摘5)信息资料指南目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为著录基本单位的检索工具。一般目录主要揭示、报道这些单位出版物的外表特征。题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式与目录有所不同。【论文题名】网络环境下信息检索与报道服务浅析

【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004

【刊名】株洲师范高等专科学校学报

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道

索引:是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等),按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。

文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘要。【论文题名】网络环境下信息检索与报道服务浅析

【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004

【刊名】株洲师范高等专科学校学报

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道

【摘要】网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题.

2.2信息检索方法、途径与步骤2.2.1信息检索方法(1)直接查找法直接查找法指检索者不依靠任何检索工具或检索系统,从本专业最新核心期刊或其他文献中直接阅读原文或浏览最新目次而获取文献的方法。这是一种最常见的信息资源的获取方式。(2)顺查法顺查法指利用检索工具或检索系统,按照时间顺序由远及近地查找。一般需了解检索问题的背景和发生简况,从而选择比较适宜的检索工具及检索系统,从问题产生的时间开始查起,直到最新的文献信息,这种方法具有查全率较高的优点。(3)逆查法逆查法就是利用检索工具或检索系统由近及远逆时间查找。逆查法的重点是放在近期信息资源上,以基本满足用户自己的信息需求为原则。使用这种方法可以最快地获得新资料、新信息,这种方法投入劳动比较小,省时省力,检索效率较高,但查全率较顺查法低。(4)抽查法抽查法指在利用检索工具或检索系统查找文献时,抽取其中某段时间查找。抽查法重点关注有关课题的文献信息最可能出现或最多出现的时间段。该方法的优点是能收集相对集中、具有代表性、且能反映该课题发展水平的文献信息,有事半功倍的效果,具有检索效率高、检索效果好的优点。(5)追溯法追溯法指从已有的文献后所列的参考文献入手,逐一追查原文,从这些新查到的原文后面所附的参考文献逐一追查、不断扩检的检索方法。其优点是在没有检索工具或检索工具不齐全的情况下,借助此种方法,也可以查到一批有关的文献。C文献(先发表)NEW文献(最近发表)参考文献:BDB文献(在A后发表)参考文献:ACA文献(先发表)D文献(在A后发表)参考文献:AG追查出的文献越来越新2.2.2信息检索途径信息检索途径也叫信息检索入口或检索点。用户在检索信息资源时,选择正确的信息检索途径能够快捷、准确、全面以及花费较低成本查找到文献。一般来说,检索信息资源时,可采取以下的检索途径。(1)分类途径:是按文献所属学科类别进行检索的途径,以文献所属学科专业的分类号为特征标识的检索方法。(2)主题途径:是一种通过文献的内容主题进行检索的途径。一般来说如果知道所检文献的主题概念选用主题途径为好。(3)著者途径:指通过已知的文献著者的名称来查找文献信息的途径。著者包括个人著者和团体著者。检索知名的学者时,著者途径具有较强的实用性。(4)题名途径:指通过文献的题名来查找文献的途径。(5)机构途径:指通过机构名称获取相关信息、了解该机构情况的途径。(6)代码途径:是通过信息的某种代码来检索信息的途径。(7)其他途径:有些检索工具还附有一些特殊索引,可以通过特殊途径查找所需文献。2.2.3信息检索步骤信息检索步骤是为达到检索目的而采取的具体操作方法的总称,一般可分为检索课题分析、制定检索策略、检索策略的实施与调整和检索结果的筛选、整理和原始信息的获取等部分。2.3信息检索效果的评价2.3.1信息检索效果的评价信息检索效果评价是通过评价相关信息检索过程的各种指标来衡量的。在网络环境下信息检索效果的评价指标主要有六个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。收录范围是信息检索系统(信息存储)所能提供的文献信息的数量和范围。查准率和查全率是指信息检索系统的效率。响应时间是指从提交检索课题到查出文献所需的时间。用户负担是用户在检索过程中所耗费的物力财力乃至精力的总和。输出形式则指检索系统所提供的检索结果和形式(可能是文献号、题录、文摘或全文等)。上述六种指标又以查全率和查准率两项指标最为重要。

查全率与查准率

查全率与查准率.查全率

指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。用字母R表示。R=4.2.2查准率(precisionratio)

指检出文献中合乎需要的文献数量占检出文献全部数量的比例。用字母P表示。P=

相关情况检出情况相关文献非相关文献总计被检出文献a(命中的)b(误检的)a+b未被检出文献c(漏检的)d(应拒的)c+d总计a+cb+da+b+c+d以上两个公式中字母所表示的含义见下表查全率和查准率之间的关系

一系列的试验结果表明,查全率和查准率之间存在互逆关系。因此,如果对检索系统要求较高的查全率,则查准率必然下降,反之亦然。查全率与查准率是评价检索效果的两项重要指标。查全率和查准率与信息资源的存储与检索两个方面是直

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论