信息技术基础 课件 项目七 信息检索_第1页
信息技术基础 课件 项目七 信息检索_第2页
信息技术基础 课件 项目七 信息检索_第3页
信息技术基础 课件 项目七 信息检索_第4页
信息技术基础 课件 项目七 信息检索_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

※了解信息检索的定义和分类。※了解搜索引擎的分类和原理。※掌握常用信息检索技术。※掌握使用知网检索文献的方法。项目七

信息检索任务一信息检索概述一、信息检索的定义和分类1.信息检索的定义信息检索是用户获取信息的主要方式,是查询信息的方法和手段。信息检索有广义和狭义之分。广义的信息检索是将信息按一定的方式进行加工、整理、组织并存储起来,再根据用户特定的需求将相关信息准确地查找出来的过程。因此,信息检索也称信息的存储与检索。狭义的信息检索仅指信息查询,即用户根据需要,采用某种方法或借助检索工具,从信息集合中找出所需要的信息。2.信息检索的分类根据检索手段的不同,信息检索可分为手工检索和机械检索。手工检索是以手工翻检的方式,通过图书、期刊、目录卡片等工具来检索信息的一种手段,其优点是回溯性好,没有时间限制;缺点是费时,效率低。机械检索则是利用计算机检索数据库的过程,其优点是速度快;缺点是回溯性不好,并且有时间限制。在机械检索过程中,网络文献检索最为迅速,是信息检索的主流。根据检索对象的不同,信息检索又可分为文献检索、数据检索和事实检索。这3种检索的主要区别在于数据检索和事实检索需要检索出包含在文献中的信息本身,而文献检索检索出包含所需要信息的文献即可。二、常用的信息检索技术是一种较为成熟且流行的检索技术,其基础是逻辑运算。常用的逻辑运算符有逻辑与(AND)、逻辑或(OR)和逻辑非(NOT)3种1.布尔逻辑检索也称临近检索,是用一些特定的位置算符来表达检索词与检索词之间的顺序和词间距的检索技术。位置算符主要有(W)算符、(nW)算符、(N)算符、(nN)算符、(F)算符及(S)算符2.位置检索是预防漏检、提高查全率的一种常用检索技术,其含义是,用截断的词的一个局部进行检索,并认为凡是满足这个词局部中的所有字符的文献,都为命中的文献3.截词检索是一种在计算机检索时,将检索范围限定在数据库特定的字段中的检索技术。常用的检索字段主要有标题、摘要、关键词、作者、作者单位及参考文献等4.字段限制检索三、信息检索的原理和方法1.信息检索的原理010203普通法追溯法分段法三、信息检索的原理和方法是利用书目、文摘、索引等检索工具进行文献资料查找的方法是利用已有文献所附的参考文献不断追踪查找的方法是追溯法和普通法的综合,它将前两种方法分期、分段交替使用,直至查到所需资料2.信息检索的方法任务二搜索引擎设置一、搜索引擎的分类和原理1全文搜索引擎它们从互联网中提取各个网站的信息,建立起数据库,并能检索与用户查询条件相匹配的记录,最后按一定的排列顺序返回结果2目录式搜索引擎它是指以人工方式或半自动方式搜集信息,由搜索引擎的编辑人员查看信息之后,依据一定的标准对网络资源进行选择、评价,由人工形成信息摘要,并将信息置于事先确定的分类框架中而形成的主题目录3元搜索引擎在接受用户查询请求后,通过一个统一的界面,同时在多个搜索引擎上搜索,并将结果返回给用户1.搜索引擎的分类一、搜索引擎的分类和原理1234搜索引擎通过一种特定软件跟踪网页的链接,从一个链接“爬到”另一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”或“机器人”爬行搜索引擎通过“蜘蛛”跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库,其中的页面数据与用户浏览器得到的HTML完全一样抓取存储搜索引擎将“蜘蛛”抓取回来的页面,进行各种预处理预处理用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动排名2.搜索引擎的原理二、常用的搜索引擎是全球最大的中文搜索引擎,它致力于向用户提供“简单,可依赖”的信息获取方式1.百度搜索引擎通过一个统一的用户界面,帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络中的多种检索工具的全局控制机制2.360搜索引擎是搜狐公司推出的全球首个第三代互动式中文搜索引擎,它致力于对中文互联网信息的深度挖掘,帮助用户加快信息获取速度,为用户创造价值3.搜狗搜索引擎任务三在中国知网中查文献一、使用知网检索文献1.进入知网在浏览器地址栏中输入中国知网的网址,打开中国知网首页。2.检索分别单击首页上部的“文献检索”“知识元检索”“引文检索”选项卡,便可进行相应类别的检索。(1)快速检索(2)高级检索(3)专业检索(4)作者发文检索二、文献处理知网的注册用户可下载和浏览文献全文,系统提供了CAJ和PDF两种格式4.下载检索出的结果可按照主题、学科、发表年度、研究层次、文献类型、文献来源、作者、机构和基金进行分组浏览3.分组浏览检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论