《信息搜索简介》PPT课件.ppt_第1页
《信息搜索简介》PPT课件.ppt_第2页
《信息搜索简介》PPT课件.ppt_第3页
《信息搜索简介》PPT课件.ppt_第4页
《信息搜索简介》PPT课件.ppt_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息搜索简介,信息091 郑晓萱 王梦思,网络信息检索存在的问题,信息过量、检索效率低 信息污染及网络安全的问题 检索工具不完善 网络传输速度太慢 用户缺乏信息检索专业知识,在数字化、网络化信息资源高度共享的今天,应学习和掌握搜索引擎的检索方法与技巧,以充分有效地利用丰富的网络信息资源。,互联网信息检索的类型:,1、基于超文本的信息检索 2、基于搜索引擎的信息检索 3、基于目录的信息检索 4、基于专业数据库文献的信息检索,一、搜索引擎的工作原理:,1)搜索信息:搜索引擎的信息搜集基本都是自动的。根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百”一样便可以遍历绝大部分网页。 2)整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进 行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅找到所要的资料。 3) 接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几 乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。,搜索引擎的性能指标,我们可以将WEB信息的搜索看作一个信息检索问题,可以用衡量传统信息检索系统的性能参数-召回率(Recall)和精度(Pricision)衡量一个搜索引擎的性能。 召回率是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统(搜索引擎)的查全率;精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统(搜索引擎)的查准率。,搜索引擎的主要技术,一个搜索引擎由搜索器、索引器、检索器和用户接口等四个部分组成。 搜索器的功能是在互联网中漫游,发现和搜集信息。 索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。 检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。 用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。主要的目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。用户接口的设计和实现使用人机交互的理论和方法,以充分适应人类的思维习惯。,搜索引擎未来值得注意动向,1.十分注意提高信息查询结果的精度,提高检索的有效性 2.基于智能代理的信息过滤和个性化服务 3.采用分布式体系结构提高系统规模和性能 4.重视交叉语言检索的研究和开发,二、搜索技巧:,1、正确使用各种检索语言 (1)布尔逻辑 not表示逻辑“非”,使用not寻找包含not前的 关键词,但排除not后的关键词的文档。 and表示逻辑“与”,使用and操作符检索所得的文档中包含所有的关键字。and的另一种表示方式是用空格表示。 or表示逻辑“或”,使用or将检索出几个关键字中至少包含一个的文档。or的另一种表示方式是逗号。 括号的作用和数字中的括号相似,可用来使括在其中的操作符先起作用。,(2)“+、-号” 在一个关键词前不留空格地加上一个“+”号,表示该关键词一定要出现在检索结果中。 “-”号的情况正好相反,表示该关键 词一定 不会出现在结果中。 (3)双引号的使用 双引号在网络检索中的作用,主要是将引号 中的词作为一个整体,在文本中查找。,2.模糊查询与精确查询,模糊查询又称为智能查询。当我们输入一个关键词时,搜索引擎不但反馈包括了关键词的网址,同时也发来与关键词意义相近的内容。模糊查询没有特殊的方法,只要在文字框中输入关键词即可。模糊查询往往会反馈来大量不需要的信息,如果想精确地只查某一个关键词,则可以使用精确查询功能。 精确查询一般是在文字框中输入关键词时,加一对半角的双引号。,3、使用恰当的检索方法,(1)一般性的浏览查询或强调获取较为综合、准确的信息时, 一般应利用目录检索,用户可按思维的逻辑顺序或按照其主题目录体 系的导引去浏览、追踪、查找信息。 (2)细节查询或强调获取较为具体、特定的信息时,一般应利 用关键词进行大范围的快速检索,方便、快捷地查询到针对性较强的 检索结果。 (3)在查询一些较模糊或就某一课题的网络资源进行调查、摸 底、综览时,使用多元搜索,进入专门数据库进行检索。 (4)在查询音频、视频等多媒体信息资源时,多用多媒体信息 检索工具进行搜索。,4、使用恰当的检索词,(1)为了提高检索的精度,应尽量选专指词、特定概念或非常 用词,避免普通词、泛指概念。 (2)当检索结果数量太少,需扩大检索范围时,要使用同义 词、近义词。 (3)提高查全率的原则是减少检索约束条件,通常的方法有:降 低检索词的专指度,调节检索式的网罗度;进行载词检索;增加检索途 径;取消某些限制过严的前后缀符、限制符等。 (4)提高查准率的原则是增加检索约束条件,通常的方法有:提 高检索式的专指度;用“与”连接一些进一步限定主题概念的相关检 索项,增加相互制约;限制检索出现的可检字段;用位置符控制检索 词的词间顺序与位置;利用限制符、前缀符等限制输出文献的外部特 征。,(5)注意拼法 应注意英美对某些单词的拼法不同,以及有些单词拆分形式和合写形式多种表达方法,我们在检索时两者都应当检索,这样才能提高查全率。 (6)“英文搜索大不同”首字母大写 多数搜索引擎对特殊名词是很敏感的,这意味着,如果你使用大写的人名、地名或者其他合适的名词,将得到更好的结果,这一点对于英文搜索非常 重要。,5.范围限制,范围限制的功能,可以使我们在某一范围中查询和搜索指定的关键词。 范围限制的能力越强,则越能使我们更准确地找到需要的信息。搜索 引擎提供的范围限制类型大体有以下几个方面: (1).分类范围。在某一类别中查询,如自然科学、教育、 商务、黄页等。 (2).地域范围。在某一地区中查询。 (3).时间范围。查询某一时间范围内建立的网站或编写 的网页。 (4).网站类型范围。在某一类型的网站中查询,如WWW、Ftp、 Gopher、BBS、新闻组等。 (5).把搜索范围限定在网页标题中intitle 把搜索范围限定在特定的站点中site 把搜索范围限定在url链接中inurl 搜索所有链接到某个url地址的网页link,6、尝试高级搜索 几乎所有的搜索引擎都有自己的一套高级搜索机制,通常只要点击主页 中的一个链接就可以了。在高级搜索页面中,可以指定附加的检索条 件,以缩小查询的范围,不同的搜索引擎提供不同的选项:常规的选项 一般包括日期范围、网域、语言。 7.加快检索速度,节省费用 8.、使用帮助信息 各个搜索引擎和数据库都有自己的特点和特色,详细的“帮助” 信息,我们要善于利用。,三、常见的搜索工具介绍:,(一)软件搜索 1搜索软件吧http:// 2.海量软件搜索引擎http:// (二)生活服务搜索 Google生活搜索http://shenghuo/ 爱帮生活搜索http:/ (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论