大型综合性搜索引擎介绍_第1页
大型综合性搜索引擎介绍_第2页
大型综合性搜索引擎介绍_第3页
大型综合性搜索引擎介绍_第4页
大型综合性搜索引擎介绍_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大型综合性搜索引擎介绍第1页,共59页,2022年,5月20日,14点32分,星期二大型综合性搜索引擎介绍第2页,共59页,2022年,5月20日,14点32分,星期二1、 网络信息检索工具与方法一、网络信息检索的特点二、网络信息检索工具三、网络信息检索的方法第3页,共59页,2022年,5月20日,14点32分,星期二一、网络信息检索的特点1、存取范围覆盖Internet上所有资源2、传统检索方法与全新检索技术相结合3、用户界面友好且操作方便4、具备良好的导航和编辑功能5、用户透明度第4页,共59页,2022年,5月20日,14点32分,星期二二、网络信息检索工具网络信息检索工具按照不同标准

2、可以划分不同类型:1、按照网络信息资源类型划分: WWW检索工具、非WWW检索工具2、按照检索机制划分: 关键词检索工具、分类目录检索工具、混合型检索工具3、按照包含检索工具数量划分: 单一型检索工具、多元型检索工具4、按照检索内容划分: 综合型检索工具、专题型检索工具、特殊型检索工具第5页,共59页,2022年,5月20日,14点32分,星期二二、网络信息检索工具查Usenet新闻组资源的WAIS查FTP资源的Archie查Gopher资源的Veronica查Telent资源的Hytelent查WWW资源Search Engine(搜索引擎) 其中Search Engine 应用最为普及第6

3、页,共59页,2022年,5月20日,14点32分,星期二主要搜索引擎的建立时间及网址建立年月 搜索引擎的名称及网址1994年4月WebCrawler1994年5月Lycos第7页,共59页,2022年,5月20日,14点32分,星期二1994年底Yahoo!1995年初Infoseek1995年10月AltaVista第8页,共59页,2022年,5月20日,14点32分,星期二2、 搜索引擎及其检索一、搜索引擎的构成及工作原理用户检索策略搜索引擎用户接口搜索引擎本地的摘要信息数据库各万维网站点资源访问详细信息反馈摘要信息反馈各记录链接信息资源搜集第9页,共59页,2022年,5月20日,1

4、4点32分,星期二二、搜索引擎的功能搜索引擎有两个主要的功能: 1、收集网络信息资源,对其进行 索引并建立数据库。 2、提供网络的信息导航与检索服 务(主要的功能)。第10页,共59页,2022年,5月20日,14点32分,星期二搜索引擎的基本检索功能1、布尔逻辑检索 逻辑与 (与、and、AND、 ) A and B AB 逻辑或(或、or、OR、|) A or B A;B;AB; 逻辑非(非、not、NOT、!) A not B AAB第11页,共59页,2022年,5月20日,14点32分,星期二2、完全字符串检索 采用双引号“”代表字符串 精确查找 “知识经济”知识经济第12页,共59

5、页,2022年,5月20日,14点32分,星期二3、 截词检索(*) 前方一致检索 扩大检索范围 nutri* nutria + nutrient + nutrilitei + nutriment + nutrition第13页,共59页,2022年,5月20日,14点32分,星期二4、字段限制检索限定检索词在检索结果中出现的位置,用来控制检索结果的相关性。如:URL限制(url:) 主机名限制(host:) 标题限制(title:)第14页,共59页,2022年,5月20日,14点32分,星期二5、位置检索 目前只有Alta Vista能提供 邻近位置运算near运算。第15页,共59页,2

6、022年,5月20日,14点32分,星期二6、 +、- 检索+:放在检索词前,表示该检索词在检索结 果中必须出现。-:放在检索词前,表示该检索词在检索结 果中不能出现。几乎所有的搜索引擎都支持这种功能。如:+computer+virusCIH第16页,共59页,2022年,5月20日,14点32分,星期二搜索引擎的高级检索功能1、自然语言检索支持字、词、句子检索几乎所有的搜索引擎都支持该功能如:知识经济的支柱产业 How has WTO developed?第17页,共59页,2022年,5月20日,14点32分,星期二2、模糊检索当输入一个检索词时,搜索引擎会把与该检索词相关的词一并反馈,列

7、出供用户选择。相关性检索如:在雅虎中国查找“搜索引擎”一词时,模糊检索会把“搜索引擎”、“搜寻引擎” 、“引擎”等相关的检索词一并列出。第18页,共59页,2022年,5月20日,14点32分,星期二3、概念检索 用某一检索词进行检索时,能同时对该词同样或类似概念的同义词和近义词进行检索,以达到扩大检索范围,提高查全率的目的。如:Excite第19页,共59页,2022年,5月20日,14点32分,星期二4、区分大小写检索大多数搜索引擎在查询中要区分大小写小写匹配大小写字符大写只匹配大写字符第20页,共59页,2022年,5月20日,14点32分,星期二5、管道(|)检索 用管道符(|)连接两

8、个或者多个检索词,如 apple | disease,先对前一个检索词进行检索,再在其检索结果的基础上对后一个检索词进行检索,依次类推,以达到逐步缩小检索范围提高查准率的目的。第21页,共59页,2022年,5月20日,14点32分,星期二6、相关信息反馈检索 提供与检索结果类似的检索结果。如: 雅虎中国的“相关网站、相关网页、相关新闻”。 Lycos的“More Like This” Excite的“Search for more documents like this one”第22页,共59页,2022年,5月20日,14点32分,星期二7、范围限制检索在某一范围内检索指定的检索词。 分

9、类范围、时间范围、地域范围、 信息来源、检索词位置、语种范围、 特殊范围第23页,共59页,2022年,5月20日,14点32分,星期二三、搜索引擎的分类1、根据信息检索方式分类: 分类搜索引擎、关键词搜索引擎、混合搜索引擎2、根据信息覆盖范围及适用用户群分类: 综合性搜索引擎、专用性搜索引擎 3、根据搜索范围分类: 独立搜索引擎、集成搜索引擎第24页,共59页,2022年,5月20日,14点32分,星期二四、搜索引擎常见的查询方式按照搜索引擎提供的分类目录逐级查询,用户一般不需要输入检索词,而是按照查询系统提供的几种分类项目,选择类别进行查询,这种方式也叫分类检索。用布尔逻辑组配方式查询,这

10、种方式也叫定制搜索。(多个关键词)第25页,共59页,2022年,5月20日,14点32分,星期二五、搜索引擎检索的步骤1、输入URL地址,登陆到搜索引擎 的主页。2、输入检索提问式或点击分类目录, 进行实时的交互式的信息检索。3、搜索引擎输出HTML文件,并且翻 译HTML,显示检索结果。第26页,共59页,2022年,5月20日,14点32分,星期二六、搜索引擎的选择技巧查全率、查准率更新速度、死链接易用性、稳定性搜索速度高级搜索的支持能力第27页,共59页,2022年,5月20日,14点32分,星期二七、常用搜索引擎简介1、主要中文搜索引擎2、主要英文搜索引擎3、各具特色的专用搜索引擎第

11、28页,共59页,2022年,5月20日,14点32分,星期二主要中文搜索引擎百度是世界上规模最大的中文搜索引擎,拥有全球最大的中文网页库,每天处理来自一百多个国家的超过一亿人次的搜索请求。第29页,共59页,2022年,5月20日,14点32分,星期二百度高级搜索主要中文搜索引擎第30页,共59页,2022年,5月20日,14点32分,星期二一搜()是雅虎公司基于全球领先的YST(Yahoo Search Technology)技术,在中国推出的搜索门户。一搜具有简洁专业、海量、客观精准、国际化、稳定高速等特点,是值得依赖的专业搜索门户。主要中文搜索引擎第31页,共59页,2022年,5月2

12、0日,14点32分,星期二主要中文搜索引擎一搜高级搜索第32页,共59页,2022年,5月20日,14点32分,星期二主要中文搜索引擎雅虎中国第33页,共59页,2022年,5月20日,14点32分,星期二主要中文搜索引擎雅虎中国高级搜索第34页,共59页,2022年,5月20日,14点32分,星期二主要中文搜索引擎新浪第35页,共59页,2022年,5月20日,14点32分,星期二主要中文搜索引擎搜狐第36页,共59页,2022年,5月20日,14点32分,星期二主要中文搜索引擎网易第37页,共59页,2022年,5月20日,14点32分,星期二主要中文搜索引擎第38页,共59页,2022年

13、,5月20日,14点32分,星期二主要中文搜索引擎263搜索第39页,共59页,2022年,5月20日,14点32分,星期二主要英文搜索引擎Alta Vista :第40页,共59页,2022年,5月20日,14点32分,星期二主要英文搜索引擎Excite: 第41页,共59页,2022年,5月20日,14点32分,星期二主要英文搜索引擎Hotbot:第42页,共59页,2022年,5月20日,14点32分,星期二主要英文搜索引擎Hotbot:第43页,共59页,2022年,5月20日,14点32分,星期二主要英文搜索引擎Lycos:第44页,共59页,2022年,5月20日,14点32分,星

14、期二Google搜索引擎和百度搜索引擎Google搜索引擎百度搜索引擎第45页,共59页,2022年,5月20日,14点32分,星期二2.1 Google搜索引擎网址:Google是一个全自动搜索引擎,它是利用计算机程序直接在网页中抓取相关字串。“Google”一词来源于“googol”(仍然是英文),是10的100次方,表示是一个非常巨大的数字的概念。正如其名,Google是一个功能强大、使用方便的搜索引擎。第46页,共59页,2022年,5月20日,14点32分,星期二与其他搜索引擎相比Google的优点:1) 对于用户所输入的关键字,Google 会最大程度的寻求语义匹配。例如想查找有关

15、某人的网页,但输入“同音不同字的名” ,Google 也能找到你想要得信息。或者,在查询框中输入作者的名字,所有文章与网页都会被检索,连那个网页有转载都会显示出来。此外,Google 还包含有汉字的相关性 ,例如对中文简体网站,找出对应的繁体网站,甚至是日文网站。2) Google还提供网页快照(Cached)功能。 Google将检索的网页都做了一番“快照”,然后存放在自己的服务器上,当被搜索的内容站点当前不存在时,用户可以用网页快照功能。第47页,共59页,2022年,5月20日,14点32分,星期二Google检索须知当检索结果过多,需进一步缩小时,可选择“缩小搜索”或在“结果中搜索”。

16、只要输入更多的关键词即可,或在不需要的关键词前“-”号。注意“-”后应留一空格。Google 不支持OR检索,也不区分英文大小写,所有字母均当小写处理。在专用词语上加双引号可以进行精确查询,这在查找某个产品或专用术语时特别有用。第48页,共59页,2022年,5月20日,14点32分,星期二“-+=,”等也作为短语连接符。例如,尽管Micro-computer,不加引号,仍作为专用词语处理。Google 会忽略http和com 等字样,以及数字和单字,因为他们出现过频繁,因此无助于检索,还会减低速度。Google的“手气不错”功能将自动连接到Google推荐的网页,无需再查其他结果,快速方便第

17、49页,共59页,2022年,5月20日,14点32分,星期二Google检索示例第50页,共59页,2022年,5月20日,14点32分,星期二第51页,共59页,2022年,5月20日,14点32分,星期二第52页,共59页,2022年,5月20日,14点32分,星期二2.2 百度搜索引擎网址:第53页,共59页,2022年,5月20日,14点32分,星期二百度搜索引擎特点1)中国人自己开发研制的,适合中文网站搜索2)“网页的相关检索功能”例如输入“手机”,在检索的上方还会出现“手机的价格”、“手机铃声”等与“手机”相关的词,此时再点一下“手机铃声”,则会检索出“手机铃声”的结果3)在百度的检索结果中,用户可以选“重新查询”;也可选“在结果中再查”则将在第一次的结果中在按新输入的词查询,这相当于AND,结果会更精确些;选在“结果中去除”则将在第一次的结果中“减去”新输入的词查询,相当于NOT。第54页,共59页,2022年,5月20日,14点32分,星期二4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论