因特网信息资源检索PPT精选文档_第1页
因特网信息资源检索PPT精选文档_第2页
因特网信息资源检索PPT精选文档_第3页
因特网信息资源检索PPT精选文档_第4页
因特网信息资源检索PPT精选文档_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,因特网信息资源检索,因特网中的信息检索,信息检索工具的工作原理,1.3因特网信息资源检索,2,本环节主要内容,主要学习各种搜索引擎及其发展趋势,并在此基础上进一步分析了搜索引擎的工作原理。,3,搜索引擎是什么?,A.网页B.网站C.一组程序D.access,搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。,4,注意的问题,搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。,5,因特网信息资源检索,1.目录索引类搜索引擎2.全文搜索引擎3.特色信息检索工具4.其它信息检索工具5.元搜索引擎,6,1.3因特网信息资源检索,搜索引擎指用于因特网信息查找的网络工具。1.目录索引类与全文搜索引擎(1)目录索引类搜索引擎(其搜索方式也称为分类搜索)目录搜索引擎将收取到的各个网站(网页)的信息按照目录分类,建立索引数据库供人们分类查找。代表网站:搜狐()新浪()网易()雅虎()搜网(),7,目录索引类搜索引擎的基本工作原理,目录索引类搜索引擎一般采用人工方式采集和存储网络信息,依靠手工为每个网站确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。,1.3.2信息检索工具的工作原理,特点:在查询信息时,不用事先确定信息检索目标(即关键词),可以通过浏览主题了解某一主题的相关资源。优点:目录索引类搜索引擎的网页由人工精选,网页内容丰富,学术性较强。缺点:更新速度慢。,8,1.3.2信息检索工具的工作原理,搜索的例子:,9,选择题,1.目录索引类搜索引擎一般采用什么方式采集和存储信息()。A.人工方式B.蜘蛛程序C.关键字检索D.检索工具,A,10,(2)全文搜索引擎(其使用方法也称为关键词查询)全文搜索引擎用代表所需信息主题的关键词进行信息查询。谷歌google:()百度:()北大天网:()特点:通过从因特网上提取的各个网站的信息(以网页文字为主)而建立的索引数据库。,1.3因特网信息资源检索,11,1.3.2信息检索工具的工作原理,搜索引擎的组成,全文搜索引擎的工作原理,12,全文搜索引擎的工作原理:,1.3.2信息检索工具的工作原理,13,全文搜索引擎的工作过程是什么?课本P72-73,搜索引擎的工作过程,从互联网上“抓取”网页建立索引数据库在索引数据库中搜索排序用户接口:查询和响应,14,全文搜索引擎,输入关键字,查询信息排序,索引数据库,用户查询,查询结果,检索,搜索,15,下列不属于搜索引擎中“搜索器”工作程序的是()。A.网络机器人B.蜘蛛C.爬虫D.CuteFTP,D,16,2.特色信息检索工具,1.3因特网信息资源检索,我们经常使用的一般是综合信息检索工具,而当们我们要查找图片、地图等信息时,使用综合搜索引擎会找到很多无用的信息,而且搜索的效率和有效性都不高。这时就可以使用特色搜索引擎(有时是综合检索工具中的一个功能),17,一类以FTP、Telnet、Usenet(UsesNetwork的缩写新闻讨论组,是全世界最大的电子布告栏系统)等资源为检索对象的检索工具,如北大天网、Archie等。,1.3因特网信息资源检索,3.其他信息检索工具,18,4.其他信息检索工具,以FTP、Telnet、Usenet等资源为检索对象。,19,5.元搜索引擎,1.3因特网信息资源检索,一般的网络检索工具局限在本引擎的数据库内进行搜索,由于不同的搜索引擎各自的信息收集方式和范围、检索算法和结果排序方法都各不相同,因此检索结果也不尽相同。为了获得较好的结果,1995年出现了元搜索引擎,元搜索引擎能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。但是由于元搜索引擎出现的时间短,一些搜索引擎强大的检索功能还不能实现。,元搜索引擎这是一种搜索引擎之上的(强调逻辑关系、逻辑结构)搜索引擎,它可以同时检索多个成员搜索引擎的数据库。,20,常用元搜索引擎1、Ithaki(支持包括中文在内的14种语言检索。2、Ixquick(可搜索网站、MP3、新闻、图象等多种网络资源3、qbSearch4、Turbo105、Dogpile6、Webcrawler7、S,1.3因特网信息资源检索,21,下列不属于元搜索引擎特点的是()。A.搜索时,用户必须多次提交搜索请求B.可同时搜索多个数据库C.一般支持AND、OR、NOT等操作D.一般只使用简单、直接的搜索策略,A,22,三、因特网资源检索策略,23,四、网上信息检索技巧,1、使用空格输入更多的关键词,只要在关键词中间留空格,这相当于多个关键词之间的关系是逻辑“与”。练习1,查找“出门在外”的歌曲2、使用减号.要避免搜索某个词语,可以在这个词前面加上一个减号(“-”,英文字符).但在减号之前必须留一空格.如要了解搜索引擎历史,可以这样输入关键字:搜索引擎宗教-佛教-基督教,24,3、添加英文双引号.双引号中的词语在查询到的文档中将作为一个整体出现.这一方法在查找名言警句或专有名词时显得格外有用.练习2,请你比较应用下面两组关键词的搜索结果有什么不同1,理科的学习方法2,“理科的学习方法”4,查找特定格式的文件.Google可以直接搜索13种非HTML文件.其中包括Flash的swf文档,MicrosoftOffice的(doc,ppt,xls,rtf),pdf和其它类型文档.格式是:关键词filetype:类型名.(梅花三弄filetype:swf),四、网上信息检索技巧,25,5、标题搜索.当我们需要搜索一篇关于某个主题的文章时,可以用以下的关键字:“intitle:关键字”.如“intitle:南瓜饼”对比“intitle:南瓜饼”和“南瓜饼”的查找结果6、网页快照.Google在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用.,四、网上信息检索技巧,26,五.因特网信息检索发展趋势,(1)多媒体信息检索(2)专业垂直搜索引擎,1.3因特网信息资源检索,27,课堂总结,这节课我们学习了两大知识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论