课件2:因特网信息资源检索_第1页
课件2:因特网信息资源检索_第2页
课件2:因特网信息资源检索_第3页
课件2:因特网信息资源检索_第4页
课件2:因特网信息资源检索_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因特网信息资源检索因特网中的信息检索信息检索工具的工作原理1.3因特网信息资源检索本环节主要内容主要学习各种搜索引擎及其发展趋势,并在此基础上进一步分析了搜索引擎的工作原理。搜索引擎是什么?A.网页B.网站C.一组程序

D.access√√搜索引擎——是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的。注意的问题搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。因特网信息资源检索1.目录索引类搜索引擎2.全文搜索引擎3.特色信息检索工具4.其它信息检索工具5.元搜索引擎1.3因特网信息资源检索搜索引擎——指用于因特网信息查找的网络工具。1.目录索引类与全文搜索引擎(1)目录索引类搜索引擎(其搜索方式也称为分类搜索)目录搜索引擎——将收取到的各个网站(网页)的信息按照目录分类,建

立索引数据库供人们分类查找。代表网站:搜狐()

新浪()

网易()

雅虎()

搜网)目录索引类搜索引擎的基本工作原理

目录索引类搜索引擎一般采用人工方式采集和存储网络信息,依靠手工为每个网站确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。信息检索工具的工作原理特点:在查询信息时,不用事先确定信息检索目标(即关键词),可以通过浏览主题了解某一主题的相关资源。优点:目录索引类搜索引擎的网页由人工精选,网页内容丰富,学术性较强。缺点:更新速度慢。专题目录链接网站总目录信息检索工具的工作原理搜索的例子:选择题1.目录索引类搜索引擎一般采用什么方式采集和存储信息()。A.人工方式B.蜘蛛程序C.关键字检索D.检索工具A(2)全文搜索引擎(其使用方法也称为关键词查询)全文搜索引擎——用代表所需信息主题的关键词进行信息查询。谷歌google:()百度:()北大天网:)特点:通过从因特网上提取的各个网站的信息(以网页文字为主)而建立的索引数据库。1.3因特网信息资源检索信息检索工具的工作原理组成部分负责工作搜索器负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页。索引器把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中。检索器面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户。搜索引擎的组成全文搜索引擎的工作原理购物描述商品特征取贷交给顾客查找信息输入描述信息的关键词在数据库中检索结果呈现全文搜索引擎的工作原理:信息检索工具的工作原理查询结果用户查询输入查询表达式

检索器查询结果显示查询信息排序

索引器

搜索器筛选信息采集索引排序索引数据库采集结果上半部下半部全文搜索引擎的工作过程是什么?课本P72-73

搜索引擎的工作过程①从互联网上“抓取”网页②建立索引数据库③在索引数据库中搜索排序④用户接口:查询和响应全文搜索引擎输入关键字查询信息排序索引数据库用户查询查询结果检索搜索下列不属于搜索引擎中“搜索器”工作程序的是()。A.网络机器人B.蜘蛛C.爬虫D.CuteFTPD2.特色信息检索工具1.3因特网信息资源检索

我们经常使用的一般是综合信息检索工具,而当们我们要查找图片、地图等信息时,使用综合搜索引擎会找到很多无用的信息,而且搜索的效率和有效性都不高。这时就可以使用特色搜索引擎(有时是综合检索工具中的一个功能)一类以FTP、Telnet、Usenet(UsesNetwork的缩写——新闻讨论组,是全世界最大的电子布告栏系统)等资源为检索对象的检索工具,如北大天网、Archie等。1.3因特网信息资源检索3.其他信息检索工具4.其他信息检索工具以FTP、Telnet、Usenet等资源为检索对象。5.元搜索引擎1.3因特网信息资源检索

一般的网络检索工具局限在本引擎的数据库内进行搜索,由于不同的搜索引擎各自的信息收集方式和范围、检索算法和结果排序方法都各不相同,因此检索结果也不尽相同。为了获得较好的结果,1995年出现了元搜索引擎,元搜索引擎能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。但是由于元搜索引擎出现的时间短,一些搜索引擎强大的检索功能还不能实现。元搜索引擎——这是一种搜索引擎之上的(强调逻辑关系、逻辑结构)搜索引擎,它可以同时检索多个成员搜索引擎的数据库。常用元搜索引擎

1、Ithaki()

支持包括中文在内的14种语言检索。2、Ixquick()

可搜索网站、MP3、新闻、图象等多种网络资源3、)

4、Turbo10/)

5、)

6、)

7、)

1.3因特网信息资源检索下列不属于元搜索引擎特点的是()。A.搜索时,用户必须多次提交搜索请求B.可同时搜索多个数据库C.一般支持AND、OR、NOT等操作D.一般只使用简单、直接的搜索策略A三、因特网资源检索策略

搜索内容引擎选择一般信息资源综合性的(百度、google)图片、视频特色的,也可以用综合搜索引擎的某个功能专业性较强专业搜索引擎全面了解网上信息资源元搜索引擎

四、网上信息检索技巧

1、使用空格

输入更多的关键词,只要在关键词中间留空格, 这相当于多个关键词之间的关系是逻辑“与”。

练习1,查找“出门在外”的歌曲

2、使用减号.

要避免搜索某个词语,可以在这个词前面加上 一个减号(“-”,

英文字符).但在减号之前必须留一空 格.如要了解搜索引擎历史,可以这样输入关键字:搜 索引擎

宗教

-佛教

-基督教

3、添加英文双引号.

双引号中的词语在查询到的文档中将作为一个整体出现.这一方法在查找名言警句或专有名词时显得格外有用.

练习2,请你比较应用下面两组关键词的搜索结果有什么不同

1,理科的学习方法

2,“理科的学习方法”

4,查找特定格式的文件.

Google可以

直接搜索13种非HTML文件.其中包括Flash的

swf

文档,Microsoft

Office的(doc,

ppt,

xls,

rtf)

,pdf和其它类型文档.格式是:关键词

filetype:类型名.

(梅花三弄filetype:swf)

四、网上信息检索技巧

5、标题搜索.

当我们需要搜索一篇关于某个主题的文章时,可以用以下的关键字:“intitle:关键字”.如“intitle:南瓜饼”

对比“intitle:南瓜饼”和“南瓜饼”的查找结果

6、网页快照.

Google

在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用.

四、网上信息检索技巧五.

因特网信息检索发展趋势

(1)多媒体信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论