32因特网上的信息检索_第1页
32因特网上的信息检索_第2页
32因特网上的信息检索_第3页
32因特网上的信息检索_第4页
32因特网上的信息检索_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.2因特网信息资源检索一、因特网信息检索方法基于超文本/超媒体的信息浏览通过一个网站中的链接去访问另外一个信息资源基于目录服务的信息查询(目录式搜索)基于搜索引擎的信息检索(全文搜索)因特网上的信息检索方法基于超文本/超媒体的信息浏览基于目录服务的信息查询基于搜索引擎的信息检索搜索引擎是什么?A.网页B.网站C.一组程序

D.access√√二、搜索引擎的发展与分类1、产生为了解决信息分散存储、数量多、冗余度大等问题,产生了专业信息搜索的公司和搜索网站最早的搜索引擎出现于1994年4月,美籍华人杨致远和一个美国人共同创办了超级目录索引雅虎1994年起搜索引擎发展举例产生时间搜索工具开发组或公司网站特点1994.4Yahoo斯坦福大学早期Yahoo数据是手工输入1995.12AltavistaDEC公司第一个支持自然语言关键词和高级检索的引擎1997.10北大天网北大计算机研究室收录网页约6000万,有强大的FTP搜索功能1998.9Google斯坦福大学提供网页评级动态摘要、网页快照,每天更新、多文档格式支持2001.8Baidu百度公司快照、预览、相关词搜索、mp3、flash搜索功能2、搜索引擎的分类类型定义举例目录搜索通过人工整理分类,网络信息资源按照主题分类,并以层次树状形式进行组织,形成分类目录树。Eg:雅虎、新浪

选择“教育”类目

按目录类别查找搜索:比如:查高考资料没找到“高考”,就找比“教育”跟接近“高考”的“中小学教育”找到啦!优点:实实在在找到用户所关心内容分类,网站导航质量高。缺点:分类不够细,需要人工介入,目录的维护量大,更新可能不够及时。目录式搜索引擎的特点2、搜索引擎的分类类型定义举例全文搜索使用关键词到预先建好的或租用其它索引数据库查询信息的一类搜索引擎.

Eg:goole、百度

全文搜索引擎输入关键字查询信息排序索引数据库用户查询查询结果检索搜索

按关键词语查找搜索:注意啦,要先在这里输入关键字!现在可以按“搜索”按钮了点击我就可以进入“高考”有关内容了!全文搜索引擎的特点优点:信息量大、更新较及时、不需人工干预。缺点:返回信息过多,有很多无关信息。类型定义举例元搜索引擎元搜索引擎就是通过一个统一的用户界面向多个搜索引擎同时递交用户查询,返回结果去重合并,综合结果返回给用户.

优点:结果精确、全面,汇聚各大搜索引擎的结果。

缺点:检索速度较慢、牺牲个别搜索引擎性能,并非1+1=2

注意的问题搜索引擎是因特网上信息检索的软件系统。搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。元搜索引擎示意图特色信息检索工具这类检索工具专门收集某一类的信息资源。例:MIDI文件检索工具特色信息检索工具地图检索其他信息检索工具以FTP、Telnet、Usenet等资源为检索对象。搜索引擎分类检索方法

优点缺点举例全文搜索引擎目录式搜索引擎元搜索引擎其他非主流类型搜索引擎举例

需要关键词查询信息量大(面向具体网页内容)、更新及时,不需要人工干预返回信息量过多,包含许多无关信息按目录浏览主题和主题相关的内容实实在在找到用户关心的内容分类(面向网站分类),网站导航质量高,分类不够细,分类目录的建立需要人工介入,目录维护量大,信息更新不及时需要关键词查询向多个搜索引擎提交查询,返回经过去重并重新排序的综合结果时间稍长(实际效果不太理想)Google、百度雅虎

Meta-Fisher信息检索代理、特种搜索引擎分别用目录式搜索引擎、全文搜索引擎、元搜索引擎搜索,并填写下表中的信息进行比较搜索内容搜索引擎名称搜索时间搜索数量环境保护上海世博会动动手目录式搜索引擎:全文搜索引擎:元搜索引擎:参考资源3、搜索引擎技术的发展(1)提高搜索引擎对用户检索提问的理解(2)对检索结果做进一步的处理(3)确定搜索引擎信息搜索范围,提高搜索引擎的针对性全文搜索引擎的工作过程是什么?三、搜索引擎的工作过程①从互联网上“抓取”网页②建立索引数据库③在索引数据库中搜索排序④用户接口:查询和响应

四、网上信息检索技巧

1、使用空格

输入更多的关键词,只要在关键词中间留空格, 这相当于多个关键词之间的关系是逻辑“与”.

练习1,查找“出门在外”的歌曲

2、使用减号.

要避免搜索某个词语,可以在这个词前面加上 一个减号(“-”,

英文字符).但在减号之前必须留一空 格.如要了解搜索引擎历史,可以这样输入关键字:搜 索引擎

宗教

-佛教

-基督教

3、添加英文双引号.

双引号中的词语在查询到的文档中将作为一个整体出现.这一方法在查找名言警句或专有名词时显得格外有用.

练习2,请你比较应用下面两组关键词的搜索结果有什么不同

1、理科的学习方法

2、“理科的学习方法”

4、查找特定格式的文件.

Google可以

直接搜索13种非HTML文件.其中包括Flash的

swf

文档,Microsoft

Office的(doc,

ppt,

xls,

rtf)

,pdf和其它类型文档.格式是:关键词

filetype:类型名.

(梅花三弄filetype:swf)

5、标题搜索.

当我们需要搜索一篇关于某个主题的文章时,可以用以下的关键字:“intitle:关键字”.如“intitle:南瓜饼”

对比“intitle:南瓜饼”和“南瓜饼”的查找结果

6、网页快照.

Google

在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论