第6章-Internet网络信息存取.ppt_第1页
第6章-Internet网络信息存取.ppt_第2页
第6章-Internet网络信息存取.ppt_第3页
第6章-Internet网络信息存取.ppt_第4页
第6章-Internet网络信息存取.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、6.1 网络信息存取原理与方法,6.1.1 网络信息检索的特点 存取范围覆盖Internet 上的几乎所有资源 传统检索方法与全新检索技术相结合 超文本检索 用户界面友好且操作方便 C/S结构 信息反馈功能和瞬间响应功能 具备良好的导航和编辑功能 用户透明度 屏蔽物理差异,6.1.2 网络信息检索一般方法, 浏览检索 偶然发现信息 不可预见性 通过资源指南(Resource Guide)来查找相应的信息 网上虚拟图书馆 利用网络信息检索工具 RSS订阅(Really Simple Syndication) 共享信息 使用搜索软件 充分利用E-mail获取信息资源,网络信息存取工具,网络信息检索

2、工具:在因特网上提供信息检索服务的计算机系统。 检索对象:存在于因特网信息空间中各种类型的网络信息资源。 搜索引擎:以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。由搜索器、索引器、检索器、用户接口组成。,结构图,搜索器:在互联网中漫游、发现和搜集信息。 从一个起始URL集合开始,顺着超链线路以宽度优先、深度优先或启发式方式循环地在互联网中发现信息。 将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个空间穷尽搜索。,返回,索引器:目录索引库或数据库。认识理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及

3、生成文档库的索引表。 客观索引项与内容索引项 集中式索引与分布式索引,返回,检索器:根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。,返回,用户接口 作用:用于输入用户查询、显示查询结果、提供用户相关性反馈机制。 目的:方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。,返回,6.1.3 网络信息存取工具, 搜索引擎的构成,用户系统,用户接口,搜索器,索引器,检索器,www信息资源,FTP信息资源,Gopher信息资源,WAIS信息资源,搜索引擎,网络,网络,Telnet信息资源,用户服务组信息资源

4、, 搜索引擎工作原理: 搜索引擎的三大支柱技术:数据库技术、网络通信技术、信息检索技术,用户访问策略,搜索引擎用户界面接口,搜索引擎本地的摘 要信息数据库,各万维网 站点资源,各记录链接,详细信息反馈,访问,摘要信息反馈,信息资源搜集, 网络信息检索工具类型 按照网络信息资源类型划分 www检索工具 非www检索工具 按照检索机制划分(分析其优缺点) 关键词检索工具 分类目录检索工具 混合型检索工具 按照包含检索工具数量划分 单一型检索工具 多元型检索工具(并行,串行,ALL-IN-ONE方式) 按照检索内容划分 综合型检索工具 专题型检索工具 特殊型检索工具,网络信息存取系统的检索功能 基本

5、检索功能 布尔逻辑检索(NOT/nor/ ! 、 AND/and/& 、 OR/or/ | ) 字符串检索(“”功能) 截词检索 字段限制检索(题名,著者,关键词等) 位置检索 高级检索功能 自然语言检索(直接输入自燃语言) 模糊检索(搜寻相关概念,上下位概念) 概念检索(指同义词和近义词) 区分大小写检索 管道检索(用管道符“|”表检索顺序) 相关信息反馈检索(点击相关网页,网站等。Yahoo,Lycos的“more like this”等) 检索范围限制(语言、地域、类型、后缀、时间等),6.2 Internet 网络存取系统及其检索,6.2.1 关键词检索工具的性能和使用 英文搜索引擎介

6、绍 Alta Vista ( ) Alta Vista 是资格最老的搜索引擎,1995年诞生于DEC研发中心,是目前最受欢迎的网络信息检索工具之一。它以搜索功能强大、响应速度快和信息量丰富而著称。 注:由于种种原因,目前国内用户无法直接访问AltaVista。,Excite,特色:概念搜索:首先将检索词按字意自动扩展或加以限定,然后根据“智能概念抽取”技术查找相关的文献。 数据库规模和范围:有包含5500万网页的新闻组数据库,每天搜索300个新闻媒体,精选了6万多站点供检索。 支持目录检索和关键词检索,有基本检索和高级检索(search home里边):基本检索支持关键词、词组和自燃语言检索。

7、自燃语言检索越详细越好。支持“”和“”,布尔操作符,括号,还可进行组合检索,能对语言、国家、域名进行限制。 结果显示:支持按日期和出版物排序,结果包括相关得分、题名、摘要、URL,也可只显示题名,还可在灭国中用“like this”检索。 更新:1到2周。 评价:便于简单查询,摘要可读性强,当相关性排序质量一般,搜索出的结果不能指明其格式和文件大小。, Excite ( ),Lycos,特色:功能强大,无所不有的搜索引擎,在欧洲、亚洲、美洲的35个国家和地区设置了镜像站点。(主页如下页所示) 规模和范围:利用多个数据库提供关键词和分类主题查询以及其他服务。高级检索利用Fast数据库(3.4亿个

8、网页),自身的目录指南包含5000万网页。 检索功能:简单和高级检索。用“+”“-”表示要求和排除,缺省是and。高级检索不支持布尔运算符,但用下拉菜单选择检索任何词或精确匹配等。字段限制检索有题名、URL、主机名或域名。可选对象有:所有书、web、城市、软件、FTP检索、多媒体、新闻、股票等包含25种语言。不去分大小写。 结果显示:按照流行网站、web网站、新闻的顺序列出,可进行再搜索,结果包括题名、摘要、URL。 更新:24周。 评价:搜索图像和声音文件功能较强;优点在于使用简便、排序功能好、查准率较高。缺点是结果重复率较高,有死链接。, Lycos ( ),HotBot,特色:1996年

9、5月推出的搜索引擎,1998年10月被Lycos收购。是一个提供最新最全面信息服务的门户网站。 规模和范围:数据库包含有1.1亿个网页,主题分类目录有专家维护。除检索web页面、新闻讨论组之外,还有股票、电子商务、新闻、商业信息服务等。 检索功能:简单和高级检索。简单检索利用下拉菜单可选择利用单词、短语、题名、人物、URL、布尔检索,可对语言、日期进行限制。高级检索除有简单检索功能外,可选择包含或排除某检索词、检索所有页还是首页、对媒体类型、地区、域名限制等。 结果显示:可选择显示数量,结果包括3部分:先列出10个最受欢迎的网站,然后是与检索相匹配的分类目录列表,最后是结果列表。结果含有标题、

10、摘要、得分、文件大小、日期和网址。 更新:34周 评价:丰富的检索功能。检索速度快,不足在于支持布尔符上有限制,在线文件的帮助功能稍差。, HotBot ( ), Google ( ), 其他常用英文搜索引擎 Infoseek ( 或 ) WebCrawler ( ) OpenText ( ) NorthernLights ( 或 ) Teoma ( ) PlanetSearch ( ) AllTheWeb ( ) Goto ( ) Askjeeves ( ) DirectHit ( ), 中文搜索引擎介绍 天网 ( ), 搜索客 ( ), 尤里卡( ),其他常用中文搜索引擎 中国大陆搜索引擎

11、 百度 ( ) 北极星 ( ) 常青籐 ( ) 若比邻 ( ) 网典 ( ) 我国台湾地区搜索引擎 番薯籐 ( .tw ) Openfian ( .tw ) 哇塞 ( .tw ), 盖世 ( .tw ) Seednet ( .tw ) 香港特别行政区搜索引擎 茉莉之窗 ( ) 添达 ( ) 英文著名搜索引擎的中文版 Google 中文版 ( ) AltaVista 中文版 ( ) Excite 中文版 ( ) Lycox 中文版 ( ),6.2.2 浏览型存取系统的性能

12、及其使用 英文分类目录介绍 Yahoo ( ),The WWW Vitural Library ( ),AOL ( ),其他常用英文分类目录 Galaxy ( ) About ( ) Open Directory ( ) Look Smart ( ) 中文分类目录介绍 搜狐 ( ) 网络指南针 ( :8010 ) 其他常用中文分类目录 雅虎中文版 雅虎中国: 简体 雅虎台湾: 繁体 雅虎中文: 简体 繁体 雅虎香港: 繁体 英文 所有( ),搜狐分类目录 ( 返回 ),6.2.3 多元型存取系统的性能及其使用, 多元型搜索引擎介绍 MetaCrawler

13、( ),Mamma ( ), 其他常用英文元搜索引擎 Dogpile ( ) Lxquick ( ) Cyber411 ( ) DigiSearch ( ) Highway61 ( ) EasySearcher2 ( ) 万维搜索引擎 ( ) 其他常用中文元搜索引擎 3721 ( ) 现代网 ( ) AsiaYeah ( ), 搜索引擎目录 All-In-One-Search Page ( ) IT!( ) CUI W3 Search Engines ( http:/cui.unige.ch/meta-index.html ) CUSI ( http:/cusi.emnet.co.uk ) 其

14、他较常用英文搜索引擎目录 Search Power ( ) Search Engine Colossus ( ) Search Engine Guide ( ) Easy Searcher ( ), 中文搜索引擎指南 ( http:/www.search- ) 其他常用中文搜索引擎目录 疯狂搜索千里眼搜索器 ( ) 小榄捷成 ( ) 离线式元搜索引擎的使用 飙风搜索通 ( ) CrazySearch ( ) MetaHari ( ) HurricaneWebSearch ( ) InforianQuest ( ),6.2.4 特种信息检索工具的使用, 查询人物、E-mail、地址等信息 Int

15、ernet Address Finder (IAF) ( ) FOUR11 ( ) Who Where ( ) 全球华人寻人引擎 LOOK4U ( Housernet ( ) Netfind ( /Inter-Links/netfind.html ) 查询地图的工具 Mapblast ( ) 图行天下 ( ) 城市交通旅游电子地图 ( ),查询多媒体信息的工具 Scour ( ) Ditto ( ) 中文数码图象搜索引擎 ( ) Eefind ( ) IfindGraphics ( ) 100分MP3搜索引擎 ( ) MP3SPY下载 ( ) 网上定点摄像站

16、引擎 earthcam ( ), 网上免费资源搜索的工具 1AAAFreeStuff ( ) AbsolutelyFreebies ( ) Allfreesites ( ) 专门提供有关域名注册信息、域名有效性测试等服务的工具 Domain Notes ( http:/www.wd- Amnesi ( ) InterNIC ( ),7.2.5 非万维网检索工具及其使用 检索FTP信息资源 Archie TFTP 数据库( http:/ ) 检索Telnet 信息资源 Hytelnet 检索Usenet 信息资源 Deja News ( ) T 新闻组数据库( ), 检索Mailing list

17、 信息资源 T 邮件列表数据库 PA Mailing Lists ( ) 检索Gopher 信息资源 Veronica ( gopher://11/veronica ) Jughead ( gopher:/:3002/7 ) 检索WAIS 信息资源 WAIS Search Directory ( wais:/:210/directory-of-servers ),6.3 网络信息检索策略与技巧,7.3.1 网络信息检索策略 明确搜索目标,确定检索项 分析检索课题的主题,选择适当的检索关键词 对检索项进行逻辑组配,构造检索表达式 选定适合的检索工具 掌握网上检索工具的类型与特点 熟悉要使用的检索工具 注意收集具体的检索网址 正确对待检索结果 可只阅读搜寻结果的前面几条信息 缩小搜索范围 找不到网页的对策 认真回顾检查搜索方法并进行纠正 提高上网速度,选择最佳上网时间,7.3.2 网络信息检索技巧,扩大检索范围 缩小检索范围 Ctrl+F 给检索结果做标签 右切断URL 猜测占点的URL,6.3.3 网络信息检索术语 Boolean search 布尔逻辑检索 Concept search 概念检索 Full-text index 全文检索 Fuzzy search 模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论