009 信息检索教程 第九章ppt课件_第1页
009 信息检索教程 第九章ppt课件_第2页
009 信息检索教程 第九章ppt课件_第3页
009 信息检索教程 第九章ppt课件_第4页
009 信息检索教程 第九章ppt课件_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信 息 检 索 教 程,王立清 主编,普通高等教育”十一五”国家级规划教材,互联网已经在网民生活中占据一定的地位。互联网上的信息已是海量,搜索引擎则是网民在汪洋中搜寻信息的工具,是互联网上不可或缺的工具和基础应用之一。在当前网络环境下,网络信息检索已成为人们获取信息的最重要方式。,第9章 网络信息检索概述,9.1.1 网络信息资源的特点 网络信息资源(Network Information Resources)指可在因特网上发布、查询与存取利用的信息资源的总和。它包括在Internet这个平台上可以获得的一切信息资源,如数据库、电子图书、电子期刊、电子报纸和其他的网站、网页等。,第9章 网络信

2、息检索概述,网络信息资源与传统信息资源相比,有着明显的优势: 1. 数量巨大,增长迅速 2. 内容丰富,形式多样 3. 结构复杂,分布广泛 4. 开放互动,共享性强 5. 传播快速,利用方便 6. 更新速度快,动态性强 7. 信息使用成本低,第9章 网络信息检索概述,网络信息资源的缺点: 1. 网络信息质量参差不齐,良莠不一 2. 分散无序,缺乏管理 3. 稳定性差,精确度低,缺乏安全保障,第9章 网络信息检索概述,9.1.2 网络信息资源的类型 依据不同的划分标准,可以对网络信息资源做出如下的分类: 按网络信息资源的媒体形式分 :,第9章 网络信息检索概述,文本信息,图片信息,音频信息,视频

3、信息,三维虚拟 影像信息,按照人类信息交流的方式划分 :,第9章 网络信息检索概述,正式出版信息,半正式出版信息,非正式出版信息,按照信息的加工程度划分:,第9章 网络信息检索概述,一次网络信息资源,二次网络信息资源,三次网络信息资源,按照网络信息的内容和用途划分 :,第9章 网络信息检索概述,普通型,即时资料型,数据资料型,专门资料型,按照信息的表现形式划分 :,第9章 网络信息检索概述,全文型,实时活动型,书目文献型,数值型,按照传输协议的不同分:,第9章 网络信息检索概述,WWW信息资源,Gopher信息资源,网络论坛,FTP信息资源,Telnet信息资源,9.1.3 网络信息资源的分布

4、 Internet现已成为全世界最大的信息资源库,网络信息资源可谓浩瀚无边,内容涉及各个方面。 1. 政府信息 2. 教育科研信息 3. 网上出版物 4. 网络数据库 5. 电子论坛和电子会议 6. 网上专利信息,第9章 网络信息检索概述,Internet还有大量的会议信息、学位论文、技术标准、科技政策法规、产品样本目录、科技报告、统计数据、电子论坛、科技新闻、组织机构、通讯讨论组和数据库等,其分布特征主要体现在以下两个个方面:,第9章 网络信息检索概述,离散性,不均衡性,9.2.1 网络信息检索原理 网络信息检索及其特点 网络信息检索(NIR-Networked Inform

5、ation Retrieval)代表着网络时代获取信息的重要方向。网络信息检索指通过一定的方法,从已存储的网络信息中查找与用户提问相关的信息的过程。它是计算机检索的发展和延伸,是一种基于Internet的新型的信息检索方式。,第9章 网络信息检索概述,网络信息检索与传统信息检索相比,呈现出新的特点: 1.检索的对象得到了极大的丰富 2.检索的空间得到了极大的扩展 3.检索趋于简单方便,第9章 网络信息检索概述,网络检索与其他类型的计算机检索形式相比,也存在一些不足,主要有: 1.信息查准率比较低 2.检索带有一定的盲目性 3.各种检索工具的检索方法不统一,造成了用户使用的不便,第9章 网络信息

6、检索概述, 网络信息资源检索的原理 当前的网络信息通讯多采用客户端/服务器结构。,第9章 网络信息检索概述,网络信息检索的基本模型,9.2.2 网络信息检索方法 在Internet上查找信息,主要是要找到提供信息源的服务器。 在网上检索信息资源的基本方法如下: 1.直接浏览网址查询 2.利用网络资源目录 3.利用以关键词检索为主的搜索引擎 4.查询网络文献数据库 5.查询网上图书馆,第9章 网络信息检索概述,9.3.1 网络信息检索标准Z39.50 Z39.50是一种Client/Server体系结构下描述客户机检索服务器上数据以及获得检索结果的数据结构与交互规则的协议,是网络中

7、的应用层协议,定义了客户机与服务器之间数据交换标准。,第9章 网络信息检索概述, Z39.50概况 Z39.50起源于20世纪70年代美国国会图书馆、OCLC(Online Computer Library Center)、研究图书馆信息网络(Research Libraries Information Network)等的书目数据库系统互联项目。在国家信息标准化组织(National Information Standards Organization,NISO)的支持下开始了这一方面的标准化研究工作,于1988年推出第一个版本Z39.50-1988,即图书馆应用系统信息检索服

8、务定义与协议规范(Information Retrieval Service Definition and Protocol Specifications for Library Applications)。,第9章 网络信息检索概述, Z39.50的内容及特点 Z39.50是一种基于网络的信息检索标准,主要包括两部分:一部分是信息检索服务的定义,定义了信息检索服务的11种机制,包括Z39.50协议支持的服务功能说明和服务参数说明;另一部分是Z39.50协议的规范,包括协议控制信息定义、信息交换规则和实现协议必备的条件。,第9章 网络信息检索概述,Z39.50协议是一种网络协议,

9、它由控制和管理计算机之间通讯过程中所涉及的格式和进程的规则所组成,具有以下特点: 1.与其他面向传输层的协议不同,Z39.50是基于会话层的协议,是有态的 2.Z39.50是一种开放网络平台上的应用层协议,利用它可以使不同计算机系统之间协同工作 3.Z39.50是一种基于网络的信息检索标准,它允许用户查询远程数据库 4.Z39.50支持分布式Client/Server(客户机/服务器)模式 5.Z39.50既可以采用同步方式,又可以采用异步方式进行通讯,第9章 网络信息检索概述, Z39.50的运行机制及实现模型 Z39.50协议是由状态的、面向连接的应用层协议,它描述了两个信息

10、检索服务系统之间的交互,客户端和服务器分别被称为源端和目的端,源端和目标端的交互是在一个会话里进行的,称为Z-连接。,第9章 网络信息检索概述,第9章 网络信息检索概述,Z39.50的基本实现过程,早先的Z39.50协议采用了典型的两层C/S结构,其实现模型如下图所示。,第9章 网络信息检索概述, Z39.50的主要功能及其应用 Z39.50的主要目的在于定义基于客户机/服务器体系结构的数据库的查询与检索的语法,从而使一套存取标准适用于异构系统的数据。Z39.50定义的信息检索系统主要包括11种功能。,第9章 网络信息检索概述,Z39.50对国外(特别是美国等英语国家)信息系统的

11、发展和服务方式产生了重要影响,尤其在图书馆自动化领域中得到了广泛的应用。国内出现了不少自行开发的支持Z39.50图书馆集成系统同时,也引进了一些国外的大型图书馆管理集成系统。 例如,广东省立中山图书馆引进并汉化了Sirsi公司的Unicorn图书馆自动化集成系统,可以利用Z39.50公共查询网关。,第9章 网络信息检索概述,广东省立中山图书馆公共查询网关,第9章 网络信息检索概述, Z39.50标准的不足 作为一个开放系统互连的标准集,Z39.50的主要问题和实现的最大障碍是其定义的协议数据结构稍显简单;其次,Z39.50标准所采用的编码标准主要用于有线通信和无线通信领域。而软件

12、产品开发中很少涉及这样的“底层”开发,甚至无法看懂相关标准文献的含义;再者,Z39.50这个标准是建立在一种比较专门的通讯协议的基础上,增加了这个标准的实施中的技术复杂性。,第9章 网络信息检索概述,9.3.2 其他网络信息检索标准 实现信息源互联互操作的协议主要有两类。一类为重量级协议,如在图书馆界有较大影响的Z39.50协议,这些协议本身较复杂,往往要求在字段级实现互操作。一类为轻量级协议如OAI等,这些协议一般作为一些应用协议的基础。,第9章 网络信息检索概述,目前正在使用或处于研究探讨的网络信息检索标准还有一些,具体如下:,第9章 网络信息检索概述,网络信息检索的发展主要体现在:智能检

13、索技术、知识检索技术、多媒体检索技术、新一代搜索引擎技术、自然语言检索技术和基于内容的检索技术。网络信息检索服务呈现出个性化、多样化特点。,第9章 网络信息检索概述,9.4.1 网络信息检索技术发展,第9章 网络信息检索概述,9.4.2 网络信息检索服务发展,第9章 网络信息检索概述,9.4.3 网络信息检索标准发展 标准的网络语言、网络符号和网络输出显示方式,会使网络信息的传播更加方便、快捷,有利于被用户接受与利用,实现信息资源共享。 Z39.50网关 随着Internet的普及,Web浏览器已经对Z39.50标准的应用范围和应用方式产生了很大的影响,为Z39.50的应用提供

14、了另一个应用领域,即作为Web网关,为公众提供跨平台、跨服务器的虚拟目录检索服务。,第9章 网络信息检索概述,Z39.50网关的工作流程为: (1)用户的查询请求由浏览器通过HTTP发送给Web服务器。 (2)Web服务器通过HTTP-Z39.50转换网关把HTTP请求转换为Z39.50请求。 (3)客户进程将请求发送给本地或远程的Z39.50服务器,进而访问数据库得到查询结果。 (4)以规定的格式将检索结果传送到网关。HTTP-Z39.50协议转换网关收集由Z39.50服务器返回的查询结果,整合后统一以HTML页面的形式返回给用户浏览器。,第9章 网络信息检索概述,Z39.50-Web网关,第9章 网络信息检索概述, 新一代Z39.50 为了简化Z39.50,以欧美为主的一些Z39.50开发团体,对Z39.50-1995及以前的各个版本,去粗取精,并且做了大量的创新, 成果合称为SRW/U,是ZING的核心所在。SRW/U集成了Web和URL技术,对Z39.50作了很大的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论