第五组 第七章《信息检索》_第1页
第五组 第七章《信息检索》_第2页
第五组 第七章《信息检索》_第3页
第五组 第七章《信息检索》_第4页
第五组 第七章《信息检索》_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息检索 原理与技术指导老师:王观玉小组成员:吴金平(组长)、杨烁、杨彩云、马明月、李广建、田洪武、黄再军、何锐 主讲:何锐学号:11080451331、简述联机检索系统与网络检索系统的区别?联机检索系统与网络检索系统区别类 型作业对象检索功能与技术系统特点 网络检索网络数据库 方法较简单,功能较强,入口较多,易用范围较广,更新快,检索速度较快,可获原文,费用 较高联机检索 联机数据库 方法复杂,功能强大,入口多,不易掌握范围广,更新及时,检索速度快,可获原文,费用高2、用图示说明信息检索系统的逻辑结构单机光盘联机网络逻辑结构(1) 信息选择与采集子系统(2) 信息标引子系统(3) 建库子系统

2、(4) 知识组织与词表管理子系统(5) 用户接口子系统(6) 提问处理与检索子系统用户接口子系统信息标引子系统提问处理与检索子系统知识组织与词表管理子系统 建 库 子 系 统 数据库信息源信息选择与采集子系统索引库用户检索结果新创或更新索引库或数据库信息检索系统的逻辑结构3、WEB信息资源的采集主要采用哪些方法和技术?待采页面选择分析 1.广度优先 2.深度优先 3.PageRank相关度计算方法 1.基于图形结构的相关度计算 2.基于页面链接标记的相关度计算 3.基于页面内容的相关度计算页面搜索算法 1.Fish搜索算法 2.Shark搜索算法4、什么是PageRank技术?它的作用是什么?

3、PageRank, 又称网页级别、Google左侧排名或佩奇排名, 是Google的创始人之一Larry Page于1998年提出PageRank,并应用在Google搜索引擎的检索结果排序上,该技术也是Google早期的核心技术之一是一种在搜索引擎中根据网页之间相互的链接关系计算网页排名的技术,是Google专有的算法。 作用Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。 PageRank 是基于从许多优质的网页链接过来的网页,必定还是优质网页的回归关系,是Google用来标识网页的等级或重要性的一种方法。是Google用来衡量一个网

4、站的好坏的唯一标准。其级别从1到10级,PR值越高说明该网页越受欢迎(越重要)。5、用图示的方法说明常见的网络存储技术有哪些?目前的网络存储技术有SAN、NAS和iSCSI。 SAN NAS iSCSISAN主要是基于光纤通道的、面向数据块的存储,可以看成是传统总线的扩展。NAS是在TCP/IP协议基础上提供文件的存取服务。iSCSI则是前面两种技术在TCP/IP网络上的融合,通过把面向数据块的SCSI协议封装在TCP/IP包中,以便在TCP/IP网络上传送DAS以文件服务器为中心,将将存储设备通过SCSI接口或光纤通道直接连接到应用服务器上使用,用户通过文件服务器间接访问存储设备上的数据。N

5、ASDAS、NAS、SAN与ISCSI的性能特点比较6、主题地图组织法。主题地图(TopicMaps)是一种类似语义网的知识表示模式,结合了传统索引、图书馆学与人工智慧等领域的优点,提供资源定址与连接的功能,可以有效的组织知识以利于探索、推理,解决大量无序信息所引来的问题。 7、提问处理与检索匹配的主要功能功能 : 负责接受并处理用户输入的检索词或检索表达式,将它们与信息存储的检索标识进行匹配运算,然后将检索结果返回给用户。 提问处理和检索匹配的主要操作流程可以描述如下: 接受用户提问。 提问校验,包括对用户输入的检索表达式进行语法、格式、 用词等方面的检查。 提问加工,对经过校验的合法、有效

6、的用户初始提问进行解 释性或编译性的变换与加工,生成便于机器处理的目标检索表达式。 检索匹配,即将目标检索表达式与数据库索引文档的记录进行匹配, 把满足匹配要求的数据库记录输出到结果文档中,或直接显示在检索 屏幕上。8、什么是语义检索?用图示简述基于语义网的语义检索原理。语义检索:是指检索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合其需求的检索结果。语义网是一种智能网络,它不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以使交流变得更有效率和价值。 领域专家信息资源RDF、RDF Schema、OWL等语义描述语言本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论