传统信息检索系统的系统结构_第1页
传统信息检索系统的系统结构_第2页
传统信息检索系统的系统结构_第3页
传统信息检索系统的系统结构_第4页
传统信息检索系统的系统结构_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

传统信息检索系统的系统结构F.W.Lancaster兰开斯特基于联机检索系统六个模块或子系统资源采集与选择子系统词表子系统标引子系统系统与用户接口子系统查询子系统匹配子系统传统信息检索系统的系统结构全文共11页,当前为第1页。计算机信息检索系统资源采集与选择子系统查寻子系统词表子系统标引子系统匹配子系统系统-用户接口子系统数据库因素数据库开发因素传统信息检索系统的系统结构全文共11页,当前为第2页。(1)资源采集和选择子系统原始信息数据源的选择和采集第一层次:单篇文献第二层次:百科全书、大全、年鉴、手册等高次文献第三层次:书目、索引、文摘等二次文献资源采集和选择子系统:系统的类型:书目的、数据的、全文的系统的收录范围:学科专业覆盖面、摘贮率、时差传统信息检索系统的系统结构全文共11页,当前为第3页。(2)词表子系统主要功能:建立和维护一个词表体系,使它与有关的子系统相连接,支持标引人员和用户的各种词汇操作,是系统的语言保证词表子系统决定:系统揭示文献和数据的可控性系统根据有无词表子系统分为:控制词汇的检索系统非控制词汇的检索系统完全的自然语言检索系统(标引无控+检索无控)后控制的自然语言检索系统(标引无控+检索控制)传统信息检索系统的系统结构全文共11页,当前为第4页。(3)标引子系统标引是按照一定的词表,对文献内容进行分析,然后赋予每篇文献一数量的表征文献特征的标识的过程标引:形成文档的逻辑视图检索任务逻辑视图原始文档标引传统信息检索系统的系统结构全文共11页,当前为第5页。标引指标:标引深度标引专指度标引一致性标引种类概念标引和符号标引人工标引和自动标引*自动标引:通过计算机对文档中词出现的频率、出现的位置、提问频率等进行统计和加权,提取标引词。标引传统信息检索系统的系统结构全文共11页,当前为第6页。标引子系统决定标引深度和检索点标引的一致性和实际的检全能力标引的贴切性和实际的检准能力传统信息检索系统的系统结构全文共11页,当前为第7页。(4)系统与用户接口子系统检索系统面向用户的、提供用户实现其检索过程的手段包括:用户模型、信息提示、检索指令和交互反馈机制等决定:系统的易用性和友好程度传统信息检索系统的系统结构全文共11页,当前为第8页。(5)查询子系统构造检索式:将用户的需求经过概念分析转换成系统所用检索语言的词汇,同时指出这些词汇之间的逻辑关系(即构造检索策略的过程)信息检索提问表达的方法布尔逻辑非布尔逻辑(加权、位置、法定数检索)传统信息检索系统的系统结构全文共11页,当前为第9页。(6)匹配子系统检索执行模块接受提问提问校验(语法检索、格式检索、用词检查)提问加工检索词与标引词匹配比较检索匹配算法由系统所采用的信息检索模型决定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论