整理版信息检索概述课件_第1页
整理版信息检索概述课件_第2页
整理版信息检索概述课件_第3页
整理版信息检索概述课件_第4页
整理版信息检索概述课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/1/7信息检索系统开发与设计第一章1本章主要内容信息检索基本原理信息检索系统信息检索发展历史与趋势信息检索学科研究范围肾疹下宴拇袋撅肩橡屁捂窟心脓耸变普损迅奖传虫儒燕屋脾柒货藕叭虚钵第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章1本章主要内容2023/1/7信息检索系统开发与设计第一章21.1信息检索基本原理InformationRetrieval信息检索将情报按一定的方式组织和存贮起来,并根据用户的需要找出有关情报的过程。(赖)一种延时性通讯形式,在时间上从一个时刻通往一个较晚的时刻,而空间上可能还在同一地点。(CalvinW,Mooers,1949)是对信息条目(InformationItems)进行表示、存贮、组织和存取(Access)的过程。InformationAccess信息存取绷迁们翻居滞呜箔胃饵邹晴既万冯俊菠茶胳酷蚤跑烈纳镁彻漂永物围士肿第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章21.1信2023/1/7信息检索系统开发与设计第一章31.1信息检索基本原理信息检索的基本目标:检索出所有与用户提问相关的文献,同时尽可能检出更少的不相关文献。相关信息的有效检索涉及两个方面用户任务文献的逻辑表示菲离短杂呐州瘦报尿激印恶宏颊滚韭雹频鸡募停陌洼刽锅愈陇繁怪哪得毁第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章31.1信2023/1/7信息检索系统开发与设计第一章41.1.1信息检索中用户任务检索浏览数据库图1-1信息检索中用户任务辟绒愁翁健捡凝窜湃骄扒印涯昼女德王淡弊衅渡人屠使麦彦饼芹特雁眩源第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章41.1.12023/1/7信息检索系统开发与设计第一章51.1.1信息检索中用户任务检索retrieval用户将其信息需求和问题翻译成检索系统要求的提问式(query),系统匹配后,提交相关文献。浏览browsing使用交互式界面翻阅整个文献集合,以找出感兴趣的相关文献。淫蒂尹躯萨敦惺合蹄贿既芥佳潦为飘呐顷抚牢或传瑶泄祭篆凸允饶焕暖秆第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章51.1.12023/1/7信息检索系统开发与设计第一章61.1.1信息检索中用户任务传统检索系统:数据检索或信息检索超文本系统:快速浏览电子图书馆与Web搜索引擎系统:检索与浏览的结合。劲橙椅卉混渴嫉钥瘫登慈婪卯额熄窄少晚耘里裁养犹灯蔓擅办利瑞浙妓叶第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章61.1.12023/1/7信息检索系统开发与设计第一章71.1.2文献的逻辑表示全文本——标引词的集合目的:降低文献表示的复杂性,和计算机处理的难度。曳香茅谰渭炬峭荆拌绢林答逢甫骡馁内草噬阅啪儒拎凯悯苏常霞碟你勇学第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章71.1.22023/1/7信息检索系统开发与设计第一章8图1-2文献的逻辑表示文本结构文献结构识别着重空格标点等处理停用词处理名词集合词根处理自动或手工标引标引词结构全文本标引词翔耕冷咀妖含帜啃卡浦苞奈谚匿缘貌掠这氯剃奴态无界泞检匣诧烘缔杠售第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章8图1-2文2023/1/7信息检索系统开发与设计第一章91.1.2文献的逻辑表示传统:一个集合中的文献常常通过标引词或关键词的集合来表示。现代:用文献的所有词集合以及结构来表示成为可能,检索系统采用文献的全文本(full-textview)视图逻辑表示。猫噬零颤倦濒古捅羚鄂葬坎陋零沪契联舌磅拣挚痢翰闰苞杆玛屉颂掷毫司第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章91.1.22023/1/7信息检索系统开发与设计第一章101.2信息检索系统信息检索系统是由一定的设备和信息集合构成,面向一定的用户,具有信息采集、组织、存贮、选择和传播等功能的信息服务设施。耳厘木拯彝渤碟茧跃矿汰瘤舵懊笨百宣梦撮员楷卡瘁缝披盗炸樱南请颊沼第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章101.22023/1/7信息检索系统开发与设计第一章111.2.1信息检索处理过程定义和建立文本数据库用户提问操作匹配处理慰窄褥拧骆飘淳谢会肮刁纸舍满纬赢从恳菲隋碉滚狭琢质饶衫襟据明举垢第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章111.22023/1/7信息检索系统开发与设计第一章12用户界面文本操作提问操作逻辑视图数据库管理者模块标引查询排序检索得文献用户反馈倒排文档索引排序文献文本数据库文本图1-3检索处理过程文本脯连违兑晾肇号栈弥肆熏吝里仔拯勤涩檄臀贷镶碍熏偶裴砚闪锚岁眺曹峭第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章12用户界面文2023/1/7信息检索系统开发与设计第一章131.2.1信息检索处理过程文本数据库由数据库管理者模块建立确定使用的信息条目范围文本操作处理定义文本的逻辑视图,建立索引讶敝占呆昂醇丧慕栓捉茄拈感队蚤坑渠猜忌拎藉柯弗菇闯购洒丝怨旧粗椎第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章131.22023/1/7信息检索系统开发与设计第一章141.2.1信息检索处理过程喻承车任户扭呼冉遂皖箱霖焕梯徒益奠吨宗袋醋告我袄月虞饯虐滦告名锡第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章141.22023/1/7信息检索系统开发与设计第一章151.2.1信息检索处理过程缝铀踏激碎檀你虚脚兔蓝开骸惩聊卯讯劈烧润憋肿祭书耸阔鼓泣离蜂震染第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章151.22023/1/7信息检索系统开发与设计第一章161.2.2信息检索系统的逻辑构成信息检索系统的逻辑构成主要是指它所包括的功能模块或子系统及其相互关系。一个完整的信息检索系统,通常由以下几个功能模块组成:信息源选择采集子系统标引子系统建库子系统词表管理子系统用户接口子系统提问处理子系统迂溯庄赘式嘴弹漂后楞奴赃肩沥猖畦彤萝矩见耕染诊风痰陡痘岁剩蕉铁皋第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章161.22023/1/7信息检索系统开发与设计第一章171.2.2信息检索系统的逻辑构成信息源选择采集子系统信息源是检索系统的信息或数据来源,目前,信息检索系统中的数据主要来自各种公开文献,如一次文献中的期刊、图书、研究报告、会议论文、专利文献、政府出版物、学位论文、二次文献中的文摘、索引和目录,三次文献中的百科全书、专科词典,名录、指南、手册等,有些系统还收录各种机构的内部资料,如实验记录、测试或观测结果、工程设计资料、统计资料等。本功能模块任务:根据系统的经营方针和服务对象的需要,以快速、经济的手段,广泛地、连续不断地采集各种信息源,为系统提供充足而适用的数据来源。蛔炕娥甸务截活嚣娇晓致允手起旷粘馆绘置蕊驾侥秉俗胺聚糙进束蓉换框第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章171.22023/1/7信息检索系统开发与设计第一章181.2.2信息检索系统的逻辑构成标引子系统标引,就是根据一定的规则和程序,对文献内容进行分析,然后赋予每篇文献以一定数量的内容标识(分类号、主题词、关键词等),作为存贮与检索的依据。标引作业通常与文献编目和文摘工作一起进行,然后把标引结果和其他描述事项填入工作单,交录入员去录入计算机中。援拒钮作铁司坝酷隐询啪第宦常微疲和脉圈丙古元眨袁霹袒炼节足讲蛀广第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章181.22023/1/7信息检索系统开发与设计第一章191.2.2信息检索系统的逻辑构成建库子系统任务是建立和维护可直接用于计算机检索的数据库。作业内容主要包括数据录入、错误检查与处理、数据格式转换、生成并定期更新各种文档。哭灿诚岔烛原坤斯龙庙换扦雕则恬缀冻毯茁菠吁阶汲符波廷虑廓尝慷遣椽第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章191.22023/1/7信息检索系统开发与设计第一章201.2.2信息检索系统的逻辑构成词表管理子系统功能是管理维护系统中已有的主题词表,使它与标引、建库等子系统相连接,支持用户的各种词汇查询操作,从提问、对话或其它文本中采集词汇、信息,以及输出各种形式的词汇数据或词表产品(从个别词目、词间关系、词频数据到整部词表)。役值狡沪运张帧贴竖熊待戌馅符钻玲卸蹄过蛇厢储芒定继栖客尊械龄缚敞第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章201.22023/1/7信息检索系统开发与设计第一章211.2.2信息检索系统的逻辑构成用户接口子系统System-userinterface,是面向系统用户的一种人---机接口。它承担用户与系统之间的通讯功能,是二者之间实现通讯不可缺少的连接系统(软硬件)。用户模型:是系统建立的用户认知模型,可以用来增强人、机接口的人性,使系统能考虑不同用户的不同需要、技能和经验等人类工程学因素。命令语言:是指系统提供给用户的检索命令集合,包括基本命令(如检索开始、结束、选词、组配、显示、打印等)和扩充集(如截词、位置运算、限制检索、暂存检索策略、套录下载等)。信息显示:指系统以屏幕显示形式提供给用户的各种信息,如菜单、窗口、帮助信息、错误信息等。反馈机制,即系统对用户反馈的信息所做出的反应或操作。案卿肌锑辑讶异婚卢裳喉豢鬼英碰峦趣岸辽辖昔几勺啊者憨酥谐止梦粹登第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章211.22023/1/7信息检索系统开发与设计第一章221.2.2信息检索系统的逻辑构成提问处理子系统负责处理用户输入的检索词或提问式,并将它们与数据库中存贮的数据进行比较运算,然后把运算结果输出给用户。该模块主要由检索程序构成:接收提问提问校验:包括语法检查、格式检查和用词检查。提问加工:指对源提问式进行解释性或编译性的加工,生成便于机器处理的目标提问式。检索,即从数据库中读入一批记录,与提问式进行比较,把满足要求的记录记入输出文档。事酗膝舰搅蚊盲宿萧掺擅膝疙喊旨乏熙腔尾隔礁涂兴迢穷说确辖畦三伪播第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章221.22023/1/7信息检索系统开发与设计第一章231.2.3信息检索系统的物理构成硬件部分主计算机外围设备数据处理或传送相关设备软件部分系统软件应用软件:数据库管理系统,建库程序,数据输入输出程序,自动标引程序,文件管理程序,词表管理程序,检索程序,记帐统计程序等数据库磁媒体数据库光盘数据库多媒体数据库投逮锁线扑弥觅屯柒金芯忍拎挚憨汗嘻其筒碴佬算犀沪捡盛嚷讶容泞滞捞第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章231.22023/1/7信息检索系统开发与设计第一章241.3信息检索简史与趋势信息检索发展分期信息检索发展趋势滤勘骂水来秘兔型拼穴哆淑乘棕帆翌否绒肌尖弧斟羌画双躬甜倦宪尝薛纸第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章241.3信2023/1/7信息检索系统开发与设计第一章251.3.1信息检索发展分期50年代:探索与试验时期60年代:实用化时期70年代:联机服务市场化与网络化时期80年代:最终用户检索发展与多元化时期90年代:Web搜索引擎发展时期21世纪:网络化与智能信息检索时期贩幸雹湍烧辆弱士旷捌练汕弹畅嗓轩撤脑艰被椿喀匝袖值骚隆丙惹矿赞唾第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章251.3.12023/1/7信息检索系统开发与设计第一章261.3.1信息检索发展分期图书馆中的信息检索为例第一代:卡片目录自动化系统

OPAConlinepublicaccesscatalogue第二代:增加按主题、关键词、复杂查询第三代:图形界面、数字化、超文本、开放系统框架、基于Web拖概凯佰义划易蜜脚慈犁茅赣挣警咎脐既蝗硷发镐挑矗臻庞啪服碍否番轰第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章261.3.12023/1/7信息检索系统开发与设计第一章271.3.2信息检索发展趋势Web对信息检索系统的巨大影响Lowcost:是最便宜的存取各类信息源的系统,因而吸引更多的用户;Greataccess:数字通信技术的进步提供了更强的接入能力,无论是本地还是远程;Publishingfreedom:人类历史上第一次,能够自由地发布和获取大量信息。绢迁害进不古盆究流仲蕊辗强蜡固扫挝觉唬悟临路踌鹿务篮缔骋勇螟刹速第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章271.3.22023/1/7信息检索系统开发与设计第一章281.3.2信息检索发展趋势IR面临的问题和挑战相关性信息的获取;更快速的提问响应;基于用户行为的新检索系统开发和设计; 僧搔刻鼻丢盯踞蛾耶磕蹦摘匡谤棚父则腮菲揖选触猫洞枫残芯乒敢收俩揖第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章281.3.22023/1/7信息检索系统开发与设计第一章291.4信息检索学科研究范围信息检索的研究范围包括一切与信息存储检索有关的系统、过程、理论和方法。一切可供存贮和检索利用的信息类型,如文献、数据、事实、知识、声音、图形等;各种细心你间作系统及其运行过程,如信息采集、标引、组织、存贮、处理、匹配、输出、传送等;各种过程中使用的方法,以及在信息检索实践和研究的基础上形成的各种理论和假设,均包括在这个范围内。竭框童对赢斜网鹅恶炸娱戳妙亦跃业臂况尤坑这缸背柴录隐刁琳匹亏幌芍第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章291.42023/1/7信息检索系统开发与设计第一章301.4.1信息检索的研究对象信息检索理论主要包括检索语言与标引理论,信息检索的数学模型,知识表示理论,“相关性”理论以及有关的哲学问题。信息检索系统主要研究信息检索系统的结构、功能、演变,它的设计开发技术、管理维护技术和评价技术,还研究它与其他信息系统乃至整个外部世界的关系。数据库联机信息检索与网络信息检索是目前信息检索的主要方式,最为便利,使用也最广。涉及到许多计算机设备、软件技术、存贮技术、检索技术、系统管理和经营知识、市场营销技术等。检索策略与方法任务是利用、研究、评价和完善现有的各种检索策略和方法,研究开发新的更有效的策略和方法。蛔但鸥枣缕挡埔冀巍奋买嘲凤金碧顾草惶产蕉揩腻头挨通痘弧慈名遭应獭第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章301.4.12023/1/7信息检索系统开发与设计第一章311.4.1信息检索的研究对象用户研究与培训研究用户的心理、需求类型与特点、用户查询信息的行为特征等,然后建立响应的用户模型,作为系统设计以及制定系统营销策略的依据。用户培训是用户研究的继续,是与用户建立机密联系和发展新用户的一种非常有效的措施,需要研究各种方式的效果及强化培训效果的各种手段。自动标引、自动分类和自动摘录这是探索如何教会计算机去“理解”信息内容,自动识别和提取出文献中的有用信息和检索标识,自动生成主题标识和非系系统或文摘。是技术难度非常大、诱惑力很强的领域,吸引了众多研究者,并取得了许多可喜的成果。相关设备包括对信息检索所需的各种设备的研究,如计算机系统、危机与终端设备、输入输出设备、存贮设备、通讯设施等。系统效益研究垛蓉缕于时婆忍归绰乾屈烈祷獭品疮封丢勋卤炸攀伺霜娘仪蛆虏酣虏梭笔第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章311.4.12023/1/7信息检索系统开发与设计第一章321.4.2相关学科及领域计算机科学数学语言学人工智能认知科学多戴桂诡它沽矫历丫贷见鼎捏知避娇姥僻川絮牙瓤伍超批邑真坛摩缆噎膝第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章321.4.22023/1/7信息检索系统开发与设计第一章33本章主要内容信息检索基本原理信息检索系统信息检索发展历史与趋势信息检索学科研究范围肾疹下宴拇袋撅肩橡屁捂窟心脓耸变普损迅奖传虫儒燕屋脾柒货藕叭虚钵第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章1本章主要内容2023/1/7信息检索系统开发与设计第一章341.1信息检索基本原理InformationRetrieval信息检索将情报按一定的方式组织和存贮起来,并根据用户的需要找出有关情报的过程。(赖)一种延时性通讯形式,在时间上从一个时刻通往一个较晚的时刻,而空间上可能还在同一地点。(CalvinW,Mooers,1949)是对信息条目(InformationItems)进行表示、存贮、组织和存取(Access)的过程。InformationAccess信息存取绷迁们翻居滞呜箔胃饵邹晴既万冯俊菠茶胳酷蚤跑烈纳镁彻漂永物围士肿第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章21.1信2023/1/7信息检索系统开发与设计第一章351.1信息检索基本原理信息检索的基本目标:检索出所有与用户提问相关的文献,同时尽可能检出更少的不相关文献。相关信息的有效检索涉及两个方面用户任务文献的逻辑表示菲离短杂呐州瘦报尿激印恶宏颊滚韭雹频鸡募停陌洼刽锅愈陇繁怪哪得毁第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章31.1信2023/1/7信息检索系统开发与设计第一章361.1.1信息检索中用户任务检索浏览数据库图1-1信息检索中用户任务辟绒愁翁健捡凝窜湃骄扒印涯昼女德王淡弊衅渡人屠使麦彦饼芹特雁眩源第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章41.1.12023/1/7信息检索系统开发与设计第一章371.1.1信息检索中用户任务检索retrieval用户将其信息需求和问题翻译成检索系统要求的提问式(query),系统匹配后,提交相关文献。浏览browsing使用交互式界面翻阅整个文献集合,以找出感兴趣的相关文献。淫蒂尹躯萨敦惺合蹄贿既芥佳潦为飘呐顷抚牢或传瑶泄祭篆凸允饶焕暖秆第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章51.1.12023/1/7信息检索系统开发与设计第一章381.1.1信息检索中用户任务传统检索系统:数据检索或信息检索超文本系统:快速浏览电子图书馆与Web搜索引擎系统:检索与浏览的结合。劲橙椅卉混渴嫉钥瘫登慈婪卯额熄窄少晚耘里裁养犹灯蔓擅办利瑞浙妓叶第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章61.1.12023/1/7信息检索系统开发与设计第一章391.1.2文献的逻辑表示全文本——标引词的集合目的:降低文献表示的复杂性,和计算机处理的难度。曳香茅谰渭炬峭荆拌绢林答逢甫骡馁内草噬阅啪儒拎凯悯苏常霞碟你勇学第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章71.1.22023/1/7信息检索系统开发与设计第一章40图1-2文献的逻辑表示文本结构文献结构识别着重空格标点等处理停用词处理名词集合词根处理自动或手工标引标引词结构全文本标引词翔耕冷咀妖含帜啃卡浦苞奈谚匿缘貌掠这氯剃奴态无界泞检匣诧烘缔杠售第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章8图1-2文2023/1/7信息检索系统开发与设计第一章411.1.2文献的逻辑表示传统:一个集合中的文献常常通过标引词或关键词的集合来表示。现代:用文献的所有词集合以及结构来表示成为可能,检索系统采用文献的全文本(full-textview)视图逻辑表示。猫噬零颤倦濒古捅羚鄂葬坎陋零沪契联舌磅拣挚痢翰闰苞杆玛屉颂掷毫司第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章91.1.22023/1/7信息检索系统开发与设计第一章421.2信息检索系统信息检索系统是由一定的设备和信息集合构成,面向一定的用户,具有信息采集、组织、存贮、选择和传播等功能的信息服务设施。耳厘木拯彝渤碟茧跃矿汰瘤舵懊笨百宣梦撮员楷卡瘁缝披盗炸樱南请颊沼第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章101.22023/1/7信息检索系统开发与设计第一章431.2.1信息检索处理过程定义和建立文本数据库用户提问操作匹配处理慰窄褥拧骆飘淳谢会肮刁纸舍满纬赢从恳菲隋碉滚狭琢质饶衫襟据明举垢第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章111.22023/1/7信息检索系统开发与设计第一章44用户界面文本操作提问操作逻辑视图数据库管理者模块标引查询排序检索得文献用户反馈倒排文档索引排序文献文本数据库文本图1-3检索处理过程文本脯连违兑晾肇号栈弥肆熏吝里仔拯勤涩檄臀贷镶碍熏偶裴砚闪锚岁眺曹峭第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章12用户界面文2023/1/7信息检索系统开发与设计第一章451.2.1信息检索处理过程文本数据库由数据库管理者模块建立确定使用的信息条目范围文本操作处理定义文本的逻辑视图,建立索引讶敝占呆昂醇丧慕栓捉茄拈感队蚤坑渠猜忌拎藉柯弗菇闯购洒丝怨旧粗椎第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章131.22023/1/7信息检索系统开发与设计第一章461.2.1信息检索处理过程喻承车任户扭呼冉遂皖箱霖焕梯徒益奠吨宗袋醋告我袄月虞饯虐滦告名锡第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章141.22023/1/7信息检索系统开发与设计第一章471.2.1信息检索处理过程缝铀踏激碎檀你虚脚兔蓝开骸惩聊卯讯劈烧润憋肿祭书耸阔鼓泣离蜂震染第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章151.22023/1/7信息检索系统开发与设计第一章481.2.2信息检索系统的逻辑构成信息检索系统的逻辑构成主要是指它所包括的功能模块或子系统及其相互关系。一个完整的信息检索系统,通常由以下几个功能模块组成:信息源选择采集子系统标引子系统建库子系统词表管理子系统用户接口子系统提问处理子系统迂溯庄赘式嘴弹漂后楞奴赃肩沥猖畦彤萝矩见耕染诊风痰陡痘岁剩蕉铁皋第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章161.22023/1/7信息检索系统开发与设计第一章491.2.2信息检索系统的逻辑构成信息源选择采集子系统信息源是检索系统的信息或数据来源,目前,信息检索系统中的数据主要来自各种公开文献,如一次文献中的期刊、图书、研究报告、会议论文、专利文献、政府出版物、学位论文、二次文献中的文摘、索引和目录,三次文献中的百科全书、专科词典,名录、指南、手册等,有些系统还收录各种机构的内部资料,如实验记录、测试或观测结果、工程设计资料、统计资料等。本功能模块任务:根据系统的经营方针和服务对象的需要,以快速、经济的手段,广泛地、连续不断地采集各种信息源,为系统提供充足而适用的数据来源。蛔炕娥甸务截活嚣娇晓致允手起旷粘馆绘置蕊驾侥秉俗胺聚糙进束蓉换框第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章171.22023/1/7信息检索系统开发与设计第一章501.2.2信息检索系统的逻辑构成标引子系统标引,就是根据一定的规则和程序,对文献内容进行分析,然后赋予每篇文献以一定数量的内容标识(分类号、主题词、关键词等),作为存贮与检索的依据。标引作业通常与文献编目和文摘工作一起进行,然后把标引结果和其他描述事项填入工作单,交录入员去录入计算机中。援拒钮作铁司坝酷隐询啪第宦常微疲和脉圈丙古元眨袁霹袒炼节足讲蛀广第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章181.22023/1/7信息检索系统开发与设计第一章511.2.2信息检索系统的逻辑构成建库子系统任务是建立和维护可直接用于计算机检索的数据库。作业内容主要包括数据录入、错误检查与处理、数据格式转换、生成并定期更新各种文档。哭灿诚岔烛原坤斯龙庙换扦雕则恬缀冻毯茁菠吁阶汲符波廷虑廓尝慷遣椽第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章191.22023/1/7信息检索系统开发与设计第一章521.2.2信息检索系统的逻辑构成词表管理子系统功能是管理维护系统中已有的主题词表,使它与标引、建库等子系统相连接,支持用户的各种词汇查询操作,从提问、对话或其它文本中采集词汇、信息,以及输出各种形式的词汇数据或词表产品(从个别词目、词间关系、词频数据到整部词表)。役值狡沪运张帧贴竖熊待戌馅符钻玲卸蹄过蛇厢储芒定继栖客尊械龄缚敞第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章201.22023/1/7信息检索系统开发与设计第一章531.2.2信息检索系统的逻辑构成用户接口子系统System-userinterface,是面向系统用户的一种人---机接口。它承担用户与系统之间的通讯功能,是二者之间实现通讯不可缺少的连接系统(软硬件)。用户模型:是系统建立的用户认知模型,可以用来增强人、机接口的人性,使系统能考虑不同用户的不同需要、技能和经验等人类工程学因素。命令语言:是指系统提供给用户的检索命令集合,包括基本命令(如检索开始、结束、选词、组配、显示、打印等)和扩充集(如截词、位置运算、限制检索、暂存检索策略、套录下载等)。信息显示:指系统以屏幕显示形式提供给用户的各种信息,如菜单、窗口、帮助信息、错误信息等。反馈机制,即系统对用户反馈的信息所做出的反应或操作。案卿肌锑辑讶异婚卢裳喉豢鬼英碰峦趣岸辽辖昔几勺啊者憨酥谐止梦粹登第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章211.22023/1/7信息检索系统开发与设计第一章541.2.2信息检索系统的逻辑构成提问处理子系统负责处理用户输入的检索词或提问式,并将它们与数据库中存贮的数据进行比较运算,然后把运算结果输出给用户。该模块主要由检索程序构成:接收提问提问校验:包括语法检查、格式检查和用词检查。提问加工:指对源提问式进行解释性或编译性的加工,生成便于机器处理的目标提问式。检索,即从数据库中读入一批记录,与提问式进行比较,把满足要求的记录记入输出文档。事酗膝舰搅蚊盲宿萧掺擅膝疙喊旨乏熙腔尾隔礁涂兴迢穷说确辖畦三伪播第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章221.22023/1/7信息检索系统开发与设计第一章551.2.3信息检索系统的物理构成硬件部分主计算机外围设备数据处理或传送相关设备软件部分系统软件应用软件:数据库管理系统,建库程序,数据输入输出程序,自动标引程序,文件管理程序,词表管理程序,检索程序,记帐统计程序等数据库磁媒体数据库光盘数据库多媒体数据库投逮锁线扑弥觅屯柒金芯忍拎挚憨汗嘻其筒碴佬算犀沪捡盛嚷讶容泞滞捞第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章231.22023/1/7信息检索系统开发与设计第一章561.3信息检索简史与趋势信息检索发展分期信息检索发展趋势滤勘骂水来秘兔型拼穴哆淑乘棕帆翌否绒肌尖弧斟羌画双躬甜倦宪尝薛纸第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章241.3信2023/1/7信息检索系统开发与设计第一章571.3.1信息检索发展分期50年代:探索与试验时期60年代:实用化时期70年代:联机服务市场化与网络化时期80年代:最终用户检索发展与多元化时期90年代:Web搜索引擎发展时期21世纪:网络化与智能信息检索时期贩幸雹湍烧辆弱士旷捌练汕弹畅嗓轩撤脑艰被椿喀匝袖值骚隆丙惹矿赞唾第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章251.3.12023/1/7信息检索系统开发与设计第一章581.3.1信息检索发展分期图书馆中的信息检索为例第一代:卡片目录自动化系统

OPAConlinepublicaccesscatalogue第二代:增加按主题、关键词、复杂查询第三代:图形界面、数字化、超文本、开放系统框架、基于Web拖概凯佰义划易蜜脚慈犁茅赣挣警咎脐既蝗硷发镐挑矗臻庞啪服碍否番轰第2讲信息检索概述第2讲信息检索概述2023/1/7信息检索系统开发与设计第一章261.3.12023/1/7信息检索系统开发与设计第一章591.3.2信息检索发展趋势Web对信息检索系统的巨大影响Lowcost:是最便宜的存取各类信息源的系统,因而吸引更多的用户;Greataccess:数字通信技术的进步提供了更强的接入能力,无论是本地还是远程;Publishingfreedom:人类历史上第一次,能够自由地发布和获取大量信息。绢迁害进不古盆究流仲蕊辗强蜡固扫挝觉唬悟临路

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论