信息检索:第三章 信息检索实践基础_第1页
信息检索:第三章 信息检索实践基础_第2页
信息检索:第三章 信息检索实践基础_第3页
信息检索:第三章 信息检索实践基础_第4页
信息检索:第三章 信息检索实践基础_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 信息存储与检索实践基础,第一节 信息存储过程 第二节 信息检索的类型 第三节 信息检索的策略与方法 第四节 信息检索效果的评价 第五节 信息检索技术 第六节 科技查新工作,第一节 信息存储环节,一、信息的搜集与选择(以CNKI为例) 二、信息的著录加工 三、信息的标引加工 四、信息的结构编排,一、信息的搜集与选择,1、确定收集的原则 收集的学科范围(如 机械、物理、化学) 主题范围(如机床、刀具) 覆盖面 信息种类 语种 时间跨度 收集的数量 摘储率 2、收集的途径 3、选择所需信息,二、信息的著录加工,1、著录目的 目的是把一篇文献变成一条著录,能体现该文献的外表特征和内容特征。 外

2、部特征指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名、人名、各种符号标识(专利号、标准号、文献号)、机构名等。 内容特征指表征文献实质意义的特征,如主题词(叙词、单元词、关键词)、分类号、化学符号等。,2、著录内容 外表特征:篇名、作者、工作单位、号码、文种 出处:发表的刊物名称、刊号、卷期、页数 内容特征:摘要 3、著录格式,图书,馆 藏 号:4418391 文摘类型:R ISBN号:92-828-556-S 语种:Ger 中图类号:TD94 文献题名:NMRSpekeropie zur stofflichen Charakter is ierung von Braunk

3、ohlen bei der hydrierenden Veredlung 作者:Michel,D 团体作者:European Commission 国别:BE 缩称:CEC 出版日期:1999 页:164S,Libraries-UniversityofOxford,Title:Chineseculture Further information:Mary Colson. Author:Colson, Mary. Publisher Details:London : Raintree Publication Date:2013 Format:48 p. : ill. (chiefly col.)

4、, col. map, ports. (some col.) ; 25 cm. Language:English Identifier:ISBN: 9781406241730 (hbk.) : ;ISBN: 1406241733 (hbk.) : Subjects:China - Civilization - Juvenile literature;China - Social life and customs - Juvenile literature Related Titles:Series: Global cultures Aleph System Number:019475547 T

5、ype:Book Miscellaneous Notes:General Note:Formerly CIP.Bibliography Note:Includes bibliographical references, filmography and index.Target Audience Note:Key Stage 2. Link to this record:http:/solo.bodleian.ox.ac.uk/primo_library/libweb/action/dlDisplay.do?vid=OXVU1&docId=oxfaleph019475547,期刊,记录标识:98

6、07001 记录来源:JX 文献类型:刊 文献题名:机械零件组成编码频率分析及设计规范化通用标准化 作者:鲍子强 作者单位:长沙重型机器厂 母体文献:矿山机械 卷期页码:1997,No.12,p.3942 出版单位:洛阳矿山机械研究所 分 类 号:97*TD-3*12 主 题 词:标准化,成组技术,机械零件,设计 文摘:(略),专利,发明名称:蓖麻脱皮筛选机 范畴:B07B 1/20 范畴分类:27F 33A 13A 国别: 省市:12 申 请 人:刘国喜 通讯地址:(300011)天津市河西区三水南里126幢 发 明 人:刘国喜 代 理 人:闫俊芬 代理机构:12100 天津市专利事务所专利

7、代理服务部 代理机构地址:(300051)天津市和平区成都道116号 法律状态:授权 说明书页数:003 附图页数:02 权 项 数:003 文摘:(略),会议文献,论文题名:从更宽阔的视野观察与思考冶金反应工程学问题 作者:曲英:北京科技大学,李士琦:北京科技大学 会议名称:第七届全国冶金反应工程学术会议 会议届次:7 会议时间:19980515 会议地点:沈阳 会议主办者:东北大学 母体文献:东北大学学报(自然科学版)(第19卷增刊) 出 版 地:沈阳 出版单位:东北大学学报编辑部 出版时间:19980500 页码:13 馆 藏 号:H043339 分 类 号:TF01,N94 关 键 词

8、:反映工程,冶金,系统工程,可持续发展 文摘:(略),标准文献,标 准 号:GB/T 1990.2-98 发布日期:1998-11-13 标准状态:ST 实施日期:1999-05-01 起草单位:中国标准化与信息分类编码研究所 标准名称:质量管理和质量保证标准 第2部分:GB/T 19001、 GB/T 19002和 GB/T 19003实施通用指南 正文语种:汉语 英文名称:Quality management and quality assurance standards-part 2:Generic guidelines for the application of GB/T 19001

9、、 GB/T 19002 and GB/T 19003 稽 核 项:0 中国标准分类号:A00,标准文献(续),采用关系:ISO 9000-2-97.IDT 主 题 词:质量管理,质量保证,质量 英文主题词:QUALITY ASSURANCEQUALITY MANAGEMENTQUALITY 国别:中国 申 请 号:98249276 公 告 号: 申 请 日:19981209 公 告 日: 审定公告日:19991110 授 权 日: 授权公告日:19991110,学位论文,论文题目:自控式同步电机机端电压位置监测器数字控制 作者:刘波 授予学位:硕士 导师姓名:李永东 授予学位单位:清华大学

10、分类号:TM762.3 馆 藏 号:Y248534 论文页数:97 出版时间:1999.3 主 题 词:自控式同步电机机端电压位置监测器数字控制 文摘:(略),科技报告,TITLE:Human factors in aviation maintenance,phase 4 Document ID:19950021275 N (95N27696) File Series:NASA Technical Reports Report Number:DOT/FAA/AM-95/14 Sales Agency&Price:CASI Hardcopy A09 CASI Microfiche A02 Aut

11、hors:Shepherd,William T.(Federal Aviation Administration) Published:May 01,1995 Corporate Source:Federal Aviation Administration(Washington,DC,United States) Galaxy Scientific Corp.(Atlanta,GA,United states) Pages:176 Contract Number:DTFA01-94-C-01013 NASA Subject Category:MAN/SYSTEM TECHNOLOGY AND

12、LIFE SUPPORT,三、信息的标引加工,1、定义 把文献的主要内容用非常简明的标识(即标志)表示出来。 标识可以是号码(分类号),也可以是科技名词或词组(主题词),也可以是其它的。,2、作用 1)相同内容的文献集中在一起,不同内容的区分开来 2)形成有序的序列,即按一定规律排列,把存储进检索工具的著录按照一定的规律排列起来,形成有序的排检系统,这样可以提供检索途径。,3、 标引加工的类型 分类法标引 用分类号作为标识 主题法标引 用代表文献主题内容的实质性的词汇作为标识,四、信息的结构编排,一般有三种排列方式 1、一条著录给一个顺序编码,号码是唯一的,按号码顺序排列。 号码可以表示存储地

13、址,但通过号码文献的逻辑内容体现不出来 2、分类编排,按分类号的顺序 3、按主题词的字母顺序,第二节 信息检索的类型,1、按信息检索手段可分为手工检索、机械化检索、计算机检索 手工检索,是历史最悠久的一种信息检索方式,手工检索是利用手翻、眼看、笔录等手段,利用检索工具查找所需特定信息的过程。 机械化检索,利用某种机械装置来查找文献的方式,计算机检索,又称自动化检索,是利用计算机、光盘等现代技术设备处理、检索所需信息的检索方式。,手工检索与计算机检索分析,手工检索的许多原理和规律都渗透在计算机检索中。但是由于查找的直接执行者不同,所以计算机检索的组配和手工检索的组配存在一定的差别。,手工检索过程

14、,手工检索过程中,直接执行查找任务的是人,在查找过程中,人的思维一直起着主导作用,检索者可以在检索过程中结合检索的结果不断明确自己的信息需求和不断修改自己的检索提问。在检索过程中,检索提问标识与检索系统中文献特征标识的组配完全可以做到内容、概念和形式上的一致,而无须严格的字面的组配。因此,所得到的信息一般能符合检索者的信息需求。,例如:检索课题“燃料电池的组堆技术”,从课题的字面意义上讲应选取“燃料电池”和“组堆”作为关键词进行检索。 在手检过程中我们可以边检索边分析检索结果,结果发现燃料电池的组堆技术主要应处理好气路控制、电路、水汽循环系统和密封技术等几个问题,于是改变查找目标,注重查找密封

15、问题、电路问题等几个重要问题的解决方案。,计算机检索过程,在计算机信息检索过程中,计算机不具备人脑的思维能力,因此,检索提问标识一经输入检索系统,便无法结合系统检索的具体情况不断明确用户的信息需求和修改用户的检索提问标识。同时,在计算机信息检索系统中,检索提问与文献特征标识的组配完全是一种字面组配,即计算机将两种“标识”完全作为“字符串”来进行类比运算。因此必须要求检索提问标识在形式上与文献特征标识保持完全一致才能“匹配”。这种字面上的组配,使检索出的文献记录只在字面上与检索提问标识保持一致,而在内容上或概念上就不一定符合用户的信息需求。,例如:检索课题“非线性光学材料的制备”,以非线性光学材

16、料作为检索词,可是结果中包含非线性光学材料制备光学元器件,显然此文章与检索课题无关,但是计算机不会自动屏蔽掉无关结果。因此在进行机检时一定要深入分析主题,找出与课题相关的概念和属性,以防误检和漏检。,在这个知识爆炸的时代,如此多的信息我们不可能都采用手工检索,90的人都选用了计算机进行信息检索。用手工(针对某一个课题)检索一年的CA,大约需要一天的时间,而用计算机进行检索可能在一刻钟之内便可完成。当然计算机不可能完全具有人工智能,需要人工去浏览结果,不断改进检索策略才能完成整个任务。,2、按检索的信息的学科范围,信息检索可分为社科信息检索和科技信息检索 社科信息检索是检索社会科学领域的信息,

17、科技信息检索是检索科学技术领域的信息。,两者的检索原理相同,只是检索内容的不同。由于社会科学和科学技术学科性质不同,决定了两者在文献分布范围、文献的时效性等方面存在着较大差别。 两大学科门类在民族性与国际性等特性上不同。,3、按照检索的信息类型,信息检索可以分为数据检索、事实检索、书目检索和全文检索 数据检索(Data Retrieval),又称数值检索,是以具有数量性质、并以数值形式表示的数据为检索内容的信息检索。 事实检索(Fact Retrieval),又称事项检索,是以从文献中抽取的事项为检索内容的信息检索。 书目检索(Catalog Retrieval),以文献线索为检索对象的信息检

18、索。 全文检索(Document Retrieval,Full-text Retrieval),以文献所含的全部信息作为检索内容的文献检索。,第三节 信息检索的策略与方法,1、信息检索途径 检索途径(Approach),或称为检索点(Access Point),是进行检索的路线和出发点。,1.1 作者(Author)检索途径,或称为著者途径,是从文献的作者姓名出发来检索其文献。 注意外国著者姓名的倒置和取舍规则、不同语种之间著者姓名的字译系统。,1.2 题名(Title)途径 题名是表达、象征、隐喻文献内容及特征的词或短语,是文献的标题或名称,包括书名、刊名、篇名等。许多检索系统是依文献题名编

19、制的,如图书馆的书名目录、刊名目录及篇名索引。 注意简称缩写、与著者相同的字译问题。,1.3 分类(Classified)途径 在检索系统采用分类语言表达文献信息内容并依此组织文献信息的基础上,检索者用分类语言的标识(分类号)表达待查课题进行检索,就是从分类途径检索。这是一种常用的检索途径。,1.4 主题(Subject)途径 利用检索系统中用于表达文献内容的主题标识(标题、叙词、关键词)进行检索。其关键就是选准能够表达检索课题、并且正好是检索系统所采用的主题标识形式。主题途径也是一种常用的检索途径。,1.5 序号(Number)途径 文献序号对于识别一定的文献,具有明确、简短、唯一的特点。

20、在对图书和期刊检索时常用到两个号码:国际标准书号ISBN(International Standard Book Number)及国际标准刊号ISSN(International Standard Serial Number),1.6代码(Code/Coden)途径 利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。,1.7 引文(Cited)途径 文献所附参考文献或引用文献,是文献的外表特征之一。 利用引文而编制的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。最早出现的美国科学引文索引是提供这种途径的典型。,1.8 文献

21、信息所包含的专门项目途径 从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特定问题。,2信息检索的策略,2.1 广义检索策略 是指在分析课题的基础上,选择检索系统、检索文档、检索途径,确定检索词及其相互间的逻辑关系,直到检索出结果的一系列科学措施。,2.2 狭义检索策略 是指就一个问题检索一个或多个数据库所输入的全部检索式的集合,是为满足检索需求所制定的一系列检索式。也即检索提问式的编写。,例如:对“微藻生长因子”这一课题来说,检索策略可编为: (algae+algal+microalgal) * growth()factor?

22、? 实检后调整(考虑提高检准率)、优化(低频词和关键词前置)为: (microalgal+algae+algal)(s)growth()factor? ? (microalgal+algae+algal)(3n)growth()factor? ?,3、构成检索提问式的基本要素,3.1 布尔逻辑检索(Boolean logic) 利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是 逻辑“与” A AND B(A*B) 逻辑“或” A OR B(A+B) 逻辑“非” A NOT B(A-B) AND OR NOT,用这些逻辑算符将检索

23、词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。,【实例】 以“计算机”和“信息检索” 解释三种逻辑算符的含义,“计算机”AND“信息检索”,表示查找文献内容中既含有“计算机”又含有“信息检索”词的文献。 “计算机”OR“信息检索”,表示查找文献内容中含有“计算机”或含有“信息检索”以及两词都包含的文献。 “计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“信息检索”的那部分文献。,检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布

24、尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情有很多。,3.2 字段限制检索 组成数据库的最小单位称为记录。 一篇完整记录中的每一个著录事项称为字段。 一篇记录中主要用来表达文献内容特征的字段称为基本索引字段(basic index fields),如篇名字段 、叙词字段、自由词字段。 表达文献外部特征的字段称为辅助索引字段(additional index fields),包括著者字段、文献类型字段、语种字段等。,3.3 截词检索 截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个

25、词局部中的所有字符(串)的文献,都为命中的文献。 在检索标识中保留相同部分,用相应的截词符代替可变化部分。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。,截词检索也是一种常用的检索技术,是防止漏检的有效工具,尤其在西文检索中,更是广泛应用。 截断技术可以作为扩大检索范围的手段,具有方便用户、增强检索效果的特点,但一定要合理使用,否则会造成误检。,不同的系统所用的截词符也不同,常用的有?、$、*等。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。 3.3.1 词尾的有限截词 3.3.2 词尾的无限截词 3.3.3 中间截词,【实例分析】 以无限截词举

26、例说明,后截断,前方一致。如:comput?表示computer,computers,computing等。 前截断,后方一致。如:?computer表示minicomputer,microcomputers等。 中截断,中间一致。如?comput?表示minicomputer,microcomputers等。,3.4 关系算符检索 数据库的辅助索引中,有些是数值型字段,可使用关系算符来限定范围,如: :包含范围(由低到高的数字) PY=2000: 2005 大于 PY2000 小于 PY2000,3.5 短语检索 3.6 括号检索,4、信息检索方法,信息检索方法有四种,即直接检索法、间接检索

27、法、追溯法、循环法。,4.1 直接检索法 又称直查法,是指不利用检索工具或检索系统,通过直接浏览或查阅原始文献,来获取所需信息的一种检索方法。 可以作为数据库更新时差等情况下的补充,4.2 间接检索法 又称常用法,是指借助于检索工具或检索系统获取所需信息的一种检索方法。它又分为顺查法、例查法和抽查法。,顺查:课题起始年代为起点,由远而近,查全、查准率较高,但费时、费力 倒查:由近及远,查准率较高,查到前面一定时间不查了,所以漏查率较顺查高,但省事 抽查:针对学科发展最快,文献发表最多的年代查,省时,但必须熟悉学科发展特点,4.3 追溯检索法 简称追溯法,又称扩展法、追踪法,是指不利用检索工具,

28、而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。,4.4 循环检索法 简称循环法、又称分段法、综合法。实际上是上述间接法和循环法两种方法的综合使用。两者相互配合,可以取长补短,取得更好的检索结果。,选择检索方法的原则,要看检索条件 检索工具缺乏而原始文献收藏丰富宜用追溯法,有成套检索工具则宜用常用法,其查全率、查准率都比追溯法高。,要看检索要求 要求收集某一课题的系统资料,要求全面,不能有重大遗漏,最好用顺查法 要解决某一课题的关键性技术,不要求全面,只要能解决这个关键问题就行,要快,针对性强,要

29、准,宜用倒查法,迅速查得最新资料,要看检索学科的特点 古老学科,开始年代很早,只好用倒查法;新兴学科,起始年代不远,可用顺查法;波浪发展的学科,可选择发展高峰,用循环法,5、信息检索步骤,信息检索是一项实践性和经验性很强的工作,对于不同的课题,可能采取不同的检索方法和程序。检索程序与检索的具体要求有密切关系,大致可分为以下几个步骤: 5.1 分析检索课题 5.2 制定检索策略 5.3 试验性检索和修改检索策略 5.4 正式检索 5.5 整理、说明检索结果,按要求给予答复,或者进一步提供原文。,6、信息检索的具体环节,分析主题内容、明确检索需要 提出检索提问 用检索语言标引检索提问 提问标识与系

30、统中存储的标识进行匹配比较 阅读著录 符合要求的输出 检索原始文献(文献线索检索的情况下),匹配指概念的逻辑关系的匹配 1)概念逻辑的方法 2)概念的外延 3)概念的内涵 4)概念的外延关系 相容关系:同一关系 从属关系 交叉关系 不相容关系,第四节 信息检索效果的评价,一、信息检索效果的评价指标 检索结果有效性评价的核心问题是建立一套切实可行的评价指标。目前主要以查全率和查准率作为评价标准。,1、查全率和查准率,被检出的文献: 有关文献 a 无关文献 b 未被检出的文献:有关文献 c 无关文献 d 查全率R 查准率P ,2、漏检率和误检率,漏检率 O 误检率N 查全率和漏检率是互补的,查准率

31、和误检率是互补的,3、检索效率的基本特性,查全率 . 查准率 . 从 式得 R(ac)=a Rc=a(1-R) 即: . ,同样从 可得: 从 和得: 由 可得: 式中b,c 为系数, 为变量P,R的二元方程,如图所示: P高则R底;R高则P底 要取得较好的检索效果应兼顾二者,一般,查全率为:6070 查准率为:4050,R,P,0,信息用户对信息检索相关性判断的因素分析/南京农业大学信息管理系本科生研究课题,二、 影响信息检索效率的因素,影响检索效果的因素很多,与检索系统性能及检索过程有关的各因素都有关系。 1、检索系统的质量(数据库)和所用的检索语言 2、检索人员的知识和技能 文献检索知识

32、 知识 外语知识 学科专业知识,检索技能的高低表现在: 1)了解和熟悉有关专业领域的各类检索工具,具备选择检索工具的能力 2)准确分析信息需求 3)准确表达信息需求 4)善于利用各种检索途径 5)善于辨识信息来源 6)善于调节查全率和查准率,三、提高查全率的措施,1、控制同义词、近义词 众多同义词中只能有一个词作为正式主题词。 众多的近义词中,选择一个词代替其它词,把这个词的定义放宽,这样相关的内容、接近的文献都集中到一个主题词下面,这样查全率提高,但准确率下降了。,2、词的关联法,利用上位词进行标引与检索,提高查全率 3、字形控制法,利用截词手段使同一词根的词组合在一起便于检索,提高查全率

33、4、利用倒置排列把同一类物体集中在一起,四、提高查准率的措施,1、用下位概念词 2、采用概念组配法,把两个或两个以上的概念组配在一起,表达内涵深的主题内容,即提高专指度 3、加权法,第五节 信息检索技术,一、传统检索技术与网上检索技术的比较 目前,以文献单元描述体结构为基础、手工检索方式为主导的传统文献检索已发展到以信息单元组织结构为基础、网上浏览式信息查询方式的信息检索,计算机信息检索呈现联机检索、光盘检索以及网络检索多元并存的格局,面对用户群体、互相竞争、互相融合,谋求个性化基础上的共同发展。,信息检索技术发展了几十年,除了MARC格式、倒排文档等基础知识外,1929年,波兰著名的逻辑学家

34、.卢卡西维兹研究出联机检索系统的逆波兰算法;1968年,日本科技情报中心的菊池敏典研究出介绍脱机批处理检索信息的菊池敏典算法,这两种算法都属于传统的布尔逻辑检索模型,都基于文本信息,特别是二次文献信息的检索。,随着计算机技术的不断进步和信息量成倍的增加,人们对检索技术的要求也越来越高,尤其是网络技术和多媒体技术的出现,信息检索技术的软硬件环境极大提高,信息检索技术从传统的线性检索向超文本支持的非线性检索发展,传统布尔逻辑检索模型已不在信息检索中占统治地位,文本信息也只是各类型信息中的一种,即使在文本信息检索模型中,概率推理模型和空间向量模型也正在占据越来越重要的地位。如下表所示,传统检索技术和

35、网上检索技术无论是在检索策略还是在检索手段上都发生了本质的变化。,传统检索技术和网上检索技术比较,二、信息检索技术的发展趋势,未来信息检索主要在网上进行,网络信息检索的发展要依赖于信息新技术的支撑,如信息推送技术、超媒体技术、动态链技术、知识发现技术、信息可视化技术等广泛的研究和应用。,网上未来的信息组织方式是面向对象的超媒体数据模型,它要实现节点和链的扩充与重新组合的动态机制,将信息的内容与组织结构分离,既能实现物理数据的相对独立性,又能保证节点和链的灵活组配与调整,这就要求超媒体技术向纵深方向发展,在传统的检索技术基础上,结合应用新型信息检索技术,实现线性与非线性、静态与动态结合。随着人工

36、智能、认知科学、多媒体、计算机技术与网络技术等学科的发展,超媒体技术将逐渐适应人脑的思维方式,实现智能、高效、快速而灵活的信息检索,达到随心所欲的查找、迅速定位的水平。,动态链技术是指对数据库中的数据建立一个超文本结构,附加在数据库上,然后与超媒体系统相连接,相关的数据动态的连接起来,检索时,按照联想的方式,从一个站点跳到另一个站点。因为在数据库系统的基础上增加了一层专为超媒体系统设计的链服务,它的不断完善,使人们查询、检索更为方便。,数据挖掘技术在Internet检索中应用广泛,给信息检索领域带来冲击,它指使用复杂的统计分析和模型技术从大量的数据或信息中抽取或识别出未知的、有趣或有用的最终可

37、理解的知识模式。,数据挖掘是知识发现的核心技术,知识发现技术(KDD)指利用数据库技术对数据进行前端处理,利用机器学习方法从处理后的数据中提取有用的知识(指精确抽取大量数据中隐含的、预先未知和潜在的有用信息),即从大量数据中发现有用知识的高级处理过程。 知识发现技术的逐渐成熟,将有利于人们充分利用信息资源。,Internet信息检索向智能化方向发展,智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。智能信息检索是人工智能技术与检索技术的高度融合。,Internet上的人工智能产品越来越多,如智能搜索引擎(Intellignt Search Engine)、智能浏览器(Intellignt Browser)、学习智能体(Learning Agent)、知识共享智能体(Knowledge-Sharing Agent)等已经走出实验室进入市场。,现有智能检索技术的重点是让用户获得信息源方面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论