计算机检索的基原本理及过程_第1页
计算机检索的基原本理及过程_第2页
计算机检索的基原本理及过程_第3页
计算机检索的基原本理及过程_第4页
计算机检索的基原本理及过程_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机检索的基本原理及过程Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.1目 录文献数据库的概念文献数据库检索步骤主题词关键词的选取文献数据库的字段检索检索效果评价常用检索技术计算机信息检索实例Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.21 文献数据库 文献数据库是将各个学科领域

2、、各种专业技术方面的文献信息汇集在一起,经过分门别类的组织、加工、编排后形成的数据库。它能够提供人们方便而快速地,更具针对性地查找各种文献资料的线索或者全文。文献数据库基本知识Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.3 1.1 文献数据库的类型按收录文献的类型划分 按提供信息的详略划分图书文献数据库期刊文献数据库专利文献数据库会议文献数据库文摘数据库作者 关键词 题名 论文来源 文摘全文数据库全文+文献数据库基本知识Evaluati

3、on only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.4 2、文献数据库检索步骤确定检索要求和目标 拟定检索对象范围主题词选择数据库及检索途径 实施检索并显示检索结果用检索技术优化检索结果 选择输出(打印、拷贝或发送至电子邮箱)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.5 2.1 选择检索词利用主题词表

4、选取规范化的主题词或词组利用印刷版的检索工具书手工试检,根据检出文献的主题词标引情况,选取合适的主题词。选用自由词由于词表规模的限制,不可能对某一专业作全面检索时,应考虑选用自由词,尽可能多地选用与课题有关的同义词,以防漏检。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.6 检索词选取时应注意的问题避免冷僻词找出隐性概念使用核心概念注意同义词近义词词型变化Evaluation only.Created with Aspose.Slides

5、 for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.7 2.2 检索途径作者(文章的责任者)篇名(或题名)机构(如浙江工业大学)关键词(如污水处理、高层建筑)主题词(规范化的主题概念,如用激光不用雷射)文摘(论文或图书的摘要或内容提要)引文(即参考文献)基金(如国家自然科学基金项目)刊名(期刊的名称)全文(或者全记录)Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.8逻辑算

6、符位置算符截词符常用命令2.3 常用检索技术常用算符Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.9逻辑检索概念示意图ABABABA and BA or BB not AEvaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.10与、AND、*用于概念交叉和限定。起缩小检索范围和提高文献查准率

7、的作用。例 Solar*Energy常用算符逻辑算符Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.11或、OR、用于概念之间并列关系的组配。增加主题的同义词,以扩大检索范围,避免文献漏检。例 www + internet + network常用算符逻辑算符Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose

8、 Pty Ltd.12非、NOT、从原检索范围中剔除一部分不需要的内容。例 EnergyNuclear除核能以外的有关能源方面的文献才被命中。常用算符逻辑算符Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.13常用算符位置算符布尔算符中的逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。Evaluation only.Created with Aspose.Slides for

9、.NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.14常用算符位置算符例如,查找“细菌对染料破坏”方面的文献,检索词:细菌、破坏、染料逻辑“与”组配检索结果:命中同时用这三个词标引的文献有“细菌对染料的破坏”方面的文献,也会有“染料对细菌的破坏”方面的文献,要排除后一部分的文献,就需用位置算符限定词与词之间的位置关系。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.15 (W)或(

10、 )算符:“With”的缩写词序不许颠倒两词之间不许插词,只许空格或连字符号例 CD(W)ROM 将命中 CD ROM 或 CD-ROM solar ( ) energy 检出 solar energy常用算符位置算符Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.16常用算符位置算符(nW)算符:“n words”的缩写(nW)是从(W)算符引伸出来检索词之间允许插入0n个词词序不许颠倒例 anticorrosion (1W) paint

11、 可检出 anticorrosion paint 和 anticorrosion of paint例 检索“材料磨损”(WEAR OF MATERIALS)方面的文献,检索式: WEAR (1W) MATERIALSEvaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.17常用算符位置算符(N)算符:“Near”的缩写词序可以颠倒两词之间不许插词例 cross (N) section 可检出 cross section 和 section cro

12、ss Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.18常用算符位置算符(nN)算符:(nN)是从(N)算符引伸出来检索词之间允许插入0n个词词序可以颠倒Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.19常用算符位置算符(F)算符:“ Field”的缩写算符两侧的检索词必须在同一字段

13、内词序及两词间插入的词数不限例 digital (F) computer / TI, ABEvaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.20常用算符位置算符(S)算符:“Sentence”和“ Sub-field”的缩写算符两侧的检索词必须在同一句子词序及两词间插入的词数不限Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2

14、011 Aspose Pty Ltd.21常用算符位置算符 上述位置算符可以混合用于同一检索式中,由于检索系统是按从左到右的顺序处理检索式,因此,应将限制最严的算符放在最左边。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.22 非限制性截词: “?”加在词干或不完整的词上,对词的完整意义进行检索。computer? 代表 Computer, computers, computerized等限制性截词: analy?er 命中记录中将出现a

15、nalyzer 和analyser;work? 命中记录中将出现,work, works, worker, workers, working常用算符截词符Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.233、检索效率检索系统进行检索时产生的有效结果它直接反映了检索系统性能的好坏。衡量检索效果的指标查全率(recall ratio)查准率(precision ratio)Evaluation only.Created with Aspose

16、.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.24检索出的相关文献量数据库中的全部相关文献查全率R=x100%检索出的相关文献量检出的文献总量查准率P=x100% 最理想的检索结果是查全率和查准率都达到100。R100表示数据库中收录的全部相关文献都被检索出来P100表示检索出来的文献全部都是相关文献但事实上,检索中有许多因素使这个指标很难达到。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-

17、2011 Aspose Pty Ltd.25R0P查全率R与查准率P的关系曲线CADBC.W.Cleverdon(英)进行Granfield试验,得出查全率R与查准率P曲线。RP之间存在着互逆关系 A点检索词数量多,泛指性强,查全率较高但查准率却非常低B点检索词专指性较强,查准率就高查全率因此降低 C,D两点两种极端的折衷。查全率一般在6070查准率一般在4050无论怎样调整检索策略和改进系统效率,都无法使P和R同时接近100。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-20

18、11 Aspose Pty Ltd.264、计算机检索实例课题名称:高层建筑的抗震结构设计 课题分析该课题涉及的主要概念有:高层、建筑、抗震问题和结构设计等方面。Evaluation only.Created with Aspose.Slides for .NET 3.5 Client Pro.Copyright 2004-2011 Aspose Pty Ltd.27作 业1、信息素质包括哪几个方面?2、信息检索活动的功用有哪些?3、文献按加工深度、出版形式和载体形态分别可分成哪几类?4、文献检索的工具有哪些?文献数据库可分成哪几种类型?请列举五种检索途径。5、请查询本校图书馆的馆藏目录,写出5本有关“计算机应用”或“国际贸易”的图书的索书号并简要说明索书号的构成。6、什么是检索语言,检索语言有几种?请详细列举并进行比较。7、文献检索的方法有哪些?各自的优缺点是什么?8、如何提高检索文献的效率并查全查准文献?9、检索词选取时应注意的问题有哪些?10、国际商业经济活动中应了解的信息有哪些?(非经贸专业不做)11、请说明计算机检索系统的基本原理及检索过程。12、布尔逻辑检索、截词检索、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论