计算机检索的基本原理及过程_第1页
计算机检索的基本原理及过程_第2页
计算机检索的基本原理及过程_第3页
计算机检索的基本原理及过程_第4页
计算机检索的基本原理及过程_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机检索的基本原理及过程第1页,共29页,2023年,2月20日,星期四目录文献数据库的概念文献数据库检索步骤主题词关键词的选取文献数据库的字段检索检索效果评价常用检索技术计算机信息检索实例第2页,共29页,2023年,2月20日,星期四1文献数据库

文献数据库是将各个学科领域、各种专业技术方面的文献信息汇集在一起,经过分门别类的组织、加工、编排后形成的数据库。它能够提供人们方便而快速地,更具针对性地查找各种文献资料的线索或者全文。文献数据库基本知识第3页,共29页,2023年,2月20日,星期四1.1文献数据库的类型按收录文献的类型划分

按提供信息的详略划分图书文献数据库期刊文献数据库专利文献数据库会议文献数据库文摘数据库作者

关键词

题名

论文来源

文摘全文数据库全文+文献数据库基本知识第4页,共29页,2023年,2月20日,星期四

2、文献数据库检索步骤确定检索要求和目标

拟定检索对象范围主题词选择数据库及检索途径

实施检索并显示检索结果用检索技术优化检索结果

选择输出(打印、拷贝或发送至电子邮箱)第5页,共29页,2023年,2月20日,星期四2.1选择检索词利用主题词表选取规范化的主题词或词组利用印刷版的检索工具书手工试检,根据检出文献的主题词标引情况,选取合适的主题词。选用自由词由于词表规模的限制,不可能对某一专业作全面检索时,应考虑选用自由词,尽可能多地选用与课题有关的同义词,以防漏检。第6页,共29页,2023年,2月20日,星期四

检索词选取时应注意的问题避免冷僻词找出隐性概念使用核心概念注意同义词近义词词型变化第7页,共29页,2023年,2月20日,星期四2.2检索途径作者(文章的责任者)篇名(或题名)机构(如浙江工业大学)关键词(如污水处理、高层建筑)主题词(规范化的主题概念,如用激光不用雷射)文摘(论文或图书的摘要或内容提要)引文(即参考文献)基金(如国家自然科学基金项目)刊名(期刊的名称)全文(或者全记录)第8页,共29页,2023年,2月20日,星期四逻辑算符位置算符截词符常用命令2.3常用检索技术-常用算符第9页,共29页,2023年,2月20日,星期四逻辑检索概念示意图ABABABAandBAorBBnotA第10页,共29页,2023年,2月20日,星期四与、AND、*用于概念交叉和限定。起缩小检索范围和提高文献查准率的作用。例Solar*Energy常用算符-逻辑算符第11页,共29页,2023年,2月20日,星期四或、OR、+用于概念之间并列关系的组配。增加主题的同义词,以扩大检索范围,避免文献漏检。例www+internet+network常用算符-逻辑算符第12页,共29页,2023年,2月20日,星期四非、NOT、-从原检索范围中剔除一部分不需要的内容。例Energy-Nuclear除核能以外的有关能源方面的文献才被命中。常用算符-逻辑算符第13页,共29页,2023年,2月20日,星期四常用算符-位置算符

布尔算符中的逻辑“与”只要求两个检索词必须同时出现在同一篇文献中,而没有限定算符两侧检索词之间的位置关系,有时难免造成误检。第14页,共29页,2023年,2月20日,星期四常用算符-位置算符例如,查找“细菌对染料破坏”方面的文献,检索词:细菌、破坏、染料逻辑“与”组配检索结果:命中同时用这三个词标引的文献有“细菌对染料的破坏”方面的文献,也会有“染料对细菌的破坏”方面的文献,要排除后一部分的文献,就需用位置算符限定词与词之间的位置关系。第15页,共29页,2023年,2月20日,星期四

(W)或()算符:“With”的缩写词序不许颠倒两词之间不许插词,只许空格或连字符号例CD(W)ROM将命中CDROM或CD-ROMsolar()energy检出solarenergy常用算符-位置算符第16页,共29页,2023年,2月20日,星期四常用算符-位置算符(nW)算符:“nwords”的缩写(nW)是从(W)算符引伸出来检索词之间允许插入0-n个词词序不许颠倒例anticorrosion(1W)paint可检出anticorrosionpaint和anticorrosionofpaint例检索“材料磨损”(WEAROFMATERIALS)方面的文献,检索式:WEAR(1W)MATERIALS第17页,共29页,2023年,2月20日,星期四常用算符-位置算符(N)算符:“Near”的缩写词序可以颠倒两词之间不许插词例cross(N)section可检出crosssection和sectioncross第18页,共29页,2023年,2月20日,星期四常用算符-位置算符(nN)算符:(nN)是从(N)算符引伸出来检索词之间允许插入0-n个词词序可以颠倒第19页,共29页,2023年,2月20日,星期四常用算符-位置算符(F)算符:“Field”的缩写算符两侧的检索词必须在同一字段内词序及两词间插入的词数不限例digital(F)computer/TI,AB第20页,共29页,2023年,2月20日,星期四常用算符-位置算符(S)算符:“Sentence”和“Sub-field”的缩写算符两侧的检索词必须在同一句子词序及两词间插入的词数不限第21页,共29页,2023年,2月20日,星期四常用算符-位置算符

上述位置算符可以混合用于同一检索式中,由于检索系统是按从左到右的顺序处理检索式,因此,应将限制最严的算符放在最左边。第22页,共29页,2023年,2月20日,星期四

非限制性截词:“?”加在词干或不完整的词上,对词的完整意义进行检索。computer?代表Computer,computers,computerized等限制性截词:analy?er命中记录中将出现analyzer和analyser;work???命中记录中将出现,work,works,worker,workers,working常用算符-截词符第23页,共29页,2023年,2月20日,星期四3、检索效率检索系统进行检索时产生的有效结果它直接反映了检索系统性能的好坏。衡量检索效果的指标查全率(recallratio)查准率(precisionratio)第24页,共29页,2023年,2月20日,星期四检索出的相关文献量数据库中的全部相关文献查全率R=x100%检索出的相关文献量检出的文献总量查准率P=x100%

最理想的检索结果是查全率和查准率都达到100%。R100%表示数据库中收录的全部相关文献都被检索出来P100%表示检索出来的文献全部都是相关文献但事实上,检索中有许多因素使这个指标很难达到。第25页,共29页,2023年,2月20日,星期四R0P查全率R与查准率P的关系曲线CADBC.W.Cleverdon(英)进行Granfield试验,得出查全率R与查准率P曲线。R-P之间存在着互逆关系A点检索词数量多,泛指性强,查全率较高但查准率却非常低B点检索词专指性较强,查准率就高查全率因此降低C,D两点两种极端的折衷。查全率一般在60%--70%查准率一般在40%--50%无论怎样调整检索策略和改进系统效率,都无法使P和R同时接近100%。第26页,共29页,2023年,2月20日,星期四4、计算机检索实例课题名称:高层建筑的抗震结构设计课题分析 该课题涉及的主要概念有:高层、建筑、抗震问题和结构设计等方面。第27页,共29页,2023年,2月20日,星期四作业1、信息素质包括哪几个方面?2、信息检索活动的功用有哪些?3、文献按加工深度、出版形式和载体形态分别可分成哪几类?4、文献检索的工具有哪些?文献数据库可分成哪几种类型?请列举五种检索途径。5、请查询本校图书馆的馆藏目录,写出5本有关“计算机应用”或“国际贸易”的图书的索书号并简要说明索书号的构成。6、什么是检索语言,检索语言有几种?请详细列举并进行比较。7、文献检索的方法有哪些?各自的优缺点是什么?8、如何提高检索文献的效率并查全查准文献?9、检索词选取时应注意的问题有哪些?10、国际商业经济活动中应了解的信息有哪些?(非经贸专业不做)11、请说明计算机检索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论