淘花百度专用_第1页
淘花百度专用_第2页
淘花百度专用_第3页
淘花百度专用_第4页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、淘花/百度专用1信息检索基础知识与信息信息检索基础知识与信息检索技巧专题讲座检索技巧专题讲座天津商学院图书馆吴凤玉E-mail:电话:26684017淘花/百度专用2一、信息检索信息检索是将信息按一定的方式组织和存储起信息检索是将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过来,并根据信息用户的需要找出有关信息的过程和技术程和技术。对于信息用户而言,就是从信息集合中找出所对于信息用户而言,就是从信息集合中找出所需信息的过程。需信息的过程。 信息检索基本原理:信息检索基本原理: 提问标识(检索式)与文献标识的对比提问标识(检索式)与文献标识的对比 淘花/百度专用3二、信息检

2、索途径检索途径:检索途径: 又称为检索点。又称为检索点。 依据文献的依据文献的外部特征外部特征(题名、责任者、(题名、责任者、 出版者、出版时间等)出版者、出版时间等) 和和内容特征内容特征(分类号、主题词、关键词(分类号、主题词、关键词 或自由词等)来确定,是信息检索的入口点。或自由词等)来确定,是信息检索的入口点。 淘花/百度专用4常用检索途径题名(篇名)途径:题名(篇名)途径:利用篇名中的字词或篇名利用篇名中的字词或篇名的一部分进行检索。其结果是所有在篇名中出现该字、的一部分进行检索。其结果是所有在篇名中出现该字、该词或该部分的文章。该词或该部分的文章。著者途径著者途径:利用文献作者名字

3、进行检索。可查到该利用文献作者名字进行检索。可查到该作者的所有文献。作者的所有文献。分类途径分类途径:利用分类名和分类号进行检索。其结果利用分类名和分类号进行检索。其结果是该类目所有的文献。是该类目所有的文献。淘花/百度专用5主题途径主题途径:利用与该篇文献主题相关的规范词(主利用与该篇文献主题相关的规范词(主题词)进行检索,其结果是包含该主题词的所有文献。题词)进行检索,其结果是包含该主题词的所有文献。关键词途径关键词途径:利用与该篇文献主题相关的关键词利用与该篇文献主题相关的关键词(自由词)进行检索,其结果是包含该关键词的所有(自由词)进行检索,其结果是包含该关键词的所有文献。文献。序号途

4、径序号途径:利用文献的各种代码、数字编制的索引利用文献的各种代码、数字编制的索引查找文献,如专利号、技术标准的标准号、科技报告查找文献,如专利号、技术标准的标准号、科技报告的报告号等。的报告号等。其他途径其他途径:如文献类型、参考文献、语种、出版如文献类型、参考文献、语种、出版(发表)年份、作者机构、出版机构等。(发表)年份、作者机构、出版机构等。淘花/百度专用6三、信息检索常用方法(一一)布尔逻辑布尔逻辑: 用布尔逻辑算符来表达检索词间的逻辑组配关系,用布尔逻辑算符来表达检索词间的逻辑组配关系,是最基本、最常用的检索技术。是最基本、最常用的检索技术。 -逻辑或逻辑或(+,OR):):表达检索

5、词间的并列关表达检索词间的并列关系。可扩大检索范围,提高查全率。如:系。可扩大检索范围,提高查全率。如:A+B,表明,表明结果中含有结果中含有A或或B都为检索命中都为检索命中AB淘花/百度专用7 -逻辑与逻辑与(*,AND):):表达检索词间的交叉关表达检索词间的交叉关系。可缩小检索范围,提高查准率。如:系。可缩小检索范围,提高查准率。如:A*B,表明,表明结果必须同时含有结果必须同时含有A和和B才为命中才为命中 -逻辑非逻辑非(-,NOT):):表达检索词间的排除关系。表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:可缩小检索范围,提高查准率,但要慎用。如:A-B,表明结果

6、是表明结果是A中不包含中不包含B的那部分的那部分 ABAB淘花/百度专用8(二二)截词检索:截词检索: 又称词干检索、模糊检索。检索时,只需用词干又称词干检索、模糊检索。检索时,只需用词干加截词符号,凡是含有与该词干相同的文献均能被检加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。出。该方法能很好避免漏检现象的出现。检索系统不同,截词符也不同,常用的截词符号检索系统不同,截词符也不同,常用的截词符号有:有:?,*等。等。分为有限截词(即一个截词符只代表一个字符)和无分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。限截词(一个截

7、词符可代表多个字符)。按截断的位置来分,截词可分为后截断、前截断、中按截断的位置来分,截词可分为后截断、前截断、中截断三种类型。截断三种类型。淘花/百度专用9举例说明举例说明:后截断,前方一致。如:后截断,前方一致。如: comput* 表示表示computer,computers,computing等。等。 王伟?王伟? 可查出所有名字中含可查出所有名字中含“王伟王伟”的作者的文献的作者的文献前截断,后方一致。如:前截断,后方一致。如: *Computer 表示表示minicomputer,microcomputer等。等。中截断,中间一致。如中截断,中间一致。如 *comput* 表示表示

8、minicomputer,microcomputers等。等。 作者作者=张张?静静 检索出张亚静、张雪静、张宇静等。检索出张亚静、张雪静、张宇静等。 淘花/百度专用10(三)限制检索(三)限制检索限制检索是缩小或约束检索结果的方法,主要是指限限制检索是缩小或约束检索结果的方法,主要是指限定字段检索,即是指定检索词在记录中出现的字段。定字段检索,即是指定检索词在记录中出现的字段。常用的字段代码有:常用的字段代码有: TI(题名)(题名) AU(作者)(作者) AB(文摘)(文摘) JN(刊名)(刊名) PY(年代)(年代) LA(语种)(语种) 如:如: information science

9、/TI LA=english 文摘文摘=网络信息资源网络信息资源淘花/百度专用11四、机检系统常用检索方法简单检索简单检索(basic search):):是一种单项检索。是一种单项检索。一般只需输入一个检索词,辅以相应的途径即可进行一般只需输入一个检索词,辅以相应的途径即可进行检索。检索。二次检索二次检索:在原有简单检索的结果基础上,再进行在原有简单检索的结果基础上,再进行检索。可反复使用,不断扩大或缩小检索范围。检索。可反复使用,不断扩大或缩小检索范围。高级检索高级检索(advanced search):):是一种多项组是一种多项组合检索,一般输入多个检索词进行组配。有的检索系合检索,一般

10、输入多个检索词进行组配。有的检索系统也称为复杂检索或扩展检索。统也称为复杂检索或扩展检索。专家检索专家检索:用多个检索词与各种运算符组成检索式,:用多个检索词与各种运算符组成检索式,功能与高级检索相似。功能与高级检索相似。淘花/百度专用12五、检索技巧五、检索技巧信息检索最重要的两个指标:信息检索最重要的两个指标: “检全率检全率”与与“检准率检准率”检准率:指检出的相关文献量与检出文献总量检准率:指检出的相关文献量与检出文献总量 的比率。反应检索结果的准确性。的比率。反应检索结果的准确性。检全率:指检出的相检全率:指检出的相 关文献量与检索系统中相关文献量与检索系统中相 关文献总量的比率。反映检索结果的关文献总量的比率。反映检索结果的 全面性。全面性。淘花/百度专用13(一)提高检准率的方法(一)提高检准率的方法使用高相关度的检索入口使用高相关度的检索入口 题名题名/关键词关键词 文摘文摘 (全文)(全文)使用限制检索使用限制检索 如:在百度中可以进行多种限制:如:在百度中可以进行多种限制: 限定搜索网站限定搜索网站(site: );文档格式;文档格式(filetype:ppt、doc、pdf、xls等)。等)。反复使用二次检索(反复使用二次检索(and)使用使用“精确检索精确检索” 如:百度中的如:百度中的“”“”(双引号)与(双引号)与(书名号)(书名号)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论