信息检索与检索工具知识培训_第1页
信息检索与检索工具知识培训_第2页
信息检索与检索工具知识培训_第3页
信息检索与检索工具知识培训_第4页
信息检索与检索工具知识培训_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索与检索工具

英国学者约翰逊曾说过

知识分为两类:一类是我们所知道的学科知识,另一类是关于在哪儿可以获得这些知识的知识。“文献检索”就是打开知识宝库的一把钥匙。一、信息检索的原理

1、信息检索(InformationRetrieval)概念定义:就是查找文献,即以科学的方法利用专门的工具,从大量的文献资料中迅速、准确、完整地查找到文献资料的过程。

文献检索也可称为信息检索。一种搜索过程从已存储的文献资源中找出与用户提问相关的文献2、信息检索过程包括两个部分:一是信息存储,即把大量分散的无序的信息集中起来,经过加工,使之有序化、系统化,成为有功能的检索工具或检索系统。二是信息检索,利用已组织好的检索工具或检索系统,按照课题的要求将所需信息查找出来。信息检索全过程示意图3、信息检索的类型划分的依据检索的类型对象文献检索,事实检索,数据检索内容书目、数据、全文、事实、声像检索检索技术全文文本、多媒体、超文本、网络检索

根据检索对象的不同,文献(信息)检索可分为三种类型:数据检索(DataRetrieval)--特定的数据,查找文献中的人名、地名、化学组成、某个参数、某个数学公式等数据。

事实检索(FactRetrieval)--特定的事实(各种史实、结果、现状)。文献检索(DocumentRetrieval)--特定的文献。狭义范围的文献检索。仅指查找相关的文献(文章或论著等)。二、信息检索工具1、概念:检索工具是指根据检索语言,将无序的文献按一定方式有系统的组织起来,用以报道、存储和检索文献的工具。二次文献又称为检索工具,它提供文献的线索。如果按著录内容划分,可将检索工具分为目录、题录、文摘、索引、搜索引擎、全文数据库。1.手工检索:利用纸介质文献进行的检索。主要包括检索性期刊(索引期刊、文摘期刊);书本式目录、索引、文摘;卡片式目录等。手工检索可利用的工具是指印刷型检索工具,它包括检索性工具书:目录、索引、文摘。参考性工具书:百科全书、年鉴、手册、名录、字典、词典、表谱、图录。2.机器检索:又称“计算机情报检索”、“自动化情报检索”。是利用电子计算机存贮和检索情报的过程。它包括数据库检索、联机检索、网上搜索(利用搜索引擎)等。检索工具的类型传统型检索工具目录索引文摘电子型检索工具数据库参考数据库源数据库混合数据库计算机信息网络分类目录型搜索引擎型混合型目录(Catalogue)含义:目录是对文献的外表特征的著录。以单独出版物为报道单位,即以完整出版物(如一本书或一种刊或一个会议录的名称)作为著录的基本单位来报道和记录文献。著录内容:文献名称(篇名目录)、著者、出版项与馆藏信息等内容。索引(Index):揭示具有重要检索意义的内容特征标识或外部特征标识,按照一定顺序排列,并注明文献条目线索的工具。分类索引、主题索引、生物体索引、著者索引等。索引是一种附属性的检索工具,主要起检索作用,常附于检索工具的后部,但也有的工具本身就是由索引构成。索引由索引款目和参照系统组成。索引款目包括:标目、说明语、材料出处或地址。题录(Title)概念:揭示文献外部特征的检索工具。以单篇文献为报道单位,题录报道信息的深度比目录大,报道周期短,收录范围广,著录较简单。例:沈则民.《武威汉代医简》中瘀方的临床应用[J].浙江中医杂志,2002,(8):353.张延昌.武威汉代医简中的民间外治法[J].中国民间疗法,2002,10(9):61.著者、论文题目、文献出处(刊名、发表年月、卷、期、页码)及文种等。如:《CNKI》免费题录等。文摘(Abstract,Excerpta,Digest)含义:文摘是指对文献内容选择重要部分以简练的形式作为摘要,并按一定的原则和方法编排而成的一种检索工具。以单篇文献为报道单位,揭示文献外部特征和内容特征的检索工具。可以看作一种带有摘要的题录,它是二次文献的核心。如美国的《化学文摘》,中国医学文摘,中国药学文摘,中国生物学文摘,EDLINE/PubMed等。《全国报刊索引》正文款目TQ174①

陶瓷工业②000814421③

界面相对碳纤维增韧碳化硅复合材料性能的影响④/尹洪峰⑤(西北工业大学凝固技术国家重点实验室)⑥徐永东、成来飞等⑤∥硅酸盐学报⑦—2000,28(1)⑧-1-5⑨说明:①《中图法》分类号。②类名。③顺序号。④论文题名。⑤作者。⑥第一作者单位。⑦刊名。⑧年、卷(期)。⑨起讫页码。目录与索引的异同:相同点:都是记录文献线索的工具;不同点:目录著录的是一个完整的出版单位、一种图书、一种期刊等;而索引著录的是一个完整出版物的某一部门、某一观点、某一知识单元等,索引揭示文献内容比目录更深入和细致。目录与题录的异同:共同点:是它们都只限于描述文献的外部特征。不同点:在于著录的对象不同。目录的著录对象是完整出版单元,而题录的著录对象通常是完整出版单元的个别内容。三、检索语言1、检索语言(RetrievalLanguage)检索语言(检索标识系统、情报语言、标引语言、索引语言)是一种在文献存储和检索过程中共同使用的语言。它的用途是描述文献特征,表达情报提问,并使两者能相互沟通。2、检索语言介绍其中表述文献内容特征的检索语言有:(1)分类检索语言(2)主题检索语言(1)《中国图书馆分类法》(简称中图法)

《中图法》是在科学分类的基础上,结合图书的特性所编制的分类法。它将所有学科分为5个基本部类、22个(L、M、W、Y除外)大类。采用汉语拼音字母与阿拉伯数字相结合的混合号码,用一个字母代表一个大类,以字母顺序反映大类的次序,在字母后用数字作标记。为适应工业技术发展及该类文献的分类,对工业技术二级类目,采用双字母。

R医药卫生、R28中药学、R5内科学、R9药学A马克思主义、列宁主义、

毛泽东思想、邓小平理论TD矿业工程B哲学、宗教TE石油、天然气工业C社会科学总论TF冶金工业D政治、法律

TG金属学与金属工艺E军事TH机械、仪表工业F经济TJ武器工业G文化、科学、教育、体育TK能源与动力工程H语言、文字TL原子能技术I文学TM电工技术J艺术TN无线电电子学、电信技术K历史、地理TP自动化技术、计算机技术N自然科学总论TQ化学工业O数理科学和化学TS轻工业、手工业P天文学、地球科学TU建筑科学Q生物科学TV水利工程R医药、卫生U交通运输S农业科学V航空、航天T工业技术X环境科学、安全科学TB一般工业技术Z综合性图书(2)主题语言也称为主题法,由受控的自然语词组成。它也是一套人工的符号系统,是在一定程度上达成共识或成为标准的一套主题规则。其具体(表现)形式是主题词表。主题词表规定了哪些词在主题标引或主题检索时可以作为正式词,哪些是非规范化的词,不能用来标引或检索。如:《实用机床维修技术汇编》

主题词:实用机床维修技术汇编关键词语言关键词,是一种准主题检索语言,也是检索语言的发展的趋势。出现在文献标题、文摘、正文中,对表征文献主题内容具有实质意义的语词,对揭示和描述文献主题内容是重要的、关键性的语词

如:《实用机床维修技术汇编》

提取关键词:机床维修技术

四、文献检索方法与步骤文献检索的方法(1)常用法直接利用各种检索工具查找文献的方法。如图书目次、期刊目次、后附关键词索引、主题词索引、著者索引等。顺查法:从远及近查,用于了解某一事物发展的全过程。逆查法:由近及远查,重点为近期。(2)追溯法(引文法)利用已掌握的原始文献所附的参考文献,追踪查找参考文献的原文获得新的“引文”,从“引文”追溯到新的“引文”,获得更多的相关文献。缺点:查全率、查准率较低,易误检漏检(3)综合法又称循环法,将上述二种方法综合运用。对于新的课题,一般从文献的内容特征入手,按分类途径或主题途径查找。如果在查找过程中,发现某著者发表的文章较多或有独创见解,便可利用著者途径追溯该著者的文章文献信息检索途径1、从文献外表特征2、从文献内容特征题名途径-TitleIndex分类途径-ClassifiedIndex著者途径-AuthorIndex关键词途径-KeywordIndex号码途径-NumberIndex主题词途径-SubjectIndex

分类主题途径-ClassifiedandSubjectIndex

其他-FormularIndex…

(1)篇名(题名)(2)著者:包括个人著者,团体著者,专利发明人,专利受让人,研究合同户,学术会议主办单位等(3)文献序号:编号唯一,互不重复,这个序号即为该文献的代表。对于技术标准、科技报告、专利文献都可以用序号作为检索途径(4)分类途径:利用分类目录和分类索引查找(5)主题途径:用表征文献主题思想的词或词组来检索检索步骤分析研究课题,明确查阅要求选择检索工具和检索方法确定检索途径和检索语言查找文献线索获取原文献文献检索的一般流程分析研究课题,制定检索方案分析研究课题的主题内容、所属学科,从而析出主题概念、提取关键词和分子式、号码等作为检索词,然后确定课题所需查找文献的时间范围、国家范围和文献类型范围等。制定比较明确的检索方案。

选择检索工具与方法根据课题的学科性质和专业性质,选择检索工具。首先确定是采用手工检索方式,还是计算机检索方式。如采用手工检索方式,使用哪种工具书;如采用计算机检索,确定是到Internet查找网络数据库还是到信息服务部门检索光盘数据库,准备检索哪个数据库。常用法(顺查法、倒查法或抽查法)、追溯法或综合法。确定检索途径和检索语言采用分类、主题等揭示文献内容特征的检索途径,还是采用著者、号码、题名等反映文献外表特征的检索途径。如需采用分类途径,利用检索工具所采用的分类表,确定分类号;如需采用规范化的主题词检索,利用检索工具所采用的主题词表,将第1步中提出的关键词转换成规范化的主题词。查找文献线索按选定的检索途径,采用前几步确定的检索用词(或计算机检索用的检索式)对检索工具一定年份范围内的文献进行检索,可得文献线索(文献出处)。手工检索时,还应对来源出版物名称缩写进行还原,找出来源出版物的全称。获取原始文献用户检索出相关文献的线索,并进行来源出版物名称缩写的还原后,即可依照由近及远或易获得性原则向收藏单位索取原文;也可上网下载原文。检索效果与评价

所谓检索效果(retrieval

effectiveness)是指检索结果的有效程度。常用的检索效果的评价指标有:收录范围、查全率、查准率、响应时间、用户负担和输出形式等。其中主要的指标是查全率和查准率。

查全率、查准率、漏检率、误检率

提高检索效果的措施

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论