信息检索概论02基本原理_第1页
信息检索概论02基本原理_第2页
信息检索概论02基本原理_第3页
信息检索概论02基本原理_第4页
信息检索概论02基本原理_第5页
已阅读5页,还剩156页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章信息检索的基本原理与方法——掌握航海工具箱信息检索概论安徽工业大学图书馆信息检索教研室主要内容2.1信息检索原理2.1.1信息检索的概念2.1.2信息的存储2.1.3信息的检索2.2检索系统2.2.1检索系统的概念2.2.2检索系统分类2.2.3检索系统小结2.3检索语言2.3.1检索语言的基础知识2.2.2检索语言的分类2.2.3检索提问式和运算符安徽工业大学图书馆信息检索教研室2.4检索步骤(掌握)2.4.1信息检索五步走2.4.2如何选择信息源2.4.3获取信息的思路安徽工业大学图书馆信息检索教研室2.1信息检索原理2.1.1信息检索的概念2.1.2信息的存储2.1.3信息的检索安徽工业大学图书馆信息检索教研室2.1.1信息检索的概念引例:汽车燃料交通运输类(U)汽车用燃料、润滑料类(U473)中国图书馆分类法中国图书馆分类法细目安徽工业大学图书馆信息检索教研室定义信息检索(informationretrieval):指的是从信息集合中查找所需信息的具体过程。广义信息检索:包括信息存储与查找两个过程。狭义信息检索:指信息的查找。安徽工业大学图书馆信息检索教研室引例:《3D计算机图形学》自动化技术、计算技术类TP计算机应用--模式识别装置TP391.41TP391.41/H293TPTP391.41TP391.41/H293书的信息存储过程书的信息检索过程安徽工业大学图书馆信息检索教研室2.1.2信息的存储信息的存储过程:按照检索语言(主要是主题词表和分类表)及其使用规则对每条原始信息进行处理,形成一系列信息特征标识,组成一条记录。许多条记录形成有序的信息集合。安徽工业大学图书馆信息检索教研室信息存储主题分析信息源概念转换目录文摘索引编制存储标识信息集合安徽工业大学图书馆信息检索教研室2.1.3信息的检索信息的检索过程:按照同样的主题词表或分类表分析检索需求,形成检索提问标识。依据信息存储时所形成的检索途径,从信息集合中查找与检索提问标识匹配的信息特征标识。安徽工业大学图书馆信息检索教研室信息检索包含信息存储与检索(informationstorageandretrieval两个方面,存储的过程是信息的组织加工和记录的过程,即建立检索系统(编制检索工具)的过程——输入的过程;检索的过程是按一定方法从检索系统(检索工具)中查出信息用户需要的特定信息的过程——输出的过程。二者是相辅相成的,存储是为了检索,而检索又必须先进行存储。只有经过组织的有序信息集合才能提供检索,因此了解了一个信息检索系统(检索工具)的组织方式也就找到了检索该信息系统(检索工具)的基本方法。安徽工业大学图书馆信息检索教研室信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下:InformationNeed信息需求Query信息提问RetrievedObjects检出对象IndexedObjects标引对象DocumentObjects文献对象Representation表述Evaluation/Feedback评价/反馈Comparison比较匹配Representation标引安徽工业大学图书馆信息检索教研室2.2信息检索系统2.2.1检索系统的概念2.2.2检索系统的分类安徽工业大学图书馆信息检索教研室2.2.1检索系统的概念信息检索系统:由一定的设备和信息集合构成的服务设施称为信息检索系统。例如:中国知网(CNKI)、在线公共目录检索系统(OPAC)、工程索引(EI)、Dialog等。安徽工业大学图书馆信息检索教研室2.2.2检索系统的分类检索系统分类:目录检索系统全文检索系统检索系统文摘检索系统安徽工业大学图书馆信息检索教研室1)目录检索系统目录检索系统:用于对出版物进行报道和对图书资料进行科学管理。

常用目录检索系统:图书馆在线公共目录检索系统(OPAC)、中国高等教育文献保障系统(CALIS)联合目录公共检索系统安徽工业大学图书馆信息检索教研室图书馆在线公共目录检索系统(OPAC)举例安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室CALIS联合目录公共检索系统举例安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室2)文摘检索系统文摘检索系统:用于对信息题录和文摘的检索,检索结果一般是文献的来源信息。

常用文摘检索系统:工程索引(EI)、引文索引(SCI)安徽工业大学图书馆信息检索教研室EI检索界面EI检索词选择字段安徽工业大学图书馆信息检索教研室EI检索结果安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室3)全文检索系统全文检索系统:全文也包括内容简短的事实和数据,全文检索系统集文摘检索与全文提供于一体。

常用的全文检索系统:中国知网(CNKI)、ScienceDirect安徽工业大学图书馆信息检索教研室CNKI检索界面林钟高安徽工业大学图书馆信息检索教研室CNKI检索结果安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室2.2.3检索系统小结文摘检索系统全文检索系统目录检索系统全文收藏地馆藏信息用户提问信息来源安徽工业大学图书馆信息检索教研室2.3.1检索语言的基础知识检索原理检索语言作用概念安徽工业大学图书馆信息检索教研室1)什么是检索语言信息检索语言:用于描述信息系统中信息的内容特征和外表特征,并可以表达用户提问的一种专门语言。作用:信息存储信息检索检索语言安徽工业大学图书馆信息检索教研室2)检索语言的作用文献存储子系统文献检索子系统信息群主题分析概念转换概念转换主题分析用户群检索语言查找著录标引过程待标文献主题概念特征标识目录数据主题概念用户提问检索标识编制检索策略过程编制文摘目录索引信息集合安徽工业大学图书馆信息检索教研室信息检索的过程:用检索标识与信息的存储标识相比较,若取得一致,则为匹配,即可得到命中文献。

检索语言信息存储信息检索安徽工业大学图书馆信息检索教研室2.2.2检索语言的分类外部特征书名/刊名著者名/团体著者出版事项代码/序号内容特征分类语言分类表主题语言主题词表检索语言安徽工业大学图书馆信息检索教研室表示文献内容特征的检索语言按构成原理划分分类语言:体系分类法组面分类法主题语言:标题词语言叙词语言单元词语言关键词语言安徽工业大学图书馆信息检索教研室1)分类语言分类语言:是以号码(一般为字母和数字的组合)为基本字符,用分类号和类目表达文献主题概念的检索语言。特点:是用分类号表达各种概念,根据概念之间的关系,把它们组织成一个逻辑体系。作用:反映知识的分类或者社会实践活动的职能分工,具有较好的系统性;把同一学科、同一专业、同一职能活动的文献集中在各个类目之下,满足族性检索(类检索)需要。常用的等级体系分类语言简称分类法。安徽工业大学图书馆信息检索教研室等级体系分类语言是按一定的观点,以科学分类为基础,用逻辑分类的原理,结合信息的内容特征,运用概念划分与概括的方法,按照知识门类的逻辑次序从总到分,从上到下,从抽象到具体,从一般到特殊,从简单到复杂,层层进行概念划分,从而产生存在隶属关系的不同级别,逐级展开组成体现知识等级体系的分类表,并以分类表来标引、存储和检索信息。在分类表中,上位类包括下位类的总和,下位类隶属于其上位类,同位类互不相容,每一个类目分别以不同的符号(分类号)作标识,从而形成了以分类号为标记的一个严格有序的层次式结构体系。安徽工业大学图书馆信息检索教研室由于体系分类语言体现的是知识等级体系,因此,用体系分类语言标识文献能按学科或专业集中而系统地揭示信息,便于从学科或专业角度进行族性检索,并且查全率高。安徽工业大学图书馆信息检索教研室分类语言的具体表现形式是分类表,信息检索系统中,常用的分类表有:《中国图书馆分类法》(简称中图法)《中国科学院图书馆分类法》(简称科图法)《人民大学图书馆分类法》(简称人大法)《国际十进制图书分类法》(DeweyDecimalClassification)(美国国会图书馆分类法》(LibraryofCongressClassification)或者采用自行编制的分类法。分类表的作用:指导存储文献,正确标引出分类号;帮助从分类的角度检索某一类文献。安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室中图法分类表基本结构A马列主义、毛泽东思想、邓小平理论22大类B哲学C社会科学总论D政治、法律E军事F经济G文化、科学、教育体育H语言、文字

I文学

J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学Z综合性图书马列主义、毛泽东思想5大部哲学社会科学综合性图书自然科学2级类目TB一般工业技术TD矿业工程TE石油、天然气工程TF冶金工程TG金属学、金属工艺TH机械仪表工业TJ武器工业TK动力工业TL原子能技术TM电工技术TN无线电电子学、电讯技术TP自动化技术、计算技术TQ化学工业TS轻工业、手工业TU建筑科学TV水利工程3级类目TU建筑基础科学TU19建筑勘测TU2建筑设计TU3建筑结构TU4工力学、地基基础工程TU5建筑材料TU6建筑施工机械和设备TU7建筑施工TU8房屋建筑设备TU9地下建筑TU97高层建筑TU98区域规划、城市规划TU99市政工程F经济F0政治经济学F1世界各国经济概况、经济史、经济地理F2经济计划与管理F3农业经济F4工业经济F5交通运输经济F6邮电经济F7贸易经济F8财政、金融安徽工业大学图书馆信息检索教研室索书号G252.7/H66、TP311.5/H226

HeadFirst设计模式(中文版)网络信息检索与利用TP311.5H226G252.7H68安徽工业大学图书馆信息检索教研室2)主题语言主题语言:是一种描述语言,即用自然语言中的名词、名词性词组或句子描述文献所论述或研究的事物概念。例如:我们在搜索引擎中查找文献时输入的“汽车燃料”就是主题语言的一种。特点:直接用词语来表达各种概念。通过概念组配用于表达任何专指概念。具有较高的专指性,便于特性组配检索,直指性强。安徽工业大学图书馆信息检索教研室主题语言的分类叙词:最有代表性的主题语言,由规范化的概念及其关系组成。叙词表关键词:题目、摘要、全文中出现的,对表述文献主题内容具有实质意义的词汇,是未经规范化的自然语言词汇。主题语言安徽工业大学图书馆信息检索教研室叙词语言的概念:叙词语言是以自然语言为基础,规范化的基本概念,以概念组配为基本原理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。叙词是从信息内容中抽选出来的能够概括表达信息内容基本概念的名词或术语,是不可再分的基本概念单元。如:“反坦克地雷”中的“反坦克武器”和“地雷”;“面向公众的电子政务信息资源的开发与管理”中的“公众服务”、“信息资源”、“电子政务”等都是叙词。安徽工业大学图书馆信息检索教研室叙词语言的特点:叙词语言具有直观性、专指性强和组配性高等优点。尤其是组配性,显示出更强的多维检索功能。无论多复杂的文献主题概念,都可以通过叙词的组配,实现有效的检索。例如,“数控车床”这一概念,就可以用“数控机床”和“车床”的概念组配来表达。安徽工业大学图书馆信息检索教研室叙词表:叙词表是将叙词按一定规则编制而成的,反映叙词的语义规范和语法规则。不同的叙词表其编制内容和方式都不同,如INSPEC叙词表有字顺表(Alphabeticdisplayofthesaurusterms)和词族表(Hierarchicaldisplayofthesaurusterms),而《汉语主题词表》除叙词字顺表外,还有词族索引、范畴索引、英汉对照索引等三个辅助索引。叙词字顺表是叙词表的主表,是正确选择叙词的依据。安徽工业大学图书馆信息检索教研室叙词表中的关联关系:Y(用)USE指引正式主题词D(代)UF指引非正式主题词S(属)BT指引上位主题词F(分)NT指引下位主题词C(参)RT指引相关主题词Z(族)CC指引族首主题词(最上位词)安徽工业大学图书馆信息检索教研室《汉语主题词表》是我国第一部大型的综合性的叙词表,由中国科技信息研究所和北京图书馆负责主持,1975年开始编制,1980年正式出版。分为社会科学、自然科学和附表3卷,共10个分册,全表收录主题词108568个。其中正式主题词91158个,非正式主题词17410个,词族数3707个,一级范畴数58个,二级674个,三级1080个。

安徽工业大学图书馆信息检索教研室电磁波测距[39C]ElectromagneticdistancemeasurementD电子测量法无线电测距物理测距F光电测距雷达测距微波测距S精密测距Z测量*C三边测量电磁簇射ElectromagneticshowersY电磁级联簇射叙词表编排体系结构举例字顺表的结构:款目主题词范畴号非正式主题词英文主题词下位主题词上位主题词族首词相关词正式主题词非正式主题词安徽工业大学图书馆信息检索教研室关键词语言关键词是从文献的标题、文摘和正文中直接抽取的,能够揭示和表达文献主题内容并具有实质意义的未经规范化处理的自然语言词汇。关键词语言以关键词作为文献内容的标识和检索依据。关键词语言属于自然语言,未经严格的规范化处理,不像标题词、叙词一样编有词表,一般只列有“非关键词表”(stopwordslist)来限制关键词的选择。安徽工业大学图书馆信息检索教研室关键词语言的优点是适用于计算机自动化编排各种关键词索引,从而加速文献的标引速度和缩短检索工具出版的滞后时间。如美国《化学文摘》的期关键词索引,就是在卷主题索引出版前提供了一条迅速、便利的关键词检索途径。由于关键词未经规范化处理,存在的明显缺点是检索质量较差,可能会在标引和检索之间造成歧义或误差,从而导致漏检或误检。安徽工业大学图书馆信息检索教研室检索语言小结外部特征书名/刊名著者名/团体著者出版事项代码/序号内容特征分类语言分类表主题语言主题词表检索语言安徽工业大学图书馆信息检索教研室检索语言实质就是检索途径。检索途径分为:分类途径、主题途径、著者途径和其他途径。安徽工业大学图书馆信息检索教研室2.2.3检索提问式和运算符例如:检索关于“流动换热的湍流模型”的文献“湍流模型”和“流动换热”安徽工业大学图书馆信息检索教研室检索策略检索策略是指为实现检索目的而制定的全盘计划和方案,是对整个检索过程的谋划和指导。主要任务是处理检索提问的逻辑关系与合理的查找步骤。常用的联机检索策略主要有积木型、引文珠型增长、逐次分馏等。安徽工业大学图书馆信息检索教研室积木型检索策略把用户的检索请求或检索课题剖析成若干个不同的概念面,先分别对这几个概念面进行检索,并在每个概念面中尽可能和多地的列举相关词、同义词、近义词,用布尔算符“OR”连接成一个总检索公式,类似把各个积木块拼成图案。积木型策略能提供比较明确的检索逻辑过程,容易理解和执行,一般用于比较复杂的检索课题。安徽工业大学图书馆信息检索教研室引文珠形增长检索策略从已知的关于检索课题的少数几个专指词开始检索,以便至少检出一篇命中文献或一条相关信息,然后审阅这批文献或信息条目,从中选出一些新的相关检索词,补充到检索式中。这些词加入到检索式之后,就能查出其他新的命中结果,不断重复上述过程,直到找不到其他适合包含于检索式的附加词为止,或者已经得到了数量适宜的命中结果。引文珠形增长策略具有很强的人机交互性,可以使检索式以比较生动的方式生成并得到不断丰富。安徽工业大学图书馆信息检索教研室逐次分馏检索策略先确定一个相当大的、范围较广的检索初始对象集合,然后提高检索的专指度,得到一个较小的命中结果集合;继续提高检索式的专指度,一步一步缩小命中结果集合,直到得到数量适宜、用户满意的结果。逐次分馏策略的特点使检索操作比较主动,漏检较少。安徽工业大学图书馆信息检索教研室检索提问式和运算符检索提问式:是检索策略的具体表达,是用检索系统规定的各种算符将各个检索条件连接而形成的一种逻辑表达式。检索运算符:在计算机检索系统中,为了制定一个计算机可识别的检索方案,这就需要用计算机信息检索系统规定使用的组配符号(也称为算符operator)。湍流模型+流动换热安徽工业大学图书馆信息检索教研室常用检索运算符号布尔逻辑算符通配符与截词符字段限制符位置限制符安徽工业大学图书馆信息检索教研室1)布尔逻辑算符NOT逻辑非:ANOTB表示命中结果为条件A中不包含条件B的部分AND逻辑与:AANDB表示命中结果为同时满足条件A和BOR逻辑或:AORB表示命中结果为满足条件A或B>>ABA-BNOTABA*BANDABA+BOR安徽工业大学图书馆信息检索教研室布尔运算符优先级比较:有括号时:括号内的先执行;无括号时:NOT>AND>OR例:检索“唐宋诗歌”的有关信息。关键词:唐、宋、诗歌;检索表达式(以CNKI为例):TI=唐andTI=宋andTI=诗歌(TI=唐orTI=宋)andTI=诗歌TI=唐andTI=诗歌orTI=宋andTI=诗歌错误表达式:

TI=唐orTI=宋andTI=诗歌TI=唐orTI=宋orTI=诗歌唐and宋or诗歌布尔逻辑运算符优先级安徽工业大学图书馆信息检索教研室布尔逻辑式的变换处理*逆波兰变换法(福岛法)一般表示法(中缀)正波兰表示法(前缀)逆波兰表示法(后缀)A+B*C+A*BCABC*+(A+B)*(C+D)*+AB+CDAB+CD+*(A+B)*C+(D-E)*F+*+ABC*-DEFAB+C*DE-F*+准波兰变换法——占用工作区最少的逆波兰表达式范式法——任一布尔逻辑检索式都可以化成与之等价的析取(或合取)范式安徽工业大学图书馆信息检索教研室例:检索“打印机驱动程序”方面的文献。(以CNKI为例)查询关键词:打印机、驱动程序检索表达式:TI=打印机ANDTI=驱动程序布尔逻辑检索举例安徽工业大学图书馆信息检索教研室例:检索“微型计算机在图书馆中的应用”方面的有关信息。(以CNKI为例)查询关键词:微型计算机、微机、图书馆检索表达式:(KY=微型计算机orKY=微机)andTI=图书馆(KY=微型计算机orKY=微机)andTI=图书馆安徽工业大学图书馆信息检索教研室例:检索有关“非师范类大学生信息素养”方面的文献信息。(以CNKI为例)检索式:TI=大学生andTI=信息素养not师范安徽工业大学图书馆信息检索教研室布尔逻辑算符小结逻辑非缩小检索范围:逻辑非用于排除不希望出现的检索词,能够缩小命中文献范围,增强检索的准确性。逻辑与缩小检索范围:增加限制条件,增加检索的专指性,缩小提问范围,减少文献输出量,提高查准率。逻辑或扩大检索范围:增加检索条件,放宽提问范围,增加检索结果,起扩检作用,提高查全率。安徽工业大学图书馆信息检索教研室注意事项在不同的数据库中,所使用的逻辑符号可能是不同的,有的用“and、or、not”有的用“*、+、-”。一些检索工具会完全省略任何符号和关系,直接把布尔逻辑关系隐含在菜单中。一些网络检索工具如搜索引擎甚至用“︺、,、-”(即空格、逗号、减号)来表示。在不同的数据库中,逻辑运算符的优先级规定也不相同,使用时应关注具体数据库的规定。安徽工业大学图书馆信息检索教研室2)通配符和截词符截词检索是指在检索词的合适位置加上截词符或通配符进行截断,表示检索词的某一部分允许有一定的词形变化,让计算机按照检索词的部分片段同索引词进行对比,以提供族性检索的功能。通配符和截词符主要用于西文电子资源的检索。各数据库使用的通配符和截词符大同小异,举例说明如下:安徽工业大学图书馆信息检索教研室EI的通配符和截词符:算符含义实例*利用它可以只输入检索词的起始部分,而实现以族词的检索也可以替代词中的任意字符。Alter*可命中Alter、Alteration、Altercate、Alternant、Alternate、Alternator等sul*ate可命中sulphate、sulfate?可以替代单个字符wom?n可表示woman、women$自动取词根运算符$management可命中manage、managed、manager、managers、managing、management安徽工业大学图书馆信息检索教研室EBSCO的通配符和截词符算符含义实例*利用它可以只输入检索词的起始部分,而实现以族词的检索;也可以用在两个词之间表示插入任意一个单词。comput*可命中computer、computers、computerize、computerization;amidsummer*dream可检出:amidsummernight'sdream.?用于替代单个字符ne?t可命中neat,nestornext#表示至多可以有一个字符colo#r可表示color或colour安徽工业大学图书馆信息检索教研室3)字段限制符限定检索字段是用字段限制符指定检索词出现在记录中的哪一个字段。检索时,计算机只对限定字段进行查找。常用的字段限制符有前缀字段限制符和后缀字段限制符。前缀字段限制符格式:字段名=检索词后缀字段限制符格式:检索词/字段名检索词

wn

字段名字段限制符一般用于高级检索或专家检索。安徽工业大学图书馆信息检索教研室数据库中可供检索的字段通常分为基本检索字段和辅助检索字段。基本检索字段主要有TI(题名)、AB(文摘)、DE(叙词)、SU(主题词)、标识词(ID)和KW(关键词),适用于各种数据库。辅助检索字段主要有AU(著者)、JN(刊名)或JA(刊号)、LA(语种)、BN(国际标准书号)、SN(国际标准刊号)、CC(分类类目)、CS(机构)、DT(文献类型)或PT(出版物类型)、PY(出版年)、SO(来源出版物)等字段。安徽工业大学图书馆信息检索教研室前缀字段限制符举例ScienceDirect:CNKI:

TI=中国andKY=生态文明and(AU%胡+李)

可以检索到“篇名”包括“中国”并且关键词包括“生态文明”并且作者为“李”姓和“胡”姓的所有文章。安徽工业大学图书馆信息检索教研室后缀字段限制符举例财务管理/TI——查找题名中包含“财务管理”的文献。EI中用后缀字段限制符“wn”,如:{testbed}wnALLAND{atmnetworks}wnTI(windowwnTIANDsapphirewnTI)ORSakamoto,K*wnAU安徽工业大学图书馆信息检索教研室4)位置限制符位置检索又称邻近检索,主要是通过检索式中的位置限制符来规定多个检索词在结果中的相对位置。一般用于高级检索或专家检索。例如检索“生物防治”的文献,若用检索式“biological*control”检索,则会将“抑制生物”(controlbiological)的文献也查出来,这显然不是所需文献。位置限制符主要有:相邻位置算符(W)、(N),句子位置算符(S),字段算符(F)。安徽工业大学图书馆信息检索教研室(W)算符

)加一个自然数n,表示此算符两侧的检索词允许插入最多n个词,且词序不可变。如biologicalW0control相当于检索biologicalcontrolCDW0ROM相当于检索CDROM或CD-ROM。taxW8reform

可以是taxreform、tax(8个单词)reform

但不能是reformofincometax。

安徽工业大学图书馆信息检索教研室(N)算符N加一个自然数n,表示两词间可插入最多n个词,词序可变。如检索式environmentN2protection可检索出“environmentprotection”、“environmentoftheprotection”、“environmentofwaterprotection”、“protectionofforestenvironment”taxN5reform可命中taxreform以及reformofincometax

安徽工业大学图书馆信息检索教研室(S)、(F)算符

(S)是sentence的缩写,表示两个检索词须同时出现在文献记录的同一子字段中,两词的词序不限,两词间插入词的数量不限。(F)表示此算符两侧的检索词必须同时出现在信息记录的同一个字段内,两词的词序不限,两词间插入词的数量不限。用此算符时须指定所要查找的字段,如题名字段、文摘字段、叙词字段等。例如digital(F)computer/TI表示在题名字段(TI)中同时出现这两个检索词的才算命中信息。安徽工业大学图书馆信息检索教研室算符小结布尔逻辑算符AND、OR、NOT截词符和通配符*、?、$、#字段限制符前缀、后缀位置限制符W、N、S、F安徽工业大学图书馆信息检索教研室例1:汽车替代燃料vehiclealternativefuel、substitutivefuelforautomobiles、methanolgasoline、ethanol、gasoholvehiclealternativefuel((vehicle$alterfuel)or(substitutivefuelforautomobiles))and(methanolgasolineorethanolorgasohol)安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室算符应用例2:在EBSCO数据库检索中,某一用户需检索有关“数字图书馆与信息检索、参考咨询”方面的文献信息,检索要求:题名或文摘中包含数字图书馆digitallibrary,数字图书馆要求考虑单复数,主题包含信息检索“informationretrieval”或参考咨询reference,请编制其检索策略(检索式)。检索式:(TIdigitallibrar*orABdigitallibrar*)andSU(referenceorinformationN2retrieval)安徽工业大学图书馆信息检索教研室安徽工业大学图书馆信息检索教研室2.4检索步骤2.4.1信息检索五步走

2.4.2

如何选择信息源

2.4.3信息获取的思路安徽工业大学图书馆信息检索教研室问题1应按照什么步骤完成信息检索?信息检索过程是一个检索操作过程,如选择数据库、确定关键词、构造检索式等?╳这种对信息检索过程公式化的理解,不能帮助我们真正把握解决问题的思考方式,也就无法产生一个全局的检索思路,以至于最终无法有效实现检索目标。信息检索实质是解决信息问题,信息检索的一般步骤实际上是提出问题和解决问题的过程。需要具备一定信息素养,结合一定信息技术使用能力,并在检索过程中将信息成功应用于批判性思考中,最终解决问题。安徽工业大学图书馆信息检索教研室2.4.1信息检索五步走第一步:界定问题第二步:选择信息源第三步:制定检索策略并实施检索第四步:评价检索结果第五步:分析、利用信息安徽工业大学图书馆信息检索教研室五步进阶1.界定问题5.分析、利用信息4.评价检索结果3.制定策略并检索2.选择信息源安徽工业大学图书馆信息检索教研室第一步界定问题

界定问题的过程首先需要根据待完成的任务,确定信息问题,然后根据信息问题,确定信息需求。自己是否完全理解待解决问题的相关概念含义?需要查找哪些方面的信息?需要第一手即时消息还是经过加工的信息?最终问题解决后应该是一个什么样的报告类型?安徽工业大学图书馆信息检索教研室课题分析分析检索目的与要求检索目的和要求大体可分成三种类型:一是普查型,需要全面收集有关某一主题的文献资料。这类需求具有普查、回溯的特点,要求尽可能高的查全率。“全”二是攻关型,需要收集有关某一主题的某一特定方面的文献资料,其目的在于解决科研生产中的关键问题。这类需求并不强调查得文献的数量,但需要查得的文献具有较强的专指性。“准”三是探索型,需要了解和掌握某一领域的最新研究动向或研究成果,要求查到的文献资料具有新颖及时的特点,而对查全率和查准率不一定有很高的要求。“新”安徽工业大学图书馆信息检索教研室分析主题内涵在明确检索目的的基础上,找出研究课题所涉及的主要内容和相关内容,形成主要概念和次要概念作为检索词。①根据检索课题所涉及的学科专业和技术内容选词,少数课题可直接选用课题名称中的主要概念作为检索词。②分析主题,找出课题所包含的显性概念和隐含概念。将分析得到认为最关键的概念定为检索关键词,排除无关概念和重复概念。

③确定包含主题概念的上位词、近义词或下位词。④从待检数据库和检索工具的词表中选取规范化的词或词组。选定可能包含检索主题的组织或机构。安徽工业大学图书馆信息检索教研室明确信息需求的类型、范围分析课题的特点,确定检索的地理范围、时间段、文献类型等;预期所需文献信息数量等。掌握已知条件初步确定检索用词;是否对特定的作者、专家学者的研究感兴趣?

是否有特定的出版机构的文献与你的研究主题相关?其它条件?安徽工业大学图书馆信息检索教研室第二步:选择信息源

需要考虑可能存在那些信息源?哪些信息源又是我可获得的?在这些可获得的资源中,哪些是比较易得而有意义的?最终完成信息源选择的过程。选择信息源主要是确定信息源类型及其检索系统的过程。首先确定所有可能解决问题的信息源,然后加以比较,确定其优先顺序,并选择包含各类信息源的检索系统。安徽工业大学图书馆信息检索教研室例如,你需要基于学术信息写一篇综述文章,该利用的信息源是:

A.学术期刊B.杂志C.报纸D.文献数据库某产品要出口到美国,需要查阅的信息源是:

A.标准信息B.科技报告C.中国专利与商标信息D.美国专利与商标信息安徽工业大学图书馆信息检索教研室第三步制定检索策略并实施检索信息源中包含的信息可能是海量的,如果在着手开始检索之前没有一个确定的检索策略,可能很快你就会在信息中“迷失”。确定好需要查找的信息源及查找的顺序之后,就需要确定具体的检索策略,根据拟定好的优先顺序检索文献信息。检索策略,就是在分析检索课题、确定检索的数据库以及检索用词的基础上,明确检索词之间的逻辑关系和查找步骤的科学安排。检索式(即检索用词与各运算符组配成的表达式)仅仅是检索策略的表达和实现方式。安徽工业大学图书馆信息检索教研室检索表达式是用来表达用户检索提问、并且计算机能够执行检索的指令。一般来说,检索表达式的构造与检索系统所提供的检索点、检索技术有关。在计算机检索过程中,提问标识与存储标识之间的对比匹配是由机器自动进行的,检索的核心就是构造一个既能表达检索课题需求,又能为计算机识别的检索表达式。编制检索表达式,关键是准确、合理地运用逻辑算符、位置算符、通配符、截词符、字段限制符。安徽工业大学图书馆信息检索教研室实施检索并处理检索结果实施检索,将所获得的检索结果加以系统整理,筛选出符合课题要求的相关文献信息;或者调整检索策略,获得更好的结果。选择检索结果的著录格式,辨认文献类型、文种、著者、篇名、内容、出处等项记录内容,输出检索结果。原始文献的获取①利用二次文献检索工具获取原始文献②利用馆藏目录和联合目录获取原始文献③利用文献出版发行机构获取原始文献④利用文献著者获取原始文献⑤利用网络获取原始文献安徽工业大学图书馆信息检索教研室馆际互借与文献传递馆际互借:ILL(InterlibraryLoan)是馆与馆之间的图书信息资料共享合作,是图书馆(文献信息服务中心)开放服务(openservice)的一个重要方面。文献传递:DD(DocumentDelivery)是利用各种通信手段、从各种文献服务中心获取文献信息的有效手段。其服务模式多样,比如:邮递(mail),快递(expressmail),电子邮件(E-mail)等。本馆文献传递负责人:徐惠老师电话:2311642-505安徽工业大学图书馆信息检索教研室网络环境下的资源共享联机检索中心的服务

提供多种方式的订购、传递服务

提供全文数据检索网络化图书馆的合作

中国高等教育保障体系CALIS:

上海高校网络图书馆SCIUT:http://00/index.htm

安徽工业大学图书馆信息检索教研室我国主要学术性图书馆和文献情报中心中国国家图书馆/中国科学院文献情报中心/中国科学技术信息研究所中国国防科技信息中心/中国标准情报中心/homepage/gov/zgbzqbzx.htm

安徽工业大学图书馆信息检索教研室中国专利信息中心/cpic/

中国专利文摘数据库/patent

北京大学图书馆/清华大学图书馆哈工大图书馆

安徽工业大学图书馆信息检索教研室第四步评价信息在对不同信息源进行检索之后,取得的文献信息数量可能相当庞大,内容也有相互重复甚至冲突的地方。这就需要有一定的评价方法对信息进行筛选,找到那些来源可靠,内容相关且详尽的文献,剔除错误、过时、不相关的信息。检索效果评价是根据一定评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一步完善检索工作的过程。常用的评价指标有:收录范围、查全率、查准率、响应时间、用户负担和输出形式。其中最主要的指标是查全率和查准率。安徽工业大学图书馆信息检索教研室查全率R(Recallratio)

查准率P(precisionratio)检索结果涉及四个方面:相关文献、非相关文献、被检出的文献和未被检出的文献。安徽工业大学图书馆信息检索教研室查全率R(Recallratio)检出的相关文献数与系统内的相关文献总数之比(W·佩里和A·肯特,1956)。查准率P(precisionratio)检出的相关文献数与检出的文献总数之比,它是衡量一个检索系统的信号噪声比,测度检索系统拒绝非相关文献能力大小的一项指标(佩里和肯特,1956)。安徽工业大学图书馆信息检索教研室实验结果表明查全率与查准率之间存在互逆关系,即提高查全率会降低查准率,反之亦然。在同一个检索系统中当查全率与查准率达到一定阈值(即查全率60%~70%,查准率40%~50%)后,二者呈互逆关系,即查全率提交,查准率就会降低,反之依然。因此,检索的最佳状态就是在查全率为60%~70%且查准率为40%~50%时。安徽工业大学图书馆信息检索教研室影响查全率和查准率的主要因素客观原因(针对检索系统):系统内文献不全;收录遗漏严重;索引词汇缺乏控制;词表结构不完善;标引缺乏详尽性,没有网罗应有的内容;文献分类专指度缺乏深度,不能精确地描述文献主题;组配规则不严密。主观原因(针对检索者):检索课题要求不明确;检索信息源选择不恰当;检索途径和方法过少;检索词缺乏专指性;检索词选择不当;检索式不当或错误等。安徽工业大学图书馆信息检索教研室相关性、适用性相关性是用户判断文献信息与实际信息需求之间关系的标准。现实的信息系统,不是回答用户提问本身(即用户真实需求),而是回答用检索式表达后的信息提问,虽然检出的是与信息提问相关的信息,但不一定是真正切题(符合用户真实需求)的信息,用户只有在阅读文献信息后才能对其切题性作出判断。适用性是反映特定时间内文献信息满足用户需求的价值。强调能够对用户的实际需要的满足程度或能够给用户带来的效果和产生的效益。安徽工业大学图书馆信息检索教研室新颖率:从检索系统中检出来的对用户而言含有新颖信息的文献件数与文档中总相关文献数、或检出的总文献数之比。错检率:从检索系统中检出来的无关文献量与系统中无关文献总量之比,它与专指度存在互补关系。根据上述分析评价,我们可以调整检索策略,改善检索结果。安徽工业大学图书馆信息检索教研室第五步分析、利用信息筛选后的检索结果来源广泛,内容涉及方方面面。如何有效组织整理,以提炼出一个综合性的信息内容,完成报告的编撰是这一步骤的主要工作。此时选用文献管理工具将检索结果有效组织,将极大减少工作量。同时通过进一步阅读确定:哪些信息是切合需要的?哪些信息表述内容之间存在冲突,需要进一步考察?然后依据相关规范正确引用文献资源,最终形成文字性的研究成果。安徽工业大学图书馆信息检索教研室2.4.2如何选择信息源——使用航海指南针信息检索无时不有、无处不在。信息源种类繁多、特点各异。下面介绍:如何界定问题如何选出最有效的信息源安徽工业大学图书馆信息检索教研室假定这样一个生活场景:你所在的单位主要从事车用燃料的生产和销售,近年来由于生产原料价格上涨导致利润率下降,并且有控制碳排量的要求,开始考虑结合市场形势开拓“车用替代燃料”的生产。需要你在较短的时间内初步对目前车用替代燃料的应用情况作一个预调研,并以报告的形式提供给同事参考。这一任务该如何完成?安徽工业大学图书馆信息检索教研室2.4.2.1界定问题界定问题是信息检索的第一步其内涵主要包括:1.分析研究问题2.建立背景知识3.拟定主题概念安徽工业大学图书馆信息检索教研室1)分析所研究问题对研究问题的了解越多,所走的弯路越少明确研究问题需要查找的文献类型、学科领域、地域范围和时间阶段。明确研究目标,以确定检索的深度和广度。安徽工业大学图书馆信息检索教研室研究课题分析——以“车用替代燃料的应用情况研究”为例研究问题车用替代燃料应用情况研究研究目标形成调研报告供公司参考,以进一步考察生产车用替代燃料的可行性时间范围近10年地域范围国内、国外背景事件车用替代燃料研究的兴起和广泛应用安徽工业大学图书馆信息检索教研室经过初步分析之后,再进一步思考以下几个问题,可以更快、更准确地把握研究问题:研究问题本身包含的主题概念有哪些?研究问题中可能包含哪些子问题,涉及哪些学科领域?子问题是否过多,需要缩小研究问题的范围?研究问题是否过于狭窄,意义不大,需要扩大研究问题的范围?需要原始资料或经过专家学者整理过的资料?一般性信息还是学术性信息?对信息的新颖性要求多高?地域范围的选择是应该越宽越好,还是越典型越好?安徽工业大学图书馆信息检索教研室2)建立背景知识研究问题分析过程中的许多问题往往不能一步回答得比较准确。这时就需要通过初步的阅读和检索,建立背景知识。安徽工业大学图书馆信息检索教研室阅读与研究主题相关的概览性资料,是建立背景知识的最佳渠道。概览性资料通常出现在三次文献中,如百科全书、字词典及年鉴等参考资料中。建立背景知识的过程往往也是辨别待解决信息问题研究的必要性及可行性的重要时机。安徽工业大学图书馆信息检索教研室在本题中,如果对“车用替代燃料”的具体含义并不清楚,则需要查找资料进一步理解。可利用网络搜索引擎如百度,用“车用替代燃料”作检索词查得:中长期车用替代燃料的主体将是煤基燃料、生物燃料和天然气燃料。包括煤直接液化、煤间接液化、二甲醚、生物燃料、甲醇汽油、天然气合成油、压缩天然气、液化天然气、液化石油气等。进一步的文献研究可知,“车用替代燃料”包括的能源类型相当丰富。总体上可分为三类:一是含氧燃料(醇/醚/酯);二是合成油(BTL/CTL/GTL);三是气体燃料(甲烷气/合成气/氢气)。安徽工业大学图书馆信息检索教研室?在规定的时间内能完成吗?根据具体要求、目标和原有的知识结构我们选其中一点——“甲醇燃料”为研究对象。信息问题车用替代燃料别名车用代用燃料包含的主题概念天然气、生物柴油、生物燃料、煤基燃料、醇类燃料(甲醇燃料、乙醇燃料)、二甲醚(DME))、天然气合成油、合成柴油、气体燃料、压缩天然气(CNG)、液化天然气、液化石油气(LPG)、燃料电池、电池、清洁燃料、氢能、电能、纯电动、混合动力等安徽工业大学图书馆信息检索教研室提高查全率、查准率的重要方法信息问题的主题概念,应尽可能罗列全相关的同义词、近义词加以表述。对于要查找外文资料的问题,还要将其翻译成所需语言。如何实际操作呢?3)拟定主题概念安徽工业大学图书馆信息检索教研室我们可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论