版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一节信息检索及其类型第二节信息检索语言第三节信息检索技术第四节信息检索策略第二章信息检索基础知识第一节信息检索及其类型第二章信息检索基础知识第一节信息检索及其类型一、信息检索的含义二、信息检索的类型第一节信息检索及其类型一、信息检索的含义一、信息检索的含义
信息检索:是指将信息(主要指文献信息)按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程。信息检索存储检索存储:是对信息进行著录、标引、整序,编制检索工具和建立检索系统的过程。检索:是指面向信息需求而进行高度选择性的查找过程。一、信息检索的含义信息检索存储检索存储:是对信息进行著录、检原始文献加工整理数据库提问检索输出存储检索原始文献加工整理数据库提问检索输出存储检索二、信息检索的类型(一)按检索内容划分2、数据检索
是以数据为检索内容的信息检索,要求从检索系统存储的大量原始调查数据和其它统计数据中查出所需的数字资料。1、书目检索
是以文献线索为检索内容的信息检索。二、信息检索的类型(一)按检索内容划分2、数据检索1、书目检3、事实检索
是以具体事项为检索内容的信息检索,要求从检索系统存储的各种原始信息资源中查出专门的事实材料。4、全文检索
即检索系统存储的是整篇文章或整本图书。5、图像检索
即以图形、图像或图文信息为检索内容的信息检索。6、多媒体检索
是以文字、图像、声音等多媒体信息为检索内容的信息检索。3、事实检索4、全文检索第二节检索语言一、检索的基本原理二、检索语言的定义三、检索语言的类型第二节检索语言一、检索的基本原理一、信息检索的基本原理
信息检索的核心是用户信息需求与文献信息集合的比较和选择,是两者匹配的过程。为了顺利实现这种匹配,两者必须依赖统一的交流“语言”,以此来描述文献信息内容的特征,同时也以此来描述用户需求特征。只有两者采用共同的“语言”,才能把文献特征的标识与需求特征的标识彼此对应,完成检索的标识匹配过程。这种信息交流中沟通双方的“语言”就是检索语言一、信息检索的基本原理信息检索的核心是用户信息需二、检索语言1.定义:
是从自然语言中精选出来的一整套词汇、符号,用来对文献内容和信息特征进行概括和规范的一种人工语言。它是文献信息工作者用来描述文献特征,检索者用来表达检索提问的语言,是沟通存储过程和检索过程的桥梁,是信息检索全过程得以顺利实现的语言保证。二、检索语言1.定义:2.检索语言所具备的功能(1)对文献的信息内容及其外表特征加以规范化的标引;(2)对内容相同及相关的文献信息加以集中或揭示其相关性;(3)可使文献信息的存贮集中化、系统化、组织化,便于检索者按一定的排列次序进行有序化检索;(4)便于将标引用语和检索用语进行相符性比较。2.检索语言所具备的功能(1)对文献的信息内容及其外表特3.检索语言的类型检索语言的类型表述文献外表特征的语言表述文献内容特征的语言题名责任者号码引文分类法主题法标题词法叙词法关键词法3.检索语言的类型检索语言的类型表述文献外表表述文献内容题名3.1分类检索语言分类检索语言:是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言.分类语言能反映事物的从属派生关系,便于按学科门类进行族检索。3.1分类检索语言分类检索语言:是用分类号和相应的分类款目名布尔逻辑运算符-德州学院图书馆课件3.2主题检索语言主题检索语言:是采用描述文献主题的语词排列主题标识,提供各种检索词语的途径。一般由主题词表及其编制和使用规则组成。3.2主题检索语言主题检索语言:是采用主题检索语言的基本类型1)标题法(Systemofsubjectheading)2)单元词法(Unitermindexing)3)叙词法(Descriptorindexing)4)关键词法(Keywordindexing)主题检索语言的基本类型1)标题法(Systemofsub第三节计算机信息检索技术一、布尔逻辑运算符组配检索二、截词检索三、字段限制检索四、位置运算符第三节计算机信息检索技术一、布尔逻辑运算符组配检索一、布尔逻辑算符组配检索布尔逻辑组配运算是采用布尔代数中的逻辑“与”逻辑“或”、逻辑“非”等运算符,将检索提问式转换成逻辑表达式,限定检索词在记录中必须存在的条件或不能出现的条件。凡符合布尔逻辑所规定的条件的文献,既为命中文献。一、布尔逻辑算符组配检索
布尔逻辑运算符————————————1、逻辑“与”2、逻辑“或”3、逻辑“非”布尔逻辑运算符1、逻辑“与”1.逻辑与(AND)*缩检假设A和B是两个检索词,则A*B表示A与B必须同时存在。运用“逻辑与”表达式,有助于明确限定检索范围。1.逻辑与(AND)*缩检假设A和B是两个检索词,则A*逻辑与(AND)*缩检例如用户想在题名中检索有关新闻美学的文献,如只输入“新闻”或“美学”,则命中文献太多,且有许多不是自己所要的。如果输入“新闻*美学”,则检索出题名中同时含有“新闻”和“美学”的文献,检索结果大大缩小。逻辑与(AND)*缩检例如用户想在题名中检索有关新闻美学1.逻辑与(AND)*缩检换一个角度看,“逻辑与”又能防止漏检。例如,用户输入“新闻美学”作为检索词,可命中《戈公振的新闻美学实践》这样的文献,但漏检了《新闻的美学属性》、《新闻标题中的美学》这些文献。如果用“新闻*美学”来进行检索,则上述三篇文献都检中。1.逻辑与(AND)*缩检换一个角度看,“逻辑与”又能防2.逻辑或(OR)+扩检A+B,表示A或B中任何一个词存在都可以(当然A和B同时存在也可以)。“逻辑或”表达式,有助于提高查全率2.逻辑或(OR)+扩检A+B,表示A或B中任何一个词存2.逻辑或(OR)+扩检例如某用户想查找研究杜甫的文献,检索途径选择题名后,输入“杜甫”,命中540篇。但考虑到研究杜甫的文献题名中未必都出现“杜甫”两字,也可能会出现“杜诗”、“李杜”,于是改用“杜甫+杜诗+李杜”表达式,结果命中608篇。2.逻辑或(OR)+扩检例如某用户想查找研究杜甫的文献,3.逻辑非(NOT)-缩检A-B,表示A必须存在,但不能有B。“逻辑非”表达式,主要用于排除那些与检索意图无关的文献。例如:“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。3.逻辑非(NOT)-缩检A-B,表示A必须存4.逻辑检索的优先级别当布尔运算符在一个检索式中连续出现时,它们的“级别”是不同的。大部分数据库是这样规定的:-优先级最高,*次之,+最低。例如要查找研究唐宋诗歌的文献,可以用“(唐+宋)*诗”、“唐*诗+宋*诗”,而不能用“唐+宋*诗”。“唐+宋*诗”查找的是含有“唐”的文献或者同时含有“宋”和“诗”的文献,这样就把涉及到的唐代、唐姓的文献都找出来了。4.逻辑检索的优先级别当布尔运算符在一个检索式二、截词检索截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。截词符一般用“?”、“*”、“#”表示二、截词检索截词检索是预防漏检提高查全率的一种常用检索技术,二、截词检索(一)根据截词的位置可以分为1、后方截词:用于前方一致的派生词检索。如:信息?则表示在数据库中含有信息、信息技术、信息检索等方面的文献记录均为命中文献。2、前方截词:用于后方一致的派生词检索。如:?经济则数据库中含有经济、工业经济、农业经济等方面的文献均为命中文献。二、截词检索(一)根据截词的位置可以分为二、截词检索3.中截词中截词也称屏蔽词。一般来说,中截词仅允许有限截词,主要用于英、美拼写不同的词和单复数拼写不同的词。如organi?ation可检索出含有organisation和organization的记录。由此可知,中截词使用的符号为"?",即用"?"代替那个不同拼写的字符。二、截词检索3.中截词有限截词
在检索词后面加上一个或一个以上(最多4个)的“?”,空一格,再加一个“?”。如:Comput????可检索出:Computer,Computers,Computing无限截词截去某个词的尾部,是词的前方一致比较,也称前方一致检索。在检索词(关键词、主题词)干后加1个截词符“?”或“*”。表示该词尾允许变化的字符数不受任何限制。
(二)按所截断的字符数目来分,分为有限截词(二)按所截断的字符数目来分,分为三、字段限制检索为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和命中率。如:riceinti(表示只在题目字段中查找文献)riceinde(只在主题词中查找)riceinab(只在文摘中查找)au=Smith,J.C(查作者为Smith,J.C的文章)py=1998(只查1998年的文章)la=Chinese(只查语种为中文的文献)三、字段限制检索为了缩小检索范围,可利用字段四、位置运算符With:设定需检索的两个词或词组在同一字段中,但不限制位置的先后。Near:设定需检索的两个词或词组在同一语句中,相对于“with”更接近。此外,在使用“near”运算符时,还可以在该运算符后添加一个数字以便进一步限定两个词之间的邻近程度,如“near3”设定需检索的两个词或词组在同一句子中且相隔不超过3个单词。四、位置运算符With:设定需检索的两个词或词组在同一字段中第四节信息检索策略信息检索的要领What?找什么?
Where?哪里找?
How?怎样找?第四节信息检索策略信息检索的要领第四节信息检索策略一、什么是检索策略二、常见的检索策略类型三、检索策略的制定四、检索效果的评价五、信息检索的实施第四节信息检索策略一、什么是检索策略信息检索的核心是用户信息需求与文献信息集合的比较和选择,是两者匹配(match)的过程。[通过检索语言匹配]信息检索的核心是用户信息需求与文献信息集合的比较和选择,是检索与查找、搜索有什么区别?检索查找、搜索英文Retrival或RetrievalSearch概念是从信息集合中识别与获取所需信息的过程。过程有一定的策略,是系统的查找资料。随机或更随意一些。技能需要一定的专门知识和技能简单,任意词用途课题或专题日常生活、学习检索与查找、搜索有什么区别?检索查找、搜索英文Retriva一、什么是检索策略所谓检索策略广义上是指为实现检索目的而制订的全盘计划和方案;狭义讲是指检索式。具体而言就是在明确检索目的、分析课题特征的基础上,选择合适的数据库和检索系统,拟定检索方案,确定检索词,构建检索提问式,执行检索并调整检索式,直至获得较满意的检索结果的全过程。一、什么是检索策略所谓检索策略广义上是指为实现检索目的而制订一、什么是检索策略狭义的检索策略特指检索过程中构建检索式的环节。包含检索词的确定,运算符的选择,检索字段的设定及限制选项的设置等检索式是用来表达用户提问的逻辑表达式,是检索策略的综合体现,通常由检索词和各种逻辑算符、位置算符及检索系统中规定的其他连接符号构成。一、什么是检索策略狭义的检索策略特指检索过程中构建检索式的二、常用的检索策略类型计算机检索策略是近几年才得到人们的重视和广泛研究的,很多检索策略只不过是某种检索方式或检索式构造方法,真正称得上检索策略的还不多。其中,美国人鲍纳(CharlesBourne)提出的检索策略影响较大:二、常用的检索策略类型计算机检索策略是近几年才得到人们的重视二、常用的检索策略类型1.积木型(BuildingBlock)把检索课题剖析成若干个不同的概念面。逐个查找各个概念。在每个概念面检索时尽可能全地列举同义词、近义词和相关词,用“OR”连接,构成针对每个概念面的检索式,即多个子检索式最后根据课题要求,选用合适的布尔算符把所有子检索式连接起来,构成一个总的检索式这种策略类似把各个积木块拼成完整图案,因此称为积木型检索策略例如:以检索“文献检索课与大学生信息素质培养的研究”课题为例。分析主题:1)确定检索本课题的主要概念:文献检索、信息素质、大学生2)“文献检索”的同义词、近义词或相关词:文献检索、信息检索、资源检索、情报检索、文检课、信检课等;3)“信息素质”的同义词、近义词或相关词有:信息素养、信息能力、信息意识、检索能力等;4)“大学生”的同义词、近义词或相关词:高校、高等院校、高等学校等5)(文献检索+信息检索+情报检索+资源检索+数据库检索+文检课+信检课)×(信息素质+信息素养+信息意识+信息能力+信息道德+检索能力)×
(大学生+高校+高等院校+高等学校)二、常用的检索策略类型1.积木型(BuildingBloc二、常用的检索策略类型2.引文珠形增长(CitationPearl-Growing)首先检索课题中较为核心的、最专指的概念面,以便至少检出一篇命中文献或相关信息浏览检出文献,从中选出新的相关检索词,补充到检索式中,重新检索出更多的命中文献然后再重复进行浏览选词再检索的过程,直到获得理想的最终检索结果为止这种策略最具交互性,检索词更具针对性,检索式在变化中完善,不足是检索费时较多二、常用的检索策略类型2.引文珠形增长(CitationP二、常用的检索策略类型3.逐次分馏(SuccessiveFractions)先用较宽泛的检索式,确定一个范围较广的命中文献初始集然后逐步利用各种检索限制或限定措施,逐渐提高检索式的专指度,缩小命中文献集,直到得到数量适宜、用户满意的命中文献集为止
例如:要检索有关“钙通道阻滞剂”的文献,其要求是1994年用英文发表的,且仅仅是有关人的,检出文献量最多不能超过20篇,步骤如下:①扩检主题词“CalciumChannelBlockers”,以便将钙通道阻滞剂及其下属主题词的有关文献全部检索出来;②分别用特征词人类(Human)和文献语种限制;③当文献量还大于所要求的数量时,再用年代限制;④最后再用主要标引主题词(MajorMeSH)限制。这种策略有利于平衡检索的全面性和准确性,如能较好地掌握检索限制和限定的尺度,可取得相当好的检索效果二、常用的检索策略类型3.逐次分馏(SuccessiveF检索策略在计算机检索中,检索策略直接关系到检索结果的成败,要想构造高水平的检索策略,不仅要求用户对检索系统十分了解,还需要对检索课题进行深入的分析并能灵活运用各种检索方法和技巧。检索策略在计算机检索中,检索策略直接关系到检索结果的成败,要三、检索策略的制定(1)列出检索课题的学科范围,主题内容及其检索目标。(2)选择相关数据库。(3)对检索提问进行概念分析,选择能代表各概念面的检索项,把提问的主题概念转换成适合检索系统的检索词,完成由概念表达到计算机系统所能接受的检索标识的转换。(4)拟订检索表达式(5)编排具体的检索程序
以上步骤不一定按顺序执行,可根据所检课题和所使用的检索系统的情况灵活运用。其中(3)和(4)是比较重要的。三、检索策略的制定(1)列出检索课题的学科范围,主题内容及其布尔逻辑运算符-德州学院图书馆课件四、检索效果评价
信息检索效果,就是利用检索系统进行检索服务时所获得的有效结果。它对用户利用信息的效果产生直接的影响,是对检索系统的性能和质量检验的尺度。评价信息检索效果,目的是为了准确掌握检索系统的各种性能水平,分析影响检索效果的因素,调节检索策略,改进检索系统的性能,提高检索效果,满足用户信息检索的需求。
四、检索效果评价检索效果评价(一)查全率(二)查准率(三)查全率与查准率的关系(四)影响查全率和查准率的因素检索效果评价(一)查全率查全率查准率
系统文献库中相关文献总量对于用户来讲几乎无从得知。由此可见,查全率和查准率很难成为用户自我评价检索效率的准绳查全率指标和查准率指标的评价标准
经验评价标准理论评价标准检出相关文献量-------------------------------×100%检索系统中相关文献总量检出相关文献量----------------------------×100%检出文献总量
通过相关领域从业的人员情况
通过手头掌握的信息资料查查系统文献库中相关文献总量对于用户来讲几乎无从得知查全率R,查准率PA点:检索词泛指性强,查全率较高,但查准率却非常低;B点:检索词专指性较强,查准率高,查全率降低;C,D两点:两种极端的折衷,查全率一般在60%一70%,查准率一般在40%一50%。查全率指标和查准率指标的评价标准
例:垃圾填埋中渗透液的处理方案一:检索词选择“垃圾”、“处理”,则查全率较高,但查准率较低,即处于A点;方案二:检索词选择“垃圾”、“填埋”、“渗透液”、“处理”,则查准率较高,而查全率却较低,即处于B点;方案三:检索词选择“垃圾”、“填埋”、“渗透液”,或选择“垃圾”、“渗透液”,则查全率和查准率处于折衷点,即C、D点。查全率R,查准率P查全率指标和查准率指标的评价标准例:垃圾查全率与查准率的关系查全率与查准率之间为互逆的关系通常采取措施提高查全率时会降低查准率反之,采取措施提高查准率时则会降低查全率在检索中要根据课题的实际需求,确定以查准为主还是以查全为主,或是寻求查准与查全之间的平衡。查全率与查准率的关系查全率与查准率之间为互逆的关系注意相关领域(如近缘学科、交叉学科和边缘学科)的检索,这是扩大检索范围、提高查全率非常重要而有效的途径。采用分类法或规范化词检索分类检索时可以采用更加宽泛的上位类号来检索增加同义词或近义词如:(lungcancerorlungcarcinoma)计算机检索时可采用模糊检索或运用逻辑“或”检索,放宽条件。减少使用逻辑“与”、逻辑“非”运算符尽可能选择信息收全率高的检索工具,如果一个工具不能满足信息查全率上的要求,应精心挑选多个工具进行检索选词不全是很重要的漏检原因。选词时除参阅相关词表以外,还应参阅已在手的相关文献或征询有关专家的意见。提高查全率的方法注意相关领域(如近缘学科、交叉学科和边缘学科)的检索,这是扩提高查全率的方法将检索词限定到文摘、全部字段等使用截词符。如:transplant*查全同义单词的不同拼写方式如:fibreorfiber查全缩写与全称如:“ang17”OR“angiotensin17”变词组检索为邻近检索如:“acutepancreatitis”改为acuteadj2pancreatitis提高查全率的方法将检索词限定到文摘、全部字段等提高检索词的专指度利用逻辑“非”剔除不需要出现的词语多使用逻辑“与”,减少逻辑“或”运算符限制检索词的出现字段利用文献外表特征进行限制。如增加机构名、人名、地名、出版物名称等作为限制检索项提高查准率的方法提高检索词的专指度提高查准率的方法提高查准率的方法将检索词限定到标题、关键词字段设定在数据库的某个或若干个子集中检索例:coreclinicaljournals子集(Medline) ClinicalMedicine大类(Elsevier)使用词组精确匹配运算符“”例:“renalfailure”提高查准率的方法将检索词限定到标题、关键词字段五、信息检索的实施信息检索五步走
如何选择信息源——使用航海指南针信息获取的思路
五、信息检索的实施信息检索五步走如何选择信息源——使问题1应按照什么步骤完成信息检索?信息检索过程是一个检索的操作过程,如选择数据库、确定关键词、构造检索式等?这种对信息检索过程公式化的理解,不能帮助我们真正把握解决问题的思考方式,也就无法产生一个全局的检索思路,以至于最终无法有效实现检索目标。问题1应按照什么步骤完成信息检索?信息检索过程是一个检索的(一)信息检索的一般步骤5索取原始文献4查找和阅读文献线索3确定检索途径、检索方法2选择检索工具或检索系统1分析检索课题、明确检索要求(一)信息检索的一般步骤5索取原始文献4查找和阅读文献线(一)信息检索五步走
信息检索实质是信息问题解决,信息检索的一般步骤也应是一个问题解决的过程。需要具备一定信息素养,结合一定信息技术使用能力,并在检索过程中将信息成功应用于批判性思考中,最终解决问题。(一)信息检索五步走信息检索实质是信息问题解决,信息检索的信息检索五步走分析和利用信息
选择信息源
界定问题
制定策略并实施检索评价信息
信息检索五步走分析和利用信息选择信息源界定问题制定信息检索五步走
假定这样一个生活场景:你所在的单位主要从事车用燃料的生产和销售,近年来由于生产原材料的上涨导致利润率有所下降,开始考虑结合现有市场形式开拓车用替代燃料的生产。需要你在较短时间内初步对目前车用替代燃料的应用情况做一个预调研,并以报告形式提供给相关同事参考。这一任务该如何完成?信息检索五步走假定这样一个生活场景:信息检索五步走第一步:界定问题
界定问题过程首先需要根据待完成的任务,确定信息问题。然后根据信息问题,确定信息需要。
自己是否完全理解待解决问题的相关概念含义?需要查找哪些方面的信息?需要第一手即时消息还是经过加工的信息?最终问题解决后应该是一个什么样的报告类型?信息检索五步走第一步:界定问题界定问题过程首先信息检索五步走第一步:界定问题
如何选用恰当的分类方式描述要解决的问题?•如何选用恰当的主题词描述要解决的问题?对问题的主题进行分析,形成相关的检索词(关键词)主要概念词次要概念词——检索词信息检索五步走第一步:界定问题如何选用恰当的分类方式描述要信息检索五步走第二步:选择信息源需要考虑可能存在那些信息源?哪些信息源又是我可获得的?在这些可获得的资源中,哪些是比较易得而有意义的?最终完成拟定策略的过程。选择信息源主要是个信息源的确定过程。首先确定所有可能的信息源,然后加以比较,确定其优先顺序。信息检索五步走第二步:选择信息源需要考虑可能存在那些信息源信息检索五步走第三步:制定检索策略并实施检索
信息源中包含的信息可能是海量的,如果在着手开始检索之前没有一个确定的检索策略,可能很快你就会在信息中“迷失”。确定好需要查找的信息源及查找的顺序之后,就需要确定具体的检索策略,根据拟定好的优先顺序检索文献信息。信息检索五步走第三步:制定检索策略并实施检索信息检索五步走第四步:评价信息——在对不同信息源进行检索之后,取得的文献信息数量可能相当庞大,内容也有相互重复甚至冲突的地方。这就需要有一定的评价方法对信息进行筛选,找到那些来源可靠,内容相关且详尽的文献,剔除错误、过时、不相关的信息。信息检索五步走第四步:评价信息信息检索五步走第五步:分析、利用信息
筛选后的检索结果来源广泛,内容涉及方方面面。如何有效组织整理,以提炼出一个综合性的信息内容,完成报告的编撰是这一步骤的主要工作。此时选用相关的工具将检索结果有效组织,将极大减少工作量。同时进一步通过阅读确定:哪些信息是切合需要的?哪些信息表述内容之间存在冲突,需要进一步考察?并依据相关规范正确引用文献资源,最终形成文字性的研究成果。信息检索五步走第五步:分析、利用信息(二)如何选择信息源——使用航海指南针
信息检索无时不有、无处不在信息源种类繁多、特点各异以下将主要介绍:如何界定问题如何选出最有效的信息源(二)如何选择信息源——使用航海指南针1.界定问题界定问题是信息检索的第一步其内涵主要包括:1)分析研究问题2)建立背景知识3)拟定主题概念1.界定问题1)分析研究问题确定研究问题需要查找的类型、所属领域、地域范围和哪一时期的文献资料明确研究目标,以确定检索的深度和广度对研究问题的了解越多,所走的弯路越少1)分析研究问题确定研究问题需要查找的类型、所属领域、地域范1)分析研究问题(1)明确检索的目的与要求撰写论文?项目研究?技术跟踪?申请专利?分析问题研究目标时间范围地域范围前景/事件·················1)分析研究问题(1)明确检索的目的与要求(2)
明确课题的主题或主要内容:要形成若干个既能代表信息需求又具有检索意义的主题概念,包括所需的主题概念有几个、概念的专指度是否合适,哪些是主要的,哪些是次要的,概念之间的关系如何,等等。(3)
课题涉及的学科范围:搞清楚课题所涉及的学科领域,是否是跨学科研究,以便按学科选择信息资源。(4)
所需信息的数量、语种、年代范围、类型等具体指标。(2)明确课题的主题或主要内容:要形成若干个既能代表信息需1)分析研究问题研究问题分析——以“车用替代燃料的应用情况研究”为例1)分析研究问题研究问题分析首先分析研究问题本身包含的主题概念有哪些?研究问题中可能包括哪些子问题,涉及哪些学科领域?子问题是否过多,需要缩小研究问题的范围?研究问题是否过于狭窄,意义不大,需要扩大研究问题的范围?需要原始资料或经过专家学者整理过的资料?一般性信息还是学术性信息?对信息的新颖性要求多高?地域范围的选择是应该越宽泛越好,还是越典型越好?首先分析研究问题本身包含的主题概念有哪些?2)建立背景知识
研究问题分析过程中的许多问题往往不能一步回答得比较准确这时就需要通过初步的检索,建立背景知识2)建立背景知识研究问题分析过程中的许多问题往往不能一步回2)建立背景知识阅读与研究主题相关的概览性资料,是建立背景知识的最佳渠道概览性资料通常出现在我们所说的三次文献中,如百科全书、字词典及年鉴等参考资源中建立背景知识的过程往往也是辨别待解决信息问题研究的必要性及可行性的重要时机2)建立背景知识2)建立背景知识以“车用替代燃料的应用情况研究”为例Amy对于“车用替代燃料”的具体含义并不清楚,需要查找资料进一步理解
登录百度-知道、百科搜索引擎,使用“车用替代燃料”为检索词,查到的内容——车用清洁替代燃料包括天然气、液化石油气、氢能源、二甲醚、醇类燃料及生物燃料进一步的阅读文献研究得知"车用替代燃料"包括的能源类型十分丰富2)建立背景知识以“车用替代燃料的应用情况研究”为例登录百度2)建立背景知识
在规定的时间内能完成么?2)建立背景知识在规定的时间内能完成么?2)建立背景知识3.如果继续上面的研究,将需要对列表中的概念进行逐一检索,工作量很大。这种情况下,考虑到时间等成本因素,可以缩小研究问题的范围,例如以“乙醇燃料”为研究对象4.进一步了解乙醇燃料的含义,例如可以登录百度百科,查得:车用乙醇燃料也称为乙醇汽油,是指在不含MTBE含氧添加剂的专用汽油组分油(由炼油厂或石油化工厂生产的用于调合车用乙醇汽油的调合油)中,按体积比加入一定比例(我国目前暂定为10%)的变性燃料乙醇,由车用乙醇汽油定点调配中心按国标GB18351—2004的质量要求,通过特定工艺混配而成的新一代清洁环保型车用燃料。2)建立背景知识3.如果继续上面的研究,将需要对列表中的概念3)拟定主题概念
对主题进行分析,形成相关的检索词上位词(概念范围大于它的词语)下位词(小于)同义词及相关词翻译检索词——如要查找外文资料
详细列出检索词既能极大地提高后续检索的查全率,也是避免漏检的重要方法。3)拟定主题概念对主题进行分析,形成相关的检索词如何拟定主题概念结合背景知识,用一小段话概括和阐述研究问题,从中找出有明确含义的专指名词,结合一定的查询操作逐个考虑该词能否作为检索词使用。得到主题概念之后,选取它的上位词(扩大检索范围)、下位词(缩小检索范围)、或者同义词(提高查准率)及相关词,将取决于检索策略。利用相关参考书(如《中国分类主题词表》等)帮助查找。如何拟定主题概念结合背景知识,用一小段话概括和阐述研究问题,3)拟定主题概念以“车用乙醇燃料的应用情况研究”为例3)拟定主题概念以“车用乙醇燃料的应用情况研究”为例主题概念分析方法之一:抽取检索词案例二:查找吸烟与肺癌关系研究的中文文献包含两个概念:吸烟、肺癌;检索式:吸烟AND肺癌
吸烟与肺癌检索式:(吸烟OR抽烟)AND(肺癌OR肺部肿瘤OR肺肿瘤)吸烟抽烟肺癌肺部肿瘤肺肿瘤主题概念分析方法之二:考虑同义词主题概念分析方法之一:抽取检索词案例二:查找吸烟与肺癌关系研主题概念分析方法之三---选取上下位类概念词垃圾的处理废弃物同义词下位类词检索式:(垃圾OR废弃物)AND(回收OR利用OR填埋OR掩埋OR焚烧)回收利用掩埋填埋焚烧案例三:查找垃圾的处理研究的中文文献主题概念分析方法之三---选取上下位类概念词垃圾的处理废弃物主题概念分析之四:舍弃重复概念案例四:全息防伪技术在包装方面的运用全息防伪包装and检索式:全息and包装主题概念分析之四:舍弃重复概念案例四:全息防伪技术在包装方主题概念分析注意事项排除比较泛指、检索意义不大的概念如“发展”、“趋势”、“现状”、“关系”少用外延十分宽广的概念如“工艺”、“分析”、“应用”、“有机物”、“无机物”、“重金属”有些检索概念已经体现在所使用的专业数据库中,这些概念也应该予以排除如在物理文献数据库中检索,“物理”一词应禁用主题概念分析注意事项排除比较泛指、检索意义不大的概念3)拟定主题概念
使用宽泛的“自由词”作为主题概念进行检索?还是使用规范的、被数据库生产商用来做标引的“主题词”进行检索?3)拟定主题概念使用宽泛的“自由词”作为主题概念进行检
自由词在检索初期可尽量使用。使用关键词作为主题概念进行检索。它的选取可以非常宽泛,只要在文章中出现过,就能被检索到。但由于是自由词,作者的使用非常随意,这就需要我们把可能出现的所有自由词尽可能考虑完全,才不至于漏检。在检索的初期建议尽量使用。当对问题有了一定了解后,可选取一些规范的、被数据库生产商用来做标引的“主题词”进行检索。如对于化学物质确定的课题,采用CAS登记号检索是一条既准、又全、又快的方式。此外,Ei中的“EiControlledTerm”和“EiMainHeading”途径均是由标引人员规范处理过的检索途径。自由词和主题词的使用自由词在检索初期可尽量使用。自由词和主题词的使用2.选择信息源了解现实生活中有那些可获得的信息源从何处去查找信息明确不同信息源所提供的信息在时效性、深度、广度等方面的不同特点2.选择信息源了解现实生活中有那些可获得的信息源从何处去查2.选择信息源让我们从大类上来梳理一下我们可用的信息源大致有哪些:1)纸质期刊2)各类文献数据库3)网页4)图书5)杂志、报纸6)特殊文献——学位论文、报告、专利、标准、会议录等2.选择信息源让我们从大类上来梳理一下我们可用的信息源大致有2.选择信息源上述几个信息源看起来都很熟悉是么?可是你了解他们各自不同特点,知道解决什么问题应该查找哪个或哪些信息源么?我们不妨设置几个场景,由你来考虑一下应该查找的信息源吧。场景一:查阅最近一个场次的NBA比分场景二:要参加某家公司的面试了,想了解下该公司的基本情况场景三:想查找影评,关于一部近期上映的电影,以决定周末是否去电影院看看场景四:写一篇小论文,需要了解计算机的发展历史场景五:写一篇有关商业智能系统研究现状的报告是否没有想像中那么容易区分?相信通过了解下文的信息交流模式及各信息源特点之后,你就能根据问题特点快速准确地选择信息源了。2.选择信息源上述几个信息源看起来都很熟悉是么?信息有学术信息和一般性信息之分学术信息交流是一个不断循环、螺旋前进的过程图:学术信息交流模式1)信息交流模式1)信息交流模式研究与发展发明保护会议研究报告期刊再现总结凝练二次再现研究开始半年一年两年专利会议论文会议论文库电子期刊库文摘库图书图书馆OPAC系统等研究与发展发明保护会议研究报告期刊再现总结凝练二次再现研究开1)信息交流模式一般性信息交流模式事件发生日周杂志年图书,电子书网页,报纸1)信息交流模式一般性信息交流模式事件发生日周杂志年图书,电以SARS(非典)为例说明情报信息的演变2003年春,我国部分地区发生传染性非典型肺炎疫情新闻报导:03年初,有关SARS的消息出现在报纸、网络、电视、广播等媒体上。《突发公共卫生事件应急条例》颁布会议、期刊:几个月后,学者专家陆续召开相关学术会议、发表会议论文。随后,各学术期刊上开始出现有关的文章。图书:一两年后,有关该主题或事件的书籍陆续出版。《非典型脑炎(SARS)冠状病毒基因全序列》/2003《应急反应的法学思考:“非典”法律问题研究》/2004百科全书:数年后,当对事件的认识已有定论,就会被收录在百科全书、统计汇编等参考资料中。如2008年在大英百科全书(EncyclopaediaBritannica)中记载了SARS事件以SARS(非典)为例说明情报信息的演变2)不同信息源的特点比较信息源信息内容检索渠道特点网页、报纸一般性信息;无法深入了解原因等较深入的问题搜索引擎提供事件发生经过的即时报道;不同来源的不同信息内容重复性高;网页动态变化,不能长期保存,引用困难杂志仍较强调报道性质索引方式较少,多依赖即时翻阅与报纸相比,对事件的报道较为详细,提供分析资料、统计等;通常不提供信息来源及参考文献纸质期刊详细、具有理论结构图书馆的OPAC系统研究对象新颖,可把握研究前沿;对特定主题进行深入探讨;提供参考文献等相关注释;提供客观的统计及图表文献数据库详细、具有理论结构数据库商提供的检索平台及图书馆提供的检索系统不受地域限制,检索、下载方便;与最新的到馆纸质期刊相比,国内期刊库往往存在一定的时间滞后,而国外期刊库往往先于纸质期刊图书提供深入性分析资料;系统的编辑相关文章图书馆的OPAC系统提供特定主题的深入剖析,结论成熟、论述全面;周期相对较长,信息具有一定的时滞;提供参考文献等相关注释2)不同信息源的特点比较信息源信息内容检索渠道特点网页、报纸3)信息源的选择策略对于一般消息,可以选择浏览网页、报纸了解事件的更全面、更详细的介绍,杂志是更好的选择对于要求一定深度的研究性信息问题,可以利用相关专业机构信息发布网站,如国家专利局、标准化委员会解决研究性信息问题时,会议论文、研究报告、专利、期刊、各类文献数据库、图书等成为重要的信息源3)信息源的选择策略对于一般消息,可以选择浏览网页、报纸3)信息源的选择策略
会议论文和研究报告虽然时效性相对较强,但不易获得,需要关注相关研究机构及研究人员,积累获取渠道。文献数据库中收录了多种连续性的期刊以及部分会议论文、研究报告,且经过专业人员的组织整理,文献内容深刻、全面,检索方便,获取容易,应作为检索的重要信息源。图书和期刊作为重要的学术研究产出形式,通过阅读能理清发展脉络、把握研究前沿,是重要的学术信息源。3)信息源的选择策略会议论文和研究报告虽然时效性相对较强,下列问题可以查阅哪些信息源?查“给力”“我爸是李刚”的前世今生最近一个场次的NBA比分朝韩炮仗和半岛危机的国外评论了解将要参加面试的公司的基本情况近期上映电影的影评,决定是否去看写一篇小论文,了解计算机的发展历史写一篇有关商业智能系统研究现状的报告97/23下列问题可以查阅哪些信息源?97/23是否所有与检索课题相关的资源都要进行检索,如果是,则不但考虑要检索一次文献和二次文献的数据库,而且对于网上其他资源,如搜索引擎/分类检索指南、学科导航、专题BBS等,也要查询。选择哪些学科的信息资源:例如查找生物学方面的信息,则可能会涉及医学方面的信息资源,因此要特别注意跨学科的问题。选择哪些语种的信息资源:是中文还是西文,或是二者兼顾。信息源选择的其他考虑因素是否所有与检索课题相关的资源都要进行检索,如果是,则不但考虑信息资源覆盖的年限是否符合需求多数数字信息资源覆盖的年限都是近二十年的内容,如果需要更早的资料,就要考虑手工检索的问题有些数据库更新速度慢(例如光盘数据库,或数据加工速度不及时),无法提供最新信息。需要使用其他相关数据库、同一数据库的网络版或其他网络资源来补充信息资源的特点及其针对性如何要了解已选择的信息资源的查询特点,是否与信息需求相吻合。例如查询某个机构或公司的网页,使用搜索引擎是最好的,而即使是搜索引擎,各自的特点不同,涵盖的内容也有所侧重的不同;查询新闻时事,则可以登录到一些新闻网站;查找学位论文,就一定要使用学位论文数据库,或直接到大学或学院网站查询,因为有些学校的学位论文在网上提供二次文献服务信息源选择的其他考虑因素信息资源覆盖的年限是否符合需求信息源选择的其他考虑因素三、信息获取的思路面临研究性信息问题需要一般性、相对粗浅的信息现有数据库无法获取全文网页数据库印刷型资源但无论
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度办公设备维修及保养合同3篇
- 2024年度卫星发射服务合同的发射任务与技术保障2篇
- 2024年买卖合同担保函3篇
- 2024年交通事故损害赔偿详细合同版
- 2024年别墅装修协议协议指导文本一
- 兴隆商业步行街商铺装修工程总包合同三篇
- 零售经营合同三篇
- 2024年建筑工程安全防护措施协议版B版
- 2024年招标投标法律法规与协议管理要点解析版B版
- 建筑设计代理合同三篇
- 河南省郑州市2023-2024学年高二上学期期末考试 物理 含解析
- 财务岗位招聘笔试题及解答(某大型国企)2025年
- 2024年中级安全工程师《(建筑施工)安全生产专业实务》考试题库(含答案)
- 2024年度贵州省安全员之B证(项目负责人)通关试题库(有答案)
- 2024年山东航空股份限公司社会招聘高频难、易错点500题模拟试题附带答案详解
- 高考英语听力指导课
- 人教版(2024)九年级化学上册1.1.2化学性质和物理性质教案
- GB/T 44340-2024粮食储藏玉米安全储藏技术规范
- 电力电子技术及应用题库及答案
- 一碗“雪花面”(2022年湖北鄂州中考语文试卷记叙文阅读题及答案)
- 《海滨小城》第二课时公开课一等奖创新教学设计
评论
0/150
提交评论