第1章-文献信息检索基础课件_第1页
第1章-文献信息检索基础课件_第2页
第1章-文献信息检索基础课件_第3页
第1章-文献信息检索基础课件_第4页
第1章-文献信息检索基础课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

朱科军文献查阅与技术文档写作朱科军文献查阅与技术文档写作1

牛顿曾经说过:如果说我看得比别人更远些,那是因为我站在巨人的肩膀上。(IfIhaveseenfurther,itisbystandingontheshouldersofgiants.)

有说法称,他说这话是嘲讽当时的科学院院长罗伯特·胡克,因为后者身材矮小,而且牛顿觉得其没有什么科学建树。但抛开所谓的嘲讽成分,牛顿的研究确实是以哥白尼、伽利略、开普勒等诸多科学家的科研成果为基础的。所以牛顿此语,也还算是写实。课程的重要性2牛顿曾经说过:如果说我看得比别人更远些,那是因为我站在课程的重要性3课程的重要性3第1章

文献信息检索基础1.1文献信息基本知识1.2文献信息检索1.3计算机检索基础第1章

文献信息检索基础1.1文献信息基本知识1.1文献信息基本知识1.1.1信息、文献及其相关概念1.1.2文献的属性与基本规律1.1.3文献的分类1.1.4基于电子信息技术和网络技术的文献信息51.1文献信息基本知识1.1.1信息、文献及其相关概念51.1.1文献及其相关概念1.文献根据《中国国家标准《文献著录第1部分:总则》(GB3792.1-2009):“文献是记录有知识的一切载体”。《文献情报术语国际标准(草案)》(ISO/DIS5127)的定义:“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存贮在磁盘上。这种附着在各种载体上的记录统称为文献。”文献具有三个基本要素:(1)要有一定的知识信息。(2)要有负载知识信息的物质载体。(3)要有记录知识信息的符号和技术。61.1.1文献及其相关概念1.文献62.信息《辞海》(2009年第六版,以下同)对信息的解释是:①音讯、消息。②通信系统传输和处理的对象,泛指消息和信号的具体内容和意义。对信息具有广泛影响的定义为:“信息是指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动中所具有的特征性内容的总称。”1.1.1文献及其相关概念72.信息1.1.1文献及其相关概念73.知识及其与文献、信息的关系《辞海》对知识的解释为:人类认识的成果或结晶。关系:信息是有组织的数据,知识是对信息的理解与认识,文献是知识的一种载体。文献不仅是知识传递的主要物质形式,也是吸收利用信息的主要手段。信息知识认识、分析、重组转化载体1.1.1文献及其相关概念83.知识及其与文献、信息的关系信息知识认识、分析、重组转化4.情报情报是一种经过人们特殊选择或进行一定研究和加工后的社会信息,它是人们为了达到一定的目的所进行的智力、智慧和知识创造活动。情报蕴含于信息之中,或者说它本身就是一种具体的信息存载。5.图书有广义和狭义之分。6.资料具有客观性和历史性1.1.1文献及其相关概念94.情报1.1.1文献及其相关概念91.1.2文献的属性与基本规律1.文献的属性⑴知识信息性⑵客观物质性⑶人工记录性⑷动态发展性2.有关文献的六大基本规律⑴洛特卡定律⑵齐普夫定律⑶布拉德福定律⑷文献指数增长规律⑸文献老化规律⑹文献引用规律

101.1.2文献的属性与基本规律1.文献的属性2.有关文献1.1.3文献的分类1.按载体(外在)形式划分载体记录手段表现内容优点缺点纸质型文献纸张印刷抄写书写出版物、档案、个人文献用途较广、读取方便、流传不受时空限制存储密度低、较笨重、占据空间大缩微型文献感光材料缩微照相缩微平片、缩微胶卷和缩微卡片体积小、价格低、存储信息密度高,便于收藏、保存与传递必须借助缩微阅读机,使用不方便声像型文献磁性材料感光材料磁记录光学技术唱片、录音带、录像带、电影胶片、幻灯片、唱盘和视盘生动直观成本较高且不易检索和更新电子文献磁光电介质网络数字代码正式出版非正式出版信息量大、查找迅速设备昂贵、使用费用高人物语言音频记录、采访笔记、调查问卷等人对事物的认识或想法载有个人的经验若不记录,容易被人忽视111.1.3文献的分类1.按载体(外在)形式划分载体记录手2.按加工层次(文献深度)划分(1)零次文献:记录在非正规物理载体上,未经出版发行的或未进入社会交流的最原始的文献。(2)一次文献:指以作者本人的生产与科研工作成果为依据而创作的原始文献。(3)二次文献:指对一次文献进行精选、提炼、浓缩和加工,标引出文献的主题,编制成具有多种检索途径的检索工具。如:文摘、索引、题录等。(4)三次文献:是指利用二次文献的线索,系统地检索出一批相关文献,并对其内容进行综合、分析、研究和评述而编写出来的文献。如:综述、述评、工具书等。1.1.3文献的分类122.按加工层次(文献深度)划分1.1.3文献的分类122.按文献被加工深度划分知识加工角度对象情报角度一次文献创造性;对知识的第一次加工广大作者文献检索的对象(目标)二次文献有序化;对知识的第二次加工图书情报工作者文献检索的工具(手段)三次文献有序+创造是知识的再加工既懂专业、又熟悉情报的专家情报研究的成果(目标+手段)1.1.3文献的分类132.按文献被加工深度划分知识加工角度对象情报3.按内容的公开程度划分(1)白色文献:指一切正式出版并在社会上公开流通的文献。(2)灰色文献:也称半文献,指非公开发行的内部文献或限制流通的文献。(3)黑色文献:指人们未破译、辨识其中信息的文献或处于保密状态、不愿公布其内容的文献。1.1.3文献的分类143.按内容的公开程度划分1.1.3文献的分类144.按出版类型划分图书期刊报纸会议文献研究报告专利文献学位论文标准文献政府出版物产品资料短期出版物档案文献1.1.3文献的分类154.按出版类型划分图书期刊报纸会议文献研究报告专利文献学位论4.按出版类型划分(1)图书图书是单册出版的正式公开出版物。历史最悠久的文献类型内容一般比较成熟,代表了某一时期某一学科的发展水平,但出版周期较长。图书的“身份证”:ISBN(InternationalStandardBookNumber)

10位ISBN:0-13-165316-413位ISBN:978-7-5076-0334-7(2007.1.1)国际标准图书编号语言区域代码出版者代号书序号检验码EAN·UCC前缀组号出版者号出版序号检验码1.1.3文献的分类164.按出版类型划分语言区域代码出版者代号书序号检验码EAN·(2)期刊是指定期或不定期出版的有固定名称的连续出版物。种类繁多,出版周期短、内容丰富新颖。最能反映当代社会和科技发展水平和动向,是最重要的一次文献。期刊与杂志都有国际标准连续出版物编号(InternationalStandardSerialNumber)。该编号是以ISSN为前缀,由8位数字组成。国内出版的期刊与杂志还有国内统一刊号,如《情报学报》的国内统一刊号为:CN11-2257/G3。CN为中国国别代码,11为地区号,2257为该地区连续出版物的序号,G3为分类号。1.1.3文献的分类17(2)期刊1.1.3文献的分类17(3)报纸是一种报道及时,内容广泛,文字通俗的信息源。其中的广告、新闻报道更是重要的信息源。重要的报纸都编有月度或年度索引,有的报纸文章与期刊论文一起被摘录编排,形成报刊索引,如《全国报刊索引》。(4)会议文献会议文献是指在相关学术会议上宣读的论文或交流的书面论文。其多为专业性会议,因而情报交流针对性很强。特点是:议题集中、内容新颖、专深、学术性强,往往反映了当前的学科进展和发展动态,是获取最新信息的重要来源。它是了解各国科技发展水平和动向的重要科技文献。1.1.3文献的分类18(3)报纸1.1.3文献的分类18(5)研究报告是研究单位和个人向上级或委托单位撰写的关于某个课题研究成果的正式报告。(6)专利文献是根据专利法公开的有关发明的文献,主要为专利说明书,也包括专利法律文件和专利检索工具。(7)学位论文是高等院校或研究机构的学生为取得各级学位、在导师指导下完成的科学研究、科学实验成果的书面报告。(8)标准文献是对工农业新产品和工程建设的质量、规格、参数及检验方法所做的技术规定。1.1.3文献的分类19(5)研究报告1.1.3文献的分类19(9)政府出版物是各国政府及所属的专门机构发表的文献,具有正式性和权威性的特点,通常有行政性文件(如政府公报、会议文件和记录、法令汇编和调查统计资料等)和科学技术文献。(10)产品资料指产品目录、产品样本和产品说明书一类的厂商产品宣传和使用资料。(11)短期出版物(PrintedEphemera)是指可以随意丢弃的或者装帧简陋的出版物,主要包括宣传册、传单(如营销材料、市场推广材料等)、价格表等印刷品。(12)档案文献档案是国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的具有保存价值的各种文字、图表、声像等不同形式的历史记录,是完成了传达、执行、使用或记录等现行使命而留备查考的文件材料。1.1.3文献的分类20(9)政府出版物1.1.3文献的分类201.1.4基于电子信息技术和网络技术的文献信息1.网络文献信息网络文献信息也称虚拟文献信息,它是以数字化形式记录的,以多媒体形式表达的,存贮在网络计算机磁介质、光介质以及各类通讯介质上的,并通过计算机网络通讯方式进行传递的文献信息内容的集合。但就图书馆文献资源而言,网络文献并不是指所有的网络信息资源,而是指其中能满足人们文献需求、改变人们知识结构的信息,主要它括电子书刊、电子报纸、各种类型文献数据库等。与传统文献信息资源相比,网络文献信息具有的特征有:①内容覆盖面广;②文献信息浩瀚,几乎没有什么范围限制;③多媒体化。211.1.4基于电子信息技术和网络技术的文献信息1.网络文2.文献数据库文献数据库可以被视为能够进行自动查询和修改的数据与信息的集合,它是文献信息检索的主要工具,有各种各样的数据库(如期刊全文、电子图书、产品资料库、标准法规等)。数据库一般都由数据库商提供,通常限定在一定的范围内使用,通常可以在图书馆网站上看到有使用权的大量的数据库。希望获得一篇文章全文时,全文数据库是最理想的选择。1.1.4基于电子信息技术和网络技术的文献信息222.文献数据库1.1.4基于电子信息技术和网络技术的文3.多媒体文献定义:多媒体文献是指运用计算机多媒体技术,以数字代码方式,将图、文、声、像信息存储在磁、光、电介质上,通过计算机多媒体设备或者具有类似功能的其他设备阅读使用,用以表达思想、普及知识、积累文化,并可复制发行的大众传播媒体。按内容题材上分,多媒体文献可分为多媒体工具书、多媒体数据库、多媒体电子报刊、多媒体图书(包括随书光盘、随书磁带)、多媒体教程。按载体形态上分,有光盘型多媒体文献、网络型多媒体文献和芯片型多媒体文献。多媒体文献的优越性:容量大,资料丰富;能直接、生动、形象地表达所载知识;人机交互,界面友好,操作简便;易于保存,使用寿命长;易于实现文献共享。1.1.4基于电子信息技术和网络技术的文献信息233.多媒体文献1.1.4基于电子信息技术和网络技术的文献4.开放获取文献开放获取(OpenAccess,简称OA,亦称为“开放存取”)就是作者把自己的科学论文或学术文献放到互联网上,使用户可以免费获得,而不需考虑版权或注册的限制。它具有两个最重要的属性:①作品一旦出版,任何人都可以通过互联网即时、免费地获取;②版权属于作者,只要以适当的方式承认作者是文章的原创者,任何人都可以因合法的目的而阅读、复制、传播和使用该文章。它包括开放获取期刊(OpenAccessJournals)、开放获取仓储(OpenAccessrepositories)两种形式。1.1.4基于电子信息技术和网络技术的文献信息244.开放获取文献1.1.4基于电子信息技术和网络技术的1)开放获取期刊开放获取期刊又称为“开放期刊”、“开放出版”,是基于开放获取出版模式的期刊,既可能是新创办的电子版期刊,也可能是由已有的传统期刊转变而来。它一般由出版商或者学会团体创办,通过同行评议,确保其专业质量;并主要采用作者付费而对读者免费的形式,使期刊能在更大范围内得到利用。2)开放获取仓储开放获取仓储又称为“开放获取文档”(OpenAccessArchives)、“开放仓储”(Openrepositoriesandarchives),是研究机构、学会团体或作者本人将未曾发表(预印本)或已经在传统期刊中发表过(后印本)的论文作为开放式的电子档案储存。开放获取仓储的论文大多没有经过同行评议,故论文的质量参差不齐,难以保证。但其成本低,还是受到一些学人的青睐。1.1.4基于电子信息技术和网络技术的文献信息251)开放获取期刊1.1.4基于电子信息技术和网络技术的文5.电子预印本与电子印本“电子预印本”(e-preprint)与“电子印本”(e-print)也是与开放获取相关的术语。电子预印本(e-preprint)是指还未在正式的刊物上发表,而出于同行交流目的自愿通过E-mail或网络等方式传播的科研论文、科技报告等电子文献。从电子预印本网站上获取的文献一般比印刷版论文发表早一两年。这对前沿科学的研究人员有一定参考性。电子印本(e-print)是学者和专业人员利用电子文稿,通过网络分享研究发现,包括预印本、再版(reprints)、科技报告、会议文献以及其他电子形式的交流。电子(预)印本文献库中的文献具有两种出版形态:预印本(PrePrint)和后印本(PostPrint)1.1.4基于电子信息技术和网络技术的文献信息265.电子预印本与电子印本1.1.4基于电子信息技术和网络6.优先数字出版文献优先数字出版是出版商或个人先于印刷版出版之前而通过数字传播媒介出版数字版定稿。目前学界和业界所讨论的优先数字出版,其主体全部指的是期刊,尤其是学术期刊。其特点是出版时间快,出版方式灵活,发行范围广。可以被广大读者通过互联网、手机等多种途径订阅、检索、下载,也可以由出版者通过电子邮件和手机短信主动向读者推荐、推送。1.1.4基于电子信息技术和网络技术的文献信息276.优先数字出版文献1.1.4基于电子信息技术和网络技术1.2文献信息检索1.2.1文献信息检索的涵义、类型和基本原理1.2.2检索语言及其类型1.2.3文献信息检索的方法和步骤1.2.4文献老化规律在文献信息检索中的应用281.2文献信息检索1.2.1文献信息检索的涵义、类型1.2.1文献信息检索的涵义、类型和基本原理1.文献信息检索的涵义文献检索的概念有狭义和广义之分。广义的文献检索包括存储和检索两个过程。存储是指工作人员将大量无序的文献信息集中起来,根据文献源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。而检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定文献。狭义的文献检索是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。这里的文献集合,不是通常所指的文献本身,而是关于文献的信息或文献的线索。如果真正要获取文献中所记录的信息,那么还要依据检索所取得的文献线索索取原文。信息检索是指依据一定的方法,从已经组织好的有关大量信息集合中,查出特定的相关信息的过程。291.2.1文献信息检索的涵义、类型和基本原理1.文献信息2.文献信息检索的类型根据检索(查找)对象的不同,文献检索可以分为以下四种类型:文献检索(DocumentRetrieval):文献检索所检索到的是关于文献线索或文献全文。数据检索(DataRetrieval):是以数据为检索对象,从已收藏数据资料中查找出特定数据的过程。事实检索(FactRetrieval):即通过对存储的文献中已有的基本事实,或对数据进行处理(逻辑推理)后得出新的(即未直接存入或所藏文献中没有的)事实过程。概念检索(ConceptRetrieval):就是查找特定概念的含义、作用、原理或使用范围等解释性内容或说明。文献检索是最典型、最重要和最常用的文献信息检索。掌握了文献检索的方法就能以最快的速度,在最短的时间内,以最少的精力了解前人和别人取得的经验和成果。1.2.1文献信息检索的涵义、类型和基本原理302.文献信息检索的类型1.2.1文献信息检索的涵义、类型3.文献信息检索系统的构成(1)检索文档;(2)检索设备;(3)系统规则;(4)作用于系统的人。4.文献信息检索的基本原理通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用文献信息源。其中存储是为了检索,而检索又必须先进行存储。检索课题文献信息特征文献信息检索提问信息检索语言和名称规范规范文献信息标识(检索点)文献提问标识(检索词)检索系统(标识分配)检索结果存储过程检索过程分析分析标引著录选用形成检索输出输入形成1.2.1文献信息检索的涵义、类型和基本原理313.文献信息检索系统的构成检索文献文献检索检索文献信息文献提1.2.2检索语言及其类型1.检索语言的概念把文献存储与检索联系起来;把标引人员与检索人员的思想沟通起来的约定语言就是检索语言。检索语言实质上是一种“人工语言”,它是沟通标引人员和检索人员双方思路的桥梁。2.检索语言的类型

题目语言著者语言号码语言分类语言主题语言题录引文语言描述文献外表特征的语言描述文献内容特征的语言检索语言321.2.2检索语言及其类型1.检索语言的概念题目语言分类3.分类语言及分类法分类语言是用分类(类号和类目)来表达文献主题内容的一种语言。以类号、类目组成分类表,以作为文献分类、存储和检索的依据。世界上比较著名的图书分类法有:《国际专利分类表》(IPC)《杜威十进分类法》(DDC)《美国国会图书馆图书分类法》(LC)我国在图书情报系统广泛采用的有:《中国图书馆图书分类法》(中图法)《中国人民大学图书馆图书分类法》(人大法)《中国科学院图书馆图书分类法》(科图法)1.2.2检索语言及其类型333.分类语言及分类法1.2.2检索语言及其类型33《中国图书馆分类法》简介《中图法》把一切知识分成五个基本部类即马列毛、哲学、社会科学、自然科学和综合性图书,然后在五大部类基础上展开为二十二个基本大类,再层层划分、逐级展开。目前的《中图法》是2010年第五版,其22大类的类目为:A马列、毛泽东思想B哲学C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科学T工业技术U交通运输V航空、航天X环境科学Z综合性图书T工业技术TB一般工业技术TL原子能技术TD矿业工程TM电工技术TE石油、天然气工业TN无线电电子学、电讯技术TF冶金工业TP自动化技术、计算机TG金属学、金属工艺TQ化学工业TH机械、仪表TS轻工业、手工业TJ武器工业TV水利工程TK动力工程TU建筑科学1.2.2检索语言及其类型34《中国图书馆分类法》简介A马列、毛泽东思想N自然科学总论《中图法》标记符号基本标记符号:拉丁字母与阿拉伯数字相结合的混合制标记符号辅助标记符号:

分段标志“

.”

:加在每三位数字之后,如D993.1,主要起间隔作用,使类号清楚醒目,易于辨认。

总论复分号“

-”:代表总论复分号的号码。如“B-49”,在总论复分表中表示普及读物。“B”代表哲学,“-49”在总论复分表中表示普及读物。

组配复分号“:”:用于解决集中与分散的类目和应用性类目,它能从不同角度充分揭示文献的内容。例:医学书目是“Z88:R”,可从“Z88”和“R”这两个类中检索到有关医学方面的书目。1.2.2检索语言及其类型35《中图法》标记符号1.2.2检索语言及其类型35中图法的类号由英文字母+阿拉伯数字组成。类目越大,类号数字的位数越少。例:查找“英语语法构词”的中图分类号

H语言、文字(一级类目)H3常用外国语(二级类目)H31英语(三级类目)H314语法(四级类目)H314.1构词(五级类目)

得到:“英语语法构词”的分类号为H314.11.2.2检索语言及其类型36中图法的类号由英文字母+阿拉伯数字组成。类目越大,类号数字的《中国图书馆分类法》简介一般图书馆的图书资料都按照分类索书号进行排架。首先按分类号顺序排;相同类目再按作者号排。如左图所示学习的决窍

G797144世界经济的未来F116069毛泽东A7510854商务英语H314441英语自学指导H315934微电脑实用手册TP363739微计算机原理TP3632431.2.2检索语言及其类型37《中国图书馆分类法》简介一般图书馆的图书资料都按照分类索书号网络信息分类网络信息分类是根据网络信息的存在状况和当前上网用户的特点来编制的,其科学性、系统性稍差,但适合大众信息资源的组织。人们在浏览网络信息时,很多情况下并不很清楚自己的信息需求,或者无法清楚表达信息需要,这时就要求人们浏览网络信息类目。网络信息分类主要有以下几类:搜索引擎的目录或专题网站学科信息门户:物理数学学科信息门户(/)开放目录:DMOZ()特殊资源分类:电影分类、软件分类1.2.2检索语言及其类型38网络信息分类1.2.2检索语言及其类型38数据库信息分类数据库信息分类结合文献信息分类和网络信息分类的优点,方便浏览和检索。目前,数据库一般都提供分类检索功能。各数据库信息分类体系不尽相同。如《中国期刊全文数据库》的专辑导航就是以CNKI文献专辑系统的十个专辑类目为导航类目,即十大专辑导航系统(见数据库的“专辑导航列表”)1.2.2检索语言及其类型39数据库信息分类1.2.2检索语言及其类型394.主题语言主题语言是以文字作为检索标识,即用自然语言中的名词、名词性词组或句子描述文献情报所论述或研究事物的概念。其特点为直接、准确、灵活;

标题词语言主题语言又分为单元词语言规范化的自然词

叙词语言

关键词语言(自然语言)1.2.2检索语言及其类型404.主题语言1.2.2检索语言及其类型401)基本概念关键词语言:以关键词作为标识和检索依据。关键词是指那些出现在文献的标题以及文摘、正文中,对表征文献的主题内容具有重要意义的词,没有经过规范化处理。标题词语言:以标题词作为文献内容标识和检索的依据。标题词是从文献题名和内容中挑选出来的,并经过规范化处理的词和词组,标题词的规范化处理是通过标题词表来实现的。单元词语言:以单元词作为文献内容标识和检索的依据。单元词是从文献题名和内容中挑选出来的,并经过规范化处理的不能分解的词。叙词语言:叙词是指一些以概念为基础的,经过规范化的、具有组配功能并可以显示词间关系和动态性的词或词组。叙词语言就是以叙词作为文献检索标识和查找依据的一种检索语言。叙词语言是多种情报检索语言的原理和方法的综合,体现了情报检索语言的发展趋势。1.2.2检索语言及其类型411)基本概念1.2.2检索语言及其类型412)《汉语主题词表》简介《汉语主题词表》是通用的汉语叙词表,分为自然科学和社会科学两个部分。自然科学部分在1996年作了修订,它有5个分册,共收录8万多主题词条目,包括正式和非正式主题词。它由主表和附表组成。《汉语主题词表》一、二分册是其主体部分,称主表。它将全部正式(规范)与非正式(非规范)主题词按汉语拼音顺序排列,该表是标引和检索汉语文献、组织目录的主要工具。第三、四、五分册为附表部分,包括:词族索引、范畴索引、英汉对照索引、轮排索引。1.2.2检索语言及其类型422)《汉语主题词表》简介1.2.2检索语言及其类型42《汉语主题词表》著录格式例:xianxiangguan

显像管[56CE]

KinescopePicturetubeD电子显像管监视管

F彩色显像管黑白显像管

S电子束管

Z电子管

C显示管指示管代(dai)非正式叙词英语主题词分(fen)下位词属(shu)上位词族(zu)族首词参(can)参见词汉语主题词和所属学科范畴代号1.2.2检索语言及其类型43《汉语主题词表》著录格式例:xianxiangguan1.2.3文献信息检索的方法和步骤1.文献信息检索的方法文献检索的目的在于寻求一种迅速、准确、省时、有效的检索方式。在检索过程中一般遵循由近及远,先线索后文献,逐步扩大的检索原理。常用的方法有以下几种:浏览法(阅读期刊)追溯法(参考文献回溯)常规法顺查法(一般以时间为线索,由远及近)抽查法(按需索取)检索方法分段法(引文-间接-直接)441.2.3文献信息检索的方法和步骤1.文献信息检索的方法浏览2.选择检索方法的原则文献信息检索总是根据文献的某种特征,从各个不同的角度进行的。根据文献的不同特征,就可以按照不同的途径使用上述方法进行检索。(1)检索条件检索工具缺乏而原始文献收藏丰富宜用追溯法;有成套检索工具则宜用直接法,其查全率、查准率都比追溯法高。(2)检索要求要求收集某一课题的系统资料,要求全面,不能有重大遗漏,最好用顺查法;要解决某一课题的关键性技术,不要求全面,只要能解决这个关键问题就行,要快,针对性强,要准,宜用倒查法,迅速查得最新资料。(3)检索学科的特点古老学科,开始年代很早,只好用倒查法;新兴学科,起始年代不远,可用顺查法;波浪发展的学科,可选择发展高峰,用循环法。1.2.3文献信息检索的方法和步骤452.选择检索方法的原则1.2.3文献信息检索的方法和步骤453.文献信息检索的步骤课题分析(分析主题内容、问题类型、查找年代)选择检索工具(根据课题的检索要求,选准、选全检索工具)确定检索途径(根据已知条件,选取最易查获所需文献的途径)选择检索方法(根据检索条件、检索要求和学科特点而定)辨别文献来源(如符合检索要求,必须记下篇名、著者、来源、文种等款目)索取原始文献(检索程序的最后一步)评估所获文献(①正是所需文献;②真实可靠;③时效性强)管理与更新(遗漏、撞车、新成果)1.2.3文献信息检索的方法和步骤463.文献信息检索的步骤1.2.3文献信息检索的方法和步骤464.大型研究项目的文献信息检索过程分析选择辨别评估定位评估评估获取文献管理更新1.2.3文献信息检索的方法和步骤474.大型研究项目的文献信息检索过程分析选择辨别评估定位评估评1.2.4文献老化规律在文献信息检索中的应用1.文献信息老化的情形随着时间的推移,信息的价值会逐渐衰减乃至失效,即文献信息表现出老化规律。文献信息老化的情形有以下几种:(1)所含信息仍有用,但现在已经被包含在其它更新的文献中。(2)所含信息仍有用,但现在正处于人们对其兴趣下降的学科。(3)所含信息仍有用,但为后来的文献所超越。(4)所含信息不再有用。481.2.4文献老化规律在文献信息检索中的应用1.文献信息老2.基于文献老化规律的文献信息检索准则在进行文献信息检索时,注意文献出版年的限定。学术文献信息的半衰期一般是3~5年。许多文献信息(如艺术品、经济信息、市场信息等)的老化表现出跳跃性。有时突然失效,有时永不失效。查阅文献信息时尽量选取较新的文献,同时要顾及较早的文献。一般性研究可选择近5年来的文献即可,了解背景资料的则要长得多。对发达国家的文献的利用可以在中文文献年限的基础上增加3~10年。1.2.4文献老化规律在文献信息检索中的应用492.基于文献老化规律的文献信息检索准则1.2.4文献老化规律1.3计算机检索基础1.3.1计算机检索技术及其实现1.3.2文献数据库检索的通用技巧1.3.3选择检索词的原则1.3.4计算机统一检索与其他检索表述501.3计算机检索基础1.3.1计算机检索技术及其实现1.3.1计算机检索技术及其实现1.布尔逻辑组配检索技术逻辑与

计算机运算符为:AandB或A*B

逻辑与是指检索结果应同时满足两个和多个检索概念,即在命中结果中同时出现A和B两个检索词,黑色部分即为命中结果。

AB逻辑和

计算机运算符为:AorB或A+B

逻辑和是指命中结果无论论及A或B均为命中,图示划线部分即为命中结果。BA

逻辑非是指一个命中结果中去除含有另一主题的文献。AnotB表示在A文献中去除论及B的文献的文献。逻辑非AB511.3.1计算机检索技术及其实现1.布尔逻辑组配检索技术逻辑2.截词检索法也称模糊检索,是指在检索表示中保留相同的部分,用相应的截词符代替可变化部分。截词符号根据检索系统的不同而不同,常用截词符有“?”、“*”、“$”、“!”等。截词种类:(1)后截断:张?(2)前截断:?化学(3)前后截断:?教育?(4)中截断:中国?写作特点1.3.1计算机检索技术及其实现522.截词检索法1.3.1计算机检索技术及其实现523.词位限定检索技术词位限定检索技术用于确定两个检索词之间的位置关系,大部分通用机检系统均提供该功能。不同的检索系统有不同的词位限定算符。该功能最为详尽的当推Dialog联机检索系统。另外,通常用“”或()来表示两词是作为一个词组来检索的,如:输入“profitandloss”将查找profitandloss。禁用词(通常为一些虚词,如冠词和连词)不包含在检索范围之内,如:a、about、also、and、any、as、at、be、between、by、both、for、some、so、not、this、with等将被自动忽略。1.3.1计算机检索技术及其实现533.词位限定检索技术1.3.1计算机检索技术及其实现533.词位限定检索技术

Dialog检索系统词位限定算符及所表示的检索含义算符用法表示的检索含义WA(nW)BA、B两词相隔n个单词且前后次序不变;n=0时格式为A()B或A(W)BNA(nN)BA、B两词相隔n个单词且前后次序不限;n=0时,格式为A(N)BLA(L)BA、B两词在同一主题词字段中,A为主题词,B为其副主题词SA(S)BA、B两词在同一子字段中,即同一语句或同一短语中,词序不限FA(F)BA、B两词在同一字段中,字段不限,词序不限1.3.1计算机检索技术及其实现543.词位限定检索技术算符用法表示的检索含义WA(nW4.限制检索

1)字段限制检索:是一种限定检索词在数据库记录中出现的字段范围的一种检索方法。分为两种:主题字段(题名、主题词等)、非主题字段(作者、文献类型、语种、出版年份等)。例如:在DIALOG系统中,“TI”代表题名,“AU”代表作者,用字段加代码实现检索。computerinTIAU=JAMES。基本字段用后缀表示,辅助字段用前缀表示。2)范围限制检索。3)使用高级检索、二次检索。1.3.1计算机检索技术及其实现554.限制检索1.3.1计算机检索技术及其实现555.加权检索加权检索是某些检索系统中提供的一种定量检索技术。加权检索的侧重点在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。加权检索的基本方法是:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值,该记录即为命中记录。运用加权检索可以命中核心概念文献,因此它是一种缩小检索范围提高检准率的有效方法。但并不是所有系统都能提供加权检索这种检索技术,而能提供加权检索的系统,对权的定义、加权方式、权值计算和检索结果的判定等方面,又有不同的技术规范。1.3.1计算机检索技术及其实现565.加权检索1.3.1计算机检索技术及其实现566.聚类检索聚类检索是在对文献进行自动标引的基础上,构造文献的形式化表示——文献向量,然后通过一定的聚类方法,计算出文献与文献之间的相似度,并把相似度较高的文献集中在一起,形成一个个的文献类的检索技术。根据不同的聚类水平的要求,可以形成不同聚类层次的类目体系。在这样的类目体系中,主题相近、内容相关的文献便聚在一起,而相异的则被区分开来。聚类检索的出现,为文献检索尤其是计算机化的信息检索开辟了一个新的天地。文献自动聚类检索系统能够兼有主题检索系统和分类检索系统的优点,同时具备族性检索和特性检索的功能。因此,这种检索方式将有可能在未来的文献检索中大有用武之地。1.3.1计算机检索技术及其实现576.聚类检索1.3.1计算机检索技术及其实现571.3.2文献数据库检索的通用技巧1.数据库检索的一般程序分析检索课题,明确信息需求。可得到一组主题词(关键词)和一些限定要求(如年限、学科领域等)。选择检索工具,了解检索系统。包括数据库的基本情况、检索功能、检索途径等信息。确定检索途经,选定检索方法。实施检索策略,浏览初步结果。调整检索策略,获取所需信息。581.3.2文献数据库检索的通用技巧1.数据库检索的一般程2.如何了解一个数据库了解一个数据库,一般可从以下几方面进行:服务形式:是WEB形式,还是光碟、联机检索、单机版,是校内、国内、国外站点,还是镜像站点;涵盖学科或主题范围;文献类型:出版形式、内容层次;收录年限,收录对象;数据量:即记录数;文种,更新频率;访问模式(口令,IP控制);其他信息:帮助信息、出版者、发行者、在同行中的地位。1.3.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论