《信息检索与利用》知识点2009-3修改_第1页
《信息检索与利用》知识点2009-3修改_第2页
《信息检索与利用》知识点2009-3修改_第3页
《信息检索与利用》知识点2009-3修改_第4页
《信息检索与利用》知识点2009-3修改_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信息检索与利用知识点(2009-3)一、讲授内容及学时数 1.内容绪论第一章 信息与信息资源第二章 信息检索基础知识第三章 中文主要信息资源检索系统第四章 外文信息检索系统第五章 特种文献检索第六章 Internet 网络信息资源第七部分:信息资源的综合利用与课程总结2. 学时数绪论、第一章、第二章共4.5学时,第三章4学时,第四章2学时,第五章2学时,第六章2学时,第七部分1.5学时。二、各章知识点绪论一、信息时代对教育的支持和挑战人类历史上发生的五次信息技术革命:第一次是语言的产生。第二次是文字的出现。第三次是造纸术和印刷术的发明。第四次是电报、电话、电视的问世。第五次信息技术革命是电子计

2、算机和现代通讯技术的结合。信息时代为现代教育提供了新的环境和条件,也对传统教育提出了挑战,特别是社会发展对教育理念、教学内容、教学工具和手段都有了新的要求,从而引起了整个教育的变革。二、信息素质及其内涵 信息素质(Information Literacy)的概念:(1)利用大量的信息工具及信息源,使问题得到解决或解答的技能。(2)要成为具有信息素质的人,他必须能够确定何时需要信息,并且具有检索、评价和有效利用信息的能力。信息素质的内涵包括:信息意识:是指人们对信息的敏感程度信息能力:发现、评价、利用和交流信息的能力信息道德:在信息活动中应遵循的道德规范三、信息检索的意义和作用(一)信息检索的意

3、义1.信息检索是获取知识的有效途径2.信息检索是创新型人才应具备的基本技能3.信息检索是继承借鉴前人成果的主要手段(二)信息检索的作用1.信息检索能够避免重复研究和走弯路2.信息检索有助于节约时间、提高科研效率3.信息检索是科学决策的必要前提第一章 信息与信息资源第一节 信息的基本知识信息可是当代社会使用最多、最广、最频繁的词汇之一,它普遍存在于自然界、人类社会以及人类思维活动之中。信息的内涵丰富、形式多样,具有物质和能量资源所不具备的独特性质和专门功能。在人类漫长的发展历程中,物质、能源和信息三种资源支配着人类最基本的生产活动。物质 - 向人类提供材料及生活必需品信息 - 向人类提供知识和智

4、慧能源 - 向人类提供动力一、信息的概念到目前为止,有关信息的定义尚无统一定论1. 信息的经典定义1948年,美国数学家、信息论的创始人香农在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不定性的东西”。1948年,美国著名数学家、控制论的创始人维纳在控制论一书中指出:“信息就是信息,既非物质,也非能量。”2. 信息的现代定义信息是指一切事物存在方式和运动规律的表征。它是事物的一种普遍属性,只要事物存在,就会有表征其属性的信息。它广泛存在于自然界和人类社会中,信息无处不在。人们正是通过自然界和人类社会中产生的不同信息来区别和认识各种事物的。它是人们认识世界和改造世界,取之不尽、用之不

5、竭的宝贵资源。在人类进入信息社会的时代,信息已成为发展科技、经济、文化、教育的重要支柱之一。尽管信息概念呈多样性,我们对信息的认识,一般可以从以下几个方面理解:信息与物质、能量既有区别又有联系;信息是事物变化和差异的表现;信息的获取,可以使主体对客体的不确定性减少。二、信息的特征 1. 信息的普遍性和客观性2. 信息认识的主观性3. 信息的依附性4. 信息的可传递性5. 信息价值的不定性6. 信息的共享性信息传递四要素:信源(信息的发出体)、信宿(信息的接收体)、信道(信息的传递媒介)、信息。三、信息的功能1. 资源功能2. 组织管理功能3. 中介功能4. 消除不定性(解惑)功能5. 传播功能

6、四、信息与知识、文献的关系1.知识(Knowledge) 知识是人类对客观事物的认识和经验的总和,是人类对客观事物规律性的认识,是信息中最有价值的部分。知识一经产生就以声像信息、实物信息、文字信息等形式传播。人类不仅要通过信息认识世界,而且要根据所获得的信息组织知识。知识与信息的关系:知识是信息的一部分,不直接等同于信息。知识是人类大脑活动的产物,是系统化、精炼化的信息。信息是知识产生和形成的基础。2. 文献(Document)文献是指记录有知识的一切载体。文献由四个基本要素组成: 所记录的知识和信息,即文献的内容。 记录知识和信息的符号,文献中的知识和信息是借助于文字、图表、声音、图像等记录

7、下来并为人们所感知的。 用于记录知识和信息的物质载体,如竹简、纸张、胶卷、胶片等,它是文献的外在形式。 记录的方式或手段,如铸刻、书写、印刷、复制、录音、录像等,它们是知识、信息与载体的联系方式(摘自中国大百科全书·图书馆学情报学档案学)。文献具有认识、存储和交流知识的作用。3. 三者的关系可见,信息与知识之间的逻辑关系为包含与被包含的关系。知识是信息的一部分,文献是信息、知识的具体体现,它不仅是信息、知识的主要物质形式,也是读者吸收利用信息、知识的主要途径。第二节 信息资源的基本知识一、信息资源(Information Resources)的概念国内外学者对信息资源概念的认识有两种

8、具有代表性的观点:狭义的理解:信息资源是人类社会经济活动中经过加工处理有序化并大量积累起来的有用信息的集合,如科技信息、政策法规信息、社会发展信息、市场信息等,都是信息资源的重要构成要素。广义的理解:信息资源是人类社会信息活动中各种要素的集合。二、信息资源的本质特性1. 知识性2. 共享性三、信息资源的类型(一)按物质载体划分1. 纸质文献纸质文献是利用纸张作为存储介质,以手写、印刷为记录手段而产生的文献形式。包括油印、铅印、胶印、复印等印刷品及手稿。纸质文献历史悠久,至今仍是主要的文献形式。2. 非纸质文献(1)缩微型文献:缩微型文献是以感光材料为存储介质,利用缩微照相技术使文献缩微化的一种

9、文献类型,如缩微胶卷、缩微平片。(2)声像型文献(视听资料):该种文献以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像,并以此传递信息。如唱片、录音带、录像带、电影胶片、幻灯片。(3)电子文献:电子文献是指以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源。它包括数据库、电子图书、电子期刊、电子报纸以及Internet信息资源(WWW站点、网络新闻组、BBS、电子邮件等)。发展趋势:由以纸质信息资源为主向以电子信息源为主发展。(二)按出版类型划分1.图书(Book)凡篇幅达48页以上并构成一个书目单元的文献称为图书。 国际标

10、准书号(ISBN)2.连续性出版物连续出版物是指具有统一题名、定期或不定期以分册形式出版、有卷期或年月标识、计划无限期连续出版的文献。其主要特点是连续性、及时性和稳定性。它包括期刊、报纸、年度出版物及其他连续性报告、会议录、专著性丛刊等。在众多的连续性出版物中最具代表性的是期刊、报纸、年鉴。连续性出版物是与图书并列的最重要的文献类型。(1)期刊(Journal Magazine periodical)是指采用统一名称定期或不定期的连续性出版物。具有连续的卷、期号或年、月顺序号。ISSN (国际标准刊号)核心期刊: 是指某一学科中高水平、高影响力的期刊。(2)报纸( Newspaper)是指以刊

11、载新闻和评论为主的连续性出版物,出版周期短(日、隔日、周报、旬报)有年、月、日顺序 。 (3)年度出版物(annual,yearbook)汇集某领域年内重要资料,每年出版一次。它包括年报、年鉴及按年度出版、修订的百科全书等。3.特种文献(special categories of documents)(1)专利文献(2)标准文献(3)学位论文(4)科技报告(5)会议文献(6)政府出版物(7)产品资料 (8)档案(三)按加工深度划分1.零次文献指未经公开发表或未交流于社会的文献。如:私人笔记、设计草图、实验记录、论文草稿、会议记录、书信2.一次文献一次文献也称原始文献,是指人们根据自己的科学实验

12、、生产实践的成果而撰写的文献,一般指期刊论文、科技报告、会议论文、学位论文、专利等。3.二次文献二次文献也称检索工具,是指对一次信息加工、整理后形成的各种检索工具,如目录、题录、文摘等,它不对一次信息提供评论,仅仅提供一次文献的检索线索,也就是说,二次文献是把一次文献从分散、无序的状态变成集中、有序化的状态,供人们迅速、准确地查询所需信息。4.三次文献三次文献是指在利用大量一次文献的基础上,对其内容进行综合、分析、研究和述评而撰写出来的文献。分为综述研究类和参考工具类两种类型。前者如动态、综述、学科总结、专题述评等;后者如百科全书、年鉴、手册、科技词典、名录、手册等。三次文献源于一次文献,又高

13、于一次文献,是一种再创性文献。一次文献、二次文献、三次文献之间的关系:从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走向有序、由一种有序结构演变为另一种完善的有序结构的过程。四、网络信息资源迄今为止,对于“网络信息资源”尚没有统一的定义,类似的名称也很多,如“电子信息资源”(Electronic Information Resources)、“因特网信息资源”(Internet Information Resources)“联机信息”(On-line Information)、“万维网资源”(World Wild Web R

14、esources)等。有关其定义也多种多样,如有人提出“电子信息资源是以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷纸质的载体中,并通过网络通信,计算机或终端等方式再现出来的信息资源”。网络信息资源,从字面上可以理解为“通过计算机网络可以利用的各种信息资源的总和”;从目的上看是“为了提高信息系统效率,实现资源共享而采用计算机网络整理、传递、获取的各种信息”;在范围上它不仅包括Internet上的信息资源,也包括各种局域网、城域网和广域网上的信息资源。(一)按照网络信息的内容划分1. 网络数据库数据库亦称文献库、资料库,是发展最早、影响最广的一种主要电子信息源。脱离单

15、机或专门的检索终端,与网络相结合,借助网络而提供服务的数据库即为网络数据库。网络数据库主要包括联机数据库和光盘数据库。2. 联机馆藏目录库图书馆作为信息的集散地,在网络的影响下纷纷向着数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并通过网络提供OPAC(Online Public Access Catalo)服务。3. 电子出版物网络上出现了越来越多的电子出版物,包括电子图书、电子期刊和电子报纸等。4. 政府机构信息政府机构以政府信息服务系统向公众提供信息。包括有关组织机构的宗旨、业务范围、人员、出版物、最新消息发布、各种法律、法规

16、或相关政策信息等,内容相当广泛。5. 休闲娱乐信息这类资源较多,且大多免费提供给用户,包括各种新闻、广告、讨论组以及各种软件(二)按照所采用网络信息的协议不同划分1. 基于超文本传输协议(HTTP)的信息资源万维网(World Wide Web,简称WWW或Web)信息资源是一种典型的基于HTTP的网络信息资源。Web建立在超文本、超媒体基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面(GUI)展现和提供信息的网络信息资源形式。由于其使用简单、功能强大,自20世纪90年代问世以来,成为发展最快、信息最丰富的一种网络信息资源形式。2. 基于文件传输协议(FTP)的信息资源FTP协议

17、的主要功能是完成从一个系统到另一个系统完整的文件复制,即在网络的联网计算机之间传输文件。通过FTP可以获得的信息资源类型很广泛。广义地说,任何以计算机方式存储的信息均可通过FTP协议获取,包括书籍、图像、声音、多媒体、一些书籍的电子版、电子期刊、某些政府机构发布的信息、大量的免费与共享软件等。3. 基于远程登录(Telnet)的信息资源这是指通过Telnet协议所访问到的网络信息资源。其实现方法为在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。这些资源包括硬件资源,如超级计算机,精密绘图仪,高速打印机,高档多媒体输入、输出设备等;也

18、包括软件资源,如大型的计算机程序、图形处理程序以及大型数据库等信息资源。第三节 我国文献信息的主要收藏及服务系统一、图书馆系统1. 公共图书馆系统2. 高校图书馆3. 科学研究系统图书馆二、国家科技信息系统三、专利文献系统四、标准文献系统五、档案系统第二章 信息检索技术与策略第一节 信息存储的基本知识信息存储是指利用一定的科学规则和方法,通过对信息的特征进行分析、表征和提炼,并按给定的参数和序列公式排列、存储在相应载体上,组织成系统化的具有检索功能的系统过程。一、信息筛选信息筛选是对原始信息的挑选和鉴别,是建立信息资源检索系统的基础和保障。信息筛选原则:针对性、系统性、预见性、科学性、计划性和

19、及时性。信息筛选方法:直观判断法、分析法、集体讨论法、专家裁决法、数学核算法、现场核实法等。二、信息描述信息描述是指根据信息组织和检索的需要,依照一定的科学规则和技术标准,对信息的外部特征、物质形态和内容特征进行全面描述并给予记录的过程。(一)信息外表特征的描述信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,它包含信息载体的物理形态、题名、加工者、出版或发表日期、流通或传播的标记等。期刊论文的外表特征:文献的题目、著者、著者的工作单位、文献的出处(刊名、年卷期、起止页码)、语种、参考文献及图表的数量。图书的外表特征:书名、著者(或编者、译者)、出版项(出版社、

20、地点、时间)、稽核项(价格、页数、参考文献)、书号不同的检索系统(数据库)所描述的项目与标识符有所不同。(二)内容特征的描述信息的内容特征就是信息包含的内容,它可以由分类号、主题词、关键词或其它知识单元来表达。内容特征标引采用的方法主要有分类标引、主题标引。其中,分类标引是指对文献主题分析,用分类语言表达分析的主题,赋予文献分类检索标识(分类号)的过程;主题标引是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(主题词、叙词)的过程。信息内容特征的标引较为复杂,必须借助于特定的信息检索语言。三、信息检索语言信息检索语言是根据信息组织和信息检索的需要而创制的人工语

21、言,又称信息组织语言、情报语言、标引语言、索引语言等。(一)分类检索语言分类检索语言用分类号和类名来表达各种概念,将各种概念按学科门类的逻辑次序或事物的性质进行分类和系统排列。分类检索语言包括体系分类法和组配分类法。1. 体系分类法体系分类法是直接体现知识分类的等级制概念标识系统,它通过对概括文献信息内容及其某些外部特征的概念进行逻辑分类和系统排列而构成。我国常见的体系分类法有中国图书馆分类法(简称中图法)、中国科学院图书馆分类法(简称科图法)、中国人民大学图书馆分类法(简称人大法);国外常见的体系分类法有杜威十进分类法(DC)、国际十进分类法(UDC)。中图法是我国使用最为广泛的分类法,它分

22、为5个基本部类、22个基本大类以及相应的二级类、三级类等。5个基本部类为:马克思主义、列宁主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书。采用英文字母与阿拉伯数字相结合的混合制号码,用一个字母表示一个大类,以字母的顺序反映大类序列,在字母后用数字表示大类下的类目划分。体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类角度检索文献信息的途径。2. 组配分类法组配分类法的原理是依据事物的性质,首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目,每一分面的类目与其他分面的类目分别组配,形成许多组配类目,达到细分的目

23、的。(二)主题检索语言主题检索语言是用语词作为概念标识,按字顺排列,并用参照系统等方法间接显示概念间相互关系的一种信息检索语言,也称主题法系统。 标题词语言(Heading) 受词表控制 单元词语言 (Uniterm) 受词表控制叙词语言( Descriptor ) 受词表控制关键词语言(Keyword) 无词表,不受词表控制(三)主题检索语言与体系分类法的区别四 信息存储1. 数据库及其基础构成数据库(database)是“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上,按一定方式存储的相互关联的数据集合,是信息检索

24、的基础。一条信息记录(record)是由若干个款目所组成,每个款目称为一个字段(Field),字段是构成记录的基础;信息记录的集合就形成文档,一个数据库可以包含有一个文档,也可以含有若干个文档。文档也可以称为子数据库。2. 数据库记录的格式“记录”(record)是数据库的基础成分,是对某一实体属性进行描述的结果,是组成文档的基本数据单位。每一条记录由三种类型的字段组成:检索系统存取号、基本索引字段和辅助索引字段。举例:图书的记录格式 举例:期刊论文的记录格式 3. 数据库的文档结构数据库的文档一般有顺排文档和倒排文档两种类型。第二节 信息检索概述一、信息检索的发展历程及进展(一)手工检索阶段

25、(二)机械检索阶段(三)计算机检索阶段1. 脱机批处理检索2. 联机检索3. 光盘检索4. 网络检索二、信息检索的概念与原理信息检索(Information retrieval)是指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。信息检索是用户进行信息查询和获取的主要方式。信息检索包括信息存储和信息检索两个部分信息检索流程图检索原理:检索提问标识与存储标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,则具有该标识的信息就从检索系统输出,输出的信息就是检索命中的信息。三、信息检索的类型和方法(一)信息检索类型1. 按检索内容划分(1)文献检索:以文献

26、线索为检索对象的检索。检索系统一般为书目、索引、文摘等二次文献。(2)数据检索:以数值形式表示检索内容的信息检索。(3)事实检索:以文献中抽取的事实为检索内容的信息检索。(4)全文检索:以原始文献中所含的全部信息作为检索内容的信息检索,即是以文献全文作为检索内容的信息检索。检索的内容可以是全文,也可以是部分内容,并可进行各种频率的统计和内容分析,它通常用自然语言表达检索课题。(5)图像检索:以有关人、事、物的形象,包括图像和图文信息为检索内容的信息检索。(6)多媒体检索:多媒体检索通常是以文字、图像、数据和声音为检索内容的信息检索。2. 按信息检索手段划分(1)手工信息检索(2)计算机信息检索

27、(二)信息检索方法1.工具法是指利用各种检索工具或数据库查找文献信息的方法。(1)顺查法:以研究课题的起始年代为起点,由远及近,逐年查找,直至最近期为止。(2)倒查法:针对研究课题,从最近期向早期回溯,直至查获适量切题文献信息为止。(3)抽查法:抽查法是一种利用检索工具进行重点抽查检索的方法。2.引文追溯法 利用文献所附的参考文献进行追溯查找。3.循环法 是工具法与引文追溯法相结合的一种检索方法。四、信息检索工具信息检索工具是用来存储、报道和检索文献线索的工具,具有存储和检索两个基本功能。信息检索工具的类型按照不同的标准划分有不同的类型,最常用的一种划分方式就是按照著录内容划分,可以分为目录、

28、题录、文摘三种。第三节 现代信息检索策略一、分析检索课题,明确检索需求1. 分析课题学科属性、专业范围及相关内容2. 分析检索课题的信息类型和时间要求3. 明确用户自身的信息需求二、选择检索系统选择检索系统要考虑三方面的因素。一方面是检索课题的具体要求,包括所需要的学科、主题范围,对语种、年代、资源类型的要求,以及对查全、查准、查新方面的具体要求。另一方面,要考虑检索系统的类型和性能,包括其收录范围,报道内容及倾向、可获得性,存储年限、更新周期、所具有的检索功等方面。最后,要考虑检索者对检索系统的熟悉程度。综合上述几方面的考虑,选择匹配性最佳的检索系统。三、确定检索途径(一)以文献的外部特征为

29、检索途径1. 题名途径2. 责任者途径3. 号码途径(二)以文献信息的内容特征为检索途径1.分类检索途径2.主题检索途径四、选择检索词检索词是表达文献信息需求的基本元素,也是计算机检索系统中进行匹配的基本单元。选择检索词一般要考虑以下基本原则:(1)所选检索工具有叙词表或主题词表的,优先选用叙词或主题词作为最基本的检索词;(2)要从词表规定的专业范围出发,选用各学科内具有检索价值的基本名词术语;(3)如选择的检索词无词表可查,或在词表中未反映,可选择自由词作为检索词;(4)选词要适应待检数据库的检索用词规则;(5)通常要选择常用的基本词汇进行匹配。五、构造检索式1.概念检索检索标识是具体的检索

30、词或词组,每个检索词表达一个概念 2.布尔逻辑算符组配检索 是将多个检索词进行逻辑组配形成的一种复合性检索要求。(1)逻辑与用符号“ and” 或 “*”表示,其逻辑表达式为: A and B 或 A * B 其意义为检索记录中必须同时含有检索词A和B的文献,才算命中文献。(2)逻辑或用符号“or”或“+”表示, 其逻辑表达式为: A or B 或 A + B其意义为检索记录中凡含有检索词A或检索词B,或同时含有检索词A和B的,均为命中文献。(3)逻辑非用符号“not”或“”表示, 其逻辑表达式为: A not B 或 A B其意义为:检索记录中含有检索词A,但不能含有检索词B的文献,才算命中

31、文献。 3.位置逻辑算符 4.截词和屏蔽(模糊检索)使用截词符(通配符):?,%,* ,$截词主要是利用检索词的词干或不完整的词形进行检索。5.比较运算符 等于,> 大于,< 小于 ,>= 大于等于,<= 小于等于 6.优先运算符 ( ) 、 、“” 7.检索字段限定符 CNKI中国知网:专业检索某些外文数据库: TI=rice、AU=Li Hua 六、实施检索七、调整检索策略检索时,应及时分析检索结果是否与检索要求一致,如果不一致,则应对检索策略做相应的修改和调整,直至得到比较满意的结果。对检索结果的分析有如下三种情况:1. 检索结果信息量过多检索结果信息量过多的原因

32、可能有:对所选的检索词的截词截得太短;未加字段限定或限定太过宽泛;使用了过多的相关词或上下位概念等。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下: 减少同义词与同族相关词。 增加限制概念,采用逻辑“与”连接检索词。 使用字段限定,将检索词限定在某个或某些字段范围。 使用逻辑“非”算符,排除无关概念。 增加语种限制以及缩短检索期限。 调整位置算符,由松变严。 将截词的词根变长或减少截词算符的使用。2. 检索结果信息量过少 造成检索结果信息量少的原因有:选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;同义词、相关词、近义词没有运用全;上位概念或下位概念

33、没有完整运用;字段限定太多;逻辑“与”、“非”用得过多;检索概念专指度过高等。这种情况要考虑扩大检索范围,提高检索结果的查全率。调整检索策略的方法如下: 选全同义词与相关词并用逻辑“或”将它们连接起来,增加网罗度。 减少逻辑“与”和逻辑“非”的运算,丢掉一些次要的或者太专指的概念。 去除某些字段限制。 增加上位概念。 重新选择更合适的数据库。 调整位置算符,由严变松。 增加截词算符的使用。3.检索结果中误检率过高错误率过高的原因可能有:检索词本身的多义性;主题词分析错误;使用了不规范的缩写。调整检索策略的方法如下: 对叙词进行相关的限定,如学科限定。 提高用户分析课题的能力,确定核心检索词。

34、尽量少使用全文字段检索。 正确使用缩写词。通过对检索策略的不断优化,从而使我们最终得到满意的检索结果。八、获取原始文献获取全文的途径:首先是查找本单位购买的全文数据库;其次可利用那些提供流量计费下载的全文数据库网站获取;第三,向文献收藏单位联系馆际互借或文献传递;第四,可直接向作者索取;最后,都找不到的情况下,可向出版发行单位购买。第四节 检索效果评价检索效果评价主要是指信息检索的最终结果是否满足用户需求或满足程度如何。一、检索效果评价指标常用的评价指标有:查全率、查准率、漏检率、误检率、响应时间、用户负担和输出形式等,其中最常用的指标是查全率和查准率。1. 查全率(Recall ratio)

35、与漏检率(Omission ratio)查全率是用来描述系统检出相关文献能力的一种尺度,是指检索出的相关信息量与信息系统中的相关信息总量之比,其计算公式为:查全率(R )=×100漏检率是指未被检出的相关信息量与信息系统中的相关信息总量之比,其计算公式为:漏检率(O )=×1002. 查准率(Precision ratio)与误检率(Fall-out ratio)查准率是用来描述检索精确度的指标,是指检索出的相关信息量和检索出的信息总量之比,其计算公式为:查准率(P )=×100误检率是指检索出的非相关信息量和检索出的信息总量之比,其计算公式为:误检率(F )=&

36、#215;100二、影响检索效果的因素(一)检索工具质量 存储文献是否齐全,索引系统是否完善,标引过程中失误率及标引深度(标引时分析文献所达到的深度),标引的全面程度等等,都对查全率和查准率有着很大的影响。(二)标引语言与检索语言的一致性文献信息检索是将检索标识与文献标识进行匹配比较的过程。为了达到二者的匹配,检索者使用的语言必须与文献标引语言相一致,即必须使用检索工具中所采用的语言,否则,就达不到预期的效果,漏检率会增大。(三)检索者的熟练程度文献信息检索专业性很强,检索人员必须熟悉相关专业知识,才能准确分析课题,制定合适的检索策略,获得良好的检索效果。因此,检索者应该熟悉检索工具和检索方法

37、,了解检索工具的收录范围及提供的检索途径,以便灵活处理各种情况,提高检索效率。(四)检索策略正确的检索策略及检索表达式可以优化检索过程,有助于提高查全率及查准率,取得最佳的检索效果。用单个词检索时会有较高的查全率和较低的查准率;用几个单词进行组配检索时将会有较高的查准率,但查全率会下降。在自然语言存在大量同义词与近义词、学名与俗称、新称与旧称、全称与简称、单数与复数这类词必须视为与检索词等同的词,才能保证查全率。自然语言中还存在大量的多义词,也会影响查准率。三、提高检索效果的措施提高检索效果,一是要提高查全率和查准率,二是降低漏检率和误检率。针对上述影响因素,提出如下措施:1.提高检索工具的编

38、辑质量2.准确使用检索语言3.提高检索者的水平,制定最优检索策略第三章 中文文献数据库检索第一节CNKI中国学术期刊网络出版总库一、简介(一)CNKI(国家知识基础设施)工程简介提出:1998年世界银行提出全称/简称: 国家知识基础设施(National Knowledge Infrastructure/ CNKI )发起: 由清华大学、清华同方发起始建: 1999年6月(二)重点数据库介绍(要求学生知道收录的数据库名称)CNKI 系列源数据库:中国期刊全文数据库(含世纪期刊)中国博士学位论文全文数据库中国优秀硕士学位论文全文数据库中国重要报纸全文数据库中国重要会议论文全文数据库中国图书全文数

39、据库二、中国期刊全文数据库1数据库简介期刊总数(8200 余种)、文献总量(2700 余万篇)、更新周期(中心网站日更新)、全文质量(PDF全文数据格式)、时间范围(1994年-)、学科范围(10个专辑168个专题3600个子栏目)、多种产品形式、检索主界面介绍2检索方式:文献检索、期刊导航(注具体的检索方式按当时数据库的最新检索方式进行介绍,以下所有数据库相同)3检索结果处理显示、标记、保存、打印、电邮全文(CAJ/PDF/TXT格式、打开/保存)第二节 中文科技期刊数据库一、简介1.维普信息资源系统简介维普信息资源系统是由重庆维普资讯有限公司研制开发的网络信息资源。2.维普信息资源系统数据

40、库:中文科技期刊数据库(全文版)中文科技期刊数据库(文摘版)中文科技期刊数据库(引文版)外文科技期刊数据库(文摘版)中国科技经济新闻数据库中国企业及产品广告数据库3.中文科技期刊全文数据库简介期刊总数(8000 余种)、核心期刊(1810 种)、文献总量(2000 余万篇)、更新周期(中心网站日更新)、全文质量(PDF全文数据格式) 时间范围(1989年至今)、学科范围(8个专辑28个专题)、检索方式(5种)著录标准(中图法/检索期刊条目著录规则)、服务方式(5种)二、中文科技期刊全文数据库检索检索主界面介绍检索方式:快速、传统、高级、分类、期刊导航检索三、检索结果处理显示、标记、下载、打印、

41、电邮、加入电子书架、我的数据库题录、文摘、全文(PDF格式/纯文本格式) 第三节 万方数据资源检索系统一、简介1.万方数据股份有限公司万方数据股份有限公司是由中国科技信息研究所以万方数据(集团)公司为基础,联合山西漳泽电力股份有限公司、北京知金科技投资有限公司、四川省科技信息研究所和科技文献出版社发起组建的高新技术股份有限公司。2.数据资源简介中国数字化期刊群、中国学术会议论文全文数据库(中文版)、中国学位论文全文数据库、中国标准全文数据库、科技信息子系统、商务信息子系统、外文文献数据库二、数据库检索1.单库检索: 2.跨库检索:经典检索、专业检索三、检索结果处理显示、下载第四节 人大复印报刊

42、资料全文数据库检索一、数据库简介 简介、收录范围、收录时间、资源列表二、数据库检索数据库检索主界面检索方式:浏览检索、查询、高级查询、二次检索三、检索结果处理 显示:单篇显示、多篇显示 用户定制:标题定制、全文定制、排序、 检索历史、打印、保存全文全文格式:TXT格式第五节 超星数字图书馆一、超星数字图书馆 1.简介超星数字图书馆由北京世纪超星信息技术发展有限责任公司投资兴建,2000年1月在互联网上正式开通。其内容包括文学、历史、法律、军事、经济、科学、医药、工程、建筑、交通、计算机和环保等几十个分馆,收录年限为1977年至今。 2.数据库检索 检索方式:快速检索、分类检索、高级检索 3.检

43、索结果处理显示、阅读、下载、打印、收藏到我的图书馆二、读秀学术搜索 1.简介读秀学术搜索是由海量图书等文献资源组成的庞大的知识系统,是一个可以对文献资源及其全文内容进行深度检索,并且提供原文传送服务的平台。 2.检索方法 基本检索、高级检索 3.检索结果处理显示、阅读、文献传递第六节 其他中文数据库一、书生之家数字图书馆二、方正阿帕比(Apabi)电子图书三、中国科学引文数据库四、中文社会科学引文数据库五、图书馆书目数据库第四章 外文文献数据库检索第一节 世界三大农业数据库一、概述世界三大农业数据库是指CAB Abstracts、AGRIS、AGRICOLACABI是国际应用生物科学中心的缩写

44、,其前身是CAB,即1928年成立的皇家农业局;CAB Abstracts是CABI出版的二次文献数据库(目前有部分全文),是世界上最大的农业文献数据库。AGRIS数据库是由联合国粮农组织(FAO)所属的国际农业科技情报系统编辑的书目数据库。该数据库的学科范围包括农业、林业、畜牧业、渔业、食品科学、地球科学、环境科学、农业工程、人口、经济、法律、教育等。AGRICOLA数据库是由美国农业图书馆(NAL)、食品与营养信息中心(FNIC)、美国农业经济文献中心(AAEDC)等机构联合编辑的数据库。该数据库主题范围包括农、林、牧、水产、兽医、园艺、土壤等整个农业科学领域及动物、植物、微生物、昆虫、生

45、态等生命基础科学及环境科学、食品科学。引用文献类型除期刊论文等连续出版物之外,还包括专著、学位论文、计算机软件、技术报告、专利、声像资料等。二、检索方式简要介绍OVIDSP中数据库进入主页界面方法和主页界面。OVIDSP检索相关检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用等;字段限制检索的语法格式,常用字段缩写表达。OvidSP的5种检索方法 (要求知道中英文名称)三、OvidSP中检索结果处理的基本方法和步骤第二节 EBSCOhost全文数据库EBSCO Publishing 是美国的一家私人公司,创建于1948年,1986年开始发行电子产品,1994年开始

46、在Internet 上提供在线服务。EBSCOhost是该公司推出的三大数据系统之一,也是目前世界上比较成熟的全文检索数据库之一,共包括60多个专项数据库,其中全文数据库10余个。一、数据库概述(以ASP、BSP为例介绍)ASP(Academic Search Premier)学术期刊数据库的简称,由EBSCO Publishing公司出版,是世界上最大的多学科学术数据库,提供近4700多种学术出版物的全文,包括3100多种同行评审期刊的全文。收录几乎覆盖学术研究的每个领域,并且所提供的内容信息最远可追溯至1975年。此数据库每日更新。 BSP(Business Source Premier)

47、商业资源数据库的简称,由EBSCO Publishing公司出版,这是业界使用最多的商业研究数据库,提供 2300多种期刊的全文。与商业相关的所有主题范围几乎均包括在内。此数据库每日更新。二、检索方法简要介绍该数据库进入主页界面方法和主页界面。该数据库检索相关检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用等;字段限制检索的语法格式,常用字段缩写表达。检索方法(基本检索、高级检索、视觉搜索的中英文名称应该知道)的步骤及相关检索技术的灵活应用技巧。第三节 ProQuest全文数据库ProQuest是ProQuest Information and learning公

48、司(原名UMI/Bell & Howell)推出的全文检索系统,为用户在网上进行多文档检索并随时获取全文提供了方便。该公司成立于1938年,是全球最大的文献信息服务公司之一,也是美国学术界著名的出版商。该公司的信息遍及世界,其出版物收录了20000多种外文期刊、7000多种报纸、150多万篇硕、博士论文、20多万种绝版书及研究专集,内容覆盖1000多个学科和专业。目前我校图书馆购买的数据库主要有农业和生物科学两种。检索技术(或技巧):布尔表达方式及应用、位置运算符应用方法、截词和通配符的应用、双引号表达意义等检索方法:基本检索、高级检索、主题和出版物检索(中英文名称应该知道)第四节 S

49、cienceDirect电子期刊全文数据库ScienceDirect是Elsevier Science公司的核心产品。Elsevier Science是一家总部设在荷兰的历史悠久的跨国科学出版公司,所出版的期刊是世界上公认的高品位学术期刊,且大多数为核心期刊,被世界上许多著名的二次文献数据库所收录,其中60%以上的期刊被SCI收录。第五节 其它外文数据库一、Web of Science二、Cell Press Journals三、SpringerLink四、Wiley InterScience五、MEDLINE六、EMBASE.com七、Engineering Village 2八、SciFi

50、nder Scholar九、BIOSIS Previews十、Food Science and Technology Abstract十一、LexisNexis Academic学术大全数据库十二、NetLibrary电子图书十三、Dialog国际联机检索系统第五章 特种文献检索第一节 专利文献及其检索一、专利概述1.专利的概念“专利”一词从不同的角度,具有三种含义:(1)专利就是专利权的简称,是指从法律角度所认定的权利。(2)专利是指取得专利权并受到专利权保护的发明创造,是从专利权客体的角度来阐述专利的含义。(3)专利是指专利文献。从专利公开的形式来说,专利是指记载享有专利权的发明创造内容的

51、专利文献。通常说的“查专利”就是指查专利文献。2.专利权的特征独占性、地域性、时间性3.专利的类型(1)发明专利(保护期限20年):是指对产品、方法或者其改进所提出的新的技术方案。因此,发明专利分为产品发明、方法发明和用途发明。发明专利是三种专利中最重要的一种。(2)实用新型专利(保护期限10年):是指对产品(包括机器、设备、用具等有形物)的形状、构造或其组合所提出的适于实用的新技术方案。这种新的技术方案能够在工业上制造出具有使用价值和实用用途的产品。由于实用新型专利的创造水平低于发明专利,人们常称之为“小发明”或“小专利”。(3)外观设计专利(保护期限10年):外观设计亦称为工业品外观设计,

52、是指对产品的形状、图案或者其结合以及色彩与形状、图案的结合所作出的富有美感并适于工业应用的新设计。4.获得专利权的条件(1)新颖性新颖性是发明和实用新型能否获得专利权的首要条件。我国专利法第二十二条对新颖性定义为:新颖性是在申请之日以前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其它方式为公众所知,也没有同样的发明或者实用新型由他人向专利局提出过申请记载在申请日以后公布的专利申请文件中。(2)创造性创造性是发明和实用新型取得专利权的另一个实质性条件。创造性是指与申请前已有的技术相比,该发明或者实用新型有突出的实质性特点和显著的进步。(3)实用性实用性是指该发明或

53、实用新型能够制造或者使用,并且能够产生积极效果。5. 专利制度的作用(1)保护与鼓励发明创造(2)有利于新技术的交流与传播(3)鼓励与促进新技术的开发及应用(4)有利于鼓励、吸引国外投资二、专利文献概述1. 专利文献的概念专利文献是指各国专利局(知识产权局)及国际专利组织在受理审批专利过程中产生的官方文件及其出版物的总称。作为公开出版物的专利文献主要有:专利说明书、专利公报、专利索引等。狭义的专利文献仅指专利说明书。2.专利文献的特点新颖性、广泛性、规范性、快速性、重复性三、国际专利分类表(IPC)1. IPC是欧洲理事会编制的专利分类表,是类分专利文献和通过主题来检索专利文献的重要工具。2.

54、 IPC1968年9月1日第一版IPC生效,每5年修订一次。3. IPC采取功能分类和应用分类结合、以功能分类优先的原则,并采用等级分类体系,将技术内容按部、分部、大类、小类、主组、分组逐级分类,组成一个完整的分类系统。IPC共分8个部,20个分部,100多个大类,600多个小类,5.8万多个主组与分组。部的类号用大写字母AH表示,分部无类号标识。四、中国专利文献检索1专利公报中国专利公报是中国专利局的官方出版物,专门公布和公告与专利申请、审查、授权有关的事项和决定,是检索中国专利文献的主要检索工具。专利公报分为“发明专利公报”、“实用新型专利公报”、“外观设计专利公报”三种,均于1985年创

55、刊,周刊,采用摘要的形式报道,附有专利公报索引和年度索引。1992年8月起,上述三种专利公报均被收入“中国专利文献数据库”。2专利索引中国专利索引自1986年以来由中国专利出版社逐年出版,收集了1985年4月1日我国专利法实施以来在三种专利公报上公布的所有中国专利信息条目,该索引为题录型检索工具,1986-1992年间每年出版一次,从1993年起,每半年出版一次,每次出版分两个分册,第一分册为分类年度索引,按国际专利分类表或国际外观设计分类号顺序排列;第二分册为申请人、专利权人年度索引,按申请人、专利权人名称的汉语拼音顺序排列。中国专利索引和专利公报可单独使用,也可配合使用。3中国专利文献数据库五、国外专利文献检索1.德温特出版公司世界专利索引(World Patent Index,简称WPI)2.网上专利信息检索Internet上有丰富的专利文献信息源,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论