文献信息检索与利用课件_第1页
文献信息检索与利用课件_第2页
文献信息检索与利用课件_第3页
文献信息检索与利用课件_第4页
文献信息检索与利用课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一讲

文献信息检索基础知识

第一节

信息与信息素养

第二节

科技文献的类型

第三节

信息检索与文献检索工具

第四节

信息检索原理

第五节

信息检索的方法和途径

第六节

信息检索常用技术及检索效果评价

第一节

信息与信息素养

一、信息的基本含义

1、图书馆学和情报学领域,信息被定义为事物或记录。

2、综合学术界对信息的定义,可以认为信息是以物质介质为载体,传递和反映世界各种事物存在方式、运动规律及特点的表征。

自然信息

社会信息

科学信息

科学家破译染色体的基因信息

风、雨、雷、电、春、夏、秋、

语言、战争、贫困、喜、怒、哀、乐

(一)信息与社会

从生产力的角度可以将人类社会划分为四个发展阶段:

原始社会、农业社会、工业社会和信息社会。

信息社会的主要标志是信息与知识成为社会最重要的基础性资源。

在人类漫长的发展历程中,物质、能量、信息三种资源支配着人类最基本的生产活动。

物质---向人类提供材料及生活必需品

信息---向人类提供知识和智慧

能量---向人类提供动力

信息社会的主要标志是信息与知识成为社会最重要的基础性资源。

(二)信息的基本特征

1.客观性

2.时效性

3.载体性

4.传递性

5.可塑性

6.共享性

7.可开发性

8.可增值性

一个完整的信息传递过程必须具备信源(信息的发出体)、信宿(信息的接受体)、信道(信息的传递媒介)和信息四个基本要素。

(三)与信息有关的基本概念

1.知识

知识是人们对客观事物的认识和经验总和。

知识与信息的关系:知识是信息的一部分,不直接等同于信息;知识是人类大脑活动的产物,是系统化、精炼化的信息。

2.情报

情报是传递中的有用的知识或信息,是为解决特定问题所需要的知识。

3.文献

文献是记录知识的一切载体。

三个基本要素:

1)文献含有知识信息

2)负载知识信息的物质载体

3)记录知识信息的符号和技术

二、什么是信息素养

信息素养有广义狭义之分。广义指信息社会对个人品质、道德观念、知识体系和能力要求的总合,或信息时代国民应有的素质,包括品质和能力两个方面。狭义指获取信息和使用信息的能力与品质。

信息素养教育的提出是文化积淀的产物

?人是环境的产物。信息素养教育的提出,既是社会演进的要求也是文化积淀的结果。英语中literacy翻译成汉语是有文化的意思,它的否定表达方式是“非文盲”,反义词是文盲(illiteracy)。在传统社会里,文盲占人口的大多数,有文化的只限于少数人。中世纪的欧洲,文化掌握在天主教神职人员之手,目不识丁的国王,屡见于史。中世纪晚期,印刷术的发明为文化的普及开辟了道路。工业社会需要有文化的劳动力,提出了扫除文盲,普及教育的要求。Literacy的标准是会读、会写、会算。图书馆事业兴起后,开展用户教育提出了图书馆素养(或文化)问题,称之为libraryliteracy。计算机普及后,为了加强计算机技能教育,便有了计算机文化computerliteracy或计算机素养之说,也有称之为数字化素养(digitalliteracy)网络素养(networkliteracy)和媒体素养(meidialiteracy)的。在信息技术和信息产业发达的国家里最早提出了信息素养(informationliteracy)的概念。美国信息产业协会主席保罗.泽考斯基(PaulZurkowaski)1974年在美国全国图书馆与情报学委员会上,最早提出了信息素养的概念,他把信息素养概括为:“利用大量的信息工具及主要信息源使问题得到解答的技术和技能。”

第二节

科技文献的类型

一、文献的主要类型

(一)

按载体类型分:

印刷型、缩微型、电子型、声像型

(二)

按出版类型分:

图书、连续出版物、特种文献

(三)按加工深度分:一次、二次、三次

(一)根据文献的载体形式划分

印刷型

图连资续出书版料物

缩微型

缩微胶片缩微胶卷缩微平片电子型

磁光联带机、网磁盘络盘版声像型

录音带、录像带唱片、幻灯片电影胶卷

印刷型文献

利用纸张为存储介质,以手写、印刷为记录手段而产生的文献。包括油印、铅印、胶印、复印等印刷品及手稿。

载体:纸张

实例:教科书

记录手段:油印、石印、

铅印、胶印、复印

特点:可直接阅读,方便

使用;但难于实现机

械化和自动化;收藏

文献占用空间大。

缩微型文献

是以感光材料为存储介质,利用缩微照相技术使文献缩微化的文献。

载体:感光材料

实例:缩微平片、缩微胶片

记录手段:光学缩微技术

特点:体积小;价格低;不能直接阅读

声像型文献

以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像信息的文献。

载体:磁性材料、感光材料

实例:录像带、幻灯片

记录手段:磁记录、光学技术

特点:直观、生动、形象;成

本高;不易检索和更新。

电子型文献

以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源

载体:磁性材料

实例:磁盘、光盘

记录手段:计算机输入

特点:存储密度高、速度快;

易复制;成本高;不能

直接阅读。

(二)根据文献的编辑出版形式划分

按出版形式及内容的不同

期刊

报纸

科技报告

会议文献

政府出版物

专利文献

标准文献

产品资料

学位论文

连续出版物

特种文献

图书的含义

凡篇幅达48页以上并构一个书目单元的文献称为图书。

国际标准书号(ISBN)

国际标准书号(ISBN)(InternationalStandardBookNumber)

每一种正式出版的图书的唯一标识代码,是专门为识别图书等文献而设计的国际编号。

例如:《信息检索原理与方法教程》,赵岩碧主编,化学工业出版社,2005年3月出版。其ISBN号为:7-5025-6431-4

ISBN7-5025-6431-4(旧号)ISBN978-7-5025-6431-5(2007年后出版图书采用的新号)

第一段:978是由国际物品编码(EAN·UCC)系统专门提供给国际ISBN管理系统的产品标识编码。

第二段:7语区号,代表国家、地区、语种

如0和1-英,2-法,3-德,4-日,5-俄,7-中,88-意大利,9971-新加坡

第三段:5025出版社代号,由国家或地区ISBN中心分配;

第四段:6431出版图书号,由出版社按出版顺序所给;

第五段:校验位

期刊又称杂志,它是指采用统一名称定期或不定期出版的连续性出版物。

国际标准刊号(ISSN)

国际标准连续出版物号(ISSN)

?正式出版的期刊有ISSN代码,即国际标准连续性出版物编号,是国际连续出版物数据系统国际中心为在该系统登记的连续出版物分配的号码。

?采用ISSN编码系统的出版物有期刊、会议录等。

如:《中国图书馆学报》

国际标准刊号:ISSN1001—8867全长8位,前7位为刊名代号,末位为校验位

期刊的特点

A、期刊以品种为单位形成知识流;

B、报道文献速度快,内容新颖,能及时反映世界科

技水平,但不如图书成熟;

C、品种多,数量大,覆盖了人类所以知识领域及各

学科专业,具有很强的容纳性。

D、科技期刊

是最重要的一次文献。

*

少数刊载某一学科大量高质量专业论文的期刊。

*特点

(1)刊载专业文献密度高,信息含量高;

(2)水平较高,代表本学科的最新发展水平;

(3)出版相对稳定,所载文献寿命较长;

(4)利用率和被引率较高。

目前,许多单位核心期刊的判定是以

《中文核心期刊要目总览》为标准

是以报道新闻及评论为主,出版周期比期刊更短,多为活页性连续出版物。其特点是内容丰富、信息量大、出版迅速、发行量大、读者众多。

科技报告是科技工作者对科学、技术研究结果或研究进展的记录。

科技报告的特点

(1)反映新的科研成果迅速;

(2)内容多样化;

(3)质量参差不齐;

(4)保密性强;

(5)每份报告独立成册,有连续编号。

会议文献是指在各

种会议上宣读、交流的

论文、报告及其它有关

文献。

政府出版物是指由政府机构制作出版或由政府指定出版商出版的文献。

政府出版物的类型

(1)行政性文件

(2)科技文献

专利文献是指实行专利制度的国家申请、审批专利过程中所产生的专利申请书、说明书及官方文件或出版物。其中最重要的是专利说明书。

与标准化活动有关的一切文献都称为标准文献。其主体是标准,还包括标准形成过程的各种档案、宣传推广标准的手册及其它出版物。

标准是按规定程序制订,经权威机构公认或主管部门批准的在特定范围内执行的规格、规则、技术要求等规范性文件。

指厂商为推销产品而印制的各种宣传资料、技术资料。如公司介绍、产品目录、样本、说明书等,它反映厂家、公司及产品的有关信息,对产品采购,仪器设备的维护、使用及新产品开发具有重要价值。

(三)不同加工层次的文献信息

一次文献

二次文献

三次文献

按文献

的加工

深度分

*

作者以自己的研究成果为基础创作或撰写,

并通过某种渠道而公开的文献;

*

对知识的第一次加工;具有创造性;

*

大多数期刊论文、科技报告、学位论文、会

议文献、专利文献、技术档案等。

*

对一次文献进行浓缩、整序及加工处理而成

的具有报道和检索作用的文献;

*

对知识的第二次加工;有序化;提供一次文

献线索;

*

目录、题录、文摘等检索工具。

并经过综合分析与重新组合而编写的文献。

*

对知识的再加工;提供文献检索;

*

综述、专著;字词典、百科全书

*指从一次文献中提取数据、事实和有关结论,

一次、二次、三次文献三者之间的关系

从检索的角度来看

一次文献是检索的对象(目标)

二次文献是检索的工具(手段)

三次文献是情报研究的成果(检索目标+检索手段)

一次、二次、三次文献三者之间的关系

从知识加工角度来看

从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走想有序、由一种有序结构演变为另一种完善的有序结构的过程。

第三节

信息检索与信息检索工具

一、信息检索的定义及类型

(一)信息检索的定义

广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。全称为“信息存储与检索”

狭义的信息检索:指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。

人们多用“文献检索”的概念,强调了检索对象。

(二)信息检索的类型

1、按检索内容划分:

文献检索、数据检索、事实检索

2、按信息检索手段划为:

手工检索、计算机检索

3、按信息组织方式划分:

全文检索、超文本检索、超媒体检索

第四节

信息检索原理

信息检索的原理

?将文献检索标识与文献存贮标识进行类比,二者若取得一致(即二者匹配),就可将文献库中符合检索提问要求的文献取出来。

简而

言之

检索标识

匹配

存贮标识

检索命中

原始文献

加工整理

数据库

检索过程分析

表达需求

检索者

检索系统

反馈结果

信息源(大量信息)

充分标注(检索语言)

可检索(检索技术、规则等)

可显示(屏幕显示或打印)

信息之间的连接等

信息检索的本质,实际上就是信息集合与需求集合的匹配与选择。

第五节

信息检索的方法和途径

(一)信息检索语言

检索语言主要有:

1、分类语言:

以学科体系为基础,将各种概念按学科性质进行分类和系统排列,并用分类号予以编排组织成一个完整的体系。

2、

主题语言:

用词语来表达各种概念,即用规范化或未规范化语言中的名词、名词性词组或短语作为主题词,来表达各种概念,将各种概念不管其相互关系,完全按字顺排列。

3、号码语言:

按文献代码,如专利号、

标准号、报告号等的顺序排检。

《中图法》体系结构:

基本部类(5个)

基本大类(22个)

1.马列、毛泽东思想:A马列、毛泽东思想

2.哲学

:B哲学

3.社会科学

:C社会科学总论;D政治、法律;E

军事;F经济;G文化、科学、

教育、体育

;H语言、文字;I文学;

J艺术;K历史、地理

4.自然科学

:N自然科学总论;O数理科学和化学;P

天文学、地球科学;Q生物科学;R医学、

卫生;S农业科学;T工业技术;U交

通运输;V航空、航天;X环境科学、劳

动保护科学(安全科学)

5.综合性图书

:Z综合性图书

《中图法》22大类是基础,每一大类下根据学科的具体内容层层细分为二级、三级、四级......类目,这逐级划分下去就形成了等级分明的科学系统。如:

O

一级类目

数、理、化

O1

O3

O4

O6

O7……二级类目

数学

力学

物理

化学

晶体

O11

O12

O13……三级类目

古典数学

初等数学

高等数学

O121O122

O123

O124四级类目

算术

初等代数

初等几何

三角

中图法全称为“中国图书馆分类法”

所有图书按中图法编制成相应的索书号进行排架

什么是关键词

?直接选用文献中的自然语言作为基本的词汇,出现在文献标题(篇名、章节名)、摘要和正文中,能揭示和描述文献主题内容具有实质意义的的那些词语,且不加规范化处理。

(二)文献信息检索方法

?常用法

?回溯法

?循环法

常用法(又称工具法)

指直接利用检索工具(系统)检索文献信息的方法,这是文献检索中最常用的一种方法。

1.顺查法:由远及近,从后向前。

如:已知某研究课题的最初产生年代(1990)

了解

发展过程

从最初的年代(1990)开始,逐步往近期查

2.倒查法:由近及远,从前向后。一般查1-5年,重点:在近期文献,只要查到基本满足需要为止。

3.抽查法:是抓住某学科发展迅速,研究成果发表较多的时期,进行重点检索。

前提:熟悉学科发展特点。

回溯法(引文法)

回溯法是指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献,进行逐一地回溯查找“引文”的一种最简便的扩大情报来源的方法。它还可以从查到的“引文”中再回溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。

优点:

在没有检索工具或检索工具不全的情况下能借助一些引文索引,述评或专著的参考文献查找。

缺点:

查得的文献不全面,比较陈旧。

循环法(又称为分段法)

它是把上述两种方法加以综合运用的方法,既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行回溯检索,分期分段地交替使用这两种方法。

(三)文献信息检索途径

?分类途径

?主题途径

?著者途径

?其他途径

1.分类途径

?

分类途径是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引。

?

分类途径检索文献关键在于正确理解检索工具的分类表,将待查项目划分到相应的类目中去。

2.主题途径

?

主题途径是指通过文献资料的内容主题进行检索的途径,它依据的是各种主题索引或关键词索引,检索者只要根据项目确定检索词(主题词或关键词),便可以实施检索。

?

主题途径检索文献关键在于分析项目、提炼主题概念,运用词语来表达主题概念。主题途径是一种主要的检索途径。

3.著者途径

?

著者途径是指根据已知文献著者来查找文献的途径,它依据的是著者索引,包括个人著者索引和机关团体索引。

4.其他途径

?

其他途径包括利用检索工具的各种专用索引来检索的途径。

?

专用索引的种类很多,常见的有各种号码索引(如专利号、入藏号、报告号等),专用符号代码索引(如元素符号、分子式、结构式等),专用名词术语索引(如地名、机构名、商品名、生物属名等)。

?课堂讨论题:

找一些有关翻译技巧的书刊,用馆藏查询的哪些途径可以获得?

(四)文献信息检索步骤

?文献信息检索是根据课题的要求,利用检索工具,按照一定的步骤和方法查找文献信息的过程。完成这个过程一般需要经过五个基本步骤:

1、分析课题与确定检索要求

2、选择检索方式与检索工具

3、确定检索途径与方法

4、优化检索提问与策略

5、整理检索结果

6、获取原文

第六节

信息检索常用技术及检索效果评价

一、信息检索常用技术

?布尔逻辑检索

?截词检索

?位置检索

?字段限制检索

1、布尔逻辑检索

在计算机文献检索中,用户的检索需求是通过检索提问式表达的,用逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。

布尔逻辑运算符:系统中采用的逻辑组配算符是布尔代数中的逻辑运算符AND/*(与)、OR/+(或)、NOT/—(非)。

(1)

AND

*

算符

实现逻辑“与”组配

检索时,命中信息同时含有两个概念,专指性强。

如:

traffic

AND

control

(2)OR

+

算符

实现逻辑“或”组配

检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比AND扩大。

如:

railway

OR

railroad(3)NOT

算符

实现逻辑“非”组配

命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词。

如:fruit

NOT

apple

布尔逻辑算符优先顺序

?执行优先顺序通常是:NOT>AND>OR。

?优先处理算符---“()”。与布尔逻辑算符搭配使用调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配。

?课堂讨论题:

试分析以下检索内容,利用布尔逻辑算符,构建出相关的检索式

1、检索数控机床的产品信息的相关文献

2、检索计算机算法或程序语言的相关文献

3、检索除因特网之外的计算机相关文献

4、检索工业模具设计与制造的相关文献

2、截词检索

截词是指将检索词在适当的地方截断,截词检索是用截断词的一个局部进行的检索,凡是满足这个截词所有字符(串)的记录,系统都为命中。

截词检索主要是利用检索词的词干或不完整的词形进行检索。

截词检索在西文数据库中广泛使用。是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。

按截词位置分:前截断、后截断、中间截断、左右截断;

按截词的字符数量分:有限截词、无限截词。

“?”、“

*

”表示截词的截断符号,各检索系统有不同的规定,没有统一标准。

前截断

?在检索字符串前方(左方)截断有限或无限的字母。

如:输入*chemistry

可检出:microchemistry(微量化学)

macrochemistry(常量化学)

abiochemistry(无机化学)

iatrochemistry(化学疗法)

……

?这种方法可以省略输入各种词头有变化的检索词的麻烦。

后截断

?在检索字符串后(右方)截断有限或无限的字母。

如:librar*

library,librarian,libraries……

?这种方法可以省略输入各种词尾有变化的检索词的麻烦。

主要用于

单复数检索(如Econom*:Economy,Economics,Economical……)

词根检索(buil*:building,built……)

年代检索(199*:1990,1991……1999)

中间截断

?在检索词中间嵌入截断符号,允许检索词中间有若干形式的变化。

如:输入wom*n可检出:woman,women

输入defen*e可检出:defence(防卫),defense

……

?主要解决一些英美拼写不同,单复数形式不同的词的输入。

左右截断

?将检索词左右词头、词尾部分同时截断,检索词中间一致。

如:输入*biolog*

可检出:neurobiology(神经生物学)

neurobiologist

microbiology(微生物学)

microbiologist

……

?适用于广泛课题的资料检索

有限截词

?对词干以外可以出现的字母数量进行限定。

如:

输入computer??表示截断处有0-2个字母变化,可检出:computer,computers,……

输入stud???表示截断处有0-3个字母变化,

可检出:study,studies,studied,student,

……

无限截词

?不限制被截断的字符数量。在检索词后加一个“

*”,表示该词后可加任意个字符。

如:输入educat*

可检出educate,educator,educators,educated,educating,education,……

注意:使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。

3、位置检索

?通过位置运算符来规定和限制检索词之间的相对位置,弥补布尔逻辑运算符构造某些提问式的不足,表达复杂专深的概念,从而提高检索的专指度。

?位置算符通常只出现在英文数据库中,多用于全文检索。

?Dialog等一些大型检索系统才支持位置算符。

?在检索提问式中同时出现位置算符和逻辑算符时,执行的先后顺序为:

先位置算符,后逻辑算符

注:不同的机检系统,位置算符的功能及算符不同,也有的检索系统不支持位置运算符,检索之前应该先看看数据库的帮助信息。

位置检索

①相邻位置算符

W、nW;

N、nN②字段算符

F、L③句子位置算符

S①

相邻位置算符:

W

nW

W:with的缩写

两词相邻,词序不变,中间不可插词,但两词之间可有一个标点、连字符或空格。

例:输入CD(W)ROM

将命中CDROM或CD-ROM

输入solar(W)energy

检出solarenergy

nWnW:nword的缩写

两词之间允许插入0-n个词,词序不变。

例:

communication(2W)satellite

将检索出含有communicationsatellite、communicationviasatellite、communicationonthesatellite的记录

N

nN

N:near的缩写

两词中间不可插词(但两词间可有一个标点,连字符或空格),允许词序发生颠倒。

例:输入cross(N)section可检出

crosssection和

sectioncross

nN:nnear的缩写

两词中间可插0~n个词(两词间可有一个标点,连字符或空格),允许词序发生颠倒。

例:输入cotton(2N)processing可检出cottonprocessing、processingofcotton、processingofEgyptiancotton②

字段算符:F

F:field的缩写

两词必须出现在同一字段中(如篇名、文摘、叙词等),词序与词量不限制。

如:输入pollution(F)control

/AB

检出的结果中pollution和control同时出现在文摘(abstract)字段中

句子位置算符:S

S:

Sentence的缩写

两词必须出现在同一句子或子字段中,词序与插入词量不

如:输入computer(W)control(S)system可检受限制。

出文摘中含有“Thispaperisconcernedwithanapplicationofthecomputercontroltechniqueinaintelligentsystem

fortestinginnerwallsofpipes.”这样一句话的文献记录。

4、限制检索

短语检索

字段检索

短语检索

将检索词用双引号””括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。

例:”GlobalPositioningSystem”

(GPS,全球定位系统)

只检索出规定字段中包含完整词组的记录。

字段检索

为了缩小检索范围,可利用字段代码来限制检索词出现的字段,以提高检索速度和查准率。

riceinab(只在文摘中查找)

au=Smith,J.C(查作者为Smith,J.C的

文章)py=1998(只查1998年的文章)

如:riceinti(表示只在题目字段中查找文献)

la=Chinese(只查语种为中文的文献)

常用检索字段中英文对照

西文数据库常用字段

字段名称

AbstractsAuthor字段代码

ABAU

中文数据库常用字段

文摘

作者

CorporateSource、Organization、CompanyDescriptor、SubjectDocumentTypeCSDEDT机构名称

叙词/主题词

文献类型

Full-textISSN/ISBNJournalName、PublicationTitleKeyword、TopicLanguagePublicationYearFTISSN/ISBNJNKWLAPY

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论