信息检索的基本知识课件_第1页
信息检索的基本知识课件_第2页
信息检索的基本知识课件_第3页
信息检索的基本知识课件_第4页
信息检索的基本知识课件_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索的基本知识信息检索的基本知识主要内容1.信息检索概述2.信息检索原理及检索语言3.信息检索系统与检索工具4.信息检索的一般程序信息检索的基本知识1.信息检索概述1.1信息检索的含义

信息检索(InformationRetrieval)是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,又叫信息储存与检索(InformationstorageandRetrieval),这是广义的信息检索,如图1-1所示。狭义的信息检索则是仅指该过程的后半部分,即从信息集合中找出所需信息的过程。信息检索的基本知识信息存储与检索过程检索工具数据库检索提问式分析分析标识标识匹配输出文献的选择与收集文献源用户文献特征标识语言信息需求检索提问检索结果反馈从这个图中,我们可以看出两条主线。一条主线是文献检索,通过分析自身的文献需求,提出检索请求。另一条主线是数据库的建设,通过获取文献源,对文献进行分类标引入库,建成可检索的数据库。当检索请求与数据库相匹配后,就返回检索结果,得到需要的文献。信息检索的基本知识检索过程一位女子征婚,开出的交友条件有两点­

1.要帅­

2.要有车­

电脑去帮她搜寻的结果~~~~~~~~~~~~~~~~~象棋­这位女子,不服搜出的结果又输入­1.要有漂亮的房子­2.要有很多钱­电脑去帮她再次搜寻的结果~~~~~~~~~~~~~~银行­此女子仍然不失望,继续输入条件­1要长得酷­2又要有安全感­结果搜出的结果是~~~~~~~~~~~~~~~~~~~奥特曼此女子仍然不失望,还继续输入条件1.要帅­2.要有车­3.要有漂亮的房子­4.要有很多钱­5要长得酷­6又要有安全感­电脑去帮她再次搜寻的结果~~~~~~~~~~~~~~奥特曼在银行里下象棋

­信息检索的基本知识以《中文科技期刊数据库》为例它把我国公开或非公开发行的9000多种期刊,从1989年到现在的每一本每一期买回来,通过扫描、数码拍相等方式录入,转化为数字形态,并对其中的每一篇文献进行分类标引和主题词标引等加工,然后入库,最后通过一个检索程序把它整合起来,发布在网络上,供人们检索使用。这个过程描述起来非常简单,但在做的过程中,有很多细节性的问题。比如,购买期刊,涉及到版权问题;文献标引,涉及到学术上的元数据标准问题;检索程序,涉及到IT技术;网络应用,也正在走向丰富的知识服务时代。信息检索的基本知识1.2信息检索的类型

1.根据检索对象划分根据检索对象的不同,早期的信息检索分为以下几种。(1)文献检索:以文献为检索对象。凡是查找某一课题、某一著者、某一地域、某一机构、某一事物的有关文献的出处和收藏单位等,均属于文献检索。这是一种相关性检索,它提供的是与用户信息需求的相关文献的线索或原文。(2)事实检索:以特定的事实为检索对象如查找某一事物发生的时间、地点与过程,某类产品哪些厂家生产、哪个牌号最好等,均属事实检索。属确定性检索。(3)数据检索:以数据为对象的检索。如查找某一数学公式、数据、图表,某一种材料的成分、性能都属于数据检索的范畴。属确定性检索信息检索的基本知识文献检索是一种不确定性检索,多利用专业检索工具,包括目录、题录、文摘、索引与搜索引擎及其相对应的数据库资源与网络资源。数据检索与事实检索得到的是字、词、事物的概念、人名、机构名、地名、公式、参数、规格、型号等,所得结果非常准确,因而是一种确定性检索。数据检索与事实检索主要使用数据、事实型工具检索,包括词典、百科全书、手册、名录、年签、指南等类型及其相对应的数据库资源与网络资源。

信息检索的基本知识2.按检索方式分

按检索方式分为手工检索(手检)和计算机检索(机检)两种方式。(1)手工检索:即用人工来直接查找所需信息的方式,多利用各种检索工具的印刷版来实现,如印刷型的目录、题录、文摘、索引等。手检直观,不需要辅助没备,但速度慢,漏检严重,查全率受信息资源储备数量的限制。(2)计算机检索:就是将大量的文献资料或数据进行加工整理,按一定格式存储在机读载体上,建成机读数据库,利用计算机对数据库进行检索的信息检索方式。与手工检索相比,计算机检索速度快、效率高、查全率高,不受时空限制,检索结果输出方式多样等。但查准率与网络及数据库质量的高低直接相关。信息检索的基本知识1.2.1信息检索原理

各种检索系统的检索原理基本相同,简单地讲就是对信息集合与需求集合的匹配与选择。信息检索的基本原理如图1-2所示。1.2信息检索原理及检索语言检索提问标识与存储在检索工具中的文献索引标识进行比较,两者一致或文献索引标识包含着检索提问标识,则具有该标识的信息就从检索工具中输入,输出的信息就是检索找到的信息。信息集合特征化表示特征化表示需求集合图1-2信息检索的基本原理示意图选择与匹配信息检索的基本知识1.2.2检索语言检索语言又称标引语言、索引语言等,是信息检索系统存储和检索信息时共同使用的一种共同语言。即在文献存储时,文献的内容特征(分类、主题)和外表特征(书名、著者)按照一定的语言来描述,检索文献时的提问也按照一定的语言来加以表达,这种在文献存储和检索过程中,共同使用、共同遵循的语言就是检索语言。传统的手工检索或现代的各种信息检索系统,都是通过一定的检索语言组织。通过检索语言,可以把能够表示文献特征的全部标识按一定的规则组成一个有序的检索系统,使每种文献在检索系统中都有固定的位置,从而为文献检索提供可能。

信息检索的基本知识

检索语言的种类很多,按描述文献特征不同,检索语言可分为描述文献外表特征和内容特征的检索语言,如图1-3所示。信息检索的基本知识检索语言外表特征内容特征题名(书名、篇名)著者代码(专利号、报告号、标准号等)引文(被引著者姓名和引用文献的出处)分类语言主题语言标题词关键词叙词图1-3检索语言的分类描述文献外表特征的检索语言,例如篇名、著者姓名、文献号等作为文献标识与检索依据直接明了,使用时较为简单。而文献内容特征的语言,也就是分类语言和主题语言的原理和使用方法是下面主要介绍的内容。信息检索的基本知识题名:

精神疾病案例诊疗思路作者:

杨世昌

出版项:北京:人民卫生出版社,2008页码:

300页价格:

CNY37.00

主题:

精神疾病案例诊疗思路

索取号:R74/101内容提要:本书分两个部分。第一部分:介绍精神疾病的诊断学基础——晤谈技术、病史采集、精神状况检查以及精神疾病的诊断思维。第二部分:根据多年临床实践编写相关病例,每个病例依据临床就诊过程逐步提供病情或临床相关信息,予以分析诊疗思路。同时编写相关的理论知识。分类:

R74一条中文书目记录:信息检索的基本知识

一条英文书目记录:

AUTHOR:Dichter,Carl.TITLE:SoftwareengineeringwithPerlPLACE:EnglewoodCliffs,N.J.PUBLISHER:PrenticeHallPTR,YEAR:1995PUBTYPE:BookFORMAT:282p.:ill.;24cm.+1computerdisk(31/2in.)NOTES:Includesbibliographicalreferences(p.267-268)andindexSystemrequirementsforaccompanyingcomputerdisk:HighDensityMSDOS;MacintoshwithPCExchange.ISBN:013016965XSUBJECT:Softwareengineering.Perl(Computerprogramlanguage)Software--Engineering信息检索的基本知识

1.分类语言所谓类是指具有共同属性的事物的集合。每一种事物都有多种属性,用其某一种属性作为划分依据来对此事物进行划分就称为分类。分类是人类逻辑思维的一种最基本的形式,分类语言是用分类号来表达学科体系的各种概念,将各种概念按学科性质进行分类和系统排列。具体而言,它是以学科分类为基础,按照概念划分的原理,将知识概念从一般到具体、从简单到复杂、从低级到高级逐级划分。每划分一次形成一批并列的概念—下位概念,它们同属于一个被划分的概念—上位概念。例如“医学”这个类可以划分为“基础医学”、“临床医学”、“康复医学”、“预防医学”等子类。“医学”为被划分的概念,即上位概念。它所划分出的几个概念,即下位概念。这几个下位概念之间体现的是平行关系,而上下位概念之间,则是隶属关系。

信息检索的基本知识中国图书馆图书分类法将图书分为社会科学、自然科学、综合三大类由字母和数字组成采用等级列举表达从属关系上位类目与下位类目的关系: 上位类目一定包含各个下位类目, 下位类目一定带有上位类目的属性。分类号越长,表示的学科范围越窄。为了清楚醒目,通常分类号的第三位数字后,隔以.,如F279.712,TQ032.4信息检索的基本知识中国图书馆分类法简介:中国图书馆分类法(第四版)将图书资料划分为五大部类序列,具体如下:

◎马克思主义、列宁主义、毛泽东思想

◎哲学

◎社会科学

◎自然科学

◎综合性图书由于社会科学与自然科学这两个科学部门的内容很多,发展很快,又各自展开为若干大类,最后在五个基本部类的基础上,组成22个大类分类号采用汉语拼音字母与数字混合编号制度。

信息检索的基本知识中图法简表:

A

马克思主义、列宁主义、毛泽东思想、邓小平理论

B

哲学、宗教

C

社会科学总论

D

政治、法律

E

军事

F

经济

G

文化、科学、教育、体育

H

语言、文字

I

文学

J

艺术

K

历史、地理

N

自然科学总论

O

数理科学和化学

P

天文学、地球科学

Q

生物科学

R

医药、卫生

S

农业科学

T

工业技术

U

交通运输

V

航空、航天

X

环境科学、安全科学

Z

综合性图书

社会科学自然科学信息检索的基本知识

每个类目都用分类号作为标识,每个分类号就代表特定的知识概念,体现这种分类体系的就是图书分类法(表)。分类法种类很多,比较有影响的有《中国图书馆分类法》(简称《中图法》)、《国际十进制分类法》和杜威分类法等,《中图法》作为我国文献分类标引工作的国家标准,被我国图书情报单位广泛应用。

信息检索的基本知识O数理化……………

一级类目

O1数学………

…二级类目

……

O3力学………

…二级类目

O31理论力学………………

…三级类目

O311运动学………………

…四级类目.1质点运动………

五级类目

……

O4物理学…

二级类目信息检索的基本知识应用举例:

利用《中图法》在《全国报刊索引》中查找有关“建筑抗震设计”方面的相关文献。第一步:分析课题,按学科属性属于“T工业技术”中的“TU建筑科学”大类。

第二步:查《中图法》确定分类号为:T工业技术—TU建筑科学—TU3建筑结构—TU352.11抗震结构。第三步:根据《全国报刊索引》(科技版)的分类目录给出的TU3建筑结构的页次,得到相关文献。第四步:根据的出处索取原始文献。信息检索的基本知识2.主题语言主题检索是直接以代表文献内容主题概念的标识作为检索标识,并按其字顺组织起来的一种检索语言。根据一词语的选词原则、组配方式、规范方法,主题语言可分为标题词语言、关键词语言和叙词语言。信息检索的基本知识(1)标题词语言标题词语言是以标题词(规范的事物名称、名词术语)作为文献内容标识和检索依据的,以词表预先确定组配方式标引和检索的主题语言。采用标题词语言的检索工具,都有自己的标题词表。标题词的主要特征是事先组配,如美国的《工程标题词表》(SubjectHeadingforEngineering,SHE)就是《工程索引》(TheEngineeringIndex,EI)的配套词表。标题词表的作用是对从信息资源中筛选出来的标题词,从词义、词形、词间关系和用法等方面进行管理和控制。保证一种事物只用一个标题词表达,一个标题词只表达一种事物或含义,避免使用过程中的混乱。

信息检索的基本知识

标题词语言是一种规范化、先组式的主题语言。一般由主标题和副标题共同构成,其表现形式为“主标题──副标题──副标题”。将所有的主标题集中并以主副标题字顺排列成表,即成为文献标引和检索用的标题词表。例如,《中国经济特区的经济法》一书,按标题词表规范化的词语来标引,其主题标目为“经济特区”和“经济法”,“中国”是说明和限定主题内容范围的副标题。其主副标题组配如下:(1)经济特区──经济法──中国;或(2)经济法──经济特区──中国。无论以“经济法”或以“经济特区”作为检索入口,都可以查到此书。

信息检索的基本知识(2)关键词语言以关键词作为文献内容标识和检索依据的一种主题语言。关键词选自文献题目、文摘乃至正文中具有实质意义的词语,是未经规范化处理的自由词汇,关键词语言是不受词表控制的非规范化语言。如美国《化学文摘》(ChemicalAbstracts,CA)的关键词索引(是CA各种索引中使用较多的一种)。信息检索的基本知识(3)叙词语言叙词语言是主题语言的最高级形式。叙词是从文献内容中抽取出来的,从概念上不可再分的基本概念单元。叙词受词表控制,词表中词与词之间无从属关系,都是相互独立的概念单元。检索时利用这些表达概念单元的叙词进行组配,以表达一个复杂的概念。叙词的组配应严格遵守组配原则,使之符合概念逻辑,具有检索意义,避免产生不合概念逻辑的假组配。叙词语言适用于计算机和手工检索系统,是目前应用较广的一种语言。如英国《科学文摘》(ScienceAbstracts,SA)、《El》(93年后)等均采用叙词语言。

信息检索的基本知识叙词语言是一种规范化、后组式的主题语言。后组式由文献检索人员按需要自由组配检索概念,具有很大的灵活性,可充分地发挥主题词之间的组配作用。

例如:“癌症”应采用规范的主题词“肿瘤”。信息检索的基本知识国内典型叙词表《汉语主题词表》《中国中医药主题词表》《地理科学叙词表》《物理学汉语主题词表》《数学汉语主题词表》《教育主题词表》……信息检索的基本知识1.3.1信息检索系统信息检索系统就是为满足各种各样的信息需求而建立的一整套信息的收集、加工、存储和检索的完整系统。信息检索系统由4个基本要素组成:信息资料;技术设备;检索语言与方法;人员(包括系统管理人员和用户)。信息检索系统按信息的存储和检索设备可分为手工检索系统和计算机检索系统。

1.3信息检索系统与检索工具信息检索的基本知识1.手工检索系统手工检索系统是用手工方式来处理和查找文献的工具或系统,主要是指利用印刷型检索工具。手工检索的特点是检索人员可根据自己的信息需求,边查边思考,随时根据课题内容修改检索策略,但查阅速度慢、效率低,检索系统内容更新慢。信息检索的基本知识2.计算机检索系统计算机检索系统是利用计算机检索存储于计算机或计算机网络内的信息资源的一种方式,也是现在发展极其迅速、应用最为广泛的检索系统。计算机检索系统包括联机检索、光盘信息检索以及网络信息检索。信息检索的基本知识(l)联机检索系统联机检索系统是指信息用户利用终端设备,通过国际通信网络与世界上的信息检索系统进行直接的人机对话,从检索系统的数据库中找出所需信息的全过程。联机检索是计算机技术、信息处理技术和现代通信技术三者的有机结合。用户利用检索终端设备,通过通信线路与检索系统的中央计算机进行人机对话,直接检索到所需信息。数据库的更新速度快、检索速度快,但费用较高。典型的系统:Dialog、OCLCFirstSeach(OnlineComputerLibraryCenter)联机计算机图书馆中心,总部设在美国的俄亥俄州

.信息检索的基本知识OCLCFirstSeach登录界面信息检索的基本知识基本检索界面信息检索的基本知识

(2)光盘信息检索系统光盘信息检索系统是利用光盘数据库作为信息资源数据建立起来的计算机信息检索系统,分单机版和网络版。用户可通过购买或租用光盘,以较低的价格,不受时间限制地在带有光盘驱动器的计算机上进行文献检索。

20世纪80年代末出现光盘网络,它使多个用户能同时检索同一大型数据库,共享信息资源。检索效率得到了很大提高,检索的费用较低。

信息检索的基本知识(3)网络信息检索系统是指利用计算机设备和国际互联网(Internet)检索网上各服务器站点的信息。随着Internet的发展,各种机构纷纷加入到Internet上,为信息需求者提供各种各样的信息服务,构成极其丰富的网络信息资源。网络信息检索系统是目前发展最快、最受人们欢迎的信息检索系统。在互联网上人们能够很容易地访问到文字、图像和音频等数字化资源,可检索到科技、商贸、经济时事新闻等信息。其特点是信息资源丰富、检索方便,实现了超文本检索。信息检索的基本知识

1.3.2检索工具1.检索工具的类型检索工具是在一次文献的基础上,经过加工整理、编辑而成的二次文献。任何检索工具都有存储和检索两方面的功能。存储的广泛、全面和检索的迅速、准确是对文献检索工具的基本要求。检索工具按著录内容划分,可分为目录、题录、文摘、索引和搜索引擎。信息检索的基本知识

(1)目录(Catalogue)

目录是对图书、期刊或其他单独出版物特征的揭示和报道。目录以单位出版物为著录对象,一般只记录其外部特征。如题名、著者、出版事项、载体形态等。目录的种类很多,如国家书目、联合目录、馆藏目录等。网络上的目录型搜索引擎,如Yahoo(http://hoo.com)它提供一种可供检索的分等级列出的主题目录,以超文本链接的方式将不同学科、专业、行业和区域的信息按分类或主题目录的方式组织起来,人们通过主题目录的指引,逐层浏览,查找自己需要的信息。信息检索的基本知识馆藏目录信息检索的基本知识

(2)题录(Title)

题录是对单篇文献外表特征的揭示和报道,著录项目一般有篇名、著者、著者单位、文献来源、语种等。由于著录项目比较简单,因此收录范围广,报道速度快,是用来查找最新文献资料出处的重要工具。报道题录的检索工具的名称不统一,有的定名为目录,有的定名为索引,这是因为题录在形式上和功能上分别与目录、索引相似的缘故)但就其性质而言,题录与目录、索引有着根本的不同。国内外有许多大型的题录型检索刊物,我国的《全国报刊索引》、美国的《化学题录》(ChemicalTitle)等均属这种类型。信息检索的基本知识单篇文献的题录格式【论文题名】网络环境下信息检索与报道服务浅析

【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment

【作者】丁彩云DINGCai-yun

【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004

【刊名】株洲师范高等专科学校学报

【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE

【年卷期】2005Vol.10No.2

【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道

信息检索的基本知识

(3)文摘(Abstract)

文摘是以精练的语言把文献信息的主要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供用户使用的一种检索工具。文摘在国外的检索刊物中常用的词有Abstract、Digest、Summary、Quotation等,在我国通常称之为文摘、摘要、内容提要等。文摘是二次文献的核心,以单篇文献为报道单元,不仅著录文献的外表特征,还著录文献的内容特征。根据文摘的目的与用途,文摘可划分为指示性文摘和报道性文摘。信息检索的基本知识

①指示性文摘(IndicativeAbstracts):文摘内容比较简单,一般在100字左右,简明扼要地介绍文献的主题范围、研究方法、结论、用途等。不涉及具体的技术内容,以使读者对文摘内容不产生误解为原则,故有人也称之为简介②报道性文摘(InformationAbstracts):是对原文内容的高度浓缩,报道原文的论点、方法、设备、结论、具体数据等,一般在200一300字左右。其内容详细具体,客观而无评论,故有时可代替通阅原文。这类文摘对于不懂原文语种及难以获得原文的科技人员尤为重要。信息检索的基本知识

(4)索引(Index)

索引是对一组信息集合的系统化指引。索引一般只起指引特定信息内容及存储地址的作用,是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等),按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。索引作为一种附属性的检索工具广泛应用于各种检索工具或数据库中,索引的类型是多种多样的,在检索工具中常用的索引类型有篇名索引、引文索引、分类索引、主题索引和著者索引等,其中以主题索引、著者索引使用最多。信息检索的基本知识

(5)搜索引擎(Engine)

搜索引擎是网络环境中的一套信息检索系统,它是一种利用网络自动搜索技术,对各种Internet信息资源进行标引,并为网上检索者提供检索的工具。它通常有两种不同的工作方式:一种是分类目录型的检索,把]Internet中的资源收集起来,由其提供的资源的层层推进,寻找到自己想要的信息;另一种是基于关键词的检索,用户可以用逻辑组合方式输人各种关键词,搜索引擎根据这些关键词寻找用户所需资源的地址,然后根据一定的规则反馈包含此关键字词信息的所有网址和指向这些网址的链接,为人们提供信息检索服务。信息检索的基本知识2.检索工具的一般结构一种完整的检索工具一般由5部分组成,

(1)使用说明:为使用者编写的必要指导。一般包括编制目的、收录范围、著录格式、代号说明及注意事项等,使用前要认真阅读。(2)目次表:检索工具的正文一般都按分类组织编排,因此前面都有详简不等的目次表作为分类查找文献的依据。(3)正文:检索工具的主体部分:存储在检索工具中的内容不是原始文献,而是描述文献外表特征与内容特征的著录条目。著录后的每篇文献都有一个固定的序号以与其他著录项目相区别,这个序号称为文摘号或顺序号。把大量的文献著录条目按一定的规则(一般是分类)组织起来,就构成了检索工具的正文。信息检索的基本知识

(4)辅助索引:为了迅速、准确、全面地查到所需文献,仅从分类途径入手是不够的,还要有主题、著者、序号等多种途径,因此索引也就有多种形式。但任何索引都不能单独存在,它们是依附于正文主体的辅助部分,但它又是检索工具的关键所在,掌握检索工具的实质就是掌握各种辅助索引的使用方法。(5)附录:附录部分主要是使用该检索工具必须参考的一些内容。例如,引用期刊一览表、文献来源名称缩写与全称的对照表、缩略语的解释以及收藏单位代码等。信息检索的基本知识

读者在学习利用新的检索工具时,应首先阅读其使用说明,然后根据所查文献的隶属学科或专业,查找目次或分类表,经过浏览选中文献。如果已知主题词、著者名、机构名或其他代码(如专利号、科技报告号、化学分子式等),则利用索引到达正文,可迅速、准确地查得所需文献。信息检索的基本知识无论是手工检索方法还是计算机检索技术,检索的程序是一样的,即都是一个经过仔细思考并通过实践逐步完善查找方法的过程。整个检索过程通常有以下5个步骤:(1)分析问题(2)选择检索方法(3)选择检索工具(4)确定检索入口(5)查找文献线索以及索取原文

1.4信息检索的一般程序信息检索的基本知识1.分析问题首先,将问题分类,有助于确定相应的检索工具。所有的问题可以分成两大类。一类是要查找某一特定的文献或某一主题学科内容相关的文献,这就要考虑文献检索类工具书(二次文献)。例如,要查找“投资分析”的文章,就要用索引、文摘;要查图书,就要用书目、馆藏目录以及访问电子书刊网站、网上书店、电子图书馆等。另一类是查找具体的事实,如统计数据、人名、地址、机构概况、法律条文、术语等,这就要考虑查找三次文献类工具书,统计年鉴、传记工具书、机构名录、手册、字典、百科全书以及包括这类检索工具的参考工具类网站。信息检索的基本知识其次,要分析“已知”和“欲知”。分清哪些是检索目标,哪些是检索条件。第三,分析需求的主题内容,所属学科性质。明确其主题内容,从而提出能准确反映课题核心内容的主题概念;明确检索的学科范围,学科范围越具体、越明确越有利于检索。第四,分析确定文献的类型。仅仅指明需要某主题的近期文献还不够,因为文献涉及的类型很多,如报纸、期刊、文集、会议论文、专利等,应弄清需要哪一类文献。如果属于基础理论性探讨,要侧重于查找期刊论文、会议论文;如果是尖端技术,应侧重于科技报告;如果是发明创造、技术革新,则应侧重于专利文献;如果是产品定型设计一,则需利用标准文献及产品样本。信息检索的基本知识最后,选择合适的文献检索时间范围。确定所需文献情报的时间范围是为了使检索更经济、快捷、准确。对于需要较多回溯性资料的问题,检索人员就要确定查找年代的上限和下限,如果是“近期文献”,那么是近三年的还是限于去年的。当查不到某一特定文献时,时间的差错是应该考虑的一个主要原因。信息检索的基本知识案例:科研课题常见信息需求查找某概念的确切含义:如“什么是ADSL”

查找某概念的背景知识如:“谁最先发现了传染性蛋白”查找某些事物的数值及量化指标:如“2005年国际无线传输的相关标准”查找学科专业领域的新进展:“有关生物信息学计算机模拟算法的综述文献”查找专业课题相关的研究文献;“氨基酸相似性比对算法相关文献”特征型知识(事实、数值类数据库、搜索引擎)关联型知识(文献数据库)信息检索的基本知识

2.选择检索方法信息检索的一般方法如下:

(1)追溯法(引文法)这是一种传统的文献检索方法,即利用参考文献进行深入查找相关文献的方法。追溯法包括两种方法,一种是利用原始文献所附的参考文献进行追溯,另一种是利用引文索引检索工具进行追溯。较为普遍的查法是由近及远地追溯,即利用文献后所附的参考文献逐一追查被引用文献,然后再从被引用文献所附的参考文献目录逐一扩大检索范围,直到满足要求为止。依据文献引用与被引用之间的关系获得内容相关的诸多文献,这是一种扩大信息来源最简捷的方法。在检索工具短缺的情况下,采用此法可获取一定数量的相关文献。这种方法适合于历史研究或对背景资料的查询,其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。信息检索的基本知识因此,最好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,有时还附有评论。由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引,如《科学引文索引》(SCI)、《社会科学引文索引》(SSCI)。利用引文法高效率地查找文献的最有用的工具是利用引文索引。

信息检索的基本知识信息检索的基本知识信息检索的基本知识信息检索的基本知识信息检索的基本知识引文检索--从“被引用文献”(citedpaper)检索到“引用文献”(citingpaper)

例:1994年至2003年华罗庚教授的著作被别人引用的情况,并按相关度排序

信息检索的基本知识最后一页信息检索的基本知识被引用文献中有华罗庚信息检索的基本知识引文数据库Webofscience中国科学(社会科学)引文数据库全文数据库、文摘数据库中的引文(参考文献)字段检索专业引文数据库信息检索的基本知识

(2)工具法又称常用法,即利用各类检索系统(工具)查找文献的方法。根据具体的检索需要,又可以分为3种类型:①顺查法:这是一种依照时间顺序,按照检索课题所涉及的起始年代由远而近地查找信息的方法。这类方法适合于检索内容复杂、时间较长、范围较广的理论性或学术性的课题。此法查全率高,但耗时费力,效率较低。②倒查法:这是一种由近及远、由新到旧地逆着时问顺序检索信息的方法,即以查准查新为主。此法多用于检索新课题或有新内容的老课题,及对某课题研究已有一定基础,需要了解其最新研究动态的检索课题。此法节省时间,效率较高。③抽查法:这是一种依据信息提问的特定需求,根据某学科发展的实际情况抽出学科的发展兴旺时间段进行检索,以达到采用较少的时间获得较多文献的检索方法。使用此法必须熟悉该学科的发展历史,否则很难达到理想的结果。信息检索的基本知识

(3)交替法交替法就是把引文法和常规法结合起来查找文献的方法:即先利用常规检索工具找出一批有用文献,然后利用这些文献所附的引文进行追溯查找,由此获得更多文献。按照引文规律,有价值的文献在发表后最初几年(例如五年)内被引用的次数较多,但以后趋于减少。因此,追溯的年期应予限制。跳过追溯的那几年再用常规检索工具查出具有新价值的文献,然后再根据所附参考文献追溯查找,并依次进行第三次或多次循环,直到获得的文献符合要求为止。信息检索的基本知识

3.确定检索工具检索工具种类繁多,必须有针对性的加以选择。选择检索工具的原则,主要有以下几点:

(1)其存储内容是否广泛,标引深度如何。

(2)提供的检索途径是否方便有效。(3)报道的时差如何。(4)还要注意专业特点,选择专业对口的检索工具。

(5)同时还要注意利用综合性检索工具。信息检索的基本知识4.确定检索入口检索途径往往不止一种,使用者应根据“已知”信息的特征确定检索人口。文献的特征分为外表特征(题名、著者、序号等)和内容特征(分类、主题、关键词),因此文献检索的入口途径,也分成如下两方面。

(1)以所需文献的外表特征为依据①题名途径:即指根据已知的书名、刊名、篇名按字顺排列规则在工具书中查找所需文献的途径。使用的工具如图书书名目录、期刊刊名目录等,有时由于文献的篇名较长,检索者难以记忆,加之按名称字顺编排,造成相同内容的文献分散,不能满足族性检索的要求。②著者途径:即指以著者姓名为检索词查找文献的途径,多数检索工具都有著者索引和机构索引等,这类索引均按著者姓名字顺排列和检索,故使用方便。

信息检索的基本知识③序号途径:即指按号码顺序如报告号、专利号、标准号、入藏号查找文献的途径。使用这种途径多见于查找专利、科技报告、政府文献和从文号查找档案文件。(2)以所需文献的内容特征为依据①分类途径:按照文献主题内容所属的学科体系和事物性质进行分类编排所形成的检索途径。通过分类号来进行检索。使用这一途径必须了解学科分门别类的体系,并将文字概念转换成分类检索标识,在转化分类号的过程中,由于受专业知识和分类方法的影响,常发生错误,造成漏检和误检,影响检索结果。

信息检索的基本知识②主题途径:是根据文献主题内容提取主题词,按字顺将其排列起来,通过主题索引检查文献的途径。常用的主题索引有标题词索引、关键词索引、叙词索引等。主题途径直接以词或词组作为检索词,表达概念比较准确、灵活,可随时增补、修改,以便及时反映学科新概念,另外主题途径能满足特性检索的要求,适合于查找比较具体、专业的课题资料。主题途径是最常用的检索途径,但主题途径的缺点是它要求使用者必须具备较高的专业知识、检索知识和外语水平。以上所述的各种检索途径中,分类途径和主题途径是最常用的检索途径。分类途径适合于族性检索,主题途径适合于特性检索。两者相互配合则会取得较好的检索效果。其他途径都是辅助性的检索途径。信息检索的基本知识选择检索入口提供题名或关键词、题名、关键词、作者、刊名、第一作者、分类号、文摘、机构、任意字段等十个检索入口。信息检索的基本知识5.查找文献线索和获取原始文献上述步骤完成之后,即可通过检索工具具体的查找了,在各种检索工具中,能查到的实际上是所需文献的线索,下一步就是要利用馆藏目录或联合目录获取原文,但是获取原文并非易事,特别是外文文献。原文获取率的高低同馆藏有关,但也与获取方法有关。在开始获取原文前,要注意掌握获取原文的必要信息和获取原文的途径。信息检索的基本知识(1)文献类型的识别中文检索工具常使用期刊、专利、会议、图书、标准等标识区别不同的文献类型。西文检索工具中文献类型的区分则主要依据各种文献所特有的标识来识别,具体如下。①图书:著录的特征除书名、著者外,还有出版社、出版地、出版年、ISBN号等。例如:

Thisbookcontains…publbyApplSciPublLtd.London,Engl,1998,372pApplSciPublLtd出版机构;London,Engl,1998,372p——出版地点、文种、年份和图书页数。信息检索的基本知识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论