门户网站华农课件_第1页
门户网站华农课件_第2页
门户网站华农课件_第3页
门户网站华农课件_第4页
门户网站华农课件_第5页
已阅读5页,还剩191页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

宛章齐87287346-8077

课程介绍《网络信息开发与利用》基于因特网,针对检索与获取对大学生研究、开发、学习对网络信息的需求,系统地介绍因特网信息资源的特点、种类、信息利用价值及评价、鉴选标准;介绍因特网信息检索的基础知识、各类型常用因特网信息检索工具的功能、特点和使用及检索方法;详细介绍学术性研究信息、公共信息及各类专门信息的网上检索平台及查找方法。教学的目的在于在培养学生的信息素质,培养大学生网络信息检索与利用能力,提高大学生网络环境下的生存和发展水平。在培养学生的信息素质。但因课时的限制,课堂讲述重点是检索技能及重要信息资源的利用,不求全面但求实用。第一章信息资源和信息素养教育第一节信息的意义一、信息的基本含义二、信息资源及类型三、信息素质与综合素质四、信息素质与创新能力五、信息利用与事业进步第二节各种信息源及其特征第三节高校图书馆信息资源的利用第一节信息的意义一、信息的基本含义信息一词久存于人类社会和人们的日常生活之中,但作为科学术语,不同的学科从不同的层次、不同的角度给予了不同的描述,关于信息的定义有100多种,这是由于信息本身的复杂性和人们对其认识的不确定性使之处于多定义并存的状态。比较有代表性的有哲学、经济学、控制论、新闻学、心理学、图书情报学、信息资源管理学等领域对它的描述。在本书里,我们所指的信息,是经过采集、处理、记录并以可检索的形式存储的数据,属于信息资源管理学范畴对信息的描述。

基于以上的描述,信息具有可识别、可处理、可存储、可检索等基本属性,即可通过人的感官去认知,也可通过仪器加以识别;可对其进行加工整序(如分类、标引)、存储、利用,是经过加工并对外界产生一定影响的数据。二、信息资源及类型1、信息资源的概念20世纪60年代,斯蒂格勒研究了信息在经济活动中的作用机制,发现信息可以减少经济活动中的不确定性,降低投资和生产成本,产生经济效益。随后,马克卢普、波拉特、贝尔等经济学家提出了信息经济的理论,认为信息是后工业社会的改造资源,由此产生信息资源的概念。

信息资源是一个宽泛的概念,可以从二个方面来理解和把握,广义的信息资源指人类社会活动中累积的信息、信息生产者、信息技术等要素的集合。它包括四层含义,一为人类活动中产生并经过加工整理的有效信息;二为有效信息的生产者;三为信息加工传递技术;四为支持信息活动的其它元素,如经费、设施设备等。狭义的信息资源指广义信息资源的第一层次,即人类活动中产生并加工的有效信息。本书所指的信息资源是狭义上的信息资源,或者说是文献学意义上的信息资源,即一定载体上的文献、数据或多媒体信息内容。2、信息资源的类型

按加工程度分为一次信息资源、二次信息资源、三次信息资源;按开发程度分为潜在的信息资源、现实的信息资源;按载体和存贮方式分为天然型信息资源、实物型信息资源、文献型信息资源。根据类型化研究的分级划分、实用性和动态性等原则,我们以信息资源的开发利用程度作为一级标准将信息资源划分为潜在信息资源和现实信息资源。潜在信息资源指储存在人们大脑中而未被记录下来的信息资源,它们可以被个人所利用,但易因忘却而消失,且不能为更多人所用。现实信息资源是已被表达出来、能够为人们所利用的信息资源,现实信息资源按其载体形式又可分为体载信息资源、实物信息资源、文献信息资源、网络信息资源等。体载信息资源以人体为载体并能传递和为他人所识别及利用的信息资源。按其表述方式可分为口语信息资源和体语信息资源。口语信息资源是人们以口头语言表达的,有的被记录下来,有的未被记录下来。被记录下来的信息资源,包括谈话、授课、讲演、讨论、演唱等记录信息。体语信息资源是以人的体态表达的信息资源,包括表情、姿态、手势、舞蹈等。实物信息资源以实物为载体的信息资源。按实物载体的自然与人工特性可分为自然实物信息资源和人工实物信息资源,如产品、样品、模型、雕塑等。

文献信息资源

以文字、数据、声频、视频等方式记录在特定载体上的信息资源。按其记录方式和载体可分为刻写型、印刷型、缩微型、机读型、声像型、电子型等类型。刻写型文献信息资源包括日记、信件、著作手稿、碑刻等;印刷型文献信息资源包括图书、报刊、档案、图片、乐谱等;缩微型文献信息资源包括缩微胶片、缩微胶卷、缩微卡片等;声像型文献信息资源包括唱片、录音带、录像带、电影胶卷、幻灯片等;电子信息资源包括CD、VCD、DVD等。

网络信息资源网上各种信息资源的总称,主要有动态信息、电子邮件、电子论坛、电子图书、电子期刊、电子报纸、数据库等。返回三、信息素质与综合素质

1。信息素质的含义2。信息素质的内容3。信息素质与综合素质的关系1。信息素质的含义关于信息素质的研究是从20世纪70年代开始的,对信息素质的认识经历了一个渐进的过程,信息素质可以概括为个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。它包含四个层面的含义,第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。第二,掌握了主要的信息源和信息工具的知识及技能。第三,能够分析评价选择相关信息。第四,利用信息的目的是为了有效地解决具体问题。信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。返回

2。信息素质的内容信息意识信息知识信息能力信息道德信息意识同样重要的信息,有的人善于抓住,有的人却漠然视之。这是由于各人的信息意识强弱不同。信息技能的掌握在很大程度上取决于信息意识的提高。

所谓信息意识,简单地说,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。有无信息意识决定着人们捕捉、判断和利用信息的自觉程度。而信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。

信息意识含有信息认知、信息情感和信息行为倾向三个层面。信息认知是指对信息和信息活动的了解和看法,其中最重要的是评价性的认知;信息情感是指人们多次从多方面感受信息的过程中,逐渐形成的某种持久、稳定的、反映本质的需求关系的内心体验,这种体验相对持久、相对稳定,而不是那种即时产生的情绪;信息行为倾向是指个人在信息活动中欲表现出来的行为趋向,是信息行为的心理准备状态。

信息意识形式有两种:一是被动接受状态,二是自觉活跃状态。前者指人们从社会的信息环境中被动地接受事先未料及的信息;后者指信息意识的觉醒状态,它促使人们制订信息活动计划,主动关心和了解各种变化,并作出相应的选择。

人们的信息搜集活动是受信息需求驱使的,影响需求的力量的大小主要就是需求被意识的清晰程度——意识越明确,行动目标越清楚,则信息活动的动机越稳定、持久、强烈,努力程度也就越高。因此,信息意识的强弱直接影响人们的信息需求程度。作为大学生,应具有这样一种信息意识:认识到信息和信息活动的功能和作用,认识到信息对他们的学习和课余科研活动的效用,认识各种信息源的价值和信息机构提供的产品和服务,形成对信息的积极体验,进而产生与学习和课余科研相适应的信息需求和信息行为倾向。经常注意并搜集各种载体的信息,积极利用包括图书馆在内的各种信息机构的服务,努力扩充知识面,主动地、有意识地去学习基本信息检索技能。

信息意识的有无和强弱可从以下几方面进行判断:是否认识到信息和信息活动的功能和作用。是否具有对信息和信息活动的积极体验(依赖感、赞同感和支持感)。是否具有与学习有关的信息需求和信息行为倾向,愿以最少的时间高效率地了解、查询自己需要的信息。是否能自觉地表达出情报需要,并能及时地去查寻或主动利用信息系统来满足这种需求。是否善于运用创造性思维,从大量信息中捕捉新动向,猎取趋势性的或有价值的信息。信息意识是可以培养的,经过教育和实践,可以由被动的接受状态转变为自觉活跃的主动状态,而被“激活”的信息意识又可以进一步推动信息技能的学习和训练。返回信息知识

是关于信息的特点、性质、运动规律、信息方法与技术、信息系统的有关知识。其中信息方法是指如何以信息的观点来分析和解决人们在工作和生活中遇到的问题的方法,把无序而良莠不齐的信息转化为有效信息加以利用,创造出新的价值。信息技术是关于信息提取、检测、处理、转换、传递、控制等技术,如计算机技术、数据库技术、通信技术、网络技术等。

返回信息能力是人们获取信息、分析信息、加工信息、传递信息、创造信息等能力的综合,是信息素质的核心部分和主要内容,包括信息查询与获取能力、信息交流与传播能力、信息组织与整合能力、信息利用能力、信息评价能力等,是提高信息素质的关键所在。面临知识的无限和与个人能力的有限性、教育的时滞性与社会发展的多变性、书本的陈旧性和生活的现实性等矛盾,我们怎样增强获取新知识的技能?怎样通过搜集各方面的信息来构筑与自己的智力水平相适应的知识结构并不断地加以补充和完善?寻求有关新知识的能力就是我们今天所说的信息技能。在大学期间,它又具体表现为以下6种技能:明确任务(TaskDefinition):了解问题的症结,确定所需信息和目的,分清任务的轻重缓急;信息查询策略(InformationSeekingStrategies):了解各种信息源,能够作出评价并确定优先查找的次序;查找和检索(LocationandAccess):确定信息藏址,从信息源中找出信息;信息利用(UseofInformation):能够读懂(或听懂、理解)查出的信息,了解信息在满足需求中的特定价值;信息综合(Synthesis):能够组织信息,提供信息产品(论文、报告等);信息评价(Evaluation):评价查找结果和解决问题的过程(效率)。返回信息道德是指在信息活动中调节和控制信息生产者、信息服务者、信息利用者及其相互关系、伦理道德和行为规范的总和。具体有遵守国家有关信息的法律法规、不制作不传播不利用违反国家政策的信息和不健康信息、不制作不传播虚假信息、不侵犯知识产权、不利用信息技术谋取不正当利益和从事违法活动等。在日趋繁杂的信息环境中,自觉而良好的信息道德,是信息素质中不可忽略的一部分。

在信息素质四个方面的内容中,信息意识是前提,信息知识是基础,信息能力是核心,信息道德是准则,它们的有机结合构成信息素质整体。返回

3。信息素质与综合素质的关系

信息素质是综合素质的重要组成因素,二者相辅相成,良好的信息素质可以极大地提高综合素质,而良好的综合素质也直接影响信息素质的提高。返回四、信息素质与创新能力

没有知识就不能创新这是大家的共识。而人们的知识一方面来自自己对客观世界的观察与认识,另一方面则来自对其他个体(包括前人)的吸收与继承。人们的知识创新与技术创新需要大量的有关信息。今天的世界并不缺乏创新所需的信息,而在于知识的存贮过于庞大和无序,信息存贮的无序化以及过多的老化信息和伪信息加剧了“信息污染”的程度。今天的社会没有良好的信息素质是很难全面、系统、及时地掌握创新所需的信息的。可以这样的认为,信息素质是创新能力的重要因素,良好的创新能力依赖于优秀的信息素质。返回

五、信息利用与事业进步

信息是生命、是财富、是力量、是事业核心竞争力的重要组成因素。

返回第二节各种信息源及其特征

信息源就是指信息来源。这里我们划分成文献信息源、电子信息源、实物及口头信息源。一、文献信息源二、电子信息源三、实物及口头信息源一、文献信息源

1。文献的涵义:文献是“记录有人类精神信息的、且便于存贮或传递的人工固态附载物”。2。文献的构成现代文献由四要素构成:文献信息、文献载体、符号系统和记录方式。文献信息是文献的内容,符号系统是信息的携带者,载体是符号赖以依附的“寄主”,而记录方式则是代表文献的符号进入载体的方法和过程,四要素缺乏任何一种都不可能形成文献。☆文献信息

文献信息属于信息,当然具有信息的一切性质和功能,但文献信息也有自身的特点。☆文献的符号系统

文献中的符号系统指图画、文字、公式、图表、编码,声像和电磁信息等。☆文献的记录方式

文献记录方式是指将表达信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。☆文献载体及其形态

文献载体的材质在人类文明的演进过程中一直在不断地演变。目前,除了纸质文献外,常见的其他介质的文献主要有以下类型:缩微文献,音像文献,磁盘和光盘文献。3。按文献生产加工层次划分的文献形式

从对文献的生产加工层次来看,文献又可以分成一次文献、二次文献和三次文献。

专著、报纸、期刊、专利文献、标准文献、会议文献、样本等成品文献属于一次文献(Primaryliterature),即人们对自然和社会信息进行首次加工(固化)而成的文字记载,这是文献信息源的主要部分,数量极为庞大,由于在内容上是分散的、无系统的,因此不便于管理和传播。

为了控制文献,便于人们查找,对一次文献进行再加工,通过整理、提炼和压缩,并按其外部特征(题名、作者、文献物理特征)和内容特征序化,形成另一类新的文献形式——目录、书目、索引、文摘,这就是二次文献(Secondaryliterature)。二次文献不是一次文献本身的汇集,而是一次文献特征的汇集,通过它们可以很方便地找到一次文献,或了解一次文献的内容。

利用二次文献,选择有关的一次文献再加以分析、综合而编写出来的第三个层次的文献形式——专题报告、综述、进展以及手册、百科全书、年鉴等工具书,这就是三次文献(Tertiaryliterature)。三次文献具有系统性、综合性、知识性和概括性的特点,它从一次文献中汲取重要内容提供给人们,便于他们高效率地了解某一领域的状况、动态、发展趋势和有关情况。因此,要在浩瀚的一次文献中查找所需资料,往往离不开二次和三次文献。返回二、电子信息源电子信息源

“电子信息”是近几年报刊上频频出现的一个词,它是在计算机技术、通信技术和高密度存贮技术的迅速发展并在各个领域里得到广泛应用的背景下成为信息学的词汇。电子技术在信息的存贮、传播和应用方面已经从根本上打破了长期以来由纸质载体存贮和传播信息的一统天下,代表了信息事业发展的方向。1。网络信息源概述

计算机信息网络是指通过远程通信方式进行计算机信息交换与数据库的存取,从而形成的一种系统。通过这种网络的控制和协调,可以充分实现地理上分散的信息资源的共享。

最初的联机网络形式是用多任务、分时等软件技术,结合终端、通讯线路等硬件技术,将若干台终端连接在计算机主机上,每台终端都可以利用主机资源同时执行不同的任务。以后又出现了多主机—多用户网络,充分发挥了数据资源和硬件资源的潜力。随着个人微计算机的问世,微机以终端形式挂接在主机上,调用网络的数据资源和硬件资源,这就是“智能终端——多主机——多用户”网络,兼顾了发挥微机性能和网络效率两个方面,成为今天信息网络发展的一个主流。

利用网络是当今获取信息的最主要途径。从时间和空间上讲,网络对用户没有任何限制,覆盖面遍及全球,24小时从不间断;就信息符号而言,网络采用宽频传输文字、图像、影视、声音等多种媒体;就服务类型而言,网络提供的信息服务包括数据库、全文文本、电子函件、文件传输、电子布告、电子论坛等;就检索技术而言,网络采用人工智能、专家系统、超文本、友好界面等让用户访问网上的各种信息资源。因此,无论在服务内容、方式、深度、广度、效果和效益等方面,网络信息资源几乎胜过了以往所有传统的信息资源,成为人们查找信息的首选目标。

Internet

Intranet

中国公用计算机互联网(CHINANET)

中国教育与科研网(CERNET)

中国科学技术网(CSTNET)

中国金桥信息网(CHINAGBN)

2。数据库数据库作为信息源的优势在于:由于有专门的系统软件对数据进行存取、管理和加工处理等,因而可以使数据尽可能不重复(具有最小冗余度),而且人们可以随时将收集到的信息存入数据库,需要时方便地在数据库中查询;以最优方式服务于一个或多个实用程序,因而数据可以共享;数据库管理系统(DBMS)可以保证为用户数据安全保密,且当他们同时使用数据库时对数据提供保护;信息更新速度快,动态信息库已达到日更新和时更新的程度,二次文献库的更新速度也比印刷型检索刊物快,可按季度或半年更新,而印刷型检索工具往往要一年;可以提供各种检索手段。由于数据库可以结合各种字段进行检索,其检索途径远比手工检索工具多得多。这些特点使数据库应用渗透到一切领域,成为储存和传递信息的最有用的工具。数据库的分类

按国际上通用的分类方法,数据库分为以下三大类:

参考数据库(Referencedatabases),是能指引用户到另一信息源获取原文或其他细节的数据库,包括书目数据库(Bibliographicdatabases)如题录库、文摘索引库、图书馆机读目录库,和指南数据库(Referraldatabases或Directorydatabases),如企业名录库、产品数据库等;

源数据库(Sourcedatabases),指能直接提供所需原始资料或具体数据的数据库。包括数值数据库(Numericdatabases)、全文数据库(Fulltextdatabases)、术语数据库(Terminologicaldatabases)和图像数据库(Graphicdatabases)。具体的如新闻消息全文库、法律法规全文库、商情全文库、期刊论文数据库、财务数据库、科技报告数据库、各种统计数据库、含有图片或照片的产品目录库、资料库等;混合型数据库(Mixeddatabases),能同时存贮多种类型数据的数据库。

近几年兴起的超文本技术将文献与文献之间得关系连接起来。各种形式的信息不是以一整篇文献为单元存储在系统中,而是通过关系链路将同一文本或不同文本中的信息单元组织起来。这样,用户从任一信息点出发可以遍历与其相关的各个信息单元,可以不必事先周密地考虑所有的检索语词和检索规则也能准确、迅速地获得所需信息。返回三、实物及口头信息源

☆实物信息源及其优点

实物,包括自然实物和人工实物(人类文化的创造物如文物、产品等),内含着大量科技文化信息,它具有文献所不具备的种种优点。

第一、直观性强。以样品为例,在造型、外观、包装等方面直观、形象,通过拆卸——还原过程,可以了解其工作原理、功能、工艺情况等,看得见,摸得着,全部信息和盘托出,容易理解。而文献所传递的信息要经过对文字符号的理解、组合和思维才能吸收。有的实物可当场操作演示,其作用可马上表现出来,对技术、材料和使用的要求一般当场就可以判断出来。这比花钱买技术资料或去情报单位查资料要有独到的优势。

第二、客观性强。实物样品是具体的东西,实实在在,真实可靠,信息直达受者,不需经文字、图片等中间媒介转达,可以避免人为因素(夸大、掩饰)造成的信息扭曲和损耗。第三、实用性强。实物是现实的商品,除了本身的信息价值外,还具有商品价值(转让)和使用价值。实物一旦不作为信息载体使用(陈列、展览),即可投入流通或作为一般物品发挥它本身的使用价值,并在使用中继续发挥其信息功能,这也是其他信息载体所不及的。

☆口头信息源

口头信息指通过交谈、讨论、报告等方式交流传播的信息。口头信息无时不在,无处不有,这一极为丰富的信息源可以为一切人所享用。我们应该利用一切口头信息传播的场合和途径。

利用会议信息

利用广播电视

利用电话信息

返回第三节高校图书馆信息资源的利用一、图书馆对大学生的意义1。学习的阶段性特点决定了大学生的信息需求2。个人信息购买能力问题3。良好学习的环境4。图书馆对用户提供的各种教育二、图书馆基本介绍1。高校图书馆2。公共图书馆3。研究所图书馆4。其他三、高校图书馆的基本布局主要服务部门及主要服务:信息咨询部:主要承担用户教育、定题服务、成果查新、情报调研和各种信息咨询等图书借阅部:主要承担图书的借阅服务。期刊部:主要提供期刊阅览服务。电子阅览。提供电子信息阅览服务。行政管理部门:用户信息交流和解决各部门上交的问题。四、高校馆信息的基本组织与分区1。文种:中文、日文、俄文、西文、其他2。学科:社会科学(A——K类)人文科学(A、B、C、D、I、J、K等类)自然科学(N——X类)Z:综合类3。信息内容的基本类目A马克思主义、列宁主义、毛泽东思想、邓小平理论B哲学、宗教

B80思维科学、B81逻辑学(论理学)B83美学、B84心理学C社会科学总论C0社会科学理论与方法、C8统计学、C91社会学

C93管理学、[C94]系统科学、C96人才学

D政治、法律

D9法律E军事F经济G文化、科学、教育、体育

G2信息与知识传播

G3科学、科学研究

G4教育H语言、文字

H1汉语、H2中国少数民族语言

H3常用外国语、H31英语I文学J艺术K历史、地理

K81传记

K85文物考古

K89风俗习惯

K9地理N自然科学总论

N0自然科学理论与方法论

N3自然科学研究方法

N93非线性科学

N94系统科学[N99]情报学、情报工作O数理科学和化学

O1数学

O4物理学

O6化学P天文学、地球科学

P4大气科(气象学)Q生物科学

Q1普通生物学

Q2细胞生物学

Q3遗传学

Q4生理学

Q5生物化学

Q6生物物理学Q7分子生物学

Q81生物工程学(生物技术)[Q89]环境生物学

Q93微生物学

Q94植物学

Q95动物学

Q96昆虫学R医药、卫生S农业科学

S1农业基础科学

S2农业工程

S3农学(农艺学)

S4植物保护

S5农作物

S6园艺

S7林业

S8畜牧、动物医学、狩猎、蚕、蜂

S9水产、渔业T工业技术

TM电工技术

TN无线电电子学、电信技术TP自动化技术、计算机技术

TP3计算机技术、计算技术

TQ化学工业

TS轻工业、手工业

TS2食品工业

TS97生活服务技术

TU建筑科学TV水利工程X环境科学、安全科学4。信息载体的排架规律五、图书馆信息利用中应注意的问题1。不同类型文献信息的特点及用途一次文献:期刊论文、报纸信息、学位论文、会议信息、专利文献、标准文献、科技报告、政府出版物、档案材料等二次文献:各种检索工具三次文献:图书、参考工具书2。各类信息的利用方法3。遵守规章制度,维护学习环境。第二章信息检索的基础知识

信息检索,是根据特定的需求,运用某种检索工具,按照一定的方法,去寻找资料或信息的工作过程,这种方法利用的是序化的信息系统和信息业提供的服务来满足自己的信息需求。本章将介绍手工和计算机检索的基本知识,让读者了解检索的一般程序,包括如何分析问题、如何获取原文、何谓检索语言、了解电子信息源的方法。

返回第一节信息需求类型及特点信息需求可以简单地理解为人们为了了解某类事物的属性以达到某种特定目的,由此而产生的了解相关信息的一种需要。因为目的不同,信息需求不同,而导致检索行为的不同。一、文献信息需求文献信息需求以获得一定的文献原文来满足人们的信息需要。这种需求需要利用提供原始文献或提供原始文献线索的检索工具。1。写论文需要的文献信息主要是要求能给论文帮助的新的、有代表性的文献信息。检索上不求全。2。科学研究需要的文献信息要求能全面、系统地掌握某一阶段内相关的全部文献信息。检索上允许一定的误检,不允许漏检。3。解决某种具体问题需要的文献信息要求文献种能提供相同或相似情况下的解决方法。检索上强调准确性,只求对解决问题的帮助,没有量上的要求。二、非文献信息需求

非文献信息需求以获得一定的有关事实或数据来服务人们。这种检索通常利用能直接提供事实或数据的工具来检索。返回

第二节检索的一般程序

无论是手工检索还是计算机检索,制定检索策略的过程是一样的,即都是一个经过仔细地思考、并通过实践逐步完善查找方法的过程。整个检索过程通常要考虑以下四个主要步骤:1.分析问题:目的是正确地选用检索工具和确定检索策略2.选择检索工具检索工具成千上万,除了要知道哪类问题该用哪类工具书解决,还要熟悉一些具体工具书的内容、范围、特点、编排结构;工具书之间的相互关系,包括内容和时间的联系。有了这些信息在头脑中,就能驾轻就熟地选择,有的放矢地进行查找。3.从检索工具中查找所需信息4.获取原文(查找原文数据库除外)

返回第三节检索语言

检索语言是根据文献检索需要创造的一种人工语言,又称检索标识。从反映文献特征的角度来看,那些代表了文献外表特征的著者姓名、题名、报告号、标准号、专利号、档案号等检索标识和代表了文献内容特征的类号、叙词、标题词和关键词都是检索语言。从检索标识规范化的角度来看,检索语言可分为自然语言检索标识和规范语言检索标识。

在编制检索工具时,标引人员要对各种文献进行分析,把它们所包含的内容要点都分析出来,使之形成若干能代表文献内容的概念,并用规范化的语言如主题词、关键词、叙词、标题词或分类号把这些概念标示出来,纳入检索系统中。检索时,用户要对提问进行主题分析,使之形成能代表信息需求的概念,并把这些概念转换成系统能接受的语言,然后才能从系统中得到用这些规范化语言所标引的文献。因此,将信息需求者的自然语言转化成系统规范化的检索语言对检索的成功与否关系极大。

当前,情报检索语言主要分为两大类:1、体系分类法和分类检索语言;2、主题法和主题检索语言。

对于较复杂的检索,最好综合运用几种检索语言从不同途径查找,各种检索语言各有其优缺点。体系分类语言具有单维性特点,适用于按学科体系进行族性检索,但不适用于多维性的、按专题概念进行的特性检索。主题语言,不论是叙词法还是标题法,具有直接性、专指性、灵活性等优点,克服了体系分类法只能从一种概念为中心检索文献的缺点,但缺乏族性检索能力又成了它的缺点。虽然词表采用倒置式标题或大量参照的办法把具有内在联系的检索标识集中在一起,但仍无法克服同类文献分散的矛盾,影响查全率。此外,标题间的先组性质也决定了它缺乏描述复杂概念的能力。叙词语言是在吸取许多语言优点的基础上发展起来的,其可以灵活组配的优点主要体现在计算机检索上,手工检索很少应用,且系统性又不及分类语言。总之,充分认识上述各种检索语言的长处和局限性,就可以在使用中扬长避短,对提高查准率和查全率都是大有益处的。一、体系分类法和分类检索语言体系分类法是一种直接体现知识分类的等级制概念标识系统,是通过对概括文献信息内容及某些外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成的。体系分类法的主要特点是按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献信息的途径。所谓“类”,是指具有共同属性的事物的集合。

体系分类法具有按学科或专业集中系统地向人们揭示文献资料内容的功能,这对于希望系统掌握和利用某一专业范围的文献而言,无疑是有效的。目前在我国通用的主要分类法是《中国图书馆图书分类法》(中图法)和《中国科学院图书馆图书分类法》(科图法)。“中图法”是国家推荐统一使用的分类法,被许多检索工具采用或改编,分5大部类22大类,类号采用汉语拼音字母与阿拉伯数字的混合号码,用一个字母代表一个大类,以字母的顺序反映大类的序列,在字母后用数字表示大类下类目的划分,数字的设置尽可能代表类的级位,并基本上遵从层累制的原则。国际上比较通用的是国际十进分类法。国际十进制分类法(UniversalDecimallassification)简称为UDC,由比利时的两位学者在DDC的基础上扩充而成,出版于1905年,是一种组配式体系分类法。现有23种文本,被称为世界图书信息的国际交流语言。其主表分为10大门类,详表的全部类目约22万个,其标识体系由等级分明的阿拉伯数字结合多种符号组成(如:钢铁分析是669.1:543),是各种分类法中最详尽的一部,尤其对于科技类。按体系分类法检索的长处是,能满足从学科或专业角度广泛地进行课题检索的要求,达到较高的查全率。查准率的高低与类目的粗细多少有关--类目越细,专指度越高,查准率也越高。但类表的篇幅是有限的,类目不可能设计得很细。因此,分类法只是一种“族性检索”,而非“特性检索”。二、主题法与主题检索语言

主题检索语言是直接以代表文献内容特征和科学概念作为检索标识,并按其外部形式(字顺)组织起来的一种检索语言。主题法最常用的有叙词法(descriptor)和标题法(subjectheading)。前者采用表示单元概念的规范化语词的组配来对文献内容进行描述,是一种后组式词汇标识系统;后者使用一个或者一组规范化的自然语言作为检索标识来描述文献的内容,是一种先组式的词汇标识系统。它们的优点是:在表达主题内容方面具有较大的灵活性,抛弃了人为的号码系统,代之以通用的规范语言,并在各主题之间建立有机的参照系统,代替了等级制的直线排列。它使用组配和索引等方式,较好地满足多元检索的要求。用户查找文献时,可以不考虑所需文献内容在体系分类等级中的位置,只要按字顺查找表达概念的主题词或相近的主题词即可。返回第四节检索工具概述

检索工具是经过一系列的选择、标引、加工、分类和组织等处理后形成的供检索用的工具和设备。检索工具按其收录的内容可分为综合性检索工具、专科检索工具和专题检索工具。如果从检索的手段看,检索工具则有手检工具和机检工具之分。一、手工检索工具(一)寻找手工检索工具书刊的途径利用检索工具书(二次文献、三次文献)是查找所需信息的快捷途径。但二次、三次文献本身的的数量也已经发展到惊人的地步。因此,要查找所需工具书就要了解工具书的书目控制体系。这个体系包括各种工具书指南、专科文献指南、工具书教科书和研究专著、工具书书评刊物。

从工具书指南或工具书教科书中获得所需的工具书名后,再利用馆藏目录查找本馆是否有收藏,或利用联合目录查阅收藏该书的图书馆;也可以直接在图书馆目录中查找,综合性工具书通常在分类法最后的综合类(如《中图法》的Z类),专科工具书在相应的专类检索。工具书指南

工具书指南是一种分类提要书目,它的主要功能并不是系统报导所有工具书,而是有选择地报道重要的和优秀的工具书。它不仅详细著录工具书的基本书目信息,还简略描述该工具书的特点,并在全书各部分之前加注导言,指导读者选书,起着推荐作用。

在国外综合性工具书指南中最著名的是美国的《工具书指南》和英国的《参考资料指南》。两种指南都介绍了广大读者适用的综合性工具书和各个专门学科的专科性工具书,它们的收录范围都是国际性的,以本国出版的工具书为重点,且不同程度地反映其他国家和地区出版的工具书,收录的工具书形式以传统的印刷型为主,也包括了近年来出现的缩微型和机读版工具书、从收录时间上看,它们不仅报导了新出版的工具书,还收录了过去早已出版的重要的工具书(样页)。

综合性工具书指南编纂修订费工费时,时差也大,往往修订版刚出来时,所收录的工具书在市场上己有了新工具书或新版代替。再说综合性指南覆盖面大,而容量有限,各学科的重要检索工具难免有缺漏,因此,需要其它途径来弥补这些不足:(1)各学科的工具书指南;(2)逐年出版的评介新工具书的年报;(3)出版适用于中小型图书馆选书的工具书书目。

国内近年编辑出版的工具书指南有:《中国工具书大辞典》、《工具书辞典》、《中国古今工具书大辞典》、《中国社会科学工具书检索大典》(样页)等。

我国各类专科工具书指南较多,如《语言文学文献利用指南》、《环境科学文献实用指南》、《史地文献检索与利用》等。(二)快速了解工具书的方法

1.了解工具书使用法的几种途径

工具书由书名页、目录(目次表)、说明(序言)、正文、索引和附录等内容组成。因此,拿到一本工具书后,可以从上述各项加以了解。

2.如何评判一本工具书的质量

对用户个人来说,一本能满足自己需求的工具书,一般就可以称为是好的工具书了。因此,评价的最好办法是向该书提问,能否回答我的问题?适合于哪一水平的人使用?前言和内容是否名实相符?以下几条途径可作辅助评价:

(1)检查收录范围(2)权威性(3)客观性

(4)可靠性(5)可读性(6)易用性

(7)适时性(8)利用书评资料(9)专家推荐(三)手检工具的类型1。卡片式检索工具卡片检索工具主要包括各种文献的馆藏目录和题录,其中馆藏目录是反映文献原文收藏状况的。题名目录:图书书名目录、期刊刊名目录等。责任者目录:图书著者目录分类目录:图书分类目录、期刊分类目录等。2。印刷型检索工具书刊

检索刊物(二次文献):目录、题录、文摘、索引工具书:

三次文献:词典

百科全书

传记资料

手册

机构名录

地理资料

统计资料

年鉴

政府文献

引语工具书

表册和图谱

类书和政书二次文献:联合目录、工具书指南等(四)手检工具的排检方法1。分类排检法分类是资料组织的主要方法,也是工具的重要排检方法。因为资料的不同可能采用不同的分类方法。但中文资料一般采用《中国图书馆图书(资料)分类法》来进行分类和组织。分类号的编排顺序是纵向等级比较顺序。例如:

例如:AB。。HH1H15H3H31H314H322。词字排检法这种方法是按照概念中的词或字的一定顺序来排检。俄文:字母顺序西文:字母顺序或同位词字母顺序日文:平假名-片假名-汉字-行政区划汉文:笔画笔形法、起笔笔形法、部首法、拼音法、号码法和韵序法3。地序法4。时序法5。其他特殊方法需要说明的是,当多种符号混排的顺序是:希腊字母-阿拉伯数字-化学符号-本国文字-外来语。二、计算机检索工具(一)数据库数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。是检索系统的信息源,也是用户检索的对象。数据库可以随时按不同的目的提供各种组合信息,以满足检索者的需求。检索系统中的数据库一般由各个数据库生产者提供,也有一些是系统本身建的。1.数据库作为信息源的优势

由于有专门的系统软件对数据进行存取、管理和加工处理等,因而可以使数据尽可能不重复(具有最小冗余度),而且人们可以随时将收集到的信息存入数据库,需要时方便地在数据库中查询;以最优方式服务于一个或多个实用程序,因而数据可以共享;数据库管理系统(DBMS)可以保证为用户数据安全保密,且当他们同时使用数据库时对数据提供保护;

信息更新速度快,动态信息库已达到日更新和时更新的程度,二次文献库的更新速度也比印刷型检索刊物快,可按季度或半年更新,而印刷型检索工具往往要一年;可以提供各种检索手段。由于数据库可以结合各种字段进行检索,其检索途径远比手工检索工具多得多。这些特点使数据库应用渗透到一切领域,成为储存和传递信息的最有用的工具。2.数据库的分类

按国际上通用的分类方法,数据库分为以下三大类:

参考数据库:是能指引用户到另一信息源获取原文或其他细节的数据库,包括书目数据库,如题录库、文摘索引库、图书馆机读目录库,和指南数据库,如企业名录库、产品数据库等;

源数据库:指能直接提供所需原始资料或具体数据的数据库。包括数值数据库、全文数据库、术语数据库和图像数据库。具体的如新闻消息全文库、法律法规全文库、商情全文库、期刊论文数据库、财务数据库、科技报告数据库、各种统计数据库、含有图片或照片的产品目录库、资料库等;混合型数据库,能同时存贮多种类型数据的数据库。

近几年兴起的超文本技术将文献与文献之间得关系连接起来。各种形式的信息不是以一整篇文献为单元存储在系统中,而是通过关系链路将同一文本或不同文本中的信息单元组织起来。这样,用户从任一信息点出发可以遍历与其相关的各个信息单元,可以不必事先周密地考虑所有的检索语词和检索规则也能准确、迅速地获得所需信息。3。数据库的记录格式数据库的记录是构成数据库顺排文档(主文档)的基本单元,是对某一实体属性进行描述的结果。在书目数据库中,被描述的实体是某一特定的文献,这类记录通常被称作文献记录。一个数据库可能包含几千条甚至几十万条记录,一条记录又包含若干个数据字段。这些数据字段就是手工检索工具正文部分的文摘款目中的若干著录项目,例如原始文献的篇名、著者、文献出处、出版时间、文摘、主题词、语种等。它们是构成记录的最小信息单元。为了方便计算和检索,每一个字段都有自己特定的标识符,称为字段名,如AB代表文摘字段、TI代表篇名字段、AU代表著者字段等。数据库记录的著录项目(字段)往往比手工检索多得多,这就决定了计算机检索能够提供比手工检索更丰富的检索途径。4。记录中的字段及标识符

在数据库中,记录由若干个字段(著录项目)组成。每个字段标出字段名称,如Title、Author分别代表篇名字段和著者字段。为了计算机在检索时能够顺利地识别字段,对每个字段又给予一个相应的字段代码标识符,如用TI表示篇名字段、AU表示著者字段。有的字段又由若干子字段(Subfield)组成,这些子字段彼此是同等关系,在内容上有一定联系,但相互独立。例如,叙词字段中的各个叙词,分别是叙词字段中的子字段;文摘字段中的每个句子分别是文摘字段中的子字段。常用的字段如下:AN=:DIALOG存取号(DIALOGAccessionNumber),在一个数据库中,每篇记录只有一个存取号,每个号只配给一条记录,两者一一对应。DIALOG存取号后常跟各数据库的文摘号,与相应的检索刊物一致。/TI:篇名字段(Title)。AU=:著者字段(Author)。CS=:著者所在单位字段(CorporateSource)。SO=:文献出处字段(SourcePublication),对于期刊文献包括期刊名称、卷、期、页等;对于会议文献包括会议名称、届次、时间、地点等。PY=:出版年代字段(PublicationYear)。/DE:叙词字段(Descriptor),/AB:文摘字段(Abstract)。/ID:自由标引词字段(Identifier),非受控词表中的词,由标引人员根据文献内容确定。CC=:分类代码字段(ClassficationCode)。(二)网络信息及检索工具1。各类信息网站信息网站中除大型的商业信息网外,要特别注意专业网站。如:中国农业信息网、中国作物种质资源信息系统、中国农药信息网、中国科学院国家基因研究中心网站、中国科学院文献信息中心网站等。2。网络引擎网址簿和搜索引擎查找网络信息源也有两种途径,上网前利用网址簿进行手工检索,或上网采用搜索引擎查找。

利用网址簿的优点是浏览方便、费用低廉、查阅时间宽裕,可以慢慢挑选和比较,确定一些所需的网站后再上网,避免上网冲浪的盲目性,比较适合经济条件并不宽裕的电话上网用户。近年来,国内出版了不少自编或翻译的网址簿,如《全球实用信息资源通,1999》、美国HarleyHahn著的《全球Internet网址簿》(机械工业出版社,1999)、《中国网址簿,1999/2000》、《全球网址大全与企事业单位上网方式》、《WEB科技资源手册》等。利用网址簿的普遍缺点是网址信息变化无法及时反映,上网时如遇到“打不开”的问题,不妨利用引擎键入网站名试试,网址只能作为参考,这是用户使用时应注意的。搜索引擎(SearchEngine)是因特网上专门提供网上信息查询服务的网站,是在浩如烟海的网站中迅速查找有效信息的指南,由于其强大的导航作用,已经成为人们上网时的必备工具。Yahoo每天被访问人次已达1000万以上,其他较大型的搜索引擎日访问量均达到了百万次的数量级。

上网查询可利用专门介绍引擎知识的网站,这些站点有不同搜索引擎的信息,以及如何有效地使用它们的建议。其中具有代表性的网站有:BerkeleyDigitalLibrarySunSite,TheSpide’sApprentice,EIN(EuropeanInternetNetwork),网易和网典。

有的研究按获取信息的不同方法将搜索引擎分为三种类型:

第一种:单一搜索引擎(SingleSearchEngine)

第二种:索引搜索引擎(MetaSearchEngine)

第三种:网络搜索软件(NetSearchSoftware)单一搜索引擎(SingleSearchEngine)

其主要工作原理是:首先,派出蜘蛛/爬虫(Spider)或机器人(Robots)在网上搜寻信息,并将有关的信息带回引擎;其次,将信息进行整序、标引,建立自己的资源数据库;再次,通过Web服务器端软件,为用户提供浏览器界面下的信息查询。我们经常使用的Altavista、Yahoo、Infoseek等属于此类。这种引擎又可以按对网站、网页的处理重点不同分成两种:第一种是目录型搜索引擎,以网站检索为主,网页全文检索为辅,即,将网上纷繁复杂的网站序化后编成国际互联网分类目录,在各类下排列有关网站的站名、网址链接和内容提要,就像一本电子网址簿。这种引擎可以使用户清晰方便地查找某一大类信息,符合传统的信息查找方式,但如果类型和站点选择不当,可能会遗漏重要信息源。第二种是全文搜索引擎,以网页全文检索为主,网站检索为辅。在这种引擎的资源库中所保存的信息是各网站的每一个网页的全部内容,全文检索的结果,不是站名、网址和内容提要,而是与用户输入的关键词相关的一个个分类的网页地址和一小段文字。换言之,前者可以查网上有哪些报纸,是文献检索,后者可以查到网上这些报纸的每一篇文章和文章中的相关内容,是信息检索。北京新浪网是受到以网页全文检索最为知名的引擎AltaVista支持的,如图显示的是其搜索引擎的主页面。检索得到的反馈,除了显示查到的网页总数、关键词总数外,还包括每一网页的标题、链接、编写日期、长度等信息,并有正文前100字的内容。AltaVasta在2000年5月推出的全文搜索引擎RagingSearch,索引了3.5亿个网页,比以往的速度快20%,搜索结果的相关度更高。索引搜索引擎(MetaSearchEngine)这种引擎一般没有自己的数据库,当用户发出检索请求后,通过转义在多个单一搜索引擎中查询,对查询结果进行处理(归并、删除重复、校验连接、按相关度排列结果),然后返还给用户。换言之,这是一种“引擎的引擎”。Metasearch()、Fusion()、Cyber411()就是这样的引擎。在Cyber411主页的检索框中键入“competitiveintelligence”,系统就将Infoseek、Google、AltaVista等252个引擎上的有关网站名称、网址及其内容介绍开列出来,并按相关度排序。由于目前搜索引擎大量涌现,引擎的选择成为用户挑选网上信息源的一大难题,使用这种“引擎指南”也许能部分地解决这一问题。网络搜索软件(NetSearchSoftware)一般安装在本地计算机上,通过向多个搜索引擎发出检索请求来查询信息,对返回的结果根据一定的规则显示输出给用户。检索方法的特点类似于多元搜索引擎,但较前者更方便快捷,由于运行软件的专用性,在输出结果方面非常灵活。Limbex公司Quarterdeck子公司研制的软件pass就是这样的软件。该软件包括AltaVista,Yahoo等43个著名搜索引擎;可定时更新已经检索的资源;通过内嵌的一个科学分类索引帮助确定关键词;能为每个站点自动编制文摘、自动校验连接并删除不能到达的URL。目前中国学生常用的搜索引擎有百度、北大天网、搜狐、Google中文、雅虎中国等。另外,要注意引擎的作用和特点。了解搜索引擎的作用和特点,为选择和评价搜索引擎提供了标准。不同的引擎,具有不同的作用和特点,在使用引擎时,对引擎的质量可从以下几点来考虑:

(1)具有网站检索、网页检索和新闻检索的功能,有的引擎甚至可以进行图形图象检索(如Infoseek的ImageSurfer,Yahoo的ImageSurfer)。

(2)既有简单的查询界面,如提供按知名度排列的站点菜单选择,也有复杂查询界面——可定制查询方式(精确匹配、模糊匹配)、逻辑操作、查询范围及结果显示模式(标准或简要模式)。用户可按照书写习惯输入检索请求。现在引擎提供的查询功能一般有分类搜寻(WebDirectory)、模糊搜寻、栏位搜寻,进阶搜寻,如Yahoo、新浪在关键词前加“t”表示搜索网站标题,加“u”表示仅搜索网站网址(URLs)。(3)较高的查询效率和搜索功能。有的引擎,如新浪可限时间范围,辟有热门词查询;浩瀚搜索器()可限制语言(简、繁体)、地区、网址、标题、主办者、同义词、上位词等。有的引擎如搜狐,具有拟人的思维包含模式,可以针对不同的思维定向,自行定义搜索专题。当输入“互联网”时,“因特网”、“Internet”等相关的概念也能得到反映,而不需要在高级搜索中使用“AND/OR/+/-”等逻辑条件多次查询。

(4)中文引擎具有中文分词功能。中文在词之间的词义、词性方面的界定比英文困难,往往要用户自己鉴定和过滤,降低了检索效率。搜狐、网典()、天网()、悠游等对大多数日常用词可以精确定位和评估,较少发生上述歧义冗余的检索结果。返回第五节检索方法及检索途径一、检索方法查找(Searching)就是实施检索策略、搜寻所得文献信息的过程。如何查找,并没有一定之规可供遵循,同一个问题,三个检索者,可能有三种不同的查找方法。这是因为他们在主观上受到的实际经验、知识结构、对检索工具了解的广度和深度、认识问题的方法、心理品质等因素的影响;在客观上,又受制于检索工具的完善与否、检索时间充足与否以及物理环境等因素的影响。以下几种方法,无论是计算机还是手工检索,都是常用的方法。1.“拉网法”

在不了解查询某一专题信息的URL地址时,可从提供信息总目的Web页面开始浏览,沿着专题链接层层查找,直至找到有关的内容为止。然后用“书签”保存这个页面的URL,转向另一个分支。这种方法可以迅速获得较多的相关地址,然后进行筛选。就使用引擎而言,国外专家也建议先用链接页面多、响应时间快的引擎。2.引文法(跟踪法)

文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法(也有称为跟踪法)就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。这些材料指明了与用户需求最密切的文献线索,往往包含了相似的观点、思路、方法,具有启发意义。循着这些线索去查找,不仅利用了前人的劳动成果,省却了很多时间和精力,而且可能在原来的基础上有新的发现。

引文法又可分为两种,一种是由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引,如《科学引文索引》、《社会科学引文索引》。

另一种较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更多相关文献,直到满足要求为止。这种方法适合于历史研究或对背景资料的查询,其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。因此,最好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,有时还附有评论。利用引文法高效率地查找文献的最有用的工具是利用引文索引。3.常规法引文法的一个主要缺点是作者个人收集文献数量有限,不可能列出有关专题的全部文献,这一不足可用常规法来弥补。所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。现在对文献的书目控制手段已日趋完善,各种印刷版、缩微版、光盘版和网络版的检索工具层出不穷,有很大的挑选余地。用户应根据自己的检索知识和条件选用一种或几种检索工具。常规法可分为顺查法、逆查法和抽查法。

顺查法是以课题研究的起始年代为出发点,利用选定的检索工具如书目、索引、文摘由远及近地逐年查找;逆查法则相反,是由近及远地查找,起点是从最近发表的文献开始,直到设定终止的年代或查到所需资料为止。由于这两种方法都是利用检索工具,又是逐年逐卷地查找,遗漏重要文献的可能性就减少了,查全率比引文法高。两种方法适用于研究范围广、研究历史较悠久、课题较大的咨询。也可用于解答那些无法准确确定答案在什么时间范围内的咨询。但逐年查找的缺点是费时费力,检索工作量大,因此可以利用抽查法。抽查法是基于这样一个规律来查文献的,即任何一门学科的专题研究大体都像波浪起伏般地发展,时而高潮,时而低潮。由于兴旺时期发表的文献量大,各种学术观点较为集中,如果针对课题研究处于兴旺时期的若干年查找,则付出较少的时间可获得较为满意的检索结果。这是一种效率较高的查法,但必须熟悉学科或研究专题发展的历史。4.交替法

交替法就是把引文法和常规法结合起来查找文献的方法:即先利用常规检索工具找出一批有用文献,然后利用这些文献所附的引文进行追溯查找,由此获得更多文献。这一方法是针对单纯用引文法所获得的情报价值越来越小的缺点提出来的。按照引文规律,有价值的文献在发表后最初几年(例如五年)内被引用的次数较多,但以后趋于减少。因此,追溯的年期应予限制。跳过追溯的那几年再用常规检索工具查出具有新价值的文献,然后再根据所附参考文献追溯查找。5.排除、限定和合取法

这实际上是将信息加工的方法融入检索中去。思维中使用排除这一概念,是指对查找对象的产生和存在的状态在时间和空间上加以外在否定。把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。如要查中国网络资源建设的文章,确定1994年以前Internet未进入中国,则可排除1994年以前的报刊资料,这就是采用的排除法。限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定。排除的结果必然是限定,反之亦然。令人满意的答案往往不是完整地记录在某一篇文献中的。如果把不同资料中涉及所需信息的记载都截取下来,汇集在一起,再经过去粗取精、去伪存真地加工,构成一个完整的答案,这就是合取法。采用这-方法,不仅要对各类工具书触类旁通,灵活运用,还要学会分析来自各方面的庞杂的材料。合取并不是一加一等于二式的材料拼凑。在检索时,也不能局限在“一把钥匙开一把锁”式的思维方式中,特别是碰到复杂的难题或大课题时,要注意:(1)善于跨种类地综合利用各种类、各文种的参考工具书,注意比较它们各自的特点,有步骤、按次序地进行查找;(2)不仅要利用二次文献,还要注意利用一次文献和三次文献;(3)不仅要利用文字资料,还要注意利用图象资料;(4)不仅要利用电子信息,也要考虑缩微资料、印刷品和档案材料;(5)不仅要注意参考工具书的正文,还要充分利用其附录。上述方法,各有其优缺点,查找时要结合检索条件、时间、人手的限制等因素综合考虑。除了考虑方法以外,查阅技巧也是不可忽略的。有时方法对头,检索策略也无问题,可就是查不到近在眼皮底下的答案。因此,切忌匆匆翻阅,浅尝辄止,这样做往往成为漫无目的地胡猜乱翻,结果一事无成。如果初查失败,不要急于丢弃原来的方案,前后多查几页往往会找到有用的线索,甚至是意外收获。尤其在网上查阅,响应一次检索请求的文献量很大,在时间或资费压力下,往往只查首页的检索结果就匆匆放弃是不明智的。如果确实不能解决问题应及时优化检索策略,许多引擎都提供了“高级检索”、“精炼检索”的途径。二、检索途径

所谓检索途径就是检索时切入信息群体的路径。检索途径有两大类,一类是用信息的外部特征,如题名、责任者、某种序号、机构名等作为检索标识;另一类是用能够描述信息内容的分类号、关键词、主题词等作为检索标识。在数据库中检索时,几乎所有的字段都可以作为检索的途径。(一)分类号检索(分类检索)

这种检索是根据信息内容的学科分类来进行的。最大的优点能保证信息的系统性,而且具有较好的族性检索功能。但是,资料在工具中的线性排列,以及学科分类的复杂性给分类检索带来了很大的困难,同时信息群体过于庞大时,分类更困难,选择信息更烦琐。分类检索的要点:1。对待检课题的概念及学科间的各种关系清楚;2。正确掌握相关课题的分类名称、分类号,手工检索中掌握工具的分类排检。

手工检索的步骤:1。分析待检课题,确定其学科,并弄清学科间的各种关系。2。查出待检课题的分类号(工具简单时可以省略)3。选择适当的检索工具4。在工具的分类目录中,根据排检规律找出相应的类目5。根据目录的指示(书本式工具中类目名称后的页码)找出信息群体6。对比题目,阅览相关信息,选出所需信息,并记录相关信息7。原文的索取计算机分类检索比较简单,1—3步同手工检索,第四步进入检索系统后选择分类号途径,并在对话框内输入分类号,开始检索,然后根据结果显示挑选所需信息并下载相关信息即可。(二)词汇检索与分类号检索相比,词汇检索具有直观、灵活、专指性和适应性好的特点,同时检索速度也比分类检索快。词汇检索的要点:首先是要选好检索词,其次是正确理解相关索引中个部分的含义,并掌握起用法。另外计算机检索中还要注意词间关系的正确表达。常用的词汇检索有关键词检索和主题检索。计算机检索时,选择任意字段检索时,检索项也可以是各种词汇。因为关键词检索和主题词检索的作用差不多,所以在检索工具中只存在其中的一个。手工检索时词汇检索需要借助工具中的相关索引来完成。1。主题词检索和关键词检索的步骤(适用于其他类型词汇索引的检索)

a.分析课题,确定检索词及词间关系(检索入口词或说明词语)

b.选择适当的检索工具

c手工检索时,在工具的相关索引中找出入口词。计算机检索时,进入数据库,选择词汇检索途径,在对话框内输入检索词(注意词间关系的表达)

d.手工检索中,对比题目,参阅说明词语,找出相关主题。计算机检索时根据快捷显示,选出有用信息并下载。

e.利用索引中相关主题后的记录号找出相关记录,并记录有用信息线索。

f.原文的索取主题索引样例:基因红细胞血型8762遗传分析统计分析8550诱发突变相关分析8772基因表达87248766基因库互补DNA肝肿瘤8684玉米互补DNA86912。计算机检索中的常用算符A.逻辑算符逻辑“与”(用and或*表示)是一种用于交叉概念或限定关系的组配,它可以缩小检索范围,有利于提高检索的专指性。如欲查同时含有概念A和概念B的文献,可表示为:“AandB”或“A*B”。逻辑“或”(用OR或“+”表示)是用于具有并列概念关系的组配。这种组配可以扩大检索范围,提高查全率。例如,检索含有检索项A或检索项B的文献,可表示为:AORB或A+B逻辑“非”(用“NOT”或“-”表示)是用于从某一检索范围中排除不需要的概念。这种组配可以缩小检索范围。例如,在含有概念A的文献集合中,排除同时含有概念B的文献,可表示为:“ANOTB”或“A-B”。B.截词算符后方截词,也称前方一致。它是将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。后方截词又分为词尾的有限截断和词尾的无限截断两种情况。中间截词又称中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。例如“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e”代替。前方截词,也称后方一致,是用检索词的后一部来进行检索。例如:computer、puter、puter,如果要把含有这三个词的文献全部检索出来,只要输入?S?computer即可。C.字段限定检索及字段标识符字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。基本字段包括篇名、文摘、叙词、自由标引词四个字段。辅助字段包括除基本字段以外的所有字段。每个字段都有用2个字母表示的字段标识符。在DIALOG检索系统的命令检索模式中,使用字段限制检索时,基本字段用后缀表示,辅助字段用前缀表示。在检索表达式中,除使用前面介绍的逻辑算符、位置算符、截断算符和字段标识符外,为了准确地表达用户的检索要求,还常常采用如下符号:如“in”字段揭示符,“=”连接符,<,>,等符号。这样不仅可以避免误检,还可以缩短检索的时间。返回第六节检索结果评价及修正一、信息检索结果评价信息检索结果与检索要求常常不一致,原因来自两个方面,一是检索工具和检索系统本身的问题,如检索工具收录的信息不全,标引深度不够,导致系统只能回答信息提问,而不一定能够满足信息需求等。二是用户的问题,一般来说,用户只能够大概表述自己的提问,而不能确切的衡量文献信息与提问的切题程度。加之随着学科的发展,检索课题日趋复杂,可能出现令人不满意的检索结果。因此,需要对检索结果进行评价,以准确了解检索系统的各种性能水平,分析影响检索效果的因素,及时调整检索策略,提高检索效果。(一)评价检索结果的主要指标检索效果是指用户对检索系统实施信息检索的有效程度,也是系统满足用户信息需求的程度,检索效果同时反映了检索系统服务能力和用户的检索能力。按照特性不同,可以将检索效果分为技术效果和经济效果。其中,技术效果由检索系统完成各种功能的能力、用户的操作能力以及对检索课题的把握能力等因素决定;经济效果由检索系统完成各种功能以及用户达到自己检索目的所花费的成本和时间来决定。评价检索效果的两个重要指标是查全率和查准率。1.查全率:又称为检全率或命中率,是指检出的相关信息量与检索系统中相关信息总量之比。2.查准率:是指检出的符合课题需要的相关信息量与检索出的信息总量之比。(二)信息检索结果的影响因子对于用户而言,最关心的是检索结果,一般来讲,影响检索结果的主要因素有文献标引的广泛性和检索标识的专指性。标引的广泛性是指标引时揭示文献主题基本概念的广度,是支配查全率的重要因素;检索标识的专指性是指检索标识表达检索主题的专指程度,是支配查准率的重要因素。对于检索系统来讲,系统信息存储不全、索引词汇缺乏控制、词表结构不够完善、标引缺乏详尽性、信息分类的专指度不能精确描述信息主题、组配规则不严密而产生模棱两可和歧义现象等,都是影响查全率和查准率的客观因素。对于用户来讲,对检索要求的理解不够明确、检索工具选择不恰当、检索途径和方法过少、确定检索词缺乏专指性、组配错误等,都是影响查全率和查准率的主观因素。二、检索结果修正1、信息量过大(正常情况)应考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下:(1)减少同义词与同族相关词;(2)增加限制概念,采用逻辑“与”连接检索词;(3)使用字段限定,将检索词限定在某个或某些字段范围;(4)使用逻辑”非”算符,排除无关概念;(5)调整位置算符,由松变严,(F)(W)。2。信息量小(正常情况)为了提高检全率应尽可能扩大检索范围。(1)注意相关和相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论