第一讲 科技文献信息检索与利用概论_第1页
第一讲 科技文献信息检索与利用概论_第2页
第一讲 科技文献信息检索与利用概论_第3页
第一讲 科技文献信息检索与利用概论_第4页
第一讲 科技文献信息检索与利用概论_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

科技文献信息检索与利用

概论主讲人:薛培元pyxue@126.com(Internet)xuepy@c512.cast(Intranet)2011年9月研究生为什么要上信息检索课?1)从入大学校门起就开始学习这门课,为什么现在还要学习?文献检索信息检索2)研究生的主要任务(文献调研及信息积累>>>选题>>>论文答辩)写论文、作研究……3)我国对本科生的信息素质教育是从1984年开始发展起来的,研究生文献检索课最初是从对文献利用要求较高的医学院校开始发展起来的。目的是培养必要的信息素质!(信息意识、信息知识、信息能力)1前言研究生信息素质的要求与现状 研究生不仅要有扎实的本科专业基础知识,而且要对整个学科体系、本专业相关的学科领域有较宽泛的理解,同时还要有一定的文献收集能力和一定的科研创新能力。 有学者做过统计,研究生论文中每篇论文的引文平均为55~70条,其中外文引文,尤其是外文期刊的引文达20~50条,反映了研究生在引用文献时注重文献的开放性和时效性。 据调查,目前在高校研究生中,能够较好地掌握现代信息检索技术,具有较强信息素质的学生还不到一半。国家人才发展目标的改变知识型人才 创新型人才知识分子、饱学之士、学富五车“最牛学历哥”周宝宽:35年获得包括3个博士、2个硕士在内的国家承认的9个文凭人才吗? 科技文献检索课的教学目标应适应人才目标的改变而改变,为“创新型”人才培养提供服务。 信息检索已从传统的检索方法向多媒体、超文本、网络化等新型检索技术方面发展,科技文献检索课应体现这些检索技术;由重检索技能、线索的获取向重信息综合利用能力方向转移。文献与科研工作的关系 科学研究涉及的思维过程大致包括四个阶段:发现问题、了解情况、深入思考和实践验证,其中前三个阶段都和文献阅读密切结合。空杯原理信息检索(InformationRetrieval)就是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。主体:信息用户目的:解决问题(查信息咨询理论课件)对象:事实、数据、知识过程:查找识别获取2信息检索的概念从实际检索工作的角度出发,信息检索具有狭义和广义之分。

广义的信息检索:将信息按一定的方式组织和存储起来,并根据用户的需要找出相关信息的过程,包括“存”和“取”两个环节。“存”是对信息进行收集、标引、描述及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。“取”即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。

狭义的信息检索:仅仅指信息查找的过程,也即上述“取”的环节。信息检索与文献检索的联系与区别

早期的信息载体主要是纸介质,信息检索活动主要围绕着相关文献的获取和利用展开,因此“文献检索”与信息检索基本同义。 随着社会信息传播与存储载体的多元化,不再拘泥于载体研究信息检索,开始广泛使用“情报检索”。目前,文献检索和情报检索统称为信息检索。信息检索的原理示意信息检索的类型1)按检索对象的内容区分,包括文献检索、数据检索和事实检索。 文献检索:以文献为检索对象,查找含有用户所需信息内容的文献。是一种相关性检索而非特定性检索。

数据检索、事实检索以文献检索为依托。2)按检索方式分,包括手工检索和机器检索,机器检索又可包括联机检索、光盘检索和网络检索。3)按时间跨度分,包括定题检索和回溯检索。

定题检索:(SelectiveDisseminationofInformation,SDI)查找有关特定主题最新信息的检索,只检索最新信息,时间跨度小,需要在较长时间内多次运行。

回溯检索:查找一段时期内有关特定主题信息的检索,也称为追溯检索,既可以查找过去某一段时间的特定主题信息,也可以查找最近的特定主题信息,一般只运行一次。工程技术领域信息用户及其需求1)科学研究人员专业性:领域窄、难度大、专深;系统性:信息要系统完整;连续性:对信息的时间性要求不高;多样性:期刊论文、学位论文、会议论文,科技报告2)设计开发人员行业性、广泛性、可靠性、实用性、时间性3)技术管理人员综合性、决策性、准确性3教学大纲本课程旨在介绍现代信息资源的特征、类型及其开发与利用,着重介绍信息资源的重要组成部分——文献信息资源的发展概况、查找途径和检索方法,以及网络信息资源的评价、检索与收集方法。通过本课程的学习,可以使学习者掌握科技文献信息检索的一般理论、主要检索工具的使用方法、主要数据库的检索技能,以及五院图书馆主要信息资源的检索与利用物质能量信息人类社会的三大资源:物质、信息和能量。其中,物质提供材料,能量提供动力,信息提供知识与智慧。4信息资源概述信息的有关定义现有信息的定义各种各样,已有几十种。它们各自从各自的角度来定义,很难把它们综合成一个通用的定义。信息是一个涵义很宽泛的概念,可以从多个角度和多个方面理解。信息现象渗透于物质世界和精神世界之中,信息的多样性使得迄今为止所有要为信息下一个统一定义的企图都落空了。--《大英百科全书》因此,定义要结合具体的理论需求和实践条件。信息科学界:申农(C.E.Shannon):1948年,在《通信的数学理论》(AMathematicalTheoryofCommunication)一文中,把信息定义为“熵的减少”即“能够用来消除不定性的东西”。意大利学者朗格(G.Longe):信息是事物之间的差异。而不是事物本身。即信息反映事物的形成、关系和差别的东西,包含在事物的差异之中。(《信息论:新趋势和未解决问题》1975年)钟义信(北京邮电大学教授):信息是事物存在的方式或运动的状态,以及这种方式或状态的直接或间接的表述。(钟义信《信息科学原理》第三版北京邮电大学出版社,2002.10)经济学界:波拉特(MacUri.Porat):信息是经组织化而加以传递的数据。德鲁克(P.E.Drucker):信息是有目的性和关联性的数据。因此,把数据转换为信息需要知识。(《知识管理》人大版P5)信息管理领域:美国OMBA-130号文件:信息——指任何传播内容或知识的表示,如以任何媒体或形式存在的事实、数据或见解,包括文本型、数字型、图片式、动画式、记叙型的、声视频形式等。美国学者AusenN.Smith和DonaldB.Medley从资源的角度对信息进行了解释,指出:信息是数据处理的最终产品,具体而言,是经过收集、记录、处理、亦可检索形式储存的事实或数据。(“Informationresourcemanagement”)已有的定义包含的意义要素有:数据、事实或见解(知识),组织化或关联性,客体的状态或方式,人类主体对其的感知或认知,社会化的信息(不是原始自然状态的信息或生物信息),还有载体、传递等要素。信息是反映事物运动状态和方式,以文本、数值或多媒体等形式存在的数据、事实或见解。实例:从反映事物运动状态和方式角度看地震波反映的是地质运动的信息股市行情反映国民经济和市场的运动状态新闻消息包含的面广,自然界和人类社会的运动状态和方式都可以反映知识金字塔

数据、信息、知识、智慧(DIKW)的关系数据

信息(数据+语境)

情报(信息+推断)

知识(情报+确实性)

智慧(知识+演绎推理)信息+经验模式化的数据分散的元素附加价值Knowledgeisknowingatomatoisafruit;Wisdomisnotputtingitinafruitsalad.5基本概念信息(information):香农:信息是用来消除不定性的东西。维纳:信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容的术语。哲学家:信息是客观世界中各种事物的运动状态和变化的反映,是客观事物之间相互联系和相互作用的表征,表现的是客观事物运动状态和变化的实质内容。信息是事物存在的方式或运动状态,以及这种存在方式或运动状态的直接或间接的表述。霍顿:信息是按照用户决策的需要经过加工处理的数据。数据(data) 数据是对客观事物的记载,由一些可以鉴别的物理符号组成。是未经加工分析的事实或事实流,如字母、数字、姓名、线条和符号等。情报(intelligence) 情报是对使用者具有参考价值和决策意义的信息,是对信息经过一系列组织、加工、分析、研究的产物。知识(knowledge) 知识是人类社会实践经验的总结,是人的主观世界对客观世界的概括和反映,是已知的、系统化的信息。知识是信息的一部分,是一种特定的人类信息。6信息资源的定义(1)资源《辞海》:一国或一定地区内拥有的物力、财力、人力等物质要素的总称。分为自然资源和社会资源两大类。前者如阳光、空气、水、土地、森林、草原、动物、矿藏等;后者包括人力资源、信息资源以及劳动创造的物质财富。《大英百科全书》:人类可以利用的自然生成物及生成这些成分的环境。联合国环境署:一定时间、地点条件下能产生经济价值以提高人类当前和未来福利的自然因素和条件。——信息资源就是文献资源,即所有文献的集合,包括各种内容、各种形式、各个时期的文献。——信息资源就是数据资源,是指所有记录下来的、可以输入到计算机里、由计算机鉴别和处理的符号的总和。(2)信息资源——信息资源就是信息本身,即各种媒介和各种形式的信息,或者说是与人类社会活动有关的所有信息,如自然信息、机器信息、社会信息等,它包括文字、图象、声音等各种媒介,有印刷品、电子信息、数据库等各种形式。——信息资源等于信息加信息技术,即计算机资源。信息技术主要关注信息处理过程的设备,包括控制硬件操作的软件,信息则指这些设备加工的原材料。——信息资源是信息生产、流通、分配、使用全过程中所有信息要素的总称,包括生产信息的材料——消息、讯息、知识、数据、情报;存储、处理、传递信息的工具——计算机软硬件、通讯设备和复制设备;控制信息过程的人——信息管理人员、系统分析人员、程序编制人员、信息服务人员等。美国信息管理专家F·W·Horton认为,从政府文书管理的角度来看,信息资源具有两层意思:第一,当“资源”为单数(Resource)时,信息资源(InformationResource)指某种内容的来源,即包含在文件和公文中的信息内容;第二,当“资源”为复数(Resources)时,信息资源(InformationResources)指支持工具,包括供给、设备、环境、人员、资金等。Horton和另一位信息管理专家Marchand从两个不同的层次给出了信息资源的范围。他们认为,对于整个社会或国家来说,信息资源包括四个方面:1.具有与信息相关的技能的人才;2.信息技术中的硬件和软件;3.信息机构,如图书馆、计算中心、通信中心和信息中心等;4.信息处理服务提供者。在商业机构一层,他们提出了“信息资产”的概念,认为它包括:1.公司拥有的数据和文献资料;2.公司拥有的“know-how”,包括知识产权(专利、著作权)和个人(专家)的经验;3.公司拥有的竞争情报,即有关其竞争对手和商业环境的信息。美国《文书工作削减法》(PRA)(1995):信息资源——指信息与相关资源,如人员、设备、资金和信息技术。美国联邦政府管理与预算局(OMB)A-130号文件(1985):信息资源包括了政府信息和信息技术。乌家培的定义:对信息资源有两种理解。一种是狭义的理解,即指信息内容本身。另一种是广义的理解,指的是除信息内容本身外,还包括与其紧密相联的信息设备、信息人员、信息系统、信息网络等。狭义的信息资源实际上还包括信息载体,因为信息内容不能离开信息载体而独立存在。

《国家信息资源开发利用规划》(草案,1997):信息资源是指在经济、政治、科技教育、国防、社会生活等各个领域、各个层次产生和使用的信息内容。7本课程的定义及其依据本课程给出的定义是:

信息资源是人类活动各个领域所产生和有使用价值的信息集合。本定义包括:由(及为)人类活动各个领域(包括政治、军事、经济、文化和社会生活等)所产生的和有使用价值的各种信息集合,如数据的集合、信息集合、(显性)知识集合,还包括各种来源,各种载体,各种表示方式,各种传递方式和渠道,各种使用场合和用途。定义依据:本定义吸收了学界和官方文献中一些有代表性的定义或解释中的基本思想和要素,如:基于人类实践活动,实用性,狭义理解(仅指信息),强调集合性(即强调有一定的数量规模、富集度或丰裕度)。8信息源与信息资源的关系信息源(informationsources)是信息资源的来源地(包括信息资源生产地和发生地)。信息的来源有多种多样,根据它们产生和传播的先后次序,可以分成以下三个不同的层次:最初始的来源是人类的社会实践活动,包括政治、经济、军事、文化和社会生活的各个领域,都会产生和积累或多或少的信息和数据。第二层次的信息源是现实社会中各种媒体以及网络,包括各种通讯社、报社、杂志社、出版商、书商、互联网、信息中介机构以及它们所采集、发布、传播的信息产品和服务,如:新闻、电讯稿、报纸、杂志、图书、网页等。它们所提供的信息一方面直接来自第一层次,另一方面则可能来自第三层次。第三层次的信息源主要是指人类社会历代流传和积累下来的文化遗产和活动成果(如文化典籍、考古发现、历代的文化遗存等)。8.1信息成为资源的条件必要条件:可以为人类创造财富和提供福利通过人类活动可以识别或检测到充分条件:经过有序化处理,真实、准确的信息。奈斯比特:“失去控制和无组织的信息,在社会中不再构成为资源,相反,它构成污染和成为信息工作者的敌人。”从资源开发利用的角度讲,信息需要具备一定的富集度。8.2信息资源的特性和价值分析8.2.1信息资源的特性8.2.2信息资源的战略价值8.2.3信息资源的社会功能8.2.1信息资源的特性信息资源与物质资源相比较,既具有一定的共性又有许多不同的特性。我们分别从自然特性和经济特性两方面来考察它的特性。(1)信息资源的自然特性非物质性和易流动性:它既不是物质,也不是能量,但具有物质基础。它必定要附着在某种介质上,不能离开媒介而独立存在。它易扩散,易传播,是最富于流动性的一种资源,而当代经济正是一种高度流动性的经济,这是信息资源和信息技术所使然。

可再生性和数量的无限性:经过处理、传播或利用,可以生产出新的信息或更多的信息。从一般意义上讲,信息资源(包括原始状态和经过一定的开发和利用的)在数量上是无限巨大的,在统计上是无法穷举的,而且是无穷无尽的。

易转换性:其记录介质和表示方式都容易转换。

易共享性:其生产者或拥有者难以独占使用。

质量差异性:由于生产和传播水平存在差异,即不同的信息资源在质量上的差异很大。

意义多样性:对不同的人或组织可能具有不同的意义。(2)信息资源的经济特性效用性:任何信息资源对人类都具有一定效用,不仅可以独立使用,并且在一定条件下可以替代其他资源。效用性还可以细分为:使用的整体性:如有关一种生产工艺的信息,不管产出量大小,都要把它作为一个整体来使用。效益的间接性:开发或利用信息资源的效益不一定立即或直接体现在经济指标上。利用效果的社会性:许多信息资源(特别是公共信息)的开发利用效果主要体现在社会发展和进步上,而不是个人或组织的经济效益上,即所谓公共产品特性。时效性:许多信息资源(特别是与决策相关的信息)都具有高度的时间敏感性,即要求及时性和适时性。供给的稀缺性:对于某个人或组织来说,真正有价值且可获得的信息资源往往是稀缺的。成本结构的特殊性:生产成本高,复制成本低,固定成本绝大部分是“沉没”成本,而可变成本或增量成本很低。体验性:作为产品,有些信息资源是一种“体验性产品”,消费者追求的是一种体验。8.2.2信息资源的战略价值资源不同,对某个国家意义也不同。作为战略资源,它必然与该国的国计民生密切相关,是一个国家社会、经济、科技发展的基础。国家战略资源是一个国家实现本国战略目标可以利用的现实的和潜在的关键性资源。信息资源已成为国际竞争中的焦点之一。信息资源禀赋和存在状况是衡量一个国家综合国力的重要标志。信息技术的广泛应用,使信息成为重要的生产要素和战略资源,是优化资源配置、推动传统产业不断升级和提高社会劳动生产率的新动力。我国目前信息技术应用已经很普遍,各个信息系统迫切需要注入充足的信息资源,以维持其正常运行和发挥更大的效益。在军事领域内,信息就是情报。信息资源已经成为继人和武器装备之后军队战斗力的又一个新的构成要素,对信息优势的争夺成为影响信息时代战争胜负的关键因素。8.2.3信息资源的社会功能认识功能:人类可以借助它来认识客观世界和人类自身。认识功能中包括了教育功能和支持科学研究的功能。经济功能:信息资源所具有的多种经济特性使之具有多种经济功能,如直接作为商品出售,替代其他资源,提高经济决策水平和运作效率,降低交易风险等。政治功能:信息就是权力,可通过控制信息来获得权力或巩固权力。信息资源还是政治斗争和外交斗争的重要武器。军事功能:这是人类最早认识到的信息资源的功能。“知己知彼,百战不殆。”信息资源从来都是军事斗争和战争不可缺少的重要武器。娱乐功能:有不少信息资源可供人类日常生活中休闲娱乐使用,有些信息资源就是专为休闲娱乐而生产的,而且这类资源越来越多,增长迅速。另外,在发挥其娱乐功能的同时,还有可能实现其认识功能或经济功能。8.2.4信息资源的分类按信息运行机制和政策机制不同分类政府信息资源商业信息资源公益信息资源按信息增值状况分类基础性信息资源增值性信息资源政府信息资源:政府拥有的,包括由政府收集和生产的信息,即在政府业务流程中产生的记录、数据、文件内容;为政府收集和生产的信息,即政府为业务流需要从外部采集的信息。商业性信息资源:由/为商业机构或其他机构以市场化方式收集和生产的,以赢利为目的的各种信息资源。公益性信息资源:进入公共领域的,由公益性信息机构管理和提供的信息资源,包括教育、科研、文化、娱乐、生活等领域里使用的公益性信息。

按信息增值状况分类基础性信息资源:机构业务流程中产生的,未经过加工或加工程度较低的,保证各行业和机构正常运作必不可少的信息资源。增值性信息资源:在基础性信息资源的基础上经过增值、加工程度较高的信息资源。

9科技文献科技文献就是记录有科学技术信息或知识的一种载体,是人们从事科学技术活动的劳动成果的表现形式之一。1)科技文献的主要社会功能:信息传递科学评价知识积累教育2)科技文献的介质形式印刷型文献缩微型文献声像型文献机读型文献(数字化信息资源)3)科技文献的结构等级一次文献(primarydocument)。是指作者以本人的研究成果为基本素材而创作(或撰写)的文献,无论创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。一般,一次文献记录的信息比较具体、详尽和系统化。按文献中信息量的变化情况来划分,可以将全部科技文献划分2个结构等级,即一次文献和二次文献。二次文献(secondarydocument)。是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。二次文献习惯上也称为第二手资料。它一般包括:目录、题录、文摘、索引、百科年鉴、手册.名录,等等。三次文献(tertiarydocument)。是指对有关的一次文献和二次文献进行广泛深入的分析研究之后综合概括而成的产物,具体包括各种述评、综述或进展性出版物以及文献指南(或书目指南)等。将科技文献划分成2个或3个结构等级,有助于明确信息机构的任务性质和范围。同时,对指导读者更好地利用文献,也有一定的意义。当然,我们也应当看到,由于划分标准本身具有相对性和某种模糊性;所以,我们只能近似地把某一文献划入其中某一个等级。科技文献经过加工、压缩,从一次文献到三次文献,使科技文献由博而约,由分散到集中,由无组织到系统化。科技文献与科技信息的关系:科技文献并不是科技信息的“源”,而是科技信息的“流”。科技信息的“源头”是自然界本身,是人类认识世界和改造世界的社会实践本身;而科技文献只不过是使科技信息得以记录、传播的一种信息载体,是科技信息在传递过程中的一种存在方式。科技文献与科技信息的关系是一种载体与信息的关系。然而,对信息使用者来说,科技文献的确又是一种非常重要的、间接的信息来源。9.1科技图书科技图书大多是对已发表的科研成果、生产技术和经验或者某一知识领域系统的论述或概括,它往往以期刊论文、会议论文、研究报告及其他第一手资料为基本素材,经过作者的分析、归纳、重新组织而编写成的。不少科技图书的内容还包含一些从未发表过的研究成果或资料。科技图书的特点是:内容比较系统、全面、成熟、可靠,有一定的新颖性;但编辑出版时间过长,传递信息的速度太慢,包含的内容一般只是反映3-5年以前的研究水平。科技图书是综合、积累和传递科技知识,教育和培养科技人才的一种重要手段。它可以帮助人们比较全面系统地了解某一特定领域中的历史和现状,可以将人们正确地领入自己所不熟悉的领域,还可以作为一种经常性的查考工具。9.2科技期刊定义:“一种以印刷形式或其他形式逐次刊行的,通常有数字或年月顺序编号的,并打算无限期地连续出版下去的出版物”(ISO3297-1986)。广义的期刊则包括一切定期刊行或不定期刊行的连续性出版物(serials),如杂志、报纸、年度报告、年鉴、丛书以及学会的会议录、学报和纪要等。经过300多年的发展演变,科技期刊类型越来越多。不同类型的期刊,其学术地位和信息价值往往差别很大。科技期刊具有以下特点:数量大、品种多;内容丰富多样;出版周期短,报道速度较快;发行、流通面很广泛;连续性强,伴随着相应的学科领域发展、前进。科技期刊在科学发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论