★ 第四章 信息组织讲解_第1页
★ 第四章 信息组织讲解_第2页
★ 第四章 信息组织讲解_第3页
★ 第四章 信息组织讲解_第4页
★ 第四章 信息组织讲解_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【本章提要】 本章主要讲述信息组织的基本内容与基本过程。在了解了信息组织的概念内涵的基础上,明确了信息组织的对象、原则及功能;在此基础上,围绕着信息组织的过程,从广义的角度讨论发信息搜集的方法与原则、信息外在形态的描述与内在特征的提示原理、信息存储的方法、信息分析的主要技术及信息服务等内容;针对网络电子住处资源不断增多的现实,对其描述与揭示与为当前理论与实践界重点关注的问题。本章从元数据的概念出发,讨论了元数据的基本概念、类型、功能、结构、应用等问题,并用实例向学习者进行了展示。【学习目标】1、信息组织的概念、原则及其功能;2、信息组织的过程;3、信息搜集的方法及其原则;4、信息描述与揭示的基

2、本原理;5、信息存储的方法;6、信息分析的方法;7、元数据的概念、类型、功能及其结构。【学习指南】本章的重点是第1节、第2节。【预习思考题】1、什么是信息组织?信息组织应遵循的原则有哪些?为什么要进行信息组织?2、信息组织的广义与狭义过程各包含哪些内容?3、如何搜集一手信息和二手信息?搜集信息时应遵循哪些原则?4、如何描述不同类型的信息的外在特征?描述的方法主要有哪些?在不同的信息载体发展阶段,人们所使用的描述方法产生了哪些变化?5、如何揭示信息的内在特征?揭示的方法主要有哪些?6、网络信息资源的描述与揭示对传统方法提出了哪些挑战?如何描述与揭示网络信息资源?7、传统与现代时期的信息存储方法各

3、有哪些?发生了什么样的变化?8、什么是信息分析?信息分析的主要方法有哪些?9、什么是元数据?元数据有哪几种主要类型?元数据具有哪些功能?元数据的结构是怎样的?10、试述元数据在人类信息组织活动历史中的名称、形态、功能的变化。 第一节 信息组织的基本问题本节内容一、信息组织的含义与目的二、信息组织的对象范围分析 三、信息组织的功能四、信息组织的原则 明确信息组织的基本问题是做好信息组织工作的基础。在信息组织工作开展之前,首先要了解信息组织的目的与功能、做好信息组织工作应遵循的原则等基本问题。一、信息组织的含义与目的1、信息组织的定义:信息组织也称信息有序化或信息整序,是根据信息资源检索的需要,利

4、用一定的科学方法和规则,通过对信息外在特征和内容特征的分析、选择、标引、处理,使其有序化,从而保证用户对信息的有效获取和利用,实现信息的有效流通和组合。含义:从此定义中可以看出,信息组织的前提是信息资源检索的需要,保证是有一定的科学规则和方法,对象是根据检索需要而采集的各种类型的信息,手段是分析和处理信息的外在和内容特征,目的是保证用户的有效获取和利用。这里包含两层意思:一是序化,即是整序,把杂乱无序的事物整理为有序的活动;二是重组,即信息开发,是信息组织的深化和优化,它是把无序的信息整理为有序,进而重组激活,挖掘信息潜在价值,使信息得到充分有效的利用,满足用户各层次、多种类需求的过程。信息的

5、重组是通过不同的新思路,使信息建立不同的新联系,通过思维加工使信息功能放大,实现更大的价值,通过重组激活,才能充分有效地被用户吸收利用,产生相应的社会效益和经济效益。信息管理的目的:信息组织是信息管理的重要活动,是沟通用户和信息的管理“桥梁”的“桥基工程”。信息管理的目的是解决日益增长的信息需求和相对滞后的信息服务的矛盾,信息组织是解决这一矛盾的关键环节。通过信息组织活动对信息进行序化和整理,从而达到甄别信息、精化信息、重组信息的作用,方便用户对各种类型信息资源的检索和利用,最终实现其有益于社会的目的。二、信息组织的对象范围分析1、信息的外在特征和内容特征信息的外在特征就是指信息的物质载体所反

6、映的特征,构成信息载体的外在的、形式的特征,如信息的物理形态、题名和责任者、信息的类型、信息生产和流通状况等方面的特征。信息的内容特征就是信息所包含和承载的具体内容,也即通过信息载体传递和交流的具体信息内容。信息的这种特征共同统一于信息本身,也是信息组织的基本对象和管理依据。信息组织的对象可从不同的层面来划分和理解,对每一不同层面的对象使用的组织方法也不相同。(一)信息内容层次的组织信息内容层面包括叙述层、含义层、效用层三个层面,它们分别对应着语法信息、语义信息和语用信息。叙述层信息是按照语法规则从信息编码中摄取表面状态的信息而成,叙述层信息组织往往采用号码法、物名法、引证关系法、时序法、地序

7、法等;含义层信息是以叙述层信息为基础或现象的深层信息,其组织多采用分类法或主题法;效用层信息是指信息所表述的内容的价值与效用,其组织采用权值或逻辑序化等方法。(二)信息加工层次的组织信息依其产生的先后与组织加工的深度可分为零次信息、一次信息、二次信息、三次信息。(三)信息载体的组织信息的存在必然要依赖于一定的载体,潜在信息以大脑为载体,现实信息以口语、体语、文献、实物为载体表现出来。这时信息组织大致可分为:动态信息组织(包括对口语、体语、实物等信息的组织)、文献信息组织、数据组织、网络信息组织。(四)信息学科内容的组织按信息的内容区分,信息组织可分为政务信息、军事信息、经济信息、科技信息、管理

8、信息等不同领域的信息组织,多成为行业性的信息资源建设或行业性网络信息资源建设的重要部分,进而形成各自信息系统、行业网络或网络站点的数据库等。三、信息组织的功能信息组织在信息管理流程中处于“承上启下”的地位。“承上”是指在信息采集的基础上进行,也即在一定的信息范围内进行;“启下”是指为信息传播和利用创造有利条件,也即提供信息传播和利用的信息组织成果。信息组织功能主要表现为:第一,基本功能全面揭示和再现信息的特征,科学反映和描述信息的特色。信息组织通过一定的方法表征信息的外在特征和内容特征,并根据这些特征将信息进行聚类和体系化,达到集中相关信息和相同信息、反映不同信息的差异的目的,使信息集合从一种

9、自然汇集的无序状态或经过信息有目的的采集活动形成的初步有序状态过渡到完全的有序状态中。第二,增值优化功能信息单元、数据依据逻辑方法再现和重组的过程是一个序化增值过程。信息经过一定的方法进行组织后形成索引、文摘、综述等二、三次信息,信息被再现和重组后得以浓缩,单位信息的价值得到了提升,信息单元之间的联系也得到了优化重组,所以说信息组织具有增值优化功能。第三,目标功能有效减除或减少信息之间的干扰,准确控制信息的运动方向,使之与特定用户需求相结合,从而方便有效地为用户提供服务。信息组织可以降低信息集合的混乱程度,使信息的各种特征特别是内容特征得以充分地显示,有利于信息的有针对性的提供,也有利于用户的

10、有针对性的选择,加强了“特定用户一特定信息”的联系,并且使用户能够多途径查找信息,也使信息能够多途径展示特色。因此,从总的方面看,信息组织就是为用户的信息需求满足和信息的使用价值实现提供有利的条件和方法,形成一系列经过组织化和序化的信息成果以供利用。第四,社会功能规范、控制信息流向的社会目标。世界、国家乃至各行业的目录控制(包括网络信息的目录控制)、搜索引擎及导航库、网站栏目对网络信息的筛选和过滤、信息资源评价、搜索引擎评价与网站评价,这些方法与手段都是在规范和控制信息的流向。实现一定的社会目标。四、信息组织的原则在信息组织中,我们必须坚持以下基本原则。(一)客观性原则信息组织中进行描述和揭示

11、的基本依据就是信息本身(the item 0btained),因此,我们描述和揭示信息的外在特征和内容特征必须客观而准确,要根据信息本身所反映的各种特征加以科学地反映和序化,形成相应的信息组织的成果。客观性原则率先确定了信息描述和揭示的数据来源必须是客观存在的信息本身。同时,客观性原则也为我们具体进行信息组织工作提出了相应的要求,要完整地、全面地、精确地反映信息的客观特征,就必须建立在对信息本身客观地了解和判断的基础上。另外,信息组织的客观性原则还要求我们不断跟踪信息源的发展变化和信息组织技术的发展变化,使信息组织与条件变化和环境变化保持客观一致性。(二)系统性原则系统性的信息组织工作为实现其

12、整体目标奠定基础,其实质即为协调。为实现信息组织的系统性,我们必须把握四个关系:一是宏观信息组织和微观信息组织的关系。二是信息组织部门与其他部门的关系。三是信息组织工作的各个环节之间的关系。四是不同信息处理方法之间的关系。(三)目的性原则信息组织具有鲜明的目的性,必须充分围绕用户的信息需求开展工作,必须充分注意信息机构的目标市场的需求状态及其变化特征。信息管理的一切环节都必须以“用户第一”为宗旨,信息传播及其效果如何在很大程度上是由信息组织水平所决定的。(四)现代化原则信息组织的现代化主要表现在两个方面,一是信息组织的思想观念现代化,二是信息组织的技术手段现代化。信息组织的思想观念现代化集中体

13、现在信息组织的标准化。信息组织的标准化主要体现在信息组织工作的统一性、信息组织方法的规范性、信息组织系统的兼容性和信息组织成果的通用性。信息组织的标准化是整个信息交流和管理的标准化的重要组成部分,主要包括:基本术语标准,有关信息技术标准(如信息交换格式、程序设计与数据库语言、网络标准与协议、信息分享和信息传输格式等),信息组织技术标准(如信息描述规则、信息代码、信息标引规则、信息组织成果编排规则等),其他相关标准。为此,信息领域的若干国际性和国家性标准组织已经制定和实施了一系列有关信息组织工作的标准,为促进信息组织的整体化、科学化发展创造了良好的条件。(五)方便性原则方便性原则,即采用用户认可

14、和习惯的方式。这也是以用户为中心的信息组织工作所要求的。信息组织的目的就是为了把信息与知识激活,让人们更加有效地利用信息,开发出信息的价值,所以信息组织工作要紧密地配合用户对信息的利用环节,最大限度地方便用户。(六)重要性递减原则即依据信息的重要程度序化信息,通常的做法是突出重要信息使其处于醒目位置,而将其他次要信息置于不显著的相应位置。这个原则是根据用户查询信息的心理规律提出的。 第二节信息组织过程及其内容本节内容一、信息采集二、信息描述 三、信息揭示四、信息存储 五、信息分析六、信息服务 信息组织是信息管理中的重要组成部分。从狭义上说,单纯指信息整序,即利用一定的科学方法,通过对信息外在特

15、征和内容特征的分析、选择、标引、处理,从而将无序的社会信息流转换为有序的社会信息流的过程。但从广义上说,信息组织的内容范围非常广,从信息采集、信息描述与揭示、信息存储、信息分析一直到服务的这个完整的过程中,都渗透着信息组织的活动。信息采集是信息组织的前提;信息描述是对信息的初级组织;信息揭示是核心,是对信息的中级组织;信息分析是深化,是对信息的高级组织;信息存储是对信息及其他信息组织的成果的空间组织;而信息服务则是宗旨,是信息组织这个微观信息管理过程重要环节的目标。虽然这几个方面并不是严格意义上的逐次推进的几个阶段,但它们之间既相互独立而又保持联系,共同构成信息组织的完整内容和全部意义。一、信

16、息采集信息的采集,简而言之,就是信息的选择和提取的过程,是根据不断变化的用户需求从信息源中搜索、选择和提取的连续过程。它是信息组织的前提,是开展其他信息工作的物质基础,采集到信息的质量好坏、数量多少往往直接影响和决定着信息工作的效益。信息采集要遵循一定的原则:一是准确性原则,即准确是信息的生命力;二是针对性原则,即信息采集的目的要明确,适合用户的需求,并据此确定信息采集的范围和重点;三是及时性原则,即以最短的时间、最快的速度搜集需要的信息资源;四是系统性原则,即指信息在时间、空间、内容的采集上要做到全面、完整;五是预见性原则,要求信息采集者不仅要研究用户的当前信息需求,还要研究用户未来的信息需

17、求;六是计划性原则,要求制定科学合理的采集计划,有目的有步骤地采集信息。信息资源的采集方法主要有:一是采购法,常用方法包括预订、现购、邮购以及代购等方式;二是交换法,通过此方法在一定的时间、空间范围内与其他信息机构交换信息资源,可以获得一些不易获得的非卖品或内部资料,加强信息的交流,扩大协调合作以及学术交流;三是调查法,主要用于获取潜在信息资源和关于现实信息资源的各种信息;四是网络法,即通过互联网检索采集信息的方法。二、信息描述信息描述是根据一定的描述规则和技术标准,对信息的外在特征和部分内容特征进行分析、选择、记录的过程。(一)信息描述的原则与标准信息描述必须客观反映信息资源的特征,严格遵循

18、一定的描述规范进行操作,应做到准确、规范、完备。信息描述的对象十分广泛,目前比较成熟的是针对文献信息的描述,也即文献编目,正在迅速发展的有网络资源编目,其他还有档案编目、博物馆藏品编目等等。文献资源编目是采用ISBDs的著录标准,它将描述内容主要分为八大描述项目,每个描述项目又由若干描述单元构成。ISBDs模式已得到国际性认可。随着网络资源编目的出现与发展,元数据的概念被重提和强调,最后一节中详细介绍。(三)信息描述的一般程序第一,查重,就是在描述信息资源前,首先要确定该信息资源是否已经收入系统,可以避免不必要的重复劳动和信息的冗余。第二,描述,即采用一定的描述规范,根据不同信息资源的特点进行

19、处理,如文献资源编目要根据ISBDs和相应的著录规则来进行。第三,复核并输入系统,即检查所进行的描述是否符合要求,即检索描述项目是否完备、准确,然后将描述结果输入到数据库中。信息描述在信息组织中具有非常基础的地位,信息描述是信息揭示、信息分析和信息存储的重要前提。信息揭示必须充分把握信息的一切特征,信息描述是掌握信息特征的重要手段,信息分析的实质是信息重组和再生,因而不能不利用信息描述及信息揭示的基本成果;信息描述和信息揭示所辨识的信息特征为信-基存储提供了排列的基本依据。信息描述中使用的信息组织语言主要用自然语言或其代码化作为信息特征的描述语言:用人工语言(即描述中使用的标识符号和著录格式)

20、来使描述内容体系化。三、信息揭示信息揭示是信息组织的中级形式,即对信息的内容特征进行深层揭示并转换成主题标识,形成一个科学的逻辑的概念标识系统。在本质上,信息揭示就是要形成一个“信息实体概念标识矩阵”,即将信息主题通过一定的方法和工具转换成系统化的概念标识,其工具主要就是我们通常所说的信息组织语言。(一)信息主题在信息揭示中,“主题”是一个基本概念,也是一个非常宽泛的概念。主题即信息主题,是指某一个具体信息实体所介绍、论述、研究、说明、表现的对象或问题。完整的主题是由若干概念因素构成的,各个主题概念因素在构成主题的功能方面具有结构性和区别性,一般可以区分为五个方面,即PMEST。P指Perso

21、nality,即本体;M指Matter,即物质;E指Energy,即动力;S指Space,即空间;T指Time,即时间。主题的概念因素的分析方法较多,除了阮冈纳赞的PMEST区分法外,还可以区分为“对象一方法一作用-一条件一生成物”,或“物体一现象一条件一过程一属性一空间一时间一材料一结果一对象”,凡此等等,说明了主题的复杂性和可分析性。(二)信息揭示的一般程序第一,主题分析,即对信息所包含的主题的分析。它主要包括三个方面:一是主题数量分析,该信息包含多少个主题;二是主题结构分析鄹每个主题有多少个主题概念因素;三是主题内容分析,具体说明该信息包含了什么主题,各个主题有哪些概念因素。第二,主题标

22、引,就是将主题分析结果转换为主题标识。有三种基本方法:一是抽词标引,又称为自由词标引,从信息实体中直接抽取未加规范化的能代表该信息主题概念的若干词作为主题标识,是自然语言在信息揭示中的运用方式;二是赋词标引,根据规范化的主题词表即一种语词型人工语言将主题概念转换为主题标识,这时的主题标识以词或词串的形式出现;三是分类标引,根据专门的分类表即一种非语词型人工语言将主题概念转换为主题标识,这时的主题标识以分类号或代码的形式出现。这三种基本方法都是在建立信息系统数据库前以人工或自动的方式进行的,还有一种主题标引方式被称为无标引或后控标引,即不对信息进行利用前的标引,而在利用过程中对用户提问进行主题概

23、念向主题标识的转换,或者把这些转换结果加以积累形成事后标引。根据对信息主题的揭示程度,主题标引方式可以有四种策略:一是整体标引,即对某一信息实体的整体主题用一个标识来进行概括性标引;二是全面标引,即对某一信息实体的所有局部主题或不同主题及其主题概念因素分别进行详细标引;三是补充标引,即对某一信息实体的整体主题作概括性标引外,对部分局部主题及其主题概念因素单独进行标引,又称为分析标引;四是重点标引,即对某一信息实体中与信息系统性质、任务、目的有关的主题部分进行标引。第三,检验审核,即对上述主题分析和主题标引的过程和结果进行检验和审核,最后正式形成信息揭示的结果。(三)信息揭示的语言信息揭示中信息

24、组织语言发挥了重要的作用,信息组织语言的具体特点决定了信息揭示的具体方式。信息揭示中信息组织语言的应用主要包括两个方面。1自然语言在信息揭示中的应用自然语言在信息揭示中的应用,主要以下列方式发挥作用:一是关键词法。一般仍把它作为人工语言的主题型语言的一种,实质上是一种以自然语言为主的准人工语言;二是自由词标引或利用自由词标引作受控标引的补充形式;三是全文标引和全文检索;四是自然语言以入口词形式辅助受控人工语言;五是受控人工语言作为主要控制手段,与关键词法结合使用;六是后控标引作为主要控制手段,与关键词法结合使用;七是自动分类,通过计算机对词频和语词共现频率的统计分析,判别出若干最能表达主题内容

25、的语词,然后将其与语词类集用数学方法进行相似性比较,确定该信息实体所属的代表某个语词类集的类,从而使相关信息聚类。2人工语言在信息揭示中的应用人工语言在信息揭示中应用,这种人工语言就是信息检索语言。信息检索语言主要按其构成原理分为三大类型:第一类,分类型信息检索语言(分类法)。它是用分类号来表达各种概念,将各种概念按学科性质进行归类和系统排列。分类法又可分为主要应用概念划分与概括方法的等级体系型分类法(体系分类法)和主要应用概念分析与综合方法的分析一综合型分类法(组配分类法)两大类。用分类法揭示信息必须有专门编制的分类表。分类表是运用分类法的原理编制的专用信息揭示工具。目前我国主要采用的信息分

26、类表有:中国图书馆图书分类法(推荐国家标准)、等综合性分类表和一系列专业性分类表。第二类,主题型信息检索语言(主题法)。它是用经过规范化处理的语词来表达各种概念并按字顺方式排列。主题法又可分为标题词型主题法(标题法)、单元词型主题法(单元词法、元词法)、叙词型主题法(叙词法)、关键词型主题莹(关键词法、键词法)四大类。其中,标题法、元词法和叙词法要对自然语言的语词进行规范化形成主题标识(虽然在形式上与自然语言的语词没有什么区别,但它已是经过转换的“标识”而不是“语词”),键词法则对自然语言不做或只做较少的规范化处理。标题法是用一个完整的标题直接表达一个具体的主题概念,因而标题在标引之前已由标题

27、表固定下来,是一种“先组式语言”。元词法和叙词法则是由若干检索标识在检索时才通过组配固定下来表达一个具体的主题概念,在元词表和叙词表中的只是一个个独立的主题概念因素,故被称为“后组式语言”。元词法与叙词法的主要区别在于元词法对概念的分析和综合是在字面意义上进行的,叙词法则是在概念层次上的“概念组配”。键词法则是直接对信息的题名、文摘等部分进行简单的词汇控制后,把对于表达主题内容有实质意义和查检意义的关键词加以规律化排列的揭示方法。我国已编制和使用了、航空科技资料主题词表等大量的综合性和专业性主题词表。目前,各种信息检索语言,包括分类法系统和主题法系统内部和两者之间的互相渗透日趋明显。第三类,代

28、码型信息检索语言(代码法)。它针对事物的某一方面特征用某种代码系统来加以标引和排列,其实质是一种分类法的特例。四、信息存储信息存储是将经过加工整理序化后的信息按照一定的格式与顺序存储在特定的载体中的一种信息组织活动。信息存储的目的就是为了便于查找、定位和检索信息。各种各样的信息检索类工具书、光盘检索系统、网络检索工具等都是信息存储的方式。信息存储于各种检索系统中,就意味着信息描述与揭示过程的结束,也意味着信息检索等狭义信息管理阶段的开始。在传统印刷型媒体阶段,人们经常采用分类组织与主题组织两种方法来进行信息的组织。为了更加高效地组织信息,还辅之以其他次要方法,如字顺组织法、时空组织法等。分类组

29、织是依据分类法的要求,依据信息内容给每一个信息进行学科的归类,并给予一个代表其学科内容的类号。在组织信息时,依据这个类号进行排列。这种方法历史最悠久,是对知识分类体系的反映。主题组织则与分类组织不同,它不是从学科的角度出发考虑信息的组织问题,而是从概念的角度出发,将位于不同学科的、表达相同或相近概念的信息统一在一起,而这个概念是词或词组,没有歧义性,所以说,这两种方法相辅相成。将表达信息内容的概念再根据一定的规则排列起来,以便于人们的查找与组织,就是主题组织法。字顺组织法是一种信息组织的辅助方法,它不能单一用于组织信息。如分类号或概念依据英文字母或汉语拼音的顺序,把它们组织排列起来,就是使用了

30、字顺法。国外也称之为“字典法”。时空组织法也是一种信息组织的辅助方法,它是按照时间和空间的要求。将信息加以组织。如某年鉴、报纸、年度统计报告等,就要按照年代的顺序加以组织;再如地方志等,就要以地理名称为依据加以组织。网络信息的组织因其表现及生成方法与传统信息资源不一致,所以出现了一些新型的信息组织方法,如超媒体组织方法、主题树方法、数据库方法、自由文本方法、文件方法等。 超媒体技术是超文本与多媒体技术的结合,它是将文字、图表、声音、图像、视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。人的思维方式是跳跃式、非线性的,而不

31、是像传统信息组织的直线性方式,所以说,超媒体组织方法更加符合人们的思维习惯。主题树方法就是将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直到找到所要的信息线索,并通过信息线索直接找到相应的网络信息资源。这种主题树的方式类似于传统的分类组织方法,所不同的是传统的分类组织方法更加严谨、科学、规范,它面向学科;而网络主题树方式则面向网络信息类型,更多地反映了人们所关注的社会信息,具有片面性、实用性,缺乏科学性;其用词也不是很规范;揭示的信息因为更新太快,有时可用性差。数据库方法主要是针对已经结构化了的二次信息的组织方法,它将事物对象的共同

32、属性抽取出来作为数据库的字段,众多字段共同说明事物对象的特征。每个对象的多方面特征描述(字段)构成一条完整的记录,众多记录(对象)形成一个数据库文件。而数据库文件的组织方法又由计算机根据文件组织的方法加以管理。自由文本方法主要用于全文数据库的组织,是对非结构化的文本信息进行组织和处理的一种方式。全文数据库是用自然语言揭示知识单元,根据全文情况直接设置检索点。它明显不同于二次信息的数据库组织方法。文件是计算机保存与处理结果的基本单位,数据在计算机中全是以文件的形式保存的。它以其操作简单方便,更适应非结构化信息(如图形、图像、图表、声音等)的处理,而被大量运用到网络信息资源的组织方法中来。如FTP

33、的协议和服务,就是帮助人们利用以文件方式组织的信息资源的。在上述几种方法中,主题树方法与数据库方法属于针对二次信息的信息存储方法,而超媒体方法、自由文本方法与文件方法更适用于非结构化的一次信息存储。五、信息分析信息分析是信息组织过程中必不可少的重要一环,在这一过程中,信息的-加工与组织将会得以深化,为信息的利用提供更高层次的保障。信息分析是通过已知信息揭示客观事物的运动规律的过程。信息分析的主要任务就是运用科学的理论、方法和手段,在对大量的(通常是零散、杂乱无章的)信息进行搜集、加工整理与价值评价的基础上,透过由各种关系交织而成的错综复杂的表面现象,把握其内容本质,从而获取对客观事物运动规律的

34、认识。信息分析主要包括课题选择,信息搜集,信息整理、评价与分析,产品制作、评价和利用等过程。当前,信息分析工作大致可分为决策研究(主要是为各级政府机构进行科技政策、发展战略研究及专题调研等)、咨询服务(多半是为企业提供市场咨询、技术咨询和决策咨询等,即属于竞争情报研究的范畴)及编译报道等三个方面。在形式上,前两种或以研究报告和参考资料,或以咨询建议书的形式提供给用户;而编译报道则多半以期刊的形式向读者发行。(一)信息分析的基本功能信息分析对其所研究的对象来说具有整理、评价、预测和反馈四项基本功能。整理功能是对信息进行搜集、组织,使之由无序变为有序;评价功能是对信息价值进行评价,以去粗取精、去伪

35、存真、辨新、权重、评价、荐优;预测功能是通过对已知信息内容的分析获取未知或未来信息;反馈功能是根据用户的实际消费效果对预测结论进行审议、评价、修改和补充。一般来说,这四项基本功能是密切相关的。信息整理和评价是信息分析的两项基本性功能,是为预测和反馈功能的实现做准备的;预测和反馈是信息分析的两项特征性功能。是信息整理和评价功能的进一步拓展和延伸。(二)信息分析的主要方法信息分析基本上通常采用的信息分析方法有比较法、分析综合方法、推理法、专家调查法、计量法、层次分析法、回归分析法、时间序列分析法等。1比较法有了比较才有鉴别,判断一个信息是否准确,分析一条信息价值的高低优劣,首先用到的就是比较法。比

36、较是人类认识客观事物、揭示客观事物发展变化规律的一种基本方法。它是对照各个事物,以确定其间差异点和共同点的逻辑方法。比较法应用的范围可大可小,大到决策方案,小到只言片语,都可用比较法加以研究。比较可以发现问题、提出问题、推动研究发展。比较常常是分析、综合、推理研究的基础,也是信息调研工作中一种最常规的和基本的方法。比较法适用对象广泛,常见的有:国家或公司的水平、能力、技术发展特点的比较;某一学科或专业知识与技术发展的历史和现状的比较;市场销路的比较;决策方案的比较等。总的来说,通过各方面信息的分析,可以总结经验教训,对比水平、速度,了解薄弱环节,确立发展方向,寻找最佳方案和改进措施。2分析综合

37、法分析就是把客观事物整体按照研究目的的需要分解为各个要素及其关系,并根据事物之间或事物内部各要素之间的特定关系,通过由此及彼、由表及里的研究,达到认识事物的目的的一种逻辑方法。分析通常采用的步骤是:明确分析的目的;将事物分解为若干个相对独立的要素;分别考察和研究各个事物以及构成事物整体的各个要素的特点;探明各个事物以及构成事物整体的各个要素之间的相互关系,并进而研究这些关系的性质、表现形式、在事物发展变化中的地位和作用等。它具体还包括因果分析、表象和本质分析、相关分析、典型分析等方法。综合是同分析相对立的一种方法。它是指人们在思维过程中将与研究对象有关的片面、分散、众多的各个要素联结起来考虑,

38、以从错综复杂的现象中探索它们之间的相互关系,从整体的角度把握事物的本质和规律,通观事物发展的全貌和全过程,获得新知识、新结论的一种逻辑方法。它的基本步骤是:明确综合的目的;把握被分析出来的研究对象的各个要素;确定各个要素的有机联系形式;从事物整体的角度把握事物的本质规律,从而获得新的知识和结论。它具体包括简单综合、系统综合和分析综合三个类型。3推理法推理是由一个或几个已知的判断推出一个新判断的思维形式,就是在掌握一定的已知事实、数据或因素相关性的基础上,通过因果关系或其他相关关系顺次、逐步地推论,最终得出新结论的一种逻辑方法。任何推理都包括前提、结论和推理过程三个要素。在信息分析中,经常采用的

39、信息推理主要有常规推理、归纳推理、假言推理三种形式。4专家调查法专家调查法是在调查题目确定后选定要调查的专家名单,然后将调查提纲以及背景材料等分别寄给被调查的专家本人,由每个专家对调查的问题经过研究后,按提纲要求用书面形式做出回答。调查组织者收齐专家们的意见后,将他们的回答综合归纳起来,进行初步的统计处理,然后再匿名分别寄给各位专家,并请各位专家在这些意见的基础上审核,补充或修改自己的意见,并以书面形式做出第二次回答。调查组织者可根据第二次意见统计,汇总出最后的结论。如果问题复杂,也可以反复多次,使结论更加明确和集中。一般经过三四个循环就可以得出预测结果。这种方法有一些明显的优点:被调查人有比

40、较充足的时间去收集信息、查阅资料,对所回答的问题能做细微的研究,可以通过阅读前次调查的结果,了解别人的意见,启发自己的认识,修改与完善自己的观点。而且由于匿名介绍别人观点,故考虑问题时不受知名专家学者的意见或领导意图等束缚,便于敞开思想,独立思考,出现对立性观点时,能避免冲突。由于回答问题尽量表格化,因而可以把一般定性问题用定量的方法处理。这种方法在国内外已经广泛用于军事、科技、人口、管理等方面的研究分析之中。专家调查方法主要有德尔菲法、头脑风暴法和交叉影响分析法三种类型。信息分析方法多种多样,在实际工作中可以根据不同的内容要求、使用范围来确定一种或几种具体的分析方法。通常情况下,不能仅仅使用

41、单一的方法,而应该多种方法并举,以实现信息分析的目的,达到信息分析的要求。六、信息服务信息服务是信息管理的主要环节,也是信息管理的重要组成部分,应该说,它是信息管理的最终目标与归宿。因为,无论广义上的信息管理,还是狭义上的信息管理,它的基本宗旨还是为了更好、更高效地发挥信息资源的价值,充分利用好信息资源。上面所讲的各种信息加工的环节,都是为了更好地实现信息服务的初衷。所以说,信息服务作为信息管理的主要内容,受到了各层次信息管理主体的重视。有关信息服务的内容,我们有专门章节讲述。 第三节 元数据方案本节内容一、什么是元数据二、元数据的类型 三、元数的功能四、元数据的结构五、元数据在不同领域的应用

42、六、元数据示例 一、什么是元数据 元数据(Metadata)这一名词出现于网络时代,很难清晰而准确地定义它。普遍认为:元数据是指用于帮助识别、描述和定位网络化的电子资源的结构化数据,通过它可以揭示各类电子文献的内容和其他特征以方便检索,能够提高信息的利用价值,其典型的操作环境是网络环境。虽然说它是网络环境下的产物,但它的理念却不是新的,图书情报界的编目格式就是元数据的一种,只是它不叫元数据罢了。从字面上看,“meta一”是“在其中,与在一起。在之后”的意思,它取自希腊语,表示一种更高的次序或更基本的属性。每一个元数据格式通常都会包括三种特征:一组有限的元素、每一个元素的名称以及每一元素的意义。

43、可以说,元数据不是独立的数据,而是一种必须与其他数据结合在一起,起辅助作用的数据。元数据元素集合可以描述一种或多种信息资源,它与其所描述的信息资源之间存在着某种必然的联系。例如,图书馆书目记录就是元数据元素的集合,这些元素通过索书号与图书馆馆藏中的图书或其他文献连接起来;存储在HTML主页中的“META区域的信息就是元数据,它通过嵌入信息资源而达到与信息资源相联系的目的;索引数据也是二种元数据(虽然它不能称为非常好的元数据),它通过多种形式与信息资源连接起来。二、元数据的类型依据英国UKOLN(The UK Office for Library and Information Networki

44、ng,英国图书馆与信息网络办公室)的DESIRE(Development 0f an European Service for Information on Research and Education,欧洲研究与教育信息服务的开发)项目,从结构和语意方面来划分元数据,可以分为三类:第一类,简洁化格式。基于全文索引的独立格式,其最好的例证就是AltaVista、Lycos等所采用的格式。这些搜索引擎使用起来是很方便的,但如上文所述,其检索效率是很低的。第二类,复杂化格式。建立于国际标准之上,通常应用于较窄的领域,其最佳的例证就是MARC。这种格式很难被其他机构利用,如很少档案馆、博物馆使用MA

45、RC标识档案文献及展品。一般来说,复杂化格式需要经过专门培训的专业人员才能完成。第三类,结构化格式。它是对上述两种格式的综合,通常其结构不如复杂格式复杂。这种格式是最近几年才开发的,主要面向Internet应用,多针对特定的专业领域,但也有针对较广泛的应用领域的,而且正在形成正式的标准。从检索方面来说,它们多支持字段检索,在很大程度上提高了检索的精确度。这种格式的工作主体除专业人员外,更主要的是网络信息资源的作者、提供者、出版者、发行者以及网络服务提供商等,也就是说,结构化格式的应用更面向大众。 而美国Getty信息研究所(Getty Information Institute)的专项研究则根

46、据元数据的功能来划分其类型,分为以下五种类型。第一类,管理型元数据。在管理信息资源中利用的元数据。例如:采购信息,指该元数据描述的对象是由何人在何地何时采购的等信息;位置信息,指该元数据描述对象实体的物理位置;版本控制,指出该元数据的版本;等等。第二类,描述型元数据。用来描述或识别信息资源的元数据。例如:书目记录、查找帮助、资源间超链接的关系等。第三类,保存型元数据。与信息资源的保存管理相关的信息。例如:资源实体状况、保存资源的物理和数字版本中所作的处理等。第四类,技术型元数据。与系统如何行使职责或元数据如何发挥作用相关的元数据。例如:硬件和软件文献,数字化信息(如格式、压缩比例、缩放比例等)

47、,系统反应次数的跟踪,安全性数据(如密码、口令)。第五类,使用型元数据。与信息资源利用的等级和类型相关的元数据。例如:展览记录,使用和用户跟踪,内容再利用和多个版本的信息等。三、元数据的功能从其定义可以看出,元数据的主要目的就是通过准确地描述、评估信息资源来促进和提高信息检索,这就明确了元数据的基本功能:描述网络数据的内容;使网络中的数据便于搜索,有助于更准确地识别、定位和访问网络信息;帮助用户决定某些数据是否为其所需等等。其具体功能可概括为以下内容强第一,描述:根据元数据的定义,它最基本的功能就在于对信息对象的内容和位置进行描述,从而为信息对象的识别、存取与利用奠定必要的基础。第二,定位:由

48、于网络信息资源是虚拟的,因此,明确它的位置十分重要。元数据中包含有关网络信息资源位置方面的信息可确定资源的位置,促进了网络环境中信息对象的发现和检索。第三,搜索:元数据为搜索提供基础。在描述过程中,信息对象中的重要信息被抽出和组织在一定的语义关系内,为用户提供多层次、多途径的检索体系,使检索时更加方便,检索结果也更加准确,这就有利于用户识别重要的信息,帮助用户认识信息的价值,发现其真正需要的资源。第四,管理:支持信息资源的存储和使用管理,包括权限管理(版权、所有权、使用权)、数字信息管理、防伪措施(电子水印、电子签名)、使用管理等。第五,评估:元数据提供有关信息对象的名称、内容、年代、格式、制

49、作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准,即可对其价值进行必要的评估,作为存取与利用的参考。第六,选择:根据元数据所提供的信息,参照相应的评估标准,结合使用环境,用户便能够做出对信息对象取舍的决定,选择适合用户使用的资源。此外,从系统的角度审视元数据,元数据的功能还包括提供浏览及检索的功能、管理功能以及组合各个对象以及藏品的再呈现功能等。四、元数据的结构 元数据结构从功能上来说可分为内容结构、句法结构和语义结构。内容结构是对该元数据的构成元素及其定义标准进行描述,它包括描述性元数据、管理性元数据、技术性元数据以及复用性元数据。描述性

50、元数据是用于描述或标识数字对象的外在和内容特征的元数据,如资源名称、创建者、主题、内容描述、资源类型、出版者等项;管理性元数据是对数据对象及元数据本身进行管理的要求、规格和控制机制进行描述的元数据,如有效期、使用权限等。 技术性元数据是对数据对象制作、传递、使用或保存过程中的技术条件或参数进行描述的元素,如扫描分辨率、压缩方法、使用软件等。复用性元数据是该元数据集从其他元数据集中复用的元素,有可能需要对其语义范围和编码规则进行修订。句法结构定义元数据整体结构以及如何描述这种结构,如:元素的分区分层分段组织结构;元素结构描述方法;DTD描述语言;元数据复用方式。句法结构还可以定义元数据与被描述数据对象的捆绑方式,如:元数据与数据对象捆绑在一起;元数据独立于数据对象存在;元数据作为单独数据存在但以一定形式与数据对象链接。语义结构定义元数据的具体描述方法。它包括四个层次:元素定义(对元素本身有关属性进行明确定义);元素内容编码规则定义(描述元素内容时应采用的编码规则);元素语义概念关系(定义元素的具体含义,将它放在一个概念体系中来说明它的上下文关系,说明它与其他概念的关系,以明确元素在不同体系中的不同意义);元数据版本管理(元数据是动态变化的,所以要明确描述元数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论