情报科学的基本原理_第1页
情报科学的基本原理_第2页
情报科学的基本原理_第3页
情报科学的基本原理_第4页
情报科学的基本原理_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

情报科学的基本原理第1页,共48页,2023年,2月20日,星期四2.1离散分布原理

2.2有序性原理

2.3相关性原理

2.4易用性原理

2.5小世界原理

2.6对数透视原理

第2章情报科学的基本原理

第2页,共48页,2023年,2月20日,星期四2.1离散分布原理信息、知识和情报是以离散形式分布的,在离散分布基础上趋向集中。情报学需要研究如何用科学的方法获取情报密度最大的情报源,为用户情报需求提供最优服务由此离散分布原理实际上主导着整个情报活动,对其研究也将揭示情报学的奠基性的定律。第3页,共48页,2023年,2月20日,星期四2.1离散分布原理2.1.1原理的表现形式

内容单元以不同的方式从不同的角度分散于各种著作或不同形式的载体中。本质上是由知识体系自身的分化和综合决定的,与情报的生产、利用,情报的累积性、再生性、老化性以及对创造者的独立性有密切的关系。第4页,共48页,2023年,2月20日,星期四2.1离散分布原理2.1.2原理的研究成果——布拉德福定律

1.频次——等级排序法

按某一具体事项(如文章、作者,词等情报单元)在其主体来源(如期刊,作者集合或词的集合)中的出现频次按递减顺序排列起来,就会导出布拉德福分布。这种现象广泛存在与社会科学领域内,如城市人口分布,书籍按页分布等。

这实质上是情报离散分布基础上形成的核心趋势和集中取向,是“成功”累积的结果,也是“马太效应”的表现形式。第5页,共48页,2023年,2月20日,星期四2.1离散分布原理2.布拉德福定律定律的两个不足(1)对情报离散分布的机理研究得还不够深入。(2)对情报离散分布规律的研究还停留在宏观水平上即对期刊上发表的科学论文分散规律的研究,而在微观层次上对情报离散分布的研究—即在内容单元(而不是文献)和内在逻辑联系层次上的研究仍不多见。案例:埃格希和鲁索出版了《情报计量学引论》,在论及情报的分散规律时,仍然是以宏观层次的文献为基础的根本上混淆了哲学。第6页,共48页,2023年,2月20日,星期四2.1离散分布原理2.1.3微观层次的研究工作1.以实证的方式研究科学情报(信息)的分布

2.以实证的方式研究网络信息的分布3.分析信息离散分布形成的机理

通过这些工作,我们可以看到情报科学发展模式及其基本定律的一致性与稳定性。第7页,共48页,2023年,2月20日,星期四2.1离散分布原理

当一系列同类对象被人选择时,就会出现有的经常被选择,有的不常被选择。这种频度会反过来作为再次被选择的依据。普顿斯用累积优越性函数来描述这一过程。这便是情报分布中出现马太效应的根本原因。

布拉德福定律:著者都希望把他们的文章发表在本专业领域的、过去已经发表了大量高质量论文的这类期刊上。投稿数量增加,因而对文章的质量要求提高,期刊的威信也随之日益提高,便产生了一些带“核心”性质的期刊,这就是文献情报分布中的“集中”趋势。与此同时,有关这一学科的文章也在其他相关期刊上发表,便又产生了文献的分散现象。2.1.4信息离散分布或核心趋势的形成过程第8页,共48页,2023年,2月20日,星期四2.1离散分布原理1.布拉德福定律揭示的不仅仅是情报的离散分布,同时又揭示了离散分布基础上的集中取向和核心趋势。2.所创造的频次—等级排序方法和对马太效应的深刻解释都具有普遍意义。(1)频次—等级排序有两个明显的特点:依照对象的重要程度为序直接表示出分析的数据,提供丰富的信息,有助于认识事物的特征。频次—等级排序无需任何统计理论或概率假设为基础,就能对事件直接进行分析和解释,应用方便,不受理论约束。

2.1.5布拉德福定律的意义第9页,共48页,2023年,2月20日,星期四2.1离散分布原理(2)通过这种排序揭示的情报对象离散分布的反向趋势—集中取向(马太效应)更使人们看到,相互矛盾、对立的情报现象和情报过程实际上是高度统一的。第10页,共48页,2023年,2月20日,星期四2.2有序性原理

序是事物发展和进步趋向有序的基本结构形式,是事物组成要素之间的相互联系以及这种联系在空间时间结构中的表现。2.2.1情报结构的有序性情报结构无论是以自然系统存在还是以人工系统存在都具有某种“序性”。研究和揭示这种“序性”,是设计最优情报系统、提供最优情报服务的基础。情报结构的有序不仅是情报科学的基本原理,也是情报工作和信息服务追求的基本目标,因此,情报科学的基本任务就是要研究这种“序”的规律,揭示这种“序”的表现按照这种“序”来标引和组织知识信息,建立高效的情报结构。

第11页,共48页,2023年,2月20日,星期四2.2有序性原理

2.2.2情报结构的有序性来源1.情报创造过程的有序性:主观知识结构的有序过程情报在知识体系中的有序性结构并不意味着它能自动生成有序的情报检索系统,只是表明我们可以通过情报的有序结构研究情报的规律和组织,建设更有效率的情报系统。科学体系的有序性和人的创造过程的有序性。第12页,共48页,2023年,2月20日,星期四2.2有序性原理

2.知识体系自身的自组织功能导致有序性:客观知识系统的有序结构。3.情报作用的基本方程式

20世纪70年代中期,布鲁克斯曾提出描述情报作用的基本方程式:

式中,K[S]表示原有的知识结构;K[S+△S]表示吸收情报以后的知识结构;△I表示知识结构吸收的或增加的情报。该方程的意义是,原有的知识结构K[S],由于吸收了情报△I,变为K[S+△S]。新的知识结构形成是由于吸收情报的结果。

K[S]+△I=K[S+△S]第13页,共48页,2023年,2月20日,星期四2.2有序性原理布鲁克斯的基本方程不仅适用于主观知识结构(即波普理论中的“世界2”),同时也适合于客观知识结构(即波普意义上的“世界3”)。4.耗散结构理论(1)普里高津的“耗散结构”远离平衡态的非线性区形成的新的稳定的有序结构,称之为耗散结构。这种自行产生的组织性和相关性被称作自组织现象。所以这一理论又叫作非平衡系统的自组织理论。(2)开放知识系统熵变化方程ds=des十dis第14页,共48页,2023年,2月20日,星期四2.2有序性原理

式中des为系统与外界交换的熵流,dis为系统内部的熵产生。dis来源于知识系统(结构)中知识单元数目的增多,知识体系的复杂、冗余无序,知识的老化和陈旧等等

为了维护和提高知识系统的功能,要求ds<0,即必须des<0,且|des|>|dis|,也就是说,需要由外界向系统输入足够的负熵流。

情报对知识系统来说,是一种负熵流理论一个知识系统、知识增长过程实质上是输入情报使知识结构由无序走向有序或从一种有序结构演变为另一种有序结构的过程。第15页,共48页,2023年,2月20日,星期四2.2有序性原理耗散结构理论中,当负熵流输入时,系统只有远离平衡态才可能形成新的有序结构,在近平衡态时,新的有序结构不可能出现。情报结构的有序性充分体现了情报生产过程中的自组织机理,如知识生产中的引文系统、网络链接系统,RSS中的知识信息聚类,都说明情报的有序化自组织功能的存在。(3)耗散结构的条件第16页,共48页,2023年,2月20日,星期四2.2有序性原理

有序性原理表明无论是主观知识结构还是客观知识结构,也无论是通过自组织产生的情报结构还是人工建造的情报结构,情报单元一定是以开放系统形式存在的,而且唯有如此,情报才能得到有效积累和利用。布鲁克斯的“知识地图”。迄今还不能按知识结构自身的有序规则来建立情报系统。如果输入的情报与原有知识结构处于近平衡态,增加原有知识系统的知识量;当其与原有的知识结构处于远平衡态,就有可能形成新的有序知识结构,导致重大的科学发现。2.2.3自组织机理

第17页,共48页,2023年,2月20日,星期四2.3相关性原理

任何一种情报结构都是按一定规则相互关联的。研究和揭示情报相互关联(即相关性)的规律和规则,是有效组织和检索信息、知识、情报的基础。

Saracevic认为情报学自诞生到20世纪90年代末有三个重要的思想:信息检索、相关性、交互性。信息检索为信息处理过程提供了逻辑基础;相关性直接面向人类信息需求与评价过程;交互促成了人机之间的交流与反馈。2.3.1对情报学相关性的理解1.作为客体的信息(或情报)之间有着极强的相关性,这使得对信息和情报的组织成为必要和可能。

第18页,共48页,2023年,2月20日,星期四2.3相关性原理

2.信息检索过程是基于用户检索提问与所查询信息之间的相关度匹配而进行

3.情报的吸收和利用密切地依赖于背景知识,即相关程度的衡量情报科学中的相关性实际上存在于两个方面:一是用户的情报检索,另一则是客观知识体系的自组织建立起来的相关性。迄今为止,相关性研究仅仅注意到了前者却忽视了后者。第19页,共48页,2023年,2月20日,星期四2.3相关性原理

1.系统相关性系统相关性主要研究用户情报需求的描述和表达与系统文档描述之间的相互匹配关系,描述了情报检索系统内部的情报组织机制和方式在多大程度上适合或匹配用户检索的要求。用户相关性指用户以及用户检索代理者与检索系统之间的关系,这类相关性是主观的,在信息检索过程中,既涉及到用户(或检索代理)的认知或知识储备,又涉及到用户所处的情报问题情景。2.用户相关性2.3.2情报检索中的相关性第20页,共48页,2023年,2月20日,星期四2.3相关性原理

无论是哪一类相关性,实质上都是指情报用户(主体)与情报(客体)之间的关系,情报主体与情报客体之间普遍存在的相关性便成为情报科学的一种基本现象,揭示这种基本现象的原则和思想显然是情报科学最基本的原理。第21页,共48页,2023年,2月20日,星期四2.3相关性原理

2.3.3知识系统中的情报相关性1.情报学相关性理论根据信息链的结构,情报必定是进入科学系统的某种知识。由于知识体系的整体性、综合性、继承性、累积性和国际性,使得情报在纵向和横向都有极强的相关性。

(1)纵向。情报的不同的级别之间存在着内在的逻辑联系。

(2)横向。各知识领域之间是一个不可分割的整体,其情报单元也自然相关联。第22页,共48页,2023年,2月20日,星期四2.3相关性原理

2.情报学相关性的表现(1)传统系统中的表现传统的各种情报标引和检索语言正是基于文献情报的相关性采用概念逻辑划分来组织和存贮情报的。由于情报标引和检索语言的产生,情报的相关性便可以反映为概念之间的关系,对概念的内涵进行限制,外延实施划分便可组织起相互关联而有序的现代情报检索系统。

(2)情报的相关性在不同的学科领域是不同的

(3)情报的相关性还可实现更深层次的知识组织

布鲁克斯的“知识地图”知识表示和知识挖掘专家系统第23页,共48页,2023年,2月20日,星期四2.4易用性原理

人类交流、获取和利用信息、知识、情报总是趋向简捷、方便、易用,省力。研究和揭示人类情报行为追求易用与省力的特征、规律可以使情报获取和情报服务的成本最小,效益最大。2.4.1齐夫定律——最小努力原则(1)“单一化的力”和“多样化的力”相互作用,取得平衡,使自然语言的词汇出现频次呈双曲线(缩略语词)。1.齐夫定律的内容第24页,共48页,2023年,2月20日,星期四2.4易用性原理

(2)对较长文章中的词进行统计,也同样得到了fr=c(f

表示词在文章中出现的频数,r表示词的等级序号)的著名分布。2.齐夫定律的应用齐夫定律不仅适用于自然语言,而且适用于人工语言,因而又被应用于情报的组织、存贮和检索领域。

(1)在情报组织中,对于倒排文档的词语控制在对信息组织和用户来说都是“最省力”的规模(2)不同领域中最短路线的选择和确定问题都与省力法则有关第25页,共48页,2023年,2月20日,星期四2.4易用性原理

齐夫定律帮助合理地选择公共图书馆和情报中心的地点位置,使得各类用户能方便到达。3.穆尔斯定律一个情报检索系统,如果用户从它取得情报比不取得情报更伤脑筋和麻烦的话,这个系统就不会得到利用。这就是为什么本国文字出版的文献是用得最多的情报源的原因。用户搜寻情报的过程表明:由于各种情报源或渠道的易用性不同,却使得不同的用户几乎趋向同样的行为。第26页,共48页,2023年,2月20日,星期四2.4易用性原理1.效果指用户为特定目标在使用某一信息系统时,完成任务的全面性和准确性。2.效率指在保证服务准确性的前提下,用户获取所需信息的速度。

3.愉悦度

愉悦度是指用户在使用某信息系统时愉快及满意程度。2.4.2易用性指标第27页,共48页,2023年,2月20日,星期四2.4易用性原理

5.容错

系统的容错性是指系统不仅可以有效的预防由用户不当的操作引起的错误,还可以在错误发生的时候快速的恢复系统。各种指令和操作程序设置简单方便,用户在较短的时间里就能掌握。上述5个指标之间并不是完全独立,互不影响的,它们之间存在着一定的联系。4.易学

第28页,共48页,2023年,2月20日,星期四2.5小世界原理

无论世界如何大,人口如何多,联系多么困难,人际情报交流与传递总是能实现的。研究和揭示人类信息联系和交流得以实现的途径及其特征、规律是建立最佳信息、知识和情报网络的基础。2.5.1小世界原理内容1.小世界现象(1)小世界现象研究实例1929年,FrigyesKarinthy,认为任何两个人可以通过一条由5位联系人组成的链条来达到相识或联系1967年,哈佛大学“六度分离”实验结论第29页,共48页,2023年,2月20日,星期四2.5小世界原理

小世界现象是指人与人之间的联系可以通过有限个个体连通,也称为“六度分离”理论,即你和任何一个陌生人之间所间隔的人不会超过6个。2.小世界网络小世界网络简单地说就是存在小世界现象的网络。人际关系等中都存在小世界现象,而人际关系本来就存在一个网络,可以用小世界理论研究人际关系网络。(2)小世界现象结论小世界模型则是数学家和物理学家对小世界的抽象描述,逐步发展成为图论的一个新兴分支学科和复杂网络理论中的一个领域。3.小世界模型第30页,共48页,2023年,2月20日,星期四2.5小世界原理

2.5.2小世界原理研究成果1.小世界网络形成的最根本的原因:网络中两点的平均距离L与网络中节点数N呈对数关系,说明网络中节点数量增长很快时L变化相对较慢。2.网络不同,L也各异。实验获得的人际网络平均传递大约是6次。尽管因特网的网络节点的平均距离有差异(如6,19,10),但差异就显得微不足道了,表现出特有的“小世界现象”

。第31页,共48页,2023年,2月20日,星期四2.5小世界原理

3.小世界网络模型瓦茨(Watts)和斯特洛格茨(Strogatz)对小世界网络模型(W-S模型)的研究,更进一步证实了这种信息相关性存在的普遍性,并找到了实现联系的一般方式。

W-S模型实质上是具有一定随机性的规则点阵。构建方法是:在环状规则点阵中用“断链重连”的方法,即顺序浏览每条边,以较小的概率p(p≈0.1)将边的一端移到另一个随机选取的位置上,即形成了所谓的小世界网络。

第32页,共48页,2023年,2月20日,星期四2.5小世界原理

(1)虽然少数边伸展到较远的地方(捷径),但由于p

很小,模型仍大致维持规则结构,具有较高的聚类系数。另一方面,加入捷径使特征路径长度下降很很快,这使得小世界网络的特征路径长度与随机网络的特征路径长度相当。第33页,共48页,2023年,2月20日,星期四2.5小世界原理(2)许多领域的合作网络都存在小世界现象,于是断定小世界现象是大型现实网络的内在属性。(3)许多学者对W-S模型加以改进,提出以较小的概率p

在网络中将少量边“断链重连”或直接加入少量捷径,保持网络基本不变,而节点之间的特征路径长度则下降很快。这种网络就同时具有短特征路径长度和高聚类系数,实现了由大世界向小世界的转换。第34页,共48页,2023年,2月20日,星期四2.5小世界原理2.5.3小世界原理应用空间1.形成网络思维方式2.促进信息传播和交流3.提高信息搜索的精确度4.优化网络信息服务小世界原理体现了情报相关性,在情报科学和整个信息管理系统领域发挥重要作用,作为情报科学的基本原理具有普遍意义和广泛应用。第35页,共48页,2023年,2月20日,星期四2.6对数透视原理

人类获取和接收信息、知识和情报的认知过程遵循对数转换机制。可以揭示物理空间的信息与进入认识空间中的信息、知识和情报之间,信息载体和信息内容之间在数量和特征上的差异,为情报、情报学的定量化提供理论、方法和途径。2.6.1对数律简介1.对数律的提出

19世纪,韦伯和费希纳通过实验验证后提出对数律,表示为:S=ktogR,其中,S是由外部物理刺激引起的人的感觉量质,R是物理刺激量。第36页,共48页,2023年,2月20日,星期四2.6对数透视原理

2.对数律的本质这一原理实际上是普遍存在的人类感官系统对外界物理刺激的反应机制,它描述物理空间的对象特征在人的感觉系统中的影像之间的差异符合对数转换律。当我们进行观察时,物理空间的一切实体总是以其对数尺度反映在我们的感觉系统中,当人类不能在所处的物理空间中自由移动或借助其他手段观测时,难以纠正这种对数透视对物理对象带来的歪曲。2.6.2对数透视原理简介20世纪70年代末,

B.C.布鲁克斯发现“对数透视原理”。第37页,共48页,2023年,2月20日,星期四2.6对数透视原理1.对数透视原理应用的前提条件不能自由移动的空间由于人类永远不可能在认识空间或情报空间中自由移动,因而在信息获取和接收时对数透视效应的作用就不可避免,而且在大多数情况下是不可能校正的。2.物理空间的对数透视原理布鲁克思设想了一个抽象的信息空间,该空间属于物理空间,其中潜在信息(potentialinformation)均匀分布,其密度为ρ,然后将对数透视原理应用于该空间,推导出在一维、二维、三维空间中距观察者a到a+n处的感知信息量分别为:第38页,共48页,2023年,2月20日,星期四2.6对数透视原理

I1=ρln[(a+n)/a] (1)I2=2πρln[(a+n)/a] (2)I3=4πρln[(a+n)/a] (3)如果我们将式(1)用于时间轴上的信息接收,设信息产生的时间区间为1000年,那么最近的10年虽然潜在信息量在总量中仅占1/100(均匀分布),而感知信息量却占到33.3%(lg10/lg1000)。如果将(2)式用于2维空间中的信息获取和接收,设信息分布在10000米范围内,那么离接收者最近的100米虽然其潜在信息量仅占总量的0.01%(1002/100002),而感知信息量却占到50%(lg100/lg10000)。同样可利用(3)式计算出3维空间中信息的透视结果。第39页,共48页,2023年,2月20日,星期四2.6对数透视原理

虽然潜在信息是均匀分布的,但经过对数透视变换后,那些距接收者时间和距离较近的信息优先获得接收,而且其感知信息量占有相当大的比例。一般来说,人们对距自己时间和距离较远的信息接收较少,对较新的较近的信息接收较多,这又一次印证了省力法则。第40页,共48页,2023年,2月20日,星期四2.6对数透视原理

3.认知空间的对数透视原理(1)布鲁克斯情报科学定量的基本思想物理空间与认识空间存在着一定的关系,后者是前者在一定条件下的变形,如果把两者区别开来,就容易按一定的规则转换,如果不进行转化,我们所得到的仅仅是情报问题的物理解,而这个转化的规则就是对数定律。根据上述分析,我们不能简单地把物理空间的测量数据搬到认识空间(或情报空间),应当考虑到对数透视效应的作用而进行转换。第41页,共48页,2023年,2月20日,星期四2.6对数透视原理

(2)对数透视原理应用以评价情报检索系统的检全率为例,如果一个数据库中与某一课题相关的文献为N为100篇,检索实际获得n为60篇,文献检全率为60%,这显然是一个物理量。根据对数透视原理,应用(3)式,从1篇文献到60篇文献,其情报检全率应是:第42页,共48页,2023年,2月20日,星期四2.6对数透视原理

如果这100篇相关文献事先由情报中心按照相关性依递减次序排列,相应的情报检全率可再次应用对数透视原理:可见,用文献为单位来评价情报检全率,无疑是夸大了情报的损失。这种方式忽视了人的情报过程的认知相关性。第43页,共48页,2023年,2月20日,星期四2.6对数透视原理

4.对数透视原理与频次等级排序频次——等级排序利用获得的经验数据揭示信息对象的分布和人类情报行为的特征,对数透视原理则揭示信息对象在物理空间与情报空间的差异,以便于转换。相同点:相同的数学表达式,都反映着某种由大到小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论