3章信息资源及分布11-12A马-陈课件_第1页
3章信息资源及分布11-12A马-陈课件_第2页
3章信息资源及分布11-12A马-陈课件_第3页
3章信息资源及分布11-12A马-陈课件_第4页
3章信息资源及分布11-12A马-陈课件_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章信息资源及分布

目的要求掌握信息资源的概念,信息资源的类型和特点。了解信息资源的社会功能和作用。掌握信息资源的分布规律。本章重、难点信息资源的定义;信息资源的社会功能;信息资源的分布规律。1第3章信息资源及分布目的要求1前言:信息资源是信息管理的对象。信息管理要发挥信息资源的社会功能和作用。要做好信息管理工作,必须树立信息资源观念,充分开发和有效利用信息资源,掌握不同类型信息资源的特点,以及信息资源的产生、表述、增长、老化和分布规律。2前言:23.1信息资源的概念3.1.1资源与信息资源的含义一.什么是资源定义:我国:资财之源,财富之源(多指天然财源)西方:自然资源+社会资源资源——是指在自然界和人类社会中一切可以用来创造物质财富和精神财富的客观存在形态。(自然资源、社会资源)33.1信息资源的概念3.1.1资源与信息资源的含义3二.什么是信息资源信息资源化信息同能源、材料并列为当今世界三大资源。信息资源广泛存在于经济、社会各个领域和部门。是各种事物形态、内在规律、和其他事物联系等各种条件、关系的反映。信息资源的的开发和利用是整个信息化体系的核心内容。随着社会的不断发展,信息资源对国家和民族的发展,对人们工作、生活至关重要,成为国民经济和社会发展的重要战略资源。现代经济学观点认为,信息交流是国民经济发展的倍乘因子,信息的吸收和利用直接作用于国民经济的发展速度。其关键是建立在准确、及时、完整、详尽、可靠的信息基础上的科学的领导和管理(核心是决策)。4二.什么是信息资源信息资源化4对信息资源的表述有不同的见解。国外代表性观点由美国的霍顿提出:当“资源”为单数时,信息资源是指某种内容的来源,即包含在文件和公文中的信息内容;当“资源”为复数时,信息资源是指支持工具,包括供给、设备、环境、人员、资金等。国内,马费成:信息资源是指人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(信息技术、设备、设施、信息生产者等的集合。对“信息资源”的理解:广义:信息资源是可以用来创造物质财富和精神财富的各种信息及其相应的人才和技术,是与信息活动相关的资源的总称。狭义:信息资源是指可供人类用来创造财富的各种信息。5对信息资源的表述有不同的见解。国外代表性观点由美国的霍顿提出3.1.2信息与信息资源的关系1.信息与广义的信息资源的关系——交叉关系2.信息与狭义的信息资源的关系——包含关系信息信息资源图:信息与广义信息资源的关系信息信息资源图:信息与狭义信息资源的关系63.1.2信息与信息资源的关系1.信息与广义的信息资源的关系3.1.3信息资源概念提出的背景一.资源环境的不断恶化(1)物质资源日益缺乏(2)能源资源日趋枯竭二.人类社会经济模式的转换(1)劳力经济的萎缩(2)物质经济的衰落(3)信息经济的发展(4)知识经济的兴起73.1.3信息资源概念提出的背景一.资源环境的不断恶化73.2信息资源的类型及其特点3.2.1不同发生领域的信息资源物理信息资源生物信息资源社会信息资源3.2.2不同载体和存储方式的信息资源天然型信息资源以天然物质为载体;是人类认识物质世界的先决条件;实物型信息资源实物携带或存贮的信息智力型信息资源以人脑为载体;易产生遗漏的失真现象;其中的隐性知识难以掌控文献型信息资源信息相对稳定、便于加工、利用网络型信息资源83.2信息资源的类型及其特点3.2.1不同发生领域的信息3.2.3不同内容性质的信息资源政治、法律、科技、经济、管理信息资源等。3.2.4不同加工深度的信息资源(具有一定的专业性、针对性)零次信息资源一次信息资源二次信息资源三次信息资源93.2.3不同内容性质的信息资源93.3信息资源的社会功能及作用3.3.1信息资源的科学功能3.3.2信息资源的教育功能3.3.1信息资源的经济功能3.3.1信息资源的管理功能103.3信息资源的社会功能及作用3.3.1信息资源的科学3.3.1信息资源的科学功能一.提供科研原料例:20世纪70年代对于青蒿素的研究二.加快科研进程例:我国在世界上首次人工合成结晶牛胰岛素三.避免科研重复四.粘结科学群体113.3.1信息资源的科学功能一.提供科研原料11提供科研原料2011年度拉斯克基金会将临床医学研究奖授予81岁的中国中医研究院研究员屠呦呦。获奖理由是“因为发现青蒿素———一种用于治疗疟疾的药物,挽救了全球特别是发展中国家的数百万人的生命。”这是至今为止,中国生物医学界获得的世界级最高大奖,离诺奖只有一步之遥。

时代背景:上世纪60年代初,全球疟疾疫情难以控制。此时正值美越交战,美国政府称,1967—1970年,在越美军因疟疾减员80万人,疟疾同样困扰越军。美国不惜投入,筛选出20多万种化合物,最终也未找到理想的抗疟新药。越南则求助于中国。屠呦呦在获奖感言中表示,……在研发的最关键时刻,是中医古代文献给予她灵感和启示……

1969年,39岁的屠呦呦从整理历代医籍开始,四处走访老中医,编辑了以640方中药为主的《抗疟单验方集》,继而组织鼠疟筛选抗疟药物。经过200多种中药的380多个提取物筛选,最后将焦点锁定在青蒿上。历史记载认为青蒿确实可以治疗疟疾,并且收效显著。东晋葛洪的《肘后备急方》中有“青蒿一握,以水二升渍,绞取汁,尽服之”的记载。《黄帝内经》、《本草纲目》也均有记载。12提供科研原料2011年度拉斯克基金会将临床医学研究奖授予81加快科研进程选择胰岛素作为当时人工合成蛋白质的对象是有道理的,不仅仅因为胰岛素只有51个氨基酸,分子小,还因为它是当时唯一已知一级序列的蛋白质。早在1948年,英国生物化学家F.Sanger就选择了一种分子量小,但具有蛋白质全部结构特征的牛胰岛素作为实验的典型材料进行研究。于1952年搞清了牛胰岛素的G链和P链上所有氨基酸的排列次序以及这两个链的结合方式。次年,他宣布破译出由17种51个氨基酸组成的两条多肽链的牛胰岛素的全部结构。这是人类第一次搞清一种重要蛋白质分子的全部结构。桑格也因此荣获1958年诺贝尔化学奖。“我们开始查阅文献时发现我们的前景并不乐观,国外许多人都曾尝试过把还原的胰岛素肽链重新组合,以期获得一定产率的天然胰岛素,而这些探索都无一例外地失败了,甚至有人报道说,对于部分还原的胰岛素而言,氧化会导致活力的进一步降低……”德国和英国的研究小组也在进行胰岛素合成的研究……

1958年12月底,人工合成胰岛素课题正式启动。不到7年,也就是1965年,人工合成胰岛素获得成功。

13加快科研进程选择胰岛素作为当时人工合成蛋白质的对象是有道理的避免科研重复14避免科研重复14粘结科学群体最早的学术团体可以追溯到古希腊以及我国的春秋战国时期。从起初单干局限,感到了交流、讨论与协作的必要性。个人成就也需要发表,也需要得到承认,于是,自发的小团体,共同研究问题,科学共同体就应运而生了。意大利物理学家波尔塔(1535—1615年)1560年创立的“自然秘密研究会”,也是近代历史上第一个自然科学的学术组织。英国科学团体的建立直接受到培根《新大西岛》的影响,建立一个书中所描画的所罗门宫,一直是英国实验科学家们孜孜以求的理想。17世纪40年代,在约翰·威尔金斯(1614—1672年)的倡导下组织了“哲学学会”。目前有以下称呼:科学共同体、学派、科研团队、学术团体等。15粘结科学群体最早的学术团体可以追溯到古希腊以及我国的春秋战国3.3.2信息资源的教育功能1.开发智力资源2.培育思想品质3.铸就专业人才4.引导教育发展163.3.2信息资源的教育功能163.3.3信息资源的经济功能***指信息在社会生产过程中的经济效益放大功能,也是信息资源对于促进社会经济发展、产生和增强经济效益的作用。1.替代传统资源2.提高生产力3.增强企业竞争力4.优化产业结构173.3.3信息资源的经济功能***指信息在社会生产过程中的经3.3.4信息资源的管理功能信息资源的管理功能是指信息在管理活动中所起的促使管理目的得以实现的作用。信息是管理活动的基础。1.信息资源是科学决策的基础2.信息资源是合理计划的依据3.信息资源是有序组织的保证4.信息资源是有效控制的手段183.3.4信息资源的管理功能信息资源的管理功能是指信息在管理信息资源的社会功能(科学、教育、经济、管理)是由信息资源自身固有的属性所决定的,是客观存在的,并且也不依人的意志而转移。信息资源的社会功能的发挥又是受社会环境制约的,在不同的社会历史条件下,信息资源社会功能的表现有所不同。信息资源社会功能的发挥,有赖于人类对信息资源社会功能的认识能力和驾驭能力。19信息资源的社会功能(科学、教育、经济、管理)是由信息资源自身3.4信息资源的分布规律信息资源按照一定规律分布于社会之中。要做到加强信息资源的科学开发和管理,提高信息资源的开发利用效率,促进社会信息资源的合理布局,其前提就是遵循信息资源分布的客观规律。203.4信息资源的分布规律信息资源按照一定规律分布于社会之中。马克思认为“一种科学只有在成功地运用数学时,才算达到了真正完善的地步。”自然辩证法、科学论(ScienceStudies)、科学学(ScienceofScience)作为把科学当作一种社会现象来研究探讨的学问同样不应例外。把科学作为一种社会现象对其进行定量研究的学科是科学计量学。21马克思认为“一种科学只有在成功地运用数学时,才算达到了真正完3.4.1信息生产者的分布规律P80随着社会的进步与科学事业的发展,科学工作者势必越来越在社会成员中居主导地位,信息生产者也表现出一种加速增长的态势。在经济社会生活中,人们所能利用的信息因其生产者的构成、知识结构、地位、名气等不同而呈现出不同的信息价值。223.4.1信息生产者的分布规律P80随着社会的进步与科学一.洛特卡定律1926年,人口统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院学报》上发表了一篇题名为“科学生产率的频率分布”的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。由于多种原因,洛特卡定律沉睡了20多年,后来由于普赖斯等人的发掘,在1949年才引起学术界的重视。今天,洛特卡定律仍然经常被科学学家、情报学家等引证和研究。

23一.洛特卡定律1926年,人口统计学家洛特卡经过大量统计和研

洛特卡选择美国《化学文摘》和德国奥尔巴赫《物理学史一览表》为数据源研究科技工作的论著数量分布。他统计分析了《化学文摘》1907~1916年10年累积索引中的部分作者,即姓氏以字母A和B开头的6891位作者。分别列出发表过1篇、2篇,一直到346篇论文的人数。《物理学史一览表》包括了1900年前物理学领域内出现的1325位物理学家及其论著,取其全部数据进行统计。24洛特卡选择美国《化学文摘》和德国奥尔巴赫《物理学史利用这些数据,洛特卡绘制了发表1、2、3、4、……、n篇文章作者的百分比例(出现频率)对论文数的曲线,发现它们都是平方反比曲线。如果设发表x篇论文的作者概率(占作者总数的比例)为

f(x),则有:f(x)=c/x2,其中c为常数,它表示发表1篇论文的作者在总作者中所占的比例,其值约为0.6079。在所有作者中,只写了一篇论文的作者占全部作者的60.79%。写2篇的大约是写1篇论文作者数的1/4;3篇则是1/9;……25利用这些数据,洛特卡绘制了发表1、2、3、4、……、n篇文章洛特卡定律的图形描述洛特卡以论文数(x)和作者数(yx)的对数为横坐标和纵坐标(即logx和logyx)作图,两组数据都是直线(如图所示)。图中虚线表示《化学文摘》数据,实线代表《物理学史一览表》的数据。用最小二乘法计算拟合直线的斜率,近似为-2。LogyxLogx1053215125301002026洛特卡定律的图形描述洛特卡以论文数(x)和根据洛特卡定律,可以做出一些重要的推论。比如,它表明对科学贡献最大的只是少数多产作者。例如在拥有1,000篇论文的学科内,若有300名作者,那么其中撰写一篇论文的是180人,撰写10篇以上是30人,对该学科贡献最大的作者仅只是10人。就是说,高产的优秀科学家是少数,而发表论文很少的一般科学家的数量却很大。科学工作的一半是由那些因发表了10篇以上论文而树立起声望的人完成的;科学家的总数应为优秀科学家人数的平方,或者说论文高产者的数量级是作者总人数的平方根。这个定律有力地说明了少数多产的优秀科学家在科学发展中的地位和作用是极为重要的。27根据洛特卡定律,可以做出一些重要的推论。27洛特卡定律的数学描述根据洛特卡分析,在论文数x和作者数yx之间存在下列关系:xnyx=c式中,yx

是发表了论文x篇的作者数,n和c是对应于这一典型数据集合而估计出来的两个常数,n的数值在2上下波动。通过变换可以得到下面的公式:=28洛特卡定律的数学描述根据洛特卡分析,在论文数x和作者令f(yx)=,实际表示写x篇论文的作者出现的频率,C=,表示作者取样总数的比例,这样可以写成:f(yx)=两边积分得:1==,

于是,C=0.607929令f(yx)=,实际表示写x篇论文一个基本事实,即任何信息资源的生产者的自然分布基本上遵循洛特卡定律。科学论文著者的不平衡分布规律。通过他的研究成果,我们可以明确:在宏观的科学著述活动中,少数作者写出了大量的文章;反之,而大多数人的著述则是不多的。洛特卡定律主要是用以预测特定学科的论文的作者数量和文献数量,掌握文献的增长趋势和交流规律,以利文献情报的科学管理和情报学的理论研究;亦可用以研究科学家的活动规律,研究人才的著述特征,以利科学学的理论研究和科技史的探讨。30一个基本事实,即任何信息资源的生产者的自然分布基本上遵循洛特二.文献信息的生产者分布与洛特卡定律描述基本一致。但不同学科有其特定的发展特点和内在规律。三.网络信息的生产者分布非科研人员广泛参与,信息生产者(个人)分布的集中程度比传统文献低,分布更加广泛而且相对均衡。31二.文献信息的生产者分布313.4.2信息表述规律信息普遍存在,人们可以通过一定规则和方式来表达信息。语言、文字是人们表述信息的主要工具。语言、文字对信息表述有一定的规律。在文献中,不同词汇的使用和出现频率是有一定规律的。为了发现和揭示这种规律,许多学者进行过探索。323.4.2信息表述规律信息普遍存在,人们可以通过一定规则和方对信息表述规律的探索[法]艾思杜(速记学家)[美]贡东(物理学家,贝尔电话公司)[美]齐夫(语言学家,哈佛大学)1935年,以大量统计数据对自然语言的词频分布进行研究。1948年《人类行为与最省力法则——人类生态学引论》,根据他对语言的研究指出:在言语交谈中,说话者只用一个词来表达一个概念最省力,听话者也类似的对每一个概念用一个词来理解最为省力,因此,在口语交谈中应遵循省力法则,这就是传播学中著名的“齐夫定律”。33对信息表述规律的探索[法]艾思杜(速记学家)33一.齐夫定律(教材P90)一)齐夫定律的表述如果将一篇较长文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级……频次最小的词等级为D级。如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:f·r=c式中c为常数。上式称为齐夫定律34一.齐夫定律(教材P90)一)齐夫定律的表述34词频分布RfLgrLgf140000.9922000.695.3031331.104.8941001.384.605801.614.386661.794.197581.944.068502.083.919442.203.7810402.303.6935词频分布RfLgrLgf140000.9922000.

如果建立f与r的直角坐标系,用纵坐标表示词的等级序号,横坐标表示出现频次,就得到一条双曲线。如果等级r与频次f都取对数,则双曲线变成一条直线。与之等价的数学表达式为:lgr+lgf=lgc36如果建立f与r的直角坐标系,用纵坐标表示词的齐夫词频分布曲线及其对数曲线f25020015010050300r132564LgfLgr37齐夫词频分布曲线及其对数曲线f250200150100503二).齐夫定律的修正图中的虚线表示理想化形式,一般地,斜率为b的任一直线可表示为:Klgr+lgf=lgc这一直线由图中的实线表示。如果将其改写成(3-19)式的形式就得:frb=c……………(3-20)取b=1,(3-20)式与(3-19)式相同,因此可以将(3-20)式看做是对齐夫定律的修正。38二).齐夫定律的修正图中的虚线表示理想化形式,一三).齐夫分布的其他形式(1)朱斯双参数等级分布美国学者朱斯指出,在(3-20)式中,不仅c应当是参数,而且b并不总是等于1,也是一个参数,齐夫定律可更为一般地表示为:f(r)=cr-b………………(3-21)式中,b>0,c>0,对于r=1,2,…,n,f(r)=1式(3-21)就是朱斯的双参数等级分布定律。f(r)表示r位词出现的频率(或概率)。39三).齐夫分布的其他形式(1)朱斯双参数等级分布39(2)曼德尔布罗三参数分布

曼德尔布罗将词(包括字母间的空格)看做有一定顺序的字母序列,并将语言和利用模拟或数学公式表达形式的编码加以比较。设r为词的顺序,f(r)为第r个词的频率,(r)为第r个词的词长。这时平均词长为:L=Σf(r)m(r)当给定的熵值H最小或当L最小时,应有:H=-Σf(r)lgf(r)=常数,以及Σf(r)=1。根据这些条件,曼德尔布罗从理论上提出了三参数分布公式:f(r)=c(r+a)-b………(3-22)式中,0≤a<1,b>0,c>0。a,b,c为参数,具有如下意义:①参数c与出现概率最高的词的概率大小相关或者说与f(1)有关。当a=0,b=1时,c=f(1)。②参数b与高频词数量的多少有关,对于r<50的高频词,b是r的非减函数,随着r的增大,参数b并不减少。③参数a与词的数量n有关,由于a的选择自由较大,此公式更为灵活,更能够在各种条件下与测定的统计数据拟合。40(2)曼德尔布罗三参数分布曼德尔布罗将词(包括字齐夫定律的适用性齐夫定律揭示的规律不仅适用于科学文献中的词汇出现的现象,而且反映了一个基本事实,即任何信息资源中使用的词汇的频次基本上遵循齐夫定律。1977年Laemmel和Shooman的验证表明,齐夫定律对计算机语言也非常适合。根据阿根廷巴里洛切巴尔塞罗研究所的物理学家达米安·扎内特的统计,莫扎特、巴赫和德彪西的作品都符合齐夫定律,对人来说是悦耳的。41齐夫定律的适用性齐夫定律揭示的规律不仅适用于科学文献中的词汇齐夫定律的精确性齐夫定律是一个纯粹的经验定律,仅仅使用了一般的统计方法,其适用范围有一定的局限性,尤其是对于出现频率特别高的词和特别低的词,都不能完全满足齐夫定律。42齐夫定律的精确性齐夫定律是一个纯粹的经验定律,仅仅使用了一般二.文献信息的表述词汇各有特点,在不同环境中被使用的意义也不尽相同。但是,人们在用词汇(语言)表达信息时,就像受到两个相反方向的力的作用:即“单一化的力”和“多样化的力”的作用。在谈话或写作时,这两种力表现为:一方面希望对方理解;另一方面希望尽量简短。从这一观点来看,写作者以只用一个词表达所有概念为最省力,而阅读者则以每个概念都用一个词表达为最省力。这两种力取得的平衡,就使自然语言词汇的分布呈双曲线。描述自然语言词汇的分布,也可以在一定程度上揭示文献中内容单元的分布。43二.文献信息的表述词汇各有特点,在不同环境中被使用的意义也不三.网络信息的表述目前网上西文信息为主。网络信息的表述更趋向于用自然语言来表达,因此其词汇的使用更适用于省力法则。综合看来,符合齐夫定律所描述的规律。44三.网络信息的表述目前网上西文信息为主。443.4.3信息的时间分布变化规律P94在社会活动中,人们所利用的信息一方面在快速增长,另一方面又随时间的推移而逐渐失去其价值。为了更有效地利用这些信息资源,必须研究和分析信息资源随时间变化而呈现出来的规律。描述信息增长规律的典型理论是普赖斯指数阐释信息老化规律的经典学说是巴尔顿——凯普勒方程。453.4.3信息的时间分布变化规律P94在社会活动中,人一.普赖斯指数增长规律普赖斯(DerekJ.deSollaPrice)1922年1月22日生于英国伦敦,46年获伦敦大学物理学博士学位,54年又获剑桥大学科学史博士学位。1946~47年获英联邦基金资助,赴美国普林斯顿大学从事数理物理研究;1947~50年任新加坡阿拉亚大学应用数学讲师;1950~57年回英国从事科学史研究。其间,结识了英国当时最著名的科学史家李约瑟,并和李约瑟合写了一本题为《天钟装置——中世纪中国的伟大天文钟》的著作。与李约瑟的合作奠定了普赖斯的学术声誉。46一.普赖斯指数增长规律普赖斯(DerekJ.deSoll1957年赴美,1958年起任普林斯顿高等研究所DonaldsonFellow,1960年任耶鲁大学科学史AvalonProfessor,后升任耶鲁大学科学和医学史系主任。1980年加入美国籍,1983年9月3日在伦敦逝世。他是一位博学多产的杰出学者,一生发表论文240篇,专著14种。1976年获美国技术史学会的达·芬奇奖章,81年又获美国科学社会学研究会的贝尔纳奖章。60年代,普赖斯经常去华盛顿为美国总统提供咨询,并以联合国教科文组织等名义走遍世界,产生了广泛的国际影响。471957年赴美,1958年起任普林斯顿高等研究所Donald科学知识指数增长律的发现1949年普赖斯在新加坡执教时,负责保管一整套《伦敦皇家学会哲学论坛》。由于十年一叠地放在床头书架上,使得杂志靠墙排成指数曲线状,这个现象被他意外地抓住了。1950年,普赖斯回欧洲后向荷兰阿姆斯特丹的国际科学史大会提交了他的第一篇有关科技期刊按指数增长的科学计量学论文。该论文不仅标志他从数学和物理学转向了科学史研究,而且也成了他成长为科学计量学之父的起点。48科学知识指数增长律的发现1949年普赖斯在新加坡执教时,负责普赖斯在书中以科学文献量为纵轴,以历史年代为横轴,把不同年代的科学文献量在坐标图上逐步描绘出来,然后以光滑曲线连接各点,得出了科学文献随时间增长的指数曲线。见下图4949普赖斯指数增长曲线F(t)1001019001950t166510000100018001750185050普赖斯指数增长曲线F(t)1001019001950t166通过对曲线分析,普赖斯最先注意到文献增长与时间成指数函数关系。如果用F(t)表示时刻t的文献量,则指数定律可表为下式:

F(t)=aebt………(3-23)式中:a是统计的初始时刻(t=0)的文献量;e=2.718;b为文献增长指数,表示持续增长率。t为时间(年)。人们还常常用文献量翻一倍的时间来衡量文献的增长速度,即

t′=ln2/b………(3-24)式中:t′为文献量翻倍时间,b为持续增长率。51通过对曲线分析,普赖斯最先注意到文献增长与时间文献信息的指数增长仅是一个理想模式普赖斯指数增长没有考虑到许多复杂因素对文献增长的限制。实际统计发现,不同时期、不同级别、不同质量、不同学科领域的文献信息增长态势是不一样的的。勒希尔考察了不同质量级别的文献增长状况,发现它们的增长速度差别极大。——P9752文献信息的指数增长仅是一个理想模式普赖斯指数增长没有考虑到许逻辑增长曲线(生长曲线)

普赖斯指出,考虑物质的、经济的、智力的及时间的影响和限制,文献信息的增长更趋近于生物的生长曲线(LogisticCurve),即最初生长或繁殖很快,随着时间推移,其生长速度越来越慢,以致几乎不增加了。普赖斯指数增长其方程为:F(t)=k/(1+ae-kbt)…………(3-25)式中:F(t)代表时刻t的文献量,k为文献增长的最大值。53逻辑增长曲线(生长曲线)普赖斯指出,逻辑增长曲线(生长曲线)F(t)tK/2Lna/kb54逻辑增长曲线(生长曲线)F(t)tK/2Lna/kb54增长率的描述一般来说,在不同的阶段科学文献增长的态势是不同的。

学科处于诞生和发展阶段,文献量指数增长,文献的寿命较短。学科进入相对成熟阶段,文献增长就不能总保持原有的指数速率,增长率变小,曲线变得平缓,文献寿命相对变长。某一知识领域的研究取得重大进展后进入相对成熟的阶段。内容上更新的文献又将进入一个新的急剧增长时期(如指数增长)。然后又进入一个稳定时期。文献的增长往往会出现几个急剧增长时期和几个相对稳定时期,呈现出错综复杂的格局。一般说来,对不同的领域,描述其文献增长的生长曲线中各个常数(a,b和k)也是不相同的。生长曲线有其局限性。如按公式推算,会出现当科学发展到一定阶段时,文献的增长率为零,文献总量会达到最大值,没有新文献出现。这显然是不符合实际的。55增长率的描述一般来说,在不同的阶段科学文献增长的态势是不同的二.逐渐过时律(

P100)科学知识的“新陈代谢”是科学发展的客观规律。信息知识随着时间的推移会逐渐失去作为科学信息源的价值,越来越少地被用户利用。文献老化的表现文献信息的老化一般指这样四种情形:文献中所含信息仍然有用,但现在已被包含在更新的其他论著中;文献中信息仍旧有用,但现在正处于一个人们对其兴趣下降的学科;文献中的信息仍旧有用,但为后来的著作所超越;信息不再有用。56二.逐渐过时律(P100)科学知识的“新陈代谢”是科学发展衡量信息资源老化有两个重要指标:半衰期普赖斯指数文献半衰期所谓文献的半衰期,是指某学科领域现时尚在利用的全部文献中的一半是在多长一段时间内发表的。普赖斯指数

普赖斯指数,即某一学科领域内,对发表年限不超过5年的文献的引用次数与总的引用次数之比值。普赖斯指数=被引文献数量(小于或等于5年)×100%/被引文献总量一般来说,普赖斯指数越大,半衰期就越小,文献老化的速度越快。57衡量信息资源老化有两个重要指标:57巴尔顿-凯普勒老化方程最早用半衰期来描述文献老化问题的是美国学者贝尔纳,但对文献老化进行定量研究的则是美国某冶金图书馆员巴尔顿和物理学家凯普勒。1960年,他们联名发表了《一些科技文献的“半衰期”》。两人选择了9个学科领域的期刊文献进行“半衰期”的探讨,结果发现按9种不同被引证数据描绘出的9条曲线竟然在形状上非常相似,呈现的是指数曲线。式中:a+b=1;

Y——经过一定时间被利用的某一门类或科目的全部文献的相对部份;

X——时间,以十年为单位。当取y=0.5时,可以计算出文献的半衰期。巴尔顿等人据此测算出生物医学、冶金工程、物理学、化学工程、社会学等12各学科的文献半衰期,其结果如下表所示:58巴尔顿-凯普勒老化方程最早用半衰期来描述文献老化问题的是美国巴尔顿、凯普勒的发现经过莫地列夫、普赖斯、鲍莱恩、阿威里麦斯、肯特等人的研究和修正,形成了巴尔顿-凯普勒方程修正式。日前,描述文献老化规律的数学表达式一般采用负指数函数形式:C(t)=ke-at………………(3-26)式中:C(t)表示发表了t年的文献的被引次数t为文献的出版年龄(以10年为单位)k为常数,随不同学科而异e为自然对数的底,等于2.718a为文献的老化率59巴尔顿、凯普勒的发现经过莫地列夫、普赖斯、鲍莱恩、阿威里麦斯文献信息老化曲线用纵坐标表示现在正被利用(引证)的文献的被引量,横坐标表示时间,我们可以绘制出文献的老化曲线。相应的方程可表示为:

C(t)=ke-at…(3-26)被引证次数C(t)0.5出版时间tt1t2t360文献信息老化曲线用纵坐标表示现在正被利用(引证)的文献的被引三.文献信息资源的时间分布文献信息老化的影响因素(1)文献增长。文献的增长和老化是一个事物的两个方面,它们从不同的侧面来描述科学的发展,阐明科学知识的修正率。(2)学科差异。世界上93%~98%的科学杂志引用寿命为20年左右,但并不是所有这些学科的文献老化速率都大体一致,相反,彼此之间差异甚大。(3)学科发展阶段的差异。即使是同一学科,不同的时期或阶段,文献的半衰期不尽完全相同。(4)信息环境和需求。不同信息用户对文献的需求是不同的,因而信息利用者的需求及所处的信息环境的研究十分必要。61三.文献信息资源的时间分布文献信息老化的影响因素61三.网络信息资源的时间分布网络信息资源的分布基本符合逻辑增长。网络信息资源的老化情况可以从内容更新频率(如主页等)或浏览频次(如网上论文)来观察。目前网络仍处于高速增长及老化状态中。62623.4.4信息的集中与分散分布规律

(信息离散分布规律,P86)

一.布拉德福定律英国著名文献信息学家布拉德福发现,某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。他在长期的观察和统计基础之上,提出了有名的“布拉德福分散定律”(BradfordsLawofScattering),简称为布拉德福定律或布氏定律:“如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的‘核心’部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1∶a∶a2的关系(a>1)。”这就是布拉德福定律的区域表述形式。633.4.4信息的集中与分散分布规律

(信息离散分布规律,P8应用地球物理学论文的布氏分布分区期刊载文量(篇/年)期刊数量论文数量1>4942921-45549931258408布拉福德当时统计的应用地球物理学的数据,a约等于5。将所有期刊划分为3个区,使每区论文数大致相等,则期刊数服从布拉福德定律,即:9:59:258≈1∶5∶5264应用地球物理学论文的布氏分布分区期刊载文量(篇/年)期刊数量布拉德福分散曲线R(n)CBDNLogenR(N’)COAR(N)n1R(n1)N’如果横坐标取期刊按载文量递减排列时的顺序号n的对数,纵坐标取1至n号期刊所载论文的累积数,我们将绘制出的曲线称为布拉德福分散曲线。65布拉德福分散曲线R(n)CBDNLogenR(N’)COA布拉德福定律图形描述

布拉德福分散曲线由三部分构成,先是一段上升的曲线AC,然后是一段直线CB,最后是下垂的曲线。布拉福德以后,其他人对布氏定律作了大量研究,作了某些修正和表达。现较普遍地采用B.C.布鲁克斯的下述模式来表示布拉德福定律:

R(n)=αnβ(1≤n≤C)………(3-15)R(n)=klog(n/s)(C≤n≤N)……(3-16)上面两个方程分别表示图形的曲线部分和直线部分。66布拉德福定律图形描述布拉德福分散曲线由三部分构成,先是一段式(3-15)和(3-16)就是布拉

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论