信息计量学重点整理_第1页
信息计量学重点整理_第2页
信息计量学重点整理_第3页
信息计量学重点整理_第4页
信息计量学重点整理_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章绪论一、信息计量学的产生背景:首先,信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的。其次,信息计量学是情报学发展的需要和必然产物。再次,一批杰出的学科带头人和骨干力量推动了信息计量学的发展。二、信息计量学的发展:信息计量学的发展逻辑过程:统计计量学 文献计量学 科学计量学 信息计量学三、信息计量学的发展趋势:从文献计量向信息计量发展;计算机辅助的信息计量研究和 应用;网络信息计量学的研究;信应用息计量学应用的拓展。四、信息计量学研究的基本目的:即使要引进量的概念和定量分析方法,进一步揭示信息 单元的体系结构和数量变化规律,从理论上提高情报学及信息管理学科的科学性和精确

2、性,促使这些学科向定量阶段发展。同时,为改善情报信息系统提供定量依据,达到高 效能的科学管理,使信息交流系统经常处于最佳运行状态,提供最优化的服务,以便更 好地解决信息服务工作中的基本矛盾,克服信息危机,使信息管理工作更有效地为科学 技术、经济和社会发展服务。五、信息计量学研究的最大意义:从理论上继续总结各种经验定律,使经验层次上的信息工作上升到理论层次上的信息科学, 从而充实其理论的广度和深度,同时将各种经验定律在新的信息单元条件下进行检验和修 正,探讨它新的适用性,从而大大提高情报学的科学性,同时又能为实际工作提供理论指导。六、信息计量学研究的理论意义全在于应用:促进和深化情报学理论研究方

3、面的应用;图书馆管理中的应用;在信息分析和预测中的应用;信息检索方面的应用;在科学评价方 面的应用;在其他社会科学中的应用。七、信息计量学(广义的定义):情报(信息)计量学被定义为采用定量方法来描述和研究 情报(信息)的现象、过程和规律的一门学科。它是数学和情报学广泛结合形成的情报 学的一个新兴的定量性分支学科。八、信息计量学的内容体系:一般由理论、方法和应用三个部分构成。具体的说,其内容体系主要包括一下七个方面:(1)信息计量学若干基本问题的探讨,包括信息概念的数学描述,学科研究的对象、内容、 范围与相关学科的关系以及学科的形成和发展等。(2)信息的基本测度,建立“信息量”等 一整套测度指标

4、,确定信息计量的准绳;关于比特、知识单元、信息熵、信息场、信息势等 计量概念的讨论。(3)几个基本定律的研究,包括布拉德福定律、齐普夫定律、洛特卡定律 等。(4)信息流模型的研究,如文献增长、老化、离散、引文分布等模型得见了与评价。(5)信息计量化方法的探讨,如等级排序方法、对数透视原理及方法以及模糊数学、信息 论、集合论等的应用,情报利用和效益的定量评价等。(6)信息计量方法和工具的自动化实 现方面的研究(7)在图书情报工作、信息资源管理、信息检索、信息分析与预测、科学学 与科学评价等领域的应用。九、信息计量学与文献计量学的关系:首先,信息计量学着眼于“信息”本身的计量问题, 文献计量学主要

5、以作为情报载体的“文献”为计量对象。其次,信息计量学较之文献计量学 来说,其研究范围更为广泛一些。再次,从任务和方法上来看,信息计量学研究任务更为艰 巨,更难找到恰当的定量方法及途径。十、网络信息计量学的概念:十在当前特定的科学背景和技术条件下迅速形成与发展起来的, 主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的 一门交叉性边缘学科,也是信息计量学的一个新的发展方向和重要研究领域。第二章文献信息增长规律一、文献信息流:在信息计量学中,通常把文献所含信息的汇流成为文献信息流。由于文献 是信息的最基本的载体形式,文献信息流是具有一系列主体特征的科学文献的集合,所以

6、有 时将文献信息流简称为文献流。二、文献信息流的特性(P36)主要有两个方面:文献信息流的静态特性和动态特性(1) 静态特性一一在一定时间内科学文献在空间的分布性质,如集中-离散分布、文献按著者 分布、词汇在文献中的分布、引文分布、主题相关分布等的规律性。(2)动态特性 指科学文献随时间的延续而增长和老化的性质。科学文献既增长又老化,在增长中不断老 化,在老化之中又不断增长;增长是文献信息流的主要趋势。三、文献信息增长的影响及对策:影响:科学文献的急剧增长给人们带来许多烦恼,给文献的搜集、管理和利用以及科学研究 的发展造成严重影响。由于科学文献与日俱增,使得各个图书馆和情报机构深感书满为患、

7、经费紧张,哟啊对馆藏文献进行妥善存储和科学管理非常困难,许多情报服务措施难以实施, 直接影响情报工作的效率和情报事业的发展。对策:在理论上加强对文献规律的研究:在技术手段上,采用计算机等现代化的先机技术和 设备来处理和利用文献情报。从目前情况来看,我国应 采取的对策是:一方面要制定合理的长远规划和发展战略,为远 期情报工作现代化创造必要的条件;另一个方面还要特别注意采取实际措施,改进当前的各 项情报工作。四、文献指数增长规律的局限性科学文献并不总是按指数函数关系增长还与统计开始时 间有关有平缓趋势指数规律不能预测文献的未来增长趋势科学文献按指数增长的规 律,一方面正确地反映了过去历史年代科学文

8、献的增长情况,另一方面又暴露出不能据以 预测未来科学增长趋势的局限。原因分析:对科学文献增长的机理研究不够,难以对影 响文献增长的各种因素通盘考虑、全面衡量,给出前如其分的分析和定量描述;在确定 科学文献的指数增长规律时,普赖斯没有考虑、也难以考虑日益严重的老化因素;在统 计 某年的科学期刊累积总数时,普赖斯没有排除已停刊的期刊。五、文献信息逻辑增长规律的分析:(1)文献信息逻辑增长规律的正确性(2)文献信息逻 辑增长规律的局限性六、文献信息数量增长的原因:科研经费和科技人员的数量激增;专业范围的扩大和细分化; 学科之间的相互渗透;科学技术的国际化;研究的合作化和集体化;研究的周期缩短、产生

9、成果和转化的速度加快;通讯出版技术的改进和情报工作的加强。七、文献信息增长规律的应用:在科学学和科技史研究中的应用;在情报研究中的应用;在 文献信息管理中的应用。第三章文献信息老化规律一、文献老化与情报老化;一般而言,“老化”问题包括文献老化和情报(信息)老化。情 报的老化是相对于情报对象而言,而文献的老化则是相对于情报用户而言的。科学文献老 化指科学文献随其“年龄”的增长,其内容日益变得陈旧过时,作为情报源的价值不断 减小,甚至完全丧失其利用价值。既是一种客观的社会现象,又是一个复杂的动态过程。二、文献老化的量度指标(1)半衰期指某学科(专业)现实尚在利用的全部文献中较新的一半是在多长一段时

10、 间内发表的(共时半衰期)。这与该学科一半文献时效所经历的时间(历时半衰期)大体 相当。半衰期适用性:共时半衰期通常是评价某一学科领域或专业文献的老化趋势,而不是指个别 文献;而历时半衰期,可以是某一学科文献老化的半衰期,也可以是一种期刊,甚至一篇 文献老化的半衰期。半衰期的计算:作图法将统计数据制成引文分布表,以引文累积量或引文百分累积量为 纵坐标,以被引文出版的年龄为横坐标作图,在图中找出与纵坐标上引文累积量或百分累 积量一半处的对应点的横坐标,即为所求结果。定量模型计算法对统计数据建立文献老 化模型,再根据定义找出半衰期的计算公式,将相应数据代入求得结果。(2)普赖斯指数一一在几个知识领

11、域内,把对年限不超过5年的文献的引文数量与引文总 量之比当作指数,用以量度文献的老化速度和程度。计算公式为:普赖斯指数=出版年限不 超过5年的被引文献数量/被引文献总量*100%普赖斯指数和半衰期比较:一般说来,某一学科或领域文献的“普赖斯指数”越大,半衰 期就越短,说明文献的老化速度就越快。它们都是从文献被利用的角度出发,但是以不同 的方式来反映文献老化的情况。文献的半衰期只能笼统地衡量某一学科领域全部文献的老 化情况,而“普赖斯指数”既可用于某一学科领域的全部文献,也可用于评价某种期刊、某 一机构,甚至某一作者或某篇文章的老化特点。半衰期概念可以适用于一般的情报老化, 而普赖斯指数只适用于

12、文献情报。(3)剩余有益性指标一一期刊有益性某一年份某一期刊被用户所利用的文献数。剩余 有益性经过若干年后,期刊还保留的有益性。只是对与满足一定类型和内容的情报需 求的几种期刊来说,才是有用的。三、引文分析法:十将所研究的学科领域在一定时间之内的全部文献收集起来,通过统计每 一篇文章所附的引文的发表时间及其被引用时间等数据来研究该领域内文献老化的情况。四、从文献利用的角度来说,科学文献的老化的几种情形:文献包含的信息失效;包含情报 的文献已老化;被更新文献替代;研究兴趣下降引起利用减少。五、文献信息老化的影响因素:1、文献的增长:在文献的动态规律中,增长与老化十一个事物的两个方面,它们从不同的

13、 侧面来阐述科学知识的修正率,因此,文献的老化首先是与文献的增长联系在一起的。2、文献的学科特点:文献内容所属学科的性质和特点不同,其老化率差异很大。3、学科的不同发展阶段:在学科发展的整个时域中,每个学科要经历诞生、发展和相对成 熟等不同历史阶段。即使十同一学科不同的发展阶段,文献的半衰期也不尽相同,其老化曲 线也并非全部都符合负指数曲线。4、文献的类型和性质:文献的老化速度不仅仅取决于文献的学科内容,而且还与文献的类 型和性质有关。5、用户的需求及情报环境:文献用户的需求特点及所处的情报环境的质量也是倾向文献老 化不可忽视的因素。六、文献信息老化规律的应用(1)在文献情报管理中的应用:知指

14、导剔除优化馆藏;为制 定合理的文献工作原则提供依据;用于评价文献(2)在科学学与科技史研究中的应用:根 据文献老化定律,可以判断学科的性质以及所处的发展阶段第四章文献信息集中与离散分布规律布拉德福定律一、布拉德福定律的产生背景:1、文献的分散是普遍的现象2、科学统一性原则,是布拉德福定律产生的思想基础3、文 献统计研究是布拉德福定律产生的基础二、布氏定律的基本阐述(P105) 一般认为,布拉德福定律的基本原理是由其区域描述和 图像描述两个部分组成的。1、区域描述如果将一定时间内(通常一年)的按某学科载文量等级排列的期刊划分为三个 区,使每一个区所包含的相关论文数量相等,即恰好等于全部期刊发表的

15、该学科文章总数的 三分之一,便可发现:第一区(核心区)所涉及的文章来自数量不多但效率很高的n1中期 刊;第二区(相关区)包括数量较大、效率中等的n2中期刊;第三区(外围区)包括数 量最大而效率很低的n3中期刊。那么这三个区中的期刊数量成下列关系:n1:n2:n3 = 1:a: a2(a0)(1)式中:a即布拉德福常数,或称比例系数。就布拉德福所分析过的数据而言,a值大约为5.0。上式即为布拉德福定量的区域表述形式,经过维克利的研究, 可以把三个区讨论的文献离散规律推广到任意多个区的情况。各区的期刊的载文量是逐区 下降,而各区期刊数量则是逐区上升的。核心区情报密度最高,相关区次之,外围区情报 密

16、度最低。2、图像描述如果取上述等级排列的期刊数量的对数(lgn)为横坐标,以相应的论文累计数 R(n)为纵坐标进行图像描述,便可得到一条曲线一一布拉德福分散曲线。分散曲线AB由 两部分组成:对应核心区的上升的一段曲线AC和对于相继各区的直线CB,后来研究表 明,拐点C点为核心区的分界点。布拉德福在研究时发现,从图像出发还可以得到另一 个结论,即:n1:(n1+n2):(n1+n2+n3)=1:b:b2 记 n1-2=n1+n2,n1-3=n1+n2+n3,则可将上式改 为:n1:n1-2:n1-3=1:b:b2其中,n1 核心区的期刊数量n1-2 核心区和第二区的期 刊累积数n1-3全部三个区

17、中的期刊累积数,即期刊总数N b一一分散系数3、区域描述和图像描述的关系区域描述方法是根据实际统计的具体数据,取近似值而概略 地归纳出的,是一种近似的经验方法。从许多统计数据中都可以发现,几乎每一组统计数 据都近似地满足(1)式,而且每一组数据也只能近似地满足(1)式。 图像描述方法所依 据的是与区域描述完全相同的统计数据,只是图像描述将统计的期刊数取对数,并利用了三 个区中相关论文量相等这一近似条件而得到(2)式的结论的。因此,从数学观点来看,图 像描述的可行的,从实际应用看来,图像描述也非常接近于反映文献的实际分布情况,甚 至其近似程度比(1)式更为精确。按布拉德福区域描述公式所产生的理论

18、曲线与图像描述 的经验曲线基本上是一致的,两种表现形式之间没有歧异性,而具有一致性。三、布氏定律理论原理与实际的一致性(1)布氏定律的理论解释:从科学的统一性规律出 发总结出文献的分散定律。(2)格鲁斯下垂:格鲁斯通过对基南-阿瑟顿数据的分析指出, 布拉德福曲线在进入直线部分后,并非无休止地 直伸下去,后来总要弯曲下垂,因而使得 布拉德福定律的图形变为明显的三个部分:上升的曲线部分一一直线部分一一弯曲的下垂 部分(格鲁斯下垂)(3)理论与实际存在差异的原因:一是理论本身的缺陷;二是对客观实 际的反映的失真问题。四、布拉德福定律的应用:(1)布氏定律应用的基本方法:a、三大步骤:选用统计工具并

19、获取原始数据;等级排列统计数据;分析统计资料,最后得出统计分析结果b、分析方法: 区域分析法、图像分析法和解析式分析法(2)布氏定律应用的主要领域:确定核心期刊; 用于文献检索;考察专著分布;动态馆藏的维护;检索工具完整性的测定;学科幅度的比较; 指导读者利用期刊;指导期刊订购工作。第五章文献信息词频分布规律齐普夫定律一、最省力法则:每一个人的运动,不管属于哪种类型,都是在一定的道路上进行的,而 且都将受一个简单的基本法则的制约,千方百计地选择一条最省力的途径。在锅中运动中, 人们也都有意无意地按照这个基本法则行事。齐普夫噶这样一个他认为的普遍存在的法则称 为“最省力法则”。二、齐普夫定律的文

20、字表述在任何一篇文章中,词的出现频率都服从如下规律:如果把 一篇较长文章(约5000字)中每个词出现的频次统计起来,按照高频词在前、低频词在后 的递减顺序排歹L并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次 之的等级为2,,频次最小的词等级 为D (或L)、若用Fr表示频次,r表示等 级序号,则有:Fr*r = C (3)称为齐普夫定律的绝对频数表示法或频次表示法式中C 为常数。但这里的常数并不是绝对不变的恒量,而是围绕一个中心数值上下波动。齐普夫 定律不仅可以用词的绝对频数(频次)表示,而且也可以用此的相对频数(频率)表示:令N为文章所 包含的词汇总数(词容量)为第r级词的相

21、对频率,则有,fr fr = cr-1 (4) 称为齐普夫定律的相对频数表示法或频率表示法其中,c仍为常量,且c=C/N,而fr=Fr/N 齐普夫运用其“最省力法则”解释了这个定律。认为,在任何语言中,凡是使用频率高的词, 功能总是不会太 大。因为词义本身在这个场合中价值小,因而传递它们所需要的“力”就 不大,所以,此的出现频率与等级序号的乘积基本上稳定于一个常数。2、齐普夫定律的 图像描述一一齐普夫分布曲线根据文献中出现的词频与等级序号的统计数据,建立Fr与 r的直角坐标系,用横坐标表示词的等级序号r,纵坐 标表示相应的频次Fr,就可以得到 一条双曲线,即齐普夫分布曲线(a)。如果等级序号r

22、与频次Fr都取对数坐标,则图 像就变成一条直线了,即齐普夫分布对数曲线(b)。3、齐普夫定律的一般数学形式(2) 中的曲线若用等价的数学式表示,则为:lgr+lgFr=lgC 一般的,由解析几何知,斜率为b的 任一直线可表示为:blgr+lgFr=lgC如果将这一方程改写成类似(1)式的形式,则得:Fr*rb=C(5)若b=1,则(3)式和(5)式相同,这与后来朱斯提出的齐普夫定律的修正式的一 致的。4、齐普夫定律的适用性一般来说,齐普夫定律较符合西文文献中词频分布的实际 情况,定量揭示了文献信息的词频分布规律。三、齐普夫定律的应用:在文献标引和词表编制中的应用,包括词表编制和自动标引;在情

23、报检索中的应用;在科学研究中的应用。四、朱斯的双灿数公式:齐普夫的单参数词频分布律。因此,齐普夫公式只不过是朱斯公式在b=1时的一种特殊情况, 可见,朱斯公式是比齐普夫公式更为抽象、更具有普遍性的公式,是对齐普夫公式的真正的 实质性的修正。第六章文献信息作者分布规律一一洛特卡定律一、洛特卡定律的最原始表述:在某一时间内,写了 x篇论文的作者数占作者总数的比例 f(x)与所撰写的论文数x的平方成反比。如下所示:f(x)=C/x的平方其中,f(x)为写x篇 论文的作者占作者总数的百分比;x为论文篇数;C为某些主题领域的特征常数。二、洛特卡定律的内容:1、文字表述(P167)检验发现,生产2篇文章的

24、作者大约是生 产1篇文章作者数的1/4,生产3篇文章的作者数是生产1篇文章作者的1/9,写 n篇文章的作者数是生产1篇文章作者数的1/n2;且生产1篇文章的作者数的全体作者 的60%左右。可表述为:y(x) = y(1)/x2 (6) y(1)为写1篇文章的作者数,y(x)为写x篇文 章的作者数。2、图像描述3、洛特卡定律的特点7洛特卡定律实际上是科学论文在作者 上集中与分散的分布现象,具有两个特点:(1)洛特卡采用频次排序的方法,即按某类作 者出现的频次大小排位,而非按照作者所写的论文多少来对作者进行等级排序;(2)论 文在作者上的集中与分散程度只限于平方反比关系,即只给出了这种集中与分散程

25、度的单一 描述。二、洛特卡定律的作用:反映科技劳动成果;科学估计劳动规模;掌握科学论文的作者队伍。第七章信息计量学的理论基础一、布齐洛定律的一致性研究(太长了,坑爹!)第十章引文分析法一、引文分析利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对 科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特 征和内在规律的一种文献计量分析方法二、评价期刊的主要测度指标:绝对值1、期刊载文量:是描述期刊吸收外部文献能力的基本指标之一,其定义为,在给定 的时间内,期刊发表的全部论文数量。2、期刊引证率:是从用户使用的角度评价期刊的基 本指标之一,其定义为,在给定的时

26、间内,期刊引证的全部参考文献数量。3、期刊被引率: 在给定的时间内,期刊被引证的全部次数。相对值:1、平均引文率:平均引证率:在给定的时间内,期刊引证参考文献的数量除以相 应期刊的载文量;平均被引率:在给定的时间内,期刊所载的文献被引用的数量除以该期刊 的全部载文量。2、影响因子:是加菲尔德提出的一个评价期刊的重要指标。该指标是一个 相对数指标,主要用以调整和修正大刊、老刊凭借发表论文绝对数量而在期刊被引上所占的 优势,同时选择期刊被引数量达到最高峰是来计算其平均被引率,所以更能反映期刊被使用 的真实情况。计算公式为:某期刊前两年发表论文在该年的被引证次数/该期刊前两年发表 论文总数3、即年指标:该期刊某年发表的论文在当年的被引次数/当年发表论文的篇数4、 期刊自引率:引证该期刊自己发表的论文的次数/期刊参考文献的总数5、期刊自被引率: 被该期刊自己引证的次数/期刊被引证的总次数。三、引文耦合与同被引的概念:引文耦合:一般来说,引文耦合是指在两篇引证文献之间建立的关系,但也不局限于2篇,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论