信息分析与预测 第9章 文献计量学方法_第1页
信息分析与预测 第9章 文献计量学方法_第2页
信息分析与预测 第9章 文献计量学方法_第3页
信息分析与预测 第9章 文献计量学方法_第4页
信息分析与预测 第9章 文献计量学方法_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第9章文献计量学方法12第1节文献计量学方法概述239.1.1文献计量学的产生与发展3文献计量学的早期实践文献计量学的正式提出文献计量学的概念文献计量学的研究对象文献体系文献计量特征49.1.2文献计量学的研究对象与特点文献计量学的特点有独到的研究方法和特定的统计规律围绕几个核心定律展开文献计量研究研究结果的定量输出理论与方法形成的周期很长51.国外文献计量学的发展萌芽阶段(1917-1933年)奠定阶段(1934-1960年)发展阶段(20世纪60年代以来)2.国内文献计量学的发展69.1.3文献计量学的发展3.文献计量学的发展趋势定量化深度和广度发展知识体系化方向发展应用领域拓宽,重视在科技管理和决策中的应用7向信息计量发展文献计量学、科学计量学和信息计量学合流研究手段及工具向现代化发展网络信息计量学成为其新的分支和发展方向89第2节文献计量学三大定律9洛特卡定律的产生洛特卡定律的描述109.2.1著者分布定律——洛特卡定律洛特卡定律主要是研究著者分布的规律。在洛特卡定律中,设论文数为x,撰写这

x篇论文的作者数占作者总数的百分比为

y(x),则x与y(x)之间存在以下关系:11式中,y——撰写这x篇论文的作者数占作者总数的百分比,y(x)<1;c——某主题领域的常数。(9-1)12文字表述为:某一时间段内,撰写x篇论文的作者数占作者总数的百分比y(x),与其所撰写的论文数x的平方成反比,故洛特卡定律也称为平方反比定律。对于c值,可以通过以下方法来推导。13式(9-1)变形为:取x值为1,2,3…,则有:通过级数求和,可以得出c的值为0.6079,在数值上等于y(1)的值,即撰写1篇论文的作者数占作者总数的60%左右。14所以,洛特卡定律也可以表示为:(9-2)式中,y(x)——写x篇论文的作者数;

y(1)——写1篇论文的作者数。这样的表示跟前面的表述是一致的。153.洛特卡定律的发展进一步的研究表明,洛特卡定律中x的指数并不总是精确为2,而是在2附近上、下波动,经过修正后,洛特卡定律一般表示为:(9-3)16式中,17x——论文数量;y(x)——写x篇论文的作者占作者总数的比例;a和c——参数,它们在特定的学科领域是一个常数。在众多的研究者中,做出较大贡献的当数普赖斯(Price)。他在洛特卡定律的基础上继续深入进行研究,得出了新的量化关系式,可以表述为:全部科学家总人数的平方根,等于撰写了全部科学论文的50%的那些高产科学家的人数。这一推论被称为“普赖斯定律”(Price’s

Law)。18洛特卡定律以及由其推出的普赖斯定律,在文献计量及信息分析中有着广泛的应

用价值和指导意义,但是在使用过程中

同样存在着局限性。由于统计的数据量

大,时间跨度长,往往不够全面,因而

也不能充分反映真实的著述情况。另外,洛特卡在研究中排除了部分高产作者,

主要适合于低产的作者,这不能不说是

一个重要的局限。19实际使用中,只是在一些学科中近似的符合平方反比规律,而在有些学科中,洛特卡定律就不适用。从信息分析与预测的角度看,洛特卡定律以及由其推出的普赖斯定律,可以帮助我们鉴别学科研究发展的学者分布情况,并从中获得有价值的启示。20布拉德福定律的产生布拉德福定律的描述219.2.2文献分散定律——布拉德福定律1)区域(文字)描述如果将一定时期内刊载某学科论文的期刊,按相关论文载文量多少排序,然后划分为三个区域,分别标记为核心区n1、相关区n2、外围区n3,使每个区的相关论文量相同,则三个区的期刊数之比为:a为布拉德福常数。(9-4)22图9-1布拉德福分散曲线lg

nR(n)

PBA02)图形描述(见图9-1)23这是早期的经典布拉德福曲线,后来,随着研究的深入,格鲁斯(O.V.Groos)在1967年发现布拉德福曲线在进入直线部分(图9-1中PB)以后,并不总是呈现直线延伸状态,而是要发生弯曲,会出现“格鲁斯下垂”。243)公式描述布拉德福定律的数学公式描述如下:(9-5)25式中,R(n)——对应于n的相关论文累积数;

n——期刊等级排列的序号;a——第一级期刊中的相关论文量R(1);c——核心区的期刊种数,即由曲线过渡到直线交点对应的n值;N——等级排列的期刊总数;β——参数,数值上等于AP曲线的曲率,且小于1;K——系数,等于曲线中直线部分PB的斜率;s——参数,等于图形直线部分反向延长与横坐标的交点的n值。263.布拉德福定律的发展1948年,维克利(B.C.Vickry)(9-6)a为分散系数。莱姆库勒(F.F.Leimkuhler)(9-7)27式(9-7)中,28F(x)——选定的部分期刊的载文量与该部分期刊总产量之比(即该部分期刊中全部相关特定主题论文与总期刊群中所有相关论文数之比);x——在特定学科中载文量最高的期刊的数量与相关学科的总刊量之比,0<x<1;β——分布函数的参数。1968年,布鲁克斯首次将布拉德福定律用数学公式表达出来:(9-8)k是常数。另外,斯马里科夫、高夫曼、威尔金森等人对布拉德福定律也做出了突出贡献,在不同程度上发展了布拉德福分散定律。29齐普夫定律的产生齐普夫定律的描述309.2.3词频统计定律——齐普夫定律设有一包含N个词的文献(N≥5000),统计其中每个词的出现频次(n),按频次递减顺序将它们排列起来,并用自然数给这些词编上等级序号(r),那么每个词的等级r与相应的频次nr之积为一常数,表示为:(9-9)r

=1,2,3…n,K为常数这就是齐普夫定律。31如果用f(r)表示等级r的词的出现频率,则f(r)=nr

/N,齐普夫定律就可以表示为:(9-10)r

=1,2,3…n,C=K/N。式(9-9)与式(9-10)是等价的。323.齐普夫定律的发展33朱斯(Joos)和芒代尔布罗(Mandelbrot)修正。1936年,朱斯指出,齐普夫公式中不仅只有C一个参数,还有一个不确定参数——r的指数,即n时,,这是朱斯双参数修正式。这个公式比齐普夫公式更抽象,也更具有普遍性,是对齐普夫公式实质性的修正。(9-11)式中,b>0,C>0,并要满足r

=1,2,3,342,3,…,n时,则。20世纪50年代初期,芒代尔布罗运用概率论和信息论的方法来研究文献中的词

的序号分布规律,通过严格的数学推导,从理论上又提出了词频的三参数序号分

布规律,也被称作芒代尔布罗三参数修

正式,其形式为:(9-12)式中,0≤a<1,b>0,C>0,并满足r

=1,35事实上,齐普夫公式与朱斯修正式只是分别当a=0、b=1和a=0时芒代尔布罗修正式的特例。芒代尔布罗三参数修正式使齐普夫定律的适用面变得更为宽广,但对于出现频率很低的一些词仍然有一定的局限性。361.三大定律的联系内在的一致性,计量分析单元;计量方法产生背景数学表达式379.2.4三大定律的联系与应用2.三大定律的应用洛特卡定律布拉德福定律齐普夫定律38第3节文献计量学的其他方法38赖德的早期发现普赖斯的工作399.3.1文献增长规律t图9-2普赖斯增长曲线v40曲线中,横坐标为年代,纵坐标为期刊种数。用公式表示为:(9-13)式中,F(t)——文献累积量;

t——时间(年);a——初始时刻(t=0)的文献累积量F(0);b——文献的持续增长率,其数值近似等于文献的年增长率。413.逻辑增长模型纳里莫夫(В.Налимов)和弗拉杜奇(Г.Владуч)式中,F(t)——t年的文献累积量;k,a,b——都是大于零的常数。逻辑增长模型的特点(9-14)42半衰期和普赖斯指数巴尔顿-开普勒方程439.3.2文献老化规律式中,a

+

b

=

1;y——某学科现在尚被利用的文献的累积相对比,(y<1);x——过去时间(即被利用的文献是在过去多少年内出版的);以10年为单位。在上面的公式中,当y

=0.5时,就可以计算出文献的半衰期。(9-15)443.文献老化规律的应用`首先是文献剔旧其次是指导阅读解释科学发展规律451.引文分析的概念如果将这篇文献设为A,将它的参考文献设为B,那么,我们就称A是引用文献,B是被引用文献(简称引文)。469.3.3引文分析472.引文分析的测度指标①引文率②期刊载文量③被引文量④被引次数⑤影响因子(Impact

Factor)48数据分析表明,期刊论文发表后两年其被引证次数达到最大值,因此把影响因子的时间限制推前两年。49⑥当年指标⑦引证系数和被引证系数503.引文分析的主要工具及应用51科学引文索引(SCI)期刊引用报告(JCR)1)科学引文索引(SCI)SCI大致分为三个部分:①引文索引(Citation

Index,简称CI)②来源索引(Source

Index,简称SI)③轮排关键词索引(Permutern

SubjectIndex,简称PSI)52利用SCI,科学工作者可以进行各种类型的综合性引文分析,定量研究科学情报

的规律和评价文献,还能根据SCI提供的大量有价值的文献引用数据和资料,进

行科学人才的识别、评价和预测。总之,

SCI是研究文献学、情报学、图书馆学的发展规律,以及进行科学信息分析预测

的一个重要工具。532)期刊引用报告(JCR)JCR的结构主要由四个部分组成:①期刊排队部②来源数据部③期刊半衰期部④引用与被引用期刊排队部54JCR在期刊引文分析中有着重要的应用价值,可以确定核心期刊,确定某专业应收藏的专业性期刊,了解学科或期刊间的交叉渗透关系,确定一些刊物的专业属性,判断两种刊物的相关性等。55在信息分析研究工作中,利用引文分析,可以准确把握不同期刊之间的相互关系,引导文献获得、评价与使用,而且可以

对信息来源做出适当评价。同时,还可

以识别不同作者和机构的研究工作的情

况,及其所拥有的影响力等。5657第4节网络计量学方法57网络的快速发展阿曼德(T.C.Almind)首次正式提出网络计量学(Webometrics)的概念589.4.1网络计量学的产生背景网络计量学的研究对象网络计量学的研究方法599.4.2网络计量学的研究对象与方法1.网络计量学的研究对象1)网上信息的直接计量60建立多媒体数据库、索引数据库、声音服务网上文献的计量网上站点的信息计量2.网络计量学的研究方法运用推理统计对数据进行统计分析运用图论的方法对数据进行可视化研究运用揭示数据聚簇和分散的工具进行数据挖掘研究模型研究61在数字图书馆和情报科学中的应用在网络搜索引擎、网站建设和管理中的应用在指导核心期刊评定中的应用在社会科学研究、科技发展和决策中的应用在社会生活中的应用629.4.3网络计量学的应用9-1

了解文献计量学产生和发展的过程,搜集有关资料,说明我国文献计量学实用研究的新进展。63利用公式推导说明文献计量学三大定律是如何联系在一起9-2

文献计量学主要有哪三大研究定律?它们的原理分别是什么?9

-

3的?9-4

观察普赖斯文献增长曲线,写出曲线方程并指明方程中各参数的具体含义。9-5

举例说明文献老化规律在图书情报工作中的应用。9-6

使用SCI和JCR进行引文查询时,需要注意哪些问题?9-7

网络计量学的发展趋势怎样的?它将如何有助于信息分析研究工作的开展?9-8

结合本章所学知识,说说文献计量学在实际工作生活中都有哪些应用,并对此谈谈你自己的认识。习题邱均平等.我国文献计量学发展的回顾和展望.科学学研究,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论