




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、洛特卡定律,小组成员: 王 琦 刘 娟 谭 琴,目录,洛特卡其人 洛特卡定律概述 洛特卡定律的研究(侧重国外部分) 洛特卡定律的应用 洛特卡定律的特点与注意事项,1、洛特卡其人,籍贯: 1880年3月生于奥地利的伦伯格,父母都是美国人。 履历: 早期教育是在法国和德国接受的。毕业后,先后在美国化学总公司、国家专利局、国家标准局等机构工作。1938-1939年任美国人口协会主席、1942年任美国统计协会主席。 成就: 洛 特卡 ( A l f r e J h a k a ) 是美国著名学 者和科学计量学家。他擅长于统计研究 , 在科学上的兴趣首先集 中在生物体总数的动态状况研究 , 并发展 了一
2、 种用出生率 、 死亡率和年龄分布函数表示的“ 人 口分析理论” 。 1 9 2 6年 ,他天 才地提出了用一对联立微分方程表示的“ 竞争增长律” 。后来 他又将统计研究 的方向转移 到科学 家与其发 表的科学文献之间 的数量关系上, 进行 了开剖性 的研 究工作, 并发表了“ 科学生产率的频率分布” 等著名论文 , 从而较早地创立了世界 闻名 的 洛特卡定律” , 为文献计量学的诞生和发展作出了创造性 的贡献。,1926年,在美国一家人寿保险公司供职的统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物华盛顿科学院报上发表了一篇题名为科学生产率的频率分布的论文,旨在通过对发表论著的统计来探
3、明科技工作者的生产能力及对科技进步和社会发展所作的贡献。这篇论文发表后并未引起多大反响,直到1949年这一成果才引起学术界关注,并誉之为“洛特卡定律”。文中他统计了化学文摘190716年索引中的以A和B开头的6,891名作者及其论著数,并统计了奥尔巴赫(Auer bach)的物理学史一览表(1919)中的1,325位科学家及其论著数。 在上述统计分析的基础上,他发现:“写了2 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/4; 写了3 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/9; 写了n 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/ n2 ”。这就是著名的洛特卡
4、定律。,趣味小故事,布拉德福定律、齐普夫定律、洛特卡定律被认为是文献计量学中最基本的三个定律. 他们之间的关系就像欧洲的一个传统的三角恋爱的故事,这个故事如下: 故事取自:车尔尼雪夫斯基 的小说怎么办 故事背景:小说描写的是十九世纪五十-六十年代的俄国。在这个时 期,一切社会问题都归结为与农奴制及其残余作斗争。 故事如下: 房产管理人的女儿韦拉在医学院学生洛普霍夫的帮助下拒绝了父母包办婚姻的企图,脱离家庭,与原医学院学生洛普霍夫结合并创办了一所实行社会主义原则的缝纫工场。两年后,韦拉与洛普霍夫的好友基尔萨诺夫相爱,洛普霍夫感到韦拉与基尔萨诺夫性情相投,他们在一起生活会更幸福,于是毅然出走,假装
5、自杀,使他们能够结合。以后,洛普霍夫受职业革命家拉赫梅托夫的委托,出国进行革命活动,数年后由美国回到彼得堡,与波洛佐娃结婚,并同基尔萨诺夫和韦拉重新会面,两对夫妇幸福地生活在一起,共同进行着他们所热爱的事业。,2、洛特卡定律概述,诞生:1926年,洛特卡最先研究了科学文献数 量与著作数量之间的关系,并创造性地提出“科学生产率”的概念 即指在一定时间内科学工作者在科学上所表现出的能力和工作效果,通常用其生产的科学文献数量来衡量。 在提出科学生产率概念的同时,洛特卡就围绕它进行了统计研究。选用化学文摘与物理学史一览表来研究科学家的著述数量,以此经过数据统计、归纳分析及运用数学工具的推算得出洛特卡定
6、律,即写有x篇论文的作者频率与x的平方呈反比。,频数,频率,这就是科学生产率的“平方反比定律”的表达式。,2、洛特卡定律概述,公式 表述:,理论意义: 1 9 2 6年洛特卡 ( D a r k a ) 定律创立 至今已整整 8 0年 ,是文献计量学 中创立最早 的一个定律 ,洛 特 卡定 律也 是 文献 信 息 计 量学 的 经 典 定 律 之 一。为文献计量学的诞生奠定了一定的基础 , 其创立是值得纪念的。,2、洛特卡定律概述,布拉德福定律 、齐普夫定律、洛特卡定律被认为是文 献计量学中最基本的三个定律。 研究对象: 1 期 刊上刊载的论文 2 文章中每个词的出现频次 3 科学工作者 的著
7、述 分析单元: 1期刊数 2单词量 3著者群 计量方法:都是通过对文献的调查和统计,取得数据并进行 分析归纳来定量地认识文献情报流。 总结:这三个定律最初都是 按照某一具体事项在其主体来源中的出现频 率排序而导出 来的,然后通过数学工具来进一步求出其分布函数。 通过 微分处理和分区处理发现,这三种分布函数具有相似性 , 可以认为它们是一种分布规律的不同表现形式。,三 大 定 律 的 对 比,2、洛特卡定律概述,洛特卡定律的命运 由于多种原因,洛特卡定律沉睡了30多年,后来由于普赖斯等人的发掘,自60年代起引起人们的重视。 今天,洛特卡定律仍然经常被科学学家、情报学家等引证和研究。 引自科学的计
8、量研究 北京大学科学与社会研究中心 周 程,2、洛特卡定律概述,3、关于洛特卡定律的研究(侧重国外),1926年,Lotka发表关于科学生产率的著名文章后,刚开始并未引起学术界重视。 一直到1949年,洛特卡的研究结论才被称为“洛特卡定律”。 在人类行为和最省力法则一书中,齐普夫较早将其称作“平方反比定律” 60年代初期,由于普赖斯的两部重要著作的出版,使洛特卡的研究工作和成果随之得以广泛传播,有力地推动了这一定律的研究和发 展。 1969年,费尔桑(Foirthorne)首次将布拉德福、齐普夫以及芒代尔布罗分布同洛特卡的频率分布联系起来,指出洛特卡的关系式对低产作者来说是适合的。,By 刘娟
9、,70年代, 研究较深入的:科尔(RCCoile)和弗拉奇(JValchy)。 前者找到了一种判断某组实验数据是否符合洛特卡分布的鉴定方法; 后者则探讨了洛特卡定律的影响因素及作用。 对美国国会图书馆和伊利诺斯大学图书 馆的图书进行统计研究。 因 国会图书馆的统计数据只取自十年的机读著者目录,结果不严格符合洛氏分布, 而伊利诺斯大学的数据覆盖了有史以来出现的所有作者及论著,因而严格符合洛特卡分布定律。,3.1、对洛氏分布一般公式的研究,f(x)=c/xn f(x):写了x篇论文的作者占所有作者数的百分比 C为某主体领域的特征常数, Lotka:a=2,确定a和C?,实际上,它仅局限于a=2的情
10、形;确立的只是科学生产率的平方反比律。一些学者探讨了洛氏定律的普遍性意义。a并不一定都等于2,C会在06079附近上下波动。,指数a,通常采用最小二乘法估算。公式;,N为被考察的数据对的数量,指数C:洛特卡和弗拉奇的推导,洛: f(x)=c/x2,弗:a为任意值,a=2时,即 C=f(1)=60.79% a=4, C=4/90=1.08241 a为其他非负分数值时,用下列公式先求出级数之和,再计算C,C=2/6=60.79%,弗拉奇的研究结论,不同的a值将产生一个显著不同的常数c,而且a的较小变化(特别是在a2时)就会引起C值的明显的变化。 下面列举了a的部分样本值和对应的C值;其中常数C可以
11、通过前面的公式计算。,指数和常数的对应值,2.86%,2.58%,2.43%,4.26%,3.2、洛氏定律的适用性研究,洛特卡定律是对两个学科抽样统计的推广,在其他情况下是否适用? 研究学者:休伯特(Hubert)、德莱斯顿(Dresden)、戴维斯(Davis)等都进行过研究,涉及到不同学科、时期、国家或单位、类型的科学文献的作者分布规律。从各个不同角度来检验或修正洛氏定律。 有的还深入到文献的某些子集,如某一年度/某一类型的文献,如会议文献、图书等; 或某一单位收藏的文献等,进行作者分布的探讨; 有的则对洛氏定律提出了修正的可能性,如普赖斯(Price) 、布克斯坦(Bookstein)、
12、阿利森(Allision)等人的论著研究了这一课题,特别是Price的研究取得了重要成果。 目前,一般认为,在一定统计条件下,洛氏定律在大多数学科领域是适用的,能够描述科学文献作者分布规律和科学家著述的行为模式。,国外学者在经济学、生物学、情报学、图书馆学、法医学、人类学、计算机学等不同学科领域分别对其进行了适用性验证,并以此为基础提出了修正洛特卡定律的可能性。 其中最具影响力的是1986年帕欧利用包括20个学科和3个大型图书馆目录在内的48组有关文献作者分布的数据验证洛特卡定律,并重新界定了洛特卡分布中参数的取值范围,推动了洛特卡定律的发展,3.3、洛氏分布机理的研究,大量修正性实验总结:影
13、响洛特卡平方反比律f(x)=c/x2的因素: 学科特征。统计研究的学科的性质、范围、特点、发展阶段以及与其他学科的相关度等都会对其分布产生本质上的影响。 原因:一方面,科学的分化趋势显著,一个学科内部可能会不断产生新的发展点;另一方面,科学研究的综合化趋势也在加剧,边缘科学不断得到发展。各学辩的研究方法也产生了一些新的特点。 而洛特卡定律掩藏了不同学科、同一学科在不同发展阶段上文献与作者分布间的差异性,缺乏对学科发展及文献增长的动态性描述;此外,洛特卡定律对合作现象的研究较少,对合著者的科学贡献研究不足。因此,随着现代研究环境的不断变化,洛特卡定律的普适性受到了一定的限制。 以主题数据拟合洛特
14、卡分布需要注意进行数据的甄别和选取,样本容量的控制。,影响表现: 研究表明,基础理论学科与应用技术学科之间、比较成熟的学科与新兴学科之间、范围宽广的学科与较窄的学科之间,其文献的作者分布呈现出一定的差别。 就物理学而言,a=2是合理的;对于技术科学、社会科学和人文科学来说,a值将增大;而规模较大和科研合作程度较高的学科,a会变小。 在很长一段时期内,对洛特卡定律的验证基本上是在理论科学领域进行的,大多数情况下符合洛 氏分布。 例:1979年,加拿大学者将洛氏定律引入到应用科学和工程技术领域,发现存在着一定偏差。但他们认为这可能是理论科学和技术科学之间的差异而引起的。,统计条件,统计时,影响平方
15、反比定律的主要有两个量 统计研究的时间跨度和作者数量。一般来说,若统计的时间较长(如10年以上)、作者集合较大(如1000人以上), 其研究将会得到比较客观的结论。,罗兰德wD Roland)认为,数据样本的时间选择对洛持卡定律的拟合非常重要。 特别是当一个学科的学术研究进入到成熟期之后,由于产文量较小的低产作者人数的增加,时间因素的影响更加明显。事实上,每一个学科都存在着各自不同的发展阶段,洛特卡定律对不同阶段的科学生产率的描述能力不同。 萌芽期,其作者数量很少,研究成果微乎其微; 而一旦发现了学科“先锋”,将很快取得突破性的学术进展,洛特卡不能很好地描述这两个时期的作者分布。 论文作者数量
16、剧增,出现核心律者的高峰期,洛特卡定律则体现出对作者分布良好的描述力。 基于以上分析,要对某学科领域进行洛特卡分布的拟合以对其研究状况和科学生产率有全面准确的了解,必须注意其数据的来源,包括时间范围的界定、学科内分支研究领域的选取、来源期刊的学术水平等因素。 C值越大,说明作者的分布越平均,高产作者的贡献越小。,国外提供的一些数据, 其症结一般都在一篇论文作者分布比率偏高上。如洛特卡数据应为60.79%, 而利夫斯 (DHLeavens ) 的计量经济学数据是63.50% , 美国国会图书馆关于 Marc磁带标题作者的数据是65.65% 。这样的偏差实际上是由统计数据时间范围的不同所至。,统计
17、数据的时间范围,研究方法,在科学生产率的研究中,洛特卡所采取的方法基本上是可取的,但在选择化学数据时却采用了不正规的抽样方法。 后来的研究说明,处理方法上的差异,特别是对合著者和高产作者群的不同处理将会影响其研究结果。高产作者的数据对其直线关系影响颇大。 因此,在确定洛特卡分布关系时必须截删一部分高产作者数据。同时,由于科学技术的发展和科学研究出现的新的特点,使得现在的著述规律与洛特卡那时的情况已大不相同。因此,洛特卡对合著者的处理方法现在就不太合适了,而应该加以改进。 在研究和运用洛特卡定律时,如何处理合著者和截删高产作者数据是两个必须解决的重要问题。,国内以一个实验为例,定律验证工作起步较
18、晚,始于20世纪80年代,但成果斐然,并在分析验证结果的基础上在合著者的处理、KS检验的适用范围、洛特卡分布中参数的拟合方法等方面提出了不少独到的见解,并积极将洛特卡定律应用到新兴学科发展趋势的预测研究中,目前验证研究多集中于各类学报及学术期刊,而对特定学科或主题领域的验证研究较少,仅有的数学类科学文献和哲学类科学文献两个学科类研究样本的拟合结果都不支持洛特卡定律。 VIP的检索结果表明,截至2008年,验证洛特卡分布的文献共有30篇,在这32个样本中,有3例结果不支持洛特卡定律:物理学报论文合著者不符合洛特卡分布,数学和哲学文献的分布情况也不符合洛特卡分布。 除此之外,水利学报、数理统计与管
19、理、林业科学、数学学报等专业期刊和八一农学院学报、西藏民族学院学报 、期刊管理文摘等学报型期刊以及嘉兴府志所载明清文献均服从洛特卡分布。 值得特别提出的是,中国科学院国家科学图书馆尝试将洛特卡定律引入古典目录学研究领域,并根据拟合的洛特卡参数推知当时的学术发展状况,具有一定的现实指导意义。,洛特卡分布拟合与KS检验的矛盾,华东师范大学商学院情报系的一个实验 19972006年十年间图书情报领域以及CSSCI收录的8种核心期刊作者著述情况的数理统计分析,从多角度对图书情报领域洛特卡定律进行验证。,注:KS检验: Kolmogorov-Smirnov检验(柯尔莫哥洛夫-斯摩洛夫),拟合优度检验法,
20、用来检验数据的分布是不是符合一个理论的已知分布,被CSSCI收录的8种图书馆学情报学核心期刊中,除情报科学和图书馆杂志外的其他6种期刊的洛特卡分布函数都通过了KS检验。而10年间图情领域所有刊载著者及其论文文献的洛特卡分布函数也未通过KS检验,其著者总量高达49084,Dmax值00165远远大于临界值Do0.073。,KS检验:计算累积实际频率分布函数和累积理论频率分布函数的差值。若差值中的最大值大于临界值,则认为理论和实际有显著差异;反之,则认为理论和实际无显著差异。,图书情报领域各核心期刊C值在076089间浮动,说明这8种图情核心期刊中,在高产作者群稳定的情况下,科学研究的队伍在不断扩
21、张,新生的科研力量正在逐渐形成规模并取得论文成果,科研新秀的涌现使核心期刊论文作者的分布越来越平均,特别是一篇论文作者所占的比率明显提高。 而根据10年间图情领域所有期刊著者和论文数据拟合的洛特卡分布函数中,C值仅0591,不仅远远低于8种核心期刊的C值,也低于其他学科的特征常数。 差异的产生是由于第二组拟合数据源于图情领域内所有学术期刊数据的融汇,包括核心期刊和众多非核心期刊,而各期刊的办刊宗旨、关注领域、学术水平都存在很大差异,数据交融混合后产生不同于第一组数据的拟合结果也在情理之中。,C值越大,说明作者的分布越平均,高产作者的贡献越小。,计算临界值的公式: 临界值D0的大小仅仅取决于著者
22、群的大小。著者数量越大,临界值越小,检验精度越高,越不容易通过KS检验。 图书情报领域起步较早、理论体系完整、发展相对成熟,著者群体庞大,数量众多,文献量大,所以,以图情领域所有论文作为样本,样本容量过大,不容易通过KS检验。相应的,由于情报科学和图书馆杂志的著者群体庞大,著者数量分别高达1685和1384,最终也没有通过KS检验。,KS检验不适应大样本容量的数据拟合检验。其适应范围较窄,不能反映成熟学科的发展情况,只能截取部分时域或者作者群体进行分析,或是对著者规模较小的新兴学科进行分析。也就是说,用KS检验的洛特卡规律不适用于具有庞大著者群的成熟学科,更不能适应这些学科的历史性研究。 更多
23、实验参见:南京大学信息管理系李丽娜.多视角对洛特卡定律的验证和阐释(选择了不同的数据组作为研究对象,从学科、多种同类型期刊、一种期刊三个角度对洛特卡定律进行了验证。),附: 11/21/3 1/n/6 的证明,首先是由欧拉推出来的,要用到泰勒公式。 将sinx按泰勒级数展开: sinxxx3/3!x5/5!x7/7! 于是sinx/x1x2/3!x4/5!x6/7! 令yx2,有sinx /x1y/3!y2/5!y3/7! 而方程sinx0的根为0,2, 故方程sinx /x 0的根为,(2), 即1y/3!y2/5!y3/7!0的根为,(2), 由韦达定理,常数项为1时,根的倒数和一次项系数
24、的相反数 即1/1/(2)1/3! 故11/21/3 /6,4、洛特卡定律的基本应用,洛特卡定律在信息分析与预测中的作用是明显的,比如我们可以利用它来预测著作数量与文献数量,从而便于搜集信息、掌握文献信息流的变动规律、预测科学家数量的增长和科学发展的规模及趋势等。 此外,在分析研究人口的分布状况和城市的比例结构等类似的信息分析与预测工作中,洛特卡定律也有一定的应用。,4、洛特卡定律的基本应用,总体来说表现在三个方面: 一、反映科技劳动成果状况: 可从统计或估算著者数量来预测文献数量的增长速度和文献流向; 二、科学估计劳动规模: 预测科学家数量的增长和科学家发展的规模及趋势; 三、掌握科学论文的作者队伍: 研究科学家的活动规律,研究人才的著述特征,合理编制著者索引,规划检索刊物体系;,4、洛特卡定律的基本应用,具体来说表现在以下几个方面: 科研人员的著述状况和发表论文数量 测定具有不同数量论文的作者之分布规律
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江舟山群岛新区旅游与健康职业学院《环境监测Ⅰ》2023-2024学年第二学期期末试卷
- 吉林省白山市长白县2025年初三“一模”考试数学试题含解析
- 雾化吸入疗法的护理
- 2025房屋租赁合同协议书范本(甲乙双方)
- 2025煤矿产权交易合同(II)
- 2025年销售合同模板下载:食品包装盒合同样本
- 2025劳动合同外包服务标准范本
- 团员干部培训大纲
- 2025年高考历史总复习近现代历史中外阶段特征知识汇编
- 2025简易员工合同协议
- 2024北京首师大附中初二(下)期中数学试题及答案
- 老年医学常识试题及答案
- 供水管道施工方案
- 医疗器械研究预测报告2025-2028年
- 生物尿液的形成和排出 课件-2024-2025学年冀少版生物七年级下册
- 政府专职消防队灭火救援理论基础
- 中职高教版(2023)世界历史-第11课-近代职业教育的兴起和发展【课件】
- 2025届高三部分重点中学3月联合测评(T8联考)地理试卷(河北版含答案)
- 2025至2030年中国三乙二醇单甲醚市场调查研究报告
- 雨污水管道工程专项施工方案
- 中国民族史知到课后答案智慧树章节测试答案2025年春云南大学
评论
0/150
提交评论