信息计量学复习资料_第1页
信息计量学复习资料_第2页
信息计量学复习资料_第3页
信息计量学复习资料_第4页
信息计量学复习资料_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章概论1、信息计量学的由来和发展:“信息计量学”(原称“情报计量学”)名称最早出自德文informetric,是由德国学者昂托.纳克教授最先提出来的。在其后的文献中很快就出现了与之对应的英文术语Informetrics。(1)信息计量学是在传统文献计量学及科学计量学的基础上扩展和演变而成的。(2)信息计量学是情报学发展的需要和必然产物(3)一大批杰出的学科带头人和骨干力量推动了信息计量学的发展2、信息计量学的概念:采用定量方法来描述和研究情报(信息)的现象、过程和规律的一门学科.它是数学和统计学与情报学广泛结合而形成的情报学的一个新兴的定量性分支学科4、信息计量学与相关学科关系:1)与数学和统计学:从产生过程来看,信息计量学是数学方法应用于信息情报研究领域相结合而形成和发展起来的.从研究内容和研究方法来看,信息计量学离不开数学工具2)与文献计量学:从信息计量学的概念和内容体系来看,信息计量学与文献计量学彼此交叉渗透,既有着许多共同的研究内容,又有着不尽相同的地方。信息计量学着眼于“信息”本身的计量问题,文献计量学主要以作为情报载体的“文献”为研究计量对象(有时也涉及文献情报)信息计量学较之文献计量学来说,其研究范围更广一些。从任务和方法来看,信息计量学研究的任务更艰巨,更难找到恰当的定量方法及途径。涉及人类的认识和判断过程,主观性、模糊性。科学情报对许多人来说是文献的同义语;而且从信息计量学目前的研究内容和成果来看,很大一部分仍然可用“文献计量学”这个术语来概括3)与科学计量学:科学计量学——用定量分析的方法来研究科学本身发展规律的一门新的分支学科。信息计量学与科学计量学既有联系又有区别:联系:1)从研究目的来看,两者都是要探讨科学活动之间的内在联系,都把科学发展的特性和规律作为自己研究的基本任务之一。2)从研究对象和方法来看,两者极为类似。区别:1)信息计量学的范围要比科学计量学的范围广很多2)信息计量学和科学计量学的研究目的不一样。3)信息计量学和科学计量学的应用的领域也不同。从以上分析可以看出:科学计量学必然向信息计量学方向发展4)与网络信息计量学, 网络信息计量学和信息计量学的关系是继承和发展的关系,网络信息计量学是信息计量学为了适应网络环境而发展起来的一个新型分支学科5)与科学评价学 ,信息计量学的理论原理和方法技术都被广泛应用于定量科学评价中,对科学评价起到了巨大的推动作用第二章文献信息增长规律1、文献信息流的特性:1)静态特性:在一定时间内科学文献在空间的分布性质,如集中-离散分布、文献按著者分布、词汇在文献中分布、引文分布、主题相关分布等的规律性2)动态特性:指科学文献随时间的延续而增长和老化的性质。科学文献既增长又老化,在增长中不断老化,在老化之中又不断增长;增长是文献信息流的主要趋势。第三章文献老化规律1、文献老化的概念:随着时间推移,已发表的文献日渐陈旧,其利用价值不断减小而越来越少或不被引用的现象2、情报老化概念:情报价值随时间的推延而减小的现象3、文献老化的量度指标:1)半衰期:指某学科(专业)现时尚在利用的全部文献中较新的一半是在多长一段时间内发表的(共时半衰期)与该学科一半文献失效所经历的时间(历时半衰期)大体相当2)普赖斯指数:在某一个知识领域内,把对年限不超过5年的文献的引文数量与引文总量之比当做指数,用以量度文献的老化速度和程度3)剩余有益性指标:某一年份某一期刊被用户所利用的文献数被称为期刊有益性,经过若干年后,期刊还保留的有益性即剩余有益性,是期刊老化程度的一种量度。第四章文献信息集中与离散分布规律——布拉德福定律1、基本内容:(1)区域描述:如果将一定时间内(通常一年)的按某学科载文量等级排列的期刊划分为三个区,使每一个区所包含的相关论文数量相等,即恰好等于全部期刊发表的该学科文章总数的三分之一,便可发现:第一区(核心区)所涉及的文章来自数量不多但效率很高的n1中期刊;第二区(相关区)包括数量较大、效率中等的n2中期刊;第三区(外围区)包括数量最大而效率很低的n3中期刊。那么这三个区中的期刊数量成下列关系:n1:n2:n3=1:a:a2(a>0)(2)图像描述:如果取上述等级排列的期刊数量的对数(lgn)为横坐标,以相应的论文累计数R(n)为纵坐标进行图像描述,便可得到一条曲线——布拉德福分散曲线。分散曲线AB由两部分组成:对应核心区的上升的一段曲线AC和对于相继各区的直线CB,后来研究表明,拐点C点为核心区的分界点。布拉德福在研究时发现,从图像出发还可以得到另一个结论,即:n1:(n1+n2):(n1+n2+n3)=1:b:b2,记n1-2=n1+n2,n1-3=n1+n2+n3,则可将上式改为:n1:n1-2:n1-3=1:b:b2其中,n1——核心区的期刊数量n1-2——核心区和第二区的期刊累积数n1-3——全部三个区中的期刊累积数,即期刊总数N,b——分散系数第五章文献信息词频分布规律——齐普夫定律1、基本内容:如果把一篇较长文章(约5000字)中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为1,频次次之的等级为2,……,频次最小的词等级为D、若用Fr表示频次,r表示等级序号,则有:Fr*r=C式中C为常数。但这里的常数并不是绝对不变的恒量,而是围绕一个中心数值上下波动。齐普夫定律不仅可以用词的绝对频数表示,而且也可以用此的相对频数表示:令N为文章所包含的词汇总数,fr为第r级词的相对频率,则有fr=cr-1,c仍为常量,且c=C/N,而fr=Fr/N2、最省力法则:在任何语言中,凡是使用频率高的词,功能总是不会太大。因为词义本身在这个场合中价值小,因而传递它们所需要的“力”就不大,所以,此的出现频率与等级序号的乘积基本上稳定于一个常数.第六章文献信息作者分布规律——洛特卡定律1、主要内容:1)文字表述,检验发现,生产2篇文章的作者大约是生产1篇文章作者数的1/4,生产3篇文章的作者数是生产1篇文章作者的1/9……,写n篇文章的作者数是生产1篇文章作者数的1/n2;且生产1篇文章的作者数的全体作者的60%左右。可表述为:y(x)=y(1)/x2y(1)为写1篇文章的作者数,y(x)为写x篇文章的作者数。第八章文献信息统计分析法1、文献信息统计的原则和指标:文献信息统计的原则要求(1)针对性对不同的具体统计项目不同的要求(2)准确性核心要求(3)代表性抽样统计的代表性较强的样本(4)可比性设置文献指标和统计数据时(5)累积性利用文献的累积数来说明问题. 文献信息统计的指标:1)按描述对象分:藏书指标、引文指标、著者指标、流通指标、读者指标2)按数据形式分:绝对数指标、相对数指标3)按管理用途分:工作评价指标、工作控制指标2、文献信息统计的基本步骤(三部曲):(1)统计调查a.确定具体方法b.选准统计工具c.明确指标项目d.统计原始数据(2)统计整理a.计算b.排序c.表示(3)统计分析a.理论指导下的分析b.数值分析c.图像分析第十章引文分析法1、引文分析的基本概念:引文分析——利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法2、引文分析的基本类型:1)从引文分析数量上进行研究,主要用于评价期刊和论文2)从引文间的网状关系或链状关系进行研究。3)从引文反映出的主题相关性方面进行研究,主要用于揭示科学的结构和进行文献检索等3、引文分析的步骤:(1)选取统计对象根据所要研究的学科的具体情况,选择该学科中有代表性的较权威的杂志,确定若干期及若干篇相关论文作为统计对象(2)统计引文数据在选取的若干篇论文中,分项统计每篇论文后面引文的数量,引文的出版年代、语种、类型,论文作者的自引量等(3)引文分析在获取的引文数据的基础上,根据研究的目的,从引文的各种指标或其他不同角度进行分析(4)作出结论根据引文分析原理和其他一般原则进行判断和预测,从而做出相应的分析结论4、SCIE特点和检索:特点:①特色链接内部链接和外部链接②充分利用WWW网罗天下的强大威力③SCI网络版每周更新④SCI网络版允许检索整个数据库或指定检索年份⑤SCI网络版可以直接收录纯电子期刊。检索:①简易检索提供三种检索途径——主题、人名和地名②全面检索——可以根据需要设定不同的限制条件,使用户可以查到最新、最全、最准确的信息,是比较专业的检索方法。a.一般检索b.被引文献检索c.结构检索d.高级检索e.查看历史记录5、ESI的功能、特点和结构:结构:ESI的主要内容包括引文排位、高被引论文以及引文分析三大主要模块。①引文排位模块科学家排名、机构排名、国家排名、期刊排名②高被引论文模块高被引论文、热门论文③引文分析模块基线、研究前言,引文排位页面和高被引论文页面还提供了与顶尖论文页面、时间序列图链接功能:a.美国ESI的检索功能:b.美国ESI的评价功能c.进行学科结构、学科关系以及学科发展史的研究;为科学评价提供重要的数据源特点:①基本的分析工具②服务对象的广泛深入③综合全面的数据、论文和课题④与其他信息资源的链接和整合6、引文测度的主要指标分析:引文年代分析:从时间的角度对引文分布规律进行分析。可以反映被引文献的出版、传播和利用情况引文语种分析:考察和分析引文语种的分布对于人们有计划地引进外文文献、译文选题、外语教育等都颇有参考价值引文文献类型分析:科学研究中引证的文献面很广,有期刊、图书和特种文献。引文的国别分析:对引文的国别分析可以探明各国互引文献的状况,弄清国际文献交流的数量和流向。7、评价期刊的主要测度指标:1)期刊载文量:2)期刊引证率3)期刊被引率4)平均引文率5)影响因子影响因子=某刊前两年发表论文在该年的被引证次数影响因子=该刊前两年发表论文总数通常影响因子越大,可认为该刊在科学发展和文献交流过程中的作业和影响力较大,质量较高。6)即年指标:8、引文耦合与同被引的概念:(1)引文耦合——指引证文献通过其参考文献(被引证文献)建立的耦合关系。具体来说,如果A和B两篇文献共同引证了一篇或多篇参考文献,或者说它们共同具有某一篇或多篇同样的参考文献,则称A和B两篇文献具有引文上的耦合关系。(2)同被引——指两篇(或多篇)论文同时被后来的一篇或多篇论文所引证,则称这两篇论文(被引证论文)具有“同被引“关系。9、引文耦合和同被引的异同:相同:①都是指两篇论文通过另外一篇或多篇论文建立起来的关系,所以都可以反映出文献之间的联系程度和结构关系,在引文分析中属于同一种类型:即以文献之间的联系程度作为计量单位的网络结构分析,从引文角度揭示论文的主题相似性,以及相互之间作用和联系。②这两种分析方法都可用于研究文献关系,进行文献检索和揭示学科结构等。观察处理问题的方法及主客体不同①引文耦合反映的是两篇引证文献之间的关系,同被引反映的是两篇被引证文献之间的关系。前者由两篇文献的作者共同建立的,后者是由引证它们的作者各自建立的。②引文耦合强度是固定不变的,同被引强度则随时有可能发生变化。③引文耦合反映的文献间的关系是一种固定的长久的关系,而同被引反映的则是变化的或暂时的关系。因此,引文耦合形成的模型的静态结构模型,而同被引则是动态结构模型。④引文耦合是回溯的,属于“回向引证”,而同被引则是展望性的,属于“前向引证”。⑤对于研究和解释科学文献的内在联系与规律,描绘科学发展的动态结构来说,同被引比引文耦合更具有优越性,更适合当代情报科学研究的对象是不断变化和发展的特点。10、引文分析法的局限性:著者引证文献是一个人为控制的思维和判断过程,而作为其表现形式的引证文献,仅仅是宏观的、表面的测度。(1)文献被引证并不完全等于重要(2)著者选用引文受到可获得性的影响(3)引文关系上假联系的影响(4)马太效应的影响11、为什么要进行引文分析:1)测定学科的影响和重要性2)研究学科结构3)研究学科情报源分布4)确定核心期刊5)研究科学交流和情报传递规律6)研究文献老化和情报利用规律7)研究情报用户的需求特点8)科学水平和人才的评价第十二章信息计量学在信息资源管理与研究中的应用1、核心期刊的概念:是指针对某一学科或专业领域来说,刊载大量专业论文和利用率较高的少数重要期刊,就称为该学科(专业)的核心期刊2、核心期刊的测定方法:(一)测定方法的两种基本类型:(1)利用信息计量学工具和指标直接选定各学科的核心期刊(2)利用文献计量学方法,按一定基本步骤测定。(二)从测定标准来划分有以下四类方法:1)以载文量为标准的方法2)以摘引率为标准的方法3)以流通量为标准的方法4)综合评价法布氏定律法:累计百分比法E.文摘法引文法G.流通率法H.综合评价法3、测定核心期刊的重要意义:(1)图书情报管理单位科学管理上的需要(2)科技工作者重点阅读的需要(3)提高信息检索和文献信息服务效率的需要第十三章信息计量学在科技管理与预测中的应用(论述)1、信息计量学与科学学研究的基本原理:科学学的发展规律,在很大程度上是有人才、经费、成果的消长演变、增长速度、学科构成及其比例关系来体现,而这方面的变化又反映在科学文献的各种变化上。这是因为科学文献是科技知识和成果的客观记录,是科学存在的表现形式。科学文献的数量和质量是对科学技术水平的一种度量。根据科学文献的内容构成和数量的变化规律,可以归纳总结、分析或评价科学技术的历史和现状,以及预测整个科学系统发展趋势和发展规律。1)科学文献量可以反映科学或技术发展的成都和阶段2)科学文献量的国家分布或语种分布,反映不同国家某项科学技术的研究力量和技术优势3)科学文献量的增减变化速度反映科技发展的速度,文献量的翻倍周期一般可作为衡量科技发展的尺度4)文献量的突变反映了科技发展的转折性变化:由增长趋势向平缓趋势、衰落的趋势转变,或从发展过程向衰退过程转变等5)科研机构发表的文献量可以反映该机构的技术实力和研究成果,等等。2、信息计量学的基本内容:(1)研究科学发展特点(2)研究科学结构①利用书目分析法②利用引文分析法③利用词频分析法研究学科发展结构3)研究科技史(4)研究科技政策3、信息计量学评价人才的原理:(1)科技人员的成就与学术造诣与其发表的文献数量有关。(2)科技人员的成就和学术造诣与其发表文献的被引次数有关。4、信息计量学评价人才的方法:(1)书目分析法。即统计某一时期各位科技人员在公开出版物发表的文章的篇数,并作为篇目,然后将各篇目比较,发表文章多的一般被认为成果较多,简单但不充分。(2)引文分析法。一般采用4个指标:论文总数,被引证总数,每篇论文的被引次数,高被引论文数。具体方法是直接统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论