基于ciespace的情报学知识图谱可视化分析_第1页
基于ciespace的情报学知识图谱可视化分析_第2页
基于ciespace的情报学知识图谱可视化分析_第3页
基于ciespace的情报学知识图谱可视化分析_第4页
基于ciespace的情报学知识图谱可视化分析_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于ciespace的情报学知识图谱可视化分析

0知识图谱的应用信息社会为信息的发展带来了机遇和挑战,扩大了信息的研究和应用,加快了信息的发展。信息披露在不断发现、获取和应用知识方面发挥着作用。近10年来,国际情报学包括我国在情报学理论与方法、信息检索、情报分析与研究、信息服务与用户研究、信息计量学等重要领域都取得了较大的进展,本文旨在通过知识图谱方式粗略的展示近10年来情报学领域的发展情况。科学知识图谱不仅能够描绘、研究、分析所用的知识资源,而且能够找出其相关联的地方,有助于了解和预测科学前沿和动态,挖掘开辟新的未知领域。科学计量学和可视技术的进步,促进了知识图谱应用的广泛研究。知识图谱在教育科研、技术更新、智力结构分析和社会问题等方面应用很多。本文采用目前在国际上广泛使用CiteSpaceII信息可视化软件对所得数据进行图谱绘制并分析。CiteSpaceII是一款Java环境下的可视化共引网络分析软件,由著名的信息可视化专家、美国德雷克塞尔大学的陈超美教授在引文分析理论的基础上借助Java语言开发的。CiteSpaceII软件最显著的一大优势就是科学的检测关键节点,然后用紫色的圆圈在可视化的网络中加以显示,由于视图效果极为明显,便于观察,用户能够很轻松地获取中心度高的节点的信息。此外,CiteSpaceII还有关键词聚类和膨胀词探测功能,以此便可以确认信息素养领域的研究热点与研究前沿。Garfield在2004年利用开发的HistCite软件包,通过某一研究领域的文献以及相互引用情况,来分析以及判定其中的关联以及把握学科的进展,产生编年图谱,特别突出高被引文献并且按年代排列。2008年,NerurS.P.等利用作者共被引图谱研究了战略管理领域的智力结构。陈超美等应用多视角共引分析方法,包括作者共被引和文献共被引,分析了1996至2008年间12个情报学期刊的三种共引图谱。CoboM.J.等将“知识图谱”主要限定在Sciencemapping、Bibliometricmapping、Literaturemapping、Mappingknowledgedomain等内容,认为其主要是运用文献计量学方法,通过文献知识单元分析来可视化科学知识的结构、关系与演化过程。本文将所下载的数据导入到CiteSpaceII软件,进行一定的设置,从文献共被引、作者共被引、关键词共现等维度形成相关图谱,并进行分析,从而对近年来国际情报学领域的研究情况得到一定程度的了解,并得出相关结论。1数据准备和基本统计结果1.1数据来源及研究载体本文中所使用的数据来源于WebofScience数据库中的三个子库社会科学引文索引(SS-CI)、科学引文索引拓展(SSCI-EXPANDED)、科技会议录索引(CPCI-S)。数据采集时间为2013年4月2日,时间跨度为2003年1月1日至2012年12月31日,文献类型为“Article”,检索范围为上述三个数据库中的24个国际情报学重要期刊(见表1),这些期刊刊载了国际情报学领域研究的主要成果。经整理筛选,共检索到文献9704篇,这些文献包括10765位作者,涉及研究机构3063家,被引频次为49324次,平均被引5.08次,施引文献达20481篇,h指数为59。将这些文献以download*.txt为文件名,选择带参考文献的全著录格式记录下来,每一条数据记录都包含了文献作者、题目、主题、摘要和文献的引文等内容。1.2基本统计结果1.2.1情报学的总体文献数量分析图1反映了2003-2012年情报学领域每年的论文分布情况,从图1中可以看出,近十年来情报学领域的研究逐渐处于一个平稳成熟的阶段。自2003年起每年的发文数量略有增长,年平均增长约30篇,至2007年趋于平缓,不再有明显波动。可以认为,情报学领域近10年研究处于平稳发展时期,情报学基础理论和方法已经趋于成熟,不是突飞猛进的发展时期。1.2.2文献的被引用频次如图2所示,2003-2012年情报学领域文献被引频次总计49324次,平均每项被引用次数5.08,h指数为59。从图2中可以看出,自2003年起,文献的被引用频次逐年增长,年均增长约1000次,至2012年略有下降。近10年在情报学领域发文量较为稳定的情况下,其被引频次以稳定斜率增长,这可以认为,情报学领域的研究正逐渐趋于平稳的发展方向,被引频次增长反映了情报学领域一些文献及其提出的论点逐步发展成熟并成为关键甚至核心理论。1.2.3研究项目国家分布表2列出了2003-2012年情报学领域发文量排名前20位的国家/地区。可以看到,美国、英格兰、中国发文量居于前3位,美国发文量为3407篇,远远超过其他国家。情报学研究较强的欧洲国家荷兰、比利时和瑞典也居于前20位,中国台湾位居第6位,都体现了不俗的实力。另外,传统科技强国德国、法国和日本均居于前20位。发文量较多的国家主要集中在美、欧洲国家和东亚三国(中日韩)。结合高被引论文的国别分布,可以看到,近10年情报学领域的研究热点主要集中于欧洲及美国,核心的文献也多出自于这些国家/地区。2被引用的文献和作者被引用的地图及其分析2.1文献计量学与研究进展将数据导入CiteSpaceII软件,节点类型设为共引文献(CitedReference),阈值设为(2,2,20)(3,3,25)(3,4,30)运行程序,获取文献共被引图谱(见图3)。从图3可以看出,近10年情报学领域的文献引用比较多的参考文献还是一些比较经典的文献,有来自伦敦大学信息科学中心(CenterforInformationScienceTheCityUniversity,London)的NicholasJ.Belkin于1982年连续发表了信息检索方面的两篇论文,其中第一篇论文《AskForInformationRetrieval:PartI.BackgroundAndTheory》是信息检索领域中理论研究的典范。该文通过研究交互式的信息检索系统对基于信息需求的异常状态的知识进行明确的结构化表达。有著名教授HenkF.Moed于2005年发表的CitationAnalysisinResearchEvaluation专著,该书是信息科学与管理学方面的经典之作,主要研究学者的科研绩效,将引文分析作为工具来评估学者的科研影响力,创新性及成果质量。也有由ChristineL.Borgman发表在2002年ARIST上的论文《ScholarlyCommunicationAndBibliometrics》,该论文在研究文献计量学发展历程的基础上提出了利用文献计量学探索研究学术交流这一方式的可行性,在此后的发展中情报学领域的学者以该文为核心,对所提出的方式进行了实际的应用,随着可视化方法与计量学的结合,利用文献计量学对学术交流乃至信息交流的规律进行分析研究成为极普遍的方式。可见,近10年,在情报学的基础理论和方法上,研究者们参考的大都是较早的经典文献,情报学理论与方法在近10年大致可以认为还未取得新的突破。2.2情报学的发展将数据导入CiteSpaceII软件,节点类型设为作者共被引(CitedAuthor),阈值设为(3,3,25)(3,4,25)(4,4,30)运行程序,获取作者共被引图谱(见图4)。图4显现的高被引作者,也是中心度较高的作者(因篇幅所限,未列出中心度表,后文同),他们是近10年来情报学领域的接触研究者,也是被引次数较多的作者。这几位作者的研究领域涵盖了信息检索,计算机科学、社会网络分析、信息计量学、科学计量学。其中,排在第一位的是荷兰著名学者,2003年普莱斯奖获得者雷迭斯多夫(LoetLeydesdorff),他提出的大学—产业—政府关系的三螺旋模型对当代社会学、信息计量学及科学计量学带来了深远的影响。计算机科学技术专家杰拉德·塞尔顿(GerardSalton)毕其一生致力于信息检索领域,他和他在康奈尔大学的团队开发出了智能信息检索系统。英国的信息科学专家迈克·塞沃尔(ThelwallM)2009年编著的《链接分析—信息科学的研究方法》一书,从情报学视角系统阐述了链接分析理论、方法与应用,为这一Google核心技术奠定了扎实的理论基础。图4中显示度较强的Belkin,是著名的信息检索方面的专家,他所提出的一系列信息检索技术在该领域始终具有很强的影响力,他发表的文献涉及信息管理、信息系统等相关领域,对这些领域的研究发展也起着推动作用。最令人拍手称奇的当属Garfield,他在20世纪80年代刊登的文献竟然能够常胜不衰,可见这位科学家在情报学的泰斗地位。上述的情报学家一直对情报学领域有着不可估量的贡献。特别是Leydesdorff,尽管他现在被引用的次数没有力拔头筹,但他在该领域的核心程度是不言而喻的,他在该领域有着极强的影响力,对未来学术方向的发展变化可能对情报学领域产生深远的影响。3通过本地搜索共享光谱和突现词时间分布分析3.1情报学的研究方向将数据导入CiteSpaceII软件,阈值经反复测定最后设定为(2,3,15)(3,3,20)(3,4,20),剪切算法选择最小生成树(minimumspanningtree),运行调试结果如图5所示,获得关键词共现图谱。如图5所示,居于中间最大节点及其周边部分的词是“science”“innovation”“citation”等词汇,这些都是情报学的常用关键词,不说明太多问题。而在往外偏出的部分,有“h-index”“pattern”“bibliometrics”等词汇,这属于科学计量学和文献计量学的范畴。再往旁边是“journal”“indicators”“electronicjournals”“interlending”等词汇,这些词汇属于期刊和图书文献学的词汇,反映了图书馆学同情报学有着密切的联系。而在图5的左上方,“informationretrieval”“retrieval”“world-wide-web”加之“seeking”等一系列词汇则是反映了信息检索领域的研究。一方面,在网络信息时代下,情报学研究方向更多的是转移到对于信息的检索这一板块;另一方面,情报和信息的概念的交叉和联系也说明了信息的获取和检索是情报学的重要研究内容。从关键词频度排序来看,居于前列的具有代表性的词有“information”“internet”“retrieval”“informationretrieval”“libraries(library)”“seeking”“indicators”“networks”“bibliometrics”等等。这些词分别反映了信息检索学科、图书馆学、文献计量学等研究方向。从关键词的频度和中心度综合来看,不难看出各个研究方向的演化趋势。a.信息检索方向。可以看到“seeking”这个关键词的代表性,并由此可以发现一系列的诸如检索(retrieval)之类的词,说明情报获取是情报学研究的方向和热点。“Worldwideweb”“informationretrieval”也说明了信息网络化的趋势。由此来延伸出的信息检索研究方向成为情报学的重要研究内容,有很多类似和重合的地方,信息检索和情报的获取有着异曲同工之妙。b.文献计量学方向。可以看出,“bibliometrics”“h-index”“citationanalysis”等文献计量学词汇也都排在靠前的位置,侧面反映出文献计量学与其联系也是密不可分,与情报学有着重合部分,有着文献获取和总结、统计等情报学等独特的特点,可以说是情报学的一个重要方向。c.图书馆学和数据库方向。“interlending”“databases”等图书馆学和数据库的相关关键词出现得也很频繁,很直观地看出,这些都属于研究热点和研究前沿,图书馆学和数据库对于情报学来说,大有裨益,主要体现在情报的存储上,情报在获取之后,要设法对其进行保存和标准化,这就需要图书馆学和数据库等知识,这提供了二者之间连接的一个桥梁。3.2国际情报学领域研究的范围逐渐集中将主题词设为BurstTerms,节点设为Keyword,区域最大关联系数设为50,阈值为(3,3,15)(4,4,20)(5,5,25),以时间线(Timeline)形式输出图谱,得到情报学领域热点词按时间分布的图像如图6所示。从图6可以看出,主要的热点词汇多集中于2006-2010年,这说明当前的国际情报学领域研究已趋于成熟,理论基础较为完善,研究范围也由宽泛而逐渐趋于集中。突现词排名前三位的是“world-wide-web”“seeking”“citinganalysis”,之后是“science”“behavior”“patterns”“journals”“searchengines”“relevance”“classification”“bibliometrics”“h-index”等词。这些排名前三位的突发词分别产生于2010年,在2010年的变化最为迅速,可以说是急剧上升,可以看出2010年的研究领域主要体现在Bibliometrics(文献计量学),尤其有代表性的是h-index,是一个显而易见的新兴词汇,但是在短短的几年中,其发展速度之快是令人难以想象的,在未来的十年甚至几十年中,他可能得到更广泛的运用。综合关键词共现和突现词的图谱来看,可以得到以下8个方面的热点研究方向及其所包含的关键词。3.2.1数字图书馆的发展digitallibraries,library,libraries,design随着信息数字化的不断发展,数字图书馆的概念及其研究范围得到拓展和升华,数字图书馆已不仅仅是单纯的“图书馆”,各个机构利用数据库技术在本机构内进行机构库建设,从而保存本机构的数字资源。当前数字图书馆建设的着眼点主要在于对其中信息资源本身的建设,而较少关注用户体验。随着信息存储技术的日趋成熟,优化用户体验在今后将可能成为数字图书馆领域新的热点。3.2.2电子期刊的反照表electronicjournals,journals,database观察图6可以发现,电子期刊的引文年环虽然较小,但其中心度极高,是图书情报学领域的又一大热点问题。通过分析情报学领域共引文献可以发现,近年来研究成果中所引用的文献多刊登在期刊甚至是纯电子期刊中。3.2.3研究热点分析citationanalysis,evaluation,indicators,researchperformance,scientometrics引文分析多被用来分析科研领域的研究热点及前沿发展趋势,通过对大量文献数据进行处理,利用词频分析发或是现代软件的可视化方法来获取某一领域内文献及作者被引用核心程度,从而确定该领域的研究热点。3.2.4馆际互借,方便读者与实验文献interlending,interlibraryloan随着信息技术的不断发展,数字图书馆的日趋成熟和普及,馆际互借的思想得以推广和发展。馆际互借是图情学经久不衰的热点。由于空间及经费的限制,任何一个图书馆在藏书数量上都存在上限,无法全面满足所有读者的需求,因此馆际间的合作自然形成。本馆没有的文献在读者需要时,根据馆际互借制度,依照相关的方式及收费标准从外馆借入。外馆缺少书籍文献时使用同样方法。3.2.5网络信息的统计分析Internet,world-wide-web,cybermetrics,SE基于网络的情报学领域热点问题中,最为热门的是网络计量。它采用数学、统计等定量方法对网络信息的存储、传递方式、引用频率等进行统计分析,并以科学定量的方式揭示这些网络信息间的规律及联系。通过结论中的信息间的规律及联系,可以优化网络资源配置,提高网络利用效率,改善网络的组织管理,提升信息管理水平,目前网络计量在网站搭建、搜索引擎建设方面应用广泛。3.2.6nt知识管理的研究热点knowledge,knowledgemanagement知识管理的研究热点主要集中在图书馆和企业,另外还有对电子政务的知识管理研究。知识(knowledge)一词在情报学领域逐渐处于核心地位表示着情报学研究正向知识化迈进。3.2.7研究的问题分析seeking,searchengine,informationretrieval围绕信息检索展开的情报学领域研究伴随着现代化搜索技术的发展不断前进,其热点研究问题始终是探究查找方式的优化。自从搜索引擎出现以来,人们开始走向信息化的情报获取道路。现代查找技术是与网

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论