自学-从0开始学CiteSpace_第1页
自学-从0开始学CiteSpace_第2页
自学-从0开始学CiteSpace_第3页
自学-从0开始学CiteSpace_第4页
自学-从0开始学CiteSpace_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自学——从0开始学CiteSpace研一时,有门课的课程作业之一是介绍一种方法论,这里把当时的课程作业分享出来,教你如何从0开始一步一步操作CiteSpace。CiteSpace作为文献计量法的文献处理工具,入门还是比较简单的。使用工具最难的一步就在于快速入门,尽管这篇文章和这些图的质量远远没有达到发表论文的水平,不过还是有价值的。希望对想要了解CiteSpace、有使用需求的人有帮助。明天会再更新一篇利用CiteSpace分析的较为完整的课程论文。目录一、CiteSpace——基于文献计量法设计的数据可视化软件(一)研究方法——文献计量法(二)CiteSpace是什么(三)如何下载CiteSpace二、以CNKI为例进行案例分析(一)数据处理1.

获取数据

2.

转换数据(二)建立项目/设置参数(三)可视化结果1.关键词共现图谱的方法论基础、含义及分析2.聚类的功能三、教师驻校培养模式研究的计量学分析结果(一)教师驻校培养模式研究文献年度分布(二)作者分布四、教师驻校培养模式研究热点分析(一)研究热点主题分析(二)研究领域分析五、教师驻校培养模式研究的演进路径教师驻校培养模式研究发展及热点演进的文献计量学分析——基于CitesSpace的可视化分析本文旨在通过借助工具CiteSpace(可视化文献分析软件),来归纳和展望国内外对于教师驻校培养模式研究的发展历程、宏观趋势以及研究热点变化,达到论述文献计量法这一方法的目的。一、CiteSpace——基于文献计量法设计的数据可视化软件(一)研究方法——文献计量法文献计量法是以文献体系和文献计量特征为研究对象,采用数学、统计学等计量研究方法,研究文献情报的分布结构、数量关系、变化规律和定量管理,进而探讨科学技术的某些结构、特征和规律的一门学科。CiteSpace作为文献计量法中的一项文献处理工具,能帮助我们快速分析文献。(二)CiteSpace是什么CiteSpace(可视化文献分析软件)是由美国雷德赛尔大学信息科学与技术学院的陈超美博士与大连理工大学的WISE实验室联合开发的科学文献分析工具,该软件将文献计量法、信息可视化法以及数据挖掘法结合起来,通过绘制知识图谱以探寻不同学科领域研究热点与趋势演化的关键路径及知识转折点。利用CiteSpace可以对文章作者、机构和关键词进行分析。例如,在CiteSpace中使用关键词共现来探究该领域的研究热点,关键词突现预知研究前沿,关键词时区了解研究趋势、发文机构分析和发文作者的分析.CiteSpace的设计理念分为哲学角度和概念模型两个方面。从哲学角度来看,该软件首先参照了波普尔的三个世界理论,即整个世界被划分为物理世界(世界Ⅰ)、精神世界(世界Ⅱ)、客观知识世界(世界Ⅲ)。世界Ⅰ是外在接触到的具体世界;世界Ⅱ是人类脑中的精神世界,存在隐形知识;世界Ⅲ是人类创造的知识体系。传统看世界的方式是人类通过世界Ⅱ来感知世界Ⅰ,形成世界Ⅲ。CiteSpace是通过将世界Ⅲ中的知识内容进行知识图谱可视化来认识世界Ⅰ,即借助世界Ⅱ通过世界Ⅲ来认识世界。其次是托马斯·库恩的科学革命的结构。库恩认为,科学的推进是建立在科学革命上的一个往复无穷的过程。这个过程中会出现一个又一个的科学革命,人们的认识通过科学革命而接纳新的观点,而新观点的重要性在于对我们所观察的对象能否作出更另人信服的解释。库恩的科学革命是新旧科学范式的交替和兴衰。科学认识中会出现危机,而危机所带来的新旧范式的转换都将在学术文献里留下印记。库恩的理论给我们提供了一个具有指导意义的框架,如果科学进程真像库恩所洞察的那样,那我们就应该能从科学文献中找出范式兴衰的足迹。第三,普赖斯科学前沿理论:“论文会因为引证关系而形成网络,人们可以借助于图论和矩阵的方法来加以研究…论文一定会聚集成一团,而形成几乎绘制成地图的'陆地’和'国家’”。基于普赖斯的论断,才形成了CiteSpace的概念模型。第四,博特的结构洞理论,即社交网络中不是每个人和所有其他人都有直接联系,如果如此,便有了结构洞,即结构上的不完备。这种情况下,信息在网络中的流动受到其结构上的约束。每个人在网络中所能接触到的信息内容不再相同,传递和接受的时间也会出现差别。Burt发现位于结构洞周围的人往往具有更大的优势。CiteSpace也是基于此理论来识别关键节点和关键位置第五,信息觅食理论,该理论用来解释模拟人们在网络环境中的信息搜寻行为,对获取信息的效率进行运算,以最小搜索成本获取最大利益。该理论用于CiteSpace网络结构探测,开发出探求知识演变路径的方法和技术。CiteSpace的概念模型认为,“如果把某一领域的研究前沿定义为一个研究领域的发展状况,那么研究前沿的引文就形成了相应的知识基础。”在CiteSpace中研究前沿和知识基础被定义如下:研究前沿是指某个科学领域中的施引文献群组。从两个方面体现研究前沿的特征:1.施引文献群组本身的内容;

2.施引文献群组引用的参考文献。

具体可以体现为:1.施引文献群组使用的关键词;

2.施引文献群组引用的参考文献。

知识基础是指某个学科领域中相对于研究前沿文献集的所有前期文献集合。具体表现为文献共被引聚类。在此基础上,理论和技术的发展为CiteSpace提供了基础——理论基础:引文分析;技术基础:信息可视化。目前CiteSpace支持以下数据库导出的文献题录及参考文献数据:图1.CiteSpace支持数据库导出的文献题录及参考文献数据

当前研究中研究英文文献主要采用webofscience数据库,中文数据主要采用CNKI和CSSCI数据库。研究者可根据自身的需求选择数据来源,并注意其所要求的格式和文件名。需注意的是:所有手动下载的数据文件的文件名必须以download开头,如download2020.txt。若需要对被引文献进行分析,必须选择具有参考文献的数据库,否则共被引部分的功能将无法实现。(三)如何下载CiteSpace1、下载网址:/~cchen/citespace/download/2、进入网站,点击download弹出保存后点击保存。3、解压安装包,双击“StartCiteSpace_Windows.bat”文件,进行CiteSpace的安装。由于软件运行需要java环境,验证java版本地址为:https:///zh_CN/download/installed8.jsp.安装适配电脑的java地址为:https:///en/download/.选择适合自己的语言环境输入相应的数字后点击回车。之后根据其提示,一直点击“下一步”安装即可。安装完成之后,再双击“CiteSpaceV.jar”文件,等待一会儿,本文使用5.7.R2(64-bit)版本,操作界面如下:图2.StartCiteSpace界面在问号后输入2选择中文语言跳转进入软件,在是否同意在文章中引用CiteSpace相关的文献中点击“Agree”,即可成功打开CiteSpace进入以下界面(图3.CiteSpace主界面),界面主要分为上方的菜单栏、左侧上方的工程区、左侧下方的运行进度区和右侧的功能选择区。图3.CiteSpace主界面菜单栏是CiteSpace的功能与参数区,包括File(文件)、Projects(项目)、Data(数据)

Network(网络)、Visualization(可视化)、Geographical(地理化)、OverlayMaps(叠加分析)

Analytics(文献网络分析报告)、Text(文本)、Preferences(偏好设置)、Tutorials(教程)、Resources(资源)、Community(社区)、Help(帮助)、Donate(捐献)。工程区又叫操作区,该区域主要用于新建项目,点击New即可进入新工程的设置界面。运行进度区可以展示CiteSpace在运行过程中的数据操作。功能选择区包括1、Timeslicing时间切片区,可以选择待分析文献的起止时间;2、TextProcessing文本处理区(包括Termsource选择聚类词来源和Termtype聚类词类型);

3、Nodetypes网络配置功能区,这部分可以选择节点类型,选择将直接决定会生成什么样的图谱(在其中,不同颜色的选项代表不同的含义:蓝色部分关于合作网络分析,对象可以是作者、机构或国家,如可以分析哪些作者、机构或文章的发文量比较多,哪些作者之间的合作比较多;绿色区是共性分析,其对象可以是主题、关键词、来源或WOS的分类,其中主题和关键词回答的问题是:哪些主题词或关键词出现的次数比较多,以及哪些词常常在同一篇文章中出现,反映了研究领域的热点词;红色部分是共被引分析,对象可以是参考文献、文献作者和期刊,回答的问题是哪些文献、作者和期刊被引用的次数最多,哪些常常被一起引用,这样的问题则反映了内容的相关性;灰色部分则是耦合分析);4、Links连接强度计算(·Strength分析对象数据之间的连接强度·Scope范围);

5、Selectcriteria阈值选择标准;

6、Pruning剪枝方式选择(优化结果);

7、Visualization可视化模式。二、以CNKI为例进行案例分析本文以中国知网(CNKI)为例,以“教师驻校模式”为检索关键词用CiteSpace进行数据分析。分析过程包括以下几个部分:数据处理、建立项目/设置参数、可视化结果、结合图谱结果进行初步解读、分析结果并完成撰写报告。本文着重对前三个过程展开论述。(一)数据处理1.获取数据

(1)在桌面建立一个名为“data

for

citepace”(可任意命名)的数据库,用来专门存放citespace的数据。在其下以自己的研究主题再命名一个子文件夹(如图4,本文命名为“教师教育”),在子文件夹下新建四个文件夹:“input”、“output”、“project”和“data”。图4.新建“data

for

citespace”的数据库(2)进入中国知网(旧版)进行数据下载,在高级检索中限定主题或者关键词(本文在高级检索中输入“教师驻校模式”的关键词,选择中文文献)。(3)点击“全选”之后有35篇文献,筛选并剔除无直接相关的文献两篇,分析剩余33份与研究主题直接相关的。若要导出大批量数据,可以在“每页显示”中选择50,再根据研究需要,如剔除报告、会议等相关文献。进入下一步,在“导出/参考文献”跳转的页面“请点击这里”中进行筛选。图5.选择数据(4)点击“导出/参考文献”选项,点击“文献导出格式”-“Refworks”-“导出”,将这份下载的txt文本格式的文件命名为download1,并放入“input”的文件夹中。图6.文献输出图7.

命名导出的参考文献2.转换数据(1)打开5.7.R2(64-bit),等待片刻后进入主界面(图3),点击Data(Import/Export)选择CNKI——————————————————————————(2)Data→Import→download1(3)Inputdirectory选择“input”文件夹,Outputdirectory选择“output”文件夹点击CNKIFormatConversion2.0,完成转换。可点击output文件夹检查数据转换与否。(4)把output里的数据复制到“data”文件夹下(二)建立项目/设置参数1、新建项目。回到主界面,在控制面板菜单栏中点击File建立新项目,在“Title”中命名英文格式的项目,本文命名为Teacher

Residency。2、功能选择区进行参数选择。时间切片区From2001JANTo2020DEC,NodeTypes选择Keyword,Pruning在循进中选择Pruningslicednetworks。点击”GO!”出现图8选项。3、点击可视化操作”Visualize”图8.可视化选项(三)可视化结果图9.菜单栏的工具功能简介1.关键词共现图谱的方法论基础、含义及分析共现分析的方法论基础是心理学的邻近联系法则和知识结构及映射原则。邻近联系法则是指曾经在一起感受过的对象往往在想象中也联系在一起,以致于想起它们中的某一个的时候,其他的对象也会以曾经同时出现时的顺序想起。关键词共现、作者共现、机构共现、国家共现、论文共现、期刊共现都是共现分析的一种。其中,作者共现分为作者合作网络分析、作者共被引分析[作者同被引];机构共现分为机构合作网络分析;国家共现又分为国家合作网络分析;论文共现分为文献共被引分析[文献同被引]和文献耦合。参数中可以看见网络的节点数、边数和网络密度。图中所示标注的点即节点,一个节点代表一个关键词。边数是关键词之间的连线数,关键词之间的连线是指关键词在同一篇文献中出现过,因此二者会有一根连线。图中圆圈大小代表关键词,频数越大圆圈越大。线条代表关键词之间的联系,线条颜色与图中上方的年份相对应,用于标志每年都有哪些关键词。关键词是对一篇文献的核心概况,分析关键词可以对文章主题进行窥探。一篇文献中的多个关键词必然存在着某种联系,那么这种联系可以用共现的频次来表示。一般认为,词汇对同一篇文献中出现的次数越多,则代表这两个主题之间的联系越紧密。频次是关键词出现的次数,年份代表某个关键词最早出现的年份是什么时候。其中阈值越小,显示的数量越多;阈值越大显示的关键词越少。综上所述,共词分析法,即利用文献集中词汇或者名词短语共同出现的情况,来确定这篇文献集所代表学科中各主题之间的关系。统计一组文献的主题词两两间在同一篇文献出现的频率,便可形成一个由这些词对关联所组成的共词网络。2.聚类的功能共词分析法的原理是通过利用文献集中词汇对或名词短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系。掌握以上原理,是为了获得学科之间各主题之间的关系,由于主题通过使用关键词所表示,它的本质便是关键词之间的联系。同时,联系越紧密的关键词会形成一个小团体,进而能把小团体之间的关键词进行归纳总结,然后总结出一个主题,再对主题进行详细论述。以上操作步骤的本质是做聚类分析。点击”K”查看聚类,这一功能是当看不清或看不懂图谱时可以利用的方法。图10.关键词显示(聚类之间的间距可以在面板中调整)需要补充的是,上图并没有显示全部聚类,原因是CiteSpace默认当关键词<10时,不显示一部分聚类。可以在”Filters”里取消”ShowtheLargestConnectedComponetOnly”这个选项,再重新聚类。也可以根据自己的需求设置确定数量的聚类,此时操作”Clusters”-”ShowtheLargestKClusters”后输入自己需要的所含关键词最多的前几个聚类数;或者用序号来表示聚类。图11.部分聚类显示图12.全部聚类显示三、教师驻校培养模式研究的计量学分析结果(一)教师驻校培养模式研究文献年度分布文献发表数量的变化能够在一定程度上反映某一研究领域的发展状况。研究对近二十年来我国教师驻校模式研究文献的年度分布情况进行统计,详见下图。(二)作者分布对文献作者情况进行计量学分析,不仅可以找出教师驻校培养模式研究领域的核心作者,也可以看出该领域学者之间的交流、合作情况。运行CitesSpace,设置时间跨度为“2000-2020年”,时间切片为1,节点类型中选择“作者”,阈值为Top=50,关键词引文数(C),关键词被引数(CC)、关键词共被引数(CCV)均设置为0、1、20,最终得到网络节点为42,连线数为14,密度为0.0163的作者共现知识图谱,详见下图。四、教师驻校培养模式研究热点分析(一)研究热点主题分析关键词是一篇文章核心内容的凝练,且能反映这一领域的研究热点。[2]本文采用CitesSpace对教师驻校培养模式研究文献中出现的关键词进行分析,以了解近二十年来我国教师驻校培养模式的研究热点,绘制关键词知识图谱,详见图10。由图可以看出热点的词汇有“教师教育”“教师培养”“驻校培养”“薄弱学校”“城市教师驻校模式”,且这些热点词汇之间的联系也较为紧密。为进一步明确我国特殊教育教师研究热点主题,将主题词中介中心性及频次导出并制作成表格,详见表1。表1高频关键词频次、中心性关键词排序序号关键词频次序号关键词中心性1教师教育131教师教育0.512美国122美国0.383城市教师驻校模式53培养模式0.254培养模式44城市教师驻校模式0.155驻校模式45薄弱学校0.156教师培养46驻校教师0.157城市教师37教师培养模式0.118模式38教师培养0.099城市校区39教育硕士0.0910薄弱学校310全日制教育硕士0.08中介中心性代表着以该关键词为主题的研究对网络图谱中其他关键词的中介效果,中介中心性越高,其影响越显著。[3]因此,该研究将频次与中介中心性共同作为研究热点的判断依据。频次排名较高且中介性大于0.1的关键词包括“教师教育”“美国”“培养模式”“城市教师驻校模式”“薄弱学校”“教师培养模式”等。这些关键词基本反应我国近二十年来教师驻校模式研究的热点及核心主题。(二)研究领域分析关键词聚类可将共现知识图谱中复杂的连线关系进行分析,以形成当前教师驻校模式主要研究领域。在调节关键词共现知识图谱的基础上,标识每个聚类,详见图11。第一个聚类为“城区教师驻校模式”。第二个聚类为“培养模式”。第三个聚类为“教师培养”。第四个聚类为“模式探析”。第五个聚类为“教师”。第六个聚类为“全日制教育硕士”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论