数据挖掘技术文献研究refviz_第1页
数据挖掘技术文献研究refviz_第2页
数据挖掘技术文献研究refviz_第3页
数据挖掘技术文献研究refviz_第4页
数据挖掘技术文献研究refviz_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据挖掘技术 文献研究 refviz第 26 卷第 4 期 2019 年 8 月中国医学教育技术CHINA MEDICAL EDUCATION TECHNOLOGY Vol 26No4Aug 2019 数据挖掘技术在文献研究法中的应用以 RefViz 为例李华新,李望秀南华大学计算机学院,湖南衡阳 421001【摘要】:在科学研究文献激增的今天,将数据挖掘技术引入文献研究领域势在必行。 RefViz是一款可视化的数据挖掘工具,利用其独特的算法能够发现文献之间的关联性,并从 中挖掘出某一研究领域的热点问题和发展趋势。【关键词】:数据挖掘;文献研究法; RefViz ;移动学习【中图分类号】:G4

2、0-057【文献标志码】:A【文章编号】:1004-5287 (2019) 04-0430-04Application of data mining technology in literature research methodology :Taking RefViz for example Li Huaxin, Li WangxiuInstitute of Computer Science and Technology , University of South China Hengyang 421001 【 Abstract 】: Today scientific research li

3、terature is increasing rapidly , and it is imperative to introduce data mining technology into the field of literature study RefViz is a visualization tool for datamining , which can discover relationship between literature and dig out hot issues and development trend of a certain study field becaus

4、e of its unique algorithms 【 Key words 】: data mining ;literature research methodology; RefViz ;M-learning 在课题研究中,我们往往需要使用文献研究法对所研究的课题进行调研,以获得该领域研究背景、存在问题以及研究趋势等信息。随着计算机和网络技术的发展,大量的传统文献被数字化后以网络文檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶檶 檶檶檶檶檶檶檶檶檶 5张亚静,朱瑞芬基于网络平台的化工原理课程教学实开放式 实验教学是高校课改的有效尝试,是提高促进理论联系实际的良好平

5、台。但学生科研能力,目前,上海中医药大学教学实验中心的实验教学开放体系尚处初级阶段,开放力度和 范围不足,实验室实验仪器利用深度不够。所以,如何完利用率不高,善教师值班、指导、报酬机制,优化实验教学开放体系值得进一步思考与探索。参考文献1庞春红,郦晓宁,何葵深化实验教学改革,提高高校教J 科技信息, 2019,( 20): 18 学质量2王雪飞基于开放实验室的教学模式研究以教育技术J 长沙铁道学院学报, 2019,12(1): 248-249 专业为例3林雅初探提升大学生网络自主学习效果的策略基于Blackboard 网络教学管理平台的研究 J 新课程学习, 2019,( 10 ): 25-2

6、64王学春,石运芝,马敏,等构建现代医学实践实验教学中国高等医学教育,体系全面提高学生创新能力 J 2019 ,( 10): 50-51J 化工高等教育, 2019,( 5): 87-89 践6余志华,王永涛,赵娟,等建设开放实验教学体系建设的J 实验技术与管理, 2019, 28( 11): 141-143 探索与实践 7J 北秦好丽改革化学实验教学, 培养创新实践人才 2019,( 10): 20 京电力高等专科学校学报, 8莫晓萍,王趁义, 王凤玲,等化学实验教学体系的建设 J 实验室科学, 2019,14(2): 52-53 与改 革 9于斐,玉崧成,吴拥军,等卫生化学实验教学改革与实

7、J 实验室科学,2019,14(4):41-42,45践 10J 徐文峰高校实验教学改革中学生主体意识 的培养 2019,30(2): 87-89 重庆文理学院学报:自然科学版, 11姚建文,王虎, 孙海军药学专业有机化学实验教学模式 J 中国科教创新导刊, 2019,( 1): 26, 29 改革的探索 12董淑玲,王秀玲改革仪器分析实验教学,培养实用型J 科技信息, 2019,( 24): 21人才 13李晓英,郎晓萍,李月强浅谈实验室开放在高 等教育1青年与社会:中外教育研究,中的意义及作用 J 2019 ,( 1): 28-2903-14 收稿日期: 2019- ),作者简介:李华新(

8、 1979- 男,湖南临湘人,硕士,讲师, 主要研究方向:教育信息化。献媒体出现,最新的研究成果及文献也借助网络载体纷纷涌现,组成了具有实时更新 功能的文献数据大大方便了我们对文献的检索、归类以及后期的库,分析处理。随着各研究领域的细化和深化,新学科使得科学研究文献数量和新研究领 域的不断涌现,任何一名研究人员穷其毕生之呈几何级数量增长,力都不可能将本领域的文献全部阅读。尽管目前国SCI 、 SSCI 等)的内外的一些文献数据库(如 CNKI 、检索功能较为强大,但是因为传统的基于关键词匹配的检索算法缺乏有效的限制机制(如逻辑性语言检索结果仍不能令人满意往往会 无法表达等),检索到大量与主题无

9、关或冗余的参考文献。研究人员往往要通过阅读摘要甚至对全文 进行人工筛选,将其归类分析,花费了大量的人力和时间,效果却不甚理想。数据挖掘 (data mining )技术由于其独特的功能,在文献研究领域中有着广泛的应用前景,具有 极其深远的意义。 1数据挖掘与文献研究数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提 取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘具 有自动预测趋势和行为、关联聚类、概念描述及偏差检测等功能,与文献研究分析、的目的不谋而合,能很好地应用于文献检索领域。1111 1文献研究中引入数据挖掘技术的意义减轻研究人员负担

10、 传统的文献研究需要研究人员阅读大量的文献摘要甚至全文,然后将这增强研究的文献数量少而带来的不完整性等问题,科学性与确切性。 113促成某一而是技术迅猛发展的因素往往并不在于技术本身,技术的应用领域。数据挖掘技术自 问世以来,便广泛应用于各种领域:如商业、情报、科学等领域。近数据挖掘技术正逐渐向教育研究 领域渗透,如年来,在网络教育中通过对学习者网络访问日志进行数据挖掘,可以获得学习者的学习风格 及学习喜好等信息,从而对学习资源和学习策略进行调整,促进学习者学习。将数据挖掘 技术引入文献研究领域进行内对文献内容作客观而有系统的量化,并加以容分析,描述,从文献中发现一些隐藏的、未知的知识,是数据

11、挖掘技术的另一个热点应用领 域。1 2 数据挖掘技术应用于文献研究中的类型数据挖掘根据不同标准有不同的分类方式 数据挖掘技术用于文献研究主要是对文献进行聚类、预测、关联和相关性分析等。因此, 可以根据数据挖共著分析、著掘的功能(知识类型)分为共引分析、者分析、共词分析和共篇分析等。这里主要介绍共词分析和共篇分析两类。 1 21共词分析共词分析是一种内容分析技术。它通过分析在同一个文本主体中的款目对单词或名确认文本所代表的学科词短语对共同出现的形式,领域中主题间的关系,进而探索科学的发展2拓展数据挖掘技术的应用领域。共词分析的第一步是从文献数据库中抽取出现频次超过一定阈值的高频主题词,两两统计其

12、在同一篇文形成共词矩阵,然后围绕着这章中 同时出现的次数,4个共词矩阵进行分析。文献研究中的共词分析主要应用于两个方面:一是探求各研究 领域间的相互关3另一个是寻找次要的但是潜在增长的领域。系,1 22 共篇分析 1994 年,我国学者罗式胜首先提出“科学文献关键词链”了这一概 念,认为两篇或多篇科学文献有一个或多个相同的关键词,则这两篇或多篇文献或其相应 著者间则必然存在一种潜在的联系,这种联系称为科学文献关键词链。共篇分析就“科学 文献关键词链”是应用概念作为基础而形成的一种文献计量方法。用途主要包括以下几个 方面:从内容上了解文献之间的内在联系,了解该领域在研究方向上的类同和相关联程 度

13、;对同一主题按年份进行时间分段比较分析,了解该主题的研究力量和内容的时间变 迁;分别统计具有相同主题词的文献作者群,能了解该主题研究领域在世界范围内的分 布和发展趋势;根据主题共篇分析来研究相应作者和研究机构的联系强度,用以确定该对所要研究的问题些文献进行人工的归类与统计,从中发现相关信息从而找出某种做系统性的分析,传统的文献研究联系。当文献的数据非常巨大时,法便有些力不从心,即使花费大量的人力和时间,也有可能无法完成。将数据挖掘技 术引入文献研究领代替人工进行数据检索、筛选、统计、聚类分析域,使研究人员从大量的重复劳动中解放出来,以减等,轻研究人员的负担,并提高研究效率。 112弥补传统文献

14、研究的不足文献研究法中既有非结构式定性分析,又有结构式定量分析, 它们从不同的侧面对文献中所包含的信息进行加工和整使用理。传统的文献研究法多为结构式定性分析,数据挖掘技术对文献进行定量分析 具有直观性、客观性、系统性等特点,因而可弥补定性研究缺乏直观性和系统性的不足;此外,使用数 据挖掘技术可以科学地抽取大型样本,对某一领域中所有的文献进行系统结构分析,因而 可以弥补传统文献研究由于检索主题研究领域的核心作者和权威研究机构22 1RefViz 软件及其应用 RefViz 软件简介。RefViz 是 Thomson ISI Research Soft 和 OmniViz 公司合作推出的一款可视化

15、的文 本分析和数据挖掘工能对大量文献进行组织、分析,以利于研究者对具,参考文献的理解,是典型的共篇分析工具。RefViz功能非常强大:能将参考文献库中参考文献的主并以直观的图形方式将其呈题内容进行组织排列,现在一个可视化的交互窗口中。通过其强大的分析可以详尽地显示各参考文献之间的 相互联系,工具,便于我们快速从一大堆毫无头绪的参考文献中找出某一研究领域的热点问题及该领域 的研究与发展趋 5势;提供了在线搜索工具,用户可以随意指定为用户进行跨库检索提供软件内置的 各类数据库,Re- 了方便;能实现与文献管理软件(如 Endnote、ference Manager 等)的无缝链接,即我们可以随意将

16、 Endnote 、 RM 数据库与 RefViz 直接进行数据的导入导出操作。 2 11RefViz 文本分析工作机理Refviz 工作的原理类似于我们平时阅读文献的过程。我们平时进图1RefViz 软件界面口( reference viewer )。显示文献数据库中参考文献 包括软件通过聚类方法对文献的分组信息,的信息, 以及参考文献的标题、作者、发表日期等信息;咨 询窗口( advisor )。这是软件的提示区域,告诉用户用以指导用户对软件当前界面 及操作的一些信息,进行操作。22RefViz 应用案例“ISI Web of Knowledge ”从数据库中选择 INSPEC 文摘索引数

17、据库。该数据库是物 理学、电子工程、电子学、计算机科学及信息技术领域的权威性文摘索“m- learning ”和“ mobile learning ”为关引数据库。以2019”键词,时间限定为“ 2019 - 进行搜索,共搜索到相关文献 320篇。使用 RefViz 对搜索到的近 5 年来learni ng )的研究文献进行分析,试移动学习领域(m-图从中发现各文献间的相互联系,找出该研究领域的热点问题及发展趋势。 2 21导入数据将搜索到的 320篇文献以“ Bibliographic +Abstract (主题词+关键词)的输出格式导“m - learning 库中,通过与 RefViz

18、入到 Endnote 软件的的关联导入到 RefViz 中进行分析(如图 2 所示)。行文献研究的方式是:逐一阅读文章标题以及摘要,根据主题内容将其分类。RefViz处理一批文献时, finding- dividing ”也是一种“ reading -的过程。 RefViz首先通过阅读文章内容(包括标题和摘要),发现词的范式及词与词之间的联系。与 其他的软件不同, RefViz 并不是单纯通过词频来统计,而是通过一种复杂的数学统计模 型找出词的重要程度,将其分为三个等级;然后利用这些最重要的词和次重要的词对每篇 文章进行标识;再通过标准的聚类方法将这批文献分成基于主题内容的若干组,每一组文 献

19、都通过三个不同重要性词和描述词予以标识,用以描述文献间的联系和主要概念。 212RefViz 软件界面RefViz 界面非常简洁,由四个窗口组成,如图1所示:视图窗口。用来显示分Galaxy方式和析结果的窗口,有两种视图显示方式,Matrix方式;主题/检索窗口( Topic /Search )。该窗左边的是主要主题词( major topic ),中间口分为三栏,的是次要主题词( minor topic ),最右边的是描述词( descriptive terms )。其 中,“ major topic ”是 RefViz 用来,“ minor topic ”和“ descriptive 对文

20、献进行分类的依据terms ”则为 RefViz 的分类提供辅助作用。此外,用户还可以根据需要对上述三种词进行调换,在自动处理的基础上增加了人工干预功能, 突出研究者的创造性,更好地发挥软件的作用;参考文献浏览窗图 2 数据导入后界面2 2 2在主题 / 检索窗口可以看到:意义相同或相近的词没有区分开来,主要主题词过多,并 预处理,说明关于某一特定框架的移动学移动学习框架” 习是移动学习领域的研究新动向。相关度分析:文献间相关度。在Galaxy视图device , method ”)与中,第 13 组(主题词为“ phone , device , personal ”) 相互第 16 组(主题

21、词为“ digital ,重叠,说明这两组文献相关性强。我们可以将这两组文献归为一类;主题词与文献 间相关度。在 Matrix视图中,以相关度0. 5为筛选标准,可以得知:主题词 “framework ”与第 7 组文献(主题词为“ user , process , model ”)关联性较强 ( re levence =0 . 71),说明框架与移动学习方法和模式存在某种联系;主“envi ronment ”“ p rocess ,题词与第 14 组文献(主题词为 mobility , learner ”)关联性较强( relevence =0 . 67);表明移动学习环境与学习者学习过程和

22、 移动性有一定联系。其他分析:查找感兴趣的文献。文献中有些主题词虽然出现频率不高,但有可能是 以后的研究热点,也有可能是你自己感兴趣的内容,可以通过检索工具在主题 / 检索窗口 中检索到包含该主题词的文献,那么这篇文献所在组中的其他文献可能也具有较高的参考 价值;对该领域名家的研究。可以以作者名称为条件进行搜索,获得某个作者发表的文 章在视图中的分布情况,藉此发现该作者在该领域的研究方向和兴趣,从中获得一定的启 示。该案JYUE FANG 、发表文章数量最多的学者为:RONG例中,Sharples M 等,均为 6 篇。数据挖掘技术应用于文献研究领域中,能从数据的汪洋大海中及时发现有用的信息,

23、提高信息利极大地提高了文献研究工作的效率 和水平,有用率,力地支持了各领域研究工作的开展,从而促进了各学科的繁荣和科学技术的良好发展。 随着文献数据各种可视化的数据挖掘库技术的不断丰富和完善, 工具的升级与进步,数据挖掘技术将会广泛应用于 文献研究领域,其功能也将会越来越强大,数据挖掘工具将成为广大研究人员的研究利器。参考文献1 Roiger R J , Geatz M W Datamining a tutorial based primerM 北京:清华大学出版社, 2019:112Qin H Knowledge discovery through co2word analysis J Li

24、brary Trends , 1999, 48 (1) : 133-159 :3崔雷,郑华川.关于从 MEDLINE数 据库中进行知识抽取J .情报学报, 2019,(4): 425-433 和挖掘的研究进展4 J .中国罗式胜.篇名关键词链特征的统计分析和应用1995,( 1 ): 28-30 图书馆学报, 5王颖,戎文慧.可视化文本分析和数据挖掘工具RefVizJ .中华医学图书情报杂志,2019,( 6): 61-64包含无实质意义的词或与分析主题无关且范围过宽 因此需要重新调整主题词进行分析。一是将的词, 主要主题词中的次要概念与专指度较低的词降级( demote ), time , learn 等词; 二是利用词表如 student ,工具,为指定标目词添加同义词,对同义词进行控制。learning为标目词,mobile learning等例如:指定 m-为其同义词。2 . 2. 3分析数据研究热度分析:以文献发表时间2019-2019 年发表论文分别为 17篇、65为检索条件,7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论