基于ciespace的语义网研究热点可视化分析_第1页
基于ciespace的语义网研究热点可视化分析_第2页
基于ciespace的语义网研究热点可视化分析_第3页
基于ciespace的语义网研究热点可视化分析_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于ciespace的语义网研究热点可视化分析

网络正义网由互联网创始人simodhyberrys提出,1998年,网络创始人phe。2000年12月的XML(可扩展标记语言)会议上正式提出语义网的概念和体系结构。随后大量学术研究机构和团体举办了多次关于语义网的学术讨论会,开始关注语义网的研究,语义网开始成为情报学的研究热点。TimothyBerners-Lee最初将语义网定义为:某种定义Web上的数据和链接的方式,从而使WWW上的内容可获取并且可解释。Wikipedia(维基百科)对语义网的定义是:通过给万维网上的文档(如HTML)添加能够被计算机所理解的语义,从而使整个互联网成为一个通用的信息交换媒介。因此,对国外语义网研究的演进轨迹、发展格局、热点领域及前沿趋势等进行定量与定性分析,总结其发展规律与特征,对于推进我国情报学的研究具有重要意义。1知识图谱的建立本文采用美国德雷赛尔大学陈超美教授开发的CiteSpace3.7.R8进行可视化分析,在对国外研究语义网论文进行计量分析的基础上,结合相关文献主题分析,利用CiteSpace软件绘制知识图谱。数据来源于ISI(美国科学情报研究所)WebofScience(简称WoS)统一文献检索平台。根据本文研究内容,设定以下检索式:(TI(标题)=(“SemanticWeb”)ANDLG(文献语言)=“English”;检索WoS的四大索引库(检索时间:2013.12.23)。选择期刊论文和会议论文两种研究性文献类型(排除国内论文),共得到1900-2013年国外发表的语义网相关论文数据2644条,其中会议论文2098篇,期刊论文1069篇(部分会议论文发表后又在期刊发表)。2国外意义网络的研究2.1语义网研究年际变化从发文量看:2000年以前发文量较少,此后呈稳步增长趋势;2005-2008年进入高产阶段,年均保持在300篇以上;从2009年起,发文量逐年递减。统计结果表明,国外语义网研究自20世纪90年代末起步,自2002年语义网-ISWC会议召开后,发文量不断上升,相关研究日益成熟,应用领域不断扩展;经过许多学者的努力研究和实验,语义网在理论研究和实际应用上都有很大的进步。2.2“语义网”频次分布从国家/地区分布来看,美国发文量最高,为457篇,其次为德国和英国。在CiteSpace软件中绘制国家/地区共现网络图谱。图谱中共有52个节点,15个连接。对“语义网”出现频次在50次以上和中心度0.01以上的进行统计(见表1),可以看出,频次较高的来自美国,即其发文数最多,在该领域内具有很强的研究实力;英格兰、德国、西班牙、意大利等节点的频次也较高,表明这些国家的研究成果较多,也具有较强的研究实力。总体上,各国间在发文量与学术水平之间存在着不同程度的差异。中心度最高的国家为德国,其中心度达到0.27,美国位列第二,中心度为0.19。2.3语义网研究的核心领域从学科类别分布来看,语义网的研究主要集中在计算机领域。在CiteSpace中绘制学科主题共现网络图谱,可以看出国外对语义网的研究主要集中在计算机学科。基于频次(取30次以上)和中心度统计,频次最高的为计算机科学(为2474次),远高于其他学科领域;其次为工程技术和通信。这表明,计算机与工程技术科学是国外对语义网研究的核心领域。其他中心度较高的学科节点有数学、运筹学、信息科学等,与其他学科也有着较广泛的关联。2.4知识产权在线保护和利用技术研究关键节点文献在不同聚类网络的演进过程中起着重要的过渡性作用,有助于识别和探测某一领域研究的动态演进和发展趋势。CiteSpace中针对各个时间段的关键节点论文,基于中间中心度(0.1及其以上)和被引频次(30次及其以上)进行统计排序。被引频次最高的是2001年Berners-leeT的论文,被引用高达266次,在Google学术搜索中的被引频次为16408次(2013年12月27日检索)。其次是1993年GruberTR发表的论文,他把本体定义成“共享概念化的形式地、明确地规范”。1993年McilraithSA提出网络服务标记———语义网标记语言DAML,被引频次为120次。该标记使多种Web服务自动发现代理技术能够实现、执行、组合和互操作。作者提出这样一种自动化Web服务组合技术。2003年Baader提出描述逻辑是知识表示的形式化语言,他的这个判断非常适合对数据库/数据仓库概念模型的推理。扩展描述逻辑(如整数和有理数),其中包括聚合函数在这些领域(如最小值、最大值、计数和总和),这通常用于数据库系统。证明了聚合函数的存在容易导致的(故意)推断问题。2004年McguinnessDL认为OWLWeb本体语言是表示信息的过程。2004年HorrocksI在语义Web规则语言(SWRL)的基础上,提出将OWLWeb本体语言的OWLDL和OWLLite与规则标记语言的一元/二进制数据记录RuleML子语言相结合的建议,给出了基于RuleML和OWL的XML表示语法和基于OWL的RDF/XML交换语法。2.5语义网服务的认知在CiteSpace中绘制共词聚类网络图谱。关键词是对文献主题内容的高度概括或集中描述。词频分析是一种重要的基于内容的定性分析方法,而高频词分析有助于考察某一科学领域的研究热点。基于词频进行统计与排序,国外在语义网研究领域的高频词如表2所示。根据关键词频次分析总结出以下研究热点。(1)本体研究。本体(Ontology)原本是哲学研究中的一个分支。1991年Neches等人最早给出本体在信息科学中的定义:“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延规则的定义。”1993年,美国斯坦福大学知识系统实验室(KSL)的Gruber给出了第一个在信息科学领域被广泛接受的本体正式定义:“概念模型的明确的规范说明。”1997年Borst对其进一步完善,表述为:“共享概念模型的形式化规范说明。”Studer等人认为本体包含4层含义,即概念模型、明确、形式化和共享。本体强调实体本质的概念化与抽象化,强调概念及概念间的关联,并通过多种知识表示元素将这些关联反映出来,这些知识表示基本元素主要包括:概念、属性、关系(对象属性)、函数、公理和实例。(2)语义网服务及Web服务研究。语义网服务(SWS)是用本体作为数据模型,在语义描述框架的基础上,提供机器可理解的语义描述。语义网服务的支撑技术有3个:Web服务描述本体,用来描述Web服务和相关方面的完整的描述框架;以本体作为底层的数据模型以支持机器对Web数据的解释;为Web服务使用过程的自动化定义语义驱动。(3)OWL-S研究。OWL-S(OntologyWebLanguageforServices,网络服务的本体语言)最早由S.McIlraith于2001年5月提出,用于描述语义Web服务,在特定的约束下能够让用户和代理自动发现、调用、编写和监控网络资源,提供服务。2.6语义网的前沿研究领域突现词(burstterm)是指频次出现增长快速的研究前沿术语。由于突现词的词频时间分布和动态变化特性,突现词比关键词更能准确地揭示与反映研究前沿领域。在CiteSpace中进行突现词探测,从大量的术语与关键词集合中析取出13个专业突现术语,如表3所示。从表3可以看出,2001年“逻辑”和“检索”是语义网领域最早的研究前沿。逻辑是语义网的基础,语义网的研究主要是由逻辑学和人工智能研究者发展来的;2003年,“系统”“Web服务”“DAML”成为语义网的前沿研究领域。Webservice是一个平台独立的、松耦合的、自包含的、基于可编程的Web的应用程序,可使用开放的XML标准来描述、发布、发现、协调和配置这些应用程序,用于开发分布式的互操作应用程序。美国国防高级设计研究署代理置标语言(DAML)是美国国防高级设计研究组(DARPA)使用的一种标记语言,它是一种基于扩展标记语言(XML);2004年“语义Web服务”词频增长较快,语义Web被赋予解决智能搜索引擎、智能信息代理、智能交易代理等基于Web个性化、智能化的服务等问题的任务,利用本体来改进WebServices,即语义Web服务(SemanticWebServices);2005年“OWL-S”成为研究前沿,OWL-S是Web服务和语义Web的结合,主要是为了解决Web服务描述和发现以及业务组合的语义表示;2008年“Web2.0”成为研究热点;2011年“LinkedData”是主要研究前沿,描述了发布能够交互链接的结构数据的方法,信息共享的方式扩展到能被自动读取,能够连接并查询不同的数据源;2012年“SemanticSensorWeb”(SSW)成为研究热点,SSW是结合传感和语义网的技术,SSW用空间、时间和主题语义元数据标注传感器数据,建立在开放地理空间联盟的传感器网络赋能(SWE)内,并利用语义Web技术来提供更好的描述和传感数据并进行扩展。3语义网领域的核心研究领域综上所述,本文总结出以下结论:①目前国外在语义网领域的研究处于相对成熟与深化变革阶段;②美国在该领域的研究发文量最高,其次为德国和英国;③计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论