




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文分类号TP31单位代码10183密级内部研究生学号1200006002吉林大学硕士学位论文本体在语义网中的应用研究TheResearchofOntologyinSemanticWeb作者姓名:作者姓名:专专业:计算机软件与理论业:计算机软件与理论导师姓名导师姓名及及职职称称教教授授论文起止年月:论文起止年月:2011年年1月至月至2011年年4月月提提要要语义网技术是当前互联网技术研究的热点之一。其目标是开发一系列新的技术,改变现有互联网仅仅依靠文字信息来共享资源的模式,通过语义信息的共享,来实现网络信息服务的智能化、自动化。本文介绍了语义网研究背景与当前的研究状况,并在语义网研究的本体描述领域,语义网模型领域做了深入研究。本文通过对本体描述深入研究,提出了以XML语言来描述本体的方法,这种方法具有较好的描述效果与较好的通用性。在此基础上,本文实现了XML描述本体的Java解析,并以此为基础实现了语义网模型中的本体层。本文设计并实现了基于本体的语义网模型系统,以本体作为语义网中的语义信息层,可以实现语义信息的共享,这样就可以提高信息服务的智能化和自动化程度。目录第1页目目录录第第1章章前前言言.11.1语义网简介.11.2本体在语义网中的应用.21.3语义网技术研究方向.31.3.1基础研究.31.3.2应用研究.41.4本论文的主要工作.5第第2章章本体的描述方法本体的描述方法.62.1本体的定义.62.2本体的作用.62.3本体的描述方法.72.3.1KIF和ConceptualGraphs.72.3.2OIL.82.3.3DAML.102.4本文中本体的描述方法.102.4.1本体的确定有限自动机表示.102.4.2用XML+XLink来描述本体.12第第3章章面向特定领域的语义网模型的设计面向特定领域的语义网模型的设计.183.1语义网的设计思想.183.2语义网系统模型.193.3语义网系统功能.203.4语义网模型设计说明.22第第4章章面向特定领域的语义网模型的实现面向特定领域的语义网模型的实现.234.1系统整体框架.23目录第2页4.1.1语义网系统结构.234.1.2应用层的架构.254.1.3本体层的架构.264.1.4Web应用三层结构.264.2系统实现中的主要技术方法.274.2.1Java2技术.274.2.2MVC(Model-View-Controller)模式.284.2.3应用XML为本体建模.304.2.4本体解析的Java实现.314.3系统特点.374.4语义网的实施环境.37第第5章章结论结论.385.1相关工作.385.2本文的特点及意义.395.3今后的研究课题.39参考文献参考文献.41摘摘要要.IABSTRACT.III致致谢谢.VI第1章前言第1页第第1章章前前言言1.1语义网简介语义网简介1990年,蒂姆伯纳斯李(TimBerners-Lee)发明了互联网上的超文本系统,使网络互连技术用于人们的信息交流与共享,从而极大的促进了互联网的发展。现在,互联网已经成为人们进行信息交流的重要工具,人们可以通过互联网来寻找自己关心的信息,也可以通过互联网来将自己的信息发布出去。但随着互联网应用的不断扩展,现有互联网技术的局限也逐渐暴露出来。现有互联网技术的核心是超文本系统,它的主要思想是通过统一资源标识符(URI)对互联网上的信息进行标记,使人们可以迅速的对互联网上的信息资源进行定位。然而,现有互联网技术并没有对信息的含义进行描述,计算机在处理信息时只是按照URL来定位信息,但对信息的内容并不关心。而人们真正关心的是信息的内容,也就是互联网上的文本、图片等资源所包含的意义。由于现有互联网技术的局限,互联网上信息处理的自动化、智能化程度是很低的,计算机处理器的强大功能也没有得到有效的利用。互联网技术的研究者正在研究新的技术来改变这种状况,而其中最令人瞩目的就是语义网技术。语义网是互联网研究者对下一代互联网的称谓,通过扩展现有互联网,在信息中加入表示其含义的内容,使计算机可以自动与人的协同工作。也就是说,语义网中的各种资源不再只是各种相连的信息,还包括其信息的真正含义。从而提高计算机处理信息的自动化和智能化。而计算机并不具有真正的智能,语义网的建立需要研究者们对信息进行有效的表示,制定统一的标准,使计算机可以对信息进行有效的自动处理。在2000年的世界XML大会上,蒂姆伯纳斯李做了题为SemanticWeb的演讲,对语义网的概念进行了解释,并提出了语义网的体系结构。W3C组织也成立了专门的工作组来推动语义网技术的发展。当前,语义网作为一个信息技术的热点,得到了研究者们极大的关注,也得到了许第1章前言第2页多政府、科研机构及商业部门的投入,近几年必将得到较大的发展。1.2本体在语义网中的应用本体在语义网中的应用图1-1是蒂姆伯纳斯李在XML2000大会上提出的语义网体系结构。图1-1SemanticWebArchitectureTimBerners-LeeXML2000从中可以看出他所建议的语义网分层:XML层作为语法层RDF层作为数据层本体层(OntologyLayer)作为语义层逻辑层(LogicLayer)提供了智能推理的规则证据层(ProofLayer)支持代理间通讯的证据交换XML使每个人可以创造自己的标签来标注网页或网页的部分文本。XML允许用户为他们的文档添加结构信息,但并没有说明这些结构的含义。只有标签名并不能提供语义,所以在语义网结构中XML只是作为语法层,来为语义网的建立提供语法基础。RDF是对结构化的元数据编码、交换和重用的一个基础。在该语义网模型中,信息以RDF句子的形式存储,即以统一的方式(主语、谓词、宾语)来存储数据,便于机器理解。抽象的RDF数据模型表示为第1章前言第3页一个有向标记图。这个抽象模型是独立与实现的而且可以用XML来序列化。蒂姆伯纳斯李所提出的语义网模型的第三层为本体层。在人工智能领域和互联网研究领域,一个本体描述了一个特定研究领域的一个形式化的、共享的概念化模型。本体非常适合于描述互联网上各种不同的、分散的、半结构化的信息资源。通过定义共享的、通用的领域理论,本体帮助人和机器明确的交流,支持语义级的交换,而不仅仅是语法级的。逻辑层提供了规则,从而便于进行推理。而证据层则在此基础上使代理可以交换推理的结果。为了检查这些结果,需要将各代理的内部推理机制转化为一种通用的证据表示语言。图1-1语义网结构中的数字签名和确信(Trust)则是为了保证信息交换的安全问题而设计的,信息交换的双方必须建立了一种信认关系才能在一定程度上保障信息的有效性。本体(Ontology)在计算机科学中指对共享领域模型的概念化的形式说明。语义网技术的研究者们提出在语义网的结构中有一层为本体层,通过本体层来表示出信息的含义,及各种信息间的语义联系。语义网上的语义信息正是基于本体而且也表示为本体的。通过这种方式,语义网中的各代理可以通过交换本体来达到一个语义级的共享-本体提供了通讯中所需的词汇。因而本体层的建立正是语义网技术的关键,成为当前语义网技术研究的热点。1.3语义网技术研究方向语义网技术研究方向语义网的目标是提高互联网的自动化与智能化,而语义网技术包含着一系列相关技术,其中包括基础研究与应用研究。1.3.1基础研究基础研究基础研究方面主要包括本体的发展、语义网语言的形式语义和确信(Trust)与证据(Proof)模型的开发。第1章前言第4页1、本体的发展包括本体的管理,本体的适应和本体的标准化:本体的管理(Management):本体的主要目的是知识的共享与重用,因此一个典型的本体库系统要支持开放式的存储与组织、标志和版本化。开放存储和组织研究本体库如何存储和组织才能便于本体的访问和管理。标志为每一个本体给定一个唯一的标记符。本体是随时间而不断发展的,所以需要一个版本机制来保证不同版本本体的一致性。本体的适应(Adaptation):因为本体随时间而发展,所以如何来扩展和更新现有的本体是一个重要的课题。这包括在本体库中对本体进行搜索、编辑和推理。本体的标准化(Standardization):在语义网中应用的本体,要能够进行集成和互操作,而要实现这一点就要对本体进行标准化。2、语义网语言的形式语义:语义网的目标是实现语义级的互操作,而要实现这一点,语义网中所用的语言就必须有具有标准的形式语义。XML、RDF及其附加标准的形式语义还在研究当中,而本体描述语言的形式语义则更是研究的重点。3、作为一个开放的分布式系统,语义网允许互联网中的任何人做出声明,而其中可能存在冲突。因此一个人需要确认源信息给出了证据并且这个源信息是值得信任的。当前证据(Proof)和确信(Trust)的概念还没有标准化,将它们集成到语义网的推理机制中的理论还需要不断发展。1.3.2应用研究应用研究语义网研究的应用研究主要集中在几个方面:Web-services、基于代理的分布式计算、基于语义的网页搜索引擎和基于语义的数字图书馆。1、Web-services是一系列标准和正在发展中的标准,它们由W3C设计和指定,用来促进跨平台的程序对程序通信。语义网技术可以提高用户对Web-services进行定位、选择、运用、组合和监控的自动化程度。2、基于代理的分布式计算也将从语义网技术中受益。语义网将用本第1章前言第5页体来描述各种网上资源,因此,网络中的知识将用一种结构化、逻辑化、语义化的方式来表示。这将改变代理对网上资源进行搜索、获取和利用的方式。一方面,语义网是一个分布式知识基的网络,代理可以在本体的指导下对网上知识进行读取和推理;另一方面,语义网是由本体描述的Web-services的集合,这就便于各种代理间形成动态的媒介,从而便于处理。当代理具有了智能性和灵活性,传统的Clientserver计算模式将可能被一种基于代理的分布式计算模式所取代。3、基于语义的网页搜索引擎也将是语义网技术的新应用。现有的搜索引擎是基于关键字的,因此词语中的多义词和同义词使查询的精确性降低了。尽管研究者们提出一些算法来解决这个问题,但从网页的文本内容入手仅能得到有限的语义信息。而语义网技术则可以较好的处理这个问题。4、近年来,大量的各种形式的数字化多媒体数据被加入互联网。传统的基于内容的多媒体数据检索技术是基于多媒体数据的低级特征的,这使人们不能有效的利用网上的多媒体数据。而基于语义的查询能够利用多媒体资源的高级特征,从而使各种多媒体数据资源得到有效利用。基于语义的数字图书馆将成为语义网中的一个重要资源。1.4本论文的主要工作本论文的主要工作本文的目标是实现一个面向特定领域的语义网模型系统,当前语义网的研究领域,还没有公认的标准模型。本文设计了基于本体的语义网模型,讨论了在语义网中引入本体层的意义。在对当前本体表示及本体层建立工作的研究的基础上,提出了一种本体描述方法。并将此种描述方法应用到语义网本体层的建立工作中。主要的具体工作如下:研究本体的表示问题,提出本体的XML+XLink描述方法。实现了本体的XML描述的Java解析。设计并实现了基于本体的语义网模型系统。第2章本体的描述方法第6页第第2章章本体的描述方法本体的描述方法当前许多语义网技术的研究者提出在语义网中加入本体层,以本体层作为实现信息服务智能化与自动化的基础。本体层的研究是当前语义网研究的热点,本论文在这方面也作了研究工作,并提出了自己的描述方法。2.1本体的定义本体的定义本体的概念源于哲学,指的是客观存在的一个系统的解释或说明,关心的客观现实的抽象本质。在计算机科学领域,本体是指共享概念模型的显式表示。某个领域的本体就是关于该领域的一个公认的概念集,其中的概念含有公认的语义,这些语义通过概念之间的各种关联来体现。即本体强调领域中的本质概念,也强调这些本质概念之间的关联。我们可以将本体理解为人们对某一领域内概念的一致理解的表示。这有三方面的含义:首先,一个本体是关于某一个领域的;其次,本体是关于领域概念的意义(一致理解),这种意义通常通过概念之间的关系来体现;最后,本体是一种表示,通过使用相同的本体,人们在研究领域内问题时,就可以根据它来进行交流,避免因对概念的理解不同而产生交流上的障碍。2.2本体的作用本体的作用本体对领域知识进行了一种表述,统一了领域内的术语和概念。从而增加了知识共享、知识重用的程度。Uschold等人在一文中总结了本体的作用,即交流(communication)、互操作(inter-operability)和系统工程(systemsengineering)。交流:主要为人与人或组织与组织之间的交流提供共同的词汇。通过公认的词汇集(本体)来减少因对概念理解的不一致,以及个人表达习惯不同而带来的交流上的障碍。第2章本体的描述方法第7页互操作:将本体作为中间表示在不同的建模方法、规范、语言和软件工具之间进行翻译和映射,以实现它们的互操作和集成。系统工程:本体可以为系统工程带来规范描述(specification)、重用(re-usability)、可靠性(reliability)等好处。本体有助于确定系统的需求和规范;所得的本体可以在其它的工程中共享和重用;非形式化的本体可以帮助设计者检查系统的设计,而形式化的本体,使自动的一致性检查成为可能,从而提高了软件的可靠性。2.3本体的描述方法本体的描述方法按着本体描述的形式化程度,可以将描述方法分为四类:非形式化:由自然语言随意描述。用严格和结构化的自然语言来描述。形式化:定义形式化语言来描述。严格形式化:用符合形式语义、具有合理性和完备性的公理系统来描述。计算机科学研究者们在研究不同的问题时,提出了不同的描述方法来描述本体,下面介绍几种影响较为广泛的描述方法。这此方法都是在一些现有的系统中得到了广泛的应用,而且这几种方法都属于形式化的描述方法。2.3.1KIF和和ConceptualGraphsKIF(KnowledgeInterchangeat)和概念图(ConceptualGraphs)都可以用来表示本体。它们都基于一阶谓词逻辑,但细节上有所不同。KIF被设计用于不同的计算机系统间进行知识交换,因而它的目的并不是用于计算机系统内知识的表示,而只是作为计算机交换知识时的一种中间表示,当计算机系统需要交换知识时,将内部数据结构映射成为KIF表示上。KIF具有说明性语义,可以通过KIF表达式本身来理解第2章本体的描述方法第8页它的含义,而不需求助于操作这些表达式的解释器。KIF也具有丰富的逻辑表达能力,可以描述任意的逻辑语句。同时KIF也可以用来描述元知识,允许用户定义新的知识表示,并且在不改变语言的基础上引入新的知识表示生成系统。IEEE的IFF(InationFlowFramework)工作组的IFFFoundationOntology计划就是用KIF来描述本体,并建立一个层次化的元本体结构。Ontolingua是斯坦福大学知识系统实验室开发的一个系统,在此系统中它们提供了独立于特定表示系统的本体表示机制,它允许用KIF定义类、关系和对象,并能将这些定义翻译成几种特定的表示语言。概念图是一个基于图和语义网络的逻辑系统。用一种逻辑精确、易读并且计算机易处理的形式来表示信息。通过直接映射到语言,概念图可以作为在面向计算机的形式化和自然语言间进行翻译的一种中介语言。通过图形化的表达方式,概念图可以作为一种易读的但是形式化并且规范的语言。概念图已经被用于各种项目的信息检索、数据库设计、专家系统和自然语言处理。2.3.2OILOIL(OntologyInterchangeLanguage)是部分语义网研究者提出的用于互联网上本体表示的语言。OIL为一个标准的本体语言指出了一个层次化的方法,每一增加层将在原来的层上增加功能性和复杂性。为了达到为语义网提供一个通用的本体语言,OIL综合了三个不同研究成果:基于框架的系统(Frame-basedsystems):基于框架的语言在人工智能领域有着较长的历史。它们的重要建模原语是类(框架)和属性(槽)。一个框架提供了类的建模环境,而类通常定义为一个或多个其它类的子类。框架的槽值对则用来指定类实例的附加约束。OIL吸收了基于框架系统的重要建模原语,为概念定义了超类和槽。OIL也将槽视为一类对象,这些对象可以具有它们自己的性质(如定义域和值域)。描述逻辑(DescriptionLogics):描述逻辑在知识表示研究中得第2章本体的描述方法第9页到发展,按照概念和角色来描述知识。描述逻辑表达式的含义可以用数学化的精确方式来描述,从而可以来进行推理。OIL从描述逻辑继承了它们的形式语义和有效的推理支持的特性。Web标准XML和RDF:OIL是面向语义网开发的本体描述语言,所以必须有便于互联网应用的语法。而现有的XML和RDF标准较好的满足了这一要求。首先,OIL具有一个基于DTD和XML模式的用XML描述的形式合理(well-defined)的语法。其次OIL被定义为RDF及其模式定义语言的一种扩展。RDF模式提供了一个建模原语的标准集和描写类层次的标准语法。OIL扩展了这一方法。下面是一个OIL语言描述本体的例子:ontology-definitionsslot-defeatsinverseis-eaten-byslot-defhas-partinverseis-part-ofpropertiestransitiveclass-defanimalclass-defplantsubclass-ofNOTanimalclass-deftreesubclass-ofplantclass-defbranchslot-constraintis-part-ofhas-valuetreeclass-defleafslot-constraintis-part-ofhas-valuebranchclass-defdefinedcarnivoresubclass-ofanimalslot-constrainteatsvalue-typeanimalclass-defdefinedherbivoresubclass-ofanimalslot-constrainteatsvalue-typeplantOR(slot-constraintis-part-ofhas-valueplant)class-defgiraffesubclass-ofanimalslot-constrainteatsvalue-typeleafclass-deflionsubclass-ofanimalslot-constrainteatsvalue-typeherbivoreclass-deftasty-plant第2章本体的描述方法第10页subclass-ofplantslot-constrainteaten-byhas-valueherbivorecarnivore这个例子描述的是非洲动物,通过对各种概念及它们之间关系的定义,定义了非洲动物物种这一领域内的知识。OIL已经在On-To-Knowledge项目中用于本体的表示。在这一项目中,OIL被扩展来开发一个大型Intranet的知识管理环境。用OIL来描述本体,需要区分三个不同的层次。首先是对象级,这一级描述具体的本体;其次是第一元级,这一级提供了确定的本体定义,用一种定义良好的语义来描述结构化的词汇;最后是第二元级,这一级描述的是一个本体的元信息,如作者、名称和主题等。OIL目前的研究关注的是第一元级和第二元级,分别称之为本体定义和本体容器。2.3.3DAMLDAML(DARPAAgentMarkupLanguage)是美国国防部的一项计划,目标是开发一套工具来创建本体和标记信息,使机器可以更加自动化、智能化的处理网络上的各种信息。其核心工作即是DAML,一种在XML和RDF基础上发展出来的标记语言,可以用来描述本体。该项目的研究人员很快吸收了OIL的研究成果,将它们结合在一起,发布了DAMLOIL来描述本体。当前,一些项目正在对DAML进行扩展,DAML-S是用DAML+OIL描述的一种用来描述WebServices的高级本体,可以用来描述服务特性一、处理模型和服务背景。这一方法将语义网技术方法与现在正在出现的工业标准联系起来。2.4本文中本体的描述方法本文中本体的描述方法本文关注的是本体在语义网中的应用。由本体的定义可知,一个本体是关于一个领域的概念的集合,概念的含义通过概念之间关系来体现。而在一个具体的领域内,一个概念往往具有其特有的属性,即确定了一个概念,也就决定了它所具有的属性;反之,由一个概念所具有的属性,也可以确定一个概念。基于这一理解,本文提出了本体的确定有限自动第2章本体的描述方法第11页机表示及其描述方法。2.4.1本体的确定有限自动机表示本体的确定有限自动机表示本体是概念体系的明确的部分说明。它由以下几部分组成:一个概念集C,一个属性集A,其中AC一个从概念集到属性集的幂集的映射函数集,:FAC2:FCA2一个关系集R,其中R是的子集。CC定义定义:一个本体定义为一个确定有限自动机:0TSSO其中:S为属性集的幂集:A2为关系集与属性集的并集为空集0S为由函数,确定的以C为指标集的集合族,即TFFCcAc为转换函数)(ccAccrAiiaSaS性质性质:初始状态为空集,中间状态、接受状态为由属性集确定的概念,状态的转换函数反映出概念之间的关系。可以通过两种途径确定一个概念,一是通过概念之间的关系;二是通过对属性集的确定。例子例子:图2-1所示的本体可以用一个确定有限自动机来表示。workinhastopicpersonprojecttopic第2章本体的描述方法第12页图2-1本体的例子person、project、topic为领域内的概念,它们具有各自的属性(未在图中标出),则图中表示的是:projectpersonAworkinAtopicprojectAhsatopicA这说明了personprojecttopic三个概念之间的关系,而这三个概念又具有各自的属性集:emailaddressagenameApersonendtimebetimenameAprojectnameAtopic意义:意义:本体的确定有限自动机表示,通过用自动机的状态对应概念,用状态的变迁表示概念之间的关系,可以全面的表示出一个本体所包含的语义信息。由于在本体内加入属性这一原语,使信息更加完整。当两个本体中的概念不一致时,可以通过在自动机中改变一个中间状态为接受状态来对齐本体。从图2-1可以看出,确定有限自动机可以准确的表示出本体的内容,通过状态转换函数来表示概念之间的关系。这样一个本体的信息,可以由确定有限自动机直观的表示出来,而对本体信息操作的语义可以由确定有限自动机的状态转换来体现。通过在自动机的状态转换即可表示出概念之间的关系,由此表示出本体的所包含的领域知识信息。也就是说本体的确定有限自动机可以看作是本体语义信息的说明,而具体的本体描述还需要一种本体描述语言。这种描述语言的要能够描述出确定有限自动机表示出的语义信息。2.4.2用用XML+XLink来描述本体来描述本体现在有很多语言被用来描述本体,一个好的描述语言应该满足以下几个条件:足够的描述能力,能够描述出本体中概念的复杂的结构和关系能够应用逻辑约束,进而能够对概念和关系进行推理具有一定的通用性和易用性,使机器可以方便的处理第2章本体的描述方法第13页本文的目的是通过加入本体层来建立一个语义网系统,为了将本体描述方式在本体层应用,要求这种描述方式可以很方便的在语义网系统中应用,易于处理,并且具有通用性,可以在互联网上应用。综合以上几点进行考虑,XML是一种比较合适的语言。XML(ExtensibleMarkupLanguage)是一种标记语言的元语言,它允许你根据它所提供的规则,制定各种各样的标记语言。现在XML已广泛应用于互联网上的数据表示及不同系统间的数据交换。对XML文档进行操作所需的各种程序包也已经得到开发。XML所描述的文档通常可以组织成为一种树状结构。我们在表示本体的时候考虑到用XML描述本体。由上一节的讨论可知本体的自动机表示结果可以看成一种有向标签图,这样XML的描述能力有些局限,而XML标准的附加标准XLink可以弥补这点不足。XLink(XMLLinkLanguage)是XML的附加标准之一,XLink通过在XML文档中加入元素来描述XML文档中所描述的资源之间的链接。这种链接可以加在不同XML文档所描述的资源之间也可以加在同一个文档内部的资源之间。我们将XML文档中的元素看作资源,则它们之间的链接可以用来代表它们之间的关系。XLink标准允许我们在XML文档中引入arc型的链接元素。因而我们在用XML来描述本体时,可以将一个领域内的概念表示为XML文档中的元素,而概念之间的关系则通过arc型的链接元素来表示。Arc型链接元素的名称即为关系名,这样一个XML文档中各元素及它们之间的关系可以由arc链接元素引入表示为一种有向标记图。如上所诉,在用XML描述本体时,可将本体的概念表示为XML的元素,而概念的属性则表示为子元素。如上小节中的例子,概念person的属性集为nameageaddressemail,则可以定义如下的XML元素来表示:第2章本体的描述方法第14页同样,概念project的属性集namebetimeendtimetopic的属性集name及这两个概念,也可以分别定义为XML文档中的元素。则这一本体的元素可以在一个DTD文件中进行声明。这样就可以通过一个DTD来表示一个本体所包含的概念及概念对应的属性集,这就表示出了本文给出的本体的确定有限自动机表示的状态信息。定义这一本体的DTD文件ontology.dtd如下:此时的表示本体的XML文件ontology.xml内容如下:由此可以看出,用XML文件可以表示出本体的概念及其所具有的属性,但是仅用XML来描述本体时的XML文件只能列出本体内的各第2章本体的描述方法第15页个概念,而没有体现出它们之间的关系。也就是只表示出了本体确定有限自动机表示的状态,而没有表示出状态间转换的信息。这是XML描述本身的局限所致,这一局限可以通过引入XLink来解决。下面本文将给出用XLink来表示概念之间关系的描述。图2-1可以看作为一个有向标记图。想用XLink来表示,需要对将要引入的链接元素进行声明。下面给出有向图的XLink表示,从中可以看出用XLink表示复杂链接的方式。graph.dtdgraph.xmlworkinhastopic第2章本体的描述方法第16页graph.dtd是为了能够在XML文件中应用XLink标准而加入的。由此可见,由graph.xml所描述的有向标记图反映出了概念之间的关系,这样通过用ontology.dtd来描述本体中的概念,graph.xml来描述本体中概念之间的关系,则可以完整的描述出一个本体的所包含的语义信息。而ontology.xml则可以用来描述一个具体的实例。用以上的方法可以描述本体,但需要用几个文件一起才能完整的描述出一个本体的信息,下面我们将它们结合在一起,通过一个XML文件来描述一个本体。workinghastopic此时的DTD文件也要作相应的修改,最后的DTD文件如下所示:第2章本体的描述方法第17页通过给XML文件中表示概念的元素加入XLink属性并在文件中加入XLink元素,并将XLink属性的类型声明为resource类型,则可以通过arc类型的XLink元素来表示概念之间的关系,arc元素的内容即为关系的名称。这样就可以表示出有向标记图的结构,也就可以完全的描述出一个本体所具有的信息。XML技术已经是一种广泛应用的技术,可以釆用现有的程序开发包来对我们所定义的本体进行操作,因而这种描述方式具有较好的通用性。本文的语义网本体层的开发正是基于本体的XML描述方式的,通过对本体XML描述的解析可以得到本体层内的本体模型。第3章面向特定领域的语义网模型的设计第18页第第3章章面向特定领域的语义网模型的设计面向特定领域的语义网模型的设计3.1语义网的设计思想语义网的设计思想目前,语义网的建立还处于探索阶段,研究人员开发了一系列新技术来促进语义网技术的发展,但对未来的语义网的具体该是什么样的结构还没有达成一致。现有语义网技术的应用主要有向两个方向发展:一是为互联网上的信息加上语义信息,在处理网络上的信息资源时,可以按着一定的标准来处理这些语义信息。从而达到信息处理自动化、智能化程度的提高;二是在各信息服务器上加入专有的语义信息库,网络上其它的机器访问信息服务器想从中获取信息时,信息服务器先按语义信息处理,然后再按语义信息处理的结果从知识库中找到所需的信息。这两种方法的代表了语义网研究的两个研究角度,一是从互联网上的知识表示出发,通过对互联网上各种信息资源的表示方式进行改进来提高信息处理的自动化,智能化;二是通过在信息服务器中直接加入一个领域的语义信息来提高信息处理的自动化与智能化。这两个角度的釆用的方法不同,但目的是相同的,即提高网络服务的自动化与智能化。本论文的目的是实现一个面向特定领域的语义网。本文釆用了第二种方式来设计一个面向特定领域的语义网模型。本文选择这种方式是因为这一种方式更具有通用性。釆用第一种方案来实现,实际上也要求信息服务器具有处理本体信息的能力。釆用第二种方案,本模型的基本思想是将特定领域的知识存储在信息服务器中,可以存在服务器的数据库中,也可以用各种文件的方式存储。而领域知识的本体则作为独立的一层。当用户访问信息服务器以获取领域信息时,先由本体层处理用户的访问要求,对其所访问信息的语义信息进行处理,从而得出所需访问的信息的语义。然后根据语义信息访问存储在服务器中的相应的信息,返回给用户。第3章面向特定领域的语义网模型的设计第19页要实现这一目标,主要需要考虑两个问题,一是采用何种方式来表示本体,二是本体层与信息库的分离。采用什么样的方式来表示本体,才能使其表达出本体中各种概念的含义及它们之间的联系,而且这种表示还要适于程序处理,使我们可以通过程序来实现本体的生成与更新的自动化或部分自动化。本体层与信息库的分离,指的是本体体现信息库的语义信息。我们要把本体层作为独立的一层来处理,本体层作为实现语义网智能化与自动化的关键,存储的是领域内的共享知识,是领域内专家对领域内各种概念及其含义的共同理解,一旦确立,就较少改动。而信息库存储的是具体化的实例,存储的是现实世界中各种具体的信息,需要随着事实的变化而进行改变与更新。将本体层与信息库分离,要考虑好两者各自的处理方式,还要考虑好两者之间的信息交换方式。3.2语义网系统模型语义网系统模型基于上一节所述的面向特定领域的语义网模型的设计思想,我们给出如图3-1的语义网系统模型:clientlayermanagementlayerstoragelayer图3-1面向特定领域的语义网系统模型本文所设计的语义网系统模型釆用了三层结构:第一层为GUI层,信息库信息库GUI浏览查询本体层本体层DatabaseFiles本体层与信息库接口本体层与信息库接口编辑览第3章面向特定领域的语义网模型的设计第20页主要是为用户提供一个图形用户接口;第二层为本体层,主要是保存本体信息,并响应来自GUI层的请求来对本体信息进行操作;第三层为信息库层,主要是存储具体的信息。下面对他们分别加以介绍:GUI层为数据表示层,这一层为用户提供一个图形接口,同时也要将由下两层传来的数据信息以合理的方式返回给用户。这一层还需要处理数据的显示,将数据信息以合适的方式显示出来,便于用户处理。GUI层对本体层和信息库层的访问要通过一系列API来实现。本体层为管理层,这一层包括两方面的内容。一是响应客户端的用户请求,先根据本体所包含的语义信息对用户请求进行处理,然后访问信息库,得到相关的信息返回给用户。二是对本体进行管理,系统管理员可以通过客户端的图形用户接口访问本体层,对本体进行编辑。也就是说,这一层包含有信息服务的业务逻辑和本体处理的业务逻辑,实际上是在本体层基础上实现的业务逻辑,即对信息服务的访问基础是对本体层的访问。信息库层为存储层,信息可以用两种方式来存储,一是关系数据库,二是各种文件。不同的存储方式要求不同的访问方法的支持。在本文的语义网模型中,通过在本体层与存储层中加入本体层与信息库接口来解决不同访问的支持问题。3.3语义网系统语义网系统功能功能上一节论述了本文所设计的语义网模型的分层结构,及每一层所起的作用。本节将具体说明语义网所需具有的功能。本文所设计的为一个面向特定领域的语义网的模型。特定领域的语义信息存储于本体中,以本体层的方式为信息访问提供语义服务,从而提高信息访问的自动化与智能化。因而语义网的功能主要包含以下两个方面,一是对本体库的操作,包含对本体的操作和对信息库操作时本体层所要进行的操作,二是对信息库的操作,包含对数据库系统与文件系第3章面向特定领域的语义网模型的设计第21页统的操作。因此要求系统具有如下功能:本体查询本体查询:本体内存储的是领域内的概念及其关系,用户访问信息服务时,可以对本体进行浏览,进而了解领域知识。所以,本体查询功能就是语义网系统必不可少的功能之一。而查询本体时,用户关心的也可能只是本体内的部分语义信息,这就要求在实现本体查询功能时考虑好查询结果的表示方式,便于用户处理。本体编辑本体编辑:本体作为实现语义级互操作的基础,较少改动,但建立本体是一项重要的任务。实现一个语义网系统,必须要先建立本体,而当领域知识发生变化时也要及时修改本体,以保持语义信息的准确性与完整性。本体管理本体管理:建立本体层,可以在本体库中存放多个本体,对本体进行管理,以合适的方式来存储本体以及在修改本体时对所作的修改进行检查,保持语义信息的准确。信息检索信息检索:信息服务器上存储有各种信息,必须为用户访问信息服务器提供检索机制,以便于用户获取信息。利用语义网的本体层所提供的语义信息,可以实现更为智能化的信息检索,提高信息检索的速度与准确性。信息编辑信息编辑:各种信息资源都是不断增加的,也有些资源随时间变化,这就要求对信息服务器上的信息进行编辑,增加信息或是修改信息。而信息服务器中的信息存储方式有关系数据库和文件系统两种方式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030全球及中国真空脱水装置行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 环境影响评估在可持续发展中的作用-全面剖析
- 2025-2030全球及中国汽车汽油燃油喷射系统行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国气门挺杆行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国数据加载工具(DLT)行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国建筑师项目管理软件行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国宠物服务在线学习行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球与中国6G硬件设备市场竞争格局与前景规划建议研究报告
- 2025-2030全球及中国医疗合同研究外包行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- 2025-2030全球及中国冒险游戏行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告
- Unit 2 Go for it!Understanding ideas教学设计 -2024-2025学年外研版(2024)七年级英语下册
- 浙江省金丽衢十二校2025届高三下学期二模试题 地理 含解析
- 【+初中语文+】《山地回忆》课件+统编版语文七年级下册
- 2025-2030中国建筑装饰行业十四五发展分析及投资前景与战略规划研究报告
- (一模)2025年广东省高三高考模拟测试 (一) 语文试卷语文试卷(含官方答案)
- 管理学基础-形考任务一-国开-参考资料
- 3.3 服务业区位因素及其变化-以霸王茶姬为例【知识精研】同步教学课件(人教2019必修第二册)
- 三维网喷播植草施工方案
- 家具设计与软装搭配知到智慧树章节测试课后答案2024年秋四川长江职业学院
- 2025人保寿险校园招聘开启啦笔试参考题库附带答案详解
- 2024年员工知识产权与保密协议范本:企业知识产权保护实务3篇
评论
0/150
提交评论