基于软件工程开发的领域本体构建研究_第1页
基于软件工程开发的领域本体构建研究_第2页
基于软件工程开发的领域本体构建研究_第3页
基于软件工程开发的领域本体构建研究_第4页
基于软件工程开发的领域本体构建研究_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于软件工程开发的领域本体构建研究基于软件工程开发的领域本体构建研究目前流行的领域本体构建方法有:英国Edinbunrgh大学AI应用研究所的Enterprise工程组开发的骨架法,该方法使用iddleut开发方式提供与商业和企业有关的术语及其定义的集合;加拿大Trnt大学企业集成实验室开发了TVE工程本体,通过该本体来建立指定知识的逻辑模型;Bernaras等人开发的欧洲EapritKATUS工程中由应用来控制本体的开发,每个应用都有相应的知识本体,这些本体即能复用其他的本体,又能集成到工程以后的本体应用中;西班牙adrid理工大学AI实验室开发的,ethntlgy法构建知识级本体;美国Su

2、thernalifrnia大学信息科学研究所开发的Sensus法,主要通过自然语言处理,提取和合并不同电子知识源的信息而得到该领域本体的内容。本文借鉴了上述传统领域本体构建方法中的根本思想,并在构建框架中交融了软件工程开发方法中的构造化开发方法和原型化开发方法。1传统领域本体构建方法分析1.1共同点分析纵观上述骨架法、评估法、Bernaras、ethntlgy及Sensus方法构建领域本体过程中的思路,它们之间存在以下共同点:1许多本体构建方法都以一个详细任务为起点,这样易于知识的获取和本体功能的描绘。2本体构建大致可划分为阶段法如骨架法和演化法如ethntlgy法。3在构建过程中可分为非形式

3、化描绘本体和用正规描绘语言形式化描绘本体前后两个阶段。4希望通过累积的方法构建本体,即先构建一个根底本体,然后做进一步开发。5对于由同一个根底本体构建出的领域本体,由于高层概念的共享,本体系统之间具有互操作才能。1.2缺陷分析IEEE10741995标准是软件开发生命周期过程的标准,其中包括模型阶段、工程管理阶段、软件开发阶段与集成阶段4个开发阶段,其中软件开发阶段的详细步骤如下:1开发前期:主要进展可行性研究等活动;2开发阶段:主要进展需求分析、设计和实现等活动;3开发后期:主要进展软件的安装、试运行、操作和维护等活动。与IEEE10741995标准比照而言,目前领域本体构建还远远没有成为一

4、种工程性活动,还具有如下缺陷:1没有一种方法是完全成熟的,不管是Bearas法、Sensus法、骨架法、评估法,还是ethntlgy法。2缺乏工程化的本体本文由论文联盟.Ll.搜集整理通用构造方法和标准。由于每个研发团队处于不同的学科领域,虽然总结出各个领域不同的开发方法和体系构造,但是各个本体开发方法都不尽统一,缺乏通用的标准。本文在领域本体构建过程中扬弃上述5种领域本体构建方法中的优缺点,而且借鉴了软件工程开发的根本标准。2基于软件工程开发的领域本体构建2.1构建框架本文在领域本体框架构建的形式上采用构造化方法中分段式形式,将整个领域本体构建过程分为领域本体规划阶段、领域本体分析阶段、领域

5、本体设计阶段、领域本体施行阶段及领域本体运行阶段,每个阶段都有自己独立的目的及主要任务,前一阶段任务的完成是后一阶段任务开场的前提和根底,后一阶段任务通常是对前一阶段提出的解决问题方法的进一步详细化,即该过程是按照软件工程开发的生命周期流程来逐步解决问题的。在领域本体分析阶段,根据领域本体规划阶段提出的详细要求和目的,采用原型化方法不断地对分析结果进展修改和完善。其构建框架如图1所示。2.2构建框架分析2.2.1领域本体规划阶段1确定领域本体的用处和范围确定领域本体范围的方式之一是设计并填写本体的性能调查表,以下从需求的角度对本体支持的性能调查表进展简单的分类:需求细化。需求细化过程必须满足何

6、种标准?会产生多余的需求吗?需求是客户的明晰表述吗?需求追溯才能。需求还能分解吗?需求的来源是什么?谁记录需求?需求在特定的设计团队中适用吗?需求满足。需求可以满足吗?两个或多个需求间互相冲突吗?更高抽象级别的需求怎样满足评估?文档生成。需求属于哪类文档?哪些是与需求文档中的段落相符的需求?不属于客户报告的需求有哪些商业机密?晋级。这是需求的最新版本吗?需求的旧版本有哪些?为什么还要改变需求?变化对需求文档的一致性和完好性有影响吗?2考虑复用现有领域本体一些本体已经初具规模,可以在网上找到相应的本体库及相关资料,在详细开发之前,有必要在这些本体中寻找系统可以重用的本体,这样可以省去元本体和顶层

7、本体的建立,而把本体建立的目的重点放在领域本体的建立上。2.2.2领域本体分析阶段1定义类和类层次类描绘了领域的概念而非单词。在类和类层次的定义过程中,需要根据以下8个原那么:确保类层次的正确性恰当使用isa和kind-f等类间关系,is-a关系指类A是类B的子类,前提是B的每个实例也是A的实例。类的子类表示概念是kind-f父类表示的概念;层次关系间具有传递性,并应区分直接子类和间接子类的关系;防止类层次的循环,确保类层次随着领域开展而进化。分析类层次中的兄弟关系在类层次中,兄弟关系是同一类的直接子类,并在同一抽象级别上。关于直接子类的个数并没有明确规定,但父类一般只有2-12个直接子类,过

8、多或过少不都适宜。多重继承关系一个类可以是几个类的子类,那么子类的实例是其所有父类的实例,子类将继承所有父类的属性和关系约束。引入新类的时机当类的子类有其父类不具有的新属性,或有已定义的新属性值,或覆盖父类属性的约束,此时可以引入一个新类。新类可以没有任何新的属性,没有必要为了一个额外的限定条件来创立新类。新类或特性值假如有不同属性值的概念变成其他类中不同属性的约束,那么应该生成新类,以便加以区别;类的单个实例不应经常改变,当使用概念的外在非固有属性来区别类时,这些类的实例将需从一个类挪动到另一类。类或实例判断类完毕和单个实例开场依赖于知识表示中最低的粒度级,而粒度级又由本体应用来确定;假如概

9、念已经形成自然的层次,那么应表述为类,单个实例是最特殊的概念表述,实例没有层次性。限定范围确保不包括类具有的所有特性,仅在本体中表述类最突出的特性,不增添所有类术语间全部的关系。不相关子类很多系统明确指定某些子类不相交,假如类没有任何共同的实例,那么它们不相交。2定义类的属性及其约束类的属性是描绘类和实例的特性,也是类间区分的特性。通常有四种对象特性能变本钱体中的属性:本文由论文联盟.Ll.搜集整理固有的特性,如圆柱的半径和高度。外在的属性,如螺旋的设计者。部分,假设对象是构造化的,物理和抽象的部分。与其他个体间的关系。不同的约束可以用来描绘属性的值类型、值范围、值基准,及值的其他特征。下面从

10、5个方面来描绘属性普通的约束:属性基数。基数定义属性有多少值。有些系统定义单一和多个基数,而有些系统用最小和最大基数来描绘属性值的个数。有些属性设置最大基数为,目的是为了表示特定子类的属性不能有任何值。属性值类型。通常属性值类型可分为字符串型String、浮点或整数数值型Flat或IntegerNuber、是或否布尔型Yes或NBlean、枚举型或符号型Enuerated或Sybl、实例型Instane。属性的领域和范围属性应能描绘其领域中所有的类,属性应能填充其范围内所有类的实例,同时不应指定属性的范围是本体中最通用的类。逆属性属性值可能会依赖于另一属性值,称为逆关系,在两个方向保存此数据是

11、冗余的,通常使用逆属性,可以自动填充另一逆关系的值。默认值假如类的多数实例的特定属性值是一样的,那么可把该值定义成默认值。当类的每个新实例包含这个属性值时,系统自动填充默认值,还能把此值改成约束允许的其他值。3生成实例定义类的单个实例首先需要选择类,接着生成这些类的单个实例,最后填充属性值。为了使生成的类、类间层次关系、类属性及约束、类实例等更符合构建目的和用处,并为了保障在较短时间内合适用户的需求,在领域专家的指导下,采用原型化软件工程开发方法对该阶段产生的成果不断修改和完善。2.2.3领域本体设计阶段1领域本体的形式化表示一般用语义模型表示领域本体。Perez等人用分类法组织领域本体,归纳

12、出5个根本建模元语:类lasses或概念nepts从语义上讲,它表示的是对象的集合,其定义一般采用框架Frae构造,包括概念的名称、与其他概念之间的关系集合、以及用自然语言对概念的描绘。关系Relati在领域中概念之间的交互作用,形式上定义为n维笛卡尔积的子集,即:R=12n函数Funtins一类特殊的关系。该关系的前n-1个元素可以惟一决定第n个元素。形式化定义为F:12n-1n。公理Axis代表永真断言,如概念乙属于概念甲的范围。实例Instanes代表元素,从语义上讲实例表示的就是对象。另外,从语义上讲根本的关系有4种:整体与部分关系Parthle、分类关系IsA、实例与概念关系Inst

13、anenept和属性关系Attribute-f。但在实际建模过程中,概念之间的关系不限于上述4类关系,可以根据领域的详细情况定义相应的关系。2领域本体的形式化描绘语言领域本体可用自然语言、框架、语义网络或逻辑语言等来描绘。但对计算机来说,形式化描绘语言做为一种可供计算机处理的概念模型,应具备以下条件:应该具有较强的表示才能,同时也应兼顾推理才能,以满足智能检索中进一步实现推理的需求。应该具有较强的内在逻辑系统支持。应该具备一致的描绘概念和表示数据的才能。应该尽可能与3已有标准兼容,从而保证其持续开展需求。应该具备XL语法特性,最好是基于语义eb。所表示的领域知识是形式化的,即机器可读和可理解的

14、。目前已经开发了6种本体语言,有些是直接基于XL语言的语法,如简单HTL本体扩展SipleHtlntlgyExtensin,SHE、本体标记语言ntlgyarkupLanguage,L和基于XL的本体交换语言XLbasedntlgyExhangeLanguage,XL;另外有2种本体语言是建立于RDFS之上,以便改善RDFS的特征:本体交互语言ntlgyInterhangeLanguage,IL和DARPA主体标记语言+本体推理层DARAPAgentarkupLanguageithntlgyInfereneLayer,DAL+IL。最近,以IL和DAL+IL语言为起点,已开发出语义网所用的eb

15、本体语言ebntlgyLanguage,L。各个本体语言之间的层次化关系如图2所示:3领域本体的文档化构建和存储构建领域本体文档,可对后续领域本体修改和进化奠定基矗1个L文档由以下4个部分组成:本体首部:包含了文档的元数据,如导入数据、版本数据及与其他L文档的兼容数据。类的定义:通过l:lass标签定义类,使用rdfs:sublassf来继承1个或多个类,由此建立类的层次关系。类的语义用类的描绘来表达。L区分了6种类的描绘:1个类标识,1个详细的列举,1个属性的限定,2个或多个类描绘的交,2个或多个类描绘的并,1个类描绘的补。属性的定义:L存在2种类型的属性,即对象属性bjetPrperty和

16、数据类型属性DatatypePrperty。对象属性是用来表述2个类实例之间的关系,而数据类型属性那么描绘类的实例、RDFLiterals,以及XLShea数据类型之间的关系。属性之间还可以定义子属性关系以及为属性声明额外的特征传递属性和逆属性。如可以定义father是parent的子属性,定义aneatr为传递属性,定义hild为parent的逆属性。个体实例的定义:一个个体是一个特定类的实例,并与其属性相联络。2.2.4领域本体施行和运行阶段1领域本体评价这里采用Gruber在1995年提出的5条准那么:明晰性。所定义的术语应尽量客观,防止受社会背景和客观环境的影响;给出的定义应尽可能完好

17、。一致性。即本体中定义的公理应该是逻辑一致的,概念和概念间关系在逻辑上也应该是一致的。可扩展性。本体应该可以保证添加新的通用或专用术语,而不需要修改原有的定义,即能支持在已有的概念根底上定义新术语。编码偏好程度最校概念应该在知识层次上说明,而不应该依赖于特定的符号层次的编码,因为不同的系统可能采用不同的表示风格。最小本体承诺。一般地,本体承诺只要满足特定的知识共享需求即可,这可以通过定义约束最弱的公理及只定义交流所需的根本词汇来保证。2领域本体试运行可针对某一应用目的,可利用初始生成的领域本体在特定的应用范围内进展试运行,来验证初始领域本体是否可以满足领域范围应用的需求,特别是要检验其一致性、完好性和可扩展性。经过试运行,假设符合要求那么转向4;假设不符合要求那么要重新经过本体分析阶段,然后转向3与4。3领域本体文档的修改针对试运行的结果,可在L文档的根底上做一些标注性的修改。4领域本体应用对于修改后的领域本体,可正式投入实际运行应用过程。3总结和展望

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论