




已阅读5页,还剩93页未读, 继续免费阅读
(计算机软件与理论专业论文)基于odm的ontology构建技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 o n t 0 1 0 9 y 是一个多学科交叉的新兴领域,如何构建o n t 0 1 0 9 y 是0 m o l o g y 工 程中最基本的问题。目前o n t o l o g y 的构建大都采用手工方式,构建过程困难费 时,这在一定程度上影响了0 n t o l o g y 的应用。自动构建o n t o l o g y 克服了手工方 式的不足,成为当前的研究热点。近年来数据挖掘、机器学习、智能信息提取、 自然语言处理等技术的发展为o m o l o g y 自动构建奠定了技术基础,本文作者与 所在的实验室的另外三位成员在此背景下研究并开发了一个0 n t o l o g y 自动构建 平台o n t o a g s 。o n t o a g s 的出现,使得o m o l o g y 在智能化的自动构建研究 上取得了一定的进展。 虽然o m o a g s 在0 n t o l o g y 的自动构建中取得一定进展,但其和世界上的同 类产品的实践证明,自动构建o m o i o g y 的方法和技术依然不成熟,尤其在构建 出的o n t o l o g y 的精确性方面尚不能满足商业要求,在某些领域中自动构建 o m 0 1 0 9 y 的技术仍然是构建0 n t o l o g y 的辅助工具。可见如何在快速构建o n t o i o g y 的同时提高o n t o l o g y 的构建精确性已成为o n t 0 1 0 9 y 理论研究和实践应用中的一 个主要问题。 另一方面,目前主流的软件开发技术是面向对象的开发技术,能否将 o n t o l o g y 的构建,作为软件开发的一个环节,进而运用当代最先进的软件开发技 术来支持o n t o i o g y 的构建,以此来提高o n t o l o g y 构建的快速性和准确性? 通过 本文作者长期的调查和研究发现,答案是可行的。同时0 m g 也在制定o n t o l o g y 的元模型标准,以此来支持o m o l o g y 的面向对象化。因此,本文在o m g 的 o n t o l o g y 元模型标准- 0 d m 的基础上,建立了面向对象的o n t o l o g y 的模型 e m f - 0 n t o i o g y ,同时在该模型的基础上开发出了0 n t o l o g y 解析器和o n t o l o g y 映射机,三者一起构成了本文所设计的面向对象的0 m o l o g y 模型与支撑系统 0 0 一o n t o l o g y 。此外,本文对如何应用0 0 0 n t o l o g y 来支持o n t o l o g y 快速和 精确的构建进行了探讨,即如何通过o o 一0 n t o l o g y 来支持o n t o l o g y 的模型驱动 构建。我们的讨论表明,运用o o - o n t o l o g y 构建o n t 0 1 0 9 y 可以在提高o n t o l o g y 北京工业大学工学硕士学位论文 构建效率的同时,还可以增强0 n t o l o g y 构建的精确性。 关键词o n t o l o g y ;o d m ;解析器;映射机;模型驱动构建 a b s t r a c t o n t o i o g yi san e wd o m a i nw h i c hi n v o l v e sm u l t i p i es u b j e c t s t h eb a s i cp r o b l e mi no n t o l o g y e n g i n 口e r i n gi sh o w t oc r e a t eo n t o l o g yn o w0 n t 0 1 0 9 yi sc r e a t e dm a i n i yb yh a n dt 1 1 a ti sh o w e v e ra d i 伍c u l ta n dt i m ec o n s u m i n gp r o c e s s ,w h i c ht os o m ee x t e ma 舵c t s 也eo n t o l o 舒印p l i c 撕0 n s t h e w a yo fc r e a t j n go n t o i o g ya u t o m a t i c a l j yo v e r c o m e st h el a c ko fo n eo fc r e a t i n go n t o l o g yb yh a n d , w h j c hm a k e si tt h ec u r r e n tr c s e a r c hh o t s p o t i nr e c e my e a r s ,t h ed e v e l o p m e n to ft e c h n o l o g ms u c h 私d a t am i n i n 舀m a c h i n ej e a r r i i n & i n t e l l i g e n ti n f o r h l a t i o nr e t r i e v a i ,n a t u r a li a l l g u a g ep r o c e s s i n g , e t c e s l a b l i s h e st h et e c h n l c a lf o u n d 撕o nf o rc r e a t j m go n t 0 1 0 9 ya u t o m a t i c a i l y b a s e do na b o v e b a c k 乎。硼d ,t i l ea u t h o ro ft h i sp a p e ra n do t h e rt 1 1 r e em e m b e r sr c s e a r c h e d a 1 1 dd e v e l o p e da p l a t f o 肿o f c r e a t i n go n t 0 1 0 9 ya u t o m a t i c a l i y o n t o a g s t h ea p p e 删c eo f o n t o a g sm a k e ss o m e p r o g r e s si nc r e a t i n go n t o l o g ya u t o m a t i c a i i y h o w e v e o m o a g s 柚do m e rs i m i l a rp r o d u c l s m 也ew o r l dp r a v em a tt h em 酏h o d sa i l d t e c h n i q u e so fc r e a t i n go m o l o g ya u t o m t i c a l l ya r es 1 1 lj m m a t i l r e ,e s p e c i a l l yi nt h ea s p e c tt h a tl h e a c c u m c yo fo n t o l o g yb u i l tc o u l dn o tm e e tt h ec o m m e r c i a lr e q u i r e m e n t s a n dt h et e c h n i q u e so f c r e a t i n go n t o l o g ya u t o m a t i c a l l ya r es t i l l ac o m p l e m e n t a r yt o o li ns o m ea r e a s s ot h a tc r e a t i n g 0 n t 0 1 0 9 yr a p i d l yw h n ee m l a n c j n gi t sa c c u r a c yh a sb e c o m eam a j o rp r o b l e mi nt h e o r e n c a ls t u d y 柚dp r a c t i c a l 印p l i c a t i o n so f 0 i l t 0 i o 料 f u 曲e 眦o r e ,o b j e c t - o r i e n t e ds o f t w a r ed e v e l o p m e mt e c 1 1 1 0 i o 爵i st h em a i n s t r e 锄t e c h n o l o g y i ns o f t w a r ee n g i n e 丽n g c o u l dc r e a t i n go fo m o l o 科b et r e a t e d 船ap a no fs o f h a r ed e v e l o p m e n t , b 站e d0 nw h i c h 印p l yt 1 1 em o s ta d v a n c e dt e c h n o l o g yo fs o 竹w a r ed e v e l o p m e mt os u p p o nc r e a t i n g o n t o l o g y s oa st oe n h 柚c et h er a p i d n e s sa n da c c u r a c yo fc r o 鲥n go n t o l o g y ? t h r o u g hl o n g 。t e r m i n v e s t i g a t i o na n ds t u d yb yt h ea u t h o ro f t h j sp a p e li t 、v a sf o u n dt h a tt h ew a yw a sf e a s i b l ea tt h e s a r n et i m e ,o m gi sa l s od e v e i o p i n gas t a n d a r do f o n t o l o g ym e t a - m o d e it 0s u p p o r to b j e c t o r i e n t e d o n t o l o g yc f e a t j o n t h e r e f o r e ,i nm i sp 印e la no b j e c t - o r j e n t e do n t o i o g ym o d e i ,e m f o n t 0 1 0 9 y 1 w a sb u i l tb a s e do nt h es t a n d a r do fo n t o l o g ym e t a - m o d e lo fo m go d m i na d d j t j o n ,o n t 0 1 0 9 y p a r s i n gm a c h i n ea n do n t 0 1 0 9 ym 印p i n gm a c h i n ew e r ed e v e j o p e d b a s e do ne m f o n t o i o g y e m f - o n t o l o g y o n t o l o g yp a r s i n g m a c h i n ea n do 咖l o 蜊m a p p i n gm a c h i n ec o n s s ta n i n 北京工业大学丁学硕士学位论文 o b j e c t o r i e n i e do m o l o g ym o d e la n di t ss u p p o r t i n gs y s t e m ,o o - o n t o l o g yf u r t h e r m o r e ,h 。wt o u s e0 0 - o n t o l o g yt os u p p o r tc r e a t i n go n t o i o g ym p i d i ya 1 1 da c c u r a t e l yi sd i s c u s s e di nt h i sp 印e l w h i c hi sh o wt ou s eo o o n t o l o g yt os u p p o r to n t o i o g ym o d e l i n gd r i v e nc o n s t m c t i o n o u r d i s c u s s i o ni n d i c a t e st h a tu s i n go o o n t o l o g yc a ne n h a n c e 也ea c c u r a c yo f c r e a t i n go n t o i o g yw l 州e 血ee f f i c i e n c yo f c r e a t l n go n t 0 1 0 9 yi si m p r o v e d k e y w o r d 8o n t o l o g y ;o d m ;p a r s i n gm a c h i n e ;m a p p i n gm a c h i n e ;m o d e l i n gd r i v e nc o n s t r u c t i o n - 一 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名:么盎日期 关于论文使用授权的说明 丝弛羽 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名:红导师签名 1 1 研究背景 第1 章绪论 人、组织和信息系统及其相互之间需要进行各种交流,但由于认识问题的 深度、知识水平、所处环境、考虑问题的着眼点、以及处理问题的方式等因素 的不同,使得对同一问题、同一事物往往存在有不同的理解和认识,结果出现 了一系列不同的、重复定义而又不一致的概念、结构和方法,以致产生下列不 良后果: 1 ) 由于缺乏共同认识而导致人与人、组织与组织、以及人与组织之间缺乏 沟通;在信息系统建设过程中,难以识别系统需求和定义系统规格1 1 j 。 2 ) 由于使用完全不同的建模方法、范例、开发语言及软件工具,限制和降 低了系统的互用性以及重用和共享的可能。 系统之间缺乏协调工作的能力,相互之间不能进行有效的通信,一个系统 不能有效地利用另一个系统的知识和结果,导致许多重复无用的劳动。 要解决这些问题,根本的力法就是要减少、甚至是消除在概念和用辞上混 乱,达成对事物互相一致的共同认识,并将其作为各种不同观点间的一种统一 的框架和基础。以此建立起来的统一框架就是咀o n t o l o g y 概念和方法为基础的。 另一方面,在万维网日益普及的今天,人们充分体会到网络的巨大魅力。 目前的万维网其进化、扩大和完善的空间还很大,可以说万维网还没有走出婴 儿期。为使万维网迈上一个新的台阶,从此摆脱幼稚,走向成熟和真正的智能 化,1 0 年前为我们发明因特网超文本系统的麻省理工学院万维网协会主席蒂 姆- 伯纳斯t 李,现在又在致力于开发新一代的万维网,他为之取了一个直观的名 称j 语义w 曲”( 1 es e m a n c i cw 曲) 。简单地说,语义w e b 是一种能理解人 类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间 的交流变得像人与人之间交流一样轻松。 语义w e b 是对万维网本质的变革,它的主要开发任务是使数据更加便于电 脑进行处理和查找。其最终目标是让用户变成全能的上帝,列因特网上的海量 资源达到几乎无所不知的程度,计算机可以在这些资源中找到你所需要的信息, 资源达到几乎无所不知的程度,计算机可以在这些资源中找到你所需要的信息, 北京工业大学一 学硕士学位论文 从而将万维网中个个现存的信息孤岛,发展成一个巨大的数据库。 语义w 曲将使人类从搜索相关网页的繁重劳动中解放出来。因为网中的计 算机能利用自己的智能软件,在搜索数以万计的网页时,通过“智能代理”从中 筛选出相关的有用信息。而不像现在的万维网,只给你罗列出数以万计的无用 搜索结果。 语义w 曲虽然是一种更加美好的网络,但实现起来却是一项复杂而浩大的 工程。要使语义w 曲搜索更精确彻底,更容易判断信息的真假,从而达到实用 的目标,首先需要制订标准,该标准允许用户给网络内容添加元数据( 即解释 详尽的标记) ,并能让用户精确地指出他们正在寻找什么;然后,还需要找到一 种方法,以确保不同的程序都能分享不同网站的内容:最后,要求用户可以增 加其他功能,如添加应用软件等。而语义w e b 的核心便是o n t o l o g y 。 因此o n t o l o g y 的重要性在语义w 曲提出之后得到了信息科学领域的广泛认 同。 o t o l o g ) ,是个多学科交叉的新兴领域,如何构建o n t 0 1 0 9 y 是o i l t o l o g y 工程中最基本的问题。目前o m o l o g y 的构建大都采用手工方式,构建过程困难 费时,这在定程度上影响了o n t o l o g y 的应用。自动构建o m o l o g y 克服了手工 方式的不足,成为当前的研究热点。近年来数据挖掘、机器学习、智能信息提 取、自然语言处理等技术的发展为o n t o l o g y 自动构建奠定了技术基础,本文作 者与所在的实验室的另外三位成员在此背景下研究并开发了一个o n t o l o g y 自动 构建平台o n t o a g s 。o m o a g s 的出现,使得o n t o i o g y 在智能化的自动构建 研究上取得了一定的进展。例如0 n t o a g s 在构建o n t o l o g y 中,术语抽取的过 滤准确率达到了9 6 5 l ,实例学习和关系学习的准确率也优于世界上的同类产 品【2 】。 虽然o n t o a g s 在o m 0 1 0 9 y 的自动构建中取得一定进展,但其和世界上的 同类产品的实践证明,自动构建o n t o l o g y 的方法和技术依然不成熟,尤其在构 建出的o n t o l o g y 的精确性方面尚不能满足商业要求,在某些领域中自动构建 o n t o i o g y 的技术仍然是构建o n t 0 1 0 9 y 的辅助工具【2 】。可见如何在快速构建 o n t o l o g y 的同时提高o n t o l o g y 的构建精确性已成为o n t 0 1 0 9 y 理论研究和实践应 用中的一个主要问题。本文作者认为在o n t o l o g y 构建中提高其构建精确性上有 第l 章绪论 两条路可以走,其一是继续在以人工智能技术为背景下,寻找智能化自动构建 的新方法和新技术;其二是利用现有成熟的面向对象的建模技术来支持 o n t o l o g y 的精确化构建。 而从第二个角度来看,目前主流的软件开发技术是面向对象的开发技术, 能否将o m o l o g y 的构建,作为软件开发的一个环节,进而运用当代最先进的软 件开发技术来支持o n t o l o g y 的构建,以此来提高o m o l o g y 构建的快速性和准确 性? 通过本文作者长期的调查和研究发现,答案是可行的。然而o w l ( w 曲 o n t o l o g yl a n g u a g e ) 等代表性的0 1 1 t 0 i o g y 描述语言都采用了大量的逻辑符号和 抽象描述,o n t o l o g y 本身也同人工智能有着密切的联系,在某种意义上说 0 n t 0 1 0 9 y 是a i 的o n t o l o g y ,这和面向对象概念有着本质上的差别。而就在o w l 成为w 3 c 推荐的o n t 0 1 0 9 y 的标准语言时,o m g ( o b j e c tm a i l a g e m e n tg r o u p ) 也在制定o n t o l o g y 元模型的标准o d m ( o m 0 1 0 9 yd e f m i t i o nm e t 锄o d e l ) , 以此来支持0 n t o l o g y 的面向对象化。本文便是在o d m 的基础上,建立了面向 对象的o n t o l o g y 的模型,本文对其命名为e m f o i l t o l o g y 。同时在该模型的基 础上开发出了0 n t 0 1 0 9 y 解析器和o n t o l o g y 映射机,三者一起构成了本文所设计 的面向对象的o n t 0 1 0 9 y 模型与支撑系统,本文对其命名为o o o n t o l o g y 。此外, 本文对如何应用o o o n t o l o g ) r 来支持o n t o l o g y 的快速和精确的构建进行了探 讨,即如何通过o o 0 m o l o g y 来支持o m o l o g y 的模型驱动构建。我们的讨论表 明,运用o o o n t o l o g y 来构建o n t 0 1 0 9 y 可以在提高o n t o l o g y 构建效率的同时, 还可以增强o n t o l o g y 构建的精确性。 1 2 论文的主要工作 1 2 1 研究内容 本文在o m g 的o d m 标准的基础上,运用m d a ( m o d e ld r i v e na r c h i t e c t u r e ) 框架和方法,采用m d a 的一个实现体e m f ( e c l i p s em o d e l i n gf r a m e w o r k ) ,建 立了面向对象的o n t o l o g y 的模型,本文对其命名为e m f o m 0 1 0 9 y ,并在此基 础上,开发出o n t o i o g y 解析器( 0 n t 0 1 0 9 yp a r s i n gm a c h i n e ) 和o n t o l o g y 映射机 ( o m o l o g ym a p p i n gm a c h i n e ) 。e m f o n t o l o g y 、o n t o l o g y 解析器和o n t o l o g y 映 北京工业大学工学硕士学位论文 射机三者构成了本文所设计的面向对象的o n t o i o g y 模型与支撑系统,本文对其 命名为o o 一0 n t o l o g y ,以此来支持o n t o l o g y 的快速和精确构建。 此外,本文对如何应用o o o m 0 1 0 9 y 来支持o m o l o g y 的快速和精确的构建 进行了探讨,即如何通过o o 0 n t o l o g y 来支持o n t 0 1 0 9 y 的模型驱动构建。我 们的讨论表明,运用0 0 - o n t o l o g y 来构建o n t o l o g y 可以在提高0 n t o l o g y 构建 效率的同时,还可以增强o n t 0 1 0 9 y 构建的精确性,为o n t o l o g y 的商业需求和 应用奠定了理论和技术基础,并可以提供精确的领域o n t o l o g y 。 1 2 2 论文的组织结构 本文共分为8 章。 第1 章是本文的绪论,介绍了本文课题的研究背景和本文的主要工作。 第2 章是o m o l o g y 综述,介绍了o n t o l o g y 的主要研究内容,其中包括 o n t o l o g y 的起源和发展,o n t o l o g y 的定义,o n t o i o g y 的分类,o n t o l o g y 的构建 方法论,o n t o i o g y 的建模原语,o n t o l o g y 的描述语言,0 n t o l o g y 与语义w 曲的 关系以及o m o l o g y 的应用等。 第3 章是o d m 中r d f s 和o w l 元模型介绍,详细介绍了o d m 中r d f s ( r e s o u r c ed e s c r i d t i o nf r 锄e w o r ks c h e m a ) 和o w l 元模型的相关类图、类图 中类的概念以及类概念之间的关系,为第4 章0 0 一o n t o l o g y 的设计和第5 章 r d f s 和0 w l 元模型的实现奠定了基础。 第4 章是o o o n t o l o g y 的总体架构和设计思想,简单介绍了本文所设计的 面向对象的o n t o l o g y 模型与支撑系统0 0 - o m o l o g y ,并给出了其总体架构 图。0 0 0 n t o l o g y 分为三个部分,分别为e m f - o n t o i o g y 、o n t o l o g y 解析器和 o t o l o g y 映射机。本章简单介绍了这三部分的功能,第五、六、七章分别详细 介绍这三部分。 第5 章是o d m 中r d f s 和o w l 元模型的实现,根据o d m 中尉) f s 和 o w l 的元模型标准,运用m d a 框架和方法,采用m d a 的一个实现体e m f , 建立了面向对象的o n t o l o g y 的模型,本文给该模型起名为e m f o n t o l o g y 。本 章首先讲解m d a 和e m f 的相关概念,然后介绍了本文对o d m 的实现机理和 过程。 第1 苹绪论 第6 章是0 n t o l o g y 解析器的设计与实现,详细介绍了本文所设计的 o n t o l o g y 解析器的概念、算法和解析实现过程。本章主要详细描述了o w l 的 r d f s o w l 的解析算法和过程。 第7 章是o m o l o g y 映射机的设计与实现,详细介绍了本文所设计的 0 m o l o g y 映射机的概念、算法和映射转换过程。0 n t o l o g y 映射机包括4 个子映 射机,分别为r j ) f s e c o r e 映射机、o w l e c o r e 映射机、e c o r e r d f s 映射机 和e c o r e 。0 w l 映射机,本章将给出这4 种映射机的详细映射算法。 第8 章是实验与0 0 - o n t o l o g y 在o m o l o g y 构建中的应用,通过测试包含 w 3 c 推荐的o w lw e bo n t 0 1 0 9 yl a n g u a g et e s tc a s e s 中的第7 1 节中的2 9 个测 试片断的f o o d o w l 和w i n e o w l 验证了o o o m o l o g y ,实验结果表明,o o o n t o i o g y 的设计是合理的和正确的。此外,本章探讨了如何运用本文设计的o o - 0 n t o l o g y 来支持o n t o l o g y 的模型驱动式的构建,并给出示例来说明运用o o o m o l o g y 来 支持0 n t o l o g y 快速和精确构建的合理性。 最后是本文的结论,对全文进行了总结,说明了本文的创造性工作,并提 出了本文进一步的研究工作。 第2 章0 n t o l o g y 综述 第2 章o n t o io g y 综述 2 10 n t o l o g y 的起源和发展 o n t o l o g y 即本体或本体论。从西方哲学史来看,本体论作为一门学问起源 于对万物本原的追问。本体论这个词早在1 7 世纪就已诞生,其派生于希腊语的 “o m o ”( “存在”) 和“i o g ”( “箴言录”) ,是一个哲学术语。从哲学意义上看, 本体论关注的是“存在”,即世界在本质上有什么样的东西存在,或者世界存在 哪些类别的实体。所以哲学上的本体论是对世界任何领域内的真实存在所做出 的客观描述,而且这种描述不一定完全建立在已有的知识基础上,还包括“求真” 的过程。实际上,人类对“存在”问题的探讨由来已久,也和哲学的起源分不开。 哲学家亚里士多德早在公元前4 世纪所确立的重要哲学分支“m e t a p h y s i c s ”就是 “关于存在的科学”,在很长时间里,本体论也一直被看作是m e t 印h y s i c s 的同义 词。后来,伴随近代科技革命的出现,m e t a p h y s i c s 逐渐包纳更多的研究领域( 如 意识、事实、价值等) ,而本体论继续承担着哲学中对世界“存在”的研究,成为 现代哲学体系的根基例。 正如本体论的诞生与哲学早期的发展密切相关一样,在过去的数十年中, 本体论在计算机科学领域的发展也与人工智能和信息技术的起步和发展密不可 分。 在人工智能领域,经历了2 0 世纪6 0 年代通用问题求解方法研究的困境, 学者们开始研究通过专门领域的知识表达来支持自动推理。以d e n d r a l f 4 】为 代表的知识库系统的成功确立了知识在解决人工智能问题方面的重要地位,作 为研究知识库和知识系统构建技术的学科“知识工程”( k n o w l e d g ee n 酉n e e 咖g ) 1 5 1 发展起来。为了减少构建知识库的代价,避免每次都从头开始,越来越有必 要考虑知识的复用问题。通过复用,系统开发者可以在已有知t 基础上更加专 注于特定领域的知识构建,并且新系统可以利用所复用的知识与现存的其他系 统进行交互。这样,描述性的知识、问题解决方法以及推理服务都可在系统间 实现共享,从而可以方便地构建出更大、更好的知识库。 自1 9 世纪初,0 n t 0 1 0 9 y 就已成为一个热门研究课题,被知识工程、自然语 北京工业大学工学硕士学位论文 言处理、知识表示等几方面人工智能研究组织所关注。最近,在智能知识集成、 多协作信息系统、信息检索、电子商务、知识管理等领域,o n t o l o g y 的研究也 日益深入开展起来。o m o l o g y 之所以在越来越多的领域备受重视,其主要原因 是o 哟l o g y 能实现知识的复用和共享,这也是当前计算机技术从单机向网络发 展过程中信息交流所必须的。 2 2o n t o l o g y 的定义 1 9 9 3 年,美国斯坦福大学知识系统实验室( k s l ) 的g m b e r 给出了第一个 在信息科学领域广泛接受的o m o l o g y 正式定义1 6 7 】:“a n0 m o l o g yi sa ne x p l i c i t s p e c m c a t i o no fac o n c e p t u a l i z a t i o n ”。0 m b e r 认为:概念化是从特定目的出发对 所表达的世界所进行的一种抽象的、简化的观察。每一个知识库、基于知识库 的信息系统以及基于知识共享的智能a g e n t 都内含个概念化的世界,或是显 式的或是隐式的。本体论是对某概念化所做的一种显式的解释说明。本体中 的对象以及它们之间的关系是通过知识表达语言的词汇来描述的。因此,可以 通过定义套知识表达的专门术语来定义一个本体,以人可以理解的术语描述 领域世界的实体、对象、关系以及过程等,并通过形式化的公理来限制和规范 这些术语的解释和使用。因此严格地说,本体是一个逻辑理论的陈述性描述。 后来,b o r s t 在此基础上,给出了0 m o l o g y 的另外一种定义【8 j :“o m o l o g y 是共享概念的形式化规范说明”。s t u d e r 等对上述两个定义进行了深入的研究, 认为o n t o l o g y 是共享概念模型的明确的形式化规范说明。这包含4 层含义:概 念模型( c o n c e p t u a l i z 砒i o n ) 、明确( e x p i i c i t ) 、形式化( f o n n a l ) 和共享( s h a r e ) 。 “概念模型”指通过抽象出客观世界中一些现象的相关概念而得到的模型。概念 模型所表现的含义独立于具体的环境状态。“明确”指所使用的概念及使用这些 概念的约束都有明确的定义。“形式化”指o n t o l o g y 是计算机可读的( 即能被计 算机处理) 。“共享”指0 r l t o l o g y 中体现的是共同认可的知识,反映的是相关领 域中公认的概念集,即o m o l og ) ,针对的是团体而非个体的共识。0 m o l o g y 的目 标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同 认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的 明确定义。 2 30 n t o i o g y 的分吾喜 根据描述对象的不同,可以将0 n t o l o g y 分为以下几类舢1 2 : ( 1 ) 领域o m o l o g y :获取特定领域( 例如,电子、医药、机械、运输等领 域) 有用的知识。 ( 2 ) 普通或常识o n t o l o g y :用于获取有关世界的普通常识的知识,并建立 起有关时间、空间、状态和事件等内容的基本概念。这样建立起来的概念在多 个领域中是有用的。 ( 3 ) 应用o n t 0 1 0 9 y :含有建立一个特定领域模型所需的全部知识( 通常是 领域o n t 0 1 0 9 y 和方法o n t o l o g y 的结合) 。 ( 4 ) 表示0 n t o l o g y :并不将其本身限定于任何特定领域,这些o n t o l o g y 规定实体的表示方式却不规定什么应该表示。一种众所周知的表示o n t o l o g y 就 是框架o n t o l o g y 【1 3 】,其中定义框架、槽、槽约束、共允许以面向对象或基于框 架的方式表达知识。 2 4o n t o l o g y 构建方法论 目前,关于0 n t o l o g y 构建的方法还不成熟,没有一套完整的统一的方法论。 下面举例一些已经开发出的典型o n t o l o g y 以及方法论: ( 1 ) c y c 本体及方法f 1 4 】; ( 2 ) 企业本体及u s c h o l d & 髓n g 方法 9 】: ( 3 ) 1 o v e 本体及c 1 唧n i n g e r & f o x 方法【9 】; ( 4 ) k a c t u s 及b e m a r a s 方法 1 5 j : ( 5 ) c h e m i c a l s 本体与m e t h o n t o l o g y 方法【1 6 ; ( 6 ) s e n s u s 本体及方法。 文献 1 8 1 综述了1 9 9 8 年之前一些本体开发的方法论,认为: ( 1 ) 许多本体构建都以一个具体任务为起点,这样易于知识的获取和本体 功能的描述: ( 2 ) 本体构建大致可划分为阶段法( 如g r u n i n g e r f o x 以及u s c h o l d 鼬n g 等) 和原型演化法( 如m e t h o n t o l o g y 等) ; 北京工业人学工学颂l 学位论文 ( 3 ) 在构建过程中可分为“非形式化描述本体”和用正规描述语言“形式化 描述本体”前后两个阶段; ( 4 ) 希望通过积累的方法来构建本体,即先构建一个基础本体,然后作进 一步开发; ( 5 ) 本体构建还没有一套作为“科学”或“工程过程”的完整方法论,成功很 大程度上依赖于具体项目。 2 50 n t o l o g y 的建模原语 在文献 1 9 】中,p e r e z 等人认为o n t o l o 盱可以按分类法来组织,他归纳出 o n t 0 1 0 9 y 包含5 个基本的建模元语( m o d e l i n gp r i m i t i v e ) 。这些元语分别为:类 ( c l a s s e s ) ,关系( r c l a t i o n s ) ,函数( f i l r l c t i o n s ) ,公理( a x i o m s ) 和实例( i n s t a n c e s ) 。 通常也把c l a s s e s 写成c o n c e p t s 。 概念的含义很广泛,可以指任何事物,如工作描述、功能、行为、策略和 推理过程等等。关系代表了在领域中概念之间的交互作用。形式上定义为n 维 笛卡儿乘积的子集:r :c l x c 2 x c 。如:子类关系( s u b c l a s s o f ) 。函数是一 类特殊的关系。在这种关系中前n 1 个元素可以唯一决定第n 个元素。形式化 的定义如下:f :c l c 2 c 。_ l c 。例如m o t l l e r o f 关系就是个函数,其中 m o t l e r - o f ( x ,y ) 表示y 是x 的母亲,显然x 可以唯一确定他的母亲y 。公理代表 永真断言,比如概念乙属于概念甲的范围。实例代表元素。 从意义上分析,实例表示的就是对象,而概念表示的则是对象的集合,关 系对应于对象元组的集合。概念的定义一般采用框架( 丹锄e ) 结构,包括概念 的名称,与其他概念之间的关系的集合,以及用自然语言对该概念的描述。基 本的关系有4 种:p a r t o f ,k i n d o f ,i n s t a l l c e o f 和a t 砸b u t e o f 。p 矾一o f 表达概念 之间部分与整体的关系;k i n d o f 表达概念之间的继承关系,类似于面向对象中 的父类和子类之间的关系,给出两个概念c 和d ,记c = x | x 是c 的实例) , d = ( x k 是d 的实例) ,如果对任意的x 属于d ,x 都属于c ,则称c 为d 的 父概念,d 为c 的子概念;i n s t a l l c e o f 表达概念的实例和概念之间的关系,类 似于面向对象中的对象和类之间的关系:a t t 曲m e o f 表达某个概念是另外一个 概念的属性。例如概念“价格”可作为概念“桌子”的一个属性。在实际的应用中, 第2 章o 呲o l o g y 综述 不一定要严格地按照上述5 类元语来构造o m o l o g y 。同时概念之间的关系也不 仅限于上面列出的4 种基本关系,可以根据特定领域的具体情况定义相应的关 系,以满足应用的需要。 2 6o n t o i o g y 的描述语言 0 n t o l o g y 表示语言口】分为三类: 第一类是基于谓词演算的o n t o l o g y 表示语言,如:f 圳( k n o w l e d g e i n t e r c h 肌g ef o n n a t ) 、o m 0 1 i n g u a 【2 1 1 、c y c l 【2 引、l o o m 2 3 】、o c m l 【2 4 25 1 、f l o g i c 2 7 】( f r 锄el o g i c ) 等。 第二类是基于图的o m o l o g y 表示语言,如:w o r d n e t 的语义网络、概念 图f 2 吼3 卅( c o n c e p t u a l ( m p h s ,c g ) 等。 第三类是基于w c b 的0 m 0 1 0 9 y 表示语言,如:s h o e 【3 l 】( s i m p l eh t m l o m o l o g ye x t e n s i o n ) 、x o l 【3 2 】( o n t o l o g ye x c h a n g el a n g u a g e ) 、o m l 【3 3 】( o n t o l o g y m a r k u p 胁g i l a g e ) 、r d f ( s ) 【3 4 ,3 5 1 ( r d fs c h 锄a ) 、o i l 【3 6 ( o n t o l o g yi m e r c h 柚g e l a i l g u a g e ) 、d p d v i l 【3 7 1 p a r p aa g e mm 盯l ,l l pl a i l g i l a g e ) 、d a m l + o i l 、0 w l 【3 8 3 卅( w 曲o n t 0 1 0 9 yl a n g u a g e ) 等。图2 一l 给出了w 3 c 的o n t o l o g y 语言栈。有关本 文用到的r d f ( s ) 和o w l 的详细描述请参见参考文献 3 4 】和【3 8 。 图2 1 w 3 c 的o m o i o g y 语言栈 f 吨i u r e2 、lo n t o l o g yl 醐g u a g es 诅c ki nw 3 c 2 70 n t o l o g y 与语义w e b 的关系 o n t o l o g y 在w 曲上的应用导致了语义w 曲【4 0 1 的诞生,其目的是解决w e b 上信息共享时的语义问题。语义w 曲被看做是当前o n t o l o g y 从学术研究走向实 际应用的最重要的构想和研究计划。语义w e b 的体系结构如图2 2 所示。 图2 - 2 语义w 曲的体系结构 f i g u r e2 - 2s e m a n t i cw 曲a r c h i t e c t u r e 1 9 9 8 年,w 曲的创始人t i m b e m e r s l e e 首次提出了“语义w e b ”( s e m a f l t i c w 曲) 的概念及其技术路线【4 1 】。2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 育婴师职业道德与责任考核试题及答案
- 精炼2024年系统架构设计师考试知识点总结试题及答案
- 激光教育培训的需求与市场现状试题及答案
- 药剂类考试复习的注意事项及试题及答案
- 护士资格证考试卫生知识普及考题及答案
- 教育学中师试题及答案
- 卫生管理证书考试技巧总结试题及答案
- 老人残疾测试题及答案
- 教师资格考试全要素复习与试题及答案
- 税务师考试考场应对策略试题及答案
- Unit 6 Beautiful landscapes Reading 教学设计-2024-2025学年译林版七年级英语下册
- 神经导航在神经外科手术中的应用与经验
- 2024-2025学年湖南省邵阳市新邵县第二中学高二上学期期中考试英语试卷
- 学习通《形势与政策》2025春章节测试答案
- 外研版(2025版)七年级下册英语Unit 1~3+期中共4套测试卷(含答案)
- 消防员战斗服装和设备介绍
- 网球场翻新施工方案
- 2025年四川省国有资产经营投资管理有限责任公司招聘笔试参考题库附带答案详解
- 基于国内外文献对银发网红崛起、影响与发展的综述探讨
- 2025年国家公务员考试公共基础知识题库400题及答案
- 2024年09月四川浙江民泰商业银行成都分行支行行长社会招考笔试历年参考题库附带答案详解
评论
0/150
提交评论