已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着越来越多的w 曲服务被部署,有很多的服务可能提供相同的功能但是却有着截 然不同的服务质量( q o s ) 。用户往往会依据服务质量来选择所需的服务。语义网技术的 目标是使得机器能够更好的处理网上的资源。而w 曲服务则是这些重要的资源之一。 将语义网技术和w 曲服务结合起来可以解决现有技术的很多难题。使用软件代理可以 实现w e b 服务的发现,选择,调用,组合和监控的自动化。这方面的努力取得的成果 之一就是w e b 服务本体o w l - s 的出现。o w l - s 使用o w l 对服务进行建模,它描述 了服务的功能,如何工作以及如何访问。但是o w l - s 缺乏对非功能特性w 曲服务质量 的描述。现在已有这方面的研究,但工作不太令人满意,因为建立的服务质量本体大多 过于主观。本论文的主要工作是首先结合软件度量理论构造了服务质量本体并与相关工 作进行了比较。然后提出了一个基于q o s 本体的服务选择框架,给出了一个w e b 服务 组合选择问题的示例,使用可废止逻辑为其构造了选择规则,最后将本文提出的基于服 务质量本体的框架同相关工作进行了比较。 关键词:本体:服务质量;软件度量:w e b 服务选择 a b s t r a c t a sm o r ea n dm o r ew e bs e r v i c e sa r ed e p l o y e da n dm o s to ft h e mm a yp r o v i d e s i m i l a rf u n c t i o nb u th a v eq u i t ed i f f e r e n tq u a l i t yo fs e r v i c e ( q o s ) l e v e l s a n dt h e c u s t o m e r sa r em o r el i k e l yt os e l e c tt h es e r v i c eb a s e du p o ni t sq o s s e m a n t i cw 曲 t e c h n o l o g ya i m sa tf a c i l i t a t i n gt h em a c h i n e st od e a lw i t ht h er e s o u r c e so nt h ew 曲 w 曲s e r v i c ei so n eo ft h em o s ti m p o r t a n tw e br e s o n r c e s c o m b i n a t i o no fs e m a n t i c 黝a n d 黝s e r v i c e sc o n c e p t sm a ya d d r e s sm a n yd i f f i c u l t i e so f e x i s t i n gt e c h n o l o g y s o f t w a r ea g e n t sc a nt h e nd i s c o v e r , s e l e c t ,i n v o k e ,c o m p o s e , a n dm o n i t o rw e b s e r v i c e sa u t o m a t i c a l l y as i g n i f i c a n to u t c o m eo ft h ee f f o r ti st h ed e v e l o p m e n to fa w e bs e r v i c eo n t o l o g y , t t l a ti so w l s o w l - su s e so w lt ob u i l daw e bs e r v i c e o n t o l o g ya n di tc a nb eu s e dt od e s c r i b ew h a tt h es e r v i c ed o e s ,h o wi tw o r k sa n dh o w i ti sa c c e s s e d b u to w l sl a c k so fa no n t o l o g y , w h i c hi su s e dt od e s c r i b et h eq o so f w e bs e r v i c e s o m ew o r kh a sb e e nd o n e ,b u tn o ta c c e p t a b l ef o rm o s to ft h e i rq o s o n t o l o g i e sa r et o os u b j e c t i v e i nt h i sp a p e r , aw 曲s e r v i c eq o so n t o l o g yi sb u i l t r e f e r r i n gt os o f t w a r em e t r i ct h e o r ya n dc o m p a r e dw i t hr e l a t e dw o r k t h e naw e b s e r v i c es e l e c t i o nf r a m e w o r kb a s e do nt h eo o so n t o l o g yi sp r o p o s e d f o ri l l u s t r a t i o n p u r p o s e , a ne x a m p l eo fw e bs e r v i c e sc o m p o s i t i o ns e l e c t i o ni sg i v e na n ds o m e d e f e a s i b l er u l e sa l ec o n s t r u c t e dt os o l v et h ep r o b l e m f i n a l l y , t h ef r a m e w o r ki s c o m p a r e dw i t ht h er e l a t e dw o r k k e yw o r d :o n t o l o g y ;q o s ;s o r w a r em e t r i c ;w e bs e r v i c es e l e c t i o n u 湖北大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所 取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任 何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡 献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的 法律后果由本人承担。 论文作者签名:南榕 日期:动司年莎月匆日 学位论文使用授权说明 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即: 按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位 论文的印刷本和电子版,并提供目录检索与阅览服务;学校可以允许采用 影印、缩印、数字化或其它复制手段保存学位论文;在不以赢利为目的的 前提下,学校可以公开学位论文的部分或全部内容。( 保密论文在解密后遵 守此规定) 作者签名: 指导教师签名: 樯 砻毯 日期:2 0 口7 c o e 懈l 呻? j f1 , 引言 w e b 服务是一种新兴的分布式技术。传统w e b 应用技术解决的问题是如何 让人来使用w e b 应用所提供的服务,而w e b 服务则要解决如何让计算机系统 来使用w e b 应用所提供的服务。而在w e b 服务中加入语义的支持,使得计算机 之间能够理解互相通信的内容,从而实现自动化。 目前语义w e b 服务的主要方法是利用本体来描述w e b 服务,然后通过这 些带有语义信息的描述来实现w e b 服务的自动发现,调用和组装。语义网和w e b 服务是语义w e b 服务的两大支撑技术。o w l - s 是连接两大技术的桥梁,目l j 语 义w e b 服务的研究主要围绕o w ls 展开。 o w l - s 是一个用o w l 描述的w e b 服务本体。该本体能够描述w e b 服务的 功能、执行流程以及服务的访问点等信息,便于智能a g e n t 支持自动的、动念的 w e b 服务发现、执行、组合和互操作。但是o w l - s 缺乏对于服务质量( q o s ) 这 个非功能特征的描述,而服务质量对于商业应用来说至关重要。本文试图通过建 立w e b 服务质量本体,并在此基础上提出基于q o s 本体的服务选择框架,以解 决以上的问题。 由于现有的服务质量本体大多太具主观性,本文试图以软件度量理论为基础 来构造一个w e b 服务质量的顶层本体。该本体可以用来结合o w l s 来对w e b 服务的质量进行描述,并且具有良好的扩展性。最后在此基础之上提出了一个基 于q o s 本体的服务选择框架,给出了一个w e b 服务组合选择问题的示例,使用 可废止逻辑为其构造了选择规则。最后将本文提出的基于服务质量本体的框架同 相关工作进行了比较。 1 1 1 第一章绪论 第一章绪论 本章首先简要介绍了本文研究问题的相关背景w e b 服务和将w e b 服务同语义网 结合起来以实现w e b 服务智能化的语义w e b 服务。在本章的最后,说明了本论文的主 要工作和全文的组织框架。 1 1w e b 服务 采用传统的中日j 件的互操作体系难以适应互联网的现状,这样的互操作体系往往与 特定的对象模型绑定,如c o r b a ( c o m m o no b j e c tr e q u e s t b r o k e r a r c h i t e c t u r e ) ,e j b ( e n t e r p r i s ej a v ab e a n ) ,c o m ( c o m m o no b j e c tm o d d ) ,业界的推动导致这 些对象模型各自拥有广泛的应用基础。但在互联网上,产业界的决定作用由于参与者众 多而被削弱。这意味着很难有一个公认的对象模型产生。w e b 服务作为适合与互联网 的中间件,是能够构筑在传统的构件技术之上,具有松耦合的软件体系结构。 1 1 1w e b 服务体系架构 w e b 服务就是一个能够使用x m l 消息通过网络来访问的接口。w e b 服务使用w e b 服务描述语言w s d l 等来描述如何与该服务交互,包括消息格式,传输协议和服务访 问点等。然后w e b 服务提供者可以向服务注册中心发布其服务描述来注册这个服务, 以便于服务请求者能够向服务注册中心查询并发现这个服务;或者直接向服务请求者发 布服务描述以便于调用该服务。但发布到服务注册中心是较好的选择,因为可以让潜在 的客户发现该服务。客户端获取服务描述后就可以同服务进行绑定来调用服务。客户端 与服务之间通过简单对象访问协议s o a p ( s i m p l eo b j e c ta c c e s sp r o t o c 0 1 ) 进行通信。 下面的图1 1 给出了w e b 服务的体系架构。 w e b 服务体系架构中的角色 服务提供者。即服务的所有者,托管访问服务的平台。 服务请求者。这是寻找并调用服务的应用程序。 湖北大学硕士学位论文 服务注册中心。这是可以搜索服务描述注册的中心。服务提供者在此发布他们 的服务描述。 , 1 1 。2w e b 服务相关技术 图卜1w e b 服务构架【1 1 w e b 服务使用x m l 来描述接口和消息,使得其具有跨语言和跨平台的特性。但 m l 本身并不保证通信,通信需要标准的格式和协议。现在的w e b 服务事实上的标准 都是基于x m l 的。w e b 服务有三个主要的标准: 简单对象访问协i 7 ( s o a p ) 定义了w e b 服务的通信协议的标准。闭 w e b 服务描述语- 言( w s d l ) 定义了w e b 服务描述的标准机制。圈 u d d i 提供了注册和发现服务的标准机制。t 4 1 1 3w e b 服务质量 随着w e b 服务作为企业应用集成e a i ( e n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o n ) 的商务解决方 案的增长,w e b 服务的服务质量( q o s ) 对于服务供应商来说变的越来越重要了。然而 由于w e b 服务的动态性和不可预知性,提供用户所需要的服务质量并非易事。w e b 服 务质量的加强有助于提高服务供应商的竞争力。w e b 服务质量包括性能,可靠性,可扩 展性,容量,强健性,异常处理,准确性,完整性,可达性,可获取性,互操作性,安 全性以及网络相关的服务质量需求【5 】。 w e b 服务的性能描述了服务请求能多快完成。它可以通过吞吐量,响应时问, 2 第一章绪论 等待时间,执行时间和事务处理时间等来衡量。吞吐量是w e b 服务在给定的时 间间隔罩所服务的请求个数。响应时间是完成服务请求所需要的时间。时延是 发送请求到接收响应间的延迟。执行时问是w e b 服务执行一系列活动所花的时 间。事务处理时间是w e b 服务完成一次完全的事务所需要的时间。 可靠性代表w e b 服务在特定条件和给定的时间问隔内w e b 服务完成其功能的能 力。与可靠性相关的有一天、一周、一年内故障次数,服务请求者和服务提供 者间的消息传递是否确保到达并且按序。 w e b 服务必须有很高的可扩展性。可扩展性包括服务供应商的计算机系统计算 能力的可扩展性和系统在给定时日j 内处理用户请求、操作和事务处理的能力的 可扩展性。可扩展性也与性能有关。 容量是在保证服务质量的情况下,w e b 服务同一时刻能够支持的最大连接数。 健壮性描述了在遇到非法或不完整或冲突的输入时正确运行的程度。 w e b 服务必须提供异常处理。与异常处理相关的是服务如何处理这些异常。 w e b 服务应该提供高准确性。准确性被定义为w e b 服务产生的错误率。单位时 日j 的错误次数应该减到最小。 w e b 服务应该提供完整性以防止未授权的访问或修改计算机程序或数据。有两 种类型的完整性:数据完整性和事务完整性。数据完整性定义了转移的数据在 传输过程中是否修改。事务完整性用来保证事务处理过程中数据库的完整性。 w e b 服务应该提供高可达性。可达性代表了是否w e b 服务能否服务客户的请求。 高可达性可以通过构建高可扩展性的系统来获得。 w e b 服务要随时准备被调用。与其相关的是可靠性和t t r ( t i m et or e p a i r ) 。t t r 代表修复一个w e b 服务所花的时间。 w e b 服务要提供很好的独立于语言和操作系统的互操作性。 w e b 服务要提供所需的安全性。服务提供商可能会依据服务请求采取不同的方 法和级别的安全策略。安全性意味着提供认证,授权,机密性,可跟踪性可审 计性,数据加密和不可抵赖。 网络相关的服务质量。为了获得需要的w e b 服务质量,w e b 服务应用程序层的 q o s 机制必须和传输网络的q o s 机制( 如r s v p , d i f f s e r v , m p l s 等) 结合起来 3 湖北大学硕十学位论文 使用。应用层的q o s 参数应该映射到相应的网络层的q o s 参数。基本的网络层 q o s 参数包括网络延迟和包丢失等。 1 1 4w e b 服务的特征 从外部的使用者的角度而占,w e b 服务是一种部署在w e b 上的对象或组件,它具备 以下特征豳: 完好的封装性。w e b 服务既然是一种部署在w 曲上的对象,自然具备对象的 良好封装性,对于使用者而言,他能且仅能看到该对象提供的功能列表。 松散耦合。这一特征也是源于对象组件技术,当一个w e b 服务的实现发生变 更的时候,调用者是不会感到这一点的,对于调用者来说,只要w e b 服务的 调用界面不变,w e b 服务的实现任何变更对他们来说都是透明的,甚至是当 w 曲服务的实现平台从j 2 e e 迁移到了n e t 或者是相反的迁移流程,用户都可 以对此一无所知。对于松散耦合而占,尤其是在i n t e r n e t 环境下的w e b 服务而 言,需要有一种适合i n t e r n e t 环境的消息交换协议。而x m l s o a pj 下是目前最 为适合的消息交换协议。 使用协约的规范性。这一特征从对象而来,但相比一般对象其界面规范更加规 范化和易于机器理解。首先,作为w e b 服务,对象界面所提供的功能应当使 用标准的描述语言来描述( 比如w s d l ) ;其次,由标准描述语言描述的服务界 面应当是能够被发现的,因此这一描述文档需要被存储在私有的或公共的注册 中心里面。同时,使用标准描述语言描述的使用协约将不仅仅是服务界面,它 将被延伸到w 曲服务的聚合、跨w e b 服务的事务、工作流等,而这些又都需 要服务质量( q o s ) 的保障。其次,我们知道安全机制对于松散耦合的对象环境 的重要性,因此我们需要对诸如授权认证、数据完整性( 比如签名机制) 、消息 源认证以及事务的不可否认性等运用规范的方法来描述、传输和交换。最后, 在所有层次的处理都应当是可管理的,因此需要对管理协约运用同样的机制。 使用标准协议规范。作为w e b 服务,其所有公共的协约完全需要使用开放的 标准协议进行描述、传输和交换。这些标准协议具有完全免费的规范,以便由 4 第一章绪论 任意方进行实现。一般而言,绝大多数规范将最终有w 3 c 或o a s i s 作为最终 版本的发布方和维护方。 高度可集成能力。由于w e b 服务采取简单的、易理解的标准w e b 协议作为组 件界面描述和协同描述规范,完全屏蔽了不同软件平台的差异,无论是 c o r b a 、d c o m 还是e j b 都可以通过这一种标准的协议进行互操作,实现了 在当前环境下最高的可集成性。 1 2 语义w e b 服务 语义网的目标就是试图使机器代理能够代理理解和使用w e b 上的资源。而w e b 服 务则是未来最重要的资源之一。将与语义网和w e b 服务结合起来,可以解决现存技术 的很多难题。现在对语义网的研究主要集中在服务的定位,选择,调用,组合和监控的 自动化这几个方面。 1 2 1 语义网 语义网是当的w e b 的扩展和延伸。语义网的信息具有充分的,完备的语义定义, 能够在人和计算机之问建立语义上的理解和合作。语义网构建在自定义标记的x m l 和 数据表示灵活的r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,资源描述框架) 基础之上,其目 标是应用有效的标准和技术使得计算机能够更多的理解网上的信息,从而进行知识发 现,数据集成等。 图1 2 是语义网的层次结构图。r 7 1 瑚 图1 - 2 语义嘲层次结构图i 丑 5 湖北人学硕十学位论文 ( 1 ) u n i c o d e 和u r i 层 u n i c o d e 和u r i 层是整个语义网的基础,其中u n i c o d e 处理资源的编码,保证使用 的是国际通用的字符集,实现网上信息的统一编码。u r i ( u n i f o r mr e s o u r c e i d e n t i f i e r ,统一资源标识) 支持语义网上的对象和资源的精细标识。u r i 有两个子 集。统一资源定位( u r l ) 具体的网络资源定位。通用资源名称( u r n ) 7 一个抽象名称。u r i 可以标示抽象资源,物理资源或者同时标示二者。 ( 2 ) x m l + n a m es p a r s e + x m ls c h e m a x m l 层具有命名空间( n a m e s p a c e ) 和x m l s c h e m a ( x m l 模式) 定义,通过x m l 标记语占将网上资源信息的结构、内容与数据的表现形式进行分离,确保语义网的 定义,并支持与其他基于x m l 的标准进行无缝集成。 ( 3 ) r d f + r d fs c h e m a 层 该层用于描述w e b 上的资源及其类型,为网上资源描述提供了一种通用框架和实现 数掘集成的元数掘解决方案。最底层的u r i 标识网上的对象,r d f 和r d f s 层则 可以对u r i 标识的对象进行陈述( s t a t e m e n t ) 。 ( 4 ) 本体层 该层用于描述各种资源之间的联系,本体揭示了资源本身以及资源之间更为复杂和 丰富的语义信息,从而将信息的结构和内容相分离,对信息作完全形式化的描述, 使网上的信息具有计算机可以理解的语义。本体定义了不同概念问的关系。现在本 体层使用基于描述逻辑的o w l 语言进行建模。 ( 5 ) 逻辑层 逻辑主要提供公理和推理规则,为智能推理提供基础。该层用来产生规则。 ( 6 ) 证明层 证明层注重于提供认证机制,证明层执行逻辑产生的规则,并结合信任层的应用机 制来评定是否能够信赖给定的证明。 ( 7 ) 信任层 项层的信任层注重于提供信任机制,以保证用户代理a g e n t 在网上进行个性化服务 和彼此问交互合作时,更安全与可靠。 6 第一章绪论 1 2 2w e b 服务的智能化 现在使用w e b 服务都需要人的介入。如果用本体语言对w e b 服务进行语义标记, 使服务变成机器可理解的,能够使用智能a g e n t 分析识别,将会促使w e b 服务的互操 作向自动化方向发展,这就是语义网服务的首要目标。 w e b 服务的发现、自动组合和互操作,都需要对服务进行一定的语义描述。尤其是 w e b 服务的组合,需要根据对任务目标的高级描述,自动地选择、组合、解释合适地 w e b 服务,并执行特定地任务。 7 1 1 5 1 1 3 要解决的问题和所做的工作 o w l - s 是一个用o w l 描述的w e b 服务本体。该本体能够描述w e b 服务的功能、 执行流程以及服务的访问点等信息,便于智能a g e n t 支持自动的、动态的w e b 服务发 现、执行、组合和互操作。但是o w l - s 缺乏对于服务质量这个非功能特征的描述,而 服务质量对于商业应用来说至关重要。本文试图通过建立w e b 服务质量本体,并在此 基础上提出基于q o s 本体的服务选择框架,以解决以上的问题。 本文的工作如下: ( 1 ) 阐述了出知识表示到语义网的发展历程,简要介绍了描述逻辑。 ( 2 ) 探讨了本体的作用及其构造规则。 ( 3 ) 结合软件度量理论构造了服务质量本体并与相关工作进行了比较。 ( 4 ) 提出了一个基于q o s 本体的服务选择框架,给出了一个w e b 服务选择规则构 造的示例。 1 4 全文的组织框架 本文共有5 章,组织框架如下: 第一章首先介绍了相关的背景知识,然后说明了本文要解决的问题和所做 的工作,最后介绍了全文的组织框架。 第二章阐述了由知识表示到语义网的发展历程,重点分析了其理论基础的 7 湖北人学硕士学位论文 方展,并介绍了知识表示的最新研究方向描述逻辑,然后总结了知识表示 中的本体及其构造规则和步骤。本章最后简要介绍了语义网中的资源描述 框架r d f ,本体建模语言o w l 和w e b 服务本体o w l - $ 。 第三章首先分析了o w l - $ 的不足,然后结合软件度量理论构造了服务质 量本体并与相关工作进行了比较。 第四章提出了一个基于服务质量本体的服务选择框架,然后给出了一个 w e b 服务选择规则构造的示例,最后与相关工作进行了比较。 第五章总结了本论文的工作,指出了未来的工作重点。 8 第一二章从知识表示到语义网 第二章从知识表示到语义网 什么是“语义”? 简单地说,语义网中”语义n 的核心就是知识共享,包括计算机与 计算机、人与计算机之间的共享。在计算机与计算机、人与计算机之间以无偏差的方式 传递的信息,就是语义。 传统的w e b 资源中的语义信息或领域知识以机器难以处理的自由文本的方式存在, 资源自j 的语义关系是以一种隐含的方式存在,这些语义信息由于缺乏明确的描述而丢 失。如果能明确表达w e b 资源语义,并把资源之日j 的关系冠以某种特殊的含义,在这 种情况下,信息以语义良定义形式存在,则将大大提高资源的共享能力。这也就是语义 w e b 的研究动机。知识表示技术是描述、建立和针对资源语义关系进行推理的有效途径, 它在语义w e b 中有着重要的地位。从某种意义上,语义w e b 可以视为k r + w e b 。 本章将首先介绍人工智能中的知识表示,逐渐过渡到语义网的理论基础描述逻辑, 然后介绍了知识表示中常见的概念一本体,并总结了本体的作用、构造规则和构造步骤。 最后简要介绍了语义网的资源描述框架r d f ,本体建模语言o w l 和w e b 服务本体 o w l ,s 。 2 。1 知识表示 知识表示在智能应用程序的建造中起到关键的作用。智能应用程序要有效地解决应 用领域的问题,就必须拥有领域特有的知识。这里的“智能”是指系统能够依据明确表 达的知识来发现隐含的知识。如何表示知识成为人工智能研究的一个重要议题。【研【1 0 l 1 1 】 2 1 1 知识的分类 知识可以按存储方式区分为两大类;程序性知识和陈述性知识。 程序性知识隐含于使用它的计算机程序中。例如一个关于倒置矩阵的程序就隐含了 倒置矩阵的知识,这种知识与应用它的程序紧密地融合在一起,难以分离。 陈述性知识独立于应用它的程序而清晰地存储。例如,一个工资表存放了关于职工 9 湖北人学硕十学位论文 工资的知识,为了处理它,必须另外设计专门的处理程序。显然;由于工资表的独立存 储,使其能为多个程序应用;如工资表修改程序、打印程序、查询程序等。陈述性知识 能清晰地存储于独立定义的符号结构中;可由应用该知识的程序存取。 陈述性知识在设计人工智能系统中处于突出而重要的地位,关于知识表示的各种研 究也主要是针对陈述性知识的,原因在于其有许多程序性知识无法比拟的优点: 易于修改。由于各陈述性语句相互独立,对于知识的修改不会产生副作用;而 程序性知识的修改直接涉及程序的变动,显然困难得多。 可应用于多重目标。例如m y c i n 知识库中存放的知识就可以为推理、解释和 教学等几个程序共享,甚至能服务于设计知识库时未曾想到的目的。该知识库 在设计时仅考虑到应用于推理和推理结果的解释,后来才发现可直接询问知识 库包含的内科疾病诊断和治疗知识,进而丌发出教学程序。与此相对照,程序 性知识隐含于特定的程序,只能为该程序所专用;若要用于其它目标,就需重 复表示这些知识,很不方便。 易于扩展。由于陈述性语句的相互独立性,知识库不仅便于静态扩展,也便于 动态吸收在推理过程中衍生的附加知识,以支持智能系统的自适应学习。 支持自我意识。可以设计所谓的内省程序去查询系统接受的问题求解任务是否 超越系统自身拥有知识的范围和方面,以便表现出一定的自我意识能力。知识 独立于应用程序而存储,使这种查询成为可能。 当然,为获得以上优点而使用陈述性知识是要付出代价的,那就是导致计算丌销的 增大和效率的降低。因为陈述性知识要求应用程序对其作解释性执行,显然效率比直接 用程序性知识( 相当于编译执行) 低得多。换言之,陈述性知识是以牺牲效率来换取灵 活性。关于两种知识在人工智能系统中的地位,曾于7 0 年代在美国引起一场大争论, 最后大家一致认为两者都很重要,虽各有优缺点,也各有用武之地,应在实用中加以权 衡。归纳起来,这两种知识应用的倾向如下: 鉴于高级的智能行为( 如人的思维) 似乎强烈地依赖于陈述性知识,人工智能 的研究注重陈述性知识的丌发。当然,这绝对不是意味着程序性知识不重要。例如, 当陈述性知识被反复应用于某一特别目的时,将其嵌入实现该目的应用程序是十分 1 0 第二章从知识表示到语义网 可取的。 程序性知识的陈述化表示。用规则表示的启发式知识属于程序性知识,因为它 们描述推理过程且上下文相关。但这些知识从推理机分离出来并由推理机作解释执 行,具有陈述性特点。这种表示方式可以促进推理和控制的透明化,有利于智能系 统的维护和进化。 程序性知识和陈述性知识的综合。以适当的方式综合应用这两种知识可提高智 能系统的性能。框架表示法为综合提供了有效的手段,每个框架陈述性地表示对象 的属性和对象间的关系,并以附加程序( i f - n e e d e d ,i f - a d d e d 等) 的方式表示程序 性知识。 2 1 2 知识表示的性能 为了实现以上表示功能,伍兹( w o o d s ) 提出应从两个方面评价知识表示的性能, 包括表示的充分性和表示法效用: 1 表示的充分性 表示的充分性是指作重要区分和避免不必要区分的能力。一种表示方式无论怎样有 效,若不能表示必要的区别,也是没有用处的。例如,一个自然语言理解系统必须能区 别走路、跑动,开车和飞行的不同,但在必要时还应该能忽略它们的差别而意识到它们 都是一种移动。可以说,只有具备表示的充分性,知识表示系统才能恰当地描述问题求 解涉及的事物,以及智能体对于外部世界的信念、目的和猜测等。 2 表示法效用 表示的充分性仅是知识表示的起码要求,但不够,好的表示方法还必须支持被表示 知识的使用。也就是说,表示知识的元素和处理这些元素的操作应能有效地支持使用知 识的推理活动。这称为表示法效用,其又分为两个方面: ( 1 ) 概念效率。指知识表示方式应能有利于知识库以自然的方式吸收随意的新知 识,新知识的加入和老知识的更新不会引起知识库发生大的变化。因为只有这样,才有 利于知识库的逐步精化,才能使包含于知识库中的有关世界的内部模型能逐步精化和调 1 湖北人学硕十学位论文 整到接近于正确地反映外部世界。为提高概念效率,要求表示知识的符号结构( 元素及 元素的组合) 具有语义清晰、一致和简洁的特点,并易于修改。 ( 2 ) 计算效率。主要指推理的有效性,如推理的速度、结论的j 下确性和有效性等。 要兼顾概念效率和计算效率往往是困难的,因为前者要求表示知识的符号结构与知识的 获取和知识库维护相容,而后者则要求与推理机相容。换言之,为促进知识获取的有效 性,知识应以接近于人思维的方式表示;但要提高处理效率,知识应以接近计算机目标 代码的方式表示。为解决矛盾,一种可取的方法是提供两套符号结构,分别面向知识获 取和机器推理,并设计自动转变程序来实现两者问的映射。 把衡量知识表示性能的这两个方面区分丌来是十分重要的。忽视任一方面都会导致 关于知识表示的错误观点。例如,有些人认为,一阶谓词逻辑的表示性能最强,实际上 这片面地强调了其表示的充分性,而忽视了这种表示法在概念和计算效率上的低下。目 前,多数人接受这样一种看法:一阶谓词逻辑具有最好的表示充分性,其它基本表示方 式( 产生式系统、语义网络和框架系统) 的表示充分性仅是它的子集,但却具有更好的 表示法效用。由此可见,知识表示的这两个方面的性能是相互制约的,往往提高一个方 面的性能要求以牺牲另一方面的性能为代价。所以,设计一种表示方式时,应根据应用 环境和问题特征,对知识表示的这两个方面的性能作取舍权衡,以能否满足需求为最实 用的评价准则,否定绝对的性能比较准则。 2 1 3 知识表示的分类 尽管人工智能研究和应用开发者设计了各种各样的知识表示方式,但常见的知识表 示方式可以归纳为三类:一阶谓词逻辑、产生式表示、结构化表示。 2 1 3 1 一阶谓词逻辑 一阶谓词逻辑的表示元素为谓词公式、连词( 与、或、非、蕴涵) 和量词( 全称和 存在) 。谓词公式由谓词符号及若干参数项组成,参数可以是常量、谓词演算变量和 s k o l e m 函数。一阶谓词逻辑限定谓词符号和联接符不能是变量。这种表示方式可以说 是分析和理解人工智能的基础,其优点在于表示元素具有良好定义的语义,便于自然地 第一二章从知识表示到语义网 表示概念,准确而灵活。一阶谓词逻辑具有很好的表示充分性,从而使得基于这种表示 方式的归结定理证明方法能适用于各种应用领域。然而,归结原理不能应用启发式知识 控制推理,因而它有知识库较大时推理效率极低的缺点。尤其是这种定理证明方法不能 保证在合理的时间内给出解答,使其不能适用于多种实用领域。为增进实用性,人们对 一阶谓词逻辑作了种种限制。例如,引人封闭世界假设,限制知识库只能由两类符号结 构事实和规则组成,对事实和规则的表示方式作进一步限定( 如事实只能表示为不带 量词和连接词并不含变量的谓词公式;限定规则的左部只能是单文字,规则的右部只能 是单文字的与、或组合等) 。这些导致了逻辑程序设计语言p r o l o g 和各种演绎推理系统 的开发:它们以减弱表示的充分性为代价,大幅度增加了表示法的效用。但这些系统仍 未提供有效的手段控制推理,而反复的穷尽性搜索( 在知识库中) 导致了效率的低下。 另一个缺点是表示知识的符号结构过于简单,无法有效地描述结构复杂的事物。 2 1 。3 2 产生式表示 应用产生式表示的系统( 称为产生式系统) 由规则库、综合数据库和控制子系统三 个部分组成。规则库是称为产生式的规则集合:综合数据库记载问题求解的初始状念和 中间结果;控制子系统执行识别行动循环,并在每一循环中选择激活( 条件部分满足) 的规则和执行规则右部拟定的动作。由于规则的条件部分不限于谓词公式( 可以是关系 表达式和真值函数) ,且动作可以是任何操作( 不像演绎推理系统中规则的右部只能是 推理结论) ,因而增加了表示法的概念效率。另外,通过设置控制元素于综合数据库和 采用多规则激活情况下的冲突解法,可以有效地控制推理过程,增加表示法的计算效率。 产生式规则最适合于表示各种启发式知识以指示事物间的经验性关联,所以广泛地应用 于专家系统的设计中。这种表示方式的缺点在于规则的堆积存储,缺乏组织,冲突解法 的单一性不能自然地适应于许多场合,而通过设置控制元素来设计控制策略在复杂的情 况下也往往不可行。另外,与一阶谓词逻辑相似,由于缺乏结构化手段,产生式表示无 法有效地描述结构复杂的事物。 2 1 3 3 结构化表示 为克服前两种表示方式的缺点,有效地表示结构化的世界和事物,语义网络和框架 1 3 湖北大学硕十学位论文 表示方式迅速发展起来。由于这两种方式表示知识的符号结构是节点和框架,它们均由 一组s l o t s ( 槽) 构成,用于集中表示对象( 概念或个体事物) 的属性和对象自j 的关系, 所以统称为结构化表示方式,而相应的知识库则在某种程度上统称为s l o t - a n d - f i l l e r 数据 库( 槽的内容称为f i l l o r ) 。这两种方式的不同之处在于语义网络注重表示对象间的关系, 而框架系统更强调对象的内部结构。由于节点( 框架) 集中了概念或个体的所有属性描 述和关系描述,又可用槽作为索引,故而这两种方式在知识库中进行检索时具有较高的 效率。同时,由于特性( 属性和关系) 继承和程序附加功能( 在槽中附加程序) ,使有 效地组织和处理知识成为可能。它们的缺点在于这两种结构化的表示方式在刻画真值理 论方面过于自由化,容易引起二意性甚至严重的错误。例如,一个框架的语义就有作严 格定义( 定义一类个体必须具备的特性) 和典型范例( 说明一类个体应有的典型特性) 这两种不相容的解释;i s a 链既用于表示子类与父类| b j 的关系又用于表示实例与类间 的关系;表示集合概念的框架( 如计算机系学生) 既定义了集合本身的特性( 如总计 4 0 0 个学生) ,又记载了其成员( 学生) 的共性( 必修某些课程) 。另外,由于结构化表 示的复杂性,知识库维护需付出比前两种方式高得多的代价。 所有上述三种基本的知识表示方式都是以一阶逻辑为基础的,后二种均可转变为等 价的一阶逻辑表示方式。所以,逻辑是知识表示的基本手段,进而构成人工智能研究的 基础。从衡量知识表示性能的角度,可以说一阶逻辑具有充分的表示能力,但其表示法 效用( 包括概念效率和计算效率) 较差。由此,人们找到逻辑程序设计语言p r o l o g 和 产生式系统去提高推理的效率,通过开发语义网络和框架系统去提高概念效率( 实现结 构化表示) 。然而表示法效用的提高是以牺牲表示的充分性为代价的。在许多情况下, 牺牲表示的充分性是允许的也是合理的,因为实用的人工智能系统往往只涉及到某些方 面的表示充分性,其它方面可以忽略。例如,p r o l o g 语言只允许以特别形式的符号结构 h o r n 子句表示知识,丢失了表示不完全知识的能力,如否定、或、存在等;语义网络 限制了与其等价的一阶逻辑表示到只允许一元或二元谓词公式,并易于引起节点和节点 间关系的二意性解释。这些均减弱了表示的充分性,但却提高了表示法效用,使这些表 示方式能应用于许多实际问题的解决。另外,j 下因为p r o l o g 语言和语义网络表示的不 充分性以及在表示法效用方面的加强很不相同,才使它们适用于明显不同的场合。 1 4 第二二章从知识表示剑语义网 2 1 4 表示能力和推理效率之间的制约关系 衡量知识表示性能的两个方面表示的充分性和表示法效用之日j 存在着相互制 约关系,即往往强调了表示的充分性就会牺牲表示法效用,反之亦然。可以说,任何知 识表示系统的设计都是权衡这两个方面利弊的结果,以便提供具有足够表达能力的知识 表示语言,并使以这种语言表示的知识能有效地用于推理。下面从一阶谓词逻辑表示不 完全知识的能力出发,阐述关系数据库、逻辑程序设计和语义网络是如何通过全部或部 分消除表示不完全知识的能力来提高推理效率的,以说明表示能力和推理效率之间制约 关系的存在,和如何作权衡处理。 2 1 4 1 一阶谓词逻辑 一阶逻辑用于知识表示的目的不同于数学应用。后者从研究数学基础理论的角度, 强调无限集合的形式化表示。知识表示系统刻画的应用领域却往往是有限的,所以一阶 逻辑的应用并不注重处理无限集合,而是侧重于不完全知识,因为描述领域世界时常遇 到它们。例如: - - , s t u d e n t ( j o h n ) ( 指出j o h n 不是学生,但未说明他是什么人) p a r e n t ( s u e ,b _ f t t ) vp a r e n t ( s u e ,g e o r g ) ( 指出s u e 的长辈是b i l l 或g e o r g e ,但未说明究竟是哪一个人) 从这些例子可以看出,一阶逻辑并不用于描述事物的复杂细节;相反,它们是通过 取反、析取和存在量词去避免表示不必或无法说明的细节。正是这些不完全知识构成一 阶逻辑表示能力的重要方面。然而,实现处理不完全知识的能力是要付出代价的,即增 加了不易处理性。在实际应用中,我们往往不需或只需有限的不完全知识表示能力,因 此,可以通过限制表示不完全知识的能力去换取推理的有效性。 2 1 4 2 关系数据库 完全消除表示不完全知识的能力,就是让知识库退化为关系数据库。让我们来观察 一个简单的数据库c o u r s e s ,如表2 1 所示。 1 5 湖北大学硕十学位论文 表2 - 1c o u r s e s 数据库 标识课程名丌课系人数教师 c s 2 4 8 程序设计计算机 4 2 王芳 m a t l 0 0 数学分析数学 1 3 7 李进 c s c 3 7 3 人工智能计算机 5 3 周文 这个关系表完全可以用一阶逻辑来表示如下: c o u r s e ( c s c 2 4 8 ) ,d e p t ( c s c 2 4 8 ,计算机) ,s t u d e n t ( c s c 2 4 8 ,4 2 ) , c o u r s e ( m a t l 0 0 ) ,d e p t ( m a t l 0 0 ,数学1 ,s t u d e n t ( m a t l 0 0 ,1 3 7 ) , 显然,这仅仅涉及到一阶逻辑的部分表示能力,即只使用谓词表达式并隐含地指出 谓词表达式之间存在合取关系,不涉及量词、析取和取反,从而消除了表示不完全知识 的能力。例如,数据库不能表示如下信息: d e p t ( m a t l 0 0 ,数学) vd e p t ( m a t l 0 0 ,计算机) 然而,包含于数据库的某些信息并没有体现于一阶逻辑的表示中。例如,我们或许会问, 计算机系丌设了几门课? 以一阶逻辑表示的知识不足以用来回答这个问题,因为没有足 够的知识说明至少有两门课( c s c 3 7 3 和c s c 2 4 8 可以是同一门课的两个名字) ,也没有 说明最多有两门课( 假设谓词表达式的列表中只显式指出这两门课由计算机系开设,但 有可能还有该系开设的其它课程未列于表中) 。作为对照,若把该问题转变为询问语句 去操作数掘库,就可以得到解答:两门课。原因在于已有隐含的知识包含于数据库管理 系统:( 1 ) 同一数据库的不同键值指示不同的个体。( 2 ) 不存在非显式表示的个体。 为了使知识库能用于回答上述问题,只要把这些隐含的知识显式地表示于知识库即 可。由此可以得出结论: ( 1 ) 数据库可以等价地表示为基于一阶逻辑的知识库。为此,不仅需要用一阶逻辑 表示直接记载于数据库关系表中的信息,也应显式表示隐含于数据库管理系统的信息。 ( 2 ) 数据库不能表示不完全知识,这使其表示能力很受限制。例如,无法表示”c s c l 4 8 或c s c l 4 9 是计算机系丌设的课程”这样的事实。显然,用一阶逻辑表示直接记载于关 系表的信息时,不需使用量词、析取和取反。 1 6 第r 二章从知识表示到语义网 ( 3 ) 数据库系统中,推理行为退化为演算,因为不存在非显式表示的个体,只需 检索和演算,不需推理。 尽管从知识表示的角度,数据库表示能力十分受限,但因免除了推理,大幅度地提 高了处理效率,所以,在许多不需推理的事务处理中,数据库是表示领域世界的最佳选 择,可删除不必要的表示能力,以换取高效的信息处理服务。 2 1 4 3 逻辑程序设计 逻辑程序是另一种一阶逻辑的受限表示形式,典型的例子为p r o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 热力发电厂的课程设计
- 上海市徐汇区董恒甫高级中学2024-2025学年高二上学期期中考试数学试题
- 计算机程序课课程设计
- 变形金刚美术课程设计
- 人教版数学五年级下册期末考试试卷带答案
- 手工面筋课程设计
- 社会学概论课程设计
- 2024签劳务合同可以随时辞职吗
- 2024简单的代销合同范本
- 2024国际田联运动员与代理人合同(官方范本)
- 木材与木制品中生物碳含量计算方法
- 中康科技腾讯健康:2024年消费者健康洞察呼吸系列报告-哮喘篇
- 《广州浪奇财务舞弊的案例分析》
- MOOC 自然保护与生态安全:拯救地球家园-暨南大学 中国大学慕课答案
- 初中英语听说能力培养策略研究-课题立项-开题报告+中期论证报告
- 水平定向钻施工机械
- 室内设计行业优势与劣势分析
- 2024年滁州市中级人民法院招考聘用司法辅助人员高频考题难、易错点模拟试题(共500题)附带答案详解
- 城市管理知识竞赛考试题库200题(含答案)
- 北京市东城区六年级(上)期末语文试卷
- 乡村振兴农村设计案例分析报告
评论
0/150
提交评论