（计算机应用技术专业论文）基于本体的web数据集成研究与应用.pdf

上传人：活*** IP属地：宁夏上传时间：2019-12-16 格式：PDF 页数：61 大小：1.66MB 积分：0 举报 版权申诉

已阅读5页，还剩56页未读，继续免费阅读

（计算机应用技术专业论文）基于本体的web数据集成研究与应用.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

贵娴大学硕士论文摘要基于本体的w e b 数据集成研究与应用摘要随着网络和分布式应用的发展和普及，大量的异构致据源应运而生特别是当前w e b 技术的飞速发展，人们获取信息的途径大量来自于网络。而w e b 是一个巨大的信息集散地，又同时也伴随着一个巨大的问题喵息泛滥、混杂它给w e b 上信息的有效获取及利用带来一定的困难。如何使用户快速有效的获取和利用w e b 上的大量信息，这是目前国际上许多机构和组织正在研究的焦点问题，也是w e b 信息管理的关键技术之一为此，本文引入本体概念来实现异构v e b 数据集成，本体的使用有利于解决数据集成中的语义异构问题，这是其它数据集成技术考虑较少的方面。本文在介绍了基本的语义网的原理及相关标准后，重点研究了数据的获取和集成数据获取的过程分为三个阶段：定义抽取规则，获取网页及清洗页面，格式转换首先在用户参与下。根据样本页面学习获得抽取规则，之后下载页面并利用t i d y 工具清洗，最后由系统完成数据的抽取和转换支中介绍了基本的基于d o m 树的方法，以及改进的基于语义块的方式数据集成的过程包括：构建领域本体本体与抽取数据库的映射，查询处理本体是语义集成的基础。文中阐述了领域本体的构建方式。建模工具数据库实例的语义标注及查询处理过程。最后对论文工作进行了总结和展望，提出了此方面尚需研究和改进的问题。关键诃：致据集成，数据获取，本体，映射。o i l l ，查询处理 h i 贵州大学硕士论文 a b s t r a c t t h er e s e a r c ha n da p p li c a t i o no fw e bd a t a i n t e g r a t i o nb a s e do no n t o l o g y a b s t r a c t a l o n g w i t h t h e d e v e l o p m e n t o f n e t w o r k a n d d i s r e p u t ea p p l i c a t i o na n d u n i v e r s a l i t y ，a g r e a t d e a l o fd i f f e r e n c eh e t e r o g e n e o u sd a t ae m e r g ew i t ht h et i d eo ft h et i m e s e s p e c i a l l yw i t hc u r r e n t w e bt e c h n i q u er a p i dd e v e l o p m e n t , p e o p l eo b t a i nt h eag r e a td e a io fi n f o r m a t i o nc o l n ef r o mt h e w e b t h ew c bi sn o to n l yah u g ei n f o r m a t i o nc o m m e r c i a lc c n t e r b u ta l s oi nt h em e a n t i m eah u g e p r o b l e m - i n f o r m a t i o n d e l u g e ，c o n g e s t i o n i t b r i n g sa l o t o f d i f f i c u l t s i n o b t a i n f i o n o f w e b t o p i n f o r m a t i o na n du h o wt oo b t a i nag r e a td e a lo fi n f o r m a t i o nf i o mw e ba n du s ei te f f e c t i v e l y ，t h i si sah o t s p o t w h i c hm a n yt o po r g a n i z a t i o n sa n da s 删o b sa r er e s e a r c h i n g ，a n di ti sa l s oo n eo ft h ek e y t e c h n i q u e si nw e bi n f o r m a t i o nm a n a g e m e n t s ot h i sp a p e ri n t r o d u c eo n t o l o g yc o n c e p tt or e a l i z ed i f f e r e n c eh e t e r o g e n e o u sw e bd a t a i n t e g r a t i o n , u s a g eo fo n t o l o g yh a sm a n ya d v a n t a g e st os o l v ead a t ai n t e g r a t i o nm e d i u m0 f s e m a n t i ch e t e r o g e n e o u sp r o b l e m , t h i si so g h e gd a t ai n t e g r a t i o nt e c h n i q u eb ev e r yd i f f i c u l t r e a l i z a t i o n t h i sp a p e rp u t st h em a i nf o u c so no b t a i n i n gd a t aa n dd a t ai n t e g r a t i o na f t e r i n l t e d u c t i n go fb a s i cp r i n c i p l eo ft h es e m a n t i cw e b a n dr e l a t e ds t a n d a r d t h ep r o c e s st h a tt h ed a t ao b t a i ni sd i v i d e di n t ot h r e es t a g e ：t h ed e f i n i t i o ns a m p l er u l e o b t a i n aw e bp a g ea n dd e a nap a g e ，f o r m a tc o n v e r s i o n f i r s t l y ，w i t ht h eu s e b p a r t i c i p a t i o n , t h ep r o c e s s s t u d i e st h er u l e sa c c o r d i n gt ot h es a m p l ep a g e s e c o n d l y ，t h ep r o c e s sd o w n l o a d sp a g e sa n dm a k e s u s eo f 啊d yt o o lt oc l e a nw e bp a g e f i n a l l y s y s t e mc o m p l e t e ss a m p l eo f d a t aa n do o n v e i 螂gt h e d a t a t h i sp a p e ri n t r o d u c e st h eb a s i cm e t h o db a s e so l ld o mt r e e ，a n di n 3 p r o v e m o n to f t h em e t h o d b a s e so i ls e m a n t i cb l o c k t h ei m a ：e s so fd a t ai n t e g r a t i o ni n c l u d e ：s c 蚰b gu par e a l mo n t o l o g y , m a p p i n go n t o l o g ya n d d a t a b a s e s e a r c hp r o c e s s i n g t h eo n t o l o g yi sf o u n d a t i o no fs e m a n t i ci n t e g r a t i o n ，t h ed i s s e r t a t i o n d e m o n s u a t e sas e to f 诧a l mo n t o l o g yw a y s , m o d e lt o o l s , t h ed a t a b a s ee x a m p l es e m a n t i cm a r ka n d s e a r c hp r o c e s s i n gp r o c e s s t h e e n d o f d i s s e r t a t i o nr e f e r s t o t h e 飘l m m a r y o f t h i s p a p e r , o u t l o o k ，a n d p u t s f o r w a r d t h e p r o b l e mi nt h i sa s p e c tt h a tn e e dt ob er e s e a r c h e da n di m p r o v e dc o n s t a n t l y k e y w o r d s ：d a t ai n t e g r a t i o n , d a t ao b t a i n ，o n t o l o g y ，m a p p i n g , o w l , s e a r c hp r o c e s s i n g 原创性声明本人郑重声明：所呈交的学位论文，是本人在导师的指导下，独立进行研究所取得的成果。除文中已经注明引用的内容外，本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究在做出重要贡献的个人和集体，均已在文中以明确方式标明。本人完全意识到本声明的法律责任由本人承担。论文作者签名：日关于学位论文使用授权的声明本人完全了解贵州大学有关保留、使用学位论文的规定，同意学校保留或向国家有关部门或机构送交论文的复印件和电子版，允许论文被查阅和借阅；本人授权贵州大学可以将本学位论文的全部或部分内容编入有关数据库进行检索，可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名：贵州大学硕士论文序言 1 1 研究背景第1 章序言随着计算机应用领域越来越广泛，数据分布也日益分散，数据的存放已经逐步让位于分布式数据存放。但是，分散的数据之间又往往存在者联系用户在具体应用中，往往又需要将分散的数据按某种需要进行集中，如多种垂直应用的数据共享与集成数据挖掘应用等。以便了解整体情况，需要将分散的数据集中起来，以达到数据盼统一、标准化用户在获取数据时面对的数据是千差万别的。产生数据差异的主要原因是数据的结构和语义上的冲突源数据可以是关系型的，也可以是对象型的。因而要解决数据集成问题，一个重要的方面就是如何消除这种差异或冲突随着数据的大量产生。数据之间的结构和语义冲突问题更加严重：如何有效解决各种冲突问题是数据集成面临的一大挑战。数据集成问题解决后，才会对其它诸如数据共享，数据交换，数据分析等提供数据基础。对一些应用，如数据仓库的建立等而数据挖掘及其它应用更是建立在数据集成之上的。集成质量的好坏直接影畴其后应用能否有效进行良好的数据集成，可以减小由于数据在存储位置上分布造成的数据存取开销：避免不同数据在结构和语义上的差异而造成数据转换错误：数据存放更为精简有效，避免存取不需要的数据；可向用户提供一个统一的数据界面等。 1 - 2 数据集成现状及w e b 集成难点 1 2 1 数据集成现状数据集成( d a t ai n t e g r a t i o n ) 是一个从异构的、存在冲突的、分散的源数据中抽取数据，进行相应结构和数据转换后，加载到目标系统中的过程其实际上是一个消除源数据和目标数据的差异和冲突，按目标系统要求而进行的一致化过程如名称- 数据模式和语义的一致化等。集成后的数据将向用户提供统一标准的表现形式，有利于用户对数据进行诸如数据仓库、数据挖掘等应用由于目前关系型数据库使用非常广泛，针对关系型数据的集成是主要应用但随着w e b 技术的发展，人们可以通过建立网站或网页及时发布自己的信息、资源、需求，同时又通过网络来寻求帮助，用户可以通过它发布问题、回答问题，甚至是在线交流获取信息这些是所有其它的信息载体，如书籍、报纸杂志、电视，无法比j 耋【的。由于w e b 信息的发布与浏览都是通过基于x m l 文档、h t m l 文档、电子邮件、普通第1 页贵州大学硕士论文序言文件等结构的信息载体来发布的。而对于这些非结构化、半结构化的文档，是无法被计算机所理解也无法像传统的数据库那样，提供结构化的、功能强大的、高效的查询处理。如何让计算机从w e b 数据源中获取用户所需的信息? 如何从纷繁的w e b 网站中获得准确、无误的用户需求信息? 这些便是w e b 信息集成所要完成的，其中涉及到l e b 信息抽取、数据消噪、模式匹配等技术。当前的w e b 数据集成系统主要还是基于传统的数据库方式，不同的是根据w e b 数据结构化、半结构化的特点并配合其自身的技术需求，来完成信息集成当前数据集成方法大致分为： ( 1 ) 模式集成方法模式集成是人们最早采用的数据集成方法其基本思想是，在构建集成系统时将各数据源的数据视图集成为全局模式，使用户能够按照全局模式透明地访问各数据源的数据全局模式描述了数据源共享数据的结构、语义及操作等用户直接在全局模式的基础上提交请求，由数据集成系统处理这些请求，转换成各个数据源在本地数据视图基础上能够执行的请求模式集成方法的特点是直接为用户提供透明的数据访问方法由于用户使用的全局模式是虚拟的数据源视图模式集成方法也称作虚拟视图集成方法模式集成需解决两个基本问题：构建全局模式与数据源视图间的映射关系；处理用户在全局模式基础上的查询请求模式集成方法现有两种典型的方式：联邦数据库和中间件联邦数据库是早期人们采用的一种模式集成方法。联邦数据库中数据源之间共享自己的一部分数据模式，形成一个联邦模式基于中问件的数据集成系统主要包括中间件和包装器其中每个数据源对应一个包装器，中间件通过包装器和各个数据源交互用户在全局数据模式的基础上向中间件发出查询请求。中间件处理用户请求，将其转换成各个数据源能够处理的子查询请求，并对此过程进行优化，以提高查询处理的并发性，减少响应时间。包装器对特定数据源进行了封装，将其数据模型转换为系统所采用的通用模型，并提供一致的访问机制。中间件将各个子查询请求发送给包装器，由包装器来和其封装的数据源交互，执行子查询请求，并将结果返回给中间件 ( 2 ) 数据复制方法数据复制方法将各个数据源的数据复制到与其相关的其它数据源上，并维护数据源整体上数据一致性、提高信息共享利用的效率数据复制可以是整个数据源的复制，也可咀是仅对变化数据的传播与复制。数据复制方法可以减少用户使用数据集成系统时对异构数据源的数据访问量，从而提高数据集成系统的性能最常见的数据复制方法就是数据仓库方法。该方法将各个数据源的数据复制到同一处数据仓库。用户则像访问普通数据库一样直接访问数据仓库 ( 3 ) 综合型集成方法以上两种数据集成方法各有优缺点及适用范围模式集成方法为用户提供了全局数据第2 页贵州大学硕士论文序言视图及统一的访问接口，透明度高；但该方法并没实现数据源间的数据交互，用户使用时经常要访问多个数据源，因此该方法需要系统有很好的网络性能。数据复制方法在用户使用某个数据源之前。将用户可能用到的其它数据源的数据预先复制过来，用户使用时仅需访问某个数据源或少量的几个数据源，这会大大提高系统处理用户请求的效率：但数据复制通常存在延时，使用该方法时，很难保障数据源之间数据的实时一致性为了突破两种方法的局限性，通常将这两种方法混合在一起使用，即所谓的综合方法综合方法通常是想办法提高基于中间件系统的性能该方法仍有虚拟的数据模式视图供用户使用，同时能够对数据源问常用的数据进行复制对于用户简单的访问请求，综合方法总是尽力通过数据复制方式，在本地数据源或单一数据源上实现用户的访问需求；而对那些复杂的用户请求，无法通过数据复制方式实现时，才使用虚拟视图方法 1 2 2w 曲集成难点在w e b 数据集成过程中，w e b 数据抽取及各个异构的数据源的模式匹配问题是最关键“ 的步骤，其直接影响集成的效果。 w e b 集成中数据抽取是对待集成的数据源的获取，有效地抽取系统所需的数据、处理无关的噪音数据，是集成的前提当前w e b 上主要还是以 m 几格式的网页为主，其杂乱的、半结构的表示，使得抽取工具很难做到自动化。目前根据各种抽取方法所采用的不同原理可以将w e b 信息抽取分为基于自然语言处理方式的信息抽取，包装器归纳方式的信息抽取，基于w e b 查询的信息抽取和基于o n t o l o g y 方式的信息抽取不同的抽取工具有其不同的实现方式，对不同的w e b 网页也有不同的抽取效果和效率，有其优点也各有不足对于模式匹配来说数据冲突的解决是一个重要的问题。另外，它也是分布式数据库系统提供分布透明性、一致性的关键模式匹配存在的冲突问题包括：命名冲突：由于各用户数据库遵循不同的实体命名习惯，因而存在命名冲突( 二义性问题) ，命名冲突包括同物异名和同名异物结构冲突：由于对实体对象的使用方式不同，各用户数据库对同一数据对象的描述结构可能存在差异语义冲突：由于参加集成的各局部数据库可能处于一个分布的环境中，可能使用不同的硬件和软件环境，运行在不同的数据库管理系统之上，因此可能发生各种各样的语义上的区别。这些语义上的不同可能引起各种矛盾，从简单的名字语义冲突( 不同的名字代表相同的概念) ，到复杂的结构语义冲突( 不同的模型表达同样的信息) 语义冲突会带来模式匹配结果的冗余干扰数据处理、发布和交换。以上是常见的三种冲突，也就是说模式匹配面临着数据源在语法( 数据表示方法) ，结构( 数据结构) 和语义( 数据含义) 等上的异构问题。当然在模式匹配过程中可能还存在着其它类型的冲突值得注意的是数据库集成系统中还可能存在语义上相互矛盾的冲突。第3 页贵州大学硕士论文序言 1 3 研究目标和本文工作本文研究和分析了数据集成领域中各种信息抽取、模式匹配方法，根据当前数据集成依托基于也技术在异构数据源语法、结构的解决基础上。着重研究本体在异构系统集成方面的问题包括以下方面： ( 1 ) 通过提取各个数据源的模式和本体的推理功能，解决当前在语义集成中仅限于对模式元素名称、模式元素类型、缩写词等简单命名冲突方面的问题，实现数据源的语义标注 ( 2 ) 依靠本体对领域知识的建模，井根据数据源模式，解决异构数据源的语义冲突，并通过查询问答的方式，实现统一的用户视图。 1 4 本文结构本文的章节安捧如一下：第一章主要介绍了异构数据集成的研究意义、研究现状和本文主要的研究内容第二章主要讨论了涉及到的基础知识简要介绍了语义w e b 中x m l , r d f ，o w l 等w 3 c 规范，阐述了本体的逻辑基础，以及数据集成中在解决语义冲突方面传统的技术与本体技术的优劣。第三章主要阐述了w e b 数据的抽取及其预处理。第四章重点描述了本体构建过程，首先介绍了本体分类和本体构建方法，然后使用构建好的本体并结合提取出的各个数据源模式，实现本体与数据源实例的映射。第五章描述了查询处理的过程，介绍了用户与系统交互的过程以及对各个数据源的子查询操作，并将各数据源的查询结果合并返回第六章给出了具体的房地产方面的集成测试。第七章总结了本文的研究工作。并给出了进一步的展望。第4 页贵州大学硕士论文基础知识简介第2 章基础知识简介 2 1 语义w e b 基础当前对语义网的概念还没有形成统一的定义，对语义网的理解表述不一但根据其基本的研究目标呵f 发一系列不同于现存的万维网的且计算机可理解和处理的表达语义信息的语言和技术，以支持网络环境下广泛有效的自动推理川碌理解语义网的一些基本特征包括：( 1 ) 语义网不同于现在w w w ，它是现有w w w 的扩展与延伸；( 2 ) 现有的w w w 是面向文档而语义网则面向文档所表示的数据；( 3 ) 语义网将更利于计算机“理解与处理一，并将具有一定的判断、推理能力语义网1 4 】的实现依赖于三个关键技术：咀f 、r d f t 8 】和o n t o l o g y l 9 1 本节将在下面三小节对它们进行讨论 2 1 1x m l 介绍 x m l ( e x t e n s m l em k e pl a 岵m 萨，可扩展标记语言) 是由w 3 c 于1 9 9 8 年发布的一种标准它是s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g e a g e ) 的标记语言的一个简化子集，它将s g m l 的丰富功能与h t m l 的易用性结合到w e b 的应用中。以一种开放的、自描述的方式定义了数据结构在描述数据内容的同时能突出对结构的描述，从而体现出数据之间的关系。这样所组织的数据对于应用程序和用户都是友好的、可操作的。x m l 规范确切定义了其中标记所必须遵循的语法，如标签如何界定元素，可以接受何种元素名称，属性应当放在什么位置，等等这些都是与h t m l 类似的。x m l 与h t m l 最大的不同在于其可扩展性，即它没有一套能够适用于各个领域中所有用户的固定的标签和元素，而是允许开发者和编写者根据需要自行定义它们总之，。可扩展”的意义在于，可以对这种语言进行扩展，以满足各种不同数据存储的需要换言之，x m l 是一种结构化的语义标记语言，而不是表示语言。互联网的迅猛发展，计算机用户之间可以从世界各地实时的接收和发送大量的信息，但在信息交换的过程中存在着一个突出的问题，就是多种多样的数据格式，给信息的有效使用带来了障碍此时，x m l 标准以一种可以描述任何逻辑关系的数据格式统一了电子数据的存储，从而有效地解决了数据格式的不统一而苦恼和困惑尽管x m l 的灵活性使得用户可以快速、容易的描述任意的内容，但由于x m l 并不能解释它标记的含义，大多数处理应用要求这些标记集合能够满足某种标准或者双方的约定。x m l 允许用户通过x m l 模式来定义这些标记的集合x m l 模式( 诸如x m l d i t d l 2 1 l 和x m ls c h e m a l 2 2 等) 为x m l 文档提供了一种约束机制用来限定x m l 文档所用到的第5 页贵州大学硕士论文基础知识简介标记和这些标记之间的结构关系咀，模式为y m l 文档提供了一定的语义描述能力，然而皿。模式的语义仍然是隐含的x m l 模式的元素含义要么由用户根据元素的名称( 通过自然语言描述) 去推断，要么通过另外一个文档来描述) 函几模式并不能对其所含有的语义进行任何解释为了实现x m l 文档的解释或者转换，必须将这些语义编码到工具中，而将数据的最终解释留给了特定的应用。不仅如此，由于x m l 模式只能对x m l 的语法合法性进行验证，而不能区分) 函几属性和元素在含义上的不同，因此对于同样的信息内容，可以将其映射为多种不同的皿。结构例如我们要说明某本书( b o o k ) 的作者( a u t h o r ) 是哪个作家( n a m e ) ，可以得到多种x m l s c h e m a 的定义如表2 - 1 表2 - 1x m l s c h e m a 与d t d 关系 x m l 实例对应的d t d 定义 x s ：e l e m e n t r e f = n a m e 。n n a m e r e f = a u t h o r b x s ：a t t r i b u t ef l a m e = i d t y p e = x s ：s t r i n g u s e = r e q u i r e d lb x s ：a t t r i b u t en a m e = i d t y p e = x s ：s t r i n g u s e = r e q u i r e d “n ； b _ i d i i 第6 页贵州大学硕士论文基础知识简介 a - i d i i i x s ：e l e m e n t ) x s ：s e q u e n c e ) 这种数据表达上的不唯一性意味着，相同的x m l 文档可以存在多种不同的解释，而相同的应用也可能对不同的) 函几作出同样的解释。这种解释上的多对多关系，使得在交换x m l 文档之前，必须对其所使用到的标记的名称、组织格式和含义进行约定，任何对该咀。文档的单方面扩展都可能会给数据交换过程带来更多的麻烦，甚至导致失败然而，这种通过约定来实现信息共享的方式只适用于两两之间的信息交换，却不能满足w e b 上多个用户或团体大范围的信息共享所以仍然不得不做大量的模式之间的转换，而目的只是为了保证它们在语法的描述结果上保持一致为了克服x m l 所存在的不具备语义描述能力的问题，在这样的背景下诞了r d f ( r 罄咄d t 赋耐i f r a m e 帅杠卜- w e b 致据的语义描述模型。 2 1 2r d f ( 资源描述框架) 由于x m l 不具备语义描述能力为此，w 3 c 推荐以r d f ( r e s o u r c e 酬州o n f r a n 鼢m r k ) 标准来解决咀的语义局限。r d f 使用一个简单的模型来表示任意类型的数据这个数据类型由节点和节点之间带有标记的连接弧所组成节点用来表示w e b 上的资源，弧用来表示这些资源的属性。因此，这个数据模型可以方便的描述对象( 或者资源) 以及它们之间关系。r d f 的数据模型实质上是一种二元关系的表达，由于任何复杂的关系都可以分解为多个简单的二元关系，因此r d f 的数据模型可以作为其他任何复杂关系模型的基础模型。 r d f 和x m l 是互为补充的。首先，r d f 希望以一种标准化，互操作的方式来规范 ) 函也的语义x m l 文档可以通过简单的方式实现对r d f 的引用。如例1 所示例1 x _ m l 对r d f 的引用示例第7 页贵州大学硕士论文基础知识简介 r d f ：r d f x n d n s ：r d f = ”h t t p ：w w w w 3 o r g 1 9 9 9 f f 2 2 2 - r d f - s y n t a x - n s # x l n h l s ：c o n t a c t = ”h t t p ：w w w w 3 o 喀g 2 0 0 0 1 0 s w a p p l m c o n t a c t # 。) e r i c 砌e r c o n t a c t ：f u l l n a m e ) ，- a 71 3 b ( 口，6 ) r 7 6 c 若在基本形式描述语言a l c 基础上增加了。数目约束”，则表示为a l c n n e g a t i o n ；若增加“术语析取一则表示为a ic i 【u l | j 伽】；若增加。存在量词”，则表示为眦脚d s t 】；所以相应表示的术语公式可表示为a 【q 口q 【u 1 【e 】【】为可选通过定义最基本的概念，并使用逻辑符号与量词符号将之联系，能够由定义了的这些概念根据某些规则而形成组合，即更复杂的概念在描述逻辑系统中，这些概念统称为“术语”，它们包含在术语集即t u o x 中，用以描述由客观对象构成的类首先要说明的一点是，这些形式化的术语是和语义相容的即具有可靠性和完备性这一点由以下术语公理所保证公理2 1 ( 术语) ：设c ；o 为术语，耻s 为关系，它们的语义解释由l 所表述。则有 c d i f c c d 。 r s i f fr 1 s l 在实际使用中，更多地考虑的是两个术语或者两个关系的等价性与它们的语义等价性，这是上述公理的一个简单推论推论2 2 ( 术语) ：设c ；d 为术语，r ；s 为关系，它们的语义解释由l 所表述则有 c - d 赶c 1 一d r ；s j 仃r 1 一s 1 在定义了术语集合后，使用上面介绍的描述语言可以有效地定义新的术语。如： h u m a n _ a n i m a lnv h a s p a r e n t a t l u m a n 关于术语还有一些其它的问题，包括术语的递归定义等。由于它们和本文的主旨关系不大，就不在这里详细讨论了这方面的具体内容可参见文献【3 l q 。 2 1 4 3 断言集合a b o x 有了术语的定义，就可以基于术语定义断言和定理，郾构造a b o l 首先来说明断言的形式事实上，断言是由术语对常元进行界定而构成的，例如c ( t a c d 同时，断言也第1 3 页贵州大学硬士论文基础知识简介可以是常元之间的关系，h a s c h i l d ( j a c k ，t o m ) 等等。通常称前者为术语断言或者概念断言，而称后者为关系断言。本质上。这两种断言对应着一阶谓词逻辑中的一元和二元谓词 a b o x 语义可以定义为：将常元a ，b 的语义解释分剐定义为其在论域中所对应的个体a i ，b i 考虑术语断言c ( a ) 和关系断言r 伍b ) t 相应的语义表示为： ( c ( a ) ) 11a 1 c 1 ( r ( a ，b ) ) 1 一a 1x b 1 r 1 具体的说明分别为：一个解释i 满足概念断言c 扣) 当且仅当a 1 c i 一个解释i 满足概念断言r “b ) 当且仅当常元a ，b 在论域上的解释a l - b l 之间的关系属于关系r 在论域上的解释r i 2 1 4 4 本体推理经过上述介绍的描述逻辑系统的各个部分下面将部分o w l 限制词与描述逻辑对应的部分列如表2 - 3 。表2 - 3o w l 与描述逻辑关系 o w l 语法d l 语法 u 砌引用a a o w l ：t h i n g t o w l ：n o t h i n g 上 i n t e l x e c t i o n o f ( c l ，c 2 ) c lnc 2 u n i o

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（计算机应用技术专业论文）基于本体的web数据集成研究与应用.pdf

文档简介

温馨提示

最新文档

评论

（计算机应用技术专业论文）基于本体的web数据集成研究与应用.pdf

文档简介

温馨提示

最新文档

评论

相关文档