毕业论文-Semantic Web的研究及其在网络教学系统中的应用00271.pdf_第1页
毕业论文-Semantic Web的研究及其在网络教学系统中的应用00271.pdf_第2页
毕业论文-Semantic Web的研究及其在网络教学系统中的应用00271.pdf_第3页
毕业论文-Semantic Web的研究及其在网络教学系统中的应用00271.pdf_第4页
毕业论文-Semantic Web的研究及其在网络教学系统中的应用00271.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学 硕士学位论文 semantic web的研究及其在网络教学系统中的应用 姓名:李军波 申请学位级别:硕士 专业:计算机应用技术 指导教师:郭禾 20040301 摘要 语义w e b ( s e m a n t i cw e b ) 是下一代的万维网( w o r l dw i d ew e b ) ,是为了解决现在 w e b 上的信息缺乏计算机能够理解的语义这个问题。 本文的主要内容是研究语义w e b 环境下的知识表达、本体构造、查询推理和基于语义 w e b 的网络教学问题。针对本体论( o n t o l o g y ) 语言o i l ( o n t o l o g yi n f e r e n c el a y e r 或 o n t o l o g yi n t e r c h a n g el a n g u a g e ) 的原语在描述公理和规则方面的不足,利用o i l 的开 放性和可扩展性,并按照w 3 c 的语义w e b 标准,定义了o i l 的描述原语在逻辑公式、关系代 数公理和查询推理三方面的扩展。针对现有网络教学中的难题:如知识库不能很好地共 享和重用、计算机难以理解知识的语义、人机之间缺乏交互性、以学生为中心的探索式 的学习难以实现等,本文把语义w e b 应用于网络教学,构造了部分教学本体知识库;实现 了网络教学环境下的个性化的查询推理系统;并建立了语义w e b 下的计算机支持的协作学 习( c o m p u t e rs u p p o r t e dc o l l a b o r a t i r el e a r n i n g ,c s c l ) 模型,对c s c l 系统的实现具 有指导意义。 关键词:语义网;本体;r d f ( s ) :o i l ;网络教学 a b s t r a c t s e m a n t i c 耗bi sp u tf o r w a r db yw 3 c ( w o r l dw i d ew e bc o n s o r t i u r n ) t os o l v et h e p r o b l e mt h a tt h ei n f o r m a t i o no nt h ew o r l dw i d ew e bl a c k ss e m a n t i cm e a n i n gw h i c h c a rb e e nu n d e r s t o o db yt h ec o m p u t e r t h em a i nc o n t e n to ft h ed i s s e r t a t i o ni st or e s e a r c ht h e k n o w l e d g e r e p r e s e n t a t i o n ,o n t o l o g y sc o n s t r u c t i o n ,s e a r c h i n f e r e n c ei nt h es e m a n t i cw e b f i e l da n de - l e a r n i n gb a s e do nt h es e m a n t i cw e b a sal a n g u a g ef o rc o n s t r u c t i n g o n t o l o g yo nt h es e m a n t i cw e b ,o i lh a s n te n o u g hp r i m i t i v et od e s c r i b l ea x i o m s a n dr u l e s ,b u ti t i so p e n ,e x t e n d a b l ea n dt h ee x t e n s i o no fi ti s e n c o u r a g e d s o t h ep a p e re x t e n do i lo nt h eb a s i so ft h es e m a n t i cw e bs t a n d a r d sr e c o m m e n d e db y w 3 c t h ee x t e n s i o ni n c l u d e s l o g i c f o r m u l a p r i m i t i v e , r e l a t i o n a l g e b r a d e s c r i p t i o np r i m i t i v ea n ds e a r c h i n f e r e n c ep r i m i t i v e t h ep a p e rb u i l das e a r c h i n f e r e n c es y s t e mw i t ht h eh e l po ff r a m el o g i ci n f e r e n c ee n g i n ew h i c hh a da l r e a d y b e e nc r e a t e db yo t h e r s s e m a n t i cw e bi sa p p l i e dt ot h ee - l e a r n i n gs y s t e mt oh e l p s o l v et h ef o l l o w i n gp r o b l e m s ,s u c ha s “i ti sd i f f i c u l tf o rk n o w l e d g eb a s et ob e s h a r e da n dr e u s e d ”,“c o m p u t e rc a n tu n d e r s t a n dt h es e m a n t i cm e a n i n go f k n o w l e d g e ”, “h u m a nc a n tc o m m u n i c a t ew i t hc o m p u t e rs u c c e s s f u l l y ”,“i n q u i r yl e a r n i n gf o c u s i n g o ns t u d e n t si si nt r o u b l e ”e t c p a r t l yt e a c h i n go n t o l o g i e sa r eb u i i tr e f e r e n c i n g t h eb u i l d i n gs t a n d a r d so ft e a c h i n gr e s o u r c e ap e r s o n a ls e a r c h i n f e r e n c e p l a t f o r mi sr e a l i z e df o re - l e a r n i n g t h ep a p e ra l s oe s t a b l i s h e sac s c l ( c o m p u t e r s u p p o r t e dc o l l a b o r a t i v el e a r n i n g ) m o d e lw h i c hc a nd i r e c tt h eb u i l d i n go fc s c l s y s t e mb a s e do ns e m a n t i c w e b k e y w o r d :s e m a n t icw e b :o n t oio g y ;r d f ( s ) ;o il :e l e a r nin g s e m a n t i cw e b 的研究及其在网络教学系统中的应用 0 前言 人类的知识建立在两个基石之上:语义学和数学。在数字计算方面,计算机已经远 远超越了人类,但计算机在语义理解的很多方面却远远逊于人类,w e b 技术的发展为此提 供了新的契机,将人工智能、知识工程及其相关学科与w e b 技术相结合,成为目前的一个 研究热点。 在万维网( w o r l d w i d e w e b ,以下简称w e b ) 日益普及的今天,人们充分体会到了网 络的巨大魅力。然而由于现在的w e b 没有很好地定义下层的数据模型,使得w e b 上的信息 的结构柱较差,并缺乏语义的支持,造成w e b 上信息孤岛的产生一信息之闽缺乏联系、 应用单调、整个网络呈现出静态与被动的特征。 万维网的创始人t i mb e r n e r sl e e 于2 0 0 0 年在x m l 2 0 0 0 的会议上正式提出了语义w e b 。 语义w e b 的目标是使得w e b 上的信息具有计算机可以理解的语义。b e r n e r sl e e 说:“我有 一个关于w w w 的梦想它由两个部分组成。在第一部分中,w w w 变成了一个有利于人们 相互合作的强大工具在梦想的第二部分,合作延伸到了计算机。机器变得可以分析 w 硼上的所有数据包括内容、链接、以及入与计算机之间的交易。能够实现这一切的 一种“s e m a n t i cw e b ”尚未出现,但一旦它出现,每天的交易、行政活动,以及我们的 日常生活就将通过机器之间的对话来完成,而人类只要提供灵感和直觉就行了” 语义w e b 虽然是一种更加美好的网络,但实现起来却是一项复杂而浩大的工程。要使 语义w e b 搜索更精确彻底,更容易判断信息的真假,从而达到实用的目标,首先需要制订 标准,目前语义w e b 的两大核心技术x m l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标记语言) 和r o f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,资源描述框架) 已经逐渐走向成熟。w e b 下的 本体论也在积极的研究和开发之中。有消息称,美国计划在2 0 0 5 年推出语义w e b 。 利用现有的语义w e b 的研究成果,开展对语义w e b 的研究和实验的条件已经成熟和迫 切。对此我们开展了一系列的研究,包括x m l 、r d f 、o n t o l o g y 、语义w e b 下的知识表达和 查询推理等。另外,我们还将研究成果应用在网络教学系统中进行了实验,取得了较好 的效果。本文就是对这些成果的总结。相信这一切为我们下一步的研究奠定了好的基础。 1 概述 1 1 语义w e b 自o 提出背景及简单架构 w e b 作为一个巨大的信息空间,其目标不仅是为了人与人之间的通信,而且应用或机 器之间也应该实现数据与知识的交互。实现机器通信的主要障碍是w e bt 大多数信息的部 署是针对人的消费,w e b 的信息只是机器可读的,而不是机器可理解的。 以w e b 上的信息检索为例:今天的w e b 搜索引擎通常会找到数不清的毫不相关的“结 果”,需要大量的手工过滤工作。例如,如果你用关键字“c o o k ”搜索,计算机根本无 法知道你是在找一位厨师,还是找有关烧菜的信息,抑或是其他什么带有“c o o k ”的人、 企业或其他什么。问题的根源在于“c o o k ”这个词对计算机来说根本没有含义。如果语 义信息在w e b 上广泛采用,那么“精细、准确和自动化”的搜索就能够实现。 语义w e b 的目的就是要提供种具有语义支持的计算平台,以一种机器可以处理的方 式来表示信息,使得人机之间、计算机之间的语义交互变得畅通,自动处理得以实现。 万维网的创始人t i mb e r n e r s l e e 为我们描绘了这样一幅图景:“我有一个关于w w w 的梦想它由两个部分组成。在第一部分中,w w w 变成了一个有利于人们相互合作的强 大工具。我总是把信息空间想象为某种每个人都可以直接凭直觉获得的东西,人们不仅 可以浏览,而且可以创造它在梦想的第二部分,合作延伸到了计算机。机器变得可 以分析w w 上的所有数据包括内容、链接、以及人与计算机之间的交易。能够实现这 一切的一种“s e m a n t i cw e b ”尚未出现,但一旦它出现,每天的交易、行政活动,以及 我们的日常生活就将通过机器之间的对话来完成,而人类只要提供灵感和直觉就行 了” 开发语义w e b 的两个重要技术已经就绪,它们是x m l $ i 3 r d f ( 资源描述框架,r e s o u r c e d e s c r i p t i o nf r a m e w o r k ) 。 x m l 让每个人都能创建自己的标签,例如 、 等,来对网页或页面的 部分文字进行注释。脚本,或者说是程序,可以将这些标签运用到复杂的应用中,不过 程序编写者必须知道网页作者是如何使用每一个标签的。简而言之,x m l 允许用户在文档 中加入任意的结构,但无需说明这些结构的含意。 含意由r d f 来表达。r d f 中的代码包含一组组的三元组,每个三元组相当于句子中的 主语、谓语和宾语。这种结构用于描述由机器处理的大量数据,是非常自然的方法。 一词多意使人类语言变得丰富,却给自动处理造成了很大的麻烦。如邮政编码、邮 编、z i pc o d e 、p o s t a lc o d e 是同义词,如果用户要搜“邮政编码”,计算机应对以上四 个词作同样的处理,但现在的搜索引擎是做不到的。这些可通过o n t o l o g y 来实现,简单 地说,w e b 上的o n t o l o g y 包括概念的分类和一套推理规则。更高级的应用将使用o n t o l o g y 将页面上的信息关联到相关的知识结构和推理规则中。比如把大连市某单位的地址交给 计算机处理,并附有大连市的城市代码,但没有告诉计算机这个地址是哪个国家的,应 s e m a n t i cw e b 的研究及其在网络教学系统中的应用 该按照哪国的地址格式处理,而计算机中已经有规则:城市代码包含其所在省( 州) 的 代码,省( 州) 的代码包含其所在国家的代码,而且计算机中有“国别”与“国别代码” 的对应关系,则计算机可以判断:大连在中国,应该按照中国的格式处理这个地址。 要能做到理解网络信息资源中丰富的逻辑语义,并进行推理,语义w e b 必, 须具备“3 : ( 1 ) 一定的知识体系来表达概念对象及其相互间的逻辑语义关系; ( 2 ) 一定的词汇体系来描述这些对象类及其关系,建立对应的元数据元素; ( 3 ) 一定的赋值机制来建立元数据元素与对应资源( 或资源片段) 的描述关系; ( 4 ) 一定的标记语言和语法来对元数据元素及其赋值关系进行标记。 为了实现这个目标,语义w e b 需要一个多层技术框架,其中: ( 1 ) 逻辑层( l o g i c a ll a y e r ) ,即前述逻辑知识体系,实际上,它们多局限于一定的 应用领域。语义w e b 在该层次的任务是建立定义和标记o n t o l o g y 的标准方式。 ( 2 ) 语义层( s e m a n t i cl a y e r ) ,即前述词汇体系,用以表达元数据。实际应用中, 不同应用领域会根据不同目的、针对不同的概念对象建立多种描述性元数据模式,对具体 对象及其属性进行描述,例如d c 、m a r c 、e a d 、g i l s 、m p e g 7 等。语义w e b 的任务是建立基 于o n t o l o g y 来描述元数据元素、元数据关系和约束元数据语义的机制。有时,o n t o l o g y 可直接定义元数据,或者将某些元数据模式g i 入到o n t o l o g y 中。 ( 3 ) 赋值层( a s s e r t i o nt u y e r ) ,即前述赋值枫制,以标准方式建立元数据与被描述 资源的连接,从而保证计算机能明确地确认元数据、元数据含义及其与资源的关系。目 前,r d f 正成为网络环境下的基本赋值机制。 ( 4 ) 语法层( s y n t a xl a y e r ) ,即前述标记语言标准,以计算机可理解和处理的方式 对上述三个层次进行标记。目前,x m l 作为网络资源的标准标记语言,也正成为语义和知识 的基础标记语言。 另外,在逻辑层之上,可能还需要利用o n t o l o g y 和其他描述性元数据进行语义分析的 推理机制,基于数字签名方式对o n t o l o g y 、元数据、赋值关系、甚至推理机制等进行确认 和验证的机制,从而建立可信赖的语义环境和推理环境。另外,在语法层下,还需要数据编 码和资源标识的标准,立i u n i c o d e 和u r i 。 1 2 语义w e b 的研究进展 早在1 9 9 4 年,w e b 的发明者t i m b e r n e r s - l e e 就与m i t 联合成立了w 3 c ,w 3 c 成为了专门 研究w e b 技术发展的核心组织。同时w 3 c 制定并维护着w e b 技术的官方标准和推荐新的标 准。特别是在1 9 9 8 年发布的x m l ,为下一代的w e b 发展打开了大门吲。在) m l 基础上可以定 义、扩展新的标记语言和功能。基于x m l 进行的研究和新的w 3 c 标准的提出,已经逐步形 成了w e b 的新的结构体系。可以说,未来的w e b 将是一个开放、具有计算机可理解的语义、 支持移动计算、对象的状态与行为可伸缩藕合的分布式对象计算环境u j 。 x m l 让每个人都能创建自己的标签,来对网页或页面的部分文字进行注释。x m l 允许 用户在文档中加入任意的结构,但x m l 的这种表示缺乏语义【4 j ,语义e 自r d f 来表达睁j 。 r d f 中的代码包含一组组的三元组,每个三元组相当于句子中的主语、谓语和宾语。 在r d f 中,文档中的声明通常是某个事物( 人、网页或其他任何东西) 对于某些值( 另一 个人、另一网页) 拥有某些属性( 例如“是姐姐”,“是作者”) 。这种结构用于描述 s e m a n t i cw e b 的研究及其在网络教学系统中的应用 由机器处理的大量数据,是非常自然的方法。r d f 实际上包含了两种正在形成中的新标准 一r d fm o d e la n ds y n t a x ( r d f m s ,r d f 模型和语法规范) 和r d fs c h e m a ( r d f 模式规范) 【6 】。 r d f m $ 提供了一种数据模型和语法规范,以种标准的可互操作的方式表示数据的语义, 同时,r d f m s 还提供了一种用“命名属性:值”描述资源之间关系的方法。r d f s 作为一种 面向对象的类型系统,是定义r d f 词汇集的词汇集。但是,r d f m s 和r d f s 尚缺乏表达能力, 仅仅基于它们,不能定义关于属性的属性、类成员之间的充要条件甚至类之间的等价和 无联系关系,同时r d f s 定义的可表达的约束也只是对属性的领域和范围约束,此外,还 需要定义更多的原语语义。 语义w e b 的核心技术和理论是以知识工程成熟的理论、技术和方法为基础,其中, o n t o l o g y 技术是知识工程技术中基础的、且具有广泛影响的技术,因此关于语义w e b 本身 的研究主要是在w e b 环境中建立以知识工程技术,特别是o n t o l o g y 技术为核心的技术体 系,从而使得在语义化的w e b 计算环境中,可以应用知识工程的技术和方法部署各种w e b 的应用和服务【7 1 。 一些研究工作受a i 启发,在r d f m s 和r d f 之上建立了知识表示语言,如:s h o e m j ,d a m l 、 o i l 、d a m l + o i l 、o w l 。这些语言都是要增强r d f 的逻辑表达能力和o n t o l o g y 描述能力,例 如:o i l 就是综合了a i 的d l 和f l 理论和技术,具有定义完备的且形式化的模型语义,同时 具有一定的公理化规范。 i b r o w 与o n t o k n o w l e d g e 是两个在建的欧洲e u - i s t 项目:其中,i b r o w 通过提供一种 面向i n t e r n e t 的b r o k e r ,使得用户可以访问w e b 上可重用的问题解决方法库,并可以根据 用户的问题和应用领域对方法库中的方法进行选择、配置和执行,进而提供可定义的推 理服务、信息和访问服务 9 1 ;o n - t o k n o w l e d g e 旨在为知识管理建立一种基于o n t o l o g y 的工具环境,处理大型机构的i n t r a n e t p q 或w e b 上的大量异构的、分布的、半结构化的文 档,在o n t o k n o w l e d g e 的分层结构体系中,o n t o l o g y 是其关键的技术基础。 由于语义w e b 是在x m l 基础上并未完全成熟的技术,因此除了在理论上需要知识工程 的技术和方法进行支持以外,在技术上还需要充分考虑w 3 c 的标准,有关语义w e b 的研究 也就需要兼顾两方面的因素,相关的研究也就比单纯的知识工程技术研究或w 3 c 标准的应 用研究包含更宽的内容。 在w e b 语义化过程中,除了r d f m s ,r d f s ,d a m l 和o i l 等这些关于语义w e b 本身的主要 技术的研究和标准化过程外,一些关键的研究还包括了:传统的a i 或知识工程领域的问 题解决方法( p r o b l e m s o l v em e t h o d ,p s m ) 、知识获取( k n o w l e d g ea c q u i s i t i o n ,k a ) 、 数据挖掘( d a t am i n i n g ,d m ) 等理论和技术如何成功地应用于w e b 计算环境:针对智能 信息集成、知识管理和电子商务等各种典型应用的体系和框架的基础研究;面向特定应 用的o n t o l o g y 技术和o n t o l o g y i 程研究等。 由于s q l 查询在r d b m s 中得到成功的应用,因此,现有的很多面 句x m l 的查询语言都是 基于s q l 技术的类s q l 查询语言,如:x q l ,l o r e l 等,提供类似于数据库的查询服务。利 用这些查询语言可以从大型的x 札文档中提取数据、定位和过滤x m l 文档中的元素和文字、 在不同的d t d 之间进行x m l 数据的转换、对多个x m l 数据源进行数据集成、x m l 数据和查询 的传输等。但是这些面向) 【m l 的查询语言主要是基于) ( m l 语法对) ( m l 文档进行类似s q l 的查 询,查询的语义层次只是在x m l 文档的元素级,如:w 3 c 提出的半结构化查询语言x m l q l , 用于在文档级的结构上进行查询,而没有考虑在x m l 之上进行知识级的查询推理,如: 4 s e m a n t i cw e b 的研究及其在网络教学系统中的应用 r d f m s 和r d f s ,由于同一个r d f m s 数据模型可以有几种x m l 语法编码方式,所以需要在r d f 逻辑和语义级上的查询语言。 传统的w e b 搜索引擎采用面向w e b 的查询语言进行信息收集、为用户提供查询服务。 用户查询和获取信息是基于关键字的搜索,这类传统的w e b 查询语言主要有w 3 q l 、w e b s q l 和w e b o q l 等。这些查询语言主要是针对w e b 资源的内容或结构上的查询,没有考虑在内容 之上的知识语义。 o i l e d ( 基于o i l 的o n t o l o g y 的编辑环境) 自带的推理机f a c t ( f a s tc l a s s i f i c a t i o no f t e r m i n o l o g i e s ) 的推理主要集中在检查约束的一致性和分类o n t o l o g y 方面,不能满足我 们的推理需要。 而r d f m s 的三元组与基于逻辑语言的基事实( g r o u n df a c t ) 是等价的,因此,我们可 以把进行信息、管理和查询的逻辑方法映射到r d f 模型。这样,考虑通过现有的描述性语 言来开发查询方面和约束方面的语言,我们定义面向r d f 数据的查询原语,基于基事实的 “匹配”和“填槽”推理过程可以重用现有的推理引擎,例如:r d f 三元组可以相应地用 f r a m el o g i c ( 也记作f l o g i c 或f l ) 等价表示,这样,针对基事实的推理可以使用基于f l 的推理引擎。所定义的查询推理原语的一致性约束能力通过o n t o l o g y 描述原语的语义来 实现。f r a m el o g i c 用来定义面向对象的数据库、框架系统和逻辑程序,它把概念上的建 模结构( 类、属性、领域和范围约束、继承、公理) 集成在一个紧凑的逻辑框架中,目前f l 的推理引擎已经很成熟。我们把f l 推理引擎嵌入到了我们的查询推理系统中,搭建了一个 语义w e b 下的查询推理平台,具有一定的先进性。 我们国家也在9 7 3 ,国家自然基金研究等项目中支持了基于o n t o l o g y 的信息集成、国 家数字图书馆、信息检索等应用型的项刚,这些项目以知识工程技术,特别是o n t o l o g y 技术作为核心。 实际上,语义w e b 的建设分为三个步骤: l - 借助x m l 和r d f 等定义一套术语,形成某个领域的o n t o l o g y ,这样不断地在网络中 建设很多o n t o l o g y ; 2 编制软件,能够根据o n t o l o g y 之间的关系进行推理; 3 基于推理软件建设应用。 1 3 语义w e b 与网格计算、w e b 服务以及p 2 p i j 勺融合 语义w e b 的研究现在还主要侧重于知识表示与推理方面,现在的w e b 服务可以说是对 原有的面向对象、分布式计算、w e b 技术等的一种综合集成,主要是从商业和应用的角度 来进行的,简单地说,w e b 服务是一种开发的规范,使得通过网络可以对基于规范开发的 各种应用进行调用、整合,从而在互联网上完成更复杂的任务,但它不能对服务的语义 进行描述,因而要让计算机去理解这些服务是很困难的,甚至是不可能的,所以w e b 月e 务 需要语义w e b 的支持。 增进资源共享是语义w e b 的目标,在语义w e b 中,计算机会根据关键名称定义的超链 接和逻辑推理规则发现语义数据的含义。其最终结果就是能够刺激开发自动化的网络服 务。这样,语义w e b 将会推动w e b b 匿务的深化。实际上,基于w e b 服务的应用正是互联网中 最重要的资源,w e b 服务与语义w e b 的融合是可能而且肯定的。 从定义上讲,网格是关于下一代互联网最宏大的构想:“把整个互联网整合成一台巨 s e m a n t i cw e b 的研究及其在网络教学系统中的应用 大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资 源的全面共享”。当然,网格并不一定非要这么大,我们也可以构造地区性网格、企业 网格、局域网网格、甚至家庭网格和个人网格。事实上,网格的根本特征是资源共享而 不是它的规模。 至于p 2 p ,更多是强调打破c 1 i e n t s e r v e r 或b r o w s e r s e r v e r 的主从模式,用对等模 式( 或无服务器模式) 实现超级服务器的功能,使互联网上的闲散资源可以被充分利用。 w e b 服务和p 2 p 具备两个共同点:( 1 ) 意图将互联网上的资源整合成一台超级服务器, 有效地提供内容服务、计算服务、交易服务等;( 2 ) 这些技术会尽量利用现有的 i n t e r n e t w e b 技术,以便早出产品。 语义w e b 研究的侧重点是智能信息处理,它与网格和p 2 p 研究的共同点是如何消除信 息孤岛和知识孤岛,实现信息资源和知识资源的智能共享。 语义w e b 、网格计算、w e b 服务以及p 2 p 被认为是互联网的四种发展方向,是对下一代 互联网的“横看成岭侧成峰”的四种不同的景象。我们认为它们之间的融合乃至包容吸 收是可能而且肯定的。 1 4 论文的主要工作及章节安排 我们的研究涵盖了第三节描述的语义w e b 建设的三个步骤,重点在以下4 个方面:( 1 ) r d f 的表示机理;( 2 ) o n t o l o g y 的建模方法、建模语言和具体的本体建设;( 3 ) 语义w e b 上的查询推理;( 4 ) 语义w e b 下的网络教学系统。 o i l 的出发点是定义一个核心语言,其意图是把一些额外的特性定义为一组扩展。建 模者可以自由地使用这些语言扩展。本文定义t o i l 原语在谓词逻辑公式、关系代数公理 和查询推理的请求与响应三方面的的扩展,为我们建构o n t o l o g y 提供支持。 o i i e d ( 基于o i l 的o n t o l o g y 的编辑环境) 自带的推理机f a c t ( f a s t c l a s s i f i c a t i o i lo f t e r m i n o l o g i e s ) 的推理主要集中在检查约束的一致性和分类o n t o l o g y 方面,不能满足我 们的推理需要。f r a m el o g i c ( 也记作f l o g i c 或f l ) 用来定义面向对象的数据库、框架系 统和逻辑程序,它把概念上的建模结构( 类、属性、领域和范围约束、继承、公理) 集成 在一个紧凑的逻辑框架中,目前f l 的推理引擎已经很成熟。所以,我们把f l 推理引擎嵌入 到了我们的查询推理系统中。 目前,已经建立了几个教学本体库,搭建了一个基于语义w e b 的查询推理平台,并把 它用于网络教学系统中实现个性化查询和推理。我们还建立了语义w e b 下的计算机支持的 协作学习( c o m p u t e rs u p p o r t e dc o l l a b o r a t i v el e a r n i n g ,c s c l ) 模型,对c s c l 系统的 实现具有指导意义。 全文共分6 章。第1 章是概述,介绍了语义w e b 的产生背景、简单架构和研究进展、并 对语义w e b 、网格计算、w e b 服务和p 2 p 的融合提出了大胆的预测。第2 章详细介绍了语义 w e b 的关键技术一r d f 、o n t o l o g y 和语义w e b 的体系结构,并介绍了本体语言o i l a 第3 章是对o i l 语言在逻辑公式原语、关系代数公理描述原语和查询推理描述原语方面的扩 展。第4 章讨论使用f l 推理引擎在语义w e b 下的查询推理问题,建立了语义w e b 下的查询推 理的原型系统。第5 章介绍了教学本体构建、网上教学的个性化查询系统的设计与实现和 语义w e b 下的计算机支持的协作学习( c s c l ) 模型。第6 章是全文的总结和下一步研究方 s e m a n t i cw e b 的研究及其在网络教学系统中的应用 向的展望。 7 s e m a n t i cw e b 的研究及其在网络教学系统中的应用 2 语义w e b 的技术基础 本章介绍了语义w e b 体系中的基础知识,包括:x m l 、r d f 、o n t o l o g y 以及语义w e b 的 体系结构,对于o n t o l o g y 的构造语言一o i l 也作了介绍。这些技术是本论文后续部分的 技术基础。 2 1x m l 技术 ) ( m l 由于其良好的可扩展性和灵活性,适合于表示各种信息,已被认为是未来w e b 上 数据交换的标准,x m l 不仅提供对资源内容的表示,同时提供资源所具有的结构信息。x m l 是创建文档结构的工具,而不单单是将结构用于界丽显示。它所创建的文档结构可以使 管理系统精确地识别信息所在的位置。它能提供数据库格式,通过交换格式以及其它应 用走进所有数据处理程序。x m l 可以将数据的存贮与数据的显示分开,即内容与形式分离。 2 2r d f 与r d f s 2 2 1w e b f l 9 元信息处理技术 在现今的社会中,信息无处不在,从这些信息中获取对自己有用的信息并不是件容 易的事。当然也有例外的,比如,在图书馆里你可以根据书名或作者名或关键字的信息 找到藏书号,从而很容易找到所要的书,图书馆的图书信息是建立在元数据之上。 元数据是关于数据的数据或关于信息的信息。例如:书的文本就是书的数据,而书 名、作者、版权数据都是书的元数据。元数据并不一定就是用来检索的,也可用于内部 的管理,如图书馆系统可以为书定义被借次数这个元数据,以了解书的被借阅情况,确 定是否要增加副本数。元数据的使用,可以大大提高系统的检索和管理的效率。 网络是个大的数据库,它里面包含的数据比起图书馆来要复杂得多,其上包含了很 多主题的信息,每个主题在w e b 上又有无数的信息。通过w e b 人们可以得到各种各样的服 务,例如可以查看新闻、天气以及进行商务活动等,在w e b 这种似乎无穷无尽的用途背后, w e b 技术所忽视的一个关键的方面越来越引起重视拉l ,这就是w e b 所包含的关于信息的信 息,即:元信息。把它们以某种方式结构化,可以使w e b 页面得到尤其适合于计算机进行 的搜索和处理。搜索引擎中除极少数如y a h o o p f ,基本上都是采用网页的全文检索来提供 检索服务,这就可想而知其查准率之低。y a h o o 将收集到的网站和网页分门别类加以索引 和文摘( 由人工完成) ,从而大大提高了查准率,这也是其流行的一个重要原因。但对浩 瀚的信息海洋若都采用人工标引显然是不现实的,所以用y a h o o 检索的查全率不如像 g o o g l e 、a l t a v i s t a 、i n f o s e e k 这样的搜索引擎高,原因是其收录的网站网页数量有限。 如果网站上的网页在创建之初都使用元数据来描述其自身的信息,那么就可以省去人工 标引的麻烦。但是怎样用元数据来描述,就得有一个标准,w 3 c 提出的用于描述w e b 资源 的r d f ( r e s o u r c ed e s c r i p t i o nf r a m e w o r k 资源描述框架) 就是这样的一个标准,r d f 给出 r s e m a n t i c 帕b 的研究及其在网络教学系统中的应用 了w e b 数据集成的元数据解决方案。 w e b 上现有的信息完全是非结构化或半结构化的信息,即使在三层结构中,从关系数 据库中得到了结构化的数据,插入到w e b 页面中也失去了其原有的语义属性。这主要是由 于w e b 最初是为了让人类消费使用的,所以w e b 上的所有信息、只是机器可读的,而不是 机器可理解的。这样,通过w e b 进行搜索的结果是搜索引擎进行文本检索结果的子集,这 样不仅效率低下,而且通常得到大量与搜索要求毫不相关的结果。基于w e b 现有的机制, 很难自动地像r d b m s 那样进行诸如描述、搜索、管理、交换和更新等准确的处理【1 1 】。 r d f 的含义就是描述资源的框架,下面我们逐个来看这三个词的意思。 资源( r e s o u r c e ) :所有在w e b 上被命名、具有u r i ( u n i f i e dr e s o u r c ei d e n t i f i e r 统 一资源描述符) 的东西。如网页、x m l 文档中的元素等; 描述( d e c r i p t i o n ) :对资源属性( p r o p e r t y ) 的一个陈述( s t a t e m e n t ) ,以表明资 源的特性或者资源之间的联系; 框架( f r a m e w o r k ) :与被描述资源无关的通用模型,以包容和管理资源的多样性、 不一致性和重复性。 综合起来,r d f 就是定义了种通用的框架,即资源一属性一值的三元组,以不变应万 变,来描述w e b 上的各种资源。 下面我们来看一个简单的r d f 的例子: t i mb r a y 该实例的意思是说:资源“h t t p :w w w t e x t u a l i t y c o m r d f w h y r d f h t m l ”的 a u t h o r 是“t i mb r a y ”、h o m e p a g e 是“h t t p :f f 悄礓t e x t u a l i t y c o m ,” r d f 实际上包含了两种正在形成中的新标准一一r d fm o d e l a n ds y n t a x ( r d f m s ,r d f 模型和语法规范) 和r d fs c h e m a ( r d f 模式规范) 。r d f 提供了一种基本的结构,用于在w e b 上对元素数据进行编码、交换和重用。 2 2 2r d f 数据模型r d f m s 2 2 2 1r d f m s 简介 1 r d f m s 的由来 p i c s 是用来定义网络内容和操作级别的系统,是将信息的标记和i n t e r n e t 内容联系 在一起的基础结构。它原本用来帮助家长和老师控制小孩上网访问的内容,同时也为标 记的其他用途提供了方便。p i c s 定义了一种描述分等级的服务和系统的语言,在p i c s 中, 分等级服务指为i n t e r n e t 上的资源提供内容标记的个人或组织,而这些标记基于一个分 等级的系统。在p i c s 基础上,w 3 c 认为p i c s 可以更加通用化以支持任意的w e b 元数据,因 此进行了p i c s n g 定义工作。p i c s - n g 定义了一种元数据对象模型及其进行x 札编码的方 法,以便支持更通用的元数据形式。p i c s 阐述了数据建模和元数据表示的一些重要思想, s e m a n ti cw e b 的研究及麒在隅络救学系统中的应用 现在p i c s n g 的工作和其它的相关工作都加入到w 3 c 的r d f m s 中。 2 r d n 幅 语义w e b 的先决条件是机器可处理的信息语义。r d f m s 是由w 3 c 支持开发的一种对结构 化的元数据进行编码、交换和重用的基础,通过一定的机制实现应用之间的互操作,机 制支持共同的语义、语法和结构的约定,从而实现应用在w e b 上交换机器可理解的信息。 资源描述面临的主要障碍是元数据语法和模式定义语言标准的多样性,而这些语法 和语言相互不兼容。r d 刚s 的目标就是支持元数据的互操作,使得资源对象的语义是可表 达的和可利用的,以一种机器可理解的形式进行w e b 资源描述。r d f m s 使用x m l 作为元数据 交换和处理的公共语法,在l 基础上,r d f 着重于提供明确的语义表达的结构,这样就 使得标准化的元数据能进行一致的编码、交换和实现机器可处理。 r d f m s 使用有向图的形式化模型构造r d f m s 数据模型,形式化模型使用“属性一值”对 描述资源之间的相互关系。r d f m s 属性可以被看成资源的属性,在这个意义上对应于传统 的属性一值对:r d f m s 属性还可以表示资源之间的关系,在这个意义上,r d f m s 数据模型对 应于一个实体一关系图。 2 2 2 2r d f m s 的概念和模型 r d f m s 提供了一种通过“属性一值”描述资源的r d f 模型。r d f 模型使用了三个基本的 概念,它们是r d f m s 基本数据模型的三种对象类型: 资源:以u r i 可唯一确定的任何对象,指所有由r d f 表达式描述的事物。资源可能 是部分、完整的网页或网页集,也可能是w e b 不能直接访问的对象。 属性:与资源相联系的属性,由属性类型确定,描述资源的特定方面、特性或关 系等。属性类型有相应的值,每个属性都有特定的含义、限定允许的值,它能描述的资 源类型以及与其他属性的关系。 r d f 陈述:由个特定资源、资源的属性、资源的属性值构成的三元组。针对同 一资源的所有属性的陈述被称为关于这个资源的描述。一个r d f 陈述就是一个语句,所以 r d f 陈述的三部分分别为主体( s ) 、谓词( p ) 、和客体( 0 ) ,类似于知识表示中的语义网络表 示法。相互等价的描述“o 是s 的属性p 的值”、“s 具有值为0 的属性p ”以及“s 的属性p 的值为0 ”,可以具有下列四种等价的描述: 1 三元组模型:( p ,s ,0 ) 2 谓词逻辑描述:p ( s ,0 ) ,渭词p ( x ,y ) 语义为:x 的属性p 的值为y 。 3 有向图模型:如图2 一l 所示。 图2 - lr d f m s 陈述的图形表示 f i g 2 - i t h eg r a p h i c a le x p r e s s i o no fr d f i ss t a t e m e n t 4 x m l 文档描述,如下所示: 1 0 s e m a n t i cw e b 的研究及其在网络教学系统中的应用 0 其中,“r d f ”和“x x ”为x m l 的名字空间,标明文档中标记“r d f ”、“d e s c r i p t i o n ” 和属性标记“p ? 定义的位置。 r d f 模型中,有时需要引入容器,包含多个元素的资源组,r d f m s 有三种容器:包( b a g ) 、 序列( s e q u e n c e ) 和选择( a l t e r n a t i v e ) 。包是资源的无序列表,序列是资源的有序列表, 而选择是从中选择一个元素的资源组列表。 r d f m s 还允许建立关于r d f 陈述的描述,即:高阶陈述,例如:一个描述:“某人说s 的属性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论