(计算机软件与理论专业论文)网络教育中web+services的个性化发现机制的研究与实现.pdf_第1页
(计算机软件与理论专业论文)网络教育中web+services的个性化发现机制的研究与实现.pdf_第2页
(计算机软件与理论专业论文)网络教育中web+services的个性化发现机制的研究与实现.pdf_第3页
(计算机软件与理论专业论文)网络教育中web+services的个性化发现机制的研究与实现.pdf_第4页
(计算机软件与理论专业论文)网络教育中web+services的个性化发现机制的研究与实现.pdf_第5页
已阅读5页,还剩75页未读 继续免费阅读

(计算机软件与理论专业论文)网络教育中web+services的个性化发现机制的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络教育中w e b s e r v i c es 的个性化发现机制的研究与实现 摘要 网络教育是计算机网络技术在教育领域的应用,与传统教育相比,它的优 势关键体现于多应用的汇集与交互。现今,新兴的w e bs e r v i c e s 技术在网络教 育领域的应用,方便了不同服务的独立开发,并为服务的集成提供了灵活高效 的集成平台。在集成了多种服务的网络教育系统中,服务发现是一项必不可少 的技术。传统的基于u d d i 和w s d l 相结合的w e bs e r v i c e s 发现机制,在长时 间的应用研究中,已日趋成为一种成熟的标准。在此基础上,如何针对网络教 育这一应用环境的特点,改善服务发现的过程,并有效地满足网络教育特定的 需求,是本篇论文研究的重点。 本文将个性化的思想作为网络教育与w e bs e r v i c e s 发现的结合点,构造了网 络教育环境下个性化的w e bs e r v i c e s 搜索系统。它一方面体现了网络教育“以 人为本”的个性化特点,另一方面能够根据学习者的个性特点,对学习者所需 的服务流程进行协调和调用,以简化服务集成的处理过程,从而更好地服务于 用户。 本文在简单介绍了我国制定的学习者模型标准c e l t s 1 1 后。针对网络教育下 个性化的服务搜索系统的需求,设计了适合本系统环境的学习者模型,并在此模 型的基础上,阐明了服务搜索模型的构造及功能。在实现个性化的服务搜索过程 中,本文分析和研究了已有的数据挖掘算法,并结合本系统的需求和特点,提出 了自己的改进思想。最后,文章基于已提出的理论要求,利用j 2 e e 技术构造了服 务搜索系统的管理员模块及面向学习者的服务搜索系统平台,并结合实验的结果 分析和评价了系统的功能及性能。 关键字;网络教育、w e b 服务搜索、个性化、数据挖掘 i l 东南大学硕士学位论文 a b s t r a c t e - l e 锄1 i n gi s t h e a p p l i c a t i o no fc o m p u t e rt e c h n o l o g yi n t h ee d u c a t i o n c o m m u n i t y c o m p a r e d t ot h et r a d i t i o n a le d u c a t i o np a t t e r n , t h eg r e a t e s ta d v a n t a g e so f e - l e a r n i n ga r ei n t e g r a t i o no fm u l t i a p p l i c a t i o n s a n dg r e a ti n t e r a c t i v i t y w i t ht h e a p p l i c a t i o no f w e bs e r v i c e si ne - l e a r n i n g ,i ti sn o wc o n v e n i e n tt od e v e l o pd i f f e r e n t s e r v i c e si n d e p e n d e n t l y a n dah i g h l ye f f e c t i v ei n t e g r a t i o np l a t f o r mi sa v a i l a b l ef o r s e r v i c e si n t e g r a t i o n i nt h ee - l e a r n i n gs y s t e m si n t e g r a t i n gv a r i o u ss e r v i c e s ,t h e s e r v i c e sd i s c o v e r yt e c h n o l o g yi s i n d i s p e n s a b l e a f a ral o n g - t e r mr e s e a r c l l ,t h e c o n v e n t i o n a ls e r v i c e sd i s c o v e r ym e c h a n i s mi nw e bs e r v i c e s ,w h i c hi sb a s e do n u d d ia n dw s d l ,h a sb e e nd e e m e da saw e l l a c c e p t e ds t a n d a r d i nt h i sp a p e r , w e l a yt h ee m p h a s i so nt h ei m p r o v e m e n to fs e r v i c e sd i s c o v e r yt e c h n o l o g yb a s e do nt h e f e a t u r e so f e - l e a r n i n ga p p l i c a t i o ne n v i r o n m e n t s t h e m a i n p u r p o s eo ft h i s i m p r o v e m e n ti st oe f f e c t i v e l yr e f l e c tt h es p e c i f i cn e e d so f e l e a r n i n gs y s t e m s t h i sp a p e rt r e a t st h ep e r s o n a l i t ya st h eb r i d g eb e t w e e ne - l e a r n i n ga n dw e b s e r v i c e sd i s c o v e r y , a n dc o n s t r u c t sap e r s o n a l i z e dw e bs e r v i c e ss e a r c hs y s t e mi n e - l e a r n i n g t h es y s t e mr e a l i z e st h eh u m a n - c e n t e r e dd e s i g n , a n dt h er e q u i r e ds e r v i c e f l o w sa r ec a l l e da n dh a r m o n i z e da c c o r d i n gt ot h ep e r s o n a l i t yo fe a c hl e a r n e r , i nt h i s w a y , t h em a n a g e m e n to fs e r v i c ec o m p o s i t i o nc a nb es i m p l i f i e d t h i sp a p e rf i r s ti n t r o d u c e st h el e a r n e rm o d e lc e l t s 一11i nc h i n e s ee - l e a r n i n g t e c h n o l o g ys t a n d a r d ( c e l t s ) ,a n dc o n s t r u c t sal e a r n e rm o d e li n0 1 1 1 e n v i r o n m e n t a c c o r d i n gt ot h er e q u i r e m e n to f t h ep e r s o n a l i z e ds e r v i c es e a r c hs y s t e m t h e n , b a s e d o nt h em o d e l ,t h ec o n s t r u c t i o na n df u n c t i o no ft h es y s t e ma r ei l l u s t r a t e d a c c o r d i n g t ot h er e q u i r e m e n ta n dt r a i t so ft h es y s t e m , t h ep e r s o n a l i z e da l g o f i t h mi sp r o p o s e d b a s e do nt h ea n a l y s i sa n dr e s e a r c ho f d a t am i n i n g f i n a l l y , t h es e r v i c es e a r c hs y s t e m i sc o n s t r u c t e db yj 2 e e ,w h i c hi n c l u d e sm a n a g e rm o d u l ea n dl e a r n e r m o d u l e m o r e o v e r , t h ef u n c t i o na n dc a p a b i l i t yo f t h es y s t e ma r ea l s oa n a l y z e da n da p p r a i s e d b a s e do nt h ee x p e r i m e n t a lr e s u l t s k e y w o r d s :e - l e a r n i n g , w e bs e r v i c e sd i s c o v e r y , p e r s o n a l i t y , d a t am i n i n g i i i 东南大学硕士学位论文 图1 1 图i 2 e - l e a r n i n g 的中间平台 图例索引 u d d i 工作原理 图2 。l一般学习技术信息、学习者信息和c e l t s 学习者之间的相互关系l l 图3 1个性化服务搜索系统的基本框架。 图3 2服务搜索引擎的构造。 图3 3用户日志举例 图3 4 规则 蜀;s 2 的x m l 描述。 圈3 5 规则岛 瓯j s 。的x m l 描述。 2 0 2 l 图3 6 序列模式( 坞,竭,塌,掘) i 挣x m l 描述 图3 7搜索引擎的工作流程 图3 8服务m a t h s 在l a d d i e 的注册 图3 9在u d d l e 中查询服务。 图3 。1 0d a m l s 的p r o f i l e 到u d d i 的映射 图3 1 1d a m l s a j d d i 中间件结构 2 4 2 4 2 4 图3 1 2m a n i f e s t 文件中对学习资源的描述 图4 1 a p n o r i 算法流程 图4 2k 一中心点算法。 图4 3 图4 4 图4 5 图4 6 图5 1 图5 2 图5 - 3 图5 4 图5 5 图5 6 图5 ,7 图5 8 图5 9 图5 1 0 图5 ,l l 图5 1 2 图5 1 3 3 4 3 9 l o g 文件中一个会话记录的l - f 1 s - t r e e 存储结构4 1 挖掘算法m i n i n g - k m a r 过程4 2 f p - 树2 i z l 1 1 ,1 3 合并后的f p - 树。4 5 管理员界面4 8 个性关联规则提取的工作流程5 0 聚类规则提取的工作流程5 2 个人序列模式提取的工作流程5 3 m v c 模式构筑的j 2 e e 平台5 5 学习者服务搜索界面。5 7 服务推荐的流程5 8 查询u d d i 注册表示例6 0 x m l s q lu t i l i t y 在数据库中的应用6 3 类别数k 对聚类规则个数的影响曲线图6 5 类别数k 对规则提取时间的影响曲线图6 5 接口调用记录的数量对序列模式提取时间的影响曲线图6 6 接口调用记录的长度对序列模式提取时间的影响曲线图6 7 v i i 东南大学学位论文 独创性声明及使用授权说明 一、学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育 机构的学位或证书面使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 签名:盈盘自日期:出n 互 二、关于学位论文使用授权说明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学 位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。 本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外, 允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文 的公布( 包括刊登) 授权东南大学研究生院办理。 j 弦 日期:迦! :一 东南大学硕士学位论文 第一章绪论 本章首先简单介绍了服务搜索系统的应用和研究背景;然后重点针对在网 络教育环境下如何实现个性化的服务搜索这一关键问题,讨论了当前的研究现 状和存在的不足;接着阐述了本文要研究和解决的问题以及采用的研究策略: 并且在本章最后部分勾画了文章的组织结构。 1 1 研究背景 网络教育是计算机和通信网络技术应用于教育的一种新的教育模式,它通 过互联网采用一对一、一对多的远程教育方式,实现了适应性学习和智能化教 学。网络教育不但可以实时传输教师在现场教学的内容,而且可以传输网上的 网络课程。学生与老师、学生与学生、学生与课件之间通过互联网在各自的多 媒体电脑或终端上进行交流。在强大的技术支持下,它呈现出多载体、交互性、 实时性、个性化和共享性的特点。 图1 1e - l e a r n i n g 的中间平台 多应用的汇集与交互是网络教育优势于传统教育的关键所在,因此如何建 立一个高效、灵活的应用集成平台是网络教育需要面对的问题。在传统系统中, 组件之间的紧耦合性需要系统遵循太多的来自于不同组织的协议和标准,而网 络教育作为一个大规模的集成系统,其各种应用通常是独立开发的,很难实现 网络教育中w e b s e r v i c es 的个性化发现机制的研究与实现 紧耦合的集成。未来的趋势是从紧耦合的单一系统发展为松耦合的动态绑定组 件系统,w e bs e r v i c e s 正是在这种趋势下出现的新的网络教育系统新的技术手 段。它在一些标准之上建立了服务描述、发布、搜索和交互的接口,为动态的 网络教育系统提供了灵活高效的集成平台。j u d i t h r o d r i g u e z 等学者提出了一种 基于w e bs e r v i c e s 的网络教育的中间平台l l 】,如图1 1 所示。 图中b r o k e r 作为服务提供商和用户的中介,实现对网络教育下w e b 服务 的所有操作。它的优点在于:1 ) 它便于不同应用之间互相通信( 如a u d i t i n g 和 c o m p l e xs o v i c e s c o m p o s i t i o n 之间) ;2 ) 它方便了外来实体搜索、定位、使用 由不同p r o v i d e r s 提供的服务:3 ) 它为p r o v i d e r s 提供了一个管理中心,以统一 的形式进行发布、管理及清算帐目。 在管理多个服务的大型集成系统中,服务发现是一项必不可少的技术。传 统的基于u d d i 和w s d l 相结合的w e bs e r v i c e s 发现机制,在长时间的应用研 究中,已日趋成为一种成熟的标准,但随着技术需求的不断提高,它也暴露了 很多不足。该机制仅能就一些简单的服务信息( 如服务名称、索引号等) 进行 单个服务的搜索,缺乏网络服务应有的智能性。在增强智能性方面,有人提出 了语义w e b ( s e m a n t i cw e b ) 的思想,它以一种易被机器识别的语义方式来定 义服务,从而实现服务发现的智能化。其中较为成熟的语义匹配机制,方便了 单个服务的发现,但对于复杂服务的搜索集成,缺乏一种标准的算法依据,实 现较为困难。在此情况下,本文针对网络教育这一应用环境的特点,在u d d i 和w s d l 技术的基础上,通过个性化的服务发现来改善服务发现的过程,提高 网络服务的智能性,并满足网络教育的特定需求。通常的w e b 搜索所依据的服 务属性相当有限,在网络教育中,一些个性化的服务属性( 如访问者身份控制 信息、教学资源存储信息等) 可能为优化服务的发现算法带来契机。此外,个 性化的教育一直被网络教育视为发展的目标,在这方面,很多人做了尝试,但 更多的是就某个具体的服务( 如网上考试系统等) 进行个性化的设计。在网络 教育中,如何就具体用户的个性特点,对用户所需的服务流程进行协调和调用, 以简化服务集成的处理过程并更好地服务用户,这样的问题有待我们做更深入 的研究。 1 2 研究现状 目前,传统的w e bs e r i v c e s 技术已具有了一些较为成熟的服务描述和发现 标准,而新兴的智能w e bs e r v i c e s ,也在不断的改进完善中逐渐形成了一些具 有代表性的技术和标准。并且在网络教育的个性化研究方面,也有很多人提出 并实现了某些值得借鉴的想法。 2 东南大学项士学位论文 1 2 1w e bs e r v i c e s 描述技术的发展现状 目前w e b 领域比较成熟的语言主要有w s d l t 2 j 、d a m l s 【3 】以及最近提出的 o w l _ s e 4 1 w s d l :是基于x m l 的w 如服务描述语言,由a r i b a 、i n t e l 、m m 和微软 等开发商提出。一个w s d l 描述包含对一组操作和消息的一个抽象定义, 绑定到这些操作和消息的一个具体协议和这个绑定的一个网络端点规范。 w s d l 通过s o a p 封装来传递请求消息,可与u d d i 、w s i n s p e c t i o n 结合 构成多样化的资源发现机制。w s d l 作为一个工业标准,面向服务等高层资 源的描述,其技术成熟,应用广泛,可扩展性很好。目前基于此标准的改进 性研究主要是在针对特定领域或新问题所作的进一步扩展以及行业规范的 研究。但在描述智能语义w e b 方面,w s d l 存在着不足。例如,它并未对 服务的p r e c o n d i t i o n 、p o s t c o n d i t i o n 进行描述,不支持输入、输出参数逻辑约 束的定义,从而影响了服务的调用。 d a m l 产s 幻w l - s :在已经发布的智能w e b 服务语言中,d a m l s 语言得到 众多研究者的认可。它是一种由多家研究机构共同创建的用于描述智能w 曲 服务的d a m l + o i l 本体语言,弥补w s d l 在语义描述方面的不足。在 d a m l s 的官方网站是这样描述d a m l s 的:“d a m l s 为w e b 服务供应 商提供了一套核心的标记语言集,使之可以以一种明确的、计算机能够解释 执行的方式来描述w e b 服务的属性和功能。”它主要包括三方面的内容:l 、 服务能提供哪些功能,满足什么需求;2 、服务如何工作;3 、服务如何使用。 w 3 c 于2 0 0 3 年1 1 月决定,为了强调所采用的本体语言从d a m l 过渡到了 o w l ,d a m l s 从1 0 版开始统一称为o w l s 。作为d a m l s 的继承, o w l ,s 沿袭了d a m l s 强大的语义功能,并在某些方面( 如p r o c e s s 类的 处理上) 做了改进。 比较上述几种服务描述语言,d a m l s 的语义描述功能为智能搜索带来契 机。但作为一种新兴的标准,有些相关技术和算法还不成熟,实现起来较为复 杂。而w s d l 技术相对比较成熟,其与u d d i 结合所构成的服务搜索工具,现 已被广泛使用,因此本文选择w s d l 作为服务描述的语言。 1 2 2w e bs e r v i c e s 发现机制的发展现状 目前基于w e bs e r v i c e s 的发现机制主要采用的是u d d i 5 1 技术。 网络教育中w e b s e r v i c e s 的个性化发现机制的研究与实现 图1 2i j d d i 工作原理 u d d i :w e bs e r v i c e s 通过一系列围绕x m l 的核心技术构建了一套相当成熟 的面向高层应用的服务描述和发现的解决方案。u d d i 构建于网络传输层和 基于s o a p 的x m l 消息传输层之上,服务描述语言提供了统一的订l 词汇供描述w e b 服务及其接口使用。它基于三种角色( 服务提供者、服务注 册表、服务消费者) 之间的交互( 如图1 2 所示) ,交互包含的行为有发布 ( p u b l i s h ) 、查找( s e a r c h ) 、绑定( b i n d ) 、服务( s e r v i c e ) 以及服务描述( s e r v i c e d e s c r i p t i o n ) 等。作为一种成熟的服务发现机制,u d d i 与w s d l 相结合,不 失为一种好的选择。 1 2 3 网络教育个性化的发展现状 个性化的教育模式是现代网络教育标准中不可忽视的一点,系统可以根据 用户的个人情况( 如喜好、能力等) “量体裁衣”进行适应性培训,使之具有“个 性色彩”。在这方面,很多人做了尝试,但由于个性化并没有一个公认的标准, 所以在实现的个性化程度上参差不齐。在综合应用系统的构建方面,邢东山等 学者提出了一个个性化网络教育的框架 6 1 ,其主旨在于通过学生浏览路径的采 集,利用数据挖掘的方法,来组织个性化的链接过程,但该文只限于文字性的 思想描述,并未就具体问题的解决展开详细的讨论。在单个应用系统的创新方 面,c h e nc h i h m i n g 等学者介绍了一种个性化的课件介绍系统1 7 j ,提出了一种 f u z z yi t e mr e s p o n s e 理论,它根据学生提供的对己学课件的理解程度来推荐一些 适合该学生的教学课件,以增强学生学习的效率。同时,l uj i e 通过多属性评 估算法和失真匹配算法,实现了一种个性化的材料介绍系统【引。此外,c r i s t e a v a l e n f i n 等学者提出了一种基于w e bs e r v i c e s 的高效的学习培训系统的框架1 9 1 , 通过受训者的经历、技能、身份等信息来实现服务的个性化。在总结了这些文 4 东南大学硕士学位论文 章的思想后,不难发现,在网络教育中,学生的特征分析是实现个性化的重点 也是难点,但数据挖掘技术己然成为个性化算法的首选。其中,研究人员已对 此提出了自己的看法,如刘均等学者提出了利用属性归并、关联规则分析和模 式推理的方法来获取学生的个性特征l l o l ,学者邓晖提出了数据挖掘技术支持下 的学生特征分析系统的结构【l ”,但该文的内容过多地停留在理论概述方面。这 些文献都在某些领域根据作者对个性化的理解实现了一种理想化的教育模式, 这有助于我们进一步地加深对个性化的理解,使我们在综合他人思想的基础上, 提出一种新的个性化的理解和实现算法。 1 2 4 网络教育下个性化的挖掘算法 在对学生个性的分析中,系统需要从大量的个性信息中提取出规律,而这 些规则的提取通常利用数据挖掘的算法来实现。 关联规则算法- - a p r i o r i 算法简介1 1 7 1 a p r i o r i 算法是发现关联规则领域的经典算法。该算法将发现关联规则的过 程分为两个步骤:第一步通过迭代,检索出事务数据库中的所有频繁项集,即 支持度不低于用户设定的阙值的项集;第二步利用频繁项集构造出满足用户最 小信任度的规则。具体做法就是:首先找出频繁1 项集,记为厶;然后利用厶 来产生候选项集c 2 ,对c 2 中的项进行判定,挖掘出三2 ,即频繁2 项集:不断 如此循环下去直到无法发现更多的频繁k 项集为止。每挖掘一层厶就需要扫描 整个数据库一遍。 此后,许多研究人员对原有的算法进行优化,如引入随机采样、并行的思 想等,以提高算法挖掘规则的效率;提出各种变体,如泛化的关联规则,对关 联规则的应用进行推广。 聚类算法简介1 1 7 l 大体上,主要的聚类算法可以划分为如下几类: 划分方法:给定一个n 个对象或元组的数据库,一个划分方法构建数据的k 个划分,每个划分表示一个聚簇,并且k 根据学习者的个人信息对学习者进行分类,将个性相似的学习者归为一 类,并发掘同种类型的学习者中行为的共性,以进行服务推荐; 发现学习者调用服务时的序列关系,找出“一些项跟随另一个项”这样 的内部事务模式,从丽根据该学习者以前的调用情况,预测出下一步他 可能调用的服务; 若学习者不接受系统所提出的推荐,他可以通过提交具体的需求来获得 服务; 当明确了所要调用的服务后,系统将根据学习者的具体情况对调用服务 的参数进行赋值推荐。 其中,提取服务在调用过程中的相关性和序列关系,以及对学习者的分类, 是通过分析学习者的个人信息及其历史行为来实现的,系统将利用数据挖掘的 方法来完成分析的过程。 1 9 网络教育中w e b s e r v i c es 的个性化发现机剁的研究与实现 3 2 网络教育个性化服务搜索系统的框架 图3 1 显示了网络教育下的w e bs e r v i c e s 搜索系统的基本框架。当用户由 网络教育的门户单点登录进入到应用系统后,可以使用服务搜索系统,来寻找 自己所需要的服务。这里所提供的搜索系统主要是面向学习者( 学生或者知识工 作者) ,它由服务搜索引擎、u d d i u d d i e ( u d d i 的功能扩展) 及资源记录库 构成。当学习者进入到搜索系统后,搜索引擎会根据该学习者的个性信息、本 次访问已调用的服务以及过去访问所发生的行为规律,预测他下一个需要调用 的服务及服务接口,并据此提供服务推荐。若该学习者没有接受推荐,那他必 须提交服务需求,通过u d d i u d d i e 搜索到相应的服务。在确定了所要调用的 服务后,搜索引擎将对服务接口的输入参数进行个性化的赋值和推荐( 如所要 调用的资源等) ,当学习者做完选择,服务会被自动地激发执行。服务执行完后, 系统将结果返回给学习者。 图3 1 个性化服务搜索系统的基本框架 在该系统中,服务搜索引擎的构造及其功能是系统实现的重点。它针对每 个学习者的个性特点,为其提供适合其自身需求的服务推荐,体现了网络教育 个性化的工作方式。同时,利用行为推导及预测的结果,进一步明确了学习者 的需求,提高了服务发现的效率。它的工作原理将在下一节做详细介绍。 塑 一入次一 迸二 东南大学硕士学位论文 3 3 服务搜索引擎的构造及功能 如图3 2 所示,服务搜索引擎主要由中心处理器、用户信息库、日志库、规 贝o 提取器、规则库、服务记录库以及服务缓存器构成。 用户 3 3 1 用户信息库 服务记录库 图3 2 服务搜索引擎的构造 i 资源记录库i 1 k 一 用户信息库用于存放学习者的个人信息,这些信息主要依据第二章所设计 的学习者模型来确定。该库中的大部分数据可为实现个性化的搜索提供实际依 据。其主要包括学习者的年龄、性别、语言能力、性格( 个人信息) 、专业、年 级、学习计划、学习完成情况( 学习信息) 、奖励、惩罚( 管理信息) 、设备偏 好、兴趣( 偏好信息) 、学习对象元数据引用、绩效信息引用( 绩效信息) 。其 中,个人信息和偏好信息主要由学习者本人填写或修改,学习信息和管理信息 主要由教务管理员负责,绩效信息由教师负责。举例说明,当教师给学生批改 作业,调用完该服务后,系统将根据服务返回的结果( 如作业成绩) 更新用户 信息库。由于本系统面向的对象主要是学习者,因此,有关教务管理员和教师 的功能实现将暂不作考虑。此外,信息库中还包含学习者的服务访问记录( 包 2 1 9 9 网络教育中w e bs e r v i c e s 的个性化发现机制的研究与实现 括登录时间、访问的服务名称、调用的服务接口以及访问服务时调用的资源信 息) 。当学习者退出网络教育系统后,这些信息将依据日志库的数据做实时更新。 3 3 2 日志库 臼志库用于记录学习者在网络教育系统中访问服务的流程。中心处理器将 学习者访问过程中捕捉到的信息传递给该记录库,所记录的数据包括被访问服 务的名称、学习者访问服务的时间、被调用的服务接口以及所调用的资源信息。 数据以x m l 的形式存储在库中( 如图3 3 ) 。当学习者退出网络教育系统后, 中心处理器将依据日志库中的数据通过接口自动更新用户信息库。更新完毕后, 该学习者在日志库中的数据将全部删除,以节省存储空间。 3 3 3 服务缓存器 图3 3 用户日志举例 东南大学硕士学位论文 服务缓存器用于保存在线学习者当前所访问的服务的全部信息以及该服务 中学习者已调用的接口所返回的参数名称及其数值。当学习者访问某服务时, 中心处理器把所获取的服务信息存放在该缓存器中。当其中的某个接口调用完 毕后,中心处理器将捕获服务端返回的参数,并保存至缓存器中。因为在同一 个服务中不同的接口之间有着若干关联,某些接口返回的参数可能就是其他接 口调用时所需的参数。保存所有返回的参数及其数值,一方面有利于后续接口 函数的调用,另一方面可通过参数这一纽带预测下一次学习者可能调用的服务 接口。当学习者连续调用同一个服务中的不同接口时,服务缓存器中存放的临 时数据将在服务推荐时发挥重要的作用。若一旦该学习者要访问其他服务,那 么前一个服务在库中保存的所有信息以及参数记录将被全部删除。 3 3 4 规则提取器 规则提取器用于分析和总结所有学习者访问服务的规则。这里的规则挖掘 来自于对学习者个性特征与学习行为模式的分析。根据服务推荐的需求,挖掘 工作主要分为三个部分:个性关联规则的提取、聚类规则的提取以及个人序列 模式的提取( 具体工作将在第四部分说明) 。提取的规则将以x m l 的形式存储 于规则库中。 3 3 5 规则库 规则库用于存放由规则提取器挖掘的学习者个性化规则。这些规则均以 儿的形式存储在库中。依据规则提取器工作的分类,规则库中的信息主要分 三部分存放:个性关联规则( 例如图3 4 ) 、聚类规则( 例如图3 5 ) 、个人序列 模式( 例如图3 6 ) 。每条规则后都附带该规则使用率的说明,其中,规则使用 率= 规则被使用的次数规则被推荐的次数。系统设置了使用率的最低阀值 m i nu s a g e 。在个性关联规则部分,若使用率低于m i n 的规则超过一定数usage 量,则必须通知规则提取器重新进行这部分的规则提取;在聚类规则部分,若 某类中有一定数量的规则使用率低于r a i nu s a g e ,则必须通知规则提取器重新对 该类学习者的行为进行规则提取,若需要重新提取规则的类过多,则必须重新 聚类;在个人序列模式中,若某人有一定数量的序列模式使用率低于m i l l ,_usage 则必须重新对他的行为进行分析。 网络教育中w e b s e r v i c es 的个性化发现机制的研究与实现 图3 4 规则i i 厶 墨s 2 的图3 5 规则5 3 s js l 的矶 ) 眦描述描述 图3 6 序列模式( 1 5 2 ,谘”i s ,嚣s ) 的) 。描述 3 3 6 服务记录库 东南大学硕士学位论文 服务记录库主要用于保存系统中所有被访问过的服务,它记录了服务的名 称、其u d d i 的键值,同时还包含服务在s o a p 调用所需的信息,如服务的访 问入口,服务所有接口的名称及接口的参数名称与类型等。如此,当明确某位 学习者要访问该库中的某服务时,系统可直接从数据库中读取服务信息,而无 需以s a p 的形式从u d d i 中获取,以提高系统工作的效率。此外,服务记录 库为其中的所有服务提供系统内的i d 号,方便系统内的服务搜索。当有学习者 从u d d i 中获取新服务时,系统需将其添加至记录库内。 3 4 中心处理器的工作原理 中心处理器是服务搜索系统的控制中心,负责分析各方面的数据以进行服 务推荐,并且作为学习者用户和服务提供商的中间节点,它为两者构建了通讯 的桥梁。其主要工作由服务日志的采集和个性化的推荐部分组成。 在日志采集的过程中,中心处理器用固定的端口实时发送和接收s o a p 消 息。当学习者发出调用某服务接口的请求后,中心处理器将请求以s o a p 消息 的形式发送给服务提供商,并将该行为记录在日志库中。当端口接收到服务提 供商返回的s o a p 消息时,标志着这次服务调用的结束,返回的结果和此刻的 时间也将记录在日志库中。当学习者退出网络教育系统后,中心处理器将依据 日志库中的数掘通过接口自动更新用户信息库。 个性化的服务推荐是整个系统工作的重点。当学习者进入到搜索系统后, 搜索引擎必须先就学习者的个性特点及其已有的行为模式对他目前可能想要的 服务进行预测和推荐,由此来提高搜索系统的工作效率。 图3 7 显示了个性化搜索引擎工作的整个流程。下面就图中标注的工作环 节做简要的介绍: 个性关联规则的匹配:在个性关联规则集中寻找到所有前件中只包含该学 习者的个性模式及本次行为模式的规则,并推荐其后件所代表的服务( 在规则 a a b 等c a d 中,一和b 为规则的前件,c 与d 为规则的后件) 。 聚类规则的匹配:在学习者所属类别的聚类规则集中寻找到所有前件中只 包含该学习者本次行为模式的规则,并推荐其后件所代表的服务。 个人序列模式的匹配:在该学习者的个人序列模式集中寻找到所有子序列 集中包含该学习者本次彳亍为序列的序列模式,并推荐序列模式中学习者上一个 调用接口的后序接口。 网络教育中w e bs e r v i c es 的个性化发现机常j 的研究与实现 1 。关若 f 选择敷务接口lf 一 t 一陋辜型 l击 i ! ! 至望竺1 墨竖竺)i ! ! 兰翌竺1 茎垩竺j 毒 莲萝 (一 # 一旦蕉) ( = 枣里毒 一一蒜脊百函第一节 影 爹 i l 呷 障位于最近使用的部分 定位于罪j 丘使用部分韵 下一节 一l 一 “r 一9 主 图3 7 搜索引擎的工作流程 东南大学硕士学位论文 服务参数的匹配:在学习者当前访问的服务中,其所有已被调用的接口所 返回的参数均被保存在服务缓存器中。对于其中未使用的参数,若该服务中有 接口的输入参数与其名称相匹配,则匹配成功的服务接口将被推荐。 服务接口的选择:若选择个人序列模式匹配与服务参数匹配后推荐的结果, 那么所要调用的服务接口已经确定;若选择个性关联规则匹配和聚类规则匹配 后推荐的结果,则必须从选中的服务中确定所要调用的接口函数;若学习者未 接受任何推荐,则必须根据他输入的关键词从u d d i u d d i e 中搜索服务,学习 者将从搜索的结果中确定所要访问的服务及其接口。 非资源参数匹配1 :若选择个人序列模式匹配与服务参数匹配后推荐的结 果,可以根据用户信息库中的信息( 对于本系统中所有的服务提供商,在进行 服务描述时,对于个人信息参数名称的表示必须有统一的规范) 及服务缓存器 中未使用的参数进行输入参数的赋值推荐。 非资源参数匹配2 :若选择个性关联规则匹配和聚类规则匹配后推荐的结 果,可以根据用户信息库中的信息,进行输入参数的赋值推荐。 资源参数的匹配:在资源记录库中寻找到选中服务所对应的m a n i f e s t 文件, 对于非资源参数匹配过程中未有给赋值推荐的输入参数,系统将其名称与 m a n i f e s t 文件中元素m a n i f e s t 的i d e n t i f i e r 属性值进行匹配( 本系统规定,服务 接口中资源参数的赋值范围必须与m a n i f e s t 文件中该资源的结构描述相对应) 。 若匹配失败,说明将要调用的接口不需要资源,学习者完成所有输入参数赋值 后,即可发出调用请求。若匹配成功,在有多种匹配结果的情况下首先要让学 习者做出选择,而后通过查询用户信息库判断学习者是否使用过该资源。若未 使用过,则将内容项的赋值推荐为第一节,若使用过,则看最近次使用的内 容项s 是否有成绩,如果有成绩且成绩通过( 百分制度以大于等于6 0 为合格, 五分制以大于等于3 分为合格,等级制以高于等于“及格”为合格) ,则将内容 项的赋值推荐为s 的下一节,如果没有成绩或成绩未通过,则内容项赋值推荐 为s 。对于资源内容项的参数赋值,可以以下拉框的形式供学习者作出选择, 其中推荐的项即下拉框的缺省值。当学习者完成所有输入参数赋值后,发出调 用请求。 3 5 u d d i u d d i e u d d i 作为一种成熟的技术,被广泛的应用于服务搜索系统中,但也同时 暴露了很多功能上的不足,描述范围的局限和语义信息的缺乏,限制了它的使 用空间。这里,u d d i e 便是对它功能进行扩展的尝试,一方面使系统可以支持 针对服务扩展属性的搜索,以便优化网络教育领域服务的搜索,另一方面引入 网络教育中w e bs e r v i c es 的个性化发现机制的研究与实现 了语义信息,为将来的智能搜索打下基础。 3 5 1 服务搜索属性的扩展i “l u d d i e 在b u s i n e s s s e r v i e e s 结构中添加了实体p r o p e r t y b a g ,其中包含服务 的某些性质( p r o p e r t y ) ,如服务的q o s 参数、服务可以提供的接口等。每个 p r o p e r t y 用三个属性来描述一p r o p e r t y n a m e 、p r o p e r t y t y p e 、p r o p e r t y v a l u e 。针 对u d d i e 新增的信息,需扩展u d d i 的a p i 接口,如在接口s a v e f m ds e r v i c e g e ts e r v i e e d e t a i l 中添加对服务p r o p e r t y 的操作。 在使用u d d i e 时,用户必须定义服务的属性。如图3 8 所示,服务m a t h s 在u d d i e 中注册的过程中,相关属性也被一一列举,这些p r o p e r t y 将被存储在 p r o p e r t y b a g 中。图3 9 中的代码显示了如何根据p r o p e r t y 查询已注册的服务。 3 d d l e p r o x yp r o x y = n e wu d d l e p r o x y 0 ; | r o x y s e t l n q u i r y u r l ( ”h t t p :i o c a l h o s t :8 0 8 0 u d d i e i n q u i r y “) : r o x y s e t p u b l i s h u r l ( ”h u p :l o c a l h o s t :8 0 8 0 u d d i e p u b h s h “1 : 舱e t a u t h o r i z a t i o nb ys e n d i n g a n s e r u a n l e a n d p a s s w o r d f o r t h e o w n 群o f t h e b u s i i g u t h t o k a nt o k e n = p r o x yg e l _ a u t h t o k e n ( ”a l i ”,a 1 1 ) ; d e f i n es e r v i c e n a m ea n da d d t h e r n t o a r e e l e r t h e m a x i m u m a l l o w e d n a n l 6 3 i s 5 q a m e n a m e = n 州n a m e ( “m a t h s ”) ; c o t t e r i l a m e s = n e w v e c t o r 0 ; l a m e sa d d ( n a m e ) ; | d e f i n es e r v i c ep m p e r t i c s r o p e r t yp r o p e r t y = ! f l e wp r o p e r t y ( ”c p u ”,”n u m b e r ”,”5 0 ”) ; r o p e r t ys c t p m p e 哪f i n d q u a h f e r ( p r o p e r t y f m d q u a l i f i e r sg

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论