(模式识别与智能系统专业论文)基于网格环境的文档数据管理系统研究与实现.pdf_第1页
(模式识别与智能系统专业论文)基于网格环境的文档数据管理系统研究与实现.pdf_第2页
(模式识别与智能系统专业论文)基于网格环境的文档数据管理系统研究与实现.pdf_第3页
(模式识别与智能系统专业论文)基于网格环境的文档数据管理系统研究与实现.pdf_第4页
(模式识别与智能系统专业论文)基于网格环境的文档数据管理系统研究与实现.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(模式识别与智能系统专业论文)基于网格环境的文档数据管理系统研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 网格是新一代的网络基础设施,它的目标是把地理上分布的、异构的资源 通过高速网络连接起来,共同完成计算任务,以及实现广域范围内的资源共享。 网格用户可以方便、快捷、便宜地获得所需的资源。最新的网格技术将计算网 格和面向商业应用的w 曲服务结合起来,在商业应用前景不可忽视。如何将网 格技术更好地服务于企业是目前研究的热点。 数据是网格中的一类重要资源。网格中的数据的查询与传输是一个使用频 繁的功能。网格数据管理模块需要屏蔽底层数据源差异,为用户提供统一访问 接口,并且还要保证访问的可靠性和安全性。 论文首先对网格的概念,特点和国内外研究现状作了简要介绍,然后对目 前最主要的两种网格体系结构:五层沙漏结构和开放网格服务体系结构 ( o g s a ) 进行了描述和分析,还对重点对o g s a 体系下两种网格基础设施规 范:网格服务基础架构( o g s i ) 和w e b 服务资源框架( w s r f ) ,进行了详细 的研究与比较。接着分析了网格环境下数据管理的特点与优势。最后提出了网 格环境下的文档数据管理系统模型,并且在遵照w s r f 规范的g t 4 网格环境中 对系统进行了初步实现,取得了良好效果。 关键词:网格,网格计算,o g s a ,w s r f ,g t 4 ,文档数据管理 第- i 页 东南大学硕士学位论文 a b s t r a c t g r i dc o m p u t i n gi st h en e x tg e n e r a t i o nn c t w o r ki n 矗a s 劬l c t i l r e g r i dc o m p u t i n g a i l n sa tc o i 珊t i n ga ut h ec o m p u t h gr e s o u r c e st h a t 缸ed i 岱口e n ti ns 弧l c n e 蛆d d i s m b u t e di nm a n yp l a c e sb yh i g hs p e e dn e t w o r k st oc o m p l e t et h ec o m p u t i n g a s s i g n m e n ta n ds h a r cr e s o l l r c e s 眦o n gw i d ea r e a 僦du s e r sc a ng e tr e s o l l r c e sw h i c h t h e yn e e dt 1 1 r o u g hr a p i d ,c o n v e n i e n ta n di n e x p e n s i v ea p p r o a c h e s t h ea d v a n c e dg r i d t e c h n i q u ei n t e 盯a t et l l eg r i dc o m p u t i n ga n dt h ew r e bs e r v i c e sw h i c hi sb u s i n e s s a p p h c a t i o n s 耐e n t e d i ti sp r o m i s i i l gi nb u s i n e s sa p p l i c 撕o n s a c c o r d i n 出y i ti sa h o t s p o to ff c c e n tg r i dr e s e a r c hh o wt om a k eg r i dt e c h n i q u eb e n e f i te n t e r p r i s e s 一 一 b e t t e r d a t ai sai m p o r t a n tl ( i n do fr e s o u r c ei ng r i d d a t aq u 盯ya n d 仕a n s f e rf u n c d o n s 缸e u s e dv e f y 行e q u e n yi nt h eg d da p p l i c a t i o n s 0 r i dd a t am 姐a g e m e n tm o d u ks h o u l d h i d et 1 1 eh e t e r o g e n e i t yo fd a t ar e s o l l r c e s ,p r o v i d eu n i f 0 皿a c c e s si n t e r f a c e s ,a n dm a k e s u r eo ft h er e l i a b i l i y a n ds e c u r i t yo fd a t aa c c e s s f i r s t l y t h eb a s i cc o n c e p t sa n ds i t i l a t i o n sa th o m ea 1 1 da b r o a do f 嘶da r e i n t r o d u c e d s e c o n d l yt w ok i n d so fg r i da r c h i t e c t e :f i v e - l e v e ls a n d g l a s sa r c h i t e c t l l r e a n do p e n 盯i ds e r v i c ea r c h i t e c t i l r eo g s aa r es t u d i e da i l d 姐a l y z e d t h et w o0 g s a i n f r a s 订u c t i l r ec r i t e r i o n s 眦a l s od e t a i l e da n a l y z e da n dc o m p a r e de a c ho t h e r t h e n ,t h e a d v a n t a g e sa n df c a t e so fd a t am a n a g e m e n tb a do n 丽d a f ee x p l a i n e d f i n a l l y a m o d e lo fd o c u m e n tm a n a g e m e n ts y s t e mi sp r o p o s e d b a s e do ng 1 0 b u st 0 0 1 k i t4 ,w e i m p l e m e n tap r o t o t y p eo ft l l em o d e l k e y w o r d s :g r i d ,g r i dc o m p u 血g ,o g s a ,w s r f ,g l o b u st o o 瞄t ,d o c 眦e n t s m a i l a g e m e n t 第- 页 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育 机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名:纶扭日期:里:垒:2 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学 位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。 本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外, 允许论文被查阅和借阅,可以公布( 包括刊登) 论文的全部或部分内容。论文 的公布( 包括刊登) 授权东南大学研究生院办理。 研究生签名:给衄 导师签名:妒日辍生监。 第1 章绪论 第一章绪论 随着信息技术的飞速发展,使网络技术逐渐成熟并得到广泛使用,给人类 的生产和生活带来了巨大的变革。然而,依靠网络解决的问题正变的越来越复 杂,规模也越来越大,需要有新的网络体系支撑这些应用的实现。 网格计算是近年来迅速兴起的一个新的研究领域,它的出现掀起了新网络 技术的浪潮。它的目标是通过互联网将分布在各地的不同类型的计算机“粘合” 起来,形成高度集成的有机整体,向普通用户提供功能强大,无处不在的资源 与计算服务。 本课题的研究目的在于通过介绍网格的概念、特征及其它相关知识,研究 和分析当前流行的网格体系结构以及网格支撑平台g l o b u s ,并重点研究和探讨 了在开放网格服务体系结构下,遵照w 曲服务资源框架规范,基于g 1 0 b u s t o o l k i t4 网格系统软件,网格数据管理应用的关键技术,并实现了一个基于网 格环境的文档数据管理系统的原型。 1 1 网格的产生 计算机应用已越来越深入各类科学研究以及社会与经济活动,有力的推动 着人类社会的前进。通过提供的科学计算服务和事务处理中的非数值计算,计 算机取得许多重要成果,为人们的生产生活带来极大的便利。“计算”已经成为 一种重要的甚至不可替代的解决问题的方法与工具0 1 。计算在问题求解中的重 要地位,为网格基础设施的出现奠定了基础。 随着人们求解问题的领域不断扩展,解决这些问题的所需要的计算能力也 在大幅度高。众多的科学和工程应用计算都需要处理大量的数据,可达1 0 ”b 至1 0 “b 数量级。像天文学研究,基因组研究,气候模型的计算,飞机模型的 计算等领域问题的求解一般都需要访问和存储大量数据。在这些问题的求解过 程中,局部的计算、存储资源是无法满足这样的需求的,因此必须使用广大的 分布资源,将它们集中起来协同解决问题。网格正是在这种背景下产生的,它 的目标是将地理上分布、异构的各种高性能计算机、数据服务器、大型检索存 储系统和可视化系统等,通过高速互联网络连接并集成起来,共同满足一些高 性能计算的应用需求。网格这种以更大范围的资源共享为目的的网络基础设施 的出现具有它的必然性。 1 2 网格定义 在计算机的实际使用中:一方面,有大量的计算、存储资源处于空闲状态, 没有被有效利用;另一方面,又有不少应用问题由于没有足够的计算、存储资 源可供使用而无法求解。随着i i l t c m e t 和w e b 技术的成熟和推广使用,人们产 第1 页 东南大学硕士学位论文 生了把h t e 吼e t 上资源集成起来使用的想法,想利用已有的h t e r n e t 设施建立一 种新的基础设施,把世界上的各种计算资源集成在一起,为世界范围的用户提 供使用这些资源的良好接口,这种新的基础设施就是网格。 对于网格目前还没有一个被普遍接受的定义,著名的网格研究专家,g l o b u s 项目的领导人i a i lf o s t e r 曾在网格:一种未来计算基础设施蓝图一书中这样描 述网格 2 】:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能 计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓 提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等 通信功能,而网格功能则更多更强,让人们透明地使用计算、存储等其他资源。” 2 0 0 1 年,i a nf o s t c r 在网格的剖析这篇论文中把网格进一步描述为圆“在动态 变化的多个虚拟组织间共享资源和协同解决问题。”i a i lf o s t e r 后来又限定网格 必须同时满足三个条件【4 】:( 1 ) 在非集中控制的环境中协同使用资源;( 2 ) 使用标 准的、开放的和通用的协议和接口( f o s t c r 认为目前只有g l o b u s 才算得上标准协 议) ;( 3 ) 提供非平凡的服务。这三个条件非常严格,像p 2 p 、m u l t i c l u s t e r 等都 被排除在网格之外。此外,还有许多研究人员从另外的角度提出了网格的定义。 这一方面说明网格处还在发展阶段,另一方面,也说明了人们对网格研究的热烈 程度。 可以简单地讲,网格就是利用互联网络把分散在不同地理位置的计算机组 织成一台“虚拟的超级计算机”,在这个平台上对来自用户的请求选择合适的资 源服务,实现计算资源、存储资源、数据资源、信息资源、设备资源等的全面 共享。网格打破了传统共享与协作方面的限制,实现了全社会范围的资源共享 与服务协作。 网格借鉴了电力网的概念,它的最终目的就是希望用户在使用网格资源时, 就如同现在使用电力一样方便。我们在使用电力时,不需要知道它是从哪个地 点的发电站输送出来的,也不需要知道该电力是通过什么样的发电机产生的, 不管是水利发电还是通过核反应发电,我们使用的是统一形式的电能。网格也 希望给最终的使用者提供的是与地理位置无关、与具体的计算设施无关的通用 的网格资源。 基于网格的问题求解就是网格计算。狭义的网格计算是指将分布的计算机 组织起来协同解决复杂的科学与工程计算问题。狭义的网格一般指计算网格, 即主要用于解决科学与工程计算问题的网格。此外人们还提出了多种其它的网 格类型,如以数据密集型问题的处理为核心的数据网格,以解决科学问题为核 心的科学网格,以及地震网格,军事网格等行业网格。 1 3 网格的特点 网格作为一种新出现的重要的基础性设施,和其它的系统相比,有着不少 重要的特点。主要又以下几个方面的特点: 分布与共享 分布性是指网格的资源是分布在地理位置互不相同的地方,而不是集中在 一起,它决定了基于网格的计算一定是分布式计算而不是集中式计算。共享是 指网格上的任何资源都可以提供给任何使用者。共享是网格的目的,解决分布 资源的共享问题是网格的核心内容。 自相似性 第2 页 第1 章绪论 网格的自相似性是指网格的局部和整体之间存在一定的相似性,局部往往 在许多地方具有全局的某些特征,而全局的特征在局部也有一定的体现。 动态性 网格的动态性包括动态增加和动态减少。具体是指原来拥有的资源可能就 会出现故障或者不可用的情况:而原来没有的资源可能随着时间的推移会不断 加入进来。这决定了网格一定要具有很高的可扩展性和自适应性。 多样性 是指网格资源是异构和多样的,即在网格环境中可以有不同体系结构的计 算机系统和类别不同的资源,因此网格系统必须要能够解决这些不同结构、不 同类别资源之间的通信和互操作问题。 自治性与管理的多重性 网格上的资源首先是属于某一个组织或者个人的,因此网格资源的拥有者 对该资源具有最高级别的管理权限和自主的管理能力,这就是网格的自治性。 管理的多重性是指资源不仅可以被拥有者自主管理网格,也必须接受网格的统 一管理,才能实现共享和互操作。 1 4 研究现状 网格一词最早出现在2 0 世纪9 0 年代中期,而网格计算的概念在1 9 9 5 年的 i - w a y 【5 】项目中被提出。网格发展可分为三个个主要阶段: 萌芽阶段:开始2 0 世纪9 0 年代早期,主要是千兆网的测试床,以及一 些元计算方面的实验。 早期实验阶段:发生在2 0 世纪9 0 年代中期到晚期,出现了一些比较重 要的开创性和奠基性的研究项目,比如i - w a y ,g l o b u s 嘲等。 迅速发展阶段:从2 0 0 2 年到目前,关于网格得研究、开发和应用项目 大量涌现,出现了影响很大的全球网格论坛( g g f ,g l o b u sg r i df o r 眦) 口】, 工业界( 如m m ,m i c r o s o f t 。s u n 等重要公司) 和学术界开展了广泛联盟,致力 于网格计算在更广泛领域的推广和应用。 1 4 1 国外网格研究现状 国外网格的研究和发展主要体现在美国、欧洲以及日本等国家。据美国福 布斯杂志预测:网格技术将推动信息产业市场的持续高速发展,在2 0 2 0 年产 生一个年产值为2 0 万亿美元的大产业。 美国是目前网格研究走在前列的国家。美国的多家大学与研究机构开展了 网格相关的研究工作,开发了g 1 0 b u s ,c o n d o f ,l e g i o n 等比较有影响的网格软 件和工具。 美国政府每年对网格投入的经费就高达5 亿美元。美国军方正规划实施一 个宏大的网格计划,叫做“全球信息网格”,预计在2 0 2 0 年完成。作为这个计 划的一部分,美国海军和海军陆战队启动了一个耗资1 6 0 亿美元、历时8 年的 项目,包括系统的研制、建设、维护和升级。 美国能源部下属的a r g o 皿e 、橡树岭等国家实验室的超级计算机和存储资 源都将与网格相连。国家能源研究科学计算中心人士指出,把分布于这些国家 第3 页 东南大学硕士学位论文 实验室中的巨大信息资源进行有效整合,将对基因组和天体物理等研究起到推 动作用。 不单美国政府对网格作了巨大投资,公司也不甘示弱。i i l m 、微软、s u n 、 o r a c l e 等公司纷纷加入网格研究的大军中。m m 在2 0 0 1 年8 月宣布,将投 入4 0 多亿美元进行“网格计算创新计划”,全面支持网格计算。2 0 0 4 年初,0 r a c l c 推出最新版本o r 跹k1 0 g 和应用服务器o r a c l ca p p l i c a d o ns e r v e rl o g 全面支持 网格技术,促进网格在商业领域的推进。从企业来讲,美国g m 公司建设了自 己的企业网格,是运行得最好的企业网格。它将该公司分布在世界各地的设计 制造部门、营销部门都连入网格中,实现了从订单到销售的最快速的全数字化 服务。 美国国家科学基金也于2 0 0 1 年发起一个创新计划,投资1 2 0 0 万美元,构 建和部署先进的网格服务,简化对i n t e m e t 上信息的服务和访问。 英国政府宣布投资1 亿英镑,用于研发= f 英国国家网格”。在英国使用g 1 0 b u s 已建成了许多“微网格”,英国高端计算中心、卢瑟福阿普莱顿实验室、爱丁堡 大学、曼彻斯特大学等有一些活跃的微网格。在欧洲还有d a a g r i d ,u n i c o r e , m o l 等网格研究项目正在开展。其中,d a t a g 柏涉及到欧盟的2 0 几个国家, 是一种典型的“大科学”应用平台。 日本n t t 数据公司联合i i l t c l ,s g i 等,在2 0 0 2 年中期开展了为期6 个月的 网格计算试验。该试验还计划连接日本家庭、企业和学术机构的1 0 0 万台p c , 集合处理能力将达到每秒6 5 万亿次浮点运算。2 0 0 2 年1 1 月,日本产业技术综 合研究所网格计算研究中心宣布,在由多台个人电脑通过网络连接组成网格计 算环境下,实现了日美之间创记录的7 0 7 m b p s 的数据传输。 1 4 2 国内网格研究现状 在我国,网格基础设施建设和网格技术研究工作也在紧张进行,己经完成 的网格研究项目主要有清华大学的先进计算基础设施a c i ( a d v a n c e d c o m p u t a 虹o n a li i i f r a s 昀c t u r e ) 阎和以中科院计算所为主的国家高性能计算环境 n h p c e ( n a t i o n a lh i g hp e r e o m a i l c ec o m p u t i n ge n v i r o i 皿e n t ) 嗍。在清华a c i 系统中,清华大学研制的高性能计算机t h n p s c 一2 与上海大学研制的高性能计 算机“自强2 0 0 0 ”通过高速网络连接在一起,此外还连接了4 个应用结点。这 6 个地理位置不同的网格节点可以同时召开网络会议。除此之外,还开发了相 应的中间件,可以构成跨地区、跨学科的“虚拟实验室研究环境。清华a c i 系 统具有一套健全的资源管理系统、任务管理系统、用户管理系统及安全服务与 监控系统。从1 9 9 9 年底到2 0 0 1 年初,中科院计算所联合十几家科研单位,承 担了8 6 3 重点项目“国家高性能计算环境”的研发任务。该项目的目标是建立 一个分布式环境下支持异构平台的计算网格示范系统,它把我国的8 个高性能 计算中心通过h l t e r n e t 连接起来,进行统一的资源管理、信息管理和用户管理, 并在此基础上开发了多个计算型的网格应用系统,取得了一系列研究成果。 2 0 0 2 年4 月,科技部召开了“网格战略研讨会”,确认将网格的研究和应 用列为“8 6 3 计划”的一个专项,随即成立了专项专家组。8 6 3 网格专项投资高 达3 个亿,主要任务是研制面向网格的万亿次级高性能计算机,具有数万亿次 聚合计算能力的高性能计算环境,开发具有自主知识产权的网格软件,建设科 学研究、经济建设、社会发展和国防建设急需的重要应用网格,制定若干与网 第4 - 页 第1 章绪论 格相关的国家标准,参与制定国际标准,形成自主知识产权。 2 0 0 2 年底,上海市宣布将投入两个多亿建设e h l s t i t i l t e ,其中网格是重点, 将把上海交大、复旦、华东理工等多所重点高校用网格整合起来,共享资源, 协同教学科研。另外,教育部也将对网格研究进行大力支持,希望百所重点高 校拥有千亿次级别的高性能计算机,以提高科研水平。在这个基础上,建设一 个覆盖全国主要高校的网格是水到渠成的事。 目前正在进行的网格研究项目有:8 6 3 计划支持的“中国网格”( c h i n a g m ) 【删建设;上海教育科研网格”( 多所上海的大学参加) ;“仿真网格的研究( 由 航天二院和清华大学共同开展) ;“织女星网格”( 由中科院计算所领衔开发) ; 另外,全国还有几十所大学和研究机构己经开展各种网格研究。 由此可见,目前国内外在网格计算方面的研究十分活跃,研究范围跨度很 大。目前呈现出这样的趋势:一是网格计算标准化的呼声越来越高。目的是为 了规范和统一现在大量的网格计算研究,而g l o b u s 在一定程度上已经成为事实 上的标准;二是专业网格的研究与开发成为一个重要的方向。因为网格是面向 具体问题的应用的,而专用网格在这方面具有独特的优势,可以为通用网格技 术提出最直接最具体的需求;三是开发面向w e b 服务的框架结构,以及与工商 界应用相结合也是网格技术研究的一个重要趋势。原来的网格主要集中在科学 计算等学术领域,而目前正走向应用,并和市场接轨,直接服务于生产和各种 商业活动。 1 5 论文背景和完成的工作 目前很多网络系统是基于不同的分布对象技术开发的,由于传统分布式计 算技术在广域网上的局限性,所以存在两个比较突出的问题:参与者没有使用 统一的标准或体系构架作为彼此服务联系的方法,使得相互间的信息交换和合 作较为困难:缺乏统一的商业发布和发现机制,使得企业之间无法互相发现并 进一步开展有效的合作。网格作为一种新兴的网络基础设施,融合了w e b 服务 技术,提出了新型的体系结构,可以提供在广域网范围内进行的资源共享,摆 脱各类系统在不同体系上的束缚,进而打破异构系统间的界限,建立起广泛的 网络协作关系,满足网络系统对交互性和集成性的要求。本论文的研究工作受 到国家“8 6 3 ”重大- a 类项目“面向电子商务的新型网络服务体系及集成 软件环境”( 编号:2 0 0 3 从4 1 3 3 2 0 ) 的资助,研究了如何在广域网范围内,为 企业内部及企业间的产品协同设计和开发提供新型的系统集成环境。对企业产 品设计和生产过程网络化集成的推广应用具有重要的意义。 论文通过对开放网格体系结构,网格系统软件( g l o b u s ) 的介绍和分析, 探讨了网格数据管理应用的技术实现。具体做了以下工作: 探讨网格出现的意义,以及网格的概念和特点,并介绍了国内外网格的 研究情况。 深入研究了网格体系结构,基础构架,分析和比较了开放网格服务基础 架构和w 曲服务资源框架两种网格基础设施规范。并介绍了比较有影 响力,且得到广泛应用的网格系统软件g l o b u s 工具包。 研究了网格环境下数据管理相对于一般网络环境的特点和优势。 第5 页 东南大学硕士学位论文 提出一个网格环境下文档数据管理系统模型,并基于g l o b u s 使用j a v a 语言实现了一个简单的原型系统。 总结研究工作的成果,并对今后的工作提出设想。 第6 ,页 第2 章网格基础理论 第二章网格基础理论 网格是一个复杂而庞大的系统,因此需要仔细规划和建立网格体系结构, 最后才能建成满足要求的网格。本章主要通过对网格体系结构的介绍,建立对 网格的理论认识。 2 1 网格体系结构 随着网格技术研究的深入,人们越来越发现网格体系结构的重要性。网格 体系结构是关于如何建造网格的技术,包括对网格系统的基本组成部分与各部 分功能的定义和描述,刻画了支持网格有效运转的机制。只有建立合理的网格 体系结构,才能够更好地设计和建造网格系统,才能够使网格更有效地发挥作 用。 到目前止,比较重要的网格体系结构有两个,一个是h n f o s t 既等在初期提 出的五层沙漏结构口】。另一个是在以m m 为代表的工业界的影响下,在考虑到 w e b 技术的发展与影响后,i a nf o s t e r 等人结合w 曲服务提出的开放网格服务 结构o g s a ( o p e ng r i ds e r v i c e sa l r c h i t e c n l r e ) 1 2 1 。 2 1 1 五层沙漏结构 五层沙漏结构是一种影响十分广泛的结构,它的主要特点就是简单。这种 结构主要侧重于定性的描述而不是具体的协议定义。五层沙漏结构以互联网协 议中的通信、路由、名字解析等功能为基础,由构造层、连接层、资源层、汇 聚层和应用层组成。每层都有自己的服务、应用程序接口和软件开发工具包, 上层协议可以调用下层协议的服务。五层沙漏结构主要侧重于学术研究,在这 一点上类似于开放系统互联模型( o s i ,o p e ns y s t e mi n 咖o n n e c t i o nr e f r c n c e m o d e l ) 和t c p 肿模型,因此很容易从整体上对其进行理解。 五层结构的划分 五层沙漏结构根据该结构中各组成部分与共享资源的距离,将对共享资源 进行操作、管理和使用的功能分散在五个不同的层次,越往下层就越接近于物 理的共享资源,该层与特定资源相关的成分就比较多,越往上层就越减少共享 资源的细节特征,即上层是更加抽象表示的共享资源,不需要关心与底层资源 相关的具体实现问题。五层结构中的五层从下到上分别是构造层、连接层、资 源层、汇聚层以及应用层,五层结构的具体划分如图2 一l 所示。图中还对五层 结构与r i p ,r p 协议结构进行了粗略对比。 第7 页 东南大学硕士学位论文 应用层 0 汇聚层 r 资源层 i连接层 国2 1五层结构及其与t c p ,r p 协议对比 构造层局部控制的界面 构造层( a b r i c ) 的基本功能就是控制局部的资源,向上提供访问这些资源 的接口。构造层面对的是一个个具体的物理( 也可以是逻辑的) 资源,它通过 对这些局部资源的管理,向上层提供对这些资源的管理和控制界面。构造层的 资源是非常广泛的,常用的资源包括处理能力、存储系统、目录、网格资源、 分布式文件系统、分布式计算机池、计算机集群等。构造层可以侦测当前可以 的软硬件资源的特性、当前负荷、状态等系统,并将其发送供上层协议调用。 连接层支持便利安全的通信 连接层( c o n n e c t i v i t y ) 的基本功能就是实现相互的通信,主要是为下层的 物理资源提供安全的数据通信能力,这是资源之间进行互操作的前提,连接层 使得孤立的单个资源之间建立了联系。它定义了核心的通信协议和认证协议, 用于网格的网络事务处理之中。 通信协议允许在构造层资源之间交换数据,要求包括传输、路由、命名等功 能。这些协议中大部分是从t c p ,口协议中抽取出的,比如口、t c p 、u d p 和 d n s 等协议。建立在通信协议之上的认证协议提供了加密的安全机制,用于识 别用户和资源。连接层的认证协议应该为通信保护提供各种灵活的支持,如保 护级别的控制、不可靠协议独立数据单元的保护、支持t c p 之外的可靠传输等, 允许网格使用者控制认证策略等。 资源层共享单一资源 资源层( r c s o u r c e ) 的主要功能就是实现对单个资源的共享,反映了抽象的 局部资源特征。资源层建立在连接层的通信和认证协议之上,定义的协议包括 安全的初始化、监视、控制单个资源的共享操作、审计以及付费等。资源层协 议考虑的完全是单个的局部资源,因此忽略了全局状态和跨越分布资源集合的 原子操作。 汇聚层协调各种资源 汇聚层( c o n e c t i v e ) 的主要功能是协调多种资源的共享,如何将下面以单 个资源形式表现出来的资源集中起来,协调解多个资源之间的共享问题。资源 层协议与服务描述的是资源的共性,说明不同资源集合之间是如何相互作用的, 第8 页 器圈 第2 章舟椿基础理论 并不涉及资源的具体特征。为了对来自应用的共享进行管理和控制,资源层提 供目录服务、资源分配、日程安排、资源代理、资源监测诊断、网格启动、负 荷控制、账户管理等多种功能。 应用层 应用层( a p 曲c a t i o n ) 是在用户应用环境中存在的,它所关心的是有什么样 的资源可以由下面提供给用户应用,解决不同用户的具体应用问题。用户的应 用程序通过各层的a p i 调用相应的服务,在通过服务调用网格上的资源来完成 计算任务。应用程序的开发涉及大量的库函数,为便于网格应用程序的开发, 需要构建支持网格体系的库函数。 沙漏形状 五层结构的一个重要特点就是沙漏形状,各部分协议的数量是不同的,对 于最核心的部分,要能够实现上层协议向核心协议的映射,同时要实现核心协 议向下层协议的映射,核心协议在所有支持网格计算的地点都应该得到支持, 因此核心协议的数量不应该太多,这样核心协议就形成了协议层次结构中的 个瓶颈,在五层机构中,资源层和连接层共同组成这一核心的瓶颈部分,使个 人资源的共享更加便利。这些协议的设计使之能够在构造层中定义的广泛资源 类型上运行,同时也能用于构建在协同层的一系列广泛的全局服务和特定应用 行为。沙漏形状如图2 2 所示。 工具与应用 应用层 诊胤曩等 汇聚层 资源与服务 资源层 f 的安全访问 i 连接层 、戮 构造层 图2 2 沙漏形状的五层结构 五层沙漏结构的核心的思想可以和微内核的操作系统进行类比。这样的设 计有利于移植,也可以比较容易地实现和得到支持。 2 。l 。2 开放网格服务体系结构 开放网格服务体系结构o g s a ( o p e ng i 试s e r v i c e sa f c h i t e c t l l ) 是由g g f ( 全球网格论坛) 于2 0 0 2 年6 月制定的开放式架构,是继五层沙漏结构之后最 重要,也是目前最新的一种网格体系结构,它已成为实际开发默认的标准。 如果说五层沙漏结构是以协议为中心的“协议结构”,那么o g s a 就是以服 务为中心的“服务结构”。这里服务是指具有特定功能的网络化实体。在五层沙 第9 页 东南大学硕士学位论文 漏结构中,强调的是被共享的物理资源,或者是这些资源所支持的服务,而在 o g s a 提出时,服务所指的概念变得更广,包括计算机设备、应用程序、数据, 也包括仪器、设备等也抽象成为服务。简而言之,就是把一切抽象为服务,这 样有利于通过统一的标准接口来管理和共享网格上功能各异的资源。 o g s a 具有下列目标; 跨分布式异构平台管理资源。 交付无缝的服务质量。网格的拓扑结构通常十分复杂,而且网格资源的 交互往往是动态的。网格可以提供健壮的后台服务,比如授权、访问控 制和委托。 为自治管理解决方案提供公共基础。网格可以包含许多资源,还有大量 的配置组合、交互以及状态与故障模式的改变。对于这些资源来说,一 些智能自动调节与自治管理方式是必不可少的。 定义开放的接口。o g s a 是一种由g g f 标准团体进行管理的开放式标 准。为了不同资源的互操作性,网格必须构建在标准接口和协议之上。 利用行业标准的集成技术。o g s a 的基础是w 曲服务。 2 1 2 1w e b 服务简介 w 曲服务是一种新型分布式计算模型,它基于一系列标准协议提供一个松 散耦合的分布式计算环境。主要的标准协议有s o a p ( s i m p l eo b j e c ta c c e s s p r o t o c o i ) 、w s d l ( w e bs e r v i c ed e s c r i p t i o nl a n g u a g e ) 和u d d i ( u n i v e r s a l d e s c r i p t i o nd i s c o v c r ya n dh t e g r a t i o n ) ,分别实现基于x m l 交换信息,描述网络 服务接口与访问方法和服务发现的目标。w e b 服务利用x m l 来解决异构分布 计算的问题,采取简单、易理解的标准协议作为组件界面描述、访问和发现规 范,在实现上不依赖于任何特定的编程语言、编程模型以及系统软件,完全屏 蔽了不同软件平台的差异。 s o a p 是在分布式环境中通过x m l 编码进行通信的一种简单的网络协议。 在网络通信世界里而,协议是指互相交换信息的双方在通信的过程中遵循的规 范。s 0 ap 协议从本质上来说,也是一种应用协议。s o a p 以x m l 形式提供 了一个简单的、轻量级的可以在分散的环境,或者是分布式的环境中点对点地 交换结构化和类型化信息地一种机制。s o a p 不定义任何应用程序语义。它实 际上定义了一种简单的表示应用程序语义的机制,这种机制通过提供一个标准 组件的包模型和在模块中编码的数据来实现。这使得s o a p 能够被用于从消息 传递到r p c ( 远过程调用) 的各种系统中。 w s d l 是定义如何用x m l 语法描述w e b 服务的规范。w s d l 通过在服务 提供者和服务请求者之间交换的消息来描述w e b 服务。消息本身是抽象定义的, 然后绑定到具体的网络协议和消息格式上。消息由一系列的具有指定类型的数 据条目组成。在服务提供者和服务请求者之间交换的一组消息称为一个操作 ( o p e f a t i o n ) 。一系列操作的集合称为端口类型( p o r f i 卯e ) 。一个服务( s e r v i c e ) 包含一系列的端口( p o n ) ,每个端口是一个端口类型的具体实现,包含需要和 服务器进行交互的所有具体细节。端口和消息的抽象定义于具体的网络分布和 数据格式绑定是相互分离的,这样就可以抽象定义消息和端口类型,实现它们 的重用。w s d l 提供了一种用以描述服务的普通的语言,同时提供了一个自动 集成这些服务的平台,因此w s d l 是w c b 服务架构中的基石之一。 第1 0 页 第2 章网格基础理论 w e b 服务的不足之处在于它提供的服务都是永久性的,没有解决对象生存 周期管理的问题,不能满足实际应用中大量临时性服务需求,难以实现一些复 杂的业务逻辑。而且s o a p 传输中消息可靠性、安全性规范没有得到解决。对 服务负荷平衡,容错功能提供的不够好。 2 1 2 2 0 g s a 架构 o g s a 把网格与面向商业应用的w e b 服务结合起来,把网格从科学与工程 计算应用扩展到更广泛的以分布式系统服务集成为主要特征的商业应用领域。 w e b 服务一般面对的都是永久性的服务,但在网格应用环境中,资源之间的联 系更加紧密,会存在大量临时性短暂服务。鉴于此,o g s a 在原有w c b 服务的 基础上,提出了网格服务的概念,该服务具有用于解决服务发现、动态服务创 建、服务生命周期管理等的,遵守网格服务规范的一组标准接口。o g s a 将整 个网格看作是网格服务的集合,而且是可以扩展的。网格服务可以以不同的方 式聚集起来满足虚拟组织的需要。网格服务的标准接口不依赖于具体的实现和 运行环境,一个网格服务可以部署在不同的运行环境中。 为解决网格中大量存在的临时服务,网格服务支持临时服务实例,可进行 动态的创建和删除。网格服务实例指的是网格服务的某个特定的实例化,客户 通过访问服务实例来得到服务。 网格服务实例具有生命周期,服务工厂创建网格服务实例时可以指定服务 实例的生命周期,生命周期是服务实例存在的时间,可以由客户端决定生命周 期的大小。当生命周期到期时,服务不能将再用。客户通过操作提前终止服务 实例的生命周期,这样可以节省服务器的开销。也可以在生命周期结束前,通 过操作延长服务的生命周期。o g s a 引入软状态,网格服务通过维护一个内部 状态来管理服务的生命周期,该状态将一个服务实例与另一个提供相同接口的 服务实例区别开来。 最初提出的o g s a 架构由四个主要的层构成【l ”:参见图2 3 。从下到上依 次为: 资源物理资源和逻辑资源。 w 曲服务,以及定义网格服务的开放网格服务基础架构扩展。 基于0 g s a 架构的服务。 网格应用程序。 第1 1 页 东南大学硕士学位论文 安全li 数据库管理| 1 文件系统ll 目录 li 消息 服务器 il 存储系统 网络 图2 3 基于0 g s i 的o g s a 架构 下面分别介绍o g s a 构架的构成 物理和逻辑资源层 资源的概念是o g s a 以及通常意义上的网格计算的中心部分。构成网格能 力的资源并不仅限于处理器。物理资源包括服务器、存储器和网络。物理资源 之上是逻辑资源。它们通过虚拟化和聚合物理层的资源来提供额外的功能。通 用的中间件,比如文件系统、数据库管理员、目录和工作流管理人员,在物理 网格之上提供这些抽象服务。 w e b 服务层 o g s a 架构中的第二层是w c b 服务。在最初制定o g s a 时有一条重要的原 则:所有网格资源( 逻辑的与物理的) 都被建模为服务。开放网格服务基础架 构规范定义了网格服务并建立在标准w e b 服务技术之上。开放网格服务基础架 构利用诸如x m l 与w 曲服务描述语言( w s d l ) 这样的w e b 服务机制,为所 有网格资源指定标准的接口、行为与交互。开放网格服务基础架构进一步扩展 了w e b 服务的定义,提供了动态的、有状态的和可管理的w e b 服务的能力,这 在对网格资源进行建模时都是必需的。 基于o g s a 架构的网格服务层 w e b 服务层及其开放网格服务基础架构扩展为下一层提供了基础设施:基 于0 g s a 架构的网格服务。g g f 目前正在致力于在诸如程序执行、数据服务和 核心服务等领域中定义基于网格架构的服务。随着这些新架构的服务开始出现, o g s a 将变成更加有用的面向服务的架构。 网格应用程序层 随着时间的推移,基于网格架构的服务不断被开发出来,使用一个或多个 基于网格架构的服务的新网格应用程序亦将出现。这些应用程序构成了o g s a 架构的第四个主要的层。 第1 页 第2 章网格基础理论 2 2 网格基础设施 2 2 1 开放网格服务基础架构 在o g s a 刚提出不久,g g f 及时推出了开放网格服务基础架构( o g s i , o p e 球g r i ds e r v i c e s i n 丘a s t f u c t 山_ e ) ,其1 0 版于2 0 0 3 年7 月正式发布。o g s i 作 为构建o g s a 的基础设施,它的核心就是网格服务规范,该规范在w 曲服务的 基础上定义了网格服务的标准接口和行为,以及一个客户如何与一个网格服务 交互。这些定义加上其他的与网格服务创建和发现相关的o g s i 机制,为分布 式计算普遍需要的分布的而且经常是长期存活的状态提供了可控的,容错的和 安全的管理。 o g s i 通过在以下两个领域引入接口和约定来扩展w 曲服务。 第一,网格中服务具有动态及可能瞬变的特性。在网格中,特殊的服务实 例会随着工作的分派、资源的配置与供给以及系统状态的变化而不断地产生和 销毁。因此,网格服务需要接口来管理它们的创建、销毁以及生命周期管理。 第二,就是状态。网格服务可以拥有与自身相关的属性和数据。这在概念 上类似于面向对象编程中对象的传统结构,对象有其行为和数据。同样地,w 曲 服务需要得到扩展,从而支持与网格服务相关的状态数据。 o g s i 的核心是网格服务,网格服务就是一种w e b 服务,为了服务生命期 管理,检查以及服务状态变化通知等目的而遵从一组约定。网格服务为分布式 应用中普遍需要的分布的并且经常长期生存的状态进行了控制的管理。o g s i 还引进了用于创建和发现网格服务的标准的工厂和注册接口,和一个基本错误 类型,为软件开发人员提供了一种统一的建模和与网格服务进行交互的方式。 图2 4 描述了这些接口。不论开发人员正在开发的是网格服务还是应用程序, o g s i 编程模型都会为网格软件提供一种一致的交互方式。o g s i 定义网格服务 时也采用了w 曲服务中的w s d l ,但是由于w s d l 所定义的元素不足以描述 网格服务的特征,因此o g s i 对w s d l 进行了扩展,对w s d l 中的p o r t d p e 定义了新的模式,在p o r t t 如e 中扩充了一个子元素s e r v i c e d a t a ,用来定义与该 p o r t t y p e 相关的所有服务数据元素。扩展的w s d l 称作g w s d l 。0 g s i 是第一 个明确提出的基于w e b 服务的网格体系结构,具有理论及概念价值。 图2 40 g s i 接口 第1 3 - 页 东南大学硕士学位论文 o g s i 引入了六个重要的接口和约定。 ( 1 ) 工厂( f a c t o r y ) :实现此接口的网格服务提供了一种创建新网格服务 的方式。工厂可以创建有限功能的临时实例。比如创建服务以表示执行特殊任 务的调度程序,或者它们可能创建生存时间更长的服务,比如一个常用数据集 的本地拷贝。并不是所有网格服务都是动态创建的。其中有些可能是作为网格 中物理资源的实例被创建的,比如处

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论