已阅读5页,还剩63页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
荫北i 业大学硕+ 学位论文 摘要 摘要 随着i n t e r n e t 和w e b 技术的不断发展,不同组织之间数据的交互越来越多, 业务互联互通的需求也越来越多。但是目前各个组织所使用的系统往往是采用不 同的平台和技术构建的,在这些异构的系统之间很难实现资源的共享。 本文通过对现有资源共享技术的分析,结合w e b 计算的特点,提出了一个 基于w e b 计算的资源共享平台。通过该平台可以实现异构系统之间的资源共享。 该平台由个资源共享中心和若干个资源共享代理组成。资源共享中心负责资源 的集中管理,用户可以通过资源共享代理发布或者使用共享资源。文中进一步给 出了平台中各个模块的功能划分和实现机制。 接着论文对平台实现的关键技术进行了研究,提出了平台实现中的元数据管 理、x m i 厂一关系数据库的数据转换、用户访问的身份验证、授权和访问控制等 问题的解决方案。 最后,论文给出了一个应用本平台进行数据交换的案例,验证了平台的可行 性和实用性。 关键词:资源管理,数据交换,w e b 服务,x m l 西北r :业大学硕士学位论文 a b s t r a c t a b s t r a c t w i t ht h ed e v e l o p m e n to ft h et e c h n o l o g yo fi n t e r n e ta n dw e b ,i ti sm o r ea n dm o r e n e c e s s a r yt os h a r ed a t aa n db u s i n e s sr e s o u r c ea m o n g d i f f e r e n to r g a n i z a t i o n s h o w e v e r , t h ea p p l i c a t i o ns y s t e m su s e db yt h e s eo r g a n i z a t i o n sh a v eb e e nc o n s t r u c t e db yv a r i o u s p l a t f o r m sa n dt e c h n o l o g y , s oi t i sh a r d l yt os h a r er e s o u r c ei nt h e s eh e t e r o g e n e o u s s y s t e m s i nt h i sp a p e r , aw e bc o m p u t i n gb a s e dr e s o u r c es h a r ep l a t f o r mi sp r e s e n t e db y a n a l y z i n gt h ea c t u a l i t y o fr e s o u r c es h a r e ,w h i c hi su s e df o rr e s o u r c es h a r ei n h e t e r o g e n e o u ss y s t e m s t h ep l a t f o r m i sc o m p o s e do far e s o u r c es h a r ec e n t e ra n d s e v e r a lr e s o u r c es h a r ea g e n t s t h es h a r ec e n t e ri si nc h a r g eo fm a n a g i n ga l lt h e r e s o u r c e s t h ea g e n tp r o v i d e su s e r sap l a t f o r mt op u b l i s ho ru s et h es h a r e dr e s o u r c e s w ea l s og i v et h em o d u l ep a r t i t i o no ft h ew h o l ep l a t f o r ma n dt h em e c h a n i s m su s e dt o i m p l e m e n tt h ed i f f e r e n tm o d u l e s t h e nw er e s e a r c ht h ek e yp r o b l e m si nt h ei m p l e m e n to ft h ep l a t f o r ma n dg i v et h e s o l u t i o n so ft h ef o l l o w i n gp r o b l e m s :m e t a d a t am a n a g e m e n t ,d a t at r a n s f o r mb e t w e e n x m ld o c u m e n ta n dr e l a t i o nd a t a b a s e ,p k i b a s e da u t h e n t i c a t i o n ,p m i b a s e d a u t h o r i z a t i o n ,r o l e - b a s e da c c e s sc o n t r o la n ds oo n a tt h ee n do ft h i sp a p e r , ad a t ae x c h a n g ec a s ei sp r e s e n t e d ,w h i c hi l l u s t r a t e st h e f e a s i b i l i t ya n da v a i l a b i l i t yo f t h ep l a t f o r m k e yw o r d s :r e s o u r c em a n a g e m e n t ,d a t ai n t e g r a t i o n ,w e bs e r v i c e ,x m l 两j e 工业大学硕士学位论文第一章绪论 1 1 选题背景 第一章绪论 随着信息技术和i n t e r n e t 技术的不断发展,全球化的信息网络和全球化的市 场正在形成。近几年我国提出了“以信息化带动工业化,发挥后发优势,实现跨 越式发展”的信息化战略方针,在这一方针的指导下,我国的信息化建设取得了 长足的发展。企业、政府部门等大都根据自身的实际情况和应用需要,构建了自 己的信息管理和业务处理系统,政府和企业都享受到了信息化带来的诸多便利, 与此同时也产生了越来越多的、不同类别的资源: ( 1 ) 数据资源:各种电子化的业务信息表示方式。这类资源包括存储在关 系数据库中的结构化数据jx m l 文档等半结构化数据、多媒体文件、平面文件 乃至各种无结构的数据等。这种表示方式代替了传统的纸质方式,使信息的存储 和表达更加灵活、高效,增强了业务资源的安全性和可靠性,也节省了耗材。 ( 2 ) 服务资源:对业务系统的各种资源进行加工、处理的应用系统。比如 各个企业内部的业务处理系统、邮件系统、企业发布的w e b 服务等。这些资源 提高了人们处理信息的效率和准确性。 随着上述资源的不断增长以及各个组织自身发展的需要,人们希望能对已有 的资源进行有效的管理,更希望在不同的组织之间进行资源的共享,以使现有的 资源得到充分的利用,发挥更大的效益,减少重复劳动和重复建设,降低信息化 建设的成本。 在我国的信息化建设中,各个企业和政府部门构建的系统往往是在不同时 期、由不同的软件开发商、采用不同的工具、在不同的开发平台上、采用不同的 技术标准开发出来的,这些已有系统往往运行在不同的操作系统和不同的数据库 平台上,而且客户端和服务器之间往往有防火墙或者代理服务器,这些跨平台的 异构系统形成了一个个信息孤岛。以信息资源的为例:不同的用户提供的数据可 能柬自不同的途径,其数据内容、数据格式和数据质量千差万别,这使得资源的 管理和共享比较棘手。这一问题的存在,严重影响了信息化建设的进程。这些问 题主要表现在以下几个方面: 数据的一致性无法保证。于数抓资源的定义和l 采集过程彼此独立,同 西北一l 业大学硕十学位论文 第一章绪论 一数据在不同的应用系统内可能有不同的表示。 不同的系统之f 白j 的信息资源不能及时共享和反馈,影响了业务的顺利开 展。 数据资源中存在大量的冗余、垃圾资源,影向了数据资源的集团化、行 业化应用。 导致数据资源重复录入和多采集口,影响了数据资源的实时性、一致性 和正确性。 无法实现真正的业务协作。在实际应用中,不同的系统之间可能需要功 能调用,但由于各个系统相对独立的建设方式,导致相互之间无法进行功能调用。 一般认为“信息孤岛”是由于不同行业和部门使用不同软件产品而造成的【5 l o 如何将各个组织的异构的业务资源有效的管理起来,在不同组织之间架起一个桥 梁,实现资源的共享,成为信息化建设中急需解决的问题。 1 2 研究内容 本文分析了w e b 计算的发展历程和发展方向,分析了当前不同组织之间资 源共享现状和需求,指出了在w e b 计算环境下实现不同组织之间资源共享的可 行性和优越性,提出了一个基于w e b 计算的资源共享平台,并从以下方面对该 平台进行了论述: ( 1 ) 采用x m l 作为统一的数据表述格式,为数据若享提供基础 这一部分主要论述如何实现不同数据源数据的抽取和转换,并以x m l 一关 系数据库的相互转换为例,详细分析了数据的映射和转换的实现。 ( 2 ) 采用异步和同步方式实现数据共享 针对不同的应用需求,论述了如何实现发匆问阕方式和请求,响应方式的数 据共享,前者是异步数据共享,后者是同步数据共享,这两种方式可以方便、灵 活的实现不同系统之间的数据共享。 ( 3 ) 资源共享过程中的访问控制 安全在整个资源共享中起着至关重要的作用,本文从身份认证、授权、访问 控制、数据传输的机密性、完整性和不可否认性等方面对整个平台的安全保证进 行了详细阐述。 西北工业犬学硕士学位论文第一章绪论 1 3 论文组织 本论文共分5 章,按如下方式组织: 第一章:绪论。介绍了当前我国不同组织之间资源共享的背景,指出了不同 组织之间进行资源共享的必要性和存在的问题,并简要介绍了本论文的工作。 第二章:w 曲计算概述。分析了w e b 计算的发展历程和趋势,附带对w e b 计算的相关技术进行了简介。 第三章:基于w e b 计算的资源共享平台研究。通过对我国资源共享现状的 分析,结合w e b 计算的优势,提出了一个基于w e b 计算的资源共享平台。接着 论述了平台中各个模块的功能和实现机制。 第四章:关键技术研究。研究了实现本文提出的平台需要解决的一些关键技 术问题,包括元数据的管理、不同数据源的数据和x m l 文档之间的相互转换以 及安全支撑等相关问题。 第五章:资源共享应用实例。以政府部门中税务局和工商局之间的企业信息 共享为例,给出了一个数据交换的案例,并给出了每个中间流程的数据处理结果。 西北一l 业大学硕 :学位论文 第二章w e b 计算概述 2 1w e b 计算概念 第二章w e b 计算概述 2 1 1w e b 计算的起源 i n t e m e t 出现以后,世界上许多网络都成功的连接到i n t e m e t 上,上网的人员 包括科研机构、高等院校、政府部门和企业等,在i n t e m e t 上传输的信息也覆盖 了科学、技术、政治、文化、教育、经济等等,其范围之广,容量之大,是前所 未有的。为了有效的查询和检索信息,人们在i n t e m e t 上建立了w w w ,这使得 人们只要通过浏览器就可以方便的查看文档、图形、声音、图像等各种资源。但 这种简单的浏览并不能很好的服务人们的工作和生活,人们就想把分布于世界各 地的资源通过网络组织起来,组成计算能力强大的超级计算系统,通过这个系统 联合服务人类的生产与科研工作这就导致了w e b 计算的诞生。 w e b 计算是一种基于唧协议的分布式计算方式汹j 。当前只能是人通过 浏览器来查看自己需要的资源,但w e b 计算希望能对分布的、异构的资源进行 整合,使得各个机构之间能有效的进行资源的共事。换言之,w e b 计算要借助于 w e b 技术对分布的、异构的各种网络资源进行组织和管理,从而使不同的应用系 统之间也能进行资源的共享,而不仅仅是人能够使用w e b 资塬。 2 1 2w e b 计算的发展 早期的w e b 计算主要实现静态w e b 页面的浏览。用户使用客户机端的浏览 器来访问i n t e m e t 上的各个w e b 站点,每一个站点都有一个主页作为站点入口。 每一个w e b 页中都可以含有信息以及超文本链接,超文本链接可以带用户到另 一个w e b 站点或者其它的w e b 页。从服务端来看,每一个w e b 站点由一台主机、 w e b 服务器及许多w e b 页构成,以一个主页为首,其它w e b 页为支点,形成一 个树形的结构。w e b 服务器使用h 1 r r p 协议将w e b 页从w e b 服务器传输至4 用户 的w e b 浏览器上。早期的w e b 计算的模式可以用图2 - 1 束表示: 西北: :业大学硕士学位论文 第二章w e b 计+ 算概述 客户机浏览器 二二 w e b 服务器f 百i _ 覃妇的w e t :百蠹蘸歪一 基于以上的分析,这一阶段的w e b 计算实质上是实现静态信息的传送,是 服务器端向客户端进行的简单信息传输。 w e b 计算的第二阶段是生成动态页面。现实社会中,大量的信息足存放在数 据库中的,人们可以将大量存储在数据库中的信息与w e b 结合在一起,在w e b 上发布这些信息。图2 2 是第二阶段的一个w e b 计算模型: 图2 - 2 第二阶段的w e b 计算模式 图中的客户端一般是一个浏览器,没有应用程序,它借助于j a v aa p p l e t 、 v b s c r i p t 、j a v a s c r i p t 、a c t i v e x 技术可以处理一些简单的客户逻辑。它的主要工 作是收集用户的请求信息,显示w e b 服务器的运行结果。 w e b 服务器负责接受远程和本地的数据查询要求,然后运行服务器脚本,借 助于c g i 等技术把数据请求发送到数据库服务器上以获取相关数据,再将结果 转化h t m l 以及各种脚本返回浏览器。 数据库服务器负责数据库的管理,处理查询请求以及数据更新、运行存储过 程,它可以是集中式也可以是分布式的。 在图2 2 中,w e b 服务器和数据库服务器之间的接口的主要功能是负责w e b 和数据库服务器之间的通信,并提供应用程序服务。采用的接口技术的不同,就 会有不同的w e b 计算解决方案。一般采用的接口技术有以下几种: ( 1 )c g i ( c o m m o ng a t e w a yi n t e r f a c e ) 技术 它是扩充传统w w w 的主流技术。用户通过浏览器输入查询信息,浏览器 通过h t t p 协议向w e b 服务器发出带有查询信息的请求,w e b 服务器按照c g i 协议激活外部c g i 程序,由该程序向数据库服务器发出查询请求并将查淘结果 转化为h t m l 返回给w e b 服务器,再由w e b 服务器返回给浏览器。c g i 程序实 际上起到了h t m l 和s q l 转换的网关作用。c g i 的开放性和通用性很好,丌f 发 者可以使用任何一种w e b 服务器内置的编程语言来编写c g i 程序。但它同时也 有以下缺点: 为响应每个客户的请求,服务器需要启动一个新的c g i 程序,二b 用户大 西北工业大学硕士学位论文第二章w e b 计算概述 量增加时,容易造成拥塞。 每次通过c g i i 匈后台数据库提交查询时,数据库都要执行同样的登录和 退出,耗费了大量的时间和开销。 s o l 和i h t m l 的差异较大,这使得c g i 程序中的转换编码编写十分繁琐, 维护比较困难。 要求软件开发人员对c g i 编程较为熟悉,具有很强的专业性,不适合普 通的开发人员。 ( 2 )服务器专用a p i 鉴于c g i 存在的缺陷,一些大的软件厂商都推出了自己的专用a p i 去扩展 w e b 服务器调用数据库的功能。常见的a p i 有m i c r o s o f t 公司的i s a p i 、n e t s c a p e 公司n s a p i 、i n f o r m i x 公司的i u w a p i 等。这些a p i 一般作为一个d l l 提供, 它是驻留在w e b 服务器中的程序代码,它可以像c g i 那样扩张w e b 服务器的功 能。通过使用a p i ,w e b 开发者不但可以实现c g i 可以实现的功能,而且还进 一步解决了不同的w e b 应用程序对信息数据的特殊请求。 专用的a p i 往往与专用的服务器平台或数据库相适应,不同平台之间的移植 几乎是不可能的,更不用说异构的计算平台。 ( 3 ) a s p 技术 a s p 技术是微软公司基于a c t i v e x 技术的一个w e b 服务端的开发环境以及 运行环境,它只能在w i n d o w sn t 和i i s 环境下运行。它把h t m l 和脚本开发融 合在一起,易于生成,无需手工编译和连接,属于a c t i v e x 技术中的s e r v e r 技术, 它直接建立在w e b 服务器中,并且是作为w e b 服务器的个服务运行,支持多 用户、多线程。与其它常见的在浏览器端实现动态页面的技术如j a v aa p p l e t 、 a c t i v e xc o n t r o l 、v b s c r i p t 、j a v a s c r i p t 等不同,一个a s p 页面中的脚本只在w e t 服务器端由i i s 解释运行,执行结果可以用h t m l 动态生成w e b 页面,并送到 客户端的浏览器。浏览器端并不处理a s p 页面中的脚本,它所面对的仅仅是一 个完全符合h t m l 格式的网页,这为更多的不同类型的浏览器访问w e b 服务器 提供了可能。 ( 4 ) j a v a j d b c j a v a 的推出使w e b 页面有了活力和动感。使用j a v a 可以在i n t e m e t 上开发 可移植的、交互的应用程序。j d b c 是s u n 公司提供的一个简单、标准、透明能 数据库连接编程接口,通过它可以访问多种数据库。用户呵以从w e b 服务器上 下载使用j a v a 丌发的a p p i e r 穰序到本地浏览器运行,运行a p p l e t 时,它会使慝 j d b c 直接与数据库柱l 连接,然后执行a p p l e t 中s o l 语句,执行的结果将会迈 = 【i 北工业火学硕士学位论文第二章w e b 计算概述 回客户端浏览器进行显示。 出于拥有j d b c 的j a v aa p p l e t 程序是下载到客户端执行的,网络带宽的限 制会影响其执行效率,同时浏览器的安全策略会防止它对用户硬盘进行访问,以 防止它破坏客户端系统,这在某种程度上限制了j d b c 访问数据库的功能。为了 改善这种w e b 计算技术,充分发挥j a v a 语言的特性,人们引入了j a v as e r v l e t 技术。j a v as e r v l e t 是运行在面向请求棚日应结构的服务器上的模块。它可以运行 在支持j a v a 的w e b 服务器上。j a v as e r v l e t 所提供的w e b 功能与c g i 所能提供 的功能基本相同。但是它支持线程、开销小、性能高、运行安全可靠、具有可移 植的开发接口、可以方便的与其它系统进行集成。 从上述分析可以看出,第二阶段的w e b 计算已经扩展为3 层体系结构,人 们使用它可以进行一些小型的独立应用。但人们的需要却远不止于此,人们希望 能够使用w e b 计算集成其它组织的应用系统,实现更大范围内的资源管理和共 享。这导致w e b 计算进入第三个阶段。 人们希望运用w e b 计算技术来构建一个计算环境,把一个组织或多个组织 的应用集成起来,实现复杂的业务处理。但是,各个组织已有的资源多是采用不 同的工具开发,运行于不同的操作系统上的,具有很大的异构性,而且不同的业 务应用也可能分布在不同的地域,具有较强的分布性。如果要构建一个w e b 计 算环境来管理这些异构的资源,实现资源的共享,必然需要屏蔽这些应用的差异。 为了解决这个问题,人们将分布式对象技术引入到w e b 计算中来,从而使w e b 计算进入第三个阶段。图2 - 3 是一个第三阶段的w e b 计算模型: 图2 - 3 第三阶段的w e b 计算模式 在这里w e b 计算所管理资源的可以是一般的数据,也可以是现存的已有的 业务应用,这里的应用服务器一个作用就是为了屏蔽各个应用系统的异构性,从 而实现客户端的透明调用。应用服务器一般借助于分靠对象技术来实现,采用的 分柿对象技术不同,会产生不同的w e b 计算方案。下边我们给出比较有代表性 的几种w e b 计算方案。 ( 1 ) 基于c o r b a j a v a 的w e b 计算 西北工业大学硕+ 学位论文第二章w e b 计算概述 兰三兰三三翻 m o 即n i t o r h t m l t t p - 墅些j a p p l e t l 币) 纠服h t 务t 器p k 贰c o l b a 一 t t p 【 卜jh t m lu i 服务k l 、【一 事 h t t p 、n 服务定位匕uo r b 恤蚶一i 矗 j a y a s e r v l e t 图2 _ 4 一个基于c o r b a j a v a 的w e b 计算框架 图2 - 4 是一个基于c o r b a j a v a 的w e b 计算框架。c o r b a 是o m g 和 x o p e n 制定的分布对象标准,它不依赖于各种平台和实现技术,所以基于 c o r b a 的系统具有可移植性。开发人员采用c o r b a 规范中通用的接口定义语 言i d l ( i n t e r f a c ed e f i n i t i o nl a n g u a g e ) 来定义对象的接口。i d l 可以保证采用不 同语言实现的对象能够有标准的对外接口,这样就做到了对语言的透明。采用 c o r b a j a v a 的w e b 计算体系结构可以保证系统的可移植性、互操作性、可重复 性以及高度的可扩展性,能够较好的满足实际应用的需要。 ( 2 ) 基于d c o m 的w e b 计算 图2 5 d c o m 的运行框架 d c o m 对象是微软公司在c o m 技术的基础 :发展起来的,其接口技术依赖 于w i n d o w s 操作系统,使用微软i d l 语言定义接口,支持c o m 构件的程序设计语 言可以使用此接口实现分布式对象应用丌发。d c o m 是面向对象远程过程调用 西北t 业犬学硕士学位论文第二章w e b 计算概述 的应用层协议,由分布式计算环境( d c e ) 的扩展构成。对象接口由惟一标识 u u i d 所确定,不同版本的接口u u i d 不同。d c o m 对象的远程过程调用( o r p c ) 实际就是d c e 远程过程调用,d c o m 支持多种通讯协议,? 缸i t c p i p 、i p x s p x 、 h t r p 等。在一个对象的远程过程调用中,调用信息头中的对象标识是1 2 8 字节的 接口指针标识。如果远程对象已经在远程机上运行,则调用被定位在远程对象的 s t u b 上,通过s t u b 调用功能在远程对象上被实际执行;否则远程机的s c m 服务 层会根据接口标识从注册表中查找相应对象并装载执行。d c o m 的运行框架如图 2 5 所示。 ( 3 ) 基于j a v a r m i 的w e b 计算 应用 f 一一d a p p l e t 。i 服务 7 i 隧 r m | 应用l i 卜j 服务定位k i s e r v l e t r i 服务 i 登录服务m n 应用i i 1 服务i l 文件服务 f 配置服务 会话服务 图2 - 6 一个基于j a v a r m l 的w e b 计算体系结构 图2 - 6 是一个基于j a v a r m i 的w e b 计算体系结构。r m i 技术是直接把分布 式对象模型嵌入到j a v a 语占内部,使得j a v a 程序员可以自然地编写分布式程序, 无需离开j a v a 环境,或者进行c o r b ai d l 以及j a v a 到c o r b a 的类型转换。 r m i 通过j a v a 远程方法协议( j r m p ) 实现对象之间的通信。r m i 远程服务对象 定义实现了远程接口,客户机可以像调用本地方法一样调用远程对象。客户机调 用远程方法时,调用请求首先传给客户机的s t u b ,客户机用s t u b 作为远程对象 的代表,远程引用层将调用请求传递给服务对象的s k e l e t o n ,s k e l e t o n 进行服务 器方法的调用。 基于j a v a r m l 的w e b 计算需要采用纯j a v a 技术丌发,这使得这种方案可以 适应几乎所有的硬件平台和操作系统,具有较好的可移植性。但使用纯j a v a 丌 发的系统和其它技术实现的系统缺乏互操作能力,可复用性世比较差。 9 西北一1 :业火学硕士学位论文第二章w e b 计算概述 2 1 3w e b 计算的现状 在对引入分布式对象的w e b 计算技术的分析中我们可以发现,不同的w e b 计算方案可能采用不同的分布式对象技术,而这些分布式对象技术之间是不能相 互通讯的。那么如何使这些异构的分布式对象之间相互通讯,实现更大范围内的 资源管理和共享,成为人们要解决的问题。同时在人们还希望能在不同的系统之 间进行数据的交换,而数据格式往往是异构的,这种异构性不仅表现在不同的应 用域之问,甚至同一应用域内的不同平台之间的数据格式也存在异构问题。比如, 企业为了将其内部不同部门的计算平台集成起来,往往需要解决这些计算平台之 间的数据格式异构问题。在w e b 计算环境下,这种异构性更加突出。 x m l 和w e b 服务的出现,为人们解决这些问题提供了技术支持。x m l 是 一种与平台无关的数据格式,具有自描述和灵活性等诸多优点,目前,用x m l 作为i n t e m e t 环境下的网络数据表达方式已经得到了i b m 、m i c r o s o f t 和s u n 等业 界几乎所有厂商和企业的支持。因此,可以采用x m l 作为中间数据格式进行数 据交换。w e b 服务采取简单的、易理解的标准w e b 协议作为组件界面描述和协 同描述规范,完全屏蔽了不同软件平台的差异,无论是c o r b a 、d c o m 还是 e j b 都可以通过这种标准的协议进行互操作,w e b 服务实现了在当前环境下最高 的可集成性。因此,基于x m l 和w e b 服务技术构建新的w e b 计算环境,实现 更广范围内的资源管理和共享,已成为w e b 计算的一个发展方向。 在使用x m l 和w e b 服务构建w e b 服务计算环境也有一些问题需要解决, 比如x m l 和不同数据格式之间的映射、w e b 服务的安全性保证、可靠性保证等 问题。对这些问题,很多人也进行了大量的研究,给出了一些解决的方法,形成 了一些相关的规范。本文中会对这些问题作进一步的研究。 2 2w e b 计算的相关技术 2 2 1x m l 技术 x m l ( e x t e n s i v e m a r k u p l a n g u a g e ,可扩展标记语言) 是1 9 9 8 年w 3 c ( w o r d w i d ew e bc o n s o r t i u m ) 组织创建的一种针对网络应用的可扩展标记语言,它是 用于定义其它语言的语副“。x m l 源于s g m l ,它是s g m l 的最小完备集,集 成了s g m l 的强大功能而剥除了其繁琐的定义。x m l 信息集( i n f o s e t ) 、x m l 担北一 业大学硕士学位论文 第二章w e b 计算概述 模式( s c h e m a ) 和x m l 命名空恻( n a m e s p a c e ) 构成了x m l 的语法核心。其 中,x m l 模式是用来定义一类x m l 文档的。当前x m l 规范的最新版本是w 3 c 组织提供的x m l l 0 ,另外还有许多x m l 规范,如x s l 、x s l t 、x p a t h 规范等。 x m l 作为一种新的i n t e r n e t 上的数据交换标准,主要有以下几个优点: x m l ;4 k 身是文本:这使得x m l 文档可以方便的使用疆盯p 传输,可以应 用于i n t e r n e t 。 自描述性:这可以使计算机在没有人为干涉的情况下理解数据含义。 可扩展性:x m l 开发人员可以根据需要自定义数据类型和元素。 数据内容和显示分离:这便于修改x m l q b 信息的显示方式,也便于数据 搜索。 平台独立:x m l 是公开的标准,不依赖任何厂商的应用程序。这是其广 泛应用的主要原因之一。 正是由于x m l 的诸多优点,它的到了许多数据库和软件厂商的支持,x m l 在w e b 应用的实现方面已经可以取代h t m l 。随着x m l 在w e b 应用中的不断 普及。x m l 从w e b 网站的内容管理、内容表示起步,开始逐渐扩展到其它基于 w e b 的应用中,如电子商务应用、数据集成、分布式系统集成、系统配置信息描 述等。 2 2 2w e b 服务 对于w e b 服务,目前没有统一的定义。比较流行的定义是w 3 c 对w e b 服 务的定义:w e b 服务是一个可以用u r l 来标志的软件系统,而且它的公共接口 和绑定可以用x m l 格式的信息来定义和描述,它的定义可以被其它软件系统 发现,并且其它软件系统可以通过使用基于x m l 的消息( 借助i n t e r n e t 协议) 、 通过在w e b 服务的定义中描述的方式与其交互。 w e b 服务的典型体系结构如图2 7 所示。在w e b 服务的体系架构里有三个 角色:服务提供者、服务注册中心和服务请求者【l 。服务提供者是w e b 服务的 提供商,它实现了一个w e b 服务,并放置在线服务器上供别人调用。服务注册 中心是一个w e b 服务的注册地,它汇集了很多w e b 服务的技术信息。服务请求 者从服务注册中心获取某些w e b 服务的技术信息引用,根据这些技术信息绑定 w e b 服务,进而调用w e b 服务。 西= i l s - 业大学硕士学位论文第二章w e b 计算概述 一 s e i c e s e r v i o e 一- 、d 。e ,s e r i p t l o n - r e g i s t r y ,7 , f i n d - 、h m i s h ,一l 一、,l 一、一 1 i s e r v i c e j 、。,! ! 鲤塑! ! v m ,。7s e r v i c e 、p 一r - jj r e q u e 蚰? 一? i p r o v i d e t 。 一s e r v 矗, 、j v v j j 、 j ? 一d e s c r i p t i o ,n j 图2 7w e b 服务的体系架构 w e b 服务包含了一系列的标准和协议,最基本的是x m l 、s o a p 、w s d l 和u d d i 。下面我们对这些技术进行简要介绍: ( 1 ) s o a p s o a p 为在一个松散的、分布式环境中使用x m l 对等地交换结构化和类型 化的信息提供了一个简单且轻量级的机制。它提供了一个标准的、可扩展的、可 组合的x m l 消息包装和交换框架。 s o a p 包括四个部分:s o a p 封装( e n v e l o p e ) ,它封装定义了一个描述消息中 的内容是什么,是谁发送的,谁应当接受并处理它以及如何处理它的框架:s o a p 编码规贝j ( e n c o d i n gr u l e s ) ,它用于表示应用程序需要使用的数据类型的实例; s o a pr p c 表示( r p cr e p r e s e n t a t i o n ) ,它表示远程过程调用和应答的协定;s o a p 绑定( b i n d i n g ) ,它定义使用底层协议交换信息的要求。s o a p 可以和很多网络传 输协议比如h t r p 、s m t p 、f i p 绑定使用。常见的绑定方式是s o a p 与h t t p 或者h t t p 扩张框架的绑定。 ( 2 ) w s d l w s d l 是一听十基于x m l 的、用于定义和描述w e b 服务的语言,它抽象的描 述了w e b 服务请求者和提供者之间相互交换的消息,这些消息可以根据需要被 绑定到某一种具体的网络协议和具体的消息格式。 w s d l 将w e b 服务定义成一系列的端口( p o r t ) ,每个端臼用来表示从抽象 端口类型( p o r tt y p e ) 到用于调用w e b 服务的具体通信协议的一个映射。w s d l 文档在w e b 服务的定义中使用下列元素: t y p e s :数据类型定义的容器,它使用某种类型系统f 一般地使用x m l s c h e m a 中的类型系统1 。 m e s s a g e :通信消息的数据结构的抽象类型化定义。使用t y p e s 所定义的 西北j :业大学硕士学位论文第二章w e b 计算概述 类型来定义整个消息的数据结构。 o p e r a t i o n :对服务中所支持的操作的抽象描述,一般单个o p e r a t i o n 描述 了一个访问入口的请求响应消息对。 p o r t t y p e :对于某个访问入口点类型所支持的操作的抽象集合,这些操 作可以由一个或多个服务访问点来支持。 b i n d i n g :特定端口类型的具体协议和数据格式规范的绑定。 p o r t :定义为协议数据格式绑定与具体w e b 访问地址组合的单个服务访 问点。 s e r v i c e :相关服务访问点的集合。 ( 4 ) u d d i u d d i 是一个用户发布和查找远端服务的基于x m l 的规范。这些服务可以 是经过分布式对象技术封装的遗留系统,也可以是单位在网络上对外提供业务功 能的应用系统。 u d d i 的核心组件是u d d i 商业注册,它使用一个x m l 文档来描述企业及 其提供的w e b 服务。u d d i 商业注册所提供的信息包含三个部分:“目页 ( w h i t e p a g e ) ”包括了地址、联系方法和已知的企业标识;“黄页( y e l l o w p a g e ) ” 包括了基于标准分类法的行业类别;“绿页( g r e e np a g e ) ”则包括了关于该企业所 提供的w e b 服务的技术信息,其形式可能是一些指向文件或是u r l 的指针,而 这些文件或u r l 是为服务发现机制服务的。所有的u d d i 商业注册信息存储在 u d d i 商业注册中心中。同时u d d i 又提供了一系列的编程接口,用于服务的发 布和查找。 2 2 3 语义w e b 和语义w e b 服务 随着w e b 的飞速发展,现有w e b 技术因只有信息资源定位描述而无信息含 义描述所带来的局限性逐渐暴露出来,如网页功能单调、搜索引擎智能化程度低 等,这是因为大部分w e b 上的内容是设计给人阅读的,而不是让计算机程序按 其意义进行操作的。计算机能熟练地解析网页的版面,知道哪罩是标题,哪里有 与其它页面的链接。但是,它分辨不出个人主页和天气预报的区别,因为它没有 可靠的方法来处理其中的语义,没有办法智能地理解网页内容并进行操作。 语义w e b 技术以信息服务智能化、自动化、高效性为目标,通过本体 ( o n t o l o g y ) 来描述资源的语义信息,达到语义级别的信息资源共享n 它对现 有的w e b 进行了语义扩展,从而使其能被计算机做一定的理解和处理,从功能 嘏i t :j - 业火学硕士学位论文第二二章w e b 计算概述 上看它将是一个能够“理解”人类信息的智能网络。例如,某人想报名参加一个 研讨会,计算机就可自动地为其制定最佳f 程和路线以及预定酒店等。 随着w e b 服务的迅速发展,w e b 服务的自动化问题也被逐渐重视,语义w e b 服务也就应运而生。语义w e b 和w e b 服务相结合称为语义w e b 服务1 2 6 j 。带有语 义信息的w e b 服务描述不仅有利于实行自动化的w e b 服务发现,而且可以进行 基于语义的模糊匹配,使w e b 服务的发现技术更加有效和准确。 显而易见,如果能够采用语义w e b 和语义w e b 服务来构建w e b 计算环境, 那将会使资源的管理和共享更加智能和自动化,给人们带来更多的便利。我们期 待着这天的早目到来。 2 3 小结 本章对w e b 计算的发展历程进行了概述,分析了w e b 计算在不同时期的典 型应用以及在这些典型应用中的解决方案,并分析了w e b 计算今后的发展方向, 为下一章的论述奠定了基础。随后,本章对w e b 计算中使用的x m l 技术、w e b 服务技术以及语义w e b 和语义w e b 服务技术进行了简要介绍。 荫北【:业人学硕士学位论文第三章基于w e b 计算的资源共享平台研究 第三章基于w e b 计算的资源共享平台研究 3 1 w e b 资源的共享现状 3 1 1 数据资源共享现状 数据资源的共享主要是把不同来源、格式、特点的数据在逻辑上或物理上有 机地集中起来,从而为用户提供全面的数据共享。当前已经有很多成熟的数据共 享框架可以利用,通常采用数据仓库、联邦式、包装器中介器( w r a p p e r m e d i a t o r ) 等方法来实现数据共享。 ( 1 ) 数据仓库方法 数据仓库是一个面向主题的、集成的、持久的且随时间变化的数据集合。数 据仓库中存储的数据由e t l ( e x t r a c t ,t r a n s f o r m ,a n dl o a d ) 工具定期从各数据源抽 取,并将其转换成数据仓库所使用的数据格式和数据类型后存储在数据仓库中 【2 1 。数据仓库体系结构如图3 - 1 所示。 图3 1 数据仓库的体系结构 两北一l 业大学硕士学位论文第三章基下w e b 计算的资源共享平台研究 采用数据仓库技术可以实现数据集成,但数据仓库中的数据主要供外界查 询,满足管理人员决策分析的需要。为了避免数据仓库中的数据和数据源中的数 据不一致,一般不允许对数据仓库中的数据实行更新操作。另外,数据源中的数 据需要在数据仓库中重新存储,这对存储空间是一种浪费。 ( 2 ) 联邦数据库系统 联邦数据库系统( f e d e r a t e dd a t a b a s es y s t e m ,f d b s ) 由多个半自治数据库系 统构成,它是一些彼此协作而又独立的单元数据库的集合,。它将单元数据库系统 按不同的程度进行集成。联邦数据库系统中不存在全局的中央控制中心,这样可 以保证数据的自治性,提高数据的私有和安全特性。在大多数情况下,f d b s 是 异构的,各个单元数据库可能有不同的数据模型、查询语言、并发控制机制、事 务处理机制、安全策略等。联邦数据库系统中的每一个单元数据库可以是集中数 据库系统或分布式数据库系统,也可以是其它联邦式系统。联邦数据库系统中的 各数据源之间通过相互提供访问接口实现数据共享。 f d b s 中实现数据共享的最常用的方法是将每个数据库模式分别和其它所存 数据库模式进行映射( 如图3 2 所示) 。当参与联邦的数据库的个数为n 时,联 邦中需要建立n ( n 1 ) 2 个模式映射规则,如果参与联邦的数据库很多时,建立 映射规则的任务变得不可行了。所以,联邦数据库集成系统适合于自治数据库的 数量比较小、希望数据库能够保持“独立”、允许用户单独查询、数据库间能够 彼此联合回答查询的情况。对于现在越来越丰富的数据源,f d b s 显然不是一个 很好的解决方案。 图3 2 联邦数据库体系中多库互访 ( 3 ) w r a p p e r m e d i a t o r 系统 西北1 业大学硕士学位论文第三章基于w e b 计算的资源共享平台研究 图3 - 3w r a p p e r m e d i a t o r 方法的体系结构 目前,w r a p p e r m e d i a t o r 模式被认为是实现异构数据集成的理想方案【4 | o w r a p p e r m e d i a t o r 方法的体系结构如图3 3 所示。该方法的核心是引入了一个中 介模式( m e d i a t e ds c h e m a ) ,数据集成系统通过中介模式将各个数据源的数据集 成起来。该方法并没有将各个局部数据源中的数据集中存储在一个地方,数据仍 然存储在各个局部数据源中。每一个局部数据源对应一个包装器( w r a p p e r ) ,包 装器负责对局部数据源中的数据进行转换,以使这些数据符合中介模式。用户的 查询是基于中介模式的,对用户来讲,他无需关心数据源的具体位置和特点。中 介器( m e d i a t o r ) 负责将用户基于中介模式的查询转换成基于各个局部数据源的 模式查询,它的查询
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 数据中心可持续发展
- 赣南师范大学《司法口才学》2021-2022学年第一学期期末试卷
- 赣南师范大学《国际私法》2022-2023学年第一学期期末试卷
- 阜阳师范大学《教师口语》2021-2022学年第一学期期末试卷
- 徐州市2024-2025学年五年级上学期11月期中调研数学试卷二(有答案)
- 福建师范大学协和学院《市场学导论》2021-2022学年第一学期期末试卷
- 福建师范大学《植物地理学》2022-2023学年第一学期期末试卷
- 2024年二级建造师管理-思维导图
- 福建师范大学《人口地理学》2023-2024学年第一学期期末试卷
- 福建师范大学《合唱指挥》2022-2023学年第一学期期末试卷
- 道德与法治三年级上册+阶段性(期中)综合素养评价(部编版)
- 盐池县再生水厂、德胜墩水资源综合利用特许经营项目实施方案
- 广东某办公楼改造装饰工程施工组织设计方案
- 制动能量回收系统故障诊断与排除说课课件
- 《20世纪的科学伟人爱因斯坦》参考课件2
- 八年级道德与法治上册 第一单元 走进社会生活 单元复习课件
- 中职心理健康课程设计
- 设计师会议管理制度
- 人教版英语九年级Unit 13《Were trying to save the earth》全单元教学设计
- 行贿受贿检讨书
- (正式版)JC∕T 60022-2024 陶粒窑协同处置固体废物技术规范
评论
0/150
提交评论