(计算机应用技术专业论文)基于xml的管理信息系统若干问题的研究.pdf_第1页
(计算机应用技术专业论文)基于xml的管理信息系统若干问题的研究.pdf_第2页
(计算机应用技术专业论文)基于xml的管理信息系统若干问题的研究.pdf_第3页
(计算机应用技术专业论文)基于xml的管理信息系统若干问题的研究.pdf_第4页
(计算机应用技术专业论文)基于xml的管理信息系统若干问题的研究.pdf_第5页
已阅读5页,还剩74页未读 继续免费阅读

(计算机应用技术专业论文)基于xml的管理信息系统若干问题的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 信息化是高效管理的必由之路,许多机构( 政府,企业等) 经过近几年的信息 化建设,已经初步具备了信息化的软硬件设施,在这些信息化过程当中,管理信息 系统起着非常重要的作用,许多机构对自身的管理信息系统建设已经积累了一些经 验。但随着i t 领域内各种技术的发展,以及机构原有的信息系统众多潜在问题的 暴露和机构需求变化的日益增长,许多机构对信息系统提出了更高的要求。另一方 面,随着互联网以及软硬件技术的不断发展,分布式,可操作性,异构性已经成为 各种计算环境的显著特征,如何创建一个全新的高扩展性的信息系统的问题已越来 越引起研究人员和开发人员的关注。 本文在分析了传统管理信息系统模型不足和目前机构信息化( 特别是电子政 务) 发展趋势的同时,结合一些开发实例,提出了一种基于x m l 的管理信息系统结 构模型,详细阐述了该模型的横向和纵向视图及工作原理,并重点研究了开发基于 x m l 的管理信息系统过程中会遇到的几个重要问题。比如,在关系数据库中如何实 现) 【m l 数据的有效存储是当前研究的热点,针对这个问题,本文在形式化x m l 模式 和关系模式的基础上,提出并实现了一种x m ls c h e m a 到关系模式的转换方法。另 外,本文研究的重点还包括x m l 数据表达,x m l 与松散耦合等问题。 关键词可扩展标记语言;管理信息系统:电子政务;模式 北京工业大学工学硕士学位论文 a b s t r a c t i n f b m a t i z a t i o ni st t l eo n l yw a yt oh i 曲p e r f b n a n c em a n a g e m e n t ,am a i l yy e a r s i n f o m l a t i z a t i o np r o c e s s ,m a l l yo 玛a n i z a t i o n s ( g o v e m m e n t s ,e n t e r p r i s e se t c ) h a v eb e e n p m v i d e d w j t h g o o ds o 挖h a r d l 愀c o n d i t j o n s n od o u b t ,m a l l a g e m e n ti n f o 珊a t i o n s y s t e m i s a c t i n g av e r y i m p o r t a l l t r o l ei nt h e p r o c e s s s o m eo r g a l l i z a t i o n sh a v e a c c u r n u l a t e d1 0 t so f e x p e r i e n c e b u t m ep e r f 0 珊a n c eo fm a i l a g e m e n ti n f o m l a t i o n s y s t e ms h o u l dh a v eh i 曲e rs t a n d a r db e c a u s em e i n c r e a s eo ft t l eo 耀a n i z a t i o n sd e m a l l d s a 1 1 dt h ed e f e c t st l l a t 仃a d i t i o n a lm a n a g e m e n ti n f o r i l l a t i o ns y s t e mh a v ee x p o s e d 0 nt 1 1 e o t h e r h a i l d ,w i t ht h er a p i dd e v e l o p m e n to fi m e m e ta 1 1 ds o f th a r d w a r et e c h n i q u e ,a l lk i n d s o f c o m p u t i n g e n v i r o n m e m s n o w a d a y s a r e b e c o m i n g c h a r a c t e l j z e d d i s t i n c t l yb y d i s t r i b u t i o n ,c o o p e r a t i o n ,a i l dh e t e r o g e n e i t ye s p e c i a l l y ,h o wt od e s i 印ah i g hn e x i b l e i n f o r n l a t i o ns y s t e mb e c o m e saf o c u so f r e s e a r c h u n d e rm e a 1 1 a l y s i so fm ed e f i c i e n c yo f t r a d i t i o n a l i n f b h n a t i o ns y s t e mm o d e la n d t h et e n d e n c yo f i n f o n n a t i z a t i o n ( e s p e c i a l l ye g o v e m m e m ) ,a c c o r d i n g t os o m ep r a c t i c a l p r o j e c t s ,t h ep a p e r l a y o u t sa nx m l - b a s e dm a n a g e m e mi n f o m a t i o ns y s t e mm o d e l _ a n d e x p l a i n sm eh o r i z o m a la n dv e r t i c a lo r i e n t a t i o nf a m e w o r ka n dm e c h a n i s mo f t h i sm o d e l i np a n i c u l 札a tt h es 锄et i m e ,t h i sp 印e rs t u d i e ss o m ep r o b l e m st h a t m a ye m e r g e w h e ni m p l e m e m i n gt 1 1 em o d e l f o re x a n l p l e ,h o wt o p e r s i s tx m l d a t ab yr d b m s e 厅e c t i v e 】yi sa f o c u so f t h i sp 印e r ,a 舭rf o 彻a l i z i n gx m ls c h e m aa n dr e l a t i o n a ls c h e m a , w e p r e s e n taa l g o r i t h mo ft r a n s f o m l i n gx m l s c h e m ai n t or e l a t i o n “s c h e m aa n dr e a l i z e t h ea l g o r i t h mw i t hm i c r o s o rd o ma p ia 1 1 dc 拌l a l l g u a g e i na d d i t i o n ,e x p r e s s i n gd a t ab y x m l ,x m l a 1 1 dl o o s e l yc o u p l e ds y s t e ma r e “s om y e m p h a s e s k e yw o r d sx m l ;m i s ;e g o v e r n m e n t ; s c h e m a 第l 章绪论 第1 章绪论 1 1 问题的提出 随着社会的飞速发展,我们对信息的收集、传递、加工和使用等方面的要求也越 来越高,传统的管理信息系统正面临着众多的问题。首先,传统的管理信息系统已经 越来越不适应现在不同数据源之间( 例如在不同的数据库之间,不同操作系统问) 的 数据交换。当面临不同类型数据库之间的信息传递时,系统往往采用格式转换的方法, 这样既增加了系统开发的工作量,又降低了系统运行的效率,而且限制了今后的变化 与发展。其次,传统的管理信息系统所使用的数据格式很难将同一数据以不同的形式 提供给众多的用户,以满足不同的用户需求。它只有依靠非常烦琐的编程才能做到这 点,而且这种方法也不能适应未来的变化和发展。最后,传统的管理信息系统对于行 业业务的标准化显得无能为力。目前,众多行业的不同单位,都有各自的管理信息系 统,但它们之间的互通性比较差。比如,某人从公安部调往教育部,该人的许多信息 只有重新用手工输入到教育部的管理信息系统,而无法在两个部的管理信息系统之间 直接传递数据,究其原因,主要是各自系统的数据不能互通。 分布式多层系统是目前在企业级大中型应用中最流行的架构,在公安部消防局 管理信息系统网络版的需求分析中,我们考虑到政府正在大力支持电子政务计划,在 全国范围内集成政府数据和应用( 工作流) 是今后的发展趋势,然而在考察了许多传统 的政府管理信息系统工程后,我们发现这些系统存在一些共同的缺陷:比如系统内的 数据很难被别的系统所使用,系统的工作流无法被别的系统( 特别是其它组织开发的 系统) 所重用,系统所能适应的客户端非常有限等等,这些问题跟我们前面讨论的传 统管理信息系统所面临的问题是一致的,这样的系统不利于实现b 2 b 电子商务模式和 理想的电子政务模式。 另方面,x m l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标记语言) 公布五年多 后的今天已经成了网络上的世界语言,它至少在两个重要方面具有超凡的表现:内容 定义和信息交换。前者用来定义一种事物,个过程或者一个行业的信息标准等。 对于后者,开放的、基于文本的瑚l 用于服务器之间交换信息非常理想。当然,要明 确说出x m l 的影响并不是那么容易,但是) ( 1 l l 几乎无所不在,光是这点就足以令人惊 北京工业大学工学硕士学位论文 叹。x m l 可用来建立网页、接合计算机、定义两家公司交流所使用的语言与词汇。它 也存在于数据库中,并影响了信息进出的规则。可以这样说,) ( m l 的重要性就在于它 的无所不在。 为了使公安消防部队管理信息系统不在短时间内被淘汰,也为了在今后的升级, 扩展和集成中留有最大的灵活度,我们决定突破传统网络信息系统的开发模式,设计 一个基于x m l 的管理信息系统,该系统必须具备如下特点: ( 1 ) 数据和服务是跨平台的。 ( 2 ) 数据和服务能被其它系统利用,当硬件条件达到要求时,易于在互联网内 被集成。 ( 3 ) 通过简单的二次开发可以很容易的适应其它客户端( 如手持设备,应用程 序等) 。 当然,开发一个基于x m l 的管理信息系统会遇到许多新问题,比如,基于) ( m l 的 信息系统架构是怎么样的? 应该在系统的什么地方应用) ( m l ,在什么地方则不宜使用 x m l ? x m l 数据用什么存储方式最好等等,这些也正是本文试图研究和解决的问题。 1 2 本文主要研究内容 本文以设计实现基于) ( m l 的公安消防部队管理信息系统为基础,研究从规划设计 到实现一个基于x m l 的管理信息系统时所需要考虑的方方面面的问题,重点选出若干 问题加以深入研究和阐述,以下将是本文重点研究的几个问题: ( 1 ) 系统架构问题,即基于) ( m l 的管理信息系统架构到底是什么样子。在以往的 一些相关研究中已有一些解决方案“m 2 ”,本文试图提出一个更简单更实用的方 案,该方案必须能应用在大部分开发中。 ( 2 ) x m l 文档的存储问题。本文在比较) ( m l 几种存储方案优劣的同时,重点研究 了x 虬存储在关系数据库中所涉及的问题,比如数据的相互映射,模式的相互映射等, 提出了一个) 【m l 模式到关系模式的转换算法,并用c # 实现之。 ( 3 ) x m l 用于表示复杂实体的问题。) ( m l 用于内容表达可以说是无处不在,本文 无法预知一个系统中哪些地方可以用涮l 进行内容表达( 特别是复杂内容的表达) , 因此,本文主要以研究实现一种基于) ( m l q c m 的随机查询系统( 以笔者提出的x m l q c m 第1 章绪论 模型为基础) 为实例来说明这个问题,系统的信息发布,公文管理等多个子系统均使 用了相关的技术。 ( 4 ) 松散耦合系统的相关问题。主要研究讨论x m l 能实现何种类型的松散耦合系 统。 1 3 本文的内容组织 第1 章主要介绍课题背景以及研究的主要内容,第2 章介绍可扩展标记语言 ( e x t e n s i b l em a r k u pl a n g u a g e ,) ( m l ) 的一些背景知识和主要相关技术,接下来便是 课题研究所涉及到的几个主要问题,从系统架构,到x m l 的存取等,它们都是在设计 开发基于) 【 f l 的管理信息系统中会涉及到的重要问题,本文在提出这些问题的同时, 还提出了一些切实可行的解决方案和建议,同时,文章以公安消防部队管理信息系统 的开发作为阐述的主要实例,后面几章的主要内容如下: 第3 章研究并提出一种基于x m l 的管理信息系统模型,本文称之为x m l d m ( x h l l _ b a s e dd i s t r i b u t e dm o d e l ) ,该模型本质上是一个分布式计算模型。 第4 章研究j ( m l 在枷l d m 中的存储方案,并给出相应的算法来实现不同模式闻 的转换。 第5 章由于查询系统在信息系统中处于最为重要的位置,是用户使用最多的功 能之一,本章分析了传统基于w e b 的查询系统的不足,提出了一种基于) 【m l 的查询条 件模型蹦l q c m ( x m l _ b a s e dq u e r yc o n d i t i o nm o d e l ) ,并在该模型上定义了一系列 的操作,笔者在此基础上实现了一个实用的w e b 随机查询系统。 第6 章研究x m l 在) ( 1 l l d m 中实现松散耦合的相关问题。 结论对相关问题的研究成果,有待解决的问题和前景做出总结。 北京工业大学工学硕士学位论文 第2 章t h ee x t e n s i b i em a r k u pl a n g u a g e ( x m l ) 2 1 x m l 的产生 1 9 9 6 年,万维网协会( 或者叫w 3 c ,h t t p :州w w 3 c o r g ) 开始设计一种可扩展的 标记语言,使其能够将s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,标准通用标 记语言) 的灵活性和强大功能与已经被广泛采用的h 体l 结合起来。这种后来变成】( i i f l ( e x t e n s i b l em a r k u pl a n g u a g e ,可扩展标记语言) 的语言继承了s g m l 的规范,而 且实际上就是后者的一个子集。) ( m l 是一种界定文本数据简便而标准的方法,曾被 人称作“w e b 上的a s c i i 码”“,就好像你可以使用自己喜欢的编程语言来创建一 种数据结构,然后同其他人在其它计算平台上使用的其它语言来共享一样,x m l 的标 记用来说明你所描述的概念。 1 9 9 8 年2 月,x m l l o 成为w 3 c 的推荐标准,接着便出现了许多支持x m l 的产 品,包括微软的n e t 和s u n 的j 2 e e 在内的多种主流开发技术和许多数据库产晶( s q l s e r v e r 2 0 0 0 ,o r a c l e9 i ) 都内置了对) ( m l 的支持。x m l 能增加结构和语义信息,可使 计算机和服务器即时处理多种形式的信息,运用x 札的扩展功能不仅能从服务器下 载大量的信息还能大大减少网络流量。可以预言,) ( m l 将在本世纪的互联网上发挥举 足轻重的作用。 总之,基于) ( m l 的分布式体系结构将会焕然一新,在服务器方面,它将能很方便 的集成各种数据( 尤其是非关系型的数据源) 和应用,并且很容易在服务器之间交换 数据,在客户端,由于我们接收到的是自描述的数据,因此,将不再局限于浏览器的 客户端,它还可以是任意富有创新的应用程序,而且这种应用程序与服务器端的应用 程序是很松散的耦合。 2 2x m l 的主要特点 ( 1 ) 简单性。x m l 经过精心设计,整个规范简单明了,它由若干规则组成,这 些规则可用于创建标记语言,并能用一种常常称作分析程序的简明程序处理所有新创 建的标记语言。 ( 2 ) 可扩展性。) ( m l 在两个意义上是可扩展的。首先,它允许开发者创建自己的 d t d ( d o c u m e n tt v d ed e f i n i t i o n ,文档类型声明) 或煳ls c h e m a ,有效地创建可被 第2 章t h ee x t e n s i b l em a r k u pl a n g u a g e ( x m l ) 用于多种应用的可扩展标记集。其次,使用几个附加的标准,开发者可以对x m l 进行 扩展,这些附加标准可以向核心的) ( m l 功能集增加样式、链接和参照能力。企业可以 用x m l 为电子商务和供应链集成等应用定义自己的标记语言,作为该领域信息共享与 数据交换的基础。 ( 3 ) 互操作性x m l 可以在多种平台上使用,而且可以用多种工具进行解释。因 为文档的结构是相容的,所以解释它们的语法分析器就可以以较低的费用建立。x m l 支持用于字符编码的许多主要标准,允许它在全世界许多不同的计算环境中使用。 ( 4 ) 灵活性x m l 提供了一种结构化的数据表示方式,使得用户界面与结构化数 据分离。“。在) ( m l 中可以使用样式表,另外,) 【m l 文档之间的超链接功能由独立的 x l i n k 来支持。 ( 5 ) 白描述性) ( m l 文档通常包含一个文档类型声明或) ( m l 模式,因而枷l 文档 是自描述的。l 文档中的数据可以被任何能够对删l 数据进行解析的应用所提取、 分析和处理,并以所需格式显示。x m l 表示数据的方式真正做到了独立于应用系统,并 且这些数据可以被重用。 ( 6 ) 国际化标准) ( m l 的国际化源于其统一代码的新编码标准,这种编码标准支 持世界上所有主要语言,在h t m l 中,就大多数字处理而言一个文档一般是用一种特 殊语言写成的,不管是英语还是日语或阿拉伯语,如果用户的软件不能阅读特殊语言 的字符,那么他就不能使用该文档。但是能阅读x m l 语言的软件就能顺利处理这些不 同语言字符的任意组合,因此,】( m l 不仅能在不同的计算机系统之间交换信息,而且 能跨国界和超越不同文化疆界交换信息。 2 3x m l 的相关技术 x m l 并不是在真空中操作的。如果不只是将矾l 用于一种数据格式的话,就需要 与多种相关的技术相互作用。这些技术包括h t m l 、s a x 、d o m 、d t d ,x m ls c h e m a 、c s s 和x s l 、u r l 和u r i 、x l l 和u n i c o d e 字符集等,本节介绍其中主要的几种技术。 2 3 1s a x d o m d 叫及s a x 推荐标准由w 3 c 维护,它们是两个用于】( m l 文档且受到广泛支持的 a p i ,换句话说,s a x 和d o m 是处理x m l 文档的两种方式,s a x ( s i m p l e a p if o rx l l ) 北京工业大学工学硕士学位论文 是一种基于流的、以事件处理方式工作的接口。d o m ( d o c u m e n to b j e c tm o d e l ) 则 是对) ( m l 文档进行分析后,在内存中建立起一个完整的树结构,然后在此基础上进 行各种操作“1 。s a x 对系统资源要求低,速度快“,但对文档的操作是只读的;d o l 的处理能力强大,但要求大量的系统资源,尤其是对于大的脚l 文档。 d o m 提供了文档的结构化视图。与d o m 兼容的解析器读取整个文档,并通过在内 存中构造一个对象树而提供文档的一个视图。文档的主要组件结构是对象树中的节 点,访问对象树并处理它是通过使用d o ma p i 。 s a x 与d o m 不同,它并非一个标准组织的产品。它是早期) ( m l 开发过程中,许多 开发者为了寻求一种有效的a p i 而创造出来的产品。s a x 并不把应用程序的注意力集 中在整个文档的树状图上,而是在解析时提供事件驱动。事件的内容往往是这样的形 式:“这里是一个起始标记;这里有一些元素内容;这里是一个结束标记。”等。 2 3 2d t d x m ls c h e m a d t d ( d o c u m e n tt y p ed e f i n i t i o n ,文档类型声明) 是一套关于x m l 标记符的语法 规则,它告诉你可以在文档的什么地方使用哪些标记,它们应该按什么次序出现,哪 些标记有哪些属性等,早在x m l 还没出现时,d t d 用于s g m l ( s t a n d a r dg e n e r a l i z e m a r k u pl a n g u a g e ) ,删l 被设计成为s g m l 的一个子集,因此用d t d 来定义) ( m l 文档 是理所当然的,d t d 的出现,赋予了) ( m l 文档可扩展性、结构性和可验证性。正因为 如此,x m l 才具备了类似于数据库的一些性质,d t d 并不是) ( m l 文档必须的成份。具 有d t d 的瑚l 文档称作“v a l i d ”,否则就是“w e l l 一f o r m e d ”。然而,随着x m l 应用领 域不断扩大,d t d 的一些不足也暴露出来了,比如其复杂的语法,不支持数据类型和 名称空间,扩展性差等。x m l 文档处理的自动化也要求有一种更为严格,全面的解决 方案。x m ls c h e m a 正是由于这方面原因而出现的,x m ls c h e 腿最初出现是在1 9 9 8 年,其功能与d t d 差不多,相对于d t d ,x m ls c h e m a 有如下优点: ( 1 ) 一致性,它本身便是) ( m l 文档,因而能用d o m ,s a x 等对它进行分析。 ( 2 ) 扩展性,如引入了数据类型,名称空间等。 ( 3 ) 规范性,它定义了x m l 文档的整体结构。 ( 4 ) 易用性,因为它本身便是) ( m l 文档,因此具有简单明了的特点,撰写模式 - 6 第2 章t h ee x t e n s i b l em a r k u pl a n g u a g e ( x m l ) 要比d t d 简单得多。 x m ls c h e m a 于2 0 0 1 年5 月2 曰成为w 3 c 推荐标准。更多有关这方面的内容可参 考文献 5 6 7 3 8 。 2 3 3x s l x s l t c s s 可扩展的样式语言( e x t e n s i b l es t y l el a n g u a g e ,x s l ) 是专门用于x m l 文档的 样式单语言。x s l 文档本身就是结构完整的) ( m l 文档。x s l t 是x s l 的转换部分( x s l t r a n s f o r m a t i o n ,x s l t ) ,它主要用来识别) ( m l 文档以便使用样式。x s l t 的弹性相当 大,允许你进行大多数】( l l 中的转换、排序和组织工作,而不需要编写自己的程序代 码。一般根据元素显示的先后关系编写x m l 的转换规则。 c s s ( c a s c a d i n gs t y l es h e e t s ,级联样式单) 开始是为h t m l 设计的,它定义 字号、字族、字重、段落缩进、段落对齐和其他样式等格式化属性,这些属性都可以 施加到个别的元素上。例如,c s s 允许h t m l 文档来指定所有的h l 元素应该被格式化 为3 2 磅、中间对齐的h e l v e t i c a 字体的粗体。单独的样式可以施加到大多数h t m l 标记上,它能够覆盖浏览器的缺省设置。多个样式单可旌加到一个文档上,而多个样 式也可用于单个元素上。样式根据特定的一套规则级联起来。 c s s 只能改变特定元素的格式,也只能以元素为基础。但x s l 样式单可以重新排 列元素并对元素进行重排序。这种样式单可以隐藏一些元素而显示另外一些元素。更 进一步说,还可以选择应用样式的标记,它不仅是基于标记的,而且还基于标记的内 容和特性,还基于标记在文档中相对于其他元素的位置,以及基于各种其他的准则。 更多有关这方面的内容可参考文献 4 1 3 2 8 。 2 3 4x l in k x p o in t e r 将) ( m l 发布到i n t e r n e t 上,我们当然希望能够对这些文档寻址并且可以将这些 文档链接起来。标准的h t m l 链接标记可用在) ( m l 文档中,而且h t m l 文档也可与x m l 文档加以链接。例如,下面的h t m l 代码将链接指向消防局管理信息系统江西总队平 台目录下的n e w s ) ( m l 。 翥f 闻 北京工业大学工学硕士学位论文 如果用户跟随着链接,浏览器能否显示这个文档,依赖于该浏览器处理) ( m l 文件 的能力。然而,x m l 是利用x l i n k 来与文档链接,用x p o i n t e r 来确定文档个别部分 的位置,具有更多的功能。x l i n k 可使任意元素成为链接,丽不只是 元素。进一 步说,链接可以是双向的、多向的或是指向多个镜像的站点,并选择这些站点中最近 的一个。x p o i n t e r 能使链接不仅指向特定位置处的特定文档,而且还可指商特定文 档的特定部分。x p o i n t e r 可以引用文档中特定的元素,如第一个、第二个或是第十 七个特定的元素。x p o i n t e r 提供了文档问连接的强大功能,而这些文档不必有包括 附加标记的目的文档,正因为如此,其中的个别部分才可以被链接。进一步说,与 h t m l 的锚( a n c h d r ) 不同,x p o i n t e r 不只是引用文档中的一点。x p o i n t e r 可以指向 一个范围或是一个区域。因而x p o i n t e r 可以用来选择文档的特定部分,或许这样一 来,就可以将这部分复制或是将其装入其他程序。 2 3 5u r l 弄u r l x m l 文档可用于w e b ,正如h t m l 和其他文档一样。使用时,也如h t m l 文档一样, 被统一资源定位符( u n i f o r mr e s d u r c el o c a t o r ,简写为u r l ) 所引用。例如,在u r l m p :w w w j ) ( ) ( 匀o r g c n z o n g n e w s m 蚴g e r n e w s x m l 处,可以找到以x m l 格式存放的新 闻。虽然u r l 已被人们广泛理解并被广泛支持,但x m l 规范使用的是更为通用的统 一资源标识符( u n i f o r i i lr e s o u r c ei d e n t i f i e r ,简写为u r i ) 。u r 【对于定位i n t e r n e t 上的资源是更为通用的架构,更为注重资源而不太注重位置。理论上说,u r i 可找出 镜像文档的最为近似的副本或是找出已经从一个站点移动到另一站点的文档。但u r i 仍然处于进一步研究之中,当前得到广泛支持的仍是u r l 。 2 4x m l 的应用模式 有关于煳l 的应用模式在文献 1 4 中有很好的阐述,煳l 的最大优点在于它的数 据存储格式不受显示格式的制约。一般来说,一篇文档包括三个要素:数据、结构以 及显示方式。对于h t m l 来说,显示方式内嵌在数据中,这样在刨建文本时,要时衬 考虑输出格式,如果因为需求不同而需要对同样的内容进行不同风格的显示时,要从 头创建一个全新的文档,重复工作量很大。此外h t m l 缺乏对数据结构的描述,对于 应用程序理解文档内容,抽取语义信息都有诸多不便。 8 第2 章t h ee x t e n s i b l em a r k u pl a n g u a g e ( x m l ) x m l 把文档的三要素独立开来,分别处理。首先把显示格式从数据内容中独立出 来,保存在x s l 文件中,这样如果需要改变文档的显示方式,只要修改x s l 文件就足 够了。x m l 的自我描述性质能够很好地表现许多复杂的数据关系,使得基于x 札的应 用程序可以在瑚l 文件中准确高效地搜索相关数据内容,忽略其它不相关部分。x m l 还有其它许多优点,比如它有利于不同系统之间的信息交流,完全可以充当网际语言, 并有希望成为数据和文档交换的标准机制。 总结一下,x m l 的应用主要分为以下四类: ( 1 ) 充当不同数据源之间交换数据的媒介。在这类应用中,) ( m l 解决了数据统 一接口的问题。但是,与其他数据传递标准不同的是,x m l 并没有定义数据文件中数 据出现的具体规范,而是在数据中附加了标记来表达数据的逻辑结构和含义。这使 x m l 成为程序能自动理解的规范。 ( 2 ) 可将大量运算负荷分布在客户端,减轻服务器压力。客户可根据自己的需 求选择制作不同的应用程序来处理数据,而服务器只须发出同一篇x m l 文档,x m l 将 处理数据的主动权交给客户,服务器所要做的只是尽可能的将数据完善准确的封装成 x m l 文档,) ( m l 文档的自解释使客户端在收到数据的同时也理解数据的逻辑结构含义, 从而使广泛,通用的分布式计算成为可能。 ( 3 ) 将同一数据以不同的面貌展现给不同的用户。 ( 4 ) 代理程序可对所取得的信息进行编辑、增减以适应不问用户的需要。有些 客户取得数据并不是为了直接使用而是根据自己的需要组织自己的数据,从而建立自 己的应用系统。 ( 5 ) 作为行业信息标准化的工具。 以下是几个) 【m l 的应用实例,它们均对应于上述的一种或多种应用类型: ( 1 ) 商务自动化处理比如基于) 【m l 的e d i ( e l e c t r o n i cd a t ai n t e r c h a n g e , 电子数据交换) 技术。瑚l 丰富的标记完全可以描述不同类型的单据,例如信用证、 保险单、索赔单以及各种发票等。结构化的珊l 文档发送至w e b 的数据可以被加密, 并且很容易附加上数字签名。文献 3 2 5 1 在这方面有很好的阐述。 ( 2 ) 信息发布信息发布在企业的竞争发展中起着重要作用。服务器只需发出 份x m l 文件,客户可根据自己的需求选择和制作不同的应用程序以处理数据,特别适 北京工业大学工学硕士学位论文 合于b 2 b 的信息发布。 ( 3 ) 数据集成和应用集成) ( m l 能够更准确地表达信息的真实内容,其严格的语 法降低了应用程序的负担,也使智能工具的开发更为便捷。来自不同应用程序的数据 也能够转化到) 【m l 这个统一的框架中,进行交互,转化和进一步的加工。 第3 章基于】( m l 的管理信息系统体系结构 第3 章基于x m l 的管理信息系统体系结构 3 1 概述 早期的商业化管理信息系统大多采用双层结构的c s ( c l i e n t s e r v e r ) 模式。应 用程序的商业逻辑通常封装在客户端程序中,或在后台数据库管理系统中以触发器 存储过程的形式实现。但是它存在不够灵活,难以管理,性能较差,难以维护等诸多不 足,因此随着信息技术的发展,这种模式在规模较大的系统中已被逐步淘汰。目前管理 信息系统中较为流行的是分布式的三层( 或多层) c s 模型及b s ( b r o w s e r s e r v e r ) 模型。所谓三层模式,是对早期双层模式的拓展,即在客户机与后台数据库中添加中间 层,对一个三层应用系统进行分割,可将代码划分为以下三个级别的逻辑组件: ( 1 ) 用户界面。它提供信息或功能的定位浏览和使用,保证用户操作界面的一致 性和完整性。用户界面可以是浏览器( 在b s 中) ,也可以是应用程序( c s ) ,还可 以是其它设备上的某些界面形式。 ( 2 ) 应用逻辑。应用逻辑是共享的商务逻辑,负责从数据中生成业务信息,保证 业务的一致性,完整性和安全性。比如w i n d o w s2 0 0 0s e r v e r 集成了c 0 m + ,可以作 为w i n d o w sd n a 体系中的应用服务器,基于j 2 雎的服务器有w e b l o g i c ,w e b s p h e r e 等,它们都是组件的容器。如果把这一层再进行一定的细分,就形成了多层结构。 ( 3 ) 数据服务。数据服务包括系统数据的定义,永久数据的存储和检索,保证数 据的一致性,这一层服务主要用数据库系统实现。 明确应用的架构后,需要进一步创建具体的构件来实现它们。构件是一个或几个 服务的封装,可以通过构件的接口获得这些服务。构件可以是的c o m + 组件、e j b 、数 据库触发器和存储过程的集合,或者应用系统中的其它软件实体,目前基于) ( m l 的构 件技术主要是w e bs e r v i c e ,它是可以在w e b 上调用的组件。构件是由它所提供的服 务以及它和其它构件的相互作用来定义的。根据性能和维护的需求、工作量、网络带 宽以及其它的因素,可以在网络上灵活地部署这些构件。构件可以是通用的,并且遵守 公开的接口标准,所以它们可以被重用,并能被多个应用程序所共享,而此时外界所需 知道的只是它们的接口。 在开发大型信息系统时,分布式三层多层系统是目前应用中最流行的架构而 北京工业大学工学硕士学位论文 ) ( m l 则是表达和处理数据的最新技术。作为新的数据标准,x m l 的通用性与开放性无 庸置疑,对于传统成熟的三层多层开发模式。) ( m l 的价值不是取而代之,而在于锦 上添花,基于x m l 的三层多层架构,不但具有原有三层多层架构的系统稳定,伸缩 性强,可扩展等优点,还非常容易实现异构系统集成,数据共享,是目前研究和应用 的热点。 3 2 基于x m l 的信息系统体系结构 设计一种分布式模型一般要从横向和纵向两个方面去研究,这跟分布式计算环境 的普及计算和深度技术两个发展方向。”是一致的,普及计算指计算环境中的终端设备 不再局限于计算机,还可能是任何互联网上的其它设备,如手机,p d a 等,相对于这 些普及计算,传统的网络协议栈和网络服务器构成了深度计算环境,这些环境为普及 计算提供有力的支撑。任何分布式模型都必须考虑分布式计算环境的这两个发展方 向。具体介绍如下: ( 1 ) 适应分布式计算环境的普及性,普及计算环境最大的特点是计算设备的计 算能力和网络条件参差不齐,可能是p c ,也可能是计算能力较差的手机和其它掌上 设备,可能通过线路很好的网络,也可能是线路较差的其它网络环境,这就要求分布 式框架必须能够适应不同网络条件下的通信协议,能够适配不同计算能力的数据交换 协议。 ( 2 ) 适应分布式计算环境的深度性,相对于普及计算环境,深度计算环境的最 大特点是提供与各种普及计算设备的互联能力,这要求分布式计算模型必须能兼容各 种通信协议和数据交换协议,并且需要为上层提供统一的接口,以屏蔽计算环境的异 构性。 另外一点还要考虑的是保持和现有技术的兼容,并尽可能的使用现有的标准技 术。 然而,传统的服务器和分布式系统构架对组件模式系统的依赖性很强,例如c o m + 或者c o r b a 。这些技术并不真正适合于i n t e r n e t 。在并不知道任何共享分布式对象结 构的条件下,能够很容易地写出客户应用程序吗? 传统的分布式技术对此恐怕无能为 力。 第3 章基于) ( m l 的管理信息系统体系结构 基于以上的一些考虑,笔者提出了一种基于x m l 的分布式管理信息系统模型,笔 者把该模型称为) 【m l d m ( x m l 岫a s e dd i s t r i b u t e dm o d e l ) 。把】( m l 加入到一个分布 式架构,我们能够克服任何所遭遇的异构问题。就如前一章所介绍的,x m l 从根本上 说,就是一种文本,而且它能够被任何平台和现有的语言所理解,能够传送请求消息 和响应于任何环境。 从纵向看,x m l d m 共分为四层,如图3 一l 所示,它们从下到上分别是消息传输 层,激活集成层,通用服务层和应用层,实际上,该模型的纵向框架可以看成是七 层网络模型中应用层的扩展。 图3 1 基于) ( m l 的信息系统应用体系( 纵向) f i g u r e3 1f r a i n e w 0 r ko f 瑚l _ b a s e dm i s ( v e r t i c a l ) ( 1 ) 消息传递层,其主要思想是采用成熟的并且在互联网上普遍存在的h t t p , h t t p s ,s m t p 甚至是m s m q 等协议完成消息传递,但传递的不再是h t m l 或m i m e 文档, 而是基于x m l 的结构化文档。传递的x m l 文档有可能是数据,也有可能是一个远程方 法调用( 比如s o a p ,) ( m l r p c ) 等等。 ( 2 ) 激活集成层,提供激活远程服务的一系列技术支持,不久前提出的w e b s e r v i c e 技术,它所对应的本层适配器应包括s o a p ,w s d l ,u d d i 等,这些都是激活 远程服务和集成应用的必要条件。 ( 3 ) 通用服务层,基于激活集成层。通用服务层向应用层提供各种分布式服务 ( 这些服务在成熟的分布式体系如c 0 m + ,c 0 r b a 中都是存在的) 如消息服务,事务服 务等,这一层也是现今技术最不成熟的一层。有些解决方案是通过某种方式来利用已 北京工业大学工学硕士学位论文 经成熟的分布式服务,如在n e t 仍使用c o m + 中的事务服务。 ( 4 ) 应用层,这一层是开发人员构建的具体的基于煳l 的分布式应用,它的构 建必须以上述三层为基础。 图3 2 基于x 札的信息系统应用体系( 横向一个单元) f i g u r e3 2f r 鲫e w o r ko f l - b 8 s e dm i s ( h o r i z o n t a i o n eu n i t ) 图3 2 所示的是) 【m l 一嘶中一个单元的横向视图,一个单元是一个相对独立的应 用实体( 单元边界的确定非常灵活,后面的实例中有更详细的阐述) ,该实体中有一 系列的输入和输出,这个实体所使用的数据有可能是) ( m l ,h t m l ,关系数据库中的数 据,面向对象数据库中的数据,或是来自于其它应用的数据,但我们的原则是无论什 么数据,我们都用一个转换器把非j ( 5 l l 数据转换成煳l 格式的数据,再通过d o m s a x 等x m l 数据操作接口在服务器中做处理。单元的输出可以有很多种,下面是主要的几 种: ( 1 ) 0 u ta p i ,输出应用接口,这个接口应是基予) ( m l 的,现在的技术主要是w e b s e r v i c e ,其相关技术已经在前面介绍过。这个输出可以为其它单元所用,主要 为b 2 b 应用而设计。 ( 2 ) o u ti eg u i ,输出i e 图形用户界面,这里,我们不再是输出h t m l ,而是) 【m l + x s l , 这样灵活度更高。这个输出主要为终端用户所用。 ( 3 ) o u tp d ag u i ,输出p d a 的图形用户界面,这充分体现了利用) ( m l 后所带来的 便利,事实上,我们只用同一份x m l 数据和不同的处理机制就可以让客户在不 同的设备上使用应用程序。这个输出主要为终端用户所用。 第3 章基于) 【m l 的管理信息系统体系结构 ( 4 ) p u b l i s hd a t a ,发布数据,同样,数据格式是) ( m l ,这主要是为b 2 b 应用而设 计的,发布的数据可供另一个单元使用。这个输出可以为其它单元所用。 有了上面的基础,我们可以得出结论,整个基于x m l 的信息系统体系( x m l d m ) 其实就是多个如图3 2 所示的x m l 应用单元互联而构成的,它们互相协作,又彼此相 对独立,某个单元的开发只要符合上述要求就行,不用太多考虑其它单元的情况,该 体系结构对电子商务和电子政务应用都有很好的借鉴作用。 3 3 模型应用实例 3 3 1 政府信息集成框架 近几年,政府信息化建设取得了不少的成果,但真正从全局着眼,我们会发现许 多潜在的问题,那就是整个过程没有一个统一的计划,甚至同一部门都开发了许多异 构系统,致使数据共享和交换因难,系统几乎没有扩展性。一个好的政府信息化方案, 既要考虑到对现在系统的集成,又必须有良好的扩展性,本节所提出的基于x m l 的政 府信息集成框架 ( x m l _ b a s e dg o v e r n m e n t a l i n f o r m a t i o n i n t e g r a t i o n f r a m e w o r k ,x m l g i i f ) 便是基于这两方面考虑的,它是一个从x m l d m 中衍生出来的 框架。 前面介绍的有关x m l 的许多特性都将是这个框架非常需要的,x m l 也能解决我们 在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论