




已阅读5页,还剩52页未读, 继续免费阅读
(航空宇航制造工程专业论文)基于xml的标准件库的建立及应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京航空航天大学硕士学位论文 摘要 标准件的大量使用提高了产品设计效率,是现代制造的一个重要的特点。如何建 立与c a d 平台无关的标准件库是一个很有意义的研究课题。随着网络的发展,讧l 承担了数据表示和交换的角色,以x m l 表现的数据,具有严谨的结构、良好的可扩 充性、可定制性,并具有平台无关性,空间无关性。x m l 的平台无关性使建立与c a d 平台无关的标准件库成为可能。本文提出了基于x m l 的标准件库的建库平台的系统 构架,在对标准件进行层次分类和标准件参数归纳基础上,设计了l 表示的标准 件文档。系统采用了参数数据和种子零件分离的机制,并把参数数据以x m l 文档的 形式描述,从而使此标准件库初步实现了c a d 系统的无关性。最后,对此标准件库 与c a d 系统的调用方法进行了研究,并在u g 中实现了此标准件库中标准件的调用。 关键词:x m l :c a d ;标准件;平台无关性;建库平台 基于x m l 的标准件库的建立及应用研究 a b s t r a c t d u r i n gp r o d u c t sd e s i g n ,l a r g en u m b e r so fs t a n d a r dp a r t sa r e u s e d t h ed e s i g n e f f i c i e n c yi si m p r o v e d i ti sa l li m p o r t a n ts y m b o lo fm o r d e mm a n u f a c t u r e b u th o wt o b u i l dap a r t sl i b r a r yo fi n d e p e n d e n c eo ft h ep l a t f o r mi su r g e d w i mt h ed e v e l o p m e n to f n e t w o r k x m lh a sp e r f o r m e da sd a t ap r e s e n t a t i o na n dc h a n g e x m l - b a s e dd a t ah a v et h e g o o ds t r u c t u r e a n de x p a n s i o n a l s oi n d e p e n d e n to ft h ep l a t f o r ma n d s p a c e t h e s e c h a r a c t e d s t i c so fx m lm a k ei tp o s s i b l et h a tb u l d i n ga ns t a n d a r dp a r t sl i b r a r yw h i c hi s i n d e p e n d e n to fp l a t f o r m a f t e ra n a l y s i n gt h eh i b e r a r e h yo fs t a n d a r dp a r t sa n dp a r a m e t e r s , a nx m l - b a s e ds t a n d a r dp a r t sd o c u m e n ti sd e s i g n e d f u r t h e ras y s t e mf r a m e w o r kb a s e do n x m li s g i v e n i nt h i ss y s t e m t h ep a r a m e t e r sa n dt h es e e dp a r t sa r e d e t a c h e d s o i n d e p e n d e n c eo fc a d i sr e a l i z e d a tl a s t t h ei n t e r f a c eb e t w e e ns t a n d a r dp a r t sl i b r a r ya n d t h ec a d s y s t e mi sr e a s e a r c h e da n dt 1 1 er e a l i z a t i o no fu s i n gt h i sl i b r a y sp a r t si sm a d ei n i7g k e yw o r d s :x m l ,c a d ,s t a n d a r dp a r t s ,p l a t f o r mi n d e p e n d e n c e ,l i b r a r y b u i l d i n gp l a t f o r m 南京航空航天大学硕士学位论文 1 1x m l 概述 第一章绪论 x m l 来自s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,即标准通用标记语言,简称 s g m l 。在w 曲未出现之前,s g m l 就早已存在。s g m l 是一种用标记来描述文档 资料的通用语言,它包含了一系列的文档类型定义( 简称d t d ) ,d t d 中定义了标 记的含义,因而s g m l 的语法是可以扩展的。s g m l 十分庞大,不容易学和使用, 在计算机上实现也十分困难。鉴于这些因素,w e b 的发明者一欧洲核子物理研究中心 的研究人员根据1 9 8 9 年计算机技术的能力,提出了h t m l 语言。 h t m l 只使用s g m l 中很小一部分标记。为了便于在计算机上实现,h t m l 规 定的标记是固定的,即h t m l 语法是不可扩展的,它不需包含d t d ( 文档类型定义) 。 h t m l 这种固定的语法使它易学易用,在计算机上开发h t m l 的浏览器也十分容易。 正是由于h n 仉的简单性,w 曲技术得到迅速推广,网络技术也迅速发展。 近年来,随着w e b 的应用越来越广泛和深入,h t m l 过于简单的语法严重地阻 碍了用它来表现复杂的形式。尽管h t m l 推出了一个又一个新版本,已经有了脚本、 表格、帧等表达功能,但始终满足不了不断增长的需求。另一方面,计算机技术的发 展也十分迅速,已经可以实现比当初发明创造h t m l 时复杂得多的w e b 浏览器,所 以开发一种新的w e b 页面语言既是必要的,也是可能的。直接使用s g m l 作为w e b 语言,能够解决h t m l 遇到的困难,但是s g m l 太庞大,用户学习和使用不方便, 要全面实现s g m l 的浏览器就非常困难,于是仅使用s g m l 的子集,使新的语言既 方便使用又实现容易。正是在这种形势下,w e b 标准化组织w 3 c 建议使用一种精简 的s g m l 版本m ,。x m l 就是在这样的背景下产生的。 x m l 的典型应用有: ( 1 ) 与不同的数据源的集成。数据可能来自不同的数据库,他们都有各自不同 的复杂格式。但客户与这些数据库间只通过一种标准语言进行交互,那就是x m l 。 在这类应用中,x m l 解决了数据的统一接口问题。x m l 并没有定义数据文件中数据 出现的具体规范,而是在数据中附加标签来表达数据的逻辑结构和含义。这使x m l 成为一种程序能自动理解的规范。 ( 2 ) 将运算负荷分布在客户端。即根据自己的需求选择和制作不同的应用程序 以处理数据,而服务器只须发出同一个x m l 文件。应用x m l 则将处理数据的主动 权交给了客户,服务器所作的只是尽可能完善、准确地将数据封装进x m l 文件中。 x m l 的自解释性使客户端在收到数据的同时也理解数据的逻辑结构与含义,从而使 广泛、通用的分布式计算成为可能。 1 基于x 札的标准件库的建立及应用研究 ( 3 ) 将同数据源以不同的格式表现。用户有着对同一数据源的不同需求。例 如在标准件库中,有些用户需要的是参数的浏览,而有些用户需要的参数的编辑和标 准件的调用。而不同的网络接入设备也要求数据源可以根据设备的不同发送不同的数 据。 ( 4 ) 数据的组织和管理。有两个发展方向,一与数据库的结合,形成了x m l 数据库,其中涉及到数据的转换和存储。二是x m l 文本的存储和管理。x m l 使用 的是非常简单的数据格式。可以用1 0 0 的纯a s c i i 文本来书写,也可以用几种其他 定义好的格式来书写。a s c i i 文本是几乎不会”磨损”的。x m l 在数据管理方面有着 很大的优势,这也是课题研究的地方。 1 2x l v i l 在数据管理中的作用 x m l 在数据管理方面提供了以下的能力: ( 1 ) 提供数据存储。x m l 以文件系统为手段来实现数据存储,这种存储方式使 x m l 数据可以跨平台使用。 ( 2 ) 提供对数据的直接存取访问。不需要用户关心数据的物理结构。 ( 3 ) 提供数据的模式描述。x m l 采用d t d ( d o c u m e n t t y p e d e f i n i t i o n ,文档类 型定义) 或x m ls c h e m a ( m ,模式) 来描述数据的逻辑结构。 ( 4 ) 提供应用逻辑接口。x m l 采用s a x ( s i m p l ea p if o rx m l ) 和d o m ( d o c u m e n to b j e c tm o d e l ) 定义应用编程接口,使应用程序能够访问和更新x m l 文 档的样式、结构和内容。 ( 5 ) 提供数据的安全控制。x m l 的数字签名技术保证了数据传输的安全性。 x m l 文件本身是一个文本文件,并且结构严谨,不会出现模糊不清的状况。x m l 文件是存储所有数据类型的极佳载体,因为x m l 非常标准,可以用作小程序配置文 件或者企业级数据库,具有可定制性,事实上,为了检索、复用以及重新结合数据对 象而需要管理文档各部分的任何实现都非常适合于使用x m l 。x m l 文件中的内容是 可移植数据,即具有平台无关性。x m l 和i n t e m e t 的天然结合,使它一开始就具有了 空间无关性。而x m l 的内容可定制的特点,也使其具有设备的无关性。正在到来的 后p c 时代,x m l 将扮演数据管理的核心角色。 总之,x m l 用来进行数据管理有这样的特点:具有严谨的结构、良好的可扩充 性、可定制性、平台无关性、空间无关性和设备无关性。 1 3 基于x l v l l 的标准件库的建立的意义 工业化生产的一个显著特点是大量采用标准件,机械产品的设计离不开各种标准 零件和标准组合件的使用,在c a d 系统中建立标准件、标准组合件库可以避免重复 2 南京航空航天大学硕士学位论文 性劳动、提高产品设计的效率和质量,因此许多c a d 系统都开发了内嵌的零件库, 是否带有实用的零件库已成为用户选择c a d 系统的一个重要衡量指标。 标准件库在目前的c a d 系统中占有重要的地位,u g 、p r o e 、i d e a 等c a d 系统 都具有自己的标准件库系统,但是这些标准件库往往是平台相关的,无法跨平台使用。 并且不能很好的实现标准件库的动态扩充,为此,各种标准件库系统的研究成为一个 热点。现在的标准件库系统大体分为两类: 一种是建立在某一平台上的标准件库,这种标准件库具有动态扩充、离线编辑等 多种功能,可以满足此平台的标准件库的调用和存储。但是存在标准件不能跨平台使 用的缺点,需要为不同的c a d 系统完成不同的造型和参数输入工作。 二是基于w e b 标准件库,通常是一个专业标准件库网站,它存储着许多厂家所 生产的零件的三维图纸及三维模型,在工程设计时所需要的某些零件图能够通过访问 该网站进行搜索把得到的图纸文件下载到本地计算机直接使用。这样提高了效率。但 是这种基于w c b 标准件库通常还是起一个标准件的网络存储的作用,真正的网络检 索和网络调用还很不成熟。并且存在维护困难、崩溃不易恢复的问题。 为此,课题依托于成都飞机工业有限责任公司的型号工程专用机床夹具项目,进 行了基于x m l 标准件库的建立及应用研究。即以x m l 来进行标准件数据的组织和 管理,使x m l 成为标准件数据交换的标准,以满足建立与c a d 系统无关的标准件 库的要求。系统采用了参数数据和“种子零件”分离的机制,并以x m l 来进行标准 件数据的表示和管理。参数文档能够在不同的c a d 系统使用,即既可以在专业的标 准件系统使用,也可以和网络结合,建立基于w e b 的标准件库,而不同系统可以采 用不同的“种子零件”。建立基于x m l 的标准件库,能够有利于标准件库的扩充和 修改,有利于标准件库根据不同需要来表现,有利于企业间信息的交流,从而使标准 件得到更加广泛的应用。 1 4 主要内容 本文共分为六章,各章的主要内容如下: 第一章绪论 本章先对x m l 进行了简要的描述,着重讲述了x m l 在数据管理中的重要的作 用,最后介绍了基于x m l 的标准件库建立的意义。 第二章x m l 数据管理技术 本章主要探讨了x m l 的数据管理技术。首先介绍了x m l 的相关的技术,后着 重研究了表格数据到x m l 文档的映射方式,从而阐明了用x m l 进行标准件数据管 理的基础。然后讨论了x m l 的数据存储方式及和元数据的关系。 第三章基于x m l 的标准件文档的设计 主要对众多的标准件和相关参数数据进行了分析归纳和抽象,使标准件参数能够 基于脚l 的标准件库的建立及应用研究 以x m l 文档的方式表示,完成了标准件参数文档的模式设计及其r d f 描述。 第四章基于w 曲m l 的标准件库的建立 着重讲述了基于w 曲m l 的标准件库的系统结构,设计原则及其实现。 第五章x m l 标准件库与c a d 系统的接口 讨论了基于w e b x m l 的标准件库与c a d 系统的接口模型,最后设计了其与u g 平台的接口。 第六章总结和展望 总结了全文,并对标准件库今后的发展做了展望。 4 南京航空航天大学硕士学位论文 第二章x m l 数据管理技术 2 1x m l 相关技术简介 2 1 1x m l d t d 和模式 l 、x m l d 。i 。d x m ld t d 即文档类型定义,它提出的目的是保证x m l 文档的有效性。一个文 档类型定义应规定元素清单、属性、标记、文档中的实体及其相互关系。一个d t d 只能和一个给定的x m l 文档关联。d t d 具有以下的好处: ( 1 ) 通过创建d t d ,能够正式而精确地定义词汇表。所有词汇表规则都包含在 d t d 中。凡是未在d t d 中出现的规则都不属于词汇表的一部分。许多解析器可以利 用d t d 验证文档实例的有效性。只要在文档实例中写入一条简单的声明语句,解析 器就能够获取d t d ,并将其中的内容与文档实例进行比较。 ( 2 ) x m l 创作工具也可以通过类似的方式使用d t d 。一旦选择了d t d ,创作 工具就能够实施d t d 中的规则,它根据d t d 中说明的结构,仅允许在文档中添加 d t d 允许的元素或属性。 由下面的标准件文档具体说明。 d = 1 0 d k = - 2 0 r = 10 基于x b l l 的标准件库的建立及应用研究 k = 1 2 叫参数系列 叫参数系列 此文档的d t d 是内部的,包含在x m l 文档的前导说明部分,d t d 也可以是外部 的,作为一个外部文档被引用,而 表示定义了一 个元素类型,元素类型的名称是“尺寸信息”,元素类型是一个混合元素类型。实际 上,元素的类型定义有四种方式: ( 1 ) 空元素类型。定义方式: ( 2 ) a n y 元素类型。定义方式: ( 3 ) 父元素类型:这类元素中可以包含子元素,在d t d 中通过正则表达式规 定子元素出现的顺序和次数。 ( 4 ) 混合元素类型:即上面的x m l 文档的元素。定义方式: 表示生命了一个元素的 属性,其中参数系列是元素,而类型系列是此元素的属性。 2 、x m l 模式 x m l 模式( s c h e m a ) 是伴随着x m l l 0 规范的制订而推出的,从s c h e m a 的第 一个方案到现在为止,w 3 c 成员共提交了五个s c h e m a 规范,分别是x m l d a t a 、 d c d ( d o c u m e n tc o n t e n td e s c r i p t i o nf o rx m l ) 、s o x ( s c h e m af o ro b j e c t o r i e n t e d x m l ) 、d d m l ( d o c u m e n td e f i n i t i o nm a r k u pl a n g u a g e ) 和x m ls c h e m a 。直到现在, 关于s c h e m a 还没有一个正式推荐标准,它仍处于不断修改完善的过程当中。 对于上述的x m l 文档,可以把其中的d t d 用s c h e m a 来代替,可以写作如下的形 式: s c h e m ax m l r t s = ”u r n :s c h e m a s - m i c m s o f t - c o m :x m l :d a t a 。 x m l n s :d t = ”u r n :s c h e m a s m i c r o s o f t c o m :d a t a t y p e 南京航空航天大学硕士学位论文 e l e m e n tt y p e = ”主参数”m i n o c c u r = ”1 ”m a x o c c u r = ”1 ”胁 e l e m e n tt y p e = ”辅助参数”胁 a t t r i b u t et y p e = ”系列类型”今 e l e m e n tt y p e = ”参数系列”肛 d = l o d k = 2 0 r = lo k = 1 2 d t d 作为x m l1 0 规范的重要组成部分,对于x m l 文档的结构起到很好的描 述作用。但是,它具有一些缺点,比如,它采用了非x m l 的语法规则、不支持数据 类型、扩展性较差等等。s c h e m a 正好解决了这些问题。从总体上讲,s c h e m a 具有以 下优点: ( 1 ) 一致性:s c h e m a 使得对x m l 的定义不必再利用一种特定的形式化的语言, 而是直接借助) 口帆自身的特性,利用x m l 的基本语法规则来定义“l 文档的结 构,使得x v l l 达到了从内到外的完美统一,也为x m l 的迸一步发展奠定了坚实的 基础。 ( 2 ) 扩展性:s c h e m a 对d t d 进行了扩充,引入了数据类型、命名空间,从而 使其具备较强的可扩展性。 ( 3 ) 互换性:利用s c h e m a ,我们能够书写x m l 文档以及验证文档的合法性。 另外,通过特定的映射机制,还可以将不同的s c h e m a 进行转换,以实现更高层次的 数据交换。 ( 4 ) 规范性:同d t d 一样,s c h e m a 也提供了一套完整的机制以约束x m l 文档中 7 基于x m l 的标准件库的建立及应用研究 置标的使用,但相比之下,后者基于x m l ,更具有规范性。s c h e m a 币1 用元素的内容 和属性来定义x m l 文档的整体结构,如哪些元素可以出现在文档中、元素间的关系 是什么、每个元素有哪些内容和属性、以及元素出现的顺序和次数等等,都非常清楚。 正是由于s c h e m a 具有这些优势,所以本文以后的x m l 的有效性都是用s c h e m a 来 控制。 2 1 2x m l d o m x m l d o m 结构将x m l 文档的内容实现为一个对象模型。w 3 c 提出了两个d o m 文档l e v e l1 和l e v e l 2 文档。w 3 cd o m 是一种独立于语言和平台的定义,即:它 定义了构成d o m 的不同对象的定义,却没有提供特定的实现,实际上,它能够用任 何编程语言实现。例如,为了通过d o m 访问传统的数据存储,可以将d o m 实现为 传统数据访问功能之外的一层包装。利用d o m 中的对象,开发人员可以对文档进行 读取、搜索、修改、添加和删除等操作。d o m 为文档导航以及操作h t m l 和x m l 文档的内容和结构提供了标准函数。微软的d o m 实现完全支持w 3 c 标准,并且还 有许多使程序更容易访问x m l 文件的新增特点。 要使用d o m ,需要创建一个x m l 解析器( x m lp a r s e ) 的实例。微软公司在 m s x r n l d l l 中创建了一系列标准的c o m 接口来使创建实例变得可能。m s x m l d l l 中包 含了类型库和可应用的代码,可以用来处理x m l 文件。 要使用可实现脚本的客户端,比如v b s c 邮t 和m ,可以使用c r e a t e o b j e c t 方法 来得到解析器的实例。 s e to b j p a r s e r = c r e a t e o b j e c t ( ”m i c r o s o f t x m l d o m ”) 使用a s p ( a c t i v es e r v e rp a g e ) ,可以使用s e r v e r c r e a t e o b j e c t 方法。 s e to b j p a r s e r 2 s e r v e r c r e a t e o b j e c t ( ”m i c r o s o f t x m l d o m ”) d o m 中最基本的对象是n o d e 。从n o d e 中又派生出许多类型的n o d e 。所有的 n o d e 组成一个文件树,它包含了x m l 的几乎全部信息。 在结构化的x m l 文档中,信息是经过层次化的树形结构图组织的,所以x m l 文档的模型也是树形的。由d o m 创建的节点树是x m l 文件内容的逻辑表示,它显 示了文件提供的信息,以及他们之间的关系,而不受x m l 的语法限制。 例如如下的一个x m l 文档: 1 0 2 0 吲尺寸信息 当此文档加载到内存的时候,形成一个d o m 树。 图2 - 1 文档的d o m 树 如图所示,在d o m 中,文档的逻辑结构类似于一颗树。文档、文档中的根、元 素、元素内容、属性等都以对象模型的形式表示的。通过此d o m 树,就可以实现 x m l 内容的遍历、搜索。 2 2 表格数据到n m l 的映射 在标准件库系统的建立工程中,最常遇到的就是参数图表。如图2 1 所示,其中 d 为公称直径,d k 为铆钉头直径,k 为铆钉头厚度,r 为连接铆钉头和圆柱部分的半 径,r 为铆钉头半径。以下章节出现表格字母代号不再赘述。 表2 1 半圆头铆钉参数表 d1 21 41 61 82 02 22 42 7 d k2 0 2 42 83 03 43 84 24 7 k89l o1 21 41 61 72 0 ro 50 5o 5o 5o 80 8o 80 8 r1 1 1 2 51 5 51 6 ,51 82 0 2 2 2 6 基于x m l 的数据表存储模式的建立应遵循如下基本原则:通过自定义标记来描 述数据表的组成元素,通过标记之间的嵌套关系来描述数据表的组织结构。假设数据 基于) a 儿的标准件库的建立及应用研究 表p h n 个元素组成,记为( 元素1 ,元素2 元素, ) 。在数据表中根据其中n 1 个元素确 定某个元素,如果数据表的检索步骤确定为:元素1 一元素2 一一元素n ,则对应的标 记嵌套关系应为 具体来说: 第一步:将整个表格表示成为一个 标记块。以后的所有 操作的内容都放在该两个标记之间。 第二步:将表格的第一行表示成一个 叫参数序列 标记块,并且该行 中的每一列( 以列的字段的名字作为标记名) 依次表示为如下所示的一些标记组合( 所 有这些数据都作为一个整体放在 标记中间,如下所示) 。 可参数1 叫参数2 叫参数3 吲尺寸信息 第三步:重复第二步的做法( 处理表格中的第二行数据) ,直到表中的最后一行 数据。最后将每一标记块按照对应的数据行的次序全部嵌套到 吲参数序列 中间。 第四步:在完成了数据表存储模式的设计后,可通过嵌套予标记或添加属性的方 法引入数据,如图2 2 所示。对于数据表中的区间值,可以拆分为多个嵌套子标记或者 多个添加属性。 南京航空航天大学硕士学位论文 嵌套子标记添加属性 1 2 2 0 8 m 图2 - 2 引入数据的两种方式 很显然这种映射的方法是可逆的,任何一个标准件参数表格可以转变成一个 x m l 文件,任何一个如上结构的x m l 文件也能唯一地转变成一个标准件参数表格。 在这种算法基础上,一个标准件参数库可以唯一的转变成一组x m l 文件,同样一组 x m l 文件( 和上面例子程序一样的文档结构) 可以唯一的决定一个标准件参数库。 该映射算法为标准件参数库的建立提供了必要的理论依据。 2 3x m l 的数据存储 x m l 文档的存储,可以有三种方式: ( 1 ) 纯文本。直接存储在操作系统本地文件系统中的纯文本文件 ( 2 ) 关系数据库。例如o r a c l e 、s q ls e r v e r 。 ( 3 ) 对象数据库。以文档对象模型d o m 的形式存储文档 ( 4 ) 目录服务系统。例如微软的活动目录系统。 2 3 1x m l 的文本存储 文本文件是最简单直接的存储方式,它与数据被理解的方式一致,自然地反映了 对象之间的嵌套和所属关系。以下的图表示了x m l 数据的文本文件存储方式。 基于) m 。的标准件库的建立及应用研究 叫参数系列 叫参数系y f j 叫尺寸信息 直接把此文本文件存储到操作系统的本地盘里面,这种做法有如下的特点 ( 1 ) 方便直接,不需要转换。 ( 2 ) 文本的备份和存储简单,恢复效率高。 ( 3 ) 定制性好,方便编辑和修改。 ( 4 ) 存储粒度较大,不利于对存储数据的检索。 ( 5 ) 安全性依靠本地操作系统的安全等级。 ( 6 ) 在分布式环境下网络通信的代价很高,数据共享困难。 2 3 2x m l 的数据库存储 x m l 作为数据交换的标准,更着重于统一数据格式。因此在x m l 应用中,数 据库作为数据管理的仍然占有重要的位置。 x m l 数据本身的树形结构不同于关系模型中的二维表结构,这种差别反映在数 据库产品处理x m l 数据的技术上,形成两大阵营:x m l e n a b l e dd b m s ( d ) 和 n a t i v ex 【ld b m s ( n x d ) 。 x e d 是在原有数据库基础上扩展了x m l 支持模块,完成x m l 数据和数据库之 间的格式转换和传输。从存储粒度上,可以把整个x m l 文档作为r d b m s 表中一行, 或把x m l 文档进行解析后,存储到相应的表格中。为了支持w 3 c 的一些x m l 操作 标准,如x p a t h ,x e d 提供一些新的原语( 如o r a c l e 9 i r 2 增加了一些数据包来操作 x m l 数据等) ,并优化了x m l 处理模块。 n x d 则出现在x m l 数据处理领域内,一般采用层次数据存储模型,保持x m l 文档的树形结构,省掉了x m l 文档和传统数据库的数据转换过程。 x e d 在处理x v i l 存储的时候有两大困难: ( 1 ) x m l 文档模式和x e d 模式的映射。为了把x m l 文档存到x e d 中,必须 将x m l 文档的模式( d t d 或x m ls c h e m a ) 映射到数据库模式。同样,将数据从 x e d 取出来重新组合成x m l 文档,要完成相反的操作。这种转化发生在元素 1 2 南京航空航天大学硕士学位论文 ( e l e m e n t ) ,属性( a t t r i b u t e ) 和文本( t e x t ) 上。由于x e d 注重的是数据而非格式,所以在 这个过程中,m 。文档的大部分物理结构( c d a r a 、实体等) 和一部分逻辑结构( 处 理指令、注释等) 都被忽略,而数据被保存。这种转换可能会丢失信息,一个x m l 文档存到x e d 里后再取出来,可能会变成另外一种格式。x e d 只能在数据层面实现 信息的保留。 ( 2 ) 由于x m l 文档模式和x e d 模式很难保持一致,所以在存取过程中经常用 x s 【t 完成转换。但x s l t 非常耗时,这会对查询性能造成很大影响。所以有些x e d 提供自己的查询语言来返回x m l 文档。 n x d 在处理x m l 存储的时候也有困难: ( 1 ) 在传统数据库技术方面比较薄弱,没有经过时间的考验。 ( 2 ) 知识比较新,相应的支持人员和文档资源都比较少。 正是由于x m l 的数据库存储在理论或者实际操作中的困难,因此,对于课题中 要解决的x m l 存储问题,使用了x m l 的文本存储方式,在存储的时候对文件名做 好定义,并且目录结构采用的树型结构与下面要讲到的标准件分类相匹配。由于标准 件文档的有限性和层次存储,在存储上属于小数据量的操作。所以,以文本存储标准 件文档是可行的。 2 3 3x m l 数据的权限控制 由于采用了文本存储,所以在使用中不可避免的遇到了文本的操作权限问题。为 此,这里采用了这样的方式,即在x m l 文档中加入权限控制的属性。如下: 参数d = ”1 2 ”胁 参数d k = ”2 0 ”肛 参数k “8 ”胁 基于x m l 的标准件库的建立及应用研究 叫尺寸信息 在加入权限控制属性后,可以通过a s p + d o m 的方式进行权限属性的解析,在 用户进行相应的操作的时候,首先验证该用户的用户组,与该x m l 文档的浏览等级 比较后,通过验证才可以进行响应的操作。 2 4 元数据和x m l 2 4 1 元数据的概念和特点 元数据( m e t a d a t a ) 是关于数据的数据和关于信息的信息,是面向某种特定应用 的用于描上资源属性的机器可理解的信息。通过规范定义语法结构和语义结构,使得 机器能够无二义地表现和获取信息。元数据可用于w e b 资源的标识、集成、交换、检 索等工作。利用元数据机制,可以更加精确地描述w e b 资源的语义,从而使得w e b 数 据从机器可读转化为机器可以理解的跨越,而w e b 的职能也实现传统的w e b 向语义 w e b 的真正转变。 元数据具有如下基本特点: ( 1 ) 元数据可以作为其描述对象的一个固有、内在的部分,也可以独立于该对象。 如d u b l i nc o r e 作为嵌入的m e t a 标记与h t m l 文本成为一体,而t e i h e a d e r 既可伴 随t e i 文本,又可作为单独的数据单元存在。 ( 2 ) 元数据创建者可分为三类:创建者在创建资源时可嵌入元数据以便资源被检 索系统发现和组织;信息资源系统管理者也可创建元数据来描述和组织自己的资源;提 供信息服务的信息网关( i n f o r m a t i o ng a t e w a y ) 也可创建元数据。 ( 3 ) 元数据一经建立,便可共享。而且元数据在使用过程中可由本地信息管理员、 专业信息网关服务,或基于搜索引擎的索引服务等给该元数据增加新的属性。 ( 4 ) 元数据的结构和完整性依赖于信息资源的价值和使用环境。基于搜索引擎 的系统提取元数据通常是自动而简略的,由专家或专业信息网关提供的元数据则精细 而复杂。 ( 5 ) s g m l x m l 是元数据的主要编码语言。x m l 的可扩展性和结构性优势 使得很多元数据标准采用x m l 编码,立l :l c d f ,r d f 和w e bc o l l e c t i o n s 。 ( 6 ) 由于各类资源之间的差异性,使得各类元数据标准彼此不能兼容,符合某 种标准规范的元数据不能被其他规范接受,给元数据的发展带来了不利的影响。 1 4 南京航空航天大学硕士学位论文 2 4 2 元数据的模式和x m l 前面已经提到,各类元数据标准彼此很难兼容,而由w 3 c 提出的x m l 的开发应 用使各类元数据标准的互通成为可能。h t m l 获得巨大成功的原因在于它的简洁和方 便利用,但h t m l 并不能提示信息资源的本质,例如,按索引擎能找到上千上万条匹 配的h t m l 信息,但实际上真正符合用户意图的信息却很少;而s g m l 是一种元标识 语言,是独立于各平台、能在不同系统和不同国家同等使用的语言,由于它确定了一 套严格一致的、独立于平台之间表达信息资源的格式,形成一种庞大的、复杂的、功 能强大的语言,不但成为正式的国际标准,而且至今仍是大量复杂文档交换的事实际 准,但s g m l 标记语言极其复杂和精密,w e b 浏览器解释其语法规则的工作量过大, 限制了它在w e b 中的广泛应用,难以达到象h t m l 在w e b 中的成就,并不适应网络的 需要。针对此,1 9 9 8 年2 月w 3 c 正式发布了x m l 标准,实际上,x m l 也是一种元语言, 它提供了与供应商无关的。可由用户扩展的、可进行有效性检验的标记语言体系,它 不仅提供了可读性,还具有表达复杂结构的能力。为了使各类标准的元数据能实现共 存共用,以满足各应用领域的需要。 元数据模式( m e t a d a t as c h e m e ) 指明了元数据之间的结构和语义关系,它的组成 成分可以是元数据或者模式。现存元数据模式标准有许多,与x m l 有关的元数据模 式,如:x m ld t d 、x m ls c h e m a 和r d f 等。它们都是可以用来描述w e b 资源的元 数据模式。模式能够定义数字资源的结构和语义等关系,还允许对内容的自动检查和 对元数据的有效性验证。通常元数据集合仅定义了描述最基本的数据特征的元数据成 分:而模式可用来对结构上更加复杂、语义上更加丰富的元数据进行定义和组织。 与x m l 相关的儿个元数据模式的比较: ( 1 ) x m l d t d :用于描述文档结构的约束关系,但其语义的表达能力比较弱。 ( 2 ) x m ls c h e m a :相对于x m ld t d ,其中增加了许多以前没有的数据类型、 名字空间的集成、结构模式、继承和模式的验证等。 ( 3 ) r d f :r d f 的语义描述能力最强,具有元素和属性的继承机制,可以实现 共享和扩展,是当前w 3 c 所提倡的标准、规范中可现成使用的技术规范之一。 1 9 9 9 年,w 3 c 发布的一种基于x m l 语法的元数据规范r d f ( r e s o u r c ed e s c r i p t i o n f r a m e w o r k ) ,即资源描述框架,目的是为元数据在网络上的各种应用提供一个基础结 构,使应用程序之间能移通过网络实现数据的交换和处理。r d f 是使结构化元数据很 容易编码、交换和再利用的基础结构,它主要通过基于x m l 语法的明确定义的结构 化约定来建立语义和语法之间的桥梁,以促进元数据之间的可操作性,r d f 本身并不 规定语义,但它为每一个资源描述体系提供一个定义反映其特定需求的语义结构的能 力,使不同的用户或团体能够在这一框架下定义各自的元数据元素。由于r d f 在利用 x m l 严谨结构的基础上,采用了避免语义二义性的结构,从而为标准的元数据的编 基于x i d l 的标准件库的建立及应用研究 码、交换及机器自动处理提供了保证,是一个开放的元数据框架。在前面所探讨的三 种x m l 元数据模式中,r d f 无疑具有更强的语义表达能力。 2 4 3r d f 的模型及标准件文档描述 r d f 的基础就是用来表现命名的属性和值的模型。r d f 属性可以看作是资源的特 性,这类似于通常的属性值对。r d f 属性也表示资源之间的关系,因此r d f 模型就象 一个表示实体关系的示图。更准确地说,作为r d f 数据模型的实例的r d fs c h e m a ( i u ) f 大纲) 是e r 图。在面向对象的设计申,资源对应于对象而属性对应于实例变 量。 r d f 数据模型是一种语法中立的方式来表示r d f 的表达式。数据模型表现用来衡 量表达式的实际含义。如果两个r d f 表达式的数据模型表现一致那么他们的含义是 相同,即使表达式中的语法变量可能有差异。 基本的r d f 数据模型包括3 种对象类型: ( 1 ) 资源( r e s o u r c e ) r d f 表达式中描述的所有事物都称为资源。一个资源可能是整个网页,也可能是 网页中的一部分,比如特定的文档中h t m l 、x m l 元素;资源也可以是一些网页的 集合,比如整个网站中所有的网页:资源也可能是不能直接通过w e b 仿问的对象:比 如打印的书目。资源的命名是通过u r j 加上一个可选的定位i d 来表示德。u r i 的扩展 性允许表示任何可以想象的实体。 ( 2 ) 属性( p r o p e r t y ) 属性是用来猫述资源的具体方面、特性或相互的关系等,每个属性有特定的含义, 规定其允许值;定义能够描述的资源类型以及与其他属性的关系。在r d f 大纲标准有 对如何表述属性特征的详细规定。 ( 3 ) 声明( s t a t e m e n t ) 一个有属性及其值的特定资源称为r d f 声明。是一个被称为“三元组”的数学 模型。其中的3 个部分分别称主语( s u b j e c t ) 、谓词( p r e d i c a t e ) 和宾语( o b j e c t ) 。主语 表示资源,谓词代表规定了名称的属性,而宾语则是属性的具体值。声明对象可以是 另外一个资源。也可以直接字面表示其内容。即可以是用u r 规定的资源或是简单的 一个宇串或者是其他由x m l 定义的原始数据类型。如标准件库其中的一个在线的 x m l 文档。如图2 3 : 1 6 南京航空航天大学硕士学位论文 厂 l 主语卜、爵一宾语l 谓词 图2 3 一个声明( s t a t e m e n t ) 的结构 例如: j i a b a oz h o ui st h ec r e a t o ro f t h er e s o u r c eh t t p :w 州1 i b p a r t c o m p a r t i n f o h t m l 该句子有下面三个部分: ( 1 ) 主语( s u b j e c t ) :h t t p :v 删1 i b p a r t c o r n p a r t i n f o h t m l ( 2 ) 谓词( p r e d i c a t e ) :c r e a t o r ( 3 ) 宾语( o b j e c t ) :j i a b a oz h o u 可用r d f 的有序对表示如下: ( c r e a t o r ,h t t p :v m w 1 i b p a r t c o r r d p a r t l n f o h t m l ,j i a b a oz h o u ) 也可以把这个资源用图2 4 来表示: (!d型:libqbl;qr_;h:,o。o。l 迫芝竺兰兰 呀”怕。 i := 图2 _ 4 标准件库文档声明的例子 再进一步,把属性的特性加入,例如: a nb i gm a i lw h o s er l a n l ei sj i a b a oz h o u ,p h o n e4 8 9 1 0 0 0 ,i st h ec r e a t o ro f t h er e s o u r c e h t t p :w w w 1 i b p a r t c o m p a m n f 0 h a r d 该旬使得c r e a t o r 成为一个结构化的实体。在r d f 中,这样的一个实体被表示为另 个资源。上句没有对其命名,则是匿名的因此图2 5 中用一个空的椭圆形来表示。 图2 5 一个在线标准件库文档的语义图 基于x 1 _ i l 的标准件库的建立及应用研究 r d f 的一个特点就是语法独立性,因此两段看起来差异很大的r d f 声明,事实上 可能是描述相同的一件事,这是因为r d f 是一个抽象的资源模式。 由于这个抽象的特点,各种不同的元数据( 如都柏林核心集) 都可利用这种抽象 的资源模式,来表达他们的内容。 若将描述同一个资源的众多属性的有序对集结起来,即成为r d f 的“断言” ( a s s e r t i o n ) ,例如描述网页h t t p :w w w ,l i b p a r t c o m p a r t i n f o h
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 修理厂试用期合同样本
- 公司运营投资合同样本
- 2025微型工厂租赁合同样本
- 专业分包总价合同样本
- 买卖公司车合同样本
- 2025年土地买卖合同无效案例分析
- 代理车辆贷款合同范例
- kv制作合同标准文本
- 不签用人合同标准文本
- 丝网合同样本
- JT-T-1045-2016道路运输企业车辆技术管理规范
- FZ/T 50009.1-1998三维卷曲涤纶短纤维线密度试验方法单纤维长度测量法
- ManagementInformationSystem管理信息系统双语教学课件
- 气候类型气温降水分布图
- 小学生飞机知识科普课件
- 交通运输有限责任公司安全生产费用提取使用制度
- 德阳巴蜀文化介绍
- 三年级下册数学课件-4.1 整体与部分 ▏沪教版 (23张PPT)
- 住 用 房 屋 租 金 计 算 表
- 7.4.2超几何分布 课件(共14张PPT)
- 晶状体相关的继发性青光眼进展课件
评论
0/150
提交评论