版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、本科生毕业论文(设计)论文(设计)题目:基于xml的web查询技术研究 系: 信息管理系毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学
2、校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位
3、论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日指导教师评阅书指导教师评价:一、撰写(设计)过程1、学生在论文(设计)过程中的治学态度、工作精神 优 良 中 及格 不及格2、学生掌握专业知识、技能的扎实程度 优 良 中 及格 不及格3、学生综合运用所学知识和专业技能分析和解决问题的能力 优 良 中 及格 不
4、及格4、研究方法的科学性;技术线路的可行性;设计方案的合理性 优 良 中 及格 不及格5、完成毕业论文(设计)期间的出勤情况 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前
5、的内画“”)指导教师: (签名) 单位: (盖章)年 月 日评阅教师评阅书评阅教师评价:一、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格二、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)评阅教师: (签名) 单位: (盖章)年 月 日教
6、研室(或答辩小组)及教学系意见教研室(或答辩小组)评价:一、答辩过程1、毕业论文(设计)的基本要点和见解的叙述情况 优 良 中 及格 不及格2、对答辩问题的反应、理解、表达情况 优 良 中 及格 不及格3、学生答辩过程中的精神状态 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文
7、(设计说明书)所体现的整体水平 优 良 中 及格 不及格评定成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)教研室主任(或答辩小组组长): (签名)年 月 日教学系意见:系主任: (签名)年 月 日基于xml的web查询技术研究摘 要www是目前使用最为广泛的internet信息服务系统,它为用户提供了一个搜索和浏览信的工具。但www是一个信息的海洋,数亿万计的web文档散布在世界各地的成千上万个web服务器上,并且每个服务器自主管理自己的资源,没有一个统一的管理机制。总体状况是,整个网络上资源丰富,内容庞杂,很难实现数据的共享,亦不能进行有效地查询。xml的出现为解决上述问题提供了
8、理想的解决方案。xml全称为extensible markup language,即扩展标记语言,是sgml(standard generalized markup language)的一个简化的而又严格的子集,它是特别为web应用设计的,xml是一个在互联网上进行数据交换的理想工具。由于xml能够使不同来源的结构化的数据很容易地结起,从而使搜索多样的不兼容的数据成为可能,为解决web查询问题带来了希围绕着基于xml的web查询技术涉及到的几个主要问题展开研究与讨论:1.针对web上的数据格式差异大、数据来源差别大及当前的数据模型不能很好地描述web上数据的缺点,研究和探讨了web上的数据模型
9、-xml数据模型。2.解决异构数据的集成问题。由于异构数据的集成主要是异构关系数据库中数据的集成。所以本文采用了基于“中间模式”的方法进行数据的集成,将关系数据库中的数据转换为通用的xml格式的数据,从而更好地实现数据的共享。3. 利用xml数据模型在半结构化数据表示和查询方面的优势,通过基于xml查询语言xml-ql实施web查询。在xml出现以前,面向web数据查询是一项复杂的技术。通过本文的研究方法,如果通过xml数据模型描述web上的数据,把不同来源的结构化的数据转换成xml格式的数据,就能够方便的实现数据的共享和进行精确、有效的信息查询,将极大的简化复杂性,提高工作效率。关键词:xm
10、l;web查询;半结构化数据;数据模型based on xml web inquiry engineering researchxxx(undergraduate classes of information management and information system subject of 2003 grade , college of longqiao,lanzhou commercial college)abstractwww is the most widely used information scivice system on the internet。it offers a
11、 tool to search and hi uwse information. but www contains too much information.and billions of pages located on thousands of servers in different palaces in the world. every server manages its own resources, and does not follow one standard managing mechanics. in general, there are wealthy of variou
12、s resources on the net, which can not be shared anc queried effectively.the emergence of xml provides a resolution to the above-mentioned problem the full name of xml is extensible markup language.it is a simplified and restricted stbset of sgml, particularly devised for web application. xml is an e
13、xcellent tool for data exchange on the internet. due to its capability to combine structured data with different sources, xml makes it fossible to retrieve data from different and incompatible database servers, and brings hopes for web data query. this article focus on these following problems: 1. c
14、onsicering the big difference of data format and data sources on the web, we made research and discuss on the web data model -xml data model. 2. to resolve the problem of integration of data with. different structure. because the integration problem mainly focus on the integration of different struc
15、tured rdbms, this article adopted mediated schema and transformed the data in rdbms into xml data source. therefore, better sharing of data can be ealized. 3.making full use of the advantages of using xml data model in semi-structured data representation and query,we can carry out dataretrieving que
16、ries from xml data resources on web by using xml-ql. before the emergence of xml,web-oriented data query is a complex technique. through the research in this article if we represent web data by xml data model and transform the structured data from different data source into xml data format sources w
17、e will realize data sharing and carry out exact and efficient data query,which will simplify ourwork and enhance efficiency greatly.key words:xml, web query, semi-structured data, data model目录一、引 言(7)二、基于xml的web查询技术研究(8)1 web查询涉及的几个主要问题(8)2 web上的数据模型-xml数据模型(9)3 异构数据库的集成(20)4 基于xml的web查询(29)三、结 论(44
18、)参考文献(45)基于xml的web查询技术研究一、引 言随着互联网的普及,网络已成为人们获得信息的主要途径和重要手段网络资源丰富,闷容庞杂,网络上的数据能否很好地得到共享成为影响网络发展的个重要因素但就目前来看,我们日常用到的数据大部分是无结构的文档和完全结构化的关系数据库中的数据,如果把这些数据放在互联网上很难实现数据的共享为此,必须改变当前数据格式的多样性和共享性差的缺点,用一种统一的数据格式来表示数据,从而实现数据在互联网上更大范围内的共享。如果能够把不同来源的结构化的数据比较容易地结合在一起,将使搜索多样的不兼容的数据库成为可能,从而为解决web 数据查询难题带来了希望。xml的出现
19、为解决上述问题提供了理想的解决方案。它是特别为web应用设计的,它是针对于html和internet 的标准的、可扩展的、通用的数据格式。xml保留了sgml可扩展性、结构性以及数据确认方面的主要优点,它的灵活性允许表示各种各样的信息,而这些信息是自我描述的,所以xml表示的结构化的数据可以被那些没有关于这些数据的知识的软件来处理,实现数据在互联网上更大范围内的共享。xml是一种半结构化的数据模型,xml的文档描述的语义非常清楚,它的可供操作的基础要比html好得多,而且很容易就可以将之和关系数据库中的属性一一对应起来,能够支持实施十分精确有效的查询。本文围绕着基于xml的web查询技术涉及到
20、的几个主要问题展开研究与讨论:1.针对web上数据的自身特点,研究与探讨了适于表示web上数据的数据模型xml数据模型;2.为了更好地实现web数据的共享,本文给出了从关系数据库中结构化的数据向xml格式数据的转换方法,解决异构数据的集成问题;3. 利用基于xml的查询语言xmlql实施web上xml数据源的查询。二、基于xml的web查询技术研究1 web查询涉及的几个主要问题web上有海量的数据信息,怎样对这些数据进行有效的应用成了现今数据库技术的研究热点。所谓数据查询,就是从大量的数据中发现真正需要的内容,解决数据的应用质量问题。如何充分利用有用的数据,废弃无用的数据,是web数据查询所
21、面临的一个难题。相对于web的数据而言,传统的数据库中的数据结构性很强,数据为完全结构化的数据,而web上的数据是半结构化数据。所谓半结构化是相对于完全结构化的传统数据库的数据而言。显然,面向web的数据查询比面向单个数据仓库的数据查询要复杂得多。web查询涉及的几个主要问题是:1.1 寻找一个描述web上数据的数据模型web上的数据与传统的数据库中的数据不同,传统的数据库都有一定的数据模型,可以根据模型来具体描述特定的数据。而web上的数据非常复杂,没有特定的模型描述,每一站点的数据都各自独立设计,并且数据本身具有自述性和动态可变性。web 上的数据具有一定的结构性,但因自述层次的存在,从而
22、是一种非完全结构化的数据,这也被称之为半结构化数据。半结构化是web上数据的最大特点。要解决web上的异构数据的集成与查询问题,就必须要有一个模型来清晰地描述web上的数据。针对web 上数据的半结构化特点,寻找一个描述半结构化数据的数据模型是解决问题的关键所在。1.2 通过web上的数据模型实现异构数据库数据的集成从数据库研究的角度出发,web上信息的来源主要是从不同的数据库中提取。如果要想充分利用这些数据进行有效地数据查询,就必须解决异构数据的集成问题,用一种统一的数据格式表示数据。只有将各个异构数据源的数据都集成起来,提供给用户一个统一的视图,才有可能从巨大的数据资源中获取所需的东西。1
23、.3 高效、准确的web查询通过使用web上的数据模型对异构数据进行“改造”,达到数据表示的统一性和一定程度上的结构化,从而实现高效、准确的web查询。下面就从web查询涉及的几个主要问题展开研究与讨论。2. web上的数据模型xml数据模型2.1 结构化数据模型的特点传统的数据库都有一定的数据模型。描述数据库的数据模型一般是结构化的数据模型,主要分为第一代的层次网状数据模型、第二代的关系数据模型、第三代的面向对象数据模型。这模型能很好地描述特定的数据,同时可以很好地定义和解释相关的查询语言。面向传统数据库技术直接应用网络数据的困难在于,网上数据缺乏统一固定的模式,数据往往是不规则并且经常变动
24、,在这种情况下如何来解决异构数据的集成和数据查询问题呢?这就迫切需要有一个模型来清晰地描述internet的数据。针对internet上的数抓半结构化的特点,寻找个半结构化的数据模型则成为了解决上述问题的关键所在由于xml数据模型的无模式及自描述的特点适于描述网上数据,所以研究这种新类型数据的半结构数据模型应运而生。2.2 xml数据模型半结构化数据模型的研究对数据库界来说是个全新的领域,早在1995 年,斯坦福大学己经开始了相关方面的研究。但当时研究的重点还没有真正面对web,而主要研究的是异构数据环境,因为在异构环境中的数据已经存在这种半结构化的特征。后来随着internet的发展,web
25、上的数据半结构化特征日渐明显,这一问题也就扩展到web领域,最终提出了针对web数据的模型司题。相关的研究工作在1997-1998 年间取得了一些结果,提出了诸如websql、wboql、 weblog、struql、llixes 、lorei等大约一二十种的查询语言。基于一web上的内容查询主要有两个含义,一是页面内容的查询,二是页面与页面之间链接的查询,而像页面之间链接的这种关系我们则称之为路径表达。由于当时的web都是基于html实现的,而html在路径表达的实现上难度很大。因为html实际上只提供了如何在浏览器中显示信息的方式而没有反映数据本身所包含的语义,所以要想真正做到准确、高效地
26、查询数据,十分困难;所幸的是,近年来新涌现出了xml,它最大的特点在于其tag是具有语义的,是由用户定义的,能够反映一定的数据的含义。al的出现给做数据库研究的人带来了很大的惊喜。从某种意义上说,xml就是一种半结构化的数据模型。xml的文档描述的语义非常清楚,而且我们很容易就可以将之和关系数据库中的属性一一对应起来,能够支持实施十分精确的查询。xml格式数据是一种自描述的半结构化数据。xml文件本质上是保存信息的结构化载体为了得到xml文件的有效性,需要确定文件中信息必须遵守哪些结构。这是通过schema来实现的,schema是一种描述xml文件中信息结构的模型。在xml中,schema被用
27、来建立某类数据的模型。一旦数据模型适合特定的数据类,我们就可以创建遵守该模型的结构化xml文件。dtd是建立xml文件的schema的一种方法。xml数据模型中xml文档的结构按照xml图来组织。xml图是一种非常灵活的数据模型图的结点表示属性,图的每一个边用元素标签标识。通常,xml图包含以下内容:1. 图的侮一个顶点用一个唯一的字符串标识,称为对象标识(oid) 2. 图的边用元素标签标记3. 图的结点用一组属性值来标记4. 图的叶结点用值(或字符串)来标记5. 图有一个根结点为了更有效地进行xml数据的处理,学者们提出了许多关于xml数据模式描述的方案,其中最主要的是文档类型定义dtd。
28、与半结构化数据的模式相比,dtd的优点是它的正则语法支持定义半结构化的数据。如:说明元素e由一个子元素a,可选的子元素b, 要求出现或连续出现多次的子元素c组成。要讨论xml的模型图,首先定义一个xml文档的dtd,假定xml文档放在d: bib.xml, 这个dtd规定元素bib中包含多个bok 元素、每一本书(book )包含一个或多个作者元素、一个标题元素、一个出版商元素、一个出版年月属性。文章(article) 的dtd也是相似的,但它的出版年月是可选的,它省略了出版商,但包含了类型属性,一个出版商包含了名字和地址元素,作者元素包含了可选的名和必须有的姓。假定所有的数据类型是字符串型。
29、该dtd限定了数据是怎样组织的。事实上,xml模型的元素顺序可以是任意的。数据模型并不要求元素的顺序必须与xml文档中的次序一致。如下述两个表示等价:1. bok 元素内的最开始部分是注释。2. 作者名放在书名的前面。3. 每一个作者的名放在姓前 $f $1 等价于: $1 $f 对于上述的dtd,假定有以下事实:1. bok 元素内的最开始部分是注释。2. 作者名放在书名的前面。3. 每一个作者的名放在姓前xml非常适合描述分布的、多态的、动态改变的web数据,数据与xml图之间的对应非常简单。下面是一个xml的数据模型图,该模型图中的数据的类型和结构与前面定义的dtd一致。图1 xml数据
30、模型图通过该模型图可以很容易的实现数据从xml模型图到xml文档的转换,转换成的xml文档如下: date anintroductionto database systems adision-wesley模型允许同样两个结点之间有多条边相连,但必须用不同的标签标识。为了支持元素的共享,xml可以为一个元素指定一个id属性值来唯一地标识元素,同时可以为一个元素指定一个引用idref属性来引用已存在的多个元素id. 例如文档dtd中有以下id属性和idrefs属性。其中:#required一属性是必须的;#implied一属性是可选的;在下面的xml文档片段中,两个person元素的id值分别为o
31、123和o234,元素article的作者是id值分别为o123和o234的person.。 john smith . 1995上述结构用xml模型图表示如下:图2 xml图中数据之间的引用因为仅有xml图的叶结点中包含值,并且只能表示一个值.所以,下面的xml文档片段就不能直接用数据模型表示. a trip to the moon为此,考虑用下面的片段来代替.a trip tothe moon该片段的数据模型图如下:图3 xml数据模型图其中页结点的值是它的oid。2.3 xml数据模型图向xml文档的映射通过对xml模型图的转换可以很容易地得到析可以生成 xml数据模型图.这可以从上述 x
32、mlxml文档,同样通过对xml文档的解文档与 xml模型图的映射对应关系看出.通常由于如下两条原因,xml图不是和 xml文档严格对应的。1xml数据模型中的数据是无序的,元素的顺序事先并未假定;2支持结点共享,一个结点可能和几个结点有边相连。2.4 xml数据模型中数据的存储以及索引的存储1. xml数据的存储有以下方式:(1).文本文件 是最简单,直接地存储xml数据的方式.它与数据被理解的方式一致,自然地反映了对象之间的嵌套关系,且同一个对象的数据集中存储.缺点是存储粒度大,当数据量大时不利于实现网络通信和数据共享。(2).关系数据库 存储半结构化数据或xml数据.可以利用数据库现有的
33、存储管理,并发控制,恢复,版本机制等技术有效地管理数据.该方式的欠缺是一个简单的查询路径可能要通过多重链接实现,影响了查询的效率.半结构化数据的缺乏模式和数据类型的特性也使关系数据库的一些优化存储策略(如聚集存储等)不能应用。(3).面向对象数据库 很多商业的xml服务器采用这种方式.它利用dtd给出的类型信息构造类层次结构,正则表达式的符号可由基于对象数据模型的类型表达 (如用 list数据类型表达),也可以通过创建新类实现 (如 |符号可用 union类型的类实现).该方式的数据模型更接近半结构化数据模型,并能更好地处理嵌套的集合和顺序,因此,其数据存储和查询处理可以用来提高xml或半结构
34、化数据处理的效率.问题是在数据加载时对未知的数据类型需要建立新的类对应,这样就影响了加载效率;当dtd改变时,数据模式的变动代价也很昂贵.面向对象模型虽然比关系模型更适合于表达半结构化数据和xml数据,但有快速连接性能的关系数据库也可以实现很好的性能。(4).专门的对象存储 如lore系统,它利用自己的对象管理器管理物理磁盘上的半结构数据或 xml数据对象。2.索引的存储半结构化数据索引需要处理的问题是异构原子值的索引和路径表达式的索引.不同原子值的索引可以通过强制类型转换实现.路径表达式的索引可以分为树/图结构数据的索引,受限/完全的正则表达式.相对来说,树结构的数据,如xml,其索引技术较
35、简单,并且只支持正则路径表达式的受限形式的索引更有效一些,因为较少有非常复杂的正则路径表达式.伯克利大学的xset系统就为xml数据采用了一种索引.这种索引综合了路径信息,也是树结构.索引树的节点是哈希表,索引根节点包含了数据根节点的所有出边标记,索引树的内节点对应了数据中到达某一非叶节点的标记序列,哈希表的每一项都包含了数据树中指向泪应节点的指针.这种索引结构可以有效地处理简单路径表达式, 一些更复杂的路径表达式也可以通过索引的索引来实现.斯坦福大学的dataguide系统实现了任意结构的半结构化数据的索引,它是关于半结构化数据的路径信息的一个精确,简洁的索引结构,可以有效地用来辅助建立查询
36、和进行查询优化。3. 异构数据库的集成3.1 异构数据库集成的方法web上异构数据库集成目标是支持对web上多个数据源的查询,处理大量的,数目递增的web数据源.web上异构数据库集成主要有两种方法:数据仓库方法和虚拟方法.前者是将各数据源的数据装载到数据仓库中,用户的查询基于数据仓库的数据;后一种方法基于一个 中间模式 (mediated schema),数据仍保存在局部数据源中,通过各数据源的包装程序(wrappers)将数据虚拟成中间模式,用户的查询基于中间模式,不必知道每个专门的数据源的特点,查询执行引擎直接与wrappers打交道,将基于中间模式的查询转换为基于各局部数据源的模式.虚
37、拟方法更适应于数据源数目多,各局部数据源的自治性很高且局部数据经常变化的web环境。本文数据的集成方法采用基于 中间模式的方法,将关系数据库中的数据转换为通用的xml数据源.由于从不同的关系数据库中产生xml数据源的转换方法类似,文中仅给出从一个数据库中进行数据转换的方法。3.2 用xml格式表示的数据源的优势xml是web上定义数据的通用语言, xml允许为指定的一群应用程序创建一致的数据格式,它同样也是服务器间传递数据的理想格式.用xml格式表示的数据源有以下优势:(1), xml格式表示的数据能够被唯一标记,能用于更有意义的检索.例如,用户可以指定查找一些书,书的作者是鲁讯,而不是指书的
38、内容.传统的检索将会将二者混为一谈,如果是xml表示的数据源,可以方便地被检索到.(2),基于 xml的数据是自描述的,不需要有对数据的内容描述就可以交换和处理,可以更好地实现数据的共享和跨平台操作。(3),可以更好地从离散的 xml数据源集成数据.查找多个不兼容的数据库在实践上难以实现,但是如果把各个数据库的数据转换成xml格式的数据源,通过软件代理可以很方便地把这些数据集成到中间层服务器上,在这之后,这些数据还可以被传到客户或其他的服务器上进行进一步的集成,处理和分发. (4) , xml数据源可以方便地应用于数据的多个视图.如果数据被传送到桌面上,它可以以多种方式显示.例如,xml数据的
39、购买订单对代理商可以显示得较为详细,而对于顾客来说,只需要显示简单的视图。(5),易于实现不同的粒度更新.xml数据允许不同的粒度更新,消除每次数据的一部分发生变化后就必须重传整个结构化数据的需要.只有发生变化的元素从服务器传给客户,不必更新全部用户接口就能显现发生变化的数据。xml是一种基于通用数据格式的描述语言,能够被其他应用程序方便地解析和操作.如果数据是关系数据格式,只有asp应用程序和能够使用 oledb数据源的应用程序才可以访问.而xml不同,只要客户程序能够解析xml的结构,就可以访问关系数据表中的信息,给我们实际生活中的应用带来了极大的方便。3.3 关系数据库中结构化的xml格
40、式数据转换的参考模型基于xml的web查询先要进行后台数据的转换,把关系数据库中的数据源先转化成 xml数据源放在 web服务器上,然后再执行查询。在下面的图示中给出了通过web对xml数据源访问的参考模型,vb应用程序通过ado从数据库中提取数据,然后把ado数据集转换成xml格式再传递到web服务器上,一旦数据放在web服务器上,就可以通过web应用程序 (如ie5. 0 )来处理和显示数据,从而实现对 web上的xml数据源方便地进行存取和访问。 图4数据转换参考模型注:在该实例中.所有的应用都基于windows环境.整个系统中的任何一层可以用运行在其它平台的应用程序所代替,只要应用程序
41、能够读取和处理xml即可。 如何从关系数据库中产生xml数据源是本文研究的重点之一.如果能够把关系数据库中的数据转换为xml数据源并把这些转换后的数据源放置在web服务器上,就可以很方便地实现对数据的访问,并且能解决很多html数据格式自身的限制。3.4关系数据库中结构化的数据向xml格式数据转换的实现现在有一个tapfs关系数据库,在这个数据库中,有一个bib表,包含如下信息:表一 bib table title author publisher yearan introduction to databasesystems dateaddison-weslev1995foundation f
42、or object/relational databases:the third manifesto dateaddison-weslev1998foundation for object/relational databases:the third manifesto darwenaddison-weslev 1998为了与xml模型中的xml文档相对应,在此处的关系数据库中的数据也设计成同样的数据。对于这样的二维关系数据表,其它应用程序很难对数据进行访问,就是 html页面也无法进行访问.要想使该数据表的数据在更广泛的范围内进行共享,必须对数据格式进行转换 在这里我们使用 xml, xml
43、的基于文本的数据格式可以方便地进行解析和互操作,一旦关系数据转换成x11l数据源,数据库中的数据可以被其他应用程序和html页面访问 在把 bib表中的数据转换成基于xml格式的数据后,就可以通过脚本和数据源对象(dso)对数据进行本地访问,其他人可以通过internet和 intranet对数据进行访问。关系数据源转换为xml数据源一般通过asp来生成,而不是静态地创建xml文件.这样从数据库中动态地生成的xml文档可以随着数据库的更新而自动更新.通过使用asp,可以将上述关系数据表转换成xml数据源,这时的数据源是asp文件.asp文件可以用来创建h丁ml页面,也可以用来创建xml数据源,
44、两者最大的区别是页面的基本结构一个是h丁ml页面,而另一个是xml数据源.就象一般的asp文件输出html页面,此时的asp文件输出的是可以在服务器上被方便访问的xml数据。这种创建xml数据源的方法有两点好处:首先,xml数据源可以通过使用脚本生成,这意味着即便是转换大量的关系数据和一般的文档数据也是很方便的.其次,由于xml数据源是从数据库中的数据中动态生成的,随着数据库数据的更新,xml数据源也自动进行更新.这样可以通过数据库管理系统(如acess, ms-sql, oracle等)来维护和管理数据库,与此同时xml数据源也自动进行了更新,无须再单独维护。asp文件通常开始于脚本语言的声
45、明和所使用的xml的版本,接下来是最顶层元素的开始标签,格式如下:在能够访问丁apes数据库之前,需要在 odbc中登录数据库.要登录数据库,进入windows的控制面版,单击odbc图标,添加tapes数据库到列表中.这时就可以通过ado (active data object)与tapes数据库进行连接.下面的脚本描述了从tapes数据库中产生一个对象,访问bib表,设置一个能够连续产生数据源的循环. 下一步需要组织数据表中数据元素的基本结构,xml可以有复杂的层次结构,如何组织数据对于数据源的可用性和整个数据源的优劣有着很大的关系.从bib表可以看出表中的数据已经提供了很好的逻辑结构,在
46、转换成xml数据源时也比较方便.整个表包含4个部分,每一部分都可以用book来标记,在book中又包含四个子部分:title, author和publisher, year.下面的xml代表了元素book的基本框架. 现在再看bib表中的数据,需要创建一个包含4个book元素的xml数据源。book中的每一部分包含一个 title,一个 author,一个publisher和一个 year元素。上面的脚本中的循环部分可以生成 4个 book元素中的每一子部分.接下来,所要做的创建和生成 book元素的框架,在框架中用变量来代表关系表中的不同数据域.脚本如下: book元素的框架创建后,还要通知
47、asp页而向表中数据的下一条记录移动,从而完成循环,然后加上最顶层元素结束的标签。 通过上述讨论,前面的asp页面可以产生以下的xml数据源。 an introduction to database systems date publisher) addison-wesley 1995 foundation for object/relational databases: the third manifesto date darwen addison-wesley 1998xml格式表示的数据源使应用程序能够通过web传递数据而不用考虑平台因素.只要应用程序能够读取文本流,异种平台和应用程序可以方便的互操作。 关系数据库中的数据转换成基于xml格式的数据之后,只要应用程序支持xml数据的解析,数据就可以方便地被存取和访问.通过使用 xml,数据可以被存放在分离的xml文件中,这样可以把主要的精力放在使用html页面控制格式和显示,并且能保证底层数据的改变并不影响到html代码的改变.通过在服务器上从关系数据库中创建xml数据源,解决了数据的共享性和跨平台性,使异种平台和不同应用程序之间可以方便地进行互操作。3.5 异构数据的集成应注意的问题 1.中间模式的说明和重新生成 包括选取何种中间模式 (如基于oem或xml等)和中间模式于各局
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多媒体课件制作教案
- 第六章氧族元素环境保护教案(人教版)
- 研发质量管理办法
- 生态养殖山坡地租赁合同
- 六年级计算机上册教案
- 农业设施地面施工合同
- 农业发展资金扶持办法
- 绿色建筑房产交易合同样本
- 拆除消防班组施工合同
- 工业区护栏施工合同模板
- 电气基础知识考试题库(完整版)
- 老年衰弱护理课件
- 谈心谈话表(普通干部)
- 沥青路面的设计-沥青路面验收弯沉值计算
- “问题链”教学模式在高中物理课堂中的实践研究
- 管道穿越高速涵洞施工方案
- 医院安全风险分级管控清单
- 流浪动物收容留检投标方案(技术方案)
- 11.1电源和电流(教学设计)高二物理(人教版2019)
- HSK六级真题与答案下载(第一套)
- 检测室安全操作规程
评论
0/150
提交评论