数据库数据模型的发展及方向_第1页
数据库数据模型的发展及方向_第2页
数据库数据模型的发展及方向_第3页
数据库数据模型的发展及方向_第4页
数据库数据模型的发展及方向_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、XXXX大学XXX学院XXX班数据库数据模型的发展及方向学号:摘要:近年来,随着计算机辅助设计(CAD)、计算机辅助制造(CAM)、计算机辅助软件工程(CASE)、 全球信息系统(GIS)、图像处理、超文本应用等领域的飞速发展及其在传统领域中应用的深化, 要求数据库管理系统(database management system,DBMS)能够有效地管理复杂对象。比如在工 程应用领域,一个客观复杂实体往往由数十个,甚至成百上千个简单实体组成,为了减小数据库 应用系统的设计复杂度、提高其执行效率,要求DBMS不但能根据实体丰富的语义进行建模、提 供有效的存储与操纵手段,以及模拟复杂实体的复杂行为,

2、而且在逻辑上还要将一个复杂实体的 表示和操纵作为一个整体看待,在操纵数据的同时考虑实体间的复合语义,即各简单实体的存在 方式(独立或依赖)以及实体间的引用方式(共享或排他)。然而,传统RDBMS由于采用满足第 一范式(first normal form, 1NF)的平关系模型,在面对各种新的应用领域时存在以下不足。关键词:数据库,数据模型,扩展关系数据库,语义数据模型,面向对象的数 据模型,XML数据模型正文:数据模型概述数据(data)是描述事物的符号记录。模型(Model)是现实世界的抽象。数 据模型(Data Model)是数据特征的抽象,是数据库管理的教学形式框架。数据 库系统中用以提

3、供信息表示和操作手段的形式构架。数据模型包括数据库数据的 结构部分、数据库数据的操作部分和数据库数据的约束条件。数据模型所描述的内容包括三个部分:数据结构、数据操作、数据约束。概念数据模型(Conceptual Model):这是面向数据库用户的实现世界的 数据模型,主要用来描述世界的概念化结构,它使数据库的设计人员在设计的初 始阶段,摆脱计算机系统及DBMS的具体技术问题,集中精力分析数据以及数 据之间的联系等,与具体的DBMS无关。概念数据模型必须换成逻辑数据模型, 才能在DBMS中实现。逻辑数据模型(Logical Data Model):这是用户从数据库看到的数据模型, 是具体的DBM

4、S所支持的数据模型,如网状数据模型、层次数据模型等等。此 模型既要面向用户,又要面向系统。物理数据模型(Physical Data Model):这是描述数据在存储介质上的组 织结构的数据模型它不但与具体的DBMS有关,而且还和操作系统以及硬件有 关。每一种逻辑数据模型在实现时都有其对应的物理数据模型。DBMS为了保证 其独立性与可移植性,大部分物理数据模型的实现工作由系统自动完成,而设计 者只设计索引、聚集等特殊结构。数据模型的三要素:一般而言,数据模型是一组严格定义的概念的集合。这些概念精确地描述了系统 的静态特征(数据结构)、动态特征(数据操作)和完整性约束条件,这就是数 据模型的三要素

5、。数据结构数据结构是所研究的对象类型的集合。这些对象是数据库的组成部分,数据结构 指对象和对象间联系的表达和实现,是系统静态特征的描述,包括两个方面:(1)数据本身:类型、内容、性质。例如关系模型中的域、属性、关系 等。(2)数据之间的联系:数据之间是如何相互联系的,例如关系模型中的 主码、外码等联系。数据操作对数据库中对象的实例允许执行的操作集合,主要指检索和更新(插入、删除、 修改)两类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。数据操作是对系统动态特征的描述。完整性约束条件数据完整性约束是一组完整性规则的集合,规定数据库状态及状态变化所应满

6、足 的条件,以保证数据的正确性、有效性和相容性。数据库技术发展概述:数据库技术是计算机科学技术中发展最快的领域之一,也是应用最广的技 术之一一、第一代的网状、层次数据库系统1、层次数据库(Hierarchiacl Database)层次模型是出现较早的一种公认的数据库管理系统数据模型。它是将数据 组织成有向有序的树结构,并用“一对多”的关系联结不同层次的数据库。早 在1968年IBM公司就推出了 IMS的最初版本,之后,层次数据库管理系统得 到了迅速发展,同时它也影响了其它类型的数据库管理系统,特别是网状系统的 出现和发展。闵右匚底扰模堇2、网状数据库处理以记录类型为结点的网状数据模型的数据库

7、。处理方法是将网状结构分 解成若干棵二级树结构,称为系。系类型是二个或二个以上的记录类型之间联系 的一种描述。在一个系类型中,有一个记录类型处于主导地位,称为系主记录类 型,其它称为成员记录类型。系主和成员之间的联系是一对多的联系。网状数据 库的代表是DBTG系统。1969年美国的CODASYL组织提出了一份“DBTG报 告”,以后,根据DBTG报告实现的系统一般称 为DBTG系统。现有的网状数 据库系统大都是采用DBTG方案的。DBTG系统是典型的三级结构体系:子模 式、模式、存储模式。相应的数据定义语言分别称为子模式定义语言SSDDL, 模式定义语言SDDL,设备介质控制语言DMCL。另外

8、还有数据操纵语言DML。图2 15网状数据模型3、层次数据库系统与网状数据库系统的共同特点:(1).支持三级模式的体系结构(2).用存取路径来表示数据之间的联系(3).独立的数据定义语言(4).导航的数据操纵语言二、第二代的关系数据库系统1970年,IBM的研究员,有“关系数据库之父”之称的埃德加弗兰克科 德(Edgar Frank Codd 或 E. F. Codd)博士在刊物 Communication of the ACM 上发表了题为 “A Relational Model of Data for Large Shared Data banks (大型共享 数据库的关系模型)”的论文,

9、文中首次提出了数据库的关系模型的概念,奠定 了关系模型的理论基础。后来Codd又陆续发表多篇文章,论述了范式理论和衡 量关系系统的12条标准,用数学理论奠定了关系数据库的基础。IBM的Ray Boyce和Don Chamberlin将Codd关系数据库的12条准则的数学定义以简单的 关键字语法表现出来,里程碑式地提出了 SQL语言。由于关系模型 相关书籍 简单明了、具有坚实的数学理论基础,所以一经推出就受到了学术界和产业界的 高度重视和广泛响应,并很快成为数据库市场的主流。20世纪80年代以来,计 算机厂商推出的数据库管理系统几乎都支持关系模型,数据库领域当前的研究工 作大都以关系模型为基础。

10、这一时期的主要成果奠定了关系模型的理论基础,给出了人们一致接受的关系模型的规范说明,研究 了关系数据语言,包括关系代数、关系演算、SQL及QBE等研制了大量的RDBMS的原型,攻克了系统实现中查询优化、并发控制、故障恢 复等一系列关键技术三、第三代数据库系统一一数据库大家族1990年,高级DBMS功能委员会发表了第三代数据库系统宣言的文章,提 出第三代DBMS应具有的3个基本特征:1、第三代数据库系统应支持数据管理、对象管理和知识管理。2、第三代数据库系统必须保持或继承第二代数据库系统的技术。3、.第三代数据库系统必须对其他系统开放。数据库模型的发展应用的需求始终是推动技术进步的动力。自20世

11、纪70年代初E. F. Code 提出关系数据库理论,定义关系数据模型以来,关系数据库管理系统(relational database managementsystem, RDBMS)以其简洁、严密的数据模型,简明易学、 功能强大的描述性查询语言而备受用户青睐,并迅速取代网状及层次型数据库系 统,成为数据库技术发展的主流。之后,随着RDBMS理论基础及其实现方法的 日趋成熟,关系数据库技术日臻完善。近年来,随着计算机辅助设计(CAD)、计算机辅助制造(CAM)、计算机辅助 软件工程(CASE)、全球信息系统(GIS)、图像处理、超文本应用等领域的飞速发 展及其在传统领域中应用的深化,要求数据库

12、管理系统(database management system,DBMS)能够有效地管理复杂对象。比如在工程应用领域,一个客观复杂 实体往往由数十个,甚至成百上千个简单实体组成,为了减小数据库应用系统的 设计复杂度、提高其执行效率,要求DBMS不但能根据实体丰富的语义进行建 模、提供有效的存储与操纵手段,以及模拟复杂实体的复杂行为,而且在逻辑上 还要将一个复杂实体的表示和操纵作为一个整体看待,在操纵数据的同时考虑实 体间的复合语义,即各简单实体的存在方式(独立或依赖)以及实体间的引用方 式(共享或排他)。然而,传统RDBMS由于采用满足第一范式(first normal form, 1NF)的

13、平关系模型,在面对各种新的应用领域时存在以下不足。1、不能完整地描述复杂实体。对一个逻辑上作为整体的复杂实体只能采用 分解成多个关系的方法进行描述,从而在内部数据库结构和由这种结构所描述的 外部实体之间缺乏一对一的对应关系,在查询时这将导致系统效率的严重降低。2、缺乏稳定的元组标识。RDBMS中完全由关键字属性值作为元组的惟一 标识,当关键字值不稳定时,引用时会产生数据的一致性问题,给维护带来很大 困难。3、缺乏数据抽象。在关系模型中只有一个非常简单的结构构造概念一一关 系,缺乏诸如聚合(把由多个子实体组成的复合实体抽象成一个聚合实体)、概化 (把相似实体归类为一个更一般的实体型)与特化(把抽

14、象的实体型细化成更特殊 的实例)等在许多实际应用中非常重要的抽象概念。4、缺乏丰富的类型系统。这些不足使得传统关系型数据库技术在面对来自“非经典”应用领域中的巨 大挑战时显得力不从心,新的数据库技术应运而生。当前,数据库的发展主要朝以下几个方向:1、扩展关系数据库。对传统的关系模型(1NF)进行扩充,引入了少数构造 器,称为复杂数据模型,一种是偏重于结构的扩充(嵌套关系模型),一种是侧 重于语义的扩充(如:POSTGRES系统)。这类研究相对来说是“改良性”的:即在传统关系模型上增添各种特点,或 打破原有约束以支持各种新型的、复杂结构的数据。早期对关系模型的扩展主要 包括非第一范式(nonfi

15、rst normal form,NF2)和抽象数据类型(abstract data type, ADT)。非第一范式打破了关系模型中第一范式的要求,从而能够有效地描述复杂实 体。这方面的工作主要集中在20世纪80年代,所作的扩充也各有不同,包括:P.Pistor等提出的AIM-P中,允许关系的属性为任意域;Jaeschke与Schek所扩 充的关系模型允许关系带有集合值属性;由Thomas和Fischer提出的“嵌套关 系模型”。其中,嵌套关系模型融合了前两种模型,它允许关系中集合操作与聚 合操作以任意层次相互嵌套,建模能力最强,因此后续的研究大多围绕嵌套关系 进行,包括代数和演算系统、查询语

16、言、规范化等。抽象数据类型原本是程序设计中的重要概念,它强调数据的封装,是面向对 象思想的起源之一。而在数据库系统中,ADT表示用户定义类型,用户不仅要 定义类型的规格(数据长度及适用函数),还需要用外部语言予以实现。DBMS对 新类型进行登记,并在适当时机调用相应函数。将ADT引入DBMS的先驱是加 州伯克利大学的ADTIngres,并在其后续系统Postgres中进一步阐明了相关的 优化方法。ADT是扩展数据库类型系统的强大武器,在很多系统中都采用这种 方法。关系模型的这类扩展,克服了平关系不能自然地表达复杂实体结构的缺点, 并因为与平关系有着自然的联系,从而可以充分利用平关系系统的研究成

17、果和原 有的理论基础。另一方面,这种方法虽然确实增强了关系数据库(RDB )的建模能 力,但在数据聚合、概化和特化、刻画复杂对象行为以及对象标识的稳定性等方 面,仍未能有根本性改善。在标准关系模型中,关系是相同结构的元组集合,每个元组是具有原子类型 值的聚合。在这类关系中,集合、聚合只使用了一次NF2嵌套关系模型是要把 这种集合概念和聚合概念嵌套使用多次,而且是有限的、预先定义好的次数。即 元组的某个属性值是一个关系,关系的元组又是具有原子值和关系值的聚合体, 如此嵌套若干次,直到元组的所有属性都是原子值域为止。图3-3嵌套关系结构图2、增加全新的数据构造器和数据处理原语,以表达复杂的结构和丰

18、富的语 义(语义数据模型,只用于概念建模)语义数据模型的模型结构是由若干种抽象所组成,用这些抽象来描述空间实 体的基本语义特征,再根据语义模型结构规则把这些抽象结合起来形成模型。语 义模型的抽象是比数据结构更高的层次,通过抽象在空间实体层次上构造模型, 形成空间实体类别以及这些类别之间的关联,在基本语义结构被确定后面加入数 据元素。3、面向对象的数据模型(对象关系数据库)这类研究将面向对象思想融人数据库技术,从而发展为全新概念的面向对象 数据库管理系统(objectoriented database management system, OODBMS)。尽管 OODB缺乏通用数据模型、形式基础

19、及强有力的实验活动,但一般说来,它至少 包含有如下核心概念:对象和对象标识。在面向对象系统和语言中,现实世界的客体统一地用 对象来模拟,每一对象有与之相联系的惟一标识符。属性和方法、封装和消息传递。每一对象都有一个状态和行为。对象的 状态是对象属性值的集合,而对象的行为是作用于对象状态上的方法(程序代码) 集。对象的属性值本身也是一个对象。被封装在对象中的状态和行为只有通过显 式的消息发送才能存取。类和ADT。类是把具有相同属性和方法的对象组织在一起的一种手段, 对象和类之间的关系是instance-of联系。类的含义与ADT相似。类层次和继承。面向对象系统允许用户从已有类中导出新类。新类继承

20、 父类的所有属性和方法。它们之间的关系是子类一一超类联系。用户可以为新类 指定附加的属性和方法。一个类可以有任意多个子类。面向对象数据库技术除提供传统关系数据库系统的功能之外,还利用类来组 织复杂对象,利用方法来模拟复杂对象行为,利用继承机制来实现对象属性和方 法的重用。虽然OODBMS在一些特定领域(如CAD)内能较好地满足应用需 求,但由于它不支持标准的结构化查询语言(structured query language,SQL),从 而在通用性方面失去了优势。还有,目前绝大多数OODBMS都不能很好地支持 视图、自动查询优化处理、动态模式演变、并发控制、安全授权、故障恢复及参 数化的系统性能调整,等等,所以Won Kim认为OODB更像一个面向对象程序 设计语言(object oriented programming language,OOPI。)的持久存储系统而不是 数据库管理系统。4、XML 数据模型(XML Query Data Model 等)随着Internet的普及和Web技术的快速发展,作为Internet上信息表示和数 据交换标准的XML应运而生。XML数据已在Web上广泛流行,从企业报表、 商业广告到技

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论