第5章_数据库体系结构_第1页
第5章_数据库体系结构_第2页
第5章_数据库体系结构_第3页
第5章_数据库体系结构_第4页
第5章_数据库体系结构_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、v 模式的分级: 为了提高数据的物理独立性和逻辑独立性,使数据库的用户观点(用户看到的数据库),与数据库的物理方面(实际存储的数据库)区分开来,数据库系统的模式是分级的。v 数据库系统三级模式结构: CODASYL(Conference On Data System Language,美国数据系统语言协商会)提出模式、外模式、存储模式三级模式的概念。三级模式之间有两级映射。二、子模式(Sub-Schema) 子模式又叫外模式,它是用户与数据库的接口。描述用户观点的数据库的实现就叫子模式。 使用子模式的优点: 接口简单,使用方便。用户只要依照子模式编写应用程序或在终端输入操作命令,无需了解数据的

2、存贮结构。 提供数据共享性。用同一模式产生不同的子模式,减少了数据的冗余度。 孤立数据,安全保密。用户只能操作其子模式范围内的数据,可保证其他数据的安全。三、模式(Schema) 所有用户的公共数据视图。是数据库中全体数据的全局逻辑结构和特性的描述。又称为概念模式,它不改变数据模型的原有逻辑意义而获得一个系统能够接受的模型。 模式的主体是数据模型,模式只能描述数据库的逻辑结构,而不应涉及具体存取细节。 模式通常是所有用户的子模式的最小并集,即把所有用户的数据观点有机地结合成为一个逻辑整体,统一地考虑所有用户的要求。五、存贮模式(Storage Schema) 存贮模式又叫内模式,它用来描述数据

3、在存贮装置上的物理配置和组织问题。这涉及到一系列文件组织技术。 存贮模式是对数据的物理描述,是系统程序员和系统设计者所持的数据观点,他们关心的是系统的性能,数据如何在硬件上存放,如何为数据建立索引等。 包含数据库的全部存贮数据,即物理数据库,系统程序员编制专门的访问程序,实现对物理数据库的访问。5.2 映射与数据独立一、外模式/模式映射二、模式/内模式映射三、数据独立为了能在内部实现这三个抽象层次的内部联系和转换,数据库管理系统在这三级模式之间提供了两层映射。 映射实质上是两个事物之间的对应关系。这两层映射保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。一、外模式/模式映射模式描

4、述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构,对应于同一个模式可以有任意多个外模式。对于每一个外模式,数据库系统都有一个外模式/模式映射,它定义了该外模式和模式之间的对应关系。映射定义通常包含在各外模式中。 当模式改变时,修改此映射,使外模式保持不变,从而应用程序可以保持不变,称为逻辑独立性。二、模式/内模式映射 数据库中只有一个模式,也只有一个内模式,所以模式/内模式映射是惟一的。它定义了数据逻辑结构与存储结构之间的对应关系。存储结构改变时,修改此映射,使模式保持不变,从而应用程序可以保持不变,称为物理独立性。 在数据库的三级模式结构中,数据库模式是数据库的中心与关键,它独立于

5、数据库的其他层次。因此设计数据库模式结构时应首先确定数据库的逻辑模式。三、数据独立 数据的逻辑独立性和物理独立性统称为数据独立性。 由于有了数据独立性,数据库系统就把用户数据与物理数据完全分开了,使得用户摆脱了烦琐的物理存贮细节。 无论是那一级模式都只能是处理数据的一个框架,而按这些框架填入的数据才是数据库的内容,因此,框架和数据是两种性质不同的信息,并且分别存贮在不同的地方。 三种模式对应着三种不同的数据库,而真正存在的只有物理数据库,它是存放在外存上的实际数据,而其它两个不同的数据库在外存上是不存在的,但数据库管理系统能够从相应的物理数据库构造出概念数据库和用户数据库,因此,用户可以认为它

6、们是存在的。 用户数据库是概念数据库的部分抽取;概念数据库是物理数据库的抽象表示;物理数据库是概念数据库的具体实现。 应用程序对数据库的访问是根据数据的三级模式由数据库管理系统(DBMS)来执行的。 一、数据描述语言二、数据操纵语言无论是程序员还是数据库管理员,他们均需与系统交往,这就要求为他们提供一种通讯工具,一方面向系统提供信息,另一方面从系统获取信息。这个工具就是数据语言。 数据语言包括数据描述语言(DDL-Data Description Language)和数据操纵语言(DMLData Manipulation Language)两大部分,前者负责定义数据的各种特性,后者表达对数据进

7、行的操作。一、 数据描述语言任务:用一种为计算机所能接受的手段来表达 数据模型 在数据库逻辑设计和物理设计基础上得到的数据模型一般用图解形式来表示,并加注一些简要说明,这种表示形式还不能为任何系统所直接接受和处理。1模式DDL 模式DDL用来定义数据库的总体逻辑结构以及由逻辑结构向存贮结构的映象。这是为数据库管理员定义模式用的一种数据描述语言。DDL所描述的模式应包括以下基本内容:(1)能标识数据单位的类型,如数据项、记录以及数据文件;(2)对每个数据项类型、记录类型、文件类型以及其它数据单位应给出一个唯一名;(3)应说明哪些数据项类型是在一个数据项组类型、记录类型或其它数据单位里;(4)确定

8、关键字:说明哪些数据项类型、数据项类型的部分或数据项类型的组合作为关键字使用;2子模式DDL 子模式DDL是为用户定义子模式提供的一种数据描述语言。子模式表示用户的数据观点,是模式的一部分,但在某种条件下,用户可以取整个模式作为其子模式,这时的子模式就是模式。子模式由子模式DDL来表达,它用来定义用户程序的局部逻辑结构向整体逻辑结构的映象。3物理DDL 物理DDL用来定义数据的物理存贮方式,这是系统程序员使用的语言,用来描述数据在存贮介质上的安排和存放,它和硬件设备的特性有关,这是最内层或着说是最低一级的数据描述。用物理DDL对数据库存贮结构的全部描述语句称为存贮模式。 数据:值得保留的任何信

9、息,一般说来是电子形式的。 数据库:数据的集合;由DBMS统一管理,多用户共享 数据库管理系统: 复杂的系统软件,它支持对于持久存储的大量的数据进行高效存取,它支持强有力的查询语言,支持以看起来是原子的和独立于其他事务的方式并发地执行的持久的事务。 数据库系统:带有数据库的整个计算机系统,包括硬件、软件、数据、人员 数据存取功能 提供DML语言(Data Manipulation Language)对数据库进行检索、插入、修改、删除。 DML类型 宿主型:DML不独立使用,嵌入到高级语言(主语言)程序中使用。 自含型:独立使用,交互式命令方式。 DBMS控制并执行DML语句 宿主型:有预编译和

10、增强编译两种方式。 自含型:解释执行。 数据库运行管理 并发控制、存取控制、完整性约束条件检查和执行,日志组织和管理,事务管理和自动恢复。 数据组织、存储和管理 用户数据、索引、数据字典的组织、存储和管理,包括文件结构、存取方式、数据之间的联系的实现等。 数据库的建立和维护功能 数据的装入、转换、卸出,数据库的转储、恢复、性能监视和分析等。数据字典 专门组织存储的非应用数据的集合数据库是一个复杂的系统,它除了包含应用数据外,还涉及很多非应用数据,诸如模式、子模式的内容、数据项的类型和长度,记录类型、用户标识符和口令等,这些非应用数据是整个数据库系统的规范化解释机制,缺少它就无法正确地理解和使用

11、数据库系统中的数据资源。将这些非应用数据专门地组织存贮起来,形成所谓的数据字典。 数据字典是数据库设计与管理的有力工具,在数据的收集、规范化和管理等方面都要用到数据字典。 数据字典的主要内容是关于数据类型的登记表,给出数据的名称、定义、组成和属性等。数据库的活动将参照这些信息进行。 由于数据字典的内容比较复杂,因此也要对它进行严密的组织,也要用数据模型予以描述。这种描述有源形式和目标形式,包括模式表、子模式表、用户表、物理文件或区域表、内码与自然语言对照表、同义词的定义与表示等。 数据字典设立一个询问机制,对数据字典中的信息进行查询、插入、修改、删除等操作,从而给数据字典赋以“数据库”的本质,

12、即它是关于数据描述信息的一种特殊的数据库。 由于数据字典中存贮的主要是关于应用数据的定义数据,这种关于数据的数据是元数据(meta data),因而,作为特殊数据库的数据字典又称为元数据库,或叫做关于数据库的数据库。一、数据保护二、故障恢复在数据库的装入、转储和修改中,由于技术问题,尤其是在网络环境下黑客的侵入、病毒的破坏等都有引起数据库信息丢失或遭到破坏的危险;由于数据库中的数据要由多个用户所共享,时间保护问题就显得更为突出。 数据库的一个重要优点是具有保护数据以及在发生故障的情况下恢复数据的能力。 一、数据保护 关于数据保护,可从三个互相区别而又互相联系的方面来看,即数据的专用性、安全性和

13、完整性。1数据的专用性 数据的专用性是指对数据库的存取控制,即数据库中的某些数据只对一定范围内的人员作一定程度的开放,无权人员(包括管理数据的专业人员和数据库管理人员)或不能阅读,或允许阅读而不能更改,等等。 2数据的安全性 数据的安全性是指如何采取必要的措施使数据库中的数据免遭破坏或损失。数据在网络环境应用过程中,可能会由于如下原因而引起安全问题:故意对数据或程序的破坏、计算机病毒、逻辑炸弹、错误指向、程序错误、黑客、硬件搭线窃听、误操作、数据泄露、盗用、伪造、假冒、诈骗等。因此数据库中都建立有关数据的系统的安全体系。 v 系统的安全策略: 系统的外部安全:包括人员安全、物理安全,如制订工作

14、人员职责,设备管理制度等。 系统内部安全:包括数据的加密/解密、身份验证、数字签名、鉴别、审计、容错和访问控制等,以及防火墙、反病毒、防黑客等技术。 3数据的完整性 数据的完整性是指在系统中采取一些措施以保护时间在逻辑上的正确性或合理性,以避免不合逻辑的或荒谬的数据出现,在共享数据库的情况下,还要保证数据的一致性。 例如人的年龄应小于200岁,大学生的年龄应大于10岁,一个人一天的工作时间应小于24小时;数据库中主关键字应有一定的值域且不能重复,工资调整时职工的新工资一定多余旧工资,一个银行户头被取消时,其余额一定为零等。 4并发控制v 并行 Vs 串行 并行事务会破坏数据库的一致性。 串行事

15、务效率低。v 并行的优点 提高系统的吞吐量。 减少平均响应时间。v 封锁的定义 封锁就是一个事务对某个数据对象加锁,取得对它一定的控制,限制其它事务对该数据对象使用。 并发控制的基本方法就是封锁。二、故障恢复由于计算机软硬件故障或人为错误,不可避免地威胁到计算机系统的正常工作。在地图数据库系统中除了设置口令、采用密码、进行校验以保障安全之外,还必须有有效的应急措施,一旦出现系统故障,数据遭到破坏时,能自动恢复到出错前的正常状态。 v 定义 恢复是把数据库从错误状态恢复到某一正确状态的功能,从而确保数据库的一致性。 恢复的基本原理是冗余,即数据库中任一部分的数据可以根据存储在系统别处的冗余数据来

16、重建。二、故障恢复v 恢复的基本手段 数据库转储 审核跟踪文件 快速录象文件 v 日志 日志文件是用来记录数据库的每一次更新活动的文件,由系统自动记录。 日志内容包括:记录名、旧记录值、新记录值、事务标识符、操作标识符等。v 故障的恢复方式 回滚(undo)和重做(redo) 命令回滚 运行单位回滚 快速恢复 5.9 数据库系统体系结构 一、集中式数据库系统 二、数据库系统 三、三层数据库系统 四、并行数据库系统 五、分布式数据库系统 5.9 数据库系统体系结构 一、集中式数据库系统 二、数据库系统 三、三层数据库系统 四、并行数据库系统 五、分布式数据库系统 、集中式系统 1. 集中式系统

17、运行在一台机器上,数据集中存储在一台计算机中,并且不与其他计算机系统交互的数据库系统 2. 单用户系统 个人使用的桌面系统 单CUP,1至2个硬盘,OS可以只支持单用户 数据库系统不支持并发控制 ,故障恢复能力没有或非常有限 3. 多用户系统 服务大量用户,用户通过终端与之相连 多个磁盘,多个主存储器,多个CPU,多用户OS 二、客户-服务器系统 PC的能力更强,价格更低,连接到集中式系统的终端被PC代替;以前由集中式系统执行的诸如用户界面功能交由PC来处理;集中式系统变成服务器系统的作用,来响应客户系统产生的请求。 三、客户-服务器系统 数据处理任务在客户与服务器间进行划分 好处:有利于充分

18、利用网络中的计算资源 有利于减少网络上的传输量 1. 数据库功能的划分 后端(Back-end) 存取结构、查询计算和优化、并发控制、故障恢复 前端(Front-end) 表格生成工具、报表书写工具、图形用户界面工具 前端和后端的接口通过SQL或应用程序接口 三、客户-服务器系统索引数据文件统计数据数据字典事务管理器应用程序目标代码嵌入式DML预编译器DML编译器DDL解释器查询计算引擎应用界面应用程序查询数据库模式初级用户程序设计人员熟练用户数据库管理员数据库管理系统查询处理器存储管理器用户缓冲区管理器文件管理器磁盘存储器5.9 数据库系统体系结构一、集中式数据库系统二、数据库系统三、三层数

19、据库系统四、并行数据库系统五、分布式数据库系统、集中式系统1. 集中式系统 运行在一台机器上,数据集中存储在一台计算机中,并且不与其他计算机系统交互的数据库系统2. 单用户系统 个人使用的桌面系统 单CUP,1至2个硬盘,OS可以只支持单用户 数据库系统不支持并发控制 ,故障恢复能力没有或非常有限3. 多用户系统 服务大量用户,用户通过终端与之相连 多个磁盘,多个主存储器,多个CPU,多用户OS二、客户-服务器系统PC的能力更强,价格更低,连接到集中式系统的终端被PC代替;以前由集中式系统执行的诸如用户界面功能交由PC来处理;集中式系统变成服务器系统的作用,来响应客户系统产生的请求。三、客户-

20、服务器系统数据处理任务在客户与服务器间进行划分好处:有利于充分利用网络中的计算资源 有利于减少网络上的传输量1. 数据库功能的划分 后端(Back-end) 存取结构、查询计算和优化、并发控制、故障恢复 前端(Front-end) 表格生成工具、报表书写工具、图形用户界面工具 前端和后端的接口通过SQL或应用程序接口三、客户-服务器系统2. 客户/服务器优点 高性能/价格比 可扩展性 友好的用户接口 易维护三、客户-服务器系统v 数据服务器 用于局域网中 客户与服务器之间具有高速连接 客户机与服务器的处理能力相当,并且其执行的任务主要以计算为主 数据传送到客户机器,在客户机上进行所有处理,然后

21、再把数据传回到服务器 多用于面向对象数据库系统三、客户-服务器系统4. 集中式或分布式 - 单服务器与多服务器系统v 单服务器系统: 多个客户共享一个服务器v 多服务器系统: 一个客户可以对多个服务器进行访问。v 四、并行系统v 1. 并行数据库系统v 由通过高速互连网络连接在一起的多个CPU、存储器和磁盘组成v 查询大数据量v 处理大数量的事务v 粗粒度并行机由几个能力强大的处理器组成v 细粒度并行机由数千个小处理器组成v 2. 加速比(Speedup)v 通过增加并行度来在更短的时间内运行一个给定的任务vvv 3. 扩展性(Scaleup)v 通过增加并行度来处理更大的任务v 数据库规模、事务提交率v v 四、并行系统负影像因素v 4. 启动代价v 进程初始化的启动时间v 5. 干扰v 竞争共享资源v 6. 偏斜v 任务的分配是有偏的v 最慢的并行步骤起决定作用v 木桶效应v 五、互联网络结构v 1. 总线(Bus)v 所有系统成分通过单一的通信总线来发送和接收数据v 适于少量处理器的情况,不适于并行度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论