第六章关系数据库设计-资格考试-阅读-_第1页
第六章关系数据库设计-资格考试-阅读-_第2页
第六章关系数据库设计-资格考试-阅读-_第3页
第六章关系数据库设计-资格考试-阅读-_第4页
第六章关系数据库设计-资格考试-阅读-_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库与智能网络研究室第六章:关系数据库设计第章 关系数据库设计12.2信息系统及其与数据库的关系数据库设计与数据库生命周期数据库设计方法关系数据库的设计方法数据库设计评价用UML设计关系数据库模式信息系统及其与数据库的关系12.3■

信息系统是由计算机硬件、网络和通讯设备、计算机软件、信息资源、信息用户和规章制度组成的以处理信息流为目的的人机一体化系统。其是对数据进行处理并为其所在的组织提供信息,以支持该组织的经营管理、制定决策等活动。信息系统一般都具有输入、输出、数据传输、数据存储和数据加工处理五个基本功能。其中数据存储和加工过程都要是以数据库技术为基础实现的。数据库设计与数据库生命周期12.4数据库设计的含义数据库设计的目标数据库设计的一般过程数据库设计的含义12.5■数据库设计(Database

Design)是建立数据库及其应用系统的技术,是信息系统开发和建设中的核心技术。具体地说,数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求。

数据库应用系统的设计从任务角度上讲包含两方面的内容:数据库设计的含义12.6(1)结构特性的设计

结构设计是指设计数据库框架或数据库物理结构。设计数据库系统首先,应进行结构设计。在以文件系

统为基础的应用系统中,文件是某一应用程序私用的。而在以数据库为基础的应用系统中,数据库模式是各

应用程序共享的结构,是稳定、永久的结构。因此数

据库机构设计是否合理,直接影响到系统中各个处理

过程的性能和质量。这就使得机构设计成为各种数据

库设计方法和设计理论关注的焦点。数据库设计的含义12.7(2)行为特性的设计

行为设计是指应用程序、事务处理等建筑在结构基础之上的内容的设计。结构特性不能和行为特性相分离。静态的结构特性设计与动态的行为特性设计相分离,会导致数据与程序不易结合,增加数据库设计的复杂性。数据库设计的含义结构特性与行为特性的设计过程12.8数据库设计的目标12.9■■■■■■

1.满足用户的应用要求,即能够正确地反映用户的现实环境。准确模拟现实世界,即准确地反映现实世界的信息类别与信息之间的联系。能被某个DBMS所接受。具有良好的性能、较高的质量。存取效率存储效率其他性能,如便于维护与扩充,有较好的安全性与完整性,系统出现故障时容易恢复等。数据库设计的一般过程12.10■数据库生命周期一般包含数据库系统的规划、设计、实现、运行管理和维护、扩充和重构等六大的阶段。数据库设计过程则采用其中的前4个阶段。1.需求分析

需求分析是整个数据库设计过程的基础,要收集数据库所有用户的信息内容和处理要求,并加以规格化和分析。这是最费时、最复杂的一步,但也是最重要的一步,相当于待构建的数据库大厦的地基,它决定了以后各步设计的速度与质量。需求分析做得不好,可能会导致整个数据库设计返工重做。在分析用户需求时,要确保用户目标的一致性。数据库设计的一般过程12.112.概念模型设计■概念设计是把用户的信息要求统一到一个整体逻辑结构中,此结构能够表达用户的要求,是一个独立于任何DBMS软件和硬件的概念模型。3.逻辑设计■逻辑设计是将上一步所得到的概念模型转换为某个DBMS所支持的数据模型,并对其进行优化。4.物理设计

物理设计是为逻辑数据模型建立一个完整的能实现的数据库结构,包括存储结构和存取方法。数据库设计的一般过程12.125.数据库实施■根据物理设计的结果把原始数据装入数据库,建立一个具体的数据库并编写和调试相应的应用程序。应用程序的开发目标是开发一个可依赖的有效的数据库存取程序,来满足用户的处理要求。6.数据库运行与维护

这一阶段主要是收集和记录实际系统运行的数据,数据库运行的记录用来提高用户要求的有效信息,用

来评价数据库系统的性能,进一步调整和修改数据库。在运行中,必须保持数据库的完整性,并能有效地处

理数据库故障和进行数据库恢复。在运行和维护阶段,可能要对数据库结构进行修改或扩充。数据库设计的一般过程12.13数据库设计方法12.14数据库设计方法概述基于3NF的数据库设计方法LRA方法DBMS的选择和全关系DBMS的评价准则数据库设计方法概述12.15■■■■■

数据库设计方法按自动程度可以分为四类,即手工的、设计指南或规则指导的、计算机辅助的、以及自动的设计方法。较有影响的有:基于3NF的数据库设计方法。LRA方法。New

Orleans设计方法(4)E-R方法。基于3NF的数据库设计方法12.16■■■■

基于3NF的数据库设计方法是由S.Atre提出的结构化设计方法。设计过程划分为以下几个阶段。设计企业模式设计数据库的逻辑模式设计数据库的物理模式对物理模式进行评价LRA方法12.17■■■■

数据库设计的LRA(Logical

Record

Access)方法即逻辑记录存取法。分三个阶段完成数据库的设计。第一阶段是要求分析。第二阶段是逻辑设计,它又分信息结构设计(ISD)和信息结构改进(ISR)两步。第三阶段是物理设计。LRA方法的特点是提供一种定量估算的方法,LRA方法引进一个极为重要的概念——逻辑记录存取数,表示在一个应用程序执行过程中对一个记录类型所要查找的记录的个数,记作LRA数。LRA方法12.18表示第j个记录类型的平均长度;表示第j个记录类型的记录数;表示第j个记录类型中每个记录的平■■假设:RECSIZEjNRECj

NPTRj均指针数;PTRSIZELRAij表示指针长度;表示应用程序i对第j个记录类型的逻辑记录存取数;

FREQi

表示应用程序i在单位时间内执行的次数,即执行频率。LRA方法■

那么,对于给定的逻辑结构,可以计算出以下各量。(1)需要存取n个记录类型的应用程序i的逻辑记录存取总数为:

(2)应用程序i在单位时间内的逻辑记录存取总数为:12.19LRA方法

(3)M个应用程序在单位时间内的全部逻辑记录存取数之和为:(4)应用程序i的数据传输量为:(5)应用程序i在单位时间内的数据传输量为:12.20LRA方法(6)在单位时间内,全部程序的数据传送量为:(7)数据存储总空间为:(8)指针存储总空间为:12.21DBMS的选择和全关系DBMS的评价准则12.22nnnnnnnnnnn1.DBMS的选择设计者必须确定应用系统对DBMS的要求,这些要求可以包括以下方面。数据库管理系统的类型,如专用DBMS还是通用DBMS等。DBMS所支持的数据库的规模以及数据量。数据库的安全性、完整性、恢复以及并发控制的能力。DBMS提供的重构方式和可扩充性。数据独立性程度。数据库终端用户的类型、联机处理特性、数据处理特性以及对数据语言的要求。系统开发和数据库利用的难易。如提供哪些开发工具、主语言、DML的功能、终端语言等。监测数据库性能的能力。提供DBMS的厂商所能提供的支持。DBMS的选择和全关系DBMS的评价准则12.23■在选择DBMS时,必须注意以下因素。(1)DBMS的性能。(2)开发新数据库和新应用程序的代价。

(3)是否有利于应用程序未来的发展,即系统易扩充、易转换,从而能满足未来的新的应用要求。关系型DBMS(RDBMS),对象—关系型DBMS(ORDBMS)或对象DBMS(ODBMS)。DBMS的选择和全关系DBMS的评价准则12.242.全关系DBMS的评价准则

关系模型的奠基人E.F.codd提出了判别全关系

DBMS的12条基本准则,9个结构特性,18个操作功能和3类完整性约束,共42条。这些标准不仅可以用来评价或选择关系型产品,而且从理论上对关系数据模型作了具体而深入的论述,是从理论和实际相结合的高度对关系数据库产品进行评价的依据。DBMS的选择和全关系DBMS的评价准则12.25■■■■

准则0一个关系型的DBMS必须能完全通过它的关系能力来管理数据库。准则1信息准则。关系型DBMS的所有信息都应在逻辑一级用一种方法(即表中的值)显式地表示。准则2保证访问准则。依靠表名、主关键字和列名的组合,就能用逻辑方式访问关系数据库中的每个数据项。准则3空值的系统化处理。准则4基于关系模型的动态的联机字典。DBMS的选择和全关系DBMS的评价准则12.26■准则5具有统一的数据子语言。

准则6视图更新准则。所有理论上能更新的视图也应该能由系统更新。准则7高级的插入、修改和删除操作,即以一个基本关系或导出关系作为单一的操作对象进行数据更新处理。

准则8

数据的物理独立性。无论数据库的数据在存储表示或存取方法上发生何种变化,应用程序和终端活动都保持逻辑上的不变性。DBMS的选择和全关系DBMS的评价准则12.27■

准则9数据的逻辑独立性。基本关系的任何变化,只要理论上信息不受损害,应用程序和终端活动都保

持逻辑上的不变性。准则10数据完整的独立性。关系数据库的完整性约束条件必须在模式中定义,并存入字典中,而不是在应用程序中进行定义。■DBMS的选择和全关系DBMS的评价准则12.28■■■

准则11具有分布独立性。所谓分布独立性是指关系DBMS的数据子语言能够使应用程序和终端活动在

下列情况下保持逻辑不变性:在第一次引入分布式数据时;当数据重新分布时。准则12无破坏准则。如果一个关系系统具有一个一次处理一个记录的低级语言,则该语言不能违背或绕过完整性准则。关系数据库的设计方法12.29关系数据库设计的工程化方法数据需求分析概念模型设计逻辑设计物理设计数据需求分析12.30■主要任务是通过对现行的手工系统或已有的计算机系统进行调查和分析,以确定企业对即将建立的数据库应用系统的信息要求和处理要求。1.系统调查(1)组织机构调查。(2)业务流程调查。(3)各部门对系统的信息要求和处理要求。(4)企业的限制和目标。数据需求分析12.312.系统分析■■■■

对调查所获得的原始资料必须进行综合的分析,权衡各方面的利弊,确定数据库结构设计和程序设计的策略和方案。业务流程分析。信息收集和分析。处理要求分析。其他各种限制和要求分析。数据需求分析3.系统分析的文档业务流程图、数据流图、数据词典等。(1)数据流图

数据流图(Data

Flow

Diagram,简称DFD)数据流图通常由如图所示的4种基本符号组成。12.32数据需求分析12.33■■■①数据流。数据流即流动中的数据,代表信息流过的通道。②处理。处理是对进入的数据流进行特定加工的过程,数据流被处理后将产生新的数据流。③文件。数据流图中的文件代表一种数据的暂存场所,可对其进行存取操作。

④外部实体。外部实体用以说明数据的来源和归宿,即表示数据的源点和终点。数据流图可以是层次性的。数据需求分析数据流图示例12.34数据需求分析12.35nnnnnnnnn(2)数据字典数据字典(DataDictionary,DD)用于定义数据流图中出现的所有数据元素和处理,即给出其确切的内涵解释。①数据字典的条目数据可分为三类:数据项、数据流和文件。数据项条目数据流条目数据库模式(文件)条目处理条目②数据字典的编制概念模型设计12.36■■■■■

数据库的概念模型是独立于任何计算机系统的信息结构模型,它是现实世界的“纯粹”表示。使用E-R方法设计概念模型一般要经过三个步骤,即设计用户分E-R图,合并用户分E-R图构成总体E-R图,以及对总体E-R图进行优化。1.分E-R图的设计分E-R图即用户局部视图。划分用户组确定实体及其属性概念模型设计12.37■■■■

实体和属性之间并不存在一个形式上可以截然划分的界限。在给定的应用环境中,可以遵循以下基本准则来划分实体和属性。①属性与它所描述的实体之间只能是单值联系,即联系只能是一对多的。②属性不能再有需要进一步描述的性质。③作为属性的数据项,除了它所描述的实体之外,不能再与其他实体具有联系。符合这三条准则的数据项,一般把它作为属性。概念模型设计12.38(3)确定实体之间的联系及其属性■■■■

在标定实体和属性的同时,要通过分析确定实体之间的联系以及联系的属性,并根据语义确定联系的类型。在确定实体之间联系的时候应该注意以下几个问题。①正确确定多元联系②避免连接陷阱(Connection

Traps)扇形陷阱(Fan

Traps)、断层陷阱(Chasm

Traps)(4)设计分E-R图概念模型设计12.39■2.总体E-R图的设计

总体E-R图即全局视图,它的设计就是分E-R图的综合,即所谓视图的集成。视图集成的具体做法是:选出最大的一个分E-R图作为基础,将其他分E-R图逐一合并上去。在合并的过程中必须注意以下工作。(1)消除命名冲突(2)综合同一实体的所有属性概念模型设计12.40(3)保留两实体之间的不同联系在综合的过程中还必须遵循以下原则:

(1)总体E-R图必须能准确地反映每个用户的数据要求。

(2)总体E-R图必须满足需求分析提出的处理要求。即在分E-R图能处理的,合并后的总体E-R图也能处

理。概念模型设计12.41■■■■■3.总体E-R图的优化

设法消去冗余。所谓优化主要就是指冗余信息的消除,使其保持最小冗余度。冗余的数据可用分析的方法加以消除。冗余的联系还可用规范化理论来消除,方法是:用函数依赖表达式表达E-R图中的每一个联系。求函数依赖表达式的最小覆盖。逐一检查不在最小覆盖中的函数依赖表达式,确认是否为冗余,若是则其对应的联系为冗余的联系,应当消去。逻辑设计12.42■

关系数据库的逻辑设计的任务,就是采取一定的策略,按照若干准则将概念模型转换为关系数据库管理系统所能接受的一组关系模式,并利用规范化的理论和方法对这组关系模式进行处理。可以用模式分解的概念来指导设计。物理设计12.43■■■■■■

数据库的物理设计是指对一个给定的逻辑数据结构选取一个最适合应用环境的物理结构的过程,使其既能满足性能准则,同时又不违反结构准则。所谓数据库的物理结构主要是指数据库在物理上的存储结构和存取方法。1.影响物理结构的主要因素数据的特性。数据的使用特性。可用性要求。DBMS的特性。资源的限制。物理设计12.442.物理设计的主要内容关系数据库的物理设计主要解决以下问题。(1)确定存储分配

许多关系DBMS提供了一些存储分配的参数供设计者选择,如页面的大小和数量,缓冲区的大小和数量,溢出空间的大小等。这些参数的确定可能会影响到存取效率和空间的利用率。数据库设计者可以估算数据库需要的存储空间的大小和增长率,确定这些物理存储参数,并为未来的数据库扩展留有余地。物理设计12.45■■(2)选择索引

索引的选择应该考虑两个问题,一是什么关系应该建立索引,二是选择哪个或哪些属性作为索引关键字。(3)数据的簇集数据的簇集(Clustering)物理设计12.46■■■簇集有下列三种情况。

①将一个关系按垂直或水平方向分解为多个关系,即按属性或记录分组,把经常使用的数据存放在一处,而很少存取的数据存放在另一处。②不同关系数据的簇集。③将一个关系按某个或某组属性的内容簇集。不少关系数据库管理系统都提供数据簇集的功能,可以按某一个簇集关键字(Cluster

Key)集中存放元组,簇集关键字可以由一个或多个属性组成。物理设计12.47■■■■■■■CREATE

CLUSTER

AC

(AGE,

NUMBER(3));

CREATE

TABLE

CL_STUDENTS

CLUSTER

AC(AGE)AS

SELECT

*

FROM

STUDENTS;INSERT

INTO

CL_STUDENTSSELECT

*

FROM

STUDENTS;DROP

TABLE

STUDENTS;RENAME

CL_

STUDENTS

TO

STUDENTS;数据安全性与完整性约束参数的确定确定基本关系和导出关系数据库设计评价12.48■数据库设计是一个设计和评价的迭代过程,物理设计完成之后,必须对设计方案进行评价。数据库设计评价准则一个通用的分析方法设计策略数据库设计评价准则12.49■■■■■■■■1.功能评价

根据系统分析说明书,检查设计方案是否支持用户的所有信息要求和处理要求。2.性能评价一个较好的方案应该具有较好的时空效率。查询响应时间更新事务的开销报表生成的开销数据库重组的开销内存空间外存空间一个通用的分析方法12.50■■■■

分析方法基于记录结构存取图。记录结构可以是一个关系,也可以是IMS中的片段或DBTG的记录型,还可以是文件系统的一个文件。记录结构的一个值称为一个记录。存储需要的分析根据记录值个数以及记录长度的说明,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论