数据库设计过程_第1页
数据库设计过程_第2页
数据库设计过程_第3页
数据库设计过程_第4页
数据库设计过程_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、数据库设计过程

数据库技术是信息资源管理最有效的手段。数据库设计是指对于一个给定的应用环境,

构造最优的数据库模式,建立数据库及其应用系统,有效存储数据,满意用户信息要求和

处理要求。

数据库设计中需求分析阶段综合各个用户的应用需求(现实世界的需求),在概念设计

阶段形成独立于机器特点、独立于各个DBMS产品的概念模式(信息世界模型),用E-R

图来描述。在规律设计阶段将E-R图转换成详细的数据库产品支持的数据模型如关系模型,

形成数据库规律模式。然后依据用户处理的要求,平安性的考虑,在基本表的基础上再建

立必要的视图(VIEW)形成数据的外模式。在物理设计阶段依据DBMS特点和处理的需

要,进行物理存储支配,设计索引,形成数据库内模式。

1.需求分析阶段

需求收集和分析,结果得到数据字典描述的数据需求(和数据流图描述的处理需求)o

需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、平安

性与完整性要求。

需求分析的方法:调查组织机构状况、调查各部门的业务活动状况、帮助用户明确对

新系统的各种要求、确定新系统的边界。

常用的调查方法有:跟班作业、开调查会、请专人介绍、询问、设计调查表请用户填

写、查阅纪录。

分析和表达用户需求的方法主要包括自顶向下和自底向上两类方法。自顶向下的结构

化分析方法(StructuredAnalysis,简称SA方法)从最上层的系统组织机构入手,采纳

逐层分解的方式分析系统,并把每一层用数据流图和数据字典描述。

数据流图表达了数据和处理过程的关系。系统中的数据则借助数据字典(Data

Dictionary,简称DD)来描述。

数据字典是各类数据描述的集合,它是关于数据库中数据的描述,即元数据,而不是

数据本身。数据字典通常包括数据项、数据结构、数据流、数据存储和处理过程五个部分(至

少应当包含每个字段的数据类型和在每个表内的主夕隧)。

数据项描述={数据项名,数据项含义说明,别名,数据类型,长度,

取值范围,取值含义,与其他数据项的规律关系}

数据结构描述={数据结构名,含义说明,组成:{数据项或数据结构}}

数据流描述={数据流名,说明,数据流来源,数据流去向,

组成:{数据结构},平均流量,高峰期流量}

数据存储描述={数据存储名,说明,编号,流入的数据流,流出的数据流,

组成:{数据结构},数据量,存取方式}

处理过程描述={处理过程名,说明,输入:{数据流},输出:{数据流},

处理:{简要说明}}

2.概念结构设计阶段

通过对用户需求进行综合、归纳与抽象,形成一个独立于详细DBMS的概念模型,可

以用E-R图表示。

概念模型用于信息世界的建模。概念模型不依靠于某一个DBMS支持的数据模型。概

念模型可以转换为计算机上某一DBMS支持的特定数据模型。

概念模型特点:

(1)具有较强的语义表达力量,能够便利、直接地表达应用中的各种语义学问。

(2)应当简洁、清楚、易于用户理解,是用户与数据库设计人员之间进行沟通的语言。

概念模型设计的一种常用方法为IDEF1X方法,它就是把实体-联系方法应用到语义数

据模型中的一种语义模型化技术,用于建立系统信息模型。

使用IDEF1X方法创建E-R模型的步骤如下所示:

2.1第零步一初始化工程

这个阶段的任务是从目的描述和范围描述开头,确定建模目标,开发建模方案,组织

建模队伍,收集源材料,制定约束和法律规范。收集源材料是这阶段的重点。通过调查和

观看结果,业务流程,原有系统的输入输出,各种报表,收集原始数据,形成了基本数据

资料表。

2.2第一步——定义实体

实体集成员都有一个共同的特征和属性集,可以从收集的源材料一基本数据资料表

中直接或间接标识出大部分实体。依据源材料名字表中表示物的术语以及具有"代码”结

尾的术语,如客户代码、代理商代码、产品代码等将其名词部分代表的实体标识出来,从

而初步找出潜在的实体,形成初步实体表。

2.3其次步——定义联系

IDEF1X模型中只允许二元联系,n元联系必需定义为n个二元联系。依据实际的业务

需求和规章,使用实体联系矩阵来标识实体间的二元关系,然后依据实际状况确定出连接

关系的势、关系名和说明,确定关系类型,是标识关系、非标识关系(强制的或可选的)

还是非确定关系、分类关系。假如子实体的每个实例都需要通过和父实体的关系来标识,

则为标识关系,否则为非标识关系。非标识关系中,假如每个子实体的实例都与而且只与

一个父实体关联,则为强制的,否则为非强制的。假如父实体与子实体代表的是同一现实

对象,那么它们为分类关系。

2.4第三步——定义码

通过引入交叉实体除去上一阶段产生的非确定关系,然后从非交叉实体和独立实体开

头标识侯选码属性,以便唯一识别每个实体的实例,再从侯选码中确定主码。为了确定主

码和关系的有效性,通过非空规章和非多值规章来保证,即一个实体实例的一个属性不能

是空值,也不能在同一个时刻有一个以上的值。找出误认的确定关系,将实体进一步分解,

最终构造出IDEF1X模型的键基视图(KB图1

2.5第四步——定义属性

从源数据表中抽取说明性的名词开发出属性表,确定属性的全部者。定义非主码属性,

检查属性的非空及非多值规章。此外,还要检查完全依靠函数规章和非传递依靠规章,保

证一个非主码属性必需依靠于主码、整个主码、仅仅是主码。以此得到了至少符合关系理

论第三范式的改进的IDEF1X模型的全属性视图。

2.6第五步——定义其他对象和规章

定义属性的数据类型、长度、精度、非空、缺省值、约束规章等。定义触发器、存储

过程、视图、角色、同义词、序列等对象信息。

3.规律结构设计阶段

将概念结构转换为某个DBMS所支持的数据模型(例如关系模型),并对其进行优化。

设计规律结构应当选择最适于描述与表达相应概念结构的数据模型,然后选择最合适的

DBMSO

将E-R图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转化为

关系模式,这种转换一般遵循如下原则:

1)一个实体型转换为一个关系模式。实体的属性就是关系的属性。实体的码就是关系

的码。

2)一个m:n联系转换为一个关系模式。与该联系相连的各实体的码以及联系本身的

属性均转换为关系的属性。而关系的码为各实体码的组合。

3)-个l:n联系可以转换为一个独立的关系模式也可以与n端对应的关系模式合并。

假如转换为一个独立的关系模式,则与该联系相连的各实体的码以及联系本身的属性均转

换为关系的属性,而关系的码为n端实体的码。

4)一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式

合并。

5)三个或三个以上实体间的一个多元联系转换为一个关系模式。与该多元联系相连的

各实体的码以及联系本身的属性均转换为关系的属性。而关系的码为各实体码的组合。

6)同一实体集的实体间的联系,即自联系,也可按上述1:1、l:n和m:n三种状况分

别处理。

7)具有相同码的关系模式可合并。

为了进一步提高数据库应用系统的性能,通常以法律规范化理论为指导,还应当适当

地修改、调整数据模型的结构,这就是数据模型的优化。确定数据依靠。消退冗余的联系。

确定各关系模式分别属于第几范式。确定是否要对它们进行合并或分解。一般来说将关系

分解为3NF的标准,即:

表内的每一个值都只能被表达一次。

〃表内的每一行都应当被唯一的标识(有唯一键X

表内不应当存储依靠于其他键的非键信息。

4.数据库物理设计阶段

为规律数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法X依

据DBMS特点和处理的需要,进行物理存储支配,设计索引,形成数据库内模式。

5.数据库实施阶段

运用DBMS供应的数据语言(例如SQL)及其宿主语言(例如C),依据规律设计和

物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。数据

库实施主要包括以下工作:用DDL定义数据库结构、组织数据入库、编制与调试应用程

序、数据库试运行

6.数据库运行和维护阶段

数据库应用系统经过试运行后即可投入正式运行。在数据库系统运行过程中必需不断

地对其进行评价、调整与修改。包括:数据库的转储和恢复、数据库的平安性、完整性掌

握、数据库性能的监督、分析和改进、数据库的重组织和重构造。

建模工具的使用

为加快数据库设计速度,目前有很多数据库帮助工具(CASE工具),如Rational公司

的RationalRose,CA公司的Erwin和BpwinSybase公司的PowerDesigner以及Oracle

公司的OracleDesigner等。

ERwin主要用来建立数据库的概念模型和物理模型。它能用图形化的方式,描述出实

体、联系及实体的属性。ERwin支持IDEF1X方法。通过使用ERwin建模工具自动生成、

更改和分析IDEF1X模型,不仅能得到优秀的业务功能和数据需求模型,而且可以实现从

IDEF1X模型到数据库物理设计的转变。ERwin工具绘制的模型对应于规律模型和物理模

型两种。在规律模型中JDEF1X工具箱可以便利地用图形化的方式构建和绘制实体联系及

实体的属性。在物理模型中,ERwin可以定义对应的表、列J,并可针对各种数据库管理系

统自动转换为适当的类型。

设计人员可依据需要选用相应的数据库设计建模工具。例如需求分析完成之后,设计

人员可以使用Erwin画ER图,将ER图转换为关系数据模型,生成数据库结构;画数据流

图,生成应用程序。

二、数据库设计技巧

1.设计数据库之前(需求分析阶段)

1)理解客户需求,询问用户如何看待将来需求变化。让客户解释其需求,而且随着开

发的连续,还要常常询问客户保证其需求仍旧在开发的目的之中。

2)了解企业业务可以在以后的开发阶段节省大量的时间。

3)重祗阵俞入输出。

在定义数据库表和字段需求(输入)时,首先应检查现有的或者已经设计出的报表、

查询和视图(输出)以打算为了支持这些输出哪些是必要的表和字段。

举例:彳触口客户需要一个报表依据邮政编码排序、分段和求和,你要保证其中包括了

单独的邮政编码字段而不要把邮政编码糅进地址字段里。

4)创建数据字典和ER图表

ER图表和数据字典可以让任何了解数据库的人都明确如何从数据库中获得数据。ER

图对表明表之间关系很有用,而数据字典则说明白每个字段的用途以及任何可能存在的别

名。对SQL表达式的文档化来说这是完全必要的。

5)定义标准的对象命名法律规范

数据库各种对象的命名必需法律规范。

2.表和字段的设计(数据库规律设计)

表设计原则

1)标准化和法律规范化

数据的标准化有助于消退数据库中的数据冗余。标准化有好几种形式,但Third

NormalForm(3NF)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简

洁来说,遵守3NF标准的数据库的表设计原则是:"OneFactinOnePlace"即某个表只

包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过

外键相连接。它具有以下特点:有一组表特地存放通过键连接起来的关联数据。

举例:某个存放客户及其有关定单的3NF数据库就可能有两个表:Customer和

表不包含定单关联客户的任何信息,但表内会存放一个键值,该键指向

OrderoOrder

Customer表里包含该客户信息的那一行。

事实上,为了效率的原因,对表不进行标准化有时也是必要的。

2)数据驱动

采纳数据驱动而非硬编码的方式,很多策略变更和维护都会便利得多,大大增加系统

的敏捷性和扩展性。

举例,假如用户界面要访问外部数据源(文件、XML文档、其他数据库等),不妨把

相应的连接和路径信息存储在用户界面支持表里。还有,假如用户界面执行工作流之类的

任务(发送邮件、打印信笺、修改纪录状态等),那么产生工作流的数据也可以存放在数据

库里。角色权限管理也可以通过数据驱动来完成。事实上,假如过程是数据驱动的,你就

可以把相当大的责任推给用户,由用户来维护自己的工作流过程。

3)考虑各种变化

在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。

举例,姓氏就是如此(留意是西方人的姓氏,比如女性结婚后从夫姓等\所以,在建

立系统存储客户信息时,在单独的一个数据表里存储姓氏字段,而且还附加起始日和终止

日等字段,这样就可以跟踪这一数据条目的变化。

字段设计原则

4)每个表中都应当添加的3个有用的字段

•?dRecordCreationDate,在VB下默认是Now(),而在SQLServer下默认为

GETDATEO

•?sRecordCreator,在SQLServer下默认为NOTNULLDEFAULTUSER

.?nRecordVersion,纪录的版本标记;有助于精确说明纪录中消失null数据或

者丢失数据的缘由

5)对地址和电话采纳多个字段

描述街道地址就短短一行纪录是不够的。AddressJJnel、Address_Line2和

Address_Line3可以供应更大的敏捷性。还有,电话号码和邮件地址最好拥有自己的数据

表,其间具有自身的类型和标记类别。

6)使用角色实体定义属于某类别的列

在需要对属于特定类别或者具有特定角色的事物做定义时,可以用角色实体来创建特

定的时间关联关系,从而可以实现自我文档化。

举例:用PERSON实体和PERSON_TYPE实体来描述人员。比方说,当JohnSmith,

Engineer提升为JohnSmith,Director乃至最终爬到JohnSmith,CIO的高位,而全部

你要做的不过是转变两个表PERSON和PERSON_TYPE之间关系的键值,同时增加一个

日期/时间字段来知道变化是何时发生的。这样,你的PERSON_TYPE表就包含了全部

PERSON的可能类型,比如Associate、Engineer,Director,CIO或者CEO等。还有

个替代方法就是转变PERSON纪录来反映新头衔的变化,不过这样一来在时间上无法跟

踪个人所处位置的详细时间。

7)选择数字类型和文本类型尽量充分

在SQL中使用smallint和tinyint类型要特殊当心。比如,假如想看看月销售总额,

总额字段类型是smallint,那么,假如总额超过了$32,767就不能进行计算操作了。

而ID类型的文本字段,比如客户ID或定单号等等都应当设置得比一般想象更大。假

设客户ID为10位数长。那你应当把数据库表字段的长度设为12或者13个字符长。但

这额外占据的空间却无需将来重构整个数据库就可以实现数据库规模的增长了。

8)增加删除标记字段

在表中包含一个"删除标记"字段,这样就可以把行标记为删除。在关系数据库里不

要单独删除某一行;最好采纳清除数据程序而且要认真维护索引整体性。

3.选择键和索引(数据库规律设计)

键选择原则:

1)键设计4原则

・?为关联字段创建外键。

・?全部的键都必需唯一。

・?避开使用复合键。

・?外键总是关联唯一的键字段。

2)使用系统生成的主键

设计数据库的时候采纳系统生成的键作为主键,那么实际掌握了数据库的索引完整性。

这样,数据库和非人工机制就有效地掌握了对存储数据中每一行的访问。采纳系统生成键

作为主键还有一个优点:当拥有全都的键结构时,找到规律缺陷很简洁。

3)不要用用户的键(不让主键具有可更新性)

在确定采纳什么字段作为表的键的时候,可肯定要当心用户将要编辑的字段。通常的

状况下不要选择用户可编辑的字段作为键。

4)可选键有时可做主键

把可选键进一步用做主键,可以拥有建立强大索引的力量。

索引使用原则:

索引是从数据库中猎取数据的最高效方式之一。95%的数据库性能问题都可以采纳索

引技术得到解决。

1)规律主键使用唯一的成组索引,对系统键(作为存储过程探纳唯一的非成组索引,

对任何外键列采纳非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访

问是否主要用作读写。

2)大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是常常

使用的键,比如运行查询显示主表和全部关联表的某条纪录就用得上。

3)不要索引memo/note字段,不要索引大型字段(有很多字符),这样作会让索引

占用太多的存储空间。

4)不要索引常用的小型表

不要为小型数据表设置任何键,假如它们常常有插入和删除操作就更别这样作了。对

这些插入和删除操作的索引维护可能比扫描表空间消耗更多的时间。

4.数据完整性设计(数据库规律设计)

1)完整性实现机制:

实体完整性:主键

参照完整性:

父表中删除数据:级联删除;受限删除;置空值

父表中插入数据:受限插入;递归插入

父表中更新数据:级联更新;受限更新;置空值

DBMS对参照完整性可以有两种方法实现:外键实现机制(约束规章)和触发器实现

机制

用户定义完整性:

NOTNULL;CHECK;触发器

2)用约束而非商务规章强制数据完整性

采纳数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括

数据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依靠于商务

层保证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规章

之上。

3)强制指示完整性

在有害数据进入数据库之前将其剔除。激活数据库系统的指示完整性特性。这样可以

保持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。

4)使用查找掌握数据完整性

掌握数据完整性的最佳方式就是限制用户的选择。只要有可能都应当供应应用户一个

清楚的价值列表供其选择。这样将削减键入代码的错误和误会同时供应数据的全都性。某

些公共数据特殊适合查找:我国代码、状态代码等。

5)采纳视图

为了在数据库和应用程序代码之间供应另一层抽象,可以为应用程序建立特地的视图

而不必非要应用程序直接访问数据表。这样做还等于在处理数据库变更时给你供应了更多

的自由。

5.其他设计技巧

1)避开使用触发器

触发器的功能通常可以用其他方式实现。在调试程序时触发器可能成为干扰。假如你

的确需要采纳触发器,你最好集中对它文档化。

2)使用常用英语(或者其他任何语言)而不要使用编码

在创建下拉菜单、列表、报表时最好依据英语名排序。假如需要编码,可以在编码旁

附上用户知道的英语。

3)保存常用信息

让一个表特地存放一般数据库信息特别有用。在这个表里存放数据库当前版本、最近

检查/修复(对Access)关联设计文档的名称、客户等信息。这样可以实现一种简洁机制

跟踪数据库,当客户埋怨他们的数据库没有达到盼望的要求而与你联系时,这样做对非客

户机/服务器环境特殊有用。

4)包含版本机制

在数据库中引入版本掌握机制来确定使用中的数据库的版本。时间一长,用户的需求

总是会转变的。最终可能会要求修改数据库结构。把版本信息直接存放到数据库中更为便

利。

5)编制文档

对全部的快捷方式、命名法律规范、限制和函数都要编制文档。

采纳给表、歹人触发器等加注释的数据库工具。对开发、支持和跟踪修改特别有用。

对数据库文档化,或者在数据库自身的内部或者单独建立文档。这样,当过了一年多

时间后再回过头来做第2个版本,犯错的机会将大大削减。

6)测试、测试、反复测试

建立或者修订数据库之后,必需用用户新输入的数据测试数据字段。最重要的是,让

用户进行测试并且同用户一道保证选择的数据类型满意商业要求。测试需要在把新数据库

投入实际服务之前完成。

7)检查设计

在开发期间检查数据库设计的常用技术是通过其所支持的应用程序原型检查数据库。

换句话说,针对每一种最终表达数据的原型应用,保证你检查了数据模型并且查看如何取

出数据。

三、数据库命名法律规范

1.实体(表)的命名

1)表以名词或名词短语命名,确定表名是采纳复数还是单数形式,此外给表的别名定

义简洁规章(比方说,假如表名是一个单词,别名就取单词的前4个字母;假如表名是两

个单词,就各取两个单词的前两个字母组成4个字母长的别名;假如表的名字由3个单

词组成,从头两个单词中各取一个然后从最终一个单词中再取出两个字母,结果还是组成

4字母长的别名,其余依次类推)

对工作用表来说,表名可以加上前缀WORK,后面附上采纳该表的应用程序的名字。

在命名过程当中,依据语义拼凑缩写即可。留意,由于ORCLE会将字段名称统一成大写

或者小写中的一种,所以要求加上下划线。

举例:

定义的缩写Sales:Sal销售;

Order:Ord订单;

Detail:Dtl明细;

则销售订单明细表命名为:Sal_Ord_Dtl;

2)假如表或者是字段的名称仅有一个单词,那么建议不使用缩写,而是用完整的单词。

举例:

定义的缩写MaterialMa物品;

物品表名为:Material,而不是Ma.

但是字段物品编码则是:Ma」D;而不是MaterialJD

3)全部的存储值列表的表前面加上前缀Z

目的是将这些值列表类排序在数据库最终。

4)全部的冗余类的命名(主要是累计表)前面加上前缀X

冗余类是为了提高数据库效率,非法律规范化数据库的时候加入的字段或者表

5)关联类通过用下划线连接两个基本类之后,再加前缀R的方式命名,后面依据字母

挨次排列两个表名或者表名的缩写。

关联表用于保存多对多关系。

假如被关联的表名大于10个字母,必需将原来的表名的进行缩写。假如没有其他缘

由,建议都使用缩写。

举例表Object与自身存在多对多的关系,则保存多对多关系的表命名为:R_Object;

表Depart和Employee;存在多对多的关系;则关联表命名为R_Dept_Emp

2.属性(列)的命名

1)采纳有意义的列名,表内的列要针对键采纳一整套设计规章。每一个表都将有一个

自动ID作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论