




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据库系统概论An Introduction to Database System第六章 关系数据理论完整性约束的表现形式限定属性取值范围:例如学生成绩必须在0-100之间定义属性值之间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键思考题查询中常常使用连接、嵌套查询,把表设计成一个有各种属性的单一关系,不是更简便?大量冗余更新时必须保持所有相关元组内容一致SNOCNOCTITLETNAMETLOCAGRADE80152C1OSLinuxD17080153C2DBIBMD28580154C1OSLinuxD18680154C3AIMinskyD37280155C1
2、OSLinuxD192SNO为学号CNO为课程号CTITLE为课程名TNAME为教师名TLOCA为教师地址GRADE为成绩。 假如要进行如下操作,会出现什么现象?插入操作:增设一门新课程时, 还没有学生选修;删除操作:学生80154退选课程AI, 查询教课程AI的教师原因?解决方法?主键:SNO+Cno内容、提纲本章主要介绍关系数据库模式设计的理论 - 关系数据理论,也称为关系规范化理论。是从数据库逻辑设计(即数据库模式设计)的需要提出的理论,是数据库逻辑设计的基础。本章是整个课程的重点和难点之一,理论性较强,应通过例子学习掌握定理、算法的实质。三部分内容:函数依赖;范式;模式的分解第六章 关
3、系数据理论6.1 问题的提出6.2 规范化6.3 数据依赖的公理系统*6.4 模式的分解6.5 小结Relational database designRelational database design: The grouping of attributes to form good relation schemasTwo levels of relation schemas:The logical user view levelThe storage base relation levelDesign is concerned mainly with base relations关系模式的
4、设计问题关系数据库模式是关系模式的集合 关系数据库模式 = 关系模式 关系数据库模式设计就是要确定:有几个关系模式每个关系模式的名称,属性组成域的定义和说明数据完整性的要求等数据库逻辑设计的工具关系数据库的规范化理论问题的提出一、概念回顾二、关系模式的形式化定义三、什么是数据依赖四、关系模式的简化定义五、数据依赖对关系模式影响一、概念回顾关系:描述实体、属性、实体间的联系。从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。关系模式:用来定义关系。关系数据库:基于关系模型的数据库,利用关系来描述现实世界。从形式上看,它由一组关系组成。关系数据库的模式:定义这组关系的关系模式的全体。二
5、、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组: R(U, D, DOM, F)R: 关系名U: 组成该关系的属性名集合D: 属性组U中属性所来自的域DOM: 属性向域的映象集合F: 属性间数据的依赖关系集合D和DOM对模式设计关联不大,故本章把关系模式看作三元组: R(U, F)三、什么是数据依赖1. 完整性约束的表现形式限定属性取值范围:例如学生成绩必须在0-100之间定义属性值之间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键2. 数据依赖一个关系内部,属性与属性之间的约束关系现实世界属性之间相互联系的抽象数据内在的性质语义的体现四、关系模式
6、的简化表示关系模式R(U, D, DOM, F) D和DOM对模式设计关联不大,故本章把关系模式简化为一个三元组: R(U, F)当且仅当U上的一个关系r满足F时,r称为关系模式 R(U, F)的一个关系问题的提出一、概念回顾二、关系模式的形式化定义三、什么是数据依赖四、关系模式的简化定义五、数据依赖对关系模式影响五、数据依赖对关系模式的影响例1建立一个描述学校教务的数据库:学生的学号(Sno)、所在系(Sdept)系主任姓名(Mname)、课程名(Cname)成绩(Grade)单一的关系模式 : Student U Sno, Sdept, Mname, Cname, Grade 学校数据库的
7、语义: 一个系有若干学生, 一个学生只属于一个系; 一个系只有一名主任; 一个学生可以选修多门课程, 每门课程有若干学生选修; 每个学生所学的每门课程都有一个成绩。学校数据库的语义: 一个系有若干学生, 一个学生只属于一个系; 一个系只有一名主任; 一个学生可以选修多门课程, 每门课程有若干学生选修; 每个学生所学的每门课程都有一个成绩。属性组U上的一组函数依赖F: F Sno Sdept, Sdept Mname, (Sno, Cname) Grade SnoCnameSdeptMnameGrade关系模式的设计问题: 例S( Sno, Sname, Sdept, Mname, Cname,
8、 Grade )SnoSnameSdeptMNameCnameGradeS01杨明D01思齐C0190S02李婉D01思齐C0187S01杨明D01思齐C0292S03刘海D02述圣C0195S04安然D02述圣C0278S05乐天D03省身C0182重复 更新:更换系主任,杨明转系了删除:D02的学生都毕业了, 杨明的选课取消插入:新系D04还没招学生,新生张三还没选课关系模式Student中存在的问题S( Sno, Sdept, Mname, Cname, Grade ) 数据冗余太大浪费大量的存储空间 例:如果一个学生选修了k门课,则有关他的所在系的信息重复k 次。 更新异常(Updat
9、e Anomalies)数据冗余 ,更新数据时,维护数据完整性代价大。例:某系更换系主任后,系统必须修改与该系学生有关的每一个元组。再例如,学生转系,若他选修了k门课,则需要修改k次。关系模式Student中存在的问题S( Sno, Sdept, Mname, Cname, Grade ) 插入异常(Insertion Anomalies)该插的数据插不进去 例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。再例如,如果学生没有选课,关于他的个人信息及所在系的信息就无法插入。 删除异常(Deletion Anomalies)不该删除的数据不得不删例,如果某个系的学生
10、全部毕业了, 我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。 再例如,如果删除学生全部选课信息,则有关他的个人信息也随之删除了。关系模式Student中存在的问题1. 数据冗余太大2. 更新异常(Update Anomalies)3. 插入异常(Insertion Anomalies)4. 删除异常(Deletion Anomalies)原因?解决方法?数据依赖对关系模式的影响(续)结论:Student关系模式不是一个好的模式。“好”的模式:不会发生插入异常、删除异常、更新异常,数据冗余应尽可能少原因:由存在于模式中的某些数据依赖引起的解决方法:通过分解关系模式来消除其中不合
11、适 的数据依赖分解关系模式把这个单一模式分成3个关系模式: S(Sno,Sdept,Sno Sdept); SC(Sno,Cno,Grade,(Sno,Cno) Grade); DEPT(Sdept,Mname,Sdept Mname)6.2 规范化 规范化理论正是用来改造关系模式,通过分解关系模式,消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。分解关系模式:让一个关系模式,尽量只描述一个概念、一个实体或一种实体之间的联系 - 概念单一!6.2 规范化规范化理论是E.F.Codd于1971年提出的。本节共8小节,讨论的内容:定义函数依赖、多值依赖、码等概念。以这些
12、概念为基础,分析关系模式存在“不好”的性质的原因。定义关系模式的各级范式:2NF、3NF、BCNF、4NF。通过“分解”把“不好”的关系模式,转换为更合适的形式。内容6.2.1 函数依赖6.2.2 码6.2.3 范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.1 函数依赖 函数依赖是很重要的概念,后面许多概念都建立在函数依赖概念之上,函数依赖取决于数据的语义。函数依赖平凡函数依赖与非平凡函数依赖完全函数依赖与部分函数依赖传递函数依赖一、函数依赖定义6.1 设R(U)是一个属性集U上的关系模式, X,YU, 若对于R(U)的任意一个可能的
13、关系r,r中不可能存在两个元组,在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作XY。 XY:对于R(U)的任意一个可能的关系r,r都存在着: 对于X的每一个属性值,都有Y唯一的属性值与之对应。A set of attributes X functionally determines a set of attributes Y, if the value of X determines a unique value for Y Functional DependenciesX Y holds if whenever two tuples hav
14、e the same value for X, they must have the same value for YIf t1X=t2X, then t1Y=t2Y in any relation instance r(R)X Y in R specifies a constraint on all relation instances r(R)函数依赖一旦确定,任何时候(过去、现在、将来)的所有关系实例都应满足这个函数依赖。FDs are derived from the real-world constraints on the attributes根据现实世界的数据语义确定,实际上是对
15、现实世界数据的联系的论断,要根据数据的客观存在的联系,和企业(组织)的管理规章制度来确定。Functional DependenciesAn FD is a property of the attributes in the schema RIf K is a key of R, then K functionally determines all attributes in R (since we never have two distinct tuples with t1K=t2K)Given a set of FDs F, we can infer additional FDs that
16、 hold whenever the FDs in F hold函数依赖:例检验在下面的关系实例中,是否成立函数依赖:AC?CA?ABD?ABCDa1b1c1d1a1b2c1d2a2b2c2d2a2b3c2d3a3b3c2d4如果一域列上的值互不相同, 则该域列一定可以函数决定其他域列。二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,如果XY,但Y X,则称XY是非平凡的函数依赖若XY,但Y X, 则称XY是平凡的函数依赖例:在关系SC(Sno, Cno, Grade)中, 非平凡函数依赖: (Sno, Cno) Grade 平凡函数依赖: (Sno, Cno) Sn
17、o (Sno, Cno) Cno任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明, 我们总是讨论非平凡函数依赖。函数依赖的一些术语若X Y,则称X为决定因素(Determinant)或函数依赖的左部,Y称为函数依赖的右部。若X Y , Y X,则记作 X Y 。若Y不函数依赖于X,则记作 X Y。练习: 找出以下关系几个可能的非平凡的FD?ABC123423533函数依赖的确定: 例给出具体关系,可以从分析属性列之间的联系类型(1:1, 1:n, m:n)入手确定函数依赖。若 X (1:1) Y 则有FD: XY和YX X (1:n) Y 则有FD: YX X (n
18、:1) Y 则有FD: XY X (m:n) Y 则没有FD A B C a1 b1 c2 a2 b3 c2 a3 b4 c4 a3 b4 c4例: 考察右表的非平凡 的函数依赖, 有: AC, BC, ABC, AB,ACB,等三、完全函数依赖与部分函数依赖定义6.2 在R(U)中,如果XY,并且对于X的任何一个真子集X,都有X Y, 则称Y对X完全函数依赖,记作 X F Y。 若XY,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作X P Y。 注意:X只由一个属性组成,则XY必定是完全函数依赖。Full functional dependency a FD Y Z where rem
19、oval of any attribute from Y means the FD does not hold any more完全函数依赖与部分函数依赖(续)例1 中(Sno,Cno)Grade是完全函数依赖, (Sno,Cno)Sdept是部分函数依赖 因为Sno Sdept成立,且Sno是(Sno,Cno)的真子集 FP找出 S( Sno, Sdept, Mname, Cname, Grade )中的完全函数依赖和部分函数依赖四、传递函数依赖定义6.3 在R(U)中,如果XY,(Y X) ,YX YZ, 则称Z对X传递函数依赖。 记为:X Z 注: 如果YX, 即XY,则Z直接依赖于X。
20、例: 在关系Std(Sno, Sdept, Mname)中,有: Sno Sdept,Sdept Mname Mname传递函数依赖于Sno传递Transitive functional dependency if there a set of atribute Z that are neither a primary or candidate key and both X Z and Y Z holds. 6.2 规范化6.2.1 函数依赖6.2.2 码6.2.3 范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.9 规范化小结6.2.
21、2 码定义6.4 设K为R中的属性或属性组合。 若K U, 则K称为R的侯选码(Candidate Key)。 若候选码多于一个,则选定其中的一个做为主码(Primary Key)。F码(续)主属性与非主属性包含在任何一个候选码中的属性 ,称为主属性(Prime attribute) 不包含在任何码中的属性称为非主属性(Nonprime attribute)或非码属性(Non-key attribute) 全码整个属性组是码,称为全码(All-key) 码(续)例2 关系模式S(Sno,Sdept,Sage),单个属性Sno是码, SC(Sno,Cno,Grade)中,(Sno,Cno)是码例
22、3 关系模式R(P,W,A) P:演奏者 W:作品 A:听众 一个演奏者可以演奏多个作品 某一作品可被多个演奏者演奏 听众可以欣赏不同演奏者的不同作品 码为(P,W,A),即All-Key 外部码定义6.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码如在SC(Sno,Cno,Grade)中,Sno不是码,但Sno是关系模式S(Sno,Sdept,Sage)的码,则Sno是关系模式SC的外部码 主码与外部码一起提供了表示关系间联系的手段例: 码的确定求出关系模式R的所有候选码:U= A , B , C ,
23、 D , E F=ABC, BD, CE, ECB, ACB 注: 码或者是某一函数依赖的左部, 或是一个属性组。验证AB是否码, 须证明 AB ABCDE是否成立? Step 1 AB ABCDEABC(已知), 而ABAB(自反), AB ABC(合并)BD(已知), ABAD(增广), AB ABCD(合并)CE(已知), ABC(已知), AB E(传递) 于是 AB ABCDE(合并)例: 码的确定验证AB是否码? 前面已得到 AB ABCDE, 又, 显然 AABCDE, BABCDE, 故所以AB ABCDE。得证AB是一个候选码。同理可证:AC也是一个候选码。说明:如果每一个F
24、D的决定因素都不是码,则要考虑这些决定因素的组合是否构成码;除了码的定义外,有候选码的求解理论和算法,在后面可以补充介绍更好的求码方法。码的确定: 练习根据码的定义,求关系模式R的所有候选码。U= A , B , C , D , F=A B, CB 答:ACD6.2 规范化 Normalization 6.2.1 函数依赖6.2.2 码6.2.3 范式 Normal Form6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.9 规范化小结6.2.3 范式范式是符合某一种级别的关系模式的集合关系数据库中的关系必须满足一定的要求。满足不同程度要求
25、的为不同范式范式的种类:第一范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第五范式(5NF)6.2.3 范式各种范式之间存在联系:某一关系模式R为第n范式,可简记为RnNF。一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化 Normalization 1NF2NF3NF4NFBCNF5NF1NF第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库如果一个关系模式R的所有属性,都是不可分的基本数据项,则R1NF即不能以集合、序列等作为属性值; 不能有大表套小表的情况。Disa
26、llows composite attributes, multivalued attributes, and nested relations; attributes whose values for an individual tuple are non-atomic.Considered to be part of the definition of relation .但是满足第一范式的关系模式,并不一定是一个好的关系模式6.2 规范化6.2.1 函数依赖6.2.2 码6.2.3 范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.
27、9 规范化小结2NF例4 关系模式 S-L-C(Sno, Sdept, Sloc, Cno, Grade) Sloc为学生住处,假设每个系的学生住在同一个地方函数依赖包括: (Sno, Cno) F Grade Sno Sdept (Sno, Cno) P Sdept Sno Sloc (Sno, Cno) P Sloc Sdept SlocSnoCnoGradeSdeptSlocS-L-C的码为(Sno, Cno)S-L-C满足第一范式。非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno)SLC不是一个好的关系模式(1) 插入异常假设Sno101,SdeptIS,SlocN的学生
28、,还未选课,因课程号是主属性,因此该学生的信息无法插入SLC。(2) 删除异常 假定某个学生本来只选修了3号课程这一门课。现在因身体不适,他连3号课程也不选修了。因课程号是主属性,此操作将导致该学生信息的整个元组都要删除。 SLC不是一个好的关系模式(3) 数据冗余度大 如果一个学生选修了10门课程,那么他的Sdept和Sloc值就要重复存储了10次。(4) 修改复杂 例如学生转系,在修改此学生元组的Sdept值的同时,还可能需要修改住处(Sloc)。如果这个学生选修了K门课,则必须无遗漏地修改K个元组中全部Sdept、Sloc信息。 S-L-C不是一个好的关系模式(续)原因 Sdept、 S
29、loc部分函数依赖于码。解决方法 S-L-C分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade) S-L(Sno, Sdept, Sloc)2NF(续)函数依赖图:SnoCnoGradeSCS-LSnoSdeptSloc关系模式SC的码为(Sno,Cno)关系模式S-L的码为Sno这样非主属性对码都是完全函数依赖 SnoCnoGradeSdeptSloc 2NF(续)2NF的定义定义6.6 若R1NF,且每一个非主属性完全函数依赖于码,则R2NF。A relation schema R is in second normal form (2NF) if every
30、 non-prime attribute A in R is fully functionally dependent on the primary key例:S-L-C(Sno, Sdept, Sloc, Cno, Grade) 1NF S-L-C(Sno, Sdept, Sloc, Cno, Grade) 2NF 若R属于1NF,但R不一定属于2NF。 SC(Sno, Cno, Grade) 2NF S-L(Sno, Sdept, Sloc) 2NF思考:一些特殊的关系模式1. 不存在非主属性的关系模式 没有非主属性2. 全码关系模式。 没有非主属性3. 码只由一个属性组成的关系模式不会有
31、部分依赖4. 二目关系模式 码或是一个属性,或是全码练习 ABC, ABD, AC设有关系模式R(A, B, C, D), 码为AB,给出它的一个函数依赖集,使得 R属于1NF而不属于2NF。例子 2NF(续)采用投影分解法,将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。将一个1NF关系,分解为多个2NF的关系,能否完全消除关系模式中的各种异常情况和数据冗余?S-LSnoSdeptSloc数据冗余:每个学生都存储了系、系宿舍的信息。更新异常:如果换系宿舍,则该系每个学生元组都要做相应修改。删除异常:如果某系的
32、学生全部毕业了,则在删除学生信息的同时将关于系宿舍的信息也随之删除了。插入异常:如果某系还没有招学生,则关于该系宿舍的信息就无法插入。3NF:提出问题关系模式 S-L(Sno, Sdept, Sloc) 2NF但仍然具有不良特性。原因是:存在非主属性,对码的传递函数依赖 - 消除! 提出3NF。S-LSnoSdeptSloc6.2 规范化6.2.1 函数依赖6.2.2 码6.2.3 范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.9 规范化小结R1NF,且每一个非主属性完全函数依赖于码 6.2.5 3NF3NF的定义定义6.7 关系模式
33、R 中 若不存在这样的码X、属性组Y及非主属性Z(Z Y), 使得XY,YZ成立, Y X,则称R 3NF。若R3NF,则每一个非主属性,既不部分依赖于码,也不传递依赖于码。 A relation schema R is in third normal form (3NF) if it is in 2NF and no non-prime attribute A in R is transitively dependent on the primary key3NF(续)例:2NF关系模式S-L(Sno, Sdept, Sloc)中函数依赖: SnoSdept Sdept Sno SdeptS
34、loc 可得: SnoSloc,即S-L中存在非主属性对码的传递函数依 赖,S-L 3NF传递S-LSnoSdeptSloc3NF(续)解决方法 采用投影分解法,把S-L分解为两个关系模式,以消除传递函数依赖: S-D(Sno, Sdept) D-L(Sdept,Sloc)S-D的码为Sno, D-L的码为Sdept。分解后的关系模式S-D与D-L中不再存在传递依赖 3NF(续)S-D的码为Sno, D-L的码为SdeptSnoSdeptS-DSdeptSlocD-L S-L(Sno, Sdept, Sloc) 2NF S-L(Sno, Sdept, Sloc) 3NF S-D(Sno,Sde
35、pt) 3NFD-L(Sdept, Sloc) 3NF思考:一些特殊的关系模式1. 不存在非主属性的关系模式 没有非主属性2. 全码关系模式 没有非主属性3. 二目关系模式 不会存在传递依赖4. 若R属于3NF,那么R也属于2NF。 可证明,反证练习:ABC, CD设有关系模式R(A, B, C, D), 码为AB,给出它的一个函数依赖集,使得R属于2NF而不属于3NF。若R属于2NF,但R不一定属于3NF。3NF(续)采用投影分解法,将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。 将一个2NF关系分解为多个
36、3NF的关系后,仍然不能完全消除关系模式中的各种异常情况和数据冗余。小结数据库的设计范式,是数据库设计所需要满足的规范。满足这些规范的数据库是简洁的、结构明晰的,同时,不会发生插入、删除和更新操作异常。反之则是“坏”设计,不仅给数据库的编程人员制造麻烦,而且可能存储了大量不需要的冗余信息。 1NF 属性的原子性2NF 非主属性,完全函数依赖码3NF 非主属性,不传递依赖于码主属性,可传递依赖于码?主属性,可传递依赖于码?例8:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。每一教师只教一门课。TJ每门课由若干教师教,某一学生选定某门课,就确定了一个固定的教师。 (S,J)
37、T某个学生选修某个教师的课,就确定了所选课的名称。(S,T)J(S,J)和(S,T)都是候选码SJTSTJSTJ没有任何非主属性,STJ(S, T , J)有不良特性 STJ3NF插入异常:如果没有学生选修某位老师的任课,则该老师担任课程的信息就无法插入。删除异常:删除学生选课信息,会删除掉老师的任课信息。更新异常:如果老师所教授的课程有所改动,则所有选修该老师课程的学生元组,都要做改动。数据冗余:每位学生都存储了有关老师所教授的课程的信息。SJTSTJ 存在主属性对码的不良依赖(部分依赖)6.2 规范化6.2.1 函数依赖6.2.2 码6.2.3 范式6.2.4 2NF6.2.5 3NF6.
38、2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.9 规范化小结修正的第三范式 6.2.6 BC范式( Boyce-Codd Normal Form )定义6.8 关系模式R1NF,若X Y且Y X时,X必含有码,则R BCNF。A relation schema R is in BCNF if whenever an FD X A holds in R, then X is a superkey of R等价于:每一个决定因素都包含码排除了任何属性(不管是主属性还是非主属性),对码的传递和部分依赖。注意:BCNF的定义更简单,不需要从1NF到2NF再到3NF再到BCNF一步步检查
39、,也不涉及完全、部分和传递函数依赖等概念,可以直接判断一个1NF的关系是否属于BCNF。BCNF(续)若RBCNF 所有非主属性,对每一个码,都是完全函数依赖所有的主属性,对每一个不包含它的码,也是完全函数依赖没有任何属性,完全函数依赖于,非码的任何一组属性R BCNF R 3NF充分不必要BCNF(续)例5 关系模式C(Cno,Cname,Pcno)C3NFCBCNF例6 关系模式S(Sno,Sname,Sdept,Sage)假定S有两个码Sno,SnameS3NF。S BCNFBCNF(续)例7在关系模式STJ(S,J,P)中,S表示学生, J表示课程, P表示名次。 函数依赖:(S,J)
40、P;(J,P)S(S,J)与(J,P)都可以作为候选码,属性相交SJP3NF,SJPBCNF BCNF例8:在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。每一教师只教一门课。TJ每门课由若干教师教,某一学生选定某门课,就确定了一个固定的教师。 (S,J)T某个学生选修某个教师的课,就确定了所选课的名称。(S,T)J(S,J)和(S,T)都是候选码SJTSTJSTJSTJ 3NF ?STJBCNF?BCNF(续)STJ3NF没有任何非主属性,对码传递依赖或部分依赖STJBCNFT是决定因素,T不包含码不满足BCNF,有坏处吗?SJTSTJSTJSTJ(S, T , J)有
41、不良特性 STJ3NF 但 STJBCNF插入异常:如果没有学生选修某位老师的任课,则该老师担任课程的信息就无法插入。删除异常:删除学生选课信息,会删除掉老师的任课信息。更新异常:如果老师所教授的课程有所改动,则所有选修该老师课程的学生元组,都要做改动。数据冗余:每位学生都存储了有关老师所教授的课程的信息。SJTSTJ 存在主属性对码的不良依赖(部分依赖) - 消除!BCNF(续)解决方法:将STJ分解为二个关系模式: ST(S,T) BCNF, TJ(T,J) BCNF SJSTTJTJ没有任何属性对码的部分函数依赖和传递函数依赖3NF与BCNF的关系R BCNF R 3NF如果R3NF,且
42、R只有一个候选码 R BCNF R 3NF充分不必要充分必要思考:一些特殊的关系模式1. 全码关系模式 没有以非码属性作为决定因素的函数依赖2. 二目关系模式 如果有函数依赖, 则其左部一定含码3. 不存在函数依赖的关系模式 没有函数依赖,平凡的不算4. 若R属于BCNF,那么R也属于3NF。 5. 若R属于3NF,但R不一定属于BCNF。 例如,关系模式 STJ(S,T,J)范式:综合例 设有关系模式 R U= A , B , C , D , E F=ABC, BD, CE, ECB, ACB 要讨论范式,首先确定码。R的候选码: AB, AC; 主属性: A, B, C; 非主属性: D,
43、 E。R BCNF EC B的决定因素EC不包含码。R 3NF 存在非主属性E对码AB的传递依赖: ABC , CAB , CE, E C R 2NF 存在非主属性D对码AB的部分依赖 AB D。R 1NFP范式:综合例 设有关系模式 R U= A , B , C , D , E F=ABC, BD, CE, ECB, ACB R的候选码: AB, AC。R 1NF。将 R规范化(分解)为 BCNF 模式集: R1(A, B, C; AB C, AC B) BCNF R2(B, D; B D) BCNF R3(B, C, E; C E, EC B) BCNF6.2 规范化6.2.1 函数依赖6
44、.2.2 码6.2.3 范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.9 规范化小结6.2.7 多值依赖 Multivalued Dependency例9 学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。课 程 C教 员 T参 考 书 B物理数学计算数学李 勇王 军李 勇张 平张 平 周 峰 普通物理学光学原理 物理习题集数学分析微分方程高等代数数学分析.普通物理学光学原理物理习题集普通物理学光学原理物理习题集数学分析微分方程高等代数数学分析微分方程高等代数李 勇李 勇
45、李 勇王 军王 军王 军李 勇李 勇李 勇张 平张 平张 平 物 理物 理物 理物 理物 理物 理数 学数 学数 学数 学数 学数 学 参考书B教员T课程C6.2.7 多值依赖 Multivalued Dependency用二维表表示Teaching一门课程可由多个教员担任,一门课程使用相同的一套参考书。每个教员可以讲授多门课程, 每种参考书可以供多门课程使用。 Teaching具有唯一候选码(C,T,B), 即全码TeachingBCNF当某门课程增加一名教员时,或某门课程需要增加一本参考书时当删除一门课程的某个教员,或者某本参考书时,当一门课程的教员或参考书作出改变时,多值依赖: 还有问题
46、 BCNF的关系模式Teaching有不良特性:插入异常:当某门课程增加一名教员时,该门课程有多少本参考书就必须插入多少个元组;同样当某门课程需要增加一本参考书时,它有多少个教员就必须插入多少个元组。删除异常:当删除一门课程的某个教员,或者某本参考书时,需要删除多个元组。更新异常:当一门课程的教员或参考书作出改变时,需要修改多个元组。数据冗余:同一门课的教员与参考书的信息被反复存储多次。还没有被充分规范化!属性集C与T、属性集C与B之间存在着数据依赖关系,但都不是“函数依赖”,当属性子集C的一个值确定之后,另一属性子集T就有一组值与之对应。例如当课程名称C的一个值“数学”确定之后,就有一组任课
47、教师T的值“李勇、张平”与之对应。这是一种“一对多”的情形。普通物理学光学原理物理习题集普通物理学光学原理物理习题集数学分析微分方程高等代数数学分析微分方程高等代数李 勇李 勇李 勇王 军王 军王 军李 勇李 勇李 勇张 平张 平张 平 物 理物 理物 理物 理物 理物 理数 学数 学数 学数 学数 学数 学 参考书B教员T课程C属性集T和B也有通过C建立起来的间接关系:当C的一个值确定之后,其所对应的一组T值与U-C-T无关!取定C的一个值为“数学”,则对应T一组值“李勇、张平”与此“数学”课程选用的教材即U-C-T值无关。显然,这是“一对多”关系中的一种特殊情况。普通物理学光学原理物理习题
48、集普通物理学光学原理物理习题集数学分析微分方程高等代数数学分析微分方程高等代数李 勇李 勇李 勇王 军王 军王 军李 勇李 勇李 勇张 平张 平张 平 物 理物 理物 理物 理物 理物 理数 学数 学数 学数 学数 学数 学 参考书B教员T课程C函数依赖关系不能包容,需要引入新的概念来描述多值依赖多值依赖: 描述型定义定义6.9 关系模式R(U),X、Y、Z U,并且Z=UXY,多值依赖 XY成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值有一组Y的值,这组Y值仅仅决定于x值而与z值无关。例子:在关系模式Teaching(C, T, B)中,给定一对(C1,B1)值,有一组T值 T
49、1,T2与之对应;对(C1,B2)值也有一组T值 T1,T2与之对应。但T1,T2这组值仅取决于C的取值,而与B的取值无关。按MVD的定义有 CT成立,同理有CB成立 。关键在于教员T和参考书B之间的关系是完全围绕着课程C进行的。因此,我们不需要存储教员T和参考书B实体之间的关系。通过课程C实体进行联结,可以得到有关哪个教员T使用那些参考书B 的信息。 普通物理学光学原理物理习题集普通物理学光学原理物理习题集数学分析微分方程高等代数数学分析微分方程高等代数李 勇李 勇李 勇王 军王 军王 军李 勇李 勇李 勇张 平张 平张 平 物 理物 理物 理物 理物 理物 理数 学数 学数 学数 学数 学
50、数 学 参考书B教员T课程C教员T课程C参考书BCTCB(C, T)值,有一组B值,仅取决于C的取值,而与T的取值无关。CBT为空,则CB为平凡的MVD另一种定义(参见P180.)关系模式R(U),X、Y、ZU,Z=UXY,对于R(U)的任一关系r,若r中存在元组t、s,使得tX = sX,那么就必然存在元组w,v (w, v可以与t、s相同),使得: wX = vX = tX = sX wY = tY, wZ = sZ vY = sY, vZ = tZ则称Y多值依赖于X,记作X Y。定义的意思是:若tX = sX,则交换t和s元组的Y值,所得到的两个新元组v和w 必在关系r中。理解多值依赖的
51、形式化定义设关系模式 R ( X Y Z ) 成立 XY。 若存在元组 t = s = 交换t和s元组的Y值所得到的两个新元组v和w 必在关系R中例 Teaching表,C T t=(物理, 李勇, 普物) 存在 v=(物理, 李勇, 普物) s=(物理, 李勇, 光学) w=(物理, 李勇, 光学) 则必存在元组 v = w = t=(物理, 李勇, 题集) 存在 v =(物理, 王军, 题集) s=(物理, 王军, 普物) w =(物理, 李勇, 普物) 例10关系模式WSC(W,S,C) W表示仓库,S表示保管员,C表示商品 假设每个仓库有若干个保管员,有若干种商品 每个保管员保管所在的
52、仓库的所有商品 每种商品被所有保管员保管 WSCW1S1C1W1S1C2W1S1C3W1S2C1W1S2C2W1S2C3W2S3C4W2S3C5W2S4C4W2S4C5对于W的每一个值Wi, S有一个完整的集合与之对应而不论C取何值,所以 WS。同理,有WC。多值依赖(续)WS且WC用下图表示这种对应 对应W的某一个值Wi的全部S值SWi,和全部C值CWi之间,正好形成一个完全二分图。MVD要求Wi与SWi和CWi全搭配组成所有元组,缺一不可。多值依赖的性质(1)多值依赖具有对称性若XY,则XZ,其中ZUXY(2)多值依赖具有传递性若XY,YZ, 则XZ Y(3)函数依赖是多值依赖的特殊情况。
53、若XY,则XY。(4)若XY,XZ,则XY Z。(5)若XY,XZ,则XYZ。(6)若XY,XZ,则XY-Z,XZ -Y。多值依赖与函数依赖的区别多值依赖的有效性与属性集的范围有关若XY在U上成立,则在W(X Y W U)上一定成立;反之则不然,即XY在W(W U)上成立,在U上并不一定成立(2) 若函数依赖XY在R(U)上成立,则对于任何Y Y均有XY 成立多值依赖XY若在R(U)上成立,不能断言对于任何Y Y有XY 成立多值依赖 Vs 函数依赖: 例A B在ABC上成立,而在 ABCD上不成立。元组不够。MVD的有效性与属性集范围有关,在小的范围内成立,而在大的范围内不一定成立 - 嵌入型
54、的。ABC成立,但AB 不成立。MVD没有分解性。ABCDa1b1c1d1a1b1c2d1a1b2c1d2a1b2c2d2ABCDa1b1c1d1a1b1c1d2a1b2c2d1a1b2c2d2多值依赖: 实例示例,百货商店将顾客的订货,直接从供应商的仓库运到顾客所在地,定义一关系:存储所有商品的可能的运输源和目的地,以便规划运输方案。运货路径(顾客名,顾客地址,商品名,供应商名,供应商地址)Key=(商品名,顾客名,供应商名)FD: 顾客名顾客地址, 供应商名供应商地址MVD: 商品名(顾客名,顾客地址) 商品名(供应商名,供应商地址)多值依赖: 实例可能的关系:商品名 顾客名 顾客地址 供
55、应商名 供应商地址彩电 张三 10号 王A 100号. 李四 20号 王A 100号. 张三 10号 刘B 200号. 李四 20号 刘B 200号.VCD 张三 10号 王A 100号. 林一 30号 王A 100号. 张三 10号 文C 300号. 林一 30号 文C 300号6.2 规范化6.2.1 函数依赖6.2.2 码6.2.3 范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.9 规范化小结说明:1. 定义中的F是数据依赖集, 包括FD和MVD; 当F只包含FD时, 4NF的定义就是BCNF的定义。2. 4NF是BCNF的推广
56、, 适用于具有多值依赖的关系模式。3. 4NF的定义,就是限制关系模式的属性之间,不允许有非平凡且非函数依赖的多值依赖的存在。4. 若XY 是平凡的多值依赖, 则不要求X包含码。5. 若R 4NF, 则R BCNF; 反之不成立(因为函数依赖是多值依赖的特例)。6.2.8 4NF定义6.10 关系模式R1NF,如果对于R的每个非平凡多值依赖XY(Y X),X都含有码,则R4NF。如果R 4NF, 则R BCNF4NF(续)例: Teaching(C,T,B) 4NF 存在非平凡的多值依赖CT,且C不是码用投影分解法把Teaching分解为如下两个关系模式: CT(C, T) 4NF CB(C,
57、 B) 4NF CT, CB是平凡多值依赖 非4NF转为4NF例2的关系模式 WSC,有WS,WC,码为(W, S, C), 所以 WSC4NF, 但 WSC BCNF。如果仓库Wi有n个保管员,存放m件商品,则关系中分量为Wi的元组共有mn个,每个保管员重复存储m次,每种商品重复存储n次, 数据冗余非常大。增删也不便, 增加商品, 取消保管员都必须增删若干元组。分解改造: 将WSC分解为WS(W,S)和WC(W,C)分解后的关系模式都属于4NF,因为只有平凡的多值依赖WS和WC,满足4NF的定义。范式盘点 1. 一个全是主属性的关系模式一定可以达到3NF。 2. 一个全码的关系模式一定可以达
58、到BCNF。 3. 一个二目关系模式一定可以达到4NF。 4. 函数依赖和多值依赖是两种重要的数据依赖。在函数依赖的范畴内, BCNF是最高级别的范式。如果考虑多值依赖, 则4NF是最高的范式级别。 5. 除FD和MVD外,还有其他数据依赖,如连接依赖,在连接依赖的概念上还可以定义5NF的范式级别。 范式之间的关系(P183.图5.8)1NF2NF消除非主属性对码的部分函数依赖4NF消除非平凡且非函数依赖的多值依赖消除主属性对码的部分和传递函数依赖BCNF3NF消除非主属性对码的传递函数依赖消除非平凡且非FD的MVD消除决定因素非码的非平凡的FD6.2 规范化6.2.1 函数依赖6.2.2 码
59、6.2.3 范式6.2.4 2NF6.2.5 3NF6.2.6 BCNF6.2.7 多值依赖6.2.8 4NF6.2.9 规范化小结6.2.9 规范化小结1. 规范化的目的 有些关系模式存在“插入异常, 更新异常, 删除异常, 数据冗余大”的问题 - 不好的模式寻求解决这些问题的方法 - 规范化的目的2. 规范化的基本思想 概念的单一化逐步消除数据依赖中不合适的部分, 使关系模式达到某种程度的分离, 即“一事一地”的模式设计原则3. 各种范式及规范化的过程 1NF 2NF 3NF BCNF 4NF规范化小结(续)4. 关系模式的规范化过程,是通过对关系模式的投影分解来实现的, 把低一级的关系模
60、式分解为若干高一级的关系模式, 分解不是唯一的。6.4节介绍分解算法。5. 规范化理论为数据库模式设计提供了理论指南和工具, 但仅仅是指南和工具。并不是规范化程度越高越好。规范化程度高, 可解决更新异常和冗余大的问题, 但会失去检索查询方便快速的优点, 增加(自然)连接运算的开销。必须结合应用环境和具体情况,合理选择DB模式, 经常用于检索查询的系统, 宁肯规范化程度低些。 学生成绩登记表分析学号姓名性别专业年级课程成绩课号课名学时学分教师师号成绩S1S2张三李四男女CSCS9899C1C2C3C4C5C1DBDSOSMAPHDB6060801209060334653赵钱孙李周赵M1M9M4M
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教育科学出版社
- 山东省济南市2024-2025学年高三上学期1月期末地理试题 含解析
- 小班音乐《打电话》课件
- 带表卡尺使用规范
- 2024年应对气候变化的中国良好实践报告
- 2025年全球工业4.0行业概述及关键技术调研报告
- 多重耐药菌知识培训课件
- 大学生创业计划书:母婴店
- 楠竹食用笋种植及初加工项目可行性研究报告写作模板-拿地备案
- 坐月子助产知识培训课件
- 标准田径场地租赁合同样本2025
- 外研版(三起)(2024)三年级下册英语Unit 3 单元测试卷(含答案)
- 2024年广州市卫生健康系统招聘“优才计划”考试真题
- 河北省石家庄市2025届普通高中教学质量检测一(石家庄一模)高三英语试卷 含答案
- 重点营业线施工方案
- 2025年西安印钞有限公司招聘(16人)笔试参考题库附带答案详解
- 第23 课《太空一日》课件 部编版七年级语文下册
- 《水土保持监测技术规范SLT 277-2024》知识培训
- 2025年教科版科学五年级下册教学计划(含进度表)
- 《保护地球爱护家园》课件
- 幼儿园教法与学法
评论
0/150
提交评论