




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、5.1 问题的提出5.2 规范化5.3 数据依赖的公理系统5.1 问题的提出5.2 规范化5.3 数据依赖的公理系统例 建立一个描述学校教务的数据库:学生的学号(Sno)、所在系(Sdept)系主任姓名(Mname)、课程号(Cno)成绩(Grade)SnoSdeptMnameCnoGradeS1计算机系张明C195S2计算机系张明C190S3计算机系张明C188S4计算机系张明C170S5计算机系张明C1781. 数据冗余太大2. 更新异常(Update Anomalies)3. 插入异常(Insertion Anomalies)4. 删除异常(Deletion Anomalies)结论:结
2、论:nStudent关系模式不是一个好的模式。n“好”的模式:不会发生插入异常、删除异常、更新异常数据冗余应尽可能少原因:原因:n把不同的概念放在了一起n概念单一化n采用“一事一地”的原则,让一个关系描述一个概念、一个实体或实体间的联系n模式中的某些数据依赖数据依赖引起的关系数据库逻辑设计q针对具体问题,如何构造一个适合于它的数据模式q数据库逻辑设计的工具关系数据库的规范化关系数据库的规范化理论理论关系模式由五部分组成,即它是一个五元组: R(U, D, DOM, F)R:关系名U:组成该关系的属性名集合D:属性组U中属性所来自的域DOM:属性向域的映象集合F:属性间数据的依赖关系集合:属性间
3、数据的依赖关系集合n数据依赖q一个关系内部属性与属性之间的约束关系q现实世界属性间相互联系的抽象q数据内在的性质q语义的体现关系模式 Student U Sno, Sdept, Mname, Cno, Grade F Sno Sdept, Sdept Mname, (Sno, Cno) Grade SnoCnoSdeptMnameGraden数据依赖的类型q函数依赖(Functional Dependency,简记为FD)q多值依赖(Multivalued Dependency,简记为MVD)q其他n关系模式R(U, D, DOM, F)简化为一个三元组: Rn当且仅当U上的一个关系r满足F时
4、,r称为关系模式 R的一个关系nStudent关系模式不是一个好的模式。n“好”的模式:q不会发生插入异常、删除异常、更新异常q数据冗余应尽可能少原因:原因:由存在于模式中的某些数据依赖某些数据依赖引起的解决方法:解决方法:通过分解分解关系模式来消除其中不合适的数据依赖n分解关系模式q把这个单一模式分成3个关系模式: S(Sno,Sdept,Sno Sdept); SC(Sno,Cno,Grade,(Sno,Cno) Grade); DEPT(Sdept,Mname,Sdept Mname);5.1 问题的提出5.2 规范化5.3 数据依赖的公理系统 规范化理论规范化理论正是用来改造关系模式,
5、通过分分解解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。n函数依赖q定义5.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作XY。 说明:1. 所有关系实例所有关系实例均要满足2. 语义范畴语义范畴的概念3. 数据库设计者可以对现实世界作强制的规定n平凡函数依赖与非平凡函数依赖q在关系模式R(U)中,对于U的子集X和Y 。如果XY,但Y X,则称XY是非平凡的函数依赖q若XY,但Y X
6、, 则称XY是平凡的函数依赖n平凡函数依赖与非平凡函数依赖q例:在关系SC(Sno, Cno, Grade)中 非平凡函数依赖: (Sno, Cno) Grade 平凡函数依赖: (Sno, Cno) Sno (Sno, Cno) Cnon函数依赖q若XY,则X称为这个函数依赖的决定属性组,也称为决定因素(Determinant)。q若XY,YX,则记作XY。q若Y不函数依赖于X,则记作XY。 n函数依赖q例,在关系S(SNO,SNAME,SEX,AGE,DEPT)中,假设无人重名 函数依赖有:SNOSEX, SNO AGE, SNO dept,SNO SNAME n函数依赖q在一个关系模式R
7、(U)中,对于U的子集X和Y n若X和Y有1:1关系,则XY, YX,记作XYn若X和Y有1:m关系, 则记作YX ,但XY 。n若X和Y有n:m关系,则X和Y不存在任何函数依赖 n完全函数依赖与部分函数依赖q定义5.2 在R(U)中,如果XY,并且对于X的任何一个真子集X,都有X Y, 则称Y对X完全函数依赖,记作X F Y。 若XY,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作X P Y。 n完全函数依赖与部分函数依赖q由定义可知,若X为单属性,由于X不存在任何真子集,若XY,则 X F Y。 n完全函数依赖与部分函数依赖 例 student(Sno, Sdept, Mname,
8、Cno, Grade)中 (Sno,Cno)Grade 是完全函数依赖, (Sno,Cno)Sdept 是部分函数依赖 因为Sno Sdept成立,且Sno是(Sno,Cno)的真子集n完全函数依赖与部分函数依赖 例 在关系SC1(Sno, Cno, Grade,Credit )中 (Sno,Cno)Grade 是完全函数依赖, CnoCredit (Sno,Cno)Credit 是部分函数依赖n传递函数依赖q定义5.3 在R(U)中,如果XY,(Y X) ,YX YZ, 则称Z对X传递函数依赖。记为:X Zq注: 如果YX, 即XY,则Z直接依赖于X。 传递n传递函数依赖 例: 在关系stu
9、dent(Sno, Sdept, Mname, Cno, Grade)中,有:Sno Sdept, Sdept Sno ,Sdept Mname Mname传递函数依赖于Snon传递函数依赖 例: 在关系s1(Sno, Sname, Dno, Dname, location)中,有: Sno Dno , Dno Sno ,Dno location location传递函数依赖于Snon定义定义5.4 设K为R中的属性或属性组合。若K U, 则K称为R的侯选码侯选码(Candidate Key)。若候选码多于一个,则选定其中的一个做为主码主码(Primary Key)。n主属性与非主属性q包含在
10、任何一个候选码中的属性 ,称为主属性(Prime attribute) q不包含在任何码中的属性称为非主属性(Nonprime attribute)或非码属性(Non-key attribute)Fn全码q整个属性组是码,称为全码(All-key)n定义定义5.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(外部码(Foreign key)也称外码n关系模型要求关系必须是规范化的(normalization),即要求关系必须满足一定的规范条件(满足一定的要求)。n规范化的关系称为范式(Normal Form)n满足不同程度要求的为不同范
11、式n范式的种类第一范式(1NF)第二范式(2NF)第三范式(3NF)BC范式(BCNF)第四范式(4NF)第五范式(5NF)n1971-1972年,E.F.Codd提出了1NF,2NF,3NFn1974年,Codd和Boyce又共同提出了一个新范式,即BCNFn1976年,Fagin又提出了4NFn后来又有人提出了5NFn各种范式之间存在联系:n某一关系模式R为第n范式,可简记为RnNF。n一个低一级范式的关系模式,通过模式分解模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化规范化 NF5NF4BCNFNF3NF2NF1n1NF的定义如果一个关系模式R的所有属性都是不可分
12、的基本数不可分的基本数据项据项,则R1NFn第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库n但是满足第一范式的关系模式并不一定是一个好的关系模式例关系模式 S-L-C(Sno, Sdept, Sloc, Cno, Grade),Sloc为学生住处,假设每个系的学生住在同一个地方(1) 插入异常(2) 删除异常(3) 修改复杂(4) 数据冗余度大S-L-C不是一个好的关系模式例 关系模式 S-L-C(Sno, Sdept, Sloc, Cno, Grade) Sloc为学生住处,假设每个系的学生住在同一个地方 函数依赖包括: (Sno, Cno) F Grade
13、 Sno Sdept (Sno, Cno) P Sdept Sdept Sloc Sno Sloc (Sno, Cno) P Sloc nS-L-C的码为(Sno, Cno)nS-L-C满足第一范式。n非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno)SnoCnoGradeSdeptSlocS-L-Cn原因 Sdept、 Sloc部分函数依赖于码。n解决方法 S-L-C分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade) S-L(Sno, Sdept, Sloc)函数依赖图:SnoCnoGradeSCS-LSnoSdeptSlocv关系模式SC的码为
14、(Sno,Cno)v关系模式S-L的码为Snov这样非主属性对码都是完全函数依赖 n2NF的定义定义定义5.6 若R1NF,且每一个非主属性非主属性完全完全函数依赖于码,则R2NF。例:S-L-C(Sno, Sdept, Sloc, Cno, Grade) 1NF S-L-C(Sno, Sdept, Sloc, Cno, Grade) 2NF SC(Sno, Cno, Grade) 2NF S-L(Sno, Sdept, Sloc) 2NFn采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。n将一个
15、1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。 S-L(Sno, Sdept, Sloc) 2NFn3NF的定义定义定义5.7 关系模式R 中若不存在这样的码X、属性组Y及非主属性Z(Z Y), 使得XY,YZ成立, Y X,则称R 3NF。n若R3NF,则每一个非主属性非主属性既不部分依赖既不部分依赖于码也不传递依赖也不传递依赖于码。 例:2NF关系模式S-L(Sno, Sdept, Sloc)中q函数依赖: SnoSdept Sdept Sno SdeptSloc 可得: Sno Sloc,即S-L中存在非主属性对码的传递函数依赖,S-L 3NF传递函
16、数依赖图:S-LSnoSdeptSlocn解决方法 采用投影分解法,把S-L分解为两个关系模式,以消除传递函数依赖: S-D(Sno, Sdept) D-L(Sdept,Sloc)S-D的码为Sno, D-L的码为Sdept。n分解后的关系模式S-D与D-L中不再存在传递依赖 S-D的码为Sno, D-L的码为SdeptSnoSdeptS-DSdeptSlocD-Lv S-L(Sno, Sdept, Sloc) 2NF S-L(Sno, Sdept, Sloc) 3NF S-D(Sno,Sdept) 3NFD-L(Sdept, Sloc) 3NFn采用投影分解法将一个2NF的关系分解为多个3N
17、F的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。n 将一个2NF关系分解为多个3NF的关系后,仍然不能完全消除关系模式中的各种异常情况和数据冗余。n例如SC2(SNO,SNAME,CNO,Grade),设姓名是唯一的q候选码(SNO,CNO)和(SNAME,CNO)q非主属性GradeqSC2 3NF q如果学生退选课,元组被删除也就失去了学号和姓名的对应关系q由于学生选课很多,姓名也将重复存储n例如仓库保管WPE(W#,P#,E#,QNT),其中各属性分别表示仓库号、零件号、职工号、数量W#P#E#QNTw1p1e120w1p2e315w1
18、p3e218w1p4e110w1p5e320w1p7e318w1p6e215w2p4e412w2p1e520w2p3e418w2p6e515w3p2e620w3p3e615w3p4e718它所反映的语义是:一个仓库有多个职工一个职工仅在一个仓库工作每个仓库里一种器件由专人管理存在函数依赖:E# W#(W#,P#) E# (W#,P#) QNT(E#,P#) QNTn存在函数依赖:E# W#,(W#,P#) E# (W#,P#) QNT,(E#,P#) QNT候选关键字是: (W#,P#) , (E#,P#) 只有一个非主属性QNT,它对任何候选关键字都是完全依赖,并且是直接依赖,因此属于3NF
19、n例如仓库保管WPE(W#,P#,E#,QNT),其中各属性分别表示仓库号、零件号、职工号、数量候选关键字是: (W#,P#) , (E#,P#)如果一个新职工被分配到仓库工作,但暂时处于实习阶段,没有独立承担任务,由于缺少关键字的一部分p#,而无法插入到关系中,要消除这些异常需要提出更高的要求。n定义定义6.8 关系模式R1NF,若XY且Y X时X必含有码,则R BCNF。n等价于:每一个决定属性因素都包含码n若RBCNF q所有非主属性对每一个码都是完全函数依赖q所有的主属性对每一个不包含它的码,也是完全函数依赖q没有任何属性完全函数依赖于非码的任何一组属性nRBCNF,排除了任何属性对码
20、的传递依赖与部分依赖nR BCNF R 3NF充分不必要n仓库保管WPE(W#,P#,E#,QNT),其中各属性分别表示仓库号、零件号、职工号、数量。存在函数依赖:E# W#,(W#,P#) E# (W#,P#) QNT,(E#,P#) QNT候选关键字是: (W#,P#) , (E#,P#) 决定因素E#不包含关键字这就造成了主属性W#对候选关键字(E#,P#) 的部分依赖例 关系模式C(Cno,Cname,Pcno)nC3NFnCBCNF例 关系模式S(Sno,Sname,Sdept,Sage) 假定S有两个码Sno,Sname S3NF S BCNF例关系模式SJP(S,J,P)中,S表
21、示学生,J表示课程 , P表示名次 。(假设不存在并列名次)n函数依赖: (S,J)P (J,P)Sn(S,J)与(J,P)都可以作为候选码,属性相交nSJP3NF,nSJPBCNF例在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。每一教师只教一门课,每门课有若干教师,某一学生选定某门课,就对应一个固定的教师。q函数依赖: (S,J)T,(S,T)J,TJq(S,J)和(S,T)都是候选码JSJTSTSTJ中的函数依赖中的函数依赖nSTJ3NF q没有任何非主属性对码传递依赖或部分依赖 nSTJBCNFqT是决定因素,T不包含码n解决方法:将STJ分解为二个关系模式: S
22、T(S,T) BCNF, TJ(T,J) BCNF 没有任何属性对码的部分函数依赖和传递函数依赖STSTTJTJn3NF和BCNF是在函数依赖的条件下的关系模式规范化程度的测度。n一个模式中的关系模式如果都术语BCNF,那么在函数依赖范畴内,它已经实现了彻底的分离,已消除了插入和删除异常。n3NF的“不彻底”性表现在可能存在主属性对码的部分依赖和传递依赖。n在信息系统的设计中,普遍采用的是“基于3NF的系统设计”方法。1NF2NF消除非主属性对码的部分函数依赖3NF消除非主属性对码的传递函数依赖消除主属性对码的部分和传递函数依赖BCNF例 学校中某一门课程由多个教师讲授,他们使用相同的一套参考
23、书。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。课课 程程 C教教 员员 T参参 考考 书书 B 物理物理数学数学 计算数学计算数学李李 勇勇王王 军军 李李 勇勇张张 平平 张张 平平 周周 峰峰 普通物理学普通物理学光学原理光学原理 物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析. v非规范化关系普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军
24、王王 军军王王 军军李李 勇勇李李 勇勇李李 勇勇张张 平平张张 平平张张 平平 物物 理理物物 理理物物 理理物物 理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程Cv用二维表表示TeachingnTeaching具有唯一候选码(C,T,B), 即全码nTeachingBCNFn对数据的增删改很不方便,数据冗余也十分明显 Teaching模式中存在的问题(1) 数据冗余度大 普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学
25、分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军王王 军军王王 军军李李 勇勇李李 勇勇李李 勇勇张张 平平张张 平平张张 平平 物物 理理物物 理理物物 理理物物 理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程C普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军王王 军军王王 军军李李 勇勇李李 勇勇李李
26、 勇勇张张 平平张张 平平张张 平平 物物 理理物物 理理物物 理理物物 理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程C Teaching模式中存在的问题(2) 插入操作复杂普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军王王 军军王王 军军李李 勇勇李李 勇勇李李 勇勇张张 平平张张 平平张张 平平 物物 理理物物 理理物物 理理物物
27、理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程C Teaching模式中存在的问题(3) 删除操作复杂普通物理学普通物理学光学原理光学原理物理习题集物理习题集普通物理学普通物理学光学原理光学原理物理习题集物理习题集数学分析数学分析微分方程微分方程高等代数高等代数数学分析数学分析微分方程微分方程高等代数高等代数李李 勇勇李李 勇勇李李 勇勇王王 军军王王 军军王王 军军李李 勇勇李李 勇勇李李 勇勇张张 平平张张 平平张张 平平 物物 理理物物 理理物物 理理物物 理理物物 理理物物 理理数数 学学数数 学学数数 学学数数 学学数数 学学数数 学学 参考书B教员T课程C Teaching模式中存在的问题(4) 修改操作复杂n定义定义5.9 设R(U)是一个属性集U上的一个关系模式, X、 Y和Z是U的子集,并且ZUXY。关系模式R(U)中多值依赖多值依赖 XY成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论