第2章关系模型_第1页
第2章关系模型_第2页
第2章关系模型_第3页
第2章关系模型_第4页
第2章关系模型_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、返回返回1第第2 2章章 关系模型关系模型返回返回2 上一章介绍了主要的数据模型: 层次模型 网状模型 关系模型 其中简单灵活,并有着坚实的理论基础,已成为当前的数据模型。 本章主要讲述本章主要讲述: 关系模型的数据结构 关系的定义和性质 关系数据库的基本概念 关系运算返回返回32.1 关系模型关系模型 关系模型就是用关系模型就是用二维表格二维表格结构来表示实体及实体之间结构来表示实体及实体之间联系的模型。联系的模型。 关系模型是各个关系的框架的集合,即关系模型是一关系模型是各个关系的框架的集合,即关系模型是一些些表格的格式表格的格式,其中包括关系名、属性名、关键字等。,其中包括关系名、属性名

2、、关键字等。 例如,教学数据库中教师与课程的关系模型如图例如,教学数据库中教师与课程的关系模型如图2.1所所示。示。 教师关系 课程关系C授课关系SC图2.1 教师课程数据库的关系模型TNO教师号TN姓名SEX性别AGE年龄PROF职称SAL工资COMM岗位津贴DEPT系别CNO课程号CN课程名CT课时 TNO教师号CNO课程号返回返回4 从各个关系的框架中,我们可以很容易看出哪两个关从各个关系的框架中,我们可以很容易看出哪两个关系之间有系之间有联系联系。例如:。例如: 教师关系和授课关系有公共的属性“教师号”,则表明这两个关系有联系。 而课程关系和授课关系有公共的属性“课程号”,则表明这两个

3、关系也有联系。 至于元组之间的联系,则与具体的数据有关。只有在公共属性上具有相同属性值的元组之间才有联系。 返回返回5 由上例可以看出,在一个关系中可以存放两类信息:由上例可以看出,在一个关系中可以存放两类信息: 一类是描述实体本身的信息 一类是描述实体(关系)之间的联系的信息 在层次模型和网状模型中,把有联系的实体(元组)用在层次模型和网状模型中,把有联系的实体(元组)用指针链接起来,实体之间的联系是通过指针链接起来,实体之间的联系是通过指针指针来实现的。来实现的。 而关系模型则采用不同的思想,即用而关系模型则采用不同的思想,即用二维表二维表来表示实体来表示实体与实体之间的联系,这就是关系模

4、型的本质所在。与实体之间的联系,这就是关系模型的本质所在。 所以,在建立所以,在建立关系模型关系模型时,只要把的所有的实体及其属时,只要把的所有的实体及其属性用关系框架来表示,同时把实体之间的关系也用关系性用关系框架来表示,同时把实体之间的关系也用关系框架来表示,就可以得到一个关系模型。框架来表示,就可以得到一个关系模型。 如上例中的教师课程数据库的关系模型就是这样建立的。返回返回62.2 关系的定义关系的定义 在关系模型中,数据是以二维表的形式存在的,这个在关系模型中,数据是以二维表的形式存在的,这个二维表二维表就叫做就叫做关系关系。 关系理论关系理论是以是以集合代数集合代数理论为基础的,因

5、此,我们可理论为基础的,因此,我们可以用集合代数给出二维表的以用集合代数给出二维表的“关系关系”定义。定义。 为了从集合论的角度给出关系的定义,我们先引入为了从集合论的角度给出关系的定义,我们先引入域域和和笛卡尔积笛卡尔积的概念。的概念。返回返回72.2.1 域(域(Domain) 域是一组具有相同数据类型的值的集合,又称为域是一组具有相同数据类型的值的集合,又称为值域值域。(用(用D表示)表示) 例如整数、实数、字符串的集合。 域中所包含的值的个数称为域的域中所包含的值的个数称为域的基数基数(用(用m表示)。表示)。 关系中用域表示属性的取值范围。例如:关系中用域表示属性的取值范围。例如:D

6、1=李力,王平,刘伟 m1=3D2=男,女 m2=2D3=47,28,30 m3=3 其中,D1,D2,D3为域名,分别表示教师关系中姓名、性别、年龄的集合。 域名无排列次序,如域名无排列次序,如D2=男,女男,女=女,男女,男返回返回82.2.2 笛卡尔积笛卡尔积(Cartesian Product) 给定一组域给定一组域D1,D2,Dn(它们可以包含相同的元素,(它们可以包含相同的元素,即可以完全不同,也可以部分或全部相同)。即可以完全不同,也可以部分或全部相同)。D1,D2,Dn的笛卡尔积为的笛卡尔积为D1D2Dn=(d1,d2,dn)|diDi,i=1,2,n。 由定义可以看出,笛卡尔

7、积也是一个由定义可以看出,笛卡尔积也是一个集合集合。其中:其中:1. 元素中的每一个di叫做一个分量(Component),来自相应的域(diDi)2. 每一个元素(d1,d2,d3,dn)叫做一个n元组(n-tuple),简称元组(Tuple)。但元组不是di的集合,元组的每个分量(di)是按序排列的。如: (1,2,3)(2,3,1)(1,3,2); 而集合中的元素是没有排序次序的,如(1,2,3)=(2,3,1)=(1,3,2)。返回返回93. 若Di(i=1,2,n)为有限集,Di中的集合元素个数称为Di的基数,用mi(i=1,2,n)表示,则笛卡尔积D1D2Dn的基数M(即元素(d1

8、,d2,dn)的个数)为所有域的基数的累乘之积,即 M= 例如:上述表示教师关系中姓名、性别两个域的笛卡尔积为: D1D2=(李力,男),(李力,女),(王平,男),(王平,女),(刘伟,男),(刘伟,女)其中: 李力、王平、刘伟、男、女都是分量 (李力,男),(李力,女)等是元组 其基数M=m1m2=3*2=6 元组的个数为6niim1返回返回104. 笛卡尔积可用二维表的形式表示。例如,上述的6个元组可表示成表2.1。表表2.1 D1和和D2的笛卡尔积的笛卡尔积 由上例可以看出,笛卡尔积实际是一个二维表,表的框架由域构成,表的任意一行就是一个元组,表中的每一列来自同一域,如第一个分量来自D

9、1,第二个分量来自D2。姓名性别李力男李力女王平男王平女刘伟男刘伟女返回返回112.2.3 关系(关系(Relation) 笛卡尔积笛卡尔积D1D2Dn的任一子集称为定义在域的任一子集称为定义在域D1,D2,Dn上的上的n元元关系关系(Relation),可用),可用R(D1,D2Dn)表示)表示 如上例D1D2笛卡尔积的子集可以构成教师关系T1,如下表:姓名性别李力男王平女刘伟男返回返回12几点说明:几点说明:1. R为关系名,为关系名,n称为关系的目或度(称为关系的目或度(Degree)。)。 当n=1时,称为单元关系。 当n=2时,称为二元关系。 当n=n时,称为n元关系。 如上例为二元

10、关系,关系名为如上例为二元关系,关系名为T。返回返回132. 该子集中的元素是关系中的元组,用该子集中的元素是关系中的元组,用r表示,关系中元组个数是关系表示,关系中元组个数是关系的基数。如(李力,男),(王平,女),(刘伟,男)为三个元的基数。如(李力,男),(王平,女),(刘伟,男)为三个元组,关系的基数为组,关系的基数为3。 如果一个关系的元组个数是无限的,则称为无限关系; 如果一个关系的元组个数是有限的,则称为有限关系。 由于计算机存储系统的限制,我们一般不去处理无限关系,而只考虑有限关系。3. 同样可以把关系看成一个二维表。其中,同样可以把关系看成一个二维表。其中,(1)表的框架由域

11、Di(i=1,2,n)构成;(2)表的任意一行对应一个元组;(3)表的每一列来自同一域;(4)域可以相同,为了加以区别,每列起一个名字,称为属性,n目关系有n个属性,属性的名字唯一,属性的取值范围Di(i=1,2,n)称为值域(5)具有相同关系框架的关系成为同类关系,例如,有另一个关系T2,如表2.3所示:T1和T2是同类关系。姓名性别张雪女张兰女返回返回144. 数学上关系是笛卡尔积的任意子集,但在实际应用中数学上关系是笛卡尔积的任意子集,但在实际应用中关系是笛卡尔积中所取的有意义的子集。例如在表关系是笛卡尔积中所取的有意义的子集。例如在表2.1中选取一个子集构成如下关系,显然不符合实际情况

12、中选取一个子集构成如下关系,显然不符合实际情况在关系模型中,在关系模型中,关系关系可进一步定义为:可进一步定义为: 定义在域定义在域D1,D2,Dn(不要求完全相异)上的关系由(不要求完全相异)上的关系由关系头(关系头(Heading)和关系体()和关系体(Body)组成。)组成。 关系头:由属性名A1,A2,An的集合组成,每个属性Ai正好对应一个域Di(i=1,2,n),关系头,也称关系框架,相对固定,是关系的数据结构的描述。 关系体:是指关系结构中的内容或者数据,并非固定不变,它随元组的建立、删除或修改而变化。姓名性别李力男李力女返回返回15 尽管尽管关系关系与与二维表格二维表格、传统的

13、、传统的数据文件数据文件是非常类似的,是非常类似的,但它们之间又有重要的区别。但它们之间又有重要的区别。 严格地说,严格地说,关系关系是种规范化了的是种规范化了的二维表中行的集合二维表中行的集合,为了使相应的数据操作简化,在关系模型中,对关系为了使相应的数据操作简化,在关系模型中,对关系作了种种作了种种限制限制,关系具有如下特性:,关系具有如下特性:1. 关系中不允许出现相同的元组。因为数学上集合中没有相同的元素,而关系是元组的集合,所以作为集合元素的元组应该是唯一的。2. 关系中元组的顺序(即行序)是无关紧要的,在一个关系中可以任意交换两行的次序。因为集合中的元素是无序的,所以作为集合元素的

14、元组也是无序的。根据关系的这个性质,可以改变元组的顺序使其具有某种排序,然后按照顺序查询数据,可以提高查询速度。2.3 关系的性质关系的性质 返回返回163. 关系中属性的顺序是无关紧要的,即列的顺序可以任意交换。交换时,应连同属性名一起交换,否则将得到不同的关系。 例如:关系例如:关系T1作如下交换时,无任何影响,如下表所作如下交换时,无任何影响,如下表所示:示:性别姓名男李力女王平男刘伟返回返回17 而作如下交换时,不交换属性名,只交换属性列中的而作如下交换时,不交换属性名,只交换属性列中的值,则得到不同的关系,如下表值,则得到不同的关系,如下表: 姓名性别男李力女王平男刘伟返回返回184

15、. 同一属性名下的各个属性值必须来自同一个域,是同一类型的数据。5. 关系中各个属性必须有不同的名字,不同的属性可来自同一个域,即它们的分量可以取自同一个域。 例如,有如下表中关系,职业与兼职是两个不同的属例如,有如下表中关系,职业与兼职是两个不同的属性,但它们取自同一个域职业教师,工人,辅导性,但它们取自同一个域职业教师,工人,辅导员。员。 姓名职业兼职张强教师辅导员王丽工人教师刘宁教师辅导员返回返回196. 关系中每一分量必须是不可分的数据项,或者说所有属性值都是原子的,即是一个确定的值,而不是值的集合。属性值可以为空值,表示“未知”或“不可使用”,即不可“表中有表”。满足此条件的关系称为

16、规范化关系,否则称为非规范化关系。 例如,在表例如,在表2.8中,籍贯含有省、市县两项,出现了中,籍贯含有省、市县两项,出现了“表中有表表中有表”的现象,则为非规范化关系,而把籍贯分成省、市县两列,将的现象,则为非规范化关系,而把籍贯分成省、市县两列,将其规范化,如表其规范化,如表2.9所示。所示。 表表2.8 表表2.9姓名籍贯 姓名省市县省市县 张强吉林长春 张强吉林长春王丽山西大同 王丽山西大同返回返回202.4.1 候选键与关系键候选键与关系键 能唯一标识关系中元组的属性或属性集,则称该属性能唯一标识关系中元组的属性或属性集,则称该属性或属性集为或属性集为候选键候选键(Candidat

17、e Key),也称,也称候选关键字候选关键字或或候选码候选码。如:。如: “学生关系”中的学号能唯一标识每一个学生,则属性学号是学生关系的候选键。 在“选课关系”中,只有属性的组合“学号+课程号”才能唯一地区分每一条选课记录,则属性集“学号+课程号”是选课关系的候选键。2.4 关系的键关系的键 返回返回21下面给出候选键的形式化定义:下面给出候选键的形式化定义: 设关系设关系R有属性有属性A1,A2,An,其属性集,其属性集K=(Ai,Aj,Ak),当且仅当满足下列条件时,),当且仅当满足下列条件时,K被称为被称为候选键:候选键:1. 唯一性(Uniqueness):关系R的任意两个不同元组,

18、其属性集K的值是不同的。2.最小性(Minimally):组成关系键的属性集(Ai,Aj,Ak)中,任一属性都不能从属性集K中删掉,否则将破坏唯一性的性质 例如:“学生关系”中的每个学生的学号是唯一的,“选课关系”中“学号+课程号” 的组合也是唯一的。对于属性集“学号+课程号” 去掉任一属性,都无法唯一标识选课记录。 返回返回22 如果一个关系中有多个候选键,可以从中选择一个作如果一个关系中有多个候选键,可以从中选择一个作为查询、插入或删除元组的操作变量,被选用的候选为查询、插入或删除元组的操作变量,被选用的候选键称为键称为主关系键主关系键(Primary Key),或简称为,或简称为主键主键

19、、主码、主码、关系键关系键、关键字关键字。 例如,假设在学生关系中没有重名的学生,则“学号”和“姓名”都可作为学生关系的候选键。如果选定“学号”作为数据操作的依据,则“学号”为主关系键。 主关系键是关系模型中的一个重要概念。每个关系必主关系键是关系模型中的一个重要概念。每个关系必需选择一个主关系键,选定以后,不能随意改变。每需选择一个主关系键,选定以后,不能随意改变。每个关系必定有且仅有一个主关系键,因为关系的元组个关系必定有且仅有一个主关系键,因为关系的元组无重复,至少关系的所有属性的组合可作为主关系键,无重复,至少关系的所有属性的组合可作为主关系键,通常用较小的属性组合作为主关系键。通常用

20、较小的属性组合作为主关系键。返回返回232.4.2 主属性与非码属性主属性与非码属性 主属性主属性(Prime Attribute):包含在候选码中的的各):包含在候选码中的的各属性称为主属性。属性称为主属性。 非码属性非码属性(Non-Prime Attribute):不包含在任何候):不包含在任何候选码中的属性称为非码属性。选码中的属性称为非码属性。 在最简单的情况下,一个候选码只包含一个属性,如在最简单的情况下,一个候选码只包含一个属性,如学生关系中的学生关系中的“学号学号”,教师关系中的,教师关系中的“教师号教师号”。 在最极终端的情况下,所有属性的组合是关系的候选在最极终端的情况下,

21、所有属性的组合是关系的候选码,这时称为码,这时称为全码全码(all-key)。)。返回返回24 下面是一个全码的例子:下面是一个全码的例子: 假设有教师授课关系TCS,分别有三个属性教师(T)、课程(C)和学生(S)。一个教师可以讲授多门课程,一门课程可以为多个教师讲授,同样一个学生可以选听多门课程,一门课程可以为多个学生选听。 在这种情况下,T,C,S三者之间是多对多关系,(T,C,S)三个属性的组合是关系TCS的候选码,称为全码,T,C,S都是主属性。返回返回252.4.3 外部关系键外部关系键 如果关系如果关系R2的一个或一组属性的一个或一组属性X不是不是R2的主码,而是的主码,而是另一

22、关系另一关系R1的主码,则该属性或属性组的主码,则该属性或属性组X称为关系称为关系R2的的外部关系键外部关系键或或外码外码(Foreign key)。并称关系)。并称关系R2为为参照关系参照关系(referencing relation),关系,关系R1为为被参照关系被参照关系(referenced relation)。 例例2.1 假设在假设在图图1.12所示的教学数据库中增加一个系别所示的教学数据库中增加一个系别关 系关 系 D , 包 含 两 个 属 性, 包 含 两 个 属 性 系 别系 别 ( D E P T ) 和) 和 地 址地 址(ADDR),),“系别系别”是此关系的主码,而

23、是此关系的主码,而“系别系别”并不是学生关系和教师关系的主码,所以并不是学生关系和教师关系的主码,所以“系别系别”是是学生关系和教师关系的外部关系键。学生关系和教师关系的外部关系键。返回返回26 例例2.2 如图如图1.12所示的选课关系中的所示的选课关系中的“学号学号”属性与学属性与学生关系的主码生关系的主码“学号学号”相对应,相对应,“课程号课程号”属性与课属性与课程关系的主码程关系的主码“课程号课程号”相对应,因此,相对应,因此,“学号学号”和和“课程号课程号”属性是选课关系的属性是选课关系的外部关系键外部关系键。学生关系。学生关系和课程关系为和课程关系为被参照关系被参照关系,选课关系为

24、,选课关系为参照关系参照关系。 由外部关系键的定义可知,被参照关系的主码和参照由外部关系键的定义可知,被参照关系的主码和参照关系的外码必须定义在同一个域上。关系的外码必须定义在同一个域上。 如选课关系中的“学号”与学生关系的主码“学号”定义在同一个域上,“课程号”属性与课程关系的主码“课程号”定义在同一个域上。返回返回272.4.4 关系模型的完整性关系模型的完整性 为了维护数据库中数据与现实世界的一致性,对关系为了维护数据库中数据与现实世界的一致性,对关系数据库的插入、删除和修改操作必须有一定的约束条数据库的插入、删除和修改操作必须有一定的约束条件,这就是关系模型的三类完整性:件,这就是关系

25、模型的三类完整性: 实体完整性 参照完整性 用户定义的完整性1. 实体完整性实体完整性(Entity Integrity) 实体完整性实体完整性是指主关系键的值不能为空或部分为空。是指主关系键的值不能为空或部分为空。 关系模型中的一个元组对应一个实体,一个关系则对关系模型中的一个元组对应一个实体,一个关系则对应一个实体集。应一个实体集。 例如,一条学生记录对应着一个学生,学生关系对应着学生的集合。返回返回28 现实世界中的实体是可区分的,即它们具有某种唯一性现实世界中的实体是可区分的,即它们具有某种唯一性标识。与此相对应,关系模型中以主关系键来唯一标识标识。与此相对应,关系模型中以主关系键来唯

26、一标识元组。元组。 例如,学生关系中的属性“学号”可以唯一标识一个元组,也可以唯一标识学生实体。 如果主关系键中的值为空或部分为空,即主属性为空,如果主关系键中的值为空或部分为空,即主属性为空,则不符合关系键的定义条件,不能唯一标识元组及与其则不符合关系键的定义条件,不能唯一标识元组及与其相对应的实体。这就说明存在不可区分的实体,从而与相对应的实体。这就说明存在不可区分的实体,从而与现实世界中的实体是可以区分的事实相矛盾。因此现实世界中的实体是可以区分的事实相矛盾。因此主关主关系键的值不能为空或部分为空系键的值不能为空或部分为空。 例如,学生关系中的主关系键“学号”不能为空;选课关系中的主关系

27、键“学号+课程号”不能部分为空,即“学号”和“课程号”两个属性都不能为空。返回返回292. 参照完整性参照完整性(Referential integrity) 如果关系如果关系R2的外部关系键的外部关系键X与关系与关系R1的主关系键相符的主关系键相符,则则X的每个值或者等于的每个值或者等于R1中主关系键的某一个值,或中主关系键的某一个值,或者取空值。者取空值。 在例在例2.1系别关系中的属性系别关系中的属性“系别系别”是学生关系外部关是学生关系外部关系键。系键。 如图2.2所示,学生关系中某个学生(如s1或s2)“系别”的取值,必须在参照的系别关系中主关系键“系别”的值中能够找到,否则表示把该

28、学生分配到一个不存在的部门中,显然不符合语义。 如果某个学生(如s11)“系别”取空值,则表示该学生尚未分配到任何一个系。否则,它只能取专业关系中某个元组的专业号值。返回返回30S(学生关系)(学生关系) D(系别关系)(系别关系) 图图2.2 学生表和系别表学生表和系别表 SNO学号SN姓名SEX性别AGE年龄DEPT所在系 DEPT所在系ADDR地址S1赵亦女17计算机 计算机1号楼S2钱尔男18信息 信息1号楼 自动化2号楼S11王威男19 返回返回31 在例在例2.2中,如果按照参照完整性规则,选课关系中的中,如果按照参照完整性规则,选课关系中的外部关系键外部关系键“学号学号”和和“课

29、程号课程号”可以取空值或者取可以取空值或者取被参照关系中已经存在的值。但由于被参照关系中已经存在的值。但由于“学号学号”和和“课课程号程号”是选课关系中主属性,根据实体完整性规则,是选课关系中主属性,根据实体完整性规则,两个属性都不能为空。两个属性都不能为空。所以所以选课关系中的外部关系键选课关系中的外部关系键“学号学号”和和“课程号课程号”中能取被参照关系中已经存在中能取被参照关系中已经存在的值。的值。 实体完整性实体完整性和和参照完整性参照完整性是关系模型必须满足的完整是关系模型必须满足的完整性约束条件,被称作性约束条件,被称作关系的两个不变性关系的两个不变性。任何关系数。任何关系数据库系

30、统都应该支持这两类完整性。据库系统都应该支持这两类完整性。 除此之外,不同的关系数据库系统由于应用环境的不除此之外,不同的关系数据库系统由于应用环境的不同,往往还需要一些特殊的约束条件,这就是同,往往还需要一些特殊的约束条件,这就是用户定用户定义完整性义完整性。返回返回323. 用户定义完整性(用户定义完整性(User-defined Integrity) 用户定义完整性用户定义完整性是针对某一具体关系数据库的约束条是针对某一具体关系数据库的约束条件。件。 它反映某一具体应用所涉及的数据必须满足的语义要它反映某一具体应用所涉及的数据必须满足的语义要求。求。 例如,属性值根据实际需要,要具备一些

31、约束条件,例如,属性值根据实际需要,要具备一些约束条件,如选课关系中成绩不能为负数;某些数据的输入格式如选课关系中成绩不能为负数;某些数据的输入格式要有一些限制等关系模型应该提供定义和检验这类完要有一些限制等关系模型应该提供定义和检验这类完整性的机制,以便用统一的、系统的方法处理它们,整性的机制,以便用统一的、系统的方法处理它们,而不要由应用程序承担这一功能。而不要由应用程序承担这一功能。返回返回332.5.1 关系模式和关系数据库模式关系模式和关系数据库模式 一个关系的属性名的集合一个关系的属性名的集合R(A1,A2,An)叫做叫做关系模关系模式式。其中:。其中: R为关系名,A1,A2,A

32、n为属性名(i=1,2,n)。 由定义可以看出,关系模式是关系的框架,或者称为由定义可以看出,关系模式是关系的框架,或者称为表表框架框架,指出了关系由哪些属性构成,是对关系结构,指出了关系由哪些属性构成,是对关系结构的描述。的描述。 一组关系模式的集合叫做一组关系模式的集合叫做关系数据库模式关系数据库模式。2.5 关系数据库模式与关系数据库关系数据库模式与关系数据库 返回返回34 关系数据库模式关系数据库模式是对关系数据库结构的描述,或者说是对关系数据库结构的描述,或者说是对关系数据库框架的描述,也就是前面所讲过的关是对关系数据库框架的描述,也就是前面所讲过的关系头,可以看作是关系的型。与关系

33、数据库模式对应系头,可以看作是关系的型。与关系数据库模式对应的数据库中的当前值就是关系数据库的内容,称为的数据库中的当前值就是关系数据库的内容,称为关关系数据库的实例系数据库的实例,即前面所讲过的关系体,可以看作,即前面所讲过的关系体,可以看作是关系的值。是关系的值。 例如,在图例如,在图1.12所示的教学数据库中,共有五个关系,所示的教学数据库中,共有五个关系,其关系模式分别为:其关系模式分别为: 学生(学号,姓名,性别,年龄,系别) 教师(教师号,姓名,性别,年龄,系别) 课程(课程号,课程名,课时) 选课(学号,课程号,成绩) 授课(教师号,课程号)返回返回35 在每个关系中,又有其相应

34、的数据库的实例在每个关系中,又有其相应的数据库的实例 例如:与学生关系模式对应的数据库中的实例有如下6个元组: S1赵亦女17计算机S2钱尔男18信息S3孙珊女20信息S4李思男21自动化S5周武男19计算机S6吴丽女20自动化返回返回362.5.2 关系数据库关系数据库 关系数据库关系数据库是是“一组随时间变化,具有各种度的规范一组随时间变化,具有各种度的规范化关系的集合化关系的集合”。 因为关系是由因为关系是由关系头关系头和和关系体关系体组成的,所以关系数据组成的,所以关系数据库也可以看作是一组关系头和关系体的集合。库也可以看作是一组关系头和关系体的集合。 由此可见,关系数据库也有由此可见

35、,关系数据库也有型型和和值值的概念,其型就是的概念,其型就是关系数据库模式,相对固定;其值就是关系数据库内关系数据库模式,相对固定;其值就是关系数据库内容,代表现实世界中的实体,而实体是随着时间不断容,代表现实世界中的实体,而实体是随着时间不断变化的,所以其值在不同的时刻会有所变化。变化的,所以其值在不同的时刻会有所变化。返回返回37 例如:例如:图图1.12所示的教学数据库是五个关系的集合,所示的教学数据库是五个关系的集合,或者说是五个关系头和五个关系体的集合。或者说是五个关系头和五个关系体的集合。 其中,各个关系头相对固定,而关系体的内容,会随时间而变化。 比如,学生和教师的年龄随时间而增

36、长,教师的工资和岗位津贴也会发生变化。返回返回38 关系模型与其他模型相比,最有特色的是它的关系模型与其他模型相比,最有特色的是它的数据库数据库语言语言。 这种语言灵活方便、表达能力和功能都很强。这种语言灵活方便、表达能力和功能都很强。 目前关系数据库所使用的语言一般都具有目前关系数据库所使用的语言一般都具有定义定义、查询查询、更新更新和和控制控制一体化的特点,而一体化的特点,而查询查询是最主要的部分。是最主要的部分。 所以说,关系数据库的核心部分是所以说,关系数据库的核心部分是查询查询,故又称为,故又称为查查询语言询语言,而查询的条件要使用,而查询的条件要使用关系运算表达式关系运算表达式来表

37、示。来表示。 因此,关系运算是设计关系数据语言的基础。因此,关系运算是设计关系数据语言的基础。 按表达查询的方法不同,关系运算可分为按表达查询的方法不同,关系运算可分为关系代数关系代数和和关系演算关系演算两大类。两大类。 2.6 关系代数关系代数返回返回392.6.1 关系代数的分类及其运算符关系代数的分类及其运算符 关系代数是对关系进行集合代数运算,是基于关系代关系代数是对关系进行集合代数运算,是基于关系代数的操作语言,称为数的操作语言,称为关系代数语言,简称关系代数关系代数语言,简称关系代数。 它 是 由 I B M 在 一 个 实 验 性 的 系 统 上 实 现 的 , 称 为ISBL(

38、Information System Base Language)语言。 ISBL的每个语句都类似于一个关系代数表达式。 关系代数的关系代数的运算对象运算对象是是关系关系,运算结果运算结果也是也是关系关系,关,关系代数用到的运算符主要包括四类:系代数用到的运算符主要包括四类: 集合运算符:(并),-(差),(交),X(广义笛卡尔积); 专门的关系运算符:(选择),(投影),(连接),*(自然连接),(除); 算术比较运算符:(大于),(大于等于), ,1000) (SEX=男) (T) 结果如图所示。结果如图所示。 注意:字符型数据的值应该使用单引号括起来,例如,注意:字符型数据的值应该使用单

39、引号括起来,例如,计算机计算机,男男。 TNOTNSEXAGEPROFSALCOMMDEPTT1李力男47教授15003000计算机返回返回532. 投影(投影(Projection) 投影运算也是单目运算,关系投影运算也是单目运算,关系R上的投影是从上的投影是从R中选择中选择出若干属性列,组成新的关系,即对关系在垂直方向出若干属性列,组成新的关系,即对关系在垂直方向进行的运算,从左到右按照指定的若干属性及顺序取进行的运算,从左到右按照指定的若干属性及顺序取出相应列,删去重复元组。记作:出相应列,删去重复元组。记作:A(R)=tA|tR 其中其中A为为R中的属性列,中的属性列,为投影运算符。为

40、投影运算符。 从其定义可看出,投影运算是从列的角度进行的运算,从其定义可看出,投影运算是从列的角度进行的运算,这正是选取运算和投影运算的区别所在。选取运算是这正是选取运算和投影运算的区别所在。选取运算是从关系的水平方向上进行运算的,而投影运算则是从从关系的水平方向上进行运算的,而投影运算则是从关系的垂直方向上进行的。关系的垂直方向上进行的。 返回返回54例例2.6 查询教师的姓名及其职称。查询教师的姓名及其职称。TN,TNO,PROF(T)或2,1,5(T) (其中2,1,5分别为TN、TNO和PROF的属性序号) 结果右图所示结果右图所示 上例表明,上例表明,投影运算可以改变投影运算可以改变

41、关系的属性次序关系的属性次序 TNTNOPROF李力T1教授王平T2讲师刘伟T3讲师张雪T4教授张兰T5副教授返回返回55例例2.7 查询教师关系中有哪些系。查询教师关系中有哪些系。DEPT(T) 结果如右图所示结果如右图所示 由例由例2.7可以看出,投影后取消了某些属性列后,就可可以看出,投影后取消了某些属性列后,就可能出现重复行,应该取消这些完全相同的行。所以投能出现重复行,应该取消这些完全相同的行。所以投影之后,不但减少了属性,元组也可能减少,新关系影之后,不但减少了属性,元组也可能减少,新关系与原关系不相容。与原关系不相容。 DEPT计算机信息自动化返回返回56例例2.8 查询讲授查询

42、讲授C5课程的教师号。课程的教师号。TNO(CNO=C5(TC) 结果如右图所示。结果如右图所示。 本例中选取运算和投影运算相结合,先在授课表中选本例中选取运算和投影运算相结合,先在授课表中选取满足条件的元组,再于取满足条件的元组,再于TNO属性上进行投影。属性上进行投影。 TNOT2T3T5返回返回573. 连接(连接(Join) 连接运算是二目运算,是从两个关系的笛卡尔积中选连接运算是二目运算,是从两个关系的笛卡尔积中选取满足连接条件的元组,组成新的关系。取满足连接条件的元组,组成新的关系。 设关系设关系R(A1,A2,An)及)及S(B1,B2,Bm),连接连接属性集属性集X包含于包含于

43、A1,A2,An,及及Y包含于包含于B1,B2,Bm,X与与Y中属性列数目相等,且相对应中属性列数目相等,且相对应属性有共同的域。属性有共同的域。若若Z=A1,A2An/X (/X:去掉去掉X之之外的属性外的属性) 及及W=B1,B2Bm/Y,则则 R及及S可表示为可表示为R(Z,X),S(W,Y) 关系关系R和和S在连接属性在连接属性X和和Y上的上的连接,就是以连接,就是以RS笛卡尔积中,选取笛卡尔积中,选取X属性列上的分属性列上的分量与量与Y属性列上的分量满足给定属性列上的分量满足给定比较条件的那些元组,比较条件的那些元组,也就是在也就是在RS上选取在连接属性上选取在连接属性X,Y上满足上

44、满足条件的子条件的子集,组成新的关系。新关系的度为集,组成新的关系。新关系的度为n+m。 返回返回58记作:记作: RS=t rts |trRtsStrXtsY为真为真 XY 其中,其中,是连接运算符,是连接运算符,为算术比较运算符,也称为算术比较运算符,也称连连接;接; XY为连接条件;为连接条件; 为“=”时,称为等值连接; 为“”时,称为大于连接。 连接运算为非基本运算,可以用选取运算和广义笛卡尔连接运算为非基本运算,可以用选取运算和广义笛卡尔积运算来表示:积运算来表示:RS=xy(RS)返回返回59 在连接运算中,一种最常用的连接是自然连接。在连接运算中,一种最常用的连接是自然连接。

45、所谓自然连接就是在等值连接的情况下,当连接属性所谓自然连接就是在等值连接的情况下,当连接属性X与与Y具有相同属性组时,把在连接结果中重复的属性具有相同属性组时,把在连接结果中重复的属性列去掉。即如果列去掉。即如果R与与S具有相同的属性组具有相同的属性组Y,则自然连,则自然连接可记作:接可记作:R*S=t rts |trRtsStrY=tsY 自然连接是在广义笛卡尔积自然连接是在广义笛卡尔积RS中选出同名属性上符中选出同名属性上符合相等条件元组,再进行投影,去掉重复的同名属性,合相等条件元组,再进行投影,去掉重复的同名属性,组成新的关系。组成新的关系。 返回返回60例例2.9 如图如图2.9(a

46、)、(b)所示的两个关系所示的两个关系R与与S,(c)为为R和和S的的大于连接(大于连接(CD),),(d)为为R和和S的等值连接(的等值连接(C=D),),(e)为为R和和S的等值连接(的等值连接(R.B=S.B),),(f)为为R和和S的自然的自然连接。连接。 R S (a) (b) ABC BDa1b12 b15a1b24 b26a2b36 b37a2b48 b38返回返回61大于连接(大于连接(CD) 等值连接(等值连接(C=D) (c) (d) AR.BCS.BD AR.BCS.BDa2b36b15 a2b36b26a2b48b15 a2b48b38a2b48b26 a2b48b37

47、 返回返回62等值连接等值连接(R.B=S.B) 自然连接自然连接 (e) (f) 图图2.9 连接运算举例连接运算举例 AR.BCS.BD ABCDa1b12b15 a1b125a1b24b26 a1b246a2b36b37 a2b367a2b36b38 a2b368返回返回63结合上例,我们可以看出结合上例,我们可以看出等值连接与自然连接的区别等值连接与自然连接的区别: 1. 等值连接中不要求相等属性值的属性名相同,而自然等值连接中不要求相等属性值的属性名相同,而自然连接要求相等属性值的属性名必须相同,即两关系只有连接要求相等属性值的属性名必须相同,即两关系只有在同名属性才能进行自然连接。

48、如上例在同名属性才能进行自然连接。如上例R中的中的C列和列和S中中的的D列可进行等值连接,但因为属性名不同,不能进行列可进行等值连接,但因为属性名不同,不能进行自然连接。自然连接。 2. 等值连接不将重复属性去掉,而自然连接去掉重复属等值连接不将重复属性去掉,而自然连接去掉重复属性,也可以说,自然连接是去掉重复列的等值连接。如性,也可以说,自然连接是去掉重复列的等值连接。如上例上例R中的中的B列和列和S中的中的B列进行等值连接时,结果有两列进行等值连接时,结果有两个重复的属性列个重复的属性列B,而进行自然连接时,结果只有一个属而进行自然连接时,结果只有一个属性列性列B。 返回返回64例例2.1

49、0 查询讲授数据库课程的教师姓名。查询讲授数据库课程的教师姓名。TN(CN=数据库(C)*TNO,CNO(TC)*TNO,TN(T)或TN(TNO(CN=数据库(C)*TC)*TNO,TN(T) 结果如右图所示。结果如右图所示。 TN王平刘伟张兰返回返回654. 除法除法(Division) 除法运算是二目运算,设有关系除法运算是二目运算,设有关系R(X,Y)与关系)与关系S(Y,Z),其中),其中X,Y,Z为属性集合,为属性集合,R中的中的Y与与S中中的的Y可以有不同的属性名,但对应属性必须出自相同可以有不同的属性名,但对应属性必须出自相同的域。关系的域。关系R除以关系除以关系S所得的商是一

50、个新关系所得的商是一个新关系P(X),),P是是R中满足下列条件的元组在中满足下列条件的元组在X上的投影:元组在上的投影:元组在X上分量值上分量值x的象集的象集Yx包含包含S在在Y上投影的集合。记作:上投影的集合。记作:RS=trX|trRy(S)Yx 其中,其中,Yx为为x在在R中的象集,中的象集,x= trX。 除法运算为非基本运算,可以表示为:除法运算为非基本运算,可以表示为:RS=x(R)x(x(R)SR) 返回返回66例例2.11 已知关系已知关系R和和S,如图,如图2.11(a),(b)所示,则所示,则RS如如图图(c)所示。所示。 与除法的定义相对应,本题中与除法的定义相对应,本

51、题中X = A , B = ( a 1 , b 2 ) , ( a 2 , b 4 ) , ( a 3 , b 5 ) ,Y=C,D=(c3,d5),(c4,d6),Z=F=f3,f4。其中,元。其中,元组在组在X上各个分量值的象集分别为:上各个分量值的象集分别为: (a1,b2)的象集为(c3,d5),(c4,d6) (a2,b4)的象集为(c1,d3) (a3,b5)的象集为(c2,d8) S在Y上的投影为(c3,d5),(c4,d6) 显然只有显然只有(a1,b2)的象集包含的象集包含S在在Y上的投影,所以上的投影,所以RS=(a1,b2) 返回返回67 R S RS (a) (b) (

52、c) 图图2.11 ABCDE CDF ABa1b2c3d5e1 c3d5f3 a1b2a1b2c4d6e1 c4d6f4 a2b4c1d3e3 a3b5c2d8e4 返回返回68 除法运算同时从行和列的角度进行运算,适合于包含除法运算同时从行和列的角度进行运算,适合于包含“全部全部”之类的短语的查询。之类的短语的查询。例例2.12 查询选修了全部课程的学生学号和姓名。查询选修了全部课程的学生学号和姓名。SNO,CNO(SC)CNO(C)*SNO,SN(S)返回返回69 关系演算是以数理逻辑中的谓词演算为基础的,通过关系演算是以数理逻辑中的谓词演算为基础的,通过谓词形式来表示查询表达式。谓词形

53、式来表示查询表达式。 根据谓词变元的不同,可将关系演算分为元组关系演根据谓词变元的不同,可将关系演算分为元组关系演算和域关系演算。算和域关系演算。2.7.1 元组关系演算语言元组关系演算语言 元组关系演算元组关系演算是以元组变量作为谓词变元的基本对象。是以元组变量作为谓词变元的基本对象。 元组关系演算语言的典型代表是元组关系演算语言的典型代表是E.F.Codd提出的提出的ALPHA语言,这种语言虽然没有实际实现,但较有语言,这种语言虽然没有实际实现,但较有名气,名气,INGRES关系数据库上使用的关系数据库上使用的QUEL语言,就语言,就是在是在ALPHA语言的基础上研制的。语言的基础上研制的

54、。 这里主要介绍这里主要介绍ALPHA语言和语言和QUEL语言语言 2.7 关系演算关系演算 返回返回70 ALPHA语言语言 ALPHA语言是以语言是以谓词公式谓词公式来定义查询要求的。在谓词来定义查询要求的。在谓词公式中存在客体变元,这里称为公式中存在客体变元,这里称为元组变量元组变量。 元组变量是一个变量,其变化范围为某一个命名的关元组变量是一个变量,其变化范围为某一个命名的关系。系。 ALPHA语言的基本格式是:语言的基本格式是: (): 操作符操作符有有GET,PUT,HOLD,UPDATE,DELETE,DROP等到种。等到种。 工作空间工作空间是指内存空间,可以用一

55、个字母表示,通常是指内存空间,可以用一个字母表示,通常用用W表示,也可以用别的字母表示。工作空间是用户表示,也可以用别的字母表示。工作空间是用户与系统的通信区。与系统的通信区。 目标表目标表用于指定操作(如查询、更新等)出来的结果,用于指定操作(如查询、更新等)出来的结果,它可以是关系名或属性名,一答操作语句可以同时对它可以是关系名或属性名,一答操作语句可以同时对多个关系或多个属性进行操作。多个关系或多个属性进行操作。返回返回71 操作条件操作条件是用谓词公式表示的逻辑表达式,只有满足是用谓词公式表示的逻辑表达式,只有满足此条件的元组才能进行操作,这是一个可选项,缺省此条件的元组才能进行操作,

56、这是一个可选项,缺省时表示无条件执行操作符规定的操作。除此之外,还时表示无条件执行操作符规定的操作。除此之外,还可以在基本格式上加上排序要求,定额要求等。可以在基本格式上加上排序要求,定额要求等。 下面以教学数据库(图下面以教学数据库(图1.121.12)为例,说明)为例,说明ALPHAALPHA语言的使用。语言的使用。 1. 数据查询数据查询(1)简单查询)简单查询例例 查询所有学生的数据。查询所有学生的数据。GET W (S) GET语句的作用是把数据库中的数据读入内存空间语句的作用是把数据库中的数据读入内存空间W,目标表为学生关系目标表为学生关系S,代表查询出来的结果,即所有的,代表查询

57、出来的结果,即所有的学生。学生。 冒号后面的操作条件缺省,表示无条件查询。冒号后面的操作条件缺省,表示无条件查询。返回返回72例例2.13 查询所有被选修的课程号码。查询所有被选修的课程号码。GET W (SC.CNO) 目标表为选课关系目标表为选课关系SC中的属性中的属性CNO,代表所有被选修,代表所有被选修的课程号码的课程号码,查询结果自动消去重复行。查询结果自动消去重复行。(2)条件查询)条件查询 由冒号后面的逻辑表达式给出查询条件,在表达式中由冒号后面的逻辑表达式给出查询条件,在表达式中可以使用如下三类运算符:可以使用如下三类运算符: 比较运算符:,1000 目标表为教师关系目标表为教

58、师关系T中的两个属性中的两个属性SN和和SAL组成的属组成的属性列表。性列表。 (3)排序查询)排序查询例例2.15 查询查询S3同学所选课程号及成绩,并按成绩降序排同学所选课程号及成绩,并按成绩降序排列。列。GET W (SC.CNO,SC.SCORE):SC.SNO=S3DOWN SC.SCORE DOWN表示降序,后面紧跟排序的属性名。表示降序,后面紧跟排序的属性名。 升序排列时使用升序排列时使用UP。 返回返回74(4)定额查询)定额查询例例2.15 查询一名男教师的教师号和姓名。查询一名男教师的教师号和姓名。GET W (1) (T.TNO,T.TN):T.SEX=男 所谓的定额查询

59、就是通过在所谓的定额查询就是通过在W后面的括号中加上定额后面的括号中加上定额数量,限定查询出元组的个数。数量,限定查询出元组的个数。 这里这里(1)表示查询结果中男教师的个数,取出教师表中表示查询结果中男教师的个数,取出教师表中第一个男教师的教师号和姓名。第一个男教师的教师号和姓名。 排序和定额查询可以一起使用。排序和定额查询可以一起使用。例例2.16 查询一名男教师的教师号和姓名,并使他的年龄查询一名男教师的教师号和姓名,并使他的年龄最小。最小。GET W (1) (T.TNO,T.TN):T.SEX=男 UP T.AGE 此语句的执行过程为:先查询所有男教师的教师号和此语句的执行过程为:先

60、查询所有男教师的教师号和姓名,再按照年龄由小到大排序,然后找出第一位,姓名,再按照年龄由小到大排序,然后找出第一位,也就是年龄最小的男教师。也就是年龄最小的男教师。 返回返回75(5)带元组变量的查询)带元组变量的查询 所谓的所谓的元组关系演算元组关系演算就是以元组变量作为谓词变元的就是以元组变量作为谓词变元的基本对象,在关系演算的查询操作时,可以在相应的基本对象,在关系演算的查询操作时,可以在相应的关系上定义元组变量。关系上定义元组变量。 元组变量元组变量代表关系中的元组,其取值是在所定义的关代表关系中的元组,其取值是在所定义的关系范围内变化,所以也称作范围变量系范围内变化,所以也称作范围变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论