第9讲数据库的基本理论(6.1节~6.3节).ppt_第1页
第9讲数据库的基本理论(6.1节~6.3节).ppt_第2页
第9讲数据库的基本理论(6.1节~6.3节).ppt_第3页
第9讲数据库的基本理论(6.1节~6.3节).ppt_第4页
第9讲数据库的基本理论(6.1节~6.3节).ppt_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第9讲数据库基础理论(第6.16.3节),第6.1讲数据库基础理论,第6.2讲数据模型,第6.3讲关系数据库系统,本课的主要内容,第6.1.1讲数据、信息和数据处理,数据是自然的和未经处理的,它的本质是信息的符号表示。数据的表达形式:数字、字符、图形、图像、声音、视频等。信息信息是现实世界中事物的存在方式或运动形式的综合,信息是一种被加工成特定形式的数据。信息的特征:信息是有价值的,可以被感知;信息可以通过载体传递,并通过信息处理工具进行存储、处理、传播、再生和增值。数据处理数据处理是将数据转换成信息的过程,如数据的收集、存储、检索、处理、转换和传输。信息=数据处理,6.1.2数据管理技术的发

2、展,数据管理数据管理是指数据的分类、组织、编码、存储、检索和维护。数据管理属于数据处理的范畴,但它是不一样的。数据管理的发展阶段手动管理阶段文件系统阶段数据库系统阶段数据管理技术的发展推动了计算机硬件的发展和计算机软件的发展。第一,手工管理阶段,从20世纪40年代中期到50年代中期的背景应用要求:科学计算硬件层面:没有直接访问存储设备软件层面:没有操作系统,6.1.2数据管理技术的发展,特征数据没有保存,主要依靠应用程序来管理数据;一组数据只能对应一个应用程序;应用程序依赖于数据,不具有数据独立性。一旦数据结构发生变化,应用程序通常需要进行相应的修改。二是文件系统阶段,背景应用要求从20世纪5

3、0年代末到60年代:科学计算,信息管理硬件层面:磁盘和鼓软件层面:文件系统,6.1.2数据管理技术的发展,特征数据以文件的形式长期存储在内存中;程序和数据之间相对独立,数据不再属于特定的应用程序。数据文件相互独立,缺乏联系,缺乏数据的集中管理,数据冗余大,容易产生不一致。第三章。数据库系统阶段,时期背景自20世纪60年代末以来的应用要求:大规模管理硬件层次:大容量磁盘和磁盘阵列软件层次:数据库管理系统,6.1.2数据管理技术的发展,数据结构的特点,即用数据模型来表示复杂的数据结构,不仅描述数据本身的特点,而且描述数据之间的联系。数据独立性高,数据结构分为具有良好物理结构和逻辑结构的用户界面。用

4、户可以通过终端命令或程序操作数据库,实现数据共享,减少数据冗余,统一数据安全保护。6.1.3数据库系统的组成,数据库系统的定义数据库系统是一个具有数据库管理功能的计算机系统,它可以有组织地、动态地存储大量的关联数据,由便于用户访问的计算机软硬件资源组成。要理解数据库系统,我们应该逐步掌握以下基本概念:数据库(DB)、数据库管理系统(DBMS)、数据库系统(DataBase system),首先是数据库的定义。数据库是长期存储在计算机中的大量数据的有组织和可共享的集合。数据库的基本特征数据是按照一定的数据模型组织、描述和存储的,可以由不同的用户共享,冗余少,数据独立性高,易于扩展。6.1.3数据

5、库系统的组成,2。数据库管理系统,什么是数据库管理系统?用户和操作系统之间的第一层数据管理软件是基础软件。是一个庞大而复杂的软件系统。目前流行的微机数据库管理系统是SQL Server,利用Visual FoxPro等数据库管理系统科学地组织和存储数据,高效地获取和维护数据库管理系统的主要功能。数据定义功能提供数据定义语言(DDL)来定义数据库中的数据对象,数据操作功能提供数据操作语言(DML)来实现对数据库的基本操作(查询、插入、删除和修改)。6.1.3数据库系统的组成,三。数据库系统,什么是数据库系统?数据库系统是具有数据库管理功能的计算机系统,它可以有组织地、动态地存储大量的相关数据,由

6、便于用户访问的计算机软硬件资源组成。数据库系统的组成数据库(及其支持数据库操作的软硬件)数据库管理系统(及其开发工具)应用系统数据库管理员数据库系统具有高数据共享、低冗余、易扩展和高数据独立性的特点。数据由数据库管理系统统一管理和控制。数据模型是对现实世界的模拟。数据模型应该满足三个要求。它能更逼真地模拟现实世界,容易被人们理解。这很容易在电脑上实现。数据模型可以分为两类(属于两个不同的层次):概念模型和信息模型。它根据用户的观点对数据和信息进行建模,并用于数据库设计。数据模型从计算机系统的角度对数据进行建模,用于数据库管理系统的实现。它主要包括网格模型、层次模型和关系模型。客观对象的抽象过程

7、分两步将现实世界中的客观对象抽象成概念模型;将概念模型转换为数据库管理系统支持的数据模型。数据库管理系统支持的数据模型、概念模型、认知抽象、信息世界、数据世界、现实世界中客观对象的抽象过程、现实世界、6.2数据模型、6.2.1概念模型、1。信息世界中的基本概念,实体客观存在并能相互区分的事物称为实体。它可以是具体的人、事、物或抽象的概念。属性实体有一个特定的特征,称为属性。一个实体可以由几个属性来表征。唯一标识实体的属性集称为键。“域”属性的值范围称为属性的域。实体类型使用实体名称及其属性名称集来抽象和描述同一种实体,称为实体类型。实体集相同类型的实体集合称为实体集。关系在现实世界中,事物之间

8、和事物内部的关系在信息世界中反映为实体之间的关系和实体之间的关系(实体之间的关系通常是指不同实体集之间的关系)。学生编号,姓名,性别,年龄,专业),学生,性别:男/女,所有学生可以组成一个学生实体集,学生编号(学生编号,姓名,性别,年龄,专业),学生编号,6.2.1概念模型,第二,两个实体集之间的连接,一对一的连接如果对于每个实体集A,实体集A被认为与实体集B有一对一的关系,标记为1:n。如果实体集b中有n(n=0)个实体与实体集a中的每个实体相连,相反,如果实体集a中最多有一个实体与实体集b中的每个实体相连,则实体集a与实体集b具有一对多的关系,标记为11。多对多连接如果实体集b中有n(n=

9、0)个实体与实体集a中的每个实体相连,反之,如果实体集a中有m(m=0)个实体与实体集b中的每个实体相连,则实体集a和实体集b具有多对多连接,表示为m:n。6.2.1概念模型,3。实体关系模型(E-R模型),实体关系方法(E-R方法)使用E-R图来描述现实世界的概念模型。生态重建方法也称为生态重建模型。电子病历图形实体:用矩形表示属性;用椭圆表示属性,并用相应的无向边实体连接它们。联系方式:联系方式本身:用菱形表示,联系方式名称写在菱形框中,通过无向边与相关实体连接,联系方式(1:1、1:n或m:n)标记在无向边旁边。联系人属性:联系人本身是一种实体,也可以有属性。如果连接有属性,这些属性也应

10、该通过无向边与连接相连。E-R模型示例、6.2.2数据模型,什么是数据模型数据模型是在数据库字段中定义数据及其操作的抽象表示。数据模型决定了数据及其相互联系,并决定了数据库的设计方法。数据模型的分类根据数据之间不同的连接方式,数据模型可以分为三种类型:(1)层次模型(2)网格模型(3)关系模型:关系模型是目前最常用的数据模型。关系模型使用二维表结构来表示实体的类型和实体之间的关系。换句话说,在关系数据模型中,数据的逻辑结构(或关系)是一个由行和列组成的二维表。表中的行代表记录,表中的列代表属性。关系数据模型的基本术语关系对应于二维表,二维表名就是关系名。关系模式对关系的描述称为关系模式。关系模

11、型的一般形式是:关系名称(属性1、属性2、属性n)的tuple表中的一行是一个tuple,即一个Tuple对应一条记录。属性表中的列是一个属性,每个属性都有一个名称,即域属性的值范围。能够唯一区分主键关系中不同元组的属性或属性组合称为关系的键,也称为主键,或简称为主键。外键关系中的某个属性或属性组合是非键的,但它是另一个关系的主键。6.3关系数据库,6.3关系数据库,关系数据模型中的表之间的关系(1)部门和部门负责人之间的一对一关系:部门(部门名称、部门负责人编号、地址)部门负责人(部门负责人编号、名称)(2)部门和学生之间的一对多关系:部门(部门名称、部门负责人编号、地址)学生例如,学生和课

12、程之间的多对多关系可以分为两种一对多关系:学生(学生编号、姓名、年龄、性别、部门名称、年级)、课程(课程编号从以上关系可以看出,两个数据表建立了关联关系,连接的类型取决于主键和外键的值是否重复:(1)(2)如果主键和外键的值之一是唯一的,而另一个是可重复的,则两个表之间的关系是一对多;注意:通常,包含主关键字段的数据表称为父表,包含外部关键字字段的数据表称为子表。,外键,主键,父表,父表,子表,6.3关系数据库,关系数据模型关系的本质(1)关系必须规范化,属性不能再次划分。规范化意味着关系模型中的每个关系模式都必须满足某些要求。最基本的要求是,关系必须是一个二维表,每个属性值必须是一个不可分割

13、的最小数据单元,也就是说,该表不能再包含表。(2)同一关系中不允许有相同的属性名;(3)同一关系中不允许有相同的元组;(4)在相同的关系中,元组的顺序是不相关的,也就是说,随意交换两行的位置不会影响数据的实际意义。(5)在同一关系中,属性的顺序是不相关的。随意切换两列的位置不会影响数据的实际含义,也不会改变关系模式。作为一个二维表,关系操作可以执行的操作包括:(1)从给定的关系中选择满足特定条件的记录(或元组)的过程称为选择。(2)投影操作给定一个关系,只从中检索预期字段(或属性)的过程称为投影(3)连接操作。联接操作需要两个关系参与操作,这是二进制运算符联接操作的先决条件:通常,这两个关系中

14、有一个公共属性(称为联接属性),它是一个关系(称为表)中的主键,而在另一个关系(称为多个表)中,例如,部门名称是“部门表”(一个表)中的主键,而部门名称是“学生表”(多个表)中的外键。连接操作的结果:从属性的角度来看,它是参与操作关系的两个属性的叠加;从元组的角度来看,它基于多个表元组的记录,并在连接属性相同时扩展对应于一个表的数据值。也就是说,以多个表为准。关系模型基于严格的数学概念,有一个单一的概念,即实体和各种联系都是用关系来表示的,数据的检索结果也是关系。6.3关系数据库中,完整性规则数据完整性是指数据库中数据的准确性、正确性和有效性。数据库中数据的完整性是用户对数据存储和维护的要求。它可以指定某些属性或字段的值必须限制在某个范围内,还可以指定某些数据之间满足某些约束。作为关系型数据库管理系统,为了维护数据库的完整性,一般为数据模式提供以下三种类型的完整性约束机制:(1)域完整性规则规定了属性的取值范围,如学生成绩不能为负数。(2)实体完整性规则要求任何元组的主键的值不能为空,并且在其所属

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论