《数据库系统原理》PPT电子课件教案-第一章 数据库系统概述.ppt_第1页
《数据库系统原理》PPT电子课件教案-第一章 数据库系统概述.ppt_第2页
《数据库系统原理》PPT电子课件教案-第一章 数据库系统概述.ppt_第3页
《数据库系统原理》PPT电子课件教案-第一章 数据库系统概述.ppt_第4页
《数据库系统原理》PPT电子课件教案-第一章 数据库系统概述.ppt_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

授课教师:讲课:32学时,数据库系统原理,第一章 数据库系统概述,数据库技术 是计算机管理数据的一个最新技术,其主要目标是解决数据管理中数据的存储、访问、处理等问题。 标志:数据库管理软件的出现,1.1 引言,1. 数据(data) 描述事物特性的符号记录。需要进行语义解释。 数据与其语义不可分。,1.1.1基本概念,数据的形式还不能完全表达其内容,需要经过解释。所以数据和关于数据的解释是不可分的,数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。 例,图象 数据黑白点阵 语义脸谱,2. 数据库( db, database) 长期储存在计算机内、有组织的、可共享的数据的集合 特点 (1) 按照一定的数据模型组织、描述和存储 (2) 具有较高数据独立性、易扩展性 (3) 较小的冗余度 (4) 可为各种用户共享,3. 数据库管理系统(dbms, database management system) 是数据管理软件,是操纵和管理数据库的软件系统,它由一组计算机程序构成,管理并控制数据资源的使用。 基本功能: 数据定义; 数据操纵; 数据库运行管理; 数据组织、存储和管理; 数据库建立与维护。,4. 数据库系统(dbs, database system) 是指在计算机中引入数据库后的系统构成。是计算机化的记录保持系统,其总目的是存储信息和产生所需要的信息。 是计算机系统+数据库 组成: 数据库(db) 数据库管理系统(dbms)os 应用系统 用户(users) 硬件环境 数据库系统三要素: db、dbms、user,dba(数据库管理员) application programmer end user,用户 数据库管理员(database administrator, dba) 全面负责数据库系统的管理、维护、正常使用 应用程序员(application programmer) 负责设计和编制应用程序 终端用户(最终用户、end user),数据库系统的组成,数据库系统,database,硬件,操作系统,d b m s,应用开发工具软件,应用系统,数据库系统在计算机中的地位,硬件 数据库,1.1.2 数据库技术的产生与发展,数据处理 是指对各种数据进行收集、存储、加工和传播的一系列活动的总和。,数据管理 是指如何对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。,数据管理的三个发展阶段 1. 人工管理阶段 2. 文件系统阶段 3. 数据库系统阶段,数据管理三个阶段的比较,人工管理阶段应用程序与数据之间的对应关系,文件管理阶段应用程序与数据之间的对应关系,存取 方法,3.数据库系统阶段,数据管理特点 (1)数据结构化 (2)数据共享性好,冗余度低,易扩充 (3)数据独立性高 (4)数据由dbms统一管理和控制 数据控制:数据的安全性 数据的完整性 并发控制 数据库恢复,数据库系统阶段程序与数据的对应关系,1.1.3 数据库技术的研究领域,1. dbms软件的研制 2. 数据库设计 3. 数据库理论,1.2 数据模型,1. 模型 是对现实世界特征的模拟和抽象。 2. 数据模型 现实世界数据特征的抽象和模拟。 3. 数据模型应满足三方面要求: (1) 能比较真实地模拟现实世界; (2)容易为人理解; (3) 便于在计算机上实现,4. 数据抽象的3个层次,现实世界,概念模型,(逻辑)数据模型,物理数据模型,概念层(最高层),物理层(最低层),逻辑层(中间层),信息世界,机器世界(物理部分),机器世界(逻辑部分),认识抽象,转换,5. 数据模型的种类: (1)概念模型(信息模型) 按用户的观点对数据和信息建模; 独立于计算机系统的数据模型;是现实世界的第一层抽象 (2)数据模型(逻辑数据模型) 按计算机系统的观点对数据建模 直接面向数据库的逻辑结构,是现实世界的第二层抽象; 主要包括:网状模型、层次模型、关系模型和面向对象数据模型,1.2.1 数据模型的组成要素,1. 数据结构 是所研究的对象类型的集合。 不同的数据结构决定了不同的数据模型 是对系统静态特性的描述 2. 数据操作 是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包含定义操作及有关的操作规则 是对系统动态特性的描述 3. 数据的约束条件 是一组完整性规则的集合,1.2.2 概念模型,用于信息世界的建模; 现实世界到信息世界的第一层抽象; 现实世界到机器世界的一个中间层; 用户与数据库设计人员进行交流的语言; 有较强的语义表达能力,且简单、清晰、易于用户理解; 最著名的是“实体联系模型”。,对象的抽象过程,现实世界,信息世界 概念模型,机器世界 数据模型,第一级 抽象,认识抽象,第二级 抽象,转换,事物个体 实体 记录 事物总体 实体集 文件 特征 属性 字段 事物间联系 实体模型 数据模型,1. 信息世界中的基本概念,(1) 实体(entity) 客观存在并相互区别的事物 (2)属性(attribute) 实体所具有的某一特性 一个实体可以用若干个属性描述 (3) 码(key) 唯一标识实体的属性集 (4) 域(domain) 属性的取值范围,(5) 实体型(entity type) 用实体名及其属性名集合来抽象和刻画同类实体 (6)实体集(entity set) 同型实体的集合 (7)联系(relationship) 实体(型)内部联系和实体(型)之间的联系 两个实体(型)之间的联系有: 一对一联系(1 : 1) 如:班级与班长 一对多联系(1 : n) 如:班级与学生 多对多联系(m : n) 如:课程与学生,2. 概念模型的表示方法,实体联系方法(entity-relationship approach) e-r图,描述现实世界的概念模型 提供了表示实体型、属性和联系的方法 表示方法: 实体型:矩形实体名 属性:椭圆形,无向边与实体连接 联系:菱形联系名,无向边与实体连接,边上标注联系类型,课程名,课程,学生,n,m,选修,课程,课程,注: 联系本身也可以有属性,联系实例及e-r图,班级班长 1 : 1 班级学生 1 : n 课程学生 m : n,学生,1,1,1,n,n,m,班级,班长,班级-班长,班级,课程,学生,选修,组成,两个实体型间的联系e-r图,生学,三个实体型间的联系e-r图,同一实体型间的联系e-r图,课程,班级,学生,教师,参考书,实体及其属性e-r图,学校课程管理的概念模型, 用e-r图来表示 设有5个实体型,实体及其联系e-r图,存在的联系:,课程管理概念模型e-r图,属性,例1: 某百货公司有若干连锁商店,每家商店经营若干商品,每家商店由若干职工,但每个职工只能服务于一家商店。试描述该百货公司的e-r模型,并给出每个实体、联系的属性。,解:根据题意,该百货公司e-r模型应有三个实体: 商店(商店号,商店名,地址,负责人) 商品(商品号,商品名,产地,价格) 职工(职工号,姓名,性别,工资) 各实体间的联系: 商店和商品之间的“经营”联系(有月销量属性) 职工和商店之间的“聘用”联系(有来店时间属性) 职工和商品之间的“销售”联系,商店,商品,职工,负责人,来店时间,月销量,百货公司e-r图,经营,聘任,1,m,m,n,m,销售,n,1.2.3 数据模型,是现实世界的第二层抽象 4种常见数据模型: 层次模型(hierarchical model) 网状模型(network model) 关系模型(relational model) 面向对象的模型(object oriented model),非关系模型,信息世界,机器世界,实体模型 数据模型 实体集 文件 实体 记录 实体型 记录型 属性 字段、数据项 实体码 记录码,机器世界与信息世界术语对应关系:,1.2.3.1 层次数据模型,典型代表 ibm公司的ims(imformation management system)数据库管理系统 定义: 在数据库中, 满足以下两个条件的基本层次联系的集合称为层次模型. (1)有且只有一个结点没有双亲结点(根结点); (2)根以外的其他结点有且只有一个双亲结点。,用树形结构表示各类实体以及实体间的联系 层次模型特点: 只有一个根结点,无双亲 其他结点有且只有一个双亲结点 任何一个记录值不能脱离双亲记录值而存在 在层次模型中: 每个结点表示一个记录类型(实体型),每个记录类型包含有若干字段(属性),结点之间的连线(有向边)表示记录(类型)之间的联系。 各个记录类型及其字段都必须命名 各个记录类型、同一记录类型中的字段不能同名。 子女结点与双亲结点的联系是唯一的,1. 层次数据模型基本结构,只能处理1对多的实体联系,教师学生层次数据库模型 有4个记录类型,各有自己字段,系编号,教师t,系d,学生s,教研室r,系名,办公地点,教研室编号,教研室,学号,姓名,成绩,姓名,职工号,研究方向,教师学生层次数据模型的一个值,d02,教师t,系d,学生s,教研室r,计算机系,信息楼,r01,数据库,s3801,王萍,a,王大明,e2101,数据库,r02,信息系统,r03,网络技术,s3804,刘华,c,s3806,张明,a,冯洁,e1709,数据仓库,李利,e3501,并行数据库,陈酶,e1101,网络管理,张豪,e3102,网络安全,多对多联系在层次模型中的表示 转换成一对多联系 转换方法: (1)冗余结点法 (2)虚拟结点法 其他非树型结构 转换成树形结构 转换方法: (1)冗余结点法 (2)虚拟结点法,用层次模型表示多对多联系,学号,姓名,成绩,课程名,课程号,v.s,v.s,s-c,课程c,s,s,c,c,c,s,s,c,学生s,m,n,学号,姓名,成绩,学号,姓名,成绩,课程名,课程号,课程名,课程号,学号,姓名,成绩,虚拟结点法,冗余结点法,课程名,课程号,2. 层次数据模型的操纵和完整性约束,不能插入无双亲的子结点 子结点和双亲结点一起删除 更新操作要保证数据的一致性,3. 层次数据模型存储结构,邻接法 按照树的前序遍历把记录值依次邻接存放 链接法 用指引元反映数据之间的层次联系,4. 层次数据模型的优缺点,优点 数据模型简单 若实体间的关系固定,性能优于关系模型 良好的完整性支持 缺点 描述现实世界的非层次性很笨拙 对插入和删除操作限制较多 必须通过双亲才能找到子结点 由于结构严密,层次命令趋于程序化,1.2.3.2 网状数据模型,典型代表:dbtg系统,也称codasyl系统 定义: 在数据库中, 把满足以下两个条件的基本层次联系的集合称为网状模型. (1)允许一个以上的结点无双亲; (2)一个结点可以有多于一个的双亲。,1. 网状数据模型数据结构,特点: 允许多个结点无双亲 允许一个结点可以有多个双亲 允许两个结点间有多种联系 多种网状数据结构,在网状模型中: 每个结点表示一个记录类型(实体),每个记录类型包含有若干字段(实体的属性),结点之间的连线(有向边)表示记录类型(实体)之间一对多的联系。 各个记录类型及其字段都必须命名 各个记录类型、同一记录类型中的字段不能同名。 若联系不唯一,要为每个联系命名,并指出与该联系有关的双亲记录和子女记录。,学生/选课/课程的网状数据库模型,学分,学生,选课,课程,s-sc,c-sc,学号,课程号,课程名,姓名,系别,学号,课程号,成绩,中间实体,2. 网状数据模型的操纵和完整性约束,允许插入无双亲的子结点 允许只删除双亲结点 更新操作较简单,3. 网状数据模型的存储结构,实现方法 常用链接法(单向、双向、环状、向首等) 其他方法(指引元阵列法、二进制阵列法、索引法等),学生/选课/课程的网状数据库实例,4. 网状数据模型的优缺点,优点 能够直接描述现实世界 存取效率较高 缺点 数据描述语言极其复杂 数据独立性差,1.2.3.3 关系数据模型,实体以及实体间的联系都是用关系来表示的 关系必须是规范化的 代表系统: oracle、 sybase、informix、ms sql 、vfp 、access等 在用户看来,关系模型中数据的逻辑结构(数据结构)是一张二维表 用二维表结构来表示实体及实体间联系的模型。,1. 关系数据模型的数据结构,是一张规范的二维表,由行和列组成 概念: 1. 关系(relation):整个二维表,一个关系对应一个二维表 2. 关系名:表格名称 3. 元组(tuple):二维表中的一行(记录值) 4. 属性(attribute):二维表中的列数据(字段、数据项) 5. 属性名:列名称(字段名),6. 主码(key):唯一确定元组的属性组 7. 域(domain):属性的取值范围 8. 分量:元组中的一个属性值 9. 关系模式:二维表中,行定义(记录的型),是对关系的描述。 表示为: 关系名(属性名1,属性名2,属性名n),关系数据模型,学生人事记录表,关系名,元组(行),属性(列),主码,男 女,域,分量,关系模式:学生(学号、姓名、性别、年龄、籍贯),属性名,关系,2. 关系数据模型的操纵与完整性约束,操纵:查询、更新(插入、修改、删除) 完整性:实体完整性、参照完整性、用户定义完整性 集合操作,操作的对象与结果都是关系 数据独立性高(存取路径向用户隐蔽),3. 关系数据模型的存储结构,在关系数据模型中,实体及实体间的联系都是 用表来表示 表以文件形式存储 每一个表对应一种文件结构,优点: 有严格的数学概念作基础 关系模型的概念单一 存取路径对用户透明 缺点: 查询效率不高,4. 关系数据模型的优缺点,1.3 数据库系统结构,从数据库管理系统角度看, 是一个三级模式结构,提供二级映象功能。 从最终用户角度看,数据系统的结构分为: 单用户结构 主从式结构 分布式结构 客户/服务器结构,1.3.1 数据库系统模式结构,模式(schema) 是数据库中全体数据的逻辑结构和特征的描述; 模式仅涉及到数据类型的描述,不涉及到具体的数值(实例) ; 模式是相对稳定的,实例是相对变动的; 模式反映的是数据的结构及其关系;实例反映的是数据库某一时刻的状态。 实例(instance) 模式的一个具体的值称为模式的一个实例。,1.数据库系统三级模式结构,是指数据库系统是由外模式、模式、内模式构成。,应用a,应用b,应用c,应用d,外模式1,外模式2,外模式3,模式,内模式,数据库,外模式/模式映象,模式/内模式映象,3,2,1,1) 模式(逻辑模式、概念模式) 是数据库中全体数据的全局逻辑结构和特征的描述。 是所有用户的公共数据视图 一个数据库只有一个模式 2) 外模式(子模式、用户模式) 是数据库中局部数据的逻辑结构和特征的描述。 是模式的子集, 是模式的部分抽取; 是数据库用户的数据视图; 一个数据库可以有多个外模式; 是与用户看待数据库方式有关的层,3) 内模式(存储模式) 是数据库中数据的物理结构和存储结构的描述 是数据在数据库中的内部表示。 一个数据库只有一个内模式 内模式是模式的物理实现,而模式是内模式的逻辑表示。,3个模式反映了数据库的3种不同观点: (1)模式表示了概念级的数据库,体现了对数据库的总体观; (2)内模式表示了物理级的数据库,体现了对数据库的存储观; (3)外模式表示了用户级的数据库,体现了对数据库的用户观;,2. 数据库的二级映象功能与数据独立性,1)外模式/模式映象 定义了外模式与模式之间的对应关系。 是数据的全局逻辑结构和数据的局部逻辑结构之间的映象; 外模式/模式映象不唯一; 模式改变映象改变外模式不变应用程序不变保证数据的逻辑独立性。,2)模式/内模式映象 定义了模式与内模式之间的对应关系。 是数据的全局逻辑结构与存储结构之间的映象。 模式/内模式映象是唯一的; 存储结构改变映象改变模式不变保证数据的物理独立性。,应用a,应用b,应用c,应用d,外模式1,外模式2,外模式3,模式,内模式,数据库,外模式/模式映象,模式/内模式映象,数据库系统三级模式结构,3,2,1,4)三级结构带来的优点: (1)保证数据的独立性; (2)简化了用户的使用; (3)减少冗余,利于共享; (4)有利于数据的安全操作。,1.3.2 数据系统的体系结构,从最终用户角度看,数据库系统分为: 1. 单用户数据库系统 2. 主从式结构的数据库系统(终端) 主从结构:一个主机带多个终端的多用户结构 3. 分布式结构的数据库系统(网络) 4. 客户/服务器结构的数据库系统 分为:集中的服务器结构 分布的服务器结构,1. 单用户数据库系统,整个数据库系统存放在一台计算机上,由一个用户独占, 不同机器之间不能共享数据。,2. 主从式数据库系统 一个主机带多个终端的多用户结构,整个数据库系统存放主机上,所有的处理任务由主机完成, 各用户通过主机的终端并发地存取数据库,共享数据资源。,3. 分布式数据库系统 数据库中的数据在逻辑上是一个整体,物理地分布在计算机网络的不同结点上,网络中的每个结点都可以独立处理本地数据库,执行局部应用; 同时也可以存取和处理多个异地数据库中的数据,执行全局应用。,4. 客户/服务器结构的数据库系统,把数据库管理和数据库应用划分为两个部分,并分别位于服务器端和客户端。数据库管理系统位于服务器端,数据库应用开发工具、应用程序位于客户端。 数据库服务器,在高性能计算机上安装有数据库管理系统。 客户机,计算机上安装dbms外围应用开发工具、应用程序,支持用户的应用。 种类 (1)集中的服务器结构 (2)分布的服务器结构,网络中只有一台数据库服务器,有多台客户机,网络中可以有多台数据库服务器,有多台客户机,1.4 数据库管理系统,是操纵和管理数据库的系统软件,是由一组计算机程序构成,管理并控制数据资源的使用。,1.4.1.1 dbms的功能,1. 数据定义功能 数据库结构模式定义 模式映象定义 约束条件的定义 2. 数据操纵功能 检索(查询) 插入 修改 删除等。 3. 数据库运行管理功能 安全性控制 完整性控制 并发控制,4. 数据组织、存储和管理功能 分类组织、存储和管理各种数据 确定数据库中的数据以何种文件结构和存取方式在存储级上组织这些数据,如何实现数据之间的联系。 5. 数据库的建立和维护功能 初始数据输入、 数据转换 数据库的转储与恢复、数据库重组织与重构、性能监视与分析等 6. 数据通信接口功能 与其他软件系统进行通讯的功能,dbms面向用户的功能,检查用户合法性 检查数据合法性 按用户要求进行操作,谁能访问数据 更新数据有什么要求 ,用户定义的数据安全性完整性,(1) user 通过ddl语言定义数据格式,(2) user 通过dml语言操纵数据进出数据库,(3) user 通过dcl语言控制数据安全性 (4) user 通过ddl语言定义数据安全性/完整性,1.4.1.2 dbms的组成,1. 数据定义语言及其翻译处理程序 数据定义语言ddl 数据描述语言ddl翻译程序 2. 数据操纵语言及其编译(解释)程序 数据操作语言dml处理程序 终端命令解释程序 数据库控制命令解释程序,3. 数据库运行控制程序 (1) 系统总控程序 (2) 存取控制程序 (3) 并发控制程序 (4) 完整性控制程序 (5) 保密性控制程序 (6) 数据存取和更新程序 (7) 通信控制程序 4. 实用程序 (1) 数据装入程序 (2)数据转储程序 (3) 数据库系统恢复程序 (4) 性能监督程序 (5) 数据库重组织程序 (6) 工作日志程序,1.4.2 dbms的工作过程,数据库,系统缓冲区,应用程序a,用户工作区,dbms,os,模式,物理模式,子模式a,(读取记录),用户a,1.4.3 dbms的实现方法,1. n方案: dbms与应用程序融合在一起 2. 2n方案: 一个dbms进程对应一个用户进程 3. m+n方案 多个dbms进程对应多个用户进程 4. n+1方案 一个dbms进程对应所有用户进程,1. n方案 dbms与应用程序融合,os,进程数与用户数相等,2. 2n方案 一个dbms进程对应一个用户进程,os,进程数接近用户数的2倍,3. m+n方案 多个dbms进程对应多个用户进程,os,有n个用户进程,m个dbms进程为之服务(mn),4. n+1方案 一个dbms进程对应所有用户进程,os,有多个用户进程,1个dbms进程为之服务,1.5 数据库工程与应用,数据库设计 指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及应用系统,使之能够有效地存储数据,满足各种用户的应用需求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论