第一章 数据库系统概论_第1页
第一章 数据库系统概论_第2页
第一章 数据库系统概论_第3页
第一章 数据库系统概论_第4页
第一章 数据库系统概论_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章数据库系统概论

主要讲解内容数据数据库数据库管理系统数据库系统数据库系统的组成数据库技术的发展历史数据库系统阶段的主要特点数据库系统结构三级模式结构与二级(层)映象功能数据的独立性物理独立性与逻辑独立性数据库系统的体系结构数据库管理系统数据库管理系统的主要功能数据库管理系统的组成概念模型E-R表示方法

数据模型层次网状关系人工管理阶段文件系统阶段1.1数据管理技术的发展应用程序1应用程序2应用程序n数据库系统阶段数据1数据2数据n文件系统物理文件1物理文件2物理文件n数据库管理系统数据库1.1数据管理技术的发展人工管理阶段文件系统阶段数据库系统阶段时间-50年代中期50年代后期-60年代中期60年代后期—应用背景科学计算科学计算、管理大规模管理硬件背景无直接存取存储设备磁盘、磁鼓大容量磁盘软件背景没有操作系统有操作系统(文件系统)有DBMS处理方式批处理批处理联机实时处理批处理联机实时处理分布处理数据库技术的三个阶段(续1)人工管理阶段文件系统阶段数据库系统阶段数据保存方式数据不保存以文件的形式长期保存,但无结构以数据形式保存,有结构数据管理考虑安排数据的物理存储位置与数据文件名打交道对所有数据实行统一、集中、独立的管理数据与程序数据面向程序数据与程序脱离数据与程序脱离实现数据的共享数据的管理者人文件系统DBMS数据面向的对象某一应用程序某一应用程序现实世界数据库技术的三个阶段(续2)人工管理阶段文件系统阶段数据库系统阶段数据的共享程度无共享共享性差共享性高数据的冗余度冗余度极大冗余度大冗余度小数据的独立性不独立,完全依赖于程序独立性差具有高度的物理独立性和一定的逻辑独立性数据的结构化无结构记录内有结构整体无结构整体结构化用数据模型描述数据的控制能力应用程序自己控制应用程序自己控制由DBMS提供数据的安全性、完整性、并发控制和恢复能力基本概念数据

描述现实世界中各种事物的符号记录数据库

长期储存在计算机中的、有组织的、可共享的数据的集合数据库管理系统

数据库管理系统是为数据库的建立、使用和维护而配置的软件。它建立在操作系统的基础上,对数据库进行统一的管理和控制。数据库系统

是实现在组织地、动态地存储大量相关的结构化数据,方便各类用户使用数据库的计算机软件/硬件资源的集合。数据库系统由5部分组成:硬件系统、数据库集合、数据库管理系统及相关软件、数据库管理员和用户。1.2数据描述1.2.1数据描述的3个领域从事物的特征到计算机中数据的表示,数据描述要经历3个不同的领域:现实世界、信息世界和机器世界。信息世界指现实世界在人们头脑中的反映。人们用文字、符号、图形、图像、声音等方式记载下现实世界的信息,我们称之为信息世界。在信息世界中,常用的术语有以下4个:实体(Entity):客观存在可以相互区别的事物称为实体。实体可以是具体的对象,例如:一个员工、一本教材等。也可以是抽象的事件,例如:一次旅游、一场球赛等。实体集(EntitySet):性质相同的同类实体的集合称为实体集。例如,学生等。属性(Attribute):实体有很多特性,每一个特性称为一个属性。每个属性有一个数据类型和值域。例如:大学生有学号、姓名、年龄、性别等属性。学号、姓名、性别的数据类型是字符串,而年龄的数据类型是整数,其值域在13~30之间。实体标识符(Identifier):能惟一标识每个实体的属性或属性集称为实体标识符,或简称键。例如,学生的学号可以作为学生实体标识符机器世界信息世界的信息在机器中以数据形式存储,成为机器世界。在机器世界中,常用的术语有以下4个:字段(Field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位,所以又称为数据元素或初等项。字段的命名往往与属性名相同。例如:一个学生记录中有学号、姓名、年龄、性别等字段。记录(Record):字段的有序集合称为记录。一般用一个记录描述一个实体,所以记录又可以定义为能完整地描述一个实体的字段集。例如:一个学生记录由有序的字段集组成:(学号,姓名,年龄,性别)。基本表(BasicTable):描述一个实体集的所有记录的集合。有的数据库管理系统,一个基本表就对应一个数据文件(File)。关键码(Key):能惟一标识基本表中每个记录的字段或字段集。1.2.2数据联系的描述1对1、1对多、多对多1.3数据模型数据模型是表示实体类型和实体间联系的模型,是现实世界中的事物及其间联系的一种抽象表示,是一种形式化描述数据、数据间联系以及有关语义约束规则的方法。对象的抽象过程第一级抽象现实世界信息世界概念模型机器世界数据模型第二级抽象事物个体 实体 记录事物总体 实体集 文件特征 属性 字段事物间联系 实体模型 数据模型认识抽象转换第一级抽象:概念模型

数据模型是数据库系统的核心和基础。各种机器上实现的DBMS软件都是基于某种数据模型的。为了把现实世界中的具体事物抽象、组织为某一DBMS支持的数据模型,人们常常首先将现实世界抽象为信息世界,然后将信息世界转换为机器世界。也就是说,首先把现实世界中的客观对象抽象为某一种信息结构,这种信息结构并不依赖于具体的计算机系统,不是某一个DBMS支持的数据模型,而是概念级的模型;然后再把概念模型转换为计算机上某一DBMS支持的数据模型,不难看出,概念模型实际上是现实世界到机器世界的一个中间层次。概念模型1)信息世界中的基本概念(1)实体客观存在并相互区别的事物(2)实体集

1.性质相同的同类实体的集合

2.实体整体

3.例子所有的学生(3)属性1.实体所具有的某一特性2.用若干个属性来描述实体3.包含(1)属性的型:学生(姓名,系别……)(2)属性的值:学生(张三,计算机系……)(4)实体型1.用若干个属性型所组成的集合表征一个实体类型2.用实体名及其属性名集合来抽象和刻画同类实体3.例如:学生(学号、姓名、系别……)(5)码1.唯一标识实体的属性集2.实体键、关键字(段)3.把某个实体个体与其他实体个体区分来开(成绩表)(6)域1.属性的取值范围(7)联系1.一对一联系(1:1)2.一对多联系(1:n)3.多对多联系(m:n)2)概念模型的表示方法(实体联系方法)(1)实体-联系方法(E-R图)由来

E-R数据模型,即实体-联系模型,是P.P.S.Chen于1976年提出的一种语义数据模型.用E-R数据模型描述现实世界,不必考虑信息的存储机构,存取路径及存取效率如何在计算机中实现.所以该模型是面向现实世界,而不是面向机器的实现.(2)E-R数据模型的基本概念

设计E—R数据模型的目标是有效地和自然地模拟现实世界,而不是它在机器中如何实现,因此E—R数据模型只应包含那些对描述现实世界有普遍意义的抽象概念。下面介绍E—R数据模型的3个基本的抽象概念:实体、联系和属性。1实体(Entny)

实体是客观存在的且可以区别的事物。现实世界由各种各样的实体组成。实体可以是有生命的,也可以是无生命的;可以是具体的,也可以是抽象的概念。例如学生、教师、文化艺术、信息技术、梦、爱与恨……都是实体。所以,实体具有客观存在和可区分的墓本特征。在数据库设计中,常常关心具有相同性质的实体的集合。这种具有相同性质的一类实体的集合称为实体集(EntitySets),如全校学生的集合组成学生实体集。实体集中各个实体是借助实体标识符(称为关键字)加以区别的。例如,可以定义学校的“教师”为一实体集,而学校中每个教师都是该实体集的成员。2.联系(Relationship)

联系是实体集之间关系的抽象表示,即对现实世界中事物之间关系的描述。如教师实体集与学生实体集间的“讲授”联系,公司实体集与职工实体集之间的“聘任”联系等。如果参与联系的实体集的数目为n,则称这种联系数为n元联系。根据联系的元数不同,通常把联系分为如下几类:

(1)二元联系:只有两个实体集参与的联系称为二元联系,它是现实世界中大量存在的联系。E—R数据模型中为了给联系提供更多的语义,二元联系可进——步区分为1:1、l:n和m:n三种,并在E—R图中显式地表示出这些语义。(2)多元联系:参与联系的实体集个数>=3时,称为多元联系例:学生书店和图书购成“购书”联系是三元联系(3)自反联系:它描述了同一实体集内两部分实体之间的联系,是一种特殊的二元联系。也可区分为1:1,1:M和M:N例:人中的夫与妻职工中的领导与被领导3.属性(Attribute)

实体或联系所具有的特征称之为属性。实体由特征来表征和区分,通常一个实体可以由多个属性来描述,即实体可用属性集表示。例如学生实体可用学号、姓名、性别、年龄、系、籍贯等属性来描述。不仅实体可以用属性来描述,联系也可以用属性来描述使其语义更加丰富。例如学生实休集和课程实体集间存在m:n的“选课”联系,这种联系可以有“成绩”、“选修时间”等属性。有关属性的几点说明如下:表示方法1.实体型:矩形+实体名2.属性:椭圆形,无向边与实体连接3.联系:菱形+联系名,无向边与实体连接,边上标注联系类型在E=R图中,有时为了突出各实体集之间的联系,略去了实体集或联系的属性.这种省去了属性的E=R图称为E-R简图校长负责学校11系部聘任教师1n教师教学学生mnE-R图实例职工号姓名性别年龄职称书号书名简介价格课程名学分课程号专业系班编号成绩学号姓名性别年龄教师参考书讲授课程mn1选修mn领导1n学生组成班级n1实体集联系学员属性第二级抽象机器世界的数据模型数据模型

1)实体模型→数据模型

2)实体集→文件

3)实体→记录

4)实体型→记录型

5)属性→数据项、字段数据模型种类层次模型(HierarchicalModel)

网状模型(NetworkModel)

关系模型(RelationalModel)层次模型

代表系统IBM的IMS

数据结构树型结构(一对多关系)1:1或1:N

只有一个根结点:无双亲其他结点有且只有一个双亲基本概念兄弟同一个双亲的结点称为兄弟叶子无子女的结点,称为叶子学校行政机构的层次模型校教研室系科处研究所研究室层次模型示例

优点1.数据模型简单2.若实体间的关系固定,性能优于关系模型3.良好的完整性支持缺点1.描述现实世界的非层次性很笨拙2.插入和删除操作限制较多3.必须通过双亲才能找到子结点4.由于结构严密,层次命令趋于程序化网状模型(1)代表系统

CODASYL的DBTG(2)数据结构:网状结构1.允许多个结点无双亲2.允许结点有多个双亲3.允许结点间有多个联系(复合联系)

操纵与完整性约束1.允许插入无双亲的子结点2.允许只删除双亲结点3.更新操作较简单存储结构1.链接法优点1.能够直接描述现实世界2.存取效率较高缺点1.数据描述语言极其复杂2.数据独立性差关系模型(1)代表系统1.Oracle2.Sybase3.VFP4.Access5.xBASE(2)数据结构:关系模型(规范的二维表)(3)概念1.关系:整个二维表2.关系名:表格名称3.元组:行数据(记录)4.属性名:列名称(字段名)5.属性:列数据(字段)6.主码:唯一确定元组的属性组(关键字)7.域:属性的取值范围8.分量:元组中的一个属性值9.关系模式:关系名(属性……),如:学生(学号,姓名,性别,系别,年龄,籍贯)(4)操纵与完整性约束1.操纵:查询、更新(插入、修改、删除)2.完整性:实体完整性、参照完整性、用户定义完整性3.操作的对象与结果都是关系4.数据独立性高(隐蔽存取路径)(5)存储结构1.以文件形式存储表(6)优点1.有严格的数学概念作基础2.关系模型的概念单一3.存取路径对用户透明(7)缺点1.查询效率不高关系数据模型学号姓名性别年龄籍贯9901李勇男20江苏9902刘晨女19山东9903王明女20北京9999张立男18陕西学生学籍记录表关系名关系元组(行)属性(列)主码男女域分量关系模式:学生(学号、姓名、性别、年龄、籍贯)属性名数据库中的表/关系学号 姓名 专业 选修课程 任课教师9003105 张鹏 计算机应用 计算机系统结构 唐飞9003212 吴俊武 计算机软件 数据结构 王小栋9003223 廖凯 计算机软件 程序设计语言 陆非9003214 李娜 计算机软件 形式语言 蒋涛…

学生选课登记表表、关系:由关系模式和元组构成值域:列数据的取值范围如,十个汉字以内的文字串关系模式:由表名和属性名构成如,学生选课登记表(学号,姓名,专业,选修课程,任课教师)列、字段、属性、数据项:列有名称(属性名),有值/数据(数据项)如,属性名为“专业”,数据项为“计算机应用”,“计算机软件”行、元组、记录:由数据构成表名:学生选课登记表如,(9003212,吴俊武,计算机软件,数据结构,王小栋)(9003223,廖凯,计算机软件,程序设计语言,陆非)1.4数据库系统的体系结构注:我们可以从不同的角度考察数据库体系结构;从数据库管理系统的抽象层次看,数据库系统通常采用三级模式结构。从最终用户角度来看,数据库系统分为单用户结构、主从式结构、分布式结构和客户/服务器结构。1)模式(1)数据库中全体数据的逻辑结构和特征的描述(2)仅涉及到数据类型的描述,不涉及到具体的数值(实例)(3)模式是稳定的,实例是相对变动的(4)模式反映数据的结构和关系,实例反映数据库某时刻的状态数据库系统的三级模式结构数据库系统的三级模式结构_外模式(1)外模式(也叫子模式或用户模式)1.是数据库用户看见和使用的局部数据的逻辑结构和特性的描述2.是数据库用户的数据视图3.描述数据的局部逻辑结构4.是概念模式的逻辑子集5.有多个外模式(不同的用户有不同的外模式)6.用户通过外模式访问数据库7.与用户看待数据库方式有关的层数据库系统的三级模式结构_模式(2)概念模式(逻辑模式或简称模式)1.是数据库中全体数据的逻辑结构和特性的描述2.是所有用户的公共数据视图3.所有个别用户视图综合起来的用户共同视图4.描述数据的全局逻辑结构5.只有一个概念模式,它是数据系统三级模式结构的中间层数据库系统的三级模式结构_内模式(3)内模式(存储模式)1.与实际存储数据方式有关的层2.数据的物理结构和存储结构的描述3.数据在数据库内部的表示方式4.描述数据的物理存储结构5.存储方式、索引、压缩加密6.只有一个内模式2)数据库的二层映象功能与数据独立性

正是这两层映像保证了数据库系统中的数据具有较高的数据逻辑独立性与数据物理独立性(1)外模式/概念模式的映象1.定义外模式与概念模式的对应关系2.概念模式改变→改变映象→外模式不变→应用程序不变3.保证数据的逻辑独立性(2)概念模式/内模式的映象1.定义数据的全局逻辑结构与存储结构的对应关系2.存储结构改变→映象改变→概念模式不变→3.保证数据的物理独立性3)三级结构带来的优点(1)保证数据的独立性(2)简化了用户的使用(3)减少冗余,利于共享(4)有利于数据的安全操作4)数据库系统的体系结构(从最终用户角度来看)单用户主从式分布式客户机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论