01 数据库概论.ppt_第1页
01 数据库概论.ppt_第2页
01 数据库概论.ppt_第3页
01 数据库概论.ppt_第4页
01 数据库概论.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第1章 数据库概论,王传栋 南京邮电大学计算机学院,Chd.Wang,E-Mail:C,2,内容提纲,1)4个概念 Data、DB、DBMS和DBS 2)数据管理技术的发展阶段 人工管理、文件系统、数据库和高级数据库阶段 3)数据描述 设计阶段(概念设计、逻辑设计和物理设计)中的数据描述 数据联系的描述 4)数据抽象级别 数据模型的定义 概念模型、逻辑模型、内部模型(物理模型)、外部模型 层次模型、网状模型、关系模型和对象模型,Chd.Wang,E-Mail:C,3,内容提纲,4)数据库的体系结构 体系结构的5个要素 数据独立性 逻辑独立性 物理独立性 5)DBMS DBMS的工作模式和主要功

2、能 6)DBS DBS的组成与DBA职责 DBS的全局结构 DBS结构的分类,Chd.Wang,E-Mail:C,4,引言,计算机应用的3个领域 科学计算 过程控制 数据处理(70%) 示例 成绩管理、学籍管理、磁卡售饭 火车订票、汽车订票、飞机订票 银行系统、移动计费 实质:软件 + 数据库,Chd.Wang,E-Mail:C,5,数据与数据处理,数据 是对事物描述的符号记录,它 描述事物中人们所感兴趣的特 征,它能被计算机识别、存储 和处理 信息 数据处理与管理 “数据处理”的真正含 义应该是为了产生信 息而处理数据,Chd.Wang,E-Mail:C,6,数据库的由来和发展,数据管理技术

3、的4个发展阶段,Chd.Wang,E-Mail:C,7,数据库的由来和发展,人工管理阶段 时间:20世纪50年代中期以前 计算机 主要用于科学计算 外部存储器:磁带、卡片和纸带等,无磁盘 软件:机器语言、汇编语言 数据处理方式:批处理 特点: 数据不保存在计算机内 没有专用的软件对数据进行管理 只有程序(program)概念,没有文件(file)概念 数据面向程序,即一组数据对应一个程序,Chd.Wang,E-Mail:C,8,数据库的由来和发展,文件系统阶段 时间:20世纪50年代后期至60年代中期 计算机 不仅用于科学计算,还用于信息管理 外部存储器 已有磁盘、磁鼓等直接存取存储设备 软件

4、 高级语言和操作系统(有:专门管理外存的文件系统) 数据处理方式 有批处理,也有联机实时处理,Chd.Wang,E-Mail:C,9,数据库的由来和发展,文件系统阶段 特点: 数据以“文件”形式长期保存在外存磁盘 数据的逻辑结构与物理结构有了区别,但比较简单 文件组织多样化 索引文件、链接文件和直接存取文件等 应用程序和数据分离,实现数据共享 对数据的操作以记录为单位 缺陷:数据量剧增 数据冗余(redundancy) 数据不一致(inconsistency) 数据联系弱(poor data relationship),Chd.Wang,E-Mail:C,10,数据库的由来和发展,数据库阶段

5、时间:20世纪60年代末 计算机 软硬件迅速发展 标志: 1968年 IBM公司推出层次模型的IMS系统 1969年 CODASYL发布DBTG报告,提出网状模型 1970年 E.F.Codd提出关系模型,奠定关系DB理论基础,Chd.Wang,E-Mail:C,11,数据库的由来和发展,数据库阶段 特点 采用数据模型表示 复杂的数据结构 较高的数据独立性 提供方便的用户接口 提供数据控制功能 数据恢复:DB从错误状态恢复到正确状态 并发控制:控制和协调并发操作,防止出现错误数据 完整性:数据控制在有效的范围内 安全性:用户按指定方式操作指定数据,防止泄密和破坏 系统灵活性,Chd.Wang,

6、E-Mail:C,12,数据库的由来和发展,数据库阶段 数据库(Database,DB) 长期存储在计算机内、有组织、统一管理的相关数据集合 为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点 数据库管理系统(DBMS) 是位于用户与OS之间的一层数据管理软件 为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制 基于某种数据模型的 层次型、网状型、关系型和面向对象型等,Chd.Wang,E-Mail:C,13,数据库的由来和发展,数据库阶段 数据库系统(DBS) 是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源

7、组成的系统 采用数据库技术的计算机系统 数据库技术(DBT): 是研究数据库的结构、存储、设计、管理和使用的一门软件学科,Chd.Wang,E-Mail:C,14,数据库的由来和发展,高级数据库阶段 标志 20世纪80年代的分布式数据库(DDBS) 20世纪90年代对象数据库(ODBS)、中间件(ODBC) 21世纪的Web数据库、XML数据库 现代信息集成技术(DW、OLAP、DM) 计算机 网络的迅速发展,Chd.Wang,E-Mail:C,15,数据库的由来和发展,高级数据库阶段 分布式数据库技术 物理分布、逻辑整体 局部应用、全局应用 通讯网(计算机既负责数据处理、又负责通讯) 对象数

8、据库(ODBS) 对象数据模型 封装性、继承性、可重用性 中间件(ODBC、JDBC) XML数据库 现代信息集成技术(DW、OLAP、DM),Chd.Wang,E-Mail:C,16,数据描述,数据设计的3个阶段:概念设计、逻辑设计、物理设计,Chd.Wang,E-Mail:C,17,数据描述,概念设计中的数据描述 实体(entity) 客观存在,可以相互区别的事物称为实体 实体集(entity set) 性质相同的同类实体的集合,称为实体集 属性(attribute) 实体的特性,每一个特性称为一个属性 属性有取值域,类型可以是整数型、实数型、字符串型等 实体标识符(identifier)

9、 也称为关键码(key),或简称为键 能惟一标识实体的属性或属性集,Chd.Wang,E-Mail:C,18,数据描述,逻辑设计中的数据描述 字段(field) 也称数据项、数据元素或初等项 标记实体属性的命名单位 可以命名的最小信息单位 记录(record) 字段的有序集合称为记录 文件(file) 同一类记录的集合称为文件 关键码(key),简称为键 能惟一标识文件中每个记录的字段或字段集,Chd.Wang,E-Mail:C,19,数据描述,物理设计中的数据描述 位(bit,比特) 一个二进制位,只能取0或1两个状态 字节(byte) 8个比特称为一个字节,可以存放一个字符所对应的ASCI

10、I码 字(word) 若干个字节组成一个字,字所含二进制位数称为字长 块(block),又称为物理块或物理记录 内存和外存交换信息的最小单位,大小常为210214字节 桶(bucket) 外存的逻辑单位,桶内的物理块空间不一定连续 卷(volume) 一个输入输出设备所能装载的全部有用信息,Chd.Wang,E-Mail:C,20,数据描述,数据联系的描述 联系(relationship) 是实体之间的相互关系 与一个联系有关的实体集个数,称为联系的元数 联系的分类 一元联系 二元联系 多元联系,一般只讨论三元联系,Chd.Wang,E-Mail:C,21,数据描述,数据联系的描述 二元联系的

11、三种类型: 一对一联系 记为“1:1” 一对多联系 记为“1:N” 多对多联系 记为“M:N”,Chd.Wang,E-Mail:C,22,数据描述,数据联系的描述 示例,Chd.Wang,E-Mail:C,23,数据抽象的级别,数据抽象的过程 模型(model) 对现实世界的抽象 数据模型 描述数据库的结构和语义,对现实世界的数据进行抽象 根据数据抽象的级别定义了四种模型 概念模型:ER模型 逻辑模型:全局逻辑模型 分为层次模型、网状模型、关系模型、对象模型 外部模型:局部逻辑模型 内部模型:存储模型,Chd.Wang,E-Mail:C,24,数据抽象的级别,数据抽象的过程 数据库设计过程 现

12、实世界的信 息到数据库存 储的数据以及 用户使用的数 据是一个逐步 抽象过程,Chd.Wang,E-Mail:C,25,数据抽象的级别,概念模型 抽象级别最高 特点 1)表达数据的整体逻辑结构,是系统用户对整个应用项目涉及数据的全面描述 2)概念模型是从用户需求的观点出发,对数据建模 3)概念模型独立于硬件和软件 硬件独立意味着概念模型不依赖于硬件设备 软件独立意味着概念模型不依赖于实现时的DBMS软件 4)概念模型是一种信息媒介 是数据库设计人员与用户之间进行交流的工具,Chd.Wang,E-Mail:C,26,数据抽象的级别,概念模型 最好的表示方法:ER图,因此概念模型也称ER模型 ER

13、模型:Entity Relationship Model,1976年P.P.Chen提出 ER图成分 矩形框:表示实体集,也称实体类型 菱形框:表示联系集 椭圆形框:表示属性 下划线:表示实体码 连接线:连接实体集与属性,或联系集与属性 联系类型:1:1,1:N,M:N,Chd.Wang,E-Mail:C,27,数据抽象的级别,概念模型 示例:实现一个教学管理系统,要求记录:1)学生的学号,姓名,年龄,性别,籍贯等信息;教师的教师号,教师姓名,职称,性别等信息;课程的课程号,课程名,学分,学时数,先修课,授课教师;学生选修课程的成绩信息 规定: 1位教师可讲授多门课程,1门课程只能有1位任课教

14、师 1位学生可以选修多门课程,1门课程可以被多名同学选修 1门课程只有1门先修课,1门课可以是多门课的先修课 报表(数据的外在表现) 统计每位学生的选课门数、总分、平均分、最高分、最低分 统计每位教师的所授课每门课程的选修人数、平均分、最高分、最低分,Chd.Wang,E-Mail:C,28,数据抽象的级别,概念模型 ER模型仅说明了客观世界中实体间的语义关 系,不能说明详细的数据结构 问: 学生的成绩? 课程的任课教师?先修课程?,Chd.Wang,E-Mail:C,29,数据抽象的级别,逻辑模型 逻辑模型与DBMS相关 DBMS确定后,将概念模型转换成适合DBMS特点的逻辑模型 特点: 1

15、)表达DB的整体逻辑结构,是设计人员对整个应用项目数据库的全面描述 2)从数据库实现的观点出发,对数据建模 3)独立于硬件,但依赖于DBMS 4)是数据库设计人员与应用程序员之间进行交流的工具,Chd.Wang,E-Mail:C,30,数据抽象的级别,逻辑模型 关系模型 由概念模型转化得到,Chd.Wang,E-Mail:C,31,数据抽象的级别,逻辑模型 关系模型 详细内容参见第2章 主要特征 由若干个关系模式组成 用二维表格(关系)表达实体集和联系 数据导航:通过“键”实现 使用DDL语言(create table, alter table, drop table)维护表结构 使用DML语

16、言(insert, update, delete, select)维护和查询表中的数据,Chd.Wang,E-Mail:C,32,数据抽象的级别,逻辑模型 关系模型,Chd.Wang,E-Mail:C,33,数据抽象的级别,逻辑模型 层次模型(hierarchical model) 用树型(层次)结构表 示实体类型及实体间联系 只能表达1:N联系,M:N联系通过辅 助手段实现 层次顺序严格、复杂,数据查询和更 新操作复杂、编程复杂 数据导航:通过“指针”实现,Chd.Wang,E-Mail:C,34,数据抽象的级别,逻辑模型 网状模型(network model) 用有向图结构表示实体类型及实

17、体间联系 数据结构复杂和编程复杂 M:N联系容易实现(一个M:N联系可拆成两个1:N联系) 查询效率较高 数据导 航:通 过指针 实现,Chd.Wang,E-Mail:C,35,数据抽象的级别,逻辑模型 对象模型 将OO思想引入数据库 未普及 对象(object) 是现实世界中实体的模型化 与实体概念相仿,但远比实体复杂 将属性集和方法集相同的所有对象组合在一起,构成了一个类(class),Chd.Wang,E-Mail:C,36,数据抽象的级别,4种逻辑模型的对比,Chd.Wang,E-Mail:C,37,数据抽象的级别,外部模型 设计经过概念模型到逻辑 模型,已形成数据库的全 局逻辑结构

18、但,用户应用中有特定的 业务需求,这是数据库的局部逻辑结构 示例 统计每位学生的选课门数、总分、平均分、最高分、最低分 统计每位教师的所授课每门课程的选修人数、平均分、最高分、最低分,Chd.Wang,E-Mail:C,38,数据抽象的级别,外部模型 示例 统计 每位 学生 的选 课门数、总分、平均分、最高分、最低分 外部模型由一系列视图组成 视图(虚表) 使用DDL语言(create view)创建 是数据的局部逻辑结构,Chd.Wang,E-Mail:C,39,数据抽象的级别,外部模型 特点: 1)是逻辑模型的一个逻辑子集 2)独立于硬件,依赖于DBMS 3)反映了用户使用数据库的观点 优

19、点: 1)简化了用户的观点。 2)有助于数据库的安全性保护 3)对概念模型的支持,Chd.Wang,E-Mail:C,40,数据抽象的级别,内部模型 又称为物理模型,是数据库最低层的抽象 描述数据在磁盘或磁带上的存储方式(文件结构)、存取设备(外存的空间分配)和存取方法(主索引和辅助索引) 是与硬件和软件紧密相连的 模型实现 在层次、网状模型设计时,要精心设计内部模型,以提高系统的效率 在关系模设计中,不必考虑内部级的设计细节,由系统自动实现 索引的创建由DDL语言(create index)实现,Chd.Wang,E-Mail:C,41,数据抽象的级别,数据库的体系结构 三级模式 两级映像,

20、Chd.Wang,E-Mail:C,42,数据抽象的级别,数据库的体系结构 三级模式 逻辑模式:DB的整体抽象表示 DB全部数据的整体逻辑结构描述 由逻辑记录类型组成,包括数据联系、完整性、安全性等 外模式:DB的局部抽象表示 用户与数据库系统的接口,由外部记录组成 用户使用的局部数据的逻辑结构和特征描述 内模式:DB的实际存储的表示 DB物理存储描述,定义所有内部记录类型、索引和文件的组织方式,以及数据控制方面的细节,Chd.Wang,E-Mail:C,43,数据抽象的级别,数据库的体系结构 两级映像 外模式逻辑模式映像 存在于外模式和逻辑模式之间 用于定义外模式和逻辑模式之间的对应性 在外模式中描述的 逻辑模式内模式映像 存在于逻辑模式和内模式之间 用于定义逻辑模式和内模式之间的对应性 在内模式中描述的,Chd.Wang,E-Mail:C,44,数据抽象的级别,数据库的体系结构 数据独立性 应用程序和数据库的数据结构之间相互独立,不受影响 修改数据结构时,不必修改外部的应用程序 分类 1)物理数据独立性 内模式的修改不影响逻辑模式、外模式和应用程序 由逻辑模式内模式映像实现 2)逻辑数据独立性 逻辑模式的修改不影响外模式和应用程序 由外模式逻辑模式映像实现,Chd.Wang,E-Mail:C,45,数据抽象的级别,数据库设计过程总结,Chd.Wang,E-Mail:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论