第六章数据库与数据仓库-PZZ课件_第1页
第六章数据库与数据仓库-PZZ课件_第2页
第六章数据库与数据仓库-PZZ课件_第3页
第六章数据库与数据仓库-PZZ课件_第4页
第六章数据库与数据仓库-PZZ课件_第5页
已阅读5页,还剩153页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章数据库与数据仓库

第一节数据库技术本章内容:第二节数据仓库第六章数据库与数据仓库第一节数据库技术本章内容:第二数据的层次字符:信息的最基本架构,用一个字节来表示;字段:以某种方法描述的业务对象或活动的字符组合;记录:相关字段的一组集合;文件:相关记录的集合。一、数据管理的概念数据的层次一、数据管理的概念字符(字节)数据库字段记录文件005-10-6321,李杰,02-01-18fiske1000100职员文件,部门文件,工资文件…005-10-6321,李杰,02-01-18549-77-1001,李英,02-02-01数据的层次字符(字节)数据库字段记录文件005-10-6321,李杰,实体:是人、地点或对象的通用类别,数据以这种类别进行收集、存储和维护。属性:实体的特性。数据项:属性的特定值键:记录中用于表示记录的一个或多个字段。主键:唯一标识记录的一个或多个字段;次键:不能唯一标识记录的字段。2.数据实体、属性和键实体:是人、地点或对象的通用类别,数据以这种类别进行收集、存传统方法:为每个应用程序分别创建和存储数据文件的数据管理。数据冗余:分散在多个文件中数据的重复。数据完整性:任一文件中数据的正确程度。程序-数据依赖性:为某个应用所开发及组织的程序和数据与为其他应用开发和组织的程序和数据不兼容。3.数据管理的传统方法传统方法:为每个应用程序分别创建和存储数据文件的数据管理。数工资工资程序报表开票开票程序报表库存控制库存控制程序报表数据文件应用程序用户传统管理方法示意工资工资程序报表开票开票程序报表库存库存控制报表数据文件应用数据库方法:一种数据管理方法,其中相关数据集合可由多个应用程序共享。传统方法:基于文件;数据库方法:基于数据。数据库方法的优点: 1.有效利用存储空间;增强数据完整性; 2.增强数据的灵活性; 3.增强数据共享能力。4.数据管理的数据库方法数据库方法:一种数据管理方法,其中相关数据集合可由多个应用程数据模型:表示实体及实体间关系的图形。企业数据建模:在整个组织层次上进行数据建模的方法。实体关系图:作用基本的图形符号来表示组织及数据之间关系的图形。二、在数据库中组织数据1.数据建模和实体关系图数据模型:表示实体及实体间关系的图形。二、在数据库中组织数据10.1文件组织数据组织的层次文件分类数据的物理储存与传送文件组织方式10.2数据库技术传统的文件处理与数据库处理数据库管理系统(DBMS)数据库的类型数据库模型与数据库组织结构数据库设计数据资源管理技术10.1文件组织数据资源管理技术第一节数据库技术人工管理

文件系统

数据库系统

一、数据管理技术及其发展数据管理技术发展阶段:(一)人工管理阶段该阶段处在20世纪50年代中期以前,这时期的数据管理呈以下特点:1、数据不保存。2、数据由应用程序管理。3、数据不共享。4、数据不具独立性。

第一节数据库技术人工管理文件系统数据库系统一、数据管一、数据管理技术及其发展(二)文件系统阶段20世纪50年代后期到60年代中期,数据结构和数据管理技术迅速发展起来。硬件方面有了磁盘、磁鼓等直接存取的外部存储设备;而软件中出现了操作系统和高级语言。操作系统中有了专门进行数据管理的软件,称为文件系统。

这一时期的数据管理的特点是:1、数据可以长期保存。2、数据由文件系统管理。3、数据具有一定的独立性。

文件系统也存在以下缺点:

1、编程不方便。

2、数据冗余量大。

3、数据独立性差。

4、不支持并发访问。

5、数据缺少统一管理。

一、数据管理技术及其发展(二)文件系统阶段这一时期的传统文件处理系统应用程序1数据文件1应用程序2应用程序3数据文件2数据文件3存在问题:1、数据冗余与数据不一致性2、数据联系弱3、缺少数据字典,缺乏灵活性用户用户用户传统文件处理系统应用程序1数据文件1应用程序2应用程序3数据一、数据管理技术及其发展(三)数据库系统阶段

20世纪60年代以来,出现了统一管理数据的专门软件系统—数据库管理系统(DBMS,DataBaseManagementSystem)。

数据库阶段的数据管理特点是:

1、数据结构化。数据结构化是数据库与文件系统的根本区别。

2、较高的数据独立性。用户能以简单的逻辑结构操作数据而无需考虑数据的物理结构。

3、数据共享。数据不再仅仅服务于某个程序或用户,而成为若干程序或用户的共享资源,由数据库管理系统统一管理与控制。

4、方便的用户接口。用户可以使用查询语句或终端命令操作数据库,也可以用程序方式操作数据库。

5、较强的数据控制能力。并发控制能力;恢复能力;完整性能力;安全性能力一、数据管理技术及其发展(三)数据库系统阶段数据库处理系统

特点:应用程序1应用程序2应用程序3DBMS数据库中央数据库用户用户用户1、完善的数据字典和数据模型2、数据独立性3、方便的接口4、完整的数据控制功能5、提高了系统的灵活性数据库处理系统特点:应用程序1应用程序2应用程序3DBMS银行数据库处理系统客户交易处理数据库管理系统核对帐户程序存款帐目程序分期贷款程序客户数据库..银行文件处理系统客户财务报表分期贷款程序帐户核对处理存款处理分期贷款处理贷款分析报告客户票据存款文件修改文件修改核对帐户核对程序分期贷款文件修改存款程序客户交易银行数据库处理系统客户交易处理数据库管理一、数据管理技术及其发展(四)数据库发展新技术

数据库技术与具他领域的技术相结合,出现了数据库的许多新的分支,如:与网络技术相结合出现了网络数据库;与分布处理技术相结合出现了分布式数据库;与面向对象技术相结合出现了面向对象数据库;与人工智能技术相结合出现了知识库;与并行处理技术相结合出现了并行数据库;与多媒体技术相结合出现了多媒体数据库。

1、分布式数据库技术分布式数据库系统(DistributedDataBaseSystem,DDBS)是在集中式数据库基础上发展起来的,分布式数据库系统是地理上分布在计算机网络的不同节点,逻辑上属于同一系统的数据库系统,分布式数据库系统不仅能支持局部应用,存取本地节点或另一个节点的数据,而且能支持全局应用,同时存取两个或两个以上节点的数据。

一、数据管理技术及其发展(四)数据库发展新技术一、数据管理技术及其发展2、面向对象数据库技术

它的基本设计思想是:一方面把面向对象语言向数据库方向扩展,使应用程序能够存取并处理对象;另一方面扩展数据库系统,使其具有面向对象的特征,提供一种综合的语义数据建模概念集,以便对现实世界中复杂应用的实体和联系建模。3、多媒体数据库

多媒体数据具有数据量大、结构复杂、数据传输的连续性等特点。因而,多媒体数据库需要有特殊的数据结构、存储技术、查询和处理方式。

4、数据仓库数据仓库,就是一种长期数据存储,这些数据来自于多个异种数据源。通过数据仓库提供的联机分析处理(OLAP)工具,实现各种粒度的多维数据分析,以便向管理决策提供支持。

一、数据管理技术及其发展2、面向对象数据库技术二、数据库系统的组成

用户用户用户数据库管理系统数据库管理员

应用程序数据库图6-1数据库系统

二、数据库系统的组成用户用户用户数据库管数据库管理员应用二、数据库系统的组成数据库数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并为各种用户共享。数据库管理系统数据库管理系统(DBMS)是介于用户和操作系统之间的一层数据管理软件,属于系统软件。数据库管理系统为数据库的建立、运行和维护提供了统一的管理和控制,是数据库系统的核心。二、数据库系统的组成数据库二、数据库系统的组成应用程序

一个数据库应用可分为客户端应用程序和服务端应用程序两类。服务端应用程序运行在数据库服务器上,是真正存储和操纵数据的,它接受用户程序的请求,对数据进行不同的操作。客户端应用程序运行在客户端计算机上,实现用户的业务逻辑,通过客户端应用程序界面,用户可以发出不同的请求给服务器端,由服务端程序完成各种各样的操作。一般情况下,客户端和服务器端的程序通过标准SQL语言通信。客户端应用程序根据使用者的不同,可以分成两类:一类是供数据库管理员使用,提供强大的图形界面和命令以便管理员最大程度的维护数据库的运转;另一类为程序开发人员使用,提供一整套完整的用户接口界面让开发人员通过程序实现操纵数据的目的,这些程序最终将提交给用户使用,即通常所讲的应用程序。

二、数据库系统的组成应用程序三、数据库系统的体系结构

为了有效地组织和管理数据,提高数据库的逻辑独立性和物理独立性,将数据库体系结构分为三级:面向用户或应用程序员的用户级(外部级)、面向建立和维护数据库人员的概念级和面向系统程序员的物理级(内部级)。用户级对应外模式,概念级对应模式,物理级对应内模式。数据库系统的体系结构如下页图6-2所示。

三、数据库系统的体系结构为了有效地组织和管理数图6-2数据库系统的体系结构

图6-2数据库系统的体系结构模式模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的全局视图。一个数据库只有一个模式。

外模式外模式又称子模式或用户模式,对应于用户级。它是数据库用户(包括程序员和终端用户)所看到和使用的局部数据的逻辑结构和特征的描述,是数据库的用户视图。外模式是从模式中导出的一个子集,一个数据库可以有多个外模式。

内模式

内模式又称存储模式,对应于物理级。它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库。一个数据库只有一个内模式。

模式二级映射

为了能够在内部实现这三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映射:外模式—模式映射,模式—内模式映射。

①外模式—模式映射

外模式—模式映射定义了该外模式与模式之间的对应关系。这些映射定义通常包含在各自外模式的描述中。当模式改变时(例如增加新的属性、改变属性的数据类型时),只要改变其映射,就可以使外模式保持不变,对应的应用程序也可保持不变(因为应用程序是依据外模式编写的),从而保证了数据与应用程序的逻辑独立性。②模式—内模式映射模式—内模式映射定义了数据库全局逻辑结构与存储结构之间的对应关系。该映射定义通常包含在模式描述中。当数据的存储结构发生变化时,只需改变模式—内模式映射,就能保持模式不变,因此应用程序也可以保持不变,从而保证了数据与应用程序的物理独立性。

二级映射四、概念模型

概念模型用于对信息世界建模,是现实世界到信息世界的第一层抽象。

(一)基本概念1、实体现实世界中的客观事物在信息世界中称为实体(Entity)。

属性:实体所具有的某一特性。

实体标识符:能够唯一标识一个实体的属性集,也称为关键码,简称码或键。域:属性的取值范围称为该属性的域。

实体型:用实体名及其属性名集合来抽象和刻画同类实体,即实体的结构描述,称为实体型。实体集:同型实体的集合称为实体集。

四、概念模型概念模型用于对信息世界建模,是现实世界四、概念模型2、实体联系:实体之间的相互关系,包括实体内部的联系和实体之间的联系。常见的实体联系可以有三种,如下图6-3所示:实体型A联系名实体型B11(a)1:1联系实体型A联系名实体型B1N(b)1:N联系实体型A联系名实体型BMN(c)M:N联系图6-3两个实体型之间的三类联系

四、概念模型2、实体联系:实体之间的相互关系,包括实(二)概念模型的表示方法

实体-联系方法(Entity-RelationshipApproach)用E-R图来描述现实世界的概念模型

实体联系模型反映的是现实世界中的事物及其相互联系。1、实体(Entity)描述客观事物的概念2、属性"属性"指实体具有的某种特性。实体名称表示方法:表示方法:属性(二)概念模型的表示方法

实体-联系方法(Enti实体名称属性1属性2属性n3、联系现实世界的事物总是存在着这样或那样的联系联系表示方法:实体1实体2联系实体名称属性1属性2属性n3、联系现实世界的联系的类型设A,B为两个包含若干个体的总体,1、一对一联系如果对于A中的一个实体,B中至多有一个实体与其发生联系,反之,B中的每一实体至多对应A中一个实体,则称A与B是一对一联系。系系主任任职11病区科室主任任职11联系的类型设A,B为两个包含若干个体的总体,1、一对一联系系2、一对多联系如果对于A中的每一实体,实体B中有一个以上实体与之发生联系,反之,B中的每一实体至多只能对应于A中的一个实体,则称A与B是一对多联系。AB联系1n教研室教师联系1n2、一对多联系AB联系1n教研室教师联系1n3、多对多联系如果A中至少有一实体对应于B中一个以上实体,反之,B中也至少有一个实体对应于A中一个以上实体,则称A与B为多对多联系。AB联系mn教师学生教学mn3、多对多联系AB联系mn教师学生教学mnE—R图建模实体及其联系概念模型E—R图E—R图建模实体及其联系概念模型E—R图E—R图绘制图书作者写作出版社类别页数ISBN书名姓名出生地身份证号定稿时间价格1、利用分类、聚集、概括等方法抽象出实体,并一一命名。2、描述实体之间的联系3、实体属性和联系属性的说明E—R图绘制图书作者写作出版社类别页数ISBN书名姓名出生地举例:某工厂物资入库管理的概念模型。物资管理涉及的实体有:供方单位:属性有单位号、单位名、地址、联系人、邮政编码物资:属性有物资代码、名称、规格、备注库存:属性有入库号、日期、货位、数量合同:属性有合同号、数量、金额、备注结算:属性有结算编号、用途、金额、经手人这些实体间的联系包括:入库:一种物资可以分多次入库,所以是1:N联系验收:一份合同订购的物资可以分多次验收,所以是1:N联系购进:一次购进的物资可以经多次结算,而一次结算可以承办多次购进的物资,所以是多对多的联系。其属性为:数量、金额。付款:也是多对多的联系。其属性是:数量、金额。订货:这是一个数量超过两个的不同类型实体之间的联系。在订货业务中,一种物资可由多家供应,产生多笔合同。反之,一个供应单位可以供应多种物资,产生多笔合同,所以,在图中用M:N:L的结构来表示。其属性为:数量、单价。举例:某工厂物资入库管理的概念模型。该工厂的物资入库管理E-R图如下图6-4,6-5所示:图6-4实体和联系的E-R图

该工厂的物资入库管理E-R图如下图6-4,6-5所示:图6库存物资供方单位结算订货入座购进付款验收合同MN1NNNMNM1L图6-5工厂物资入库管理E-R图

库存物资供方单位结算订货入座购进付款验收合同MN1NNNMN层次模型:数据按“自顶向下”的结构进行组织。项目1部门C部门B部门A员工1员工4员工3员工2员工6员工5数据模型分析层次模型:数据按“自顶向下”的结构进行组织。项目1部门C部门网状模型是层次模型的扩展,其中一个属记录可以有多个首记录。项目1部门C部门B部门A项目2网状模型网状模型是层次模型的扩展,其中一个属记录可以有多个首记录。项项目号说明部门号155薪水册257498原材料632226销售管理598部门号部门名经理社会保障号257财务部421-55-99993632生产部765-00-3192598市场部098-40-1370社会保障号名字性别聘用日期部门号421-55-99993李杰男01-02-14257765-00-3192张丽女01-08-10650098-40-1370王中豪男02-11-11598数据表1:项目表数据表2:部门表数据表3:经理表关系模型

关系模型是最流行的数据库模型;关系模型是用标准表格形式描述数据;所有数据元素存在于“关系”的二维表中。关系数据:以表格形式——行和列来组织数据的一种模型。项目号说明部门号155薪水册257498原材料632226销五、数据模型

数据模型是直接面向数据库的逻辑结构,是对现实世界的第二层抽象。数据模型是数据库系统的核心和基础。数据模型由三个基本的要素组成:数据的结构、数据的操作、数据的约束条件。

1、数据结构:数据结构是所研究的对象类型的集合。这些对象是数据库的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象;另一类是与数据之间联系有关的对象。

2、数据操作:数据操作是指对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则。

3、数据的约束条件数据的约束条件是一组完整性规则的集合。

五、数据模型数据模型是直接面向数据库的逻辑结构,是五、数据模型(二)关系模型

关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据的组织方式。1、关系模型的数据结构

在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。

五、数据模型(二)关系模型关系模型(RelationalModel)用二维表表示实体与实体之间联系的模型。仓库号城市面积WH1北京370WH2上海500WH3广州200仓库器件号器件名称P1显示卡P2声卡P3解压卡P4散热风扇仓库号器件号数量WH1P2675WH1P3250WH1P4340WH2P1280WH2P2200WH2P4270WH3P2500WH3P1330器件库存器件仓库库存关系模型(RelationalModel)用二维表表示实体关系:一个关系对应通常说的一张表。元组:表中的一行即为一个元组。属性:表中的一列即为一个属性。主键(码):表中的某个属性组,它可以唯一确定一个元组。域:属性的取值范围。分量:元组中的一个属性值。关系模式:对关系的描述成为关系模式,一般表示为关系模式:关系名(属性1,属性2,…,属性n)例如上面的关系可描述为:教职工(职工号,姓名,出生日期,性别,学院,电话)关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条件,这些规范条件中最基本的一条就是:关系的每一个分量必须是一个不可再分的数据项。关系:一个关系对应通常说的一张表。(三)、E—R图向关系数据模型的转换回顾实体实体集合及实体联系相关属性集合加工、转换数文件据记录库相关数据项集合数据世界DBMS的数据模型信息世界E-R模型(三)、E—R图向关系数据模型的转换回顾实体实体关系模式对关系的描述,用关系名(属性1,属性2,…属性n)来表示。eg.库存(仓库号,器件号,数量)仓库(仓库号,城市,面积)转换过程示意图E-R图关系模型关系模式eg.转换过程示意图E-R图关系模型2、联系a.联系具有属性:联系名作为关系名,发生联系的实体的主关键字作为联系的主关键字。b.联系不具有属性:不带有属性的联系可以去掉。1、实体相应转换为一个关系,实体名称作为关系名称,该关系包括对应实体的全部属性,并确定出该关系的关键字。转换方法和原则2、联系1、实体转换方法和原则转换举例一厂长号*姓名年龄厂长厂号*厂名地点工厂管理11厂长(厂长号,姓名,年龄)工厂(厂号,厂名,地点)管理(厂号,厂长号)转换举例一厂长号*姓名年龄厂长厂号*厂名地点工厂管理11厂长转换举例二仓库号*地点面积仓库货号*品名价格产品存放1n仓库(仓库号,地点,面积)产品(货号,品名,价格)数量存放(仓库号,货号)转换举例二仓库号*地点面积仓库货号*品名价格产品存放1n仓库转换举例三学号*姓名年龄学生课程号*课程名学时数课程学习mn学生(学号,姓名,年龄)课程(课程号,课程名,学时数)成绩学习(学号,课程号,成绩)转换举例三学号*姓名年龄学生课程号*课程名学时数课程学习mn五、数据模型

2、关系模型的操纵与完整性约束关系模型给出了关系操作的能力。关系数据模型的操作主要包括选择、投影、连接、除、并、交、差等查询操作和插入、删除、修改操作两大部分。为了维护数据库中数据与现实世界的一致性,这些操作必须满足关系的完整性约束条件。关系的完整性约束条件包括三大类:实体完整性、参照完整性和用户定义的完整性。

五、数据模型2、关系模型的操纵与完整性约束五、数据模型

关系模型的逻辑结构是一组关系模式的集合。E-R图则是由实体、实体的属性和实体之间的联系三个要素组成的。所以将E-R图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转换为关系模式,这种转换一般遵循如下原则:

1.一个实体转换为一个关系模式,实体的属性就是关系的属性,实体的码就是关系的码。2.一个联系转换为一个关系模式,与该联系相连的各实体的码以及联系的属性均转换为该关系的属性。3.具有相同码的关系模式可合并。

五、数据模型关系模型的逻辑结构是一组关系模式[例6-2]将例6-1物资入库管理的E-R图转换为关系模型,其中,有下划线的属性表示是主码:(1)把每一个实体转换为一个关系模式首先分析各实体的属性,从中确定其主码,然后分别用关系模式表示。供方单位(单位号、单位名、地址、联系人、邮政编码)物资(代码、名称、规格、备注)库存(入库号、日期、货位、数量)合同(合同号、数量、金额、备注)结算(编号、用途、金额、经手人)(2)把每一个联系转换为关系模式:购进(入库号、编号、数量、金额)付款(编号、合同号、数量、金额)订货(代码、单位号、合同号、数量、单价)入库(代码、入库号)验收(合同号、入库号)[例6-2]将例6-1物资入库管理的E-R图转换为关系模型(3)关系模式合并,其最终结果为:供方单位(单位号、单位名、地址、联系人、邮政编码)物资(代码、名称、规格、备注)库存(入库号、日期、货位、数量,代码,合同号)合同(合同号、数量、金额、备注)结算(编号、用途、金额、经手人) 购进(入库号、编号、数量、金额)付款(编号、合同号、数量、金额)订货(代码、单位号、合同号、数量、单价)(3)关系模式合并,其最终结果为:数据分析和规范化问题数据分析:一种对数据进行评价以揭示数据库内容中存在问题的过程。规范数据的步骤:消除所有重复组;消除多次出现的数据;消除表中不依赖于主键的属性。数据分析和规范化问题数据分析:一种对数据进行评价以揭示数据库1NF2NF3NF六、关系的规范化

数据库的设计应遵循规范化理论,规范化程度过低的关系,可能会存在插入、删除异常、修改复杂、数据冗余等问题,解决的方法就是对关系模式进行分解或合并(规范化),转换成高级范式。规范化一共有六个级别:1NF,2NF,3NF.BCNF,4NF,5NF。但也应当注意到,并不是规范化程度越高的关系就越好。当一个应用的查询中经常涉及到两个或多个关系模式的属性时,系统就必须经常地进行联接运算,而联接运算的代价是相当高的.所以,在具体应用时,到底规范化进行到什么程度需要权衡利弊。一般而言,做到第三范式(3NF)就足够了。

BCNF4NF5NF1NF2NF3NF六、关系的规范化数据库的设计应遵第一规范型:如果一个关系模式中的属性都是单纯的(即不可再分为更小的属性),则称该模式是属于第一规范型(FirstNormalForm,即1NF)。姓名地址省市街道邮编甲江苏南京卫岗210095姓名省市街道邮编甲江苏南京卫岗210095规范化第一规范型:如果一个关系模式中的属性都是单纯的姓名地址省市街第二规范型:如果一个关系模式属于1NF,并且所有的非关键字都完全地依赖于关键字(即不存在部分依赖),则称该关系模式属于第二规范型,即2NF。零件号仓库号零件数量11100211503120042150仓库号仓库地址1北区1号2南区1号第二规范型:如果一个关系模式属于1NF,并且所有零件号仓库号第三规范型:如果一个关系模式属于2NF,并且不存在非关键字传递地依赖于关键字,则称该关系模式属于第三规范型(3NF)。职工号职工职务工资1001张三工程师2001002李四技术员1201003杨华工程师2001005王五高工350职工号职工职务1001张三工程师1002李四技术员1003杨华工程师1005王五高工职务工资技术员120工程师200高工350第三规范型:如果一个关系模式属于2NF,并且不存职工号职工职规范化程度越高数据冗余更新异常连接运算时间查询时间效率规范化程度越高数据冗余更新异常连接运算时间查询时间效率七、数据库保护

对数据的保护主要通过四个方面实现:

一是数据库的安全性控制,保证数据库中的数据不被破坏;二是数据库的完整性控制,保证数据库中的数据与现实世界相符;三是数据库的并发控制,保证多用户使用数据库时数据库的正常使用;四是数据库的恢复控制,保证当由于各种原因造成数据损害时,数据不会丢失。

七、数据库保护对数据的保护主要通过四个方面实现:七、数据库保护(一)数据库的安全性

数据库的安全性是指保护数据库,防止不合法使用,以免数据的泄漏、更改或破坏。对数据库的不合法使用分无意滥用和恶意滥用两类。

在数据库中,可采用加密、用户身份验证、限制操作权等技术手段来控制恶意滥用;采用提供系统的可靠性和数据备份等方法来控制无意滥用。

用户DBMSOS数据库身份验证

操作权控制

操作系统安全保护

加密存储与冗余

图6-6数据库系统的安全模型

七、数据库保护(一)数据库的安全性用户DBMSOS数据库(二)数据库的完整性数据库的完整性是指数据的正确性、有效性和相容性,目的是防止错误数据进入数据库。

完整性约束条件一般由三部分组成:(1)什么时候使用条件进行检查(即“触发条件”);(2)要检查什么样的错误(即“约束条件”或“谓词”);(3)如果查出错误,应如何处理(即“ELSE子句”,违反时要做的动作,如拒绝操作、报告违反情况、改正错误等)。完整性约束条件的作用对象是关系、元组和列。(三)数据库的并发控制

数据库的并发操作通常会引发三个问题:丢失修改问题、读“脏”数据问题和不一致分析问题。并发控制就是要用正确的方式调度并发操作。并发控制的主要技术是封锁(Locking)。所谓封锁就是事务T在对某个数据操作之前,先向系统发出请求,对该数据加锁,从而使事务T对这个数据有了一定的控制,在“解”锁之前,其他事务不能更新此数据。

(二)数据库的完整性(四)数据库的恢复

1、故障的种类

(1)事务故障

(2)系统故障

(3)其他故障:如介质故障或由计算机病毒引起的故障或破坏

2、恢复的实现方法

(1)数据库备份:数据备份是指定期或不定期地对数据库数据进行复制。(2)登记日志文件:日志文件是用来记录事务对数据库的更新操作的文件。

(3)数据库镜像:所谓镜像就是在不同的设备上同时存有两份相同数据库,其中一个设备被称为主设备,另一个设备称为镜像设备。

(四)数据库的恢复第二节数据仓库

一、数据仓库发展的由来

联机事务处理不适合DSS应用的原因概括起来主要有以下四点:第一、联机事务处理环境下的数据是分散而非集成的,业务数据往往被存放于分散的异构环境中,不易被统一查询访问,而且还有大量的历史数据处于脱机状态,形同虚设;第二、事务处理系统不具备数据动态集成的能力,数据源中数据发生的变化不能反映给决策者;第三、对于决策分析而言,历史数据是相当重要的,企业的事务处理一般只需要当前数据;第四、业务数据的模式是针对事务处理系统而设计的,数据的格式和描述方式并不适合非计算机专业人员进行业务上的分析和统计。于是,有人感叹:20年前查询不到数据是因为数据太少,而今天查询不到数据是因为数据太多。针对这一问题,人们专门为业务的统计分析建立一个数据中心,它的数据可以从联机的事务处理系统、异构的外部数据源、脱机的历史业务数据中得到。它是一个联机的系统,专门为分析统计和决策支持应用服务,通过它可满足决策支持和联机分析应用所要求的一切。这个数据中心就叫数据仓库。可以把它看作一个作为决策支持系统和联机分析应用数据源的结构化数据环境。

第二节数据仓库一、数据仓库发展的由来二、数据仓库的定义及特点

据仓库是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。

数据仓库的4个特点:1、面向主题。传统数据库的数据组织面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题进行组织的。2、集成的。面向事务处理的传统数据库通常与某些特定的应用相关;而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性。3、相对稳定的。传统数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及到的数据操作主要是数据查询,一旦某个数据进入数据仓库,一般情况下将被长期保留,很少修改和删除,只需定期加载、刷新。

4、反映历史变化。传统数据库主要关心当前某一个时间段内的数据;而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时间点到目前的各个阶段的信息。二、数据仓库的定义及特点据仓库是一个面向主题的(S三、数据仓库系统的体系结构

整个数据仓库系统是一个包含4个层次的体系结构:

1、数据源2、数据的存储与管理

3、联机分析处理(OLAP)服务器4、前端工具

三、数据仓库系统的体系结构整个数据仓库系统是一个包含4个层四、数据仓库的应用

(一)数据仓库在客户服务、市场营销方面的应用客户关系管理(CRM)是一个判断、获取、保持和增加可获利客户的过程。CRM在整个客户生命周期中都以客户为中心,它简化了各种与客户相关联的业务流程(如销售、营销、服务和支持等),并将其注意力集中于满足客户的需求上。

(二)数据仓库在银行领域的应用利用数据仓库的强大功能,银行可以建立企业客户群和个人客户群的数据仓库,并对企业的结构、经营、财务以及市场竞争等多个数据源进行统一组织,形成一个一体化的存储结构,为决策分析奠定基础。

四、数据仓库的应用(一)数据仓库在客户服务、市场营销方面的数据库管理系统(databasemanagementsystem,DBMS):由一组程序执行数据库的实际操作,并提供数据库与用户和数据库与应用程序的接口。1.存储及检索数据并发控制:数据库一个特点,可用加锁以防同时访问某一正为其他应用程序所更新或使用的记录。模式:数据库中数据的逻辑和物理结构以及数据间的联系。三、数据库管理系统数据库管理系统(databasemanagementsy存储设备中的数据DBMS管理查询其他软件应用程序物理存取路径(PAP)逻辑存取路径(LAP)逻辑和物理存取路径:存储设备DBMS管理查询其他软件应用程序物理存取路径(PAP2.提供用户视图子模式:包含对数据库的一个子集的描述及确定哪些用户可对该子集的数据项进行修改操作的文件。模式子模式A子模式B子模式CDBMS用户1用户2用户3用户4用户52.提供用户视图子模式:包含对数据库的一个子集的描述及确定哪数据库定义语言(datadefinitionlanguage,DDL):是定义和描述某一特定数据库中数据及数据关系的各种指令及命令的集合。数据字典:数据库中所有数据的详尽描述。数据字典的优点: 1.减少数据冗余; 2.提高数据可靠性; 3.加快了程序开发; 4.易于修改程序和数据。3.创建及修改数据库数据库定义语言(datadefinitionlangua4.操纵数据和生产报表数据操纵语言:是一种包含操纵数据库命令的语言;结构化查询语言:一种标准化的数据操纵语言。5.选择数据库管理系统性能集成性特点供应商成本4.操纵数据和生产报表数据操纵语言:是一种包含操纵数据库命令分布式数据库:一种数据库,其实际的数据可能散布在多个由通信设备联接的较小数据库中。复制数据库:一种数据库,其中含有经常使用的数据的副本。四、数据库发展趋势分布式数据库:一种数据库,其实际的数据可能散布在多个由通信设数据提取过程数据净化过程查询和分析工具关系数据库网状数据库扁平文件层次数据库电子表格最终用户访问数据仓库2.数据仓库数据提取数据净化查询和分析关系数据库网状数据库扁平文件层次数数据集市是数据仓库的一个子集。4.联机分析处理联机分析处理(OLAP):用来存储和传送数据仓库信息的程序集合。3.数据集市数据集市是数据仓库的一个子集。4.联机分析处理联机分析处理(5.数据挖掘数据挖掘:自动地找出数据仓库中的模型及关系。6.开放式数据库互连开放式数据库互连(ODBC):一项标准,能保证凡符合本标准的软件均能用于任何遵循ODBC的数据库。5.数据挖掘数据挖掘:自动地找出数据仓库中的模型及关系。6.7.面向对象的数据库面向对象数据库:可将数据作为对象进行存储的数据库,对象中包含了数据,又包含了完成数据库事务处理所需的各种处理指令。8.图象、超文本和超媒体数据库以图象的形式存储数据的数据库。超文本数据库:用户可采取非机构化的方法来检索和操纵字母数字型数据的数据库。超媒体数据库:允许企业查找和操纵超媒体形式数据的数据库。7.面向对象的数据库面向对象数据库:可将数据作为对象进行存储9.空间数据技术9.空间数据技术五、管理数据库数据库管理:数据库各方面的管理。数据库的使用、政策和安全性五、管理数据库数据库管理:数据库各方面的管理。第六章数据库与数据仓库

第一节数据库技术本章内容:第二节数据仓库第六章数据库与数据仓库第一节数据库技术本章内容:第二数据的层次字符:信息的最基本架构,用一个字节来表示;字段:以某种方法描述的业务对象或活动的字符组合;记录:相关字段的一组集合;文件:相关记录的集合。一、数据管理的概念数据的层次一、数据管理的概念字符(字节)数据库字段记录文件005-10-6321,李杰,02-01-18fiske1000100职员文件,部门文件,工资文件…005-10-6321,李杰,02-01-18549-77-1001,李英,02-02-01数据的层次字符(字节)数据库字段记录文件005-10-6321,李杰,实体:是人、地点或对象的通用类别,数据以这种类别进行收集、存储和维护。属性:实体的特性。数据项:属性的特定值键:记录中用于表示记录的一个或多个字段。主键:唯一标识记录的一个或多个字段;次键:不能唯一标识记录的字段。2.数据实体、属性和键实体:是人、地点或对象的通用类别,数据以这种类别进行收集、存传统方法:为每个应用程序分别创建和存储数据文件的数据管理。数据冗余:分散在多个文件中数据的重复。数据完整性:任一文件中数据的正确程度。程序-数据依赖性:为某个应用所开发及组织的程序和数据与为其他应用开发和组织的程序和数据不兼容。3.数据管理的传统方法传统方法:为每个应用程序分别创建和存储数据文件的数据管理。数工资工资程序报表开票开票程序报表库存控制库存控制程序报表数据文件应用程序用户传统管理方法示意工资工资程序报表开票开票程序报表库存库存控制报表数据文件应用数据库方法:一种数据管理方法,其中相关数据集合可由多个应用程序共享。传统方法:基于文件;数据库方法:基于数据。数据库方法的优点: 1.有效利用存储空间;增强数据完整性; 2.增强数据的灵活性; 3.增强数据共享能力。4.数据管理的数据库方法数据库方法:一种数据管理方法,其中相关数据集合可由多个应用程数据模型:表示实体及实体间关系的图形。企业数据建模:在整个组织层次上进行数据建模的方法。实体关系图:作用基本的图形符号来表示组织及数据之间关系的图形。二、在数据库中组织数据1.数据建模和实体关系图数据模型:表示实体及实体间关系的图形。二、在数据库中组织数据10.1文件组织数据组织的层次文件分类数据的物理储存与传送文件组织方式10.2数据库技术传统的文件处理与数据库处理数据库管理系统(DBMS)数据库的类型数据库模型与数据库组织结构数据库设计数据资源管理技术10.1文件组织数据资源管理技术第一节数据库技术人工管理

文件系统

数据库系统

一、数据管理技术及其发展数据管理技术发展阶段:(一)人工管理阶段该阶段处在20世纪50年代中期以前,这时期的数据管理呈以下特点:1、数据不保存。2、数据由应用程序管理。3、数据不共享。4、数据不具独立性。

第一节数据库技术人工管理文件系统数据库系统一、数据管一、数据管理技术及其发展(二)文件系统阶段20世纪50年代后期到60年代中期,数据结构和数据管理技术迅速发展起来。硬件方面有了磁盘、磁鼓等直接存取的外部存储设备;而软件中出现了操作系统和高级语言。操作系统中有了专门进行数据管理的软件,称为文件系统。

这一时期的数据管理的特点是:1、数据可以长期保存。2、数据由文件系统管理。3、数据具有一定的独立性。

文件系统也存在以下缺点:

1、编程不方便。

2、数据冗余量大。

3、数据独立性差。

4、不支持并发访问。

5、数据缺少统一管理。

一、数据管理技术及其发展(二)文件系统阶段这一时期的传统文件处理系统应用程序1数据文件1应用程序2应用程序3数据文件2数据文件3存在问题:1、数据冗余与数据不一致性2、数据联系弱3、缺少数据字典,缺乏灵活性用户用户用户传统文件处理系统应用程序1数据文件1应用程序2应用程序3数据一、数据管理技术及其发展(三)数据库系统阶段

20世纪60年代以来,出现了统一管理数据的专门软件系统—数据库管理系统(DBMS,DataBaseManagementSystem)。

数据库阶段的数据管理特点是:

1、数据结构化。数据结构化是数据库与文件系统的根本区别。

2、较高的数据独立性。用户能以简单的逻辑结构操作数据而无需考虑数据的物理结构。

3、数据共享。数据不再仅仅服务于某个程序或用户,而成为若干程序或用户的共享资源,由数据库管理系统统一管理与控制。

4、方便的用户接口。用户可以使用查询语句或终端命令操作数据库,也可以用程序方式操作数据库。

5、较强的数据控制能力。并发控制能力;恢复能力;完整性能力;安全性能力一、数据管理技术及其发展(三)数据库系统阶段数据库处理系统

特点:应用程序1应用程序2应用程序3DBMS数据库中央数据库用户用户用户1、完善的数据字典和数据模型2、数据独立性3、方便的接口4、完整的数据控制功能5、提高了系统的灵活性数据库处理系统特点:应用程序1应用程序2应用程序3DBMS银行数据库处理系统客户交易处理数据库管理系统核对帐户程序存款帐目程序分期贷款程序客户数据库..银行文件处理系统客户财务报表分期贷款程序帐户核对处理存款处理分期贷款处理贷款分析报告客户票据存款文件修改文件修改核对帐户核对程序分期贷款文件修改存款程序客户交易银行数据库处理系统客户交易处理数据库管理一、数据管理技术及其发展(四)数据库发展新技术

数据库技术与具他领域的技术相结合,出现了数据库的许多新的分支,如:与网络技术相结合出现了网络数据库;与分布处理技术相结合出现了分布式数据库;与面向对象技术相结合出现了面向对象数据库;与人工智能技术相结合出现了知识库;与并行处理技术相结合出现了并行数据库;与多媒体技术相结合出现了多媒体数据库。

1、分布式数据库技术分布式数据库系统(DistributedDataBaseSystem,DDBS)是在集中式数据库基础上发展起来的,分布式数据库系统是地理上分布在计算机网络的不同节点,逻辑上属于同一系统的数据库系统,分布式数据库系统不仅能支持局部应用,存取本地节点或另一个节点的数据,而且能支持全局应用,同时存取两个或两个以上节点的数据。

一、数据管理技术及其发展(四)数据库发展新技术一、数据管理技术及其发展2、面向对象数据库技术

它的基本设计思想是:一方面把面向对象语言向数据库方向扩展,使应用程序能够存取并处理对象;另一方面扩展数据库系统,使其具有面向对象的特征,提供一种综合的语义数据建模概念集,以便对现实世界中复杂应用的实体和联系建模。3、多媒体数据库

多媒体数据具有数据量大、结构复杂、数据传输的连续性等特点。因而,多媒体数据库需要有特殊的数据结构、存储技术、查询和处理方式。

4、数据仓库数据仓库,就是一种长期数据存储,这些数据来自于多个异种数据源。通过数据仓库提供的联机分析处理(OLAP)工具,实现各种粒度的多维数据分析,以便向管理决策提供支持。

一、数据管理技术及其发展2、面向对象数据库技术二、数据库系统的组成

用户用户用户数据库管理系统数据库管理员

应用程序数据库图6-1数据库系统

二、数据库系统的组成用户用户用户数据库管数据库管理员应用二、数据库系统的组成数据库数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并为各种用户共享。数据库管理系统数据库管理系统(DBMS)是介于用户和操作系统之间的一层数据管理软件,属于系统软件。数据库管理系统为数据库的建立、运行和维护提供了统一的管理和控制,是数据库系统的核心。二、数据库系统的组成数据库二、数据库系统的组成应用程序

一个数据库应用可分为客户端应用程序和服务端应用程序两类。服务端应用程序运行在数据库服务器上,是真正存储和操纵数据的,它接受用户程序的请求,对数据进行不同的操作。客户端应用程序运行在客户端计算机上,实现用户的业务逻辑,通过客户端应用程序界面,用户可以发出不同的请求给服务器端,由服务端程序完成各种各样的操作。一般情况下,客户端和服务器端的程序通过标准SQL语言通信。客户端应用程序根据使用者的不同,可以分成两类:一类是供数据库管理员使用,提供强大的图形界面和命令以便管理员最大程度的维护数据库的运转;另一类为程序开发人员使用,提供一整套完整的用户接口界面让开发人员通过程序实现操纵数据的目的,这些程序最终将提交给用户使用,即通常所讲的应用程序。

二、数据库系统的组成应用程序三、数据库系统的体系结构

为了有效地组织和管理数据,提高数据库的逻辑独立性和物理独立性,将数据库体系结构分为三级:面向用户或应用程序员的用户级(外部级)、面向建立和维护数据库人员的概念级和面向系统程序员的物理级(内部级)。用户级对应外模式,概念级对应模式,物理级对应内模式。数据库系统的体系结构如下页图6-2所示。

三、数据库系统的体系结构为了有效地组织和管理数图6-2数据库系统的体系结构

图6-2数据库系统的体系结构模式模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的全局视图。一个数据库只有一个模式。

外模式外模式又称子模式或用户模式,对应于用户级。它是数据库用户(包括程序员和终端用户)所看到和使用的局部数据的逻辑结构和特征的描述,是数据库的用户视图。外模式是从模式中导出的一个子集,一个数据库可以有多个外模式。

内模式

内模式又称存储模式,对应于物理级。它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库。一个数据库只有一个内模式。

模式二级映射

为了能够在内部实现这三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映射:外模式—模式映射,模式—内模式映射。

①外模式—模式映射

外模式—模式映射定义了该外模式与模式之间的对应关系。这些映射定义通常包含在各自外模式的描述中。当模式改变时(例如增加新的属性、改变属性的数据类型时),只要改变其映射,就可以使外模式保持不变,对应的应用程序也可保持不变(因为应用程序是依据外模式编写的),从而保证了数据与应用程序的逻辑独立性。②模式—内模式映射模式—内模式映射定义了数据库全局逻辑结构与存储结构之间的对应关系。该映射定义通常包含在模式描述中。当数据的存储结构发生变化时,只需改变模式—内模式映射,就能保持模式不变,因此应用程序也可以保持不变,从而保证了数据与应用程序的物理独立性。

二级映射四、概念模型

概念模型用于对信息世界建模,是现实世界到信息世界的第一层抽象。

(一)基本概念1、实体现实世界中的客观事物在信息世界中称为实体(Entity)。

属性:实体所具有的某一特性。

实体标识符:能够唯一标识一个实体的属性集,也称为关键码,简称码或键。域:属性的取值范围称为该属性的域。

实体型:用实体名及其属性名集合来抽象和刻画同类实体,即实体的结构描述,称为实体型。实体集:同型实体的集合称为实体集。

四、概念模型概念模型用于对信息世界建模,是现实世界四、概念模型2、实体联系:实体之间的相互关系,包括实体内部的联系和实体之间的联系。常见的实体联系可以有三种,如下图6-3所示:实体型A联系名实体型B11(a)1:1联系实体型A联系名实体型B1N(b)1:N联系实体型A联系名实体型BMN(c)M:N联系图6-3两个实体型之间的三类联系

四、概念模型2、实体联系:实体之间的相互关系,包括实(二)概念模型的表示方法

实体-联系方法(Entity-RelationshipApproach)用E-R图来描述现实世界的概念模型

实体联系模型反映的是现实世界中的事物及其相互联系。1、实体(Entity)描述客观事物的概念2、属性"属性"指实体具有的某种特性。实体名称表示方法:表示方法:属性(二)概念模型的表示方法

实体-联系方法(Enti实体名称属性1属性2属性n3、联系现实世界的事物总是存在着这样或那样的联系联系表示方法:实体1实体2联系实体名称属性1属性2属性n3、联系现实世界的联系的类型设A,B为两个包含若干个体的总体,1、一对一联系如果对于A中的一个实体,B中至多有一个实体与其发生联系,反之,B中的每一实体至多对应A中一个实体,则称A与B是一对一联系。系系主任任职11病区科室主任任职11联系的类型设A,B为两个包含若干个体的总体,1、一对一联系系2、一对多联系如果对于A中的每一实体,实体B中有一个以上实体与之发生联系,反之,B中的每一实体至多只能对应于A中的一个实体,则称A与B是一对多联系。AB联系1n教研室教师联系1n2、一对多联系AB联系1n教研室教师联系1n3、多对多联系如果A中至少有一实体对应于B中一个以上实体,反之,B中也至少有一个实体对应于A中一个以上实体,则称A与B为多对多联系。AB联系mn教师学生教学mn3、多对多联系AB联系mn教师学生教学mnE—R图建模实体及其联系概念模型E—R图E—R图建模实体及其联系概念模型E—R图E—R图绘制图书作者写作出版社类别页数ISBN书名姓名出生地身份证号定稿时间价格1、利用分类、聚集、概括等方法抽象出实体,并一一命名。2、描述实体之间的联系3、实体属性和联系属性的说明E—R图绘制图书作者写作出版社类别页数ISBN书名姓名出生地举例:某工厂物资入库管理的概念模型。物资管理涉及的实体有:供方单位:属性有单位号、单位名、地址、联系人、邮政编码物资:属性有物资代码、名称、规格、备注库存:属性有入库号、日期、货位、数量合同:属性有合同号、数量、金额、备注结算:属性有结算编号、用途、金额、经手人这些实体间的联系包括:入库:一种物资可以分多次入库,所以是1:N联系验收:一份合同订购的物资可以分多次验收,所以是1:N联系购进:一次购进的物资可以经多次结算,而一次结算可以承办多次购进的物资,所以是多对多的联系。其属性为:数量、金额。付款:也是多对多的联系。其属性是:数量、金额。订货:这是一个数量超过两个的不同类型实体之间的联系。在订货业务中,一种物资可由多家供应,产生多笔合同。反之,一个供应单位可以供应多种物资,产生多笔合同,所以,在图中用M:N:L的结构来表示。其属性为:数量、单价。举例:某工厂物资入库管理的概念模型。该工厂的物资入库管理E-R图如下图6-4,6-5所示:图6-4实体和联系的E-R图

该工厂的物资入库管理E-R图如下图6-4,6-5所示:图6库存物资供方单位结算订货入座购进付款验收合同MN1NNNMNM1L图6-5工厂物资入库管理E-R图

库存物资供方单位结算订货入座购进付款验收合同MN1NNNMN层次模型:数据按“自顶向下”的结构进行组织。项目1部门C部门B部门A员工1员工4员工3员工2员工6员工5数据模型分析层次模型:数据按“自顶向下”的结构进行组织。项目1部门C部门网状模型是层次模型的扩展,其中一个属记录可以有多个首记录。项目1部门C部门B部门A项目2网状模型网状模型是层次模型的扩展,其中一个属记录可以有多个首记录。项项目号说明部门号155薪水册257498原材料632226销售管理598部门号部门名经理社会保障号257财务部421-55-99993632生产部765-00-3192598市场部098-40-1370社会保障号名字性别聘用日期部门号421-55-99993李杰男01-02-14257765-00-3192张丽女01-08-10650098-40-1370王中豪男02-11-11598数据表1:项目表数据表2:部门表数据表3:经理表关系模型

关系模型是最流行的数据库模型;关系模型是用标准表格形式描述数据;所有数据元素存在于“关系”的二维表中。关系数据:以表格形式——行和列来组织数据的一种模型。项目号说明部门号155薪水册257498原材料632226销五、数据模型

数据模型是直接面向数据库的逻辑结构,是对现实世界的第二层抽象。数据模型是数据库系统的核心和基础。数据模型由三个基本的要素组成:数据的结构、数据的操作、数据的约束条件。

1、数据结构:数据结构是所研究的对象类型的集合。这些对象是数据库的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象;另一类是与数据之间联系有关的对象。

2、数据操作:数据操作是指对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则。

3、数据的约束条件数据的约束条件是一组完整性规则的集合。

五、数据模型数据模型是直接面向数据库的逻辑结构,是五、数据模型(二)关系模型

关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据的组织方式。1、关系模型的数据结构

在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。

五、数据模型(二)关系模型关系模型(RelationalModel)用二维表表示实体与实体之间联系的模型。仓库号城市面积WH1北京370WH2上海500WH3广州200仓库器件号器件名称P1显示卡P2声卡P3解压卡P4散热风扇仓库号器件号数量WH1P2675WH1P3250WH1P4340WH2P1280WH2P2200WH2P4270WH3P2500WH3P1330器件库存器件仓库库存关系模型(RelationalModel)用二维表表示实体关系:一个关系对应通常说的一张表。元组:表中的一行即为一个元组。属性:表中的一列即为一个属性。主键(码):表中的某个属性组,它可以唯一确定一个元组。域:属性的取值范围。分量:元组中的一个属性值。关系模式:对关系的描述成为关系模式,一般表示为关系模式:关系名(属性1,属性2,…,属性n)例如上面的关系可描述为:教职工(职工号,姓名,出生日期,性别,学院,电话)关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条件,这些规范条件中最基本的一条就是:关系的每一个分量必须是一个不可再分的数据项。关系:一个关系对应通常说的一张表。(三)、E—R图向关系数据模型的转换回顾实体实体集合及实体联系相关属性集合加工、转换数文件据记录库相关数据项集合数据世界DBMS的数据模型信息世界E-R模型(三)、E—R图向关系数据模型的转换回顾实体实体关系模式对关系的描述,用关系名(属性1,属性2,…属性n)来表示。eg.库存(仓库号,器件号,数量)仓库(仓库号,城市,面积)转换过程示意图E-R图关系模型关系模式eg.转换过程示意图E-R图关系模型2、联系a.联系具有属性:联系名作为关系名,发生联系的实体的主关键字作为联系的主关键字。b.联系不具有属性:不带有属性的联系可以去掉。1、实体相应转换为一个关系,实体名称作为关系名称,该关系包括对应实体的全部属性,并确定出该关系的关键字。转换方法和原则2、联系1、实体转换方法和原则转换举例一厂长号*姓名年龄厂长厂号*厂名地点工厂管理11厂长(厂长号,姓名,年龄)工厂(厂号,厂名,地点)管理(厂号,厂长号)转换举例一厂长号*姓名年龄厂长厂号*厂名地点工厂管理11厂长转换举例二仓库号*地点面积仓库货号*品名价格产品存放1n仓库(仓库号,地点,面积)产品(货号,品名,价格)数量存放(仓库号,货号)转换举例二仓库号*地点面积仓库货号*品名价格产品存放1n仓库转换举例三学号*姓名年龄学生课程号*课程名学时数课程学习mn学生(学号,姓名,年龄)课程(课程号,课程名,学时数)成绩学习(学号,课程号,成绩)转换举例三学号*姓名年龄学生课程号*课程名学时数课程学习mn五、数据模型

2、关系模型的操纵与完整性约束关系模型给出了关系操作的能力。关系数据模型的操作主要包括选择、投影、连接、除、并、交、差等查询操作和插入、删除、修改操作两大部分。为了维护数据库中数据与现实世界的一致性,这些操作必须满足关系的完整性约束条件。关系的完整性约束条件包括三大类:实体完整性、参照完整性和用户定义的完整性。

五、数据模型2、关系模型的操纵与完整性约束五、数据模型

关系模型的逻辑结构是一组关系模式的集合。E-R图则是由实体、实体的属性和实体之间的联系三个要素组成的。所以将E-R图转换为关系模型实际上就是要将实体、实体的属性和实体之间的联系转换为关系模式,这种转换一般遵循如下原则:

1.一个实体转换为一个关系模式,实体的属性就是关系的属性,实体的码就是关系的码。2.一个联系转换为一个关系模式,与该联系相连的各实体的码以及联系的属性均转换为该关系的属性。3.具有相同码的关系模式可合并。

五、数据模型关系模型的逻辑结构是一组关系模式[例6-2]将例6-1物资入库管理的E-R图转换为关系模型,其中,有下划线的属性表示是主码:(1)把每一个实体转换为一个关系模式首先分析各实体的属性,从中确定其主码,然后分别用关系模式表示。供方单位(单位号、单位名、地址、联系人、邮政编码)物资(代码、名称、规格、备注)库存(入库号、日期、货位、数量)合同(合同号、数量、金额、备注)结算(编号、用途、金额、经手人)(2)把每一个联系转换为关系模式:购进(入库号、编号、数量、金额)付款(编号、合同号、数量、金额)订货(代码、单位号、合同号、数量、单价)入库(代码、入库号)验收(合同号、入库号)[例6-2]将例6-1物资入库管理的E-R图转换为关系模型(3)关系模式合并,其最终结果为:供方单位(单位号、单位名、地址、联系人、邮政编码)物资(代码、名称、规格、备注)库存(入库号、日期、货位、数量,代码,合同号)合同(合同号、数量、金额、备注)结算(编号、用途、金额、经手人) 购进(入库号、编号、数量、金额)付款(编号、合同号、数量、金额)订货(代码、单位号、合同号、数量、单价)(3)关系模式合并,其最终结果为:数据分析和规范化问题数据分析:一种对数据进行评价以揭示数据库内容中存在问题的过程。规范数据的步骤:消除所有重复组;消除多次出现的数据;消除表中不依赖于主键的属性。数据分析和规范化问题数据分析:一种对数据进行评价以揭示数据库1NF2NF3NF六、关系的规范化

数据库的设计应遵循规范化理论,规范化程度过低的关系,可能会存在插入、删除异常、修改复杂、数据冗余等问题,解决的方法就是对关系模式进行分解或合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论