版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章物流数据库及其管理技术1第一页,共六十二页。学习目标了解数据库的历史、概念及系统构成;了解数据库发展的新技术、新方向及数据挖掘基础知识;掌握数据模型、数据设计理论与技术。2第二页,共六十二页。主要内容数据库基础知识数据库技术及设计数据仓库与数据挖掘3第三页,共六十二页。第一节
数据库基础知识
4第四页,共六十二页。一、数据库概述(一)基本概念和术语数据(Data)信息(Information)数据库DB(DataBase)数据库管理系统DBMS(DataBaseManagementSystem)数据处理数据管理5第五页,共六十二页。(二)数据库技术发展历史人工管理文件系统数据库系统6第六页,共六十二页。(三)数据库技术发展历史与现状第一代:层次和网状数据库IBM公司于1968年研制成功层次数据库IMS,它是世界上第一个DBMS系统。第二代:关系数据库系统(RelationalDBMS,RDBMS)1970年E.F.Codd提出关系数据理论,开创了数据库系统的新纪元,后来又发表了多篇论文,奠定了关系数据库的理论基础。30年来,关系数据库的研究取得了辉煌的成就,涌现了许多性能良好的商品化关系数据库管理系统,如DB2,Oracle,Ingres,Sybase,Informix等,关系数据库的应用领域也不断扩大。第三代:面向对象的数据库系统(ObjectOrientedDBMS,OODBMS)7第七页,共六十二页。(四)数据库发展方向在数据库管理系统上,主要表现在以下四个方面。(1)面向对象数据库;(2)对象—关系数据库;(3)并行数据库;(4)分布式数据库。在数据库应用方面,主要表现在以下四个方面:(1)数据仓库;(2)数据挖掘;(3)OLAP;(4)时态数据库。8第八页,共六十二页。9第九页,共六十二页。二、数据模型
概念模型(也称语义模型)数据模型(如网状、层次及关系模型)10第十页,共六十二页。二、数据模型
(一)概念模型
概念模型也称信息模型,它是按用户的观点来对数据和信息建模,主要用于数据库设计。概念模型独立于具体的机器和DBMS。概念模型是现实世界的抽象描述,是现实世界到机器世界的一个中间层次,反映现实世界所涉及的对象及对象间的联系。11第十一页,共六十二页。实体联系模型反映的是现实世界中的事物及其相互联系相关概念实体(entity)——是客观世界中描述客观事物的概念,可以指事物本身,也可以指事物之间的联系
属性——指实体具有的某种特性。用来描述实体联系——现实世界的事物间存在的相互关系一是实体内部的联系一是实体之间的联系实体联系模型通过E-R图形表示信息世界中的实体、属性、关系的模型(一)概念模型——实体联系模型12第十二页,共六十二页。E-R模型中的对应关系:一对一联系(1:1)一对多联系(1:n)多对多联系(m:n)
(一)概念模型——实体联系模型(E-R图)
13第十三页,共六十二页。(一)概念模型——E-R图数据库的E-R图常用以下图形表示:14第十四页,共六十二页。(一)概念模型——E-R图(举例)假如一个学生选修课程,则学生与课程之间是选修关系。对于实体学生和课程,其各有自己的属性。图中联系“选修”也有属性,它的属性是学生选修某门课程的“成绩”。15第十五页,共六十二页。(二)数据模型——相关概念数据结构:描述系统的静态特性,即组成数据库的对象类型。包括数据本身的类型(如内容、性质)和数据之间的联系。数据操作:描述系统的动态特性,即对数据库中对象的实例允许执行的操作的集合,包括操作及操作规则。一般有检索、更新(插入、删除、修改)操作。数据模型要定义操作含义、操作符号、操作规则,以及实现操作的语言。数据的约束条件:是完整性规则的集合,规定数据库状态及状态变化所应满足的条件,以保证数据的正确、有效、相容。16第十六页,共六十二页。(二)数据模型——三种数据模型介绍层次模型网状模型关系模型17第十七页,共六十二页。【例2-1】描述图2-9所示的学生选课关系模型学生(学号,姓名,年龄,性别,系别,年级)课程(课程号,课程名,学分)选课(学号,课程号,成绩)18第十八页,共六十二页。三、数据库系统组成
数据库系统指带有数据库的整个计算机系统,包括硬件、软件、数据以及人员。
19第十九页,共六十二页。四、关系数据库介绍关系数据库系统是支持关系模型的数据库系统,是基于严格数据模型的一种数据库系统。1970年E.F.Codd提出关系数据模型:“ARelationalModelofDataforLargeSharedDataBanks”,1970之后,提出了关系代数和关系演算的概念,1972年提出了关系的第一、第二、第三范式,1974年提出了关系的BC范式,80年代后,关系数据库系统成为最重要、最流行的数据库系统。典型实验系统有SystemR、UniversityINGRES,典型商用系统有ORACLE、SYBASE、INFORMIX、DB2、SQLServer等。20第二十页,共六十二页。五、SQL语言SQL语言的概念SQL语言的特点常用SQL语言21第二十一页,共六十二页。(一)SQL语言的概念SQL语言(StructuredQueryLanguage)是处理关系数据库的标准语言,并且市场上的任何数据库产品都支持SQL。SQL是20世纪70年代早期在IBM公司的研究所开发的SystemR中实现的,随后又在IBM公司的其他商品和其他公司的商品中实现。SQL原先是作为特殊的“数据子语言”出现的,然而,随着持久存储模块(PSM)在1996年成为了标准,SQL已经变成了计算上完全(computationallycomplete)的语言。T-SQL(TransactstructureQueryLanguage)是一种增强的SQL,它在SQL语言的基础上扩充了许多新的内容。22第二十二页,共六十二页。(二)SQL语言的特点综合统一高度非过程化面向集合的操作方式同一种语法结构提供两种使用方式(自含式语言;嵌入式语言)语言简捷,易学易用23第二十三页,共六十二页。(三)常用SQL语言
SQL语言由以下部分组成,包括:DDL(DataDefinitionLanguage)DML(DataManipulationLanguage)DCL(DataControlLanguage)存储过程和触发器嵌入式SQL语言24第二十四页,共六十二页。定义表:如创建表,删除表,修改表定义;定义视图:如创建视图、删除视图、间接修改视图定义(删除+创建视图);定义索引(内模式或内部视图):如创建索引、删除索引、间接修改索引定义(删除+创建索引)
1.SQL数据定义语言(DDL)功能25第二十五页,共六十二页。2.SQL数据操纵语言(DML)
SQL数据操纵语言提供了select,insert,delete和update命令,完全覆盖关系各种运算。26第二十六页,共六十二页。3.SQL数据控制语言(DCL)数据控制亦称为数据保护,包括数据安全性控制、完整性控制、并发控制和数据恢复。27第二十七页,共六十二页。4.存储过程和触发器
存储过程是为了完成特定功能汇集而成的一组命名了的SQL语句集合,该集合编译后存放数据库管理系统中,可根据实际情况重新编译,该过程可直接运行,也可以远程运行。触发器是一种特殊的存储过程。它的优点是不管什么原因造成的数据变化都能自动响应,对于每条SQL语句,触发器仅执行一次,事务可用于触发器中。28第二十八页,共六十二页。5.嵌入式SQL语言
SQL的表达能力相比高级语言有一定的限制,有些数据访问要求单纯使用SQL无法完成,因此,有时候要将SQL语言嵌入到高级语言中使用。嵌入式SQL语言的执行过程如图
29第二十九页,共六十二页。第二节
数据库技术及设计
30第三十页,共六十二页。主要内容数据库设计理论数据库设计技术31第三十一页,共六十二页。一、数据库设计理论(一)基本概念关系模式数据依赖函数依赖码范式规范化32第三十二页,共六十二页。1.关系模式关系模式(RelationSchema)是对一个关系的描述,用来定义关系。关系模式的形式化表示为:R(U,D,Dom,F)其中,R——关系名;U——属性集合;D——属性来自的域;Dom——属性向域的映射;F——属性间数据的依赖关系。关系模式可简化为一个三元组:R(U,F)33第三十三页,共六十二页。2.数据依赖
数据依赖是通过一个关系中间属性值的相等与否体现出来的数据间的相互关系。对于一个三元组R(U,F),当且仅当U上的一个关系r,满足数据依赖关系F时,r称为关系模式R(U,F)的一个关系。34第三十四页,共六十二页。3.函数依赖
设R(U)是属性集U上的关系模式,X,Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数确定Y或Y函数依赖X。35第三十五页,共六十二页。4.码设K为R<U,F>中的属性或属性组,若K->U,则K为R的候选码(CK),若候选码多于一个,则选定其中的一个作为主码(PK)。5.范式满足不同程度要求的约束集称为不同的范式。6.规范化一个低一级范式的关系模式,通过模式分解(投影运算)可以转化为若干个高一级范式的关系模式的集合,这个过程叫做规范化。36第三十六页,共六十二页。(二)范式
1.第一范式(1NF)当且仅当一个关系R中,每一个分量都是不可再分的数据项时,R∈1NF。即要求属性是原子的、不可再分的。37第三十七页,共六十二页。2.第二范式(2NF)假定只有一个候选码,且该候选码是主码:当且仅当一个关系变量属于1NF,且该关系变量的每一个非码属性都完全函数依赖于主码时,该关系变量属于2NF。进一步分解的作用是消除传递函数依赖,也正是消除了这种传递函数依赖才解决了更新异常问题。38第三十八页,共六十二页。解决上述问题的方法是将一个非2NF关系分解为多个2NF的关系。教师关系:教师代码,姓名,职称;课题关系:研究课题号,研究课题名称;教师与课题关系:教师代码,研究课题号。经过上述规范化后的这些关系都符合2NF的要求。39第三十九页,共六十二页。3.第三范式(3NF)第三范式(假定关系变量只有一个候选码,且该候选码是主码):当且仅当一个关系变量属于2NF且该关系变量的所有非码属性都不传递依赖于主码时,该关系变量属于3NF。规范化过程的第二步可以归纳为利用投影消除非码属性间的传递函数依赖40第四十页,共六十二页。消除表2-8中传递依赖的方法,是将原关系分解为如下几个3NF关系:产品关系:产品代码,产品名,生产厂名;生产厂关系:生产厂名,生产厂地址。41第四十一页,共六十二页。4.BC范式(BCNF)如果一个关系变量的所有非平凡的、完全的函数依赖的决定因素是候选码,则该关系变量属于Boyce/Codd范式(BCNF)。函数依赖图中唯一的一个箭头是从候选码中出来的。前面已经说过,每一个候选码总有箭头出来,而BCNF认为这里没有其他箭头,也就是说,在规范化过程中已没有箭头可消除。42第四十二页,共六十二页。43第四十三页,共六十二页。二、数据库设计技术
数据库设计概述;数据库设计特点;数据库设计方法;数据库设计过程;44第四十四页,共六十二页。(一)数据库设计概述数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)。45第四十五页,共六十二页。(二)数据库设计的特点(1)数据库建设是硬件、软件和数据的结合,常有“三分技术,七分管理,十二分基础数据”的说法。(2)数据库设计应该与应用系统设计相结合,即数据库设计应包含两方面的内容。结构(数据)设计:设计数据库框架或数据库结构。行为(处理)设计:设计应用程序、事务处理等。设计时,要重视对应用中数据语义的分析和抽象,同时要重视对行为的设计。46第四十六页,共六十二页。47第四十七页,共六十二页。(三)数据库设计方法
手工试凑法规范设计法计算机辅助设计数据库设计过程48第四十八页,共六十二页。(四)数据库设计过程
49第四十九页,共六十二页。第三节
数据仓库与数据挖掘
50第五十页,共六十二页。一、数据仓库概述数据仓库的产生及发展数据仓库的体系结构51第五十一页,共六十二页。(一)数据仓库的产生及发展传统数据库系统无法提供决策分析支持,主要表现在决策处理中的系统响应、决策数据需求和决策数据操作方面。数据仓库DW(DataWarehouse)是支持决策支持系统的、面向主题的、集成的、稳定的、带有商业应用软件的数据库系统。52第五十二页,共六十二页。(二)数据仓库的体系结构53第五十三页,共六十二页。二、数据挖掘
数据挖掘的产生与发展
数据挖掘过程数据挖掘工具介绍
54第五十四页,共六十二页。(一)数据挖掘的产生与发展55第五十五页,共六十二页。(二)数据挖掘过程
56第五十六页,共六十二页。(三)数据挖掘工具第一代数据挖掘软件:CBA第二代数据挖掘软件第三代软件,SPSSClementine第四代数据挖掘软件57第五十七页,共六十二页。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护士长2023年工作总结和2024年工作计划课件
- 四年级语文上册第七单元第22课为中华之崛起而读书习题课件2新人教版
- 几种常见微生物培养标本采集
- 长沙电视台新闻频道记者面试题(笔试真题及参考答案)
- 二零二五年度香港某航空公司空乘人员派遣合同3篇
- 二零二五年度物流供应链合同模板下载集锦3篇
- 二零二五年酒吧DJ工作聘用合同3篇
- 二零二五暗股合作协议-航空航天产业投资2篇
- 2024年长沙方泰医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 二零二五年打印机设备销售与行业专家咨询合同3篇
- GB/T 3478.1-1995圆柱直齿渐开线花键模数基本齿廓公差
- GB/T 20174-2006石油天然气工业钻井和采油设备钻通设备
- GB 6000-1999主要造林树种苗木质量分级
- 2023年弥渡县广播电视台(融媒体中心)招聘笔试题库及答案解析
- GB 18613-2020电动机能效限定值及能效等级
- 体能训练讲解健身课件
- 农业昆虫学实验5蔬菜害虫课件
- 地震工程学-反应谱和地震时程波的相互转化matlab编程
- 大学研究生赴境内外高校学习课程学分认定管理办法
- 非标设计最强自动计算-压入力计算
- 建筑工程施工现场视频监控布置实施方案
评论
0/150
提交评论