商务智能理论与应用数据库_第1页
商务智能理论与应用数据库_第2页
商务智能理论与应用数据库_第3页
商务智能理论与应用数据库_第4页
商务智能理论与应用数据库_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据库原理与应用第一章绪论

12数据管理技术的发展数据库系统结构34DB、DBMS和DBS数据库技术的发展

数据:描述客观事物的一组文字、数字和符号,它是客观事物的反映和记录。如:(李明,男,20,1992,江苏,数理学院,信息与计算科学专业,2008)

信息:潜在于数据中的意义,它反映了客观世界中各种事物的状态与特征,它能增长人的知识,影响接受者的行为。基本概念1.1数据管理技术的发展数据处理:对各种形式的数据进行收集、存储、加工和传播的一系列活动的总和。其目的是从大量原始数据中抽取出对用户有价值的信息,以作为行动和决策的依据。信息=数据+数据处理数据管理:指对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。数据库技术是应数据管理任务的需要而产生的1.1数据管理技术的发展人工管理阶段(20世纪50年代中期以前)文件系统阶段(20世纪50年代后期--60年代中期)数据库系统阶段(20世纪60年代后期—今)

硬件(外存贮器)和软件的发展应用需求扩大数据管理技术经历了三个发展阶段:人工管理阶段(--50年代中期)应用程序1应用程序2应用程序n数据集1数据集2数据集n…

计算机主要用于科学计算数据量小、结构简单。

外存为顺序存取设备磁带、卡片、纸带,没有磁盘等直接存取设备。

没有操作系统及数据管理软件用户用机器指令编码,通过纸带机输入程序和数据,程序运行完毕后,由用户取走纸带和运算结果,再让下一用户操作。●

用户完全负责数据管理工作●

数据完全面向特定的应用程序每个用户使用自己的数据,用完撤走不保存,无共享。●

数据与程序没有独立性程序中存取数据的子程序随着存储结构的改变而改变。背景特点文件系统阶段(50年代后期--60年代中期)文件系统……文件组1文件组2文件组3应用程序1应用程序2应用程序n●

计算机不但用于科学计算,还用于管理。●

外存有了磁盘、磁鼓等直接存取设备。●

有了专门管理数据的软件,一般称为文件系统。●

数据可以长期保存●

数据与程序有一定的独立性文件的逻辑结构与存储结构由系统进行转换,数据在存储上的改变不一定反映在程序上。●

共享性差、冗余度大(一个文件对应一个程序)背景特点数据库系统阶段(60年代后期--)…应用程序1应用程序2应用程序n数据库

数据库管理系统

DBMS●计算机管理的数据量大,关系复杂,共享性要求强(多种应用、不同语言共享数据)●外存有了大容量磁盘,光盘●软件价格上升,硬件价格下降。●数据有整体的结构性,面向全组织,面向现实世界●由DBMS统一存取,维护数据语义及结构●数据共享性好●

数据与程序完全相互独立背景特点常见DBMS:Oracle,IBMDB2,Informix,Sybase,SQLServer,FoxPro,Access等例:学生基本信息记录表:学号姓名性别出生年月学院籍贯奖惩情况200505101张三男1987/10/10数理学院广东2005-06学年一等奖学金2005-06学年校三好学生200505102李四男1988/01/10数理学院河南200505103钱红女1987/05/21数理学院上海200505106赵晓林女1989/02/10数理学院上海2005-06学年一等奖学金………………………这个表格的缺点:有些同学的奖惩记录很多,但大部分没有,因此“奖惩情况”这一栏该留多大的位置很难确定,而且很难统计奖励的次数修改后的记录表:将学生基本信息和奖惩情况分开来学号奖惩情况2005051012005-06学年一等奖学金2005051012005-06学年校三好学生2005051062005-06学年一等奖学金学号姓名性别出生年月学院籍贯200505101张三男1987/10/10数理学院广东200505102李四男1988/01/10数理学院河南200505103钱红女1987/05/21数理学院上海200505106赵晓林女1989/02/10数理学院上海………….……………………奖惩情况表修改后的学生基本信息记录表特点:描述数据时不仅描述数据本身,还描述了数据间的联系。数据库系系统的特特点1.数据结构构化---数据库系系统与文文件系统统根本区别别即采用复复杂的数数据模型型表示数数据结构构按照某种种数据模模型,将整个组组织的全全部数据据组织成成一个结结构化的的数据整整体,即即实现了了整体数数据的结结构化。。数据模型型不仅描描述数据据本身,还描述了了数据之之间的联联系。数据不再再面向应应用,而而是面向向系统,,弹性更更大。存取方式更灵灵活,存取粒粒度可为数据据项。数据库系统的的特点2.数据的共享性性高、冗余度度低,易扩充充共享是指多用用户、多种应应用、多种语语言互相覆盖盖地共享数据据集合。数据据共享可减少少数据冗余,,节约存储空空间,避免数数据之间的不不相容性与不不一致性。数据不一致指指同一数据不不同拷贝的值值不同。数据面向系统统+结构化++数据共享→→系统易易扩充。数据库系统的的特点3.数据独立性高高包括数据的物理独立性和逻辑独立性物理独立性::指用户的应用用程序与存储储在磁盘上的的数据库中的的数据相互独独立。逻辑独立性::指用户的应用用程序与数据据库的逻辑结结构相互独立立。数据描述、定定义从应用程程序中分离出出来,独立于于应用程序而而存在,相互互独立,互不不依赖,大大大简化了应用用程序的设计计维护的工作作量。数据库系统的的特点4.数据由DBMS统一管理和控控制共享一般是并发的,即多个用用户可同时使使用数据库中中的数据。DBMS应提供如下功功能:数据安全性保保护数据完整性检检查(正确性性、有效性、、相容性)并发控制数据库恢复人工管理阶段文件系统阶段数据库系统阶段背景特点数据的结构化无结构数据管理技术术三个发展阶段段的详细比较较应用背景科学计算科科学计算算、管理大大规模管理硬件背景无直接存取存存储设备磁磁盘、磁鼓大大容量磁盘盘软件背景没有操作系统统有有文件系统统 有DBMS处理方式批处理实时处理、批批处理数据的管理者者用户(程序员员)文文件系统数数据库库管理系统数据面向的对对象某一应用程序序某某一应用现现实实世界数据的共享程程度无共享,冗余余度很大共享性差,冗冗余度大共享性高,冗冗余度小独立性差实时处理、分分布处理、批批处理具有高度的物物理独立性和和一定的逻辑辑独立性数据的独立性性不独立,完全全依靠于程序序记录内有结构构、整体无结结构整体结构化,,用数据模型型描述数据控制能力力应用程序自己己控制 文件件系统 数据据库管理系统统1.2数据库系统结结构数据库管理系系统角度:三级模式结构构最终用户角度度:单用户结构主从式结构分布式结构内部外部1.2数据库系统结结构单用户主从式结构分布式结构结构特点整个数据库系统在一台机器上,由一个用户独占,不同机器间不能共享数据。一个主机带多个终端的多用户系统。数据库系统在主机上,所有处理由主机完成,各用户通过终端并发地存取数据库共享资源。数据库中的数据在逻辑上是一个整体,但物理上分布在计算机网络的不同结点上。网络中的每个结点可以执行局部应用和全局应用。优点简单易实现。简单,数据易维护管理。难满足大公司对数据应用的需求。缺点不同部门数据不共享,冗余。用户数增多时主机负担重性能下降,系统可靠性不高。数据管理维护难,系统效率受网络制约。1.2数据库系统结结构1.2数据库系统结结构模式:是数据库中全全体数据的逻逻辑结构和特特征的描述。。实例:模式的一个具具体值。模式反映的是数据的结构及其联系-相对稳定实例反映的是数据库某一时刻的状态-相对变动第二章数数据模型12数据模型的概概念E-R模型3面向对象模型型2.1数据模型的概概念在数据库中用用数据模型这这个工具来抽象、表示和和处理现实世界中的的数据和信息息。通俗地讲讲数据模型就就是现实世界界的模拟.数据模型应满满足三方面要要求:能比较真实地模拟现实世界容易为人所理解便于在计算机机上实现数据的三个范范畴从事物的客观观特性到计算算机中的数据据表示,经历历了三个阶段段:存在于人们头头脑之外的客客观世界.现实世界在人人们头脑中的的反映,人们们把它用文字字和符号记载载下来。信息世界的信信息在机器世世界以数据形形式存储。现实世界信息世界

概念模型机器世界DBMS支持的数据模型转换认识抽象数据的三个范范畴1.信息世界相相关术语(1)实体:客观存在并并可相互区别别的事物。实体可以是具具体的对象((一个学生、、一辆汽车)),也可以是是抽象的事件件(一次借书书,一次比赛赛)。(2)实体集:性质相同的的同类实体的的集合。如:全体学生生,全国足球球联赛的所有有比赛。(3)属性:实体所具有有的某一特性性。一个实体可以以由若干个属属性来刻画,,每个属性有有一个值域和和类型。如::学生实体由由学号、姓名名等构成。(4)码:唯一标识实实体的属性或或属性集。如:学号是学学生实体的码码。数据的三个范范畴2.机器世界相关关术语:(1)字段(数据项项):标记实体属性性的命名单位位,是可以命命名的最小信信息单位,往往往和属性名名相同。例如:学生有有学号、姓名名、年龄、性性别等字段。。(2)记录:字段的有序集集合称为记录录。一般用一一个记录描述述一个实体。。例如:学生记记录:(学号号,姓名,年年龄,性别))。(3)文件:同一类记录的的汇集称为文文件。文件是是描述实体集集的。例如:所有学学生记录组成成了一个学生生文件。(4)码:能惟一标识文文件中每个记记录的字段或或字段集,与与实体的码相相对应。例如:学生的的学号可以作作为学生记录录的码。机器世界和信信息世界术语语的对应关系系:信息世界机机器世界实体…………………记录属性…………………字段(数据项项)实体集……………文件码…………………….码数据的三个范范畴以学生数据为为例表示信息息在三个世界界中的有关术术语及其联系系:2.2E-R模型基本概念(1)实体:现实世界中客客观存在并可可相互区别的的事物。(2)属性:实体所具有的的某一特性称称为属性。(3)码(key):唯一表示实体体的属性集称称为码。(4)域(Domain):属性的取值范范围。(5)实体集:具有相同特征征或能用同样样特征描述的的实体集合。。组成实体集的的各实体称为为实体集的外外延。例如:某单位位所有员工称称为实体集Employee的外延。(6)实体型:具有相同属性性的实体必然然具有共同的的特征和性质质。用实体名名及其属性名名集合来抽象象和刻画同类类实体,称为为实体型。例如:员工工(员工编编号、姓名名、部门、、性别、年年龄、职称称)就是一一个实体型型。基本概念(7)联系:实体内部的的联系:组成实体的的各属性之之间的联系系(如:学号号-姓名))。实体之间的的联系:不同实体集集之间的联联系。两个实体型型之间的联联系可分为为三类:1对1联系(1:1)1对多联系(1:n)多对多联系系(m:n)基本概念1对1联系:定义:若对对于实体集集A中的每一个个实体,实实体集B中至多有一个实体体与之联系系,反之亦亦然,则称称实体集A与实体集B具有一对一一联系,记记为1:1。例:部门---负责责人人实体型A联系名实体型B11位于部门负责人11基本本概概念念1对多多联联系系:定义义::若若对对于于实实体体集集A中的的每每一一个个实实体体,,实实体体集集B中有有n个实体体(n≥≥0)与之之联联系系,,反反之之,,对对于于实实体体集集B中的每每一一个个实实体体,,实实体体集集A中至多多只有一一个实实体与与之联联系,,则称称实体体集A与实体体集B具有一一对多多联系系,记记为1:n。例:部部门---员工实体型A联系名实体型B1n属于部门员工1N基本概概念多对多多联系系:定义::若对对于实实体集集A中的每每一个个实体体,实实体集集B中有n个实体(n≥≥0)与之联联系,,反之之,对对于对对于实实体集集B中的每一一个实实体,,实体体集A中也有有m个实体(m≥≥0)与之联联系,,则称称实体体集A与实体体集B具有多多对多多联系系,记记为m:n。例:学学生---课程实体型B实体型A联系名mn选课学生课程MN基本概概念同一实实体集集内的的各实实体之之间也也存在在着一一对一一、一一对多多和多多对多多的联联系.员工领导1n同一实实体集集内一一对多多联系系员工配偶11同一实实体集集内一一对一一联系系基本概概念一般地地,两两个以以上实实体型型之间间也存存在着着一对对一、、一对对多和和多对对多的的联系系.学生教师课程选课mnn三个实体型之间的多对多关系(8)弱实实体集集:在描述述实体体的过过程中中,有有些实实体集集的属属性可可能不不足以以形成成主码码,需需要依依赖其其他实实体集集中的的部分分属性性。这这样的的实体体集叫叫做弱弱实体体集,,不需需要依依赖其其他的的实体体的实实体集集称为为强实实体集集。例如一一个单单位的的员工工实体体集Employee与工作作履历历实体体集Career,则工工作履履历实实体集集Career是以职职工存存在为为前提提的,,即工工作履履历实实体集集Career是弱实实体集集。基本概概念图设计计用E-R图来描述述现实世世界的概概念模型型。E-R图提供了了表示实实体集、、属性和和联系的的方法。。实体名矩形框表示实体属性名椭圆形表示属性菱形表示联系联系名连接实体型与联系类型,也可用于表示实体与属性的联系并注明种类;对构成码的属性,在属性名下画一横线表示。n课程成绩选修m学号姓名学生注:用虚虚边矩形形和虚边边菱形分分别表示示弱实体体和弱实实体之间间的联系系。图设计确定实体体类型:几个实实体类型型及相应应的实体体名确定联系系类型:各实体体类型之之间是否否有联系系,是何何种联系系类型及及相应的的联系名名.连接实体体类型和和联系类类型,组组合成E-R图确定实体体类型和和联系类类型的属属性确定实体体类型的的码例:学生生选修课课程学生课程选修姓名学号系别成绩用矩形表表示实体用椭圆表表示实体体的属性性用无向边边把实体体与其属属性连接接起来用菱形表表示实体体间的联联系实体与联联系用线线段连接接并注明明类型mn课程号课程名学分图设计----ER图实例举例:为为仓库管管理设计计一个E-R模型,该该仓库主主要管理理零件的的入库、、出库和和采购等等事项;;仓库根根据需要要向外面面厂家((供应商商)订购购零件,,而许多多工程项项目需要要仓库供供应零件件;一个个仓库有有多个保保管员。。实体有::仓库:属性有仓仓库号、、仓库面面积、电电话号码码。零件:属性有零零件号、、名称、、规格、、单价、、描述。。供应商::属性有供供应商号号、姓名名、地址址、电话话号码、、帐号。。项目:属性有项项目号、、预算、、开工日日期。职工:属性有职职工号、、姓名、、年龄、、职称。。图设计----ER图实例实体之间间的联系系如下::一个仓库库可以存存放多种种零件,,一种零零件可以以存放在在多个仓仓库中,,某种零零件在某某个仓库库中的数数量用库库存量描描述。仓库:零件-m:n仓库:职工-1:n职工实体体集之间间-1:n供应商:项目:零件-m:n:p一个仓库库有多个个职工当当仓库保保管员,,一个职职工只能能在一个个仓库工工作。职工之间间具有领领导被领领导的关关系,即即仓库主主任领导导若干保保管员。。一个供应应商可以以供给若若干项目目多种零零件,每每个项目目可以使使用不同同供应商商供应的的零件,,每种零零件可由由不同供供应商供供给。图设计----ER图实例如果某个个部门的的概念模模型中涉涉及的实实体和实实体属性性较多,,可以把把实体及及其属性性在另一一个图上上画出。。实体及其其属性图图仓库仓库号面积电话号图设计----ER图实例供应商项目零件供应供应量库存仓库库存量职工领导工作nmpmn1n1n实体及其其联系图图图设计----ER图实例【例2.1】】某电力公公司的配配电物资资存放在在仓库中中,假设设一个仓仓库可以以存放多多种物资资,一种种配电物物资只能能存放在在一个仓仓库中;;一个配配电抢修修工程可可能需要要多种配配电物资资,一种种配电物物资可以以应用到到多个抢抢修工程程中。仓仓库包含含仓库编编号、仓仓库名称称仓库面面积等属属性,配配电物资资包含物物资编号号、物资资名称、、单价、、规格、、数量等等属性,,抢修工工程包含含工程编编号、工工程名称称、工程程开始日日期、工工程结束束日期、、工程状状态(工工程是否否完工))等属性性,某一一抢修工工程领取取某配电电物资时时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论