db01--数据库系统概述_第1页
db01--数据库系统概述_第2页
db01--数据库系统概述_第3页
db01--数据库系统概述_第4页
db01--数据库系统概述_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Information 数据处理的中心问题是数据处理的中心问题是数据管理。数据管理。 数据管理是指对数据的数据管理是指对数据的组织组织、分类分类、编码编码、存储存储、检检索索和和维护维护。 随着计算机硬件和软件的发展,数据管理经历了随着计算机硬件和软件的发展,数据管理经历了人工人工管理管理、文件系统文件系统和和数据库系统数据库系统三个发展阶段。三个发展阶段。人工管理人工管理(50年代中期以前) 这一阶段计算机主要用于这一阶段计算机主要用于科学计算科学计算。 硬件中的外存只有卡片、纸带、磁带,没有磁盘等直接硬件中的外存只有卡片、纸带、磁带,没有磁盘等直接存取设备。存取设备。 软件只有汇编语言,没

2、有操作系统和管理数据的软件。软件只有汇编语言,没有操作系统和管理数据的软件。 数据处理的方式基本上是数据处理的方式基本上是批处理批处理。数据不进行保存数据不进行保存 没有专门的数据管理软件没有专门的数据管理软件 数据面向应用数据面向应用 基本上没有文件的概念基本上没有文件的概念 文件管理文件管理(50年代后期至60年代中期) 这一阶段,计算机不仅用于科学计算,还大量用于信息这一阶段,计算机不仅用于科学计算,还大量用于信息管理。管理。 大量的数据存储、检索和维护成为紧迫的需求。大量的数据存储、检索和维护成为紧迫的需求。 硬件有了磁盘、磁鼓等直接存储设备。硬件有了磁盘、磁鼓等直接存储设备。 在软件

3、方面,出现了高级语言和操作系统。在软件方面,出现了高级语言和操作系统。 操作系统中有了专门管理操作系统中有了专门管理数据的软件,一般称为文件数据的软件,一般称为文件系统。系统。 处理方式有批处理,也有处理方式有批处理,也有联机处理。联机处理。文件管理文件管理(50年代后期至60年代中期)优点:优点: 数据以文件形式可长期保存下来数据以文件形式可长期保存下来 文件系统可对数据的存取进行管理文件系统可对数据的存取进行管理 文件形式多样化文件形式多样化 程序与数据间有一定独立性程序与数据间有一定独立性缺点:缺点: 数据冗余度大数据冗余度大 数据独立性低数据独立性低 数据一致性差数据一致性差 数据库系

4、统阶段(数据库系统阶段(6060年代末开始)年代末开始)1. 1. 数据共享性高、冗余少数据共享性高、冗余少2. 2. 数据结构化数据结构化3. 3. 数据独立性高数据独立性高 数据的独立性是指数据的独立性是指 逻辑独立性和物理独立性逻辑独立性和物理独立性4.4.有统一的数据控制功能有统一的数据控制功能 高级数据库阶段高级数据库阶段 数据仓库与数据挖掘数据仓库与数据挖掘数据越来越丰富,我们却面临如下问题:数据越来越丰富,我们却面临如下问题: “ “数据丰富,但信息贫乏数据丰富,但信息贫乏”快速增长的海量数据收集、存放在大型和大量快速增长的海量数据收集、存放在大型和大量数据库中,却没有强有力的工

5、具,理解使用它数据库中,却没有强有力的工具,理解使用它们已远远超出了人的能力!们已远远超出了人的能力! 怎么解决这些问题?怎么解决这些问题? 数据仓库与数据挖掘数据仓库与数据挖掘重要的决定往往不是由数据量的多少(数据丰重要的决定往往不是由数据量的多少(数据丰富)决定的,而是善于从海量数据中提取有价富)决定的,而是善于从海量数据中提取有价值的数据。值的数据。-有什么工具吗?有什么工具吗? -数据挖掘与数据仓库数据挖掘与数据仓库 -将数据坟墓转换成知识的将数据坟墓转换成知识的“金块金块”作业:说明数据仓库与数据库的区别。作业:说明数据仓库与数据库的区别。 模型是对客观世界中复杂对象的描述。如同在建

6、筑设计和施工的不同阶段需要不同的图纸一样,如同在建筑设计和施工的不同阶段需要不同的图纸一样,在实施数据库应用中也需要使用不同的数据模型:在实施数据库应用中也需要使用不同的数据模型:概念模概念模型(也称信息模型)、逻辑模型和物理模型。型(也称信息模型)、逻辑模型和物理模型。概念模型独立于计算机系统,它完全不涉及信息在计算机概念模型独立于计算机系统,它完全不涉及信息在计算机系统中的表示,只是用来描述某个特定组织所关心的信息系统中的表示,只是用来描述某个特定组织所关心的信息结构,是按用户的观点对数据和信息建模,是对企业主要结构,是按用户的观点对数据和信息建模,是对企业主要数据对象的基本表示和概括性描

7、述,主要用于数据库设计。数据对象的基本表示和概括性描述,主要用于数据库设计。逻辑模型是直接面向数据库的逻辑结构的,通常有一组严格定义的,无二义性的语法和语义的数据库语言,人们可以用这种语言来定义、操纵数据库中的数据。物理模型是对数据最低层的抽象,它描述数据在磁盘或磁带上的存储方式和存取方法。从概念模型到逻辑模型的转换是由数据库设计人员完成的,从逻辑模型到物理模型的转换是由DBMS完成的,一般人员只需要了解逻辑模型就行了。是模型的一种,是现实世界数据特征的抽象。 数据模型通常由数据结构、数据操作和数据的约束条件三个要素组成。Hierarchical Model - - 树结构树结构Network

8、 Model - - 图结构图结构Relational Model - - 表表面向对象模型 OO Model -对象对象Hierarchical Model - - 树结构树结构 层次模型是数据库系统中最早出现的数据模型,采用层次模型的数据库的典型代表是IBM公司的IMS(Information Management System)数据库管理系统。 现实世界中,许多实体之间的联系都表现出一种很自然的层次关系,如家族关系,行政机构等。 层次模型用一棵“有向树”的数据结构来表示各类实体以及实体间的联系。在树中,每个结点表示一个记录类型,结点间的连线(或边)在树中,每个结点表示一个记录类型,结点间

9、的连线(或边)表示记录类型间的关系,每个记录类型可包含若干个字段,记表示记录类型间的关系,每个记录类型可包含若干个字段,记录类型描述的是实体,字段描述实体的属性,各个记录类型及录类型描述的是实体,字段描述实体的属性,各个记录类型及其字段都必须命名。其字段都必须命名。如果要存取某一记录型的记录,可以从根结点起,按照有向如果要存取某一记录型的记录,可以从根结点起,按照有向树层次向下查找。树层次向下查找。Hierarchical Model - - 树结构树结构 图1.9是层次模型有向树的示意图。 结点A为根结点,,F,G为叶结点, B,D为兄结点 层次模型有向树的示意图 ABCDEFNetwork

10、 Model - - 图结构图结构 现实世界中事物之间的联系更多的是非层次关系的,用层次现实世界中事物之间的联系更多的是非层次关系的,用层次模型表示这种关系很不直观,模型表示这种关系很不直观,网状模型网状模型克服了这一弊病,可以清晰的表示这种非层次关系。克服了这一弊病,可以清晰的表示这种非层次关系。 网状模型是一个网络。在数据库中,满足以下两个条件的数据网状模型是一个网络。在数据库中,满足以下两个条件的数据模型称为网状模型。模型称为网状模型。 1 1、允许一个以上的结点无父结点;、允许一个以上的结点无父结点; 2 2、一个结点可以有多于一个的父结点、一个结点可以有多于一个的父结点 由于在网状模

11、型中子结点与父结点的联系不是唯一的,所由于在网状模型中子结点与父结点的联系不是唯一的,所以要为每个联系命名,并指出与该联系有关的父结点和子以要为每个联系命名,并指出与该联系有关的父结点和子结点。结点。Network Model - - 图结构图结构R1与R4之间的联系被命名为L1,R1与R3之间的联系被命名为L2,R2与R3之间的联系被命名为L3,R3与R5之间的联系被命名为L4,R4与R5之间的联系被命名为L5。R1为R3和R4的父结点,R2也是R3的父结点。R1和R2没有父结点。 R3R1R2R4R5 关系数据库关系数据库已成为目前已成为目前应用最广泛应用最广泛的数据库系统,如现在广泛的数

12、据库系统,如现在广泛使用的小型数据库系统使用的小型数据库系统FoxproFoxpro、AccessAccess,大型数据库系统,大型数据库系统OracleOracle、InformixInformix、SybaseSybase、SQL ServerSQL Server等都是关系数据库系统。等都是关系数据库系统。数据库系统的结构通常通常DBMSDBMS把数据库从逻辑上分为三级,即把数据库从逻辑上分为三级,即外模式外模式、模模式式和和内模式内模式,它们分别反映了看待数据库的三个角度,它们分别反映了看待数据库的三个角度模式(模式(SchemaSchema)是数据库中全体数据的逻辑结构和特征的描)是数

13、据库中全体数据的逻辑结构和特征的描述,又称述,又称概念模式概念模式或或概念视图概念视图。视图视图可理解为一组记录的值,可理解为一组记录的值,用户或程序员看到和使用的数据库的内容。用户或程序员看到和使用的数据库的内容。模式处于三级结构的中间层,它是整个数据库实际存储的抽模式处于三级结构的中间层,它是整个数据库实际存储的抽象表示,也是对现实世界的一个抽象,是现实世界某应用环象表示,也是对现实世界的一个抽象,是现实世界某应用环境(企业或单位)的所有信息内容集合的表示,也是所有个境(企业或单位)的所有信息内容集合的表示,也是所有个别用户视图综合起来的结果,所以又称别用户视图综合起来的结果,所以又称用户

14、共同视图用户共同视图。它表示了数据库的整体数据。它表示了数据库的整体数据。由多个由多个“概念记录概念记录”组成,包含数据库的所有信息,也称组成,包含数据库的所有信息,也称“概念数据库概念数据库”、“DBADBA视图视图”。DBMS DBMS 提供模式描述语言(模式提供模式描述语言(模式 DDLDDL)来定义模式。)来定义模式。2. 2. 外模式外模式又称又称子模式子模式或或用户模式用户模式或或外视图外视图,是三级结构的最外层,是三级结构的最外层,个别用户只对整个数据库的一部分感兴趣,所以外视图是个别用户只对整个数据库的一部分感兴趣,所以外视图是个别用户看到和使用的数据库内容,因此也常把外视图称

15、个别用户看到和使用的数据库内容,因此也常把外视图称为用户数据库。为用户数据库。它由多种外记录值构成,这些记录值是概念视图的某一部它由多种外记录值构成,这些记录值是概念视图的某一部分的抽象表示。即个别用户看到和使用的数据库内容,也分的抽象表示。即个别用户看到和使用的数据库内容,也称称“用户用户DB”DB”。由多个由多个“外记录值外记录值”组成,是概念视图的某一部分的抽象组成,是概念视图的某一部分的抽象表示。表示。从逻辑关系上看,外模式包含于概念模式。从逻辑关系上看,外模式包含于概念模式。DBMS DBMS 提供子模式描述语言(子模式提供子模式描述语言(子模式 DDLDDL)来定义子模式。)来定义

16、子模式。3. 3. 内模式内模式又称又称存储模式存储模式或或内视图内视图,是三级结构中的最内层,也是靠,是三级结构中的最内层,也是靠近物理存储的一层,即与实际存储数据方式有关的一层,近物理存储的一层,即与实际存储数据方式有关的一层,由多个存储记录组成,但并非物理层,不必关心具体的存由多个存储记录组成,但并非物理层,不必关心具体的存储位置。储位置。DBMS DBMS 提供内模式描述语言(内模式提供内模式描述语言(内模式 DDLDDL)来定义内模式。)来定义内模式。在数据库系统中,外模式可有多个,而概念模式、内模式在数据库系统中,外模式可有多个,而概念模式、内模式只能各有一个。只能各有一个。内模式

17、是整个数据库实际存储的表示,而概念模式是整个内模式是整个数据库实际存储的表示,而概念模式是整个数据库实际存储的抽象表示,外模式是概念模式的某一部数据库实际存储的抽象表示,外模式是概念模式的某一部分的抽象表示。分的抽象表示。4. 4. 三级结构的优点三级结构的优点(1 1)保证数据的独立性。)保证数据的独立性。将模式和内模式分开,保证了数据的物理独立性;将模式和内模式分开,保证了数据的物理独立性;将外模式和模式分开,保证了数据的逻辑独立性。将外模式和模式分开,保证了数据的逻辑独立性。(2 2)简化了用户接口。)简化了用户接口。按照外模式编写应用程序或敲入命令,而不需了解数据库内按照外模式编写应用

18、程序或敲入命令,而不需了解数据库内部的存储结构,方便用户使用系统。部的存储结构,方便用户使用系统。(3 3)有利于数据共享。)有利于数据共享。在不同的外模式下可有多个用户共享系统中数据,减少了数在不同的外模式下可有多个用户共享系统中数据,减少了数据冗余。据冗余。(4 4)利于数据的安全保密)利于数据的安全保密。在外模式下根据要求进行操作,不能对限定的数据操作,保在外模式下根据要求进行操作,不能对限定的数据操作,保证了其他数据的安全。证了其他数据的安全。 5.数据库系统的二级映象数据库系统的三级模式是对数据的三个抽象级别,它使用户能逻辑地抽象地处理数据,而不必关心数据在计算机内部的存储方式,把数

19、据的具体组织交给 DBMS 管理。为了能够在内部实现这三个抽象层次的联系和转换,DBMS 在三级模式之间提供了二级映象功能。5.数据库系统的二级映象 A.A.模式模式/ /内模式映象内模式映象数据库中的模式和内模式都只有一个,所以模式/内模式映象是唯一的。它确定了数据的全局逻辑结构与存储结构之间的对应关系。 B.B.外模式外模式/ /模式映象模式映象数据库中的同一模式可以有任意多个外模式,对于每一个外模式,都存在一个外模式/模式映象。它确定了数据的局部逻辑结构与全局逻辑结构之间的对应关系。6.数据库系统外部体系结构数据库管理系统是对数据进行管理的大型系统软件,数据库管理系统是对数据进行管理的大

20、型系统软件,它是数据库系统的它是数据库系统的核心核心组成部分,组成部分,用户在数据库系统中的一切操作,包括数据定义、查用户在数据库系统中的一切操作,包括数据定义、查询、更新及各种控制,都是通过询、更新及各种控制,都是通过DBMSDBMS进行的。进行的。DBMSDBMS就是实现把用户意义下的抽象的逻辑数据处理转就是实现把用户意义下的抽象的逻辑数据处理转换成计算机中的具体的物理数据的处理软件,这给用户换成计算机中的具体的物理数据的处理软件,这给用户带来很大的方便。带来很大的方便。1. 数据定义DBMS提供数据定义语言DDL(Data Define Language)定义数据的模式、外模式和内模式三

21、级模式结构,定义模式/内模式和外模式/模式二级映象,定义有关的约束条件,例如,为保证数据库安全而定义的用户口令和存取权限,为保证正确语义而定义完整性规则。2. 数据操纵DBMS提供数据操纵语言DML(Data Manipulation Language)实现对数据库的基本操作,包括检索、插入、修改、删除等。SQL语言就是DML的一种。3. 数据库运行管理DBMS 对数据库的控制主要通过四个方面实现:数据的安全性控制数据的完整性控制多用户环境下的并发控制数据库的恢复以确保数据正确有效和数据库系统的正常运行。4. 数据库的建立和维护功能包括数据库的初始数据的装入,数据库的转储、恢复、重组织,系统性

22、能监视、分析等功能。5. 数据通信DBMS提供与其他软件系统进行通信的功能。实现用户程序与DBMS之间的通信,通常与操作系统协调完成。DBMSDBMS的组成的组成DBMS是许多“系统程序”所组成的一个集合。每个程序都有自己的功能,共同完成DBMS的一件或几件工作。1. 语言编译处理程序(1)数据定义语言DDL及其编译程序它把用DDL编写的各级源模式编译成各级目标模式,这些目标模式是对数据库结构信息的描述,而不是数据本身,它们被保存在数据字典中,供以后数据操纵或数据控制时使用。(2)数据操纵语言DML及其编译程序,实现对数据库的基本操作。DML有两类,一类是宿主型,嵌入在高级语言中,不能单独使用

23、;另一类是自主型或自含型,可独立地交互使用。2.系统运行控制程序,主要包括以下几部分:系统总控程序:是DBMS运行程序的核心,用于控制和协调各程序的活动;安全性控制程序:防止未被授权的用户存取数据库中的数据;完整性控制程序:检查完整性约束条件,确保进入数据库中的数据的正确性、有效性和相容性;并发控制程序:协调多用户、多任务环境下各应用程序对数据库的并以操作,保证数据的一致性;数据存取和更新程序:实施对数据库数据的检索、插入、修改、删除等操作;通信控制程序:实现用户程序与DBMS间的通信。 3.系统建立、维护程序,主要包括以下几部分:装配程序:完成初始数据库的数据装入;重组程序:当数据库系统性能

24、变坏时(如查询速度变慢),需要重新组织数据库,重新装入数据;系统恢复程序:当数据库系统受到破坏时,将数据库系统恢复到以前某个正确的状态。4. 数据字典(Data Dictionary,简称DD)用来描述数据库中有关信息的数据目录,包括数据库的三级模式、数据类型、用户名、用户权限等有关数据库系统的信息,起着系统状态的目录表的作用,帮助用户、DBA 、DBMS本身使用和管理数据库。DBMS的数据存取的过程在数据库系统中,DBMS与操作系统、应用程序、硬件等协同工作,共同完成数据各种存取操作,其中DBMS起着关键的作用。DBMS对数据的存取通常需要以下四步:1. 用户使用某种特定的数据操作语言向DBMS发出存

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论