《数据库系统基础》PPT课件.ppt_第1页
《数据库系统基础》PPT课件.ppt_第2页
《数据库系统基础》PPT课件.ppt_第3页
《数据库系统基础》PPT课件.ppt_第4页
《数据库系统基础》PPT课件.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 数据库系统基础,本章内容: 信息、数据的处理、数据库的发展。 层次模型、网状模型、关系模型的概念。 关系代数概念及运算、数据库设计及管理。 Access 2003数据库介绍。,8.1数据库系统概论,8.1.1数据库基本概念 1 数据、信息: 数据是一组表示数量、行动和目标的非随机的可鉴别的符号,它可以是字母、数字或其它符号,也可以是图形、声音等。信息是客观事物属性的反映,是经过加工处理并对人类客观行为产生影响的数据表现形式,具有可感知、可存储、可加工、可传递、可再生、可压缩等属性。数据必须经过加工处理之后才能成为信息,数据是信息的载体和表现形式。,2.数据处理 数据处理是对数据(包括数

2、值的和非数值的)进行分析和加工的技术过程。包括对各种原始数据的采集、整理、检索、计算、分析等的加工和处理。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。,3、数据库 数据库是“按照数据结构来组织、存储和管理数据的仓库”。 例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表中,这张表就可以看成是一个数据库。严格地讲,数据库是长期存在计算机内、有组织的、可共享的大量数据集合。数据库中的数据按一定的数据模型进行组织、描述、和存储,具有较小的冗余度、较高的数据独立

3、性和易扩展性,并可为用户共享。,4、数据库管理系统(DBMS) 数据库管理系统(database management system)是一种操纵和管理数据库的大型软件,是用于建立、使用和维护数据库,简称DBMS。它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。它的主要功能有:数据定义功能;数据存取功能;数据操纵功能;数据库运行管理功能;数据库的建立和维护功能等。,8.1.2 数据库管理技术的发展,1、人工管理阶段 这一阶段,大致是在50年代中期之前,当时计算机技术相对落后,计算机主要用于科学计算。硬件方面,计算机的外存只有磁带、卡片、纸带,没有磁盘等直接存取的存储设备,存储量非常

4、小;软件方面,没有操作系统,没有高级语言,数据处理的方式是批处理,也即机器一次处理一批数据,直到运算完成为止,然后才能进行另外一批数据的处理,中间不能被打断,原因是当时的外存如磁带、卡片等只能顺序输入。这一阶段数据管理的特点是:数据不保存、数据不能独立、数据是面向应用的。,2、文件系统阶段 从50年代后期到60年代中期,数据管理发展到文件系统阶段。此时的计算机不仅用于科学计算,还大量用于管理。硬件方面,外存储器有了磁盘等直接存取的存储设备。在软件方面,操作系统中已有了专门的管理数据软件,称为文件系统。处理方式上,不仅有了文件批处理,而且能够联机实时处理。这一时期的特点是:数据长期保留 、数据的

5、独立性、文件组织多样化、对数据的操作以记录为单位 。,3、数据库系统阶段 20世纪60年代后期随着计算机的广泛应用、数据量急剧增长、磁盘技术取得重要进展、系统软件进一步成熟,数据要求共享的呼声越来越强。在这样的背景下,从60年代后期开始,数据管理技术进入数据库系统阶段。在这一阶段,数据管理具有下面的特点:数据冗余小,易扩充 、数据独立于应用程序 、数据由DBMS统一管理和控制 。,8.2 数 据 模 型,8.2.1 概念模型 概念模型也称信息模型,是对真实世界中问题域内的事物的描述,是现实世界到机器世界的一个中间层次。它既是数据库设计的有力工具,也是数据库开发人员与用户之间进行交流的语言。它是

6、按用户的观点来对数据和信息建模,目前最常用的是实体-联系模型(E-R模型)。E-R模型中主要有实体、属性、实体间的联系等基本概念。,1、实体(Entity) 客观存在并可以相互区别的事物称为实体。实体可以是看得见、摸得着的具体事物,也可以是抽象的概念和关系。例如一名工人、一个学生、一门课程、一场篮球比赛和上下级关系等都是实体。,2、属性(Attribute) 实体所具有的某一特性称为属性。一个实体可以由若干个属性来描述。例如:“学生”这一个实体可以由学号、姓名、性别、出生年月等属性来描述。,3、关键字(Key) 能唯一标识实体的属性称为关键字,关键字可以是单个属性,也可以是组合属性。例如:学号

7、是学生实体的关键字,如果某个班中有同名不同性别的两个学生,则可用姓名和性别两个属性共同作为学生实体的关键字。,4、实体集(Entity Set) 同型实体的集合称为实体集。例如全体学生就是一个实体集,全体职工也是一个实体集。 5、联系(Relationship) 现实世界的事物彼此之间是有联系的,代表实体的数据之间也存在着联系,实体与实体的联系可分为三类:一对一联系、一对多联系、多对多联系。,8.2.2 数据模型,数据模型是数据库的框架,这个框架形式化地描述了数据库的数据组织形式,它是定义数据库的依据。常用的数据模型一般可分为两类:一是语义数据模型,如实体-联系模型(E-R模型)。面向对象模型

8、等;二是经典数据模型,如层次模型、网状模型和关系模型。 数据模型通常都是由数据结构、数据操作和数据约束条件三个要素组成。,(1)数据结构 数据结构是数据库研究对象类型的集合,反映系统的静态特性,主要用于描述数据的类型、内容、性质以及数据间的联系等。 (2)数据操作 数据操作是对数据库中各种对象的实例允许执行的操作的集合,用于描述系统的动态特性。数据库的操作主要有检索、插入、删除、修改。数据模型要定义这些操作的确切含义、操作符号、操作规则及实现操作的语言。 (3)数据约束条件 数据的约束条件是一组完整性规则的集合,用于限定数据库状态以及状态的变化,以保证数据的正确、有效和相容。,数据模型的分类,

9、(1)关系模型 用二维表格结构来表示实体以及实体间联系的数据模型称为关系数据模型(简称关系模型)。一个关系的逻辑结构就是一张二维表,它由行和列组成。 (2)层次模型 用树型(层次)结构表示实体类型及实体间联系的数据模型称为层次模型。每个结点表示一个记录类型,结点之间的连线表示记录类型间的联系,这种联系只能是父子联系。层次模型的特点是:1)有且仅有一个结点无双亲,这个结点为根节点;2)其它结点有且仅有一个双亲。,(3)网状模型 用有向图结构表示实体类型及实体间联系的数据结构模型称为网状模型,网状数据模型是一种比层次模型更具有普遍性的结构,它既允许多个结点没有双亲结点,又允许结点有多个双亲结点,此

10、外它还允许两个结点之间有多种联系。网状模型中每个结点表示一个记录类型(实体),每个记录类型可以包含若干个字段(实体的属性),结点间的连线表示记录类型(实体)之间的父子联系。,8.3 关系代数,关系代数是以关系为运算对象的一组高级运算的集合,是一种抽象的查询语言,用对关系的运算来表达查询,是研究关系数据语言的数学工具。关系代数的运算对象是关系,运算结果亦为关系。关系代数用到的运算符包括四类:集合运算符、专门的关系运算符、算术比较符和逻辑运算符,比较运算符和逻辑运算符是用来辅助专门的关系运算符进行操作的,所以关系代数按运算符的不同主要分为传统的集合运算和专门的关系运算两类。,8.3.1传统的集合运

11、算 传统的集合运算,如并、交、差、广义笛卡尔积。这类运算将关系看成元组的集合,其运算是以关系的行为单位来进行的。,1、并(Union) 设关系R和关系S都是n目关系(即两个关系都有n个属性),且相应的属性取自同一个域,则关系R与关系S的并运算由属于R或属于S的元组组成,其结果关系仍为n目关系。记作: , t是元组变量。 2、差(Difference) 设关系R和关系S都是n目关系(即两个关系都有n个属性),且相应的属性取自同一个域,则关系R与关系S的差运算由属于R而不属于S的所有元组组成,其结果关系仍为n目关系。记作:, t是元组变量。,3、交 设关系R和关系S都是n目关系(即两个关系都有n个

12、属性),且相应的属性取自同一个域,则关系R与关系S的交运算由既属于R又属于S的元组组成,其结果关系仍为n目关系。记作: , t是元组变量。,4、笛卡尔积 设关系R和关系S分别是r目关系s目的关系,R和S的广义笛卡尔积是一个(r+s)列的元组的集合。元组的前r列是关系R的一个元组,后s列是关系S的一个元组。若R有k1个元组,S有k2个元组,则关系R和关系S的广义笛卡尔积有k1k2个元组。,8.3.2专门的关系运算 专门的关系运算,如选择、投影、连接、除。这类运算表达了实用系统中应用最普遍的查询操作。,1、选择(Selection) 选择又称为限制(Restriction)。从关系R中选取满足给定

13、条件的元组构成一个新的关系。选择运算记作:F(R) = t|tR F(t)=真其中是选择运算符,其中F表示选择条件,由逻辑运算符、和等连接各个算术表达式组成,取逻辑值真或假。 逻辑表达式F的基本形式为: X1Y1,表示比较运算符,它可以是、或。X1、Y1等是属性名或常量或简单函数。选择运算实际上是从关系R中选取使逻辑表达式F为真的元组,这是从行的角度进行的运算。,2、投影(Projection) 设有关系R,在关系R中求指定的若干个属性列组成新的关系的运算称作投影,记作:A(R)= tA | tR 其中A为R中的属性列,投影是从列角度进行的运算。,3、连接(Join) 连接也称为连接,它是从两

14、个关系的笛卡尔积中选取属性间满足一定条件的元组。连接运算从R和S的笛卡尔积RS中选取(R关系)在A属性组上的值与(S关系)在B属性组上值满足比较关系的元组。 连接运算中有两种最为重要也最为常用的连接,一种是等值连接,另一种是自然连接。为“”的连接运算称为等值连接。它是从关系R与S的笛卡尔积中选取A、B属性值相等的那些元组。,4、 除(Division) 给定关系R(X,Y)和S(Y,Z),其中X, Y, Z为属性组。R中的Y与S中的Y可以有不同的属性名,但必须出自相同的域集。R与S的除运算得到一个新的关系P(X),P是R中满足下列条件的元组在X属性列上的投影:元组在X上分量值x的象集Yx包含S

15、在Y上投影的集合。记作:RS= trX | trRY (S)Yx ,8.4 数据库设计与管理,8.4.1 数据库设计 数据库设计(Database Design)是指对于一个给定的应用环境,设计优化的数据库逻辑模式和物理结构,并据此建立数据库及应用系统,使之能够有效地存储和管理数据,满足各种用户的应用需求。 大型数据库的设计和开发是一项庞大的工程,是涉及多学科的综合性技术。数据库建设和一般的软件系统的设计、开发和运行与维护有许多相同之处,更有其自身的特点。在设计过程中,必须把数据库的设计和对数据库中数据处理的设计紧密结合起来,将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照

16、,相互补充,以完善两方面的设计。,数据库的步骤: 1、需求分析 调查和分析用户的业务活动和数据的使用情况,弄清所用数据的种类、范围、数量以及它们在业务活动中交流的情况,充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,确定用户对数据库系统的使用要求和各种约束条件等,形成用户需求规约,然后在此基础上确定新系统的功能。,2、概念设计 将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计。概念结构独立于数据库逻辑结构,也独立于支持数据库的DBMS。它是现实世界与机器世界的中介,它一方面能够充分反映现实世界,包括实体和实体之间的联系,同时又易于向关系、网状、层次等各

17、种数据模型转换。它是现实世界的一个真实模型,易于理解,便于和不熟悉计算机的用户交换意见,使用户易于参与,当现实世界需求改变时,概念结构又可以很容易地作相应调整。因此概念结构设计是整个数据库设计的关键所在。概念设计阶段一般采取的方法是:自顶向下、自底向上、逐步扩张、混合策略,但无论采用哪种设计方法,一般都以E-R模型为工具来描述概念结构。,3、逻辑设计 概念设计的结果是得到一个与DBMS无关的概念模式,而逻辑设计的目的是把概念设计阶段设计好的全局概念模式转化为具体DBMS支持的数据模型相符合的逻辑结构。设计逻辑结构应该选择最适于描述与表达相应概念结构的数据模型,然后选择最合适的DBMS。但实际应

18、用中,往往数据库设计人员对DBMS没有挑选的余地,都是在指定的DBMS上进行逻辑结构的设计。设计逻辑结构时一般要分三步进行:将概念结构转换为一般的关系、网状、层次模型;将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换;对数据模型进行优化。最终得满足用户的信息要求、处理要求、安全性与完整性要求的数据模型。,4、物理设计 数据库最终是要存储在物理设备上的,为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的物理设计。物理结构依赖于给定的DBMS和硬件系统,因此设计人员必须充分了解所用DBMS的内部特征,特别是存储结构和存取方法。,5、验证设计 在上述设计的基

19、础上,收集数据并具体建立一个数据库,运行一些典型的应用任务来验证数据库设计的正确性和合理性。通常,一个大型数据库的设计过程往往需要经过多次循环反复,当设计的某步发现问题时,可能就需要返回到前面去进行修改。因此,在做上述数据库设计时就应考虑到今后修改设计的可能性和方便性。,6、数据库实施阶段 经过验证设计,初步确定数据库设计符合要求后就可以开始建立数据库了。数据库实施主要包括以下工作:(1)用所选用的DBMS提供的数据定义语言(DDL)来严格描述数据库结构。(2)组织数据入库,组织数据入库是数据库实施阶段最主要的工作。(3)编制与调试应用程序,数据库应用程序的设计应该与数据设计并行进行。(4)数

20、据库试运行,应用程序调试完成,,7、数据库试运行阶段 应用程序调试完成,并且已有一小部分数据入库后,就可以开始数据库的试运行。数据库试运行也称为联合调试,其主要工作包括: 功能测试,即实际运行应用程序,执行对数据库的各种操作,测试应用程序的各种功能。如果不满足要求,就要对应用程序进行修改、调整,直到达到设计要求为止;性能测试,即测量系统的性能指标,分析是否符合设计目标,如果测试达不到设计目标,则要返回物理设计阶段,重新调整物理结构,修改系统参数,某些情况下还要返回逻辑设计阶段,修改逻辑结构。,8.4.2 数据库管理 在数据库投入运行后,对数据库日常性的维护管理工作主要是由DBA(DataBas

21、e Administrator)完成的,它包括数据库的安全性、完整性控制。,1、数据库的转存和恢复 数据库的转存和恢复是数据库系统投入使用后最重要的维护管理工作之一。定期对数据库和日志文件进行备份,以保证一旦发生故障,能利用数据库备份及日志文件备份,尽快将数据库恢复到某种一致性状态,并尽可能减少对数据库的破坏。,2、数据库的安全性、完整性控制 DBA必须对数据库安全性和完整性控制负起责任。根据用户的实际需要授予不同的操作权限。另外,由于应用环境的变化,数据库的完整性约束条件也会变化,也需要DBA不断修正,以满足用户要求。,3、数据库性能的监督、分析和改进 目前许多DBMS产品都提供了监测系统性

22、能参数的工具,DBA可以利用这些工具方便地得到系统运行过程中一系列性能参数的值。DBA应该仔细分析这些数据,通过调整某些参数来进一步改进数据库性能。,4、数据库的重组织 数据库运行一段时间后,由于记录的不断增、删、改,会使数据库的物理存储变坏,从而降低数据库存储空间的利用率和数据的存取效率,使数据库的性能下降。这时DBA就要对数据库进行重组织,或部分重组织(只对频繁增、删的表进行重组织)。数据库的重组织不会改变原设计的数据逻辑结构和物理结构,只是按原设计要求重新安排存储位置,回收垃圾,减少指针链,提高系统性能。,5、数据库的重构造 当数据库应用环境发生变化,会导致实体及实体间的联系也发生相应的

23、变化,使原有的数据库设计不能很好地满足新的需求,从而不得不适当调整数据库的模式和内模式,这就是数据库的重构造。重构造数据库的程度是有限的。若应用变化太大,已无法通过重构数据库来满足新的需求,或重构数据库的代价太大,则表明现有数据库应用系统的生命周期已经结束,应该重新设计新的数据库系统,开始新数据库应用系统的生命周期了。,8.5 Access 数据库及应用,Access 2003 是Microsoft 公司推出的Office 2003 家族的成员之一。本节详细的介绍了Access 2003 数据库中表、查询、窗体与报表等对象的创建及使用方法,让读者对数据库及数据库对象建立一个初步的概念。对象是数据库最重要的组成部分,Access 2003数据库由7种对象组成,分别是表、查询、窗体、报表、页、宏和模块。,1、表 表是数据库中用来存储数据的对象,Access 2003允许一个数据库中包含多个表,用户可以在不同表存储不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论