




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据管理技术的产生和发展数据库技术是应数据管理任务的需要而产 生的。数据的处理是指对各种数据进行收集、存 储、加工和传播的一系列活动的总和。 数据管理则是指对数据进行分类、组织、 编码、存储、检索和维护,它是数据处理 的中心问题。数据管理技术经历了人工管理、文件系统、 数据库系统三个阶段。人工管理阶段(20世纪50年代中期以前) 特点:(1)数据不保存(2)应用程序管理 数据,数据需要由应用程序自己管理,没 有相应的软件系统负责数据的管理工作。(3)数据不共享。(4)数据不具有独立性文件系统阶段(50年代后期一60年代中期) 特点:(1)数据可长期保存(2)由文件系统管理数据(3)数据共享性差
2、,冗余度大(4)数据独立性差 不容易扩充; 数据与程序之间仍缺乏独立性;是一个无 弹性的无结构的数据集合。数据库系统阶段(60年代一 )特点:(1) 数据结构化(2)数据的共享性高,冗余度 低,易扩充(3)数据独立性高物理独立性是指用户的应用程序与 存储在磁盘上的数据库中数据是相互独立 的。逻辑独立性是指用户的应用程序与 数据库的逻辑结构是相互独立的,数据独立性是由DBMS的二级映象功能 来保证的。(4)数据由DBMS统一管理和控制数据库的共享是并发的 (Concurrency)。DBMS还必须提供的数据控制功能:(1)数据的安全性(2)数据的完整性、正确性、有效性和 相容性(3)并发控制(4
3、)数据库恢复数据库技术的发展是沿着数据模型的主线 展开的。数据模型是现实世界数据特征的抽象。数据库中用数据模型这个工具来抽象、 表示和处理现实世界中的数据和信息。通 俗地讲数据模型就是现实世界的模拟。数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二 是容易为人所理解;三是便于在计算机上 实现。根据应用的不同目的,数据模型划分为两 类:概念模型(信息模型) 按用户的观 点来对数据和信息建模;主要用于数据库 设计。数据模型按计算机系统的观点对数据建模; 主要包括网状模型、层次模型、关系模型 等,主要用于DBMS的实现。数据模型的三个要素数据结构是所研究的对象类型的 集合。数据操作 是指对
4、数据库中各种 对象(型)的实例(值)允许执行的操作的集 合,包括操作及有关的操作规则。数据库 主要有检索和更新(包括插入、删除、修改) 两大类操作。数据操作是对系统动态特性 的描述数据的约束条件是一组完整性规则 的集合。完整性规则是给定的数据模型中数 据及其联系所具有的制约和依存规则,用 以限定符合数据模型的数据库状态以及状 态的变化,以保证数据的正确、有效、相 容。(1)实体客观存在并可相互区别的事物称为实 体。(2)属性 实体所具有的某一特性称 为属性。一个实体可以由若干个属性来刻 画。(3)码 唯一标识实体的属性集称 为码。(4)域属性的取值范围称为该属性的域。(5)实体型用实体名及其属
5、性集合来抽象和刻画同类实体,称为实体型。(6)实体集同型实体的集合称为实体集。(7)联系 在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息 世界中反映为实体(型)内部的联系和实体 (型)之间的联系。实体内部的联系通常是 指组成实体的各属性之间的联系。实体之 间的联系通常是指不同实体集之间的联 系。两个实体型之间的联系可以分为三类:一对一联系(1:1),一对多联系(1:n), 多对多联系(m:n),数据模型数据库领域中最常用的数据模型有四种 层次模型, 网状模型 关系模型 面向对象模型DBMS提供内模式描述语言(内模式DDL,或者存储模式DDL)来严格地定义 内模式。优点:数据库的二
6、级映象保证了数据库外模 式的稳定性,从而从底层保证了应用程序 的稳定性。数据和程序之间的独立性使得数据的 定义和描述可以从应用程序中分离出去。 另外,由于数据的存取由DBMS管理,用户 不必考虑存取路径等细节,从而简化了应 用程序的编制,大大减少了应用程序的维 护和修改。层次数据模型的优缺点优点:优点:很少几条命令就能操纵数据库,使 用简单;对于实体间联系是固定的,且预先 定义好的应用系统,采用层次模型性能优 于关系模型;良好的完整性支持;缺点:对于多对多联系,通过引入冗余数 据解决;对插入和删除操作限制多;查询子女结点必须通过双亲结点; 网状数据模型的优缺点优点: 能够更为直接地描述现实世界
7、; 具有良好的性能,存取效率较高;其DDL (数据定义语言)语言极其复 杂;数据独立性差;关系数据库的优缺点优点:建立在严格的数学概念的基础上的; 关系模型的概念单一;关系模型的存取路径对用户透明, 数据独立性高,安全保密性好; 缺点:查询效率不如非关系数据模型;数据库管理系统它是数据库系统的核心,是为数据 库建立、使用和维护而配置的软件; 建立在操作系统的基础上于操作系 统与用户之间的一层数据管理软 件;负责对数据进行同一的管理和 控制;DBMS的功能数据定义;数据操纵;数据库运行 管理;数据组织、存储和管理;数据库的建立和维护;数据通道接 口;DBMS的组成:数据定义语言及其翻译 处理程序
8、;数据操纵语言及其编译(或解释) 程序;数据库运行控制程序;实用程序1:实体:客观存在并可相互区别的 事物。2:模式:数据库中全体数据的逻辑结 构和特征的描述,是所有用户的公共数据 视图。3:候选码:关系中能唯一地标识一个 元组的属性或属性组。4:函数依赖:设R (U)是属性集U 上的关系模式,X,Y是U的子集,若对于 R (U)的任意一个可能的关系r,r中不可 能存在两个元组在X上的属性值相等,而 在Y上的属性值不等,则称X函数决定Y 或Y函数依赖于X,记为X Y。5:事务:用户定义的一个数据库操作 序列,这些操作要么全做,要么全不做, 是一个不可分割的工作单位。数据库系统的特点:数据结构化
9、,数据共享性高、冗余度低、 易扩充,数据独立性高,数据由DBMS统一 管理和控制。查询优化的一般准则:选择运算应尽可能先做。在执行连接前对关系适当地预处理。把投影运算和选择运算同时进行把投影同其前或其后的双目运算结合起来。把某些选择同在它前面要执行的笛 卡尔积结合起来成为一个连接运算。找出公共子表达式。:数据库设计的特点:数据库建设是 硬件、软件、干件的结合,把结构设计和 行为设计密切结合起来。事务的四个特性:原子性、一致性、 隔离性和持续性。数据库数据具有永久存储有组 织和可共享三个基本特点。试述数据、数据库、数据库系统、数 据库管理系统的概念。数据:描述事物的符号记录称为数据。数 据库:数
10、据库是长期储存在计算机内、有 组织的、可共享的数据集合。数据库中的 数据按一定的数据模型组织、描述和储存, 具有较小的冗余度、较高的数据独立性和 易扩展性,并可为各种用户共享。数据库 系统:数据库系统(DBS)是指在计算机 系统中引入数据库后的系统构成。数据库 系统由数据库、数据库管理系统(及其开 发工具)、应用系统、数据库管理员构成。 数据库管理系统:数据库管理系统(DBMS) 是位于用户与操作系统之间的一层数据管 理软件。DBMS主要功能包括数据定义功 能、数据操纵功能、数据库的运行管理功 能、数据库的建立和维护功能。使用数据库系统有什么好处?使用数据库系统的好处很多,例如可以 大大提高应
11、用开发的效率,方便用户的使 用,减轻数据库系统管理人员维护的负担 等。总之,使用数据库系统的优点是很多 的,既便于数据的集中管理,控制数据冗 余,可以提高数据的利用率和一致性,又 有利于应用程序的开发和维护。.试述文件系统与数据库系统的区别 和联系。区别:文件系统面向某一应用程序,共 享性差、冗余度大,独立性差,纪录内有 结构、整体无结构,应用程序自己控制。 数据库系统面向现实世界,共享性高、冗 余度小,具有高度的物理独立性和一定的 逻辑独立性,整体结构化,用数据模型描 述,由数据库管理系统提供数据安全性、 完整性、并发控制和恢复能力.试述数据模型的概念、数据模型的作 用和数据模型的三个要素。
12、数据模型是数据库中用来对现实世界 进行抽象的工具,是数据库中用于提供信 息表示和操作手段的形式构架。一般地讲, 数据模型是严格定义的概念的集合。这些 概念精确地描述系统的静态特性、动态特 性和完整性约束条件。因此数据模型通常 由数据结构、数据操作和完整性约束三部 分组成。数据结构:是所研究的对象 类型的集合,是对系统的静态特性的描述。 数据操作:是指对数据库中各种对象 (型)的实例(值)允许进行的操作的集 合,包括操作及有关的操作规则,是对系 统动态特性的描述。数据的约束条件: 是完整性规则的集合,完整性规则是给定 的数据模型中数据及其联系所具有的制约 和依存规则,用以限定符合数据模型的数 据
13、库状态以及状态的变化,以保证数据的 正确、有效、相容。.试述概念模型的作用。概念模型实际上是现实世界到机器世 界的一个中间层次。概念模型用于信息世 界的建模,是现实世界到信息世界的第一 层抽象,是数据库设计人员进行数据库设 计的有力工具,也是数据库设计人员和用 户之间进行交流的语言。.定义并解释概念模型中以下术语: 实体,实体型,实体集,属性,码,实体 联系图(E-R图)实体:客观存在并可以相互区分的事物 叫实体。实体型:具有相同属性的实体具 有相同的特征和性质,用实体名及其属性 名集合来抽象和刻画同类实体称为实体 型。实体集:同型实体的集合称为实体集。 属性:实体所具有的某一特性,一个实体
14、可由若干个属性来刻画。码:唯一标识实 体的属性集称为码。实体联系图:E-R图 提供了表示实体型、属性和联系的方法: 实体型:用矩形表示,矩形框内写明实体 名。属性:用椭圆形表示,并用无向边 将其与相应的实体连接起来。联系:用菱 形表示,菱形框内写明联系名,并用无向 边分别与有关实体连接起来,同时在无向 边旁标上联系的类型(1:1,1 : n或 m : n)。.试述网状、层次数据库的优缺点。 层次模型的优点主要有:1)模型简单, 对具有一对多的层次关系的部门描述非常 自然、直观,容易理解,2)用层次模 型的应用系统性能好,特别是对于那些实 体间联系是固定的预先定义好的应用,采 用层次模型来实现,
15、其性能优于关系模型; 3)次数据模型提供了良好的完整性支 持。层次模型的缺点主要有:1)现实 世界中很多联系是非层次性的,如多对多 联系、一个结点具有多个双亲等,层次模 型不能自然地表示这类联系。只能通过引 入冗余数据或引入虚拟结点来解决。2) 对插入和删除操作的限制比较多。3)查 询子女结点必须通过双亲结点。网状模型:网状数据模型的优点主要有:1)能够更为直接地描述现实世界,如一 个结点可以有多个双亲。2)具有良好的 性能,存取效率较高。网状数据模型的缺 点主要有:1)结构比较复杂,而且随 着应用环境的扩大,数据库的结构就变得 越来越复杂,不利于最终用户掌握。2) 其DDL,DML语言复杂,
16、用户不容易使 用。由于记录之间联系是通过存取路径实 现的,应用程序在访问数据时必须选择适 当的存取路径。因此,用户必须了解系统 结构的细节,加重了编写应用程序的负担。.试述关系模型的概念,定义并解释 以下术语:(1)关系(2)属性(3) 域(4)元组(5)主码(6)分 量(7)关系模式关系模型由关系数据结构、关系操作集 合和关系完整性约束三部分组成。在用户 观点下,关系模型中数据的逻辑结构是一 张二维表,它由行和列组成。(1)关系: 一个关系对应通常说的一张表。(2)属 性:表中的一列即为一个属性;(3)域: 属性的取值范围;(4)元组:表中的一 行即为一个元组;(5)码:表中的某个 属性组,
17、它可以唯一确定一个元组;(6) 分量:元组中的一个属性值;(7)关系 模式:对关系的描述,一般表示为关系名 (属性1,属性2,、,属性n九.试述关系数据库的特点。 关系数据模型具有下列优点: 1 关系模型 与非关系模型不同,它是建立在严格的数 学概念的基础上的。2关系模型的概念单 一。无论实体还是实体之间的联系都用关 系表示。操作的对象和操作的结果都是关 系。所以其数据结构简单、清晰,用户易 懂易用。3关系模型的存取路径对用户透 明,从而具有更高的数据独立性、更好的 安全保密性,也简化了程序员的工作和数 据库开发建立的工作。缺点:由于存取路 径对用户透明,查询效率往往不如非关系 数据模型。因此
18、为了提高性能,必须对用 户的查询请求进行优化,增加了开发数据 库管理系统软件的难度。.试述数据库系统三级模式结构,这 种结构的优点是什么?数据库系统的三级模式结构由外模式、 模式和内模式组成。外模式,亦称子模式 或用户模式,是数据库用户(包括应用程 序员和最终用户)能够看见和使用的局部 数据的逻辑结构和特征的描述,是数据库 用户的数据视图,是与某一应用有关的数 据的逻辑表示。模式,亦称逻辑模式,是 数据库中全体数据的逻辑结构和特性的描 述,是所有用户的公共数据视图。模式描 述的是数据的全局逻辑结构。外模式涉及 的是数据的局部的逻辑结构,通常是模式 的子集。内模式,亦称存储模式,是数据 在数据库
19、系统内部的表示,即对数据的物 理结构和存储方式的描述。数据库系统的 三级模式是对数据的三个抽象级别,它把 数据的具体组织留给DBMS管理,使用户 能逻辑抽象地处理数据,而不必关心数据 在计算机中的表示和存储。为了能够在内 部实现这三个抽象层次的联系和转换,数 据库系统在这三级模式之间提供了两层映 象:外模式/模式映象和模式/内模式映 象。正是这两层映象保证了数据库系统中 的数据能够具有较高的逻辑独立性和物理 独立性。.定义并解释以下术语:DDL、DMLDDL :数据定义语言。用来定义数据 库模式、外模式、内模式的语言。DML : 数据操纵语言。用来对数据库中的数据进 行查询、插入、删除和修改的
20、语句。.什么叫数据与程序的物理独立性?什 么叫数据与程序的逻辑独立性? 为什么 数据库系统具有数据与程序的独立性?数据与程序的逻辑独立性:当模式改 变时、由数据库管理员对各个外模式/模 式的映象作相应改变,可以使外模式保持 不变。应用程序是依据数据的外模式编写 的,从而应用程序不必修改,保证了数据 与程序的逻辑独立性,简称数据的逻辑独 立性。数据与程序的物理独立性:当数据 库的存储结构改变了,由数据库管理员对 模式/内模式映象作相应改变,可以使模 式保持不变,从而应用程序也不必改变。 保证了数据与程序的物理独立性,简称数 据的物理独立性。数据库管理系统在三级 模式之间提供的两层映象保证了数据库
21、系 统中的数据能够具有较高的逻辑独立性和 物理独立性。.试述数据库系统的组成。数据库系统一般由数据库、数据库管理 系统(及其开发工具)、应用系统、数据库 管理员和用户构成。.DBA的职责是什么?负责全面地管理和控制数据库系统。 具体职责包括:决定数据库的信息内 容和结构; 决定数据库的存储结构和 存取策略;定义数据的安全性要求和 完整性约束条件;监督和控制数据库 的试用和运行;数据库系统的改进和 重组。.系统分析员、数据库设计人员、应 用程序员的职责是什么?系统分析员负责应用系统的需求分 析和规范说明,系统分析员要和用户及 DBA相结合,确定系统的硬件软件配置, 并参与数据库系统的概要设计。数
22、据库设 计人员负责数据库中数据的确定、数据库 各级模式的设计。数据库设计人员必须参 加用户需求调查和系统分析,然后进行数 据库设计。在很多情况下,数据库设计人 员就由数据库管理员担任。应用程序员负 责设计和编写应用系统的程序模块,并进 行调试和安装。.试述关系模型的三个组成部分。关系模型由关系数据结构、关系操作集 合和关系完整性约束三部分组成。.试述关系数据语言的特点和分类。关系数据语言可以分为三类:关系代 数语言,域关系演算语言包括:元组关 系演算语言,具有关系代数和关系演算双 重特点的语言特点是,具有完备的表达 能力,是非过程化的集合操作语言,功能 强,能够嵌入高级语言中使用.定义并理解下
23、列术语,说明它们之间 的联系与区别:(1)域,笛卡尔积, 关系,元组,属性(2)主码,候选码, 外部码(3)关系模式,关系,关系数据库域:域是一组具有相同数据类型的值的 集合。笛卡尔积:给定一组域D1, D2,Dn,这些域中可以有相同的。 这组域的笛卡尔积为:D1XD2XXDn = ( dl,d2,dn ) I di?Di, i = 1 , 2,n 其中每一个元素 (dl,d2,dn )叫作一个n元 组(n-tuple )或简称元组(Tuple )。 元素中的每一个值di叫作一个分量 (Component )。关系:在域 D1, D2,Dn上笛卡尔积D1 X D2 XX Dn的子集称为关系,表
24、示为R ( D1, D2,Dn )元组:关系中的每个元素 是关系中的元组。属性:关系也是一个二 维表,表的每行对应一个元组,表的每列 对应一个域。由于域可以相同,为了加以 区分,必须对每列起一个名字,称为属性。 候选码:若关系中的某一属性组的值能唯 一地标识一个元组,则称该属性组为候选 码。主码:若一个关系有多个候选码,则 选定其中一个为主码。外部码:设F是基 本关系R的一个或一组属性,但不是关系 R的码,如果F与基本关系S的主码Ks 相对应,则称F是基本关系R的外部码, 简称外码。基本关系R称为参照关系,基 本关系S称为被参照关系或目标关系。关 系R和S可以是相同的关系。关系模式: 关系的描
25、述称为关系模式。它可以形式化 地表示为:R ( U,D,dom,F ) 其中R为关系名,U为组成该关系的属 性名集合,D为属性组U中属性所来自 的域,dom为属性向域的映象集合,F为 属性间数据的依赖关系集合。关系:在域 D1,D2,Dn上笛卡尔积D1 X D2 XX Dn的子集称为关系,表示为R(D1 , D2,Dn )关系是关系模 式在某一时刻的状态或内容。关系模式是 静态的、稳定的,而关系是动态的、随时 间不断变化的,因为关系操作在不断地更 新着数据库中的数据。关系数据库:关系 数据库也有型和值之分。关系数据库的型 也称为关系数据库模式,是对关系数据库 的描述,它包括若干域的定义以及在这
26、些 域上定义的若干关系模式。关系数据库的 值是这些关系模式在某一时刻对应的关系 的集合,通常就称为关系数据库。.试述关系模型的完整性规则。在参 照完整性中,为什么外部码属性的值也可 以为空?什么情况下才可以为空?关系模型的完整性规则是对关系的某种 约束条件。关系模型中可以有三类完整性 约束:实体完整性、参照完整性和用户定 义的完整性。其中实体完整性和参照完整 性是关系模型必须满足的完整性约束条 件,被称作是关系的两个不变性,应该由 关系系统自动支持。1)实体完整性规则:2)参照完整性规则:3)用户定义的完整 性是针对某一具体关系数据库的约束条 件。它反映某一具体应用所涉及的数据必 须满足的语义
27、要求。在参照完整性中,外部码属性的值可以为空,它表示该属性 的值尚未确定。但前提条件是该外部码属 性不是其所在关系的主属性。.等值连接与自然连接的区别是什 么?连接运算中有两种最为重要也最为常 用的连接,一种是等值连接,另一种是自 然连接。0为“=”的连接运算称为等值 连接。它是从关系R与S的笛卡尔积中 选取A、B属性值相等的那些元组。即 等值连接为:R A=B S = t r t s | t rE R A t sG S A t r A = t s :B 自然连接是一种特殊的等值连接,它要求两个关系中进行比较的分量必 须是相同的属性组,并且要在结果中把重 复的属性去掉。即若R和S具有相同的 属
28、性组B,则自然连接可记作:RS=t r t s | t rE R A t sG S A t r B = t s B .代数的基本运算有哪些?如何用这 些基本运算来表示其他的关系基本运算?在八种关系代数运算中,并、差、笛 卡尔积、投影和选择五种运算为基本的运 算。其他三种运算,即交、连接和除,均 可以用五种基本运算来表达。交运算:R? S = R-(R-S)连接运算 R S = ?A?B(R?S) A?B 除运算:R ( X,Y ) ?S ( Y, Z ) = ?X? - ?X ( ?X? ? ?Y(S) ?R ) X、 Y、Z为属性组,R中的Y和S中的Y 可以有不同的属性名,但必须出自相同的
29、域集。1 .试述SQL语言的特点。(1 )综合统一。SQL语言集数据定义 语言DDL、数据操纵语言DML、数据控 制语言DCL的功能于一体。(2 )高度非 过程化。用SQL语言进行数据操作,只要 提出“做什么”,而无须指明“怎么做”, 因此无需了解存取路径,存取路径的选择 以及SQL语句的操作过程由系统自动完 成。(3 )面向集合的操作方式。(4 ) 以同一种语法结构提供两种使用方式。SQL语言既是自含式语言,又是嵌入式语 言。(5 )语言简捷,易学易用。.试述SQL的定义功能。SQL 的数据定义功能包括定义表、定义 视图和定义索引。SQL语言使用CREATE TABLE语句建立基本表,ALT
30、ER TABLE语 句修改基本表定义,DROP TABLE语句删 除基本表;使用CREATE INDEX语句建立 索引,DROP INDEX语句删除索引;使用 CREATE VIEW 命令建立视图, DROP VIEW 语句删除视图。.什么是基本表?什么是视图?两者 的区别和联系是什么?.试述视图的优点。.所有的视图是否都可以更新?为什 么?. 哪类视图是可以更新的,哪类视图 是不可更新的?各举一例说明。.在嵌入式SQL中是如何区分SQL 语句和主语言语句的?在SQL语句前加上前缀 EXEC SQL。 SQL语句的结束标志则随主语言的不同而 不同。.在嵌入式SQL中是如何解决数据 库工作单元与
31、源程序工作单元之间通信 的?数据库工作单元与源程序工作单元 之间的通信主要包括:(1 ) SQL通信 区SQLCA,用来向主语言传递SQL语句 的执行状态信息,使主语言能够根据此信 息控制程序流程。(2 )主变量,1 )用 来实现主语言向SQL语句提供参数。2 ) 将SQL语句查询数据库的结果交主语言 进一步处理(3 )游标,解决集合性操作 语言与过程性操作语言的不匹配通过游标 逐一获取记录,并赋给主变量,交由主语 言进一步处理。.在嵌入式SQL中是如何协调SQL 语言的集合处理方式和主语言的单记录处 理方式的?用游标来协调这两种不同的处理方 式。游标区是系统为用户开设的一个数据 缓冲区,存放
32、SQL语句的执行结果,每个 游标区都有一个名字。用户可以通过游标 逐一获取记录,并赋给主变量,交由主语 言进一步处理。.试给出各类关系系统的定义:最小 关系系统;关系上完备的系统;全关系型 的关系系统。最小关系系统:一个系统可定义为最 小关系系统,当且仅当它:(1 )支持关 系数据库。从用户观点看,关系数据库由 表构成,并且只有表这一种结构。(2) 支持选择、投影和(自然)连接运算,对 这些运算不必要求定义任何物理存取路 径。关系上完备的系统:这类系统支持关 系数据结构和所有的关系代数操作。全关 系型的关系系统:这类系统支持关系模型 的所有特征。即不仅是关系上完备的而且 支持数据结构中域的概念
33、,支持实体完整 性和参照完整性。.试述全关系型系统应满足的十二条 准则,以及十二条基本准则的实际意义和 理论意义。关系模型的奠基人E.F.Codd具体地 给出了全关系型的关系系统应遵循的十二 条基本准则。从实际意义上看,这十二条 准则可以作为评价或购买关系型产品的标 准。从理论意义上看,它是对关系数据模 型的具体而又深入的论述,是从理论和实 际紧密结合的高度对关系型 DBMS的评 述。准则0 一个关系型的DBMS必须能 完全通过它的关系能力来管理数据库。准 则1信息准则。关系型DBMS的所有信息 都应在逻辑一级上用一种方法即表中的值 显式地表示。准则2保证访问准则。依 靠表名、主码和列名的组合
34、,保证能以逻 辑方式访问关系数据库中的每个数据项 (分量值)。准则3空值的系统化处 理。全关系型的DBMS应支持空值的概念, 并用系统化的方式处理空值。准则4基 于关系模型的动态的联机数据字典。数据 库的描述在逻辑级上应该和普通数据采用 同样的表示方式,使得授权用户可以使用 查询一般数据所用的关系语言来查询数据 库的描述信息。准则5统一的数据子语 言准则。准则6视图更新准则。所有理 论上可更新的视图也应该允许由系统更 新。准则7高级的插入、修改和删除操 作。准则8数据物理独立性。无论数据 库的数据在存储表示或存取方法上作任何 变化,应用程序和终端活动都保持逻辑上 的不变性。准则9数据逻辑独立性
35、。当 对基本关系进行理论上信息不受损害的任 何改变时,应用程序和终端活动都保持逻 辑上的不变性。准则10数据完整性的独 立性。关系数据库的完整性约束条件必须 是用数据库语言定义并存储在数据字典中 的,而不是在应用程序中加以定义的。准 则11分布独立性。关系型DBMS具有分 布独立性。准则12无破坏准则。如果一 个关系系统具有一个低级(指一次一个 记录)语言,则这个低级语言不能违背或 绕过完整性准则。.试述查询优化在关系数据库系统中 的重要性和可能性。重要性:关系系统的查询优化既是 RDBMS实现的关键技术又是关系系统的优 点所在。它减轻了用户选择存取路径的负 担。用户只要提出“干什么”,不必指
36、出 “怎么干”。查询优化的优点不仅在于用 户不必考虑如何最好地表达查询以获得较 好的效率,而且在于系统可以比用户程序 的“优化”做得更好。可能性:这是因 为:(1)优化器可以从数据字典中获 取许多统计信息,(2)如果数据库的 物理统计信息改变了,系统可以自动对查 询进行重新优化以选择相适应的执行计 划。在非关系系统中必须重写程序,而重 写程序在实际应用中往往是不太可能的。(3)优化器可以考虑数十甚至数百种不 同的执行计划,从中选出较优的一个,而 程序员一般只能考虑有限的几种可能性。(4)优化器中包括了很多复杂的优化技 术,这些优化技术往往只有最好的程序员 才能掌握。系统的自动优化相当于使得所
37、有人都拥有这些优化技术。.试述查询优化的一般准则。下面的优化策略一般能提高查询效 率:(1)选择运算应尽可能先做。(2) 把投影运算和选择运算同时进行。(3) 把投影同其前或其后的双目运算结合起来 执行。(4)把某些选择同在它前面要 执行的笛卡尔积结合起来成为一个连接运 算。(5)找出公共子表达式。(6 ) 选取合适的连接算法.试述查询优化的一般步骤。各个关系系统的优化方法不尽相同, 大致的步骤可以归纳如下:(1)把查 询转换成某种内部表示,通常用的内部表 示是语法树。(2)把语法树转换成标 准(优化)形式。即利用优化算法,把 原始的语法树转换成优化的形式。(3) 选择低层的存取路径。(4)生
38、成查询 计划,选择代价最小的。.理解并给出下列术语的定义:函数依 赖、部分函数依赖、完全函数依赖、传递 依赖、候选码、主码、外码、全码 (All-key) 、 1NF 、 2NF 、 3NF 、 BCNF 、 多值依赖、4NF。.试述数据库设计过程。这里只概要列出数据库设计过程的六 个阶段:1)需求分析2)概念结构设计3)逻辑结构设计4)数据库物理设计5) 数据库实施6)数据库运行和维护这是一 个完整的实际数据库及其应用系统的设计 过程。不仅包括设计数据库本身,还包括 数据库的实施、数据库运行和维护。设计 一个完善的数据库应用系统往往是上述六 个阶段的不断反复。54.试述数据库设计过程的各个阶
39、段上的 设计描述。各阶段的设计要点如下: 1) 需求分 析:准确了解与分析用户需求。2)概念 结构设计:通过对用户需求进行综合、归 纳与抽象,形成一个独立于具体DBMS的 概念模型。3)逻辑结构设计:将概念结 构转换为某个 DBMS 所支持的数据模型, 并对其进行优化。4)数据库物理设计: 为逻辑数据模型选取一个最适合应用环境 的物理结构。5)数据库实施:设计人员 运用DBMS提供的数据语言、工具及宿主 语言,根据逻辑设计和物理设计的结果建 立数据库,编制与调试应用程序,组织数 据入库,并进行试运行。6)数据库运行 和维护:在数据库系统运行过程中对其进 行评价、调整与修改。.试述数据库设计过程
40、中结构设计部分 形成的数据库模式。数据库结构设计的不同阶段形成数据 库的各级模式,即:在概念设计阶段形成 独立于机器特点,独立于各个DBMS产品 的概念模式,在本篇中就是E-R图;?在 逻辑设计阶段将 E-R 图转换成具体的数 据库产品支持的数据模型,如关系模型, 形成数据库逻辑模式;然后在基本表的基 础上再建立必要的视图(View),形成数 据的外模式; ? 在物理设计阶段,根据 DBMS特点和处理的需要,进行物理存储安 排,建立索引,形成数据库内模式。.试述数据库设计的特点。特点有:1)数据库建设是硬件、软件 和干件(技术与管理的界面)的结合。2) 从软件设计的技术角度看,数据库设计应 该
41、和应用系统设计相结合,也就是说,整 个设计过程中要把结构(数据)设计和行 为(处理)设计密切结合起来。57.需求分析阶段的设计目标是什么?调 查的内容是什么?需求分析阶段的设计目标是通过详细 调查现实世界要处理的对象,充分了解原 系统工作概况,明确用户的各种需求,然 后在此基础上确定新系统的功能。调查的 内容是“数据”和“处理”,即获得用户 对数据库的如下要求:(1)信息要求。 指用户需要从数据库中获得信息的内容与 性质。由信息要求可以导出数据要求,即 在数据库中需要存储哪些数据。(2)处 理要求。指用户要完成什么处理功能,对 处理的响应时间有什么要求,处理方式是 批处理还是联机处理。(3)安
42、全性与完 整性要求。. 数据字典的内容和作用是什么?数据字典是系统中各类数据描述的集 合。数据字典的内容通常包括:数据项、 数据结构、数据流、数据存储、处理过程 五个部分其中数据项是数据的最小组成单 位,若干个数据项可以组成一个数据结构。 数据字典通过对数据项和数据结构的定义 来描述数据流、数据存储的逻辑内容。数 据字典的作用:数据字典是关于数据库中 数据的描述,在需求分析阶段建立,是下 一步进行概念设计的基础,并在数据库设 计过程中不断修改、充实、完善。.什么是数据库的概念结构?试述其特 点和设计策略。概念结构是信息世界的结构,即概念 模型,其主要特点是:(1)能真实、充 分地反映现实世界,
43、包括事物和事物之间 的联系,能满足用户对数据的处理要求。 是对现实世界的一个真实模型。(2)易 于理解,从而可以用它和不熟悉计算机的 用户交换意见,用户的积极参与是数据库 的设计成功的关键。(3)易于更改,当 应用环境和应用要求改变时,容易对概念 模型修改和扩充。(4)易于向关系、网 状、层次等各种数据模型转换。概念结构 的设计策略通常有四种:1自顶向下。即 首先定义全局概念结构的框架,然后逐步 细化;2自底向上。即首先定义各局部应 用的概念结构,然后将它们集成起来,得 到全局概念结构;3逐步扩张。首先定义 最重要的核心概念结构,然后向外扩充, 以滚雪球的方式逐步生成其他概念结构, 直至总体概
44、念结构;4混合策略。即将自 顶向下和自底向上相结合,用自顶向下策 略设计一个全局概念结构的框架,以它为 骨架集成由自底向上策略中设计的各局部 概念结构。.什么叫数据抽象?试举例说明。数据抽象是对实际的人、物、事和概 念进行人为处理,抽取所关心的共同特性, 忽略非本质的细节,并把这些特性用各种 概念精确地加以描述,这些概念组成了某 种模型。如分类这种抽象是:定义某一类 概念作为现实世界中一组对象的类型。这 些对象具有某些共同的特性和行为。它抽 象了对象值和型之间的“ is member of ” 的语义。在E-R模型中,实体型就是这种 抽象。例如在学校环境中,李英是老师, 表示李英是教师类型中的
45、一员,则教师是 实体型,李英是教师实体型中的一个实体 值,具有教师共同的特性和行为:在某个 系某个专业教学,讲授某些课程,从事某 个方向的科研。.试述数据库概念结构设计的重要性和 设计步骤。重要性:数据库概念设计是整个数据 库设计的关键,将在需求分析阶段所得到 的应用需求首先抽象为概念结构,以此作 为各种数据模型的共同基础,从而能更好 地、更准确地用某一 DBMS实现这些需求。设计步骤:概念结构的设计方法有多 种,其中最经常采用的策略是自底向上方 法,该方法的设计步骤通常分为两步:第1 步是抽象数据并设计局部视图,第2步是 集成局部视图,得到全局的概念结构.什么是E-R图?构成E-R图的基本
46、要素是什么?E-R图为实体-联系图,提供了表示 实体型、属性和联系的方法,用来描述现 实世界的概念模型。构成E-R图的基本要 素是实体型、属性和联系,其表示方法为: 实体型:用矩形表示,矩形框内写明实体 名;属性:用椭圆形表示,并用无向边 将其与相应的实体连接起来;联系:用 菱形表示,菱形框内写明联系名,并用无 向边分别与有关实体连接起来,同时在无 向边旁标上联系的类型(1 :1, 1 : n 或 m : n)。.为什么要视图集成?视图集成的方法 是什么?在对数据库系统进行概念结构设计时 一般采用自底向上的设计方法,把繁杂的 大系统分解子系统。首先设计各个子系统 的局部视图,然后通过视图集成的
47、方式将 各子系统有机的融合起来,综合成一个系 统的总视图。这样设计清晰,由简到繁。 由于数据库系统是从整体角度看待和描述 数据的,因此数据不再面向某个应用而是 整个系统。因此必须进行视图集成,使得 数据库能被全系统的多个用户、多个应用 共享使用。一般说来,视图集成可以有两 种方式:多个分E-R图一次集成;逐 步集成,用累加的方式一次集成两个分 E-R图。无论采用哪种方式,每次集成局 部E-R图时都需要分两步走:(1)合并。 解决各分E-R图之间的冲突,将各分E-R 图合并起来生成初步E-R图。(2)修改 和重构。消除不必要的冗余,生成基本E-R 图。.什么是数据库的逻辑结构设计?试述 其设计步
48、骤。数据库的逻辑结构设计就是把概念结 构设计阶段设计好的基本E-R图转换为 与选用的DBMS产品所支持的数据模型相 符合的逻辑结构。:(1)将概念结构转 换为一般的关系、网状、层次模型;(2) 将转换来的关系、网状、层次模型向特定 DBMS支持下的数据模型转换;(3)对数 据模型进行优化。.试述把E-R图转换为DBTG模型和 关系模型的转换规则。E-R图向DBTG模型的转换规则:1) 每个实体型转换为记录型,实体的属性转 换为记录的数据项;2)实体型之间1 : n ( n N 1 )的联系转换为一个系,没 有任何联系的实体型转换为奇异系;3) K (K N 2)个实体型之间多对多的联系, 引入
49、一个连结记录,形成K个实体型和连 结记录之间的K个系。连结记录的属性由 诸首记录的码及联系属性所组成;4)同 一实体型内的 1 : n , n : m 联系, 引入连结记录,转换为两个系。66.你能给出由E-R图转换为IMS模型 的转换规则吗?E-R图向IMS模型的转换规则:1) 每个实体型转换为记录型,实体的属性转 换为记录的数据项; 2) 实体型之间 1 : n ( n N 1 )的联系转换记录型之间的 有向边;3)实体型之间m : n ( m1, n1 )的联系则分解成一对多联系,再根 据2)转换;4) K ( K N 2 )个实体 型之间多对多的联系,可先转换成多对两 个实体型之间的联
50、系,再根据3)转换。.规范化理论对数据库设计有什么指导 意义?规范化理论为数据库设计人员判断关 系模式优劣提供了理论标准,可用以指导 关系数据模型的优化,用来预测模式可能 出现的问题,为设计人员提供了自动产生 各种模式的算法工具,使数据库设计工作 有了严格的理论基础。.试述数据库物理设计的内容和步骤。数据库在物理设备上的存储结构与存 取方法称为数据库的物理结构,它依赖于 给定的DBMS。为一个给定的逻辑数据模 型选取一个最适合应用要求的物理结构, 就是数据库的物理设计的主要内容。数据 库的物理设计步骤通常分为两步:( 1 ) 确定数据库的物理结构,在关系数据库中 主要指存取方法和存储结构;(
51、2 )对物 理结构进行评价,评价的重点是时间和空 间效率。69.你能给出关系数据库物理设计的主要 内容吗?例如ORACLE数据库物理设计的 内容。对于关系数据库物理设计的内容主要 包括:?为关系模式选择存取方法;? 设计关系、索引等数据库文件的物理存储 结构。有关ORACLE数据库物理设计的内 容请参考其技术资料,根据上述内容进行 总结。.数据输入在实施阶段的重要性是什 么?如何保证输入数据的正确性?数据库是用来对数据进行存储、管理 与应用的,因此在实施阶段必须将原有系 统中的历史数据输入到数据库。数据量一 般都很大,而且数据来源于部门中的各个 不同的单位。数据的组织方式、结构和格 式都与新设
52、计的数据库系统有相当的差 距,组织数据录入就要将各类源数据从各 个局部应用中抽取出来,分类转换,最后 综合成符合新设计的数据库结构的形式, 输入数据库。因此这样的数据转换、组织 入库的工作是相当费力费时的工作。特别 是原系统是手工数据处理系统时,各类数 据分散在各种不同的原始表格、凭证、单 据之中。数据输入工作量更大。保证输入 数据正确性的方法:为提高数据输入工作 的效率和质量,应该针对具体的应用环境 设计一个数据录入子系统,由计算机来完 成数据入库的任务。在源数据入库之前要 采用多种方法对它们进行检验,以防止不 正确的数据入库。.什么是数据库的再组织和重构造?为 什么要进行数据库的再组织和重
53、构造?数据库的再组织是指:按原设计要求 重新安排存储位置、回收垃圾、减少指针 链等,以提高系统性能。数据库的重构造 则是指部分修改数据库的模式和内模式, 即修改原设计的逻辑和物理结构。数据库 的再组织是不修改数据库的模式和内模式 的。进行数据库的再组织和重构造的原因: 数据库运行一段时间后,由于记录不断增、 删、改,会使数据库的物理存储情况变坏, 降低了数据的存取效率,数据库性能下降, 这时DBA就要对数据库进行重组织。 DBMS 一般都提供数据重组织用的实用程 序。数据库应用环境常常发生变化,如增 加新的应用或新的实体,取消了某些应用, 有的实体与实体间的联系也发生了变化 等,使原有的数据库
54、设计不能满足新的需 求,需要调整数据库的模式和内模式。这 就要进行数据库重构造。.试述事务的概念及事务的四个特性。事务是用户定义的一个数据库操作 序列,这些操作要么全做要么全不做,是 一个不可分割的工作单位。事务具有四个 特性:原子性、一致性、隔离性和持续性)。 这个四个特性也简称为ACID特性。原子 性:事务是数据库的逻辑工作单位,事务 中包括的诸操作要么都做,要么都不做。 一致性:事务执行的结果必须是使数据库 从一个一致性状态变到另一个一致性状 态。隔离性:一个事务的执行不能被其他 事务干扰。即一个事务内部的操作及使用 的数据对其他并发事务是隔离的,并发执 行的各个事务之间不能互相干扰。持
55、续性: 持续性也称永久性,指一个事务一旦提交, 它对数据库中数据的改变就应该是永久性 的。接下来的其他操作或故障不应该对其 执行结果有任何影响。.为什么事务非正常结束时会影响数据 库数据的正确性,请列举一例说明之。事务执行的结果必须是使数据库从 一个一致性状态变到另一个一致性状态。 如果数据库系统运行中发生故障,有些事 务尚未完成就被迫中断,这些未完成事务 对数据库所做的修改有一部分已写入物理 数据库,这时数据库就处于一种不正确的 状态,或者说是不一致的状态。例如某工 厂的库存管理系统中,要把数量为Q的某 种零件从仓库1移到仓库2存放。则可 以定义一个事务 T , T 包括两个操作; Q1=Q
56、1-Q,Q2=Q2+Q。如果T非正常终 止时只做了第一个操作,则数据库就处于 不一致性状态,库存量无缘无故少了 Q。.数据库中为什么要有恢复子系统?它 的功能是什么?因为计算机系统中硬件的故障、软件 的错误、操作员的失误以及恶意的破坏是 不可避免的,这些故障轻则造成运行事务 非正常中断,影响数据库中数据的正确性, 重则破坏数据库,使数据库中全部或部分 数据丢失,因此必须要有恢复子系统。恢 复子系统的功能是:把数据库从错误状态 恢复到某一已知的正确状态(亦称为一致 状态或完整状态)。.数据库运行中可能产生的故障有哪几 类?哪些故障影响事务的正常执行?哪些 故障破坏数据库数据?数据库系统中可能发生
57、各种各样的 故障,大致可以分以下几类:(1)事务 内部的故障;(2)系统故障;(3)介 质故障;(4)计算机病毒。事务故障、 系统故障和介质故障影响事务的正常执 行;介质故障和计算机病毒破坏数据库数 据。.数据库恢复的基本技术有哪些?数据转储和登录日志文件是数据库 恢复的基本技术。当系统运行过程中发生 故障,利用转储的数据库后备副本和日志 文件就可以将数据库恢复到故障前的某个 一致性状态。.数据库转储的意义是什么?试比较 各种数据转储方法。数据转储是数据库恢复中采用的基 本技术。所谓转储即DBA定期地将数据库 复制到磁带或另一个磁盘上保存起来的过 程。当数据库遭到破坏后可以将后备副本 重新装入
58、,将数据库恢复到转储时的状态。 静态转储:在系统中无运行事务时进行的 转储操作。如上图所示。静态转储简单, 但必须等待正运行的用户事务结束才能进 行。同样,新的事务必须等待转储结束才 能执行。显然,这会降低数据库的可用性。 动态转储:指转储期间允许对数据库进行 存取或修改。动态转储可克服静态转储的 缺点,它不用等待正在运行的用户事务结 束,也不会影响新事务的运行。但是,转 储结束时后援副本上的数据并不能保证正 确有效。因为转储期间运行的事务可能修 改了某些数据,使得后援副本上的数据不 是数据库的一致版本。为此,必须把转储 期间各事务对数据库的修改活动登记下 来,建立日志文件。这样,后援副本加上
59、 日志文件就能得到数据库某一时刻的正确 状态。转储还可以分为海量转储和增量转 储两种方式。海量转储是指每次转储全部 数据库。增量转储则指每次只转储上一次 转储后更新过的数据。从恢复角度看,使 用海量转储得到的后备副本进行恢复一般 说来更简单些。但如果数据库很大,事务 处理又十分频繁,则增量转储方式更实用 更有效。.什么是日志文件?为什么要设立日志 文件?(1)日志文件是用来记录事务对 数据库的更新操作的文件。(2)设立日 志文件的目的是:进行事务故障恢复;进 行系统故障恢复;协助后备副本进行介质 故障恢复。79.登记日志文件时为什么必须先写日志 文件,后写数据库?把对数据的修改写到数据库中和把
60、 表示这个修改的日志记录写到日志文件中 是两个不同的操作。有可能在这两个操作 之间发生故障,即这两个写操作只完成了 一个。如果先写了数据库修改,而在运行 记录中没有登记这个修改,则以后就无法 恢复这个修改了。如果先写日志,但没有 修改数据库,在恢复时只不过是多执行一 次UNDO操作,并不会影响数据库的正确 性。所以一定要先写日志文件,即首先把 日志记录写到日志文件中,然后写数据库 的修改。.针对不同的故障,试给出恢复的策略 和方法。(即如何进行事务故障的恢复?系 统故障的恢复?介质故障恢复?)答:事务故障的恢复:事务故障的恢 复是由DBMS自动完成的,对用户是透明 的。DBMS执行恢复步骤是:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 ISO/IEC/IEEE 41062:2024 EN Software engineering - Life cycle processes - Software acquisition
- 【正版授权】 ISO 10924-4:2025 EN Road vehicles - Circuit breakers - Part 4: Medium circuit breakers with tabs (Blade type),Form CB15
- 【正版授权】 IEC TR 61364:1999 EN-D Nomenclature for hydroelectric powerplant machinery
- 2025年元旦晚会策划方案模板
- 元宵节主题活动方案2025年(精彩)
- 2025年幼儿园新学期个人工作方案
- 时尚知识全解析
- 护理科研文献检索与管理
- 护理临床教学病案讨论
- 生产简历工作总结
- JJF(皖) 181-2024 沥青混合料轮碾成型机校准规范
- 福建省高速公路施工标准化管理指南(工地建设)
- 航信Eterm指令及其功能描述与分类
- 2025-2030年中国钾肥项目可行性研究报告
- 2025-2030年中国中药保健饮料行业未来发展趋势及前景调研分析报告
- 2024ESC心房颤动管理指南解读-完整版
- 四川省成都市2025届高三一诊考试英语试卷含解析
- 2024医院与科研机构临床研究合作协议书3篇
- 模具厂三年规划
- 小学二年级《金斧头》中文故事
- 公司绿色可持续发展规划报告
评论
0/150
提交评论