版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第 6 6 章章 数据库技术与数据库技术与access 2003access 2003 目 录上一页下一页 结 束计算机文化基础2本章内容本章内容 6.1 数据库技术基础数据库技术基础 6.2 数据库设计数据库设计6.3 数据库管理系统数据库管理系统6.4 数据库管理系统数据库管理系统access 2003 目 录上一页下一页 结 束计算机文化基础36.1 数据库技术基础数据库技术基础 6.1.1 数据库的基本概念数据库的基本概念 6.1.2 数据库管理技术的发展数据库管理技术的发展 6.1.3 数据库系统的组成数据库系统的组成6.1.4 数据模型数据模型 6.1.5 关系数据库关系数据库返
2、 回 目 录上一页下一页 结 束计算机文化基础46.1.1 数据库的基本概念数据库的基本概念 1. 数据数据 数据是指存储在某一种媒体上能够识别的物理符数据是指存储在某一种媒体上能够识别的物理符号。数据的概念包括两个方面:其一是描述事物特号。数据的概念包括两个方面:其一是描述事物特性的数据内容;其二是存储在某一种媒体上的数据性的数据内容;其二是存储在某一种媒体上的数据形式。形式。 2. 数据处理数据处理 数据处理是指对各种形式的数据进行收集、存储、数据处理是指对各种形式的数据进行收集、存储、加工和传播的一系列活动的总和。加工和传播的一系列活动的总和。 3. 数据库数据库 数据库是长期存放在计算
3、机内的、有组织的、可数据库是长期存放在计算机内的、有组织的、可以表现为多种形式的可共享的数据集合。以表现为多种形式的可共享的数据集合。 目 录上一页下一页 结 束计算机文化基础56.1.1 数据库的基本概念数据库的基本概念 4. 数据库管理系统数据库管理系统 数据库管理系统(数据库管理系统(dbms)是对数据库进行管理)是对数据库进行管理的系统软件,它的职能是有效地组织和存储数据,的系统软件,它的职能是有效地组织和存储数据,获取和管理数据,接受和完成用户提出的访问数据获取和管理数据,接受和完成用户提出的访问数据的各种请求。的各种请求。 5. 数据库系统数据库系统 数据库系统是指拥有数据库技术支
4、持的计算机系数据库系统是指拥有数据库技术支持的计算机系统,它可以实现有组织地、动态地存储大量相关数统,它可以实现有组织地、动态地存储大量相关数据,提供数据处理和信息资源共享服务。据,提供数据处理和信息资源共享服务。 目 录上一页下一页 结 束计算机文化基础66.1.2 数据库管理技术的发展数据库管理技术的发展 数据管理技术的发展大致经历了人工管理、文数据管理技术的发展大致经历了人工管理、文件系统和数据库系统三个阶段。目前,数据仓件系统和数据库系统三个阶段。目前,数据仓库技术和库技术和xml数据库的发展也十分迅速。数据库的发展也十分迅速。 1. 人工管理阶段人工管理阶段 2. 文件系统阶段文件系
5、统阶段 3. 数据库系统阶段数据库系统阶段 1) 数据仓库系统数据仓库系统 2) xml数据库数据库 目 录上一页下一页 结 束计算机文化基础76.1.2 数据库管理技术的发展数据库管理技术的发展 -人工管理阶段人工管理阶段 20世纪世纪50年代中期以前,计算机主要用于年代中期以前,计算机主要用于科学计算。那时的计算机硬件方面,外存只有卡科学计算。那时的计算机硬件方面,外存只有卡片、纸带及磁带,没有磁盘等直接存取的存储设片、纸带及磁带,没有磁盘等直接存取的存储设备;软件方面,只有汇编语言,没有操作系统和备;软件方面,只有汇编语言,没有操作系统和高级语言,更没有管理数据的软件;数据处理的高级语言
6、,更没有管理数据的软件;数据处理的方式是批处理。这些决定了当时的数据管理只能方式是批处理。这些决定了当时的数据管理只能依赖人工来进行。依赖人工来进行。 目 录上一页下一页 结 束计算机文化基础8 人工管理阶段的主要特点如下:人工管理阶段的主要特点如下: (1)数据不进行保存;)数据不进行保存; (2)没有专门的数据管理软件;)没有专门的数据管理软件; (3)数据面向应用;)数据面向应用; (4)只有程序的概念。)只有程序的概念。人工管理阶段人工管理阶段 返 回 目 录上一页下一页 结 束计算机文化基础96.1.2 数据库管理技术的发展数据库管理技术的发展 -文件系统阶段文件系统阶段 20世纪世
7、纪60年代,随着科学技术的发展,计年代,随着科学技术的发展,计算机技术有了很大提高,计算机的应用范围也不算机技术有了很大提高,计算机的应用范围也不断扩大,不仅用于科学计算,还大量用于管理。断扩大,不仅用于科学计算,还大量用于管理。这时的计算机硬件已经有了磁盘、磁鼓等直接存这时的计算机硬件已经有了磁盘、磁鼓等直接存取的外存设备;软件则有了操作系统、高级语言,取的外存设备;软件则有了操作系统、高级语言,操作系统中的文件系统是专门用于数据管理的软操作系统中的文件系统是专门用于数据管理的软件;处理方式不仅有批处理,还增加了联机实时件;处理方式不仅有批处理,还增加了联机实时处理。处理。 目 录上一页下一
8、页 结 束计算机文化基础10文件系统阶段文件系统阶段 文件系统阶段的主要特点如下:文件系统阶段的主要特点如下: (1)数据可以长期保存在磁盘上;)数据可以长期保存在磁盘上; (2)文件系统提供了数据与程序之间的存取方法;)文件系统提供了数据与程序之间的存取方法; (3)数据冗余量大;)数据冗余量大; (4)文件之间缺乏联系,相对孤立,仍然不能反)文件之间缺乏联系,相对孤立,仍然不能反映客观世界各个事物之间错综复杂的联系。映客观世界各个事物之间错综复杂的联系。返 回 目 录上一页下一页 结 束计算机文化基础116.1.2 数据库管理技术的发展数据库管理技术的发展 -数据库系统阶段数据库系统阶段
9、20世纪世纪60年代末以来,计算机的应用更为广年代末以来,计算机的应用更为广泛,用于数据管理的规模也更为庞大,由此带来泛,用于数据管理的规模也更为庞大,由此带来数据量的急剧膨胀。计算机磁盘技术有了很大发数据量的急剧膨胀。计算机磁盘技术有了很大发展,出现了大容量的磁盘。在处理方式上,联机展,出现了大容量的磁盘。在处理方式上,联机实时处理的要求更多。这种变化促使了数据管理实时处理的要求更多。这种变化促使了数据管理手段的进步,数据库技术应运而生。手段的进步,数据库技术应运而生。 目 录上一页下一页 结 束计算机文化基础12数据库系统阶段数据库系统阶段 数据库系统阶段的主要特点如下:数据库系统阶段的主
10、要特点如下: (1)数据的结构化;)数据的结构化; (2)数据共享性好;)数据共享性好; (3)数据独立性好;)数据独立性好; (4)数据存储粒度小;)数据存储粒度小; (5)为用户提供了友好的接口。)为用户提供了友好的接口。返 回 目 录上一页下一页 结 束计算机文化基础13 数据管理三个阶段的比较数据管理三个阶段的比较 人人 工工 管管 理理 阶阶 段段 文文 件件 系系 统统 阶阶 段段 数数 据据 库库 系系 统统 阶阶 段段 背背景景应用背景应用背景 科学计算科学计算 科学计算、管理科学计算、管理 大规模管理大规模管理 硬件背景硬件背景 无直接存取存储设无直接存取存储设备备 磁盘、磁
11、鼓磁盘、磁鼓 大容量磁盘大容量磁盘 软件背景软件背景 无操作系统无操作系统 有文件系统有文件系统 有数据库管理系统有数据库管理系统处理方式处理方式 批处理批处理 联机实时处理、联机实时处理、批处理批处理 联机实时处理、分布处理、批处理联机实时处理、分布处理、批处理 特特点点数据的管理者数据的管理者 用户(程序员)用户(程序员) 文件系统文件系统 数据库管理系统数据库管理系统 数据面向的对象数据面向的对象 某一应用程序某一应用程序 某一应用某一应用 现实世界现实世界 数据的共享程度数据的共享程度 无共享,冗余度大无共享,冗余度大 共享性差,冗余共享性差,冗余度大度大 共享性高,冗余度小共享性高,
12、冗余度小 数据的独立性数据的独立性 不独立,完全依赖不独立,完全依赖于程序于程序 独立性差独立性差 具有高度的物理独立性和一定的逻具有高度的物理独立性和一定的逻辑独立性辑独立性 数据的结构化数据的结构化 无结构无结构 记录内有结构,记录内有结构,整体无结构整体无结构 整体结构化,用数据模型描述整体结构化,用数据模型描述 数据控制能力数据控制能力 应用程序自己控制应用程序自己控制 应用程序自己控应用程序自己控制制 由数据库管理系统提供数据安全性、由数据库管理系统提供数据安全性、完整性、并发控制和恢复能力完整性、并发控制和恢复能力 目 录上一页下一页 结 束计算机文化基础146.1.2 数据库管理
13、技术的发展数据库管理技术的发展 -数据仓库系统数据仓库系统 数据仓库技术是目前数据处理中发展十分迅数据仓库技术是目前数据处理中发展十分迅速的一个分支。所谓数据仓库,是对长期数据的速的一个分支。所谓数据仓库,是对长期数据的存储,这些数据来自于多个异种数据源。通过数存储,这些数据来自于多个异种数据源。通过数据仓库提供的联机分析处理(据仓库提供的联机分析处理(olap)工具,实)工具,实现多维数据分析,以便向管理决策层提供支持。现多维数据分析,以便向管理决策层提供支持。数据仓库系统允许将各种应用系统集成在一起,数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对海量为统一
14、的历史数据分析提供坚实的平台,对海量信息处理进行支持。目前数据仓库已经日渐成为信息处理进行支持。目前数据仓库已经日渐成为数据分析和联机分析处理的重要平台。数据分析和联机分析处理的重要平台。 目 录上一页下一页 结 束计算机文化基础15数据仓库系统数据仓库系统 数据仓库的主要特征如下:数据仓库的主要特征如下:(1)面向主题特性:围绕某一主题建模和分)面向主题特性:围绕某一主题建模和分析;析;(2)集成特性:将多个异种数据源以及事务)集成特性:将多个异种数据源以及事务记录集成在一起;记录集成在一起;(3)时变特性:数据存储从历史的角度提供)时变特性:数据存储从历史的角度提供信息;信息;(4)非易失
15、特性:总是物理地独立存放数据。)非易失特性:总是物理地独立存放数据。返 回 目 录上一页下一页 结 束计算机文化基础16数据库系统和数据仓库系统的区别数据库系统和数据仓库系统的区别 (1)面向的用户不同。数据库系统面向使用单位的低)面向的用户不同。数据库系统面向使用单位的低层人员,用于日常数据的分析和处理;数据仓库系统面层人员,用于日常数据的分析和处理;数据仓库系统面向的是使用单位的决策人员,提供决策支持。向的是使用单位的决策人员,提供决策支持。(2)数据内容不同。数据库系统存储和管理的是当前)数据内容不同。数据库系统存储和管理的是当前的数据;数据仓库系统存储的是长期积累的历史数据。的数据;数
16、据仓库系统存储的是长期积累的历史数据。(3)数据来源不同。数据库的数据一般来源于同种数)数据来源不同。数据库的数据一般来源于同种数据源,而数据仓库的数据可以来源于多个异种数据源。据源,而数据仓库的数据可以来源于多个异种数据源。(4)数据的操作不同。数据库系统提供了联机事务处)数据的操作不同。数据库系统提供了联机事务处理(理(oltp,on-line transaction processing)系统,而)系统,而数据仓库系统主要提供了联机分析处理(数据仓库系统主要提供了联机分析处理(olap,on-line analytical processing)和决策支持系统,实现数据)和决策支持系统,
17、实现数据挖掘和知识发现。挖掘和知识发现。返 回 目 录上一页下一页 结 束计算机文化基础176.1.2 数据库管理技术的发展数据库管理技术的发展 -xml数据库数据库 xml数据库是一种支持对数据库是一种支持对xml格式文档进行格式文档进行存储和查询等操作的数据管理系统。在系统中,存储和查询等操作的数据管理系统。在系统中,开发人员可以对数据库中的开发人员可以对数据库中的xml文档进行查询、文档进行查询、导出和指定格式的序列化。导出和指定格式的序列化。 xml(extensible markup language)即可扩)即可扩展标记语言,它与展标记语言,它与html一样,都是一样,都是sgml
18、(standard generalized markup language,标,标准通用标记语言)。准通用标记语言)。xml作为一种简单的数据作为一种简单的数据存储语言,仅仅使用一系列简单的标记来描述存储语言,仅仅使用一系列简单的标记来描述数据。虽然数据。虽然xml比二进制数据要占用更多的空比二进制数据要占用更多的空间,但间,但xml极其简单,易于掌握和使用,尤其极其简单,易于掌握和使用,尤其具有跨平台的特性。具有跨平台的特性。 目 录上一页下一页 结 束计算机文化基础186.1.3 数据库系统的组成数据库系统的组成数据库系统由四部分组成,即硬件系统、系统软件(包括操作系数据库系统由四部分组成
19、,即硬件系统、系统软件(包括操作系统和数据库管理系统)、数据库应用系统和各类人员。统和数据库管理系统)、数据库应用系统和各类人员。1. 硬件系统硬件系统 由于一般数据库系统的数据量很大,加之由于一般数据库系统的数据量很大,加之dbms丰富的强有力的丰富的强有力的功能使得自身的体积很大,因此,整个数据库系统对硬件资源提功能使得自身的体积很大,因此,整个数据库系统对硬件资源提出了较高的要求。出了较高的要求。2. 系统软件系统软件 系统软件主要包括操作系统、数据库管理系统、与数据库接口的系统软件主要包括操作系统、数据库管理系统、与数据库接口的高级语言及其编译系统,以及以高级语言及其编译系统,以及以d
20、bms为核心的应用程序开发工为核心的应用程序开发工具。具。3. 数据库应用系统数据库应用系统 数据库应用系统是为特定应用开发的数据库应用软件。数据库应用系统是为特定应用开发的数据库应用软件。4. 各类人员各类人员 参与分析、设计、管理、维护和使用数据库的人员均是数据库参与分析、设计、管理、维护和使用数据库的人员均是数据库系统的组成部分。这些人员包括数据库管理员、系统分析员、应系统的组成部分。这些人员包括数据库管理员、系统分析员、应用程序员和最终用户。用程序员和最终用户。 目 录上一页下一页 结 束计算机文化基础196.1.4 数据模型数据模型数据库是企业或组织所涉及的数据的提取和综合,数据库是
21、企业或组织所涉及的数据的提取和综合,它不仅反映数据本身,而且反映数据之间的联系。它不仅反映数据本身,而且反映数据之间的联系。数据库用数据模型对现实世界进行抽象,现有的数据库用数据模型对现实世界进行抽象,现有的数据库系统均是基于某种数据模型的。数据库系统均是基于某种数据模型的。数据库中最常见的数据模型有三种,即层次模型、数据库中最常见的数据模型有三种,即层次模型、网状模型和关系模型。网状模型和关系模型。 目 录上一页下一页 结 束计算机文化基础206.1.4 数据模型数据模型 -层次模型层次模型 若用图来表示,层次模型是一棵倒立的树。若用图来表示,层次模型是一棵倒立的树。在数据库中,满足以下两个
22、条件的数据模型在数据库中,满足以下两个条件的数据模型称为层次模型:称为层次模型: (1)有且仅有一个结点无父结点,这个结点称)有且仅有一个结点无父结点,这个结点称为根结点;为根结点; (2)其他结点有且仅有一个父结点。)其他结点有且仅有一个父结点。 在层次模型中,结点层次从根开始定义,根在层次模型中,结点层次从根开始定义,根为第一层,根的子结点为第二层,根为其子为第一层,根的子结点为第二层,根为其子结点的父结点,同一父结点的子结点称为兄结点的父结点,同一父结点的子结点称为兄弟结点,没有子结点的结点称为叶结点。弟结点,没有子结点的结点称为叶结点。 目 录上一页下一页 结 束计算机文化基础21层次
23、模型层次模型 下图是一个抽象层次模型,下图是一个抽象层次模型,r1为根结点;为根结点;r2和和r3为兄弟结点,并且是为兄弟结点,并且是r1的子结点;的子结点;r4和和r5为兄弟结点,并且是为兄弟结点,并且是r2的子结点;的子结点;r3、r4和和r5为叶结点。为叶结点。层次模型结构 目 录上一页下一页 结 束计算机文化基础226.1.4 数据模型数据模型 -网状模型网状模型 若用图来表示,网状模型是一个网络。在数据若用图来表示,网状模型是一个网络。在数据库中,满足以下两个条件之一的数据模型称为库中,满足以下两个条件之一的数据模型称为网状模型。网状模型。 (1)允许一个以上的结点无父结点;)允许一
24、个以上的结点无父结点; (2)允许结点可以有多于一个的父结点。)允许结点可以有多于一个的父结点。 由于在网状模型中子结点与父结点的联系不是由于在网状模型中子结点与父结点的联系不是唯一的,所以要为每个联系命名,并指出与该唯一的,所以要为每个联系命名,并指出与该联系有关的父结点和子结点。联系有关的父结点和子结点。 网状模型允许一个以上的结点无父结点或某一网状模型允许一个以上的结点无父结点或某一个结点有一个以上的父结点,从而构成了比层个结点有一个以上的父结点,从而构成了比层次结构复杂的网状结构。次结构复杂的网状结构。 目 录上一页下一页 结 束计算机文化基础23网状模型网状模型 下图是一个抽象网状模
25、型,下图是一个抽象网状模型,r1与与r2之间的联系被之间的联系被命名为命名为l1,r1与与r4之间的联系被命名为之间的联系被命名为l2,r3与与r4之间的联系被命名为之间的联系被命名为l3,r4与与r5之间的联之间的联系被命名为系被命名为l4,r2与与r5之间的联系被命名为之间的联系被命名为l5。r1为为r2和和r4的父结点,的父结点,r3也是也是r4的父结点。的父结点。r1和和r3没有父结点。没有父结点。 网状模型结构 目 录上一页下一页 结 束计算机文化基础246.1.4 数据模型数据模型 -关系模型关系模型关 系 模 型 把 世 界 看 作 是 由 实 体 (关 系 模 型 把 世 界
26、看 作 是 由 实 体 ( e n t i t y ) 和 联 系) 和 联 系(relationship)构成的。)构成的。所谓联系就是指实体之间的关系,即实体之间的对应关系。所谓联系就是指实体之间的关系,即实体之间的对应关系。联系可以分为三种:联系可以分为三种: (1)一对一的联系。如:一个班级只有一个班长,一个班长)一对一的联系。如:一个班级只有一个班长,一个班长只属于一个班级,班长和班级之间为一对一的联系。只属于一个班级,班长和班级之间为一对一的联系。 (2)一对多的联系。如:相同性别的人有许多个,一个人只)一对多的联系。如:相同性别的人有许多个,一个人只有一种性别,性别与人之间为一对
27、多的联系。有一种性别,性别与人之间为一对多的联系。 (3)多对多的联系。如:一个人可以选多门课,一门课可以)多对多的联系。如:一个人可以选多门课,一门课可以被很多人选,人与课程之间是多对多的联系。被很多人选,人与课程之间是多对多的联系。通过联系就可以用一个实体的信息来查找另一个实体的信息。通过联系就可以用一个实体的信息来查找另一个实体的信息。关系模型把所有的数据都组织到表中。表是由行和列组成的,关系模型把所有的数据都组织到表中。表是由行和列组成的,反映了现实世界中的事实和值。反映了现实世界中的事实和值。 目 录上一页下一页 结 束计算机文化基础25关系模型关系模型 满足下列条件的二维表,在关系
28、模型中,称为满足下列条件的二维表,在关系模型中,称为关系。关系。 (1)每一列中的分量是类型相同的数据;)每一列中的分量是类型相同的数据; (2)列的顺序可以是任意的;)列的顺序可以是任意的; (3)行的顺序可以是任意的;)行的顺序可以是任意的; (4)表中的分量是不可再分割的最小数据项,)表中的分量是不可再分割的最小数据项,即表中不允许有子表;即表中不允许有子表; (5)表中的任意两行不能完全相同。)表中的任意两行不能完全相同。 目 录上一页下一页 结 束计算机文化基础26关系模型关系模型 如下面给出的如下面给出的“学生基本情况表学生基本情况表”便是一个便是一个关系:关系: 学学 号号姓姓
29、名名性性 别别出生日期出生日期入学成绩入学成绩0802011001张张 莉莉女女1989-10-015400802011002董董 源源男男1988-01-255760802011003雷晓亮雷晓亮男男1990-10-066010802011004刘刘 萌萌女女1987-08-265560802011005李李 彬彬男男1991-06-14612 目 录上一页下一页 结 束计算机文化基础27关系模型关系模型 层次数据库是数据库系统的先驱,而网状数据库层次数据库是数据库系统的先驱,而网状数据库则为数据库在概念、方法、技术上的发展奠定了则为数据库在概念、方法、技术上的发展奠定了基础,它们是数据库技
30、术研究最早的两种数据库,基础,它们是数据库技术研究最早的两种数据库,而且也曾得到广泛的应用。但是,这两种数据库而且也曾得到广泛的应用。但是,这两种数据库管理系统存在着结构比较复杂、用户不易掌握、管理系统存在着结构比较复杂、用户不易掌握、数据存取操作必须按照模型结构中已定义好的存数据存取操作必须按照模型结构中已定义好的存取路径进行、操作比较复杂等缺点,这就限制了取路径进行、操作比较复杂等缺点,这就限制了这两种数据库管理系统的发展。这两种数据库管理系统的发展。 关系数据库以其数学理论基础完善、使用简单灵关系数据库以其数学理论基础完善、使用简单灵活、数据独立性强等特点,而被公认为是最有前活、数据独立
31、性强等特点,而被公认为是最有前途的一种数据库管理系统。途的一种数据库管理系统。 目 录上一页下一页 结 束计算机文化基础286.1.5 关系数据库关系数据库1. 关系数据库的基本概念关系数据库的基本概念(1)关系:)关系:一个关系就是一张二维表,每个关系有一个关系名。在计算机中,关系的数据存储在文件中,在access中,一个关系就是数据库文件中的一个表对象。(2)属性:)属性:二维表中垂直方向的列称为属性,有时也叫做一个字段。(3)域:)域:一个属性的取值范围叫做一个域。(4)元组:)元组:二维表中水平方向的行称为元组,有时也叫做一条记录。 (5)码:)码:又称为关键字。二维表中的某个属性或属
32、性组,若它的值唯一地标识了一个元组,则称该属性或属性组为候选码。若一个关系有多个候选码,则选定其中一个为主码,也称之为主键。(6)分量:)分量:元组中的一个属性值叫做元组的一个分量。(7)关系模式:)关系模式:是对关系的描述,它包括关系名、组成该关系的属性名、属性到域的映象。通常简记为:关系名(属性名1,属性名2,属性名n)。 目 录上一页下一页 结 束计算机文化基础29关系数据库关系数据库2. 关系运算关系运算对关系数据库进行查询时,若要找到用户关心的数据,就需要对关系数据库进行查询时,若要找到用户关心的数据,就需要对关系进行一定的关系运算。关系运算有两种:一种是传统的对关系进行一定的关系运
33、算。关系运算有两种:一种是传统的集合运算(并、差、交、广义笛卡儿积等);另一种是专门的集合运算(并、差、交、广义笛卡儿积等);另一种是专门的关系运算(选择、投影、连接)。关系运算(选择、投影、连接)。传统的集合运算不仅涉及关系的水平方向(即二维表的行),传统的集合运算不仅涉及关系的水平方向(即二维表的行),而且涉及关系的垂直方向(即二维表的列)。关系运算的操作而且涉及关系的垂直方向(即二维表的列)。关系运算的操作对象是关系,运算的结果仍为关系。专门的关系运算包括:对象是关系,运算的结果仍为关系。专门的关系运算包括:(1)选择:选择运算即在关系中选择满足指定条件的元组。)选择:选择运算即在关系中
34、选择满足指定条件的元组。(2)投影:投影运算是在关系中选择某些属性(列)。)投影:投影运算是在关系中选择某些属性(列)。(3)连接:连接运算是从两个关系的笛卡儿积中选取属性间)连接:连接运算是从两个关系的笛卡儿积中选取属性间满足一定条件的元组。满足一定条件的元组。 目 录上一页下一页 结 束计算机文化基础306.2 数据库设计数据库设计 6.2.1 数据库设计概述数据库设计概述 6.2.2 需求分析需求分析 6.2.3 概念设计概念设计6.2.4 逻辑设计逻辑设计6.2.5 物理设计物理设计 返 回 目 录上一页下一页 结 束计算机文化基础316.2.1 数据库设计概述数据库设计概述 1. 数
35、据库设计任务数据库设计任务数据库设计是指根据用户需求研制数据库结构的过程,数据库设计是指根据用户需求研制数据库结构的过程,具体地说,是指对于一个给定的应用环境,构造最优具体地说,是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能有的数据库模式,建立数据库及其应用系统,使之能有效地存储数据,满足用户的各种信息处理要求。效地存储数据,满足用户的各种信息处理要求。具体地说,数据库设计是把现实世界中的数据,根据具体地说,数据库设计是把现实世界中的数据,根据各种应用处理的要求,加以合理的组织,满足硬件和各种应用处理的要求,加以合理的组织,满足硬件和操作系统的特性,利用已有的
36、操作系统的特性,利用已有的dbms来建立能够实现来建立能够实现系统目标的数据库。系统目标的数据库。 返 回 目 录上一页下一页 结 束计算机文化基础32数据库设计概述数据库设计概述2. 数据库设计的阶段数据库设计的阶段一般来说,数据库的设计过程大致可分为五个阶段:一般来说,数据库的设计过程大致可分为五个阶段:(1)需求分析:调查和分析用户的业务活动和数据的使用情况,)需求分析:调查和分析用户的业务活动和数据的使用情况,弄清所用数据的种类、范围、数量以及它们在业务活动中交流的弄清所用数据的种类、范围、数量以及它们在业务活动中交流的情况,确定用户对数据库系统的使用要求和各种约束条件等,形情况,确定
37、用户对数据库系统的使用要求和各种约束条件等,形成用户需求规约。成用户需求规约。(2)概念设计:针对用户要求描述的现实世界(可能是一个工)概念设计:针对用户要求描述的现实世界(可能是一个工厂、一个商场或者一个学校等),通过对其中数据的分类、聚集厂、一个商场或者一个学校等),通过对其中数据的分类、聚集和概括,建立抽象的概念数据模型。和概括,建立抽象的概念数据模型。(3)逻辑设计:将现实世界的概念数据模型设计成数据库的一)逻辑设计:将现实世界的概念数据模型设计成数据库的一种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数种逻辑模式,即适应于某种特定数据库管理系统所支持的逻辑数据模式。与此同时,
38、可能还需要为各种数据处理应用领域产生相据模式。与此同时,可能还需要为各种数据处理应用领域产生相应的逻辑子模式。这一步设计的结果就是所谓的应的逻辑子模式。这一步设计的结果就是所谓的“逻辑数据库逻辑数据库”。 目 录上一页下一页 结 束计算机文化基础33数据库设计的阶段数据库设计的阶段 (4)物理设计;根据特定数据库管理系统所提供的多种存储结)物理设计;根据特定数据库管理系统所提供的多种存储结构和存取方法等依赖于具体计算机结构的各项物理设计措施,对构和存取方法等依赖于具体计算机结构的各项物理设计措施,对具体的应用任务选定最合适的物理存储结构(包括文件类型、索具体的应用任务选定最合适的物理存储结构(
39、包括文件类型、索引结构和数据的存放次序、存取方法和存取路径等)。这一步设引结构和数据的存放次序、存取方法和存取路径等)。这一步设计的结果就是所谓的计的结果就是所谓的“物理数据库物理数据库”。 (5)验证设计:在上述设计的基础上收集数据并具体建立一个)验证设计:在上述设计的基础上收集数据并具体建立一个数据库,运行一些典型的应用任务来验证数据库设计的正确性和数据库,运行一些典型的应用任务来验证数据库设计的正确性和合理性。一般来说,一个大型数据库的设计过程往往需要经过多合理性。一般来说,一个大型数据库的设计过程往往需要经过多次循环反复。当设计的某步发现问题时,可能就需要返回到前面次循环反复。当设计的
40、某步发现问题时,可能就需要返回到前面去进行修改,因此,在做上述数据库设计时就应考虑到今后修改去进行修改,因此,在做上述数据库设计时就应考虑到今后修改设计的可能性和方便性。设计的可能性和方便性。 目 录上一页下一页 结 束计算机文化基础346.2.2 需求分析需求分析 需求分析是数据库设计的第一步,是设计的基石。需求分需求分析是数据库设计的第一步,是设计的基石。需求分析是否能全面、准确地表达用户要求,将直接影响到后续各阶析是否能全面、准确地表达用户要求,将直接影响到后续各阶段的设计,影响到整个数据库设计的可用性和合理性。段的设计,影响到整个数据库设计的可用性和合理性。 1. 需求分析的内容和方法
41、需求分析的内容和方法 需求分析的目的是获取用户的信息要求、处理要求、安全需求分析的目的是获取用户的信息要求、处理要求、安全性要求和完整性要求。性要求和完整性要求。 需求分析阶段的任务一般分以下步骤:需求分析阶段的任务一般分以下步骤:(1)现行系统调研;)现行系统调研;(2)业务及需求分析;)业务及需求分析;(3)综合、调整;)综合、调整;(4)编写需求分析报告,以作为下一阶段设计的依据。)编写需求分析报告,以作为下一阶段设计的依据。 目 录上一页下一页 结 束计算机文化基础35需求分析需求分析2. 用户要求的描述和分析用户要求的描述和分析1)数据流图)数据流图 数据流图(数据流图(dfd,da
42、ta flow diagram)是结构化)是结构化分析方法(分析方法(sa,structured analysis)的工具之一,它)的工具之一,它描述数据处理过程,以图形化方式刻画数据流从输入描述数据处理过程,以图形化方式刻画数据流从输入到输出的变换过程。任何一个系统都可以抽象为如下到输出的变换过程。任何一个系统都可以抽象为如下图所示的情况。图所示的情况。 返 回 数据流抽象图 目 录上一页下一页 结 束计算机文化基础36需求分析需求分析2)数据字典)数据字典 数据字典(数据字典(dd,data dictionary)是对系统中数据的详)是对系统中数据的详尽描述,是各类数据属性的清单。对数据库
43、设计来讲,尽描述,是各类数据属性的清单。对数据库设计来讲,数据字典是进行详细的数据收集和数据分析所获得的主数据字典是进行详细的数据收集和数据分析所获得的主要结果。要结果。 数据字典是各类数据描述的集合,通常包括以数据字典是各类数据描述的集合,通常包括以下几个部分:下几个部分:(1)数据项:是数据的最小单位。)数据项:是数据的最小单位。(2)数据结构:是若干数据项有意义的集合。)数据结构:是若干数据项有意义的集合。(3)数据流:可以是数据项,也可以是数据结构。)数据流:可以是数据项,也可以是数据结构。(4)数据存储:处理过程中存取的数据。)数据存储:处理过程中存取的数据。 目 录上一页下一页 结
44、 束计算机文化基础376.2.3 概念设计概念设计概念设计是对数据的抽象和分析,它以对信息要概念设计是对数据的抽象和分析,它以对信息要求和处理要求的初步分析为基础,以数据流图和求和处理要求的初步分析为基础,以数据流图和数据字典提供的信息作为输入,运用信息模型工数据字典提供的信息作为输入,运用信息模型工具,发挥开发设计人员的综合抽象能力建立概念具,发挥开发设计人员的综合抽象能力建立概念模型。概念模型独立于数据逻辑结构,也独立于模型。概念模型独立于数据逻辑结构,也独立于dbms和计算机系统,是对现实世界有效而自然的和计算机系统,是对现实世界有效而自然的模拟。其主要特点如下:模拟。其主要特点如下:(
45、1)能充分地反映现实世界;)能充分地反映现实世界;(2)易于理解;)易于理解;(3)易于更动;)易于更动;(4)易于向关系、网状或层次等数据模型转换。)易于向关系、网状或层次等数据模型转换。 目 录上一页下一页 结 束计算机文化基础38概念设计概念设计 1. 概念设计的方法概念设计的方法概念设计可采用两种方法,即自顶而下和自底而上,分别如图概念设计可采用两种方法,即自顶而下和自底而上,分别如图1和和2所示所示 图1 自顶而下的方法图2 自底而上的方法 目 录上一页下一页 结 束计算机文化基础39概念设计概念设计2. 数据抽象与局部视图设计数据抽象与局部视图设计1)e-r模型模型 e-r方法是实
46、体方法是实体-联系方法(联系方法(entity-relationship approach)的简)的简称,是描述现实世界概念结构模型的有效方法。用称,是描述现实世界概念结构模型的有效方法。用e-r方法建立的概方法建立的概念结构模型称为念结构模型称为e-r模型,或称为模型,或称为e-r图,如图图,如图3所示。所示。图3 er模型图 目 录上一页下一页 结 束计算机文化基础40 现实世界的复杂性导致实体联系的复杂性。表现在现实世界的复杂性导致实体联系的复杂性。表现在e-r图上可以归结图上可以归结为以下几种基本形式:为以下几种基本形式:(1)两个实体集之间的联系,如图)两个实体集之间的联系,如图a所
47、示所示(2)两个以上实体集间的联系,如图)两个以上实体集间的联系,如图b所示。所示。(3)同一实体集内部各实体之间的联系,如图)同一实体集内部各实体之间的联系,如图c所示。所示。 实体联系类型 目 录上一页下一页 结 束计算机文化基础41概念设计概念设计2)数据抽象)数据抽象 e-r模型是对现实世界的一种抽象。所谓抽象模型是对现实世界的一种抽象。所谓抽象是对实际的人、物、事和概念进行人为处理,抽取是对实际的人、物、事和概念进行人为处理,抽取人们关心的本质特性,忽略非本质的细节,并把这人们关心的本质特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成些特性用各种概念精确地加
48、以描述,这些概念组成了某种模型。抽象一般有三种,分别是分类、聚集了某种模型。抽象一般有三种,分别是分类、聚集和概括。和概括。返 回 目 录上一页下一页 结 束计算机文化基础42概念设计概念设计 3)局部视图设计)局部视图设计 概念结构设计的第一步就是利用上面介绍概念结构设计的第一步就是利用上面介绍的抽象机制对需求分析阶段收集到的数据进的抽象机制对需求分析阶段收集到的数据进行分类、组织(聚集),形成实体、实体的行分类、组织(聚集),形成实体、实体的属性,标识实体的码,确定实体之间的联系属性,标识实体的码,确定实体之间的联系类型(类型(1 1,1 n,n m),设计局部视图),设计局部视图(也称局
49、部(也称局部e-r图)。具体做法是:图)。具体做法是: (1)选择局部应用;)选择局部应用; (2)逐一设计局部)逐一设计局部e-r图。图。返 回 目 录上一页下一页 结 束计算机文化基础43概念设计概念设计3. 视图集成视图集成设计好各子系统的局部视图后,还需要通过视图集成的方法,设计好各子系统的局部视图后,还需要通过视图集成的方法,将各子系统有机融合起来,综合成一个系统的总视图,如图将各子系统有机融合起来,综合成一个系统的总视图,如图4所所示。这样由局部到整体设计出的数据库,最终是从系统整体的示。这样由局部到整体设计出的数据库,最终是从系统整体的角度看待和描述数据的,因此数据不再面向某个应
50、用而是面向角度看待和描述数据的,因此数据不再面向某个应用而是面向整个系统。经过视图集成,使得数据库能被全系统的多个应用整个系统。经过视图集成,使得数据库能被全系统的多个应用共享使用。共享使用。 图4 视图集成局部-图合并(消除冲突)消除冗余集成视图集成视图基本-图初步-图分析规范化理论 目 录上一页下一页 结 束计算机文化基础44概念设计概念设计1)合并)合并 局部局部e-r图中语法和语义都相同的概念称为对应,局部图中语法和语义都相同的概念称为对应,局部e-r图之间的不一致称为冲突。合并局部图之间的不一致称为冲突。合并局部e-r图就是尽量合并对应图就是尽量合并对应的部分,保留特殊的部分,着重解
51、决冲突的部分。各局部的部分,保留特殊的部分,着重解决冲突的部分。各局部e-r图面向不同的局部应用,而通常由不同开发设计人员进行局部图面向不同的局部应用,而通常由不同开发设计人员进行局部e-r图设计,因此,各个局部图设计,因此,各个局部e-r图间的冲突是难免的。一般图间的冲突是难免的。一般来讲,冲突分为命名冲突、属性冲突和结构冲突。来讲,冲突分为命名冲突、属性冲突和结构冲突。2)消除冗余)消除冗余 冗余包括冗余数据和实体间冗余的联系。冗余数据指可由冗余包括冗余数据和实体间冗余的联系。冗余数据指可由其他数据导出的数据;冗余联系是指可由其他联系导出的联系。其他数据导出的数据;冗余联系是指可由其他联系
52、导出的联系。冗余数据和冗余联系会破坏数据库的完整性,增加数据库管理冗余数据和冗余联系会破坏数据库的完整性,增加数据库管理的困难,应该消除。的困难,应该消除。 注意:注意:但并非所有的冗余都应去掉,对于访问频率高的冗余但并非所有的冗余都应去掉,对于访问频率高的冗余数据应适当保留,同时加强数据完整性约束,如设计触发器等。数据应适当保留,同时加强数据完整性约束,如设计触发器等。消除冗余后得到基本消除冗余后得到基本e-r图。图。 目 录上一页下一页 结 束计算机文化基础456.2.4 逻辑设计逻辑设计 逻辑设计是在数据库概念设计的基础上,将概念结构设计阶段得到逻辑设计是在数据库概念设计的基础上,将概念
53、结构设计阶段得到的独立于的独立于dbms和计算机系统的概念模型转换成特定和计算机系统的概念模型转换成特定dbms所支持的数所支持的数据模型。据模型。 e-r图向关系模型的转换图向关系模型的转换 : e-r图由实体、联系和属性组成,图由实体、联系和属性组成,e-r图向关系模型的转换就是将实图向关系模型的转换就是将实体、联系、属性转换为关系模式。转换原则如下:体、联系、属性转换为关系模式。转换原则如下:1)实体转换为关系模型)实体转换为关系模型 用关系模型表示实体是很直接的,实体的名称就是关系的名称,实用关系模型表示实体是很直接的,实体的名称就是关系的名称,实体的属性就是关系的属性,实体的主键就是
54、关系的主键。体的属性就是关系的属性,实体的主键就是关系的主键。2)联系转换为关系模型)联系转换为关系模型 (1)一对一联系的转换:若实体间的联系是)一对一联系的转换:若实体间的联系是1 1,则选择两个实体,则选择两个实体类型转换成的关系模式中的任意一个关系模式,在其属性中加入另一类型转换成的关系模式中的任意一个关系模式,在其属性中加入另一个关系模式的键和联系类型的属性。个关系模式的键和联系类型的属性。 (2)一对多联系的转换:若实体间的联系是)一对多联系的转换:若实体间的联系是1 n,则可以在,则可以在“n”端端实体类型转换成的关系模式中,加入实体类型转换成的关系模式中,加入“1”端实体类型的
55、键和联系类型端实体类型的键和联系类型的属性。的属性。 (3)多对多联系的转换:若实体间的联系是)多对多联系的转换:若实体间的联系是m n,则可以把联系类,则可以把联系类型也转换成关系模式。型也转换成关系模式。 目 录上一页下一页 结 束计算机文化基础466.2.5 物理设计物理设计 物理设计是以逻辑设计结果作为输入,结合物理设计是以逻辑设计结果作为输入,结合dbms特征与存储设备特性设计出适合应用环特征与存储设备特性设计出适合应用环境的物理结构。数据库物理结构是数据库在物境的物理结构。数据库物理结构是数据库在物理设备上的存储结构和存取方法。数据库物理理设备上的存储结构和存取方法。数据库物理设计
56、的目的是提高系统处理效率,充分利用计设计的目的是提高系统处理效率,充分利用计算机的存储空间。算机的存储空间。 一般来讲,数据库物理设计分为两步,即数据一般来讲,数据库物理设计分为两步,即数据库物理设计和性能评价。库物理设计和性能评价。 目 录上一页下一页 结 束计算机文化基础47物理设计物理设计1. 数据库物理设计数据库物理设计 数据库物理设计主要是确定文件组织、分块技术、缓冲区大数据库物理设计主要是确定文件组织、分块技术、缓冲区大小及管理方式、数据在存储器上的分布等。小及管理方式、数据在存储器上的分布等。1)数据簇集设计)数据簇集设计 数据簇集就是把有关的元组集中在一个物理块内或物理上相数据
57、簇集就是把有关的元组集中在一个物理块内或物理上相邻的区域,以提高访问某些数据的速度。邻的区域,以提高访问某些数据的速度。 数据簇集建立以后,簇集键相同的元组存放在一起,因而簇数据簇集建立以后,簇集键相同的元组存放在一起,因而簇集键不必在每个元组中重复存储,只需在一组中存储一次即可,集键不必在每个元组中重复存储,只需在一组中存储一次即可,因此可以节约一些存储空间。簇集键可以是单属性的,也可以是因此可以节约一些存储空间。簇集键可以是单属性的,也可以是复合的。复合的。 簇集对于某些特定的应用可以明显地提高性能。一般来说,簇集对于某些特定的应用可以明显地提高性能。一般来说,用户应用满足以下条件时考虑创
58、建簇集。用户应用满足以下条件时考虑创建簇集。 (1)通过簇集键进行访问或连接是该关系的主要应用,与簇)通过簇集键进行访问或连接是该关系的主要应用,与簇集无关的其他访问很少或是次要的。集无关的其他访问很少或是次要的。 (2)对应每个簇集键值的平均元组既不太少,也不太多。)对应每个簇集键值的平均元组既不太少,也不太多。 (3)簇集键的值相对稳定(更新、插入、删除操作少),以)簇集键的值相对稳定(更新、插入、删除操作少),以减少修改簇集键值所引起的维护开销。减少修改簇集键值所引起的维护开销。 (4)对查询某一范围的值,最好在相关属性上建立簇集索引。)对查询某一范围的值,最好在相关属性上建立簇集索引。
59、 目 录上一页下一页 结 束计算机文化基础482)索引的选择)索引的选择 索引是为了加速对表中数据进行检索而创建的一种分散索引是为了加速对表中数据进行检索而创建的一种分散存储结构。索引是表的关键字,它提供了指向表中记录行的存储结构。索引是表的关键字,它提供了指向表中记录行的指针。合理建立索引可以提高数据检索速度,加速关系连接,指针。合理建立索引可以提高数据检索速度,加速关系连接,强制操作的唯一性。强制操作的唯一性。 一般来说,建立索引需考虑以下原则:一般来说,建立索引需考虑以下原则: (1)考虑建立索引的属性:)考虑建立索引的属性: 主关键字。主关键字。 连接中频繁使用的属性。连接中频繁使用的
60、属性。 (2)不考虑建立索引的属性:)不考虑建立索引的属性: 很少或从来不在查询中出现的属性。很少或从来不在查询中出现的属性。 属性值很少的属性。属性值很少的属性。 小表(记录很少的表)。小表(记录很少的表)。 经常更新的属性或表。经常更新的属性或表。 属性值分布不均,在几个值上很集中。属性值分布不均,在几个值上很集中。 过长的属性。过长的属性。 目 录上一页下一页 结 束计算机文化基础49物理设计物理设计 2. 评价物理结构评价物理结构 数据库物理设计可能有多个方案,衡量一数据库物理设计可能有多个方案,衡量一个物理设计的优劣,可以从存储空间、响应时个物理设计的优劣,可以从存储空间、响应时间、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度电梯安装工程质量跟踪与评估合同
- 2022年甘肃省酒泉市公开招聘警务辅助人员(辅警)笔试必刷测试卷(1)含答案
- 2024年夫妻财产分割及房贷分担合同3篇
- 2021年广西壮族自治区梧州市公开招聘警务辅助人员(辅警)笔试专项训练题试卷(1)含答案
- 2021年湖南省湘潭市公开招聘警务辅助人员(辅警)笔试经典练习卷(A)含答案
- 2024年大理小型客运从业资格证考试
- 2024年度奶类产品环保包装采购合同2篇
- 2024年山西省晋城市公开招聘警务辅助人员(辅警)笔试自考练习卷一含答案
- 2024年重庆客运从业资格考试
- 2024年喀什小型客运从业资格证理论考题
- 校园文印室外包服务投标方案(技术标)
- 装饰装修工程监理细则详解样本
- 2022上海中医药大学妇产科护理学题库参考
- 2024年机加工行业分析报告及未来发展趋势
- 2024年建筑市场营销行业培训资料
- 植物-微生物联合修复技术
- 个体化治疗方案制定策略
- 《自定义函数》课件
- 电梯拆除安全施工方案
- 三只松鼠财务分析
- 空调制冷及水系统安装检验报批质量验收表
评论
0/150
提交评论