版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、l同同 学学 们们 好!好! 第二讲 数据库发展及 其基本概念 l1张健沛,数据库原理及应用系统开发,1999年4月 l2徐其钧邓习峰编著,数据库及其应用复习与应试指 导,北京,北京大学出版社,2002.1 l3史济民汤观全编著,visualfoxpro及其应用系统开 发,北京,清华大学出版社,2000.1 l4冯玉才,数据库系统基础(第二版),武汉,华 中理工大学出版社,1993 l5萨师煊王珊,数据库系统概论,北京,高等教育出版 社,1997.9 l6刘云生卢正鼎卢炎生,数据库系统概论第二 版,,1997.9 l数据库技术是本世纪60年代开始兴起的一门信息管理 自动化的新兴学科,是计算机科
2、学的一个重要分支。 数据库技术是一门综合性的软件技术,是编译原理、 数据结构、操作系统和程序设计许多软件知识的综合 应用。随着计算机技术的蓬勃发展,计算机应用从科 学计算、过程控制进入数据处理,使计算机从少数科 学家手中的珍品成为人们日常工作中处理数据的得力 助手和有力工具。数据库技术的应用越来越广泛,几 乎深入到各个领域、各个部门,因此人们普遍要求掌 握数据库系统的基本原理。本章首先介绍数据库技术 的发展,有关数据的基本概念和持征,然后介绍数据 库系统的主要构成及其与信息系统的关系最后简要 地介绍数据库在几个方面发展的新概念。 l在信息社会中,信息是一种资源,其重要性可以物质 能量相提并论。
3、对企业来说,各种必须的信息是其赖 以生存和发展的命根子。按信息论的观点,任何社会 实践活动都可以抽象为人流、物流、财流、能源流和 信息流这五种流运动,其中起主导和支配作用的是信 息流,它调节和控制着其他各流的数量、方向、速度 和目标,从而使社会实践活动更具有目的性和规律性。 信息是维持生产活动、经济活动和社会活动必不可少 的资源,因此,信息是有价值的,信息成为构成客观 世界的三大要素(信息、能源和材料)之一。人们为 了获取有价值的信息用于决策,就需要对数据进行处 理和管理。 l信息信息 信息是现实世界各种事物的存在方式、 运动状态以及不同事物间的相互联系等诸要素 的反映。信息向人们提供关于现实
4、世界新的事 实的知识。信息可以存储、加工、传递和再生, 可以为人们所利用。 l信息是现实世界事物的存在方式或运动状态的反映。 具体地说,信息是一种已经被加工为特定形式的数据, 信息是以数据的形式表示的,即数据是信息的载体; 但不是所有的数据都能表示信息,信息是人们消化理 解了的数据。这种数据形式对接收者来说是有意义的, 而且对当前和将来的决策具有明显的或实际的价值。 另一方面,信息是抽象的,不随数据设备所决定的数 据形式而改变;而数据的表示方式却具有可选择性。 l信息与知识、消息意思相近。信息的本质是事件、事 物或物质特征的表征。由于每种事件、事物或物质都 带有区别于其它事件、事物或物质的特性
5、,它们的存 在必然是通过它们的特性表现出来。比如,一个建筑 物是通过它的形状、大小、色调等特性表现它的存在。 我们的视觉“捕捉”到这一物体的光学特性,便判断 出这一物体是建筑物,从而得到建筑物坐落在这里的 信息。信息是客观存在的,它不随主观意志而转移, 我们不可能制造信息,改造信息,只能认识信息。但 是信息又不同于一般的客观存在,它只能说是物质的 而不能说就是物质,因为它不能像一般物质一样,可 以任意分解,也不能像一般物质那样,由这种物质可 以直接作用于另一种物质。信息可以传播,传播以后 自身并不损失与消耗,也不降低它本身的价值,相反 却因为传播增加了自身的社会价值。 l在诸多信息的载体中,数
6、据是信息的一个重要 载体,这个载体是通过符号的有序组合来表达 信息的。数据不等同于数字。数据可分为数值 数据和字符数据两种。比如,一个街坊的宗地 法人代表名单完全都是中文汉字,这些汉字符 也认为是一种数据,它表达了这个街坊的一则 信息。在实际工作中,表达信息常常用这两种 数据的组合,比如,“北京位于北纬3950、 东经11620”,这里数值数据和字符数据结 合在一起使用,构成了北京地理位置的一则信 息。 l信息有如下一些重要特征: l信息传递需要物质载体,信息的获取和传递 要消耗能量。 l信息是可以感知的。 l信息是可以存储、压缩、加工、传递、共享、 扩散、再生和增值的。 l数据数据 描述事物
7、的符号记录称为数据。描述事物的符 号可以是数字,也可以是文字、图形、图像、声音、 语言等。数据本质上是对信息的一种符号化表示、是 用来载荷信息的。 l数据是将现实世界中的各种信息记录下的、可以识别 的符号,是信息的载体,信息的具体表现形式。可用 多种不同形式的数据来表示同样的信息,信息不随它 的数据形式不同而改变。数据的表现形式多种多样, 不仅有我们熟知的数字和文字,还可以有图形、图像、 声音等形式。 l信息与数据的关系信息与数据的关系 信息与数据是两个既有联系、又 有区别的概念。数据是信息的符号表示或称为载体; 信息是数据的内涵,是对数据语义的解释。数据表示 了信息,而信息只有以数据形式表示
8、出来才能彼人们 理解,才能被计算机接受和处理。 l数据与信息是密切关联的。信息是向人们(或机器)提供关于 现实世界有关事物的知识;数据则是载荷信息的物理符号,二 者是不可分离而又有一定区别的概念。例如,“今年大学招生 录取钱为450分,张红的高考成绩为500分。”这段文字(数据) 提供了张红可能被某一个大学录取的信息。但是,在一些不很 严格的场合下,对它们不做严格的区分,当作同义词互换使用。 譬如,信息处理与数据处理、信息资源与数据资源、信息采集 与数据采集等。 l数据与信息之间的关系可以表示为:信息=数据+数据处理 l数据处理数据处理 数据处理是指从某些已知的数据出发、推 导加工出一些新的数
9、据,这些新的数据又表示了新的 信息。在具体操作中涉及到数据收集、存储、加工和 传播等一系列活动。 数据处理也称为信息处理。数据处理实际上就是利用计算机 对各种形式的数据进行处理。它包括:数据采集、整理、编 码和输入,有效地把数据组织到计算机中,由计算机对数据 进行一系列储存、加工、计算、分类、检索、传输、输出等 操作过程。数据处理的目的是从大量原始的数据中抽取和推 导出对人们有价值的信息以作为行动和决策的依据。例如, 一个企业,需要对其收集的大量的有关市场产品销售的信息 (数据)进行存储加工。计算,生成市场销售情况图表,从 而获得哪种型号的产品最受欢迎的信息,以指导生产计划。 l数据管理数据管
10、理 数据管理是指数据的收集、整理、 组织、存储、检索、维护和传送等各种操作, 是数据处理中的基本环节,是任何数据处理任 务必须具有的共同部分。 l在数据处理的一系列活动中,数据收集、分类、 组织、编码、存储、检索、传输和维护等操作 为基本操作,我们将这些基本操作环节称为数 据管理,而加工、计算、输出等操作是千变万 化的,不同业务有不同的处理。 l数据管理是数据库系统的基本功能 l社会的一切组织、人类思想和行动的各个领域 都离不开信息。在各种组织和个人的活动中都 需要决策而决策正确与否主要依赖于信息是 否准确、及时、完善和真实。数据是信息的载 体是表示信息的物理符号(可以是数字、字母 或其他形式
11、的符号)、信息是数据处理过程的结 果。 l人类活动的整个历史,离不开对信息和数据的 收集、保存和处理。像银行、统计、仓库等部 门的工作人员,无时无刻不在和大量的数据打 交道。然而,随着社会的不断进步,人类社会 积累的信息,正以“几何级数”的速度增长。 因此人们过去传统的、落后的数据处理方法, 已经远远适应不了形势发展的需要了。所以长 期以来,如何妥善地保存和管理数据一直是 人们十分关注的课题。人们对数据处理现代化 的要求日益迫切。 l电子计算机的出现,为人类处理数据自动化提供了可 靠的物质基础。开始时,计算机只是单纯为科学计算 服务,所以人们又把它称为数字计算机。随着汁算机 硬件和软件的发展,
12、计算机硬件成本的不断降低和各 种新型外部设备的问世,特别是大容量磁盘存储器的 生产和应用,人们逐渐地认识到,除了科学计算之外, 计算机还具有强大的处理数据的能力,而且计算机的 外存储器还是保存数据资料的理想场所。于是,计算 机就不单纯地应用于科学计算,而是还在数据处理这 个广阔的领域大显身手。到了60年代后期,数据库技术 出现了。数据库技术研究的对象,就是高效地、巧妙 地进行数据处地,而又开销最小。 l目前,在整个计算机应用领域中,数据处理还是最庞 大、最活跃的应用领域。在发达国家中,数据处理约 占8090。计算机工业历史说明,电子计算机是 在科学计算领域中诞生,却在数据处理领域中站稳了 脚跟
13、,找到了真正的立足点,而数据库系统是数据处 理的核心机构,数据库管理系统的最新成果,反映了 数据处理技术的最新水平。 l一个计算机化的电子数据处理系统(electronic date processing system,简称edp系统),包括了人和电子 计算机系统。它执行输入、处理、存储、输出和控制 功能,用于完成对数据的一系列操作过程。一个计算 机化的电了数据处理系统,一般由三个基本系统组成, 它们是电传处理系统、数据管理系统、科学计算系统。 如图12所示。 l电传处理系统的基本功能是,在适当的地点和时间提供必要的 数据,即由它完成数据提供、通信(传输)利传递。 l数据管理系统完成对数据的组
14、织、编目、定位、存储、检索和 维护等功能。 l科学计算系统作为数据处理系统的一部分,会大大地加强系统 的处理能力。它强调使用推理过程产生信息,好像纸和笔一样, 成为人们在分析问题时的有力工具。但是有些复杂的推理问题, 电传处理系统、数据管地系统、科学计算系统单靠纸和笔是不 能解决的,而要靠科学计算系统来解决,因此它有助于提高人 们的逻辑推理和通信的功能。 由于数据处理系统的核心是 数据,因此数据管理系统是 计算机数据处理系统中最重 要的组成都分,而数据库管 理系统则是一种新的数据管 理软件,它提供了种新的 数据管理方法。 l数据以及数据之间的关系可以从逻辑的和物 理的两方面进行描述和组织。数据
15、的逻辑描述 是指控用户要求的数据间逻辑关系来组织和表 达数据的,而物理描述则将涉及数据在计算机 内的存储方式,是以存储数据的时空概念来描 述数据问的关系的,前者可称为数据的逻辑结 构,后者则称为数据的物理结构。 l如何用计算机对数据进行组织、编目、定位、存储、 检索和维护是数据管理的任务。数据管理是数据处理 的中心问题。数据管理技术与数据处理方式有密切的 关系,并且直接影响着数据处理的效率。在数据处理 的手工处理阶段和机械处理阶段,数据管理技术也是 手工的。但是,在计算机进入数据处理领域之后,原 来的那套手工管理方式就不能适应计算机自动处理数 据的需要了。而且,在跨入信息社会的今天,需要管 理
16、的数据越来越多,如果仍然沿用原来那套方式,不 仅需要耗费大量的人力,而且很难使这些数据发挥应 有的作用。为此,许多计算机专家,特别是软件工作 者,对数据管理技术做了大量的研究工作,使数据管 理技术经历了一个由筒单到复杂的不断完善的发展过 程。 l数据处理的中心问题是数据管理。数 据库技术所研究的问题就是如何科学 地进行数据管理。数据库技术是数据 管理的最新技术。数据库系统是当代 计算机系统的重要组成部分。随着计 算机的软硬件技术的发展,数据管理 技术的发展大致经历了从人工管理、 文件系统和数据库系统三个阶段。 l 50年代初期,当计算机一出现,人们就试图使用计算 机来处理这些数据。在这一阶段,
17、计算机除硬件外, 没有任何软件可供数据处理使用,因而计算机主要用 于科学计算。而对数据管理时,设计人员除考虑应用 程序、数据的逻辑定义和组织外,还必须考虑数据在 存储设备内的存储方式和地址,数据管理工作只能依 赖人工进行。 图1-2数据与程序之间的关系 应用程序1数据1 应用程序2数据2 应用程序n数据n l这个阶段的数据管理有如下特点: l 数据不保存 由于没有软件系统对数据 进行管理和计算机硬件的限制,每次计算前, 先将程序和数据输入。计算结束后,将结果输 出,计算机不保存程序和数据。 l 数据面向程序 每个程序都有属于自己 的一组数据,当数据在存储上稍有改变,就要 修改程序。程序与数据相
18、互结合成为一体,互 相依赖,独立性差。各程序之间的数据不能共 享,因此数据就会重复存储(冗余度大)。数 据与程序之间的关系如图1-2所示。 l在50年代后期至60年代中期,计算机外存已有 了磁鼓、磁盘等存储设备,软件有了操作系统。 人们在操作系统的支持下,设计开发了一种专 门管理数据的计算机软件,称之为文件系统。 这时,计算机不仅是用于科学计算,而且还大 量用于数据处理。 图1-3文件系统中数据与程序之间的关系 应用程序1 数据1 应用程序2数据2 应用程序n数据n 文件系统 l由于有了文件系统,这个阶段的数据管理有如下特点: l数据与文件的形式长期保存。由于计算机大量用于数据处理, 数据需要
19、长期保留在外存上反复处理,即经常对其进行查询、 修改、插入和删除等操作,因此,在文件系统中,按一定的规 则将数据组织为一个文件,存放在外存储器中长期保存。 l文件形式多样化。为了便于数据的存储和查找,人们研究了 许多文件类型,如索引文件、链接文件、顺序文件和倒排文件 等存储数据。数据的存取基本上是以记录为单位。(注:字段 的有序集合称为记录,如一个学生的记录由编号、姓名、年龄、 性别等字段组成。) l程序与数据之间有一定的独立性。应用程序通过文件系统对 数据文件中的数据进行存取和加工,因此,管理数据时,不必 过多地考虑数据物理存储的细节,文件系统充当应用程序和数 据之间的一种接口,这样可使应用
20、程序和数据都具有一定的独 立性。这样,程序员可以集中精力于算法,而不必过多地考虑 物理细节,并且,数据在存储设备上的改变不一定反映在程序 上,这可以大大节省维护程序的工作量。 l尽管文件系统有上述优点,但是,这些数据在数据文 件中只是简单地存放,文件中的数据没有结构,文件 之间并没有有机的联系,数据的存放仍依赖于应用程 序的使用方法,基本上是一个文件对应于一个或几个 应用程序,数据面向应用,独立性较差,不同的应用 程序很难共享同一数据文件。因此出现数据重复存储, 冗余度大,一致性差(同一数据在不同文件中的值不 一样)等问题,造成应用程序编制繁琐,数据的正确 性、安全性、保密等得不到保证。文件系
21、统中数据与 程序之间的关系如图1-3所示。 图1-3文件系统中数据与程序之间的关系 应用程序1 数据1 应用程序2数据2 应用程序n数据n 文件系统 l60年代末期开始,在这一时期,磁盘技术已经 成熟,并作为主要外存而广泛使用。计算机硬 件的价格大幅度下降,可靠性增强,为数据管 理技术的发展奠定了物质基础。另外,计算机 用于管理,其规模更加庞大,从而使数据量急 剧增加。为了提高数据处理的效率,对数据进 行集中控制,充分提供数据共享的要求日益迫 切。人们对文件系统进行了扩充,研制了一种 新的、先进的数据处理方法,即数据库系统。 l数据库系统克服了以前所有处理方式的缺点, 试图提供一种完美的、更高
22、级的数据管理方式。 它的基本思想是解决多用尸数据共享的问题, 实现对数据的集中统一管理,具有较高的数据 独立性,并为数据提供各种保护措施。这一时 期,数据库管理软件作为用户与数据的接口, 程序和数据的关系如图14所示。 应用程序1 应用程序2 应用程序n dbms 数 据 库 图1-4数据库系统中应用程序与数据库之间的关系 l与人工管理和文件系统相比,数据库系统主要有以下持点: l数据结构化数据结构化在数据库系统中,数据不再针对某一应用,而是 面向整个组织,实现了整体数据的结构化,用数据模型描述数 据结构。这是数据库系统与文件系统的本质区别。 l数据共享性高,冗余度低数据共享性高,冗余度低从整
23、体角度看待和描述数据,数 据不再是面向某个应用而是面向整个系统,因此数据可以被多 个用户、多个应用共享使用。数据共享减低了数据冗余度,节 省存储空间,而且可以避免数据的不一致性。 l数据独立性高数据独立性高数据库系统具有高度的物理独立性和一定的逻辑独立性。 物理独立性是指用户的应用程序与数据库的物理结构是相互独立的,即当数 据的物理存储改变时,应用程序不用改变。逻辑独立性是指用户曲应用程序 与数据库的逻辑结构是相互独立的,即当数据的逻辑结构改变时,应用程序 不用改变。 l数据由数据由dbms统一管理和控制统一管理和控制数据库管理系统(dbms:chta databasemanagementsy
24、stem)作为用户与数据库之间的中间层软件,不仅提 供数据定义、数据操纵、数据库运行、数据库维护等功能,而且提供数据控 制功能,包括数据安全性控制、数据完整性控制、并发控制和数据库恢复等 控制。 l数据库系统是计算机软件的个重要分支,是 近20年来发展起来的一门新兴学科。它和计算 机网络、人工智能被称为当今计算机技术界的 三大热门技术。目前,虽有人对数据库的设计 原则和方法进行总结和探讨,使之通用化、标 难化和理论化。但总的说来,它的概念、原则 和方法还处于从工程实践向理论过渡的阶段, 它的概念,原理和方法处在继续变化和发展。 另外,数据库是一个很复杂的系统,涉及面很 广,难以用简练的语言准确
25、地概括其全部特征。 l这三个发展阶段特点的比较如表11所示。 l数据库是一个很复杂的系统,涉及面很广,难以用简 练的语言准确地概括其全部特征。因此,给它下一个 确切的定义是困难的,所以我们先从简单分析入手, 逐步认识什么是数据库。 l库,这个名词在日常生活中经常接触到。我们知道各 种各样的库。例如:仓库、书库、金库、血库等。稍 微留心一下,我们就会发现,这些库都具有这样几个 特点: l(1)可以存放现实世界中一定的东西; l(2)这些东西是有条理有组织地存放在库中的; l(3)库中这些东西由专人来进行管理。 l例如,书库中的书就是有次序地摆在书架上的,并由 图书管理员对它们进行管理。显然,库中
26、的东西如果 不是按照一定的次序存放,并由专人管理,那么就不 能有效地利用库中的空间,也不可能方便地找出所需 要的东西。 l顾名思义,数据库就是存储数据的“仓库”。但它和 我们前面讲的库是有所不同的。首先,数据不是存放 在容器或空间中,而是存放在计算机的外存储器上(如 磁盘),并且是有组织地存放的。数据的管理和利用是 通过计算机的数据管理软件数据库管理系统来完 成的。因此,我们讲的数据库,不单是指存有数据的 计算机外存,而是指存放在外存上的数据集合以及管 理它们的计算机软件的总和,通常称为数据库系统。 l目前,对于什么是数据库还没有一个统一的、 公认的定义。比较流行的有关数据库的文献中 常见的数
27、据库定义合如下三种: ldbtg的定义数据库是由个特定的模式控制 的所有记录、系和域组成的。如果有多个数据 库,则每一个数据库必须有自己的模式。并假 定不同数据库的内容是彼此无关的。 l它从三个方面描述数据库:存储在磁鼓、磁 盘或其他外存介质上的数据集合这是指数 据库自身;存在以这种数据为背景而运行的 若干个应用程序,可进行检索、修改、插入和 删除等操作,另外可能有一些联机用户,利用 远程终端与数据库相互作用;数据库是集成 的,即包括许多用户的数据;每个用户只享用 其中的一小部分,且不同用户使用的部分以多 种方式重叠,也就是单独的数据片能够被许多 不同用户所共享。 l数据库是存储在一起的相关数
28、据的集合,这些 数据去掉了有害的或不必要的冗余,为多种应 用服务,数据的存储独立于使用它的程序;对 数据库插入新数据,修改和检索原有数据均能 按一种公用的和可控制方式进行;数据被结构 化,为今后的应用研究提供基础。当某个系统 中存在结构上完全分开的若干数据库时,则说 该系统包含一个数报库集合。 l综合上述三种定义,通常一个数据序系统包含下列内容: l(1)有一个结构化的相关数据的集合。在这个数据集合中没有有 害的或不必要则冗余,能够为多种应用服务,它独立于应用程 序而存在。这种结构化的数据集合就是数据库本身,是数据库 系统的核心和管理对象。 l(2)有一个负责数据库管理和维护的软件系统,称为数
29、据库管理 系统(databasemanagementsystemdbms)。它对数据库中 数据的各种操作,提供一种公用的方法。它接受并完成用户程 序或终端命令提出的访问数据库的各种请求,负责数据库的维 护,保护数据库中的数据不受破坏。 l(3)有个(或一组)负责整个数据系统的建立、维护和协调工作 的专门人员,这就是数据库管理员(databaseadministrator- dba)。他们负责对数据库系统的全面管理与监督,并对运行状 况进行统计分析,不断改进数据库设计。 l数据库(db)是长期存储在计算机内、有组织 的、可共享的数据集合。数据库是按某种数据 模型进行组织的、存放在外存储器上,且可
30、被 多个用户同时使用。因此,它具有较小的冗余 度,较高的数据独立性和易扩展性。数据库本 身不是独立存在的,它是组成数据库系统的一 部分,在实际应用中,人们面对的是数据库系 统(dbs)。 l数据库系统是指具有管理和控制数据库功 能的计算机系统。 l数据库系统简称dbs(databasesystem),它包 括和数据库有关的整个系统:硬件系统、数据 库集合、数据库管理系统及相关软件、数据库 管理员和用户等等。当然,人们也常把除人以 外与数据库有关的硬件和软件系统称为数据库 系统。 l一个数据库系统应该是: l (1)允许用户用一种叫做“数据定义语言”的专 用语言来建立新的数据库。 l (2)允许
31、用户用一种叫做“数据操作语言”或者 “查询语言”的专用语言来对数据库中的数据进行查 询和更新。 l (3)支持存储大量的数据,保证对数据的正确及 安全使用。 l (4)控制多用户的并发访问,保证并发访问不相 互影响,不损坏数据。 l 由于数据模型是数据库系统的基础,因此人们就 按数据模型来命名数据库系统,如数据模型为层次模 型、网状模型或关系模型,则相应的数据库系统就称 为层次数据库系统、网状数据库系统或关系数据库系 统。 l数据库系统作为软件的一个分支,与其他基础 软件和系统软件有密切的关系。它几乎涉及及 到软件的所有知识,是许多重要软件技术的综 合应用。例如,大家以前学过的或以后要学的 数
32、据结构、操作系统、编译技术、程序设计等 知识在数据库都将用到。所以数据库系统是一 门综合性的软件技术,是一门很有意义很有趣 味的学科。要更好的研究掌握它,必须了解软 件的各个方面,以便更加理解和认识到这些知 识的内在联系,并在一种观念上将它们统一起 来。 l图15表示了数据库系统的用户、数据库管理 系统、数据库管理员和数据库之间的相互关系。 图1-5数据库系统 l另外,还应该指出,数据库保存的是属于企业和事业 部门,团体和个人的有关数据。例如,银行帐目数据、 学校的教学管理数据、政府部门的管理、统计和计划 数据等。特别应该强调的是,设计数据库保存这些数 据的目的,不仅仅是为了扩展人们的记忆,而
33、主要是 帮助人们去控制与之相关的事物。因此,数据库往往 不是孤立存在的,通常是一个更大的信息系统的部 分,两者的关系如图16所示。 图1-6信息控制系统 该图表示,人们从观测客观事 物产得到大量信息,对这些信 息进行记录、整理和归类图 (总称规范),然后将规范信息 数据化,送入数据库中保存起 来,其中一部分信息可能直接 送入控制决策机构。 l数据库系统是引进数据库技术后的计算机系统,由5部 分组成:硬件系统、数据库集合、数据库管理系统及 相关软件、数据库管理员和用户。 l硬件系统是整个数据库系统的基础,需要有足够大的 内存、足够大容量的磁盘等联机直接存取设备等。数 据库集合是若干个设计合理、满
34、足应用需要的数据库。 数据库管理系统是为数据库的建立、使用和维护而配 置的软件,是数据库系统的核心组成部分;相关软件 是支持软件,如操作系统等。数据库管理员是全面负 责建立、维护和管理数据库系统的人员。用户是最终 系统的使用和操作人员。 l硬件硬件包括cpu、内存和外部设备等。要求足够大 的内存,用以存放操作系统、数据库管理系统的核心 模块、数据缓冲区等;要求足够大的外存,用以存储 数据,日志文件等。 l 在数值计算中,主机的运算速度决定程序的运行 时间。但在数据库技术中,io所占时间决定了程序 的运行时间,因此cpu的速度就不是数据库运行速度的 决定因素。 l数据库要存储大量的数据,现在磁盘
35、容量已达每轴5 000兆字节,随着光盘的使用,大容量数据库的物质条 件越来越优越。数据库还需要足够的磁带作备份。此 外还要求系统有较高的通道能力,以提高数据的传输 速度。 有足够大的内存以存放操作系统、有足够大的内存以存放操作系统、dbms 的核心模块、数据缓冲区和应用程序;的核心模块、数据缓冲区和应用程序; 有足够大的直接存取设备存放数据有足够大的直接存取设备存放数据(如磁如磁 盘盘),有足够的存储设备来进行数据备份;,有足够的存储设备来进行数据备份; 要求计算机有较高的数据传输能力,以要求计算机有较高的数据传输能力,以 提高数据传送率。提高数据传送率。 由于一般数据库系统所存 放和处理的数
36、据量很大,加 之dbms丰富的功能软件, 使得自身所占用的存储空间 很大,因此整个数据库系统 对硬件资源提出了较高的要 求,这些要求是: l软件软件包括操作系统(os:operatingsystem),数据 库管理系统和应用开发工具等。dbms是专门用于数 据管理的软件系统,在os支持下工作。 l应用程序应用程序数据库的特定用户根据自己的数据处理业务, 利用应用开发工具而开发的应用系统,供最终用户直 接操作。 l 这一部分主要包括操作系统、各种宿主语言、实 用程序以及dbms等。dbms是管理数据库的软件系统, 它是在操作系统的文件系统基础上发展起来的,而且 dbms是在操作系统支持下工作。为
37、了开发应用系统, 还要有各种宿主语言,这些语言应与数据库有良好的 接口。 l数据库系统的软件主要包括: l(1)dbms是数据库系统的核心软件,它实现数据库的建立、 使用和维护。 l(2)支持dbms运行的操作系统。通常,dbms运行时都是 基于某一操作系统,并通过操作系统来实现对数据的存取。 l(3)一般来讲,数据库管理系统的数据处理能力较弱,所以 需要提供与数据库接口的高级语言及其编译系统,以便于开发 应用程序。这种高级语言称为“数据库的主语言”。 l(4)以dbms为核心的应用开发工具。应用开发工具是系统 为应用开发人员和最终用户提供的高效率、多功能的应用生成 器、第四代语言等各种软件工
38、具,如报表生成系统、表格软件、 图形系统筹。它们为数据库系统的开发和应用提供了有力的支 持。当前开发工回四记成为数据库软件的有机组成部分。 l(5)为特定应用开发的数据库应用软件。数据库软件为数据 的定义、存储、查询和修改提供支持,而数据库应用软件是对 数据库中的数据进行处理和加工的软件,它面向特定应用,如 基于数据库的各种管理软件、管理信息系统(mis)、决策支 持系统(dss)和办公自动化(oa)等都属于数据库应用软 件。 l数据库数据库数据库(db:database)是一个长期存储在 计算机内的结构化的数据集合,供系统中的用户共享。 l数据库是数据库系统的核心和管理对象,库中的数据 是集
39、成的、共享的、最小冗余的,能为多种应用服务。 其中“集成”是指某特定应用环境中的各种应用的数 据及其数据之间的联系(联系也是一种数据)全部集 中地按照一定的结构形式进行存储。“共享”是指数 据库中的一块块数据可为多个不同的用户,使用多种 不同的语言,为了不同的目的而同时存取数据库,甚 至同时存取同一块数据。 l数据库是与一个特定组织的与各项应用相关的 全部数据的汇集。通常由两大部分组成:一部 分是有关应用所需要的工作数据的集合,称作 物理数据库,它是数据库的主体;另一部分是 关于各级数据结构的描述,称作描述数据库, 通常由一个数据字典系统管理。 一个数据库有四个主要成一个数据库有四个主要成 分
40、 :分 : 数 据 、 联 系数 据 、 联 系 (relationship)、)、约束约束 (constraint)和模式和模式 (schema)(见图见图1.5)。)。 数据是所存储的逻辑实体数据是所存储的逻辑实体 在计算机中的二进制表示;在计算机中的二进制表示; 联系表示数据项之间的某联系表示数据项之间的某 种对应;约束是定义正确种对应;约束是定义正确 数据状态的断言;一种模数据状态的断言;一种模 式描述数据库中数据的组式描述数据库中数据的组 织和联系。织和联系。 l最初的数据库的概念只是指一个数据文件或一个数据 表格,对这个文件或表格的容量、数据格式限制很多, 修改、编辑也较困难,后来
41、系统对数据库允许的数据 容量巨增,管理能力大幅度增强,逐渐产生了二次开 发语言,允许用户对数据库进行二次开发,用批处理 而后又发展为以程序的形式对数据库进行多种方式的 管理,包括多种文件的沟通。再后来数据库概念不再 是指一个数据文件,或一个数据二维表格,而且指一 个门类的数据文件的集合,这个集合逐渐发展为可以 跨越硬件,形成分布式的网络数据库,数据库管理系 统在指令的驱动下可以对数据文件集合进行一致性的 数据变更维护,即对有相互关联关系的多个数据文件 表格进行自动一次性联带变更,这样使诸如在会计账 目管理、仓库物品台账管理、档案管理等经常遇到的 复杂繁琐的人工劳动变得自动化了。 l数据库管理员
42、数据库管理员数据库管理员(dba:database administrator)是管理和控制数据库系统,使之 始终处于最佳状态的人员。dba是相关人员中 最重要的人员。 ldba的具体职责包括! l(1)决定数据库中信息的内容和结构; l(2)决定数据库的存储结构和存取方法; l(3)定义数据的安全性要求和完整性约束条件; l(4)监督和控制数据库的使用和运行; l数据库系统中存在一组管理、开发、使用数据库的用 户。有的用户需要从数据库中查询信息;有的用户要 为查询信息的用户编写处理程序;有的用户专门来管 理维护数据库等。通常,将这些用户根据他们的工作 分成三类,说明如下: l终端用户。这类用
43、户使用数据库系统提供的终端命 令语言或者菜单驱动、表格驱动。图形显示和报表生 成等对话方式来存取数据库中的数据。这类人员一般 为不精通计算机和程序设计的各级管理人员。 l应用程序员。这类人员是负责设计和编制应用程序 的人员。他们通常使用c语言、数据库语言或4gl(第 四代语言)等来设计和编写应用程序,对数据库进行 存取操作,所编应用程序供终端用户使用。 l需要注意的是,对于不同规模的数据库系统, 用户的人员配置是不相同的。只有大型数据库 系统才配备有应用程序员和数据库管理员。对 于常见的微机数据库系统,通常只有一个用户, 兼终端用户、应用程序员和数据库管理员。 l为了便于读者更直观地了解数据库
44、系统,我们 不妨把它与图书馆做一比较(表1-1),大家知 道,图书馆是存储和借阅图书的部门,而数据 库系统则是存储数据并负责用户访问数据的机 构。正像图书馆不能简单地与书库等同起来一 样,我们也不能把数据库系统仅仅理解成存储 数据的集合,而应该理解成一个系统。 表1-1 数据库系统与图书馆比较 数据库数据库图书馆图书馆 数据图书 外存书库 用户读者 数据模型书卡格式 数据库管理系统图书馆管理员 数据的物理组织方法图书馆图书存放方法 用户对数据库的操作( 使用数据操纵语言对数 据检索、插入、删除、 修改) 读者对图书馆的访问( 用普通语言借书、还书 等) l数据库系统是一个实际可运行的,按照数据
45、库 方式存储、维护和向应用系统提供数据或信息支持的 系统。一般而论, 数据库系统有以下几方面的主要功 能:系统地管理信息、协调、控制管理活动的功能、 优化决策的功能。 l 1)系统地管理信息。信息涉及的范围广、内容多, 且大都是以零星、随机的形式存在的。数据库系统的 任务就是要对信息进行系统的管理,包括采集、加工、 输入、处理和输出等等。具体说,数据库系统及其各 子系统要对从不同途径所获得的信息,进行分类、编 码、评价等加工处理,使之系列化条理化,并有效地 存贮起来,同时提供各种统计、分析模型和查询检索 功能,以备随时调用、处理和输出应用。 l2)协调、控制管理活动的功能。数据库系统所贮存的
46、数据和信息,是业务人员和业务机构之间的联系纽带 和桥梁,因而能对业务活动进行有效的协调、约束和 控制。而数据库系统的信息反馈,又是发现问题和纠 正业务工作偏离目标行为的重要依据。 l3)优化决策的功能。决策是业务管理的核心,一项正 确的决策不仅要依靠决策者的智慧、胆略和才能,更 重要的是依靠及时、准确和有效的信息支持。“知己 知彼,百战不殆”,没有准确可靠的信息,就不可能 有克敌制胜的战略决策。可以说,没有信息的决策就 如同无源之水和无本之木,是不可能发生、不可能存 在的。由于数据库系统能为各部门、各单位、各企业 提供丰富、及时和有价值的信息,因此,便成为管理 者优化决策的可靠保证。 l数据库
47、系统实质上就是一个记录保存系统。它可以将 各种数据很方便地保存到数据库中,数据库中的数据 由一个称为数据库管理系统的软件进行管理,对数据 库的访问必须通过数据库管理系统。例如,在计算机 上有一个学生情况数据库student,它帮助我们记录学 生信息。现在如果我们想查询有关管理信息系学生的 学号、姓名、性别、年龄情况,可输入下面的命令: lselect select 学号,姓名,性别,年龄学号,姓名,性别,年龄 from student from student where where 系名系名=“=“管理信息系管理信息系” ” l于是,在计算机屏幕上就会显示所需要的学生库中管 理信息系全部学生
48、的信息。如表1-2所示。 学号学号姓名年龄年龄性别性别系名系名 97001王义19男管理信息系 94002李四20男管理信息系 94003张玉20女管理信息系 95001赵明19男管理信息系 表1-2显示查询结果 一个数据库系统的主要功能之一就是允许数据操作,如检索、更 新、删除和插入这四种操作是最常用的操作,但是数据库系统绝 非仅此而已,还需要有许多的附加功能(例如屏幕格式定义、菜 单定义、打印输出控制等等)和数据定义(即建库功能)功能。 上述这些功能,说准确一点,是支持一种数据库语言,用户可以 用这种语言编写程序去处理数据。每一种数据库系统都有它自己 支持的语言(命令)来实现对数据的操作,
49、但是,语言不同给不 同数据库系统之间的交流带来了困难。因而国际标准化组织 (iso)选定了sql语言作为数据库的标准语言。 l数据库系统的特点如下: l1 1)数据共享;)数据共享; l2 2)面向全组织的数据结构化)面向全组织的数据结构化; l3 3)数据独立性;)数据独立性; l4 4)可控数据冗余度)可控数据冗余度 l1 1)数据共享。)数据共享。这是数据库系统区别于文件系统 的最大特点之一,也是数据库系统技术先进性 的重要体现。共享是指多用户、多种应用、多 种语言互相覆盖地共享数据集合,所有用户可 同时存取数据库中的数据。数据库是面向整个 系统的,以最优的方式服务于一个或多个应用 程序
50、(用户),实现数据共享。 l2 2)面向全组织的数据结构化)面向全组织的数据结构化。在数据库中,数据不再 像文件系统那样从属于特定的应用,而是按照某种数 据模型组织成为一个结构化的整体。它不仅描述了数 据本身的特性,而且也描述了数据与数据之间的种种 联系,这使数据库具备复杂的结构。 l数据结构化有利于实现数据共享。比如,一个学校, 可以把学校所有的各个应用(人事、学籍、科研、财 务、后勤等)的数据组织到一个数据库中,并且结构 化。数据实现集中统一的存储与管理,各种应用存取 各自相关的数据于集,满足各种应用要求,实现数据 共享。 l3 3)数据独立性。)数据独立性。文件系统管理中,应用程序严 重
51、依赖于数据文件,如果把应用程序使用的磁 带顺序文件改成为磁盘索引文件,则必须对应 用程序进行修改。而数据库技术的重要特征就 是数据独立于应用程序而存在,数据与程序相 互独立,互不依赖,不因一方的改变而改变另 一方,这大大简化了应用程序的设计与维护的 工作量。 l4 4)可控数据冗余度。)可控数据冗余度。数据共享、结构化和数据 独立性的优点可使数据存储不必重复,不仅可 以节省存储空间,而且从根本上保证了数据的 一致性,这也是有别文件系统的重要特征。 l从理论上讲,数据存储完全不必重复,即冗余 度为零,但有时为了提高检索速度,常有意安 排若干冗余,这种冗余由用户控制,称为可控 冗余度。可控冗余要求
52、任何一个冗余的改变都 能自动地对其余冗余加以改变,这个过程叫做 传播更新。 l5 5)统一数据控制功能)统一数据控制功能。数据库是系统中各用户的共享资源, 因而计算机的共享一般是并发的,即多个用户同时使用数据库。 因此,数据库管理系统必须提供以下四个方面的数据控制功能, 保证整个系统的正常运转。 l 数据安全性控制。数据的安全性是指采取一定安全保密措 施确保数据库中的数据不被非法用户存取而造成数据的泄密和破坏。 l 数据完整性控制。数据的完整性指数据的正确性、有效性 与相容性。系统要提供必要的功能,保证数据库中的数据在输入、修改过程 中始终符合原来的定义和规定。 l 并发控制。当多个用户并发进
53、程同时存取,修改数据库中数据 时,可能会发生互相干扰而得到错误结果,并使数据库完整性遭到破坏,因 此必须对多用户的并发操作加以控制和协调。 l 数据恢复。当系统发生故障造成数据或当对数据库数据的操作 发生错误时,系统能进行应急处理,把数据库恢复到正确状态。 l现在,世界上使用的数据库在数万个以上,而且每年 以20的速度递增。尽管传统的关系数据库技术已经 十分成熟,然而在“迈向信息社会”的今天,只有不 到10的商业和科学数据是用dbms管理的,同时新的 应用要求急需新的数据库技术的支持。目前已出现的 新的数据库系统概念有:面向对象数据库系统、演绎 数据库系统、模糊数据库系统、巨型数据库系统、主
54、动数据库系统、多媒体数据库系统、集成的工程数据 库系统、联邦数据库系统,以及时态数据库系统,等 等。 l在讲本部分前先介绍两个数据库中常用到的两 个概念:模型和模式 l模型人们对实体或对象的抽象描述,可以用文 字或图形来描述 l模式用计算机语言来描述或定义的模型或对象 l在数据库系统中,用户看到的数据与计算机中存放的 数据是两回事,两者之间是有联系的,实际上它们之 间已经过了两次变换。一次是系统为了减少冗余,实 现数据共享,把所有用户的数据进行综合,抽象成一 个统一的数据视图;第二次是为了提高存取效率,改 善性能,把全局视图的数据按照物理组织的最优形式 存放。 l用户使用的数据视图叫做外模型,
55、是一种局部的逻辑 数据视图,表示用户所理解的实体、实体属性和实体 关系。 l全局的逻辑数据视图叫做概念模型,是数据库管理员 所看到的实体、实体属性和实体之间的联系。 l数据的物理存储模型叫做内模型。 l整个数据库系统分为三层:外层、概念层和内层。 l在数据库系统中,对于同一意义下的数据,比如学生 数据,从计算机中处理的二进制到用户处理的诸如学 生姓名、年龄等概念的数据之间,存在着许多层 抽象和转换。 l由图1-8可知,为了提高数据库的独立性,dbms把数据库从逻辑 上分为三层(三级),面向用户或程序员的用户层(或称为外 部级),面向数据库管理员和系统分析员的概念层(或称为概 念级)和内层(或称
56、为内部级),它反映了看待数据库的三种 不同角度。 用户数据库1 用户数据库2 用户数据库n 概念数据库 图1-8数据库的三个抽象层次 存储数据库 l尽管目前世界上大多数数据库管理系统种类不同,支 持的数据模型不同,使用的语言不同,存储结构不同, 但它们的结构基本是相同的,都支持数据库系统结构 的三级抽象描述。在数据库系统中,用户看到的数据 与计算机中存放的数据是两回事。用户只能看到外层, 而其他两层是看不到的。它们之间实际上经过两次抽 象和转换:一次是把所有用户的数据综合抽象成一个 统一的全局数据共同视图,即中间层,以实现数据共 享和减少数据冗余;第二次是把全局数据的共同视图 抽象为计算机的数
57、据实际存储,即把全局数据按照存 储的最优组织形式进行物理存放,以提高性能和存放 效率。当计算机向用户提供数据时则做相反的变换。 因此,对于一个数据库系统而言,实际上只有物理数 据库是存在的,概念层数据库只是物理数据库的一种 抽象描述,用户层数据库则是用户与数据库的接口。 图1-9 数据库系统结构示意图 dbms 数据库操 作 系 统 模式 内模式 模式/内模式映象 用户程序a1 工作区 用户程序a2 工作区 用户程序b1 工作区 用户程序b2 工作区 外模式/模式映象a 外模式a外模式b 外模式/模式映象b 数据库系统采用三级结构的优点是保证了数据的独立性,简化了用户接 口,有利于数据共享和数
58、据的安全保密。这也正是数据库系统优于文件 系统之处。图1-9给出了内模式、模式,外模式的三级结构以及它们之 间的两级映象,还给出了dbms和数据库管理员与三级结构的关系。 l模式为数据库管理系统各部件的使用和应用的安全定义数据库 的各种视图。一种模式将数据存储的物理外表与逻辑表示分开 (见图4.2)。内部模式定义数据在物理数据存储区中如何组织 以及放在何处。概念模式模型按照适当的数据库数据模型(如 关系模型或对象模型)定义所存储数据的结构。外部模式为特 定用户(们)定义数据库的一个或多个视图。一个数据模型是 数据库的一种抽象定义或模型,它提供一种描述数据的表示法。 数据库管理系统为数据库管理系
59、统为 访问数据库提供服访问数据库提供服 务,同时维护存储务,同时维护存储 数据所要求的正确数据所要求的正确 性和一致性性和一致性 l数据库系统结构可用图形和语言描述。图形描 述就是数据模型图(简称视图),是我们看到 的数据库结构的图形表示,非常直观,但不严 格。视图分为外视图、概念视图(也称为视图) 和内视图。模式就是用 dbms提供的数据定义语 言 ddl(data descriptive language)来编写 的精确地定义(描述)数据库结构(视图)的 程序。其语言描述严格。准确,可描述许多细 节,是计算机可接收的方式。对应三个不同的 视图,分别用数据定义语言去定义得到三个对 应的模式,
60、即外模式、模式和内模式。 l用数据描述语言精确地定义数据模型的全部语 句称为模式。对应于不同的模型,也有三个相 应的模式。 l外模式定义外模型的模式叫做外模式,又称子 模式,用于模式定义语言来定义。 l概念模式定义概念模型的模式叫做概念模式, 简称为模式,用模式定义语言来定义。 l内模式定义内模型的模式叫做内模式,又称物 理模式,用设备介质语言来定义。 l子模式是概念模式的子集,可以从概念模式推导出来, 图19表示各级模式之间的关系。其中有两层映象: l子模式一模式映象定义了各子模式与模式之间的映 射关系。当整个系统要求改变模式时,可以改变映射 关系而保持子模式不变。这种用户数据独立于全局的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 磁性编码借记卡产品入市调查研究报告
- 液压扭矩扳手产业规划专项研究报告
- 化学加工用烧结机产品入市调查研究报告
- 2024年商务采购合同协议
- 建筑工程劳务人工合同模板
- 建材订购合同书范本示例
- 2024年标准版个人房屋租赁合同(5篇)
- 劳动法全文-合同范本
- 游泳池用除藻剂产业规划专项研究报告
- 劳务机械合同范本2024年
- 《我与社会》 (课堂PPT)
- 第六讲 声音音质主观评价
- 普通话培训教案
- 施工日志记录模板
- 阳光分级阅读初一上The Fantastic Washing Machine课件
- 基坑支护(护坡)工程冬季施工方案
- 新建加油站工程施工组织设计方案
- 口腔科应急预案详解
- 余姚农业信息综合服务系统需求说明
- 工作纪律检查表
- 砌筑工-技能评分记录表3
评论
0/150
提交评论