第一章分布库概述_第1页
第一章分布库概述_第2页
第一章分布库概述_第3页
第一章分布库概述_第4页
第一章分布库概述_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分布式数据库分布式数据库教师:申德荣教师:申德荣电话:电话:83691218办公室:主楼办公室:主楼 407 e_mail:S分布式数据库系统课程介绍分布式数据库系统课程介绍分布式数据库1.课程名称课程名称分布式数据库系统2.学时学时:323.教材教材:PrinciplesofDistributedDatabaseSystems M. Tame Ozsu & Patrick Valduriez Prentice-Hall, 1999 2002.6 影印版(清华大学出版社)分布式数据库系统课程介绍分布式数据库系统课程介绍分布式数据库4.参考教材参考教材分布式数据库系统及其应用分布式数据库

2、系统及其应用科学出版社科学出版社邵佩英邵佩英分布式数据库分布式数据库科学出版社科学出版社郑振楣郑振楣于戈于戈5.先修课先修课本科数据库原理、计算机网络本科数据库原理、计算机网络 6. 考试考试 40% : 作业+测验 60% : 考试主要内容主要内容分布式数据库第一章第一章概论概论第二章第二章分布式数据库系统体系结构分布式数据库系统体系结构第三章第三章分布式数据库的设计分布式数据库的设计第四章第四章全局查询处理和优化全局查询处理和优化第五章第五章分布查询的存取优化分布查询的存取优化第六章第六章分布式事务管理分布式事务管理第七章第七章分布式恢复分布式恢复第八章第八章分布式并发控制分布式并发控制第

3、九章第九章典型的分布式系统介绍典型的分布式系统介绍引言及准备知识分布库系统的基本概念分布库系统的作用和特点主要问题系统结构功能结构模式结构软件结构分布式数据库系统分类字典信息的组织分片的定义水平分片的设计垂直分片的设计分片的表示方法分配设计基于复制技术的数据分片基本概念查询优化的基础全局优化的一般规则全局查询的分解和变换片段查询的优化 基本概念存取优化的理论基础半联接优化方法SDD-1系统优化技术枚举法优化技术事务的基本概念分布式事务分布式事务的提交协议分布式事务管理的实现两段提交协议(2PC)的分类基本概念集中式数据库的故障恢复方法分布式事务的恢复非阻塞分布式事务提交协议基本概念基于锁的并发

4、控制方法两段封锁协议(2PL)并发控制理论基础分布库并发控制方法其它典型的并发控制方法第一章第一章 概论概论 分布式数据库引言及准备知识引言及准备知识分布库系统的基本概念分布库系统的基本概念分布库系统的作用和特点分布库系统的作用和特点主要问题主要问题分布式数据库系统介绍分布式数据库系统介绍第一章第一章 概论概论 引言及准备知识引言及准备知识分布式数据库 数据库领域的发展历程数据库领域的发展历程 1960s -IBM IMS(层次模型的数据库管理系统) -DBTG(美国数据库任务组) 提议的network data model 1970s -E. F. Codd RDB model Pionee

5、ring systems: INGRES, System R 1980s -Booming of RDBs -Federated, Multi-databse -DDB -OODB第一章第一章 概论概论 引言及准备知识引言及准备知识分布式数据库 数据库领域的发展历程数据库领域的发展历程 1990s -Merge of RDB and OODB -Internet Fame -P2P model 2000s -XML DB -Web data processing -Semantic Web -Data Integration第一章第一章 概论概论1.1引言及准备知识引言及准备知识分布式数据库

6、数据库领域的发展历程数据库领域的发展历程 Status of Commercial DDB -Server side P2P Support Horizontal fragmentation and 2PC Trend for Data Processing -data intensive scalable computing -cloud computing -non-relational data model,et al. 分布式数据库的基本原理是分布式系统的基础数据库的基本原理是分布式系统的基础了解:基本概念、问题描述、关键技术问题、算法、系统的设计与实现了解:基本概念、问题描述、关键技

7、术问题、算法、系统的设计与实现第一章第一章 概论概论 1.1 引言及准备知识引言及准备知识分布式数据库 分布数据库管理系统兴起于分布数据库管理系统兴起于70年代中期,推动其发展年代中期,推动其发展来自两方面:一方面是来自两方面:一方面是应用需求应用需求,另一方面是,另一方面是硬件环境硬件环境的的发展。如:全球及全国范围内的航空发展。如:全球及全国范围内的航空/铁路铁路/旅游订票系统、旅游订票系统、银行通存通兑系统、水陆空联运系统、跨国公司管理系统、银行通存通兑系统、水陆空联运系统、跨国公司管理系统、连锁配送管理系统等等。连锁配送管理系统等等。 这些应用都涉及这些应用都涉及地理上分布的团体地理上

8、分布的团体、组织的局部业务组织的局部业务管理管理和和系统全局管理系统全局管理,采用成熟的集中式数据库管理系统,采用成熟的集中式数据库管理系统已无法实现应用需求。在硬件环境上提供了功能强大的计已无法实现应用需求。在硬件环境上提供了功能强大的计算机和成熟的广域范围公用数据网及局域范围局域网的硬算机和成熟的广域范围公用数据网及局域范围局域网的硬件环境支持。件环境支持。第一章第一章 概论概论1.1 引言及准备知识引言及准备知识分布式数据库系统(分布式数据库系统(DistributedDatabaseManagementSystem,DDBMS)是地理上分散而逻辑上是地理上分散而逻辑上集中的数据库系统。

9、即通过计算机网络将地理上分散的集中的数据库系统。即通过计算机网络将地理上分散的各局域结点连接起来共同组成一个逻辑上统一的大数据各局域结点连接起来共同组成一个逻辑上统一的大数据库系统。因此可以说:分布式数据库系统是计算机网络库系统。因此可以说:分布式数据库系统是计算机网络技术和数据库技术的结合的产物。技术和数据库技术的结合的产物。分布式数据库系统与集中数据库系统一样,包含两个分布式数据库系统与集中数据库系统一样,包含两个重要部分:分布式数据库和分布式数据库管理系统重要部分:分布式数据库和分布式数据库管理系统。分布式数据库 基本概念基本概念 数据库(数据库(DB) 从用户使用数据库的角度出发,可定

10、义如从用户使用数据库的角度出发,可定义如下:下:数据库数据库是长期存储在计算机内、有组是长期存储在计算机内、有组织的、可共享的数据集合。数据库中的数织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述、存储,据按一定的数据模型组织、描述、存储,具有具有较小的冗余度较小的冗余度、较高的数据独立性和、较高的数据独立性和易于扩展性,并可为各种用户共享。易于扩展性,并可为各种用户共享。数据库设计数据库设计是对一个给定的应用环境(现是对一个给定的应用环境(现实世界)设计最优的数据模型,然后,按实世界)设计最优的数据模型,然后,按模型建立数据库。模型建立数据库。见图见图1.11.1。 分布式数

11、据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识现实世界模型DB图1.1 数据库模型 数据库管理系统(数据库管理系统(DBMS)数据库管理系统(数据库管理系统(DBMS)是人们用于管理和操是人们用于管理和操作数据库的软件产品。为有效地管理和操作数据作数据库的软件产品。为有效地管理和操作数据库,研制出数据库管理系统(库,研制出数据库管理系统(Database Management System),使用户不必涉及数据),使用户不必涉及数据的结构描述及实际存储,方便、最优地操作数据的结构描述及实际存储,方便、最优地操作数据库。其模型见图库。其模型见图1.2。 分布式数据库第一章第一章

12、概论概论1.1 引言及准备知识引言及准备知识 数据库管理系统(数据库管理系统(DBMS)数据库管理系统可数据库管理系统可描述为描述为用户接口用户接口、查询处理查询处理、查询优查询优化化、存储管理存储管理四个四个基本模块和基本模块和事务管事务管理理、并发控制并发控制、恢恢复管理复管理三个辅助模三个辅助模块组成。块组成。应用DBMSDB查询处理查询优化用户接口并发控制事务管理恢复管理存储管理DB基本模块辅助模块图1.2 数据库管理系统模型 分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识数据库系统数据库系统数据库系统数据库系统=DB+DBMS模式模式现实世界的信息抽象到数据库

13、存储的数据是一个现实世界的信息抽象到数据库存储的数据是一个逐步抽象的过程。美国国家标准协会逐步抽象的过程。美国国家标准协会(ANSI)和标准需求计划委员会和标准需求计划委员会(SPARC)根据数据的根据数据的抽象级别定义了三层模式参考模型。抽象级别定义了三层模式参考模型。 分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识 三层模式三层模式 分布式数据库外模式1外模式2外模式n模式内模式数据库应用A应用B应用C应用D应用E外模式/模式模式/内模式外模式/模式第一章第一章 概论概论1.1 引言及准备知识引言及准备知识模式模式-概念模式:概念模式:RELATION EMP KE

14、Y=ENO ATTRIBUTE=ENO:CHAR(9)ENAME:CHAR(15)TITLE:CHAR(10) RELATION PAY KEY=TITLE ATTRIBUTE= TITLE:CHAR(10) SAL:NUMBER(5) 分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识INTERNAL_RELA EMPLINDEX ON E# CALL EMINXFIELD=HEADER:BYTE(1)E#:BYTE(9)ENAME:BYTE(15)TITLE:BYTE(10)分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识模式模式-内部模式:内部模

15、式:CREATE VIEW PAYROLL(EMP_ENO, EMP_NAME, SAL)AS SELECT EMP.ENO,EMP.NAME,PAY.SALFROM EMP,PAYWHERE EMP.TITLE=PAY.TITLE 分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识模式模式-外部模式:外部模式: 基础知识基础知识 介绍关系模型、关系代数和介绍关系模型、关系代数和SQLSQL语言知识。语言知识。关系模型关系模型是数据库数据模型的三种模型(是数据库数据模型的三种模型(层次数据模层次数据模型型、网状数据模型网状数据模型和和关系数据模型关系数据模型)之一。关系是二

16、维)之一。关系是二维表,关系也称表。表中的一行称关系的一个元组,表中表,关系也称表。表中的一行称关系的一个元组,表中的一列称关系的一个属性。的一列称关系的一个属性。关系代数关系代数关系是一个集合,关系的元组是集合的元素。关系代数关系是一个集合,关系的元组是集合的元素。关系代数包括包括5个集合运算个集合运算和和3个特殊关系运算个特殊关系运算。分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识 关系代数关系代数 假设关系假设关系R和和S,则集合运算为:,则集合运算为:并(并(UNION)运算)运算:表示:表示RUSRUS或或R+SR+S。两个关系的并运算是将两个。两个关系的并运

17、算是将两个关系中的所有元组构成一个新关系。关系中的所有元组构成一个新关系。交(交(INTERSECT)运算)运算:表示:表示RSRS。两个关系的交运算的结果是。两个关系的交运算的结果是由两个关系中公共元组组成一个新的关系。由两个关系中公共元组组成一个新的关系。差(差(DIFFERENCE)运算:表示运算:表示R-S。两个关系的差运算结果是。两个关系的差运算结果是由属于一个关系由属于一个关系R,且不属于另一个关系,且不属于另一个关系S的元组构成的新关系。的元组构成的新关系。乘(乘(PRODUCT)运算)运算:表示:表示RS。结果是两个关系中所有元组。结果是两个关系中所有元组组成一个乘积关系。若组

18、成一个乘积关系。若R有有m个属性,个属性,S有有n个属性,则个属性,则RS由由(m+n)个属性组成关系;若)个属性组成关系;若R有有i个元组,个元组,S有有j个元组,则个元组,则RS由(由(ij)个元组组成关系。)个元组组成关系。除(除(DIVIDE)运算)运算:表示:表示RS。两个关系的除运算结果是满足关。两个关系的除运算结果是满足关系系S的的R关系的子集。关系的子集。第一章第一章 概论概论1.1 引言及准备知识引言及准备知识 关系代数关系代数关系运算为:选择(选择(SELECTSELECT)运算)运算:表示(R)。选择是从指定的关系中选择满足条件的元组构成一个新的关系。投影(投影(PROJ

19、ECT)运算)运算:表示A (R)。投影是从指定的关系中选择某些属性的所有值组成的新关系。连接(连接(JOIN)运算)运算:表示RS。连接是将两个关系按条件连接在一起,形成一个新关系。也可多个关系连接在一起。分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识关系代数举例关系代数举例分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识关系代数举例关系代数举例第一章第一章 概论概论1.1 引言及准备知识引言及准备知识第一章第一章 概论概论1.1 引言及准备知识引言及准备知识关系代数举例关系代数举例第一章第一章 概论概论1.1 引言及准备知识引言及准备知识关系代

20、数举例关系代数举例是一种非过程性语言。提供了是一种非过程性语言。提供了数据定义数据定义(建立数据(建立数据库和表结构)、库和表结构)、数据操纵数据操纵(输入、修改、删除和更(输入、修改、删除和更新、数据查询)、新、数据查询)、数据控制数据控制等数据库操作命令,较等数据库操作命令,较好地满足数据库语言的要求。由于国际标准化组织好地满足数据库语言的要求。由于国际标准化组织指定了指定了SQLSQL标准,具有可移植性,标准,具有可移植性, SQLSQL又提供了灵又提供了灵活而强大的查询功能方便复杂的查询操作,使活而强大的查询功能方便复杂的查询操作,使SQLSQL为广大用户所采用。具体为广大用户所采用。

21、具体SQLSQL命令略。命令略。分布式数据库第一章第一章 概论概论1.1 引言及准备知识引言及准备知识SQL (Structured Query Language)第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念节点节点/场地场地分布式数据库系统分布式数据库系统是地理上分散而逻辑上集中的数据库系统。管理分布式数据库的软件称分布式数据库管理系统。分布式系统分布式系统通常是由计算机网络将各地理上分散的逻辑单位连接起来。被连接的逻辑单位称为节点(节点(node)或场地)或场地(site)。节点/场地可是单独一台计算机也可是局域网组成。分布式数据库集中数据库系统集中数据库系统所有

22、数据驻留在同一场地上。如图所有数据驻留在同一场地上。如图1.4:我们称传统的数据库系统为集中式数据我们称传统的数据库系统为集中式数据库系统(库系统(DB)。)。 网络节点上的集中数据库系统网络节点上的集中数据库系统DBMSDB图1.4 集中数据库系统分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念网络场地1场地4场地3场地2DBDB分布式数据库(分布式数据库(DDB)分布式数据库分布式数据库是分布在一个计算机网络上的多个逻辑相关的数据库的集合。也就是说,分布式数据库是一组结构化的数据集合,逻辑上属于同一系统,物理上分布在计算机网络的各个不同节点上。如图1.5所

23、示。分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念网络场地1场地4场地3场地2DBDBDBDBDBDB图1.5 分布式数据库系统分布式数据库管理系统(分布式数据库管理系统(DDBMS)分布式数据库系统由分布式数据库系统由分布式数据库(分布式数据库(DDB)和和分分布式数据库管理系统(布式数据库管理系统(DDBMS)组成。组成。分布式数据库管理系统分布式数据库管理系统是分布式数据库系统的一是分布式数据库系统的一组软件。负责管理分布式数据库的数据管理和操组软件。负责管理分布式数据库的数据管理和操作。由于分布式数据库管理系统基于分布环境下作。由于分布式数据库管理系

24、统基于分布环境下实现,必保证逻辑数据的一致性、完整性等,因实现,必保证逻辑数据的一致性、完整性等,因此,其复杂度远高于集中数据库管理系统。此,其复杂度远高于集中数据库管理系统。分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念分布式数据库分布式数据库 用户视图用户视图分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念分布式数据库分布式数据库 举例举例分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念分布式数据库分布式数据库 举例举

25、例分布式数据库的特性分布式数据库的特性数据透明性数据透明性场地自治性场地自治性 数据透明性数据透明性 : 基于分布库的划分层次:基于分布库的划分层次:全局外层(用户层)全局外层(用户层)、全局全局 概念层、局部概念层概念层、局部概念层和和局部内层局部内层。 可知:应用程序与系统实际数据组织相分离,即数据可知:应用程序与系统实际数据组织相分离,即数据具有独立性或透明性。具体体现为具有独立性或透明性。具体体现为分布透明性分布透明性、复制透复制透明性明性和和分片透明性分片透明性。分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念数据透明性数据透明性分布透明性分布透明性

26、:全局用户看到的是全局数据模型的描述,用:全局用户看到的是全局数据模型的描述,用户象使用集中数据库一样,不需考虑数据的存储场地和操户象使用集中数据库一样,不需考虑数据的存储场地和操作的执行场地。作的执行场地。复制透明性复制透明性:分布数据库支持:分布数据库支持有控制的数据冗余有控制的数据冗余,即数据,即数据可重复存储在不同的场地上,提高系统的可用性和可靠性,可重复存储在不同的场地上,提高系统的可用性和可靠性,加强系统处理的并行性。加强系统处理的并行性。分片透明性分片透明性:分片分片是将一个关系分成几个子关系之中的一是将一个关系分成几个子关系之中的一个子关系。根据实际需求,一个分片可能存储在不同

27、的场个子关系。根据实际需求,一个分片可能存储在不同的场地上(实际存储在场地上称分段)。地上(实际存储在场地上称分段)。分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念数据透明性数据透明性逻辑层逻辑层是用户语义层,是用户语义层,物理层物理层是具体实现细节。逻辑层的语义与物理是具体实现细节。逻辑层的语义与物理层的实现分离开来,对高层系统和用户隐蔽了实现细节。即应用程序层的实现分离开来,对高层系统和用户隐蔽了实现细节。即应用程序无须考虑数据分片细节,对分片的调用(分片到分段的映射)由系统无须考虑数据分片细节,对分片的调用(分片到分段的映射)由系统自动完成。自动完成。

28、分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念数据集合数据集合片段片段片段片段场地n逻辑层物理层分片分片分片分片场地1图1.6 数据分片、分段示意图场地自治性场地自治性在分布式数据库系统中,为保证局部场地独立自主能力,在分布式数据库系统中,为保证局部场地独立自主能力,分布场地具有自治性。多个场地或结点的局部数据库在逻分布场地具有自治性。多个场地或结点的局部数据库在逻辑上集成为一个整体,并为分布式数据库系统的所有用户辑上集成为一个整体,并为分布式数据库系统的所有用户使用,这种应用称使用,这种应用称全局应用全局应用,其用户称,其用户称全局用户全局用户。分布式。分

29、布式数据库系统也允许用户只使用本地的局部数据库,该应用数据库系统也允许用户只使用本地的局部数据库,该应用称称局部应用局部应用,其用户为,其用户为局部用户局部用户。这种局部用户独立于全。这种局部用户独立于全局用户的特性称局用户的特性称局部数据库的自治性局部数据库的自治性,也称,也称场地自治性场地自治性。具体体现为:具体体现为:设计自治性设计自治性:局部数据库管理系统(DBMS)能独立决定它自己局部库的设计。通信自治性通信自治性:局部数据库管理系统(DBMS)能独立决定是否和如何与其他场地的DBMSs通信。执行自治性执行自治性:局部数据库管理系统(DBMS)能独立决定以何种方式执行局部操作。分布式

30、数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念什么什么不是不是分布式数据库系统分布式数据库系统松耦合/紧耦合的多处理器系统网络节点上的集中式数据库系统多数据库系统?网格数据库?数据库网格?多数据库系统?网格数据库?数据库网格?P2P数据库系统?数据库集成系统?联邦数据库系统?数据库系统?数据库集成系统?联邦数据库系统?分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念分布式的多处理器系统分布式的多处理器系统集中式管理系统集中式管理系统存在一个场地上;存在一个场地上

31、;分布式管理系分布式管理系统统分布在网络上的多个场地上。分布在网络上的多个场地上。并行系统并行系统根据三要素根据三要素P P(处理机)、(处理机)、M M(内存)、(内存)、D D(磁盘)组成方式不同,有三种体系结构,其(磁盘)组成方式不同,有三种体系结构,其系统结构如下所示。系统结构如下所示。分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念共享内存系统(共享内存系统(Shared-MemeryArchitecture)P1PnMDBUS分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念共享磁盘系统(共享磁盘系统(Shared-

32、DiskArchitecture)P1PnM1DMnDBUS无共享系统(无共享系统(Shared-Nothing Architecture)分布式数据库第一章第一章 概论概论 1.2分布库系统的基本概念分布库系统的基本概念P1PnM1D1MnDnBUS与分布环境相似,但不同,分布系统是松散互操作。最基本不同是操作模式。最基本不同是操作模式。多处理器系统多处理器系统是对称的,由一是对称的,由一定数量的处理器、内存组件组成,由一个或多个同样的定数量的处理器、内存组件组成,由一个或多个同样的操作系统严格控制每一个处理器的任务。操作系统严格控制每一个处理器的任务。而而分布计算系统分布计算系统是异构操作

33、系统以及硬件环境。是异构操作系统以及硬件环境。第一章第一章 概论概论 -1.2分布库系统的基本概念分布库系统的基本概念 分布式数据库系统分布式数据库系统既不是既不是多处理机系统多处理机系统也不是也不是基于基于服务器的系统服务器的系统例例:一个全国范围的加工制造公司的分布系统一个全国范围的加工制造公司的分布系统( 1 ) 每 一 地 域 的 分 公 司 保 存 自 己 公 司 的 雇 员 信 息每 一 地 域 的 分 公 司 保 存 自 己 公 司 的 雇 员 信 息(employees)。)。(2)研发部门(研发部门(R&Dfacility)维护其研发项目信息。)维护其研发项目信息。(

34、3)加工工厂保存工程信息并可访问研发场地的研发信息和仓加工工厂保存工程信息并可访问研发场地的研发信息和仓库数据(库数据(warehouse)。)。(4). 总部保存区域的市场销售信息,并可访问工厂和仓库的总部保存区域的市场销售信息,并可访问工厂和仓库的帐目数据(帐目数据( inventory )。)。分布式数据库第一章第一章 概论概论 -1.2分布库系统的基本概念分布库系统的基本概念 例例: 一个全国范围的加工制造公司的分布系统一个全国范围的加工制造公司的分布系统分布式数据库特点:特点:数据分布在各个场地上,如公司的雇员(数据分布在各个场地上,如公司的雇员(employee)和库房和库房的帐目

35、信息的帐目信息(inventory)。)。查询涉及多个场地,如查询年龄小于查询涉及多个场地,如查询年龄小于45岁的雇员,涉及所有岁的雇员,涉及所有的场地雇员信息。的场地雇员信息。第一章第一章 概论概论 -1.2分布库系统的基本概念分布库系统的基本概念DDB与与C/SDB的区别的区别分布数据与集中数据(分布数据与集中数据(Distributeddataversuscentralizeddata)集中的功能和分布的功能(集中的功能和分布的功能(Centralizedfunctionversusdistributedfunction)分布式数据库第一章第一章 概论概论 1.3分布库系统的作用和特点分

36、布库系统的作用和特点 作用作用分布式数据库系统分布式数据库系统是地理上(或物理上)分散而逻辑上集是地理上(或物理上)分散而逻辑上集中的数据库系统。适合于分散型组织结构的任何信息系统。中的数据库系统。适合于分散型组织结构的任何信息系统。如:航空公司订票系统、陆、海、空军事指挥系统、如:航空公司订票系统、陆、海、空军事指挥系统、CIMS制造业、银行通存通兑系统和连锁配送系统等等。制造业、银行通存通兑系统和连锁配送系统等等。以上每一系统都涉及分散在不同地理位置上数据的一致性、以上每一系统都涉及分散在不同地理位置上数据的一致性、完整性及有效性,是集中式数据库无法满足的。在此推动完整性及有效性,是集中式

37、数据库无法满足的。在此推动下,研制出分布式数据库系统,有效地适应了下,研制出分布式数据库系统,有效地适应了地理上分散地理上分散的的、网络环境下的网络环境下的、逻辑上统一的逻辑上统一的分布式系统的需求。分布式系统的需求。 特点特点 分布式数据库系统分布式数据库系统是在集中式数据库和计算机网络技术是在集中式数据库和计算机网络技术基础上发展起来的,同时提出了许多基础上发展起来的,同时提出了许多新观点新观点、新方法新方法和和实现的实现的新技术新技术,有效地提高了分布系统的性能。因此,有效地提高了分布系统的性能。因此,分布式数据库系统具有许多集中库系统所不具备的优点。分布式数据库系统具有许多集中库系统所

38、不具备的优点。但由于分布库系统复杂,有些技术的实现还不完善,如:但由于分布库系统复杂,有些技术的实现还不完善,如:恢复开销庞大,导致系统效率严重下降;难于达到完全恢复开销庞大,导致系统效率严重下降;难于达到完全透明等。透明等。分布式数据库第一章第一章 概论概论 1.3分布库系统的作用和特点分布库系统的作用和特点 优点优点 提高系统性能,如:吞吐率和响应速度提高。提高系统性能,如:吞吐率和响应速度提高。 可利用现有设备和系统,降低投资。可利用现有设备和系统,降低投资。 系统允许存储副本,提高可靠性、可用性和并系统允许存储副本,提高可靠性、可用性和并行执行度。行执行度。 根据实际需要,可增加或减少

39、某一场地。系统根据实际需要,可增加或减少某一场地。系统具有可扩展性。具有可扩展性。 系统资源和数据分布在物理上不同场地上,为系统资源和数据分布在物理上不同场地上,为系统所有用户共享。系统所有用户共享。分布式数据库第一章第一章 概论概论 1.3分布库系统的作用和特点分布库系统的作用和特点 不足不足 经验不足,系统不很完善。经验不足,系统不很完善。 系统复杂。系统复杂。 维护开销大。维护开销大。 需分布控制。需分布控制。 安全问题。安全问题。分布式数据库第一章第一章 概论概论 1.3分布库系统的作用和特点分布库系统的作用和特点 分布库系统复杂因素分布库系统复杂因素 数据复制场地故障场地故障分布式事

40、务处理分布式事务处理分布式数据库第一章第一章 概论概论 1.3分布库系统的作用和特点分布库系统的作用和特点 分布式数据库设计分布式数据库设计分布式数据库设计中需要考虑下面几个问题:分布式数据库设计中需要考虑下面几个问题:如何合理分布数据于各个场地上;如何合理分布数据于各个场地上;如何设定复制型和非复制型数据;如何设定复制型和非复制型数据;如何实现目录管理。如何实现目录管理。分布式数据库第一章第一章 概论概论 1.4主要问题主要问题查询处理查询处理 事务到数据操作命令的转换问题;事务到数据操作命令的转换问题;以最小代价(访问时间)执行查询策略的优化问题。以最小代价(访问时间)执行查询策略的优化问

41、题。 并发控制并发控制对多个用户并发访问的同步问题;对多个用户并发访问的同步问题;事务的一致性和隔离性问题;事务的一致性和隔离性问题;解决和预防死锁问题。解决和预防死锁问题。分布式数据库第一章第一章 概论概论 1.4主要问题主要问题可靠性可靠性系统故障恢复问题;系统故障恢复问题;事务的原子性和耐久性实现问题。事务的原子性和耐久性实现问题。 安全性与完整性安全性与完整性在安全性与完整性方面,要解决:在安全性与完整性方面,要解决:用户授权和认证问题;用户授权和认证问题;访问权限控制问题;访问权限控制问题;数据完整性约束问题。数据完整性约束问题。分布式数据库第一章第一章 概论概论 1.4主要问题主要

42、问题相互关系相互关系分布式数据库目录管理目录管理分布式分布式DB设计设计并发控制可靠性查询处理死锁管理第一章第一章 概论概论 1.4主要问题主要问题早期的一些早期的一些DDBS原型原型SDD-1系统系统:70年代后期到年代后期到80年代初完成,由美国国年代初完成,由美国国防部委托美国计算机公司(防部委托美国计算机公司(CCA)研制的第一个原型)研制的第一个原型同构型的关系数据模型(时间戳并发控制),同构型的关系数据模型(时间戳并发控制),ARPANET网运行。网运行。R*系统系统:80年代初,由美国年代初,由美国IBM公司的公司的SanJose研究研究室设计开发的原型。是室设计开发的原型。是S

43、ystemR关系数据库系统在分布关系数据库系统在分布环境中的扩充。环境中的扩充。采用两段锁和两阶段提交技术,不支持采用两段锁和两阶段提交技术,不支持分片和副本。分片和副本。支持水平、垂直分片,以及数据复制;时戳、半联接等的提出;第一章第一章 概论概论 1.5 分布式数据库系统介绍分布式数据库系统介绍Distributed INGRES分布式INGRES是是INGRES系统的进一步研究成果,由美国系统的进一步研究成果,由美国加利福尼亚大学伯克利分校研发。该系统支持加利福尼亚大学伯克利分校研发。该系统支持QUEL查询语查询语言。支持对关系水平分片,但不支持数据副本。采用基于锁言。支持对关系水平分片

44、,但不支持数据副本。采用基于锁的并发控制方法。目录分为全局目录和局部目录。的并发控制方法。目录分为全局目录和局部目录。 法国法国SIRIUS计划开发的几个计划开发的几个DDBS原型:计划原型:计划1976年创建年创建 SIRIUS-DELTASIRIUS-DELTA系统系统,法国信息与自动化技术研究所,法国信息与自动化技术研究所(INRIAINRIA)19771977研制的同型的研制的同型的DDBS,DDBS,于于19811981年提出异构型版本年提出异构型版本(封锁与死锁预测,有完善的恢复机制)。是当时世界上著(封锁与死锁预测,有完善的恢复机制)。是当时世界上著名的四大分布式数据库样板系统之

45、一。名的四大分布式数据库样板系统之一。支持关系模型,支持水平、垂直分片。第一章第一章 概论概论 1.5 分布式数据库系统介绍分布式数据库系统介绍法国法国SIRIUS计划开发的几个计划开发的几个DDBS原型:计划原型:计划1976年创建年创建MICROBEMICROBE系统系统是在是在SIRIUS-DELTASIRIUS-DELTA系统基础上,吸收其他系统基础上,吸收其他系统优点,于系统优点,于2020世纪世纪8080年代初推出的在微机局域网上的年代初推出的在微机局域网上的DDBSDDBS,采用关系数据模型,同型的,采用关系数据模型,同型的DDBS, DDBS, 是高级的分布是高级的分布执行系统

46、。是世界上最先对请求进行动态分布式的分解执行系统。是世界上最先对请求进行动态分布式的分解定位与并行处理的算法。即分布式查询优化是动态执行定位与并行处理的算法。即分布式查询优化是动态执行的。的。POLYPHEME系统系统,1979年公布的异构型版本。是年公布的异构型版本。是利用现有计算机网络和存在于各节点上数据库实现分布利用现有计算机网络和存在于各节点上数据库实现分布式数据库系统的杰出代表,是欧洲第一个投入运行的式数据库系统的杰出代表,是欧洲第一个投入运行的DDBS。(。(无并发控制无并发控制)。)。第一章第一章 概论概论 1.5 分布式数据库系统介绍分布式数据库系统介绍VDN系统系统。德国柏林

47、大学。德国柏林大学1977-1979开发的开发的关关系数据模型,同型的系数据模型,同型的DDBSDDBS。支持关系的水平分片。支持关系的水平分片和副本,采用封锁和预防死锁。和副本,采用封锁和预防死锁。POREL系统系统。德国斯图加特大学。德国斯图加特大学1975-1981开开发的发的关系数据模型,同型的关系数据模型,同型的DDBSDDBS。支持关系的水。支持关系的水平分片和副本,采用封锁和预防死锁,共用系统平分片和副本,采用封锁和预防死锁,共用系统的并发控制、恢复及存取机制。未真正在网上运的并发控制、恢复及存取机制。未真正在网上运行。行。第一章第一章 概论概论 1.5 分布式数据库系统介绍分布

48、式数据库系统介绍分布式数据库系统的发展分布式数据库系统的发展20世纪世纪80年代以来:相继推出了扩充的分布式年代以来:相继推出了扩充的分布式DBMS。标志着分布式数据库系统步入标志着分布式数据库系统步入实用阶段实用阶段。这一时期商品化的产品如下:这一时期商品化的产品如下:分布式分布式Ingres(D-Ingres)。加州大学伯克利分校。加州大学伯克利分校1986年推出的,是年推出的,是Ingres关系数据库系统的分布式版本。关系数据库系统的分布式版本。支持关系的水平分片,但不支持副本,采用封锁机制。支持关系的水平分片,但不支持副本,采用封锁机制。SQL*Star。ORACLE公司公司1986推

49、出的,是异质型的推出的,是异质型的DDBS.1993年公布了年公布了OracleV7.1,1997年推出商品化软年推出商品化软件件V8.0。第一章第一章 概论概论 1.5 分布式数据库系统介绍分布式数据库系统介绍分布式数据库系统的发展分布式数据库系统的发展20世纪世纪80年代以来年代以来,这一时期商品化的产品如下:这一时期商品化的产品如下:SybaseSQLServer。SYSBASE1987年推出的。年推出的。Informix-Online.INFORMIX公司公司20世纪世纪90年代推出。年代推出。C-POREL.1990年由中国科学院数学所等单位开发集年由中国科学院数学所等单位开发集成的

50、。成的。仍未推出真正完全透明的仍未推出真正完全透明的DDBMS第一章第一章 概论概论 1.5 分布式数据库系统介绍分布式数据库系统介绍Oracle 分布式数据库分布式数据库Oracle支持异构的分布式数据库系统,即在系统中存在有支持异构的分布式数据库系统,即在系统中存在有非非Oracle数据库。数据库。Oracle数据库服务器通过连接于一个数据库服务器通过连接于一个代理(代理(agent)的异构服务()的异构服务(Heterogeneous Services)来访问非)来访问非Oracle数据库。数据库。异构服务异构服务(Heterogeneous Services(HS)是集)是集成于成于O

51、racle服务器内的组件,是服务器内的组件,是Oracle 透明网关产品套透明网关产品套件中的使能技术。件中的使能技术。HS为为Oracle网关产品以及其它的异构网关产品以及其它的异构访问工具提供了通用的体系结构和管理机制。访问工具提供了通用的体系结构和管理机制。 数据库链数据库链(database links)是一个指针,定义从一个)是一个指针,定义从一个Oracle数据库服务器到另一个数据库服务器到另一个Oracle数据库服务器的单数据库服务器的单向通信路径。向通信路径。第一章第一章 概论概论 1.6 现代分布式数据库产品分布特性现代分布式数据库产品分布特性DB2分布式数据库分布式数据库

52、数据分区特性数据分区特性(DataPartitioningFeature,DPF),用于将,用于将数据库分成多个数据库分区。每个数据库分区有它自己的数据库分成多个数据库分区。每个数据库分区有它自己的一组计算资源,包括一组计算资源,包括 CPU 和存储。和存储。当处理一个查询时,当处理一个查询时,请求也相应地被划分成多个部分,以便让各个数据库分区请求也相应地被划分成多个部分,以便让各个数据库分区各自处理其负责的那些行。各自处理其负责的那些行。DPF可通过增加数据库分区来可通过增加数据库分区来提高处理能力。提高处理能力。 DB2 Connect 由编程接口(被实现为由编程接口(被实现为 JDBC、SQLJ、ODBC、DB2 CLI、OLE DB、.NET 和和 Embedded SQL 驱动程序)和一个通信基础设施组成。驱动程序)和一个通信基础设施组成。DB2 Connect附带了一个内建的基础级联邦数据库功能,当在附带了一个内建的基础级联邦数据库功能,当在 服务器上部署了服务器上部署了 DB2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论