分布式数据库设计_第1页
分布式数据库设计_第2页
分布式数据库设计_第3页
分布式数据库设计_第4页
分布式数据库设计_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.分布式数据库设计一: .Net PetShop 4.0中的分布式数据库设计.数据库作为应用数据的存储中心,在系统中具有具足轻重的地位。当用户量急剧增长时,数据库往往成为系统的瓶颈,采用分布式数据库是首选策略。使用分布式数据库后,每一部分数据由专门的服务器来管理,分而治之,自然减少了数据库服务器的压力。 .Net PetShop 4.0使用了四个数据库,分别为: MSPetShop4 MSPetShop4Orders MSPetShop4Profile MSPetShop4Services 其中MSPetShop4用来管理产品、分类等基本数据信息,其中共有六个表 AspNet_SqlCache

2、TablesForChangeNotification Category Inventory Item Product Supplier 除AspNet_SqlCacheTablesForChangeNotification是为了配合.net的缓存处理外,其它表都是基本数据表,它们在PetShop 4.0中有对应的模型。 MSPetShop4Orders用于订单的管理,其中有三个表 LineItem Orders OrderStatus 分别用来存储订单明细、订单基本信息和订单状态的数据。 MSPetShop4Profile用于配置管理,其中有三个表 Account Cart Profiles

3、 分别用来保存账户基本信息、购物车信息和用户配置信息。 MSPetShop4Services是.Net 2.0自带的用户成员资格管理的数据库,其中数据表众多,在此不再一一列出。 通过将一个完整系统的数据按功能进行划分,各部分数据存储到独立的数据库服务器中,便是一种典型的分布式数据库模式。采用这种方式,不仅可以提高数据库以及应用的复用性,而且可以分散数据库服务器的压力,从而在某种程序上解决数据库瓶颈。二:分布式数据库介绍.(一)分布式数据库分布式数据库系统是在集中式数据库系统成熟技术的基础上发展起来的,但不是简单地把集中式数据库分散地实现,它具有自己的性质和特征。集中式数据库系统的许多概念和技术

4、,如数据独立性、数据共享和减少冗余度、并发控制、完整性、安全性和恢复等在分布式数据库系统中都有了不同的、更加丰富的内容。 (1)数据独立性。数据独立性是数据库方法追求的主要目标之一。在集中式数据库中,数据独立性包括两方面:数据的逻辑独立性和物理独立性。其意义在于程序和数据的逻辑结构和数据的存储结构无关。在分布式系统中,数据库独立性除了上面所说之外,还有数据分布独立性亦称分布透明性,即用户不必关心数据的逻辑分片,不必关心数据的物理位置分布的细节,也不必关心重复副本(冗余数据)的一致性问题。有了分布透明性,用户的应用程序书写起来就如同数据没有分布一样。在集中式数据库中,数据的独立性是通过系统的三级

5、模式和它们之间的二级映象得到的。分布式数据库,分布透明性是由于引入新的模式和模式之间的映象得到的。 (2)集中与自治相结合的控制结构。数据库是供用户共享的,在集中式数据库中,为保证数据的安全性和完整性,对数据库的控制是集中的。由数据库管理员(DBA)负责监督和维护系统的正常运行。 在分布式数据库中,数据的共享有两个层次:一是局部共享,即在局部场地上存储局部用户的共享数据。二是全局共享,即在分布式数据库的各个场地也存储可供网络中其他场地的用户共享的数据,支持全局引用。因此,相应的控制结构也具有两个层次:集中和自治。各局部的DBMS可以独立地管理局部数据库,具有自治的功能。同时,系统又设有集中控制

6、机制,协调各局部DBMS的工作,执行全局应用。 (3)适当增加数据冗余度。在集中式数据库中,尽量减少冗余度是系统目标之一。其原因是,冗余数据浪费存储空间,而且容易造成个副本之间的不一致性。减少冗余度的目标是用数据共享来达到的。而在分布式系统中却希望增加冗余数据,在不同的场地存储同一数据的多个副本。其原因是提高系统的可靠性和性能,当某一场地出现故障,系统可以对另一场地上的相同副本进行操作,不会造成系统的瘫痪。系统可以根据距离选择离用户最近的数据副本进行操作,减少通信代价。但是增加冗余会碰到集中式数据库同样的问题,即不利于更新,增加了系统维护代价,需要在这些方面作出权衡。 (4)全局的一致性、可串

7、行性和可恢复性。分布式数据库中各局部数据库应满足集中式数据库的一致性、可串行性和可恢复性。除此以外,还要保证数据库的全局一致性、可串行性和可恢复性。例如,在前面提到的银行转帐事务中,包括两个节点上的更新操作,当其中一个节点出现故障,应使全局事务回滚,在一个节点撤销已经执行的操作等。 (二)分布式数据库系统的目标 研制分布式数据库系统的动机、目的,主要包括技术和组织两方面的目标。 (1)降低费用。使用数据库的单位在组织上往往是分布的(部门、科室),在地理上也是分布的。分布式数据库系统的结构符合这种分布的要求。允许用户在自己的本地录用、查询、维护等操作,实行局部控制,降低通信代价,提高响应速度。

8、(2)提高系统可靠性。将数据分布于多个场地,并增加适当的冗余度可以提供更好的可靠性。在一些可靠性要求高的系统中,这一点尤其重要。避免了因为某个场地的故障而造成全部瘫痪的后果。 (3)保护投资。当在一个企业中已经建成了若干个数据库之后,为了相互利用资源,为了开发全局应用,就要研制分布式数据库系统。否则,就要把现有的数据库集中起来重建一个更大的集中式数据库,将是困难和不经济的。所以,利用分布式数据库充分利用现有数据库资源,提高利用率。 (4)易于扩展处理能力和系统规模。当一个企业增加了新的部门时,分布式数据库系统的结构可以很容易地扩展系统,甚至是唯一的途径:在分布式数据库中增加一个新的节点,不影响

9、现有系统的正常运行。这样比扩大集中式系统要灵活经济。在集中式系统中扩大系统和系统升级,由于有硬件不兼容和软件改变困难等缺点,升级的代价常常是昂贵和不可行的。 (三)现状与前景 尽管在过去的时间里,分布式数据库已经取得了很显著的研究成果,但是,成功地进入商品化运行的软件却仍为数不多。 集中系统的数据库设计是比较复杂的,而分布式数据库的设计就更为复杂了。它除了集中式数据库设计的所有复杂性,还有数据分布的决策、更新同步以及查询分解等的复杂性。另外,还有设计通信系统的问题。 大多数的数据库管理系统也许走一条从集中到分布的道路。首先是跨越数个节点定义数据库,避免不同节点数据的更新同步问题,许可局部和远程

10、查询,回避了复杂的查询处理问题。进一步的工作是增加有限的重复,如果最新的数据并不是最重要的情况下,这样提高了检索的性能。最后,就是完全的分布式数据库管理。系统的功能能够处理复杂的查询,有较好的并发控制机制和保证数据的更新同步。 对分布数据管理的研究有两个方面。一是单项的研究。比如数据的分布问题,通信问题等。在研究一个问题时,假定其他因素是不变的,得出研究成果。此处还要研究的是要将各种因素综合起来,研究它们的相互作用和结果。数据库设计和更新同步之间就有密切的联系,对于更新要求,依据不同的更新同步方案,对通信系统的要求也随着不同。因此,就要对这些因素综合地考虑。 分布式数据库系统的研究领域还包括对

11、计算机网络的研究。计算机网络技术的迅速发展,已经很大程度地影响到了数据库和分布数据库的领域。不管是在远程网络还是局域网领域,都发生了很多的变比。局域网和远程网之间的处理差别,必然会导致处理数据库和分布数据库问题的显然不同的一些原则和方法。 三:分布式数据库介绍(附)1前言        随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩充,数据库应用已经普遍建立于计算机网络之上。这时集中式数据库系统表现出它的不足:数据按实际需要已在网络上分布存储,再采用集中式处理,势必造成通信开销大;应用程序集中在一台计算

12、机上运行,一旦该计算机发生故障,则整个系统受到影响,可靠性不高;集中式处理引起系统的规模和配置都不够灵活,系统的可扩充性差。在这种形势下,集中式DB的“集中计算”概念向“分布计算”概念发展。分布计算主要体现在客户机服务器模式和分布式数据库体系结构两个方面。本章将分别介绍这两种技术。2分布式数据库系统概述        随着传统的数据库技术日趋成熟、计算机网络技术的飞速发展和应用范围的扩大,以分布式为主要特征的数据库系统的研究与开发受到人们的注意。分布式数据库是数据库技术与网络技术相结合的产物,在数据库领域已形成一个分支。分布

13、式数据库的研究始于20世纪70年代中期。世界上第一个分布式数据库系统SDD-1是由美国计算机公司(CCA)于1979年在DEC计算机上实现。20世纪90年代以来,分布式数据库系统进入商品化应用阶段,传统的关系数据库产品均发展成以计算机网络及多任务操作系统为核心的分布式数据库产品,同时分布式数据库逐步向客户机服务器模式发展。3DDBS的分类       (1) 同构同质型DDBS:各个场地都采用同一类型的数据模型(譬如都是关系型),并且是同一型号的DBMS。      

14、;(2)同构异质型DDBS:各个场地采用同一类型的数据模型,但是DBMS的型号不同,譬如DB2、ORACLE、SYBASE、SQL Server等。      (3)异构型DDBS:各个场地的数据模型的型号不同,甚至类型也不同。随着计算机网络技术的发展,异种机联网问题已经得到较好的解决,此时依靠异构型DDBS就能存取全网中各种异构局部库中的数据。4DDBS的特点和优缺点DDBS的基本特点:(1)物理分布性:数据不是存储在一个场地上,而是存储在计算机网络的多个场地上。逻辑整体性:数据物理分布在各个场地,但逻辑上是一个整体,它们被所有用户

15、(全局用户)共享,并由一个DDBMS统一管理。(2)场地自治性:各场地上的数据由本地的DBMS管理,具有自治处理能力,完成本场地的应用(局部应用)。(3)场地之间协作性:各场地虽然具有高度的自治性,但是又相互协作构成一个整体。DDBS的其他特点(1)数据独立性 (2)集中与自治相结合的控制机制 (3)适当增加数据冗余度 (4)事务管理的分布性DDBS的优点 (1)具有灵活的体系结构 (2)适应分布式的管理和控制机构 (3)经济性能优越 (4)系统的可靠性高、可用性好 (5)局部应用的响应速度快 (5)可扩展性好,易于集成现有的系统DDBS的缺点 (1)系统开销较大,主要花在通信部分 。(2)复

16、杂的存取结构(如辅助索引、文件的链接技术),在集中式DBS中是有效存取数据的重要技术,但在分布式系统中不一定有效。 (3)数据的安全性和保密性较难处理。5数据分片类型:(1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。(2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片。(3)导出分片:又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。(4)混合分片:以上三种方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他们的结果是不相同的。条件:(1)完

17、备性条件:必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的任何一个片段。(2)可重构条件:必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可用联接操作重构全局关系。(3)不相交条件:要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。6数据分配方式(1)集中式:所有数据片段都安排在同一个场地上。 (2)分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。 (4)全复制式:数据在每个场地重复存储。也就是每个场地上都有一个完整的数据副本。(5)混合式:这

18、是一种介乎于分割式和全复制式之间的分配方式。7体系结构                                     数据分片和数据分配概念的分离,形成了“数据分布独立型”概念。数据冗余的显式控制。数据在各个场地的分配情况在分配模式中一目了

19、然,便于系统管理。        局部DBMS的独立性。这个特征也称为“局部映射透明性”。此特征允许我们在不考虑局部DBMS专用数据模型的情况下,研究DDB管理的有关问题。8分布式数据库管理系统                            

20、          接受用户请求,并判定把它送到哪里,或必须访问哪些计算机才能满足该要求。        访问网络数据字典,了解如何请求和使用其中的信息。        如果目标数据存储于系统的多个计算机上,就必须进行分布式处理。        通信接口功能。在用户、局部DBMS和其他计算机的DBMS之间进行协调。        在一个异构型分布式处理环境中,还需提供数据和进程移植的支持。这里的异构型是指各个场地的硬件、软件之间存在着差别。 9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论