![云数据库体系架构研究分析_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-2/14/22032308-8a65-4bfc-823d-2791ee9e82cc/22032308-8a65-4bfc-823d-2791ee9e82cc1.gif)
![云数据库体系架构研究分析_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-2/14/22032308-8a65-4bfc-823d-2791ee9e82cc/22032308-8a65-4bfc-823d-2791ee9e82cc2.gif)
![云数据库体系架构研究分析_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-2/14/22032308-8a65-4bfc-823d-2791ee9e82cc/22032308-8a65-4bfc-823d-2791ee9e82cc3.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、云数据库体系架构研究分析网络应用越发普及,数据量呈现爆炸式增长。随着云计算技术的发展,云数据管理问题得到了人们的关注。本文首先整体介绍了一下云数据库,之后着重介绍了三种云数据库体系架构。通过分析具有代表性的三种体系架构,进而提出了一种新的云数据库体系架构。最后讨论了云数据库体系架构的研究方向。互联网已经成为当今人们生活中不可或缺的一部分。一方面,随着Web2.0的流行以及云计算技术的发展,超大规模和高并发的社交网站迅速兴起,人们对互联网的需求远不局限于网页信息的浏览,而是通过浏览器获取各种各样的服务。另一方面,互联网数据中心的研究报告显示,在未来几年中,企业对于结构化以及非结构化的数据存储需求
2、会每年都会增长,但对非结构化数据需求增长幅度相对较大。同时,在数据库知识网站DB-Engines最新一期的数据库产品流行度排名中,位于前10名的大部分是基于关系数据模型的数据库,以及少部分的非关系数据模型数据库,但从整体来看,RelationalDBMS处于下降的趋势,而对非关系数据模型的数据库的需求越来越多。面对数据的海量存储以及需求的动态变化,传统关系型数据库已经显得力不从心。为了满足互联网发展以及互联网用户对数据海量存储的需求,Amazon、Google、Microsoft等公司相继对云数据库管理系统进行了深入研究,并生产了自己企业的云数据库。具有代表性的云数据库有Amazon的simp
3、leDB、Google的BigTable以及yahoo的PNUTS等。1 .云数据库概述通俗的理解,云数据库就是部署在云计算环境中,并利用云计算的特性来提升自身的服务质量,满足用户新需求的数据库。云数据库是随着SaaS(Softwareasaservice;软件即服务)应用的兴起而发展起来的一种云计算技术,它在数据库的存储能力方面有了很大的提高,并在一定程度上消除了对软件、硬件以及人员的重复配置,让软硬件的升级变得更加方便,与此同时也虚拟化了很多后端的功能。与传统的关系数据库相比,云数据库具有显著的优势:海量性、种类多样性、动态可扩展性、高可用性、较低的使用代价、易用性、大规模并行处理等。2
4、.云数据库系统体系架构云数据库的系统体系架构多种多样,本文主要介绍采用键/值数据模型和关系数据模型的系统体系架构以及可扩展分布式关系型系统体系架构。2.1 HBase体系架构HBase(HadoopDatabase),是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。HBase是谷歌Big-table的开源实现,其采用的架构和Bigtable类似。如图1所示。图1Hbase的体系架构HBase体系架构中主要包括5部分,分别为:Client,Zookeeper,Hmaster,HRegionServer和Store,具
5、体功能如下:(1)Client:为用户访问数据库提供了接口。(2)Zookeeper:主要用于存储数据库模式和所有HRegion的地址,并实时监控HRegion-Server的状态。(3)HMaster:主要为每个HRegionServer分配其要维护的HRegion群组,实现负载均衡,HBase中仅有一个Masterserver。(4)HRegionServer:每个HRegionServer主要用于管理多个HRegion,确保其能为Client提供服务,并及时向HMaster提供自己的运行状况信息。(5)Store:主要用于实现数据库的存储功能,其由两部分组成:MemStore和Store
6、Files。更新数据首先会存储到MemStore中,并当MemStore数据存储满了之后再将数据存储到StoreFile中,其中StoreFile存放在分布式文件系统的HFile中。2.2 SQLAzure体系架构SQLAzure是一种基于云计算的关系型数据库服务,基础架构类似于SQLServer2008,但它与SQLServer2008有所不同,其在内部包含了很多虚拟服务器,可以根据需求的动态变化而改变参与计算的虚拟机数量。SQLAzure以关系模型存储数据,并且每台虚拟机都安装了数据库管理系统。一般情况下,一个完整的数据库会被存储到多台虚拟机中。每台虚拟机的结构相同,都包括SQLAzure
7、Fabric,管理服务,若干数据库实例,管理服务主要用于实现数据同步,这就避免了因为更新操作而导致的每台虚拟机中数据的不同,从而保证了数据的高可用性。同时,虚拟机通过SQLAzureFabric和管理服务之间互相交换信息,从而监控整体服务的状态。如图2所示。图2SQLAzure的体系架构2.3 可扩展分布式关系型系统体系架构可扩展分布式关系型系统是在非关系型数据库存储系统基础上提出来的,并借鉴了RDBMS数据模型的高效性和NoSQL数据库的高可用性,其体系架构如图3所示。图中实线箭头用于表示组件间数据的传输功能;虚线箭头用于表示组件间对信号的控制功能。系统服务组件主要包括五种,分为别:RS(主
8、服务,主要用于维护系统最底层的元数据),US(更新服务,主要用于执行系统的更新操作),CS(主干服务,主要用于存储用于查询的静态数据),MS(合并服务,主要用于处理查询请求时数据的合并相关操作),client(客户端,主要为用户操作数据库提供接口)。图3可扩展分布式关系型系统体系架构客户端查询流程,如图4所示。图4数据查询流程(1)首先客户端向处理合并操作的合并服务组件发送查询请求;(2)合并服务组件接到请求后首先向主服务发送定位请求,获取相应数据所在服务器的位置;(3)主服务组件RS根据合并服务的请求获取相应的定位信息并返回给合并服务组件;(4)合并服务组件根据返回的定位信息首先向存储静态数
9、据的主干服务组件CS发送查询请求;(5)主干服务组件CS根据请求返回满足条件的静态数据;(6)合并服务组件然后根据从主服务返回的定位信息向存储动态数据的更新服务组件发起动态查询请求;(7)更新服务组件根据请求向合并服务组件返回满足需求的动态数据;(8)合并服务组件将(5)和(7)返回的数据进行处理并将最终结果返回给客户端。2.4 云数据库体系架构的探索HBase体系架构采用键/值数据模型,解决了传统关系数据库只能存储关系型数据的瓶颈,其不仅可以存储结构化数据,同时也可以存储半结构化以及非结构化数据,并可以通过Zookeeper实时监控系统运行状态,保证交叉操作数据的正确性。SQLAzure体系
10、架构采用关系数据模型,可以使用与人们所熟悉的SQLServer相同的方式来使用,在扩展性、可用性等方面相对传统数据库来说具有很好的改进,并可以通过管理服务实现数据间的同步。可扩展分布式关系型系统体系架构既具有关系数据库的便携性同时又增加了NoSQL的可扩展性,提出了一种全新的数据读写、合并以及存储流程。三者在实现方式上有所不同,但他们的基本目的是一致的,都是尽可能保证系统的高可用性以及高效性,三者具有相对的优势,但如果将其优点进行融合,各自发挥各自的优势,便可带来新的体验。下面介绍一种在三者基础上提出的云数据库体系架构。该体系架构融合了Hbase、SQLAzure、可扩展分布式关系型系统体系架
11、构三者的优点,将用户的操作分为更新操作和查询操作两种。首先客户端通过访问端口进行操作,如果是查询操作并且客户端存储了相应的分区映射图,直接到指定的HregionServer读取数据,如果未存储相应的分区映射图则首先通过Hmasterselect获取相应的分区映射图之后再到指定的HregionServer读取数据。因为不需要执行更新操作,Store中只有存储数据的Storefile。如果用户执行的是更新操作,则首先经过Zookeeper检查一下相应的HRegionServer的状态,若可用则连接到相应的HregionServer,否则Hmaster_update会根据负载均衡分配可用的Hregi
12、onServer,并将数据首先放到MemStore中,在适当的时机自动更新到Storefile中。另外,每一个HregionServer中包含一个管理服务,并且管理服务间相互连接,从而实现数据的同步。如图5所示。图5云数据库体系架构探索示意图该体系架构与Hbase体系架构相比,采用了其监控的模式,不同的是每一个体系中含有两个Hmaster,分别为Hmaster-select和Hmaster-update,二者都可以管理HRegionServer的负载均衡,调整Region的分布,区别在于前者主要用于管理用户对Table的查询操作,后者主要用于管理用户对Table的增加、删除、修改操作。与SQLAzure体系架构相比,采用了其利用管理服务实现数据同步的功能。与可扩展分布式关系型系统体系架构相比,主要采用了其查询和更新操作相分离的思想,这样执行不同的操作目的性强,在一定程度上节省了时间。3 .结论及展望随着信息量的增加,计算机所要处理的数据呈指数级别的增长,传统的关系型数据库已经不能满足用户的需求。云数据库为解决该问题提供了一种可行的解决方案,日益受到业界和学术界的普遍关注。云数据库的出现必定会带来一场巨大的变革,诸如:数据存储的变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45176-2024绿色产品评价商用制冷器具
- racemic-Biotin-sulfoxide-生命科学试剂-MCE-2914
- 2α-Mannobiose-生命科学试剂-MCE-5577
- 二零二五年度商标同授权与品牌授权管理服务协议
- 2025年度职工食堂承包协议书(含员工餐饮服务品牌建设)
- 2025年度体育赛事营销合作二零二五年度协议书
- 2025年度白酒企业人才培训与行业交流合作协议
- 二零二五年度股东清算与资产清算评估协议
- 二零二五年度炊事员临时聘用合同执行与监督规范
- 2025年度房地产贷款担保合同模板二零二五年度版
- 人教版高一数学上册期末考试试卷及答案
- 安全学原理第2版-ppt课件(完整版)
- 倾听是一种美德
- 《水上加油站安全与防污染技术要求》J
- 统编版三年级语文下册第三单元《综合性学习:中华传统节日》教案
- EN50317-2002-铁路应用集电系统受电弓和接触网的动力交互
- 项目部组织机构框图(共2页)
- 机动车登记证书
- 弹性力学第十一章弹性力学的变分原理
- 钽铌矿开采项目可行性研究报告写作范文
- 小升初数学衔接班优秀课件
评论
0/150
提交评论