基于云计算技术构建多公有云系统部署实践课件_第1页
基于云计算技术构建多公有云系统部署实践课件_第2页
基于云计算技术构建多公有云系统部署实践课件_第3页
基于云计算技术构建多公有云系统部署实践课件_第4页
基于云计算技术构建多公有云系统部署实践课件_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

构建多公有云系统部署实践构建多公有云系统部署实践1今天的话题•

我们的目标是什么?•

实现业务目标过程中遇到了什么问题?•

我们是如何思考的?•

我们是如何实践的?•

我们下一步的计划是什么?今天的话题•我们的目标是什么?•实现业务目标过程中遇到了2••单数据中心,VMWare环境宕机4小时•

切换云供应商•

再次宕机1

2•

单云供应商•

宕机6小时3

4

再找一家云供应商???我们如何走到这一步?•单数据中心,VMWare环境•切换云供应商1 233从宕机中学到的几件事(1)•

供应商SLA不是保证不宕机,而是索赔的依据SLA

<99.95%

$$从宕机中学到的几件事(1)•供应商SLA不是保证不宕机,而4从宕机中学到的几件事(2)•

小范围宕机几乎不可避免1000台服务器64GB

Mem24小时无内

存故障内存颗粒无故障工作=

87.6

年从宕机中学到的几件事(2)•小范围宕机几乎不可避免10005从宕机中学到的几件事(3)

/status-of-compute•

大范围宕机发生可能性依然存在从宕机中学到的几件事(3) https://cloudhar6“不宕机是核心需求”“不宕机是核心需求”7“如果一朵云宕机不可避免那就把应用部署到多个云上”“如果一朵云宕机不可避免那就把应用部署到多个云上”8目标•

多数据中心多活•

节省成本、可负担的解决方案•

在灾难发生的过程中,如果无法达到完全可用,则至少应该保证部分可用:•••部分业务功能可用部分客户业务可用部分数据可用•

尽量少的人工干预目标•部分业务功能可用•尽量少的人工干预9DataAppDataApp10AppApp11AppAppGIT/AnsibleAppAppGIT/Ansible12AppAppGSLBGIT/AnsibleAppAppGSLBGIT/Ansible13GIT/AnsibleUser

AppUser

AppGSLB

301GIT/AnsibleUserUserGSLB14Data?Data?15

Datamaster

DataslaveMaster

/

Slave Data DataMaster/Slave16

Datamaster

DataslaveMaster

/

Slave

AppApp Data DataMaster/SlaveApp17

Datamaster

DataslaveAppMaster

/

Slave

App

(Write) Data DataAppMaster/Slave18x

App

DataslaveMaster

/

Slave

App

(Write)

Data

master•

如果设计目标是随时保持2分数据拷贝,那么slave宕机的情

况下,master应不能写入x AppMaster/Slave•如果设计19

Datamaster

DataMasterMaster

/

Master

AppApp Data DataMaster/MasterApp20•

需要假定网络可靠(拜占庭将军问题)•

Master越多越慢,代价越高,不可扩展•

适合单数据中心内部,可以用来解决局部故障•

跨数据中心则可能需要投入专线•需要假定网络可靠(拜占庭将军问题)•适合单数据中心21

Datamaster

DataMasterMaster

/

Master

/

MasterAppApp

DatamasterApp Data DataMaster/Master/22Master

/

Master

/

Master

D

a

tam

aster

D

a

taM

asterA

ppA

ppA

pp

D

a

ta

m

aster1.

允许任意一个站点宕机、断网的情况下保证依然有2个可用站点2.

可以形成2:1的多数派解决数据不一致的问题3.

超高的可用性Master/Master/Master D23实战之:找到合适的云实战之:找到合适的云24不同云的性能不同云的性能25云间的网络云间的网络26最后的选择最后的选择27Master

/

Master

/

Master

D

a

tam

aster

D

a

taM

asterA

ppA

pp

D

a

tam

asterA

pp•

公网传输数据(专线成本过高)•

允许1个云计算数据中心宕机•

允许网络传输不稳定•

允许时钟不同步•

当数据差异发生时可以做到多数票PAXOSMaster/Master/Master D28

D

a

tam

aster

D

a

tam

asterD

a

taM

aster/citusdata/pg_paxos/watch?v=WX4gjowx45EProprose

(N,

V)Paxos

PG数据库

Accept(N,

V)

or

Accept(N’,

V,’

)

orDenyChoose

(N,

<V|V’>)ProposeAcceptChoose Data DataDataMasterht29Paxos

PG

性能问题X10

LatencyPaxosPG性能问题X10Latency30数据分类常见操作存储选择元数据(用户信息、权限、记账)CreateReadUpdateDeletePaxosPostgreSQL资产数据(云上资源资产信息)CreateReadUpdateDelete双实例数据库+定期批量复制到从站+资源实际状态定期更新操作数据(云上资源的操作日志)CreateAppendReadOSS和异步复制数据的分类处理数据分类常见操作存储选择元数据CreatePaxosPost31SlaveMasterFront

Page

Console

A

METAOSSSlaveConsole

C

METAMasterOSSSlaveMasterFront

Page

Console

B

METAOSSGSLBSlaveMasterFrontPageOSSSlave32SlaveMasterFront

Page

Console

A

METAOSSSlaveConsole

C

METAMasterOSSSlaveMasterFront

Page

Console

B

METAOSSGSLBSlaveMasterFrontPageOSSSlave33SlaveMasterFront

Page

Console

A

METAOSSSlaveConsole

C

METAMasterOSSSlaveMasterFront

Page

Console

B

METAOSSGSLBSlaveMasterFrontPageOSSSlave34SlaveMETAMasterOSSSlaveMasterOSSSlaveMETAMasterOSSProxyProxyProxyMETASlaveMETAMasterOSSSlaveMasterO35尚需解决的问题•

paxos_pg

事务性的问题•

paxos的算法的数据代理???•

异地数据中心部署的可能性•

10~100万量级云资产管理尚需解决的问题•paxos_pg事务性的问题•pax36总结•

故障理所当然发生•

打破Dev|Ops的边界,双方共同构建可用性•

理解业务目标,按需架构设计•

学会妥协总结•故障理所当然发生•打破Dev|Ops的边界,双方共37构建多公有云系统部署实践构建多公有云系统部署实践38今天的话题•

我们的目标是什么?•

实现业务目标过程中遇到了什么问题?•

我们是如何思考的?•

我们是如何实践的?•

我们下一步的计划是什么?今天的话题•我们的目标是什么?•实现业务目标过程中遇到了39••单数据中心,VMWare环境宕机4小时•

切换云供应商•

再次宕机1

2•

单云供应商•

宕机6小时3

4

再找一家云供应商???我们如何走到这一步?•单数据中心,VMWare环境•切换云供应商1 2340从宕机中学到的几件事(1)•

供应商SLA不是保证不宕机,而是索赔的依据SLA

<99.95%

$$从宕机中学到的几件事(1)•供应商SLA不是保证不宕机,而41从宕机中学到的几件事(2)•

小范围宕机几乎不可避免1000台服务器64GB

Mem24小时无内

存故障内存颗粒无故障工作=

87.6

年从宕机中学到的几件事(2)•小范围宕机几乎不可避免100042从宕机中学到的几件事(3)

/status-of-compute•

大范围宕机发生可能性依然存在从宕机中学到的几件事(3) https://cloudhar43“不宕机是核心需求”“不宕机是核心需求”44“如果一朵云宕机不可避免那就把应用部署到多个云上”“如果一朵云宕机不可避免那就把应用部署到多个云上”45目标•

多数据中心多活•

节省成本、可负担的解决方案•

在灾难发生的过程中,如果无法达到完全可用,则至少应该保证部分可用:•••部分业务功能可用部分客户业务可用部分数据可用•

尽量少的人工干预目标•部分业务功能可用•尽量少的人工干预46DataAppDataApp47AppApp48AppAppGIT/AnsibleAppAppGIT/Ansible49AppAppGSLBGIT/AnsibleAppAppGSLBGIT/Ansible50GIT/AnsibleUser

AppUser

AppGSLB

301GIT/AnsibleUserUserGSLB51Data?Data?52

Datamaster

DataslaveMaster

/

Slave Data DataMaster/Slave53

Datamaster

DataslaveMaster

/

Slave

AppApp Data DataMaster/SlaveApp54

Datamaster

DataslaveAppMaster

/

Slave

App

(Write) Data DataAppMaster/Slave55x

App

DataslaveMaster

/

Slave

App

(Write)

Data

master•

如果设计目标是随时保持2分数据拷贝,那么slave宕机的情

况下,master应不能写入x AppMaster/Slave•如果设计56

Datamaster

DataMasterMaster

/

Master

AppApp Data DataMaster/MasterApp57•

需要假定网络可靠(拜占庭将军问题)•

Master越多越慢,代价越高,不可扩展•

适合单数据中心内部,可以用来解决局部故障•

跨数据中心则可能需要投入专线•需要假定网络可靠(拜占庭将军问题)•适合单数据中心58

Datamaster

DataMasterMaster

/

Master

/

MasterAppApp

DatamasterApp Data DataMaster/Master/59Master

/

Master

/

Master

D

a

tam

aster

D

a

taM

asterA

ppA

ppA

pp

D

a

ta

m

aster1.

允许任意一个站点宕机、断网的情况下保证依然有2个可用站点2.

可以形成2:1的多数派解决数据不一致的问题3.

超高的可用性Master/Master/Master D60实战之:找到合适的云实战之:找到合适的云61不同云的性能不同云的性能62云间的网络云间的网络63最后的选择最后的选择64Master

/

Master

/

Master

D

a

tam

aster

D

a

taM

asterA

ppA

pp

D

a

tam

asterA

pp•

公网传输数据(专线成本过高)•

允许1个云计算数据中心宕机•

允许网络传输不稳定•

允许时钟不同步•

当数据差异发生时可以做到多数票PAXOSMaster/Master/Master D65

D

a

tam

aster

D

a

tam

asterD

a

taM

aster/citusdata/pg_paxos/watch?v=WX4gjowx45EProprose

(N,

V)Paxos

PG数据库

Accept(N,

V)

or

Accept(N’,

V,’

)

orDenyChoose

(N,

<V|V’>)ProposeAcceptChoose Data DataDataMasterht66Paxos

PG

性能问题X10

LatencyPaxosPG性能问题X10Latency67数据分类常见操作存储选择元数据(用户信息、权限、记账)CreateReadUpdateDeletePaxosPostgreSQL资产数据(云上资源资产信息)CreateReadUpdateDelete双实例数据库+定期批量复制到从站+资源实际状态定期更新操作数据(云上资源的操作日志)CreateAppendReadOSS和异步复制数据的分类处理数据分类常见操作存储选择元数据CreatePaxosPost68SlaveMasterFront

Page

Console

A

METAOSSSlaveConsole

C

METAMasterOSSSlaveMasterFront

Pa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论