ArchSummit全球架构师峰会-《阿里异地多活与同城双活的架构演进》-谢吉宝_第1页
ArchSummit全球架构师峰会-《阿里异地多活与同城双活的架构演进》-谢吉宝_第2页
ArchSummit全球架构师峰会-《阿里异地多活与同城双活的架构演进》-谢吉宝_第3页
ArchSummit全球架构师峰会-《阿里异地多活与同城双活的架构演进》-谢吉宝_第4页
ArchSummit全球架构师峰会-《阿里异地多活与同城双活的架构演进》-谢吉宝_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

谢吉宝(花名I唐K)阿里巴巴高级技术O家.标题文本..标题文本.标题文本.标题文本.标题文本.标题文本.标题文本.标题文本.标题文本.标题文本.标题文本.标题文本.标题文本.标题文本唐K阿里巴巴高级技术O家•谢吉宝,花名唐三•阿里期间主导设计了灰度发布系统、共享服务化平•目前负责阿里异地多活和同城双活的高可用体系建设和中间件的DevOps‣/A02向单k-5v5应用演进(性能)‣单k应用向大型分布式架构演进(效率)‣单IDC架构向多IDC架构演进(容量、稳定)7003500070035000为a么做异地多活历年双十一秒级峰值汇总9125713625.919.42009201020112012201320142015201620092010201120122013201420152016D资源I电商、阿里云、大数据等业务高速发展,单地资源容量受限D扩展I业务多元化对异地部署需求D容灾I天灾、人祸都g影响业务的可用性S地K中心方案随机访问D冷备中心M工作,u键时刻M敢随机访问D冷备中心M工作,u键时刻M敢切D冷备中心M工作,成本存在T重浪费D本质L数据仍然单点y,数据库瓶颈数据同步复制数据异步复制业界主流容灾方案随机访问随机访问数数据异步复制异地冷备数据中心C用户分片用户分片用户分片用户分片数据中心2理想化的解决方案D按用户分片,访问M同数据中心,随意切换用户分用户分片用户分片现实很骨感‣买家、卖家、商品K个维度D业务多P复杂‣业务太多,应用之间o赖u系错综复杂‣一次业务调用对应L百次原子调用‣同城<2ms‣异地6ms-100ms之间J基本原则D只取与买家链路相u的业务(单元)做B多活CD无法接受数据最终一致的跨单元单点y单元应用(买家相关应用)本单元买家维度数据全量商品及卖家数据单元应用(买家相关应用)本单元买家维度数据全量商品及卖家数据(库存单元应用(买家相关应用)本单元买家维度数据全量商品及卖家数据单元应用(买家相关应用)本单元买家维度数据全量商品及卖家数据(库存、卖家、长尾)全量买家维度数据全量商品及卖家数据买家数据...卖家及商品数据构卖家维度数据读写单元化完成交易下单卖家维度数据读写单元2单单元应用(买家相关应用)本单元本单元买家维度数据全量商品及卖家数全量商品及卖家数据单元三按用户分流按用户分流IDC-2强中心依赖中心copy类型单元二IDC-1异步消息异步消息数据同步单元三按用户分流按用户分流IDC-2强中心依赖中心copy类型单元二IDC-1异步消息异步消息数据同步技术架构cDNcDN按用户按用户分流IDCIDC-3入层DDD技术挑战路由一致数据延时数据的正确性为期K年的单元化项目D2013I杭州同城S个21C验证D2014I杭州、L海近距离S个单元D2015I千里之外的K地四单元架构这样架构升级后,容量、扩展和容灾的问题解决了么? 数据双向同步数据单向同步 数据双向同步建站平台数 数据双向同步数据单向同步 数据双向同步建站平台数据单向同步物理机…Ecs调度 数据双向同步数据单向同步资源和扩展能力单元2...单元2...单元2...单元2......单元2...xxx单单元2...容灾能力 数据双向同步数据单向同步数据单向同步 数据双向同步数据单向同步数据单向同步 数据双向同步数据单向同步数据单向同步....22.2......2.2...D单实n、集群层面的故障,有v它高可逼,那你给我说说“5.27支付宝大规模忘机事故”是昨回事?有种天鹅叫B黑天鹅C黑黑天鹅事件(英文:BlackswaneVent)指非常难以预测,且不寻常的事件,通常会引起市场连锁负面反应甚至颠覆。从次贷危机到东南亚海啸,从“泰坦尼克号”的沉没到9.11事件,瑞士央行放弃欧元兑瑞郎汇价下限后瑞郎的暴涨。黑天鹅存在于各个领域,无论金融市场、商业、经济还是个人生活,都控制。在I4领域,黑天鹅主要指网络/电力问题,导致的机房大面积、长时间M可恢复,甚至极端场景,数据可靠性出现问题ID机房内大量或者s部服务器脱网或者掉电按用户分流按用户分流DC单元二中心IDC-2cDN统一接入层入层库依赖copy类型数据库库强中心依赖copy类型单元二中心IDC-2cDN统一接入层入层库依赖copy类型数据库库强中心依赖copy类型B中心C是什么情况按用户分流按用户分流按用户分流接入层IDC单IDC单元二入层入层异步消息异步消息元元三库数据同步心机房-1机房-2B中心C的问题D业务类型繁多,u系复杂D很多业务M支持B双活CD离线e务轻量级故障演练D通过0<n96y.ing平台,可以实现单实n的故障模拟JD故障模拟恢复平台通过D3C2(差分服务协议)打标来实现对I2五元组粒度的断网模拟J容灾等级并对v进行静态巡检JD通过故障模拟恢复平台,业务方实现自己对自己的业务进行断网模拟演练JD通过故障模拟恢复平台,业务方可以实现自己对自己业务的恢复操作JNetflix的猴子家族1持容灾1持容灾234故障防范体系•轻标准ABCRTO>30min&RPO>30minX完全不具备恢复能力•重管控‣故障快速发现、定位‣故障恢复平台‣链路自动生成、容灾等级巡检00现阶段结果应恢复效果Ds年演练36次,白天10次,夜间26次Ds年节省系统M可用时间591分钟用户NscDN统一接入层负载均衡用调用容灾管控平台A应用B服务调用消息通信缓存数据层数据库/存储层用户NscDN统一接入层负载均衡用调用容灾管控平台A应用B服务调用消息通信缓存数据层数据库/存储层双活和多活的云端解决方案用用户云解析DNs接入层cDNsLBEDAsocsDRDsRDs/oss14SLB23SLB14SLB23SLB高可用k系的生态闭环户55D决策大盘、容灾切换、组织协助JD降级业务、丢弃过载流量,保证业务稳定JD根据业务流量和机器水i动态扩容D对故障改进完进行故障场景模拟,验证故障是否再现JD通过各个形式制造压测流量,来模拟真实大流量情况联系方式Am懂的•大规模、高并发、高可用•高可用、稳定性的方法策略•同城双活、异地多活•故障处理、限

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论