




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、技术创新,变革未来阿里云云原生异地多活解决方案目录CONTENTS01容灾架构分析02阿里云异地多活解决方案03异地多活客户案例容灾架构分析01主机级 故障机房级 故障地域级 故障容灾必要性磁盘故障性能中断数据损坏主机网络异常单点负载过高流量不均自然灾害战争/恐袭供电故障机房网络问题建筑火灾空调故障全 局 影 响 面单点故障影响扩散系统复杂度随着系统复杂度的增加,单点问题的影响面逐步增加容灾能力成为企业信息化建设的必选项容灾行业分析国家信息化领导小组关于加强信息安全保障工作的意见中共中央办公厅、国务院办公厅(中办发2003 27号);国家网络与信息安全协调小组关于做好重要信息系统灾难备份工作的
2、通知(信安通200411号);河北省信息安全战略(冀办发200721号);河北省关于加强信息安全保障工作的实施意见(冀办发200412号);河北省网络与信息安全“十二五”规划;加强全省社保资金管理信息系统建设 推进信息共享工作方案(办字2012 86号);国家电子政务总体框架(国信20062号);2006-2020国家信息化发展战略(中办发200611号);关于转发的通知中共中央办公厅、国务院办公厅(中办发2002 17号)信息系统容灾恢复规范(GB/T 20988-2007)合 规 严 格全球容灾市场总额2017年约71.3亿美元,预计2022年上升到115.9亿美元10万+企业用户40万+
3、数据库实例客 户 群 体 广政 府金 融能 源互 联 网通 信容灾架构演进Region:地域级别Zone:机房级别Region A主备APPAPPZone 1流量: 50%Zone 2流量: 50%主备APPAPPZone 1Zone 2流量: 50%流量: 50%主APPRegion BZone 3流量: 0%同城双活异地冷备:双Region三AZRegion A备主备APPAPP主备APPAPP异地冷备:双Region四AZRegion ARegion BZone 1Zone 2Zone 3Zone 4流量: 50%流量: 50%流量: 0%流量: 0%主APPAPP异地双活主备APPAP
4、PRegion ARegion BZone 1Zone 2Zone 3Zone 4流量: 25%流量: 25%流量: 25%流量: 25%APP异地三活Region CRegion A主备APPAPPZone 1流量: 100%Zone 2流量: 0%同城容灾APPAPPAPPRegion ARegion AZone 1Zone 2Zone 3Zone 4流量: 16.6%流量: 16.6%流量: 16.6%流量: 16.6%APPZone 5流量: 16.6%主/备主/备主/备备DTS双向同步异地多活APPZone 6流量: 16.6%主/备主/备主/备集群内部强一致同步异地冷备用户直接访问
5、数据中心A数据异 步复制异地数据中 心B优势:部署简单,对于业务侵入少异地部署,具备更高容灾等级缺点:灾备单元不提供在线服务,切换可靠性差冷备单元冗余100%成本,成本浪费触发跨城切换的概率大同城容灾/双活用户随机访问随机访问同城数据中同城数据中 心A心B读写读写同步/异步优势:部署简单,接入成本低灾备环境可用性强,数据质量有保障缺点:仅提供同城保护,容灾等级低两地三中心用户随机访问随机访问同城数据中数据同同城数据中 心A步复制心B数据异步复制 异地冷备中心C优势:结合了同城双活+异地冷备同城范围有效地保证了数据的安全性和业 务系统;缺点:冷备中心成本浪费地域级故障发生时不敢切换传统的容灾方案
6、容灾方案与容灾级别:同城容灾:1级异地灾备:25级同城双活:1级两地三中心:25级阿里云异地多活解决方案02阿里云异地多活架构接入层- 实现入口流程的识别与纠错按照DNS权重分配流量自定义的分流规则纠错流量服务层- 部署客户的应用系统,对业务服务进行 划分,不同类型服务采用不同纠错策略单元化服务中心化服务普通服务数据层- 数据存储和数据实时同步,并在切流时 进行数据保护跨域实时同步防循环数据质量保障异地多活的本质:异地多活本质上是通过对业务做自顶向下的流量隔离来实现的OLTP业务多活架构安全策略流量校正切流联动同步对象分流策略多活流量控制(MSFE)根据既定规则通过MSFE进行分流流量识别流量
7、分发多活数据同步(DTS)通过DTS实现数据单向/双向复制 防循环网络优化多活容灾切换(MSHA)通过MSHA方便进行容灾切换 状态检查规格推送多活场景运维(DMS)借助DMS进行日常的运维变更 DDL变更数据运维围绕TP数据库RDS、POLARDB-X构建:多活配置(MSHA)- 通过MSHA进行一站式多活配置OLAP业务多活架构AP业务并不独立存在,AP业务的数据来源 是TP业务实时产生的增量数据。多活流量控制通过MSFE进行分流,为AP业务定义不同 的分流策略多活数据同步借助TP多活的数据同步能力通过DTS实现本单元的TP向AP数据同步多活容灾切换AP业务以读为主,对数据同步时延不敏感通
8、过MSHA控制台上对分流策略进行调整架构说明Region A、Region B均为生产单元,提供在线服务每个单元对外暴露一个子域名MSFE跨AZ部署,进行流量归属判断两Region的CSB级联部署,提供服务纠错和中心化服务的转发数据库主备架构,分别部署在本Region的两个AZ中分流策略入口流量按照权重转发到不同cname下,可根据实际情况调控流量进入接入层MSFE进行归属判断,归属本单元则继续向下,否则转 发到对端单元CSB通过级联可以暴露本单元服务到对端,对于中心化服务的流量转发 到中心,数据同步策略数据在Region A和Region B之间进行DTS双向同步成本应用冗余200%,AZ1
9、 50%, AZ2 50%, AZ3 50%, AZ4 50%。数据库冗余4份数据容灾能力(计划外切换)支持AZ级故障,RTO 分钟级,RPO 0Region级故障,RTO 分钟级,RPO 0双活典型架构:双Region四AZRegion AZONE 1ZONE 2ECSECSECSECSECSECSSLB主库流量Region BZONE 3ZONE 4ECSECSECSECSECSECSSLB主库备库备库DTS双向同步公网DNS/云解析MSFEMSFECSBCSB路由纠错CSB级联子域名B子域名A多活中不同的服务类型中心单元单元化服务DB单元化服务DB读写读写双向同步中心化服务DB中心化服务
10、DB读写读写中心单元普通服务DB普通服务DB读写单向同步读写多活主要面向的服务类型单元内封闭调用,不依赖其他单元非本单元的流量纠错到对端单元单元化服务中心化服务中心单元普通服务数据有强中心要求,通常提供全局业 务服务仅中心提供服务,各单元读写请求均 路由到中心单元数据仅提供灾备服务不做任何改造的服务,就近访问本地能容忍同步延迟,写入后往往不需要 立即读取主要面向读服务,不建议写场景使用(缺少单元写保护)双向同步跨云数据同步UNIT类型COPY类型/非多活类型应对中心化服务和普通服务数据单向同步,单元只可读不可写同步任务配置使用白名单+DDL放行方式跨城同步异步复制适配单元化服务和普通服务数据双
11、向同步,各单元均可读写防循环机制通过事务表/THREAD_ID方式实现通过全局Sequence避免冲突防循环&Sequence以内步长10万,单元个数2为例: create table TEST(ID int primary key auto_increment unit count 2 index 0)中心单元1100000100001200000外步长200001300000300001400000400001500000500001600000内步长Sequence分配全局唯一的Sequence,避免数据冲突。内步长:单次申请的可用于分配的ID个数外步长=内部长*单元个数防循环中心DB单
12、元DB业务写入update id=1DTSupdate id=1update id=1 insert trx_tbDTS解析发现trx_tb表操作事务表方式:中心DB单元DB业务连接THD:0 x00000-0 xFFFFFDTS连接THD:0 xXXX00000-0 xXXXFFFFFTHREAD_ID方式:AliSQL内核具备设置THREAD_ID功能DTSTHD:0 x00000-0 xFFFFFTHD:0 xXXX00000-0 xXXXFFFFFbinlog多活场景数据保护数据质量核心问题:数据双写单元保护-日常态数据层,应用和PolarDB-X对写操作的多活分流规则进行路由逻辑 校
13、验,若非本单元流量,触发单元保护机制,不进行写操作。单元保护-变更态DMS定制化的数据运维功能,订正前对进行各单元数据备份,并 对同步链路状态进行检查,小于1S才能执行。单元保护-切流态切流前进行预检查,切流中通过多种手段保障局部切流用户的数据 在各单元的一致性。绝对禁写延迟禁写前镜像匹配同步延迟检查举例说明,如上图,在某个时刻有切流需求,用户在多活管控平台进行切流操作。在0s,多活管控平台(MSHA)下发切流命令,并打开DTS前镜像匹配功能。在04s,应用机器获得切流操作命令及新的流量分发规则,此时机器上运行的仍旧是老的流量分发规则,实际业务无影响。在10s,在规定的某个时刻(例如10s)启
14、动绝对禁写,此刻正式开始切流,切流用户的写操作和更新操作均被拒绝,当前请求失败。在13s,持续3s(可配置)后,规则在各层完成收敛,此刻解除绝对禁写,启动延迟禁写,禁写时长取决于数据同步速度,若未同步完成,多 db同时的更新会带来数 据脏写问题。当数据同步完成后,机器上解除延迟禁写,关闭DTS前镜像匹配,此刻切流用户的更新操作可正常进行。多活切流流程业务即容灾异地多活价值总结业务高速发展支撑流量有效隔离降本增效有效分摊各个数据中心 成本,实现成本小于 200%冗余业务连续性保障各个数据中心承载的流 量大小可灵活调配实现业务级的流量闭环核心单元化业务异地多 活,且秒级切流到异地各个数据中心常态承
15、载 业务流量,切流有保障全局业务异地热备,分 钟级切换一体化多活运维管控平 台,支撑流量、数据库 一键切流、零脏写具备跨地域的水平扩展 能力在最小单元内进行风险 可控的技术演进用户自行实施异地多活的难点多数据中心统一管控难度大需要具备快速建站和多单元统一管理的能力需要对接众多基础设施流量管理难度高需要对接入层、服务层、数据层等的流量规则进行 统一管理。在分发规则时,需要保障众多节点规则的一致性。需要具备多维的分流能力,和动态调配能力。数据同步策略复杂针对不同服务类型需要支持多种同步类型双向数据同步中需要具备同步防循环能力。远距离数据同步,对同步性能、同步带宽有很高要求。容灾切换数据质量保障难为
16、了保障RPO要求,容灾切换过程中需要对业务架 构的各层进行状态检查的能力对规则分发的收敛情况以及跨数据中心的同步情况 进行准确评估,难度较大。阿里云云原生方案优势阿里多年沉淀阿里从12年开始实施异地多活有超过300+业务,上万数据库实例的实践经验一体化的解决方案统一管理和路由规则分发从多活建站到容灾演练实现能力全覆盖分钟级切换保障容灾切换时的RPO最高可达到秒级通过“一键切换”能力对各层规则统一管理, 可以达到切换RTO分钟级流量精细化管理实现多维的流量管理策略,满足灵活性流量管理与底层存储分布解耦,流量随心所欲切换数据质量保障提供多种数据质量保障手段有效控制切流态的数据质量问题成熟的多活生态生态工具对多活场景进行充分适配异地多活客户案例03客户案例-某税务核心系统方案概述接入层:MSFS做流量纠错,支持按省份 分流和按自然人档案号分流服务层:CSB级联支持普通服务跨云调用 数据层:针对不同服务类型(单元化、中 心、非多活)实施不同容灾级别的数据同 步架构。多活实施效果按地域和自然人两个维度实施多活秒级切换能力,达到国标6级效果两单元接流,充分利用资源灰度放量能力xxxxxxxxxxxxxxxxA单元子域名B单元子域名接入层 SLB多活接入层接入层 SLB多活接入层多活接入层纠错服务纠错应用层 API网关 服务发现单元服务 统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宝宝成长纪念册
- 吉兰巴雷综合症护理课件
- 脊柱侧弯护理
- 行政总监工作总结
- 年终总结汇报扁平化模板
- 护理检查反馈整改措施
- 中医护理整体病历书写
- 北京市大兴区名校2025年初三适应性月考(九)英语试题含答案
- 河北科技师范学院《主题摄影创意与实践(文史类)》2023-2024学年第二学期期末试卷
- 贵阳职业技术学院《领导力开发》2023-2024学年第二学期期末试卷
- 提高教学管理质量校长讲话:“2574”工作实施思路!即两大抓手五项重点任务七个落实环节四个质量目标
- 清理报废渔船合同范本
- 成都设计咨询集团有限公司2025年社会公开招聘(19人)笔试参考题库附带答案详解
- 《基于西门子S7-1200PLC的四层电梯控制系统设计》8900字
- 生产安全事故应急演练评估报告模版
- 2025年江苏太仓市文化教育投资集团有限公司招聘笔试参考题库附带答案详解
- 退伍军人心理培训课件
- 广东省中山市2024-2025学年九年级上学期期末语文试题
- 装饰装修木工施工合同
- 2025年吉林铁道职业技术学院单招职业技能测试题库汇编
- “轻松前行压力不再”-高中生压力管理与情绪调节 课件-2024-2025学年高二下学期压力管理与情绪调节班会
评论
0/150
提交评论