FusionSphere容灾方案白皮书_第1页
FusionSphere容灾方案白皮书_第2页
FusionSphere容灾方案白皮书_第3页
FusionSphere容灾方案白皮书_第4页
FusionSphere容灾方案白皮书_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 DOCPROPERTY DocumentName 容灾方案白皮书 华为专有和保密信息 华为技术有限公司文档版本 DOCPROPERTY DocumentVersion V1.0 ( DOCPROPERTY ReleaseDate 2014-09-05) DOCPROPERTY Product Project Name 华为FusionSphere DOCPROPERTY DocumentName 容灾方案白皮书 STYLEREF Contents 目 录 DOCPROPERTY DocumentName 容灾方案白皮书 目 录 TOC o 1-1 h z t 标题 2,2,标题 3,3,Ap

2、pendix heading 2,2,Appendix heading 3,3 HYPERLINK l _Toc417734725 1 容灾简介 PAGEREF _Toc417734725 h 1 HYPERLINK l _Toc417734726 1.1 云计算容灾概述 PAGEREF _Toc417734726 h 1 HYPERLINK l _Toc417734727 1.1.1 容灾简介 PAGEREF _Toc417734727 h 1 HYPERLINK l _Toc417734728 1.1.2 容灾系统的评价指标 PAGEREF _Toc417734728 h 1 HYPERL

3、INK l _Toc417734729 1.1.3 容灾系统建设过程 PAGEREF _Toc417734729 h 2 HYPERLINK l _Toc417734730 1.1.4 容灾系统的实现分类 PAGEREF _Toc417734730 h 3 HYPERLINK l _Toc417734731 1.2 FusionSphere容灾方案简介 PAGEREF _Toc417734731 h 4 HYPERLINK l _Toc417734732 2 FusionSphere容灾方案介绍 PAGEREF _Toc417734732 h 7 HYPERLINK l _Toc4177347

4、33 2.1 UltraVR基于主机远程复制容灾方案 PAGEREF _Toc417734733 h 7 HYPERLINK l _Toc417734734 2.1.1 方案概述 PAGEREF _Toc417734734 h 7 HYPERLINK l _Toc417734735 2.1.2 适用场景 PAGEREF _Toc417734735 h 8 HYPERLINK l _Toc417734736 2.1.3 方案组网 PAGEREF _Toc417734736 h 9 HYPERLINK l _Toc417734737 2.1.4 方案特点 PAGEREF _Toc417734737

5、 h 12 HYPERLINK l _Toc417734738 2.2 UltraVR基于存储远程复制容灾方案 PAGEREF _Toc417734738 h 12 HYPERLINK l _Toc417734739 2.2.1 方案概述 PAGEREF _Toc417734739 h 12 HYPERLINK l _Toc417734740 2.2.2 适用场景 PAGEREF _Toc417734740 h 14 HYPERLINK l _Toc417734741 2.2.3 方案组网 PAGEREF _Toc417734741 h 16 HYPERLINK l _Toc417734742

6、 2.2.4 方案特点 PAGEREF _Toc417734742 h 19 HYPERLINK l _Toc417734743 2.3 城域双活容灾方案 PAGEREF _Toc417734743 h 19 HYPERLINK l _Toc417734744 2.3.1 方案概述 PAGEREF _Toc417734744 h 19 HYPERLINK l _Toc417734745 2.3.2 适用场景 PAGEREF _Toc417734745 h 20 HYPERLINK l _Toc417734746 2.3.3 方案组网 PAGEREF _Toc417734746 h 21 HYP

7、ERLINK l _Toc417734747 2.3.4 方案特点 PAGEREF _Toc417734747 h 23 HYPERLINK l _Toc417734748 2.3.5 VIS产品简介 PAGEREF _Toc417734748 h 23 HYPERLINK l _Toc417734749 2.4 第三方应用层容灾方案 PAGEREF _Toc417734749 h 24 HYPERLINK l _Toc417734750 2.4.1 方案概述 PAGEREF _Toc417734750 h 24 HYPERLINK l _Toc417734751 2.4.2 适用场景 PAG

8、EREF _Toc417734751 h 24 HYPERLINK l _Toc417734752 2.4.3 方案组网 PAGEREF _Toc417734752 h 24 HYPERLINK l _Toc417734753 2.4.4 方案特点 PAGEREF _Toc417734753 h 25 HYPERLINK l _Toc417734754 3 综述:FusionSphere容灾方案对比分析 PAGEREF _Toc417734754 h 26 HYPERLINK l _Toc417734755 4 术语 PAGEREF _Toc417734755 h 28 STYLEREF Co

9、ntents 目 录FusionSphere备份方案白皮书容灾简介云计算容灾概述随着云计算的蓬勃发展,越来越多重要的计算机信息系统出现在云计算中。由于各行业的用户和企业对网络应用和数据信息的依赖日益强烈,使得突发性灾难如火灾、洪水、地震、区域电力中断或者人为破坏对整个企业的数据和业务生产会造成重大影响,如重要信息丢失、服务中断、经济损失、客户流失等。因此,为了保证云计算中计算机信息系统的业务连续性和数据可靠性,华为提供了针对云计算的容灾解决方案,保证灾难发生时关键数据不丢失,系统服务尽快恢复运行。容灾简介容灾系统是指在相隔较远的异地,建立两套或多套功能相同的系统,系统之间可以相互进行健康状态监

10、视和功能切换,当一处系统因意外(如火灾、洪水、地震、人为蓄意破坏等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾系统需要具备较为完善的数据保护与灾难恢复功能,保证生产中心不能正常工作时数据的完整性及业务的连续性,并在最短时间内由灾备中心接替,恢复业务系统的正常运行,将损失降到最小。容灾系统的评价指标容灾系统主要为了在灾难发生时业务不发生中断,那么当灾难发生时,用户最关心的是什么呢?下面是国际上通用的容灾系统的评审标准Share 78,可以作为广大用户衡量和选择容灾解决方案的指标。备份/恢复的范围容灾计划的状态业务中心与容灾中心之间的距离业务中心与容灾中心之间如

11、何相互连接数据是怎样在两个中心之间传送的允许有多少数据被丢失怎样保证更新的数据在容灾中心被更新容灾中心可以开始容灾进程的能力因此,容灾系统的设计,主要也是围绕这几个用户需求。由于用户投入资金的数量限制,想用少的资金达到第6级容灾级别显然是有难度的,我们设计出的系统也只能是在现有的条件下尽量减少故障历时,尽量多的恢复数据,这也是衡量我们所设计出来的容灾系统质量的指标。实际的容灾系统设计过程中,我们重点关注的是RTO和RPO两个指标。RPO(Recovery Point Objective):即数据恢复点目标,以时间为单位,即在灾难发生时,系统和数据必须恢复到的时间点要求。RPO标志系统能够容忍的

12、最大数据丢失量。系统容忍丢失的数据量越小,RPO的值越小。RTO(Recovery Time Objective):即恢复时间目标,以时间为单位,即在灾难发生后,信息系统或业务功能从停止到必须恢复的时间要求。RTO标志系统能够容忍的服务停止的最长时间。系统服务的紧迫性要求越高,RTO的值越小。RPO针对的是数据丢失,而RTO针对的是服务丢失,RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。好的容灾系统需要尽量满足用户的需求,但是容灾系统的设计往往受多种条件的制约,如可用的技术、现网状况、用户意志、用户业务等,但到目前为止,起决定性的因素,是容灾建设的成本。以下是容

13、灾中心建设等级示意图:容灾中心的建设等级示意图容灾系统建设过程根据对容灾系统建设模型,容灾系统建设过程分为分析、策略制订、方案实施和测试/演习/维护四个阶段。下面分别对各个阶段作出说明:分析阶段在取得管理层的正式同意后,获得人员和资源上的保证。首先收集业务过程的信息、技术基础架构的支撑环境、灾难类型等方面的内容,然后进行业务影响分析和风险分析,确定由于中断和预期灾难可能造成的影响。分析的结果用以确定业务关键级别、业务恢复时间和可承受的数据损失程度。策略制订阶段在本阶段,结合以上的分析成果,以及企业对容灾的投入规划,制订企业短期、长期范围内的容灾策略和目标,先定义初步的方案。再进一步结合各种因素

14、进行分析,在候选的方案中剔除不合适的方案,将剩余的可用的方案提交给评估组,评估组经过充分详细的评审,选择最合适的容灾方案。方案实施阶段根据选择的容灾方案,整合企业相关资源,确定容灾的体系架构和灾难恢复计划,通过技术手段和服务以达到所要求的容灾目标。测试/演习/维护阶段任何制订的计划,都必须经过不断的测试和修正,才能满足企业不断发展的需求。同时,通过培训、测试过程,也能够使企业内部人员熟悉自己在容灾流程中所扮演的角色,保证在灾难真正发生的时刻能够有条不紊地执行恢复流程。测试的过程可以分为局部验证和演习两种方式。随着商业需求、新技术的不断升级以及新的内部和外部规则的变化,IT系统也会随之改变。要确

15、保灾难恢复计划的有效性,必须定期检查和修改计划。以上四个阶段是一个周而复始的过程,应随着企业内外部环境的变化而灵活变化。容灾系统的实现分类从容灾系统保护级别,可以分为数据级容灾和应用级容灾。数据级容灾指的是对生产机的业务数据定期进行异机保存,当生产机的业务数据由于灾难而损失时,待生产机修复之后,可以利用异机保存的数据来恢复业务,这个过程称为数据级容灾。应用级容灾侧重业务完整性,尽可能的保证业务不中断或者可以快速恢复。数据级容灾是应用级容灾的前提,即应用级容灾也需要在异机有一份生产机业务数据的备份,并且当生产机发生灾难时,异机可以利用备份数据快速恢复业务。一般来说,应用级容灾实现较为复杂,成本也

16、较高。根据容灾系统所采用的数据复制实现层次的不同,又可分为:基于主机层的复制、基于阵列层的复制和基于网络层的复制。基于主机层的复制实现方式:在主机操作系统安装数据复制软件,或是应用程序提供的数据复制、灾难恢复工具(如数据库的相关工具),利用TCP/IP网络连接远端的容灾站点的服务器,实现异地数据复制。优点:数据复制建立在应用主机之上,用户不需更换太多的现有的系统架构,也不用担心后端存储系统的兼容性问题,并且可以满足用户的不同数据保护要求,提供多种不同数据保护模式,可实现要求最苛刻的应用级的容灾。缺点:由于复制基于其对应的数据库或者卷管理,应用有一定局限性;需要在每台应用服务器上安装;系统运行需

17、要占用主机资源,会影响主机的系统运行性能;操作系统的版本和存储软件的版本兼容性需要一一确认。基于存储层的复制实现方式:基于存储系统(磁盘阵列、NAS)内置的增值功能,通过IP网络或光纤通道等传输界面连接,将数据以同步或异步的方式复制到远端。目前各个主流存储厂商均可以提供这种容灾技术。优点:将数据与运行分开,对主机系统的运行资源影响比较小。另外,由于运行机制大多是利用镜像来复制数据,并借助高速缓冲存储器加速I/O存取,两端的数据差异时间点比较小,加上存储系统本身具备一定的容错能力,使之具有一定的运行性能和可靠性。 缺点:成本高。由于用户必须在本地端和灾备端分别配置两套相同的存储系统,不仅采购成本

18、高,而且还要受制于单一的设备厂商,未来的扩展性势必缺乏弹性。此外,光纤通道存储系统如果要构造远程容灾,必须在本地端和灾备端各安装一台FC-to-IP转接器,再加上网络带宽成本,整体费用投入非常大。 基于虚拟化网关的镜像或复制实现方式:在前端应用服务器与后端存储系统之间的存储区域网络(SAN),加入一层存储网关,前端连接服务器主机,后端连接存储设备。它的角色就好像是存储网络中的交通警察,所有的I/O都交由它来控制管理,不仅可以实现本地存储系统的应用与镜像,而且可以实现异地数据的复制。 优点:由于数据镜像或复制是通过存储网关来执行,对主机的性能影响十分低。通过存储网关的虚拟化技术,可以整合前端异构

19、平台的服务器和后端不同品牌的存储设备。缺点:成本高。由于用户必须增加虚拟化网关设备,相对存储复制其成本更高。综上所述,这三种容灾复制方式各有千秋,用户需要根据自身的IT系统的特性,选择适合自己的容灾复制方式 。FusionSphere容灾方案简介FusionSphere针对不同的业务场景、应用类型、用户规模、IT基础设施条件、投资预算,提供以下四类有针对性的容灾解决方案:UltraVR基于主机远程复制容灾方案UltraVR基于存储远程复制容灾方案基于VIS6600T的城域双活容灾方案基于第三方应用容灾方案FusionSphere容灾方案整体示意图Fusion Sphere虚拟化平台OSAPPO

20、SAPPOSAPP虚 拟 机物理服务器存储Fusion Sphere虚拟化平台OSAPPOSAPPOSAPP虚 拟 机物理服务器存储基于存储远程复制(UltraVR方案)基于虚拟机应用容灾(飞康CDP)存储虚拟化设备存储虚拟化设备Site ASite BDistributed Volume基于跨站点共享存储容灾(城域双活容灾)124基于主机远程复制( UltraVR方案)3FusionSphere容灾方案选择方案类型解决方案功能特点应用场景投资成本基于主机远程复制容灾UltraVR基于主机远程复制容灾方案1、支持整虚拟机(含系统卷与数据卷)容灾2、RPO=10秒3、一键式容灾切换4、支持容灾演

21、练与计划性迁移5、支持大量虚拟机容灾6、不依赖于存储,支持虚拟存储与DSWare服务器整合数据中心一体机低基于存储远程复制容灾UltraVR基于存储远程复制容灾方案1、支持整虚拟机(含系统卷与数据卷)容灾2、采用同步复制时RPO=0,站点间要求光纤互联;采用异步复制时RPO=15分钟3、一键式容灾切换4、支持容灾演练与计划性迁移5、支持大量虚拟机容灾服务器整合数据中心中基于虚拟化网关镜像容灾VIS6600T城域双活容灾1、支持整虚拟机(含系统卷与数据卷)容灾2、RPO=03、RTO要求很高,自动容灾切换4、站点间要求光纤互联服务器整合数据中心高虚拟机内主机层复制容灾第三方应用层容灾方案1、RP

22、O分钟级;2、不要求系统卷容灾;3、少量虚拟机容灾需求; 4、支持物理机与虚拟机之间容灾需求;桌面云服务器虚拟化数据中心一体机高FusionSphere容灾方案介绍UltraVR基于主机远程复制容灾方案方案概述UltraVR基于主机IO远程复制的容灾方案,是基于虚拟化层实现的IO实时复制,将生产站点被保护虚拟机的虚拟机磁盘IO写数据远程复制到容灾站点,并由UltraVR实现VM规格的复制和容灾恢复计划的管理,在发生灾难时执行容灾恢复计划进行一键式自动容灾切换;其中RPO最小可达10秒。UltraVR基于主机远程复制容灾方案具有以下功能:1、集中式恢复计划支持创建和管理恢复计划。配置并显示受主机

23、复制保护的虚拟机,并可灵活设置复制策略(如压缩、加密、复制速率、快照周期)。将虚拟机映射到容灾站点上的相应资源(如集群、存储或网络)。指定虚拟机引导顺序。自定义虚拟机 IP 地址。自定义容灾站点上的低优先级虚拟机的关机。自定义容灾站点上主机的开机启动。利用自定义脚本扩展恢复计划。利用基于角色的访问控制来控制对恢复计划的访问。端到端呈现虚拟机保护拓扑关系,包括“生产站点=生产站点内云平台=生产站点内虚拟机=生产站点VRG - 容灾站点VRG=容灾站点内虚拟机=容灾站点内云平台=容灾站点”的拓扑关系及其链路的状态。两个站点互为容灾或主备容灾,或将多个站点恢复至一个共享的容灾站点。2、自动执行故障切

24、换监控站点的可用性,并在可能发生站点故障时向用户发出告警。支持一键启动执行恢复计划。自动停止用于恢复的复制数据存储的复制并提升为主用存储。关闭容灾站点上的低优先级虚拟机。按照预先指定的引导顺序自动启动受保护的虚拟机。在恢复过程中执行用户定义的脚本。在容灾站点上自动重新配置虚拟机 IP 地址。支持管理和监控恢复计划的执行。3、无中断测试(容灾演练)自动执行恢复测试。使用虚拟机快照执行恢复测试,不会丢失复制的数据。支持在隔离网络中恢复虚拟机,以免对生产应用程序造成任何影响。针对测试方案自定义恢复计划的执行。完成测试后自动清理测试环境。可存储、查看和导出测试结果及故障切换执行情况。4、计划内迁移自动

25、执行计划内迁移,使用计划内迁移工作流确保数据零损失和应用一致性迁移。正常关闭原始生产站点上受保护的虚拟机。启动迁移过程前确保在应用保持一致的状态下完整复制虚拟机数据。5、自动容灾重保护 通过一键式自动反向复制到原始生产站点来重新保护虚拟机。反向执行原始恢复计划,切回原始生产站点。适用场景使用场景适合选用主机复制容灾的场景:私有云下服务器整合、数据中心、一体机场景下用户虚拟机的容灾,不适用于桌面云以及公有云容灾场景。生产与容灾站点之间主备容灾、互为容灾及共享容灾(多站点到一个站点)场景。不依赖于存储设备进行数据的远程复制。不希望生产站点与容灾站点的距离受到限制。容灾切换允许数据有一定丢失,RPO

26、10秒。希望对虚拟机进行计划性的跨站点迁移。站点中业务需要连续性保护。存在虚拟机启动优先级、依赖关系等复杂的恢复场景。容灾演练具有较高优先级,例如SLA或审计要求反复验证一致的恢复结果。不适合选用主机复制容灾的场景:桌面云以及公有云容灾场景要求同步复制,RPO=0使用约束UltraVR主机复制容灾方案存在以下约束:1、只支持基于虚拟化存储和FusionStorage存储的虚拟机的容灾。其他存储形态均不支持。2、只支持FusionCompute VRM+Xen虚拟化环境的容灾,不支持OpenStack、VMWare、XenServer等虚拟化环境的容灾。3、只支持站点间1:1主备容灾、1:1互为

27、容灾及N:1共享容灾场景。4、支持FusionCompute发放的用户虚拟机的容灾,支持FusionManager发放的属于组织的用户虚拟机的容灾;不支持FusionManager发放的应用、非组织虚拟机的容灾。5、只支持对普通用户虚拟机的容灾,不支持对链接克隆虚拟机、FT虚拟机、PVS虚拟机、虚拟机模板以及使用共享卷(如用于Oracle RAC共享卷)、直通设备(USB、GPU、HBA卡、SCSI设备等)、远程设备(remote USB, remote CDROM等)、RDM裸设备磁盘的虚拟机及管理虚拟机的容灾。6、容灾虚拟机不支持磁盘在线和离线扩容,不能转换为模板(模板虚拟机不能容灾),不

28、支持对虚拟机快照的容灾。7、对FusionStorage存储虚拟机进行主机复制容灾保护时,由于需要修改IO路径,容灾保护只有在虚拟机下次关机后启动后才能生效。8、生产站点和容灾站点的MAC地址段不能冲突;且应保证生产端和灾备端的网络类型一致(如同为静态注入IP或手工配置静态IP或外部DHCP分配或内部DHCP分配)。方案组网基于主机IO远程复制容灾VMVMFusionSphere虚拟化平台VMVMFusionSphere虚拟化平台生产站点容灾站点基于主机IO复制UltraVR容灾管理软件UltraVR容灾管理软件VRGVRGVRGVRGVMVM在容灾站点已经按容灾虚拟机业务需求配置的情况下,需

29、要增加以下软硬件设备需求。新增软硬件设备UltraVR容灾管理服务器:部署在虚拟机内,虚拟机规格为:4U8G及50GB系统盘,可对3000个虚拟机进行容灾。生产与容灾站点各部署一套。VRG容灾复制网关:部署在虚拟机内,虚拟机规格为:2U2G及15GB系统盘+20GB数据盘;每个VRG支持2000写IOPS流量,最多可对150个虚拟机进行容灾。根据虚拟机数量与写IOPS流量,每个站点可配置多个VRG容灾网关,生产与容灾站点VRG需一一对应。生产站点与容灾站点之间通过IP网络互联,包含管理与IO复制两种类型链路:管理链路带宽:建议至少10Mbps。IO增量复制链路带宽:建议至少50Mbps。实际所

30、需带宽需根据复制周期内的所有数据变化量来计算,计算公式为:保护虚拟机数量 *每虚拟机复制周期内业务繁忙期间平均数据变化量 * 链路放大系数 *8 / RPO复制周期 / 0.7(带宽利用率)。其中(每虚拟机复制周期内数据变化量* 链路放大系数) 一般小于 (每虚拟机复制周期内业务繁忙期间平均写业务IOPS * 写IO数据块大小),建议根据实际业务评估。IO初始复制链路:由于初始复制需要将生产站点上需要容灾的虚拟机上所有数据同步到容灾站点上,数据量比较大(如100个100GB虚拟机需要同步10T数据),因此建议进行初始同步时将生产VM数据导出到磁盘,物理搬迁到容灾站点,再导入到灾备存储内;若直接

31、通过网络初始复制,则要求初始同步期间租用专用光纤,否则将会导致初始同步时间过长。IO复制链路采用IP互联。对IP网络链路要求:时延:平均值不能超过50ms,最大值不能200ms。丢包率:不能超过1。为了防止链路单点故障,建议每种链路至少部署两条链路进行负荷分担。容灾建设步骤(1)在生产站点上创建需要容灾的虚拟机,并安装配置操作系统、软件及数据,以使需容灾的虚拟机正常运行和处理业务。(2)在所有容灾虚拟机业务正常运行后,对生产虚拟机进行容灾保护,启动初始同步;(3)由于站点间复制带宽通常较小,有两种常用的初始同步方式:方案一:将生产虚拟机的数据导出,通过物理搬迁方式带到容灾站点,再导入到容灾站点

32、内。方案二:初始同步时租用较大带宽(如10GE),以便初始同步能很快完成;在初始同步完成后再使用较小带宽(如1GE)用于增量数据同步。注:由于RPO、复制带宽与业务IOPS密切相关,通常需要在容灾建设前就提前规划要容灾的虚拟机;否则会影响业务IOPS评估,在复制带宽已确定的情况下会导致RPO目标无法满足。容灾切换前处理(1)在生产站点与容灾站点各部署一个UltraVR容灾管理服务器,并互相连接。(2)在生产站点与容灾站点各部署一个或多个VRG容灾网关,并一一对应。(3)在生产站点UltraVR上配置两个站点间资源映射关系,并对需要保护的虚拟机进行容灾保护。(4)在容灾站点UltraVR上创建对

33、受保护虚拟机的灾难恢复计划,设置灾难恢复时虚拟机启动顺序。容灾演练处理容灾管理员在创建灾难恢复计划后,且被保护虚拟机已完成初始同步,则可在任何时间在容灾站点使用灾难恢复计划进行灾备演练,UltraVR自动在容灾站点使用占位虚拟机最新快照注册虚拟机,并按顺序启动虚拟机。在演练结束后,可以清理容灾演练数据,UltraVR自动清理现场回到演练开始前的状态。该过程对生产站点没有任何影响,不影响生产端业务及生产端到容灾端的数据继续复制。容灾切换处理当生产局发生灾难时,在容灾站点执行已经创建好的灾难恢复计划,UltraVR将自动在容灾站点按照顺序启动虚拟机。计划性迁移处理当生产局即将要发生灾难,或将要计划

34、性停电,或需要计划性升级维护时,容灾管理员可以在容灾站点对已经创建好的灾难恢复计划执行计划性迁移,UltraVR将自动关闭生产站点的虚拟机,并将虚拟机数据完全同步到容灾站点后,在容灾站点注册虚拟机并按照顺序启动虚拟机。该过程可保证虚拟机迁移过程中数据完全不丢失,可保证数据的一致性。重保护处理当原生产站点的虚拟机在计划性迁移完成后,容灾站点成为新的保护站点但不受保护时,容灾管理员可直接对恢复计划进行重保护,系统将自动对受保护对象进行反向数据同步。容灾切回处理容灾管理员在虚拟机完成IO反向初始同步后,选择在业务空闲并允许业务中断的时间,使用容灾恢复计划进行计划性迁移,将容灾切换到容灾站点(新生产站

35、点)的虚拟机反向切回到原生产站点,从而保证业务恢复到原生产站点上运行。(与“容灾切换处理”类似)方案特点优点1、不需要在虚拟机内安装代理软件。2、支持整虚拟机(含系统卷与数据卷)的容灾恢复。3、支持异构存储的容灾。4、可以一键式容灾切换、容灾演练与计划性迁移,减少容灾管理员手工操作。缺点1、只支持异步复制,不支持同步复制,RPO=10秒。2、只支持对FusionManager虚拟机与FusionCompute虚拟机的容灾,不支持对FusionManager应用的容灾。UltraVR基于存储远程复制容灾方案方案概述UltraVR基于存储的远程复制容灾方案,是利用华为存储的同步或异步远程复制功能,

36、将生产站点存储上的虚拟机数据远程复制到容灾站点,并由UltraVR实现VM规格的复制和容灾恢复计划的管理,在发生灾难时执行容灾恢复计划进行一键式自动容灾切换。其中使用存储同步复制时,RPO=0,要求生产站点与容灾站点之间采用光纤互连且环回时延小于5毫秒;使用存储异步复制时,RPO为存储间数据复制周期,与客户需容灾虚拟机的写业务IOPS与用于远程复制的网络带宽相关;RTO为全系统切换与VM启动时间,在典型配置场景下1000VM的RTO时间 生产站点内云平台=生产站点内虚拟机=数据存储=主LUN=生产阵列 - 容灾站点=容灾阵列=从LUN”的拓扑关系及其链路的状态。两个站点互为容灾或主备容灾,或将

37、多个站点恢复至一个共享的容灾站点。2、自动执行故障切换支持一键启动执行恢复计划。自动将远程复制从LUN提升为主,以便用于恢复。监控站点的可用性,并在可能发生站点故障时向用户发出告警。关闭容灾站点上的低优先级虚拟机。按照预先指定的引导顺序自动启动受保护的虚拟机。在恢复过程中执行用户定义的脚本。在容灾站点上自动重新配置虚拟机 IP 地址。支持管理和监控恢复计划的执行。3、无中断测试(容灾演练)自动执行恢复测试。使用存储快照执行恢复测试,不会丢失复制的数据。支持在隔离网络中恢复虚拟机,以免对生产应用程序造成任何影响。针对测试方案自定义恢复计划的执行。完成测试后自动清理测试环境。可存储、查看和导出测试

38、结果及故障切换执行情况。4、计划内迁移自动执行计划内迁移,使用计划内迁移工作流确保数据零损失和应用一致性迁移。正常关闭原始生产站点上受保护的虚拟机。启动迁移过程前确保在应用保持一致的状态下完整复制虚拟机数据。5、自动容灾重保护 通过一键式自动反向复制到原始生产站点来重新保护虚拟机。反向执行原始恢复计划,切回原始生产站点。适用场景使用场景适合选用存储远程复制容灾的场景:私有云,且虚拟机在灾备站点建设前就创建、软件安装和运行。生产与灾备站点之间主备容灾、互为容灾及共享容灾(多站点到一个站点)场景。使用华为SAN设备。需要使用存储同步复制或异步复制;使用同步复制时,RPO=0,站点间使用光纤互联,距

39、离小于100公里;使用异步复制时,RPO=15分钟,站点间可以使用IP互联,距离没有限制。希望对虚拟机进行计划性的跨站点迁移。站点中业务需要连续性保护。存在虚拟机启动优先级、依赖关系等复杂的恢复场景。容灾演练具有较高优先级,例如SLA或审计要求反复验证一致的恢复结果。不适合选用存储远程复制容灾的场景:一体机、桌面云以及公有云容灾场景。容灾部署后大量发放容灾虚拟机。虚拟机内应用的使用场景(针对异步远程复制)由于存储异步远程复制过程中IOPS性能有一定下降,因此对于虚拟机内应用,需要根据以下原则评估是否可使用存储异步远程复制容灾:总体原则场景适合远程复制场景主机写压力较小,对阵列的带宽、IOPS和

40、时延要求不是太高,能够接受阵列异步远程复制性能下降数据库(如:Oracle,SqlServer,DB2)数据挖掘类(读业务较多,写业务较少)文件系统(如:个人桌面业务,读业务较多,写业务较少)OLAP联机分析(读业务较多,写业务较少)exchange邮件收发(写业务压力较小)不适合远程复制场景主机写压力大,对阵列的写带宽、IOPS、时延要求很高视频监控项目(IO压力大)建设后需大量发放或克隆或存储迁移要容灾的虚拟机(IO压力大,对性能要求高)说明:以上场景仅仅是针对典型应用场景,是否适合异步远程复制还是需要根据实际情况评估,需要收集详细信息以进行评估,容灾需求调研表参见文档FusionSphe

41、re需求调研模板V1.0(容灾)。使用约束UltraVR存储远程复制容灾方案存在以下约束:1、只支持基于华为阵列并满足UltraVR对存储的兼容性要求,且为虚拟化基本共享存储的容灾;其他存储形态均不支持。目前兼容的华为存储型号包括:华为存储型号版本OceanStor S2600TOceanStor S5500TOceanStor S5600TOceanStor S5800TOceanStor S6800TV100R005C00V100R005C02V200R001C00V200R002C00OceanStor 18500OceanStor 18800V100R001C00以上T系列存储之间、1

42、8500/18800高端存储之间可跨型号远程复制,但不支持T系列存储与18500/18800高端存储之间远程复制,比如S5500T与S5600T之间可进行远程复制,S5500T与18500之间不能进行远程复制;通常建议采用同型号的阵列,以免由于不同型号阵列性能与规格差异影响远程复制的时间。2、只支持FusionCompute虚拟化环境的容灾,不支持OpenStack、VMWare、XenServer等虚拟化环境的容灾。3、只支持1:1主备容灾、1:1互为容灾及N:1共享容灾场景。4、支持FusionCompute发放的用户虚拟机与模板的容灾,支持FusionManager发放的属于组织的用户虚

43、拟机的容灾;不支持FusionManager发放的应用、非组织虚拟机及虚拟机模板的容灾,不支持对链接克隆虚拟机、共享磁盘虚拟机以及管理虚拟机的容灾。5、不支持对虚拟机的GPU、USB等外设的容灾,不支持对虚拟机快照的容灾。6、虚拟机规格周期性同步,容灾切换时容灾站点虚拟机规格可能与生产站点虚拟机不一致,建议尽量减少对容灾虚拟机规格的变更。7、灾难恢复无法保证虚拟机内应用数据一致性(只支持崩溃一致性),灾难恢复时存在虚拟机或虚拟机内应用无法启动的风险(计划性迁移可保证应用一致性)。8、生产站点和容灾站点的MAC地址段不能冲突;且对于FusionManager发放的虚拟机容灾,应配置生产端和灾备端

44、的网络类型一致。不同的网络类型,虚拟机恢复后有不同的限制:对于静态注入类型的网络,如果生产端和灾备端网段相同,应确保灾备端此网段内没有虚拟机,此时虚拟机网络可以完全恢复;如果生产端和灾备端网段不同,虚拟机恢复后需要按照系统重新分配的IP地址(可在虚拟机所属的组织VPC对应网络的“IP使用情况”中查看IP地址),在虚拟机内手动配置IP地址。对于手动配置的IP地址,在容灾切换后手工配置的原IP地址不丢失。对于外部DHCP类型的网络,虚拟机恢复后,网络由外部DHCP服务器分配,容灾系统不做控制。对于内部DHCP类型的网络,如果生产端和灾备端网段相同且灾备端此网段内没有虚拟机,虚拟机网络会完全恢复;如

45、果生产端和灾备端网段不同,IP地址会自动重新配置。由于容灾切换后虚拟机的IP地址可能变化,若虚拟机业务与IP地址相关,则需要管理员手工调整运行在虚拟机上的业务系统。方案组网基于存储远程复制容灾在容灾站点已经按容灾虚拟机业务需求配置的情况下,需要增加以下软硬件设备需求。新增软硬件设备UltraVR容灾管理服务器:部署在虚拟机内,虚拟机规格为:4U8G及50GB系统盘,可对3000个虚拟机进行容灾。生产与容灾站点各部署一套。存储同步或异步远程复制License:每套需要远程复制功能的阵列都需要购买License。 存储异步远程复制资源池:对于华为OceanStor T系列V1R1版本设备,每套需要

46、远程复制功能的阵列都需要配置资源池,磁盘类型建议为SAS或更高性能磁盘,其容量大小建议为阵列可支持的最大资源池容量大小。以下是存储远程复制方案支持的华为存储型号对应的资源池大小:型号最大资源池大小OceanStor S2600T667GBOceanStor S5500T1TOceanStor S5600TOceanStor S5800TOceanStor S6800T2TB建议将资源池所在LUN与需容灾的LUN部署在不同RAID组上,以减少远程复制对容灾LUN所在RAID组的性能影响。对于OceanStor 18500或18800类型高端存储不需要配置资源LUN,但需至少预留存储池20%的存储

47、空间用于远程复制。生产与容灾存储磁盘配置:对于华为OceanStor T系列V1版本设备,由于异步远程复制过程中存储IOPS性能会下降,对于需要容灾的LUN,建议预留20%50%的存储IOPS能力用于远程复制。生产站点与容灾站点之间包含管理与存储复制两种类型链路:管理链路带宽:通过IP网络互联,建议至少10Mbps。存储增量复制链路带宽:异步复制:一般建议采用IP互联,也可采用FC光纤互联。建议至少50Mbps。实际所需带宽需根据复制周期内的所有数据变化量来计算,计算公式为:保护虚拟机数量 * 每虚拟机复制周期内每秒数据变化量 * (链路数据块大小(缺省64KB) / IO数据块大小)*8 /

48、 0.7(带宽利用率)。其中每虚拟机复制周期内数据变化量 一般小于 每虚拟机复制周期内业务繁忙期间平均写业务IOPS * 写IO数据块大小,建议根据实际业务评估。同步复制:采用光纤互联,距离不能超过100公里,环回时延小于5毫秒。带宽需要为所有远程复制LUN上所有虚拟机业务所需最大带宽之和。存储初始复制链路:由于存储初始复制需要将生产存储上需要容灾的LUN上所有数据同步到容灾存储上,数据量比较大(如8T LUN则需要同步8T数据),因此建议进行初始同步时将容灾存储搬迁到生产站点,通过光纤连接进行初始复制,完成后再搬迁回容灾站点;若直接通过网络初始复制,则要求初始同步期间租用专用光纤,否则将会导

49、致初始同步时间过长。对IP网络链路要求:时延:平均值不能超过50ms,最大值不能200ms。丢包率:不能超过1。为了防止链路单点故障,建议每种链路至少部署两条链路进行负荷分担。容灾建设步骤(1)确定哪些虚拟机需要容灾,并在生产与容灾阵列上创建需要容灾的LUN;采用存储异步远程复制时,对于T系列存储还需要创建资源LUN。(2)在生产站点上,将所有需要容灾的虚拟机创建在规划好的容灾LUN上,对于已经创建在非容灾LUN上的虚拟机可以通过存储迁移方式迁移到容灾LUN上。(3)在生产站点上,对于所有需要容灾的虚拟机安装配置操作系统、软件及数据,以使需容灾的虚拟机正常运行和处理业务。(4)在所有容灾虚拟机

50、业务正常运行后,配置生产站点阵列与容灾站点阵列之间配置远程复制链路,并配置LUN远程复制和一致性组,启动初始同步;(5)由于站点间复制带宽通常较小,有两种常用的初始同步方式:方案一:将容灾站点阵列物理搬迁到生产站点,通过光纤互联后进行初始同步,初始同步完成后再将容灾站点阵列搬迁后容灾站点。方案二:初始同步时租用较大带宽(如10GE),以便初始同步能很快完成;在初始同步完成后再使用较小带宽(如50GB)用于增量数据同步。注:由于RPO、复制带宽与业务IOPS密切相关,通常需要在容灾建设前就提前规划,不建议在容灾建设完成后动态发放、存储迁移需要容灾的虚拟机;否则会影响容灾LUN上业务IOPS评估,

51、在复制带宽已确定的情况下会导致RPO目标无法满足。容灾切换前处理(1)在生产站点与容灾站点各部署一个UltraVR容灾管理服务器,并互相连接。(2)在生产站点UltraVR上配置两个站点间资源映射关系,并对远程复制LUN上的虚拟机进行容灾保护,及相应的容灾保护策略(存储数据同步周期)。(3)在容灾站点UltraVR上创建对受保护虚拟机的灾难恢复计划,设置灾难恢复时虚拟机启动顺序。容灾演练处理容灾管理员在创建灾难恢复计划后,且存储已完成初始同步,则可在任何时间在容灾站点使用灾难恢复计划进行灾备演练,UltraVR自动在容灾站点对存储远程复制从LUN创建快照LUN,并使用快照LUN数据注册虚拟机和

52、按顺序启动虚拟机。在演练结束后,可以清理容灾演练数据,UltraVR自动清理现场回到演练开始前的状态。该过程对生产站点没有任何影响,不影响生产端业务及生产端到容灾端的数据继续复制。容灾切换处理当生产局发生灾难时,在容灾站点执行已经创建好的灾难恢复计划,UltraVR将自动在容灾站点注册虚拟机并按照顺序启动虚拟机。原生产站点重建后重新保护当生产局即将要发生灾难,或将要计划性停电,或需要计划性升级维护时,容灾管理员可以在容灾站点对已经创建好的灾难恢复计划执行计划性迁移,UltraVR将自动关闭生产站点的虚拟机,并将虚拟机数据完全同步到容灾站点后,在容灾站点注册虚拟机并按照顺序启动虚拟机。该过程可保证虚拟机迁移过程中数据完全不丢失,可保证数据的一致性。原生产站点重建后重新保护存在两种场景:1、当原生产站点的虚拟机在计划性迁移完成后,灾备站点成为新的保护站点但不受保护时,容灾管理员可直接对恢复计划进行重保护,系统将自动对受保护对象进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论