




文档简介
数据中心容灾备份方案概述概述经济损失,影响政府、企业的形象。格外是数据库数据,一旦发生故障,引起数据丢的话,将带来严峻后果。由于各种故障造成的损失,提升政府和企业形象.数据备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的经过。国家信息安全规范和政策进入21世纪,电子政务的建设已经成为我国今后一个时期信息化工作的重点,政府先行带动国民经济和社会进展信息化,同时加快政府职能的转变,提升行政质量和效率,增强政府监管⑴、200397《国家信息化领导小组关于加强信息安全保障工作的意见》(简称中办发[2003]27号文件),要求各地结合实际认真完善信息安全应急处置预案.《国家信息化领导小组关于加强信息安全保障工作的意见》是为进而提出的。⑵、20049《关于做好国家重要信息系统灾难备份的通知》,要求在系统面临自然灾害、网络攻击、恐怖活动、战争行为、人为蓄意破坏以及大规能力,达到系统抗毁的有效性、重要数据保护的完整性和业务的连续性。通知明确强调“谁主管20054《重要信息系统灾难恢复指南》难恢复等级的确定、灾难恢复等级的实现、灾难恢复预案的制订、落实和管理等方面,对灾难恢复的规划和预备活动的规范化要求进行了全面的描述,规定了对重要信息系统的灾难恢复应遵循的根本要求.《指南》还以规范性附录的形式对灾难恢复的等级划分进行了描述,并以资料性附录的形式规划提出了明确的要求。它的出台使得我国的灾难备份更加趋于规范和标准,对待完善中国灾难备份市场具有深远的意义。20065《国家信息化领导小组关于推动国家电子政务网络建设的意见》(简称中办发[2006]18中,将保障国家电子政务网络和信息安全,作为电子政务建设的四项重要任务之一。⑸、2007年7月,国务院信息化工作办公室领导编制的《重要信息系统灾难恢复指南》正式升级成为国家标准《信息系统灾难恢复规范》(GB/T20988-2007).这是中国灾难备份与恢2007111概述(包括灾难恢复的工作范围、灾难恢复的组织机构、灾难恢复的规划管理、灾难恢复的外部协作、灾难恢复的审计和备案)、灾难恢复需求的确定(包括风险分析、业务影响分析、确定灾(灾难恢复资源的要求(心的选择和建设、专业技术支持能力的实现、运行维护管理能力的实现、灾难恢复预案的实现)等内容作了详细描述.A6123456ABC业RTO/RPO与灾难恢复能力等级的关系比例作了规范要求。信息系统灾难恢复能力等级与恢复(RTO(RPO)具有肯定的对应关系,各行业可依据行业特点和信息技术的应用情况制定相应的灾难恢复能力等级要求和指标体系.灾备建设目标《信息系统灾难恢复规范》(2007年7月国务院信息化办公室发布的国家标准GB/T20988备用基础1.新建物理灾备中备用数据备份2.两个数据中心同步备用基础1.新建物理灾备中备用数据备份2.两个数据中心同步备用灾备数据处理系统技术灾难恢复运行维护3.运维体系及决策经过分析,灾备建设需要考虑的重点如下:灾备模式灾备类型不同,应对的策略也不尽相同。对待IT系统灾难和人为灾难,能够在本地数据中心营进行保障。比较典型的方式是“两地三中心”,即设立主生产中心、同城灾备中心和异地灾备中心。建立异地灾备中心的优势在于它具有强大的跨地域灾难抗御能力,能够有效防止物理设备损伤所产生的灾难后果,同时实时数据复制提供强大的数据交换能力。领域进展的重要趋势之一,目前在国内已有多个成功实践案例,也成为后续灾备领域的新兴关注重点。灾备等级灾难恢复等级的确定是信息系统灾备建设的重要考虑因素.《信息系统灾难恢复规范》将灾难恢复能力划分为6(即灾难恢复资源的成本与风险可能造成的损失之间取得平衡),确定业务系统合理的灾难恢复能力等级。对待多个业务系统,不同业务可采纳不同的灾难恢复策略。灾难本身是个小概率事件,但影响却是巨大的,提升投资回报率是必需考虑的重点.因此,灾RTO(恢复时间目标和RPO(恢复点目标)来考虑,需要对业务和数据进行重要性评估和分级,以确定相应的RPO和RTO级别后,需要调研IT应用环境,确定合适的灾备技术,并检查灾备建设成本是否符合预算并作相应调整,最后达到保护等级与成本投资的平衡点,获得最高的投资回报率。依据对数据业务恢复的RPO和RTO的不同要求,灾备业务建设一般可分为:应用级灾备、数据级灾备和备份级灾备.保护等级越高,成本会呈级数增长。没有任何一种技术或方式能适应所有业务的灾难备份需求,最好的解决方案是采纳不同等级灾难备份与恢复的组合,实现最大业务范围的灾难恢复和最少的成本投入.项目总体需求分析系统现状描述系统及业务环境中复连众自2010年大力实施信息化建设以来,硬件基础环境、系统环境以及网络环境都获得了很大的改善。目前中复连众主要使用两个大的信息化系统:SAPERPdominoOA统。ERP199996。12M37G,OA60G。OA(2013。01)42。9G,2。23G。OA系统的当前(2014。04)数据量为:邮件数据为83。5G,系统数据为22.7G,合同评审附5GTOMCAT60M。中复连众数据全部集中存储在宋跳厂区科研楼2楼机房内,经过EMCCX4—240中存储。目前使用的备份软件系统是IBMTivoliIBMTS3100IBM3650。此次项目中复连众有限制的服务器设备IBMP560一台,性能能够满足SAP数据备份窗口5点左右结束,2—3854了系统日常的运作以及备份安全性,占用了大量的系统资源。1。备份日志2。备份明细现有拓扑结构3。中复连众网络拓扑图4。中复连众数据中心网络现状系统需求描述服务器更新随着业务的增长,为了保证SAPIBMP550新。数据迁移数据级备份从数据安全角度分析,数据作为信息架构的核心,IT支撑系统在给中复连众内外部用户提供便利服务的同时,其业务运行也更加依靠于信息化系统的稳定运行,其结果是,一旦发生IT系统停都可能同时丢失。因此,小至一般性的硬件故障,大到区域性的自然灾害,从物理的设备不行用,到逻辑的人为失误和破坏,都可能造成整个信息系统的全面瘫痪,导致业务运营的停顿。为防患未然,现有SAP及OA对应连云港中复连众的数据安全要求是严格的,如何将RPO降到最低,这就需要一套完整的正常使用。为了提升数据的安全级别中复连众在分厂区(沈阳、大浦)也进行数据的安全保存,需要解决方案有对异地数据备份的高效、安全的支持能力。应用级容灾6级,明确了RTO/RPO(第6级)中要求RPO=0,RTO0。从业务连续性角度分析,企业日常的办公、财务、等核心系统均部署在服务器中,一旦现有故障率越来越高,用户面对着可能随时业务中断的风险也越大,要求前端业务系统提供7*24小时的高可用性服务,业务运行不允许中断,系统一旦停机会给企业造成巨大的损失。中复连众的核心业务SAPOA是仍然存在单点的故障,当目前的EMC存储设备出现故障将会影响两大业务系统的运行.或者当机房出现断电、物理故障,能够在异地飞快的接管正常的核心业务系统。SAPOA24高性能存储考虑到SAP服务器更新、容灾中心数据备份及应用级容灾考虑,需新加存储,其存储空间能满足五年的数据增长.从SAP、OA系统的性能需求角度分析,依据前端业务特点和数据类型,可大致分为两类:服务器虚拟化,数据库服务。主机虚拟化业务访问存储系统的特点:(1)随机性,虚拟机运行的业务类型多样,I/O绝大部分为随机I/O。(2)突发性,可能同一时间访问量很大,格外是上千个虚拟桌面同时启动带来的“启动风暴(即当大量的用户同时登录系统时所造成的系统反应格外缓慢,桌面启动时间长)”问题或前端部署了大规模应用,同时并发访问.(3)灵活性,虚拟机部署在不断调整(虚拟机优势)。数据库服务业务访问存储系统的特点:安全性,保证数据不能丢失。稳定性,业务不行中断性.性能要求高,格外是IOPS的要求,小文件随机读写为主。服务器及服务器端业务一方面将产生的数据写到存储,另一方面从存储设备上读取所需数据,格外是现有数据库及虚拟化业务对随机读写数据、小数据块读写,对存储缓存要求更高,面设备的IOPS理性能越强,对后端存储要求更高,需要存储配置相应缓存,提升存储的整体性能,满足前端业IO网络加速IP2M复杂型需求RPORTO重要的指标外,还需要考虑到诸多因素。理,削减IT数据备份代理类型:中复连众采纳的系统平台和数据库都多样化,数据结构也是复杂的,如何在统一的保护平台中对各种数据库和结构有针对性的备份,对数据备份平台的技术支持范围有较高的要求。灵活的备份手段和机制:数据备份的目的是保护数据业务,而不能对业务运行产生影响,要为备份作业提供灵活的控制,需要为统一数据保护平台提供灵活的的备份手段和机制。恢复流程:当数据出现故障的情况下,能高效快速的自动恢复,是对RTO要求的直接反应.报表提供:对待统一的数据保护平台,提供相应的数据和介质设备、备份资源状态、恢复操作等汇总信息,利于信息管理人员进行统计和审核工作。监控能力:由于业务是时时刻刻进行的,所以必需要有时时观测业务环境的可视化控制台,让所有的操作和业务运行状态得到自动和手动的监控管理。结合中复连众每个业务应用的详细RPORTO提供以下整体的系统保护解决方案,力保当出现系统故障时候,飞快的得到恢复,保证业务服务的正常运行。项目总体建设目标及建设原则系统建设目标条件下,为中复连众单位业务系统建立完备的异地数据及生产应用容灾系统.总体上,此次备份容灾系统的建设将至少达到如下目标:高性能双活存储系统SAN主存储实现双活和存储虚拟化;本地存储故障时,要求实现数据无丢失、应用不中断,即RPO=0、RTO=0;实现OA/MAIL等应用系统虚拟化集群及容灾,容灾级别必需达到GB20988—2007—T信息安全技术信息系统灾难恢复规范,所规定的三级容灾级别,和三级容灾中心建设。备份容灾系统实现数据中心存储内的数据基于现有网络线路的远程备份备份;在主数据中心大浦的存储和远程容灾存储之间实现基于磁盘阵列的数据块层次的数据复制,能够定制符合现有IP网络环境的复制策略,以最小的网络带宽代价实现快速的数据恢复或业务切换;持续数据恢复功能(CDPI/O路径中。实时对写I/O网站证实.能够实现对物理和数据逻辑故障的恢复,逻辑故障包括:数据库逻辑错误、人为误操作和病毒等引起的数据库数据丢失、人为或病毒引起的数据库崩溃等故障.提供全都性组功能,能够将某个特定应用程序的所有LUN时进行,从而确保应用程序的全都恢复。项目建设原则为了全面保证各单位数据中心建设目标,在数据中心存储系统规划、建设、实施、运行和完善的经过中,必需应遵循以下建设原则:(1)开放性:系统符合开放性设计原则,具备优良的可扩展性、可升级性,能够支持开放系统平台,运行于现有的技术标准之上;(2)兼容性:与现有系统需要彻底兼容,各个构成子系统必需紧密衔接、高度集成,构成一个整体;(3)稳定性:要保证系统运行的稳定性,使系统运行风险降至最低;技术先进性:系统设计应采纳当前先进而成熟的技术,不仅能够满足本期工程的需求,也应把握将来的进展方向。可扩充性:在系统设计时应充分考虑可扩充性,从而确保新功能、新业务的增加在原有的系统平台上扩展和实现。(6)高可靠性:系统平台具有高可靠性,支持服务器平台的高可用性集群技术;具备先进的性能调整能力,提供极为充分的可靠性各项指标设计。(7)高可用性:在不停机情况下,实现不停机扩容、维护、升级等服务,提升性能以满足新的业务需求.具备7×24×365连续工作的能力,系统的可用性应大于99。999%。在自动化管理软件支持下能够实现磁盘数据的在线(不停机)备份。(8)成熟性:应尽量选用经过大量运用、成熟可靠的系统.(9)可实施性:选用成熟的技术,成熟的案例阅历和设计方案,制定详细的技术实施方案.(10)经济性原则:在满足所有需求的前提下,选择最合适的设备及管理软件,使系统具有较好的性价比.(11)充分保护用户现有投资:采纳先进技术,将现有存储系统无缝的整合在新系统中,实现对用户现有设备的有效利用,达到保护用户现有投资的目标。项目总体方案设计及技术说明项目总体规划方案设计在宋跳机房新增两台对称双活存储系统MS3100替换原有存储CX4—240,将原存储上的数据迁移至新存储MS3100,经过配置大容量缓存提升MS3100整体性能,提供高效数据支撑能力,MS3100SAPOA存储MS3100上,最大限度削减数据的丢失量(包括RPO=0),最快速度的恢复关键应用系统(RTO=0),提升信息系统的整体服务级别。CX4—240存储的利旧,新增一台宏杉科技存储虚拟化CDPVS2100,可继续对老存储的空间与新增存储资源进行统一管理,并且,实现将主存储生产数据持续保护到原有CX4—240IO新增一台赛门铁克备份一体机NBU3250,将主存储数据实现基于多种丰富备份策略的近线备份,再与原有磁带库实现D2D2T在异地远程灾备中心大浦机房配置一套MS2520i作为灾备系统,经过在存储底层的复制容灾软件,将宋跳主存储MS3100上的数据灾备到大浦,一旦宋跳数据中心两台存储系统的数据均丢失,在异地留有一份数据副本,进一步提升数据安全。OAVMware服务器虚拟化环境,两台IBMX38505VMware移等多种高级VMotion项目总体方案拓扑图5.方案总体系统架构拓扑图双活存储系统方案说明7*24高可用、扩展灵活、管理简单的统一存储平台,从而前端数据的集中整合,提升系统连续性和数SDAS实现数据的实时同步,前后端均配置多路径冗余链路,当主存储发生故障时,镜像存储可自动接管前端业务系统,RTO、RPO0。方案描述针对以上对业务RPORTO均为0案。新增两台存储系统MS3300,采纳对称配置方式,两台存储之间完成数据的实时同步,一旦当主存储系统MS3300出现故障时,镜像存储系统MS3300可自动将前端业务切换过来,最大限度削减数据的丢失量(包括RPO=0),以最快速度在数据中心恢复关键应用系统(RTO=0),提升业务系统的整体服务级别和业务连续性。AMS3300:针对目前本项目的各业务系统对存储性能的需求,我们建议新增一套宏杉科技自主研发的MacroSANMS3300存储产品用于存放各在线应用系统基础数据,用于承载前端核心业务等:配置双冗余控制器支持Active/Active负载均衡;同时配置SAN、NAS32GBIO求;88GbFC,10个万兆IP1310000600GB企业级SAS,122TB7200转企业级SAS31TB。配置基于磁盘阵列底层的数据双活功能SDASA与数据中心BABRTO、RPO0,并且,前端无需配置任何第三方软、硬件,部署简单,屏蔽了前端主机物理特性及应用类型特性(适用于所有应用);存储引擎B:新增一台镜像存储MS3300.配置彻底全都,保障系统可实现自动切换且两套系统无任何性能、容量等差异,切换经过中,前端用户体验无任何变化感知,RTO、RPO0,达到应用级容灾。镜像存储同时进行数据读写。并且,两台存储也能够承载不同的应用,相互镜像,达到真正的双活目标,两台双活存储系统做到负载均衡的作用流作用。MS330059.MS3300SASMS3300采纳SAS96Gb;为了保障处理能力,MS3300PCI-E2.0总线3千兆/万兆/8GbFC主机接口:在前端主机接口上,MS3300可依据需要提供千兆、8GbFC、万兆主机接口,并保障前端的业务带宽;全交换磁盘柜:磁盘柜采纳了SAS6Gb它磁盘的干扰;在磁盘选择上,MS3300兼容高性能的SSD磁盘,并同时支持SAS、SATA中间光纤交换机:为了安全起见,考虑搭建全冗余链路平台,避开光纤交换机成为单点故障来源,中间部署两台博科24FCSANHBAFCSAN方案优势大容量缓存提升性能数十倍经过在计算、传输与存储之间设置大容量、高速的缓冲区,才有可能缓解前端电子设备与后端存储硬盘之间上万倍的性能差异.对待单个LUN,假若读写操作频繁,假若配置更多的缓存,则读取效率更高,格外适宜本次前端数据库级服务器虚拟化多业务并发模式。实践证实,单个LUN1GB大小,假若是相同大小的LUN1GB20GB24存储端负载均衡两台存储系统同时处于工作状态,非“一主一备”模式,主机能够经过主、镜像存储同时进行数据读写。并且,两台存储也能够承载不同的应用,相互镜像,达到真正的双活目标,两台双活存储系统做到负载均衡的作用,降低主存储应对前端数据读写压力,实现数据分流作用。零数据丢失,业务自动接管(RPO、RTO0)采纳基于磁盘阵列间的数据同步镜像技术,两端数据实时同步,业务系统自动切换,无需手动.主、镜像存储产品均采纳全冗余的硬件架构设计,电源、风扇、控制器等冗余部署的,不存在单点故障,能够在线更换部件,无影响业务连续性。借助宏杉科技独特的CRAID技术解决了磁盘的安全性问题,大大降低数据丢失的风险。成本低、易部署(适用于所有应用类型)本次双活数据中心平台搭建彻底是基于两台双活存储底层,前端主机与存储之间配置多路径软件即可实现链路的自动切换,无需在主机端安装其他第三方软、硬件设备,格外简便。易扩展、易维护存储平台MS300051664GB3-5MSGUI、CLI管理界面,操作简单便利.经过应用相关型的引导界面,管理员只需简单的点击鼠标,设置应用类型和空间大小等信息,就能轻松完成资源分配;MS系列存储支持EventLog、指示灯告警、控制台告警、蜂鸣器告警、SNMP告警、邮件告警、短信告警等多种告警机制.在告警处理上,MS系列存储支持故障事件和告警联动方式自定义,管理员可为每种事件配置不同的告警联动方式.本地化研发级原厂售后服务7*24级别的技术支持。国产品牌,支持二次开发和定制功能.常见三种双活存储技术对比本次双活存储平台建设,从采购成本、部署及实施简便性、应用范围等多方面综合考了,建议采纳宏杉科技本次推举的彻底基于存储系统底层双活镜像软件搭建双活存储解决方案,性价比等各方面都更加能满足用户实际需求。本地备份系统D2D2T方案说明方案描述为防患未然,现有SAP及OA数据需在本地进行数据的备份。虽然目前已经有了备份的机制,但是现有的机制明显已经没有方式满足日益增长的数据和有限的备份窗口的要求,所以,目前公司需要一套有效的,快速的,稳定的备份架构来满足这些要求。由于目前公司的大部分的架构都是基于SAN同时,在需要备份数据的时候能够以最快的速度恢复相应的数据.有以下几点磁盘被真正被作为磁盘来管理(随机访问)image基于磁盘能够同时读写image支持跨域的自动映像复制备份软件的高级磁盘管理功能虚拟合成备份,MediaServer(OST)RPO备份方案,当出现任何软、硬件故障的情况下,飞快的将备份走的数据恢复出来,保证数据的正常使用。选择原则实现一个真正满足业务需求的备份环境是一项格外复杂的任务方案来适应,一般来说,一个完善的备份系统,需要满足以下原则:定性和可靠性就变成了最重要的一个方面.首先,备份系统肯定要与操作系统兼容,其次,当事故发生时,能够快速有效地恢复数据。全面性:在复杂的计算机网络环境中,可能会包括了各种操作平台,如各种厂家的UNIX、LINX、WindowsNT、VMS灵活的备份策略:在下班时间系统负荷轻,适于备份。可是这会增加系统管理员的负担,由于精神状态等原因,还会给备份安全带来潜在的隐患。因此,备份方案应能提供定时的自动备份。在自动备份经过中,还要有日志记录功能,并在出现异样情况时自动报警。操作简单:使备份工作得以轻松地设置和完成。连云港中复联众现有的SAN(存储区域网络SANClient技术,经过光纤网络进行备份数据的传输,在减轻主机负担的同时,大大提升备份的速Netbackup备份一体机强大的性能以及功能优势,主要涉及到的功能有SAN-Client备份加速器(合成加速备份功能)重复数据删除功能(源端以及目的端)NetbackupV—RaySAN-Client备份所有接入SANSANClient机上需要安装NetBackupEnterpriseClientApplicationandDatabasePack应用系统没有数据库则不需要安装ApplicationandDatabasePack).在备份操作时,NetbackupEnterpriseClient模块把需要备份的数据从生产数据存储设备中读入生产机,然后把数据经过SANNetBackupEnterpriseClient将经过SAN模块把数据写入生产系统。在SANClient/恢复操作的数据经过SAN彻底的介质服务器控制设备,充分的资源共享、负载均衡,简化管理。应用服务器利用SAN驱动、传输备份数据。备份设备彻底由介质服务器控制,管理独立于应用区域。让备份与应用彻底隔开,对业务服务器影响最小.备份软件升级对应用影响最小。备份设备更换、维护、升级对应用影响最小.经过扩展介质服务器无限扩展备份域。备份加速器(合成加速备份功能)此功能使用Accelerator技术加快虚拟化备份速度,在完成增量备份期间还提供彻底备份映像。仅将发生变化的数据块从客户端传输至介质服务器.在我们的备份设备这里将之前的全量份的时间来完成全量备份。备份速度增加高达35倍,能够更好地满足服务级别协议要求而不影响恢复削减了数据传输量,因此缓解了基础架构承受的压力重复数据删除简化数据中心迁移和更新经过不论是传统、虚拟化还是混合企业环境中,重复数据删除功能正快速成为管理空前增长数据的基石。重复数据删除功能的使用率稳步升高,而众多IT部门目前又面临着问题:能否得到一种经济有效且可伸缩的重复数据删除解决方案,能够简化现有数据保护经过,能够便利透明地部署,能随着数据中心的扩展而扩展,并协助削减和控制CAPEX和OPEX成本。在单一数据保护平台中实现企业级“端到端”全局重复数据删除采纳V—Ray的智能NetBackupDeduplication使您能够轻松地部署企业级、高伸缩性、“端到端”全局重复数据删除功能,整个经过只需动动鼠标.NetBackup的整合和管理简便易行,经济适用,适宜企业全局部署规划,提供了独特的无缝集成功能,经过单一供应商产品,为虚拟和物理服务器数据保护及重复数据删除提供了“一步到位解决方案”。利用经过实证的单,NetBackup重复数据删除功能具备与时俱进的灵活性,不会产生昂扬的成本。NetbackupV-Ray技术有效的保护虚拟化环境针对虚拟机工作负载的建议包括:采纳统一的虚拟和物理保护–借助屡获殊荣的NetBackup,用户不需要使用两种备份工具,也无需更换供应商,即可获得对虚拟和物理环境的企业级保护.作为首屈一指的虚拟机备份提供程序,NetBackup在单一备份和恢复平台中提供了管理用户环境所需的一切.在虚拟机内采纳应用程序全都性恢复–众所周知,备份的关键在于速度,但恢复更甚于此。假若只顾尽可能快地执行备份而不考虑恢复问题,那么您将受益很浅-尤其是在尝试恢复关键应用程序时更是如此,这种情况下时间就是金钱。V-RayNetBackup应用程序全都性备份且对虚拟应用程序的恢复与数据全都。这有助于确保更快地完成恢复,从而协助用户更好地满足严苛的SLA的要求采纳V—Ray技术的NetBackup提供许多独特且强大的功能,在光纤的环Netbackup采纳NetBackup虚拟机智能策略–NetBackup会监控整个虚拟环境,并自动对新的、移动的或克隆的虚拟机应用备份策略以确保保护不会停止。此外,NetBackupNetBackup便能够在各主机服务器之间平衡备份负载,以防止经过备份进程不公正地加载它们。这能够带来大大高于竞争解决方案的备份成功率Netbackcp的P2V技术,能够将物理机或者物理机的备份镜像转换成为虚拟机,在虚拟化的环境下,大大提升系统包括数据恢复的速度和效率。提升了恢复时间目标(RTO)可满足严苛的灾难恢复(DR)SLA要求经过在虚拟环境上进行灾难恢复(DR,削减OPEXIRVNetbackupNFSdatastore,VMwareESXiNFSmountdatastoreESXi务器,然后经过Storagevmotion的功能,将这个只读的镜像迁移到其他存储上,便完成了虚拟机的瞬时恢复,整个经过消耗几分钟,是一个格外有效的轻量级容灾功能只需几步便完成系统和应用的还原,效率极高不需要额外的license,在最新版的Netbackup里面便带有这个功能BMR裸机恢复功能BMR技术主要的功能是能够备份操作系统的状态和应用数据,在恢复的时候连系统带数据一IBMP550BMRIBMP750BMRNetBAckupNetBackup务器。但在执行每项预定备份任务之前,系统将自动执行附加经过,即记录服务器配置的当前状态,其中包括磁盘配置和网络配置.假若服务器配置被修改,系统在执行备份时,将自动捕捉和记录这些修改,不需要用户进行干预。BMRBMRserver的命令行,又能够使用基于浏览器的简单界面。只要发出“preparetorestore”(预备恢复)命令,系统就开头执行恢复.些时,BMR将立刻检索客户机配置数据,并使用该数据创建一个定制化的客户恢复程序。然后,经过网络为客户机发送相应的引导数据和文件系统。客户机将经过BMRbootserver序。引导程序将执行一列任务:假若不需要转变服务器配置,除初始网络引导外,将不需要进行人工干预.由于BMR是一种多平台产品,用户能够经过一个公用界面,恢复一系列系统,从而大大降低成本.传统恢复传统恢复BareMetalRestore1.修理硬件1。修理硬件2。收集所有必需的介质2。点击“preparetorestor”3.重新启动3。重新启动4。经过CD—ROM作系统5.重新启动6.CD—ROM,重新安装备份客户端软件7。重新启动8.从备份服务器进行恢复9。重新启动颗粒度还原技术exchange邮箱的时候,能够恢复某个用户的某封邮件,甚至于某封邮件里面的某个附件,而不用还原整个mailbox里面的所有邮件,协助管理员定位需要还原的组件,并且以最快最高效的速度还原单个项目。D2D2T的备份还原机制Netbackup备份一体机提供外置借口能够外接物理带库进行数据的传输,从而实现D2D2T的备份方式,将最近的,需要恢复概率最高的那些数据存放在一体机的硬盘上,而将那些TS3100的物理带库来完成数据的长久保存。方案优势Netbackup一体机设备采纳磁盘作为备份的介质,在空间使用率上相比之前的物理带库或者虚拟带库备份有着无法比拟的优势,其他各种有用的功能也久经考验,主要的优势体现有:经过彻底基于光纤的SAN—Client的备份方式,削减备份操作对应用主机的影响的同时提升备份的效率。采纳备份加速器的功能,用增量备份的时间和资源消耗来完成全量备份,能够大大缩短备份窗口.采纳源端和目的端的重复数据删除技术,更加有效的利用存储空间。VmwareV—rayBMR裸机恢复功能,能够在相同或者不同的硬件上对操作系统和应用数据进行恢复。利用Netbackup的颗粒度还原技术,能够还原应用程序的某个项目,例如某封邮件的某个附件。充分使用中复联众现有的物理带库资源实现D2D2T的备份模式。远程容灾系统方案说明方案描述新增一套宏杉科技存储产品MS2520i,作为远程灾备存储。远程灾备存储主要作为主存储的2M带宽,提供基于IPMS3100上的数据同步到MS2520MS2520MS2520i检测以后,可重新临时挂载前端业务.宋跳数据中心主存储恢复工作以后,将MS2510基于增量同步模式将这段时间发生变化的数据量同步回新主存储MS3100前端业务重新切换至主存储。远程灾备存储:新增一台宏杉科技MS2520i:作为主存储MS3100的容灾,提供一份与主存储数据格式全都的数据副本:配置双冗余控制器支持Active/Active负载均衡;16GB134TB7200转企业级SAS52TB。配置基于磁盘阵列底层的IP数据复制软件,完成将主存储MS3300数据经过基于IP复制到灾备存储MS2520方案优势网络带宽可充分利用MS系列存储数据复制经过IP网络实现,只要IP可达,数据复制即可实现。但在不同的网络环境下,复制的速率会有较大影响.下表给出了在特定数据库环境下,复制的传输速率参考值。测试环境:40公里距离,MPLSVPN网络,Oracle数据库网络带宽2Mbps10Mbps20Mbps100Mbps155Mbps1000Mbps不压缩传输(MB/s)0.2111。0901。95510.01519。31323.894压缩传输(MB/s)0。5692。8445.66214.48021。95326.235同步量(GB/小时)0。7413。836.8735.167.884.0(%)84.487。278。280。1299。6819。16由上表可得知如下结论:155MbIP链路,可充分利用带宽,2M可得到充分利用。小带宽链路下,复制压缩效果明显,可达2—3倍,不过压缩比与数据格式相关。异地留有数据副本,可快速做数据恢复或临时性业务接管将主存储MS3300上的数据同步到MS2520上,为宋跳数据中心再提供一份实时的数据备份。MS2520然,假若前端业务服务器仍然可工作情况下,也可将灾备存储MS2520i临时搬到宋跳机房,完成数据全都性检测以后,可重新临时挂载前端业务。持续数据保护CDP功能说明方案描述多新概念.当我们将隐藏在用户复杂需求之后的本质抽离出来CDP技术彻底契合商务备份需求,代表了数据备份的进展方向。(recoverypointobject,RP(recoverytimeobject,RTO)是两个关键性指标。RPO间点与故障时间点之间的时间差。RPO越小,数据丢失越少,RPO=0是容灾级备份技术的目标,即在灾难发生时实现数据零丢失。RTOIT系统恢复并支持业务恢复运营的时间间隔。RTO术语来描述,就是在实现RPO=0的基础上,实现尽可能低的RTO,这正是近年来新兴的持续数据保护(ContinuousDataProtection,CDP)技术的典型特点.与传统数据备份技术对数据进行周期性备份相比较,CDP不仅从RTO、RPO本次持续数据保护经过虚拟化网关VS2000提供的“带外”基于网络的应用装置,不在主机到存储的主I/O路径中,实时对写I/O原有存储CX4-240上。能够实现对物理和数据逻辑故障的恢复,逻辑故障包括:数据库逻辑错误、组功能,能够将某个特定应用程序的所有LUN绑定到一个全都性组中,以确保事务向以前时间点的回滚同时进行,从而确保应用程序的全都恢复.方案优势CDP会对企业数据进行自动监控,连续捕获并备份数据变化,发生变化的数据会实时、准确地备份下来。“持续回退”-—当出现故障或者用户需要找回某特定时间点的数据时,VS2000可按任意操作步数或时间点进行数据快速恢复。对待数据库类型的结构化数据,能够回到数据库的任何状态;对于非结构化数据,能够回到指定的时间点,协助用户找回损坏前的数据。在恢复的经过中不但保证了数据的完整型,而且能保证数据库事务的完整性.VS2000的CDP实现了实时数据备份与持续回退,每次数据变化均产生回退点,在数据无变化时则不产生回退点,与定时备份相比,可大幅度节省备份空间.数据迁移方案建议序号方式序号方式描述1直接拷贝方式后复制到要迁移到的目的地.2数据库工具方式用备份软件提供的专业软件.直接拷贝方式关闭数据库后,将存储挂载到数据库服务器上,利用操作系统的实现磁盘数据的直接复制,等待复制完成后替换原来数据所在盘符,适宜于脱机迁移的环境。数据库工具方式对待数据库数据,还可使用数据库的自身工具,如Oracle、Sybase方案实现之关键技术说明关键技术1--IP远程复制功能(实现远程容灾)基于磁盘阵列的远程复制技术磁盘阵列远程复制功能是灾备系统中业务数据实现多点到一点或一点到多点灾难备份的基础.磁盘阵列经过IP链路进行远程复制,能够有效利用广域网的各种IPIPv4和IPv6.远程复制经过中综合采纳数据块微扫描、差异对比、数据压缩、加密等技术,有效节省带宽资源.磁盘阵列到磁盘阵列N1复制灾备平台与用户端的存储设备实现数据复制的经过中投资可行性、运维可行性、管理可行性等方面均无法达到令人满足的要求.为有效利用灾备存储资源,灾备数据大集中的环境下,磁盘阵列提供十二点到一点的根本复制能力,最高能够达到几十点到一点的复制能力。有效降低灾备系统投资,极大程度简化管理、运维经过与成本。(1)网络复制概述复制是宏杉科技MS系列存储提供的存储功能选项.它可实现两台MS系列所管理的资源(SAN资源或者组)之间的数据复制。远程复制功能支持在远程办公地点与数据中心之间经过IP网络对关键业务数据进行策略性增量复制,实现数据的异地备份,并在发生意外灾难时对数据进行快速恢复,确保用户业务的持续性.远程复制是在两台MS系列存储所管理的资源之间进行MS中心和灾备中心,其中,灾备中心为生产中心提供数据备份.MS据复制到灾备中心的副本磁盘中,为源磁盘生成远端数据副本。复制策略制两种方式。策略性复制策略性复制将依据设置的条件(按预定的时间周期或阈值)触发复制。启动初始复制,以后期性触发,每日半夜或间隔几小时开头执行复制。周期最短为10分钟。持续复制持续复制功能支持在远程办公地点和数据中心之间经过IP网络对关键业务数据进行自适应复制,在远端网络中保存数据的完整副本.持续复制支持两种复制方式:策略性复制和不间断复制。如下图所示,配置持续复制时,需要先创建一个独立、专用的不间断复制资源,以提升数据磁盘的访问速度.初始状态下,持续复制采纳不间断复制方式。在生产中心,当应用服务器写入数据时,MS系列存储同时把数据写入源磁盘和不间断复制资源。数据进入不间断复制资源后,就会被自动持续写入副本磁盘,实现对源磁盘持续的数据保护。假若不间断复制资源被占满,那么系统将自动切换为策略性复制,当策略性复制触发的复制或执行手动同步复制完成时,系统会自动切换回不间断复制。复制速率MS系列存储数据复制经过IP网络实现,只要IP可达,数据复制即可实现。但在不同的网.复制带宽利用率(%)84.487.278。280.1299。6819.16测试环境:40公里距离,MPLS复制带宽利用率(%)84.487.278。280.1299。6819.16网络带宽不压缩传输2Mbps10Mbps20Mbps100Mbps155Mbps1000Mbps(MB/s)0。2111。0901.95510.01519。31323。894(MB/s)0.5692.8445。66214.48021.95326.235同步量(GB/时)0.7413。836.8735。167.884.0由上表可得知如下结论:155Mb以下带宽的IP链路,可充分利用带宽小带宽链路下,复制压缩效果明显,可达2—3倍,不过压缩比与数据格式相关2—-CRAID技术(提升硬盘安全)9012%是彻底的物理损坏,88%属于部分/彻底可用。假若磁盘发生错误后立刻被踢出阵列,一方面客户需要为100%故障所导致的数据丢失风险。ODSP存储软件平台在分层次、模块化设计的基础上,对多个层次上进行了磁盘错误处理。Cell,形象称之为“细胞”,指带“活性”的数据单元,是存储资源管理的根本单位。引入CellRAID,然后把RAID(1GB)CellLUNCellLUNRAID、Disk之间的捆绑关系,使RAID更小更灵活的Cell,实现了彻底的虚拟化存储架构。3。1。1CRAIDCellCellRAIDRAID512RAIDODSP现中,只要磁盘出错区域不在同一个Cell,RAIDRAIDCellRAID在介质错误,但是数据仍然能够访问,提升了存储产品对硬盘的容错性以及业务连续性。同时,针对多个磁盘出错区域在同一个CellODSP这些磁盘错误仅影响当前的CellCell3。1。2区分于传统RAID先踢盘再重建的方式,CRAID的快速重建可只重建错误磁盘上的损坏数据IDDCRAID传统RAID组重建时,最消耗性能和时间的原因是需要调用所有磁盘进行异或校验。快速重建由于将全盘校验改成了按Cell校验+磁盘复制,其校验任务只有传统全盘重建的几百分一或千分之一,校验时间几乎能够忽略不记,而磁盘复制的速度能够达到磁盘读写的最大值.以1TB的SATA15RAID3063。1。3类似于快速重建,但不是重建热备盘,而是只对原盘的变化部分进行重建,使其同步。适用5分钟内磁盘不在位经过中所丢失的数据,重建时间短,极大降低RAID3。1。4仅重建被LUN使用的Cell,未使用的CellCell1234,Cell5、6重建调度时,优先重建存在介质错误的Cell,然后再使用拷贝的方式重建其他Cell,以尽可能的避开该CellCellRAID组中的两块磁盘所处的不同Cell在坏块,能够两个Cell3。1.5与传统RAID组一样,适用于磁盘被拔走或者磁盘严峻故障不能继续使用的情况使用。关键技术3——大容量智能缓存管理(提升存储性能)的限制,传统存储阵列的缓存容量小,扩展困难,而且调优管理格外复杂。在云计算环境下,存储的并发I/O访问量快速增长,数据存取热点变动频繁,对存储缓存的容量要求也急剧增长同时,大容量缓存对待存储的缓存管理也提出了更高的要求.MS5000MS3000MS2500存的效率.容量按需配置:缓存大小是决定存储阵列档次的重要标准,经过增加缓存能够显著的提升存储性能.在缓存大小上,MS5000系列、MS3000系列、MS2500系列支持缓存灵活配置,用户可依据来提升性能的方式,具有更高的性价比。全局智能调度:MMS5000MS3000系列、MS2500系列采纳智能缓存调度机制,对全局性缓存进行管理.不仅单个控制器内的读、写缓存可依据实际情况动态调整,而且两个控制器的共享、突发三大区块,以满足LUNLUNLUN缓存使用格外高效。数据安全可靠(保留磁盘)里。当供电恢复后,能够从保留磁盘中将数据恢复回来。前四块盘,部分空间预留,用于保存缓存数据关键技术4——IDDC(主动式磁盘检测中心,提升数据安全)但是,据统计,存储系统的硬件故障90%以上都是由磁盘故障引发的.能够说,磁盘的安全才是存储安全的根本。基于多年存储维护阅历的深刻理解,MacroSAN开发了一套能够在不增加任何附加投资的条件下,最大化提升磁盘及RAIDIDDC:InitiativeDiskDiagnosisCenter,主动式磁盘诊断中心该诊断中心包含了4,它能够经过预先RAID磁盘检测:对所有磁盘进行周期性全盘检测,提前发觉故障;(2)支持磁盘检测速率动态调整,不影响应用性能;(3)发觉问题的磁盘交由诊断中心统一处理;快速复位:结合CRAID的局部重建机制,可快速修复磁盘逻辑错误,降低全盘重建机率。坏块修复:经过检测的磁盘发觉存在坏块(扇区)后,会触发磁盘自身的remap机制,将坏块的指针重定向到好的保留扇区中.然后调用RAID组的校验功能,重建该数据块,确保数据全都性.磁盘诊断:判.修复后的磁盘自动转为全局热备磁盘。磁盘检测:对所有磁盘进行周期性全盘检测该功能能够经过以下几个模块实现:快速复位的错误,能够实行不同的错误处理方案,包括:(1)重试,即针对磁盘可恢复的临时性故障(磁盘的假故障,比如震动引起的读/写错误),磁盘子系统对命令进行重试;对磁盘下电再上电,即从硬件上复位磁盘,尝试修复磁盘错误,结合上面提到的RAID基于Cell的局部重建机制,复位磁盘经过中新写入的数据可快速完成重建,恢复RAID磁盘错误透传,由RAID进行处理.坏块修复发觉磁盘坏块(扇区,依据RAID信息重建数据,触发磁盘自身的remap机制,实现坏块替换磁盘在出厂前会留有一部份备用扇区,当正常使用的扇区出现损坏的情况下,磁盘会启用remap自动修复机制,将损坏扇区重定位到备用扇区,这样磁盘的整体容量和功能就不会受到影响,对待用户来讲,这个磁盘还是一个完整的好盘。采纳remap的数据是已经丢失的,IDDC的坏块修复功能能够依据RAID据,并进行恢复,这个经过只是针对产生坏扇区的部份,而不需要对整个RAID进行重建,重建经过所耗性能几乎能够忽略不计。磁盘诊断磁盘自动转为全局热备磁盘.磁盘检测中心对磁盘进行扫描后,会依据发觉的磁盘错误类型进行标记warningfail盘等,并经过相应的功能模块将这部分磁盘替换出来,转移到磁盘诊断中心盘诊断中心会对磁盘进行全写操作,并对逻辑错误尝试进行修复.能够经过磁盘诊断中心修复的磁盘会被设置为热备磁盘。不能经过的会被设为fail磁盘,并会经过通知模块提示用户更换.关键技术5—-双活存储技术(保障业务连续性)数据信息是当今社会进步、进展的关键,数据安全和业务连续性显得尤其重要.当前大部分信息中心都采纳中心服务器和单台存储的模式,服务器具有较高可靠性和可用性,存储设备提供.加大的同时,带来了更大的管理难度,如何在故障情况下尽快恢复使用并保证数据的安全,已经成为一个日渐突出的问题。双活存储方案,正是解决本地由服务器或存储软硬件故障而引起的问题.该技术较为成熟,具有维护简单、稳定可靠等优点,能充分保障业务连续和数据安全。灾备运行维护策略灾难恢复预案设计制定完备灾难恢复预案的主要目的是:规范灾难恢复流程,使重要信息系统在灾难发生后能够快速地恢复数据处理系统运行和业务运作;进行测试;
重要信息系统能够依据灾难恢复预案对其数据处理中心的灾难恢复能力灾难恢复预案可作为相关人员的培训资料之一。灾难恢复的目标和范围灾难恢复的目标生后能够快速的恢复数据处理系统运行和业务运作.灾难恢复能够防范的灾难包括地震、水灾等自然灾难以及火灾、战争、恐怖攻击、网络攻击、设备系统故障、人为破坏等无法预料的突发事件。经过灾难恢复系统的建设,提升抵御灾难和重大事故的能力,削减灾难打击和重大事故造成的损失,确保关键数据和关键业务的数据安全和作业持续性。灾难恢复的范围工作。灾难恢复的组织机构组织机构的设立信息系统的使用或管理组织(以下简称“组织”)应结合其日常组织机构建立灾难恢复的组织机构,并明确其职责。其中一些人可负责两种或多种职责,一些职位可由多人担任。每一个团队都应该得到培训并时刻预备在中断事件发生需要启动恢复预案时展开工作团队将负责对事件进行响应、对功能进行恢复和使系统回到正常运行状态,恢复人员应该被布置到其中的一个团队中.这样,他们就需要明确认识团队在恢复工作中的目标、他们要执行的每一个步骤以及他们的团队与其它团队的关系。复领导小组、灾难恢复规划实施组和灾难恢复日常运行组和技术专家组。其中,灾难恢复领导小能不同还能够细分为损害评估小组、操作系统管理小组、系统软件小组、服务器恢复小组、数据也可委托外部机构承担实施组以及日常运行组的部分或全部工作。另外,视单位实际情况,还可选择组建“后勤保障组”和“媒体攻关组"等。组织机构图依据各小组的工作职能和职责,可划分灾难恢复的组织架构图如下所示灾难预警处理流程任何人员在发觉灾难即将发生时,应立刻报告灾难预警值班人员(日常运行组成员),由值,削减损失赢得时间.在某一时刻,单位的生产系统及其灾难保护系统总处于以下某一确定状态.可能发生人为的、有先兆的、可预料或不行预料的各种灾难,进入灾难状态。而正常状态和演习状态下发生灾难直接进入灾难状态的情况一般是属于不行预料或没有先兆的.我们希望在可预料或有先兆的灾难发生之前,能够有一套规范、合理的处理流程,能够及时排除故障、消除警报,避开灾难的发生或尽量的削减灾难造成的损害,这就是灾难预警处理流程所应具备的功能。灾难预警处理的一般流程如下:通知启动流程通知启动流程定义在探测到系统中断或紧急情况发生或即将到来时实行的初步行动复人员将预备在临时系统上执行恢复系统功能的应急措施。事件通报流程任何人员在发觉紧急事件发生或即将发生时,应按预定的流程报告相关人员,并由相关责任人员进行初步推断、通知和处置。包含这两种情况.该流程应该描述在工作时间和非工作时间内通知恢复人员的方式,适当的通知对削减对IT系统的影响是很重要的.统崩溃赢得足够的时间.在灾难发生后,应该通知损害评估负责人,使其能够确定事态的严峻程度和下一步将要实行的行动。当损害评估完成后,应该通知相应的恢复和支持小组。能够经过各种方式完成通知,包括电话(包括移动电话)、电子邮件以及电台、电视广播和Web.事件通报流程中应该定义在事件发生后人员无法联络时的实行的措施要的和备用的联络方式。需要通知的人员应该在规划附录中的联系清单中标明负面影响的外部机构或互联的伙伴系统,与外部机构相连的每一个互联系统应相互协助,协助的方式应该依据所提供的系统互联协议确定。通知中所传递的信息类型应该在预案中说明团队而定.依据需要,通知信息可包括但不限于以下内容:所发生或将发生的紧急情况的性质死亡或受伤情况任何已知的评估结果响应和恢复的细节何时何地召集会议介绍简况或听取进一步的响应指令在评估期间进行重新部署预备的指令使用呼叫树完成通知的指令(假若需要)损害评估流程要确定应急事件后如何实施应急规划,对系统损害性质和程度的评估是格外重要的.在紧急事件发生后,灾难恢复责任人应第一时间召集相应的专业人员对紧急事件进行慎重评估,确定事态的严峻程度,以及紧急事件对信息系统造成的影响程度,并最后确定下一步将要实行的行动。损害评估流程对待不同的系统是不同的,但是应该涉及到但不限于以下领域:造成紧急情况或中断的原因潜在的附加中断或损失受到紧急情况影响的区域物理构架(如数据中心结构的完整性、电源、电信以及制热、通风和空调的情况)的状况IT设备的总量和功能状态(如具备完整功能、具备部分功能或丧失功能)IT设备及其存货的损失类型(如水害、火灾或热能、物理以及电涌影响)被更换的项目(如硬件、软件、固件或支持材料)估计恢复正常服务所需的时间灾难宣告流程应预先制定灾难恢复预案启动的条件。当损害评估的结果达到一项或多项启动条件时,领导机构的启动条件各不相同,应该在灾难宣告流程中予以说明。条件能够基于以下方面:人员的安全和/或设施损失的程度系统损失的程度(如物理的、运作的或成本的)系统对待机构使命的影响程度(如保护资产的关键基础设施)预期的中断持续时间一旦明确了系统损害,应急规划协调人就能够选择适当的恢复策略,并通知相关的恢复团队。灾难恢复处理流程恢复处理流程。依据损害评估的结果、灾难造成的损害程度和灾难恢复的优先挨次,在灾难恢复间、地点、人员、设备和每一步的详细操作步骤,同时还包括特定情况发生时各团队之间进行协调的指令。容灾备份中心的系统替代主系统,支持关键业务功能的提供。这一阶段包含主系统运行管理所涉及的主要工作,包含重续运行的所有操作流程和规章制度。灾难恢复处理流程应该被设定为适当的灾难恢复团队,其通常涉及到如下行动:获得访问受损系统和/或地理区域的授权通知相关系统的内部和外部业务伙伴获得所需的办公用品和工作空间获得和安装所需的硬件部件获得和装载备份介质恢复关键操作系统和应用软件恢复系统数据测试包括安全控制在内的系统功能将系统连接到网络或其它外部系统成功地运行备用系统能假定或忽略规程的步骤。检查列表(checklist)的形式有助于撰写挨次的灾难恢复方案和在系统无法正常恢复时解决问题。灾后回退处理流程该阶段是主中心的重建工作,中止容灾备份系统的运行,回退到主系统.法恢复,这个阶段的行动也能够在支持系统处理需求的新设施中进行.当原站点或新站点恢复到能够支持业务系统及其正常处理的水平常,系统就能够转回原站点或新站点.在完成主系统恢复和测试以前,灾备(应急)系统应该继续运行.重建阶段应该设定负责恢复或替换站点和业务系统的团队。下列是这个阶段进行的主要行动:确保充分的基础设施支持,如电源、供水、电信、安全、环境控制、办公设备等与网络部件和外部系统建立连接和接口测试系统运行以确保彻底的功能性备份应急系统中的运行数据并上载到被恢复系统中关闭应急系统终止应急操作对应急站点的所有敏感材料加以保护、清除和/或重新配置布置恢复人员回到原设施人员联系清单等相关信息资料为保证事件通报流程能够顺利的完成,在发生灾难时能够及时的联系到相关团队、技术专家和技术支持人员,必需列出灾难恢复相关人员和组织的联络表。包含领导小组、实施小组、日常运行组、外部技术专家组、各灾难恢复小组、运营商、厂商、主管部门、媒体、员工家属等。联络方式包括固定电话、移动电话、传真、电子邮件和住址等.小组:系统软件小组角色:团队负责人-主要姓名:张三1234邮编:123456小组:系统软件小组角色:团队负责人-主要姓名:张三1234邮编:123456家庭电话:(123)45678905家庭电话:(123)45678905工作电话:(123)56789011传真:(123)89762310移动电话:(123)67890124电子邮件:zhangsan@;zhangsan@灾难演练流程设计人们普遍认为建设容灾系统就像买保险,花了钱,但又不希望有派上用场的那一天。可是,从来没用过的东西,却又肩负着在不确定的某一天“挽狂澜于既倒”的使命,这本身就埋伏着巨,?是否能正常运转,但常常做些演练,是能够达到同样的目的,且是很有必要的.一个很有代表性的观点是容灾系统的建设90%以上的精力和花费是在容灾设施的演练,例照实施大楼一两次火警的演习,不断的完善技能,而且容灾规划要实时的更新,由于用户的系统环境在不断的变化。恢复预案和经过,做好预备工作,归纳如下:验证灾难恢复预案与策略,发觉疵暇之处,予以改进(如系统是如何被恢复的,速度如何)等相关数据能够测试备份主机系统与网络系统的效率能够使整个队伍熟悉其各自的角色与责任能够向领导、审计、管理、媒体等展示演练预备为了能从演练中得到最大价值,灾难演练负责人应制定演练的测试方案和灾难演练规划,演复测试.测试方案和演练规划编写好之后在测试方案和演练规划被批准采纳,角色和职责也确定好之后,应当进行演练前会议,以协调安十次甚至更多次会议,来进行各种预备和协调.演练预备期间需要考虑和着重的事项一方面,灾难恢复演练场景应当尽可能真实;另一方面,从实践的角度看,单位进行灾难恢复演练时,通常没有必要中断其正常功能.进行灾难演练规划时考虑系统运行的某些方面尤为重要,这包括:保证单位正常运营。单位进行灾难演练时应当避开引起灾难。不管是演练团队还是成员个人,都应当清晰保护单位正常运营需要实行的措施。引入的任何假设场景都应避开影响单位的正常运营,并能够被清晰识别,同时应让相关各方清晰地认识这种假设在真正的灾难中可能不会出现。决定是否延迟测试.在测试开头以前,如有必要应当有一个该测试是否能够被延迟的决定.假若单位过于繁忙,或者生产问题致使主要站点和系统不稳定,测试的额外压力会使情况恶化。这种情况下,延迟测试可能是更恰当的决定。为这是测试的组成部分,而有的参加者可能知道这是真实的灾难,但却不知道该实行测试措施还是真实灾难的恢复措施.解决这个问题的方式是,不同的测试应当采纳不同的口令或代码,以区分恢复程序。真实灾难的谣传.在恢复测试经过中,不是恢复团队成员的员工也许以为某个真实的灾难的各方时,这种惊惶尤其常见。因此所有恢复测试的传达应当首先说明“这只是一次测试”,以免产生混乱。灾难演练前期预备工作归纳确定演练目标与范围确定演练的时间确定演练的测试方案确定灾难演练规划容灾备份中心提前预备就绪灾难备援系统提前预备就绪确定演练参加单位与人员下发演练通知实施演练目的意义和灾难演练经过中的着重事项,并感谢团队的参加。演练经过中的着重事项测试持续时间、正常运行的部分,更重要的是要记下不能正常运行的部分。录下来,然后从实际应用中找回这组数据的副本,以便继续进行测试。然而,关键的是,在这一问题没有找到根源并排除时,不能简单地一笔带过.实施演练的一般步骤模拟灾难发生启动灾难宣告流程模拟灾难断开数据复制链路灾难备援系统预备启用备援系统,并确认备援系统的可用性和准确性启动应用系统,并确认和验证应用系统和数据的可用性演练通信切换灾备中心正式接替电脑中心运营业务处理服务重续运行演练恢复在演练经过中,应实时观察业务系统运行情况,当演练完成且业务系统运行正常后,应及时恢复数据备份系统选择测试的目的.正在评估规划的哪些方面?选择测试的目的.正在评估规划的哪些方面?描述测试的目的.将如何评测是否成功达到目的?清理演练环境,删除演练数据演练总结演练测试结束后,组织者或负责人应提示所有参加演练的团队和个人就演练经过中的成功或不足之处提出反馈意见,输出演练总结报告,并负责更新相关文档。测试中遇到的问题应逐一记录,并及时布置彻底解决。测试结束后的短期内,组织者应公布演练测试报告,报告中应详细记录遇到的所有问题,并推举解决方案,详细包括问题解决的详细责任人和处理人,以及问题解决的详细时间.从灾难演练测试经过中吸取的阅历和教训,要应用到灾难恢复预案和下一次演练中.经过这种方式,单位的弹性才能日趋成熟,灾难恢复预案才能保持适应性.最重要的是,当与某一次演练相关的所有目标都完成时,新一轮演练又应当开头。因此,灾难恢复预案测试越频繁,真正需要灾难恢复时它就越可靠.当然,前提是其测试不应影响单位正常运行和避开发生灾难。1.演练总结一般包括以下几个内容:1)更新容灾备份系统2)文档资料更新3)更新灾难恢复预案4)形成演练总结报告5)演练文档资料存档6)完成演练测试核对表2.演练测试核对表一般包括但不限于以下方面表1。演练测试核对表项目 是 否用适不适用注释会见管理人员并说明测试和目的。获得他们会见管理人员并说明测试和目的。获得他们的同意和支持.让管理人员通告测试和估计的完成时间.在测试周期结束的时候收集测试结果。评估结果.恢复成功吗?为什么成功或为什么不成功?确定测试结果的含意。简单事例的成功恢复暗示在可容忍中断时间段中所有关键作业都能成功恢复吗?提出更改建议.要求在给定日期之前得到响应.将结果通知给其他区域的人员.包括用户和审计员。依据需要更改灾难恢复规划手册。人员的损失或者关键文档的丢失,都有可能对灾难恢复预案的执行造成巨大影响.因此,在灾难演练经过中要着重到人员的交叉备份情况,除了每个人自己所担负的责任外,尽量做到关键步骤有后备人选作为应变。日常运行维护管理策略基础设施保障管理机房的温度和湿度网络设备和存储备份设备的长久稳定运行是需要一个良好的环境,为保证设备正常工作和延干缩而引起紧固螺丝松动,同时在干燥的气候环境下,易产生静电,危害设备上的CMOS电路等;温度过高则危害更大,它会使设备的可靠性大大降低,长久高温还会影响其寿命,过高的温度将发觉机房空调损坏,要及时的修理,削减设备在不良环境下的工作时间。要求机房的温湿度情况达到以下标准:温度温度相对湿度长久工作条短期工作条件长久工作条短期工作条件15℃~30℃0℃~45℃40%~65%10%~90%着重:数据中心和灾备中心机房内工作环境温度1.5m0。4m4815电源稳定输入电源的稳定对待设备稳定运行至关重要,电压的波动过大,使设备的部分器件常常工作在高电压或低电压,导致设备的寿命下降,器件工作不稳定,对待设备的运行造成较大的影响,建议定期(建议半年或一年一次)检查机房的电源输入是否正常,电压的波动是否在正常范围内,电压的波动范围见各个产品的输入电压,假若发觉不在正常范围内,及时对电源进行整改。建议定期检查UPSUPS等备用电源输出的功率不能满足机房设备的需求需要进行定期的检查,保证在主用的输入电源中断后,设备仍然能够正常工作。风扇与线缆运行完好长久高温还会影响其寿命,过高的温度将加速绝缘材料的老化经过防尘网上积累了过多的灰尘,或者风扇运转不顺畅,都会影响风扇的通风排热效果,建议每月检查一次设备风扇运转是否良好,是否有隐患,风扇框上的防尘网是否积累了过多灰尘。建议定期(每1-2月检查一次)检查设备的电源线、尾纤、接地线缆是否完好,有没有被腐蚀,有没有被鼠咬,以保证业务不会由于线缆的损坏而受到影响.设备运行管理采纳统一的管理系统,实现整体的系统管理解决方案.要求提供数据通信网络、容灾备份系安全、存储等设备实施统一管理。故障管理对全网设备的故障、运行状态进行实时监控、历史统计并提供协助排障的手段系统性能监控对网络优化调整、存储性能调整提供数据支撑网络流量分析NSC&NDA(NetStreamCollector&NetStreamDataAnalyzer),为用户提供丰富的网络流量、流向的数据信息,为流量工程分析、流量计费结算、存储空间使用分析存储设备的扩展提供数据依据。配置管理提供网络设备、安全设备、存储设备丰富的配置管理能力完善的系统安全(可依据对象+操作来给用户授权责来分配用户权限;提供简便易用的数据库备份工具,简化系统管理员数据备份的工作;提供Watchman志记录.技术支持和培训管理现技术支持可靠、培训管理高效的目标。技术支持依据容灾等级的不同,技术支持实现也有不同要求,依据最高容灾等级,技术支持需要达到以下标准:7x24专职计算机机房管理人员;7x24专职数据备份技术支持人员;7x24专职硬件、网络技术支持人员;7x24专职操作系统、数据库和应用软件技术支持人员。在容灾备份中心建设的一期中,建议首先满足前面两条标准,在后期的进一步完善中,应该满足全部四条标准;假若有需要,能够考虑引入第三方服务。培训管理为了使相关人员认识容灾备份系统的相关技术学问,认识灾难恢复的目标和流程,熟悉灾难恢复的操作规范,应按以下要求组织容灾备份系统技术、灾难恢复预案的教育和培训,培训的最后格外重要的意义:在容灾备份系统建设前期开展容灾备份基础学问讲座在容灾备份系统建设经过中,结合当前容灾备份系统进行深入培训在灾难恢复规划的初期应该开头灾难恢复观念的宣扬教育工作演练流程的培训应预先对培训需求进行评估,开发和落实相应的培训课程应事先确定培训的频次和范围,事后保留培训的记录;培训内容一般可分为以下三种:流程培训技术培训管理培训灾难恢复预案的管理保存与分发经过审核和批准的灾难恢复预案,应:由专人负责保存与分发;具有多份拷贝在不同的地点保存;分发给参加灾难恢复工作的所有人员;予销毁.维护和变更管理为了保证灾难恢复预案的有效性,应从以下方面对灾难恢复预案进行严格的维护和变更管理:映;预案在测试、演练和灾难发生后实际执行时,其经过均应有详细的记录,并应对测试、演练和执行的效果进行评估,同时对预案进行相应的修订;灾难恢复预案应定期评审和修订,至少每年一次。安全管理容灾备份中心的日常运作和安全管理可经过多种方式来保证.建立完善的门禁系统、视频监控系统和完善的安全管理制度是必要的手段。门禁系统最可靠、安全的出入口控制管理系统。视频监控系统际情况,在重要的通道及关键的部位安装摄像机,并采纳数字方式录像并保存在大容量硬盘上,可实现对机房情况的全天候监控安全管理制度完善的安全管理制度包括但不限于这些方面:对日常运行维护人员应依据权限不同分配不同的角色,实现分级管理不同的人员把握不同等级的登录口令登录口令的强壮性和定期更换对待设备的硬件、软件、数据配置操作进行登记备案对待每一次的设备告警、异样进行登记备案在设备外保存设备当前运行的版本、数据配置、日志信息机房应有物理出入控制措施,不允许拨号上网或其他对外网络连接方式存储产品选型依据标书中产品技术规划要求,对待磁盘陈列,我们推举使用宏杉MacroSANMS3000MacroSANMS2500.MacroSANMS3000系列产品介绍MacroSANMS3000(ODSP:OpenDataStoragePlatform)架构,其融入了大量先进的设计理念和架构技术,面对中、MS3000MS3100、MS3300.MS3000产品特点:大容量智能缓存管理MS3000不仅支持64GB缓存,还能经过容量按需配置、全局智能调度等缓存管理机制,大大提升了缓存的效率,降低了缓存调度的管理难度.此外,MS3000支持缓存镜像、掉电保护功能,在控制器或外部电源故障的情况下,能够将缓存里的数据下刷保存到保留磁盘里,保证数据不丢失。双活控制器MS3000主要部件都采纳冗余模块化设计,支持故障冗余和负载均衡,支持单独组件的热插拔和在线更换,当个别组件发生故障时,能够实现快速的故障隔离和组件更换,避开对整个系统造成大的影响。此外,MS3000双控制器平常都处于活动状态,当某个控制器的性能出现瓶颈时,控制器之间能够自动进行调整,将部分业务迁移到另一个控制器上,从而实现自动的负载均衡。主动式磁盘诊断IDDC(IDDC不仅对磁盘进行故障前的主动检测,还能经过主动预防、增强容错纠错能力、快速修复处理三个层次的监测保护机制,可将磁盘故障导致的系统宕机时间削减80%.创新的CRAIDCRAID(CellRAID)技术是宏杉科技在传统RAID精细的资源管理单元(Cell)来实现对磁盘的精细化管理,能有效提升系统对待磁盘故障的容忍.CRAID能解决传统RAID6、RAID10磁盘浪费严峻的问题,2磁盘出现介质错误,系统和数据依旧正常,极大增强可靠性.此外,CRAID还支持快速重建、局部重建等技术,能够削减80%—95CellICMT(基于Cell的智能资源管理技术Cell为单位来管理数据单元,能够从数据块底层转变了传统的卷(LUN)管理机制,并在此基础上构建了彻底的存储虚拟化架构,实现了资源的精细化管理和弹性调度。经过ICMT技术,能够轻松实现容量弹性配置、自动分层存储.丰富的数据保护功能在采纳全冗余高可靠设计、完善的磁盘安全策略的基础之上,MS3000还能够提供丰富的数据保护功能,包括连续数据快照、数据复制、数据镜像等特性.经过这些特性,实现了从在线到近线、从本地到远程的数据管理和保护,为用户轻松提供多层次、跨地域的存储解决方案。ODSPMS3000创新性地采纳“开放式数据存储平台ODSOpenDataStoragePlatfor,能缝融合,使存储不再是一个传统的“数据存取黑盒子"。项目描述MS3100项目描述MS3100控制器数量2,Active-Active主处理器Intel缓存能力8-32GB缓存保护缓存镜像,掉电后数据下刷到保留硬盘Hotcache2。4TBIO41Gb/siSCSI48Gb/sFC210Gb/siSCSI项目描述 MS310010Gb/sFCoE24*6Gb/sSAS88Gb/sFC48Gb/sFC+21Gb/siSCSI最大硬盘数目主机连接数
516(可经过选配SAS接口模块扩展)4096Storagepool数目 3060Pool支持的LUN数目板载硬盘接口及通道扩展硬盘柜类型
10244*24GbSAS4SAS3U162.5/3。5器2U252。5硬盘类型硬盘检测与诊断
SSD、SAS、SATA支持周期性硬盘检测支持硬盘检测速度的智能动态调整RAID性CRAID
、1、10、5、6持专用热备、全局热备、空闲硬盘热备CRAID重建、局部重建、快速重建LUN操作系统支持
支持不同步、校验同步、快速同步AIXHP—UXSolarisWindowsLinuxVMware项目描述项目描述MS3100等主机多路径支持兼容支持ALUA特性的多路径软件基础管理软件MacroSAN管理套件,含根本存储管理、CRAID、系统监控、日志及告警等功能虚拟磁带库支持虚拟磁带库升级管理界面支持图形化(中文)、命令行界面,提供WebService快照功能512图复制功能支持基于IP1:2、连跳、64对1点的复制功能,且无须额外的协议转换设备其他高级特性镜像功能、性能监控、自动精简配置、智能分层存储、自动数据迁移性能IOPS>110000(依据SPC-1NAS特性(可扩展) 支持CIFS、NFS、FTP等协议,支持双机、集群模式(2—8)外形尺寸模式:高(U)×宽×长(mm)(宽度不含挂耳)控制器:175(4U)×446×7203U130.5(3U)×446×6662U86。5(2U)×446×660电源输入输入:100V~127V/200V~24
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- java面试题及答案arrlist
- 换药术考试题及答案
- 江苏省南京市励志高级中学2024-2025学年高一下学期6月期末地理试题(含答案)
- 心理健康协会会长竞选
- 2025年湖北省黄冈市黄梅县中考适应性考试英语试题(含答案)
- 教师激励培训
- 药学药理学知识点练习题库
- 人才猎头服务与雇佣服务合作协议要求
- 中班幼儿死亡教育引导策略
- 学校运动会的精彩瞬间记事与事件相融的作文(8篇)
- 一级圆柱齿轮减速器的设计计算22001文档
- 第19章一次函数-一次函数专题数形结合一一次函数与45°角模型讲义人教版数学八年级下册
- 2023年四川省宜宾市叙州区数学六年级第二学期期末考试模拟试题含解析
- 幼儿园警察职业介绍课件
- 灭火器维修与报废规程
- 皮肤病的临床取材及送检指南-修订版
- 机型理论-4c172实用类重量平衡
- 校企合作项目立项申请表(模板)
- 管道工厂化预制推广应用课件
- 海水的淡化精品课件
- 项目工程移交生产验收报告
评论
0/150
提交评论