EMC业务连续性建设经验交流_第1页
EMC业务连续性建设经验交流_第2页
EMC业务连续性建设经验交流_第3页
EMC业务连续性建设经验交流_第4页
EMC业务连续性建设经验交流_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

EMC

业务连续性建设经验交流EMC咨询服务部议程业务连续性管理框架业务连续性管理框架风险评估和控制业务连续性管理组织结构应急响应和操作业务影响分析维护与演练认知与培训危机沟通外部协调业务连续性策略业务操作恢复流程信息系统恢复流程EMC

BCSI方法论

为业务连续性建设提供系统、科学的指导EMCBCSIFramework启动&准备组建项目团队B项目规划A业务影响分析2风险分析3调研相关的法规要求1IT现状分析4应用关联性分析5制定灾备策略7可行性和成本效益分析6规划管理建设项目管理灾备架构设计8制定实施规划9灾备系统详细设计11灾备系统实施12设计灾难恢复预案10培训13规划和实施灾备演练14灾备更新及维护15构建灾备中心日常运维流程16EMC方法论指导下需要开展的工作项目管理总体架构咨询(Architect/Consultant)IT现状分析应用关联分析灾备认知培训当前恢复能力评估制定业务连续性策略监管要求评估复制链路需求DR技术评估和选型容灾技术实施规划软硬件基本安装配置灾难恢复预案设计DR与ITSM的结合容灾系统技术测试DRP优化和修订专业培训演练规划主机存储网络数据复制应用数据库DR系统详细设计备份迁移主机存储网络数据复制应用数据库DR技术实施和文档备份迁移容灾演习规划与演练风险分析容灾机房设计改造制定容灾运维计划采购期业务影响分析明确灾备设备采购需求灾备策略及方案培训实施演练议程EMCBCSI建设方法论规划阶段启动&准备组建项目团队B项目规划A业务影响分析2风险分析3调研相关的法规要求1IT现状分析4应用关联性分析5制定灾备策略7可行性和成本效益分析6规划管理建设项目管理灾备架构设计8制定实施规划9灾备系统详细设计10灾备系统实施11设计灾难恢复预案12培训13规划和实施灾备演练14灾备更新及维护15构建灾备中心日常运维流程16风险分析通过风险分析发现企业业务所面临的不同风险,包括IT风险和非IT风险,从而提出风险防范策略、措施。风险类别风险列举计划外风险自然灾害气候灾害、地质灾难机房环境风险火灾、机房结构性破坏、供电系统瘫痪、空调故障社会性灾难传染性疾病或污染、恐怖主义事件、动乱、人为故障人为失误或故意破坏硬件单点故障单台服务器故障、网络单点故障、存储单部件故障硬件多点故障多台服务器故障、网络多点故障、存储多部件故障数据库逻辑故障数据库损坏、数据表误删除或修改软件故障应用软件故障、数据库软件故障、操作系统故障系统性能严重下降主机、存储、网络、数据库、应用程序等计划内风险系统升级操作系统升级、数据库版本升级、应用升级、数据库整理、硬件微码升级数据备份定期或不定期的数据备份系统迁移数据迁移、系统整合容灾演习系统切换或回切示例:业务覆盖地域范围应用级容灾选址数据级容灾选址风险影响范围与容灾中心选址风险分析:容灾中心选址业务影响分析定义关键的业务功能和业务流程RTO/RPO定义业务运营所依赖的资源第一阶段通常重点关注IT资源数据追补的能力人工替代操作的能力关键点:业务部门的参与和认可,避免不合理的期望业务影响分析:RTO/RPO目标确定过程T1T2T3T4T5T6T7T8业务RTO常见RTO定义业务影响分析:典型的RTO组成业务影响分析定义关键的业务功能和业务流程RTO/RPO定义业务运营所依赖的资源第一阶段通常重点关注IT资源数据追补的能力人工替代操作的能力业务影响分析:IT现状及业务应用关联IT系统映射、应用关联分析业务应用与IT系统映射分析业务应用的关联关系分析业务应用与外部单位(如银行)的关联关系分析业务数据一致性要求根据业务的关键性确定IT系统、IT元素的重要性应用之间的数据传递和相互依赖关系是制定容灾策略及后续容灾切换策略的依据之一。示例业务影响分析的结果定义各业务系统优先级别及RTO/RPO目标业务支撑系统访谈评分优先级别RTO(h)RPO(m)营业系统378120开关机系统356120帐务系统289120接口库、前置机280120采集系统(GSM语音)2782430计费系统2852430漫游上、下发接口2362430网间结算2144248h统计分析2043248h示例国家质量监督检验检疫总局,国家标准化管理委员会制定的《信息安全技术信息系统灾难恢复规范》GB/T20988-2007中所定义的灾难恢复等级业务连续性策略:容灾恢复能力考量标准业务连续性策略:本地恢复与容灾恢复本地恢复策略:本地高可用切换磁带恢复磁盘备份或虚拟磁带库备份恢复磁盘快照克隆恢复日志恢复CDP恢复数据追补策略…灾难恢复策略:容灾切换启用条件容灾切换最小单元容灾切换优先级…示例案例:WEB可以单独切换

中间件可以单独切换

数据库可以单独切换

每层超过一半的处理能力受损,短时无法恢复,则需要考虑切换业务连续性策略:容灾保护与本地保护人为故障的数据保护、逻辑故障保护是本地保护策略问题灾难通常导致物理故障,容灾保护通常针对物理故障的保护与恢复。业务连续性策略:容灾中心建设统一规划、分布实施示例演进路线

建设策略业务系统首期目标容灾层次容灾中心运行模式RTORPO备注CRM同城应用级主备4H0处理能力、高可用性可以适度降低。EAI同城应用级主备4HN/ALDAP同城应用级主备4H0Billing同城应用级主备8H30MinIBP同城应用级主备8H30Min示例:业务连续性建设策略容灾架构设计:容灾技术选型原则需要考虑现有的应用和系统状况、投资规模、实施后的管理要求等因素采用平台级的技术,能够适应异构环境要求避免对生产环境的重大变更采用的技术成熟、可靠,需要有大量的实际应用案例做参考采用技术能满足具体业务RTO、RPO要求,并能适应传输网络带宽要求采用的技术简单、实用,避免管理的复杂化尽量减少对生产系统的性能影响采用的技术成本适度容灾数据复制技术选型:数据的复制保护是容灾技术中最核心的部分信息的载体:磁盘阵列信息的传输:SAN网络信息的驱动:操作系统信息的处理:数据库信息的应用:业务系统中间件编程实现备用数据库技术、或数据库日志传送技术OS逻辑卷镜像或复制基于智能光纤交换机技术基于磁盘阵列复制技术需编程实现,切换及回切复杂,扩展极复杂。对主机性能有影响,切换及回切复杂,扩展复杂;只能复制数据库信息。实现复杂,主机性能影响较严重,管理复杂,支持异构存储。不占用主机资源;对应用及主机透明,扩展容易,存储系统可异构,应用越来越广泛。不占用主机资源;对应用及主机透明,切换/回切容易,扩展容易,存储系统不可异构。目前普遍采用。规划设计路线灾备系统详细设计方案应用:核心系统、信用卡、SWIFT、资产托管系统、外汇宝系统、银基通、网银、SAPTR、业务集中系统、客服系统核心技术:网络、SAN、存储系统重要技术:服务器、密钥系统、运维辅助系统、域环境、数据库、中间件规划设计灾备系统总体架构设计灾备建设策略业务影响分析应用关联分析技术可行性投资预算法规遵从企业发展战略行业案例参考IT现状调研各阶段目标、建设路线、方向架构和方法容灾架构设计:容灾设计参考模型典型的两中心容灾参考模型数据容灾应用恢复业务接管生产中心同步数据复制异地灾备中心同城灾备中心异步数据复制容灾架构演变:多点容灾容灾架构演变:多点容灾生产中心同步数据复制异地灾备中心同城灾备中心异步数据复制异步数据复制EMCBCSI建设方法论建设阶段启动&准备组建项目团队B项目规划A业务影响分析2风险分析3调研相关的法规要求1IT现状分析4应用关联性分析5制定灾备策略7可行性和成本效益分析6规划管理建设项目管理灾备架构设计8制定实施规划9灾备系统详细设计10灾备系统实施11设计灾难恢复预案12培训13规划和实施灾备演练14灾备更新及维护15构建灾备中心日常运维流程16设计灾难恢复计划及本地恢复计划也称容灾恢复流程或应急响应预案应急响应计划容灾管理组织灾难初始评估流程灾难宣布流程灾难评估流程容灾恢复计划(DRP)IT切换流程/步骤/启用条件IT回切流程/步骤/启用条件本地恢复计划本地保护操作流程/步骤本地恢复场景及恢复流程/步骤/启用条件业务恢复计划IT恢复配合业务验证数据追补容灾演习演习方法ContinuousTesting确定演习策略记录演习和收集反馈规划演习准备和协调演习实施演习分析和评估演习结果汇报演习结果ContinuousImprovement修改及完善容灾演习尽可能明确和量化演习目标,确保演习效果可以被衡量。容灾演习规划演习类型的定义和选择演习范围和目标参与人员及其职责演习场景的选择演习的时间调度演习的成功标准风险分析和应急预案演习后的状态报告人员后备计划后勤保障容灾演习手册,包括《指挥手册》、《操作手册》根据演习反馈,修订容灾切换/回切流程安全有效的容灾演练机制为什么需要业务连续性导航软件当前业务连续性项目中,容灾切换面临的问题导航软件的主要使用方法演练前演练时创建角色创建人员分配权限创建模板系统管理员模板管理员现场指挥创建流程实例定义相关人员启动流程流程指挥流程监控流程统计IT操作人员、业务人员和支持人员根据分配的任务执行对应的命令,并递交相应结果EMC导航软件的主要工作界面介绍用户任务列表用户可操作的系统模块导航栏点击按钮,退出系统并返回到登录界面流程进度EMC导航软件的主要工作界面介绍用户任务列表用户可操作的系统模块导航栏详细操作任务点击数字,在用户任务列表中查看对应类型的任务内容小结议程浦发银行两地三中心灾备建设咨询项目项目背景建设“两地三中心”的灾备体系过渡期内租用电信IDC,三年内建设自有的综合服务中心一期完成11个核心应用系统灾备,二期力争完成所有重要应用系统的灾备EMC的主要实施内容包括:业务影响分析IT系统分析应用关联分析灾难恢复策略制定灾备系统总体方案设计灾备系统详细方案设计灾难恢复计划开发灾难恢复切换演练成功案例-阿里巴巴支付宝用户背景用户超过1亿日交易总额超过4.5亿元人民币日交易笔数超过200万笔EMC的主要工作内容包括:风险分析业务影响分析IT系统分析应用关联分析恢复能力分析业务连续性策略开发灾备系统方案设计业务连续性计划开发灾备系统演练运维管理设计等客户受益建立了针对各种IT风险的应急预案通过多次不同形式的演练提高了应对灾难的能力业务系统业务运营要求业务保护要求A类(核心业务)7×24小时每年最大停机时间3.5小时(高可用性99.96%)RTO=1小时RPO=1分钟B类(内部管理及支撑业务)7×24小时每年最大停机时间8.7小时(高可用性99.9%)RTO=4小时RPO=15分钟C类(周边业务)7×24小时每年最大停机时间8.7小时(高可用性99.9%)RTO=2天RPO=1天中国航信同城容灾项目项目背景和范围开放平台业务系统容灾核心业务要求:RTO=2小时,RPO=0EMC的主要实施内容包括项目管理项目总咨询商容灾保护及恢复策略制定容灾系统方案设计容灾系统实施容灾项目实施进度跟踪开发详细灾难恢复预案多场景容灾演练规划与实施指导总体负责容灾演练的设计和指挥EMC咨询服务部EMC在业务连续性建设方面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论