版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重大事件保障服务保障方案v1.1重大事件保障组织服务中心制定了重大活动的保障组织。在客户有重要活动时我们将立即响应,提前制定合理的保障策略。1)工作组:为保障各种重大事件,我中心长期设置有经理级以上人员为工作组领导,中高级工程师为主的工作组。当客户服务器等设备需进行重大保障服务时,我中心立即启用组成工作组。请立即与交付与服务中心取得联系,交付与服务中心的工程师会竭尽全力为客户提供最迅速、最有力的现场和电话支持。2)时间安排:对于重大事件的响应不受工作日与非工作日的限制。只要客户服务器发生重大事件,请立即与我司售后服务部联系,相应的技术工程师将立即协商、确定解决方案。我司向客户承诺提供365*7*24小时的原厂工程师现场服务和热线保障服务。对于对客户业务造成较大影响,较为复杂的紧急情况,启动危急情况处理体系。由专职服务经理负责,成立危急情况处理小组,调集相关的资源。该小组需每天向公司汇报处理进展,每小时更新紧急情况处理系统的相关记录。该小组具有高度权威,能快速调动相关资源,找到我公司及上游厂商、合作伙伴中最具经验的专家,防止问题处理的任何环节出现延迟,以尽快解决问题。3)联系方式:如果有任何问题,客户可立即致电400-XXX-XXX,交付与服务中心将为客户提供全天候24小时热线服务。XX客服人员在接到客户电话后在20分钟内进行回复。重大事件保障内容重大事件保障一般分为事前、事中、事后三个阶段。事前工作为信息采集,保障方案确定、应急预案制定,责任分工、落实实施,关键时间点控制,保障人员落实等。事中工作为现场测试保障、现场动态反馈,应急处理流程待命,现场故障处理、实时参数调整等事后工作为数据删除,保障期间数据提取及分析,总结经验、输出总结报告等。重大事件保障场景为了确保IT系统设备发生重大事件或面对意外事故,在系统出现各种升级、调整或者意外情况(如系统升级、架构调整、数据迁移、系统崩溃、电源掉电等)时,相关服务能在最短时间内得以恢复以使正常的业务运营继续进行,保证用户端数据安全,将损失降低到最小限度,保证系统业务的持续性和可用性。重大事件及故障应急管理方法论交付与服务中心为了提高应对突发事故的组织指挥能力和应急处置能力,保证应急处理时指挥调度工作迅速、高效、有序地进行,满足突发情况下系统运行和系统故障恢复工作的需要,总结整理了应急管理和预案演练的方法论如下:重大事件及故障应急规范标准交付与服务中心为了提高应对突发事故的组织指挥能力和应急处置能力,保证应急处理时指挥调度工作迅速、高效、有序地进行,满足突发情况下系统运行和系统故障恢复工作的需要,总结整理了应急管理和预案演练的方法论如下:总则信息技术运行达到绝对安全是根本不现实的。在信息系统运行环境中存在着各种风险,这种风险有些是可以控制的,但有些是不可控的;我们需要做的是把风险程度降低到可以接受的范围内,能够将风险带来的损失降到最小。由于业务系统的应急方案有着针对业务系统非常强的特点,因此交付与服务中心公司将与客户一起了解客户业务需求和服务质量要求,确定应急恢复计划的范围与目标,设计提供应急恢复方案,以保证其业务的持续性和可用性。双方需共同讨论以完成应急恢复方案设计。应急恢复方案设计完成后,双方应共同参与,完成应急方案的测试预演,以确定其是否满足业务需要和达到设定的恢复目标。同时交付与服务中心将负责对贵方相关管理维护人员进行应急方案操作培训以确保需要时可以立即启动。编制依据以国家及地市有关法律、法规、规章、相关政策为依据,适用性法规标准主要有:《中华人民共和国突发事件应对法》《国家突发公共事件总体应急预案》《北京市实施<中华人民共和国突发事件应对法>办法》《北京市突发公共事件总体应急预案》《北京市突发公共事件信息管理暂行办法》《北京市网络与信息安全事件应急预案》ISO/IEC24762:2008信息技术-安全技术-信息与通讯技术灾难恢复服务指南国际标准GB/T20988-2007《信息系统灾难恢复规范》国际标准GB/T22080-2008《信息技术安全技术信息安全管理体系要求》国家标准GB/T22239-2008《信息安全技术信息系统安全等级保护基本要求》国家标准GB/T24363-2009《信息安全技术信息安全应急响应计划规范》国家标准GB/Z20985-2007《信息技术安全技术信息安全事件管理指南》国家标准GB/Z20986-2007《信息安全技术信息安全事件分类分级指南》国家标准基本原则坚持协调统一、科学处置坚持统一指挥,科学处置,针对信息安全事件快速响应,科学分析信息安全事件,科学进行应急响应,根据需要积极投入外部应急力量。坚持预防为主坚持预防为主,通过安全预警及安全监控等手段,对可能的信息安全事件进行发现,降低潜在风险对组织的影响。坚持“谁主管谁负责、谁运营谁负责”坚持“谁主管谁负责、谁运行谁负责”,应急响应工作明确到人,及时开展,从而实现应急响应工作的规范化、制度化和流程化。事故分级原则根据信息安全事故对业务系统造成的影响,将信息安全事故划分为三个级别:一级(重大事故)、二级(较大事故)和三级(一般事故)。一级(重大事故):造成业务系统数据全部丢失,或者业务系统中断半天以上,或者所有使用人员工作中断一天以上的信息安全事故。二级(较大事故):造成业务系统数据部分丢失,或者业务系统中断半天以下,或者部分使用人员工作中断半天以上的信息安全事故。三级(一般事故):造成业务系统的业务系统中断,或者部分使用人员工作中断半天以下的信息安全事故。应急机制故障升级机制突发事件的处理结果直接决定了用户对我们服务能力和服务质量的评价。要确保突发事件在SLA范围内处理完成,服务实施前,交付与服务中心将与贵司的业务人员沟通应急事件故障级别的定义,并将根据故障的级别提供相应更高的服务响应。技术备份机制对于重要的业务系统,建议贵方建立应急所需的软硬件资源、数据等备份机制。建议采用完备的备份恢复方案,使得故障后,系统能够快速恢复到故障点前的状态;备份恢复方案必须经过严格的测试;日常管理中,必须经常检查系统的备份状态,确保备份的可恢复性。设备备用机制使用备用服务器,备用服务器应随时处于待命状态,当主服务器出现故障时,可快速切换到备用服务器,从而降低业务的停顿时间。远程灾备机制条件允许的情况下,建立远程灾备系统,在数据中心出现灾难事故,短时间内无法恢复正常时,可由远程灾备系统接管关键业务,使得关键业务不受重大影响。人员备份机制除了建立应急的技术备份机制外,还需要建立人员的备份。重要岗位建立双人或多人备份制度;定期组织培训,培训内容包括应急计划和应急组织体系的运作。应对措施我们针对客户的实际环境,经过系统的巡检、分析,评估出目前系统存在的安全性现状,对于存在风险的问题进行评估,设计应对方案。硬件故障采用冗余硬件设备来防止单点错误使用HA等双机软件实现自动切换购置主要设备和易损部件的备件,及时更换磁盘镜象和RAID技术增强冗余可靠采用UPS电源保障供电安全互联的网络设备提供双机整机、系统软件及应用软件故障通过构筑本地高可用技术的群集系统来保证完善备份机制使用HA等双机软件实现自动切换存储设备的应急预案当存储设备系统发生存储故障时,如果发生存储数据丢失,我们将启动存储故障应急预案。下面将是具体的实施步骤:确认数据是否备份。更换存储损坏的部件。根据原来的存储空间规划,恢复损坏的磁盘存储LUN配置。在主机上从新确认和生成损坏的LUN的设备信息。按照原先的LVM配置信息,恢复LVM配置。如果有文件系统,按照原先的方式重新创建新的文件系统。恢复裸设备和文件系统的属主和权限。将备份软件备份的数据恢复到新的裸设备和文件系统上去。在单机环境下对恢复的数据进行测试。看是否恢复正常。恢复群集软件配置信息。将应用重新恢复到高可用性环境下。在HACLUSTER环境下对应用进行测试。确认应用恢复正常。填写现场技术服务报告记录。整理事故报告并备案。网络故障应急预案当贵方系统的发生网路故障时,我们将应用切换备用网络系统上,将用户的损失减到最低,同时我们将启动网络故障应急预案预案。下面将是具体的实施步骤:确认是否是网络出了问题,排除主机故障、存储故障和应用故障将应用切换备用网络系统上联系网路系统的开发或维护商。对现场应用进行诊断根据诊断结果,修复相关的问题将应用切回到主用网络系统上重新在群集环境中对应用进行测试填写现场技术服务报告记录整理事故报告并备案人为因素所造成的故障加强对管理人员的专项培训建立完善的维护操作规范总结经验,及时推广系统调整所造成的紧急情况事先提供完善的计划和安排重点任务的实施要经相关配合人员的充分讨论,并明确的分工专家审核变更、上线、调整的方案,保证可靠和高成功率需要的时候现场驻守工程师保证顺利实施机房环境突发性事故采用UPS电源保障供电安全合格的机房装修,温度、湿度和灰尘符合设备要求严格完善的防火、防雷击、防静电设施机房位置选择和设备固定以防地震和房屋倒塌灾难性事故不能通过一般的高可用性技术来解决,需要采用灾难恢复技术来解决,即远程灾备。应急演练为了提高突发事件的应对能力,在日常工作过程中,保证系统正常运行的前提下,每年度将组织两次服务演练,选择若干用户单位进行模拟故障演练,交付与服务中心按照贵方演练计划派技术人员到选定用户单位进行现场模拟故障排除。贵方要提前发出演练通知,说明演练时间,参演人员,演练范围,演练内容,所有人员要按照应急情况处置演练流程进行,演练流程有变动的要提前制定演练计划并分发给各演练参与人员,同时说明注意事项。演练流程详细步骤1)制定故障演练计划方法和标准:根据故障演练要求进行调研并制定计划输入:《应急预案》、(或《故障演练任务书》)输出:《故障演练计划》时间安排:(编写计划的时间)资源。风险和假设:任务假设故障各项工作已建设完成,内部评审通过、软件需求分析已确定。存在需求无法完全确定,计划可能变更的风险。角色和职责:由贵方用户方及交付与服务中心公司共同执行该任务,为故障演练提供测试计划,并组织计划的评审工作。2)故障演练时间安排根据调研的结果确认演练时间安排。3)协调参与故障演练人员说明故障演练过程中负责协调工作的人员及职责:贵方参与本项目的协调人员及其职责贵方有关管理机构的协调人员及其职责本项目同其它有关项目之间的协调人员及其职责4)故障演练环境准备说明硬件设备、网络通讯和系统软件。说明故障的数据环境准备。说明故障演练系统配套的管理制度及操作规程。说明故障演练所需的各种条件和设施。5)公告故障演练时段6)具体故障演练方法和标准:根据故障演练计划或方案进行测试输入:《故障演练计划》输出:问题报告单、《故障演练测试报告》时间安排:根据故障演练发现的问题,修改故障演练计划及相关的应急预案。风险和假设:任务假设系统预测试评审通过,各版本测试的问题能够得到及时解决。可能存在系统预测试评审不通过和缺陷不能及时修复,新版本无法准时提交
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川宜宾市第五人民医院医共体总院招聘1人笔试备考试题及答案解析
- 2026年泉州工程职业技术学院单招综合素质笔试参考题库含详细答案解析
- 2026江西赣江新区中医药科创城幼儿园招聘教职员工4人笔试备考试题及答案解析
- 2026年辽宁地质工程职业学院单招综合素质考试备考试题含详细答案解析
- 2026甘肃中医药大学附属医院招聘护理人员12人笔试备考题库及答案解析
- 2026广东广州花都区花东镇莘田小学临聘教师招聘笔试备考试题及答案解析
- 2026南昌市劳动保障事务代理中心派遣制技术运维人员招聘14人笔试备考试题及答案解析
- 2026广东茂名市茂南区农村公路建设项目管理处就业见习人员招聘3人笔试备考试题及答案解析
- 2026年广西科技职业学院单招职业技能考试备考题库含详细答案解析
- 2026安徽黄山徽投集团面向全国部分重点高校引进人才2人笔试备考题库及答案解析
- 2026湖南衡阳日报社招聘事业单位人员16人备考题库附答案详解
- 《中国的地理区域划分》教案-2025-2026学年商务星球版(新教材)初中地理八年级下册
- 炎德·英才大联考长郡中学2026届高三月考(五)语文试卷(含答案解析)
- 2025玉石加工行业创新设计市场竞争与市场发展前景规划
- 2025年天津市检察官、法官入员额考试真题(附答案)
- 建筑施工企业诚信承诺书范本
- 消防改造免责协议书
- GB 3608-2025高处作业分级
- 医疗器械进销存管理台账模板
- 2025年安徽省普通高中学业水平选择性考试地理含答案详解及试卷分析
- DB15∕T 3413-2024 住宅小区和商业用房供配电设施规范
评论
0/150
提交评论