某数据中心应急方案_第1页
某数据中心应急方案_第2页
某数据中心应急方案_第3页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、XXX XXX 2021 - DC V2.0XX 应急方案XXX 数据中心发放编号 :受控状态:受控 非受控XXX 版本记录版本状态作者开始日期完成日期备注目录目 录 第 1 章 总那么 第 2 章 数据中心应急方案组织体系 62.1 网络与信息平安应急协调领导小组职责 62.2 领导小组办公室组成及成员 . 62.3 工作职责 . 72.4 各设备应急联系人 . 7第 3 章 信息系统平安应急处置实施细那么 83.1. 信息系统故障等级划分 . 83.1.1. 一级故障. 83.1.2. 二级故障. 93.1.3. 三级故障. 103.2. 网络信息故障处理程序 . 103.2.1. 故障的

2、发现 . 103.2.2. 故障的处理 . 103.2.3. 故障的记录 . 113.2.4. 故障的升级上报 . 113.2.5. 报告内容 . 133.2.6. 应急处置 . 133.2.7. 故障处理后的测试验收 143.2.8. 故障书面报告 . 143.2.9. 故障报告填写及报告 . 14第 4 章 信息系统平安应急处理流程 164.1. 信息系统平安应急处理流程图 . 164.2. 故障升级分类及升级时限 . 174.3. 越级报告 . 17第 5 章 应急响应特点文档及工具 . 175.1. 应急文档的备存 . 175.2. 应急设备及软件备存. 18第 6 章 应急处理预案

3、. 186.1. 网络中断应急处理 . 186.2. 黑客攻击的应急处理. 196.2.1. 应急处理 . 196.2.2. 修复处理 . 206.3. 大规模病毒含恶意软件攻击的应急处理 206.4. 数据库系统故障的应急处理 . 216.5. 设备硬件故障的应急处理. 216.6. XX 相关故障应急处理 . 226.7. 对重大故障的应急处理 . 226.8. 请求外部协助支持 . 22第 7 章 后期处理 237.1. 善后处理 . 237.2. 调查和评估 . 237.3. 应急方案更新 . 23附件:应急响应相关表单 . 24第1章总那么为保证公司数据中心信息系统平安,防范蓄意攻击

4、、破坏网络系统及数据安全等紧急突发事件的发生, 根据公司?XXX数据中心应急预案?,结合公司数据中心信息化的特点,特制定本应急方案。第2章数据中心应急方案组织体系2.1网络与信息平安应急协调领导小组职责负责领导XXX数据中心网络与信息平安应急工作,确定并直接领导信息系统平安应急处置工作组。审定XXX数据中心信息系统安 全应急预案并组织实施, 研究解决数据中心有关网络与信息系统安 全的重大问题。领导小组下设处置工作 组,其工作职责由数据中心承当。2.2领导小组办公室组成及成员 姓名职务联系 组长副组长成员2.3工作职责1 组长职责负责XXX数据中心网络与信息平安应急方案的启动,对 XXX数据 中

5、心网络 与信息平安故障全权组织进行应急处置。2副组长职责协助组长对数据中心网络与信息平安故障进行应急处置,负责确定合理的技术处理方案、制定应急处置方案。组长不在现场或不便履行职责时,行使组长职责3应急领导小组其它成员职责配合组长和副组长,实施应急处置工作2.4各设备应急联系人单位姓名职务联系 备注第 3 章信息系统平安应急处置实施细那么3.1. 信息系统故障等级划分XXX 数据中心信息系统故障等级,按照?信息平安技术 -信息系 统平安等级 保护根本要求?第二级的要求,具体划分为三个等级, 一级故障为重大故障;二 级和三级故障为一般性故障。3.1.1. 级故障信息系统发生故障,预计将或已经严重影

6、响公司核心系统业务, 导致相关业 务中断 1 小时以上, 并预计 24 小时以内无法恢复的, 具 备以下一个或几个特征, 即定义为一级故障。1. 公司核心业务系统 XXX XXX 和局部 XXX 业务的广域网和专网出 现线路和设 备故障,且中断时间为一个小时以上;2. 公司数据中心核心网络出现故障,造成外网用户不能访问公司服 务器;3公司数据中心核心业务效劳器出现故障,无法及时恢复,导致业 务中断一个 小时以上。4. 公司数据中心存储出现故障, 导致业务中断一个小时以上且数据 无法恢复。5. xx 核心业务系统出现故障,导致公司业务中断一个小时以上。6. 利用技术手段,造成业务数据被修改、假冒

7、、泄漏、窃取的信息 系统平安事 件。3.1.2. 二级故障信息系统发生故障, 预计将或已经严重影响公司核心系统业务, 导致相关 业务中断 1 小时以上,并预计 6 小时以内可以恢复的,具 备以下一个或几个特 征,即定义为二级故障。1. 公司局部核心业务系统出现线路故障,导致局部客户无法访问;2. 公司数据中心核心业务效劳器宕机,无法及时恢复, 导致业务中 断一个小时 以上。3. 公司局部部署在 xx 机房的核心业务系统出现故障,导致公司业 务中断一个 小时以上。4. 病毒或网络攻击造成公司数据中心广域网连接中断或传输效率 明显下降,关 键业务系统不能正常提供效劳;5. 人为误操作导致公司备份数

8、据丧失。6利用技术手段,造成业务数据被修改、假冒、泄漏、窃取的信息 系统平安事7 12 小时以内无法解决的三级故障。3.1.3. 三级故障满足以下条件之一,即定义为三级故障。 1非核心业务出现故障,导致无法访问。2故障发生后,影响到信息系统的运行效率,速度变慢,但不影响业务系统访问; 3故障发生后,可随时应急处理,不会影响的系统全面运行,但是一种隐患;3.2. 网络信息故障处理程序3.2.1. 故障的发现 数据中心中心工作人员在发现故障或接到故障报告后,首先要 判断故障发生 的原因,对故障的等级进行初步的判断; 其次联系并 协调相关人员解决此次故障; 待故障解决后,对此次故障进行详细 的记录。

9、3.2.2. 故障的处理1. 发生故障的业务系统主管部门数据中心为故障处理部门, 故 障处理部门领导负责通知和落实相应岗位人员到达现场,故障处理 部门应首先指 定现场指挥人员,指挥人员应先询问了解设备和配置 近期的变更情况,查清故障 的影响范围,从而确定故障的等级和发 生故障的可能位置 ;2. 对于一般性故障按照 324 的故障升级上报要求进行上报 , 并在处理过程 中及时向主管领导通报故障处理情况。3. 对于重大故障按照324的故障升级上报要求进行上报,并在处理过程中及时向主管领导通报故障处理情况。3.2.3. 故障的记录在故障处理中,应对其过程进行详细记录,其中包括故障处理 的负责人,检

10、查的内容及结果,对故障的判断及处理方法,以及故 障处理过程中各步骤及执行 人员。3.2.4. 故障的升级上报根据故障等级和发生的时限,要对故障的情况进行及时的上报 ,并对报告人,告知人及时间及内容进行记录。重大故障由部门主管领导负责上报,一般性故障由故障处理人员负责上报。故障升级上 报时限如下表所示:升级时限一级故障二级故障三级故障立即数据中心经理相应岗位人员相应岗位人员半小时数据中心部门主管领导数据中心经理1小时公司主管咼层数据中心部门主管领导数据中心经理4小时公司主管咼层数据中心部门主管领导8小时24小时故障上报升级时限XXX 数据中心是负责受理和处理网络和信息平安突发事件的具 体职责部门

11、,在接到突发事件报告后,要按以下工作程序处置:1 . 一级故障的报告程序(1) 发现故障岗位人员根据故障初级判断结果, 立即向数据中 心经理汇报;(2) 数据中心经理根据故障初级判断结果,迅速将有关情况报 告 XXX 数据 中心网络与信息平安应急领导小组或数据中心部门主 管领导,报告时限不能 超过 30 分钟;(3) 经排查故障无法在 1 个小时内排除,将该突发事件形成书 面汇报材料 呈报给公司主管领导,同时向数据中心部门主管领导 上报情况。2. 二级故障的报告程序(1) 发现故障岗位人员根据故障初级判断结果,将故障有关情 况向数据中 心经理汇报,报告时限不能超过 30 分钟;(2) 数据中心

12、经理根据故障初级判断结果,迅速将有关情况报 告 XXX 数据 中心中心网络与信息平安应急领导小组或数据中心部门主管领导,报告时限不能超过 60 分钟;(3) 经排查故障无法在 4 个小时内排除,将该突发事件形成书 面汇报材料 呈报给公司主管领导。3. 三级故障的报告程序(1) 发现故障岗位人员根据故障初级判断结果,将故障有关情 况向数据中心 经理汇报,报告时限不能超过 1 小时;(2) 数据中心经理根据故障初级判断结果,迅速将有关情况报 告 XXX 数据中心网络与信息平安应急领导小组或数据中心部门主 管领导,报告时限不能超过 4 小时;3经排查故障无法在 8 个小时内排除,将该突发事件形成书

13、面汇报材料 呈报给数据中心部门主管领导,做故障升级处理。3.2.5. 报告内容报告内容包括突发事件发生的时间、地点、过程、状况、原因 及影响等。3.2.6. 应急处置1 数据中心根据故障情况立即进行应急处理, 防止事件进一步 扩大,同时 分析该故障的起因, 判断需要的处理时间, 并根据判断 结果按故障升级上报程序, 逐级上报;2 根据突发事件的性质、级别,决定启动相关系统技术应急预 案;3 根据事件级别以及对业务影响程度的评估结果, 向网络与信 息平安应急 协调领导小组报告,应急领导小组决定是否启动业务应 预案,数据中心配合业务 部门开展应急处置工作;4 应急领导小组授权办公室或责任人通过内外

14、网站、 等媒 介通报突发 事件有关信息;5根据故障可能产生的原因尽早联系其它相关部门、线路运营商、设备供应商请求技术支持, 并将联系外协支持的情况记录在案。3.2.7. 故障处理后的测试验收故障处理后,故障处理部门要进行自测,然后提交用户进行确 认,当用户对处理结果认同后,故障最终确认解决3.2.8. 故障书面报告 对于重大故障和拖延时间较长的一般性故障,在处理过后,应 对故障及处理 的全过程进行总结,以文字形式进行报告。对于影响较小的一般故障处理,在维护日志中做完整的说明和 记录。3.2.9. 故障报告填写及报告故障报告应包括以下几方面的内容: 故障处理过程的原始记录, 故障情况描述及故障处

15、理情况说明, 报告中要明确说明故障处理是 否准确和及时, 有无明显的失误,有无违反规定行为。语言应简明 扼要,对情况描述要清楚、有 条理。故障处理部门负责人将对故障报告进行全面审核,无误后签字 并报数据中心 部门主管领导,重大故障报告需报公司主管领导。第4章信息系统平安应急处理流程4.1. 信息系统平安应急处理流程图通知相关人 员前去如星敌障是否升级是处理完毕址理延! 战障升级迪知应急啊应人城、芸商到场通知应急响应人1 设备供给商到处理完毕I £ <1处理完毕 故障同归测试眾取应总救援措谴抢畳鲂 恢便正常t束*1 Ml*1|!些隍:归沏试故障風归訓试吹知哎评1古4.2. 故障升

16、级分类及升级时限1 、故障分类详见第 3.1 章节。2、二级故障发生后,在 4 小时内没有解决,升为一级故障。 三级故障发生后,在 8 小时内没有解决,升为二级故障。4.3. 越级报告故障上报应遵循逐级上报原那么,但在与上级联系不上时,可越 级报告第 5 章 应急响应特点文档及工具5.1. 应急文档的备存列号等;址;系人;用户及原始密1各类网络设备和效劳器、计算机及其附属设备的型号、序2硬件设备供给商、生产厂商的 、联系人、技术支持网3操作系统、关键业务应用软件开发商或供给商的 、联4数据中心网络拓朴图;5路由器、防火墙、入侵检测设备的配置文档,效劳器登陆 码文档;6各类软件的技术文档及其他需

17、要保存的文档。5.2. 应急设备及软件备存1正版操作系统启动盘、安装盘;2正版防病毒软件注明安装及升级序列号 3数据库管理系统软件, 数据库备份软件及最近完整的数据 备份存储介质;4相关的设备驱动程序含主板、显卡、网卡等及更新到最新的效劳器注册表文件;5备用网线,万用表、测网仪、螺丝刀等必要工具;6其它必备的应急工具。第 6 章 应急处理预案6.1. 网络中断应急处理1、故障排查:网络中断后,技术人员要迅速判断故障节点,查明故障原因;2、故障排除: 如属线路故障,应重新安装线路。 如属路由器、交换机等网络设备故障,技术人员立即检修并调 试通畅。如路由器、交换机配置文件破坏,技术人员应迅速按照

18、要求重新配置,调试通畅。必要时,请有关供货单位、 设备厂商 协助调测畅通。 如需更换设备, 应上报公司主管领导,经批准后马上更换故障 设备,尽快 恢复系统运行。 如发现属于外部线路的问题, 应与线路运营商联系, 敦促尽快 恢复故障 线路。 数据中心无法及时修理时,应立即通知相关供给商及维护人 员,在最短时 间内安排修理。6.2. 黑客攻击的应急处理6.2.1.应急处理1. 当发现网络上有黑客攻击行为时,应立即向数据中心通报情 况,并由数据 中心相关负责人向数据中心主管领导报告;2. 数据中心工作人员应立即赶到现场, 将被攻击的效劳器或其他 设备从网络 中隔离出来,必要时可以采取照片、截图等方式

19、留存记 录,保护现场;3. 如事态较为严重, 经向数据中心主管领导请示后, 立即向公安 部门报警, 配合公安部门展开调查;4. 数据中心相关技术人员做好被攻击或破坏后系统的恢复与重 建工作;5. 数据中心负责组织技术力量追查非法信息来源;6. 数据中心相关工作人员将实施事件处理的过程和结果备案存 档,必要时向 数据中心主管领导汇报。6.2.2. 修复处理1、记录系统状况;2、立即复制系统登录文件、历史文件、日志文件等重要文件;3、修改防火墙、路由器等网络平安设备的过滤规那么;4、断开被攻主机、关闭不需要的效劳;5、处理可疑的文件和程序;6、修改不平安的系统帐号及其口令;7、恢复被修改的软件和数

20、据;8、安装相应的补丁程序,填补平安漏洞 ;9、编写报告,详述事件过程及处理步骤。6.3. 大规模病毒含恶意软件攻击的应急处理1. 当发现局域网网络中有大量效劳器被感染上病毒后,效劳器 维护人员应立 即上报数据中心;2. 数据中心工作人员应立即将该机从网络上隔离开来;3. 数据中心工作人员对该设备的硬盘进行数据备份, 并将防病 毒软件的病 毒特征库更新至最新版本;4. 数据中心工作人员启用反病毒软件对该机进行杀毒处理, 并 对相关效劳 器进行病毒扫描和去除工作;5. 情况较为严重的,已影响到公司相关系统的数据传输、应用 系统访问不正 常等情况, 应及时向数据中心主管领导报告, 按照 3.1 信

21、息系统故障等级划分, 确定其故障等级,并启动相应的应急处理程序进行排除。6.4. 数据库系统故障的应急处理1. 数据库系统每日必须存有备份,与软件系统相对应的数据必 须有多日的备 份;并将它们保存与平安处;2. 数据库系统发生故障以后,数据中心工作人员立即向数据库 组负责人和数 据中心主管领导汇报请示,经同意后采用相关技术手 段尽快恢复数据库运行,保 证业务不中断;3. 数据中心工作人员及时组织相关数据库工程师,并同时通知 主要应用部门 等技术力量做好数据库系统切换和有关数据的恢复工 作;4. 数据库工程师应检查日志等资料,确定故障原因;5. 数据库部门会同数据中心工作人员将实施处理的过程和结

22、果 进行备案存档, 并向有关领导汇报。6.5. 设备硬件故障的应急处理1. 数据库效劳器等关键设备损坏后,数据中心相关人员应立即 向数据中心经 理报告;2. 数据中心经理立即组织相关技术人员查明原因, 联系维保单 位更换受损 部件;3. 如果设备一时不能修复,应向数据中心主管领导汇报,并告 知各应用部门 暂缓上传上报数据或及时切换应用到其它应用效劳器上,及时恢复业务系统。6.6. XX 相关故障应急处理1. 数据中心相关工作人员应分析大致故障原因,并立即向数据 中心经理报告;2. 数据中心经理立即组织协调相关人员联系 XX 相关负责人查 明原因解决 此问题;3. 如果 XX 时无法解决,应向数

23、据中心主管领导汇报,并告知 各应用部门 暂缓上传上报数据或及时切换应用到其它应用效劳器 上,及时恢复业务系统。6.7. 对重大故障的应急处理当数据中心工作人员通过网络监控到诸如广域链路意外中断、 核心路由交换机宕机。非法入侵及病毒入侵使网络传输性能下 降,应用系统网站、核心数 据库等系统关键效劳器性能下降,严重 影响正常业务运行的情况时。数据中心工 作人员应及时记录故障发 生时间、地点等。同时立即报知数据中心主管领导。在 此过程中数 据中心工作人员应检查所发生故障设备和配置近期的变更情况,查 清 故障的影响范围,从而确定故障的等级和发生故障的可能部位, 在处理过程中要 及时向主管领导通报故障的

24、处理情况。6.8. 请求外部协助支持1. 对一时不能查清原因的重大故障,应尽早联系原厂商请求技术支持。2. 对 4 小时内无法解决的一般性故障,也应联系原厂商请求技 术支持,并 要将联系外协支持的情况记录在案。第 7 章 后期处理7.1. 善后处理应急处置工作结束后,现场领导小组组织有关人员和技术专家 组成事件调查 组,对事件发生原因、性质、影响、后果、责任及应 急处置能力、恢复重建等问 题进行全面调查评估,根据应急处置中 暴露出的管理、协调和技术问题,改良和 完善预案,实施针对性演 练,总结经验教训,整改存在隐患,组织恢复正常工作 秩序。7.2. 调查和评估应急处理工作结束后, 应急响应领导小组应立即组织有关人员, 专家组, 会同技术中心成立事件调查小组,对事件发生及其处理过 程进行全面的调查,查清事件发生的原因及财产损失状况并总结经 验教训,写出调查评估报告,并将故 障处理文档整理,形成知识库 进行统一归档管理。7.3. 应急方案更新根据信息化快速开展和经济社会开展状况,配合相关法律法规 的制定、修改和完善,结合应急处置中暴露出的管理、协调和技术问题,修订和完善本预案附件:应急响应相关表单网络与信息平安事件记录表日期事件发生原因处理方法处理结果操作人员审核人员网络与信息平安事件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论