机房应急处置方案_第1页
机房应急处置方案_第2页
机房应急处置方案_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机房应急处置方案 第一节总 则1、保证人员和财产的安全为前提的原则:在由于火灾或电力 问题造成的主机故障,在解决故障前,应以保证人员的生命安全和 财产的安全为前提,然后进行故障的解决。2、最快时间恢复业务的原则:本着先想尽一切方法,尽快恢 复业务的原则来处理故障,如在有备用设备的状况下,主设备产 生了故障,应先尽快将应用切换到备用机上,使业务能够运行, 再对故障设备进行诊断和修理。3、故障应急人员高度负责的原则:当故障应急人员在节假日 接到故障通知时,本着高度负责的态度,应迅速接手处理障碍, 如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处 理,处理故障的同时应及时向领导汇报。应急人员

2、不可互相推卸 责任,如因特别状况,确实无法处理障碍,部门领导必须安排好 其他人员处理。 4、尽可能全面的保留故障现场的原则:当故障发生后,应急 人员应尽可能全面的备份出能够反映故障现象的各种日志、 记录、 受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障 的再次发生。 应急方案的目标:保证预付卡运营系统连续安全稳定地运行。第二节应急领导小组应急领导小组成员:组 长:副组长:成 员: :第三节电源系统故障 故障应急处理定期检查信息中心机房电源设备的运行状况,当发生以下 突发事件时,按以下方案进行处置: 当中心机房发生市电供电突然停电或远程报警电源异常 时。首先确认是否为正常停电及估计停电

3、时间。检查不间断电 源的电池可供电时间,需在不间断电源供电时效内关闭所有服 务器及网络设备。 联系工程部查看停电原因,尽快恢复供电,并将状况报告 相关领导.工程部联系 :第四节空调系统故障应急处理定期对空调的运行状况进行检查,如有报警信息,应及时查 找故障原因,关于不能自行排除的问题,应及时与设备提供商进 行联系。 当中心机房主空调因故障无法治冷,致使机房内环境温度超 过摄氏 40 度时,打开机房房门,并关闭所有服务器及网络设备。 关于无法自行处置的空调系统异常状况, 及时与设备提供商联系, 并报告公司领导。空调问题联系人:第五节中心机房自动消防系统应急处理当中心机房发生火警时,按以下方案进行

4、处置: 1.上班工作时间发生火警, 听到自动消防系统发出的声光报警 后,中心机房四周办公室人员应及时紧急撤离,避免气体自动消防 系统启动后,消防气体对四周人员造成人身伤害。确认火警后,立 刻拨打 119 报警,并说明尽量使用气体灭火器进行灭火,减少电子 设备的损坏。 2.发生火警后,信息中心相关人员应马上赶赴现场,并向有关 领导报告事故状况。同时马上联系联通等相关公司,及时评估事故 损失状况,研讨尽快恢复信息系统正常运行的最正确方案。安保消防中控 :第六节设备、网络系统故障应急处理设备、网络应用系统故障应由发现人通知技术部,技术部门立 即检查故障,进行初步故障定位,解决; 1网络设备、服务器、

5、储存设备均有备份,当设备存在硬件问 题时,可随时把业务切换到备份主机上,保证业务正常运行; 2应用系统每更新一次则做一次远程备份,在远程主机上分别 备份旧的应用系统和更新后的应用系统,以当天的更新日期命名; 3对磁盘柜上的数据库文件有定时任务,天天凌晨 4:00 会把 数据库里的数据文件倒出到远程备份主机上, 以保证磁盘柜出现硬 件故障的时候,数据文件不丢失;关于网络、应用系统出现硬件方 面的故障,比较严重的问题,对业务的正常运行造成较大的影响, 马上向有关领导报告。 4、网络中有监控服务器,运用 Cacti v10 最新的版本,监控网 络所有设备路由器,防火墙,交换机以及服务器设备;对设备

6、本身的硬件检测、外部入侵检测、外部攻击等多种对系统不利因素 以发送 mail 的形式报警; 相关人员收到报警信息, 分析收到的 log 日志以做出相应的处理。 5、每周周五对网络设备进行日志及配置文件采集,对数据库数 据文件定期下载, 和远程备份; 在本地电脑上保存最近的配置文件, 以便在发生毁灭性的灾难时,用来重组。 对简单故障,运维人员应迅速排除故障,解决问题并记录。如 果需要改换设备,应上报有关领导,经批准后马上改换故障设备, 尽快恢复网络、应用系统运行。运维部门判断无法及时修理时,应 马上通知相关的系统运行服务提供商, 在最短的时间内安排修理或 改换系统。 如发现属外部线路的问题,应与

7、线路服务提供商联系,敦促对 方尽快恢复故障线路。 启用备份线路、设备、系统,迅速恢复相关的应用。技术支持联系 :第七节黑客入侵的应急处理发现网络上有黑客攻击行为, 任何人员都有义务向技术部门报告。 技术部马上启动应急响应,切断受攻击计算机与网络的连接,停止一 切操作、保护现场,并上报有关领导。 关于黑客攻击, 由计算中心组织应急响应专家小组查找入侵踪迹, 分析入侵方式和原因。由安全管理员依据对入侵事件的分析,组织相 关人员对内部网计算机整改, 防止黑客用同样的手段再次入侵其他系 统。安全管理员检查确定无安全隐患后,才可将受攻击计算机重新连 接网络,或启用备份计算机来恢复应用。 安全管理员应做好

8、记录,保护现场,进行日志收集等工作。如果 能追查到攻击者的相关信息,可以对其发出警告,必要时可以采用进 一步的行动, 乃至采用法律手段。 依据破坏程度, 经有关领导同意后, 上报公安部门。 假设系统已被黑客破坏,无法恢复,应将受黑客攻击的计算机上的 重要数据备份到其他存储介质,保证计算机内重要的数据不丢失。如果数据无法恢复,经有关领导同意后,可与国家指定的部门联系,由他们来协助恢复,为保证数据信息安全,需在安全管理部门作记录。 生产系统、 第八节 生产系统、数据库故障处理生产系统出现故障,技术部做出应急处理 1.因软件制定缺陷、制定漏洞等引起的故障,通知公司研发部门 在 2 小时内查明原因,解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论