IDC中心机房预防措施及应急预案_第1页
IDC中心机房预防措施及应急预案_第2页
IDC中心机房预防措施及应急预案_第3页
IDC中心机房预防措施及应急预案_第4页
IDC中心机房预防措施及应急预案_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、IDC机房维保预防举措及应急预案IDC数据中央机房的平安无疑是整个计算机信息系统平安的前提,如果数据 中央机房存在这样那样的不平安因素,从而导致发生数据中央机房事故,那么整个 信息系统的平安也就不可能实现.随着网络信息化建设的不断深入,增强机房各类设备、系统以及信息与网络 平安等方面应对突发事件的处理水平将是我们目前面临的一项重要任务.为保证系统及机房平安与稳定,以保证正常运行为宗旨,根据“预防为主,积极处置 的原那么,本着建立一个有效处置突发事件,建立统一指挥、责任明确运转有序、 反响迅速处置有力的机房平安体系的目标, 将正在发生或已发生事故的损害程度 减轻到最低.1、维保预防举措1、建立健

2、全机房维保技术人员治理制度1.1 在正常工作日内,信息技术人员负责对机房进行监控,主要责任是: 巡视网络设备及系统的运行情况,发生异常情况及时处理,消除故障隐患.1.2 周末、节假日及重大会议期间技术人员轮流值班,负责处理有关异常 情况.2、应提升对机房可靠性、可用性、平安性等方面的熟悉,既要重视信息系 统平安,又要重视机房的运行维护治理, 重视对计算机硬件、软件及网络设备的 维护.要树立大局意识和忧患意识,对机房设施平安的重要性给予足够的重视.3、应重点增强治理制度的执行.治理制度包括预防维护流程和紧急情况处理预 案两个方面.要制定相应的治理制度,包括机房治理岗位制度、机房操作规程等, 以明

3、确岗位责任.为应对机房中可能会发生的紧急情况,如火灾、断电、数据丢 失、设备失灵等,应按各种紧急情况分列处置举措,还要对预案进行演练.4、应不断提升机房治理人员的技术水平. 机房设施非常复杂,涉及很多专业和 系统,维护人员只有通过不断的总结以往出现的各种问题进行后续学习和培训, 提升技术水平,才能防止更多的相同的问题及异常情况甚至事故的发生.5.应增强供配电、照明等电源子系统的监测.同时应重点对温度、湿度、灰尘、有害气体等进行评估和监测.还要增强静电防护、干扰源分析及保护、雷击防护、 电磁干扰、振动限制,防火、防水等工作.S应增强对进入机房人员的治理.工作人员行为、素质等因素均可能对机房 平安

4、造成影响,因此,除治理制度约束外,门禁和视频监视等物理平安策略均可 有效提升机房平安水平.7、应定期对机房设施进行平安评估.最好每年聘请第三方机构进行安 全评估,专业评估机构拥有专家力量,能够比拟平安地对所有的设备进行操作, 不会由于误操作引起机房故障.8、机房内严格采取防雷、防火、防尘、防静电等举措以及机房 24小时 监控等举措.9、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服 务器运行和备份情况.10、对机房的主要网络设备(路由器、主干交换机等)进行工作时间内 全程监控,发现异常情况应及时进行处理,保证整个网络的正常运行.2、应急处置举措2.1 机房漏水应急预案(1)发生机房

5、漏水时,第一目击者应立即通知运维效劳小组,并及时报告 监控系统突发故障应急领导小组.(2)假设空调系统出现渗漏水,运维效劳小组负责人应立即安排停用故障空 调,去除机房积水,并及时联系设备供给方处理,同时启动备用空调,必要情况 下可临时用备用空调对效劳器进行降温.(3)假设为墙体或机房门渗漏水,运维效劳小组负责人应立即采取有效举措 保证机房平安,及时去除积水,维修墙体或门窗,消除渗漏水隐患.2.2 设备发生被盗或人为损害事件应急预案(1)发生设备被盗或人为损害设备情况时,使用者或治理者应立即报告系 统突发故障应急领导小组,同时保护好现场.(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相

6、关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况, 做好必要的影像记 录和文字记录.(3)事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报.(4)系统突发故障应急领导小组安排运维效劳小组、事发单位及时恢复系 统正常运行,并对事件进行调查.运维效劳小组和事发单位应在调查结束后一日 内书面报告系统突发故障应急领导小组.事态或后果严重的,应向相关领导汇报.2.3 机房长时间停电应急预案(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生以下 突发事件时,根据以下方案进行处置:(2)当机房发生市电供电忽然停电或是电源异常时.首先应和后勤部门

7、 联系确认正常停电以及预计停电时间. 检查不间断电源的电池可供电时间, 保证 设备正常运行,如遇到忽然断电,应及时将空调等不在 UPSfe源供电范围内的设 备及时断电,预防忽然来电时瞬间电流过大导致设备损坏等现象.(3)当确定停电时间超出机房 UPS承载范围后,首先确定停电的范围以 及受影响的设备范围.并及时通知各部门做好停电应急准备. 然后通知机房电源 维护人和设备的负责人到达现场, 做好各设备的电源停电准备.在UPSK电电量 仅剩10%:后,严格按操作手册停掉各效劳器的电源,最后停核心交换机和路由 器,等待电力恢复.(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并 及时联

8、系相关维护人员到达现场检修.对于恢复时间无法预计的,要通知后勤部 门做好柴油机发电及移动电源车供电准备(5)恢复供电后,严格根据操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏.2.4 通信网络故障应急预案(1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员 应及时通知本单位信息系统治理员,经初步判断后及时上报运维效劳小组和系统突发故障应急领导小组.(2)运维效劳小组接报告后,应及时查清通信网络故障位置,隔离故障区 域,并将事态及时报告系统突发故障应急领导小组, 通知相关通信网络运营商查 清原因;同时及时组织相关技术人员检测故障区域,逐步恢复故障区与效劳器的

9、网络联接,恢复通信网络,保证正常运转.(3)事态或后果严重的,应向应急指挥办公室和相关领导汇报.(4)应急处置结束后,运维效劳小组应将故障分析报告, 在调查结束后一 日内书面报告系统突发故障应急领导小组.2.5 网络病毒事件应急预案(1)发现不良信息或网络病毒时,信息系统治理员应立即断开网线,终止 不良信息或网络病毒传播,并报告指挥调度中央运维效劳小组和系统突发故障应 急领导小组.(2)运维效劳小组应根据系统突发故障应急领导小组指令,采取隔离网络 等举措,及时杀毒或消除不良信息,并追查不良信息来源.(3)事态或后果严重的,应向监控中央办公室和相关领导汇报.(4)处置结束后,运维效劳小组应将事发

10、经过、造成影响、处置结果在调 查工作结束后一日内书面报告系统突发故障应急领导小组.2.6 效劳器软件系统故障应急预案(1)发生效劳器软件系统故障后,运维效劳小组负责人应立即组织启动备 份效劳器系统,由备份效劳器接管业务应用,并及时报告系统突发故障应急领导 小组;同时安排相关责任人将故障效劳器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据.(2)运维效劳小组应根据系统突发故障应急领导小组的指令,在确认平安 的情况下,重新启动故障效劳器系统;重启系统成功,那么检查数据丧失情况,利 用备份数据恢复;假设重启失败,立即联系相关厂商和上级单位,请求技术支援, 作好技术处理.(3)事态或后

11、果严重的,应向监控中央应急指挥办公室和相关领导汇报.(4)处置结束后,运维效劳小组应将事发经过、处置结果等在调查工作结束 后一日内报告系统突发故障应急领导小组.2.7 黑客攻击事件应急预案(1)当发现网络被非法入侵、网页内容被篡改,应用效劳器上的数据被非 法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者 或治理者应断开网络,并立即报告系统突发故障应急领导小组.(2)接报告后,系统突发故障应急领导小组应立即指令运维效劳小组核实 情况,关闭效劳器或系统,修改防火墙和路由器的过滤规那么, 封锁或删除被攻破 的登陆帐号,阻断可疑用户进入网络的通道.(3)运维效劳小组应及时清理系统

12、,恢复数据、程序,恢复系统和网络正 常;情况严重的,应向监控中央应急指挥办公室和相关领导汇报,并请求支援.(4)处置结束后,运维效劳小组应将事发经过、处置结果等在调查工作结 束后一日内报告系统突发故障应急领导小组.2.8 核心设备硬件故障应急预案(1)发生核心设备硬件故障后,运维效劳小组应及时报告系统突发故障应 急领导小组,并组织查找、确定故障设备及故障原因,进行先期处置.(2)假设故障设备在短时间内无法修复运维效劳小组应启动备份设备,保持 系统正常运行;将故障设备脱离网络,进行故障排除工作.(3)运维效劳小组故障排除后,在网络空闲时期,替换备用设备;假设故障 仍然存在,立即联系相关厂商,认真

13、填写设备故障报告单备查.(4)事态或后果严重的,应向监控中央应急指挥办公室和相关领导汇报.2.9 业务数据损坏应急预案(1)发生业务数据损坏 时,运维效劳小组应及时报告系统突发故障应急领 导小组,检查、备份业务系统当前数据.(2)运维效劳小组负责调用备份效劳器备份数据,假设备份数据损坏,那么调 用磁带机中历史备份数据,假设磁带机数据仍不可用,那么调用异地备份数据.(3)业务数据损坏事件超过2小时后,运维效劳小组应及时报告系统突发 故障应急领导小组,及时通知业务部门以手工方式开展业务.(4)运维效劳小组应待业务数据系统恢复后,检查历史数据和当前数据的 差异,由相关系统业务员补录数据;重新备份数据

14、,并在工作结束后一日内报告 系统突发故障应急领导小组.2.10 雷击事故应急预案(1)遇雷暴天气或接上级部门雷暴气象预警,运维效劳小组应及时报告系 统突发故障应急领导小组,经请示同意后关闭局部效劳器,切断电源,暂停内部 计算机局部网络工作.(2)雷暴天气结束后,运维效劳小组报经系统突发故障应急领导小组同意, 及时开通效劳器,恢复内部计算机网络工作,对设备和数据进行检查.(3)因雷击造成损失的,运维效劳小组应会同相关部门进行核实、报损, 并在调查工作结束后一日内书面报告系统突发故障应急领导小组.必要时,应向监控中央应急指挥办公室和相关领导汇报.2.11 空调设备故障应急预案假设机房专用空调损坏,应第一时间启用机房备用空调,并通知厂家上门进行 维修,并及时报告相关领导请示,获得授权后按机房设备关闭顺序关闭各类设备.2.12 火灾事故应急预案(1) 一旦机房发生火灾,应遵照以下原那么:首先保证人员平安;其次保护 关键设备、数据平安;三是保护一般设备平安;(2)人员疏散的程序是:机房工作人员立即按响火警警报,并通过 119电 话向公安消防请求支援

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论