机房环境安全事件应急处置专项预案_第1页
机房环境安全事件应急处置专项预案_第2页
机房环境安全事件应急处置专项预案_第3页
机房环境安全事件应急处置专项预案_第4页
机房环境安全事件应急处置专项预案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机房环境安全事件专项应急预案预案编号110000-01-01-002-v1.0预案名称机房环境安全事件专项应急预案版木v1.0适用等级i、ii、iii、iv涉及部门信息屮心、机关服务中心应急处置基本原则:机房环境安全爭件应急处置基本原则是:保障关键系统运行及业务系统数据安全、采取应 急措施、及时恢复、预防为主。机房坏境主要由电力系统、制冷系统、监控系统组成,在日常 工作中,常遇到的状况主要是以上系统出现故障或发生紧急情况(例如大范围停电、设备故障 等)。为保证在出现紧急悄况时,能够及时有效等排除故障,保障系统正常运转或将业务数据 安全保存,特制定以下基本原则:1、保障关键系统运行及业务系统数据

2、安全机房环境在出现市电故障的情况下,应保证线路能及时切换到备用电路,并自动报警给机 房管理人员、安全管理人员及相关主管领导,确保业务不被中断,如杲主备用电路均出现故障, 确保能自动川用备用电源,备用电源(ups)的供电时间不少于市电一般恢复时间的两倍,在 备用电源无法满足全部业务供电需求时,根据情况停用菲关键系统,保障关键系统运行。具体 措施见减压降温方案。机房环境在出现制冷系统故障的情况下,应保证制冷系统的冗余设备止常运转,并自动将 故障情况自动报警给机房管理人员、安全管理人员,确保业务系统不受故障影响。如果机房内 制冷系统的兀余设备无法保证机房内温湿度在止常范闌(22-24度)内,自动通过

3、环境监控系 统报警给机房管理人员、安全管理人员及相关主管领导,提示机房环境处于非止常状态。机房 管理人员及时采取应急措施。2、采取应急措施机房环境在出现市电故障的情况下,将不间断电源最短供电时间(机房内有多台不间断电 源,以供电最短时间为依据)和故障恢复时间上报主管领导,提供决策依据。同时,为延t不 间断电源供电时间,能够及时将重要数拥进行备份,平稳关闭业务系统,应采取减压降温处理 措施,按主机设备重要性优先级由低到高的顺序,依次进行关闭。具体措施见减压降温方案机房环境在出现制冷系统故障的情况下,冗余设备无法保证温湿度在止常范i羽内吋,应采 取减压降温处理措施,按主机设备重要性优先级由低到高的

4、顺序,依次进行关闭,同时,确保 机房通风,采用辅助降温措施,如电风扇等,对机房进行降温。具体措施见减压降温方案。3、及时恢复在出现山电故障的情况卜,及时与供电部门联系,随时了解供电恢复的预期时间,并要求 电力部门提供必要的临时供电支持。在出现制冷系统故障的悄况下,兀余设备无法保证温湿度在正常范围内时,应关闭菲关键 系统,确保通风,并采取辅助措施和设备对机房进行降温,并要求空调维修厂商或和关部门及 时通报故障修复预期时间。4、预防为主应要求供电单-位和ups电源供应商等定期进行主备电力线路和ups设备检杳,及时发现 线路故障或备用电源故障隐患,要求空调维护厂商每月对制冷系统进行巡检,及时排除故障

5、隐 患,确保紧急联系部门和人员信息真实可用;保证机房内有辅助降温设备储备;适时进行电力 故障应急演练。事件类型及危害程度分析:机房环境安全爭件属于综合类安全爭件,涉及ups可用性以及机房温度等指标,该类爭 件造成的危害主要有以卜儿方而:ups可用性:1、当市电供应故障时间较短,需要切换到备份电路或ups ibj,可能造成电压不稳,将影 响部分设备性能,甚至可能造成部分设备故障;2、当市电供应故障时间较长,超过ups可供电时间和范围时,将造成大血积断网,导致 业务屮断,造成更人影响和损失。机房温度过髙:1、由于电力或其他因素导致机房空调不町用后,由于设备持续散热导致机房温度持续升 高,战后可能导

6、致机柜温度过高和设备异常宕机。事件级别判定从影响时间和范围而吕: 业务吋间预计或实际恢复时间低于1小时超过30分钟、非业务吋间低于24小时 超过8小时的,并h仅对市局业务造成影响的,属于iv级事件; 业务吋间预计或实际恢复时间低于4小时超过1小吋、非业务时间低于48小吋 超过24小时的,且仅对市局业务造成影响的;或者业务时间预计或实际恢复时 间低于1小时超过30分钟、非业务时间低于24小时超过8小时的,且对市局 及下属区县局业务造成影响的,iii级事件; 业务时间预计或实际恢复时间低于8小时超过4小时、非业务时间低于72小时 超过48小时的,且仅对市局业务造成影响的;或者业务时间预计或实际恢复

7、时 间低于4小时超过1小时、非业务时间低于48小时超过24小时的,且对市局 及下屈区县局业务造成影响的,屈丁7i级事件。 业务时间预计或实际恢复时间超过8小时、非业务时间超过72小时的,且对市 局业务造成影响的;或者业务时间预计或实际恢复时间超过4小时、非业务时间 超过48小时的,冃対市局及下屈区县局税收业务造成影响的,屈丁丨级事件。 从影响重要系统严重程度而言: 故障造成部分业务的服务性能受到短暂影响,且影响范围在北京市局范闌内,属 于iv级事件; 故障造成部分菲实时业务屮断,影响范围在市局及部分区县局,属于iii级事件; 故障造成部分实时业务屮断,影响范围在市局及部分区县局,屈tii级事件

8、。 故障造成大面积业务中断,影响全市税收业务正常秩序,属于i级事件。预防与预警采用双路供屯、ups,部署机房环境安全监控系统,部署机房辅助降温设施;识别关键系统,备份关键数据,确定系统关开机顺序和方法,制定减压降温方案,并机房断电和空调停tll应急开始询问电力未恢复i核心数据库备份,紧急关机上报审批单,关闭非关键系i 统,布置机房降温辅助设施.电力未恢复i3z 关闭网络设备、存储设备赳力恢复相关人员到场联系机关服务中心 銅问故障原因及恢复时间;i 答复/告知保持联络,直到供电恢复后为止向领导汇报悄况iilce1j十丄vj伏是;*成功不成功r联系厂商处理力恢复时间及机房温度决定v 是否启动机房减

9、压降温措施是.向领导汇报故障排除过程y应急结朿预案流程说明(此流程主要用于市电故障)1、由于市屯故障,导致机房断电和空调停机,应急处置开始并通知相关人员到现场;2、联系机关服务中心询问停电原因,并在后续的应急处理过程中保持与服务中心的联系, 获取最新信息;3、向领导汇报机房断电、空调停机以及服务中心反馈信息;4、自动切换到ups供电,如果出现部分ups不能切换的情况,手工切换到ups供电, 并联系ups厂商排除不能自动切换或部分无法正常运行ups的故障;5、根据ups支持时间、预计电力恢复时问及机房温度决定是否启动机房减压降温措施, 如果由于空调停机导致机房温度快速上升、且无法预计电力恢复时间

10、时,由领导决策,及时执 行减压降温方案;如果和服务中心确认电力能在机房温度没有快速上升前(经验值为10 分钟)恢复供应,可不进行后续应急处置;6、上交机房减压降温处置审批单,情况紧急吋,可先口头汇报确认(事后补文档), 确认可执行后,关闭菲关键系统,开启通风口,布置并开启机房降温辅助设施(如电风扇), 若在此过程中电力恢复,按照原关机顺序进行开机操作;7、在电力未恢复、供电局还处在事件调杳阶段且ups支持时间不足情况下,需要提前对 核心数据进行备份并进行紧急关机处置操作,最后关闭小型机、相关存储设备和网络设备,若 在此过程中电力恢复,按照原关机顺序进行开机操作;&在等待供电恢复期间,需

11、要协调相关厂商工程师到场,做好供电恢复后开机准备工作;9、供电恢复后,执行开机流程,确保全部主机、网络设备顺利开启后,结束应急响应, 向领导汇报处置过程,形成事故分析报告并归档。应急处置过程需要的时间1、机房断电和自动切换ups供电设备需要的时间忽略不计;2、机房值班人员和女全责任人员接到报警,紧急到达现场需要3分钟;3、与服务中心联系,询问停电原因并向领导汇报需要5分钟;4、发现ups无法完成自动切换后,手工切换需要花费1分钟;5、关闭非关键系统,开启通风口,布置机房降温设施需要10分钟;6、进行核心数据备份和紧急关机操作需要34分钟;7、关闭网络设备、存储设备需要40分钟;8、协调厂商工程

12、师到场需要40分钟;9、全部应用系统和设备开机需要至少2小时。整个应急处置时间预计至少需要4小时。应急处置结果1、在市电供应恢复前,ups支持时间范圉内,确保机房温度保持在合理范闌内,保证在 ups电力耗尽前备份核心数据并安全关闭所有系统。2、执行紧急停开机顺序,确保全部应用系统和设备安全有序地关闭和开启。演练要求1、熟悉服务中心的联系方式;2、熟悉ups状态检查,能预估ups支撑时间;3、熟悉空调状态检查,以及机房降温辅助措施方法;4、制定机房减压降温方案,确定合理停开机顺序,熟悉核心数据库备份方法;5、演练结束形成演练总结报告。应急物资储备清单1、电风扇等降温辅助设施;2、协调相关厂商工程

13、师和总部技术支持。相关文档:减压降温方案机眉减压降温处置审批单 备注:无编制人审批人分发范围内部机房减压降温处置审批单申请日期申请部门联系人联系电话处置类型关闭开发测试环境紧急手动关闭服务器保留最小环境全部关闭处 置 内 容(说明需求背景、具体操作,以及希望达到的目的)拟订 计 划(进行处置的时间段、处置人,及需要进行处置的设备列表)主管审批意见备注减压降温方案本方案适用于市电中断及机房内空调出现故障时,机房内温度升高 或不间断电源转入后备电池供电状态,为保证机房内设备可在预计时间 内止常关闭,并完成必要的数据备份,特制定此方案。我局不间断电源共有4台,总容量360k,市电屮断后,后备电池最 短可支持55分钟。空调8台,南北机房各四台。为核心设备延长供电 时间,保证关键业务可在预计时间内运转正常,进行必要的数据备份后 正常关闭,特采取降温措施,按照主机设备重要性优先级由低到高的顺 序,依次关闭设备,减小电力负载,并将机房温度保持在合理范围内。减压降温方案分为三个步骤,当故障发生后,向领导提交机房减 压降温处置审批单,按照关闭开发测试设备清单关闭设备,并将 预先准备的风扇放置在指尢位置为核心设备降温(使用不间断电源为风 扇供电)。当得知故障无法在不间断电源可支持最短时限内修复时,立即向领 导汇报,启动第二个步骤,按照紧急关闭设备清单关闭相关设备。 进行紧急关闭设备操作时,采用直

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论