精选机房运维管理办法讲义_第1页
精选机房运维管理办法讲义_第2页
精选机房运维管理办法讲义_第3页
精选机房运维管理办法讲义_第4页
精选机房运维管理办法讲义_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(优选)机房运维管理办法ppt本文档共30页;当前第1页;编辑于星期六\14点16分内容运行维护管理的意义提高可靠性提高可用性提高安全性提高经济性运行维护管理的本质人员技能的提高(技术的掌握)制度流程的建立、执行运行维护管理的技术手段环境监控设备监控本文档共30页;当前第2页;编辑于星期六\14点16分运行维护管理的意义提高可靠性:降低故障率提高可用性:减少宕机时间提高安全性:减少灾害提高经济性:增长设备寿命本文档共30页;当前第3页;编辑于星期六\14点16分运行维护管理的本质人员技能的提高技术培训经验交流本文档共30页;当前第4页;编辑于星期六\14点16分运行维护管理的本质制度流程的建立、执行机房运维制度的建立机房运维制度的执行管理机制本文档共30页;当前第5页;编辑于星期六\14点16分机房运行管理制度一.值班制度二.巡视制度三.日常管理制度四.运行维护制度五.安全保密制度本文档共30页;当前第6页;编辑于星期六\14点16分一.值班制度机房昼夜要有人值班值班人员要遵守值班守则值班守则本文档共30页;当前第7页;编辑于星期六\14点16分二.巡视制度机房环境的巡视机房设备的巡视本文档共30页;当前第8页;编辑于星期六\14点16分1.机房环境的巡视机房门窗的关闭情况机房的卫生状况机房的灯光状况机房的空气清新度状况本文档共30页;当前第9页;编辑于星期六\14点16分2.机房设备的巡视对网络运行保障设施要经常巡视巡视供电系统、UPS、电池巡视空调的工作状况巡视新风机和空气净化器的工作状况巡视消防报警系统本文档共30页;当前第10页;编辑于星期六\14点16分三.日常管理制度经常注意保持机房的环境卫生不得将食品、饮品带入机房机房内禁止吸烟不得在机房内乱扔物品本文档共30页;当前第11页;编辑于星期六\14点16分四.运行维护制度配电柜一年进行至少2次维护检查UPS一年进行2次巡检机房专用空调每月进行一次巡检新风机每年2次维护空气净化器每季度维护一次机房消防系统每年一次检测机房防雷设施每年一次检测机房每年进行2次保洁本文档共30页;当前第12页;编辑于星期六\14点16分五.安全保密制度1.门禁管理2.防雷击、防火、防水、防盗、防虫害3.网络运行安全管理4.系统设备安全管理5.认真遵守国家的各项保密制度本文档共30页;当前第13页;编辑于星期六\14点16分1.门禁制度机房要设有门禁机房门禁7X24小时保持运行机房门禁的2个作用机房工作人员需持卡进入机房非机房工作人员进入机房需登记本文档共30页;当前第14页;编辑于星期六\14点16分2.防雷击、防火、防水、防盗、防虫害防雷击防火、防水防盗防虫害本文档共30页;当前第15页;编辑于星期六\14点16分3.网络运行安全管理防入侵防病毒涉密网本文档共30页;当前第16页;编辑于星期六\14点16分4.系统、设备安全管理进入机房不得带拷贝工具和便携机机房内所有服务器应设有开机密码、系统登录密码机房内所有服务器都应设有带密码的屏幕保护非网管人员不得私自操作任何服务器本文档共30页;当前第17页;编辑于星期六\14点16分5.认真执行国家的保密制度涉及政务、金融、高科技、网上交易定期集中销毁废弃的涉密纸、物非机房工作人员在机房工作时必须有机房值班人员陪同机房内各类服务器应由专人分类管理建立设备、资料责任制本文档共30页;当前第18页;编辑于星期六\14点16分应用举例附件《机房运行管理制度》本文档共30页;当前第19页;编辑于星期六\14点16分机房内的危机管理史蒂文•芬克(StevenFink)的《危机管理》(CrisisManagement-Planningfortheinevitable):组织对所有危机发生因素的预测、分析、化解、防范等等而采取的行动。罗伯特•希斯(RobertL.Heath)的《危机管理》(CrisisManagementforManagersandExecutives):管理者考虑如何减少危机情境的发生、如何做好危机管理的准备、如何规划以及如何培训员工应对危机局面、如何从危机中很快复原。本文档共30页;当前第20页;编辑于星期六\14点16分危机管理的PPRR模式Prevention(预防)观念、流程Preparation(准备)人力物力资源Response(响应)应急预案,消除危机的短期影响Recovery(恢复)经验总结,消除危机带来的中长期影响本文档共30页;当前第21页;编辑于星期六\14点16分应急预案事前“马后炮”“一旦发生XX事故,管理员应该在XX分钟之内采取以下措施:一、XX;二、XX;。。。”本文档共30页;当前第22页;编辑于星期六\14点16分第一步:列出危机或称风险例如,IT系统宕机、火灾、空调漏水、机房温度超高等。第二步:排除不存在的风险第三步:将各种风险列举在应急预案的风险目录第四步:横向分类与纵向分级横向分类:将目录中类似的风险进行分类,比如可将机房的风险划分为的灾难风险(如火灾)、生产中断风险(如宕机)、安全隐患风险(室温过高、接地不良)、财产风险和人力资源风险等等。纵向分级:按各类风险的大小和威胁程度排序,从而建立起风险管理的优先顺序。比如可将IT系统宕机定为I级风险,而将室温升高定为II级风险,将湿度过低定为III级风险。本文档共30页;当前第23页;编辑于星期六\14点16分第五步:设计针对这些风险的预先和应急处理措施1.对可以预见且时间和资源允许处理的风险,采取排出和缩减。2.对可以预见但可能发生概率较低的风险,可以进行风险转移。如,将火灾风险转移给保险公司,将UPS停机风险转移给UPS厂商或UPS服务商。3.对现在没有表现出来,但其爆发总存在一定征兆的风险,采取建立预警系统对其监控。4.对那些发生时间完全不可预测的风险,则必须建立起一个协调人力资源的“危机处理机构组织结构图”以及一个指导人员操作的“危机应对表”,使运维管理人员和相关部门、人员能够在危机发生时有组织地、按部就班地执行。本文档共30页;当前第24页;编辑于星期六\14点16分“危机处理机构组织结构图”的建立预先协调跨部门的资源“危机应对表”管理人员根据对各种可能出现的危机设想,设计出的应对措施。本文档共30页;当前第25页;编辑于星期六\14点16分环境监控机房电力质量监测机房温度监测机房湿度监测新风风量监测IT微环境监测机架电力质量监测机架温度监测机架湿度监测运行维护管理的技术手段—监控对象本文档共30页;当前第26页;编辑于星期六\14点16分故障预测:防止故障的发生故障报警:缩短故障恢复时间运行维护管理的技术手段

—监控目的本文档共30页;当前第27页;编辑于星期六\14点16分

故障预防28-2-101234发现隐患采取措施设备将发生故障设备发生故障的时间被推迟

本文档共30页;当前第28页;编辑于星期六\14点16分

故障恢复10234567故障发生服务商收到详细报警信息管理员收到详细报警信息服务商判断故障部件服务商携带部件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论