机房类运维服务方案范例_第1页
机房类运维服务方案范例_第2页
机房类运维服务方案范例_第3页
机房类运维服务方案范例_第4页
机房类运维服务方案范例_第5页
已阅读5页,还剩276页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机房类运维服务方案范例机房类运维服务方案范例机房类运维服务方案范例十四、服务方案一、机房及设备维护方案与计划1、预防性检查1.1巡检时间每个工作日上午9点1.2、巡检地点计算机机房、精密空调、UPS1.3、巡检目的进行机房检查,对机房设备及供电系统、UPS系统、精密空调系统、录像系统等设备进行检查,及时发现设备隐患,排除故障。、巡检要求1.4.UPS及配电系统异常等,应按应急预案及操作流程进行处理。UPS工作情况、指示状态。检查UPS蓄电池使用状态,确保蓄电池无松动。并使用温度枪进行检测物理温度。确保配电柜及、蓄电池无温度过高现象。机房环境:检查机房卫生状况及物理环境。℃,湿度≤60%.机房空调:空调运行状态、空调内部有无漏水现象、空调噪音、空调风量等。机房照明:机房照明系统是否正常,有无异常状况。PDU:PDUUPS机房整体:检查机房其余设备运行状态,有无报警及指示灯异常状态。1.4.2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。1.4.3.故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。、计算机机房现场管理要求作,避免其他人员未经授权擅自接触机房物理设备。机房的机柜、线缆、设备等的标签管理;机房环境清理。每日检查内容列表项目 性能检查内容 脆弱性检查内容空调系统

高压压力、低压压力(风冷系统,冷冻水压力、温度,冷却水压力、温度(水冷系统水系统、灰尘情况等。

机房热点情况、室内机漏水检查、室外风机运转情况、加湿输入输出功率,输入输出电流、断路供配电系统 关、接地电阻、零序电流、器件发热况等。

导线、器件发热情况,断路开关、防浪涌器件情况等。UPS系统

负载功率情况、器件发热情况、电池情况(外观、液位、接线柱)等。录像备份管理、出入机房登记、器件灵

器件、导线发热情况,电池放电时间等。安全系统 敏度、画面清晰度(不同照度情况下、 器件灵敏度、监控死角问题等云台运行等。设备运行

查看设备运行指示灯、机房照明运行情

设备运行是否有报警情况、照明是否正常、机房卫生是否整机房环境 况、机房环境洁等2、现场故障维修每日巡检过程中,如有发现设备及环境系统有故障状态,需进行记录并恢复故障状态。如不能立即恢复故障状态,则需进行应急预案处理。具体如下:环境故障:卫生、温湿度、照明(四级故障)交换机故障:交换机蜂鸣,交换机启动不正常,指示灯异常(三级故障)空调故障:空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故障等(二级故障UPS故障:UPSUPSUPSUPSUPS蜂鸣报警等(一级故障)配电柜故障:配电柜内温度过高、配电柜打火现象等(一级故障)在解决故障时,最大限度做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于30分钟内解决故障,应立即提出应急方案,确保业务系统的运行。故障解决后24应标准列表:故障级别 响应时

故障解决时间IUPS系统崩溃导致业务停止、空调系统崩溃导致业务停止。II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。

分钟内人分钟内恢故障处理方案。分钟内抵处理方案

12内24内报错或警告,但业务系统能继续运行且性能不受影响。安装或配置咨询。

分钟内抵处理方案分钟内障处理方案

48内天内3、后台故障维修后台故障状态维修,需要在甲方允许的情况下,对设备进行维护及维修。及维修。如需联系厂商,则由我方负责。零配件部件等,并将维修记录保存文档交由甲方及我方双方管理。质保期外的设备出现故障,则由我方统一进行维修,费用由我方负责。并将维修记录报由甲方确认并存档。设备更换对于无法修复的设备,在合同有效期内,经甲方审核,由乙方负责整体更换同型号或类似型号的产品,无法维修的设备交由甲方。更换单个备品备件费用大于等于500,;500,备品备件费用由乙方承担,质保期内由供货商(厂商)进行更换的除外。4、资产管理对硬件设备型号、数量、版本等信息统计记录对软件产品型号、版本和补丁等信息统计记录对机房设施设备连接统计记录对综合布线系统结构图的绘制对机房更换设备连接统计记录每月向甲方上报低值易耗品记录,包括仓库存储情况、耗材使用情况。机房更新及更换设备的统计机房维护设备及备品备件的管理及记录5、应急处理随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。本预案共分为应用系统故障应急流程和机房突发事件应急流程系统故障应急流程一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:、运维服务中心通过网管告警发现故障、维护站点通过维护巡检发现故障、用户发现故障,报给呼叫中心、驻场工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。3、信息研判障应急处理预案。4、预案启动件进行全面管控处理。5、资源确认关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:我公司技术支持人员;我公司聘请的技术专家6、预案执行按既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。7、预案终止急领导小组决定。8、结果上报统突发故障应急领导小组。二、系统故障应急处理流程图机房突发事件应急流程一、机房突发事件分类1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。3二、应急处理人员组织机构三、应急机构人员岗位职责1、应急总指挥职责、保证在任何时间,及时协调应急行动所有涉及的岗位人员;、提供必须的紧急响应设备;、在紧急情况下全面负责紧急行动;、110120等。2、应急副总指挥职责、在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;、根据获得的应急信息下达命令。3、各相关设备负责人职责、负责尽快收集信息向应急总指挥汇报事故情况;、负责现场临时设备抢救和对事态的控制;四、突发事件处理原则预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系。最大程度地减少危害和影响。职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。以人为本。把保障人员以及公共利益的安全作为首要任务。网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。五、机房应急开关机具体措施六、机房日常维护1、建立健全机房管理制度生异常情况及时处理,消除网络故障隐患。节假日期间技术人员轮流值班,负责处理有关异常情况。机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域。2、机房内严格采取防雷、防火、防尘、防静电等措施以及机房24小时监控等措施。3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。4、对机房的主要网络设备(路由器、主干交换机等)确保整个网络的正常运行。七、服务器及存储设备故障处理1、排错流程2、应急处置具体措施机房漏水应急预案发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告监控系统突发故障应急领导小组。应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温。体或门窗,消除渗漏水隐患。设备发生被盗或人为损害事件应急预案现场。或盘查人为损害情况,做好必要的影像记录和文字记录。事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报。服务小组和事发单位应在调查结束后一日内书面报告系统突发故障应急领导小组。事态或后果严重的,应向相关领导汇报。机房长时间停电应急预案定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按以下方案进行处置:检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。当确定停电时间超出机房UPS门做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。对于恢复时间无法预计的,要通知后勤部门做好柴油机发电及移动电源车供电准备恢复供电后,严格按操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。通信网络故障应急预案初步判断后及时上报运维服务小组和系统突发故障应急领导小组。务器的网络联接,恢复通信网络,保证正常运转。事态或后果严重的,应向应急指挥办公室和相关领导汇报。组。不良信息和网络病毒事件应急预案调度中心运维服务小组和系统突发故障应急领导小组。追查不良信息来源。事态或后果严重的,应向监控中心办公室和相关领导汇报。处置结束后故障应急领导小组。服务器软件系统故障应急预案应用,并及时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。处置结束后,小组。黑客攻击事件应急预案系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组。和路由器的过滤规则,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。挥办公室和相关领导汇报,并请求支援。处置结束后小组。核心设备硬件故障应急预案备及故障原因,进行先期处置。进行故障排除工作。写设备故障报告单备查。事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。业务数据损坏应急预案据。据仍不可用,则调用异地备份数据。业务数据损坏事件超过2以手工方式开展业务。新备份数据,并在工作结束后一日内报告系统突发故障应急领导小组。雷击事故应急预案意后关闭部分服务器,切断电源,暂停内部计算机部分网络工作。网络工作,对设备和数据进行检查。系统突发故障应急领导小组。必要时,应向监控中心应急指挥办公室和相关领导汇报。空调设备故障应急预案示,获得授权后按机房设备关闭顺序关闭各类设备。火灾事故应急预案备安全;119防毒面具,所有不参与灭火的人员按预先确定的线路,迅速从机房中撤出;指定位置取出泡沫灭火器进行灭火。电源设备故障应急预案机房目前使用UPS系统,在紧急情况发生时,应按如下步骤进行关机:确认所有负载均已安全关机。关闭UPS负载电源。将UPS的系统启用开关切换到off的状态。将电池连接断路器切换到off的位置。6、保密管理要求一、机房管理1、路由器、交换机和服务器以及通信设备是网络的关键设备,须放置计算机机房内,不得自行配置或更换,更不能挪作它用。2、计算机房要保持清洁、卫生,并由专人7×24负责管理和维护(包括温度、湿度、电力系统、网络设备等),无关人员未经管理人员批准严禁进入机房。3、严禁易燃易爆和强磁物品及其它与机房工作无关的物品进入机房。4、建立机房登记制度,对本地局域网络、广域网的运行,建立档案。未发生故障或故障隐患时当班人员不可对中继、光纤、网线及各种设备进行任何调试,对所发生的故障、处理过程和结果等做好详细登记。5、做好操作系统的补丁修正工作。6、网管人员统一管理计算机及其相关设备,完整保存计算机及其相关设备的驱动程序、保修卡及重要随机文件。7二、机房安全保密制度变更营业软件。机房所有人员未经允许不得访问信息系统中用户信息、公文、报表、邮件等属于授权访问数据信息或私人信息。机房所有人员未经授权,不得私自修改、查阅系统的有关信息。权限密码。也不得擅自带离机房,使用后归还原处。IP轻易获取。机房内重要保密文件、数据的销毁,应使用碎纸机进行销毁,不得任意丢弃。机房内部的废弃设备、测试数据由仓管部门统一保存和处理。机房所有人员严格遵守通信纪律,增强保密意识和法制观念,不得随意监测用户通信。机房内部所有维护和管理人员,均应熟悉并严格执行安全保密规定。7、人员管理要求在招标人进行备案。对维保人员的管理员应按甲方的要求和标准来进行执行。人员具体职责如下:一、硬件维护人员岗位职责:及时高效地完成分配的硬件维修等各项任务,保证硬件的正常工作。基本原则和维修方法进行。对键盘、鼠标等易损件进行常规检查;对硬件系统进行外观和静态检查;对微机系统进行全面的动态检查,发现问题及时解决。寒假、暑假或长期不用期间,要定时对其进行开机上电操作,以使机器内部保持干燥。寒假、暑假或长期不用期间,要使用塑料袋将主机、显示器及网线接头等严密包裹起来,避免受潮。给予排除。当硬件发生故障时,及时排除故障,尽快恢复系统的运行。定期进行硬件的例行维护,建立每台机器的维护档案。每次维修必须进行登记,包括更换的设备和配件。二、软件维护人员岗位职责:及时高效完成软件维护等各项任务,保证计算机系统的正常运行。器。机器运行当中,软件维护人员应时刻观察有无异常情况,及时发现及时处理。软件维护人员应备有各种工具软件、常用应用软件、操作系统软件和程序语言软件并留存实验中心一份。防病毒入手,对外来的软件或文件应事先查杀再使用。断绝病毒传播途径。积极协调硬件维护人员排除硬件故障。要。平时要做好系统保护与数据备份工作,系统出现问题后能够快速恢复。认真参与业务学习,不断提高自身的软件维护水平。作好软件的安全保密工作。8、定期检查方案与计划定期维修定期维修是按时间计算,应对机房和机房设备作定期检修。维修应包括以下内容:1)对机房内部和周围环境作一次彻底性的清理,把卫生搞好。2)对机房内所有设备作一次清洗,除尘。对空调设备、新风设备的过滤装置作一次清洗。排除设备在使用时出现的故障和缺陷。检查、测试机房电源系统工作的情况,并做好登记。检查、测试机房空调设备工作的情况,并做好登记。其它检查。换季维修换季维修是在每年进入夏季之前和进入冬季之前为保障机房及机房设备在盛夏和严冬能正常使用而进行的预防性检查。换季维修应包括以下内容:1)完成定期维修的内容。对空调设备中的蒸发器、冷凝器进行一次大清洗、大检查。检查并排除影响冷凝器散热效果的障碍。检查空调设备加湿水的供应状况。检查空调设备冷凝水的排泄管道是否畅通,有无异物堵塞。检查加热装置的工作状况。合要求。检查各种安全设备、防火设备及报警设备的工作状况。夏季到来之前,还应检查机房防水(施落实的情况。10)其它检查。重大任务开始前检修在重大任务开始前,为了保障机房及设备正常运行,为顺利完成重大任务提供可靠的环境而进行的检修。主要应包括:1)完成季节性检查的维修内容。根据任务的要求,定向检查一些有关设备的情况。为了保障重大任务约完成,临时增设一些设备的安装和调试。其它有关的检查维修。定期中修计算机机房及其设备经过一段较长时间的连续使用,机件的磨损和自然老化,会使机房和设备存在一些问题,为了保障机房和设备进一步使用,必须认真地对机房和设备进行维修。设备连续使用10000容有:1)机房的结构,外部环境的检修。机房建筑结构的变化。机房的严密性。从机房穿过的为楼内其它楼层使用的各种管线对机房的影响。机房与外部各种连接用管路的畅通、密封性检修。机房周围环境的变化情况对机房的影响。机房内装修部分的检修。机房吊顶部分要打开一些活动顶板。检查顶部各种电缆、信号线、管道的连接、固定。清除吊顶上的积尘。受损吊顶的更换、调整。对机房墙面装饰板进行全面的检查,清洁。机房内活动地板打开一部分进行检查。检查地板下电缆、导线、信号线各种设备使其附件的固定。清洁地板下部的积尘。对损坏、变色地板的更换和调整。对损坏灯具、门窗拉手、照明开关的修理、更换。完成空调制冷系统中修的检查。检查压缩机、排除异常情况。清洗蒸发器、冷凝器、蒸发器,特别对室外机要重点清洗。对润滑系统清洗,更换润滑油。清洗、更换过滤网。检查皮带松紧情况,调整到合适的程度。检查制冷剂是否泄漏,需要时予以补充。检查冷凝管道有无损伤、变形。测试各个部位的工作性能参数。4)完成机房供配电系统的中修检查。检查市电的电压是否稳定。配电柜各接触点是否牢固,如有松动及时紧固。调整机房内三相电源使之均衡分配。检查电源线套管有无破损、各类开关、控制器是否灵敏,并加以解决。各类插座有无损坏并予以更换。整顿机房使用中用电的不规范行为。完成UPS电源定期检测内容。检查并清理使用UPS的非计算机类设备。测量UPS对非免维护的UPS的电池进行一次放充电。清理蓄电池的灰尘并检查有无泄漏情况。计算机直流接地电阻小于一欧姆。若使用组合接地系统,则计算机组合接地电阻小于一欧姆。对安全消防系统和自动报警系统的设备和线路进行一次全面的检查、测试。设备的固定。线路和管路的固定和连接。探头技术性能要进行实测。消防系统有关附件的技术性能测试和联动试验。检查灭火气体设备间使之符合设计要求,钢瓶压力达到技术指标。非气体灭火的其它灭火设施,均应符合技术要求。更换手提灭火器材。中修后要对机房的状况和设备技术性能作一次全面的结论。在结论中应有以下内容:机房外部影响的程度。需要更新的机房设备。对机房使用状况的评估。定期大修机房及其设备连续使用30000小时左右时要对机房及其设备进行大修。大修时除完成中修内容和排除机房内设备故障外还应增加以下内容:机房的外部环境的影响对影响机房的外部环境进行调查和测试,在调查的基础上制定改造的方案。机房本身建设结构的状况对机房本身建筑的现状进行一次全面的检查评估,写出调查报告,制定整修计划。机房内部装修要对机房内部装修情况进行一次全面的整修。在整修前要对机房各部位,各方面进行检查,制定整修计划。机房内吊顶、地板要全部打开进行检查、清洁;对吊顶、地板的平整度进行调整;更换裂缝、起鼓、脱皮、变色的微孔顶板和活动地板;补刷楼层顶板、地板的防尘漆;墙面饰板严重变形或损坏的要重新更换。按大修内容完成空调制冷设备的检查,制冷系统大修就是要对机房空调设备和新风设备进行全面的测试、调整。重点是:完成中修的内容。清洗压缩机外壳的油垢和灰尘。检查并校验温湿度探头和各类控制器的灵敏度、准确性,如果有损坏或动作失调的应予更换。监测系统中的所有阀门并试压。检修保温管道及绝热材料,不合格的应重新作保温。清洗室外机、散热器,并清理其周围的杂物,保证散热充分。清除辅助设备表面的特铁锈,吹出内部的油腻。做好大修后的试运行和测试工作。完成供配电系统全面的大修检查。检查应符合国家和当地供电部门有关规定。检查后应有供电部门的合格证方可重新使用。对机房专用UPS电源进行全面的检查测试。在大修中要对机房专用UPS电源作以下性能检测:检查UPSUPS电源作一次全面的清洁。检查各接线端的可靠性,清洁各种开关、接触器的触点。检查弹簧的强度和灵活性。检查各种集成电路板的固定和清洁应良好。检查蓄电池的性能对蓄电池作放电试验。24个小时充电。不合格的蓄电池要摘除,摘除蓄电池的个数不能多于UPS电源对蓄电池组的最低限度。蓄电池组不能满足要求时要全部更新。对UPS电源性能作全面的评估。报警系统的可靠性和准确性检验。灭火系统管路按规定作耐压试验。灭火剂瓶(罐)做耐压试验。灭火药剂如果过期、压力不足应更换或补充。此项工作应由消防专业人员完成并由消防主管部门现场检查指导。对接地系统进行全面测试。如果是机房专用接地系统,在条件允许时,可抽查部分接地体在地下的锈蚀状况,接地电阻若达不到要求时,可补做或增加接地体。机房大修后要进行全面验收。机房大修应组织有机房专业装修资格的公司完成,大修完成后应按机房标准和大修要求进行检查验收。二、机房维护服务方案1、机房维护的必要性机房内的设备对工作环境有着非同一般的要求。感冒。如果设备长期处于灰尘漫舞的环境中工作,很容易发生故会散热不良,长此以往自然就容易出现故障。能会逐步下降,而且还有可能产生漏电现象,引发火灾事故。、设备对环境温度十分敏感。高于的环境或低于0℃充分发挥,从而减少使用寿命。设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不及,或者无法找到症结所在,或者没有可更换的备件。此时,损失已经造成了。为了做好机房设备的维护工作,我公司维修中心配备相应的人力、物力(工具、通讯设备等),养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。2、维护内容:供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备(像头、硬盘录像机)、监控主机;UPS配电柜;:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装置;:水、电路管线及接口的检查维修。管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路由及交换设备等系统;:完善机房运维规范,优化机房运维体系;3、维护具体需求机房监控设备:1) 下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入机房℃~+60℃,相对湿度应在10%~100,相对湿度应控制在10%~80设备一个良好的运行环境。控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行。会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色及亮度。会影响排热,以免硬盘录像机工作不正常。控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。每月定期对监控系统和设备进行优化:合理安排监控中心的监控网络需求,如带宽IP的监控系统网络性能检测,包括网络的连通性、稳定性及带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运行状态、流量及入侵监控等。对异常情况,进行核查,并进行相关的处理。根据用软件的拆装等。提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表送监控中心负责人。、机房空调与配电设备机房空调及新风维护控制系统的维护对空调系统的维护人员而言,在巡视时第一步就是看空调系统是否在正常运行,因此我们首先要做以下的一些工作。;;;比较老的空调系统还不能够读出这些参数,这就需要晚上值班的工作人员多观察和记录。压缩机的巡回检查及维护听用听声音的方法,能较正确的判断出压缩机的运转情况。因为压缩机运转时,它的响声应是均匀而有节奏摸用手摸的方法,可知其发热程度,能够大概判断是否在超过规定压力、规定温度的情况下运行压缩机。看主要是从视镜观察制冷剂的液面,看是否缺少制冷剂。量主要是测量在压缩机运行时的电流及吸、排气压力,能够比较准确判断压缩机的运行状况。当然对压缩机我们还需要检查高、低压保护开关、干燥过滤器等其他附件。冷凝器的巡回检查及维护的固定件是否有松动的迹象,以免对冷媒管线及室外机造成损坏。检查冷媒管线有无破损的情况(当然从压缩机的工作状况及其它的一些性能参数也能够判断冷媒管线是否破损检查冷媒管线的保温状况,特别是在北方地区的冬天,这是一件比较重要的工作,如果环境温度太低而冷媒管线的保温状况又不好的话,对空调系统的正常运转有一定的影响。的扇也在转动时是否在同一个平面上。检查冷凝器的翅片有无破损的状况。检查冷凝器工作时的电流是否正常,从工作电流也能够进一步判断风扇的工作情况是否正常。动和停止。蒸发器、膨胀阀的巡回检查及维护蒸发器、膨胀阀的维护主要是检查蒸发器盘管是否清洁,是否有结霜的现象出现,以及蒸发器排水托盘排水是否(通常状况下,蒸发器盘管的温度应该比环境温度低10)适。当然出现这种现象也有可能是其它环境的原因引起的,比如空调的制冷量不够、风机故障引起风速过慢等原因造成的。加湿系统的巡检及维护1)1)由于各个地方的空气环境不同,对加湿器的使用和影响也不一样,但我们在日常的维护工作中同样要做的事情是观察加上罐内是否有沉淀物质,如有就要及时冲洗,因为现在空调的加湿罐一般都是电极式的,如沉淀物过多而又不及时冲洗的话,就容易在电极上结垢从而影响加湿罐的使用寿命。当然现在有些加湿罐的电极是可以更换的。问题的;根据我们多年来的维护来看,引起这种现象的主要原因是停水后的空气进到进水电磁阀前端,对进水电磁阀的正常开启造成了一定的影响,解决这种现象有两种比较有用的办法,一是卸开进水口,排掉空气,二是关掉加湿系统的电源,重新给电磁阀上电也基本上能够解决这类问题。检查加湿罐排水管道是否畅通,以便在需要排水和对加湿罐进行维修时顺利进行。检查蒸汽管道是否畅通,保证加湿系统的水蒸汽能够正常为计算机设备加湿。调系统未配有漏水探测器,那么我们更要注意监测排水管道是否畅通,同时也要做好机房防水墙的维护工作。空气循环系统的巡回检查及维护常维护工作中要做好以下的一些工作:过大的情况。如有上述现象应及时调整,如果实在调整不过来,应建议设备移到新的合适的位置。检查空调过滤器是否干净,如脏了就应及时更换或清洗。;对风机的检查;对风机而言当然最重要的皮带调整的松紧程度要合适,太松容易打滑,太紧对皮带的磨损太快,皮带的松紧跟外部对静压得需求也有比较大的关系,当然这种调整是现在部分比较先进的空调系统采用了一体化的风机,就解决了皮带调整的问题。测量电机运转电流,看是否在规定的范围内,根据测得的参数也能够判断电机是否是正常运转。更换。但也是一个比较重要的环节,因为一台空调停止运行,如果隔风栅未关闭其温度、湿度探头检测到的是其它空调的出口的温度和湿度,在空调下一次开启时控制系统就会根据其先前检测到的参数而对空调系统的运行情况做出控制,这时空调控制系统就会对压缩机、加湿、除湿系统地运行情况做出错误的指令。现在大多数空调设计时都没有考虑这种状况对空调系统的影响,因为这种影响的时间较短,在较短的时间内系统会根据新的信息达到正常的运行状况,所以没有设计隔风栅,这种影响虽然较小,但我们认为在要求很高的计算机机房中我们最好不要让系统出现一段时间的错误运行,因此我们可以为空调系统人为地增加隔风栅。人员对空调系统的风道做出相应的调整或增加空调设备。UPS及电池维护测试及记录主机运行参数,根据实际情况进行电池核对性容量测试;用专用仪器对后备用蓄电池组逐个测量,进行充放电维护及调整充电电流,确保电池正常工作;检查风机及风道情况并清洁,主机外观清洁、内部除尘;检查记录输出波形、谐波含量、零地电压等,清洁系统主设备及电池等,查清各参数是否正确或切合实际,能及时发现事故隐患UPS各项功能测试,如检查逆变器、整流器等启停、电池管理功能,有条件进行UPS同市电的切换试验。 固工作等。观察可能出现的元件老化或损坏现象、电容是否有膨胀或漏液迹象、磁性元件是否过热或分层迹象并机系统进行单机运行测试,热备份系统负荷切换测试等低压配电柜维护低压配电柜带电清洗维护:检查电气盘柜的部分触点、接线柱等有氧化锈蚀;电气设备外壳用手触摸感觉温度异常高;检查有些电气设备的内部有无声音异常;清理绝缘子表面沉积了污秽物质等;接线柱加固,标签更换,测试输入输出频率;电流电压等消防设备的维护;检查报警探测器、手动报警按钮、火灾警报装置外观;气体灭火控制器工作状态;储瓶间环境、气体瓶组或储罐、选择阀、驱动装置等组件外观;应急灯和疏散指示标志工作状态。火灾报警探测器、手动报警按钮、报警控制器、联动控制设备的试验报警功能。气体灭火控制设备的试验模拟自动启动供水水路、电路及照明线路的维护镇流器、灯管更换;灯盘校正,开关更换,线头氧化处理,标签巡查更换,漏保实验检查机房进出水管接头是否有液漏现象水管阀门检查、加固及更换机房基础维护吊顶表面清洁;板材松动、翘起修复,变形、损坏更换;龙骨调平等墙面污迹清理,裂缝修补玻璃清洗,不锈钢清洗,玻璃胶修整,地弹簧校正,拉手螺丝加固静电地板清洗清洁,地面除尘;缝隙调整;平整度调整;损坏更换接地电阻测试;主接地点除锈、土壤降阻、接头紧固;防雷器检测;接地线触点防氧化加固。格和对应表来显示其物理链路机柜除尘、清洁;机柜及网络设备整理,包括交换机、配线架和网线的重新整理、排序,并重新标上统一的编号机房主机设备维护提供计算机专业知识咨询、操作;3.6.23.6.2网络进行全面维护、升级硬件设备建立计算机信息卡,并以标签的形式粘贴在计算机主机上。信息卡内容包括:IP地址、备注等。3.6.3安装杀毒软件、病毒防火墙,定期为计算机查杀毒和病毒库升级服务:完善机房运维规范,优化机房运维体系;结合中心机房业务工作及信息化建设实际,制定《机房主机设备维护制度》、《机房环境系统维护制度》、《电气设备操作手册》等用于完善机房运维,在已有的流程制度基础上,进一步细化完善,使之成为一整套高效、合理、适用的机房运维管理流程 、维护服务质量1据系统故障的程度提供不同的响应时间和故障排除时间:故障程度响应时间故障排除时间(工作小时)一般故障≤1小时≤6小时(市区内)严重故障≤30分钟≤2小时(市区内)系统紧急故障立即≤1小时2、对本项目涉及的设备进行1年4次(即每季度一次)的定期检测、保养、可预防性的对设备进行检测,并且出具检2433个工作日(计算机服务器、网络设备等须在1个工作日内),则必须提供档次不低于送修设备的备件。在维护期间,提供保修服务(保修服务包括维护、检测、设备免费维修和更换,提供的更换件不低于需要维修或现使用的产品档次),涉10短期内解决的,可以与用户方协商先行使用替代设备或材料,延长处理时间。4、在用户因其它项目建设,提出协助请求时(如长时间停电、系统切换、调整网络结构、线路迁移等),提供商必须派专业技术人员到现场监控设备的运行情况,做好相关配合工作。5障及时进行检查、提供处理方案,并解决,消除隐患。三、精密空调维护保养方案精密空调的构成包括:压缩机、冷凝器、膨胀阀、蒸发器、风机、空气过滤器、加湿器、加热器、排水器等,因此我们在日常的机房管理工作中对空调的管理和维护,主要是针对以上部件去维护的。信息中心机房精密空调维护保养分为日常巡检、月度维护保养、季度维护保养和年度运行报告等四部分,每一部分的维护范围都涵盖了所有项目的维护,但侧重点各不相同具体方案如下。1、机房精密空调的维护常识(日常巡检)的显示屏上检查空调系统的各项功能及参数是否正常。、控制系统的维护作。;;;备运行状况是否有较大的变化,以便合理地调配空调系统的运行台次和调整空调的运行参数。、压缩机的巡回检查及维护听―用听声音的方法,能较准确的判断出压缩机的运转情况。因为压缩机运转时,它的响声应是均匀而有节奏3)看―主要是从视镜观察制冷剂的液面,看是否缺少制冷剂。4)当然对压缩机我们还需要检查高、低压保护开关、干燥过滤器等其他附件。、冷凝器的巡回检查及维护件是否有松动的迹象,以免对冷媒管线及室外机造成损坏。作,如果环境温度太低而冷媒管线的保温状况又不好的话,对空调系统的正常运转有一定的影响。的扇也在转动时是否在同一个平面上。检查冷凝器的翅片有无破损的状况。检查冷凝器工作时的电流是否正常,从工作电流也能够进一步判断风扇的工作情况是否正常。动和停止。、蒸发器、膨胀阀的巡回检查及维护蒸发器、膨胀阀的维护主要是检查蒸发器盘管是否清洁,是否有结霜的现象出现,以及蒸发器排水托盘排水是否(通常状况下,蒸发器盘管的温度应该比环境温度低10)适。当然出现这种现象也有可能是其它环境的原因引起的,比如空调的制冷量不够、风机故障引起风速过慢等原因造成的。、加湿系统的巡检及维护是观察水槽内是否有沉淀物质,如有就要及时冲洗,如沉淀物过多而又不及时冲洗的话影响使用寿命。检查上水和排水电磁阀的工作情况是否正常。在加湿系统工作的过程中,有一种情况常常出现,但又不容易判断,即在空调系统正常工作的时候,由于某种原因出现了一段时间的停水,后又恢复供水,在恢复供水后加湿水槽不能够正常上水,出现这种现象的原因有多种,并且在大多数空调器的控制系统中直接对加湿系统复位通常是不能够解的正常开启造成了一定的影响,解决这种现象有两种比较有用的办法,一是卸开进水口,排掉空气,二是关掉加湿系统的电源,重新给电磁阀上电也基本上能够解决这类问题。检查加湿水槽排水管道是否畅通,以便在需要排水和对加湿水槽进行维修时顺利进行。现漏水的情况,如漏水探测器不正常的话,就易出现事故。、空气循环系统的巡回检查及维护常维护工作中要作好以下的一些工作:过大的情况。如有上述现象应及时调整,如果实在调整不过来,应建议设备移到新的合适的位置。检查空调过滤器是否干净,如脏了就应及时更换或清洗。;对风机的检查;对风机而言当然最重要的皮带调整的松紧程度要合适,太松容易打滑,太紧对皮带的磨损太快,皮带的松紧跟外部对静压得需求也有比较大的关系,当然这种调整是现在部分比较先进的空调系统采用了一体化的风机,就解决了皮带调整的问题。测量电机运转电流,看是否在规定的范围内,根据测得的参数也能够判断电机是否是正常运转。更换。但也是一个比较重要的环节,因为一台空调停止运行,如果隔风栅未关闭其温度、湿度探头检测到的是其它空调的出口的温度和湿度,在空调下一次开启时控制系统就会根据其先前检测到的参数而对空调系统的运行情况作出控制,这时空调控制系统就会对压缩机、加湿、除湿系统地运行情况作出错误的指令。现在大多数空调设计时都没有考虑这种状况对空调系统的影响,因为这种影响的时间较短,在较短的时间内系统会根据新的信息达到正常的运行状况,所以没有设计隔风栅,这种影响虽然较小,但我们认为在要求很高的计算机机房中我们最好不要让系统出现一段时间的错误运行,因此我们可以为空调系统人为地增加隔风栅。人员对空调系统的风道作出相应的调整或增加空调设备。2、机房精密空调的维护检查项目(月度)表日期:日期:设备型号:制表人:序列号:检查项目检查及处理情况过滤网:1、检查过滤网是否有破损、堵塞2、检查过滤网堵塞开关3、清洗过滤网风机组件:1、风机叶轮有无变形2、轴承有无磨损3、皮带松紧度及状况压缩机组件:1、检查有无泄漏2、聆听运行声音、观察运行振动情况风冷冷凝器(室外机):1、冷凝器翅片的清洁度2、室外机安装底座是否牢固3、风机减震垫是否出现老化或损坏4、制冷剂管路支架是否牢固5、防雷板是否仍有效制冷循环系统:1、检查吸气压力21、检查吸气压力2、检查排气压力3、检查制冷剂管路4、检查系统含水分情况(视液镜观察)5、检查热力膨胀阀加热系统:1、检查系统元件的运行2、检查元件受腐蚀情况远红外加湿器:1、检查水槽排水有无堵塞2、检查结垢情况签名:日期:日期:设备型号:制表人:序列号:检查项目检查情况过滤网:1、检查过滤网是否有破损、堵塞2、检查过滤网堵塞开关3、清洗过滤网风机组件:1、风机叶轮有无变形2、轴承有无磨损3、皮带松紧度及状况4、检查并紧固电路接头压缩机组件:1、检查有无泄漏2、聆听运行声音、观察运行振动情况3、检查并紧固电路接头风冷冷凝器(室外机):1、冷凝器翅片的清洁度2、室外机安装底座是否牢固3、风机减震垫是否出现老化或损坏4、制冷剂管路支架是否牢固5、防雷板是否仍有效6、检查并紧固电路接头7、检查转速调节器电压调节功能8、温度开关处在规定的设定值制冷循环系统:1、检查吸气压力2、检查排气压力3、检查制冷剂管路4、检查系统含水分情况(视液镜观察)5、检查热力膨胀阀6、检查是否需要添加制冷剂(视液镜观察)加热系统:1、检查系统元件的运行2、检查元件受腐蚀情况3、检查并紧固电路接头远红外加湿器:1、检查水槽排水有无堵塞2、检查结垢情况3、检查并紧固电路接头6、检查加湿器灯管电气部分:6、检查加湿器灯管电气部分:1、检查保险丝空开2、检查并紧固电路接头3、检查控制程序4、检查接触器的吸合情况签名:UPS维护保养方案为保证信息系统的安全,UPS间的建设尤为重要。由于供电系统中不可避免的存在如供电中断、电压浪涌、电压陷落、波形畸变、频率漂移、持续过压、持续低压、瞬间过电压和噪声干扰等情况,这些情况中的任一出现必将造成整个供电系统的不稳定,尤其是对通信网络信息设备轻则工作出错、通信失败,重则设备损坏、数据丢失、系统崩溃。作为网络信息系统核心的服务器及通信设备能否稳定地工作,取决于电源系统能否提供高质量、稳定的电源。因此,UPS的日常维护及保养对于机房的重要性可想而知,我们要做到以下方面。维修服务:提供保修期内在系统正常使用情况下出现故障所需的维修服务。时内到达现场进行故障处理。365365(24小时值)维护服务:乙方应按下述要求为甲方的设备提供维护服务,并对发现的问题做及时处理。服务提供商需具备专业测量仪器和专业设备1 UPS专业的测量仪器检测、UPS的输入输出电压,电池的内阻和电压()UPS(鼓风机、棘轮扳手)UPS日常检查的具体项目A.检查所有电气连接B.进行放电测试CD.清理内部灰尘杂物E.检测内部静态旁路F.检查内部所有控制线路及带电线路是否绝缘良好G.断电情况下对UPS系统内部所有端子进行物理检查H.按客户要求实施功能检测/UPS预防性维护检查布线是否正确,记录相关情况检查UPSL.确认内部功能正常M.检查旁路工作是否正常,包括静态旁路和手动旁路N.记录所有显示数据和环境参数,包括:测量进线负载电流和接地电流测量配电盘承载电流测量支路的电压和电流池参数报告供招标方参考。月度检查各项日内提交维修报告至招标方数,出具电池参数报告供招标方参考。技术档案、交流及培训:填写维护维修报告,并由甲方填写意见和签字确认乙方每季度为甲方提供一份维修维护报告,报告应包括如下内容;维修服务内容、工作性质计服务时间统计维护服务内容、工作性质计服务时间统计故障处理及备件更换情况设备状况分析及评价对设备运行计使用的建议UPS电池的保养对电池组中的电池做静态,动态测试对电池组的联接进行检查电池在UPS主机上放电测试主机保养检查设备的运行状况对需要进行清扫的机器进行除尘清扫对设备内主要部件进行静态测试检测机内易损单元(逆变器,整流器,静态开关)检查设备的输入输出联接端子是否牢固恢复设备运行检测设备的输出主要性能指标在质保期内服务提供商必须为最终用户提供技术服务热线(24小时),用中遇到的问题,并及时提出解决问题的建议和操作方法(技术服务热线支持应是中文)。UPS设备()一年质保期内服务提供商应提供小时)小48小时内排除,服务提供商应提供免费替换服务(设备由服务提供商提供),12个小时内未作出响应,则由于故障所造成的全部损失由服务提供商承担。4次,巡检内容(不少于)如下:环境检查:房间的清洁程度;房间的温度:电池房(小于25度、UPS房(小于40度)设备四周及上面是否有堆积物;房间的空调通风情况;设备上方是否有水管是否所有金属柜、架都有地线连接;输入滤波器检查:物理检查:电感电容机柜的清洁连接紧密程度的检查(过热、氧化)电感电容输入电压V1V2V3测量电容器的电流UPS工作情况的检查整流器/充电器物理检查电抗功率连接的紧密程度(过热、氧化)信号线连接的紧密情况板及附件的情况风扇2) 输入电压:U1-2,U2-3,U3-1谐波含量幅值URMS充电电压的测量直流电压纹波的测量逆变器:物理检查电抗功率连接的紧密程度(过热、氧化)信号线连接的紧密情况板及附件的情况风扇机柜的清洁直流电容情况直流电容上次更换的日期2) 逆变器电压的测量:V1,V2,V3,U1-2,U2-3,U3-1逆变器电流的控制每个逆变器支路的电流波形4) 输出电压的测量:V1,V2,V3,U1-2,U2-3,U3-1输出电流的测量:I1,I2,I3峰值峰值因数校验情况电池的检查:电池房温度的检查电池绝缘情况电池物理检查电池资料调试日期电池单体的电压并联组数串联只数后备时间(功率因数0.8的负载)浮充情况下电池电压的测量记录每块电池的浮充电压电池组放电测试电池电压电池内阻放电时电池电压的测量放电时间放电时的负载电流放电前的直流电压放电结束时的直流电压记录放电曲线静态开关的检查物理检查功率连接的紧密程度(过热、氧化)信号线连接的紧密情况板及附件的情况风扇切换测试(要由客户的部门经理同意)切换到旁路UPS....................................分隔 分隔.............................机房类运维服务方案范例十四、服务方案一、机房及设备维护方案与计划1、预防性检查1.1巡检时间每个工作日上午9点项目 性能检查内容 脆弱性检查内容空调系统

高压压力、低压压力(风冷系统,冷冻水压力、温度,冷却水压力、温度(水冷系统水系统、灰尘情况等。

机房热点情况、室内机漏水检查、室外风机运转情况、加湿输入输出功率,输入输出电流、断路供配电系统 关、接地电阻、零序电流、器件发热况等。

导线、器件发热情况,断路开关、防浪涌器件情况等。UPS系统

负载功率情况、器件发热情况、电池情况(外观、液位、接线柱)等。录像备份管理、出入机房登记、器件灵

器件、导线发热情况,电池放电时间等。安全系统 敏度、画面清晰度(不同照度情况下、 器件灵敏度、监控死角问题等云台运行等。设备运行

查看设备运行指示灯、机房照明运行情

设备运行是否有报警情况、照明是否正常、机房卫生是否整机房环境 况、机房环境洁等2、现场故障维修每日巡检过程中,如有发现设备及环境系统有故障状态,需进行记录并恢复故障状态。如不能立即恢复故障状态,则需进行应急预案处理。具体如下:环境故障:卫生、温湿度、照明(四级故障)交换机故障:交换机蜂鸣,交换机启动不正常,指示灯异常(三级故障)空调故障:空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故障等(二级故障UPS故障:UPSUPSUPSUPSUPS蜂鸣报警等(一级故障)配电柜故障:配电柜内温度过高、配电柜打火现象等(一级故障)在解决故障时,最大限度做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于30分钟内解决故障,应立即提出应急方案,确保业务系统的运行。故障解决后24应标准列表:故障级别 响应时

故障解决时间IUPS系统崩溃导致业务停止、空调系统崩溃导致业务停止。II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。

分钟内人分钟内恢故障处理方案。分钟内抵处理方案

12内24内报错或警告,但业务系统能继续运行且性能不受影响。安装或配置咨询。

分钟内抵处理方案分钟内障处理方案

48内天内3、后台故障维修后台故障状态维修,需要在甲方允许的情况下,对设备进行维护及维修。及维修。如需联系厂商,则由我方负责。零配件部件等,并将维修记录保存文档交由甲方及我方双方管理。质保期外的设备出现故障,则由我方统一进行维修,费用由我方负责。并将维修记录报由甲方确认并存档。设备更换对于无法修复的设备,在合同有效期内,经甲方审核,由乙方负责整体更换同型号或类似型号的产品,无法维修的设备交由甲方。更换单个备品备件费用大于等于500,;500,备品备件费用由乙方承担,质保期内由供货商(厂商)进行更换的除外。4、资产管理对硬件设备型号、数量、版本等信息统计记录对软件产品型号、版本和补丁等信息统计记录对机房设施设备连接统计记录对综合布线系统结构图的绘制对机房更换设备连接统计记录每月向甲方上报低值易耗品记录,包括仓库存储情况、耗材使用情况。机房更新及更换设备的统计机房维护设备及备品备件的管理及记录5、应急处理随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。本预案共分为应用系统故障应急流程和机房突发事件应急流程系统故障应急流程一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:、运维服务中心通过网管告警发现故障、维护站点通过维护巡检发现故障、用户发现故障,报给呼叫中心、驻场工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。3、信息研判障应急处理预案。4、预案启动件进行全面管控处理。5、资源确认关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:我公司技术支持人员;我公司聘请的技术专家6、预案执行按既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。7、预案终止急领导小组决定。8、结果上报统突发故障应急领导小组。二、系统故障应急处理流程图机房突发事件应急流程一、机房突发事件分类1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。3二、应急处理人员组织机构三、应急机构人员岗位职责1、应急总指挥职责、保证在任何时间,及时协调应急行动所有涉及的岗位人员;、提供必须的紧急响应设备;、在紧急情况下全面负责紧急行动;、110120等。2、应急副总指挥职责、在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;、根据获得的应急信息下达命令。3、各相关设备负责人职责、负责尽快收集信息向应急总指挥汇报事故情况;、负责现场临时设备抢救和对事态的控制;四、突发事件处理原则预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系。最大程度地减少危害和影响。职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。以人为本。把保障人员以及公共利益的安全作为首要任务。网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。五、机房应急开关机具体措施六、机房日常维护1、建立健全机房管理制度生异常情况及时处理,消除网络故障隐患。节假日期间技术人员轮流值班,负责处理有关异常情况。机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域。2、机房内严格采取防雷、防火、防尘、防静电等措施以及机房24小时监控等措施。3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。4、对机房的主要网络设备(路由器、主干交换机等)确保整个网络的正常运行。七、服务器及存储设备故障处理1、排错流程2、应急处置具体措施机房漏水应急预案发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告监控系统突发故障应急领导小组。应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温。体或门窗,消除渗漏水隐患。设备发生被盗或人为损害事件应急预案现场。或盘查人为损害情况,做好必要的影像记录和文字记录。事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报。服务小组和事发单位应在调查结束后一日内书面报告系统突发故障应急领导小组。事态或后果严重的,应向相关领导汇报。机房长时间停电应急预案定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按以下方案进行处置:检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。当确定停电时间超出机房UPS门做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。对于恢复时间无法预计的,要通知后勤部门做好柴油机发电及移动电源车供电准备恢复供电后,严格按操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。通信网络故障应急预案初步判断后及时上报运维服务小组和系统突发故障应急领导小组。务器的网络联接,恢复通信网络,保证正常运转。事态或后果严重的,应向应急指挥办公室和相关领导汇报。组。不良信息和网络病毒事件应急预案调度中心运维服务小组和系统突发故障应急领导小组。追查不良信息来源。事态或后果严重的,应向监控中心办公室和相关领导汇报。处置结束后故障应急领导小组。服务器软件系统故障应急预案应用,并及时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。处置结束后,小组。黑客攻击事件应急预案系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组。和路由器的过滤规则,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。挥办公室和相关领导汇报,并请求支援。处置结束后小组。核心设备硬件故障应急预案备及故障原因,进行先期处置。进行故障排除工作。写设备故障报告单备查。事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。业务数据损坏应急预案据。据仍不可用,则调用异地备份数据。业务数据损坏事件超过2以手工方式开展业务。新备份数据,并在工作结束后一日内报告系统突发故障应急领导小组。雷击事故应急预案意后关闭部分服务器,切断电源,暂停内部计算机部分网络工作。网络工作,对设备和数据进行检查。系统突发故障应急领导小组。必要时,应向监控中心应急指挥办公室和相关领导汇报。空调设备故障应急预案示,获得授权后按机房设备关闭顺序关闭各类设备。火灾事故应急预案备安全;119防毒面具,所有不参与灭火的人员按预先确定的线路,迅速从机房中撤出;指定位置取出泡沫灭火器进行灭火。电源设备故障应急预案机房目前使用UPS系统,在紧急情况发生时,应按如下步骤进行关机:确认所有负载均已安全关机。关闭UPS负载电源。将UPS的系统启用开关切换到off的状态。将电池连接断路器切换到off的位置。6、保密管理要求一、机房管理1、路由器、交换机和服务器以及通信设备是网络的关键设备,须放置计算机机房内,不得自行配置或更换,更不能挪作它用。2、计算机房要保持清洁、卫生,并由专人7×24负责管理和维护(包括温度、湿度、电力系统、网络设备等),无关人员未经管理人员批准严禁进入机房。3、严禁易燃易爆和强磁物品及其它与机房工作无关的物品进入机房。4、建立机房登记制度,对本地局域网络、广域网的运行,建立档案。未发生故障或故障隐患时当班人员不可对中继、光纤、网线及各种设备进行任何调试,对所发生的故障、处理过程和结果等做好详细登记。5、做好操作系统的补丁修正工作。6、网管人员统一管理计算机及其相关设备,完整保存计算机及其相关设备的驱动程序、保修卡及重要随机文件。7二、机房安全保密制度变更营业软件。机房所有人员未经允许不得访问信息系统中用户信息、公文、报表、邮件等属于授权访问数据信息或私人信息。机房所有人员未经授权,不得私自修改、查阅系统的有关信息。权限密码。也不得擅自带离机房,使用后归还原处。IP轻易获取。机房内重要保密文件、数据的销毁,应使用碎纸机进行销毁,不得任意丢弃。机房内部的废弃设备、测试数据由仓管部门统一保存和处理。机房所有人员严格遵守通信纪律,增强保密意识和法制观念,不得随意监测用户通信。机房内部所有维护和管理人员,均应熟悉并严格执行安全保密规定。7、人员管理要求在招标人进行备案。对维保人员的管理员应按甲方的要求和标准来进行执行。人员具体职责如下:一、硬件维护人员岗位职责:及时高效地完成分配的硬件维修等各项任务,保证硬件的正常工作。基本原则和维修方法进行。对键盘、鼠标等易损件进行常规检查;对硬件系统进行外观和静态检查;对微机系统进行全面的动态检查,发现问题及时解决。寒假、暑假或长期不用期间,要定时对其进行开机上电操作,以使机器内部保持干燥。寒假、暑假或长期不用期间,要使用塑料袋将主机、显示器及网线接头等严密包裹起来,避免受潮。6给予排除。当硬件发生故障时,及时排除故障,尽快恢复系统的运行。定期进行硬件的例行维护,建立每台机器的维护档案。每次维修必须进行登记,包括更换的设备和配件。三、软件维护人员岗位职责:及时高效完成软件维护等各项任务,保证计算机系统的正常运行。器。机器运行当中,软件维护人员应时刻观察有无异常情况,及时发现及时处理。软件维护人员应备有各种工具软件、常用应用软件、操作系统软件和程序语言软件并留存实验中心一份。防病毒入手,对外来的软件或文件应事先查杀再使用。断绝病毒传播途径。积极协调硬件维护人员排除硬件故障。要。平时要做好系统保护与数据备份工作,系统出现问题后能够快速恢复。认真参与业务学习,不断提高自身的软件维护水平。32.作好软件的安全保密工作。8、定期检查方案与计划定期维修定期维修是按时间计算,应对机房和机房设备作定期检修。维修应包括以下内容:1)对机房内部和周围环境作一次彻底性的清理,把卫生搞好。2)对机房内所有设备作一次清洗,除尘。对空调设备、新风设备的过滤装置作一次清洗。排除设备在使用时出现的故障和缺陷。检查、测试机房电源系统工作的情况,并做好登记。检查、测试机房空调设备工作的情况,并做好登记。其它检查。换季维修换季维修是在每年进入夏季之前和进入冬季之前为保障机房及机房设备在盛夏和严冬能正常使用而进行的预防性检查。换季维修应包括以下内容:1)完成定期维修的内容。对空调设备中的蒸发器、冷凝器进行一次大清洗、大检查。检查并排除影响冷凝器散热效果的障碍。检查空调设备加湿水的供应状况。检查空调设备冷凝水的排泄管道是否畅通,有无异物堵塞。检查加热装置的工作状况。合要求。检查各种安全设备、防火设备及报警设备的工作状况。夏季到来之前,还应检查机房防水(施落实的情况。10)其它检查。重大任务开始前检修在重大任务开始前,为了保障机房及设备正常运行,为顺利完成重大任务提供可靠的环境而进行的检修。主要应包括:1)完成季节性检查的维修内容。根据任务的要求,定向检查一些有关设备的情况。为了保障重大任务约完成,临时增设一些设备的安装和调试。其它有关的检查维修。定期中修计算机机房及其设备经过一段较长时间的连续使用,机件的磨损和自然老化,会使机房和设备存在一些问题,为了保障机房和设备进一步使用,必须认真地对机房和设备进行维修。设备连续使用10000容有:1)机房的结构,外部环境的检修。机房建筑结构的变化。机房的严密性。从机房穿过的为楼内其它楼层使用的各种管线对机房的影响。机房与外部各种连接用管路的畅通、密封性检修。机房周围环境的变化情况对机房的影响。机房内装修部分的检修。机房吊顶部分要打开一些活动顶板。检查顶部各种电缆、信号线、管道的连接、固定。清除吊顶上的积尘。受损吊顶的更换、调整。对机房墙面装饰板进行全面的检查,清洁。机房内活动地板打开一部分进行检查。检查地板下电缆、导线、信号线各种设备使其附件的固定。清洁地板下部的积尘。对损坏、变色地板的更换和调整。对损坏灯具、门窗拉手、照明开关的修理、更换。完成空调制冷系统中修的检查。检查压缩机、排除异常情况。清洗蒸发器、冷凝器、蒸发器,特别对室外机要重点清洗。对润滑系统清洗,更换润滑油。清洗、更换过滤网。检查皮带松紧情况,调整到合适的程度。检查制冷剂是否泄漏,需要时予以补充。检查冷凝管道有无损伤、变形。测试各个部位的工作性能参数。4)完成机房供配电系统的中修检查。检查市电的电压是否稳定。配电柜各接触点是否牢固,如有松动及时紧固。调整机房内三相电源使之均衡分配。检查电源线套管有无破损、各类开关、控制器是否灵敏,并加以解决。各类插座有无损坏并予以更换。整顿机房使用中用电的不规范行为。完成UPS电源定期检测内容。检查并清理使用UPS的非计算机类设备。测量UPS对非免维护的UPS的电池进行一次放充电。清理蓄电池的灰尘并检查有无泄漏情况。计算机直流接地电阻小于一欧姆。若使用组合接地系统,则计算机组合接地电阻小于一欧姆。对安全消防系统和自动报警系统的设备和线路进行一次全面的检查、测试。设备的固定。线路和管路的固定和连接。探头技术性能要进行实测。消防系统有关附件的技术性能测试和联动试验。检查灭火气体设备间使之符合设计要求,钢瓶压力达到技术指标。非气体灭火的其它灭火设施,均应符合技术要求。更换手提灭火器材。中修后要对机房的状况和设备技术性能作一次全面的结论。在结论中应有以下内容:机房外部影响的程度。需要更新的机房设备。对机房使用状况的评估。定期大修机房及其设备连续使用30000小时左右时要对机房及其设备进行大修。大修时除完成中修内容和排除机房内设备故障外还应增加以下内容:机房的外部环境的影响对影响机房的外部环境进行调查和测试,在调查的基础上制定改造的方案。机房本身建设结构的状况对机房本身建筑的现状进行一次全面的检查评估,写出调查报告,制定整修计划。机房内部装修要对机房内部装修情况进行一次全面的整修。在整修前要对机房各部位,各方面进行检查,制定整修计划。机房内吊顶、地板要全部打开进行检查、清洁;对吊顶、地板的平整度进行调整;更换裂缝、起鼓、脱皮、变色的微孔顶板和活动地板;补刷楼层顶板、地板的防尘漆;墙面饰板严重变形或损坏的要重新更换。按大修内容完成空调制冷设备的检查,制冷系统大修就是要对机房空调设备和新风设备进行全面的测试、调整。重点是:完成中修的内容。清洗压缩机外壳的油垢和灰尘。检查并校验温湿度探头和各类控制器的灵敏度、准确性,如果有损坏或动作失调的应予更换。监测系统中的所有阀门并试压。检修保温管道及绝热材料,不合格的应重新作保温。清洗室外机、散热器,并清理其周围的杂物,保证散热充分。清除辅助设备表面的特铁锈,吹出内部的油腻。做好大修后的试运行和测试工作。完成供配电系统全面的大修检查。检查应符合国家和当地供电部门有关规定。检查后应有供电部门的合格证方可重新使用。对机房专用UPS电源进行全面的检查测试。在大修中要对机房专用UPS电源作以下性能检测:检查UPSUPS电源作一次全面的清洁。检查各接线端的可靠性,清洁各种开关、接触器的触点。检查弹簧的强度和灵活性。检查各种集成电路板的固定和清洁应良好。检查蓄电池的性能对蓄电池作放电试验。24个小时充电。不合格的蓄电池要摘除,摘除蓄电池的个数不能多于UPS电源对蓄电池组的最低限度。蓄电池组不能满足要求时要全部更新。对UPS电源性能作全面的评估。报警系统的可靠性和准确性检验。灭火系统管路按规定作耐压试验。灭火剂瓶(罐)做耐压试验。灭火药剂如果过期、压力不足应更换或补充。此项工作应由消防专业人员完成并由消防主管部门现场检查指导。对接地系统进行全面测试。如果是机房专用接地系统,在条件允许时,可抽查部分接地体在地下的锈蚀状况,接地电阻若达不到要求时,可补做或增加接地体。机房大修后要进行全面验收。机房大修应组织有机房专业装修资格的公司完成,大修完成后应按机房标准和大修要求进行检查验收。二、机房维护服务方案1、机房维护的必要性机房内的设备对工作环境有着非同一般的要求。感冒。如果设备长期处于灰尘漫舞的环境中工作,很容易发生故会散热不良,长此以往自然就容易出现故障。能会逐步下降,而且还有可能产生漏电现象,引发火灾事故。、设备对环境温度十分敏感。高于的环境或低于0℃充分发挥,从而减少使用寿命。设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不及,或者无法找到症结所在,或者没有可更换的备件。此时,损失已经造成了。为了做好机房设备的维护工作,我公司维修中心配备相应的人力、物力(工具、通讯设备等),养延长设备生命周期,降低故障率。确保机房在突发事故导致硬件设备故障,影响机房正常运作情况下,可及时得到设备供应商或机房服务维护公司的产品维修和技术支持,并快速解决故障。2、维护内容:供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备(像头、硬盘录像机)、监控主机;UPS配电柜;:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装置;:水、电路管线及接口的检查维修。管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路由及交换设备等系统;:完善机房运维规范,优化机房运维体系;3、维护具体需求机房监控设备:1) 下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入机房℃~+60℃,相对湿度应在10%~100,相对湿度应控制在10%~80设备一个良好的运行环境。控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行。会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色及亮度。会影响排热,以免硬盘录像机工作不正常。控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。每月定期对监控系统和设备进行优化:合理安排监控中心的监控网络需求,如带宽IP的监控系统网络性能检测,包括网络的连通性、稳定性及带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运行状态、流量及入侵监控等。对异常情况,进行核查,并进行相关的处理。根据用软件的拆装等。提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表送监控中心负责人。、机房空调与配电设备机房空调及新风维护控制系统的维护对空调系统的维护人员而言,在巡视时第一步就是看空调系统是否在正常运行,因此我们首先要做以下的一些工作。;;;比较老的空调系统还不能够读出这些参数,这就需要晚上值班的工作人员多观察和记录。压缩机的巡回检查及维护听用听声音的方法,能较正确的判断出压缩机的运转情况。因为压缩机运转时,它的响声应是均匀而有节奏摸用手摸的方法,可知其发热程度,能够大概判断是否在超过规定压力、规定温度的情况下运行压缩机。看主要是从视镜观察制冷剂的液面,看是否缺少制冷剂。量主要是测量在压缩机运行时的电流及吸、排气压力,能够比较准确判断压缩机的运行状况。当然对压缩机我们还需要检查高、低压保护开关、干燥过滤器等其他附件。冷凝器的巡回检查及维护的固定件是否有松动的迹象,以免对冷媒管线及室外机造成损坏。检查冷媒管线有无破损的情况(当然从压缩机的工作状况及其它的一些性能参数也能够判断冷媒管线是否破损检查冷媒管线的保温状况,特别是在北方地区的冬天,这是一件比较重要的工作,如果环境温度太低而冷媒管线的保温状况又不好的话,对空调系统的正常运转有一定的影响。的扇也在转动时是否在同一个平面上。检查冷凝器的翅片有无破损的状况。检查冷凝器工作时的电流是否正常,从工作电流也能够进一步判断风扇的工作情况是否正常。动和停止。蒸发器、膨胀阀的巡回检查及维护蒸发器、膨胀阀的维护主要是检查蒸发器盘管是否清洁,是否有结霜的现象出现,以及蒸发器排水托盘排水是否(通常状况下,蒸发器盘管的温度应该比环境温度低10)适。当然出现这种现象也有可能是其它环境的原因引起的,比如空调的制冷量不够、风机故障引起风速过慢等原因造成的。加湿系统的巡检及维护1)1)由于各个地方的空气环境不同,对加湿器的使用和影响也不一样,但我们在日常的维护工作中同样要做的事情是观察加上罐内是否有沉淀物质,如有就要及时冲洗,因为现在空调的加湿罐一般都是电极式的,如沉淀物过多而又不及时冲洗的话,就容易在电极上结垢从而影响加湿罐的使用寿命。当然现在有些加湿罐的电极是可以更换的。问题的;根据我们多年来的维护来看,引起这种现象的主要原因是停水后的空气进到进水电磁阀前端,对进水电磁阀的正常开启造成了一定的影响,解决这种现象有两种比较有用的办法,一是卸开

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论