下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 服务方案一、总体维护服务方案1、预防性检查1.1 巡检时间每月1日工作日上午9点1.2、巡检地点计算机机房1.3、巡检目的进行机房检查,对机房设备及供电系统、UPS系统、精密空调系统、网络设备等设备进行检查,及时发现设备隐患,排除故障。1.4、巡检要求1.4. 1.巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、精密空调异常、UPS及配电系统异常等,应按照应急预案及操作流程进行处理。(1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。检查UPS蓄电池使用状态,确保蓄电池无松动。并使用温度枪进行检测物理温度。确保配电柜及UPS、蓄电池无温度过高现象。(2)机房环境:检
2、查机房卫生状况及物理环境。(3)机房温度:检查温湿度,将温湿度控制在一定围。温度:22±5,湿度 60%.(4)机房空调:空调运行状态、空调部有无漏水现象、空调噪音、空调风量等。(5)机房照明:机房照明系统是否正常,有无异常状况。(6)机房PDU:PDU市电或UPS是否正常,使用温度枪进行检测外部物理温度。(7)机房整体:检查机房其余设备运行状态,有无报警及指示灯异常状态。1.4. 2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。1.4.3.故障处理过程必
3、须在机房日常巡检表的备注栏中详细记录,以备查阅。1.5、计算机机房现场管理要求1.除工作人员外,其他工作人员进出机房,需签字后方可进入,同时计算机机房人员要在现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备。2.机房的机柜、线缆、设备等的标签管理;3.机房环境清理。 1.6检查容列表项目性能检查容脆弱性检查容空调系统高压压力、低压压力(风冷系统),冷冻水压力、温度,冷却水压力、温度(水冷系统),风机运行情况,滤网、机排水系统、灰尘情况等。机房热点情况、室机漏水检查、室外风机运转情况、加湿罐阳极棒检查、过滤网检查等。供配电系统输入输出功率,输入输出电流、断路开关、接地电阻、零序
4、电流、器件发热情况等。导线、器件发热情况,断路开关、防浪涌器件情况等。UPS系统负载功率情况、器件发热情况、电池情况(外观、液位、接线柱)等。器件、导线发热情况,电池放电时间等。安全系统录像备份管理、出入机房登记、器件灵敏度、画面清晰度(不同照度情况下)、云台运行等。器件灵敏度、监控死角问题等。设备运行机房环境查看设备运行指示灯、机房照明运行情况、机房环境设备运行是否有报警情况、照明是否正常、机房卫生是否整洁等2、现场故障维修 巡检过程中,如有发现设备及环境系统有故障状态,需进行记录并恢复故障状态。如不能立即恢复故障状态,则需进行应急预案处理。具体如下:2.1 环境故障:卫生、温湿度、照明。(
5、四级故障)2.2 交换机故障:交换机蜂鸣,交换机启动不正常,指示灯异常。(三级故障)2.3 空调故障:空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故障等。(二级故障2.4 UPS故障:UPS逆变故障、UPS旁路、UPS蓄电池温度、UPS蓄电池外观鼓包现象、UPS蜂鸣报警等(一级故障)2.5 配电柜故障:配电柜温度过高、配电柜打火现象等。(一级故障) 在解决故障时,最大限度做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于30分钟解决故障,应立即提出应急方案,确保业务系统的运行。故障解决后24小时,提交故障处理报告
6、。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。故障类型、级别及相应标准列表:故障级别响应时间故障解决时间I级:属于紧急问题;其具体现象为:机房出现电力事故等意外情况导致业务停止、UPS系统崩溃导致业务停止、空调系统崩溃导致业务停止。立即响应,5分钟人员抵达现场,30分钟恢复业务使用,2小时提交故障处理方案。12小时以II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。立即响应,5分钟抵达现场,1小时提交故障处理方案24小时以III级:属于较严重问题;其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。立即响应,
7、5分钟抵达现场,2小时提交故障处理方案48小时以IV级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询。立即响应,30分钟抵达现场,2小时提交故障处理方案3天3、后台故障维修 后台故障状态维修,需要在甲方允许的情况下,对设备进行维护及维修。 3.1 质保期的设备由我方查找故障原因并填写故障申请单,交由甲方进行协调处理,并协助甲方进行故障排除及维修。如需联系厂商,则由我方负责。 3.2 三级及四级故障状态,我方可自行进行维护和维修的设备,报由甲方同意后,我方自行进行设备维修,更换零配件部件等,并将维修记录保存文档交由甲方及我方双方管理。 3.3 质保期外的设备出现故障,则由我方统一进行
8、维修,费用由我方负责。并将维修记录报由甲方确认并存档。 3.4设备更换 对于无法修复的设备,在合同有效期,经甲方审核,由乙方负责整体更换同型号或类似型号的产品,无法维修的设备交由甲方。4、资产管理 4.1对硬件设备型号、数量、版本等信息统计记录 4.2对软件产品型号、版本和补丁等信息统计记录 4.3 对机房设施设备连接统计记录 4.4 对综合布线系统结构图的绘制 4.5 对机房更换设备连接统计记录4.6每月向甲方上报低值易耗品记录,包括仓库存储情况、耗材使用情况。4.7 机房更新及更换设备的统计4.8 机房维护设备及备品备件的管理及记录 5、应急处理随着网络信息化建设的不断深入,加强机房各类设
9、备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。本预案共分为应用系统故障应急流程和机房突发事件应急流程系统故障应急流程一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:1.1、运维服务中心通过网管告警发现故障1.2、维护站点通过维护巡检发现故障1.3、用户发现故障,报
10、给呼叫中心1.4、驻场工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。3、信息研判运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。4、预案启动如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。5、资源确认系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:我公司技术支持人员;相关厂家技术支
11、持人员;我公司聘请的技术专家6、预案执行按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。7、预案终止预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。8、结果上报预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。二、 系统故障应急处理流程图机房突发事件应急流程一、机房突发事件分类1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。3、
12、人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。二、 应急处理人员组织机构四、突发事件处理原则1.预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系。2.快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。3.分级负责。按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。根据各负责人的职能,各司其职,加
13、强各负责人的协调与配合,共同履行应急处置工作的管理职责。4.以人为本。把保障人员以及公共利益的安全作为首要任务。5.常备不懈。加强技术储备,规应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规化。五、机房应急开关机具体措施机房各设备关闭顺序如下:六、服务器及存储设备故障处理1、排错流程2、应急处置具体措施2.1 机房漏水应急预案 (1)发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告监控系统突发故障应急领导小组。(2)若空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空调,清除机房积水,并及时联系设备供
14、应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温。(3)若为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施确保机房安全,及时清除积水,维修墙体或门窗,消除渗漏水隐患。2.2 设备发生被盗或人为损害事件应急预案 (1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系统突发故障应急领导小组,同时保护好现场。(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。(3)事发单位和当事人应当积极配合公安部门进行调查, 并将有关情况向系统突发故障应急领导小组汇报。(4
15、)系统突发故障应急领导小组安排运维服务小组、事发单位及时恢复系统正常运行,并对事件进行调查。运维服务小组和事发单位应在调查结束后一日书面报告系统突发故障应急领导小组。事态或后果严重的,应向相关领导汇报。2.3 机房长时间停电应急预案 (1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置: (2)当机房发生市电供电突然停电或是电源异常时。首先应和后勤部门联系确认正常停电以及预计停电时间。检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电围的设备及时断电,预防突然来电时瞬间电流过大导
16、致设备损坏等现象。 (3)当确定停电时间超出机房UPS承载围后,首先确定停电的围以及受影响的设备围。并及时通知各部门做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。 (4)当确定停电原因是在本身供电系统围,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。对于恢复时间无法预计的,要通知后勤部门做好柴油机发电及移动电源车供电准备(5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成
17、设备损坏。 2.4 通信网络故障应急预案 (1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应及时通知本单位信息系统管理员,经初步判断后及时上报运维服务小组和系统突发故障应急领导小组。(2) 运维服务小组接报告后,应及时查清通信网络故障位置,隔离故障区域,并将事态及时报告系统突发故障应急领导小组,通知相关通信网络运营商查清原因;同时及时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。(3) 事态或后果严重的,应向应急指挥办公室和相关领导汇报。(4)应急处置结束后,运维服务小组应将故障分析报告,在调查结束后一日书面报告系统突发
18、故障应急领导小组。2.5 不良信息和网络病毒事件应急预案 (1)发现不良信息或网络病毒时,信息系统管理员应立即断开网线,终止不良信息或网络病毒传播,并报告指挥调度中心运维服务小组和系统突发故障应急领导小组。(2)运维服务小组应根据系统突发故障应急领导小组指令,采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。(3)事态或后果严重的,应向监控中心办公室和相关领导汇报。(4)处置结束后 ,运维服务小组应将事发经过、造成影响、处置结果在调查工作结束后一日书面报告系统突发故障应急领导小组。2.6 服务器软件系统故障应急预案 (1)发生服务器软件系统故障后,运维服务小组负责人应立即组织启动
19、备份服务器系统,由备份服务器接管业务应用,并及时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。(2)运维服务小组应根据系统突发故障应急领导小组的指令,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。(3)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。(4)处置结束后,运维服务小组应将事发经过、处置结果等在调查工作结束后一日报告系统突发故障应急领导小组。2.7 黑客攻击事件应急预案 (1)当
20、发现网络被非法入侵、网页容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组。(2)接报告后,系统突发故障应急领导小组应立即指令运维服务小组核实情况,关闭服务器或系统,修改防火墙和路由器的过滤规则,封锁或删除被攻破的登陆,阻断可疑用户进入网络的通道。(3)运维服务小组应及时清理系统,恢复数据、程序,恢复系统和网络正常;情况严重的,应向监控中心应急指挥办公室和相关领导汇报,并请求支援。(4)处置结束后 ,运维服务小组应将事发经过、处置结果等在调查工作结束后一日报告系统突发故障应急领导小组。2.
21、8 核心设备硬件故障应急预案 (1)发生核心设备硬件故障后,运维服务小组应及时报告系统突发故障应急领导小组,并组织查找、确定故障设备及故障原因,进行先期处置。(2)若故障设备在短时间无法修复运维服务小组应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。(3)运维服务小组故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查。(4)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。2.9 业务数据损坏应急预案 (1) 发生业务数据损坏 时,运维服务小组应及时报告系统突发故障应急领导小组,检查、备份业务系统当前数据。(
22、2)运维服务小组负责调用备份服务器备份数据,若备份数据损坏,则调用磁带机中历史备份数据,若磁带机数据仍不可用,则调用异地备份数据。(3)业务数据损坏事件超过 2小时后,运维服务小组应及时报告系统突发故障应急领导小组,及时通知业务部门以手工方式开展业务。(4)运维服务小组应待业务数据系统恢复后,检查历史数据和当前数据的差别,由相关系统业务员补录数据;重新备份数据,并在工作结束后一日报告系统突发故障应急领导小组。2.10 雷击事故应急预案 (1) 遇雷暴天气或接上级部门雷暴气象预警,运维服务小组应及时报告系统突发故障应急领导小组,经请示同意后关闭部分服务器,切断电源,暂停部计算机部分网络工作。(2
23、) 雷暴天气结束后,运维服务小组报经系统突发故障应急领导小组同意,及时开通服务器,恢复部计算机网络工作,对设备和数据进行检查。(3) 因雷击造成损失的,运维服务小组应会同相关部门进行核实、报损,并在调查工作结束后一日书面报告系统突发故障应急领导小组。必要时,应向监控中心应急指挥办公室和相关领导汇报。2.11 空调设备故障应急预案 若机房专用空调损坏,应第一时间启用机房备用空调,并通知厂家上门进行维修,并及时报告信息部相关领导请示,获得授权后按机房设备关闭顺序关闭各类设备。2.12 火灾事故应急预案(1)一旦机房发生火灾,应遵照下列原则:首先确保人员安全;其次保护关键设备、数据安全;三是保护一般
24、设备安全;(2)人员疏散的程序是:机房工作人员立即按响火警警报,并通过119向公安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线路,迅速从机房中撤出;(3)人员灭火的程序是:首先切断所有电源,启动自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。2.13 电源设备故障应急预案机房目前使用UPS系统,在紧急情况发生时,应按如下步骤进行关机:(1)确认所有负载均已安全关机。(2)关闭UPS负载电源。(3)将UPS的系统启用开关切换到off 的状态。(4)将电池连接断路器切换到off的位置。维护管理方案1、路由器、交换机和服务器以及通信设
25、备是网络的关键设备,须放置计算机机房,不得自行配置或更换,更不能挪作它用。2、计算机房要保持清洁、卫生,并由专人7×24负责管理和维护(包括温度、湿度、电力系统、网络设备等),无关人员未经管理人员批准严禁进入机房。3、严禁易燃易爆和强磁物品及其它与机房工作无关的物品进入机房。4、建立机房登记制度,对本地局域网络、广域网的运行,建立档案。未发生故障或故障隐患时当班人员不可对中继、光纤、网线及各种设备进行任何调试,对所发生的故障、处理过程和结果等做好详细登记。5、做好操作系统的补丁修正工作。6、网管人员统一管理计算机及其相关设备,完整保存计算机及其相关设备的驱动程序、保修卡及重要随机文件
26、。7、计算机及其相关设备的报废需经过管理部门或专职人员鉴定,确认不符合使用要求后方可申请报废。定期检查方案与计划定期维修 定期维修是按时间计算,应对机房和机房设备作定期检修。维修应包括以下容: 1 )对机房部和周围环境作一次彻底性的清理,把卫生搞好。 2)对机房所有设备作一次清洗,除尘。 3)对空调设备、新风设备的过滤装置作一次清洗。 4)排除设备在使用时出现的故障和缺陷。 5)检查、测试机房电源系统工作的情况,并做好登记。 6)检查、测试机房空调设备工作的情况,并做好登记。 7)其它检查。换季维修 换季维修是在每年进入夏季之前和进入冬季之前为保障机房及机房设备在盛夏和严冬能正常使用而进行的预
27、防性检查。换季维修应包括以下容: 1 )完成定期维修的容。 2)对空调设备中的蒸发器、冷凝器进行一次大清洗、大检查。 3)检查并排除影响冷凝器散热效果的障碍。 4)检查空调设备加湿水的供应状况。 5)检查空调设备冷凝水的排泄管道是否畅通,有无异物堵塞。 6)检查加热装置的工作状况。 7)检查各种电缆、导线的固定,走向及通电后温升情况是否符合要求。 8)检查各种安全设备、防火设备及报警设备的工作状况。 9)夏季到来之前,还应检查机房防水 (或雨水)浸入室措施落实的情况。 10 )其它检查。 重大任务开始前检修 在重大任务开始前,为了保障机房及设备正常运行,为顺利完成重大任务提供可靠的环境而进行的
28、检修。主要应包括: 1 )完成季节性检查的维修容。 2)根据任务的要求,定向检查一些有关设备的情况。 3)为了保障重大任务约完成,临时增设一些设备的安装和调试。 4)其它有关的检查维修。定期中修计算机机房及其设备经过一段较长时间的连续使用,机件的磨损和自然老化,会使机房和设备存在一些问题,为了保障机房和设备进一步使用,必须认真地对机房和设备进行维修。设备连续使用10000小时左右要进行中修,其主要容有: 1 )机房的结构,外部环境的检修。机房建筑结构的变化。机房的严密性。从机房穿过的为楼其它楼层使用的各种管线对机房的影响。机房与外部各种连接用管路的畅通、密封性检修。机房周围环境的变化情况对机房
29、的影响。 2)机房装修部分的检修。机房吊顶部分要打开一些活动顶板。检查顶部各种电缆、信号线、管道的连接、固定。清除吊顶上的积尘。受损吊顶的更换、调整。对机房墙面装饰板进行全面的检查,清洁。机房活动地板打开一部分进行检查。检查地板下电缆、导线、信号线各种设备使其附件的固定。清洁地板下部的积尘。对损坏、变色地板的更换和调整。检查机房各种门、窗、隔断的固定,玻璃密封条的完整性。门和窗的关闭、开启的灵活性。关闭时的密闭性。对损坏灯具、门窗拉手、照明开关的修理、更换。 3)完成空调制冷系统中修的检查。检查压缩机、排除异常情况。清洗蒸发器、冷凝器、蒸发器,特别对室外机要重点清洗。对润滑系统清洗,更换润滑油
30、。清洗、更换过滤网。检查皮带松紧情况,调整到合适的程度。检查电器线路的完好和控制开关的灵活性,接触的可靠性。检查制冷剂是否泄漏,需要时予以补充。检查冷凝管道有无损伤、变形。检查上下水管道是否畅通,接口有无裂缝。测试各个部位的工作性能参数。对怀疑部位进行认真检查,消除疑点。4)完成机房供配电系统的中修检查。检查市电的电压是否稳定。配电柜各接触点是否牢固,如有松动及时紧固。调整机房三相电源使之均衡分配。检查电源线套管有无破损、各类开关、控制器是否灵敏,并加以解决。各类插座有无损坏并予以更换。整顿机房使用中用电的不规行为。 5)完成UPS电源定期检测容。检查并清理使用UPS的非计算机类设备。测量UP
31、S的输入输出电压是否正常并加以解决。对非免维护的UPS的电池进行一次放充电。清理蓄电池的灰尘并检查有无泄漏情况。 6)对机房接地系统进行一次全面的检查测试。计算机直流接地电阻小于一欧姆。计算机交流接地电阻小于四欧姆。计算机安全接地电阻小于四欧姆。若使用组合接地系统,则计算机组合接地电阻小于一欧姆。 7)对安全消防系统和自动报警系统的设备和线路进行一次全面的检查、测试。设备的固定。线路和管路的固定和连接。探头技术性能要进行实测。消防系统有关附件的技术性能测试和联动试验。检查灭火气体设备间使之符合设计要求,钢瓶压力达到技术指标。非气体灭火的其它灭火设施,均应符合技术要求。更换手提灭火器材。 8)中
32、修后要对机房的状况和设备技术性能作一次全面的结论。在结论中应有以下容:机房环境的技术性能。机房外部影响的程度。机房设备主要技术性能参数及使用状况评估。需要更新的机房设备。对机房使用状况的评估。 8.5. 定期大修 机房及其设备连续使用30000小时左右时要对机房及其设备进行大修。大修时除完成中修容和排除机房设备故障外还应增加以下容: 1 )机房的外部环境的影响 对影响机房的外部环境进行调查和测试,在调查的基础上制定改造的方案。 2)机房本身建设结构的状况 对机房本身建筑的现状进行一次全面的检查评估,写出调查报告,制定整修计划。 3)机房部装修 要对机房部装修情况进行一次全面的整修。在整修前要对
33、机房各部位,各方面进行检查,制定整修计划。机房吊顶、地板要全部打开进行检查、清洁;对吊顶、地板的平整度进行调整;更换裂缝、起鼓、脱皮、变色的微孔顶板和活动地板;补刷楼层顶板、地板的防尘漆;墙面饰板严重变形或损坏的要重新更换。 4)按大修容完成空调制冷设备的检查,制冷系统大修就是要对机房空调设备和新风设备进行全面的测试、调整。重点是: 完成中修的容。 清洗压缩机外壳的油垢和灰尘。 检查并校验温湿度探头和各类控制器的灵敏度、准确性,如 果有损坏或动作失调的应予更换。 监测系统中的所有阀门并试压。 检修保温管道及绝热材料,不合格的应重新作保温。 清洗室外机、散热器,并清理其周围的杂物,保证散热充分。
34、 清除辅助设备表面的特铁锈,吹出部的油腻。 做好大修后的试运行和测试工作。 5)完成供配电系统全面的大修检查。 检查应符合国家和当地供电部门有关规定。检查后应有供电部门的合格证方可重新使用。 6)对机房专用UPS电源进行全面的检查测试。 在大修中要对机房专用UPS电源作以下性能检测: 检查UPS电源部的附件,各种电缆、信号线的固定。 对UPS电源作一次全面的清洁。 检查各接线端的可靠性,清洁各种开关、接触器的触点。检 查弹簧的强度和灵活性。 检查各种集成电路板的固定和清洁应良好。 检查蓄电池的性能 对蓄电池作放电试验。 逐个测量每个蓄电池的终了电压。 对蓄电池作24个小时充电。 不合格的蓄电池
35、要摘除,摘除蓄电池的个数不能多于UPS电源对蓄电池组的最低限度。 蓄电池组不能满足要求时要全部更新。 对UPS电源性能作全面的评估。 7)对安全消防系统进行一次全面技术性能检查。 报警系统的可靠性和准确性检验。 灭火系统管路按规定作耐压试验。 灭火剂瓶 (罐)做耐压试验。 灭火药剂如果过期、压力不足应更换或补充。 对照竣工图逐个检查烟感、温感探头的灵敏性。 此项工作应由消防专业人员完成并由消防主管部门现场检查 指导。 8)对接地系统进行全面测试。 如果是机房专用接地系统,在条件允许时,可抽查部分接地体 在地下的锈蚀状况,接地电阻若达不到要求时,可补做或增加 接地体。 9)机房大修后要进行全面验
36、收。机房大修应组织有机房专业装修资格的公司完成,大修完成后应按机房标准和大修要求进行检查验收。机房维护服务方案1、机房维护的必要性 1.1、机房设备十分爱干净,对灰尘特别“感冒”。如果设备长期处于灰尘漫舞的环境中工作,很容易发生故障,因为灰尘会不知不觉地渗入设备的控制框中,并直接覆盖到它的电子线路中。时间一长,设备部的工作电路就会散热不良,长此以往自然就容易出现故障。 1.2、设备都害怕潮湿。设备部有电子线路,如果电子线路中的各个元器件长期在潮湿环境中工作,其电气性能会逐步下降,而且还有可能产生漏电现象,引发火灾
37、事故。 1.3、设备对环境温度十分敏感。高于40的环境或低于0的环境会降低设备的工作效率,使它的潜能得不到充分发挥,从而减少使用寿命。 1.4、机房的硬件设备品牌过多、产品供应商过多,厂家售后保障措施不到位等等原因,导致设备使用一段时间后,设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。 2.1机房监控设备维护管理:供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备(包含摄像头、硬盘录像机)、监控主机;2.2机房空调与配电设备维护管理:精密空调机组、新风设备;
38、UPS及电池、主配电柜、UPS配电柜;2.3机房消防设备维护管理:各种探测器、手动报警按钮和报警控制器,灭火剂的控制装置;2.4机房供水水路、电路及照明线路的维护管理:水、电路管线及接口的检查维修。2.5机房基础维护管理:机柜线路的整理、标签检查更换、机房除尘清洁、地板、墙面、吊顶、门窗及有关配套的维护管理2.6机房主机设备维护管理:计算机服务器(包括PC服务器、存储服务器);网络设备(路由及交换设备等);KVM系统;2.7机房运维管理体系建设:完善机房运维规,优化机房运维体系;3、维护具体需求3.1机房监控设备:1) 每季度一次设备的除尘、清理,扫净监控设备显露的尘土,对摄像机、防
39、护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体,确保机器正常运行。同时检查监控机房通风、散热、净尘、供电等设施。室外温度应在20 60,相对湿度应在10100;室温度应控制在535,相对湿度应控制在1080,留给机房监控设备一个良好的运行环境。2)根据监控系统各部份设备的使用说明,每月检测其各项技术参数及监控系统传输线路质量,处理故障隐患,协助监控主管设定使用级别等各种数据,确保各部份设备各项功能良好,能够正常运行。3)对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象应及时更换、
40、维修,如视频头、采集模块等。4)对易吸尘部份每季度定期清理一次,如监视器、漏水检测主机、门禁主机等暴露在空气中,由于屏幕的静电作用,会有许多灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色及亮度。5) 对长时间工作的监控设备每月定期维护一次,如硬盘录像机长时间工作会产生较多的热量,一旦其电风扇有故障,会影响排热,以免硬盘录像机工作不正常。6) 对监控系统及设备的运行情况进行监控,分析运行情况,及时发现并排除故障。如:网络设备、服务器系统、监控终端及各种终端外设。桌面系统的运行检查,网络及桌面系统的病毒防御。 7)每月定期对监控系统和设备进行优化:
41、合理安排监控中心的监控网络需求,如带宽、IP地址等限制。提供每月一次的监控系统网络性能检测,包括网络的连通性、稳定性及带宽的利用率等;实时检测所有可能影响监控网络设备的外来网络攻击,实时监控各服务器运行状态、流量及入侵监控等。对异常情况,进行核查,并进行相关的处理。根据用户需要进行监控网络的规划、优化;协助处理服务器软硬件故障及进行相关硬件软件的拆装等。 8)提供每月一次的定期信息服务:每月第一个工作日,将上月抢修、维修、维护、保养记录表以电子文档的形式报送监控中心负责人。3.2、机房空调与配电设备2.1机房空调及新风维护2.1.1控制系统的维护对空调系统的维护人员而言,在巡视时第一
42、步就是看空调系统是否在正常运行,因此我们首先要做以下的一些工作。1)从空调系统的显示屏上检查空调系统的各项功能及参数是否正常;2)如有报警的情况要检查报警记录,并分析报警原因;3)检查温度、湿度传感器的工作状态是否正常;4)对压缩机和加湿器的运行参数要做到心中有数,特别是在每天早上的第一次巡检时,要把前一天晚上压缩机的运行参数和以前的同一时段的参数进行对比,看是否有大的变化,根据参数的变化可以判断计算机机房中的计算机设备运行状况是否有较大的变化,以便合理地调配空调系统的运行台次和调整空调的运行参数。当然,对目前而言有些比较老的空调系统还不能够读出这些参数,这就需要晚上值班的工作人员多观察和记录
43、。2.1.2压缩机的巡回检查及维护1)听用听声音的方法,能较正确的判断出压缩机的运转情况。因为压缩机运转时,它的响声应是均匀而有节奏的。如果它的响声失去节奏声,而出现了不均匀噪音时,即表示压缩机的部机件或气缸工作情况有了不正常的变化。2)摸用手摸的方法,可知其发热程度,能够大概判断是否在超过规定压力、规定温度的情况下运行压缩机。3)看主要是从视镜观察制冷剂的液面,看是否缺少制冷剂。4)量主要是测量在压缩机运行时的电流及吸、排气压力,能够比较准确判断压缩机的运行状况。当然对压缩机我们还需要检查高、低压保护开关、干燥过滤器等其他附件。2.1.3冷凝器的巡回检查及维护1)对专业空调冷凝器的维护相当于
44、对空调室外机的维护,因此我们首先需要检查冷凝器的固定情况,看对冷凝器的固定件是否有松动的迹象,以免对冷媒管线及室外机造成损坏。2)检查冷媒管线有无破损的情况(当然从压缩机的工作状况及其它的一些性能参数也能够判断冷媒管线是否破损),检查冷媒管线的保温状况,特别是在北方地区的冬天,这是一件比较重要的工作,如果环境温度太低而冷媒管线的保温状况又不好的话,对空调系统的正常运转有一定的影响。3)检查风扇的运行状况:主要检查风扇的轴承、底座、电机等的工作情况,在风扇运行时是否有异常震动机风扇的扇也在转动时是否在同一个平面上。4)检查冷凝器下面是否有杂物影响风道的畅通,从而影响冷凝器的冷凝效果;检查冷凝器的
45、翅片有无破损的状况。5)检查冷凝器工作时的电流是否正常,从工作电流也能够进一步判断风扇的工作情况是否正常。6)检查调速开关是否正常,一般的空调的冷凝器都有两个调速开关,分为温度和压力调速,现在比较新的控制技术采用双压力调速控制,因此我们在检查调速开关时主要是看在规定的压力围,调速开关能否正常控制风扇的启动和停止。2.1.4蒸发器、膨胀阀的巡回检查及维护蒸发器、膨胀阀的维护主要是检查蒸发器盘管是否清洁,是否有结霜的现象出现,以及蒸发器排水托盘排水是否畅通,如蒸发器盘管上有比较严重的结霜现象或在压缩机运转时盘管上的温度较高的话(通常状况下,蒸发器盘管的温度应该比环境温度低10左右),就应当检查压缩
46、机的高、低压,如果压力正常的话,就应考虑膨胀阀的开启量是否合适。当然出现这种现象也有可能是其它环境的原因引起的,比如空调的制冷量不够、风机故障引起风速过慢等原因造成的。2.1.5加湿系统的巡检及维护1)由于各个地方的空气环境不同,对加湿器的使用和影响也不一样,但我们在日常的维护工作中同样要做的事情是观察加上罐是否有沉淀物质,如有就要及时冲洗,因为现在空调的加湿罐一般都是电极式的,如沉淀物过多而又不及时冲洗的话,就容易在电极上结垢从而影响加湿罐的使用寿命。当然现在有些加湿罐的电极是可以更换的。2)检查上水和排水电磁阀的工作情况是否正常。在加湿系统工作的过程中,有一种情况经常出现,但又不容易判断,
47、即在空调系统正常工作的时候,由于某种原因出现了一段时间的停水,后又恢复供水,在恢复供水后加湿罐不能够正常上水,出现这种现象的原因有多种,并且在大多数空调器的控制系统中直接对加湿系统复位通常是不能够解决问题的;根据我们多年来的维护来看,引起这种现象的主要原因是停水后的空气进到进水电磁阀前端,对进水电磁阀的正常开启造成了一定的影响,解决这种现象有两种比较有用的办法,一是卸开进水口,排掉空气,二是关掉加湿系统的电源,重新给电磁阀上电也基本上能够解决这类问题。3)检查加湿罐排水管道是否畅通,以便在需要排水和对加湿罐进行维修时顺利进行。4)检查蒸汽管道是否畅通,保证加湿系统的水蒸汽能够正常为计算机设备加
48、湿。5)检查漏水探测器是否正常,这对加湿系统来说是比较重要的一环,因为排水管道如果不畅通的话就容易形成出现漏水的情况,如漏水探测器不正常的话,就易出现事故。当然,对一般的空调系统而言,漏水探测器是选件,如空调系统未配有漏水探测器,那么我们更要注意监测排水管道是否畅通,同时也要做好机房防水墙的维护工作。2.1.6空气循环系统的巡回检查及维护对空气循环系统我们主要是考虑空调系统的过滤器、风机、隔风栅及到计算机设备的风道等因素。因此我们在日常维护工作中要做好以下的一些工作:1)计算机机房的设备经常有设备移动的现象,而设备的移动一般又不是由空调设备的维护人员去完成,因此我们在设备移动后应及时检查机房的
49、气流状况,看是否有气流短路的现象发生,同时在新设备的位置是否存在送风阻力过大的情况。如有上述现象应及时调整,如果实在调整不过来,应建议设备移到新的合适的位置。2)检查空调过滤器是否干净,如脏了就应及时更换或清洗。3)检查风机的运行状况:主要是检查风机各部件的紧固情况及平衡,检查轴承、皮带、共振等情况;对风机的检查应该特别仔细,因为蒸发器的热交换过程主要是由在风机的作用下使快速流动的气流经过低温的蒸发器盘管来完成的,从而使空调达到制冷的效果,所以风机的是否正常运行是空调系统是否正常运行的最后体现;对风机而言当然最重要的就是电机了,因此我们在日常维护中首先就应查看其皮带的状况、主从动轮是否在同一面
50、上等;皮带调整的松紧程度要合适,太松容易打滑,太紧对皮带的磨损太快,皮带的松紧跟外部对静压得需求也有比较大的关系,当然这种调整是在空调系统控制的围之进行的;现在部分比较先进的空调系统采用了一体化的风机,就解决了皮带调整的问题。4)测量电机运转电流,看是否在规定的围,根据测得的参数也能够判断电机是否是正常运转。5)测量温、湿度值,与面板上显示得值进行比较,如有较大的误差,应进行温度、湿度的校正,如误差过大应分析原因。出现这种情况从我们的维和经验来看有两种原因:一是控制板出现故障,二是温度、湿度探头出现故障需要更换。6)检查隔风栅的关闭情况是针对已经停机的空调而言的,这也是我们在日常维护工作中比较
51、容易遗漏的一个环节,但也是一个比较重要的环节,因为一台空调停止运行,如果隔风栅未关闭其温度、湿度探头检测到的是其它空调的出口的温度和湿度,在空调下一次开启时控制系统就会根据其先前检测到的参数而对空调系统的运行情况做出控制,这时空调控制系统就会对压缩机、加湿、除湿系统地运行情况做出错误的指令。现在大多数空调设计时都没有考虑这种状况对空调系统的影响,因为这种影响的时间较短,在较短的时间系统会根据新的信息达到正常的运行状况,所以没有设计隔风栅,这种影响虽然较小,但我们认为在要求很高的计算机机房中我们最好不要让系统出现一段时间的错误运行,因此我们可以为空调系统人为地增加隔风栅。7)检查计算机及其它需要
52、制冷的设备进风侧的风压是否正常,因为随着计算机设备的搬迁和增加,地板下面的线缆的增加有可能就影响空调系统的风压,从而造成计算机及其它设备跟前的静压不够,这就需要我们设备维护和管理人员对空调系统的风道做出相应的调整或增加空调设备。2.2 UPS及电池维护 2.2.1测试及记录主机运行参数,2.2.2 根据实际情况进行电池核对性容量测试;2.2.3 用专用仪器对后备用蓄电池组逐个测量,进行充放电维护及调整充电电流,确保电池正常工作; 2.2.4 检查风机及风道情况并清洁,主机外观清洁、部除尘;2.2.5检查记录输出波形、谐波含量、零地电压等,2.2.6清洁
53、系统主设备及电池等,2.2.7查清各参数是否正确或切合实际,能及时发现事故隐患2.2.8 UPS各项功能测试,如检查逆变器、整流器等启停、电池管理功能,有条件进行UPS同市电的切换试验。2.2.9 检查主机、电池及相关配电引线及端子的接触情况是否可靠,并测量记录压降及温升,有条件地进行相关紧固工作等。2.2.10观察可能出现的元件老化或损坏现象、电容是否有膨胀或漏液迹象、磁性元件是否过热或分层迹象2.2.11 并机系统进行单机运行测试,热备份系统负荷切换测试等2.3 低压配电柜维护2.3.1低压配电柜带电清洗维护:2.3.2检查电气盘柜的部分触点、接线柱等有氧化锈
54、蚀; 2.3.3电气设备外壳用手触摸感觉温度异常高;2.3.4检查有些电气设备的部有无声音异常; 2.3.5清理绝缘子表面沉积了污秽物质等;2.3.6接线柱加固,标签更换,2.3.7测试输入输出频率;电流电压等3.5机房基础维护3.5.1吊顶表面清洁;板材松动、翘起修复,变形、损坏更换;龙骨调平等3.5.2墙面污迹清理,裂缝修补3.5.3玻璃清洗,不锈钢清洗,玻璃胶修整,地弹簧校正,拉手螺丝加固3.5.4静电地板清洗清洁,地面除尘;缝隙调整;平整度调整;损坏更换3.5.5接地电阻测试;主接地点除锈、土壤降阻、接头紧固;防雷器检测;接地线触点防氧化加固。3.5.6线路测试;模块、光纤配线检查;标
55、签检查;整理凌乱线缆;对甲方所发生的故障及时排除;编写更新文档、表格和对应表来显示其物理链路3.5.7机柜除尘、清洁;机柜及网络设备整理,包括交换机、配线架和网线的重新整理、排序,并重新标上统一的编号3.6机房主机设备维护3.6.1提供计算机专业知识咨询、操作;3.6.2网络进行全面维护、升级硬件设备建立计算机信息卡,并以标签的形式粘贴在计算机主机上。信息卡容包括:机器名、机器编号、使用人、机器配置、IP地址、备注等。3.6.3安装杀毒软件、病毒防火墙,定期为计算机查杀毒和病毒库升级服务3.7房运维管理体系建设:完善机房运维规,优化机房运维体系;结合中心机房业务工作及信息化建设实际,制定机房主
56、机设备维护制度、机房环境系统维护制度、电气设备操作手册等用于完善机房运维,在已有的流程制度基础上,进一步细化完善,使之成为一整套高效、合理、适用的机房运维管理流程4、维护服务质量1、提供专用技术咨询,如果技术支持不能解决问题,服务提供商将派出技术人员到现场协助解决,根据系统故障的程度提供不同的响应时间和故障排除时间:故障程度响应时间故障排除时间(工作小时)一般故障1小时6小时(市区)严重故障30分钟2小时(市区)系统紧急故障立即1小时2、对本项目涉及的设备进行1年4次(即每季度一次)的定期检测、保养、可预防性的对设备进行检测,并且出具检修报告及时向用户方汇报设备运行状态,报告由用户方确认,双方存底备查。任何故障的维修响应时间为全天24小时。3、设备或材料产生损坏时,服务商负责送设备至原厂进行维修或更换,当维修或更换设备所需要的时间超过3个工作日(计算机服务器、网络设备等须在1个工作日),则必须提供档次不低于送修设备的备件。在维护期间,提供保修服务(保修服务包括维护、检测、设备免费维
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《销售人员培训方案》课件
- 肱骨干骨折的健康宣教
- 《保险营销渠》课件
- 卡波西水痘样疹的临床护理
- 《机械设计基础》课件-第0章
- 《改革开发的时代》课件
- 外耳道乳头状瘤的健康宣教
- 毛发腺瘤的临床护理
- 中国共产党精神谱系(威海职业学院)知到智慧树答案
- 《计算题解答》课件
- 量具能力准则Cg-Cgk评价报告
- 嘉兴市七年级数学压轴题专题
- 高中化学必修二《乙烯》教案-新版
- 中学生零花钱数量及用途的调查报告模板
- 2023新时代解决台湾问题的总体方略PPT
- 游泳安全保障制度和措施
- 高中语文-《桂枝香金陵怀古》教学设计学情分析教材分析课后反思
- 小水电站风险隐患排查表
- 山东师范大学《计算机基础》期末考试复习题及参考答案
- 2023年内蒙古自治区乡村医生招聘笔试模拟试题及答案解析
- 年产1000万件日用陶瓷陶瓷厂工艺设计
评论
0/150
提交评论