




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
XXX数据中心运维方案XXX数据中心运维方案全文共44页,当前为第1页。项目背景XXX数据中心运维方案全文共44页,当前为第1页。XXXXXX项目需求本项目主要采购内容为XXXXXXX基础设施设备的维修和保养服务。设备维修服务是指当最终用户的设备出现故障(如服务中断、数据丢失、设备不能正常工作等)时,投标人须为最终用户提供软硬件修复、备件更换及系统软件故障排除的服务。设备保养服务是指定期、例行的维修,以帮助设备保持正常运转,防止任何计划外的停机和设备意外故障造成的昂贵费用。在实际问题出现之前仔细规划和安排设备维修,准确记录过去的检查和维修报告,了解每个部件的使用寿命,了解更换频率。向最终用户提供建议:更换零件的适当时间并预判可能需要更换的备件。服务范围XXXX系统XXXX设备以上设备还包括但不限于:相关输入输出电缆、管路连接件、涡轮杆型碳钢蝶阀、排污阀、温度计、压力表、流量计、电动三通阀、电动阀、止回阀、温度传感器、Y型过滤器、压差旁通阀、截止阀、水表等零备件,全部包含在服务范围之内。3.弱电系统(包含相关硬件及软件):电力监控系统;动环/集中监控系统;BA系统;防盗报警系统;门禁系统视频监控系统(包含摄像机和存储服务器);视频矩阵及大屏显示系统。XXX数据中心运维方案全文共44页,当前为第2页。服务内容XXX数据中心运维方案全文共44页,当前为第2页。我司提供7X24小时的统一服务电话,受理故障报修,解答最终用户技术人员的技术咨询问题。当设备发生故障时,我司将启动公司的多层技术资源支持,帮助客户排查问题,直到问题最终获得妥善处理。对于客户系统的重要问题,我司将至少每天汇报一次问题解决情况,协助最终用户进行问题定位,就解决问题所需要相关系统信息的收集方法,指导最终用户的技术人员。我司将帮助最终用户进行问题根源的分析和诊断,提出解决问题的建议方案。当设备发生故障时,我司将派合格的技术人员(对于具有原厂授权的设备故障,我方将协调原厂技术人员)在4小时内到达事故现场并修复故障,如4小时内未能修复故障,我方将在此4小时内提出解决此类问题的紧急预案方案,以恢复系统的正常运行。在设备维修中如需更换备件,我司将免费提供备件并进行更换(大件的维修更换,根据原厂家的维修解决方案另行商议,我方将在报价部分对大件设备进行报价)。我司如有幸中标将提供原厂商生产的同型号全新部件或者原厂商生产的兼容型号的全新部件,每次更换硬件部件时将出示该部件为原厂商生产证明,如我司采用不符合要求的部件替换故障部件,最终用户有权要求我方更换,给最终用户造成损失的,最终用户有权要求给予损失赔偿。更换下来的备件,如果是可能造成环境污染的物质,我司将交予具备相关废弃物处理资质的机构对其进行无害化处理,并且出具书面处理报告。我司将针对不同的设备,制定详细的保养计划,保证每年4次的设备保养。设备保养完毕,我司将提供书面的保养报告与最终用户。我司提供的护养材料,符合行业质量标准。如最终用户需要对设备进行保养或检修时,最终用户须提前2个工作日通知我司,我司将提供合格的技术人员进行现场技术支持。此项服务,每年应不超过4次。每次服务,我司将提供服务报告给最终用户,由最终用户签字认可。我司将以自己的设备、技术和劳力,完成设备护养工作。未经最终用户同意,我司绝不将设备护养主要工作交由第三人完成。若发生上述情况,我司将向最终用户承担所发生损失的赔偿责任。因我司护养不善造成设备及其相连管线的损坏、XXX数据中心运维方案全文共44页,当前为第3页。灭失的,我司将向最终用户承担赔偿实际损失的责任。XXX数据中心运维方案全文共44页,当前为第3页。服务SLA指标要求在本项目的服务过程中,我方将严格遵守以下SLA指标要求,响应甲方对本项目的服务要求。服务项目服务指标要求应急响应提供7*24小时热线服务工作日:5分钟响应,1小时内提出应急响应方案,4小时到现场解决问题;非工作日:15分钟响应、1小时内提出应急响应方案,4小时到现场解决问题;如4小时内未能修复故障,则须在此4小时内提出解决此类问题的紧急预案方案,以恢复系统的正常运行;备品备件须8小时到现场。如确有备件无法保证8小时到现场,经双方协商,投标人应保证3天备件到现场。服务期限本项目服务期限自合同签订生效之日起1年。项目需求理解随着云计算的发展,机房规模急剧扩大、机房数量不断增加,由小规模、封闭式、单一功能向大规模、开放式、多功能方向发展,机房管理更为重要。机房运维水平的高低也直接影响着机房的使用率和使用寿命,机房运维应引起机房管理人员的高度重视。尤其对于XXXXXXXXXXXXXX这样的大型数据中心来说,一方面对机房稳定性有着超高的需求,另一方面对安全性、专业性也有着超过一般数据中心的多方面需求。如果没有一支专业运维团队对各种系统、基础设备进行统一规划管理,那对于机房来说将是一场灾难。通过专业化、规范化基础设施管理,有效维护机房的基础设备运行健康,增强各基础系统的安全性、可靠性和可维护性;延长系统设备的使用寿命,降低系统的故障率和维护成本;使用户更加熟练操作设备,提高设备利用率;对本数据中心来说是有着至关重要的作用的。通过对本项目的需求理解,我们对本项目的XXX数据中心运维方案全文共44页,当前为第4页。需求总结为以下三个方面:XXX数据中心运维方案全文共44页,当前为第4页。1. 确保XXXXXXXXXXXXXX机房基础设备健康运行,通过对机房基础设备、环境设备定期检测的定期维护保养,保障机房各设备运行稳定,延长设备生命周期,降低故障率。2. 确保设备在突发事故,影响XXXXXXXXXXXXXX正常运作情况下,通过协调各个产品供应商调配设备、人力资源。可快速分析问题,给出解决问题预案,并快速解决故障。3. 对机房进行科学合理的系统扩容、升级规划的跟踪、预测,从而保证系统能够满足不断增长的应用需要。难点分析及实施方法缺少专业的维护人员是本项目的难点目前许多机房运维已经实现从人工运维到计算机管理,但在同客户的交流中发现其中很多机房运维管理还只是处在“半自动化”的运维状态。因为这种机房运维仍然是等到机房故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的机房运维管理模式经常让机房管理者疲惫不堪。在机房运维过程中,只有当事件已经发生并已造成业务影响时才能发现和着手处理,这种被动“救火”不但使机房运维人员终日忙碌,也使机房运维本身质量很难提高,导致机房使用者对机房运维的服务满意度都不高。目前绝大多数的机房运维人员日常大部分时间和精力是处理一些简单重复的问题,而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,使到机房运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且常常会出现恶性连锁反应。由以上问题可以看出本项目主要存在的难点是:缺少专业的维保人员和技术人员对日常维护做有序的梳理,没有充足的维保工作经验,不能把故障消灭在萌芽状态。数据中心的日常运维工作是至关重要的。设备故障时,应提供快速的备件供应、技术支持、故障处理等服务。通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生,避免不必要的经济损失。解决本项目难点的主要实施方案是:通过引入专业的维护公司进行日常运维XXX数据中心运维方案全文共44页,当前为第5页。工作。建设及使用单位相关管理人员可从日常需要完成专业性很强的维护保养工作中解放出来,重点做好管理及协调工作,更好的发挥信息或科技部门的其它职能。XXX数据中心运维方案全文共44页,当前为第5页。通过专业、系统、全面的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态,提高系统的安全性,做到为客户排忧解难,减少客户人力、物力投入的成本,为机房内各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,使可用价值最大化。通过专业的维护,将数据中心机房内各类设备的运行数据进行整理,进行数据分析,给客户的机房基础设施建设、管理和投入提供依据。对现有设备运行情况的了解程度是本项目实施难点对设备的了解程度,直接影响设备在维保过程中的故障判断和维修时间,对设备了解程度的不同,直接影响维护效率,在对机房装饰、装修、机房供配电系统、UPS系统、新风排风系统、空调系统、门禁系统、动力环境监控系统、机房消防系统进行维保前,首先要对这些设备的详细参数、近几年的运行状态、巡检记录、维修记录、备件更换记录等资料文档进行详细的了解和分析。对频发的故障、系统报警、备件等,工程师应制订有针对性的维护方案和必要的备件储备。在巡检过程中有针对性的进行检查,及早发现问题处理问题。解决方案:如我方有幸中标,我放将在进场之初将对现场各系统的图纸进行全面的熟悉,并结合现场实际情况记录各个设备的现在的运行情况充分了解,进行巡检预演和虚拟故障维护演练,从根本上提高我方对现场设备的熟悉度,提高故障解决效率。管线设施的维保是本项目的难点管线设施在设备维保项目中常常被忽视,也是最容易酿成事故的导火索。在本项目机房建设过程中,各机房空调冷媒管汇集在有限的走廊顶部空间和垂直管道竖井内通往裙楼屋顶。当管路出现漏氟现象,维修不及时会导致空调停机,影响IT设备的散热,事故严重会导致IT设备宕机,对系统安全运行构成隐患。在对设备巡检过程中,对于工程师来说,这些管线的巡检和维护并不在工作职责范围内,因此,管线设施的维护在本项目中非常重要。解决方案:如我方有幸中标,我方将对本项目的管路、线缆进行统一梳理,XXX数据中心运维方案全文共44页,当前为第6页。对走廊顶部、垂直空间内的管线逐项巡检,记录管路、线缆的通过方向和所对应的系统。管路和线路有磕碰、破损、通过空间狭窄的地方,一一记录在巡检方案内,方便项目实施后我方排查故障点。通过前期对管路、线缆的巡检,做到管路、线缆路由明确、管控明确的目标,为后期运维工作打下坚实基础,提高运维工作效率。XXX数据中心运维方案全文共44页,当前为第6页。服务优势XX计算机XX有限公司的前身XX计算机公司始创于1987年,是我国IT产业的开路先锋。多年来,XX公司依托华北计算技术研究所的雄厚实力和鼎力支持,先后承担了数百项国家大型信息化项目,数据中心机房的建设和实施工作。在多年服务于各级政府信息化建设的过程中,XX公司不断提高业务水平,建立了完善的技术支持和售后服务体系,拥有一支优秀的、高素质的服务队伍和一套严格的服务标准和服务流程。XX公司拥有丰富的IT服务经验,多年的工程实践培养造就了一批既精通专业技术又熟悉业务流程,且具备过硬工作作风的员工队伍。XX公司的技术支持服务中心,可为用户提供全方位的、高效的、及时的技术支持和售后服务,可迅速地为用户解决应用过程中出现的问题。持续的服务保障体系、真正的用户化服务模式及迅速的维护响应是我们服务的特点。这种服务打破了一般的“快速响应,热情周到”的服务范畴,而使服务提升到“长期保驾,全面负责”的运行级服务水准。根据本次招标文件的要求以及项目的特点,我公司在本项目维护过程中将充分调动资源,发挥我公司多年服务各大部委的优势,为本项目提供本地化支持和快速响应服务,并量身定制本项目技术支持和售后服务方案,使各级用户能够得到良好和及时的技术支持和售后服务保障,保证所有系统安全、稳定、畅通地运行。XX公司将针对本次项目成立专门的技术支持售后服务组,由现场工程师、售后工程师组成。在项目的整个运行过程中,专职负责技术支持、维护期外服务等工作,以保证本次项目的顺利实施。服务原则前瞻性原则:对问题做出预见性分析,并为用户系统将来的发展和扩充提供建议。实效性原则:即快速反应。我们会根据系统的硬件配置、地理环境等因素,XXX数据中心运维方案全文共44页,当前为第7页。采取电话、远程诊断和现场服务的方式及时解决各种突发的技术问题。XXX数据中心运维方案全文共44页,当前为第7页。顾问性原则:提供用户咨询服务;对用户在使用系统中遇到的问题,提供改进的原则和手段。完备性原则:对所提供的所有设备进行服务支持,并对用户与系统相关的其它设备提供必要的服务。规范性原则:服务过程可监督、可管理、可追溯,从而保证服务的质量。安全性:机房安装门禁、图像监控、漏水检测系统、动力设备环境集中监控系统和设置安全通道,确保人员和设备的安全。可靠性:应结合机房特点和所使用设备情况,充分考虑使用的长久性。灵活性:结合该机房的现状充分考虑不同运行状态下,运行的灵活性。先进性:结合现代化数据处理中心运维的特点,人员技术能力要具有一定的先进性。系统运维功能完整性:综合全面各个子系统,充分考虑各子系统的内在联系,使该机房具有完整和完善的系统功能。服务策略服务标准化:基于ISO9001质量控制体系的技术服务标准,形成标准化的作业流程,标准化的追诉制度,标准化的文挡管理,标准化的资格认证等。服务体系化:建立授权服务体系,让客户在最短的距离感受到最全面的服务。服务多样化:在售前、售中、售后,倡导基于用户满意度为99.99%的个性化关怀;完全满足用户标准化服务以外的特殊使用需要。服务主动化:定期回访制度,针对客户问题比对历史案例,提出预先解决方案,并保证服务在短时间内到位。服务电子化:针对具备上网条件的用户,提供远程登录、WEB互动、在线支持等电子化服务内容,逐步建立完善的电子化服务渠道。服务目标“用户满意”是XX人的根本服务目标。事实上,在产品和技术日益遵循开放式标准的现实中,各厂商之间的主要区别就是服务质量,我公司技术支持与服务的三大目标是:用户的事业通过我们的服务得到发展;XXX数据中心运维方案全文共44页,当前为第8页。用户的投资通过我们的服务得到升值;XXX数据中心运维方案全文共44页,当前为第8页。用户的烦恼通过我们的服务得到排解。通过上述目标的实现来保证机房运维项目的正常和安全运行。维护管理制度1) 熟悉掌握各设备的操作规程,保证设备正常运转。2) 做好各设备运转时的日常检查工作,发现问题及时处理。3) 严禁各设备超负荷运转,严格按照各设备技术要求进行操作。4) 加强设备的日常维护和保养制度,设备调试运转,确认正常以后,方能投入使用。5) 建立健全各种设备台帐、设备卡片,并将设备的维护保养落实到人。6) 保持设备的清洁卫生,对易产生热量和安装在潮湿处的设备,运转时要及时检查,发现异常情况立即停止使用。7) 停用设备及闲置设备要做到归库管理,保持整洁。8) 对于特殊设备,操作人员必须持证上岗,并做好专业理论教育及培训考核工作,严禁违章操作。9) 做好设备维护保养检修记录,责任落实到个人,检修过的设备在下次使用期间发现问题影响生产由检修人承担责任。10)由于操作失误发生设备事故及损坏设备,操作人员应按设备维修费用的80%进行赔偿,并责令下岗。运行分析、优化和管理支持服务我公司及时了解系统运行情况,定期出具系统运行分析报告,每周通过邮件和电话(邮件或口头)向用户方相关人员提交本周运行情况和运行分析报告,每月提交月运行报告。在保证期内,我公司工程师根据巡检情况,对系统安全策略配置和系统性能进行调优,保证系统最好的提供服务和稳定运行。根据系统运行实际状况,结合用户对今后系统发展规划和需求,我公司免费提供有关系统安装、调试、使用、维护、升级等方面的咨询服务。同时提供针对本系统的优化服务,提高系统的稳定性和可靠性。XXX数据中心运维方案全文共44页,当前为第9页。重大节日值守服务XXX数据中心运维方案全文共44页,当前为第9页。在特殊时期,XXXX将派资深安全运维专家提供7×24小时实时不间断驻场职守服务,随时准备为突发情事件做出服务响应,为系统的稳定保驾护航。根据XXXXXXX需求,依托我方资源,为XXXXXXXXXXXXXX提供专业化的重点保障服务(不超过三次/年),满足在国家重大事件或突发重大事件期间,保障系统安全稳定运行的需求。当XXXXXXXXXXXXXX系统发生重大事件或重大变更(如应用系统上线、变更、重要系统割接、重要系统升级、优化调整、机房搬迁、突发事件保障等)时,如XXXXXXXXXXXXXX有人员需求,我方全力准备完整的支持方案,提供人员现场支持。维护档案文件的形成与管理服务计划书我公司运维部在实施服务之前,根据签订好的《维护合同》制定相应的服务计划书,并获得技术部的认可与批准。该服务计划书包括:服务实施机制、巡检计划表、年度计划表、服务人员的安排、资源保障等必须项目。当服务人需要进入机房内开展服务时,我公司需要针对相关服务人员的劳务管理制定适当的计划。作业计划书我公司运维部根据服务计划按照各项服务制定作业计划书,并在作业开始前获得机房负责人的认可,作业计划书应该对具体作业时间、作业内容、作业步骤、作业范围、作业人姓名、安全管理等进行详细的规定。对于紧急抢修作业,可以不事先提交作业计划书,但作业完成后必须提交相关内容的作业报告。作业报告与记录将和机房机房负责人协商的结果整理记录。将各项作业做好详细的作业报告,报告的格式以本规程后的附表为标准,如果机房负责人有特殊要求,以与机房负责人的协商结果为标准制作。制作记载了作业执行全部经过的文件。但对于重复的相同业务,在于机房负责人协商的前提下可以省略。制定相应的培训计划XXX数据中心运维方案全文共44页,当前为第10页。以上报告与记录须按照合同或与机房负责人的约定,提交给机房负责人。XXX数据中心运维方案全文共44页,当前为第10页。机房资料使用与管理机房内应该备有如下相关的资料:机房工程竣工图和改造图机房各功能分区系统图机房设施原理图机房设施产品说明书机房设施操作说明书机房设施其他历史档案其他相关的标准或文件我公司服务人可以使用相关的机房资料,但作业完成后应该恢复原状。机房资料原则上不许带出机房,如果确实由于作业的需要,必须征得机房负责人需要,并出具相应的手续,及时归还。在没有征得机房负责人同意的情况下不得随意复制与传播机房资料。服务流程XX严格按照ISO9001质量保证体系制定的售后服务控制程序来执行服务过程、保证服务质量。售后服务控制程序,规定了服务质量控制的基本要求,通过规范的服务流程和事件处理流程,保证提供的软硬件产品或系统能安全、可靠、稳定、有效地运行,保证产品或系统完全满足合同要求、收集质量信息,为改进工程及相关产品的质量提供依据。维护团队配置方案概述我方积极推进体制创新,完善公司治理,强化内部管理,通过ITIL标准、ITSS体系的建设,加强团队人员的管理,强化运维团队的建设。机房基础设施运维项目的组织实施开展,离不开公司人力资源的保障。在机房基础设施运维服务项目中,我方明确了组织架构,根据机房运维服务工作的内容和流程确定各项工作中的人力资源的岗位设置、职责要求进行精确分工,并按照相应岗位的要求配备所需不同专业、不同层次的人员,组成专业分工下高效协作的运维团队,并实XXX数据中心运维方案全文共44页,当前为第11页。时做好对项目人员定期进行专业技术培训、做好员工绩效考核管理激发员工工作积极性、做好员工关系降低人员流失率,以适应本项目的实际需求确保机房设备在一个有序的环境下安全、稳定地运行。XXX数据中心运维方案全文共44页,当前为第11页。运维人员主要职责划分我方根据运维人员的架构、甲方岗位的设置及相关要求,拟派具备运维项目管理经验和人员资质的强电专业人员、暖通技术人员、弱电智能化技术人员按照工作内容分设以下几个主要职能岗位,并明确其主要职责。运维人员岗位职责(一)项目经理服从上级领导及甲方领导的指示,执行“运维零事故报告”制度,运维中出现问题第一时间向上级领导和甲方领导汇报。负责运维项目部与公司各部门之间的沟通协调工作。协调甲方和运维部的各项工作,与用户方保持良好沟通机制。负责客户交给的技术协助任务,帮助协调机房施工项目的技术实施。认真听取用户意见,制定各项目运维工作计划,发现和解决内部问题。负责指导运维项目部各运维组的工作,制定运维部整体发展计划,落实公司各项规章制度。对内部人员进行绩效考核,根据绩效考核情况调整人员配置;给用户做好个系统的数据备份及容量管理工作。(二)技术主管团队主要职责:服从运维部经理领导,执行运维部经理指示,对运维部经理直接负责,执行“零事故报告”制度,工作中出现的问题第一时间上报运维部经理。以确保所管辖系统设备的安全运行为首要任务,对所属系统设备的安全稳定运行负有管理责任。负责领导和组织下属对所管辖系统设备进行日常运行、统计分析、技术培训等工作,针对性地制定各项机房运行管理制度和标准流程,推进运行技术工作的标准化、流程化作业。XXX数据中心运维方案全文共44页,当前为第12页。负责根据不同的环境和变化,结合设备实际运行情况向工程维修组及时提出相关设备安全稳定运行的评估需求,积极配合、协助工程维修组的设备安全运行评估工作和设备维修工作,并依据评估结果制定相应的运行调整计划或应急方案。XXX数据中心运维方案全文共44页,当前为第12页。负责审核系统设备定期的保养计划,定期或不定期检查设备的运行状况,提出整改建议方案或措施建议,在保证安全稳定运行的前提下,控制维修成本。负责审核季度备品备件的采购计划,经审核的采购计划承报运维部经理批准后组织采购。同时建立库存备件登记簿,及时、准确的记载机房备品备件的购入、支领、存货情况。每月对库存的备品备件进行盘点造表上报运维部经理。认真贯彻落实岗位责任制度,定期对员工进行安全责任教育,审查员工的考勤情况。完成上级领导交办的其他工作。对客户的基础设施及强、弱电系统提供运维技术支持,解决技术问题,承担基础设施一般性的优化改造工程的项目管理工作,包括但不限于电气、空调、弱电、安防等系统的技术人员。(三)运维专家运维专家平时负责对项目疑难问题的解决、审查日常的巡检报告、月度季度巡检等工作。在接收到甲方动环或其他运维平台上传的检测报告后,对报告数据进行分析,依据这些数据对整套系统提出优化建议。(四)运维巡检团队主要职责:对强电、弱电、暖通、安防系统等基础设备设施进行巡检,担任巡检工作,并填写值班巡检记录,做到第一时间发现故障或问题,并作为管理程序的执行者。负责XXXXXXXXXXXXXX的巡检巡查工作。(五)应急指挥团队如我放中标,我司将成立针对本项目的应急指挥团队,由1名公司副总裁带队,各系统专家4名,各专业支持工程师4人组成。24小时接收项目的重大故障预警信息,如果发生紧急故障时,副总裁带领专家小组立即针对现场情况给出XXX数据中心运维方案全文共44页,当前为第13页。处理意见,如需人员支援,立刻调集专业工程师携带各种必备工具及配件赶往现场,配合现场人员解决突发故障问题,力争把故障损失减小到最小。XXX数据中心运维方案全文共44页,当前为第13页。提高服务团队素质的具体措施制度是行为的规范和尺度。科学的、良好的、健全的制度,可以有效地规范运维人员的行为,是各项工作顺利进行的根本保证。我司及时制定了相关的配套制度,确保制度建设的贯彻落实。先后制定了《运维部人才选拔管理办法》、《运维部员工考核制度》、《运维部考勤制度》、《运维部日常培训制度》、《运维部日常工作监管制度》等5项制度,由运维部和行政后勤部分别下发执行。这些制度的建立将有利于形成审计监督整体合力。在以上制度下发之后,我司成立了有关人员组成的监督小组及时对整改情况进行督促和检查,从根本上提高服务团队的整体素质,形成一支人员素质和技术素养均有所成就的成熟团队,为甲方提供优质服务,解决后顾之忧。1.落实员工职业道德和工作技能培训1)培训目标、计划坚持“以德为先、德才兼备”的原则,制定完善基层员工的培训课程,提高基层员工的职业道德、专业知识、服务态度和技能等综合素养;提高现有中层管理者的职业素质与管理技能;积极宣传企业文化,增强员工对企业的认同,提高企业对员工的凝聚;部门在跟进培训过程中,通过发放培训调查问卷,针对培训制度实施、培训人员能力、课程设置、考核方法等问题进行全员问卷调查,并根据培训人员的综合意见反馈对培训计划和内容进行改善。2)培训内容培训主要包括:入职培训、职业道德培训、岗位职责培训、专业技能培训、专家培训。入职培训新入职员工在入职当天由行政助理组织进行入职培训,培训内容以公司规章制度为主,培训时间不低于2个小时。培训完成后,由受培训人填写《新入职员工培训总结报告》,交送行政人事部。序号培训内容培训人员培训时间1公司介绍、企业文化建设入职当天XXX数据中心运维方案全文共44页,当前为第14页。2XXX数据中心运维方案全文共44页,当前为第14页。公司规章制度入职当天3考勤管理制度入职当天4公司礼仪入职当天5机房接待礼仪入职当天职业道德培训新入职员工在试用期期间,由部门主管或经理需安排不少于三次的职业道德培训,其中职业道德培训内容主要以职业道德素养、团队精神、团队凝聚力、执行力等内容为主。岗位职责培训岗位培训主要以工作环境、风险识别、工作内容、工作流程和工作要求为主。类别培训内容培训人员培训时间运行维护熟悉工作环境、系统的操作规程、风险识别、工作流程入职第一周客服服务态度、工作流程、门禁开卡、出入登记入职第一周监控机房设备监控、环境监控入职第一周安保机房财产安全保障、物品放行管理入职第一周专业技能培训定期举行员工专业技能培训,由公司工程师及原厂商工程师共同负责组织。培训内容主要以各系统设备功能、原理、操作、维修维护以及相应行业技术发展情况为主。培训类别培训内容培训时间培训人员专业技能培训各系统设备功能及原理每周四下午班组长各系统设备操作知识和流程每周四下午班组长各系统设备维护技能每周四下午班组长各系统应急技能培训每周四下午主管或班组长专家培训部门将不定期聘请相应行业有资质的专业讲师给全体人员进行培训。3)严把新员工转正考核细抓考核程序建立健全试用期员工考核档案,了解掌握试用期干部的职业道德表现、工作作风、工作实绩等情况。通过任中满意度测评和任职期满意度测评,突出对职业XXX数据中心运维方案全文共44页,当前为第15页。道德表现、所任职务的适应能力和履行职责情况进行考核,如实记录存档,切实提高试用期员工自我约束和自我提升的能力。此外,以客观公正的态度,实事求是地进行个别谈话,不仅把员工的德才表现、工作实绩掌握准确,而且及时指出试用期员工的缺点不足,以利于其更快地健康成长。XXX数据中心运维方案全文共44页,当前为第15页。安排日常随机考察坚持严格要求和关心新员工相结合,及时了解试用期员工的思想动态和困难、需要,收集新员工的意见建议,建立试用期员工谈心谈话制度。切实加强对试用期员工的日常管理和监督,各级班组长、主管、经理承担对试用期员工的日常管理职责,加强对其工作的指导,做到问题早发现、早提醒、早纠正,做好思想引导工作。严抓试用期满考核强化日常考核与试用期满考核相结合,增强考核的实效性。在试用期满考核前进行综合考核,汇总的试用期考核结果由直属上级签字后,报部门经理审核。考核合格后方可正式任职。试用期满转正考核评价表格如附件1所示。具体转正考核实施如下表所示:考核项目考核方式考核时间考核人员职业道德表现日常观察考核在新员工试用期期间由班组长每月月底上报观察考核结果班组长工作作风日常观察考核在新员工试用期期间由班组长每月月底上报观察考核结果班组长工作实绩会议考核新员工试用期满两个月后,由主管组织,各系统班组长组成的考核小组进行考核主管、班组长谈话记录谈话考核新员工转正前一个星期经理、主管试用期满转正考核评价综合考核综合试用期期间员工职业道德表现、工作作风、工作实绩、面谈情况以及转正报告等进行评分。经理、主管新员工须与试用期满前一个星期上交《转正申请书》(内容包括:试用期岗位职责、试用期业绩及工作成效、自我评价、对公司的意见或建议等)至直属上司,转正申请人员的直属上司于试用期满前三天将签署意见的《转正申请书》、《日常考核评价记录》及《试用期满转正考核评价表》交人力资源部。人力资源部根据部门签署意见的《转正申请书》及《试用期考核评价表》,与本人进行沟通访谈,并形成书面材料。XXX数据中心运维方案全文共44页,当前为第16页。人力资源部与部门负责人共同确定新员工转正后的意向岗位及意向工资,报运维部经理批准后执行。XXX数据中心运维方案全文共44页,当前为第16页。4)严抓落实各项工作制度根据部门召开全体会议,加强各项工作制度和管理的落实,不断提高制度落实的监督约束力,确保制度最大限度地得到执行:努力发挥领导示范带头作用。各级管理者要带头学习制度、严格执行制度、自觉维护制度。组织全体员工认真学习《值班巡检制度》、《应急事件上报制度》和《考勤制度》,并严格执行日常工作岗位考核制度,日常工作监督小组对运维人员每天的在岗工作情况进行不定时抽查,发现问题,立即上报处理并当月兑现奖惩。制度名称学习日期培训讲师参训人员考勤制度月日全体员工值班巡检制度月日月日全体运行人员应急事件上报制度月日全体运维技术人员加强应急管理,牢固树立未雨绸缪、预防为主的思想,切实抓好基层应急管理工作,根据实际情况制订和完善应急预案,明确各类突发事件的防范和处置程序和上报流程,提高员工处理突发事件的能力,保证各方能够快速调度资源,快速排除故障,恢复生产,将突发事件影响降至最低。开展应急工作的培训和考核,确保安全意识培训普及面达100%,达不到考核要求的管理人员和技术人员一律不准上岗。运维人员需掌握的应急状况处理办法如下:系统应急状况处理适用人员强电单路市电中断紧急处理全体运维技术人员双路市电中断紧急处理全体运维技术人员UPS报警紧急处理全体运维技术人员关键开关跳闸紧急处理全体运维技术人员触电急救办法全体运维人员XXX数据中心运维方案全文共44页,当前为第17页。空调XXX数据中心运维方案全文共44页,当前为第17页。空调补水系统异常紧急处理全体运维技术人员空调主机跳机紧急处理全体运维技术人员精密空调异常紧急处理全体运维技术人员机房漏水紧急处理全体运维技术人员机房温湿度异常紧急处理空调技术人员机房热点紧急处理空调技术人员弱电监控故障紧急处理弱电术人员环空系统故障紧急处理弱电技术人员门禁异常紧急处理全体运维技术人员机房困人紧急处理全体运维技术人员其它应急上报流程全体运维技术人员应对外界骚扰防范措施全体运维技术人员通过绿色通道进入机房的条件和注意事项全体运维技术人员一般受伤急救办法全体运维技术人员5)划分工作职责,落实责任到人随着运维责任与压力逐大,无论从管理难度、运维面积、设备状态等方面均较以前有了较大程度的提升,XX公司作为大管家的管理责任及压力;另一方面,随着机房精细化运维工作的推进,以及机房基础设施设备开始全面进入维修期,设备安全运行压力已经发生明显增大,为了确保机房基础设施持续安全、稳定地运行,在后续的维工作中必须进一步做到落实各项工作职责明确,责任到人的制度。根据精细化管理的要求,细分运维技术人员、管理人员的各项工作职责,做到职责明确、分工落实到个人。坚持每日早会制度的执行,确保做好前天工作的总结和回顾,做到当天工作有计划、有安排地实施。同时通过早会收集员工意见和建议,进一步做好员工关系管理。设立机房运行负责人和日常值班负责人,共同负责整个机房、数据中心基础设施的运行安全和维护、防护等工作,并通过三级问责制度,规范和引导各级管理人员的行为,提升运维管理人员工作意识和责任心。为了应对日益增多的设备维修事件和面对各种突发情况,配备现场专业技术人员,设立专业维修团队。3)奖惩制度的执行公司的奖励项目主要分为嘉奖、记小功、记大功、年度进步员工、优秀员工评选、工作突出贡献奖等,公司的优秀员工将在年终给予晋升加薪或奖金奖励。公司对于违反工作纪律或管理规定的员工,视情节轻重分别予以警告、记小过、记大过三种行政处分。如果工作表现差或违反公司规章制度,经多次沟通无效且无改善的员工,将受到降级、降薪、待岗或辞退处理;对于严重违反工作规XXX数据中心运维方案全文共44页,当前为第18页。程,造成公司重大损失的,公司将给予辞退或开除处理,并追究相应的经济赔偿责任。XXX数据中心运维方案全文共44页,当前为第18页。运行管理制度为确保本项目运维服务工作正常、有序、高效、协调地进行,需要根据管理内容和要求制定一系列管理制度,覆盖各类运维对象,包括从投产管理、日常运维管理到线下管理以及应急处理等各个方面。此外,为实现运维服务工作流程的规范化和标准化,还需要制定流程规范,确定各流程中的岗位设置、职责分工以及流程执行过程中的相关约束。目前我方根据多年的实际运维经验,已形成较为完善运维工作制度和流程,相关的制度和流程随着运维工作实际需求和体系的建设,持续优化和完善。运维质量管理制度为确保本项目运维服务工作正常、有序、高效、协调地进行,需要根据管理内容和要求制定一系列管理制度,覆盖各类运维对象,包括从投产管理、日常运维管理到线下管理以及应急处理等各个方面。此外,为实现运维服务工作流程的规范化和标准化,还需要制定流程规范,确定各流程中的岗位设置、职责分工以及流程执行过程中的相关约束。目前我方根据多年的实际运维经验,已形成较为完善运维工作制度和流程,相关的制度和流程随着运维工作实际需求和体系的建设,持续优化和完善。为确保运行维护工作正常、有序、高效地进行,必须针对运行维护的管理流程和内容,制定相应的运行维护管理制度,实现各项工作的规范化管理。运行维护管理制度中巡检相关管理制度、工作流程相关管理里制度、安全相关管理制度、故障相关管理制度、运维人员管理制度可参见如下:1)服务质量保证为做好机房基础设施运维服务项目,我方将明确公司内部管理流程,保证项目顺利、高质量的完成,将质量管理贯穿整个运维服务周期中。2)质量监督为做好机房运维服务项目,我方将成立客户服务监督小组,各个服务质量阶段的监督由客户服务监督小组来进行,定期将监督的情况报告给技术部经理,同时反馈给本人,以利于工程师提高服务质量。XXX数据中心运维方案全文共44页,当前为第19页。3)客户满意度调查XXX数据中心运维方案全文共44页,当前为第19页。客户服务监督小组会定期或不定期地对客户进行客户满意度调查,了解客户对我方服务的意见和建议,建议我方进行改进,主要包括:每次现场问题处理服务或阶段性服务后,客户服务监督小组都会给客户打电话或当面交流调查工程师服务情况,并记录在案;每年年底,客户服务监督小组对客户进行年度满意度调查;不定期向客户发放调查表,调查服务质量。4)服务保障级别定期巡检和维护。电话以及其它任何方式通知的事件立即响应。两小时内完成现场备件更换;重要节假日期间提供满足客户要求的现场支持及响应;5)根据相关ISO9000及ITSS要求,强化服务质量管理针对项目建设范围广、系统结构复杂以及其本身具有重要的战略意义等特点,本着“诚信、守法、公正、科学”的宗旨,根据项目的建设内容和建设目标以及ISO9001及ITSS质量保障的要求,运用先进的、适合于信息化工程行业特点的项目质量保障手段,对项目建设的各个层面进行管理和控制协调,对项目实施各个时期中的行为、事件和文档进行质量控制和管理,为用户方提供与项目有关的信息和信息处理能力的支持,以确保本项目建设成功。6)质量方针我方凭借多年数据中心基础设施运维工作的经验,总结实际工作的切身体会与正反两方面的经验教训,逐步形成了一套以ISO9001质量体系标准、ITSS标准为基础的运维管理管理规范,并树立了以客户为中心的思想。公司在发展过程中开拓创新,与时俱进,不断改进和完善自己。确定了以下质量方针:以客户为中心,通过持续的过程改进,提供高质量的软件产品与系统集成服务,实现股东、员工、企业、客户和社会的最大价值。7)质量目标为了实现质量方针,公司制订了长期质量目标:提高全员质量意识,加强过程质量控制,确保自主产品合格率高于99%,工XXX数据中心运维方案全文共44页,当前为第20页。程验收合格率100%,服务响应时间不超过24小时,客户投诉率低于1%,客户满意度高于99%,赢得客户的信赖与满意。XXX数据中心运维方案全文共44页,当前为第20页。8)质量服务流程为了对机房基础设施运维服务工作进行有效管理,对运维工作开展中将从人员、资源、技术、过程方面做好计划、实施、检查、改进工作,及时控制、调整、解决实施中服务质量问题,确保本项目的顺利开展,提升客户满意度。我方将从如下方面开展9)质量计划:通过服务项目的质量保证计划,以确保服务目标的实现,服务风险的降低。本项目中设计与规划组制定详细的技术方案、配置文档等;工程实施组将对整个项目的实施进度、人力资源进行详细周密的安排和筹划,形成本项目实施规划。为按照计划做好相关运维工作,保证按时完成项目计划,我方还需根据运维需求,实时完善公司内部审核程序、质量管理制定、过程管理(事件管理、问题管理、配置管理、变更管理等)程序及相关制度,并通过审核和批准,对各运维人员进行相关的传达培训。10)服务执行:从项目开始实施至结束,有项目对监督、控制服务过程中的每一个环节,包括事件、配置、变更、等按合同要求形成服务报告,在报告中详细列明项目达成情况。在项目进行中,根据具体情况,提交问题报告单、系统变更单等项目记录报告。11)质量检查分析:运维服务组提交项目阶段总结报告,并根据服务计划进行服务阶段性考核,提交考核报告。项目经理组织对包括数据统计、分析、预警、跟踪。检查各项运维服务指标达成情况,并与SLA的要求进行对比,对未达标项提出改进措施,形成项目质量分析报告。12)质量改进:由项目经理组织相关人员,通过阶段性(月度、季度)的服务工作总结,项目实施开展过程的问题和偏差做出有效评估,并进行调整和优化,及时了解客户的需求,并根据客户的意见或建议进行改进,保证年度运维服务目标的实现。运维人员管理制度1.运维人员日常行为准则XXX数据中心运维方案全文共44页,当前为第21页。严禁吸烟、喝水、吃食物、嬉戏和进行剧烈运动,保持机房安静。XXX数据中心运维方案全文共44页,当前为第21页。对于意外或维保过程中弄污机房地板和其他物品的,必须及时采取措施清理干净,保持机房无尘洁净环境。临时征机房用品要使用后各归其位,不能随意乱放。进入机房应遵守机房管理制度,应严格按照机房管理员的要求进行操作,并虚心接受其行为督导。进入机房不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。如有特殊需求,及时向机房管理员通报并取得上级主管人员同意,方可在安全保护的前提下带入机房。2.运维人员保安制度进入机房,需经负责人批准,并认真填写登记表后方可进入,并建议由机房管理员陪同。维保人员出入机房应注意锁好门禁。对于有其他陌生人跟随进出机房,及时与机房管理员取得联系,经同意方可准入。最后离开机房的人员必须自觉检查和关闭所有门禁。离开工作区域前,应保证工作区域内保存的重要文件、资料、设备、数据处于安全保护状态。未经机房管理员批准,禁止将机房相关的钥匙、密码等物品和信息外借或透露给其他人员,同时有责任对信息保密。对于遗失钥匙,泄露保安信息的情况要即时上报,并积极主动采取措施保证机房安全。机房人员对机房保安制度上的漏洞和不完善的地方有责任及时提出改善建议。绝不允许与维保人员直接或间接操纵机房网络数据设备,如有需要,提前申请获批后方可。出现机房盗窃、破门、火警、水浸、110报警等严重事件时,维保人员有义务以最快的速度及时到达现场,协助处理相关的事件。3.运维人员用电安全制度应在熟练掌握常规用电安全操作和知识的基础上,着重了解机房内部的供配电系统及其操作规程。XXX数据中心运维方案全文共44页,当前为第22页。以专业资质人员定期、定时检查供配电及用电设备、设施。XXX数据中心运维方案全文共44页,当前为第22页。需要用电时,必须取得机房管理员允许,并使用安全且对机房设备影响最少的供电。不得乱拉乱接电源电线,应选用安全、有保证的供电和使用有保护装置的用电电器材。严禁随意对设备断电,更改设备供电线路,严禁随意串接,并接,搭接各种供电线路。如发现用电安全隐患,应即时采取措施解决,不能解决的必须及时询问相关负责人员,并向机房管理员及时汇报。机房工作人员需要离开当前用电工作环境,应检查并保证工作环境的用电安全。最后离开机房的维保人员,应检查所有用电设备,应关闭长时间带电运作可能会产生严重后果的用电设备。禁止在无人看管下在机房中使用高温,炽热,产生火花的用电设备。4.运维人员消防安全制度维保人员应熟悉机房内部消防安全操作和规则,了解消防设备操作原理。不能随意更改消防系统工作状态、设备位置。需要变更消防系统工作状态和设备位置的,必须取得机房管理员批准。如发现消防安全隐患,应即时采取措施解决,不能解决的应及时向相关负责人员提出解决。维保人员最后离开机房,应检查消防设备的工作状态,关闭将会带来消防隐患的设备,采取措施保证无人状态下的消防安全。5.运维人员资料、文档和数据安全制度资料,文档,数据等必须有效组织,整理和归档备案。禁止将机房内的资料,文档,数据,配置参数等信息擅自以任何形式提供给其它无关人员或向外随意传播。对于牵涉到网络安全,数据安全的重要信息,密码,资料,文档等等必须妥善存放。维保人员的确需要翻阅文档,资料或者查询相关数据的,应由机房管理员代为查阅,并只能向其提供与其当前工作内容相关的数据或资料。XXX数据中心运维方案全文共44页,当前为第23页。重要资料,文档,数据应采取对应的技术手段进行加密,存储和备份。对于加密的数据应保证其可还原性,防止遗失重要数据。XXX数据中心运维方案全文共44页,当前为第23页。在维护人员更替时应及时周详地做好资料及文档的递交工作,并更改密码,清理个人用户资料等信息。6.机房财产保护制度维护人员应有义务安全和小心使用机房的任何设备,仪器等物品,在使用完毕后应将物品归还并存放于原处,不应随意摆放。对于使用过程中损坏,遗失的物品应汇报登记,并对责任人追究相关责任。未经机房管理员同意,不允许向他人外借或提供机房设备和物品。业务技术方案配电系统供配电系统是机房运维的核心,全面考虑用户对机房供配电的需求后进行合理规划,确保机房供配电系统的安全、可靠和先进性。一个高品质的机房供配电系统体现在:高冗余、高容错,有防雷、防火、抗电网浪涌、静电泄漏等功能,良好的接地系统、防雷系统等。科学合理的供配电系统是保证机房设备安全可靠运行的关键。我方对配电系统的检测主要遵循以下标准来实施:检查项目检查要求检查配电屏/柜、列头柜的外观是否完好修整或改造检查配电屏/柜、列头柜是否清洁使用吹尘器清扫灰尘,不允许与带电设备直接接触。检查配电屏/柜、列头柜的标示是否正确、清晰调整或更换检查各种显示仪表是否正常调整或更换检查各相电压是否符合要求查找原因解决问题检查各相电流是否平衡三相负荷不平衡度应小于20%,否则调整负载。检测开关、电缆、母线与接点的温升使用激光测温仪或红外测温仪测量,正常温升应小于5摄氏度。否则紧固相应接点。检查电气电缆的标示是否正确、清晰调整与更换检查电缆线槽、线架是否完好调整与更换检查电缆沟等是否清洁清扫检查电缆的防鼠消除隐患检测漏电保护开关动作是否正常一般可以通过短接零、地线的方法进行测试。剩余XXX数据中心运维方案全文共44页,当前为第24页。动作电流一般为30mA。XXX数据中心运维方案全文共44页,当前为第24页。检查各级防雷器是否完好调整或改造检查各级防雷器是否洁净清扫检查各级防雷器指示灯是否正常正常情况一般绿灯点亮时防雷器在有效范围内。如果红灯点亮则防雷器已经失效,应该及时更换。检查各级防雷器的接点是否紧固紧固检查各级防雷器的接地是否良好防雷器接地系统应该可靠的与设备保护地相连,接触电阻不大于10欧姆。检查接地系统各点接触是否良好紧固各接点检测接地电阻是否符合设计要求使用接地电阻仪测量接地电阻。选用不需中断接地进行测量的数字式地阻测试仪。按照国家规定,每年试验一次检测零地电压是否符合设计要求查找原因解决问题检测三相负载是否平衡调整检测已用负载使用率查看是否合理清扫瓷套管和外壳,检查外壳、垫片、瓷套管有无破裂、放电痕迹或胶垫有无老化,电缆及母线有无变形现象,有破裂的应进行更换每年进行一次绝缘电阻的测试检查母线接触面是否保持清洁使用热成像仪进行检测并提供报告紧固引线端子、销子、接地螺丝、母线螺丝如有松动的应及时处理电力电缆测量绝缘电阻如低于出厂值得70%,须及时上报。此项每年完成一次高压供配电设备预防性维护内容(每年进行一次)清洁柜体、开关、绝缘件、母线、电缆电气连接柜内母排、电缆等电气连接螺栓紧固检查及处理绝缘件绝缘管材固定、破损、放电痕迹、闪络痕迹检查及处理功能接地、保护接地可靠性检查及处理检查处理密封性高压供配电装置对小动物和防水的密封性坚持处理电力变压器预防性维护内容(每年进行一次)外观粉尘聚集情况、干燥情况、绕组外部绝缘表面检查及处理清扫清洁设备表面、绕组表面、绝缘子、电缆、母排清洁电缆及母线连接松动、过热氧化迹象检查及处理温控器整定值启停温度、报警及跳闸设定值检查及处理风扇风扇启停功能检查及处理接地功能接地、保护接地可靠性检查及处理测量绕组绝缘电阻和系数比XXX数据中心运维方案全文共44页,当前为第25页。直流装置预防性维护内容(每季度进行一次)XXX数据中心运维方案全文共44页,当前为第25页。清扫清洁柜体、开关、绝缘件、母线、电缆和及出风口、风扇、过滤网清洁电气连接柜内母排、电缆等电气连接螺栓力矩紧固检查及处理仪表测量仪表校准监控设置绝缘电阻值并与整定值比较,检查报警情况蓄电池检测蓄电池内阻暖通系统机房暖通系统是为保证机房内所运行设备的安全运行而提供长期不间断的恒温、恒湿、洁净的环境的设备。机房暖通系统的组成:制冷循环部分:由于机房设备(服务器、UPS等)都会释放大量热量,为保持这些设备安全稳定地运行,就一定要使机房室内保持恒定的温度,暖通系统的制冷循环部分就必须为机房源源不断地提供制冷量,同时也具有除湿、加湿的功能。空气循环部分:机房设备对空气的湿度、洁净度和气流速度等也有着严格的要求,同时,为了使空调产生的冷量均匀地分部到机房的每一处替代机房设备所产生的热量,就要求空气循环设备必须做到针对机房特征,清洁、科学地送风。我方对暖通系统的检测主要遵循以下标准来实施:每季度进行一次深度检测和保养,工作内容包括但不限于下列项目:1.精密空调系统:检查机组运行状况,记录报警内容并对报警内容进行分析消除隐患;检查设定参数,控制电路,并根据实际需要调整各项运行参数;检查压缩机、风机的运行电流值;检查冷媒液镜、视情况补液或更换干燥过滤器;制冷剂管路检漏。检查制冷系统运行情况,检查运行压力,检查膨胀阀的工作状态,必要时调整过热度,使设备处于最佳状态;对蒸发器、表冷器进行表面积灰清理,翅片变形情况进行检查及处理;检查冷媒管道和加湿系统供水管道是否正常;检查每个接触器触点、接线,必要时做保养或更换;XXX数据中心运维方案全文共44页,当前为第26页。检查电加热器的各级加热电流及各电气接点是否正常,电加热器的过热保护是否灵敏;XXX数据中心运维方案全文共44页,当前为第26页。检查制冷系统辅助部件的工作状态,如电磁阀、干燥过滤器等;检查冷冻机油情况,如有变质情况要及时更换;检测高低压保护装置;校正机组传感器温湿度显示值;。检查压缩机和风机绝缘电阻;检查原器件、接线、安装等有无异常,紧固内部线路连接;校验测量参数的精准;消除设备缺陷,更换不合格元器件;检查主控板和图形显示器的工作状态;对精密空调过滤网及新风机过滤网,风机皮带等辅材进行清洗,过滤网等辅材费用由投标人负责。每年更换一次精密空调及新风机组过滤网;室外机冷凝器进行表面清洁,电气系统检查及处理;对安全阀、仪表、传感器按照相关规范进行校准。2.加湿设备检查加湿器进水、回水管路、漏水感应及控制装置、PC气体过滤器更换、过滤网清洗、电场清洗、加湿系统维护及易损件更换;对加湿器进行除垢,水位、漏水情况、电气接线情况、加湿功能检查及处理。3.新风机组清洁外观,对变形破损情况检查及处理;清洗或更换新风机过滤器,检查主机接线是否松动,检查新风系统并调节风量,检查管道的气密性,检查控制面板;对表冷器进行清洗;对风机进行表面清洁,对壳体破损密封泄漏、机体固定、传动装置磨损情况检查及处理,并加注润滑脂。检查及处理风机电机的传动皮带,根据情况及时调整或更换。XXX数据中心运维方案全文共44页,当前为第27页。4.冷却塔系统XXX数据中心运维方案全文共44页,当前为第27页。冷却塔须检查塔体的腐蚀、变形和破损情况并及时处理;对集水盘记性腐蚀检查及处理;补水阀功能检查及处理;检查及处理布水器喷嘴、进风格栅、挡水板和填料的结垢、堵塞、老化破损;对电伴热系统冬季前进行回路开关、加热功能检查及处理;对风机变频器进行启动、调速功能检查及处理;对风机轴承每季加注润滑脂;对传感器按照相关规范记性校准;集水盘应每季度进行洒扫以清除冲积于池底的淤泥及粘着物,扫除填料及其支架落下的碎屑,清洁水泵吸水口的格栅,检查冷却塔喷头;冷却塔做好电机、风机的全面检查,及时清理尘土和涂抹润滑油防腐工作,每半年更换一次齿轮油,检查是否有漏油、缺油现象,检查电机皮带,确保皮带无松动、脱落、跑偏等现象;检查供水浮球阀及进出阀门能否正常启动、关闭。如有锈蚀、失灵应及时更换。检查冷却塔各部件的螺栓是否有松动现象,冷却塔基础与支脚是否有脱离;检查冷却塔填料是否堵塞,冷却塔易损件是否有破损现象;每年对冷却塔填料进行深度清洗一次。板式换热器应根据运行温差或压差进行预防性维护:清洗板式换热器板片,对变形、错位、渗漏检查及处理;检查板式换热器垫片的密封性、老化和破损并处理。5.冷冻及冷却水泵对泵体表面进行清洁;检查及处理:壳体及基座腐蚀、密封泄漏、泵体固定、联轴器与轴的磨损情况。对轴承加注润滑脂。对水泵电机外壳进行清洁和补齐;检查处理三相对地绝缘电阻;XXX数据中心运维方案全文共44页,当前为第28页。对接线端子的连接牢固性进行检查及处理。XXX数据中心运维方案全文共44页,当前为第28页。6.空调水系统阀门检查阀门的零部件完整性、动作灵活度、启闭性能和电动阀联动功能;检查及处理泄漏、结露和保温情况检查及处理管道的泄漏、结露和保温情况。定压补水装置进行表面清洁和手自动切换检查,检查电磁阀、安全阀;微晶旁流处理器进行表面清洁和功能性检查、对接线端子的连接牢固性进行检查及处理、检查及处理泄漏、结露和保温情况。弱电系统本项目弱电系统主要包含电力监控系统、动环系统、BA系统、门禁系统、视频监控系统、大屏显示系统、入侵报警系统等,这些系统主要作用是保证机房安全运行、能从人员安全和系统能安全方面全面保障机房的正常运行。我方对弱电系统的检测主要遵循以下标准来实施:每季度进行一次深度检测和保养,工作内容包括但不限于下列项目:1.电力监控系统、动环/集中监控系统、BA系统对各系统的功能和性能进行测试;对各系统上的各设备运行状态和硬件连接进行检查;对传感器、控制器、执行器安装牢固、破损的检查及处理;对传感器按照相关规范进行校准;对执行机构进行机械性能、电气性能和功能的检查及处理;对数据接口进行监控对象通信、数据采集的检查及处理;对传输线路进行连接端子牢固、标识清晰、链路通畅的检查及处理;检查及处理:系统运行、显示、控制、报警、统计、分析等功能有效、权限和阈值设置合理。BA系统前端设备:检测主机、执行机构、传感器是否正常运行,控制逻辑准确无误,时间程序无误;清洁现场执行器、检测设备、控制箱等;检测现场执行器功能是否正常,现场检测设备读数是否准确;现场DDC功能检测,联网是否正常,作为单元控制功能是否正确。BA系统主机检测:检查系统软硬件运行情况并进行功能和性能的测试;XXX数据中心运维方案全文共44页,当前为第29页。清洁管理主机、交换机、通讯转换器等主机设备;检测主机报警记录及报警图像显示和记录速度、对前端设备的控制功能、以及通信接口功能、远端联网功能;检查系统所有主要连接接口;检查电器连接端子是否玩就好,表面有无缺损,接口是否牢固;XXX数据中心运维方案全文共44页,当前为第29页。对环控系统的漏水报警系统进行有效性检查。对各系统的软件、日志、数据库、配置参数进行备份;对各系统软件本身提供软件升级服务,或系统本身的缺陷进行修复;机房新增设备或监控点,加入到监控系统中统一监控;提供与其他运行管理平台系统对接的技术支持。2.门禁系统物理检查:安装牢固、破损的检查及处理;设备清洁开关按钮:功能检查及处理读卡器:读卡数据检查及处理;指纹识别设备:功能检查及处理;执行机构:电控锁、闭门器、电动栏杆等执行机构功能检查及处理;传输线路:连接端子牢固、标识清晰;门禁控制器:开关门锁功能、与服务器间的通信功能检查及处理;管理服务器:设备运行状态、联动控制功能检查及处理;3.入侵报警系统物理检查:安装牢固、破损的检查及处理;设备清洁运行环境检查:排除设备所在局部环境影响探测效果的因素;周界探测器、报警探测器:功能、探测范围检查及处理;声光报警器:功能检查及处理;传输线路:连接端子牢固、标识清晰;报警控制器:功能、防区报警、信号输出功能检查及处理。4.视频监控系统及大屏显示系统物理检查:安装牢固、破损的检查及处理;设备清洁运行环境检查:排除设备所在局部环境影响探测效果的因素;摄像机:监控图像清洗、监视范围有效;XXX数据中心运维方案全文共44页,当前为第30页。云台:云台方向控制功能、预置位测试的检查及处理;XXX数据中心运维方案全文共44页,当前为第30页。镜头:清洁、图像清晰;辅助光源:亮度,聚光方位及摄像机方位一致;传输线路:连接端子牢固、标示清晰;矩阵控制主机:功能、联动情况检查及处理;监视器:图像显示清晰、图像设置有效;录像、存储设备:检查功能、存储空间正常;安全防范监控平台:功能和性能有效。备品备件库内容安全性保证措施成立应急领导小组应急领导小组由甲方领导、我方公司领导及我司专家组成,领导小组的主要工作是在发生紧急状况时能有效的、及时的组织人力对紧急状况进行研判,启动预案,调动多方面人力。物力应对紧急状况,把危害降低到最小。应急预案的修订与完善随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。系统故障应急流程一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:1.1、运维服务中心通过网管告警发现故障XXX数据中心运维方案全文共44页,当前为第31页。1.2、维护站点通过维护巡检发现故障XXX数据中心运维方案全文共44页,当前为第31页。1.3、用户发现故障,报给呼叫中心1.4、运维工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。3、信息研判运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。4、预案启动如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。5、资源确认系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:我公司技术支持人员;相关厂家技术支持人员;我公司聘请的技术专家6、预案执行按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。7、预案终止预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。8、结果上报预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。XXX数据中心运维方案全文共44页,当前为第32页。应急事件响应XXX数据中心运维方案全文共44页,当前为第32页。按照机房事件的可控性、严重性和影响程度,将机房应急事件分为一级(特别重大)、二级(重大)、三级(较大)、四级(一般)四个级别。当机房发生突发事故后,我方将按照《安全应急管理细则》事件的级别逐级向甲方和我公司领导上报,同时迅速组织相关技术人员进行全面检测,查找原因,并采取措施避免再次发生同类事件。根据机房实际情况,我方的应急事件基本应急响应流程以及关于突发事件应急策略服务流程如下:应急事件基本应急响应流程
XXX数据中心运维方案全文共44页,当前为第33页。关于突发事件应急策略服务流程XXX数据中心运维方案全文共44页,当前为第33页。
XXX数据中心运维方案全文共44页,当前为第34页。应急事件处理XXX数据中心运维方案全文共44页,当前为第34页。我方根据制定的《信息安全应急管理细则》应急处理方案具体实施应急处理活动,并将实施过程和结果记录在《应急处理过程记录》中。涉及到客户现场服务的应取得客户的签字确认。应急结果处理应急处理过程完成后,我方将配合对事件调查分析、总结和评估,并向甲方提交应急处理过程相关表单,包括《应急处理过程记录》、《事件应急报告》,报告的内容应包括:事件基本情况、处置情况、原因分析、整改措施、事件处置的经验及存在的问题,由甲方对应急处理结果进行评估和确认。应急演练我方将根据机房应急需求及《信息安全应急管理细则》,按照年度运维工作计划,编制好电力系统、暖通系统、消防系统等安全演练方案,并联合相关设备运维厂商配合开展各系统的机房安全演练工作。应急演练方式包括:沙盘演练:参与演练的运维人员集合,并分别口述在发生紧急情况下自身所应承担的职责及将会执行的方案及步骤。模拟演练:参与演练的人员跑位到模拟故障现场,模拟处理故障,参与人员应清晰地说出故障的处理方案及步骤。我方还将根据各类突发事件的演练情况,对突发事件风险防范措施和应急响应进行定期全面评估,组织各级人员不断完善应急管理的策略、机制、方法、流程,并对应急管理过程中发现的问题及时整改,并完成应急预案持续修订。此外,我方还将协调设备厂商定期对相关应急设施进行检测,以保证设备处于正常状态。突发状况应急预案机房漏水应急预案(1)发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告监控系统突发故障应急领导小组。(2)若空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空XXX数据中心运维方案全文共44页,当前为第35页。调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温。XXX数据中心运维方案全文共44页,当前为第35页。(3)若为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施确保机房安全,及时清除积水,维修墙体或门窗,消除渗漏水隐患。设备发生被盗或人为损害事件应急预案(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系统突发故障应急领导小组,同时保护好现场。(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。(3)事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报。(4)系统突发故障应急领导小组安排运维服务小组、事发单位及时恢复系统正常运行,并对事件进行调查。运维服务小组和事发单位应在调查结束后一日内书面报告系统突发故障应急领导小组。事态或后果严重的,应向相关领导汇报。机房长时间停电应急预案(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置:(2)当机房发生市电供电突然停电或是电源异常时。首先应和后勤部门联系确认正常停电以及预计停电时间。检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。(3)当确定停电时间超出机房UPS承载范围后,首先确定停电的范围以及受影响的设备范围。并及时通知各部门做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。对于恢复时间无法预计的,要通知后勤部XXX数据中心运维方案全文共44页,当前为第36页。门做好柴油机发电及移动电源车供电准备XXX数据中心运维方案全文共44页,当前为第36页。(5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。通信网络故障应急预案(1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应及时通知本单位信息系统管理员,经初步判断后及时上报运维服务小组和系统突发故障应急领导小组。(2)运维服务小组接报告后,应及时查清通信网络故障位置,隔离故障区域,并将事态及时报告系统突发故障应急领导小组,通知相关通信网络运营商查清原因;同时及时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。(3)事态或后果严重的,应向应急指挥办公室和相关领导汇报。(4)应急处置结束后,运维服务小组应将故障分析报告,在调查结束后一日内书面报告系统突发故障应急领导小组。核心设备硬件故障应急预案(1)发生核心设备硬件故障后,运维服务小组应及时报告系统突发故障应急领导小组,并组织查找、确定故障设备及故障原因,进行先期处置。(2)若故障设备在短时间内无法修复运维服务小组应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。(3)运维服务小组故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查。(4)事态或后果严重的,应向应急指挥小组和相关领导汇报。雷击事故应急预案(1)遇雷暴天气或接上级部门雷暴气象预警,运维服务小组应及时报告系统突发故障应急领导小组,经请示同意后关闭部分服务器,切断电源,暂停内部计算机部分网络工作。(2)雷暴天气结束后,运维服务小组报经系统突发故障应急领导小组同意,及时开通服务器,恢复内部计算机网络工作,对设备和数据进行检查。XXX数据中心运维方案全文共44页,当前为第37页。(3)因雷击造成损失的,运维服务小组应会同相关部门进行核实、报损,并在调查工作结束后一日内书面报告系统突发故障应急领导小组。必要时,应向应急指挥小组和相关领导汇报。XXX数据中心运维方案全文共44页,当前为第37页。空调设备故障应急预案若机房专用空调损坏,应第一时间启用机房备用空调,并通知厂家上门进行维修,并及时报告信息部相关领导请示,获得授权后按机房设备关闭顺序关闭各类设备。火灾事故应急预案(1)一旦机房发生火灾,应遵照下列原则:首先确保人员安全;其次保护关键设备、数据安全;三是保护一般设备安全;(2)人员疏散的程序是:机房工作人员立即按响火警警报,并通过119电话向公安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线路,迅速从机房中撤出;(3)人员灭火的程序是:首先切断所有电源,启动自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。电源设备故障应急预案机房目前使用UPS系统,在紧急情况发生时,应按如下步骤进行关机:(1)确认所有负载均已安全关机。(2)关闭UPS负载电源。(3)将UPS的系统启用开关切换到off的状态。(4)将电池连接断路器切换到off的位置。售后服务方案服务体系XXXX公司可为用户提供强大的本地化服务,采用多种服务渠道和方式,为客户提供完善的运行维护服务。能够为客户提供高质量、快捷的服务。XX的运行维护服务体系基于XX的质量保证体系和客户关系体系,利用XX总部和遍布全国30多个中心城市的服务机构,以及XX的培训基地,共同形成服务的组织体系。针对本次项目,XX将以本项目部为核心服务机构,依托XX的运行维护服务XXX数据中心运维方案全文共44页,当前为第38页。体系,为业主提供高质高效的售后服务,确保系统稳定运行。XXX数据中心运维方案全文共44页,当前为第38页。针对本项目专项售后小组、人员和队伍我方将成立针对本项目的专项售后小组,由1名公司副总裁带队,各系统专家4名,各专业支持工程师4人组成。24小时接收项目的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 原油供货合同范例
- 厦门工资合同范例
- 光伏电池转让合同范例
- 南充代理记账合同范例
- 厂家付款合同范例
- 专业劳务分包合同范例
- 个人质押合同范例
- 中介销售合同范例
- 出售木板封边机合同范例
- 2024专升本文学欣赏与评测标准试题及答案
- 单组份室温固化硅橡胶物质安全数据表MSDS模板
- 2022年北京事业单位招聘考试真题及答案解析
- 高中英语 选必二 Unit3 Times change 第4课时-developing ideas- Emojis a new language 课件
- 机动车检测站突发环境污染事件应急预案
- 关于赴XXX医院参观学习联系函
- 【汇总】高二政治选择性必修三(统编版) 重点知识点汇总
- T∕CIS 71001-2021 化工安全仪表系统安全要求规格书编制导则
- 体医融合与健康中国课件
- 福利院装修改造工程施工组织设计(225页)
- 基因表达的调控
- 华师大版九年级下册数学全册教案
评论
0/150
提交评论