版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据中心基础设施运行维护管理规范2024
目录TOC\o"1-3"\h\u26628第一章总则 760451.1、范围 776361.2、规范性引用文件 825561第二章符号和术语 91892.1、数据中心能效管理 9129022.2、电力能耗指标 9176262.3、水能耗使用指标 955992.4、能效 9198722.5、数据中心设施运维团队 966882.6、安防团队 9155602.7、综合管理团队 9209972.8、专业执照 965652.9、管理手册 10286552.10、操作手册 10235522.11、维护手册 10101592.12、日常记录表单 10161072.13、访问控制 10195912.14、预期寿命 1090132.15、应急组织管理 10297842.16、应急事件管理 11180112.17、应急预案目标对象 11289932.18、应急演练管理 11312782.19、桌面演练 11156752.20、模拟演练 11108892.21、实战演练 1139502.22、应急演练方案 12106942.23、应急演练登记表 12208192.24、应急演练过程记录单 12168582.25、应急演练总结报告 1266352.26、公共灾难和危害事件 12141362.27、基础设施意外故障事件 12183102.28、IT系统类故障事件 1251002.29、应急预案 12217502.30、应急通讯管理 1211772.31、应急通讯平台工具 13115502.32、通讯工具 1377302.33、国家数据中心/数据中心 136207第三章一般规定 1423206第四章运维流程 15308404.1一般规定 15194234.2服务台 15305304.3服务请求管理 15163204.3.1数据中心应及时响应并记录来自内外部的各类服务请求,包括: 1551204.3.2应根据要求履行服务请求,包括履行服务请求应包括: 1594784.3.3应对服务请求进行回顾并关闭。包括: 16173654.4事件管理 16164374.4.1所有事件均应被记录,包括接收的事件和主动发现的事件。 1654694.4.2应对事件进行分类分级,包括: 16309754.4.3应快速解决影响数据中心服务的事件。包括: 1679334.4.4应定义和执行事件升级子流程,包括: 1630094.4.5事件解决后,对事件处理过程进行回顾并关闭事件。包括: 17299284.5问题管理 1720604.5.1应明确问题触发条件,并识别问题。包括: 1730784.5.2应对问题进行分类分级。包括: 1731574.5.3应检查问题产生异常的根本原因。包括: 17228834.5.4应制定问题解决方案并实施。包括: 17287324.5.5应对问题进行回顾和关闭。包括: 18148034.6变更管理 18230624.7风险管理 19194324.7.1一般规定 19249764.8能效管理 21303224.8.1、一般规定 21124574.8.2、能效管理体系 21266554.8.3、能效采集 22239014.8.4、能效分析评估 222434.8.5、能效优化 2218862第五章 组织架构及人员管理 23237325.1运维组织管理 2312655.2能力要求 24116435.3岗位培训 25165225.4团队建设 2520488第六章文件管理 26152256.1一般规定 2639886.2定义 26254506.2.1管理手册 26320396.2.2操作手册 2679716.3日常记录表单 2778796.4运行维护管理规则生命周期 2755096.4.1起草审核阶段 2774196.4.2审批阶段 2875516.4.3发布阶段 2824136.4.4存档 2898896.4.5执行阶段 28286076.4.6变更 28100276.4.7销毁 2910690第七章日常维护 30173687.1日常运维 30314137.1.1运行维护工作内容的核心 30180957.1.2基础设施日常运行维护管理是数据中心运行维护的基础工作。 30207957.2基础设施日常运维工作内容 30260127.2.1数据中心供配电设备日常运维应观察、检测与记录下列内容: 3019996数据中心UPS系统日常运维应观察、检测与记录下列内容: 3178467.2.3数据中心柴油发电机系统日常运维应观察、检测与记录下列内容: 31240907.2.4数据中心精密空调及新风系统日常运维应观察、检测与记录下列内容: 32243137.2.5数据中心消防设备日常运维应观察、检测与记录下列内容: 33264617.2.6数据中心监控与安全防范系统日常运维应观察、检测与记录下列内容: 3448957.2.7数据中心运行环境日常运维可观察、检测与记录下列内容: 34202877.3验证与健康评估 34292107.3.1验证与健康评估应采购有资质的第三方检验检测机构的服务。 359017.3.2验证与健康评估频次:应1-2年做一次,保证基础设施运行的可靠性。 3587707.3.3验证与健康评估范围: 3519009数据中心动力系统运行健康体检范围 353599电气系统的测试检查实施范围 3530199暖通系统的测试检查实施范围 3512343环境质量测试检查实施范围 3518365机房有害空气质量检测 366605计量器具精确度检定/校准 36223717.3.4依据规范和标准 36190117.3.5数据中心健康体检内容 3723022系统性能检查工作内容 3728790UPS输入端电能质量 388434暖通系统 439524环境质量系统 4416766系统功能测试检查工作内容 4829403灾难切换演练流程测试检查工作内容 501987计量器具管理要求: 50232967.4资产管理 50175647.4.1一般规定 50210567.4.2资产信息管理 51114197.4.3资产全生命周期管理 51111777.4.4资产安全 5131823第八章应急管理 52308158.1、一般规定 52296568.2、应急组织 52177638.2.1应急组织架构 5230828.2.2应急领导小组 5212463组成 526567工作职责 53225218.2.3应急管理小组 5330592组成 5330437工作职责 53221358.2.4应急技术与执行小组 5330573组成 532745工作职责 5337718.2.5应急保障小组 5410158组成 544575工作职责 5421508.3、应急响应及应急流程 54186738.3.1应急响应 5442508.3.2应急流程 55319198.4、应急事件管理 5547228.4.1基础设施应急事件 5565468.4.2基础设施应急预案编制 55129038.4.3应急通讯管理 57320058.5、基础设施应急演练管理 5813841第九章环境健康与安全 60326199.1一般规定 60185159.2职责 60141839.3物理环境安全管理 6188849.4人员操作安全管理 62136639.5信息安全管理 63176889.6人身安全管理 64118929.7安全培训管理 646585第十章数据中心一体化运维管理 652023710.1一般规定 651692110.2集中监控系统 65168310.3能效管理系统 66722510.4容量管理系统 661916710.5资产设备管理系统 661502910.6配置管理系统 67836810.7组织人员管理系统 671061810.8计划任务管理系统 67342510.9运维流程管理系统 67705110.10应急演练管理系统 682594910.11报表管理系统 681318第十一章质量管理的监督与检查 692445011.1一般规定 692021511.2过程监督与检查 691687511.3监督与检查质量改进过程 7011853第十二章其他 711583612.1数据中心成本管理 712553612.1.1一般规定 711544012.1.2数据中心运行维护成本构成 721538612.1.3数据中心运维成本管理 721017212.2供应商服务管理 741984912.2.1一般规定 742584612.2.2供应商管理规范 753158812.3专项服务的实施与交付 763185312.3.1项目实施 762381212.3.2持续运维 771589612.4服务交付能力 78第一章总则1.1、范围本标准给出国网数据中心基础设施运维管理的指南,包括总则、符号和术语、一般规定、运维流程、组织架构及人员管理、文件管理、日常维护、应急管理、环境健康和安全、数据中心一体化运维管理、质量管理的监督与检查、成本管理等。本标准可为国网数据中心管理者提供基础设施运维管理系统性指导,也可作为用户或第三方评价国家电网数据中心基础设施运维管理水平的参考。1.2、规范性引用文件下列文件对于本标准的应用是必不可少的。凡是注明日期的引用文件,仅注日期的版本适用于本标准。凡是不注明日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。GB/T33136信息技术服务数据中心服务能力成熟度模型GB/T51314数据中心基础设施运行维护标准GB/T2887计算机场地通用规范GB/T26572电器电子产品有害物质限制使用管理办法GB26860电力安全工作规程发电厂和变电站电气部分GB50174数据中心设计规范DL408电业安全工作规程AQ7004-2007制冷空调作业安全技术规范GB/T24353风险管理原则与实施指南
第二章符号和术语2.1、数据中心能效管理是在保证业务连续可用的基础上,应用工业自动化、数据采集分析等多个技术对数据中心全生命周期内连续供应的能源进行综合利用、能效分析评估及改善提升。2.2、电力能耗指标PUE(POWERUSAGEEFFICIENCY)=数据中心总电力能耗/IT设备能耗,用于反映数据中心电力用于IT设备和辅助IT设备运行的效率衡量指标。2.3、水能耗使用指标WUE(WATERUSAGEEFFICIENCY)=数据中心耗水量/IT设备功耗,用于反映数据中心用水损耗指标。2.4、能效是能源利用效率(数据中心实际消耗的总能耗与IT设备能耗之比)的简称。2.5、数据中心设施运维团队以数据中心设施运行提供保障支持为主要工作内容的团队。2.6、安防团队以数据中心的消防、周边和安全相关监控管理为主要工作内容的团队。2.7、综合管理团队负责数据中心综合管理,包括园区物业管理、行政管理等。2.8、专业执照是指政府强制要求的执业证书,如:高压进网许可证、高压电工作业证、低压电工操作证、建(构)筑物消防员证等。2.9、管理手册规定了运行维护工作的框架结构、执行范围、组织结构、工作规范及各的主要职责的手册2.10、操作手册标准操作流程对数据中心IT系统、基础设施系统、用户服务系统、安防系统,分别制定相应的标准化操作流程,用来指导和规范日常的运行维护工作的标准操作手册。维护操作流程用于规范和明确数据中心运行维护工作中各项设备的维护操作流程、操作步骤2.11、维护手册应急操作流程用于规范应急操作过程中的流程及操作步骤,确保运行维护人员可以迅速启动,确保有序、有效地组织实施各项应对措施的紧急操作手册。2.12、日常记录表单在日常运维工作中执行的标准化的操作流程、预防性维护计划、紧急操作流程,进行详细记录,形成的日常记录表单。2.13、访问控制是指对主体访问客体的权限或能力的限制,以及限制进入物理区域(出入控制)和限制使用计算机系统和计算机存储数据的过程(存取控制)。2.14、预期寿命从开始投入使用时起,一直到因设备功能完全丧失而最终退出使用的总的时间长度。2.15、应急组织管理主要针对应急组织架构、应急领导小组、应急管理小组、应急技术与执行小组、应急保障小组的组织的建立与管理。2.16、应急事件管理因基础设施设备故障或者公共灾难危害事件引发数据中心服务中断的事件,应纳入事件管理流程,执行应急响应和紧急恢复。包括:地定义基础设施应急事件、基础设施应急响应、基础设施应急预案编制、基础设施应急通讯联络管理。2.17、应急预案目标对象应针对重要设施设备及公共类事件制定应急预案。应急预案须明确该预案的适用场景、通知通报、恢复操作步骤等内容。2.18、应急演练管理应制定基础设施年度测试演练计划,明确演练项目、演练方式、演练时间、演练内容等项细则。2.19、桌面演练对预案的组织架构和应急流程进行验证。组织数据中心基础设施运维人员,通过设计恰当的故障场景,采用参演人员集中培训、讨论、文字考核等手段加深对应急处置策略、手段和应急预案的了解。2.20、模拟演练由数据中心基础设施运维团队人员及应急预案的协同单位共同参与,模拟验证应急预案。模拟应急情况下的报警流程、应急操作执行动作、通知通报及恢复等工作。2.21、实战演练数据中心基础设施运维机构可以独自或联合其它部门及客户组织实战演练。在数据中心投运前或投运后的计划性维护期间,假设相应的故障场景,组织相关人员按照应急预案流程进行实操性演练。2.22、应急演练方案是演练准备的方案和计划,包括风险控制方案、演练剧本(参演人员的台词,流程、时间控制、执行的动作等)。2.23、应急演练登记表是参演人员登记和签名表。2.24、应急演练过程记录单是演练各项活动执行情况记录。2.25、应急演练总结报告是应急演练过程的总结,可暴露问题,促进完善改进措施和行动计划。2.26、公共灾难和危害事件主要包括恐怖袭击、炸弹威胁、治安事件等公共安全危害事件,地震、雷击、异常气候自然灾害等。2.27、基础设施意外故障事件主要包括火灾及火灾防范系统故障、建筑物内水患、供配电系统故障、备用应急电源系统故障、空调制冷系统故障、安防系统故障和动力环境监控系统故障、通讯系统故障等。2.28、IT系统类故障事件包括IT系统故障、IT设备故障、网络通讯系统故障、主干传输线路故障等。2.29、应急预案对不同等级的故障事件和灾难事件,针对重要设施设备及公共类事件制定应急预案,主要包括供配电系统、制冷系统、消防、监控、网络等基础设施故障,以及暴雨、暴雪、大风、雷击、地震等气候灾难。2.30、应急通讯管理要避免应急发布时大群多头现象,按照决策等级情况建立不同的群组,同时应避免层级过多的情况出现,尽量扁平化。群组内明确相应负责人及汇报人,实现信息的准确传达与汇总。2.31、应急通讯平台工具具有在应急事件发生时快速的有效的通知到相关执行人员、参与决策组织。通过应急通讯工具平台完成应急事件发布、决策发布、处置执行情况的快速收集和反馈。2.32、通讯工具可由多种沟通联络渠道组成,可采用电话会议、视频会议、无线通讯网络、第三方平台等单种或多种方式组成。2.33、国家数据中心/数据中心指国家电网数据中心
第三章一般规定数据中心已参照《数据中心设计规范》GB50174中数据中心分级依据,和《数据中心基础设施运行维护标准》GB/T51314中的方法和要求,根据自身的使用性质、管理要求及其在经济和社会中的重要性确定,建立运维管理流程、运维管理团队与运维管理制度,并给予落实,以确保数据中心的运行满足IT系统运行需要。3.2数据中心的运维管理流程应覆盖数据中心运维管理的全过程,并制定计划进行周期性检视与修正。3.3数据中心的运维管理队伍应该满足业务开展需要,技能与资质符合政府监管要求。3.4数据中心的运维管理制度应涵盖数据中心的各项工作。3.5数据中心应详尽识别潜在的风险,并制定对应的风险应对方案,制定计划进行演练。3.6数据中心的运维活动应关注成本,在确保可用性不受影响的基础上实施节能减排。
第四章运维流程4.1一般规定数据中心宜依据GB/T24405信息技术服务管理标准,建立数据中心服务支持流程,包括服务请求管理、事件管理、变更、问题管理。4.2服务台4.2.1数据中心应建立服务台,以记录、分解、跟踪来自故障的事件、服务请求、投诉建议及其他事项。4.2.2服务台宜建立和提供多种沟通渠道,包括电子邮件、热线电话、移动应用等,提供7×24小时服务响应和支持。4.2.3服务台应设置专门服务座席,由专人负责服务请求、事件等的集中受理和跟踪。4.2.4数据中心应建立服务台相关管理制度,明确服务台工作职责、工作内容、监督考核等方面要求。4.3服务请求管理4.3.1数据中心应及时响应并记录来自内外部的各类服务请求,包括:应接受来自用户的服务请求,并记录相关信息。应对服务请求进行确认,根据客户合约和SLA要求,判断是否需履行此服务请求。应根据服务请求类型,分派服务请求至数据中心服务团队。4.3.2应根据要求履行服务请求,包括履行服务请求应包括:应有明确的服务请求分类分级定义、处理时限和升级规则。应履行服务请求,执行相应的响应、处理、升级等活动。应监督、监控服务请求处理进展,并根据需要协调解决。4.3.3应对服务请求进行回顾并关闭。包括:应明确服务请求关闭规则,服务请求履行完毕应与用户书面确认。应定期回顾、更新服务请求列表并告知用户。宜对服务请求的完成情况进行满意度调查。应设计服务请求管理绩效指标,用于考量服务请求执行过程的符合度和有效性,如服务请求按时解决率、及时响应率等。4.4事件管理4.4.1所有事件均应被记录,包括接收的事件和主动发现的事件。应对事件进行分类分级,包括:应明确事件的分类分级的定义应按事件的影响度和处理优先级,确定事件等级。应定义各等级事件的响应时间、恢复时间、解决时间目标。应建立重大事件子流程。应快速解决影响数据中心服务的事件。包括:应对事件进行分析,尽快处理解决,并记录事件的解决方法。事件涉及人员应该能够访问、匹配并关联相关信息,包括相关服务请求、已知错误、问题解决方案和配置管理数据库(CMDB)。应监督、监控事件处理进展,并根据需要协调解决。4.4.4应定义和执行事件升级子流程,包括:应明确定义事件升级规则,包括技术升级和管理升级处理规则符合事件升级规则的事件,应根据事件升级规则进行升级和转移委派等以确保事件的及时解决。4.4.5事件解决后,对事件处理过程进行回顾并关闭事件。包括:应有明确的事件关闭规则。应在关闭事件时对事件的记录进行更新,确认事件的最终分类和分级,受影响的服务,以及导致事件发生的配置项等。应设计事件管理绩效指标,用于考量过程的合规性和有效性,例如事件及时响应率、按时解决率等。4.5问题管理应明确问题触发条件,并识别问题。包括:应明确问题来源和触发条件。应识别问题并记录。应对问题进行分类分级。包括:应明确问题分类分级的定义。应按问题的属性划分问题分类和优先级。应检查问题产生异常的根本原因。包括:应分析问题现象和关联事件,定位产生异常的根本原因。应根据需要转移委派后线支持人员处理。应制定问题解决方案并实施。包括:针对问题的根本原因,提出并实施根本解决方案,并记录解决过程。暂时无法根本解决的问题,应采用规避措施作为临时解决方案。应监督、监控问题处理进展,并根据需要协调解决。应对问题进行回顾和关闭。包括:应有明确的问题关闭规则。应回顾问题的解决过程与结果。应设计问题管理绩效指标,用于考量过程的合规性和有效性等。4.6变更管理应明确变更管理范围,制定变更策略。包括:应制定变更策略,包括但不限于变更范围、变更的分类分级标准;实施前变更应被测试;实施过程中应及时与相关方进行沟通。新服务或服务重大变化的落实应参照变更管理执行。宜定义数据中心标准变更类型,以简化数据中心变更审批和实施过程。对紧急和重大变更的授权和实施,建立独立的策略和子过程。应接收、记录并评估变更。包括:所有变更都被记录。应接收变更申请,并检查变更申请的完整性,评估变更的影响、风险和需要的资源。4.6.3应制定变更方案。变更方案内容应包括变更原因、变更实施方案、实施计划、回退方案或补救措施等。4.6.4所有变更均应经过评审和授权后,方能执行。高等级变更宜组织正式的变更评审会议,由基础设施运维、客户服务、运营管理等相关部门进行共同评审后,做出变更评审结论。应监督变更执行进展,协调变更实施。包括:应全程推进、协调变更的实施。应对变更实施结果进行回顾及验证。应更新设备管理信息,并根据需要更新操作手册以及必要培训。应对变更实施过程进行回顾与关闭。包括:应有明确的变更关闭规则。应回顾变更实施的过程和结果。设计变更管理绩效指标,用于考量过程的合规性和有效性等。4.7风险管理4.7.1一般规定数据中心应建立风险管理过程,控制数据中心建设和运行风险。风险管理的实施方法可依据GB/T24353《风险管理原则与实施指南》。4.7.2数据中心的风险管理的内容和过程,包括风险背景建立、风险评估、风险处置、批准监督、监管审查、沟通咨询六个方面,其中监管审查、沟通咨询贯穿于风险背景建立、风险评估、风险处理、批准监督步骤过程中。4.7.3数据中心基础设施运维工作风险管理应涉及人员的角色和责任宜结合信息安全风险管理相关体系进行分类定义,并建立管理机制。4.7.4数据中心应依据基础设施运维工作范围,确定风险管理对象、范围、实施风险管理的准备、相关信息的调查和分析背景的建立。4.7.5数据中心运维团队宜密切关注内外部环境变化,并评估变化可能带来的风险,包括:数据中心业务和客户的变化,组织架构和人员的变化,技术上的改变等; 相关法律法规的变更。4.7.6数据中心风险管理应制定风险评估计划、评估方案、评估方法和工具,并定期回顾和完善。4.7.7数据中心应定期识别和记录影响数据中心安全运行的各类风险。可从以下来源识别数据中心安全风险:已发生的安全事件和故障;数据中心人员日常运维中主动发现的隐患;监管方、客户方和第三方在审计中发现的问题和隐患;在内部检查中发现的风险隐患。4.7.8数据中心风险识别过程除技术风险外,还应涵盖以下类型的风险:客户与合约:合约及SLA执行上的风险等;供应商管理:设备供应商、维保服务商、运营商、物业等方面可能影响安全运行的风险等;团队管理:组织架构、岗位设置、人员能力方面的风险等;制度流程:制度流程缺失、不健全等方面的风险等。4.7.9数据中心应在风险评估之前,应从风险发生的后果、可能性、度量方法、等级等方面制定评价风险重要程度的标准,并持续不断地检查和完善。4.7.10数据中心风险管理工作应针对已识别的风险进行定性和定量分析,根据风险发生可能性和影响确定风险等级,综合评价风险状况,并形成风险评估报告。4.7.11数据中心风险管理工作应对评估出的风险,选择相应的风险处置措施,确定风险处置计划,包括风险处置措施、负责人、计划完成时间等。4.7.12数据中心风险管理工作应对风险处置计划实施情况进行定期跟踪,对风险处置措施实施后的残余风险进行评估,确保风险可控可接受。4.7.13数据中心风险管理应对背景建立、风险评估、处置的结果进行批准监督,建立批准监督流程和机制,并形成管理制度。通过批准申请、批准处理和持续监督三个批准监督过程,对风险管理活动做决策和监管。4.7.14数据中心风险管理应对批准的有效期、风险背景的变化情况进行持续监督,并形成监督记录。4.7.15数据中心风险识别、评估及处置过程应形成制度记录文档。4.7.16数据中心宜对风险管理的背景建立、风险评估、风险处置和批准监督全过程进行监控和审查,并输出相应的过程审查记录。监控审查内容宜包括:风险管理过程有效性及成本有效性;风险管理结果的有效性和符合性;4.7.17数据中心风险管理的审查工作应对高等级的风险每年审查一次,其他等级风险二年至少审查一次。审查方式可以为现场或非现场的内部审查、外部审查和第三方检验检测机构审查。4.7.18数据中心应建立风险管理的沟通咨询机制,保障风险管理中的背景建立、风险评估、风险处置、批准监督活动过程顺利有效,相关行动人员的协调统一,以及有效的知识技能培训咨询。4.7.19数据中心沟通咨询过程应按照制度输出相应的沟通咨询度记录,并及时向内外部相关人员报告。4.8能效管理4.8.1、一般规定1数据中心能效管理是在保证业务连续可用的基础上,应用工业自动化、数据采集分析等多个技术对数据中心全生命周期内连续供应的能源进行综合利用、能效分析评估及改善提升。2数据中心机房应按照设计相关要求做好维护管理工作。3针对维护管理中出现的问题,应及时评估分析并优化改进。4采用能源利用效率(PUE/WUE)作为机房整体能效的衡量指标。5应制定热源安全管理制度,明确控制机房内部和外部产生热量的工作细则,在保障机房设备工作温度的情况下,达到节能降耗的目的。6数据中心应支持对内部各种设备的能耗进行综合管理。4.8.2、能效管理体系1通过采集和监控各类用能系统(电气、暖通、电梯、给排水等)整体的实际运行状态,找出关键耗能点和异常耗能点,进行控制和管理。2能效管理体系须包含三个子系统:即能耗的采集、分析评估与优化。4.8.3、能效采集1数据的收集宜采用自动化的监控系统和工具,借助智能电量仪、智能传感器等,并经监控系统进行统一数据上传和存储,减少人为因素影响。2数据中心能源损耗数据应按照各物理机房模块、子系统、设备分别进行计量统计和可视化展示,包括IT设备运行功耗、电力线路损耗、制冷系统能耗等。3应计算并可视化展示实时、日、月、季、年的能效数据(PUE),宜计算并可视化展示水效(WUE)。4宜对保证数据中心连续运行的电力、制冷等关键系统的安全运行范围、系统最大承载能力、最佳效率区间等进行统计。4.8.4、能效分析评估1能够提供多种能耗分析如同比、环比、排名等方式,可实现对区域能耗、具体能耗类型、设备类型能耗等进行分析,并可生成设备能耗与系统能效分析报告。2应能计算发现低利用率设备、低能效设备与异常能耗设备,形成节能操作工单或实现节能自动控制。3需建立合理的评估机制,在机房实施相关节能方案后,应能对比机房节能方案实施前、后能耗数据,找出存在的主要问题并提出改进建议。4.8.5、能效优化1数据中心能效优化,应从机房、供电、散热、机房布局、设备选型等多个方面考虑降低能耗。2应当建立完整的绿色能效管理制度,为数据中心绿色能效发展提供体制机制保障。3宜应用模拟测试等优化方法,分析和测试相关变更可能对电源容量和冷却能力配置规划产生的影响。
第五章 组织架构及人员管理5.1运维组织管理5.1.1数据中心等级应符合现行GB50174《数据中心设计规范》的相关规定。应明确数据中心组织架构、岗位配置和各岗位工作职责,并形成组织架构图及岗位职责书面文档。对于A级数据中心应具备完整的运维团队,具备7*24小时服务响应和支持能力,以满足业务和客户服务需求。B级与C数据中心宜根据其数据中心规模与定位选择服务级别和服务模式。5.1.2数据中心应根据自身特点和使用需求,选择相应的运维服务模式。数据中心运维服务组织模式主要包括:自主维护模式:所有运维团队和人员为组织自有人员,日常维护自主实施;全外包模式:由第三方服务商提供全部驻场运维服务团队并进行管理,组织保留少量运营管理人员,进行服务管理和监控。部分外包模式:骨干运维人员为组织自有人员,值班岗等非关键岗位人员采用外包驻场方式,由组织运维人员进行现场管理。5.1.3应根据数据中心等级及业务功能和服务需求,配置相应数据中心服务团队。数据中心运维组织架构中所配置的团队与岗位包括:数据中心客户服务团队:数据中心提供服务的接口团队,也是协调客户与数据中心技术性服务团队的关键岗位。客户服务团队工作职责应包括以下内容:.1负责数据中心中客户需求的管理;.2负责数据中心中客户相关工作协调。数据中心技术团队:以数据中心技术、规划、建设等为工作核心的团队,工作重点应包括以下内容:.1负责数据中心的整体资源分配使用;.2负责数据中心项目建设与改造升级;.3负责数据中心数据中心规划建设设计和技术研究;.4负责对数据中心运维工作的技术支撑和标准的制定。数据中心IT团队:以服务器、网络设备等业务设备和系统维护支持为主要工作,主要包括但不限于以下内容.1负责IT设施的日常变更与服务处理;.2负责IT设施的现场操作服务提供;.3负责客户远程技术支持工作。数据中心设施运维团队:以数据中心设施运行提供保障支持为主要工作内容,主要包括以下内容.1负责数据中心设施的日常维护管理(巡检、定期维护、故障应急处理等);.2负责数据中心各设施维护厂商管理;.3负责与外部启用或部门的沟通与处理。安防管理团队:负责管理数据中心的消防、周边和安全相关监控系统,主要职责包括以下内容:.1负责数据中心人员、设备出入的安全管理;.2负责数据中心建筑消防系统监控、火警响应、灭火系统操作;.3负责数据中心门禁权限、视频监控系统管理;.4负责数据中心建筑及周边安全巡检和安全事件响应。综合管理团队:负责数据中心综合管理,如园区物业管理、日常运营管理等。主要职责可包括以下内容:.1负责数据中心园区物业管理;.2负责数据中心人事、行政、财务等综合性管理事务;.3负责数据中心调度计划管理与跟踪,包括团队工作计划执行情况、培训完成情况、计划性维护完成情况等;.4负责数据中心前台管理、参观接待等。5.2能力要求5.2.1数据中心运维人员应满足政府法规对该岗位从业的强制要求。5.2.2数据中心运维团队应确保各岗位人员具备运行所需的经验和技术能力,运维人员能力应覆盖数据中心运行所需各专业技能。5.2.3数据中心运维关键岗位应做到A/B角配置(如:专业工程师、班长等关键岗位)。5.2.4数据中心运维团队人员上岗前必须测试合格,具有独立操作能力。5.3岗位培训5.3.1数据中心应制定年度运维人员培训计划,培训计划应涵盖数据中心运行各相关系统和管理领域,包括各系统工作原理、操作流程、应急预案、以及管理制度等。5.3.2数据中心新员工须经过岗前培训和考核才能上岗,岗前培训内容除包括理论培训外,还应包括数据中心主要设施设备的现场操作训练。5.3.3数据中心对在岗人员应每年进行岗位能力培训。5.3.4数据中心人员培训的主要形式包括:技能培训与认证;经验总结与分享;交流学习等。5.3.5数据中心应对员工培训计划的执行情况进行管理和追踪。对数据中心运维团队的培训和训练应记入员工档案,并保留培训记录备查。5.4团队建设5.4.1数据中心应有专人负责数据中心人员日常管理,包括但不限于日常排班、考勤加班、资质管理、绩效考核等。5.4.2新进人员在岗位试用期结束前应进行考核,对其是否达到岗位能力要求进行评估,考核内容宜包括但不限于公司管理制度和流程、设施维护理论知识、设施维护实操技能等。5.4.3数据中心人员绩效考核宜包括安全运营状况、岗位纪律遵守情况、日常工作完成情况、培训和能力提升情况等,并与人员的职级与薪资调整相挂钩。第六章文件管理6.1一般规定6.1.1本标准规定了数据中心运行维护工作的管理手册的要求、运维操作手册的标准、记录要求和质量审核制度。6.1.2保障数据中心安全可靠运行,必须要制定管理手册、操作手册、日常记录表单和质量审核制度。6.1.3以本标准为指导,制定数据中心操作手册,以规范的操作保障数据中心的安全、稳定运行,操作手册包括:标准化的操作流程、预防性维护计划、紧急操作流程。、6.1.4数据中心所有运行维护工作,需要以管理手册为指导制定操作手册和记录表单。6.1.5数据中心文件管理要求设定文档的起草、审批、变更、存档、分发、执行、销毁等职责权限。6.1.6文件管理编撰应遵循正确、完整的要求,统一字体、字号、格式、版本号符合运行维护部门要求。6.1.7要求建立文档起草小组,由运维部门负责人担任直接领导,小组成员必须具备相关数据中心运维经验。6.1.8需设立专职文档管理员,建立和完善档案管理的相关制度,包括运行维护规范《文件树》的建立、文件管理的接收、整理,归档、文档的提供。6.1.9要求建立运行维护管理规范审核制度。6.1.10由运行维护管理部门进行每年至少1次的评审工作,包括:临时审核、常规审核。6.2定义6.2.1管理手册规定了运行维护工作的框架结构、执行范围、组织结构、工作规范及各部门的主要职责的手册数据中心运维管理规范的制定要求明确职责:包括负责人、制定者、审定者、批准者。6.2.2操作手册标准操作流程对数据中心IT系统、基础设施系统、用户服务系统、安防系统,分别制定相应的标准化操作流程,用来指导和规范日常的运行维护工作的标准操作手册。维护操作流程用于规范和明确数据中心运行维护工作中各项设备的维护操作流程、操作步骤的维护手册应急操作流程用于规范应急操作过程中的流程及操作步骤,确保运行维护人员可以迅速启动,确保有序、有效地组织实施各项应对措施的紧急操作手册。运维部门制定的各类操作手册要求打印归档,每年至少1次对手册进行审核、更新,切实保证各类操作手册的可行性。6.3日常记录表单在日常运维工作中执行的标准化的操作流程、预防性维护计划、紧急操作流程,进行详细记录,形成的日常记录表单。数据中心运行维护工作日常记录表单,要求定时提交每月不少于1次,由运行维护管理团队进行打印存档或电子版存档,档案保存时间不少于三年。6.4运行维护管理规则生命周期6.4.1起草审核阶段运行维护管理规范的起草应有充分、合理的依据,标准的制定不得与国家的法律法规、相关规范相抵触。明确运行维护规范规定的内容、原因、起草目的,执行目的、适用的范围。要求建立文档的更新历史记录,便于追踪该文档的修订过程。操作类手册要求按各类设备不同的操作方式,除文字描述外增加图片、图例、表格,将步骤中某些细节进行形象化和量化。操作类手册应在首页包含但不限于以下内容:撰写人、审批人、版本号、编撰日期、适用范围。运行维护管理规范起草完成,需提交执行部门负责人进行内容审核。6.4.2审批阶段运行维护管理规范的审批须遵循二级审批制度,同时确定生效日期,执行日期。
二级审批是指在企业内部控制中,对事项实行二级控制把关的审核、审查、审批制度和办法。运行管理规范经最终批准人签批后,方可作为有效文件,否则视为无效文件,不可执行。6.4.3发布阶段运维管理团队负责运行维护管理规范的发布。最终签批后的文件以电子版为主要发布形式。电子版发布时以不可修改的文件格式发布,这些格式包括PDF格式、图片格式。6.4.4存档文档管理员将审批通过的运行维护管理规范进行编号,并加入运行维护管理规范《文件树》总目录。文档管理员在工作环境内指定地点按类别存放运行维护管理规范,标注存档日期,确保文件便于查找。6.4.5执行阶段要求建立运行维护管理规范培训考核制度、日常操作考核制度。要求对每一个运维人员进行各类设备操作手册的培训,并进行培训考核。6.4.6变更运行维护管理规范一旦发布使用,未经运维部门管理者批准不得随意更改,如须更改应提出理由,按变更流程执行。
运行维护管理规范变更需提交《变更申请单》并详细描述变更内容,由运行维护管理团队进行审核、批准,遵循二级审批制度,进行更新后发布。
6.4.7销毁运行维护管理规范销毁需满足运行以下要求:已不适用运行维护管理需要、有其他规范可代替该规范的工作,并提交《文件废止审批单》至运维部门负责人。运行维护管理规范的销毁须遵循二级审批制度。被废止文件已被打印为纸面版,须使用碎纸机销毁。同一运行维护管理规范的新版本生效时该规范旧版本自动废止。文档管理员负责运行维护管理规范《文件树》的更新、并邮件或公告方式通知相关运维团队。
第七章日常维护7.1日常运维7.1.1运行维护工作内容的核心是通过运维工作支撑和保障数据中心所承载的各类业务安全、稳定、连续运行。一般数据中心运行维护工作内容包括:日常运行维护管理、安全管理、应急管理、风险管理、能效管理、自动化管理、资产管理与服务管理等。7.1.2基础设施日常运行维护管理是数据中心运行维护的基础工作。包括供配电、暖通空调、消防、监控与安防等工作内容。本标准主要涉及数据中心基础设施的日常运维。7.2基础设施日常运维工作内容7.2.1数据中心供配电设备日常运维应观察、检测与记录下列内容:运行环境检查、运行参数检查:定期巡检设备外观、运行参数,包括外壳、接线、输入电压电流、输出电压电流、频率、接地电阻、母线温度、开关端子及接线端子温度等参数、设备显示屏报警信息、标牌等;高低压断路器,包括对断路器灭弧室、机械结构等检查,高压断路器分、合闸回路和保护闭锁回路检查,对低压断路器的脱扣单元采用专业测试仪器检测,对保护装置进行相应的整定值校核,并出具专业的测试报告;低压电容补偿柜,包括补偿器检查、电容回路检查,对电容器采用专用测试仪器检测,检测电容器电容值是否偏差,提供每台电容器详细电容值报告,分析电容器使用情况;测试系统谐波,测量不同地点的谐波,出具谐波检测报告;高低压开关柜,包括对所有母线、抽屉柜的清洁无尘情况检查,柜体机械构件检查,对所有母线采用力矩扳手按照出厂要求进行力矩校核,检查柜体一次回路、二次回路,测量一次回路绝缘电阻,对设备运行时的母线进行红外成像检测,提供专业的温度成像报告和器件发热分析,备用开关手动或电动闭合和分断功能测试;变压器,检查内外部灰尘杂物、内外部螺丝、温控器、绝缘支柱、冷却风扇,测试超温报警,跳闸等保护操作,测试绝缘电阻、接地、变压器运行噪音,测试电气接线点及触头是否过热、对正常运行时的母排连接处进行红外成像检测,提供专业的成像报告和器件发热分析;低压双电源切换柜,自动投入及自动投切装置功能测试;其他测试和检查,包括三相平衡与中线电流检查、机械移动装置灵活性检查、电能质量检查、红外成像检查、接地检查、继电保护装置定值检查和校验确认、电力测量仪表精度检查测量(电压、电流、功率因数等)、表计功能验证等。数据中心UPS系统日常运维应观察、检测与记录下列内容:UPS设备,现场及其外观检查,设备显示屏报警信息检查,风扇运转情况检查,运行参数测量:输入电压电流、输出电压电流、直流电压、总谐波失真、频率等,并机切换测试;滤波器,外观检查,运行参数测量:输入电压、总谐波失真等;蓄电池,外观检查,有无鼓胀、漏液、接头过热现象,浮充状态下电池电压、内阻的检测,电池放电状态下(放电深度控制在10%-30%内)电池放电持续时间、电池放电过程中的负载电流、放电之前的总直流电压、放电之后的总直流电压、电池后备时间等参数的测试;STS静态开关,电路转换测试。7.2.3数据中心柴油发电机系统日常运维应观察、检测与记录下列内容:柴油发电机设备,定期检测:每月1次机器启动、并机、带负载的运行测试;发电机开机静态检查,发电机开机前检查:检查润滑油位、冷却液位、燃油油量,检查柴油机供油、润滑、冷却等系统各管路及接头有无漏水、漏油现象,检查启动蓄电池电压,检查发电机内循环水温度,开机前对发电机系统设备、仪表初始状态等及其他方面检查;模拟市电失电柴发机组自启带载运行:检查发电机自动启动,检查机组并机情况,检查发电机带负载情况,检查机油压力、水温、电压、频率、转速等各项参数,检查机组油路、水路和气路的渗漏情况,有无漏油、漏水和漏气现象,检查机组各处的连接和紧固情况,有无松动和剧烈震动,检查机组各种保护和监视装置是否正常,检查机组运行的输出功率、输出电压、输出电流、功率因素、转数等各种运行参数;发电机停机后检查及报告,各控制开关应恢复自动档,检查发电机自动停运和规程设置,及时提供测试情况报告;假负载,外观检查,电阻测量,防护等级检测。7.2.4数据中心精密空调及新风系统日常运维应观察、检测与记录下列内容:精密空调设备,定期检测:每季度1次,对精密空调室内、外机(风冷系统),精密空调室内机、冷水机组(水冷系统)进行全面的检测;运行工况检查,检查主控板和图形显示器的工作状态;参数设置检查,检查设定参数,控制电路,并根据实际需要调整各项运行参数,校验测量参数的精准,校正机组传感器温湿度显示值;过滤网检查,检查空气滤网,视情况清洗或更换,清洗蒸发器和冷凝器翅片;压缩机和风机检查,检查压缩机、风机的运行电流值,检查压缩机和风机绝缘电阻;制冷系统检查,检查制冷系统运行情况,检查运行压力,检查膨胀阀的工作状态,必要时调整过热度,使设备处于最佳状态;检查冷媒液镜、视情况补液或更换干燥过滤器;制冷剂管路泄露检查;检查制冷系统辅助部件的工作状态,如电磁阀、干燥过滤器等;加热系统检查,检查电加热器的各级加热电流及各电气接点是否正常,电加热器的过热保护是否灵敏;加湿系统检查,检查加湿罐,视情况清洗或更换,检查电磁阀;阀门及管道检查,检查冷媒管道和加湿系统供水管道是否正常,检查冷凝水积水盘及排水系统管道是否畅通;高压压力、低压压力(风冷系统),冷冻水压力、温度,冷却水压力、温度(水冷系统),风机运行情况,灰尘情况等0电气单元检查,检查每个接触器触点、接线,必要时做保养或更换,检测高低压保护装置,检查元器件、接线、安装等有无异常,紧固内部线路连接;1故障状态检查,记录机组报警内容,并对报警内容进行分析;2新风系统检查,测量新风温湿度、风速、机房正压值。7.2.5数据中心消防设备日常运维应观察、检测与记录下列内容:包括消防报警及联动设备、气体灭火设备、水喷淋设备、水喷雾设备、消火栓设备、早期烟雾探测设备,定期检测:每月1次,对消防设备进行全面的检测;对探测器进行模拟火灾响应试验和故障报警试验;对消防报警系统的主机设备、控制设备、探测器设备检测;对消防报警联动设备进行测试;对消防广播设备进行消防联动测试;对气体灭火设备的钢瓶、电磁阀,管道、阀门设备进行测试,检查记录气体灭火钢瓶压力、灭火器有效期等;对喷淋灭火设备的管道、阀门设备进行测试;对消火栓设备的管道、阀门设备进行测试;检查设定参数,控制电路,并根据实际需要调整各项运行参数。7.2.6数据中心监控与安全防范系统日常运维应观察、检测与记录下列内容:监控与安全防范设备,定期检测:每两月一次设备检测;环境和设备监控设备系统参数检查;从监控软件上读取各设备的监控数据,与设备自身控制器显示数据进行对比,检测监控系统是否正常:UPS监控准确性检查、数字电量仪监控准确性检查、配电开关状态监控准确性检查、漏水监控检查、空调监控准确性检查、温湿度监控准确性检查、门磁报警监控状态检查、视频监控系统状态检查;漏水报警系统漏水模拟试验,测试报警的准确性及灵敏度;检查门禁设备每个读卡器外观是否良好、感应卡是否灵敏;通过门磁测试工具检测门磁是否正常,吸力是否足够;检查门禁控制器、协议转换器的通讯,门禁控制功能检查,门禁权限变更验证;微波红外双鉴探测器、报警主机检查,报警输出功能验证;闭路电视监控系统,检测前端每个摄像头的监控图像质量,评估摄像监控范围有无死角,检测后端存储设备的容量是否满足监控图像保留要求,检测后端存储设备、监视器的回放功能,检测监控软件的自动识别、分析功能。7.2.7数据中心运行环境日常运维可观察、检测与记录下列内容:定期检测环境温湿度、空气洁净度(如粉尘、SO2等)、照度、电磁场、正压、等电位、接地、温度场及机房微环境分布等。7.3验证与健康评估7.3.1验证与健康评估应采购有资质的第三方检验检测机构的服务。7.3.2验证与健康评估频次:应1-2年做一次,保证基础设施运行的可靠性。7.3.3验证与健康评估范围:数据中心动力系统运行健康体检范围 机房电气系统、暖通系统、计量器具:电气系统的测试检查实施范围 UPS配电系统:变压器低压输出柜下端至UPS配电系统末端的测试检查;.1动力配电系统:变压器低压输出柜下端至动力配电系统末端的测试检查;.2柴油发电机系统:柴油发电机机组、供油及油路系统和低压配电柜系统的测试检查。暖通系统的测试检查实施范围.1室内精密空调:风冷直膨型恒温恒湿精密空调全系统;.2新风系统。环境质量测试检查实施范围.1开机温度测试.2开机相对湿度测试.3开机相对温度变化率.4尘埃粒子含量测试.5光照度测试.6主机房与走廊正压差测试.7无线电干扰场强测试.8磁场干扰环境场强测试.9空调送回风温差测试.10噪音测试.11输出端中性线与PE线之间电位差测试机房有害空气质量检测.1机房内气体含量(氧气、硫化氢、二氧化硫、三氧化硫、氢气);.2ECC内气体含量(氧气);.3电池间气体含量(氢气、氧气)计量器具精确度检定/校准7.3.4依据规范和标准 测试验证依据包括国家相关规范标准、项目用户需求、技术规格书、施工图纸、国际相关规范标准等,具体由数据中心健康体检单位在实施方案中具体阐述,由业主审定。 工程施工招、投标文件 工程施工项目合同书 项目技术规格书、图纸 工程管理文档 GB50462-2008电子信息系统机房施工及验收规范 GB50174-2008电子信息系统机房设计规范 GB/T9361-2011计算机场地安全要求 GB50045-2005高层民用建筑设计防火规范 GB50057-2010建筑物防雷设计规范 GB50116-2013火灾自动报警系统设计规范 GB50166-2013火灾自动报警系统施工及验收规范 GB50198-2011民用闭路电视监视系统工程技术规范 GB50203-2011砌体工程施工质量验收规范 GB50209-2010建筑地面工程施工质量验收规范 GB50210-2010建筑装饰装修工程质量验收规范 GB50235-2010工业金属管道工程施工及验收规范 GB50236-2011现场设备、工业管道焊接工程施工及验收规范 GB50243-2002通风与空调工程施工质量验收规范 GB50303-2011建筑电气工程施工质量验收规范 GB50325-2010民用建筑工程室内环境污染控制规范 GB50339-2013智能建筑工程质量验收规范 GB50343建筑物电子信息系统防雷技术规范 GB17167《用能单位能源计量器具配备和管理通则》 GB/T32910.3-2016《数据中心资源利用第3部分:电能能效要求和测量方法》 GB/T33656-2017《企业能源计量网络图绘制方法》 JJF1356-2012《重点用能单位能源计量审查规范》 CQC1312数据中心场地基础设施评价技术规范 以上所有标准规范均以最新版本为准,当不一致时按高标准执行。7.3.5数据中心健康体检内容系统性能检查工作内容 电气系统。 柴油发电机系统。测试设备:电能质量分析记录仪、红外成像仪、红外测温仪等。状态指示验证:是否自动控制状态、电流断路器分开和闭合、引擎运行、相电压、电流、频率、电池电压、运行小时、转速发动机温度、冷却介质温度、工作方式(自动/手动)、输出功率、润滑油温度、油压等状态显示检查。UPS输入端电能质量 UPS输入端,即接入公用电网的连接处(公共连接点),该点是UPS配电输入端。测试设备:电能分析记录仪测试项目:.1频率偏差允许值: 正常频率偏差允许值:±0.2HZ; 当系统容量较小时,频率偏差允许值:±0.5HZ; 孤立电网:根据系统条件,在保证发电机组和网内电力用户安全稳定运行及正常供电前提下,可适当放宽频率偏差限值。.2供电电压允许偏差: 220V单相供电电压允许偏差为标称系统电压(额定电压)的+7%,-10%; 10KV及以下三相供电电压允许偏差为标称系统电压的±7%; 35KV及以上供电电压正、负偏差的绝对值之和不超过额定电压的10%。 对供电电压允许偏差有特殊要求的用户,由供用电双方协议确定。.3公用电网谐波:表1.1公共电网谐波电压(相电压)限值电网标称电压KV电压总谐波畸变率%各次谐波电压含有率:%奇次偶次0.385.04.02.064.03.21.610353.02.41.2661102.01.60.8注:1)、电力系统最小运行方式下,测量谐波应在谐波源工作周期中产生的谐波量大的时段内进行;、负荷变化快的谐波源,测量间隔5s~2min,负荷变化慢的谐波源,测量间隔取5min~10min;、谐波测量的数据应取测量时段内各相实测值中最大的一相值,作为判断谐波是否越限的依据;、每次测量结果应为3s内所测值(≥6个值)平均值或均方根值。.4电压波动和闪变限值表1.2各级电压下的闪变限值电压等级LVMVHVPst1.00.9(1.0)0.8Plt0.80.7(0.8)0.6 注: 1)、Pst测量周期为10min,Plt测量周期为2h;MV括号中值仅适用于公共连接点连接的所有用户为同电压等级的用户场合。 2)、低压(LV)≤1kV;中压(MV)≤35kV;低压(HV)≤220kV。表1.3各级电压下的变动限值r,h-1d,%LV、MVHVr≤1431<r≤1032.510<r≤10021.5100<r≤10001.251 注: 1)、很少的变动频度r(每日少于1次),电压变动限值还可以放宽。 2)、在电力系统正常运行的较小方式下,波动负荷最大工作周期时测量d、Pst和Plt。对三相不平衡负荷,取最严重一相的值。 3)、每10min作为Pst的一个测量周期,测量一个Pst值和一个d的95%概率大值,每2小时得到一个Plt值。 4)、在统计周期内,以d、Pst、Plt的95%概率大值作为判断是否越限依据。.5三相电压不平衡限值1)、电力系统公共连接点正常电压不平衡允许值为2%,短时不得超过4%。2)、接于公共连接接点的每个用户,引起该点正常三相电压不平衡度允许值为1.3%。.6UPS输出端电能质量UPS输出端电能质量,UPS输出端连接用电设备。测试设备:电能分析记录仪测试指标及要求:电子计算机供电电源质量应符合表1.4规定。表1.4供电电源质量分级项目ABC稳态电压偏移范围(%)±2±5+7/-13稳态频率偏移范围(Hz)±0.2±0.5±1电压波形畸变率(%)3-55-88-10允许断电持续时间(ms)(即市电、电池切换时间)0-44-200200-1,500 按照GB/T1095-2000、GB/T14715-93规定,UPS的输出端电气性能指标如表1.5所示。表1.5UPS输出端电气性能指标要求指标项目技术要求一级二级三级旁路逆变切换时间<1ms<4ms<4ms输出电压不平衡度≤5%输出电压相位偏差≤5°(平衡线性负载)输出功率因数≤0.8电源效率>10kVA,≥90%≤10kVA,≥80%测试的意义:电源质量的不稳定带来的危害1)干扰通信系统的工作。2)会使功率因数下降,导致电费成倍增长。3)谐波电压会使配电系统损耗增加,设备故障率升高;3%的负序电压会使电动机的寿命减半。4)会导致变压器、变频器、马达和中线过热,及断路器动作。5)会使电压、电流波形畸变,导致精密仪器无法正常工作。6)增加用电设备的附加损耗,降低设备的效率和利用率。7)使测量和计量仪器的指示和计量不准确。8)三相不平衡会造成中心点与地形成一个电压,当此电压超过1V时,会使电子设备积累大量的静电,对灵敏设备产生干扰,干扰数据通讯,给电子设备造成非常危险的后果,甚至造成致命的损坏。9)三相不平衡会造成变压器内部磁旋涡,使铁损加大,造成变压器发热、容量减小。10)三相不平衡会造成用户对功率需求加大,增加用户用电量。.7UPS蓄电池 测试仪器:电池性能测试仪 测试指标及要求: UPS蓄电池适用于电子计算机机房供电,蓄电池的测试项目主要有:1)浮充电压2)内阻3)电池浮充电压:必须在制造商的推荐极限值之内,而且该推荐值须考虑温度补偿。4)单体电池的内阻值:随测量条件而变化。如果单体的内阻值变化时,则表明其性能也发生变化。内阻值有明显的变化,表明单体电池的性能也发生明显的变化。在没有内阻测试仪器制造商的特定指南时,内阻值变化超过20%时,就认为是明显的变化。这样的变化应与制造商作进一步的讨论。.8电力系统、电气设备红外检测 测试仪器:红外成像仪 测试目的:电气设备外壳内部的各种部件,如导电回路、接头、连接件、绝缘介质、铁芯等,在其故障发展和形成过程中,绝大多数都与发热升温紧密相连。精确识别导电回路的接头和连接件的可能发热故障,设备外壳内部的各种部件,如导电回路、绝缘介质和铁芯等部件,由于损坏、老化、腐蚀、污秽、氧化、接触不良、材料不合格、工艺设计、施工不当等方面的问题造成应力/电流过载和不平衡,产生的局部过热。暖通系统.1精密空调 设备检查:设备型号和规格确认,设备外观、组件的完整性等检查; 安装检查: 1)空调设备安装位置、冷凝水排水管、减震和密封; 2)空调设备供配电电源与开关、控制系统、温/湿度设定与报警参数等设定; 3)厂家调试报告; 功能检查: 1)空调设备实际运行参数、设备启动与重启测试、自动轮停功能测试、关键报警测试、漏水与消防联动测试,风机转速控制等检查;.2动力与环境监控系统检测 功能检查:报警、状态显示、远程监视等;.3新风机组 1)设备检查: ①设备型号和规格确认,设备外观、组件的完整性等检查; 2)安装检查 ①设备安装、检修门、内部清洁、管道、风管管道、阀门、电气、变频器、风机、过滤器、加热器等检查; ②电气回路连接与保护开关、控制系统与开关; ③厂家调试报告; 3)功能检查①手动操作测试;②自动操作测试; 4)风阀控制运行测试①进气阀门与新风机联动测试;环境质量系统 1)噪声 测试仪器:数显声级计 测试指标要求:①计算机系统机房内的噪声在主机房中心处测试应小于85dB(A)。②有人值守的辅助区,在主操作员位置测量应小于65dB(A)。测试方法:①主机房中心处和有人值守辅助区的主操作员位置进行测量。②测量的稳定值即为该房间的噪声值,应符合标准要求。 2)尘埃测试仪器:激光尘埃粒子计数器测试指标要求:主机房内的空气含尘浓度,依机器要求而定,主机房内尘埃的粒径大于或等于0.5μm的个数应小于或等于18000粒/cm3(相当于500000粒/英尺3)。测试方法:①计算机场地竣工测试应对房间及空调系统进行彻底清扫,并应在空调系统正常运行24h以后进行;②对粒径大于或等于0.5um的尘粒计数,宜采用光散射粒子计数法;③采样注意事项:采样管必须干净,连接处严禁渗漏;管的长度应根据仪器允许长度,当无规定时不宜大于1.5m;测试人员应在采样口的下风侧;④测点布置:按50㎡布置5个测点,如图2.1所示。每增加20㎡~50㎡,增加3~5个测点;图2.150㎡机房抽样点选取规范⑤每个测点连续三次测试,取其平均值为该点的实测数值,各测点的实测数值均代表房间内的含尘数量。 3)照明测试仪器:照度计测试指标要求:计算机机房在距地面0.8m处,照度不应低于300lx,基本工作间和第一类辅助房间不低于200lx,其他房间参照GB50034执行。测试方法:①在房间内距墙面1m(小面积房间为0.5m),距地面为0.8m的假定工作面上进行测试;或在实际工作台面上进行测试;②测试点选择3~5点,大面积房间可多选几点进行测试 4)电磁场干扰测试设备:高频电磁辐射分析仪、工频电磁场测试仪测试项目及要求:①无线电干扰环境场强主机房内无线电干扰场强,在频率范围0.15Mhz~1000Mhz时不大于126dB。②磁场干扰场强主机房内磁场干扰场强不大于800A/m(相当于10Oe)。测试方法:①无线电干扰环境场强的测试:在计算机机房内任一点测试,取最大值应符合标准要求。②干扰环境场强的测试:在计算机机房内任一点测试,取最大值应符合标准要求。 5)温度、湿度测试仪器:数显温湿度计测试指标要求:电子计算机机房内温、湿度应符合表1.6的规定。表1.6温湿度检测技术要求项目技术要求A级(增强级)主机房温度(开机时)18℃~27℃主机房相对湿度(开机时)不大于60%主机房和辅助区温度变化率(开、停机时)5℃/h辅助区温度、相对湿度(开机时)18℃~28℃,35%~75%不间断电源系统电池室温度15℃~25℃测试方法:①测试应在计算机设备正常运行1h以后进行;②测点选择高度应离地面0.8m,距设备周围0.8m以外,应避开出、回风口;③每个测点数据均为该房间的实测温度、湿度; 6)风速检测 测试仪器:数字风速表 测试项目及要求:机房的送风风速:采用活动地板下送风时,出口风速不应大于3m/s 测试方法:风口处的风速可用热点风速仪测量,测量时应贴近格栅及网格。按20%抽检,合格率达到100%为合格。 7)正压检测 测试仪器:数字式微压计 测试项目及要求:正压要求:主机房必须维持一定的正压。主机房与其他房间、走廊件的压差不应小于4.9Pa,与室外静压差不应小于9.8Pa。 测试方法: ①测试时应关闭室内所有门窗; ②使用数字式微压计检测,要求仪器预热时间15min; ③测点布置:任意选择室内气流扰动较小的点; 8)接地系统 测试仪器:接地电阻测试仪 测试项目及要求:①独立的防雷保护接地电阻应≤10Ω;②独立的安全保护接地电阻应≤4Ω;③独立的交流工作接地电阻应≤4Ω;④独立的直流工作接地电阻应≤4Ω;⑤防静电接地电阻一般要求≤4Ω;⑥采用联合接地体时,接地电阻不应大于1Ω。 9)振动 测试仪器:测振仪 测试项目及要求:在电子信息设备停机条件下,主机房地板表面垂直及水平向的振动加速度不应大于500mm/s2;系统功能测试检查工作内容 1)单项测试①电气系统:完成配电系统的单项测试,包括:母联切换测试、二次保护回路测试、UPS配电柜、接地系统测试、精密配电柜、楼层配电箱、照明系统、末端插座回路测试、低压母线检查、柴油发电机测试、仪表的测试、电源自动切换箱测试、动力配电箱及照明配电箱本体检查、UPS冗余测试、精密配电柜检测、照明系统测试。②暖通系统:精密空调、新风系统、送排风系统工程等、机房内气流组织等的测试验证及空调设备性能测试、排风机、排烟风机等通风设备性能测试、全系统联动测试。 2)联合测试①电气系统:分别模拟验证单边UPS设备故障时系统的联动切换,并对UPS系统进行应急操作,验证应急状态下系统电流电压等各关键参数是否符合设计及相关规范需求,并提供各种紧急状态下的操作步骤;(CQC要求)模拟一路变压器故障,低压母联顺利切换,验证自投自复/自投手复/手动等模式的情况,包括切换延时时间,切换过程中电池放电以及动力与环境监控系统的报警信息。模拟验证单路市电停电,系统放电并切换至旁路,并对UPS系统进行应急操作,验证应急状态下UPS系统电流电压等各关键参数是否符合设计及相关规范需求,并提供各种紧急状态下的操作步骤。模拟验证双路市电停电时,UPS系统放电时长及柴油发电机启动、送电测试,并对配电系统进行应急操作,验证应急状态下配电系统电流电压等各关键参数是否符合设计及相关规范需求,并提供各种紧急状态下的操作步骤。市电掉电时,低压母联的切换状态,各控制继电器、时间继电器的参数整定值设定,上下各级母联切换开关的切换时间并监测切换过程中设备的持续供电,末端切换以及电池充放电等一系列影响结果。验证动力与环境监控系统中关于整个数据中心电力系统监控的全面性、准确性以及直观性。 3)暖通系统:模拟验证一台及多台精密空调故障,进行冗佘测试,对系统进行应急操作,验证应急状态下系统温湿度等各关键参数是否符合设计及相关规范需求,并提供各种紧急状态下的操作步骤。机房热负荷制冷能力测试:测试精密空调和气流组织的制冷能力,温湿度情况,出现问题时,查找问题原因。灾难切换演练流程测试检查工作内容 1)市电停电状态:模拟单路、双路市电停电状态,对电气系统、空调系统进行应急操作,验证电气空调监控系统,检验电流、电压、温湿度、报警响应时同等各关键参数是否符合设计及相关规范需求,并提供各种紧急状态下的运维人员配置、操作步骤等详细文档。市电停电状态测试内容包括但不限于:单路市电停电状态,蓄电池放电,市电进线侧进行电源切换,设备自投装置运行情况下的工作状态。双路市电停电状态,蓄电池放电,柴油发电机启动,切换到柴油发电机供电,UPS恢复正常供电状态。计量器具管理要求: 1)建立健全计量器具管理制度,并保持可持续改进能力。 2)保持人员计量管理知识水平,满足计量器具管理要求。 3)建立计量器具年度巡检制度,保证关键节点计量器具的可用性和准确性,确保计量数据的可信度。 4)每年采购第三方检验检测机构对与PUE计算有关的计量器具进行比对实验,确保计量器具的可用性和有效性,提升PUE数值的可信度。 5)在用数据中心应采购节能认证服务,获得节能认证A级证书,降低能源消耗,履行中华人民共和国节约能源法的义务。7.4资产管理7.4.1一般规定数据中心资产包括:电力系统设备、暖通系统设备、IT设备与其他数据中心附属设备;数据中心资产管理须有明确的管理颗粒度,并进行明确描述与记录,包括:品牌、型号、资产编号、资产位置、资产管理员、采购时间、采购合同、过保时间、维保信息、预期寿命、资产状态、资产所有者、资产关联属性等;数据中心资产需要建立对应的资产档案,7.4.2资产信息管理应建立资产管理系统,宜平台化;数据中心资产管理系统已经具备完善的维护管理机制,确保数据中准确性与完整性。7.4.3资产全生命周期管理数据中心基础设施资产的采购、折旧、维保、报废等工作,应遵循采购、财务部门相关的标准制度执行;应制定数据中心资产盘点制度,定期或不定期组织资产盘点,对盘盈、盘亏数据进行分析,通过有效措施确保账实相符;资产迁入、迁出与变更等数据,均需记录在资产管理系统中,确保符合审计要求;数据中心基础设施资产的使用寿命、升级改造,应遵循国家标准、行业标准、本团体标准、厂商说明书等依据。包括:高中低压变压器、各级配电柜、UPS、蓄电池、空调末端设备、冷冻机组、冷却塔、板换设备、储冷罐、制冷管线、电气管线……7.4.4资产安全数据中心资产应存放在具有访问控制的安全区域;线下所有备品、备件应按照不同的类别进行分类存储;所有备品、备件应符合按需使用原则;
第八章应急管理8.1、一般规定数据中心在发生基础设施异常事件时,应立即启动应急处理机制。数据中心应急管理要求包括:8.1.1应急组织管理;8.1.2应急响应及流程管理;8.1.3应急事件管理;8.1.4应急预案目标对象;8.1.5应急演练管理;8.1.6应急预案的持续改进;8.2、应急组织8.2.1应急组织架构应急组织架构设置核心是应急处置领导小组架构。应急处置领导小组下设应急管理小组、应急技术与执行小组、应急保障小组等下级组织。应急组织负责突发事故及灾难事故的应急预案制定、应急处置、对外信息发布、总结报告等工作。8.2.2应急领导小组组成应急领导小组是应急事件决策机构,由数据中心高管层授权并由高管人员担任应急领导小组组长,各相关职能部门的负责人为应急领导小组成员。工作职责应急领导小组的主要职责是负责审定突发事件及灾难事故的分类方式和分级响应的总体策略、应急响应流程及操作规程;负责突发事件的应急指挥、组织协调和过程控制;决定应急处理预案的启动;明确事件新闻发布人,并授权事件新闻发布人在应急过程中统一对外信息发布口径;宣布重大应急响应状态的降级或解除;向高级管理层报告应急处置进展情况以及做总结报告等。8.2.3应急管理小组组成应急管理小组是应急流程管理及文件维护的机构,由专职的体系管理部门及各业务部门负责人组成,负责组织有关业务部门编制及定期更新应急预案,并负责组织应急预案的日常培训与演练。工作职责应急管理小组工作职责
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度企业质量管理与提升合同
- 2024年度新型车库门材料供应合同
- 2024年度拆墙工程保险合同
- 2024年度国际文化旅游合作合同
- 2024年度城市供水系统井群扩建工程承包合同
- 软木工艺品市场发展现状调查及供需格局分析预测报告
- 2024年度婚礼拍摄服务合同
- 2024年度大连港口货物装卸服务投标合同
- 智能铁路监控行业市场调研分析报告
- 采矿用电笛项目评价分析报告
- 小学语文中段整本书阅读的指导策略研究 中期报告
- 健身指导与管理职业生涯规划书
- 2023医保药品目录
- 工业互联网职业规划
- 2024年黑龙江省药品监督管理局直属事业单位招聘笔试冲刺题
- 肺癌射频消融术护理课件
- 癌症化疗病人心理护理课件
- 浙江省绍兴市高三上学期11月选考科目诊断性考试化学试题
- 《急救知识普及》课件
- 广州市小学数学学科第二届青年教师解题比赛初赛试题(答案)
- 校园游泳馆项目运营方案
评论
0/150
提交评论