版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 103/103 数据中心基础设施管理系统(DCIM)整体方案目 录 TOC o 1-3 h z u HYPERLINK l _Toc507779883 1.项目概述及需求理解 PAGEREF _Toc507779883 h 6 HYPERLINK l _Toc507779884 1.1.项目背景简介 PAGEREF _Toc507779884 h 6 HYPERLINK l _Toc507779885 1.2.项目管理范围 PAGEREF _Toc507779885 h 6 HYPERLINK l _Toc507779886 1.3.项目建设原则 PAGEREF _Toc507779886
2、h 7 HYPERLINK l _Toc507779887 1.4.项目建设目标 PAGEREF _Toc507779887 h 8 HYPERLINK l _Toc507779888 1.5.解决方案概述 PAGEREF _Toc507779888 h 9 HYPERLINK l _Toc507779889 2.系统架构及实现原理 PAGEREF _Toc507779889 h 13 HYPERLINK l _Toc507779891 2.1.系统架构 PAGEREF _Toc507779891 h 13 HYPERLINK l _Toc507779892 2.1.1.采集层 PAGEREF
3、 _Toc507779892 h 14 HYPERLINK l _Toc507779893 2.1.2.处理层 PAGEREF _Toc507779893 h 14 HYPERLINK l _Toc507779894 2.1.3.管理层 PAGEREF _Toc507779894 h 15 HYPERLINK l _Toc507779895 2.1.4.交互展现层 PAGEREF _Toc507779895 h 15 HYPERLINK l _Toc507779896 2.2.系统集成 PAGEREF _Toc507779896 h 16 HYPERLINK l _Toc507779897 2
4、.2.1.第三方集成 PAGEREF _Toc507779897 h 16 HYPERLINK l _Toc507779898 2.2.2.短信猫集成 PAGEREF _Toc507779898 h 17 HYPERLINK l _Toc507779899 2.2.3.短信网关集成 PAGEREF _Toc507779899 h 17 HYPERLINK l _Toc507779900 2.3.开发工具及技术介绍 PAGEREF _Toc507779900 h 18 HYPERLINK l _Toc507779901 2.3.1.自定义流程引擎 PAGEREF _Toc507779901 h
5、18 HYPERLINK l _Toc507779902 2.3.2.成熟的开发标准技术 PAGEREF _Toc507779902 h 19 HYPERLINK l _Toc507779903 2.3.3.分布式通讯调度 PAGEREF _Toc507779903 h 19 HYPERLINK l _Toc507779904 2.3.4.搜索引擎 PAGEREF _Toc507779904 h 20 HYPERLINK l _Toc507779905 3. DCIM系统功能实现 PAGEREF _Toc507779905 h 21 HYPERLINK l _Toc507779907 3.1.
6、基础设施集中监控 PAGEREF _Toc507779907 h 21 HYPERLINK l _Toc507779908 3.1.1.UPS监控 PAGEREF _Toc507779908 h 22 HYPERLINK l _Toc507779909 3.1.2.蓄电池监测 PAGEREF _Toc507779909 h 23 HYPERLINK l _Toc507779910 3.1.3.配电参数监测 PAGEREF _Toc507779910 h 25 HYPERLINK l _Toc507779911 3.1.4.发电机监测 PAGEREF _Toc507779911 h 26 HYP
7、ERLINK l _Toc507779912 3.1.5.精密空调(加湿器)监控 PAGEREF _Toc507779912 h 28 HYPERLINK l _Toc507779913 3.1.6.环境监控(温湿度、风速、氢气) PAGEREF _Toc507779913 h 29 HYPERLINK l _Toc507779914 3.1.7.漏水检测 PAGEREF _Toc507779914 h 30 HYPERLINK l _Toc507779915 3.1.8.消防(极早期)监测 PAGEREF _Toc507779915 h 31 HYPERLINK l _Toc50777991
8、6 3.2.基础设施管理 PAGEREF _Toc507779916 h 32 HYPERLINK l _Toc507779917 3.2.1.资产管理 PAGEREF _Toc507779917 h 32 HYPERLINK l _Toc507779918 3.2.2.容量管理 PAGEREF _Toc507779918 h 37 HYPERLINK l _Toc507779919 3.2.3.能耗管理 PAGEREF _Toc507779919 h 39 HYPERLINK l _Toc507779920 3.3.集中展现 PAGEREF _Toc507779920 h 42 HYPERL
9、INK l _Toc507779921 3.3.1.展现系统集中化 PAGEREF _Toc507779921 h 42 HYPERLINK l _Toc507779922 3.3.2.展现方式多样化 PAGEREF _Toc507779922 h 49 HYPERLINK l _Toc507779923 3.4.预警及告警 PAGEREF _Toc507779923 h 51 HYPERLINK l _Toc507779924 3.4.1.统一事件展现 PAGEREF _Toc507779924 h 51 HYPERLINK l _Toc507779925 3.4.2.监控指标库 PAGER
10、EF _Toc507779925 h 51 HYPERLINK l _Toc507779926 3.4.3.故障管理 PAGEREF _Toc507779926 h 52 HYPERLINK l _Toc507779927 3.5.运维管理 PAGEREF _Toc507779927 h 56 HYPERLINK l _Toc507779928 3.5.1.服务台 PAGEREF _Toc507779928 h 58 HYPERLINK l _Toc507779929 3.5.2.个人工作台 PAGEREF _Toc507779929 h 60 HYPERLINK l _Toc50777993
11、0 3.5.3.值班管理 PAGEREF _Toc507779930 h 63 HYPERLINK l _Toc507779931 3.5.4.事件管理 PAGEREF _Toc507779931 h 66 HYPERLINK l _Toc507779932 3.5.5.问题管理 PAGEREF _Toc507779932 h 69 HYPERLINK l _Toc507779933 3.5.6.配置管理数据库 PAGEREF _Toc507779933 h 74 HYPERLINK l _Toc507779934 3.5.7.变更管理 PAGEREF _Toc507779934 h 76 H
12、YPERLINK l _Toc507779935 3.5.8.服务级别管理 PAGEREF _Toc507779935 h 78 HYPERLINK l _Toc507779936 3.5.9.知识库管理 PAGEREF _Toc507779936 h 84 HYPERLINK l _Toc507779937 3.5.10.可视化流程设计 PAGEREF _Toc507779937 h 88 HYPERLINK l _Toc507779938 3.5.11.角色/权限管理 PAGEREF _Toc507779938 h 94 HYPERLINK l _Toc507779939 3.6.报表分析
13、 PAGEREF _Toc507779939 h 96 HYPERLINK l _Toc507779940 3.6.1.监控报表 PAGEREF _Toc507779940 h 96 HYPERLINK l _Toc507779941 3.6.2.运维管理报表 PAGEREF _Toc507779941 h 981.项目概述及需求理解项目背景简介 伴随着数据中心规模的不断扩大,业务量的逐渐增大,对数据中心的运维管理也变的越来越重要。一旦基础设施系统出现问题,而没有及时地得到妥善解决,常常会给企、事业造成很大的损失。怎样能7x24小时保证设备系统的正常运行,避免各种故障的发生,优化和改进传统的运
14、维模式,提高客户服务的及时性和满意度就显得非常重要。因此,建设一套数据中心基础设施管理系统势在必行。一个完备的运维管理系统能够提供7x24小时检测基础设施运行状态、各种资源状态的信息。运维管理人员依靠流程管理系统可以及时排除故障避免造成重大损失,控制运维质量提高服务水平。项目管理范围项目内容:设施故障发现与警报;记录日常运维日志信息;设施故障统计;设施软硬件信息统计;服务进程管理;将数据信息存储备份,并采用不同方式直观的展示出来;服务人员绩效、考核管理;将数据生成报表;项目建设原则数据中心基础设施管理系统建设指导思想是:“统一规划、分步实施、已有纳入、新建遵循”。数据中心基础设施管理系统项目建
15、设是要建设一个集中管控资源的运维平台,所以需充分考虑对已有各种产品组件做针对性的开发、整合工作。在项目建设过程中,除满足系统功能需求外,遵循如下原则:安全性原则:系统设计注重安全方面的设计,确保系统的安全运行。系统提供安全认证技术,确保登录身份认证安全性、有效性。稳定性原则:保证系统不间断运行,系统执行监控及操作任务时或出现自身故障,绝不能影响被监控及操作对象的正常稳定运行。开放性原则:系统遵循行业主要的标准化组织所提供的标准或建议,采用标准的、开放性的技术,能够实现与其他厂商的产品无缝地连接;采用国际标准化组织及工业界广泛接受的有关标准和基于标准的通用软硬件平台。可扩展性原则:在保持系统的基
16、本体系结构长期稳定的前提下,可以有效地容纳和支持基础设施规模的不断扩大和复杂、业务种类的增多。同时,能够在应用体系结构和软件模块划分两个方面支持整个应用的良好扩展性。在体系结构方面采用多层结构划分,实现各层的高聚合和层间低耦合。尽量使用模块化和插件化,使得扩展时对原系统的影响最小化。用户体验优化原则:具有较高的易用性,界面友好,美观统一,并对人机交互进行优化设计。灵活性原则:系统各子系统及子系统内功能模块具有一定的独立性,同时具有系统相关性和整体一致性。系统提供自动化升级维护功能,系统的维护及拓展灵活、方便。规范性原则:统一接口标准,规范数据字典。定义监控接入标准,规范未来新建系统的监控。项目
17、建设目标 加强数据中心的维护平台建设,提高数据中心的运行管理水平,通过运维体系的建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握数据中心的运行状态,保障各业务系统的正常运行,并达成如下目标: (1)强化主动监控,实现集中管理。 以设施资源可用性监控为主线,构建数据中心统一集成的设施资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成数据中心运维管理主动服务的新局面。 (2)帮助定位故障,快速恢复系统运行。 建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当故障产生时,可以进行故障的快速定位,发现故障原
18、因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。 (3)掌握运行质量与效率,合理利用资源。 建立数据中心基础设施管理系统平台后,可以实时了解数据中心全部资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调剂业务系统对资源的使用。 (4)规范运行管理,有序开展维护。 参照数据中心运维规范,对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。根据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。 (
19、5)共享运维经验,完善知识库。 把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,提高数据中心运维人员的工作效率。解决方案概述DCIM系统是在在分析了国内数据中心管理现状和需求后,自主研发而成。秉承以客户为中心、流程为导向的理念,实现对基础设施资源的全面管理,完美整合了人员、技术和流程三大要素,帮助用户以较低的成本提供稳定、优质的服务,共同实现基础设施服务的目标。DCIM系统提供了“无缝式基础设施监控系统”功能,其系统架构清晰,采用模块化的设计理念,各功能模块既可独立运行、松散耦合;亦可整体功能无缝衔接覆盖整个业务系统,灵活的自由组合真正
20、实现个性化的基础设施无忧运维。DCIM系统提供一个图形化、可定制、统一的监控管理平台。通过它实现对基础架构性能和告警数据的直接监控与展示,实现对用户环境的整体运行状态的监控管理。故障预警和管理前瞻性地发现系统的故障和性能问题,能够快速识别、隔离、诊断和修复生产中出现的问题。前瞻性发现基础设施和应用系统的故障。前瞻性检测复杂的应用性能问题。基于业务的性能影响分析报告快速识别、隔离和诊断问题的起因,事故根本原因分析。对一些简单的故障问题,提供自动化修复故障的功能;对复杂的故障和性能问题,尽可能提供修复故障和改善性能的建议。提供的丰富的事件通知功能,事件通知方式包括:Mail 自动向指定邮箱发送告警
21、邮件。短信 自动向指定手机发送告警短信。声音 自动产生声音告警。图像 自动以图标形式显示告警事件。其它 通过二次开发可实现特殊要求的告警方式。提供监控参数化配置管理,参数超过设定阀值,产生报警信息。多层次的视图展示直观、准确地体现各层面的系统和业务运行状态,分别展示不同管理层次和范围的系统运行状态。根据企业的业务特点和管理习惯,可将展示视图分成一级视图、二级视图和三级视图,分别展示不同管理层次和范围的系统运行状态(如下图所示)。集中统一的管理界面用户在统一监控管理平台上可查看所有视图,提供直观的图形用户界面。基于上下文环境和组合视图,降低用户诊断问题的时间。基于角色和权限的控制,增强管理的安全
22、性。提供可定制化的工作区和视图,提高操作的灵活性。开放的接口能够集成第三方监控工具,实现将第三方监控(例如BA、安防、柴发、电力或特定应用管理工具等)完全变为监控系统的一部分。丰富的报表展示功能提供统一的报表界面,具备强大的数据展现能力:提供网络、系统、数据库、网络、中间件、应用和业务运转状况的集中统一报表提供实时与历史性能报表提供数据分析、展现和用户报表定制功能预制报表模板自动周期性报表,如日报、周报、月报、季报、年报等支持PDF、HTML、Excel等报表格式2.系统架构及实现原理系统架构本次提供的数据中心基础设施管理系统涵盖较多被监控的对象,覆盖面较广,功能复杂,系统设计遵循模块式开发、
23、部署,系统从底层到最上层的图形用户接口共分为四层,每一层实现不同的功能,系统整体的架构如下图所示:整个系统管理架构分为采集层、处理层、管理层、交互展示层四个层次。采集层包括数据中心环境中的机房环境、暖通设备、电力设备、安防设备等被管理实体,是需要被实时监控的对象,是原始信息的来源。所有的被管理对象通过标准协议或私有协议方式向管理端提供各种性能和事件数据。处理层包含两个功能,一是对管理实体中的数据进行数据采集;二是根据要求对数据进行必要的整合。除了采集到的数据外,还可能包括各种管理数据,系统汇总后的数据、文档数据等。系统管理的数据采集方式支持以下几种:采用定时轮循机制获取被监测设施的数据;监听代
24、理端的TRAP消息实时获取数据;通过设备厂家提供的监控工具获取数据;通过读取日志文件获取数据;通过其他厂商监控平台获取数据。管理层数据中心基础设施管理系统所使用的各种业务逻辑,集中管理和协调各子系统之间的服务调用,是系统管理的核心管理平台,主要有如下功能要点:1. 性能管理,对基础设施实时监控,采集各种指标数据,并与告警模块关联,在产生异常时及时发出警告2. 告警管理,提供告警主动通知、告警统计、告警相关性分析等功能3. 统一事件处理,集中收集基础设施事件与告警,并提供告警相关性分析,辅助管理员排除故障4. 基于运维服务管理则实现运维管理功能,包括服务台、事件管理、问题管理、变更管理、配置管理
25、、发布管理、知识库管理、SLA管理等模块。交互展现层展现层是DCIM系统与运维人员之间的人机交互接口,本次系统采用全WEB化的客户端界面,运维人员只需使用浏览器即可在网络中任意一台电脑上随时接入系统,系统支持portal功能,可以根据用户的需要呈现不同的功能和数据。此外,系统支持email、短信、声光等多种方式的事件通知形式。通过北向接口及标准协议,系统可将监控、采集数据推送至第三方管理平台及3D展示平台。 系统集成第三方集成DCIM系统在设计之初,充分考虑了开发性和可扩展性的需求,可以有效地容纳和支持基础设施规模的不断扩大和复杂、业务种类的增多,能够在设施体系结构和软件模块划分两个方面支持整
26、个应用的良好扩展性。系统预留业界较通用的接口,可以方便地实现与各类第三方系统的集成,支持通过以下方式进行对接和整合:Trap:基础设施管理系统可以接受第三方监控平台产生的trap,前提是双方确定好trap的报文格式,由DCIM系统内置的trap解析器进行解析和处理。如工单的自动生成,告警消息的上报,确认和清除等等。Webservice接口:为了实现数据共享,可以通过webservice接口将监控平台的数据在基础设施管理系统进行展示或汇总分析。如监控平台的topN数据展示,告警信息,与CI关联的设备信息,实时CPU, 内存,磁盘信息、链路流量等信息。HTTP接口:功能与(1),(2)基本相同,是
27、另一种数据交互方式,优点是调用方便,并且无需对引入第三方jar包,无需做侵入式修改。JMS:为了达到高实时性的要求,通过JMS推送机制,作为订阅客户端,可以接受推送过来的实时告警信息并在DCIM上进行展示,比如展示在业务视图上或工作区/服务台首页。SOCKET:可以支持socket双向通讯,由第三方监控平台开放socket监听端口,DCIM进行socket连接后进行数据通讯。可以满足一些实时性要求比较高的需求。API接口短信猫集成 短信猫直接接在DCIM系统所在服务器的串口上,并给短信猫配置一张SIM卡,当需要发送短信时,DCIM系统直接通过串口通信协议与短信猫通信,将短信的收信人手机号码,短
28、信内容发送给短信猫,由短信猫负责通过运营商的网络发送到指定接收人。短信网关集成 对于客户具备相应的短信网关系统的情况下,DCIM系统支持与短信网关对接,通过数据库访问协议访问短信网关的后台短信数据库,将短信的收信人,短信内容插入数据库,由短信网关软件负责将数据库中的短信发送到指定接收人,目前支持与SQL Server2000、SQL Server 2005、Oracle9i/10g数据库的短信网关集成。开发工具及技术介绍系列产品均采用JAVA+HTML5技术开发,实际情况证明,JAVA+HTML5技术是一项成熟可靠的技术,在全世界各个行业,有数不清的核心业务系统使用JAVA语言开发,大到银行核
29、心业务系统小到各个论坛网站,JAVA平台提供了多种多样的特定技术来解决软件开发中遇到的各种问题。目前的DCIM产品主要使用到了如下开发工具和技术:自定义流程引擎业内成熟、功能强大、性能稳定的流程引擎产品,通过使用流程引擎,可以使得企业业务人员和软件开发人员统一沟通的语言,使用流程建模工具即可完成交流,规避了业务人员不懂软件开发技术、软件开发人员不懂业务所带来的困扰;通过对流程的建模(结果以XML格式呈现),方便我们根据企业多变的业务情况灵活修改,流程引擎帮助我们管理各个流程实例的状态,软件开发商只需要在此基础上加入业务特定要求的表单数据即可,大大简化了开发企业流程管理软件的复杂度、降低了开发时
30、间和财务成本,提高了软件交付的时间,也提高了软件的稳定性。成熟的开发标准技术DCIM基于JAVA企业版本技术规范开发,为浏览器/服务器模型软件系统,系统严格遵守JAVA企业版本规范,采用了成熟可靠的Struts、多线程、异步IO、线程池等可靠技术,确保DCIM系统稳定、可靠、系统资源占用低,能够长时间稳定运行。分布式通讯调度在整个DCIM管理系统的建设中,底层的监控是基础,离开了底层的监控上层的运维就无从谈起,那么监控软件如何能够快速、准确的按照管理员设定的监控策略对指定的被管对象进行监控,并将监控取到的各种数据完整的送往上层。不同的被管对象,有不同的监控策略,比如某些重要配电设备,每秒钟就要
31、采样1次,某些设备比如蓄电池内阻只需要30分钟采样一次即可,随着被监测对象数量的增多,不同的监测对象需要有不同的通讯调度策略,在同一时刻可能有数千个通讯需要调度执行,这对通讯调度器模块提出了很高的要求,如何能够在预先规定的时间内采集到数据而没有发生延迟现象? DCIM系统通过分布式的通讯调度模块实现了该功能,其原理是通过并行的多台监控节点(嵌入式采集服务器),同时运行通讯调度工作,每个监控节点分别负责监控一部分被管对象,监控策略由中央策略节点下发,一旦下发到某个监控节点,监控节点会根据监控策略中规定的时间点准时触发相应的通讯。通过多台监控节点的水平部署,解决了大规模通讯调度的问题。搜索引擎 企
32、业流程多种多样,业务复杂,这些流程有事件处理、严重问题处理、变更/发布处理等流程,当日常运维工作使用管理软件来完成运维流程工作一段时间以后,就会产生大量的工单,这些工单以结构化的形式记录存储在数据库的表中,由于工单中记录了很多字符串的文字信息,如何根据关键字快速寻找到想要的工单,是一个难题。传统的关系型数据库虽然解决了结构化数据的存储、索引及搜索问题,但是无法做到对带有语义的字符串进行分词、索引,如果使用某个关键字对数据库表记录进行搜索的话,往往需要对全表进行逐行扫描,这会造成性能急剧下降,给用户带来非常差的搜索查询体验。 为了避免该问题,借鉴互联网搜索引擎对网页文本进行抓取、分词、索引、存储
33、的相关技术,DCIM通过内置的搜索引擎,对流程工单数据自动进行分词、索引操作,操作人员日后可以通过任意关键字搜索业务数据,相比较于传统的数据库式的搜索,大大提高了搜索时输入的便利性(只需要输入几个关键字而不需要在多个查询条件中分别输入)和搜索速度及准确性。3. DCIM系统功能实现基础设施集中监控 基础设施集中监控采用一体化监控采集系统(运行在嵌入式服务器上),系统主要功能有:机房设备监控:系统自身提供各种设备通讯接入端口,连接各种设备,例如红外,烟感、水浸、门禁、视频、空调,电源,UPS,发电机,服务器等,一旦发现异常,自动报警,发送报警通知信息并联动控制。动力监控支持: UPS、市电电量、
34、配电开关、蓄电池组、精密配电柜、ATS/STS、电源支路电流、PDU机柜电源、防雷器、发电机等设备监控;环境监控支持: 空调、漏水、温湿度、空气质量、光照度、粉尘含量等监测;安防、消防支持: 视频监控、门禁管理、入侵检测、火灾检测、极早期监测;微环境监控支持:监控机柜内的温度湿度状态、线路状态、供电状态,保障核心设备的稳定运行,辅助分析机房的局部环境及能源应用情况;联动控制:对所有设备设置报警上下限,任何设备数据超出范围,系统能够产生报警信息,并联动控制其他接入设备,例如录像、喷淋、新风机、空调等。UPS监控监控内容设计对机房内UPS电源的各部件工作状态、运行参数等进行实时监测,一旦发生故障及
35、报警通过监控平台发出对外报警。实现方式通过UPS设备提供的RS485(或RS232)智能接口及通讯协议,采用总线的方式将UPS的监控信号直接接入监控主机的串口,由监控平台软件进行UPS的实时监测。实现功能(只监不控)实时监视UPS整流器、逆变器、电池(电池健康检测,含电压电流等数值)、旁路、负载等各部分的运行状态与参数(能监测到的具体内容由厂家的协议决定,不同品牌、型号的UPS所监控到的内容不同)。系统可对监测到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦UPS发生越限报警或故障,系统将自动产生报警事件,并第一时间发出语音、电话、短信等对外报警。提供曲线记录,直观显示实时及历史曲线,
36、可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解UPS的运行状况。蓄电池监测监控内容设计对机房内蓄电池的参数进行实时监测,一旦发生故障通过监控平台发出对外报警。实现方式通过加装蓄电池检测仪与每节电池进行连线监测,多台蓄电池检测仪通过RS485智能接口及通讯协议采用总线方式将信号接入监控主机的串口,由监控平台软件进行蓄电池的实时监测。实现功能实时监测蓄电池组的总电压、充放电电流、电池表面温度(可选,需配置贴片式温度传感器)、单体蓄电池的电压参数。系统可对监测到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦蓄电池
37、发生故障,系统将自动产生报警事件,并第一时间发出语音、E-Mail、声光等对外报警。提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解蓄电池的状况。配电参数监测监控内容机房市电的供电质量好坏将直接影响机房内用电设备的安全,设计在配电柜上安装电量仪对市电进线进行各项供电参数监测。实现方式通过在配电柜中安装带液晶显示的电量仪对进线实现监测,既可在配电柜表面实时看到电量仪采集到的参数,亦可通过电量仪的RS485智能接口和通讯协议采用总线的方式将信号接入监控主机的串口,由监控平台软件进行市
38、电的实时监测。实现功能实时监测市电进线三相电的相电压、线电压、相电流、频率、功率因数、有功功率、无功功率等参数。系统可对监测到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦市电发生越限报警,系统将自动产生报警事件,并第一时间发出语音、电话、短信等对外报警。提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解市电的供电状况。发电机监测监控内容设计对(柴油、燃气)发电机各部件的工作状态及运行参数进行实时监测,一旦发生故障及报警通过监控平台发出对外报警。实现方式通过发电机设备提供的
39、RS485(或RS232)智能接口及通讯协议,采用总线的方式将发电机的监控信号直接接入监控主机的串口,由监控平台软件进行发电机的实时监测。实现功能实时监视发电机的输出电压、电流、功率、油压、水温、转速等参数(能监测到的具体内容由厂家的协议决定,不同品牌、型号的发电机所监控到的内容不同)。系统可对监测到的各项参数设定越限阀值(包括上下限、恢复上下限),一旦发电机发生越限报警或故障,系统将自动产生报警事件,并第一时间发出语音、电话、短信等对外报警。提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管
40、理员全面了解发电机的运行状况。精密空调(加湿器)监控监控内容机房温度、湿度出现异常时,将导致机房其他设备运行所需的环境失去保障,因此设计对各机房内空调(加湿器)的运行状态和参数进行实时监测,同时可对空调(加湿器)进行远程的开关机控制。实现方式通过空调(加湿器)设备提供的RS485智能接口及通讯协议,采用总线的方式将空调的监控信号通过串口服务器转换为网络信号接入监控主机的网口,由监控平台软件进行空调的实时监测。实现功能实时监视空调(加湿器)压缩机、风机、水泵、加热器、加湿器、去湿器、滤网、回风温度和湿度等的运行状态与参数,并可对空调实现远程开关机的控制(能监测到的具体内容由厂家的协议决定,不同品
41、牌、型号的精密空调所监控到的内容不同)。系统可对监测到的各项参数设定越限阀值,一旦精密空调(加湿器)发生故障,系统将产生报警事件,并第一时间发出语音、电话、短信等对外报警。提供曲线记录,直观显示实时及历史曲线,可查询一年内相应参数的历史曲线及具体时间的参数值(包括最大值、最小值),并可将历史曲线导出为EXCEL格式,方便管理员全面了解精密空调(加湿器)的运行状况。环境监控(温湿度、风速、氢气)在机房中有大量的服务器,设备对温、湿度等运行环境的要求非常严格,按照机房功能区域的划分及的实际面积,同时结合设备的密集情况,在机房内安装多个温湿度、风速、氢气浓度传感器,以实时检测机房和重要设备区域内的温
42、、湿度、风速、氢气浓度。温湿度、风速、氢气浓度传感器将把检测到的数值实时传送到现场嵌入式服务器中,并在监控界面上以图形形式直观地表现出来。一旦温、湿度值、风速、氢气浓度越限,系统将自动报警框,提示管理员通过调节空调温、湿度值给机房设备提供最佳运行环境。并且还可以将一段时间内机房里的温湿度、风速、氢气浓度值通过历史曲线直观地表现出来,以方便管理人员进行查看。温湿度传感器可与空调系统实现联动,当机房的温度越限时,系统可联动设定空调温度及启动空调进行工作等联动动作。 机房内对温湿度值、风速、氢气浓度监控,一旦发生警情及时通知管理人员,使损失降到最低。漏水检测鉴于机房设备的重要性,在机房中安装美国泰科
43、的定位式漏水检测系统,用于监测机房的空调有无漏水事件发生,确保设备不受水浸的危害。机房内精密空调的进出水管均有可能出现漏水,这将威胁着机房内各设备的安全。设计通过在有可能造成漏水的水源附近安装1套非定位式漏水监测设备,在精密空调底下四周共敷设1根的漏水感应绳,一旦有水泄漏碰到漏水监测绳,感应绳通过漏水控制器将信号传输到现场嵌入式服务器上,同时在集中管理服务器上形象、准确的输出告警信息。消防(极早期)监测监控内容设计对机房内由消防控制箱提供的干接点信号(或在机房内安装不同点位点的极早期烟雾报警器)进行实时火警监测,一旦发生报警通过监控平台发出对外报警。实现方式采用采集消防控制箱(极早期烟雾报警器
44、)提供的干接点信号,将信号接入监控主机的串口,由监控平台软件进行消防的实时监测。实现功能实时监测机房内的消防火警(极早期烟雾报警器)信号,一旦发生报警,系统自动产生报警事件,并第一时间发出语音、电话、短信等对外报警。基础设施管理资产管理资产台账管理IT设备基本信息管理:单台设备的基本信息包括设备名称、固定资产号、供应商、供应商电话、保修到期时间、技术状况、设备位置、资产类型、IP地址,购买日期,设备所使用的操作系统,供应商信息等,要便于管理员编辑查询;能够对物理资产信息按照需求字段进行导出或导入。设备出入管理管理员可以根据设备出入机房门的动作,在系统中录入相应信息,可以在数据模型基础上完成规划
45、合理性的检验,从而达到资产配置的最优化。上下架位置管理上、下架作业:管理员能在系统中记录和编辑IT设备目前是上架状态还是下架状态。位置管理:管理员能在系统中记录和编辑设备的位置信息,可以精确到机柜内设备所在位置的预设和管理,自动记录资产移入移出机柜的情况,对异常的资产进出机柜进行报警。固定资产生命周期管理对资产的全生命周期,从入库、上架使用、迁移、保养、维修、返库到报废的全过程进行监控和管理。报表管理根据机房资产类型、位置、负责人、折旧等多方面,自动生产各类报表,便于规划设计和部署,可以按照历史日期查询变更历史记录,并生产对应的历史记录报表。报表格式包括Excel、PDF、HTML等,显示方式
46、包括曲线图、饼图和柱状图。 资产定位管理系统可根据资产的具体情况,进行实时的定位监控。通过在各个机架安装RFID资产检测条,覆盖所有固定资产,从而实现贴有RFID标签的固定资产的实时定位监控。容量管理容量建模容量建模部分是容量管理功能的内核,旨在建立数据中心各物理层级SPC容量模型,以便精细分析、处理与显示各层级容量数据。综合U空间、供电、制冷、承重、电力口、光口、网口等因素构建容量模型。涵盖数据中心、机房、虚拟机房、列、机柜等不同层级。容量展示 按容量模型,分管理层级或设施物理层级在页面上实时显示SPC等容量数据、预警与告警信息。容量分配及优化容量预分配功能模块旨在对数据中心的容量分配进行管
47、理,可以提供可用机位、机柜位的搜索、预占、审核和上线功能。对于已经预占的机位和空间,考虑不同项目的优先级,管理员可以审核、取消、编辑和再分配,以确保高优先级项目的顺利执行,并避免资源的随意占用和资源闲置。预占管理预占管理模块旨在根据工程项目需求,对机房或机柜的可用空间进行查询、浏览、预占。根据项目实际情况,管理员可以对已占空间进行调整,以实现场地的有效管理,避免随意占用和资源浪费。预占审批在机柜或机房预占操作之后,需要由管理员进行审核,审核确认后容量预占才生效。经审批,优先级高的预占可以插队。此模块包括的功能有资源预占审批、预占申请详情展示、审批历史查询等功能。上线管理设备上架后,容量预占状态
48、变成已上架(已占),之后高优先级的项目将无法搜索和使用相关的容量。能自动检测的主要容量信息(SPC、承重)自动更新,次要容量信息(网络端口、电力端口)可由工程实施人员更新。能耗管理 PUE计算 “PUE概念的引入为数据中心能耗评估提供了一个可供量化的指标评价体系,但是在能耗总量(电量)评估、测量点、能量维度、可操作性等多个方面有所欠缺,所以TGG(The Green Grid)提出了对PUE进行分类定义。” 根据TGG提出的概念,PUE被分为四类,分别是PUE Category 0(PUE0),PUE Category 1(PUE1),PUE Category 2(PUE2),PUE Cate
49、gory 3(PUE3)。其中,PUE0与2007年提出的概念是一致的,而PUE1,PUE2,PUE3是新扩展的概念。最大的区别是,PUE0是采用功率的比值,而新扩展的三项是采用电量作为比值,而这三项的不同是在于对IT设备耗电量的测量点的不同。定义级别PUE0PUE1PUE2PUE3IT 负荷测量点UPS 输出UPS 输出PDU 输出IT 设备输入IT 设备能耗峰值 IT 负荷电力需求(kW)IT 负荷 12 月内累计能耗IT 负荷 12 月内累计能耗IT 负荷 12 月内累计能耗总能耗总能耗峰值电力需求(kW)总能耗 12 月内累计能耗总能耗 12 月内累计能耗总能耗 12 月内累计能耗 能
50、耗分析及统计数据中心能耗主要组成:制冷设备是为保证IT设备运行所需温、湿度环境而建立的配套设施IT设备包括计算、存储、网络等不同类型的设备供配电系统提供满足设备使用的电压和电流,并保证供电的安全性和可靠性其他:照明、安防设备、灭火、防水、传感器以及管理系统等 能效管理指标的计算数据全部来源于以上能耗单元; 可分析包含PUE、pPUE、CLF、PLF、ERE(如有)等能效指标; pPUE1= 局部耗电总量 / 局部设备耗电量对数据中心的局部区域或设备的能效进行评估和分析;适合用于基于集装箱、模块化数据中心或者由多个建筑和机房构成的较大型数据中心的局部能效评估; CLF=制冷设备耗电/IT设备耗电
51、 PLF=供配电系统耗电/IT设备耗电数据中心总耗电制冷设备耗电+供配电系统耗电+IT设备耗电以上各项除以IT设备耗电,可以变换得到PUECLF + PLF +1 RER=可再生能源供电/数据中心总耗电用于衡量数据中心利用可再生能源的情况,以促进可再生、无碳排放或极少碳排放的能源利用;可再生能源供电可能来自市电(例如水电),也可能来自于自供(例如数据中心装配太阳能或风能发电机),并假定市电中可再生能源占比为r%。 温度场管理 通过运算子系统生成实时的温度场3D云图并绘制切面云图,要求有多个方向、剖面等云图,有热点可发出报警事件。对于每个机房或者机房区域,可以设置多个切面以供温度场浏览。每个机房
52、区域默认包括5个切面:部署的三层传感器所对应的三个切面,出风切面和回风切面。可对已有的切面进行查看和删除。 系统支持查看机房或者机房区域中的当前时刻的温度场云图,温度场效果通过不同的切面来表现。切面须包括系统自动产生的典型切面和自定义切面。应可以查看不同切面的温度场云图,也可在云图中双击查看任意点的温度值和温度曲线图。温度场云图须能提供2D和3D两种展现方式,每幅云图都必须具备缩放功能。 系统支持查看指定机房在某个时段的异常温度报表,异常类型包括:采集异常、超过上限、超过下限。集中展现展现系统集中化DCIM系统提供统一运维入口,统一访问入口作为技术与业务部门之间的统一接口,同时综合调度后台各个
53、运维流程。用户通过统一平台登录,实现在一个平台上进行各项基础设施状态查看、处理、和审批操作,减少运维各项服务获取的复杂度,同时门户还提供各类信息系统的帮助信息,包括知识库、动态信息及相关的服务通告,以及各类信息服务相关的汇总统计显示。使得用户获取和使用信息服务更直接、更方便,实现信息共享、综合利用。统一资源监控呈现资源监控呈现提供了基础设施监控、资产管理、容量管理、能耗管理等四大类视图。系统从上到下的呈现界面,从全局观到细粒度的导航模式,方便用户深入浅出的分析当前数据中心基础设施运行状况。系统首页基于Web Portal技术,支持标准JAVA Portal API,通过WEB浏览器进行访问。通
54、过仪表盘式的概览页面,用户可以直观的掌握当前系统运行状况。统一运维服务展现运维服务展现面向基础设施运维部门的管理工作,包括服务流程管理、资产配置管理、日常工作管理、知识库管理等展现视图,服务运维展现针对不同的人员角色,提供相应的运维展现界面,通过个人的工作台来管理自身的工作,集成我的工单、工作任务、服务水平考核、资产管理、知识库等相应界面和功能。统一运维管理网站作为运维服务管理的统一入口,是面向各个层面的使用者的窗口,是全面了解、监控和展示系统运行和服务运维的管理界面。采用B/S 架构,门户以Web 方式访问。该模块是用户获取服务支持方法和监督基础设施系统运行和服务运维现状的窗口。运维门户包含
55、值班表公示、公告信息、服务统计公示、管理制度公示、人员职责公示等部分,涵盖了运维服务情况的方方面面。值班表公示中可查看当前值班人、值班人联系方式信息、值班时间等,可查看本月值班表,值班表内容在运维子系统中有运维部门工作人员编排。公告信息中可查看运维部门发布的紧急公告。公告信息由运维部门工作人员在运维运维子系统中编辑发布。服务统计分门别类的提供每日服务数量通告。包括接受服务总量、受理总量、完成总量等信息。系统根据每日受理及处理的情况,自动生成日通告,并在运维门户中公示。系统还提供服务情况月通告、服务情况季度分析报告、服务情况年报等。使运维部门的服务质量透明可监督,促使运维部门不断改进服务方式,提
56、升服务质量。管理制度公示中公示了运维部门提供服务的范围、服务详细内容、服务流程、反馈机制等。用户可通过阅读公示内容,详细了解运维部门提供服务的情况。人员职责公示详细描述了运维部门的组织架构;各个业务系统的负责人、联系方式;每个人员的职责范围。栏目管理栏目管理实现运维门户的分类管理。通过栏目管理,运维门户中除了上节中提到的值班表公示、公告信息、服务统计公示、管理制度公示、人员职责公示外,还可根据自身情况增加新的栏目。栏目支持普通栏目和图片栏目。用户在发布信息时可选择对应的栏目。信息发布这里所讲的信息发布主要是指特定文件和信息的发布。系统应该能够提供多种格式的信息发布,可以是简单的文本信息。系统还
57、可以提供上传文件,也可以是复杂格式的信息。支持在线编辑,要求提供支持html格式的文本编辑:可以在线编排文本的可视化的功能,插入图片,调整字体等。同时部分信息可能要求上传附件,也就是在发布信息的同时,对这个信息附上相应的附件,而且附件可能是多个,提供附件删除的功能。对已经上传至栏目的信息,栏目管理员和信息发布人可以进行详细的修改,或者删除。已经上传的信息要经过审核才能在最终的页面显示。展现方式多样化DCIM系统支持多种展现方式,包括大屏展现、终端展现、手机终端展现。大屏展示预警及告警统一事件展现系统可根据告警的时间、类型、告警源、严重度、故障位置等进行筛选。监控指标库 监控指标库存放了所有监控
58、对象的当前运行状况、重要告警、重要KPI性能指标等数据,实现性能基线管理,并为监控对象的可视化展现提供数据支持。CMDB库与监控指标库应具有一一对应关系,具备对应关系的自动维护和验证功能,保证资产配置数据与监控指标数据的自动关联。监控指标库监控指标库可以灵活建模,当某类监控对象需要增加一些监控指标时,只需要通过增加该类资源的监控指标字段,然后调整数据同步模块的相关同步配置信息,即可实现对新增监控指标的数据采集、性能阈值分析、运行展现、历史性能统计等功能。新建阈值方案模板故障管理告警管理提供符合国际规范的告警管理。在设备上共有四种级别的告警,告警名称后面为其相应的告警颜色:严重告警 重要告警 次
59、要告警 警告 如果某个被监测设施有活动告警,则在平面电子地图图上的对应图标上显示最高级别表示的颜色。查询告警:左侧上半部为告警的查询条件,包括基本信息、确认/清除、严重度三部分,下半部分为已确认、已清除和告警总数的统计信息,用户可以进行告警的查询,查询到的告警显示在右部的界面上,对当前告警可以进行确认、清除操作。设置告警重要度条件:告警等级按照严重级别分为四个:关键、重要、次要、警告,四个条件间为或的关系。查询条件设置完成后,点击“查找”按钮,查找结果即显示在右半部份的列表中。批注告警:在查询到的当前告警列表中,选择一条未确认告警,单击“确认”按钮,或在右侧告警列表中,打开右键菜单,选择“批注
60、告警”,打开确认告警窗口,输入注释信息,点击确定提交后,告警列表中显示批注状态。确认告警:在查询到的告警列表中,选择一条未被批注的或系统自动确认的告警,单击“确认”按钮,或在右侧告警列表中,打开右键菜单,选择“确认告警”,打开确认告警窗口,输入注释信息,确认后,当前告警中将不显示,转移到历史告警中。告警一览表:可以在主界面的告警Tab页上,查询最近产生的100个告警。选中一条告警记录,支持的右键菜单为,查看详情、同源告警、定位到地图、定位对端设备、确认告警、清除告警。告警通知方式:除了常见的声光告警以外,当特定的告警发生时,我们还提供E-Mail、短信通知方式。可与DCIM运维管理模块配合,产
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 客舱服务英语(陕西职业技术学院)知到智慧树答案
- 《职业形象管理》课件
- 生猪养殖场废水深度处理及粪污生产有机肥综合利用项目建设可行性研究报告
- 生态蔬菜种植园项目可行性研究报告
- 美术课件设计你的房间
- 《红眼病鉴别表》课件
- 2015年浙江义乌中考满分作文《我长大了》10
- “一定能完成”的新年计划
- 物理教师心得体会
- 市政工程安全质量协议
- 工程经济说课标准课件
- 买卖合同法律风险防范讲座课件
- 印制、文印服务清单价格及有关技术要求表
- 2013清单规范宣贯-房屋建筑与装饰工程工程量计算规范宣贯
- 万科物业管理标准化管理体系
- DB45-T 2522-2022+桥梁缆索吊装系统技术规程
- 海关监管作业场所(场地)有关规范要求解读
- 年产12000吨水合肼(100%)项目环评报告书
- 虚云老和尚自述年谱
- 城市规划原理课件(完整版)
- 制造执行系统的功能与实践最新ppt课件(完整版)
评论
0/150
提交评论