版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
系统设计方案详细版-XXXX版机房监控管理系统设计方案书目录一、项目背景4二、设计思路及要点4三、总体设计方案63.1系统设计63.1.1设计依据63.1.2串口设计63.1.3系统结构63.2系统性能83.2.1可靠性83.2.2稳定性93.2.3精确性93.2.4实时性93.2.5安全性93.2.6维护性103.2.7扩充性103.2.8易操作性103.3系统功能113.3.1界面管理113.3.2客户端管理123.3.3报警管理123.3.4故障管理123.3.5联动管理133.3.6安全时段功能143.3.7数据管理要求143.3.8日志管理要求143.3.9增强型IE权限管理153.3.10双向短信查询功能163.3.11增强型告警功能173.3.12报表功能183.3.13能效管理功能193.4系统实现213.4.1动力监控213.4.1.1配电柜监测213.4.1.2配电开关监测213.4.1.3UPS监测223.4.1.4蓄电池监测233.4.1.5精密配电柜监测243.4.1.6直流/交流配电屏监测253.4.2环境监控263.4.2.1精密空调监控263.4.2.2普通空调监控273.4.2.3新/排风机监控283.4.2.4温湿度监测293.4.2.5机柜温度监测303.4.2.6漏水监测313.4.3安保监控323.4.3.1防盗监控323.4.3.2视频监控333.4.3.3消防监测343.4.4IT设备监控353.4.4.1服务器监测353.4.4.2路由器监测363.4.4.3交换机监测373.5推荐监控对象383.5.1动力监控383.5.1.1STS/ATS开关柜监测383.5.1.2发电机监测393.5.2环境监控403.5.2.1照明监控403.5.2.2防雷监测413.5.3安保监控423.5.4IT设备监控43
四、售后服务444.1售后服务标准444.2售后服务支持体系444.2.1例行性检查服务454.2.2系统应急维修服务464.2.3服务资料的管理464.2.4服务结果的确认474.3售后服务内容及范围474.3.1系统故障维护474.3.2咨询服务474.3.3备件保修和更换服务47
五、运维外包485.1背景说明485.2平台设计理念485.3解决客户机房管理中的难题485.4平台架构495.5平台特点505.5.1网络接入安全505.5.2平台系统安全505.5.3“一站式“服务网站505.5.47x24小时远程监控值守515.5.5定时远程巡检525.5.6快速故障处理525.5.7专业运维分析53一、项目背景firewall储备份(backupVPNanti-virusintrusiondetectMailSystemERPSystem未有的压力:一是由于缺少对于机房基础设施、IT设备的监控,导致空调、电源异常、网络中断等情况时有发生,却得不到实时监控和解决;二是监控系统种类繁多,基础设施监控系统、IT监控系统、KVM系统等既相互独立又相互关联,纷繁复杂交织在一起,运维过程中难免“牵一发而动全身”的现象;三是新业务的需求不断涌现,支撑体系相善不能跟上用户需求的增长。这些因素都成为机房稳定运行的隐患,影响业务层的稳定运行,给企业带来不可估计的损失,同时也证明了一套功能完善、运行可靠的信息监控管理系统已成为机房规划建设中不可缺少的组成部分。二、设计思路及要点就全国各地机房信息监控管理系统建设和使用情况来看,由于参与建设的监控厂家水平良莠不齐,导致国内部分机房不能体现信息监控管理系统的价值所在。如何规划一套涵盖监控和管理,但又可以模块化逐步集成的解决方案;如何选择与业务层匹配的监控对象;如何确保系统的实时性、准确性并且具有实用,不花哨的功能;如何选择一个可以长期持续优质服务的监控厂家成为本项目的设计要点。项目的设计要点:1)监控、管理、服务缺一不可信息监控管理系统设计往往注重数据监控采集,忽略监控数据的分析处理和售后服务的持续保障能力,使得项目容易出现虎头蛇尾的局面。为确保业务的稳定运行,须对机房的动力、环境、安防、IT统管理功能高效地运维是设计考虑的关键因素;同时系统建设完成后,应确保可持续服务满足系统的正常连续运行。因此在系统建设时,须采用整体规划的方向,通过统一建设或分步实施的手段来承建机房监控、管理、服务相融合的系统。2)监控管理一体化是趋势IT体化也成为必然趋势,一体化是纲举目张的过程。一体化系统没有复杂的硬件连接和软件二次开发,一方面可通过一套平台实现对所有对象的统一监控管理;另一方面可通过完整的监控数据,对数据和报警进行综合分析诊断,判断故障根源,提高运维效率。系统具备更广泛的适应性和经济性,标志着系统更加成熟,易于升级换代。3)数据分析是降低运维难度的金钥匙原始的监控数据展示已不能满足用户的需要,如何把监控数据提炼成用户需要的数据是本项目设计的难点。例如当机房断电时,会产生一系列的故障时间,通过智能化分“UPS市电供入断开告警;原始的动力数据通过分析模块,可以将机房内的能耗进行综合计算分析,得出机房的PUE值及其他相关能耗指标值,为优化方案提供有力的支撑数据。4)管理需要为本单位人员结构量身定制IT服务部门和业务部门用户之间的一个中心联络点,满足业务部门用户与运维人员之间的协调与沟通,并对问题的处理进行有效的跟踪和监控。ITIL是公认的it最佳实践,但如果没用的运维管理功能,是本项目实现高效运维管理的关键。5)直观展示是提高工作效率的起跑线报警信息在所有监控数据中比例可以用“沧海一粟”来形容,大量数据有可能会让重要报警淹没在信息流中。数据分析处理的结果,怎样以一种既最直观的方式展示,也是值得深究的学问。信息监控管理系统应当要有能力把用户所关心的设备集中一个页面应当要有更快捷的报警页面展示方式,例如自动弹出报警页面、点击报警时间弹出报警页面等。6)服务是系统稳定运行的基石信息监控管理系统建设完成后,有形产品在需求的比例中下降,服务的价值正在变得越来越重要。解决系统软硬件发生的故障、业务体系扩容带来的系统升级、协助运维部门做好工作成为一家优秀服务提供商的工作重点。服务提供商和用户之间的量化服务级别指标(SLA)应当要成为客户满意度的评定标准之一。三、总体设计方案3.1系统设计3.1.1设计依据《电子信息系统机房设计规范(GB50174-2008)》《电子信息系统机房施工及验收规范(GB50462-2008)》《安全防范系统验收规则(GA308-2001)》《计算机场地安全要求(GB9361-200X)》3.1.2串口设计对RS485/RS422接口类型的智能设备,通过手拉手总线连接,采用轮询通讯方式实现对设备数据的采集。单条串口总线串接的设备越多,采集周期越长。常量名称参数值单条命令采集周期0.1~1s(视被监控设备而定)单条命令平均包含的测点数≈10(根据设备厂家通讯协议而定)采集周期间隔0.1~1s(可配置)同端口下设备采集间隔时间0.1s页面刷新周期1s=设备1+…+设备N+(同一端口下设备个数–1)*0.1s+采集周期间隔。我司经过丰富的项目经验总结,针对不同设备,结合项目数据刷新要求,给出本项目详细设计。3.1.3系统结构为了确保系统的稳定可靠运行,系统采用了模块化的架构进行设计,确保任何模块出现故障不会影响同级别的其他模块的正常工作。同时为了满足本项目现在和以后的规模需要,采用分布式系统架构可以确保系统后续的扩容能力和系统反应速度。监控管理平台是一个高可用性的分布集中的机房弱电集成监控系统,从硬件来说可以分为监控单元(SUSCSS,采用分布式系统结构,每个模块各施其职,互不干扰。整体架构图如下:各部分的主要作用如下:监控单元(SU):动力、环境、安防监控单元由各种I/O采控模块、传感器组成,直接连接各种被监控设备,采集如UPS、空调、温湿度、漏水等的现场信号,将采集的现场信号通过RS485方式上传到监控服务器的串口。IT监控单元由各类被监控的IT设备通过TCP/IP方式,采用SNMP接口将信号上传到监控服务器。监控管理中心(SC):由主机房的监控管理服务器(主备机)组成,监控管理服务器可脱网工作并具有独立数据处理及数据存储能力,用于将现场监控信号进行存储、实时处理、分析和输出,处理所有的报警信息,记录报警事件,并负责将控制命令发往前端设备,实现对现场设备的远程控制。监控管理服务器支持采用“双机热备”方式设计,确保监控系统的稳定靠运行。监控管理服务器已通过国家3CSUIE种统计报表、数据分析挖掘、告警管理、权限管理和系统配置管理等,通过运维管理模块可以实现设备管理、事件处理、服务台、检修计划、知识库、统计分析等功能,并完成各种统计报表。监控业务台(SM):用于进行远程的WEB浏览,系统可以提供三维的展示方式,便在具有相应权限下还可对设备实现远程控制,如空调的开关机等。系统支持B/S分布模式的模块化结构,软硬件的安装与维护集中于监控服务器端,B/S录监控管理系统时可以进行修改界面、配置等操作,数据处理放在监控管理中心(SCSUSU大大地加强系统的伸缩性。各监控单元内都以分布式模块化设计,任何一个被监控对象发生故障时,不影响本监控单元或其他监控单元内的数据采集工作。3.2系统性能3.2.1可靠性系统满足核心配套设备监控、管理需求作为第一要素考虑。系统符合电磁兼容性和电气隔离性能设计要求,不会影响被监控设备的正常工作。系统具有自诊断功能,对软硬件故障能够自动重启恢复。监控设备具有良好的接地,抗干扰能力强。设备选用高可靠的工业级设备,保障系统24×365小时不间断运行。系统成熟稳定,支持3000种主流厂家设备的接口通讯协议。监控管理服务器具备独立数据处理和存储能力,在TCP/IP网络完全中断的情况下,系统能持续正常采集总线接入设备的数据,并完成数据处理和对外报警,独立存储数据时间可长达一年以上,并可供随时查询,报表和曲线统计、打印功能。3.2.2稳定性系统采用多总线方式,某一子系统的故障不影响其它子系统的正常运行。所有监控设备采用UPSUPS设备提供AC220V7*24小时不间断运行。监控管理服务器支持双网卡链路备份,在出现单一网络链路故障时,不影响监控管理系统运行。3.2.3精确性直流电压优于0.5%2%5%,开关量100%准确。监控管理系统通过终端采集的各类采集值保证不出现负值和数值明显漂移等现象,对于告警频率高的信号监控系统软件可自动识别,在告警栏显示告警最初时间。3.2.4实时性使用同类设备单总线采集方式,保证监控数据的实时性。前端设备数据采控时间<2S远程监控数据刷新时间<4S。短信、电话报警发出响应时间<30S。3.2.5安全性系统具有多级权限管理。系统无人操作一定时间后可自动注销、锁定。3.2.6维护性扩充,无需编程。3.2.7扩充性系统支持RS232/485/422、TCP/IP、SNMP、OPC、DDE、MODBUS、USB等各种标准化协议和接口,支持符合行业和国际标准的软件和硬件,可快速方便的将各种监控对象集成到系统中。支持MYSQL、SQLSERVER等主流关系型数据库。系统通过标准化协议和接口,可以方便地和第三方系统进行信息交换。系统通过模块化设计满足本次项目的监控需求,还可以方便地为扩容和升级,以适应业务的发展。IT设备可以使用SNMPAgentTelnet/SSHLogFileSyslogWMI等接口技IT通过安全审计,并非通过二进制程序获得。3.2.8易操作性系统针对监控对象的监控指标,可设置不同的报警阈值、并具有由用户选择是否保存数据的功能。数据存储采用分级存储的方式进行,系统管理员可以根据需要对不同种类的数据灵活设置保存期限。对不在保留周期内的数据进行自动备份,并从生产数据库中自动清理,同时将清理的数据自动存储到历史数据库中。平台以集中的方式,灵活地支持整个系统数据的存储、备份和恢复,支持联机活地设置系统数据的备份方式,操作员能在每次数据恢复后进行数据的一致性和兼容性的检测。3.3系统功能3.3.1界面管理监控平台界面显示为全中文界面,采用图形化设计,支持电子地图功能。界面的结构、层次清晰明了,页面风格可以按照用户需求进行定制,能够实时直观地显示设备的运行数据和运行状态,场景仿真。监控系统的主界面为包含所有子系统内监控设备的电子地图,在该界面上可直接点击子系统内的任意监控设备进入其运行状态界面。同时,在本子系统的主界面上为各功备进行更清晰、更有针对性的监控。以往监控页面不够直观时,系统为用户单独定制一张页面,以列表的方式可以置入用户关心的所有设备状态,方便用户能够方便快捷地查看到所有所关心设备;也可以在此页面上选择显示所有正在报警的设备,方便用户快速定位所有的故障设备数量、种类及相关信息。在系统发生报警时,系统支持自动弹出报警设备所在页面;当报警事件较多时,用户可以在事件栏点击报警事件,系统自动弹出所点击的报警设备所在页面。当操作者点击主界面或功能模组界面上某一子系统后,画面会自动切换到该子系统的运行状态图或者弹出对相关的操作界面,以便管理人员查看和管理该子系统。在有报警或异常状态的情况下,有问题的监控设备界面可以自动弹出;页面轮询:系统允许管理人员针对系统中不同设备、环境的重要程度,自行定义监系统显示界面可按照设定的顺序(可随意更改编辑)自动显示。当进行手动操作或发生报警时,界面轮询功能应自动停止,直到手工再次启动轮询;系统提供集成开发环境,利用各种界面元素(例如按钮、圆、矩形、直线、图片、例如对界面的框架结构进行调整、对监控单元的位置进行调整等。在使用过程中,对界面的修改应能在线进行,修改效果即时生效;通过软件界面应可直观的展示出机房内的情况,包括整体结构、空调、PMM柜、服务器机柜的摆放位置都要在图中体现出来;3.3.2客户端管理系统采用B/S分布模式的模块化结构,软硬件的安装与维护集中于监控服务器端,易于实施和维护。同时采用B/S结构,客户端只负责用户界面显示,数据处理放在监控层,当监控需求增加时,只需对监控平台进行升级或扩展多个监控模块即可,大大地加强系统的伸缩性。支持关键设备集中展示功能,可以在一个页面上组合若干重要设备的参数,如在同一界面上展示所有楼层的空调参数;系统界面与用户权限绑定,不同权限的用户,其所看到的界面不同。3.3.3报警管理机房管理员可根据国家标准和现场实际环境情况对机房内的各类被监控设备设置其监控管理系统将前端被监控设备的数据采集后将与数据库内所设定的数据值进行比对,当数据有有出入时且超过设定范围时,系统将产生报警事件。同时用户也可根据管理需要,将产生报警事件的设备安装重要性和危害性进行报警分级或做进一步处理,可以根据报警事件的报警级别提供不同的报警方式:短信、电话、邮件等告警模式。3.3.4故障管理整个系统由于涉及软件、硬件,具有设备数量多、类型杂、系统结构复杂等特点,在运行过程中,时刻会受到来自外界的各种干扰,影响系统的稳定运行。例如来自电磁场和电源的干扰、设备自身故障、通信链路的干扰等等。为此,整个系统提供了完善的故障管理机制,以应对异常情况的发生,并尽可能的减少故障所带来的影响。故障管理的作用体现在以下几个方面:1)智能监测,尽早发现问题。2)智能恢复,尽早解决问题。3)智能屏蔽,尽可能的缩小故障影响范围。4)智能分析,帮助维护人员尽快定位问题,尽早彻底解决问题。故障管理的范围包括以下三个方面:1)应用层:对系统平台核心进程和线程的监控管理。2)系统层:对操作系统的核心服务、系统资源进行监控和管理。3)硬件层:对主机硬件资源进行监控管理。故障管理的具体实现是由软件看门狗和硬件看门狗两部分构成,软硬件看门狗相互配合,实现对硬件、操作系统、应用的三级监控管理。3.3.5联动管理机房监控管理系统通过对采集到的设备或环境数据与数据库内相关设定数值进行对比,当采集数据与设定值不符时,便可触发相关系统动作,从而实现联动功能。另外,系统提供图形化动态逻辑组态功能,以图形化界面方式实现逻辑定义,从而更方便的实现联动功能。通过设定联动逻辑,可以方便的将不同监控设备或不同子系统进行联动,即可以设定一些事件触发条件,当满足这些条件的时候,系统会自动执行某个功能或者启动另外一个设备工作等。例如:当火警发生时,监控系统自动对空调进行远程停机处理,同时系统的联动功能具有足够的灵活性,当联动逻辑需要改变时,系统提供方便的组态工具,快速修改联动逻辑,实现对系统或设备的灵活、有效的控制。联动逻辑的修改不需重新编程,系统的高级管理人员均可通过基础培训,掌握自行修改联动逻辑的方法。举例:3.3.6安全时段功能整个系统在长期运行过程中,会遇到需要检修或演练的时段,如果任由系统进行报警会有大量的无关警报发送给运维人员。安全时段功能指在一个时间段内,报警事件将11个时单个测点和所有策略选择屏蔽的时间段,实现安全时段功能。安全时段结束后或者手动恢复正常时,报警功能将恢复正常。3.3.7数据管理要求实时数据:系统能够监控到指定设备的实时状态信息,支持实时查询,支持自定义采样频率;历史数据:系统能自动保存历史数据,保存时间不少于1年,可支持历史数据的定期清理,支持历史数据的导出备份,历史数据不可修改,支持多种形式的历史数据曲线查询,支持自定义时段。3.3.8日志管理要求系统日志至少包括用户操作日志、系统运行状态日志、报警日志等;系统日志不可修改,支持系统日志到期提醒,可由指定用户对系统日志进行清理操作;系统日志的保存时间不少于一年,支持系统日志导出备份。当监控软件平台有相应管理人员进行操作或配置时,系统会有权限验证,通过验证后,会将操作人员、操作内容、时间、类型、操作对象等信息进行记录。当管理员需要查询最近对系统的操作,可通过查询操作日志来实现。通过历史事件和日志查询程序,选择条件(设备范围、时间范围、类型范围和操作人员)组合查询,获取需要的操作日志,并可导出为报表。3.3.9增强型IE权限管理用户的人员组织结构各有不同,对应的查看系统的权限、接受报警的级别、范围也各有不同。系统默认用户权限可按照机房区域、被监控设备、监控测点、监控页面、操作内容五个维度进行任意组合,首先可以设定不同的权限组,然后在不同的权限组内可设定不同的权限用户,使用户权限分配与公司组织架构、人员职能相符,如下示例:企业决策层级别:可对系统所有数据进行查看,但无控制、设置、编辑权限,默认登录系统进入全局监控界面;超级管理员分组级别:可对系统所有功能和内容进行查看、操作、设置、备份、恢复,具有关闭系统的权限;一般管理员:可对系统所有内容进行查看,可选择性对部分设备、参数进行控制、设置、编辑;维护员:对某个专业的设备(如配电)具有查看权限,可选择是否具有控制权限,无编辑权限;值班员:对系统所有监控界面具有查看权限,无控制、设置、编辑权限,适用于外聘值班员及保安。不仅可按操作进行授权之外,还可按资源(功能、设备、页面等)进行授权,实现按需管理,系统具有远程进行权限集中管理的功能,系统可为每个账号设定一个自己的电子签到管理、交接班管理等一系列人性化管理体制,大大地提高了整个系统的可操作性。系统支持自由设置组权限、可操作功能多少,并具备人员管理器,可对每个用户的名称、口令、备注信息、隶属组信息进行添加、删除、编辑功能。智能告警发送:系统支持用户针对值班人员的上班安排,设定排班计划。当设定好排班计划后,该值班人员只能在上班时间登录到我们的监控系统进行监控和接收报警信息;当下班后他的账户就无法登录监控系统,并且也不会把报警信息发送给他,让他可以好好休息,所有的操作权限都移交给下一位值班人员。显示不同的操作界面和可管理工作范围。登录前系统处于锁定状态,但报警界面的自动(系统未锁定)统继续受到保护。系统操作记录:系统对所有操作者所进行的系统操作均作详细的操作记录,包括操作人、所操作的对象、操作内容、操作时间及权限用户登录、退出的系统的时间等,操作记录可以以列表的形式进行打印,以供查询之用。3.3.10双向短信查询功能用户不在机房现场或不方便上网的时候,需要知道某个设备的实时数据、状态,某个时间段、某个级别的系统事件等信息,系统支持双向短信查询,可以查询设备的实时数据、状态,也可以查询指定时间段、指定级别的系统事件。查询内容可由用户自行定义。每一组查询都有权限控制,只有经过授权的手机才可以执行相应的查询。3.3.11增强型告警功能本集中监控管理系统提供灵活多变的告警管理功能:报警机制:系统对报警事件按优先级的高低进行处理,并具备过滤机制。系统对所有报警事件进行判断,分析各报警事件的因果关系,通过预先设定的逻辑关系,屏蔽部分报警事件,减少突发性事件潮(如停电)带来的误报警和容量冲击,实现准确定位事件根源,从而提高了管理人员的工作效率,设置过滤组可对过滤时间,过滤条件,以及过滤报警的描述进行设置。系统可设置报警缓冲的次数,当多次采集到该报警后才真正将报警在事件栏上显示出来,有效减少误报警的发生,提高监控系统的准确性。报警方式:报警发生时系统界面可自动跳转到相应设备所在页面,同时告警信息可以限次播放,而且在两次告警间的停顿时间可以设置。每天8点至24点期间逢整点发送指定测点温度、定时(每天中午12点及晚上8点)发送机房整体运营状况等。按管理范围报警:可以根据排班情况进行报警,报警只发给值班人员,休假时可以会收到管辖范围内的报警,避免引起管理混乱。报警屏蔽:可以屏蔽掉不重要的报警信息,增强系统的灵活性、提高对数据的可信度。报警分类:报警信息可分组或分级管理,用户可以根据按早实际发生的报警情况的紧急程度,划分为不同的报警组别或级别,对不同的报警组别或级别,系统会以不同的报警方式对外报警。报警升级:当一条报警信息在规定时间内没有得到确认,变会以升级的方式向上一层用户报警。主要有人员升级与设备升级两种方式。人员升级是指第一级报警接收人员在规定时间内没有确定报警信息,报警信息便发送给系统中设定好的上一级用户,以使报警信息能够得到及时处理。设备升级是指当使用第一种报警方式发出的报警信息在规定时间内没有得到确认,系统便自动使用设定好的新一级报警方式发送报警信息,以使报警信息能够得到及时处理。对报警的设备、事件、内容等进行准确定位,例如:“XX机房的当前温度为27.5度,温度过高,请立即查看。报警过滤机制:例如当某台UPS市电供入出现故障,可能会产生一系列的故障事件,如组电压偏低、单相参数为零、逆变器参数骤变等等,报警过滤机制则通过智能化的分析手段,对故障告警进行过滤,可准“UPS市电供入断开管理人员。报警跟踪:系统提供对于任意一条报警信息的状态进行跟踪统计,包括报警时间,报警内容,确认时间,处理时间,处理日志以及处理人等情况的统计。并可对各项报警信息进行及时度统计。未恢复报警事件列表:提供设备报警状态的显示列表,可查看哪些设备有报警,是否报警恢复。预警管理:设备告警支持预警功能。用户可为关键的数据点设定预警阀值,系统通过趋势判断,在设备产生真正的告警之前先产生预警,提醒用户及时处理,避免真正告警的产生。告警发送记录与查询传统的监控管理平台在发生告警后都可以向用户发送告警,但发送的状态和结果确无从知晓。如果因网络或设备故障,导致告警未发送成功,用户往往并不知道情况,导致重要告警存在漏报的可能性。我们的告警平台支持对所有告警发送任务的跟踪和记录便于用户对历史的发送情况进行管理。3.3.12报表功能针对于本项目具有大量数据的特殊性,我们为本系统设计并提供强大的报表功能。,能够基于配置、性能、可用性、性能、报警事件等数据,自动创建专项指标和综合分析报表。报表模块可实现以下功能:提供报表模板;对相关数据进行分类归组,利用系统报表组态功能,可由管理员修改报表格式和报表数据存储、计算规则,形成报表模板,从而实现报表管理功能;支持以EXCEL和PDF形式导出;(待确定)可根据设定时间,自动生成指定报表,通过邮件的方式发送给指定人员;所有报表的生成分为自动和手动两种方式;不同管理员账户创建的报表应可以互相共享;保存数据和生成报表的方式可以选择定时保存和数据变化间隔量变化保存,有效地降低系统负担,增加系统的可利用性和全面管理性能所有历史数据均存储在历史数据库内,数据可以根据用户实际情况设定存储策略,系统提供以下策略:按照时间进行存储,如每30分钟或每1小时整点存储一次数据;按照变化率方式进行存储,如温湿度变化0.5度以上才进行一次存储;按照时间+通过时间进行补偿方式存储。报表系统提供统一的报表门户,具备相应权限的用户可通过该门户登录报表系统。报表系统支持B/S,C/S两种访问方式,其监测内容和展现内容一致。通用报表:系统提供多种机房运行报表,以时间维度来划分,有日报、周报、月报有实时趋势图、历史趋势图、柱状图、饼图、雷达图等等。3.3.13能效管理功能监控平台的PUE值分析模块通过将IT设备、和其它设备的能耗进行综合测算和分析,计算出机房的PUE,管理员可通过报表模块实时查看PUE数据。一方面对于日常维绿色节能的机房。PUEPUE是目前最流行的衡量机房电源能效比的指标,也是衡量一个机房是否节能的关键指IT通过对供配电系统的监控,在用户的配电结构明确,并提供计算公式的条件下,可以计算出当前机房的PUE。3.4系统实现3.4.1动力监控3.4.1.1配电柜监测监控意义机房的进电直接影响到机房内所有用电设备的安全稳定运行,监控配电柜能让管理人员第一时间知道供电质量等问题,并有效采取预防、维护和优化措施。实现方式通过安装(带液晶显示的)智能电量仪对配电柜供电进线进行各项供电参数监测。电量仪的RS485监测内容无功功率等参数。3.4.1.2配电开关监测监控意义机房的配电开关关联着其下联部分用电设备的通电状态,监控配电开关能让管理人员第一时间知道设备通电状态等问题,并有效采取预防、维护和优化措施。实现方式对配电柜内重要配电开关的状态进行实时监测,通过隔离高压输入模块(或隔离数高压输入模块(或隔离数据量输入模块)的RS485智能接口及通讯协议采用总线的方式控平台软件进行开关状态的实时监测。监测内容实时监测配电开关的通断电状态,一旦发生报警,系统将自动切换到相应的监控界面,且发生报警的开关会变成断开状态且变红显示,同时产生报警事件进行记录存储并有相应的处理提示。3.4.1.3UPS监测监控意义机房的UPS是为持续运转的工业设备提供不间断的电力供应保证。监控UPS能让管理人员第一时间知道机房储备运行时间等问题,并有效采取预防、维护和优化措施。实现方式对机房内UPS电源的各部件工作状态、运行参数等进行实时监测。通过UPS设备提供的RS485(或RS232或SNMP)智能接口及通讯协议,将UPS的监控信号采用总线方式(或经通讯转换模块将RS232转换成RS485信号后或通过网络方式)接入监控服务器(或串UPS的实时监测。监测内容(只监不控)实时监视UPS负载等各部分的运行状态与参数(能监测到的具体内容由厂家的协议决定,不同品牌、型号的UPS3.4.1.4蓄电池监测监控意义机房的蓄电池直接关系到UPS供电时间,供电质量等因素。监控蓄电池能让管理人员第一时间知道电池老化、后备电压不足等问题,并有效采取预防、维护和优化措施。实现方式多台蓄电池检测仪通过RS485智能接口及通讯协议采用总线方式将信号接入监控服务器的实时监测。监测内容3.4.1.5精密配电柜监测监控意义IT柜能让管理人员第一时间知道末梢IT优化措施。实现方式对机房内精密配电柜的运行参数及开关状态进行实时监测,通过精密配电柜设备提供的RS485(或SNMP)智能接口及通讯协议,将精密配电柜的监控信号采用总线的方式(或通过网络)接入监控服务器(或串口服务器,由串口服务器将数据上传至监控服务监测内容实时监测精密配电柜进线电源的三相电压、三相电流、三相电能等参数,各支路的电流、功率因数、有功功率、电能等参数,以及各支路的开关状态(能监测到的具体内3.4.1.6直流/交流配电屏监测监控意义机房的直流/交流配电屏是机房集中控制、合理向下级分配电源的单位。监控直流/交流实现方式对机房内直流/交流配电屏的运行参数及状态进行实时监测,通过直流/交流配电屏设备提供的RS485(或RS232或SNMP/交流配电屏的监控信号采用总线方式(或经通讯转换模块将RS232转换成RS485信号后或通过网络方式)软件进行直流/交流配电屏的实时监测。监测内容实时监测直流//交流配电屏所监控3.4.2环境监控3.4.2.1精密空调监控监控意义机房温度出现异常时,将导致机房其他设备运行所需的环境失去保障,因此设计对机房内精密空调的运行状态和参数进行实时监测,同时可对精密空调进行远程的开关机控制。实现方式通过精密空调设备提供的RS485(或RS232或SNMP)智能接口及通讯协议,将精密空调的监控信号采用总线方式(或经通讯转换模块将RS232转换成RS485信号后或通过由监控平台软件进行精密空调的实时监测。监测内容实时监视精密空调压缩机、风机、水泵、加热器、加湿器、去湿器、滤网、回风温度和湿度等的运行状态与参数,并可对精密空调实现远程开关机的控制(能监测到的具体内容由厂家的协议决定,不同品牌、型号的精密空调所监控到的内容不同);同时支持与其它子系统的联动控制,如当温度过高时自动联动启动空调进行制冷。3.4.2.2普通空调监控监控意义机房温度出现异常时,将导致机房其他设备运行所需的环境失去保障,因此设计对机房内普通空调的运行状态进行实时监测,同时可对普通空调进行远程的开关机控制。实现方式对机房内普通空调的运行状态进行实时监测,同时可对普通空调实现远程的开关机1个RS816能空调遥控器或RS816DKRS485智能接口采用总线的由监控平台软件进行普通空调开关机控制(和运行状态)的实时监测。(本段描述为选用RS816学习型遥控器时保留)另外通过空调状态开关量变送器检测普通空调电源线的电流信号,转换成开关量信号后接入8路隔离数字量输入模块中进行实时状态采集,再通过8路隔离数字量输入模块的RS485智能接口及通讯协议采用总线的方式将信号接入监控服务器(或串口服务器,由串口服务器将数据上传至监控服务监测内容实时监测普通空调的开关机运行状态,并可通过监控平台软件实现远程的开关机控制及对制冷温度数值的调节,同时支持与其它子系统的联动控制,如当温度过高时自动启动空调进行制冷。3.4.2.3新/排风机监控监控意义机房空气质量、压力出现异常时,将导致机房其他设备运行所需的洁净空气失去保障,因此设计对机房内新/排风机的运行状态进行实时监测,同时可对新/排风机进行远程的开关机控制。实现方式对机房内新/排风机的运行状态进行实时监测,同时可对新/排风机实现远程的开关/现新风机的开关机电源控制;空调状态开关量变送器检测新/排风机电源线的电流信号,转换成开关量信号后接入数字量输入输出模块中实时采集新/时选用)另外通过微压差开关检测过滤网两侧的压差信号后再接入数字量输入输出模块进行采集,数字量输入输出模块通过RS485智能接口及通讯协议采用总线的方式将信号软件进行新风机开关机控制和运行状态的实时监测。监测内容实时监测新/并可通过监控平台软件实现远程的开关机控制,同时可对新风机进行定时开关机设置。3.4.2.4温湿度监测监控意义机房温度、湿度出现异常时,将导致机房其他设备容易出现过热、静电等现象,监控温湿度传感器能让管理人员第一时间知道热点、干燥等问题,并有效采取预防、维护和优化措施。实现方式在机房的各个重要部位安装温湿度传感器对环境温湿度实现监测,既可在温湿度传感器表面实时看到当前的温度和湿度数值,亦可通过温湿度传感器的RS485智能接口和通讯协议采用总线的方式将信号接入监控服务器(或串口服务器,由串口服务器将数据监测内容实时监测机房区域内的温度和湿度值;同时支持与其它子系统的联动控制,如当温度过高时自动联动启动空调进行制冷。3.4.2.5机柜温度监测监控意义机柜内温度出现异常时,将导致机柜内设备容易出现过热等现象,监控温度传感器能让管理人员第一时间知道冷量不够或冷空气短路等问题,并有效采取预防、维护和优化措施。实现方式在机柜内安装温度传感器对机柜微环境进行实现监测,通过温度巡检仪采集温度传感器的数据,再通过温度巡检仪的RS485智能接口和通讯协议采用总线的方式将信号接件进行机柜温度的实时监测。监测内容实时监测机房区域内的温度和湿度值;同时支持与其它子系统的联动控制,如当温度过高时自动联动启动空调进行制冷。3.4.2.6漏水监测监控意义并有效采取预防、维护和优化措施。实现方式设计在机房有空调的地方安装定位式(区域式)漏水检测设备,保证机房设备的稳定运行。通过在有水泄露地方的四周敷设漏水感应绳,当发生漏水时感应绳将报警信号传给定位式测漏控制模块(区域式漏水控制模块),通过定位式测漏控制模块提供的RS485智能接口及通讯协议(通过8路隔离数字量输入模块实时采集区域式漏水控制模块的干接点报警信号后,再经8路隔离数字量输入模块提供的RS485采用总线的方式将漏水报警信号直接接入监控服务器(或串口服务器,由串口服务器将监测内容及有相应的处理提示,并第一时间发出对外报警。3.4.3安保监控3.4.3.1防盗监控监控意义监测非法入侵情况对于机房的管理闲得尤为重要。监控红外防盗报警器能让管理人员第一时间知道机房入侵情况,并有效采取应对措施。实现方式在机房的重要区域安装吸顶式红外探测器实时监测机房的人体入侵情况。吸顶式红外探测器的信号直接接入8路隔离数字量输入模块,通过8路隔离数字量输入模块的RS485智能接口及通讯协议采用总线的方式将信号接入监控服务器(或串口服务器,由监测内容实时监测各点探测器的报警情况;系统支持与其它子系统的联动功能,当吸顶式红外探测器有人触发时自动联动打开照明灯光、自动联动相应位置的摄像机进行录像等。3.4.3.2视频监控监控意义视频监控以其直观、准确、及时和信息内容丰富而广泛应用于机房管理。视频能让管理人员不受地域限制随时访问被监控点,并有效监测现场情况。实现方式XX的视频图像监视。摄像机通过视频线直接接入到监控服务器的视频输入接口(硬盘录像通过监控平台软件进行图像监控。监测内容实时监视各路视频图像,通过在电子地图上点击相应的图标即可查看该摄像机的当前画面。24动侦测录像以及联动触发录像等多种方式。可设置录像分辨率(CIF、2CIF、D1CIF分辨率录像时存储空间约为5G/天(每路视频图像按D1分辨率录像时存储空间约为20G/置了XX块XXG容量的硬盘,可录像XX天。系统支持硬盘存满时自动从头覆盖,循环录像。支持历史视频检索回放功能,可根据录像的类型、通道、时间等条件进行检索,回放速度可调。支持与其它子系统的联动功能,如:门打开或发生防盗报警时联动摄像机进行录像,同时弹出相应的视频画面窗口等。3.4.3.3消防监测监控意义火灾往往是导致机房出现瘫痪的罪魁祸首之一。管理者需要第一时间知道机房内的消防火警信号,来避免更大的损失。实现方式对机房内由消防控制箱提供的干接点信号进行实时火警监测。采用8路隔离数字量8路隔离数字量输入模块的RS485智能接口及通讯协议采用总线的方式将信号接入监控服务器(或串口服务器,由串口服监测内容实时监测机房内的消防火警信号。3.4.4IT设备监控3.4.4.1服务器监测监控意义服务器指一个管理资源并为用户提供服务的计算机软件,通常分为文件服务器、数PC方面都要求更高,因此需要让管理人员第一时间知道CPU、芯片组、内存、磁盘系统、网络等硬件等问题,并有效采取预防、维护和优化措施。实现方式对机房内服务器进行监控。通过被服务器提供的SNMP标准接口,通过TCP/IP的方式将信号接入监控服务器,由监控平台进行对服务器的监测。监控内容监控服务器硬盘、网卡、内存的好坏,CPU温度、电压、风扇转速、电源调制模块温度、电源电压等细微性指标等及设备健康状况。3.4.4.2路由器监测监控意义路由器是互联网络的枢纽,用于连接多个逻辑上分开的网络。监控路由器对于判断通信故障方向有决定性作用,能让管理人员第一时间知道故障网络等问题,并有效采取预防、维护和优化措施。实现方式对机房内路由器进行监控。通过被路由器提供的SNMP标准接口,通过TCP/IP的方式将信号接入监控服务器,由监控平台进行对路由器的监测。监控内容监控CPU,内存利用率,端口状态、网络端口的流量、端口的丢包率及设备健康状况。3.4.4.3交换机监测监控意义交换机是网络节点上话务承载装置、交换级、控制和信令设备以及其他功能单元的集合体。交换机能把用户线路、电信电路和(或)其他要互连的功能单元根据单个用户的请求连接起来。监控交换机就是监控用户需求与服务提供方之间的桥梁,能让管理人员第一时间知道网络流量、网速不达标等问题,并有效采取预防、维护和优化措施。实现方式对机房内交换机进行监控。通过被交换机提供的SNMP标准接口,通过TCP/IP的方式将信号接入监控服务器,由监控平台进行对交换机的监测。监控内容监控总虚拟内存量、流量及网速、运行时间、系统名称、系统描述、网络参数和设备健康状况。监控内容监控CPU、内存利用率,端口状态、网络端口的流量及设备健康状况。3.5推荐监控对象3.5.1动力监控3.5.1.1STS/ATS开关柜监测监控意义机房的STS/ATS是电源二选一自动切换系统。监控STS/ATS能让管理人员第一时间知道输入电源方向等问题,并有效采取预防、维护和优化措施。实现方式对机房内静态开关柜(STS)/动态开关柜(ATS)的运行参数及状态进行实时监测,通过STS/ATS设备提供的RS485(或RS232)智能接口及通讯协议,采用总线的方式将STS/ATS的监控信号直接(或经通讯转换模块将RS232转换成RS485信号后)接入监控STS/ATS的实时监测。监测内容实时监测输入电源的三相电压、电流、功率因数、有功功率、无功功率等参数,以及断路器、各开关、设备运行状态等状态(能监测到的具体内容由厂家的协议决定,不同品牌、型号的ATS/STS3.5.1.2发电机监测监控意义机房的发电机是机房要保证长期可靠性,并提供可以持续数小时甚至几天充足的后备电源供应设备。监控发电机能让管理人员第一时间知道发电机的马达启动情况、发电机功率等问题,并有效采取预防、维护和优化措施。实现方式对智能发电机各部件的工作状态及运行参数进行实时监测。通过发电机设备提供的RS485(或RS232经通讯转换模块将RS232转换成RS485信号后)接入监控服务器(或串口服务器,由串监测内容实时监视发电机的输出电压、电流、功率、油压、水温、转速等参数(能监测到的3.5.2环境监控3.5.2.1照明监控监控意义通过监控平台软件实现远程的开关灯控制,同时可对灯光照明回路进行定时开关灯设置,使灯光照明自动工作不需人为干预,大大延长了设备使用寿命,达到节能降耗、无人值守的目标。实现方式设计对机房内灯光照明回路进行远程的开关灯控制。通过隔离高压输入模块监测照220V电源的通断电,从而实现灯光照明的开关灯控制,并通过模块的RS485智能接口及通讯协议采用总线的方式将信号接入监控服务器(或串口服务器,由串口服务器将数据上传监测内容系统支持与其它子系统的联动功能,如:灯光和门禁系统联动,有权限的管理人员进入房间前在外面刷卡,系统自动打开机房内灯光,离开时刷卡后自动延时熄灯(自定义延内有人员活动,自动联动系统打开相应区域的灯光等。3.5.2.2防雷监测监控意义机房内防雷器的工作状态关系到机房内设备在雷雨天气中的安全系数。监控防雷器能让管理人员第一时间知道防雷器的工作状态,并有效采取预防、维护和优化措施。实现方式设计对机房内防雷器的工作状态进行实时监测,采用8路隔离数字量输入模块采集防雷器提供的干接点信号后,再通过8路隔离数字量输入模块的RS485智能接口及通讯协议采用总线的方式将信号接入监控服务器(或串口服务器,由串口服务器将数据上传监测内容实时监测防雷器的工作状态。3.5.3安保监控门禁监控监控意义传统的门锁,越来不适用于机房这样的重要区域。钥匙容易丢失、被配置、不方便管理等缺点凸显严重。门禁监控可以实时掌握机房各道门的人员进出情况,让管理人员便捷地管理人员进出区域、进出时段、有效进出日期等。实现方式+纹,指纹+(刷卡)的进出验证方式,由监控平台软件进行机房出入的门禁管理。器)设备提供的RS485(TCP/IP)智能接口及通讯协议,采用总线(TCP/IP)的方式将监控平台软件进行门禁的实时监测。监测内容实时监控各道门人员进出的情况,并进行记录。可对人员的进出区域、有效日期、进出时段等进行授权,并可对人员进行权限组划如:发生火警时联动门禁控制器自动打开各道门的电锁以便逃生等。3.5.4IT设备监控防火墙监测监控意义防火墙是一项协助确保信息安全的设备,会依照特定的规则,允许或是限制传输的“CPU、内存利用率等问题,并有效采取预防、维护和优化措施。实现方式对机房内防火墙进行监控。通过被防火墙提供的SNMP标准接口,通过TCP/IP的方式将信号接入监控服务器,由监控平台进行对防火墙的监测。监测内容监控防火墙的CPU,内存利用率,端口状态、端口的丢包率及设备健康状况等。四、售后服务4.1售后服务标准.质保期间对下不建议对系统平台进行版本升级)4.2售后服务支持体系我们公司在北京、广州、上海、成都等地设有一级办事处,每个办事外都拥有独立西安等12个地市建立的二级办事处,设有维护及技术支持网络。根据PICC全国机房的15东、青岛、大连、黑龙江、辽宁、北京朝阳、北京宣武、河南、天津、沈阳后援中心)8的地方(宁波、湖北、浙江、江苏3楼、江苏23楼)的机房环境监控的售后服务支持。广州办事处负责华北区域9的地方(海南、福建、厦门、广东、广西、湖南、贵州、云南、深圳)的机房环境监控售后服务支持。成都办事处负责华北区域7的地方(西藏、新疆、陕西、)级协议SLA:一是每年的主动上门巡检次数;二是故障紧急程度对应的处理速度;三是监控系统接入厂家全国运维平台的可用率;四是专家远程值守客户机房的时间等条款,来充分维护客户信息监控管理系统的稳定性和可用性。4.2.1例行性检查服务a在保修期内或是在维护合同期内,我们公司安排系统巡检和2次电话回访,以保证系统能正常稳定的运行b例行检查时间间隔:在合同签署之日起一年内,我公司将每年安排一次上门系统例行巡检。通过对系统的可靠性、安全性、可管理性以及系统性能等层面进行广泛、深入的检查,发现系统潜在的安全隐患并提出纠正及预防措施,具体包括但不限于以下内容:系统运行环境系统硬件工作情况系统日志系统软件维护(打补丁)系统资源状况系统综合效能出具巡检维护报告c检查内容检查数据库服务器:检查数据库的运行状况;核实原系统配置:核实系统软件配置及版本;检查各监控终端软件:检查各计算机监控系统用户端软件使用情况;检查软件系统运行环境:检查网络操作系统软件、操作系统软件稳定性等;d检查方式制定例行检查计划:根据软件系统的检查时间,投标方制定相应的检查计划,其中包括每次例行检查时间、例行检查小组成员、例行检查内容;核实例行检查方案:例行检查前,由招标方提前三天通知本公司具体检查时间。e检查结果处理例检记录:每次检查完成后提交例行检查报告。包括检查发现的问题、系统现状评价、改进建议;例检问题处理:对于例检发现的问题,若属于负责维护的软件系统,则保证在5个工作日内解决问题;每次巡检后将根据巡检的情况提供巡检的项目表格和报告。4.2.2系统应急维修服务共济科技提供7*8小时全天候热线电话进行售后技术支持服务:售后服务热线电话(24小时):400-8810-182当系统出现故障且通过电话咨询、远程维护等方式无法解决时,本公司将按响应等级实施,响应方式分三级,具体要求如下:一级响应方式——立即安排当地的维护人员到达现场紧急处理:整个监控系统处于瘫痪或严重报警状态,使用单位现场管理人员不能处理时,维护人员在接到通知后2小时电话响应,6小时内赶到现场处理,并在到达现场之后12维护厂家现场技术人员无法彻底解决,应采用应急方案恢复系统基本运行,通知总部安排有关技术人员立即前来处理。二级响应方式——安排当地维护人员及时到达现场或者远程指导完成维护事务。当监控系统出现严重问题并影响到系统的运行,本公司保证在接到现场服务要求后,派技术人员在12小时内赶到现场,并在到达现场之后24小时内恢复运行或采用应急方案,同时可以根据对维护技术要求程度调整为远程指导完成维护事务;三级响应方式——远程指导完成维护事务。当监控系统中的某个功能出现故障,但整个系统仍能工作。本公司在2工作日内恢复运行,可以通过电话、传真、互联网等多种方式进行远程的系统维护指导。4.2.3服务资料的管理我公司在系统调试交接时,将提供完整的完工图纸,软、硬件文档,操作、维护手册,设备清单等,并帮助用户建立系统的运行、管理和维护文档,以便在发生故障时能及时提供资料,迅速找到并排除故障,将损失减至最小。建立用户档案,对每次用户反映的情况和处理情况做详细的记录。4.2.4服务结果的确认所有的服务结果,以对用户的回访意见和公司审核监督机制相配合,做出最终确认,保证服务质量。4.3售后服务内容及范围4.3.1系统故障维护当系统出现问题时,对问题进行诊断、分析,并解决问题。4.3.2咨询服务免费为用户提供技术咨询等技术支持服务。包括系统管理的技术指导,协助客户做好备份计划,完善工作日志、操作制度,订立操作守则等。4.3.3备件保修和更换服务我公司根据所集成的产品建立了备件仓库,同时结合原厂家在国内的备件中心,为用户提供备件更换服务。基于用户业务运行的重要性及响应时间考虑,我公司备件更换程序可以先将好的备用模板或设备供用户使用,直至故障设备修复,这样可以大大减少用户业务中断的可能是我公司整个技术支持体系中的重要组成部分。如果设备故障无法排除,我公司保证提供不低于故障设备规格型号档次的备用设备供用户替代使用,直至故障设备修复为止,保证用户业务的正常运行,并恢复正常工作。五、运维外包5.1背景说明为客户监控管理其非核心业务的服务模式已成为一种新的业务模式,在推动着各行各业的核心业务的健康发展。很多企业,将部分非核心业务剥离出来,交由专业公司来处理,而专业公司凭借自身的专业人才和资源提供优质服务,这已成为当前业务发展的一种趋势。这种服务方式使得企业
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44749.2-2024胶粘剂室内木制品用胶粘剂评价和选择试验方法第2部分:在恶劣环境下的抗分层性
- GB/T 44673-2024婴童用品水上辅助浮力器具通用技术要求
- GB/T 11981-2024建筑用轻钢龙骨
- 《大学物理2》课程教学大纲
- 2024年伐木劳务承包合同范本
- 2024年代销电缆线合作协议书模板
- 2024年传家电视剧大姐离婚协议书模板
- 儿童肺炎的预防护理
- 《社会调查》教材笔记
- 可疑深部组织损伤期护理
- 健康体检的重大意义共35张课件
- 微景观制作课件
- 2023学年西藏省重点中学英语九上期末考试试题含解析
- 三位数除两位数的除法练习题
- 小学心理健康教育人教六年级下册目录生命只有一次教学设计
- 小学劳动课教案三年级上册5篇
- 2021版特种设备目录
- 五年级上册美术课件-第4课 未来的交通工具丨赣美版
- 最新爆破安全规程
- 主题班会课防盗
- 支委会委员选举计票单
评论
0/150
提交评论