山东省厅8.it智能分析技术方案_第1页
山东省厅8.it智能分析技术方案_第2页
山东省厅8.it智能分析技术方案_第3页
山东省厅8.it智能分析技术方案_第4页
山东省厅8.it智能分析技术方案_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11.1 项目背景随着计算机技术的发展和普及,信息系统数量与日俱增,山东省厅新建警务云计算中心机房,机房分布于技术楼三层。机房的和管理,是后续的一个重要的工作,机房设备若出现故障,很可能导致业务系统无法正常工作,从而对厅造成非常严重的损失和恶劣的社会影响。所以,需要建设一套及机房动力环境、IT、能源及热场管理、资产管理、运维管理于一体的综合运维管理,完成机房的日常管理工作。1.2 项目需求基于以上,本次要为山东省厅机房部署一套整体管理,具体需求包括以下几个方面:(1)动力环境(已建):无缝集成已建设的动环系统,包括动力(市电、配电开关、精密配电柜、UPS)、环境(精密空调、温湿度、漏水、新风)

2、、安防(门禁、消防、防盗)三个方面的子系统;(2)IT(已建):集成第IT系统,包括网络设备、服务器、操作系统、应用系统及中间件等方面的子系统;(3)资产容量管理:包括机房 IT 资产管理、容量管理等方面;(4)能源及热场管理:对机柜前后门处进行温度监测,通过系统内置算法,计算生成机柜不同切面的温度云图,直观反映机房温度及热点分布;监测机房 PUE 及能耗分布情况,为节能减排提供数据依据;(5)三维可视化:通过 3D 的方式,实时展现机房的建设成果,对机房进行 3D,展示内容包括动环系统、IT 系统、资产系统等。1.3 设计依据本次数据中心机房系统建设应满家现行的设计和施工标准或规范,设计、施

3、工、验收时需满足下列标准及规范(更新版本,参照新版本执行)。电子信息系统机房设计规范(GB50174-2008)电子信息系统机房施工及验收规范(GB 50462-2008)电子计算机场地通用规范(GB/T2887-2000)工业企业通地设计规范(GBJ79-85)安全防范工程技术规范 (GB 50348-2004)供配电系统设计规范(GB 50052-2009)低压配电设计规范(GB 50054-2011)建筑照明设计标准(GB50034-2004)出控制系统设计规范(GB50395-2007)智能建筑设计标准(GB/T50314-2006)通用用电设备配电设计规范(GB 50055-2011

4、)1.4 建设目标系统的建设目标是:实现对山东省厅云计算中心机房动力环境、IT设备、资产信息进行集中,对机房设备管理和运营实现、完善和主动的流程化运维,规范化服务和集中化管理,全面提高技术保障水平。在数据中心的和运维管理工作中,1.数据中心须达到以下几个方面:所有应用系统应是一个整体,每个系统应是其中的一部分,整个系统使用通用技术制定信息标准以及各系统之间的接口标准;对于关键应用,采用高可靠性工控设备来设计。所有系统、设备、材料等都应选用主流的,稳定的产品;所选用的设备具有智能化,可管理的功能,同时采用先进的管理系统设备及,实现先进的集中管理,实时、监测机房的运行状况,具备实时,实件功能,为机

5、房安全、可靠的运行提供最有力的保障。2. 数据中心设备管理规范化所有进入数据中心的设备,拥有完整的管理、资产、基础配置登记,所有数据中心设备使用者和资产管理者可以随时查阅其设备的管理基本信息。3. 数据中心配置管理精细化实现数据中心各区域的机位、供电、交换机端口等资源的精细化管理,对每台设备的物理位置、基础物理环境、设备信息实现配置信息的精细化。为数据中心设备的、数据中心整体使用成本计算提供基础数据。4. 数据中心容量控制规范化根据数据中心区域配置情况及数据中心设备的基本放置情况,实现数据中心基础环境资源池梳理,达到数据中心服务目录化、标准化的管理要求。在实现数据中心配置管理精细化的基础上,对

6、机房各个区域的基础资源实现容量信息的标准化管理。数据中心管理者必须实时掌握数据中心内基础资源使用率。预先准备紧缺资源,更好满足IT 运维服务要求。为了实现上述方面的目标,在梳理完成数据中心配置容量信息表、发布数据中心管理规范的基础上,完成对山东省厅云计算中心机房综合运维管理系统的建设工作,依托高效灵活的管理工具,来实现管理目标。1.5 整体系统架构设计管理系统架构采用“分布、集中管理”的方式进行设计,系统架构示意图如下:如上图所示,整个系统包括现场设备层、集中管理层和展示层三个部分。现场设备层:由动环系统、资产容量管理系统、IT系统等组成。各子系统负责收集各子系统的的实时数据,进行本地,并将数

7、据经过滤后上传至集中管理服务器,进行和管理。集中管理层:由集中管理服务器组成。集中服务器负责整体系统的集中与调度,收集与处理由现场监控层发送上来的数据和,并能生成相关报表,给管理提供优化管理资料。机房管理通过集中管理服务器或操作终端(C/S、B/S均可)的人机交互界面进行实时,完成统计报表、数据分析挖掘、告警管理、能耗管理、权限管理和系统配置管理。展示层:通过集中管理服务器对机房进行3D仿真,采取三维可视化的方式,直观展示机房建设成果、机房内设备运行状态。1.6 综合运维管理系统介绍“综合运维管理系统”是通过TCP/IP与各子系统及设备进行通讯,管理的权限控制、各子系统的数据集成管理、信息查询

8、、报表管理、管理、日志管理、联动控制管理、系统管理、运维管理、能耗管理、资产容量管理等功能均在综合运维管理系统上完成。综合运维管理系统功能模块,详见下图(本项目配置功能请参照):综合运维管理系统和各子系统之间采用分布式集散结构,各子系统相对独立,一个子系统发生故障,不影响其他子系统的正常;综合运维管理系统发生故障,各子系统仍能正常工作。同时各子系统之间又可通过在综合运维管理系统上定义各自的联动策略,并可实现跨子系统的策略联动。综合运维管理系统同时对于IT系统、资产管理系统进行集成管理,并预留对其它系统集成接口。管理(用户)对综合运维管理系统的,可通过以下途径实现:通过web方式综合运维管理系统

9、,中心WEB客户端接入大屏系统,可通过大屏系统进行展示。可实现对设备的运行状态的查看,参数设置、权限设置、设置的修改等。通过客户端进行管理。通过三维可视化系统综合运维管理系统。1.6.1综合运维管理系统功能智能联动系统在同一集成了动力、环境、安防、IT、资产等子系统,并可通过图形化界面实现相互间的任意联动。可通过联动设置实现了各子系统间的联动,如门禁联动,温湿度过高联动空调运行等,使得各个子系统之间真正能实现数据和资源共享,能够实现更加强大、完善的。联动功能具有最大的灵活性,联动内容可由用户自行定义,当联动逻辑需要改变,无需编程,通过系统能提供联动策略组态工具,用户可自行快速修改联动逻辑,实现

10、对系统或设备的灵活、有效的操作、控制,可以实时的更改联动功能和效果。联动策略组态设置界面三维可视化系统采用基于 Windows 的 3D 渲染技术,进行场景渲染呈现,结合场景图技术、快速可见性判断技术,加快虚拟数据中心的模型重绘,保证渲染的实时性。管理可以通过 3D 方式浏览设备参数、查看、定时巡检、处理事件等。.1 总览场景总览场景体现整个建筑,用户通过控制三维系统在虚拟建筑和机房内进行巡查、漫游等操作。该场景应包括楼层建筑、中心机房等,使其与现有环境一致。采用互动的方式,通过鼠标的方式对机房个区域进行浏览。当某区域出现故障,该区域有红色闪烁,点击相应区域可进入到该区域的三维模型图中;提供灵

11、活的互动快捷键,使得虚拟浏览功能的操作使用更加简单、人性化。用户可看到机房装修情况,还可以看到各种仪器仪表设备等,包括空调、UPS、服务器机柜、服务器、网络设备等。建筑的装修装饰、设备的外观及摆放位置都可以和实际物体保持高度的相似性。在巡视过程中,用户也可以在虚拟场景中执行一些巡视操作,虚拟出仿真的动作效果。可以模拟机房管理在机房内操作的情况。.2 楼层场景视觉上可以总览楼层全貌,快速获取个设备及系统在楼层的分布情况,或在楼层中漫游,或聚焦观察特定设备或物体的细节;功能上,实现适合在楼层中展现的功能。可以随时调整三维视角,选择最佳浏览方式,获得更佳的视觉效果。这些操作包括视角的拉近、旋转、翻滚

12、平移等。在三维场景中,要能随时显示整个区域的平面地图,以及当前所处位置。点击电子地图的某个区域可直接跳转定位到相应区域。.3 子系统场景用户可通过快捷键查看子系统场景,抽象地模拟每个子系统的运行情况。子系统场景中,不相干的建筑和设备半透明,使子系统得以突出显示。.4 漫游巡查可与真实环境一样,在三维虚拟系统的机以任意路径巡查。可对机房环境中的任意已设备进行数据获取。.5处理当有发生时,管理系统可对外发出;当机房内发生故障警事件可以直观地在界面上显示相应的效果。.6 设备信息管理可通过点击相应的设备,既可查看对应的设备即时状态或资产信息;可直接点击相应的被设备,显示各设备的相关信息、设备参数设置

13、和状态、点击相应设备可以查询设备的历史数据和事件,可实现设备快速搜索和定位功能;实现机柜可用资源、已用资源的汇总和统计功能,可按照机房名称、设备种类等多种方式进行汇总和统计。基础设施设备运行状态的实时联动功能:在三维场景中,用户可直接点击相应的被的基础设施设备,设备状态可在当前视图中实时联动刷新显示,点击设备可显示当前信息。本系统的机房环境和设备信息管理可视化系统可以与IT系统及业务监控可视化系统无缝集成,形成覆盖机房环境、物理设备到网络、系统、应用等层次的端到端展示。.7 设备控制对数据中心内可以控制的设备,具备相应权限的用户或用户组可以对该设备进行控制操作,例如打开或关闭机房门等。1.7

14、综合运维管理系统功能1.7.1人机交互界面系统支持树形结构、场地布局,并能将、曲线、动画、控件等组态到显示界面上,鼠标控制,操作简单,可根据现场情况按用户意图定制主界面和各个子系统的界面,最大程度满足个性化设计,并预留扩展3D电子地图功能,场景真。1.7.2系统运行日志系统具备完备的运行日志,可以分类型、分设备、分时间、分类型进行统计。在“设备事件”中,用户可以选择系统的某台设备,查看该设备在某个时间段的。在“设置事件”中,用户可以查看各种设置事件,比如某人在什么时间关闭了空调,在什么时间对门禁系统进行了设置。在“系统事件”中,了系统的启动、关闭事件,用户的连接事件,的发送事件等等。所有的报表

15、都可以导出到word、excel等中,便于用户向汇报机房的运行情况。如下图所示:以设备为关键字查询所有的报表均采用系统自带的二次开发开发而成可以根据用户的需求,设计出各种不同的报表,满足用户的特殊要求。1.7.3权限管理系统内置完整的网络支持,用户可以在网络的任意位置机房运行,其安全性尤其重要。因此系统具有完整的权限管理功能,可以规定每个用户可以浏览的内容以及该用户可以操作的设备。并且每一次连接、登录以及对设备的操作都有详细,便于核查。完整的多级用户权限管理功能,可根据机房结构特点对用户进行分组群管理。权限级别在 10 种以上,可根据用户的不同组合权限,整体过程支持由用户自定义完成。用户登录后

16、如长时间不操作可自动注销,注销等待时间可以由用户自行设置。默认用户操作,操作工号、操作时间、操作内容和设备,提供操作的登录和退出系统时间信息,并可以将信息打印输出。系统具有强大的容错能力,对用户的致命性操作都进行安全提示认证,不会出现误操作退出系统和死机现象。1.7.4查询功能通过把各单元数据到数据库,对数据进行分类归组,在查询数据时,过滤不相关数据,以实现查询功能。系统对每一个单元(设备)的工作状态、工作参数等内容提供简单、直接的查询方式,查询的结果可以输出及打印。同时系统的查询方式可以根据查询条件过滤不关心的内容,要求直观、简洁,又不失完整性。1.7.5数据管理实时查询相关机房及设备的状态

17、、参数,提供实时数据曲线、历史数据曲线功能,可对设备当前的参数变化进行密切的实时监测、历史数据的回滚查看等,并可实时打印;同时也可以通过策略,当设备参数值达到某个标准时进行自动打印。对设备的重要参数可进行历史数据保存,可在直观的坐标图中以曲线形式显示,并可支持屏幕打印输出。系统对历史数据曲线采用二进制 DAT 文件格式独立,在数据较多时依然能够快速检索,数据经过加密后具有高可靠性,他人无法轻易进行和反编译行为,无法篡改。用户可以对曲线的显示精度进行时间范围调整,可以细致到以秒为的曲线变化输出,并支持通过游标线的移动对曲线进行回滚查看。所有打印出来的曲线图都有打印范围内数据分析,显示出最高值/最

18、小值分别为多少。提供完美的报表功能,除提供日常报表模板外,还可根据用户要求定制各种样式报表,并可以多种格式打印输出(EXCEL,AS,自定义等)。系统具备用户操作日志、系统运行状态日志、日志等。所有日志可以根据查询条件即时生成报表,并可打印输出。可以对任何设备参数实现报表功能,报表中会对设备参数进行级数据分析,为用户的提供准确的数字依据。对所有历史、实时数据可以灵活定制条件查询、统计、输出和打印。并可对查询后显示的数据进行条件排序。1.7.6管理系统具有多种方式的并行能力,发生事件时可根据级别高低进行排序告警,级别高的先,级别低的后;可针对测点定义级别,并可灵活的定义/类型(高限、低限等)。级

19、别的详细化管理,提供 10-255 个级别,可定义不同级别对应不同的方式。系统能自动对发生的按级别高低进行优先选择,当有不同级别的多个同时发生时,系统将会先对级别高的进行提示,再依次根据级别高低对其他的进行提示。系统发现后,事件栏将自动弹出提示信息,显示并打印告警信息,事件栏内显示的内容包括告警级别、站点名称、告警设备名称等数据。所有以电子地图形式弹出页面信息提供可视化管理窗口,发生时可在窗口中进行。可灵活进行条件定制事件查询、统计和打印,并可进行条件排序。1.7.7WEB管理机房环境系统同时支持 B/S、C/S 两种方式,用户可以通过 TCP/IP 网络在网络连接的任意位置,通过浏览器或管理

20、服务器浏览所有机房的实时信息:遥测、遥信、曲线等,查看事件、进行设置、系统配置等工作,IE站与当地站具有完全一致的图形界面,且无需安装任务。1.7.8高度的可扩展性系统采用模块化设计,各子系统或功能相对独立,当某一机房设备或某一个功能模块发生故障时只需替换相应模块而不会影响其它机房或整体系统。系统采用组态方式和模块化结构,实现了对机房内各智能设备和子系统的实时和管理,使系统具有非常好的扩容性能,具有扩容功能,可扩容至 300000点,完全可以满足用户今后系统扩容的要求,在不影响已建设系统的正常运行情况下即可加入新增站点。系统支持 RS232、RS485、RS422、TCP/IP、SNMP、OP

21、C、DDE、MODBUS、A、ET、C-BUS 等各种标准化协议和接口,以用于快速方便的将各对象集成到系统中。系统预留的 OPC、API、SNMP、ODBC、SCOKET 等各种上位集成接口,能够为未来的集中管理实现数据集成和界面集成,提供包括数据库存取、告警信息、界面数据的共享,通过系统预留的上位集成接口,在集中管理上实现单点登录,系统权限验证由系统完成,不需人为多次登录。1.7.9功能系统不单有功能,还可以进行后的事件处理专业指引,以方便任何人接到都能应急处理,预防更大的损失。例如,当系统监测到空调压缩机故障,建议功能模块可以自动的进行处理提示:“请先关闭号空调,将号空调电源开关分离,联系

22、空调厂家公司工程师X进行,期间请注意机房内温度的变化,确保设备的安全运行。”1.8 机房 IT系统功能本系统的网络与其他完全融合在一起环境设备和数据网络的完整系统。主机通过网络与交换机、路由器、服务器、小型机等建立通讯联系,直接从这些网络设备中获取各种信息,通讯过程采用国际上通用的 SNMP、MON等,无需在网络设备上添加任何应用程序,即可各种主流网络设备或服务器,确保网络系统的安全可靠性。同时,由于采用了通用协议,也给系统的扩容和升级带来极大方便。主机通过网络与路由器、服务器、小型机等建立通讯联系,直接从这些网络设备中获取各种信息, 通讯过程采用国际上通用的简单网络管理协议(SNMP),无需

23、在网络设备上添加任何应用程序,即可机房内服务器、路由器、工作站及其他网络设备的工作状态;网络设备的启停时间、网络流量-时间曲线;统计通讯繁忙程度、通讯可靠性;对于服务器关机、通讯拥塞或通讯瘫痪等严重事件立即给出信息,并弹出该网络设备的相应画面和处理建议,辅助管理排除网络过障;提供网络通讯状况的详尽资料,辅助管理预先发现网络问题隐患,有力保障网络系统的网络系统的安全可靠性。同时,由于采用了通用协议,也给系统的扩容和升级带来极大方便。保证网络持续高效运行随着信息化的普及,网络将合作伙伴、供应商、客户和员工有机的结合起来。企业经营的成功与否,越来越依赖于网络系统的正常运行和高可用性,系统出现故障或响

24、应时间过长,将对企业的整个经营活动产生巨大的影响。因此,高效的网络与系统管理不仅是必需的,而且已经成为企业成功的先决条件。先进的可视化功能Watchsys的网络拓扑功能使繁杂的网络运营管理工作变得直观和方便。系统的管理通过一个基于浏览器的用户界面,可以一目了然地了解整个异构系统、网络设备及其应用的运行状况。Watchsys不仅可以用来保证网络基础架构的高可用性,还可以用来追踪各种企业关键网络应用的运行情况,查看各种设备之间的关联并在复杂的IT架构中漫游,从而实现方便高效的管理。适用于各种复杂的网络环境不管你是简单的局域网,还是遍布的庞大的广域网或局域网,Watchsys都可根据你的需求生成各种

25、相应的网络拓扑图,并且可以十分方便地在各个拓扑图间进行切换,从而使复杂的网络信息系统管理工作变得直观和轻松。数据与网络拓扑的完美结合直观反映整个系统运行状况网络拓扑图一旦生成,Watchsys可以自动查找、添加与相应的服务器、网络设备、IP地址、端口相关的各种监测参数。单击网络拓扑图上的任意组件,与该组件相关的监测参数的运行状况都将直接显示出来,点击任意监测参数可以查看该监测参数的历史数据和实告。网络拓扑图中任何组件的监测参数中只要有一个达到了事先设定或错误的条件,该组件颜色就会变成相应的黄色或红色,系统管理从网络应用拓扑图可一目了然地了解整个网络的运行状况。1.8.1 面向应用的网络拓扑Wa

26、tchsys的网络拓扑发现不仅可以用来直观地反映服务器、网络设备等网络基础架构的运行状况和网络状况,而且可以直观地显示数据库、FTP等等各种网络应用的运行情况,从而帮助系统管理从应用层面确保整个网络信息的正常运营。拓扑发现分为:网络骨架搜索和网络子网搜索,网络骨架搜索对应路由器交换机的拓扑;网络子网搜索对应整个网络的设备。只要设备允许它就能被发现,如果设备支持它就能被识别出设备类型。1.8.2 网络连通性当一台或多台计算机无法与其它网络区域的计算机进行通信时,这可能是由网络连通性问题所引起。有关连通性问题可以归结为以下三种:连通性丢失 用户不能访问网络的某些部分。间断连通性(ermittent

27、 Connectivity) 尽管用户有时可以网络资源,但仍存在周期性停机现象。间断连通性问题表明用户的机器大型故障危机。超时问题(Timeout) 超时会导致连通性丢失。它通常是由网络性能较差所引起。产生网络连通性问题的原因有多种,主要包括以下几种:网络适配器和交换机端口双工方式或传输速率设置不匹配;传输速率为10/100 Mbps 的网络适配器或交换机转换不正确;自动感应设置可能无法正确检测某些网络适配器的传输速率;3.网络适配器与母板或其它硬件或组件和驱动不兼容。设置为接受包或者是应答。4.连通性测试程序就是,是一种常见的网络工具。用这种工具可以测试端到端的连通性,即检查源端到目的端网络

28、是否通畅。即从源端向目的端发出一定数量的网络包,然后从目的端返回这些包的响应,如果在一定的时间内收到响应,则程序返回从包发出到收到的时间间隔,这样根据时间间隔就可以统计网络的延迟。如果网络包的响应在一定时间间隔内没有收到,则程序认为包丢失,返回请求超时的结果。这样如果让一次发一定数量的包,然后检查收到相应的包的数量,则可统计出端到端网络的丢包率,而丢包率是检验网络质量的重要参数。在广域网中,线路一般是网络的重要对象,因此监测线路的通断,统计线路的延迟与丢包率是发现网络故障、检查网络质量的重要。而网络中线路两端一般是路由器的两个端口,所以通常的监测就是登录到线路一端的路由器端口上线路另一端路由器

29、的端口地址,从而掌握该线路的通断情况和网络延迟等参数。由于登录是可以进行的,所以即使网络管理者在异地,只要他有足够的权限,就能监测任意线路的情况。本系统通过在设定时间内使用IP的方式查询系统中的主要节点设备、主机、服务器等设备连接状况,以便相关业务系统设备因故与网络失去联系,影响业务的正常并给企业造成不良影响。1.8.3 路由器兼容Cisco等各型主流路由其CPU使用率、路由器器,内存、接口流量、关键接口(如光纤接口)是否down、接口是否有丢包现象;监测Cisco设备底板风扇状态、模块状态、端口状态;路由器各界面接收字节总数、接收单播字节数、接收广播或多播字节数、丢弃的接收数据包数、错误的接

30、收数据包数、丢弃的未知协议或不支持的数据包数、发送字节总数、发送单播字节数、发送广播或多播字节数、丢弃的发送数据包数、错误的发送数据包数、发送队列长度等,据此判别网络通讯质量是否可靠,网络设备的处理能力是否满足要求等;其IP通讯接收数据包数、丢弃的错误数据包数、丢弃的错误地址数据包数、传递数据包数、丢弃的未知协议或不支持的数据包数、丢弃的接收数据包数、处理的数据包数、发送队列数据包数、丢弃的发送数据包数、丢弃的无路由数据包数、数据包装配最大等待秒数、需装配的IP碎片数、装配好的IP包数、包装配失败计数、成功分割的数据包数、分割失败的数据包数、分割的碎片数,据此判别网络通讯IP曾的可靠性和主要网

31、络设备的处理能力,发现问题立即,保障网络设备的可靠运行,也给网络升级提供客观依据。如特殊设备厂家未公开协议库必要时可通过设备管理端口对设备进行监控。1.8.4 交换机兼容IBM、Cisco、Catalyst等各型交换机,其CPU使用率、交换机内存使用率、接口流量、关键接口(如光纤接口)是否down、接口是否有丢包现象。如设备厂家未公开协议库必要时可通过设备管理端口对设备进行。1.8.5兼容CheckPo、Cisco PIX 等各其交换机 CPU型,使用率、交换机内存使用率、的数据包数、丢弃的数据包数、fw 模块状态、写入日志的数据数、接口流量。1.8.6 服务器服务器是数据业务系统的,其上运行

32、各种服务程序(数据库、Web服务、邮件服务、办公系统)或应用程序,确保操作系统的可靠运行、确保各种服务的正常工作,才能使企业的生产管理正常进行,意义十分。由于系统资源的使用、系统的工作好坏仅靠人工难于解决,必须由其他程序进行全面深入的。本系统设有专门模块监视服务器的资源使用以及各进程的活动。1.8.7 服务器运行状态监测并CPU 的平均利用率,监测指定磁盘的剩余空间及利用率,监测物理内存、虚拟内存的利用率及剩余空间,一旦发现错误,立即报警,保障数据系统的可靠工作。主机资源监测并CPU的平均利用率,监测指定磁盘的剩余空间及利用率,监测物理内存、虚拟内存的利用率及剩余空间,监测文件系统状态,监测交

33、换分区状态,监测登录状态用户进程的数量,一旦发现错误,立即,保障系统的可靠工作。主机系统资源的可以采取SNMP实现,条件是系统必须安装有关主机性能的MIB库,该方法的优点是安全可靠,兼容性好,实现方便。如果条件不具备,可以编写,运行在该主机上,定时系统数据,在指定端口侦听主机的连接请求,采用TCP协议应答主机的询问,这种方式的优点是信息比较详尽,量体裁衣,通讯量小,但实现复杂。特别针对主机系统。系统进程监测指定进程的CPU及内存占用量,监测指定进程(服务)是否启动,监测进程是否正常工作。重要进程发生异常应当自动将进程断开,并重新启动,并该事件。进程可以通过SNMP实现,条件是系统必须安装有关主

34、机性能的MIB库,否则必须通过实现;进程重新启动必须通过在主机上运行的实现。软件定时进程运行状况,在指定端口侦听主机的连接请求,采用TCP协议应答主机的询问,这种方案量体裁衣,通讯量小,但实现复杂。具体实施手实际情况而定。特别针对主机系统。1.8.8 系统运行日志监测各程序运行时会产生大量的log文件,这些log文件对于检查程序运行状态、查找程序出错原因很有帮助。syslog.log,db2diag.log,前置进程和通讯产生的log文件的内容。在上述日志文件中发现的报错和异常信息进行及告。系统日志的检测可以通过FTP定时将日志文件取回分析其中的报错和异常信息,也可以通过主机上运行的分析日志文

35、件,并传回系统。日志种错误信息的特征字可以方便地增加或删除,方式也可灵活设置。1.8.9 网络通讯监测主机网络通讯接口(网络骨架/网卡)接收字节总数、接收单播字节数、接收广播或多播字节数、丢弃的接收数据包数、错误的接收数据包数、丢弃的未知协议或不支持的数据包数、发送字节总数、发送单播字节数、发送广播或多播字节数、丢弃的发送数据包数、错误的发送数据包数、发送队列长度等,据此判别网络通讯质量是否可靠,网络设备的处理能力是否满足要求等;其IP通讯接收数据包数、丢弃的错误数据包数、丢弃的错误地址数据包数、传递数据包数、丢弃的未知协议或不支持的数据包数、丢弃的接收数据包数、处理的数据包数、发送队列数据包

36、数、丢弃的发送数据包数、丢弃的无路由数据包数、数据包装配最大等待秒数、需装配的IP碎片数、装配好的IP包数、包装配失败计数、成功分割的数据包数、分割失败的数据包数、分割的碎片数,据此判别网络通讯IP曾的可靠旬和主要网络设备的处理能力,发现问题立即,保障网络设备的可靠运行,也给网络升级提供客观依据。1.8.10 WWW 服务监测WWW服务提供、通知及综合管理信息的基本,WWW服务的可靠性关系到日常工作正常进行,因而有必要对其服务质量进行。本系统WWW服务的发送字节总数、接收字节总数、发送文件总数、接收文件总数、当前用户数、当前非用户数、总共用户数、总共非用户数、当前连接数、最大连接数、连接尝试数

37、、登录尝试数、Http请求总数、删除移动拷贝总数、当前CGI请求数、当前BGI请求数、CGI请求总数、当前BGI请求总数、当前阻赛的请求数、阻赛的请求总数、的请求总数、未找到内容的总次数、HTTP服务的实际带宽等,发现异常、即启动、保障WWW服务的可靠性,数据可用于评估WWW服务质量、性能。1.8.11 FTP 服务监测Ftp服务主要提供共享、文档资料,给企业带来极大方便。本系统Ftp服务的发送字节总数、接收字节总数、发送文件总数、接收文件总数、当前用户数、当前非用户数、总共用户数、总共非用户数、当前连接数、最大连接数、连接尝试数、登录尝试数等,发现异常、即启动、保障Ftp服务的可靠性,数据可

38、用于评估Ftp服务质量、性能。1.8.12 网络出口管理进入网络时代所有人都疯狂地在网络上获取资讯,或休闲,因此网络带宽会觉得不够用,对于员来说除了想要知道网络系统工作是否正常外,很多时候为保证机构的主要业务传输会需要有一种灵活便捷的方式去控制网络的数据出口数据路径的方法和做法。显然可以人为的把一个子网从一台三层交换机的端口上直接拔下的确是一个非常干脆有效的方法,但却显然是一个不受人欢迎的做法,首先即便是设计成易插拔的结构的网络端口也是经不住长期禁不住的磨损的;其次这个做法好象有些麻烦。或许net到一台设备上去设置一次也是一个行之有效的办法,当然如果能有三天两头上去设一把而不厌其烦的劲头的话,

39、而且还要保证能永不出错。现在有了一种更好的选择,通过Watchsys系统你只要点击一下你那个可爱的鼠标一切就搞定了,如果这种工作稍有规律可循甚至你可以直接设置一个定时任务一切搞定,继续忙手头重要的事去吧或者干几件自己中意的事也不错。1.9 IT 设备能耗管理数据中心是高能耗,目前,集中管理主要在能耗监测和热场分布方面,进行相关的监测、计算和仿真,通过直观的界面展示、合理的报表统计,为数据中心节能减排提供判断和控制的依据。1.9.1能源及热场管理子系统实现本次设计采用前 2 后 1 的方式在机柜署温度传感器,系统周期性温度数据结果存入数据库,按照权限对各机房分别进行浏览,提供报表、历史温度场查询

40、功能。1.9.2能源及热场管理子系统功能PUE 计算PUE 是目前最流行的衡量机房电源能效比的指标,也是衡量一个机房是否节能的关键指标之一。实时 PUE通过对供配电系统的,可以计算出当前机房的 PUE。历史 PUE 查询PUE 会到系统数据库内,方便用户随时检索以往任何时间点的 PUE 值,方便用户把历史PUE 和当前实时PUE 进行对比,可以了解机房电源能效比的变化。能耗分析及统计能耗分析及统计数据来自与机房的 UPS、UPS 配电柜、市电输入柜、精密配电柜、发电机等配电设备,通过能耗管理模块就可以实时显示每个耗电系统(精密空调、冷水机组、照明、IT 系统等)当前的耗电情况,实时监测数据中心

41、总能耗、IT 设备能耗、空调设备能耗、电度数值、电费数值、温室气体排放情况等。热场管理通过运算子系统生成实时的温度场3D云图并绘制切面云图,要求提供不同剖面的云图,有热点可发出事件。对于每个机房或者机房区域,可以设置多个切面以供温度场浏览。可对已有的切面进行查看和删除。系统支持查看机房或者机房区域中的当前时刻的温度场云图,温度场效果通过不同的切面来表现。可以查看不同切面的温度场云图,也可在云图中双击查看任意点的温度值和温度曲线图。温度场云图须能提供2D和3D两种展现方式,每幅云图都必须具备缩放功能。系统支持查看指定机房在某个时段的异常温度报表,异常类型包括:采集异常、超过上限、超过下限。1.1

42、0 IT 设备资产容量管理1.10.1 资产容量管理子系统架构PC(本项目配置的阅读器为不带屏幕阅读器)资产管理子系统由条码、手持式阅读器、资产管理服务器等组成。资产管理服务器负责收集与处理由手持阅读器设备发送上来的数据。1.10.2资产容量管理子系统实现资产信息通过条形码扫描的方式进行,通过安装手持阅读器扫描机房资产表面粘贴的,同步到数据库中。该技术应用稳定,支持移动巡检,提高资产管理效率。手持阅读器1.10.3资产管理主要功能资产台账管理IT 设备基本信息管理:单台设备的基本信息包括设备名称、固定资产号、供应商、供应商、保修到期时间、技术状况、设备位置、资产类型、IP 地址,日期,设备所使用的操作系统,供应商信息等,要便于管理员编辑查询;能够对物理资产信息按照需求字段进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论