大数据中心管理平台解决方案_第1页
大数据中心管理平台解决方案_第2页
大数据中心管理平台解决方案_第3页
大数据中心管理平台解决方案_第4页
大数据中心管理平台解决方案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据中心管理平台解决方案

目录

1资源监管............................................................3

1.1应用管理......................................................3

1.2虚拟机管理...................................................4

1.3物理机管理...................................................5

1.4存储管理......................................................5

1.5网络管理......................................................6

1.6安全管理......................................................6

1.7机房管理......................................................7

1.8硬件准入管理.................................................7

2接口管理............................................................7

3运维管理............................................................8

3.1流程管理......................................................8

3.2监控告警管理..................................................8

3.2.1活动告警................................................8

3.2.2历史告警................................................9

3.2.3活动故障................................................9

3.2.4历史故障................................................9

3.3系统消息提醒.................................................10

3.4运维统计报表.................................................10

3.5大屏全景展示界面.............................................10

1资源监管

资源监管是云监管平台的核心功能之一,主要目的是对

云服务商的各类资源配置情况、运行情况、故障告警等各

方面信息进行从全局到局部的可知和可控。主要包括对应

用的管理、虚拟机的管理、物理机的管理、存储的管理、

网络的管理、安全的管理以及机房的管理。

资源监管可对各类资源进行关联管理和从多视角进行逐

级管理。

资源的监管是需要对应的厂商提供相应的信息和接口,

同时也需要一定量的二次开发,因此以下功能的实现需分

期逐步实现。

1.1应用管理

应用的监控,包括对物理资源运行的应用和虚拟机所运

行应用的监控。

应用使用的资源:监控应用所使用的基础信息,根据云

邛台服务商提供接口的能力,监控应用的CPU、内存等资源

占用信息。

应用所在机器:监控应用所在机器的主要性能,如

CPU、内存和磁盘性能。

应用健康状态的监控:监控应用是否正常启动、应用日

志是否正常记录、应用可否被正常访问等。

应用日志监控:根据云服务商提供应用的监控的接口,

管理应用的日志并根据日志级别进行日志分级信息的监

控,根据安全审的条件发出不同级别的告警信息。

L2虚拟机管理

可对虚拟机按照不同的用户权限进行创建、删除、启

动、关闭、重启、修改、迁移等各类管理。

对虚拟机CPU、内存、磁盘、网络等资源的配置情况、

使用情况、运行情况、所在物理机、健康状况、故障监

控、运行时间、关机时间等情况进行查看和管理。

可对虚拟机的生命周期进行管理,如虚拟机的申请部

门、生存时间、迁移情况、应用情况等进行查看管理。

以上的管理系统都可以对变化的信息进行保存,提供基

于时间、用户、业务等单个或多个关键字的查询和统计,

并结合系统前台界面的请求,对指定虚拟机的各种基本信

息及动态信息结合图表方式进行展现。

1.3物理机管理

可对物理机按照权限进行查看管理:物理机所在机房、

机柜、CPU颗数和核数、内存、磁盘、以及物理机所使用

网络、IP地址等信息。

物理机的运行状况查看管理:CPU使用率、内存使用

率、磁盘10性能及所用空间、健康状况、故障监控、运行

时间、关机时间、物理机内虚拟机等情况的管理。

以上的管理系统都可以对变化的信息进行保存,提供基

于时间、用户、业务等单个或多个关键字的查询和统计,

并结合系统前台界面的请求,对指定物理机的各种基本信

息及动态信息结合图表方式进行展现。

1.4存储管理

根据用户权限的不同,可对存储设备进行以下操作:

1、启动、关闭、重启、修改等各类管理。

2、卷/卷类型的创建、升级、删除、查询等操作。

3、快照的创建、升级、删除、查询等操作。

4、查看存储设备的配置情况:所在机房、机柜、硬盘

数量、硬盘配置、10等信息。

5、查看存储设备的运行情况:I/O性能、存储空间使用

情况、卷、快照、设备健康状况、故障情况、运行时间、

关机时间等情况的管理。

以上的管理系统都可以对变化的信息进行保存,提供基

于时间、用户、业务等单个或多个关键字的查询和统计,

并结合系统前台界面的请求,对指定存储设备的各种基本

信息及动态信息结合图表方式进行展现。

1.5网络管理

网络设备的配置情况:所在机房、机柜、设备型号、端

口等信息。

网络设备的运行情况:CPU内存利用率、端口流量、IP

分配、健康状况、故障监控、运行时间、关机时间等情况

的管理。

以上的管理系统都可以对变化的信息进行保存,提供基

于时间的查询和统计,并结合系统前台界面的请求,对指

定网络设备的各种基本信息及动态信息结合图表方式进行

展现。

L6安全管理

通过与云服务商平台的接口,收集各类安全设备的配

置、运行的信息以及系统中安全事件信息等进行收集、查

询、展示和分析。

1.7机房管理

通过与云服务商平台的接口,查看机房相关信息,包括

机房温度、湿度、门禁、监控视频等,实现机房进行远程

的监管。

L8硬件准入管理

对硬件准入的管理,主要是对接入集约化政务云平台平

台云监管平台和云服务商平台的边界进行保护,对接入网

络的终端和终端的使用人进行合规性检查,同时关联至云

监管平台中。只有被云监管平台激活的资源,才能在云监

管平台和云服务商平台上看到,用于资源的申请和使用。

需要准入的硬件设备包括:服务器、存储、网络、安全设

备及其他外围设备。

2接口管理

云监管平台应具备与电子政务外网统一CA认证、短

信、邮件等系统的接口。

3运维管理

3.1流程管理

集约化政务云平台平台的管理涉及到不同政府部门的租

户、不同的云服务商、各类监管部门等众多使用和管理角

色,因此对于系统的管理需要制定一些规范的制度和流

程,通过流程化审核和记录确保系统整体使用和运维的安

全。

云监管平台的工单流程可以包括用户注册、权限修改、

资源申请与释放、故障申报与处理、工作协同、硬件准入

等,可通过流程管理模块根据实际需求进行流程增减及流

程修改,实现可定制化。

3.2监控告警管理

3.2.1活动告警

活动告警是指系统被监控设备当前正在发生的告警信

息。系统管理员通过活动告警管理模块,及时地发现当前

设备的告警信息,及时地的解决设备的告警问题,保证了

设备的正常稳定的运行。

由于告警信息属于级别较低的警告信息,系统管理员可

以选择忽略和确认。告警信息支持导出功能,支持把系统

中的告警导出生产文档。

3.2.2历史告警

历史告警是指系统被监控设备以前发生的告警信息。系

统管理员通过历史告警管理模块,可以查看设备过去的告

警信息,分析设备的负载趋势以及设备的健康状态,对于

管理员对设备运行情况的了解提供r重要信息和科学依

据。告警信息支持导出功能,支持把系统中的告警导出生

成文档。

3.2.3活动故障

活动故障是指系统当前被监控设备正在发生的故障。系

统管理员通过活动故障管理模块,及时地发现当前设备的

故障信息,及时地的解决设备的故障问题,保证了设备的

健康稳定的运行。

由于故障信息属于级别高的警告信息,颜色上会呈现红

色,在监控策略设置的前提下,也会按照监控策略的规则

进行触发相应的处理机制。故障信息支持导出功能,支持

把系统中的故障导出生成文档。

3.2.4历史故障

历史故障是指系统被监控设备以前发生的故障信息2系

统管理员通过历史故障管理模块,可以查看设备过去的故

障信息,分析设备的存在的故障的原因,对于管理员修复

设备的故障提供了重要信息和科学依据。故障信息支持导

出功能,支持把系统中的故障导出生成文档。

3.3系统消息提醒

在监管平台的使用过程中,需要通过短信、邮件等方式

完成消息的下发,如流程审批提醒、告警故障提醒、资源

状态提醒等,需考具备短信、邮件下发的功能性。系统应

具备单个用户发送、按分组发送、按角色发送等功能。

3.4运维统计报表

以云监管平台中的各种信息为基础,根据监管平台使用

者的需求,实时或周期性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论