网络综合管理系统-技术设计方案_第1页
网络综合管理系统-技术设计方案_第2页
网络综合管理系统-技术设计方案_第3页
网络综合管理系统-技术设计方案_第4页
网络综合管理系统-技术设计方案_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络综合管理系统

技术方案

文档修改记录

版本号修改内容描述修改人修改日期

V0.1建立

VI.0修订

目录

1.项目概况.......................................................1

2.项目建设目标...................................................7

3.系统需求分析.........................................9

3.1.建设技术先进、端到端的集中运维管理平台.....................9

3.2.主动及时地发现问题,扭转被动服务局面.......................9

3.3.n"系统网络拓扑结构的管理分析..............................10

3.4.建立智能的综合监控系统....................................10

3.5.建立智能的趋势运行分析系统................................11

3.6.IT系统性能的监控分析......................................11

3.7.建立综合报表发布平台......................................11

3.8.建立综合的服务器管理机制..................................12

4.综合R"管理系统建设任务........................................12

4.1.建立统一灵活的管理平台....................................12

4.2.建立与管理区域匹配的分级管理模式..........................12

4.3.实现故障信息采集和统一处理................................13

4.4.实现管理流程整合和统一管理................................13

4.5.建立统一的信息展示和运行考核..............................14

5.综合IT管理系统方案选择以及环境要求............................14

5.1.1.方案模块选择........................................14

5.1.2.网络环境要求........................................14

5.1.3.硬件运行环境........................................14

5.1.4.系统运行软件环境....................................15

6.项目方案设计...................................................15

6.1.设计原则.................................................15

6.2.系统架构................................................17

6.2.1.逻辑架构...........................................17

6.2.2.产品架构..........................................19

6.2.3.技术路线..........................................21

6.3.功能设计.................................................21

6.3.1.系统概述............................................21

6.3.2.网络拓朴管理........................................23

6.3.3.真实的背板..........................................24

6.3.4.跨地域的分布式管理..................................24

6.3.5.丰富的网络分析工具..................................25

6.3.6.详细的性能监测指标..................................26

6.3.7.IP地址管理..........................................26

6.3.8.性能管理............................................26

6.3.9.带宽资源监控........................................27

6.3.10.事件管理...........................................28

6.3.11.故障智能告警.......................................28

6.3.12.高效资产管理.......................................29

6.3.13.安全管理...........................................30

6.3.14.告警管理...........................................31

6.3.15.故障管理流程.......................................35

6.3.16.综合报表...........................................37

6.3.17.运行维护管理人员考核管理...........................44

6.3.18.用户权限管理.......................................45

6.3.19.建立数据管理.......................................46

63.20.服务器管理功能....................................46

6.4.系统要求响应............................................47

6.4.1.软件通用设计........................................47

6.4.2.系统特性设计........................................48

6.4.3.系统接口设计........................................52

6.4.4.系统内部集成接口...................................53

6.4.5.与基础运维管理工具的集成接口......................53

6.4.6.与综合运维平台的集成接口..........................53

6.4.7.统一身份认证与单点登录接口........................54

7.方案特点与优势.................................................54

7.1.综合IT管理系统功能优势...................................55

7.1.1.统一灵活的管理平台..................................55

7.1.2.系统适合分布式管理应用模式..........................55

7.1.3.3.1.3适合多用户管理..................................56

7.1.4.3.1.4合理分配网络负载...............................56

7.1.5.3.1.5跨平台管理.....................................56

7.1.6.3,1.6智能的事件管理..................................56

7.1.7.3.1.7采用简单易用、直观的操作和管理..................58

7.1.8.3.1.8智能报表准确反映真实运行情况....................58

7.1.9.3.1.9可定制的管理业务视图............................61

7.1.10.3.1.10监控业务领域全面化............................62

7.1.11.3.1.11具有丰富的接口易于扩展........................62

7.2.综合IT管理系统平台优势...................................63

7.2.1.由面向集中到面向分布................................63

7.2.2.面向设备到面向整体..................................63

7.2.3.系统反应快捷........................................63

7.2.4.强大的扩展性........................................64

7.2.5.适合各种复杂的网络情况..............................64

7.2.6.和原厂网管接口......................................64

7.2.7.强硕的平台级系统....................................64

7.2.8.强大的安全管理措施..................................65

7.3.综合n"管理系统整体价值...................................65

7.3.1.建立统一的信息分析和发布平台........................65

7.3.2.提高信息标准化一一避免信息孤岛......................67

7.3.3.提供决策分析、历史数据分析依据......................67

7.3.4.降低管理成本-提高系统可靠性、可用性.................67

7.3.5.降低管理难度…增加实用性.............................68

7.3.6.实现统一管理,提高工作效率..........................68

7.3.7.实现对全网的统筹规划和管理,提高资源利用率..........69

7.3.8.保障全网健康稳定运行,避免严重系统故障造成损失......69

8.系统培训、维护、升级和二次开发.................................70

8.1.系统培训................................................70

8.1.1.培训体系............................................70

8.1.2.培训组织............................................70

8.1.3.培训理念.......................................71

8.1.4.培训目标............................................71

8.15培训计划安排.......................................72

8.2.系统维护升级.............................................72

8.2.1.远程支持服务流程...................................73

8.2.2.现场服务流程.......................................74

8.2.3.应急维护方案...................................76

8.3.二次开发................................................77

9.系统实施计划..................................................78

9.1.实施步骤.................................................78

9.1.1.实施指导思想.........................................78

9.1.2.实施方案...........................................78

9.2.项目团队..................................................87

9.2.1.项目领导小组........................................87

9.2.2.项目指导小组........................................87

9.2.3.运维总负责人........................................87

9.2.4.总协调人............................................88

9.2.5.项目管理组..........................................88

9.2.6.现场负责人..........................................89

9.2.7.项目软件经理........................................89

10.项目经费预算.................................................92

10.1.项目预算表.............................................92

10.2.项目预算明细表.........................................94

10.2.1.设计费明细表.......................................94

10.2.2.材料费明细表.......................................95

10.2.3.燃料动力费预算明细表(专项).......................96

10.2.4.差旅费概算明细表...................................97

10.2.5.会议费概算明细表...................................99

10.2.6.出版/文献/信息传播/知识产权事务费..................100

10.2.7.测试化验加工费预算明细表..........................101

10.2.8.固定人员费概算明细表..............................102

11.项目进度规划................................................103

12.售后服务及技术支持..........................................104

1.项目概况

作为ABCD-1234信息化基础工程建设的一部分,网络综合管理系统是数据中

心网络设备运维管理和性能监控平台,它从硬件设施和性能的不同层次,采集和

监测网络设备性能信息、网络链路质量信息等指标型数据,并通过可视化方式向

运维管理用户提供管理、维护与监控接口,提供与设备无关的网络设施通用监测

管理平台,在此基础上为网络设备的管理、评估,统计分析和决策支持,帮助定

位故障,预测故障以及上层应用提供服务支持。

经过多年的建设,现有数据中心IT设施已具有一定的规模,各类不同厂商、

不同型号的设备和各种各样的应用系统已上线运行。由于应用的错综复杂,各个

厂商、不同型号的设备都有自己的标准、自己的接口,数据无法得到统一的汇总,

给信息中心的日常管理、维护带来很大的障碍。如何才能保证保证计算机系统及

应用系统的正常运行,并实现高效安全的运转变成了一个艰巨的任务。目前网络

内包含有华为、思科、烽火、Juniper等不同厂商的网络设备以及不同架设有不

同平台的服务器。需要对整体网络、各类操作系统以及网络设备的运行状况进行

监测。对于网管的要求,客户希望对交换机性能及端口信息进行监控,在网络发

生中断或端口有异常的情况下自动向网络维护人员发送告警信息,同时网管软件

拓扑图中相应设备或地点名称有告警显示。

网络综合管理系统提供面向网络传输平台的网络运行态势管理、故障管理、

网络资源管理、网络安全管理、运维力量管理和系统管理等功能,分别针对通信

指挥人员和网络值勤维护人员提供综合网络管理功能。

功能和接口要求包括:

拓扑管理功能,呈现所有网络设备关联关系,可以查看每一个拓扑节点的信

息、在线状态、使用状态、逻辑拓扑和地理分布等信息。

拓扑节点信息展示功能,用户可通过拓扑管理视图查看节点相关信息,如节

点名称、节点所属单位、节点设备型号、节点设备生产厂家、节点IP地址、节

点端口等。

拓扑节点在线状态信息展示功能,用户基于已存在的拓扑视图查看当前拓扑

中所有节点的在线状态,也可以通过导航树上的状态信息判断是否在线。(状态:

1

在线、离线)

拓扑节点使用状态信息展示功能,用户基于已存在的拓扑视图查看当前拓扑

中所有节点的使用状态,也可以通过导航树上的状态信息判断是否在用。(状态:

在用、未用)

逻辑拓扑定义功能,根据相关方式进行定义逻辑拓扑

拓扑图操作功能,拓扑管理提供生成拓扑图的功能,方便用户根据实际情况,

形成自定义的逻辑管理域。拓扑管理提供视图控制功能,进行拓扑表示和拓扑操

作,增强拓扑管理的可操作性。

设备定位功能,根据设备IP、设备MAC、主机名等定位交换机及其端口,

并能在拓扑图中显示其具体位置,达到故障的快速定位。

实时状态监视功能,网络流量等动态信息显示更新等。

性能管理功能,性能管理监测网络传输平台的承载网和综合接入网的运行和

服务质量,并对性能管理信息进行分析处理、存贮,产生输出报表。当性能参数

超过门限时,系统产生告警信息。

性能管理系统功能包括收集、处理和统计网络数据流量、综合接入网接通率

等指标。

网络设备管理功能,网络设备管理可提供一个面向网络传输平台中各承载网

和综合接入网的资源管理功能,提供设备资源、信道资源和文档资源等多种资源

数据采集、汇总和呈现,并对设备资源进行多种形式的分类统计。所有网络设备

通过列表方式呈现,可以对设备进行增加,修改,删除,查询等操作,同时要体

现出网络设备当前的状态信息。

网络设备新增功能,用户可以通过手动方式录入网络设备,对于录入的数据

需要进行前端脚本验证和后台代码验证,当验证通过后方可入库,同时新增的网

络设备会记录到日志中。

可以通过日志将新增的数据进行撤销操作。

网络设备修改功能,用户可以通过手动方式修改网络设备信息,对于修改的

数据需要进行前端脚本验证和后台代码验证,验证通过后修改数据库中的数据信

息,同时修改的网络设备会记录到日志中。可以通过日志将修改的数据进行还原

操作。

2

网络设备删除功能,用户可以选择删除或彻底删除,删除只是逻辑上删除数

据,即数据库中只需修改删除标识即可,对于彻底删除操作的数据,需要从物理

上删除该数据,同时删除的网络设备会记录到日志中。可以通过日志将删除的数

据进行恢复操作。

网络设备查询功能,对网络设备提供根据设备类型、设备名称、设备IP、设

备端口、设备所属单位等信息进行查询。

网络设备列表展示功能,将网络设备信息通过列表方式进行呈现,包含内容

有:编号、设备名称、设备IP、设备主机名、设备类型、设备MAC地址、设备

所属单位、设备当前状态等信息。

网络设备状态维护功能功能,可以通过手动方式对网络设备状态进行修改,

也可以通过重新点名测试获取设备当前状态信息或设备状态信息有变更时会自

动更新设备信息状态。

信道资源管理功能,信道资源管理提供信道资源的采集、汇总、呈现等功能,

主要完成承载网联网、综合接入网等信道相关资源的管理维护操作,提供增加、

删除、修改和查询等功能。

文档资源管理功能,文档资源管理提供文档资源的采集、汇总、呈现等功能,

管理内容主要包括:在通信网络设计、建设、使用、维护过程中设备、信道的文

档资料等,提供上传、下载、删除等功能。

资源分类统计功能,对设备资源进行分类统计,包括设备数量容量统计、容

量分类统计、运行机型分类统计、来源分类统计、运行时间分类统计等,以图形

和表格形式显示,为管理人员准确掌握资源情况提供帮助。

网络设备状态维护功能功能,设备点名测试主要包含:服务器(获取cpu、内

存、磁盘、某端口是否打开等)、路由器(获取接口状态、接口丢包率等)、交换

器(获取接口状态、接口丢包率等)、数据库(获取连接数、性能等)、Web应用服

务器(获取服务在线状态、访问状况等)等

测试计划维护功能、测试记录管理功能、测试实时展示功能、网络访问压力

测试、设备已部署业务系统访问压力测试、压力测试计划维护功能、压力测试记

录管理功能、压力测试实时分析展示功能。

网络安全管理功能,网络安全管理提供网络传输平台有关的非法接入记录管

3

理和综合接入规范性校验管理,并能提供与之相关的配置、查询、汇总、呈现等

功能。

非法接入记录管理功能,提供对非法接入的采集、汇总、统计分析、呈现等,

主要包括非法接入的来源、去向、时段等,为管理人员进一步分析和决策提供支

撑。用户登陆功能(与用户管理子系统对接信息);用户权限验证功能(与用户管

理子系统对接信息);用户信息展示功能(与用户管理子系统对接信息)。

综合接入规范性校验管理功能,提供综合接入规范性校验,发现配置异常或

不符合规范时,产生告警。

专项任务管理功能,专项任务管理主要提供专项任务性能分析、专项任务定

制功能,可以通过专项定制的方式,对所关注的重点区域、重点局进行综合监测

和分析,建立针对专项任务的细粒度监测视图,并可保存、发布。

专项任务性能分析功能,建立流量分析评估指标体系,能够对承载网、综合

接入网流量进行统计分析。

专项任务管理功能,专项任务管理包括专项任务定制、专项任务查询等功能,

能够实时监测承担专项任务的网络流量、接通率和可用率等指标。

点名测试功能,通过点名测试查看被测设备的服务器(获取CPU、内存、磁

盘、某端口是否打开等)、路由器(获取接口状态、接口丢包率等)、交换器(获

取接口状态、接口丢包率等)、数据库(获取连接数、性能等)、Web应用服务

器(获取服务在线状态、访问状况等)等信息。

测试计划维护功能功能,用户可以通过列表方式查看测试计划,测试计划包

含:测试对象、测试内容、测试时间、测试结果等信息

测试记录管理功能功能,对于测试过程中产生的信息,进行统一的记录管理。

提供查询,删除等操作。记录包含内容:测试时间、测试对象、测试结果等

测试实时展示功能功能,用户通过点名测试,可以实时查看当前被测对象的

状态信息。包含信息:CPU利用率、内存利用率、链路通断情况等

运维力量管理功能,运维力量管理主要提供对值勤维护力量的信息综合查询

和统计,同时提供与其他系统的互联互通接口,实现本系统与其他综合网管系统

的资源数据传输,包括资源数据的上报、查询等功能,为综合网络管理系统的资

源动态更新、资源变动情况、规划等功能提供支撑。与其他系统的接口功能主要

4

通过消息中间件实现。

告警管理功能,告警信息以数据列表的形式展示,还提供告警阈值的设置、

根据条件查询告警、告警信息推送等功能。

告警信息阈值设置功能功能,用户可以设置告警信息的阈值,对告警信息进

行一定的过滤。告警信息阈值包含设备在线状态、设备资源使用率(CPU、内存、

磁盘)、网络设备丢包率、网络设备接口状态、数据库连接数、数据库性能、Web

应用服务器访问状态等内容

告警信息查询展示功能功能,用户可以通过列表方式查看告警信息,同时提

供根据告警级别、告警类型、告警时间等条件进行查询。

告警信息实时推送功能功能,当设备产生告警后,将告警信息以可视化的方

式推送至系统显眼部分,同时给予声音提示或者颜色改变等提示。

告警信息详情展示功能功能,用户可以通过点击告警信息列表中详情按钮,

查看告警的具体信息,包括告警对象、告警类型等。

告警上报功能,告警信息实时上报、告警信息实时推送。

历史告警查询统计功能,告警信息查询展示功能、告警信息详情展示功能、

设备信息维护功能、设备信息查询展示功能、设备年度信息图表展示功能(包含

采集类型、告警维度)、设备季度信息图表展示功能(包含采集类型、告警维度)、

设备月度信息图表展示功能(包含采集类型、告警维度)。

告警屏蔽功能,能够按照一定的规则进行相关告警信息的屏蔽。

报警报表功能,可帮助管理员有效地预防或发现故障,警报将通过声音、短

信、显示报警框、发送Mail等方式及时发送相关人员,或自动运行相应的程序

进行故障处理;提供全方位的告警监测、统计分析和报警定位。

统计分析功能,用户通过选择年度、季度、月度、周度、天等不同粒度的条

件对设备信息进行饼状图、柱状图、折线图等图形图表化的统计呈现。

压力测试功能,通过对系统进行网络访问压力测试、系统访问压力测试,让

用户更好的了解系统当前的运行状态。用户可以通过列表方式查看压力测试,压

力测试包含:测试对象、测试内容、测试时间、测试结果等信息,对于测试过程

中产生的信息,进行统一的记录管理。提供查询、删除等操作。记录包含内容:

测试时间、测试对象、测试结果等

5

日志管理功能,日志管理记录系统运行过程中系统的问题信息,监测系统发

生事件,记录系统用户登录登出信息、敏感数据操作、系统异常信息等,以方便

管理员查看系统运行状况。

用户管理功能,用户管理是针对系统用户进行增删改查的一个界面,并且在

页面左边点击部门,可查看部门下的所有人员,以及该人员的角色等信息。提供

登录、授权、验证、用户信息展示、用户信息维护。

时间校准功能,将指定机器的时间与服务器时间进行校准

进程管理功能,用户可以对所有设备上运行的进程信息进行查看,同时提供

模糊查询、杀死进行等操作。

软件分发功能,用户可以将需要的软件发送至某一台或多台机器上。若软件

为压缩包则系统可以自动解压,并删除原压缩包以保证硬盘容量。

远程开关机功能,将每一台设备的状态用表格呈现出来,可对每一台设备进

行开关机操作操作

接口要求功能,支持单点登录接口、网络信息报警接口、网络设备查询接口。

通过集成平台前台界面框架嵌入网络管理系统的设备信息列表界面,展示设备分

类、名称及位置信息以及设备的运行状态等(与外部综合运维平台之间的接口)。

本方案通过网络综合管理项目建设,将做到网络系统故障早发现、早解决,

确保计算机网络的连续、可靠、安全运行,降低发生故障的可能性,提高数据中

心的网络设备运行管理水平和服务保障能力,为相关业务工作提供高效、贴身服

务。具体而言,网络综合管理管理系统应满足如下的管理需求:

1)以业务的角度将传统的技术设备的管理整合到基于业务的管理平台上

来,不仅能完成对网络设备监控的需求同时能满足根据业务的组成定位问题

根源,定位性能瓶颈,预测业务发展趋势和稳定性。

2)采用的技术成熟、先进,并具有较强的集成性和可扩充性的管理平台;

3)解放人力,依靠智能化技术化的管理手段,降低故障发生率,降低维护

成本,并同时提高维护效率。

4)易于使用和维护。管理软件本身的作用就是为了降低运维成本、提高运

维效率。这就要求管理软件本身必须是易于使用和维护的。

5)统一的报告和报表,多台设备性能比较,其它格式导出,柱图、XY坐标、

6

饼图、折线图,定期的运维报告等等

6)系统的自管理,系统的自我管理功能,包括角色管理,权限视图管理,

资源管理等。

2.项目建设目标

加强网络综合管理系统建设,提高网络设备运行管理水平,通过运维体系的

建设,结合构建集中式的服务热线、运维流程、系统监控和综合展示系统,通过

系统联动,及时、准确、全面反映与掌握数据中心各网络设备运行状态,保障各

业务系统的正常运行,应达成如下目标:

需要实现网络管理工作还包括:

(1)网络故障排查。

当出现网络故障时,迅速定位网络故障发生的位置,分析出现网络故障的原

因,解决网络故障,使网络与业务系统运行正常;

(2)新增设备、线路的网络调整

包括新增接入者,新增备份设备与线路时的网络调整;

(3)网络配置的调整。

当网络应用需求变化时,对网络设备如路由器、防火墙、交换机的设置情况

进行调整;

(4)日常巡检。

对网络设备、线路的日常检查利于及时发现网络故障,发现系统入侵,发现

病毒危害等情况;

(5)网络设备管理。

网络在用设备与冷备设备的管理,向总行报送在用设备与备用设备的相关配

置情况,以便于更好地管理网络,例如出现故障时迅速找到替用设备;

7

(6)整体业务情况。

对整体业务设备制定指标健康度,能够直观了解当前业务状况;

(7)强化主动监控,实现集中管理。

以网络设备和网络资源的可用性监控为主线,构建统一集成的网络资源及应

用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成IT

运维管理主动服务的新格局。

(8)帮助定位故障,快速恢复系统运行。

建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当网

络故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系

统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。

(9)掌握运行质量与效率,合理利用资源。

实时了解全部网络资源的负载与使用情况,根据需要从整体角度考虑资源的

使用,同时可以根据业务高峰期的不同来调剂业务系统对网络资源的使用。

(10)规范运行管理,有序开展维护。

参照ITIL规范,对网络运维管理工作进行优化,对服务管理进行改善,将

管理数据电子化,管理过程规范化。根据相关制度进行运行维护管理,对内完善

流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的

工作效率,提高业务技术能力和解决实际问题的能力。

(11)共享运维经验,完善知识库。

把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知

识的共享机制,提供信息共享和交流的平台,提高运维人员的工作效率。

8

3.系统需求分析

31建设技术先进、端到端的集中运维管理平台

在IT运维管理平台系统中,所有系统的用户对系统的操作都将通过接入平

台来完成。从系统用户的视图能看到的是某一种业务,而这种业务在系统中对应

的是跨越系统三层结构的很多环节,任何一个环节出现问题都将导致在用户看来

的系统不可用。因此就要将这些环节作为一个整体,统一加以管理。

在成功实现了上述的管理功能后,就可以对整个IT运维管理平台系统进行

统一、全面的管理,保证数据中心的IT系统网络系统可靠、高效地运行,保证

各个IT系统协调一致的提供更好的服务,实现如下系统管理目标:

能够全面详细地监视系统中所有IT资源的运行情况,提供一致的系统管理

风格

能够实时监视网络和业务的性能状况,能够通过客观数据分析当前系统性能

状况和长期系统性能变化规律和趋势,为系统升级和扩容提供科学的依据。

具有全面而深入的数据库管理功能,保证数据库系统的可靠和高性能运作,

从而使数据库变成最优的后台支撑系统。

提供运营商级IT系统中所需要的各种功能,及集成化的管理模式,可降低

系统管理的成本

机房实现智能管理管理,分析深层次原因等问题

总之,通过实施系统管理,应该把各个IT系统和涉及到的所有计算机网络

资源统一的管理起来,把现在靠经验、靠规章制度进行的管理自动化,减少系统

维护的成本,改善系统可用性和安全性,更好的管理内部系统。

32主动及时地发现问题,扭转被动服务局面

建成信息资源管理平台后,将采用设备主动向监控中心报告故障与监控中心

向设备定时发巡检指令两种形式。以电子巡检代替人工巡检,可以大大缩短巡检

周期。技术人员可以抢在业务人员发现系统故障前知道系统故障并完成系统的维

护任务,改变被动服务的局面。

9

3.3.IT系统网络拓扑结构的管理分析

数据中心的IT系统管理网络拓扑结构的自动生成和管理是一切其他管理的

基础。网络软件不仅应该自动地发现网络中IT资源和设备,形成网络拓扑结构

图,而且应该能够以非常直观的形式反映网络设备之间的网络连接情况、网络线

路的故障和性能状况、甚至网络设备在不同地区的分布情况。

只有这样,网络人员才能简单高效地对网络进行深入的监控和管理,即使对

环境不是很熟悉的人员,也能迅速看出系统的结构和状况。对网络拓扑结构的管

理还应该与具体的IT系统结合,安装不同的业务对网络设备进行分类,建立所

谓的“业务处理视图”。这样,如果某设备或某设备的某些端口发生故障,管理

人员就能轻而易举地确定该故障影响了哪些IT系统,从而根据IT系统的关键程

度确定应首先解决的问题。

拓扑管理应该首先能够让管理者从全局角度了解全行设备运行的情况,如果

某个区域发生问题,则能方便进入到具体发生问题的地方查看实时真实的运行和

连接情况。

实时动态拓扑图通过不同的颜色和图标反映了网络设备不同的状态,当拓扑

图的设备图标或链路图标变红时,网管员就能知道当前这些设备或链路的负载比

较大,需要重点关注这些情况;

34建立智能的综合监控系统

对于运营需求功能的不断加多加深,IT系统的管理功能约来越多,管理者

得到的信息将是海量的,如何分析那些是重要紧急的事件,那些事件需要自己处

理,这些事件之间有没有关联,这些事件背后的运行趋势是怎么样的,要解决这

些问题,单纯依靠管理者的经验是不够的,同时如果完全依靠人工方式

而完成这些工作不应该继续成为用户信息运维管理的负担,因此,智能化是

建设网络管理信息系统一个重要的要求。所谓智能,对于网络管理应用软件来说,

代表着高效的系统分析和处理能力,甚至支持企业战略的实施。具体的智能化就

是需要具备告警的自动压缩、自动合并、自动关联到相关管理者、告警的根源定

10

位以及告警的趋势预警等。

35建立智能的趋势运行分析系统

通过监控系统记录系统运行的各项重要指标,将这些运行指标跟据管理和业

务的需要生成历史运行趋势分析图,帮助运维系统管理人员了解重要的业务系统

在哪些时段,哪些区域会对IT系统资源占用率比较高,规律性的表现在什么地

方,如果业务部门在做业务促销时,IT系统的资源是否能够保障相关联的业务

稳定增长运行。这些都会为数据中心信息管理部门分析业务的健康程度和系统扩

容或改造调整做准确的科学判断依据。

3.6.IT系统性能的监控分析

IT系统性能分析是IT系统管理以至整个系统管理体系非常重要的一个环节。

有些IT系统的故障并不是由于设备或线路的故障引起的,而是由于系统性能问

题造成的。通过性能管理,一方面可以及时掌握性能状况,排除由于性能问题造

成的故障,保障系统的正常运行,另一方面,可以通过对性能的历史分析,调整

网络、服务器配置。

37建立综合报表发布平台

为了提高科技处信息管理部门的服务水平,提高相关业务部门的满意度,

需要一个综合的报表发布平台来发布各项关键业务和关键指标的健康度、可用性

的报表。报表的内容应该包括:系统设备的性能统计、系统设备故障统计、系统

资源使用情况统计、应用统计、服务水平统计报表等。

同时,当要访问报表时,不同部门,不同角色的用户组都有不同的需求,作

为综合的IT监控,平台提供的报表可以让用户很方便的访问和使用大量信息,

通过它可以访问大量数据源一一业务信息系统与交换系统、Excel电子表格、XML

文件,因此用户可以将数据整合,划分和分割,执行高级排列和分类,创建计算

方法,进行复杂的绘图等。

11

3.8.建立综合的服务器管理机制

伴随着信息化建设事业的不断发展,信息中心IT设施已具有一定的规模,各

类不同厂商、不同型号的服务器和各种各样的应用系统已上线运行。服务器承载

着的各个应用系统的运行,如何才能保证服务器及应用系统的正常运行,并实现

高效安全的运转变成了一个艰巨的任务。

4.综合IT管理系统建设任务

IT管理解决方案能对用户所有的网络设备、服务器、安全设备、应用系统

等各种软硬件以及业务系统进行端到端的一体化管理,并克服了其它网管系统只

是提高大量数据而没有业务建模和智能分析展现的弱点,真正帮助用户化繁为

简,解决目前综合IT管理系统遇到的各种问题,解决网络复杂性和人员不足的

矛盾。要实现以上目标,综合IT管理系统建设的主要任务如下

41建立统一灵活的管理平台

IT管理系统实现了三个统一:统一登录界面、统一资源管理、统一展现。

系统从纯C/S(Client/server)或B/S+C/S模式带入到崭新的B/S时代。用户界

面方面提供基于行业标准的纯浏览器B/S(Browser/Server)方式的操作界面,

保证了使用上简单、灵活、方便。

同时基于成熟的网络技术所用的电子签名技术给灵活多样的浏览器界面提

供了充分全面的安全保证。管理者还可以根据自己的使用习惯和不同的管理范围

定制个性化的登陆界面,极大的方便了管理者的使用。

4.2.建立与管理区域匹配的分级管理模式

具有一级权限的管理员登陆到ITMaster后,就能看所有区域的设备运行情

况,包括拓扑、告警、性能分析、报表等;每个二级权限的管理员可以通过WEB

方式方便的登陆到中心服务器上,通过身份验证后,只能管理自己区域内的设备,

完成的管理工作也是在管理员授权范围内的功能,可以是拓扑管理、告警管理、

12

性能分析、报表分析等功能,或其中一项。

43实现故障信息采集和统一处理

即将网络管理、系统管理、安全管理、机房环境管理等功能整合在一起,实

现统一的监控数据采集、一体化的报警数据处理、统一的故障流程处理。逐步建

立一个功能齐全、面向未来的综合网络监控管理平台,以解决由于分别建立多个

专业网管系统而造成互相分割的问题,实现对网络资源集中监控、集中管理和集

中维护,包括全网故障分析和故障定位以及全网性能综合分析等功能。

B

/

S

、S

S网管基础平台总线a

结f

构i

Oracle|应用管理模|主机管理模||网络管理模

SQL、DB2、Sybase、存储管理模

块Agent、块及子网管

Mysqlveblogic、块

webspheredonino_Snr®3^.系统接口

数据库/中间存储应用服务服务器网络桌面终端机房+空调

44实现管理流程整合和统一管理

建立统一网络管理、系统管理、安全管理、机房环境相关的各个业务流,如

值班、工单、资产管理等,形成信息中心运行维护的规范化流程。网络监控子系

统实时监控网络及系统的运行情况,一旦出现异常情况,系统将根据工作流管理

子系统预定的流程,自动生成并派发工单,并根据值班管理子系统的设定,将工

单下达给相应人员。处理人员可以调用知识库子系统的内容,查询以往的历史记

录和处理办法,对本次情况处理提供全面帮助。整个工作完成后,所有操作和记

录自动归档,相关知识自动记录在知识库子系统。同时,统一用户管理子系统实

现对用户的权限管理,资产管理帮助管理员录入资产信息,查询资产使用情况,

加强对IT资源的内部控制;其它系统入口子系统,提供在ITMASTER上访问其它

系统的入口,建立运维管理的统一门户。

13

4.5.建立统一的信息展示和运行考核

我们可以看到,综合的系统管理的目标,已经由进行个别资源监控、系统及

网络管理、应用可用性方面阶段,正向着业务流程的优化方向发展;业务系统管

理工具的功能,已经从数据收集、发现、状态监控、配置管理、实时性能监控,

向着历史数据分析、决策分析、自动响应和高度容错方向发展。综合管理系统应

该根据系统采集的各类数据,开发运行维护的信息管理、网络、应用的信息展示

功能,并与运行管理的绩效考核相结合。综合的系统管理的管理目标和管理功能

也是不断发展、变化的。

5.综合IT管理系统方案选择以及环境要求

5.1.1.方案模块选择

结合目前IT系统管理的需求,满足对网络资源的管理需求,我们选择如下

模块:

基础平台(其中包括:拓扑管理模块、动态背板管理模块网络预警模块、网

络告警模块、性能分析模块、资源管理模块、运行管理模块、系统工具模块、日

志管理模块、报表模块)、网络设备管理节点模块、服务器管理管理模块、、设

备集/地域管理模块、桌面管理系统模块、流量分析模块。

5.1.2.网络环境要求

1、网络设备管理地址允许Ping。

2、需要管理的设备SNMP已经全部配置完成。

3、防火墙、访问列表上<UDP161>端口是允许通过的。

5.1.3.硬件运行环境

为了能更好的完成IT运维管理系统的各项模块功能,我们建议用如下配置

服务器来完成各项功能,具体硬件要求如下:

14

网络系统管理服务器要求

类型指标要求

Cpu2XXEON2.8GHZ二级缓存L2Cache2M

内存4GB

硬盘SCSI硬盘180G

网卡千兆网卡

5.1.4.系统运行软件环境

操作系统平台:

Linux或WindowsXP/2003或Unix

6.项目方案设计

6.1.设计原则

数据中心运维管理平台作为数据中心未来运维工作的核心支撑系统,需要系

统本身具有高可靠、易扩展、易维护等特点,并且在系统功能应用上要具备一定

的技术先进性和实用性。所以,本次项目的方案设计遵循以下设计原则:

(1)规范性

规范性原则规定系统的设计、开发、实施和维护管理必须遵循中国国家标准、

工业和信息化部有关通信行业通用的规范以及通用的国际规范,保证系统的正常

使用。

(2)先进实用

平台注重先进性和实用性的统一,以实用为目的,合理选用各类成熟、先进

技术。在体系结构、功能算法等诸多方面都采用先进计算机技术和理论,应用功

能体现实用性。

(3)可靠性

在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能

15

够7*24安全无故障运行,系统有很好的容错功能;对IT资源的监测应保证不影

响相关设备和系统的正常良好运行,并实现最好的响应效率及最小的资源占用。

(4)安全性

注重安全方面的设计,确保IT运维监控管理平台的稳定、安全运行。系统

要保证数据的安全,不会增加现有应用系统的复杂性,更不会降低现有应用系统

的稳定性。

(5)开放性

采用符合国际国内标准的通用协议,为实现与其他系统监控软硬件互联或接

入本系统进行监控提供接口,支持各种主流计算机平台、操作系统以及数据库厂

商的各类软硬件产品。

(6)可扩展、易集成

系统需具备很好的扩展性,能适应不断发展的业务需求。随着IT资源种类

和数量的扩大,系统也应能适应新的系统的对IT运维管理的需求。系统具备高

度集成性,可以和第三方产品进行集成,进行功能扩展。系统提供开发工具和接

口,方便其他监控系统集成和统一管理。

(7)易用性

易用性原则规定系统在两个方面容易使用。一方面是方便普通的客户,另

一方面是方便客户服务系统的系统管理员。

(8)业务独立性

业务独立性原则规定用户系统的接入部分与业务实现相关的处理部分之间

必须相互独立。

(9)服务位置透明性

在业务逻辑层,所有的应用程序都以服务的形式分布在多台机器节点上,

这些机器节点既可以是同构的,也可以是异构的(不同的操作系统)。在开

发应用时,任何服务中都不能出现有关机器节点位置(如IP地址)和异构平

台的信息。而要实现位置的透明性与平台的无关性。

16

6.2.系统架构

6.2.1.逻辑架构

建设数据中心运维管理体系包括四个层次的工作:

一是实现数据中心数据中心系统的故障信息采集和统一处理。即对网络、服

务器、数据库、中间件、磁盘阵列、应用系统及机房环境进行有效的管理和监控,

将网络管理、数据中心运维管理、安全管理、数据中心基础环境管理等功能整合

在一起,实现统一的监控数据采集、一体化的报警数据处理、统一的故障流程处

理。

二是管理流程整合和统一管理。统一网络管理、数据中心运维管理、安全管

理、IT基础环境管理相关的各个业务流,如值班管理、工单管理、资产管理、

知识库管数据中心数据中心运维系统解决方案理等,形成数据中心运行维护的规

范化流程。

三是统一的信息展示和运行考核。根据资源监控系统采集的各类数据,提供

网络、业务应用的信息展示功能,并与运行管理的绩效考核相结合。

四是实现数据中心运维管理平台向综合运维管理平台系统的数据上报,可以

全盘掌握各子系统软件/硬件设备的运行情况,并生成各种统计分析报表。

数据中心运维管理平台将是一个完整的网络与系统管理、安全管理、数据中

心基础环境管理、运维流程管理解决方案,可以最大限度的保护网络中的投资,

并充分考虑到将来管理需求扩展。其中每一个层次之间的如下图所示:

17

规则管理统一数据显示系统数据交换接口

网络管理应用管理设备管理桌面管理数据接口

(一)对象层

对象层能够管理数据中心信息平台,涵盖了机房动力环境设备、网络设备、

服务器系统、系统应用软件、网络安全设备等。同时系统可以管理由网络设备和

线路构成的多种链路。

(-)系统监测层

监测层包括网络管理、应用管理、设备管理、桌面管理,是监测底层的被管

对象层,实现对网络、主机、存储设备、安全设备、数据库、中间件及应用软件

等IT资源的全面监控管理;同时自动收集、过滤、关联和分析各种管理功能产

生的故障事件,实现对故障的快速定位和处理;对网络和业务应用等IT资源的

性能进行监控,定期提供性能报表和趋势报表,为网络性能优化提供科学依据。

系统监测层通过各类探针获得各类被管对象的数据。采集方式支持多种网络协议

和采集方式,对于不符合标准网络协议的设备,系统提供二次开发的数据采集接

□o采集协议与方式主要包括:SNMP、SNMPTRAP、Agent.WKSocket等。

(三)用户层

用户层是整个系统呈现,是运维管理平台的人机交互接口,系统集中运行展

现提供集中的直观的监控呈现、快速发现和分析各类运行隐患,提供了运行一览、

网络拓扑、业务拓扑、负载分析、告警台、统计分析等多种监测视图,通过集中

18

化的有机的组合各种视图,为不同角色的人员提供完整的运维管理工作界面。运

维服务管理层将人、技术与流程进行有效地融合,实现日常运维工作的自动化、

信息化和标准化。

(四)事件层

事件层的设计目标是通过历史大数据分析,建立起运维知识库。知识库能自

动实现运维知识的积累、沉淀和共享,从而降低IT运维管理对个人的依赖。至

上而下的IT运维管理平台能为IT服务管理提供足够的管理元素,帮助管理者从

不同的角度、不同层面去了解系统运维状况,为领导决策提供科学依据,同时生

成多种工作记录,领导可对IT运维管理人员的绩效进行客观的评估,从而帮助

用户实现对IT服务基础支撑系统的透彻管控。

监测层和用户层通过统一的资源库和子系统接口来进行有机的融合,同时系

统提供了单点登录和统一认证的支持,确保从上到下的操作是必须经过统一登录

认证和操作审计的。其他集成接口系统包括系统数据交换接口和分布式数据采集

接口,通过系统数据交换接口,可以建立多层系统部署的数据交换,同时也可以

和异构系统集成,通过分布式数据采集接口可以实现数据的远程采集。

6.2.2.产品架构

本系统面对用户日益复杂的数据中心环境,整合对网络、服务器与业务应用、

安全设备、和机房基础环境等的分割管理,实现了对数据中心系统的集中、统一、

全面的监控与管理;系统通过融入ITIL等运维管理理念,达到了技术、功能、

服务三方面的完全整合,实现了数据中心服务支持过程的标准化、流程化、规范

化,极大地提高了故障应急处理能力,提升了数据中心的管理效率和服务水平。

19

W

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论