中国电信省级业务平台综合网管系统功能规范1.0_第1页
中国电信省级业务平台综合网管系统功能规范1.0_第2页
中国电信省级业务平台综合网管系统功能规范1.0_第3页
中国电信省级业务平台综合网管系统功能规范1.0_第4页
中国电信省级业务平台综合网管系统功能规范1.0_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国电信省级业务平台综合网管系统功能规范V1.0中国电信集团公司2012年4月中国电信省级业务平台综合网管系统功能规范目录1文档说明51.1编写目的51.2适用范围51.3制定依据51.4起草单位61.5解释权61.6版权62系统综述72.1建设背景72.2系统目标72.3管理范围82.4系统逻辑架构92.5系统功能架构92.6系统性能要求133系统功能要求153.1业务平台数据采集模块153.1.1自动发现功能153.1.2业务平台接口适配153.1.3采集调度管理153.2业务平台运行综合监控功能163.2.1监控管理通用功能163.2.2平台级监控223.2.3业务级监控263.3业务平

2、台运行综合维护功能303.3.1集中业务查询处理303.3.2作业计划自动执行323.4业务平台运行统计分析功能343.4.1统计分析报表功能343.4.2平台网络运行分析353.4.3业务运行质量分析373.4.4专题化分析413.5系统管理423.5.1用户与权限管理423.5.2安全管理433.5.3系统自监控443.5.4南北向接口异常监控报表443.6系统接口功能453.6.1与业务平台数据采集接口453.6.2与集团级网管系统接口453.6.3与短信邮件通知接口463.6.4与集中告警系统接口473.6.5与省10000号服务能力前置模块接口473.6.6与省开通激活系统接口474

3、非功能性要求484.1系统平台要求484.1.1主机平台484.1.2操作系统484.1.3数据库平台484.2系统管理能力要求494.3系统可靠性要求494.4系统响应时间要求504.5存储能力要求504.6用户界面要求504.7可维护性要求514.8可扩展性要求514.9开放性要求514.10安全性要求514.11其它要求521 文档说明1.1 编写目的本规范从业务需求出发,明确了省公司层面的业务平台综合网管系统的管理范围,提出了系统应具备的功能,并提出了对技术层面的基本要求,用于指导中国电信省级业务平台综合网管系统规划和建设。1.2 适用范围本规范适用于中国电信省级业务平台综合网管系统的

4、规划、招标和验收,为系统建设、升级改造、系统演进提供指导和依据。1.3 制定依据本文件的制定依据规范包括:u 【中国电信运维201218号】,2012年省级业务平台综合网管系统建设和应用指导意见;u 中国电信集团业务平台网管功能规范_V1.0。u 中国电信省级业务平台综合网管系统接口规范-省部接口数据接口分册;u 中国电信省级业务平台综合网管系统接口规范-省部接口数据指标集分册;u 中国电信业务平台北向接口通用规范;u 中国电信省级业务平台综合网管接口规范-通用平台设备分册;u 中国电信省级业务平台综合网管接口规范-短信中心平台分册;u 中国电信省级业务平台综合网管规范-短信业务网关平台分册;

5、u 中国电信省级业务平台综合网管接口规范-短信互通网关平台分册;u 中国电信省级业务平台综合网管接口规范-彩信中心平台分册;u 中国电信省级业务平台综合网管接口规范-WAP网关平台分册;u 中国电信省级业务平台综合网管接口规范-ISMP平台分册;u 中国电信省级业务平台综合网管接口规范-ISAG平台分册;u 中国电信省级业务平台综合网管接口规范-UDB平台分册;u 中国电信省级业务平台综合网管接口规范-WAP门户平台分册;u 中国电信省级业务平台综合网管接口规范-彩铃平台分册;u 中国电信省级业务平台综合网管接口规范-IVR平台分册;u 中国电信省级业务平台综合网管接口规范-手机报平台分册;u

6、 中国电信省级业务平台综合网管接口规范-融合支付平台分册;u 中国电信网络运行分析规范-短信产品分册;u 中国电信网络运行分析规范-彩信产品分册;u 中国电信网络运行分析规范-WAP等产品分册。1.4 术语及缩写ISMPIntegrated sevice management platform 综合业务管理平台ISAGIntegrated sevice Access Gateway综合业务接入网关UDBUser Data Base用户数据库MOMobile OriginatedCDMA终端发起的短消息MTMobile TerminatedCDMA终端终止的短消息AOApplication Or

7、iginatedESME发送至短消息中心的短消息FOForward Originated 其他彩信中心发起前转到本彩信中心的流程SPService Provider服务提供商1.5 起草单位本规范起草单位为中国电信集团公司网络运行维护事业部。1.6 解释权本规范的解释权归中国电信集团公司网络运行维护事业部。1.7 版权本规范的版权归中国电信集团公司网络运行维护事业部。2 系统综述2.1 建设背景中国电信业务平台综合网管系统(原“业务平台集中监控系统”)采用总部和省两级部署架构进行部署。2008年以前部分省份建设有固网业务平台网管系统;另外2008年基于原联通C网增值业务综合网管系统进行改造和扩

8、容建设了C网业务平台集中监控系统。随着管理要求的提升,今后针对业务平台的多套网管系统将逐步统一为业务平台综合网管系统,对业务平台实现综合监控、综合维护、综合运行分析。业务平台综合网管系统实现对所有业务平台的集中化、集约化、高效化地运行管理工作,提供对故障的快速发现、定位与解决,实现对业务运行情况的统计分析与多维度考核分析,形成规范化、体系化的业务平台运维管理体系与标准。本规范作为省级业务平台综合网管系统建设的项目指导规范,供各省公司进行省内业务平台综合网管系统建设与规划时提供参考。2.2 系统目标省级业务平台综合网管系统通过直连各省内业务平台实现对省级业务平台的集中化运行监控、维护操作和统计分

9、析等功能。系统管理的业务平台范围涵盖省级C网业务平台、固网业务平台、融合型业务平台(基地平台除外,基地平台纳入集团级业务平台综合网管系统)和省公司云计算资源池(定位于面向内部业务平台服务的资源池)等。省级业务平台综合网管系统的建设目标为“实现集约化的业务网络运行监控和业务保障、打造灵活的业务网络维护管理平台、与集团级业务平台综合网管系统高效联动、支撑集团实现移动互联网产品的高效运营与规模发展”。省级业务平台综合网管系统需要支撑如下八大应用场景:u 支撑业务平台故障的主动发现和快速定位;u 支撑业务运行状况的实时监督和隐患排查;u 支撑增值业务产品的运行分析;u 支撑业务平台的优化、规划与建设;

10、u 支撑10000号客服投诉系统対业务平台侧客户业务信息的查询u 支撑服务开通激活系统对业务平台侧的配置;u 支撑平台维护质量的管理考核;u 支撑对软硬件设备提供商的产品质量考核。2.3 管理范围省级业务平台综合网管系统管理对象与管理内容包括:面向所有省级业务平台涉及的硬件设备、软件设备、业务运行情况的运行监控、故障处理与定期维护、业务运行质量分析与考核。针对每套业务平台,业务平台综合网管系统管理对象为:u 设备层对象:主机、数据库、网络设备、存储、以及其他可管理设备的资源信息、运行状态、运行性能、告警信息;u 业务层对象:关键业务应用进程、关键业务应用端口、业务日志生成情况、话单文件生成情况

11、、双机状态、业务配置资源、业务性能指标、业务告警。各省级业务平台综合网管系统至少完成对省内13套核心业务平台的监控,其他省级业务平台各省依据实际情况进行接入监控。u 短信中心;u 短信业务网关;u 短信互通网关;u WAP网关;u 彩信中心;u 彩铃;u ISMP;u ISAG;u IVR;u 融合支付;u 手机报;u WAP门户;u UDB。2.4 系统功能架构省级业务平台综合网管系统至少要具备对核心的业务平台的数据采集、综合监控、综合维护、综合运行分析功能。要求至少具备的功能架构如下:附图1. 省级业务平台综合网管通用功能架构r 数据采集:u 资源配置数据采集:系统要具备对被管业务平台的设

12、备资源配置数据的采集功能,通过与业务平台的北向接口实现对业务资源配置数据的采集;u 告警数据采集:系统要具备对被管业务平台的设备告警数据的采集功能,通过与被管业务平台的北向接口实现对OMC业务告警数据的采集;u 性能、业务详单数据采集:系统具备对被管业务平台的设备性能数据的采集、通过与被管业务平台的北向接口实现对业务性能统计数据的定期采集、具备通过与被管业务平台的业务详单接口定期采集业务详单数据。r 综合监控:u 监控管理通用功能:系统要提供基础的网管系统的监控管理功能:² 拓扑管理:提供网络连接拓扑、业务平台拓扑、定制化拓扑的功能,能够直观、统一、集中化的呈现业务平台运行情况;&#

13、178; 资源与指标建模:提供面向业务平台的设备资源、业务资源的建模能力,针对各个资源提供指标建模能力。² 资源管理:提供资源对象管理、资源建模、资源属性维护、资源对象关联、资源统计查询、资源数据自动采集接口、资源数据手工录入接口、资源数据批量导入接口、资源变更、资源告警;² 告警管理:提供面向业务平台的设备和业务告警的告警展现、告警规则定义、告警前转、告警传递、告警处理知识库、告警统计查询;² 性能管理:提供面向平台设备和业务性能的性能指标定义、性能门限设定、性能数据计算、性能数据汇总、性能数据统计查询、性能门限告警、性能实时监控等功能;² 配置管理:

14、提供对平台设备的远程登录、配置操作模版管理、配置文件管理等功能;² 大屏幕呈现(可选):提供大屏幕呈现功能,可以通过与大屏幕设备的接口将关注的拓扑、告警、性能数据通过大屏幕进行呈现;u 平台级监控功能:提供面向业务平台的平台设备的监控管理功能:² 服务器管理:提供对服务器设备的资源配置信息、告警事件信息、性能信息、系统进程状态的采集、处理和呈现功能;² 数据库管理:提供对主流数据库的资源配置信息、告警事件信息、性能信息、系统进程状态的采集、处理和呈现功能;² 网络设备管理:提供对主流的网络的资源配置信息、告警事件信息、性能信息的采集、处理和呈现功能;&#

15、178; 存储设备管理:提供对具备管理条件的磁盘阵列、光纤交换机等存储设备的资源配置信息、告警事件信息、性能信息的采集、处理和呈现功能;² 云计算资源池管理(待定):对于云计算资源池,需要等待集团论证后确认本网管系统是都直接管理云计算资源池设备;如果云计算资源池有专门的网管则与云计算资源池网管做接口,如果没有的话则需要直接监控与计算资源池设备。u 业务级监控功能:提供面向业务平台的业务层面的对象监控管理功能:² 北向业务数据接入监控:依照制定的业务平台北向接口规范,定期采集业务平台的业务配置数据和业务运行性能统计指标进行分析;² 业务应用运行状态监控:提供对业务平

16、台应用层面的对象和指标的监控,包括进程、端口、话单文件、日志文件、双机软件等状态的监控;² 关键性能指标准实时监控:按照制定的业务平台北向接口规范,细粒度采集关键的业务性能指标,进行及时处理呈现;² 业务告警集成接入:按照制定的业务平台北向接口规范,通过与被管业务平台的OMC模块实现接口,实现对业务平台的重要级别以上的业务实时告警采集、处理和呈现;² 动态业务性能基线管理:提供对关键业务性能指标的动态告警阈值门限设置功能。r 综合维护:u 集中业务查询处理功能:依照集团制定的北向接口规范,提供对此相关业务平台的部分业务数据查询、业务数据配置功能;u 作业计划自动执

17、行功能:提供对被管的业务平台的日常作业计划的任务配置、调度、自动执行功能。r 综合运行分析:u 提供基础报表统计工具:提供可视化、可定制的报表工具;u 平台网络运行分析:提供面向业务平台设备的资源统计报表、告警统计与趋势分析报表、性能统计与趋势分析报表;u 业务运行质量分析:提供面向业务层面的业务资源配置统计分析、业务性能数据统计分析、业务产品质量分析;u 专题化分析:提供面向运维需求的场景化分析,包括容量规划分析、系统优化分析、集团考核指标趋势分析。r 系统管理:u 提供用户管理、权限管理、安全管理、系统自监控、系统接口异常监控等功能。2.5 与周边系统的关系省级业务平台综合网管作为省级业务

18、平台的集中化管理运维平台,通过与业务平台的北向接口直连省级业务平台网元进行数据采集和操作维护等数据交互。通过与集团级业务平台综合网管的接口定期将集团要求的数据上传到集团系统中。同时省级业务平台综合网管系统需要与省内的外部系统进行横向接口。省级业务平台综合网管与周边系统的关系如下图所示:附图2. 省级业务平台综合网管与周边系统架构省级业务平台综合网管通过北向接口从省内各业务平台上采集告警、性能、详单等数据,并进行配置、激活、查询等操作;省级业务平台综合网管通过省部接口上报省内各业务平台中集团网管系统所需的数据。省级业务平台综合网管通过与集中告警系统的接口上报告警数据,通过与短信网关和邮件系统的接

19、口进行故障通知,通过与10000号的服务能力前置模块和省开通激活系统的接口,承接对业务平台的能力前置和开通激活功能。如果业务平台以后部署在云资源池上的,则需在建立与云资源池网管的接口,实现对业务平台基础设施的监控。3 系统功能要求3.1 数据采集管理网管系统应支持对各种业务平台北向接口的适配功能,实现对资源数据、性能数据和告警数据的采集上报功能。此功能需要强调数据采集的准确性、及时性、全面性,并且各类数据依照相关规范通过不同的采集接口来进行采集。省级业务平台综合网管系统应支持多种接口类型,包括WebService、SNMP、Syslog、WMI、JDBC、JMX、CORBA、Telnet、FT

20、P、JMS、RMI、Netflow等多种协议,能够很好的满足不同设备、不同数据的采集需求。3.1.1 配置数据采集省级网管系统应支持自动发现并采集到被管业务平台的平台设备资源配置数据,包括服务器设备、数据库、网络设备、存储设备。包括设备的厂家型号、设备的接口、基础性能配置(比如服务器的CPU、内存、文件系统等配置数据)。具体配置指标需要依照中国电信省级业务平台综合网管与业务平台互联的接口规范-通用平台设备分册执行。省级网管系统应支持通过与被管业务平台的北向接口实现对被管业务平台的业务资源配置数据的采集。具体配置指标需要依照中国电信省级业务平台综合网管与业务平台互联的接口规范-XX平台分册和中国

21、电信业务平台北向接口通用规范执行。3.1.2 告警数据采集省级网管系统应支持通过部署监控代理(探针)、状态轮询、Syslog等方式实现对平台类设备的告警事件信息的采集。具体告警指标需要依照中国电信省级业务平台综合网管接口规范-通用平台设备分册执行。省级网管系统应支持通过与被管业务平台的北向接口实现对被管业务平台的业务告警数据的采集。具体告警指标需要依照中国电信省级业务平台综合网管接口规范-XX平台分册和中国电信业务平台北向接口通用规范执行。3.1.3 性能、业务详单数据采集省级网管系统应支持通过部署监控代理(探针)、状态轮询等方式实现对平台类设备的性能信息的采集。具体性能指标需要依照中国电信省

22、级业务平台综合网管与业务平台互联的接口规范-通用平台设备分册执行。省级网管系统应支持通过与被管业务平台的北向接口实现对被管业务平台的业务性能统计数据的采集。具体业务性能指标需要依照中国电信省级业务平台综合网管接口规范-XX平台分册和中国电信业务平台北向接口通用规范执行。省级网管系统应支持通过与被管业务平台的接口实现对被管业务平台的业务详单数据的采集。具体采集方式和数据需要依照中国电信网络运行分析规范-XX产品分册执行。3.2 综合监控3.2.1 监控管理通用功能 指标配置网管系统提供可扩展的指标管理功能,可以快速便捷的实现对管理对象监控指标的管理。网管系统应提供监控指标管理功能,

23、能够增、删、改监控指标,设置指标的主要属性。指标管理应具有扩充功能,可以对系统可识别的设备厂商、设备型号建立私有的配置信息属性清单,即只对此种设备生效。对于系统能够自动采集到的指标数据,网管系统可以根据定义好的指标管理体指标的实现监控指标的自动入库和呈现功能。对于不能通过系统自动采集到的指标数据,包括设备关键级别、状态代码、地理位置、生产商、软件类别等维度与管理属性指标,网管系统应提供通过手工录入或者批量导入的方式实现指标数据的录入和呈现功能。 资源管理网管系统应支持采用自动或手工方式采集各被管系统的各种配置数据。当采用自动方式时,应能够随着自动发现的结果,自动生成配置信息。当采

24、用手工方式时,网管系统应提供灵活友好的录入界面,能对已录入的数据进行核查、编辑。应提供建立配置数据间父子关系的功能,实现属性继承。网管系统提供的产品应能够对于能够自动采集的配置数据,要求能够实现定时的采集调度。网管系统应提供诸如业务树图、地理树图、厂商树图的表现方式展现配置信息,并提供按照多维度查询和统计分析的功能,同时,为了实现关联分析和业务拓扑,系统应提供建立配置数据间父子关系的功能,并能够从网络或应用拓扑中通过导航的方式查看配置信息。u 资源对象记录网管系统能够通过自动发现、自动采集、批量导入、手工录入等方式获取初始资源对象数据后,会按照资源对象类的定义创建相关资源实例,并将该资源对象相

25、关的各种属性数据填充进资源属性字段中。资源对象的创建和部分资源属性数据可以通过自动方式进行采集,但还有一部分资源属性数据只能通过手动方式进行维护。诸如设备采购日期、设备到保日期、设备所属部门、设备所处地理位置等。网管系统应提供图形化资源数据维护界面,用户可以方便的对资源属性进行补充。u 资源数据变更网管系统支持设定资源数据采集任务,定时自动对网络中的资源数据进行采集,并对资源管理数据库中的数据进行更新。此外,用户也可以通过图形化界面对资源属性数据进行更新修改。为了有效管理用户资源数据的历史变更过程,以及变更过程中的负责人,网管系统能够对资源修改的用户权限进行控制。并能够形成审计日志及执行修改的

26、登录用户名等信息。u 资源维护计划网管系统应提供资源维护计划管理,定义对某些设备进行定期执行维护的时间,自动在某些时段将这些设备的状态设置为“维护中”,从而在告警管理中屏蔽这类因维护作业造成的告警。网管系统资源维护计划管理还能够对各设备的到保时间进行检索,提前发现即将到保的设备,并形成相关提示信息。提示用户提前为设备续保,避免因为过保而造成损失。 拓扑管理拓扑管理指在网络拓扑图上能够动态、实时显示业务平台网络、业务系统的运行状态。网管系统应支持由管理维护人员对拓扑展示图进行定制。应支持按照物理设备类型、节点、业务类型(如短信中心、网关、彩铃、WAP等)等灵活展示,基本展示方式应由

27、粗到细,例如最上层显示各业务系统的逻辑连接,点开逻辑连接图再显示各设备的物理连接。应支持小地图显示、多窗口显示、全屏显示等。网管系统应能够显示网元之间的相邻关系和虚拟链路,显示节点、业务系统之间的网络层信息流量、流向和业务层信息流量、流向。应能在拓扑图上通过点击右键等查看对象特征(网元名称,网元属性,网元状态如当前告警、历史告警、实时性能、配置属性、联系人等)。拓扑图中应根据采集的配置信息动态显示网元的增加、删除和参数修改。当出现告警时,能从逻辑连接中直观的看到受影响的业务系统,有告警拓扑颜色改变,且能传递到上层拓扑,点开告警后显示具体的告警内容。应提供声音、光、短信等告警通知功能,在出现故障

28、时及时提醒值班人员。拓扑图可以直观以红、黄、绿等颜色呈现各种告警信息,包括故障告警、配置告警和性能告警,如果定义了告警策略,还可以发出告警声音。网管系统拓扑管理功能应支持两类类拓扑:u 网络连接拓扑:提供被管理设备信息及其相互间的连接关系,形成网络连接拓扑视图。u 业务拓扑视图:网管系统应提供按照特定业务平台定义的业务拓扑视图的功能。 告警管理网管系统应能在统一的界面上显示所有被管系统告警信息。网管系统应具备主要业务平台设备、业务的告警信息统一采集处理功能,然后进行集中展示。r 告警数据采集要求应能够实现通过各类告警采集接口,如监控代理(探针)、状态轮询、Syslog、Trap、

29、等方式完成告警数据采集任务。主要的告警数据来源包括:u 业务平台服务器、数据库、网络设备、存储设备产生的告警事件信息;u 通过业务平台北向接口采集到的OMC业务告警事件信息;u 本网管系统性能管理模块的产生的超性能门限告警事件信息;u 本网管系统作业计划自动执行、资源管理等模块产生的告警事件信息。应能通过对采集到的告警数据进行预处理,完成告警格式一致性处理。应能根据网管系统的告警分类规则,实现告警的分类。应能实现告警采集层屏蔽功能,可按照发生时间、告警级别、告警分类、设备类型、设备状态等告警详细信息,可以选择对告警进行入库或者不入库。应具备告警数据本地存储转发功能,当告警处理模块上行数据链路或

30、集中告警处理服务器出现问题时,应能够暂存采集到的告警信息,记录在日志中。r 告警数据处理要求告警处理是针对采集的告警信息进行统一处理,以便快速确认故障,缩短排障时间,为及时恢复业务运行打下良好基础。主要包括告警过滤、告警合并、告警资源信息关联、告警前转、告警操作等功能。u 告警过滤:根据维护管理的实际情况,针对单位时间内发生大量告警或者已知告警,设置过滤规则,过滤不重要的告警信息,减少轻微告警的干扰,以提高监控与处理的效率。告警过滤需要提供灵活的过滤规则,可按告警网元、告警级别、告警类别、告警时间等设置过滤规则。u 告警合并:告警合并是对不同时间产生的相同告警,将其合并成一条告警信息,同时累计

31、该告警的次数,第一次告警发生时间和最后发生时间等。在进行告警压缩时,应只保留一条压缩后的告警信息,应更新告警记录的发生次数、最后发生时间等信息。u 告警资源信息关联:应能够实现与资源管理中资源配置数据的实时关联,对告警信息进行丰富,增加对告警信息的描述,如对于系统告警,增加相应的厂家、型号设备和描述信息等。u 告警前转:系统提供告警前转功能,将告警信息以各种手段(短信、邮件等)转至指定的维护人员,应能够灵活的设置前转条件、告警内容等。u 告警操作:告警操作主要包括告警确认、告警清除和告警级别调整等功能。² 告警确认主要是对告警承载的信息予以认可,以形成有效的告警。系统应产生确认时间等

32、确认信息。应具备批量确认的功能。告警确认应能支持手动确认。² 告警清除主要是对于系统中已经处理完毕的告警信息,设置相关的标志,标记为清除。告警清除应能支持手动清除和自动清除两种方式。² 告警级别调整:系统应能够重新调整告警级别,保证告警处理的正确性。告警级别调整应能支持自动调整。应能够通过组合不同的告警信息字段设置告警自动级别调整规则。r 告警展现要求告警展现是通过告警列表、监控拓扑等方式,对处理后的告警信息进行展现。告警信息展现内容应包括:u 告警基础信息:包括告警标题、告警类型、告警级别、告警状态、告警内容、告警源、设备类型、设备名称、处理操作员、清除操作员、告警发生时

33、间、恢复时间等。u 告警类型:包括告警类型、告警类型描述等。u 告警级别:包括告警级别、告警颜色等。告警展现主要包括以下各项功能:u 告警展现过滤:应能够根据操作人员的维护需求,灵活的定义告警展现过滤规则。应能够通过组合不同的告警信息字段设置告警展现过滤规则。u 告警列表展现:以列表的方式对活动告警信息进行滚动呈现。在告警列表中,告警信息应以不同的颜色来代表不同的告警级别。在告警列表中应能够灵活过滤其需要查看的字段,并可根据字段内容进行相应告警的排序。应能够在告警列表中方便的完成各项手工告警操作,如手工告警清除、告警级别改变以及告警的确认等,且上述操作均需通过日志的形式进行记录。告警列表应支持

34、手工批量的告警确认、告警清除、告警级别调整等功能。u 监控拓扑展现:支持在系统的监控拓扑上呈现告警信息。在监控拓扑的对应对象通过以不同的颜色标识呈现相应的级别告警。可以直接查看到告警的详细信息。应能够在监控拓扑中方便的完成各项手工告警操作,如手工告警清除、告警级别改变以及告警的确认等。 性能监控性能指标反映了系统的运行状况,是判断被管资源运行是否正常的关键信息,性能指标的获取方式应包括主动采集、被动接收和模仿用户行为(如响应测试)等多种。性能的数据来源包括本网管通过监控代理(探针)、SNMP轮询等方式采集到的业务平台设备性能数据,通过与被管业务平台的北向接口采集到的业务性能统计数

35、据。性能管理的功能要求如下:(1)指标管理:指标管理是指对性能指标属性项的管理,包括采集周期、精度、数据类型等属性定义和采集任务的分配与调度等;由于各种性能指标(尤其是业务性能监控指标)的属性不同,要求系统能够灵活调整性能指标模型,具有足够的可扩展性;(2)阈值管理:阈值管理的功能是对阈值进行设定、修改、删除,并能实时生效;阈值可以设定多个级别,阈值可以查询,相同的性能指标针对不同的关键业务监控点可以设定不同的阈值;由于监控指标门限设定各不相同,因此要求对阈值的管理具有足够的灵活性;(3)指标分析:对采集得到的性能指标进行分析,包括历史最高值、最低值、限定时间段的平均值、限定时间段的指标值变化

36、趋势、同一指标不同关键业务点之间的比较等;(4)告警判断:性能指标一旦超出预先设定的阈值时,系统将触发一个告警事件;(5)告警管理接口:向告警管理提供告警信息;(6)历史性能数据处理:性能管理模块应能调度监控手段(数据采集)定时采集指定被管对象的历史性能数据,并对这些历史性能数据进行不同时间粒度的聚合处理,以形成供报表系统展现的性能指标数据;(7)指标展现:在实时性能管理中能够通过图表或表格的方式展现性能指标的变化情况。同时,通过定期采集历史性能数据;(8)应能够提供性能工作区,可将多个被管理对象的多个性能指标按照一定的业务逻辑进行组织和呈现。能够在同一个管理界面中一目了然查看所有与其管理职责

37、相关的性能指标。能够以直观的图形方式实时展现性能状态,能够以红、黄、绿不同的颜色显示性能告警,并且可以直接查看实时性能和历史性能。(9)系统应提供多种形式(如表格、直方图等)的性能统计和性能分析结果显示,向统计分析提供性能指标数据源。系统应提供对性能数据的存储、备份、清除等管理功能。对性能数据进行存储时应进行进一步的收敛性控制,即对持续相同的性能数据,不重复存储。(10)系统应能对所收集的性能数据进行分类统计,对业务平台的网络性能、主机及信令网关性能、业务性能进行历史数据统计、对比。网管系统应具备对性能指标的分析功能。(11)用户可以对业务平台网络/网元的性能数据进行查询,待查询的数据集合可以

38、通过自定义模版的方式确定。3.2.2 大屏幕呈现(可选)对于具备大屏幕呈现设备的省份。省级网管系统可以与大屏幕设备实现接口,可以通过与大屏幕设备的接口将关注的拓扑、告警、性能数据通过大屏幕进行呈现。3.2.3 平台级监控省级网管系统要求至少实现对省内13套核心业务平台的平台级监控功能。涉及的平台包括短信中心、短信业务网关、短信互通网关、WAP网关、WAP门户、彩信中心、彩铃、ISMP、ISAG、IVR、手机报、UDB、融合支付平台。平台级监控要求实现对业务平台的服务器、网络设备、数据库、存储设备实现资源信息、告警事件信息、性能信息的采集、处理与呈现。需要遵循的规范为中国电信省级业务平台综合网管

39、与业务平台互联的接口规范-通用平台设备分册。 服务器监控服务器的监控包括以下各个功能:u 系统资源管理:网管系统能够采集服务器的资源数据,通过综合加工和处理,形成服务器完整的配置信息数据。网管系统的资源管理中应能将所有采集到的资源信息作为主机类的自身属性进行建模,通过与资源占用情况进行综合关联分析,可以为用户进行系统优化和了解设备的处理能力提供准确的数据。u 服务器资源占用监控:服务器资源对象主要指CPU、内存、Kernel、SWAP、文件系统、网卡等,对于每种系统资源对象又都有多个监控指标,系统不仅能够监控CPU总体的占用率、空闲率、用户/系统/IO等待所占比率,还能够提供每个

40、CPU的使用情况监控。网管系统不仅能够监控各个指标的运行情况,还提供了系统健康情况检查功能,能够定时检查系统的CPU、SWAP、文件系统等几个最重要运行指标,并将这些指标放在同一视图中集中展现,维护人员只要一看就能大概的了解系统运行状况。u 系统进程监控:进程监控的主要着眼点有进程CPU时间占用情况、进程内存占用情况、同名进程数、进程状态等,对采用了IPC技术的进程还需要监控其共享内存、信号量和消息队列。支持对UNIX系统进行多进程监控。u 日志文件监控:监控主机的系统/应用日志,系统应提供监控模板定制的功能,可以通过“与、或、非”等方式灵活的组织字符串匹配规则,形成告警。 数据

41、库监控网管系统应支持多种主流数据库的监控支持,包括DB2、Oracle、SysBase、MySql、SQL Server等主流数据库的主流版本的监控管理功能。主要监控内容包括:u 数据库状态:数据库状态监控;u 数据库空间:监控特定表空间性能信息,设定过载阈值。监控各个DBSPACE占用情况;数据库内表空间的读写次数;数据库表空间的利用情况。u 数据库内存分配使用情况:数据库内存使用信息。监控内存段分配情况,设定过载阈值。u 数据文件或数据设备的监控:数据文件或数据设备的读写次数。u 数据库的事务:监控数据库事务情况,设定过载阈值。u 数据库碎片的情况:监控数据库碎片情况,设定过载阈值。u 数

42、据库锁使用情况:监控数据库锁的使用情况,设定过载阈值。u 数据库用户占用资源情况:监控数据库的资源使用情况,设定过载阈值。u 数据库日志:监控数据库日志空间或回滚段使用情况,未备份的逻辑日志数量,设定过载阈值。 网络设备监控网管系统应具备完善的网络设备管理功能,能够支持Huawei、中兴、Alcatel、Cisco、Juniper、F5、Foundry、Radware、3COM等厂商的网络设备和防火墙,网管系统对于网络的管理可归纳为对网络设备、网络接口、网络服务等的监控与管理,实现网络管理的手段主要有状态轮询、SNMP Trap、Syslog、SNMP MIB数据采集、响应测试等

43、。u 网络设备管理:网管系统应默认支持多种拓扑发现,能够自动识别并建立网络设备的厂商型号、CPU、内存、接口,形成设备的实体关系视图,自动发现物理连接情况,并通过拓扑进行直观的展现,以及监控网络设备的端口状态、端口流量等指标。u 网络设备性能管理:对于网络设备的性能监控主要包括CPU、内存等运行参数的管理,还应包含对设备IP层转包率、丢包率、错包率等指标的监控。u 网络设备故障管理:主要内容包括设备状态、性能指标超门限等,数据来源主要是ICMP和SNMP采集。u 网络设备配置管理:网管系统应提供网络设备配置文件管理的功能。提供对配置文件的比对功能。u 接口与链路管理:对于网络接口的管理主要注重

44、性能和故障的监控,支持的实现方式有状态轮询、SNMP Trap和Syslog。u 网络接口故障管理:提供对网络接口状态的监控。u 网络接口性能管理:主要关心的内容有接口流量、接口带宽利用率、接口错包率等指标。u 网络接入管理:网管系统应提供IP-MAC地址邦定的功能进行接入控制。在对网络设备进行自动发现时,可以获取网络内所有节点的IP地址和MAC地址,通过运维人员进行一一确认,可在系统中维护一套合法的IP-MAC地址绑定策略。u 服务响应:网管系统能够管理各类服务,如HTTP/HTTPS、DNS、FTP、POP3、SMTP等,并对这些服务进行可用性和响应性监控。u 网络流量分析:网管系统提供网

45、络上的流量的发布情况。支持Netflow等协议,能够通过接收Netflow包,提供实时和历史的网络流量流向监控功能,提供了准实时的流量流向统计功能,同时也提供了Netflow历史数据统计分析报表。 存储设备监控网管系统应支持对业务平台的存储设备的管理。存储设备必须具备监控管理条件才能实现监控。存储设备管理主要包括磁盘阵列、光纤交换机和备份设备的监控。主要实现对存储设备的资源配置管理、告警监控、性能监控。u 光纤交换机状态监控:包括风扇状态、设备接口状态、电源供应、温度等;u 磁盘阵列和磁带库状态监控:主要状态指标包括控制器、主机连接、物理磁盘组、阵列接口等状态指标。

46、 云计算资源池监控(待定)省级业务平台综合网管系统是否直接实现对涉及业务平台的云计算资源池的监控,集团公司正在进行统一的管理方式和方法的论证,待后期集团确认监控管理方式方法后各省可依照规范执行。如果集团明确云资源需由业务平台网管进行管理,则对于具备云资源池专业网管系统的省,省级网管应与云计算资源池网管实现接口采集相关监控数据进行显示;对于没有云计算资源池网管的省份,省级网管系统可以直接对云计算资源池的设备进行监控。具体监控的内容依据后续集团下发的相关要求进行。3.2.4 业务级监控业务级监控实现对业务平台的业务层面的应用和业务运行的监控。业务级监控要实现对北向业务数据接入监控、业务应用运行状态

47、监控、关键性能指标准实时监控、业务告警集成接入监控、动态业务性能基线管理,通过拓扑呈现、告警流水窗、报表或者定制化的性能呈现界面进行展现。 业务数据接入监控业务数据接入监控是指通过与被管业务平台实现北向接口,采集业务平台的业务配置数据、业务性能统计指标数据。对于省级业务平台的业务级需要遵循对应的业务平台北向接口规范:中国电信省级业务平台综合网管接口规范-XX平台分册。网管系统需要支持按照FTP、DBlink接口规范要求实现对规范的北向接口数据采集。采集到相关的业务数据后,需要进行汇聚处理,然后生成相关的业务资源配置统计报表和业务性能数据分析报表,同时作为其他分析报表的数据来源。北

48、向业务数据需要按照集团的要求通过部省接口定期上传到集团网管系统中,由集团网管系统实现对全网业务运行的汇总分析。 业务应用运行状态监控网管系统需要提供业务应用运行状态监控功能。业务应用运行状态监控主要实现对业务平台的应用软件运行状态实现监控,及时掌握业务应用的运行情况。对于每套业务平台的业务应用运行状态的监控主要监控内容要求如下:u 关键业务进程状态监控:网管系统需要完成对业务平台应用软件的关键的应用进程的调研与监控,监控进程是否存活、是否僵死;生成相应的进程监控拓扑和告警通知运维人员;u 关键应用交互端口状态监控:网管系统需要完成对业务平台的应用软件的内部间、与外部网元间交互的端

49、口状态的监控,生成相关的应用交互端口拓扑和告警及时通知运维人员;u 双机状态监控:网管系统需要完成对业务平台涉及的双机软件运行状态的监控,监控双机软件是否运行正常、是否发生双机切换。生成相关的告警通知运维人员;u 业务日志文件生成状态监控:网管系统需要完成对业务平台是否生成业务日志进行监控,如果发现业务日志文件不生成的话则产生相关的告警通知运维人员;u 话单文件生成状态监控:网管系统需要完成对业务平台的话单文件生成进行监控。要监控是否有话单文件生成、话单文件生成是否连续,以判断是否出现话单丢失。如出现话单文件不生成或者话单文件丢失则产生相关的告警通知运维人员。 关键性能指标准实时

50、监控网管系统需要实现关键性能指标准实时监控功能。关键性能指标准实时监控通过从业务平台北向接口细粒度的采集关键的业务性能统计指标,实现对业务性能的准实时监控,解决北向业务数据接入监控数据时延较大的问题。对于省级业务平台的关键业务性能指标的定义以及采集方式依照业务平台北向接口规范执行:中国电信省级业务平台综合网管与业务平台互联的接口规范-XX平台分册。从业务平台生成关键业务性能指标到上传到网管系统进行处理呈现原则上时延不能大于15分钟。网管系统对于每套业务平台的关键业务性能指标需要实现及时的采集、处理和呈现。要求网管系统需要针对每套业务平台提供关键性能指标准实时监控界面,提供图形化的方式进行准实时

51、监控呈现。省级网管系统采集到的关键业务性能指标需要具备通过实时消息接口的方式上传到集团级网管系统中。 业务告警集中监控业务告警集中监控指通过网管系统与被管业务平台的北向接口采集重要的业务实时告警事件,实现业务平台告警的集中管理功能。此功能需要依照业务平台北向接口规范执行:中国电信省级业务平台综合网管接口规范-XX平台分册。原则上需要业务平台具备业务告警管理模块和接口功能。网管系统需要支持通过SNMP Trap或者WebService等实时消息接口采集业务告警事件数据。-对于采集到的业务实时告警事件,网管系统应能通过系统的告警管理功能进行统一的告警处理和呈现。省级网管系统采集到的业

52、务实时告警中,要求最高级别的业务实时告警需要具备通过实时消息接口的方式上传到集团级网管系统中。 动态业务性能基线管理(可选)动态业务性能基线管理实现对重要的业务平台的关键业务性能指标告警阈值实现动态设定,通过对历史值的计算设定告警容忍范围,实现灵活、可靠、准确的告警性能指标设定。本功能为可选功能。动态业务性能基线的性能指标数据原则上与关键性能指标准实时监控的指标一致。u 主要提供的功能有:基线算法配置:提供了基线算法配置功能,配置好的基线算法供用户进行基线配置时使用。u 性能基线配置:提将配置好的基线算法,结合被管网元的指标进行动态性能基线的计算规则配置。通过基线配置功能,定义应

53、用基线算法的性能指标,定义基线值的计算方式和告警产生方式。u 基线自动计算:系统提供基线自动计算功能,即根据配置好的动态性能基线规则和算法,系统自动从历史性能数据库中选取对应的样本数据进行计算,根据规则生成符合要求的动态性能基线数据。u 基线告警功能:提供通过基线计算产生的动态性能基线数据会和实时采集上来的被管性能指标进行比对,如果超过了预先设置的告警门限值则产生动态性能告警。u 基线数据呈现功能:能够通过基线趋势图直观、形象地展现实时的监控指标与动态性能基线指标的对比变化情况,为相关人员提供决策支持和故障处理的支撑。3.3 综合维护功能3.3.1 集中业务查询处理省级网管系统需要提供核心业务

54、平台的集中业务查询处理功能。集中业务查询处理功能将对业务平台的部分业务数据的查询与配置功能进行统一化、集中化、界面化的管理。原则上要求对业务平台的业务数据的查询与配置功能要通过省级网管系统进行实现,不能直接对业务平台网元进行操作。集中业务查询处理功能需要依照业务平台北向接口规范执行:中国电信省级业务平台综合网管与业务平台互联的接口规范-XX平台分册。网管系统需要针对每套业务平台提供业务配置、查询的可视化界面,用户可通过在界面中输入相关的参数即可实现查询与配置功能。网管系统的并发查询用户数需要遵循对端业务平台的限制要求,如超过对端业务平台的最大并发操作用户数限制时,网管系统应能提示出来。对于每次

55、查询和配置操作,网管系统应该有详细的操作记录以方便进行操作审计。 业务数据查询功能省级网管系统需要依照中国电信省级业务平台综合网管与业务平台互联的接口规范-XX平台分册的规范要求,实现对对应的业务平台的业务数据查询功能。逐步实现省级网管系统作为业务平台网元业务查询操作的统一入口。业务数据查询功能主要查询的业务数据包括黑白名单数据、业务网元配置参数、外部网元互连接口数据、业务监控处理策略、用户业务数据等信息。具体查询数据需要根据各业务平台的北向接口规范进行定义。省级网管的业务查询功能需要依照对应的业务平台北向接口提供图形化的界面,用户可通过输入相关的参数后,业务查询功能自动通过与被

56、管业务平台的接口查询到相关的业务数据信息进行呈现。 业务数据配置功能省级网管系统需要依照中国电信省级业务平台综合网管与业务平台互联的接口规范-XX平台分册的规范要求,实现对对应的业务平台的业务数据配置功能。逐步实现省级网管系统作为业务平台网元业务配置操作的统一入口。业务数据配置功能主要配置的业务数据包括黑白名单数据、部分业务监控处理策略等信息。具体配置数据需要根据各业务平台的北向接口规范进行定义。对于可以进行配置的业务数据,需要依照每套业务平台的规范执行。省级网管的业务配置功能需要提供图形化的界面,用户可通过输入相关的参数后,业务配置功能自动通过与被管业务平台的接口进行相关的业务

57、数据配置,并且呈现配置结果。3.3.2 作业计划自动执行省级网管系统需要针对纳入的被管业务平台实现作业计划自动执行功能。对于每套业务平台的作业计划自动执行功能需要提供:u 主机性能类:CPU、内存、文件系统、SWAP等监控;u 数据库类:数据库主要进程、数据库监听、数据库表空间等监控;u 业务类:业务链路、业务进程、业务日志、业务话单等监控;u 网络设备类:CPU、内存、会话数等监控。网管系统的作业计划自动执行模块应该具备模板管理、任务管理、调度管理、执行结果评价及审核管理、分析统计功能。 模板管理为了灵活管理自动作业计划,系统应提供巡检任务的模板管理功能。模板中可以灵活定制各种巡检命令,提供丰富的自动巡查手段,支持通过多种协议对被巡查对象进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论