某公司一体化运维监控方案_第1页
某公司一体化运维监控方案_第2页
某公司一体化运维监控方案_第3页
某公司一体化运维监控方案_第4页
某公司一体化运维监控方案_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

某公司一体化运维监控方案

第1章大型集团企业网络运维的痛点

随着企业数字化转型升级进程的加快,很多大型集团企业的信息

化建设虽已具备良好的IT基础,但同时也导致企业IT系统架构

越来越复杂,新业务系统不断上线,企业内部难以掌握企业内所

有软硬资源的数量、版本、运行状态等信息,大型集团企业运维

面临诸多难题。

面临的具体难题如下:

因建设时期等原因,企业网络中分布着不同时期、不同厂商、不

同型号的IT设备,运维人员需频繁切换不同厂商的管理平台对

其进行管理,难以进行全面高效运维。

常规网络管理工具,缺乏各级网络结构可视化能力,难以全面覆

盖所有网络设施,用户无法掌握网络运行态势。

企业网络中交换机、路由器、VPN、服务器、PC等多种类型设备

并存且相互连接,连接方式多样复杂,难以清晰管理设备间的链

接关系。

网络中出现故障或异常时,因设备品牌、型号、配置等存在差异,

难以快速定位,又因网络结构复杂,难以快速定位故障根因,造

成排障困难。

企业运维过程中,只有当故障已经发生并且造成业务影响时才能

发现和着手处理,日常运维工作多处于“救火”状态,被动地处

理各种故障。

网络设备配置复杂,设备间兼容性差,运维过程中大量的配置变

更和巡检工作以手工为主,效率低、风险大。

企业内部如ERP、CRM、0A办公、项目管理系统等业务系统众

多,业务系统间交叉联动,缺乏合理手段对业务进行全面监控。

企业中IT设备、业务软件、行政资产等数量巨大,种类繁多,

仅靠人工管理难以对其备件、配件信息详细统计,资产的采购、

调拨、报废等管理效率低,难审计。

网络性能、流量、巡检和配置检查的数据多为手工整理,数据分

析统计难度大,效率和正确率较低,难满足更高的运维管理需求。

第2章大型集团企业对运维监控软件的需求

根据企业信息化建设现状和运维难题,往往提出以下基础运维需

求,并希望通过一款产品全栈式运维,满足企业基本需求和支撑

企业进行运维扩张。

⑴全面深入地监控管理

企业既有不同厂商的网络设备,也有各种服务器、软件应用,设

备种类繁多,设备数量巨大,而且设备的管理协议不同,运维部

门期望能用一套软件统一监控起来。

⑵不间断地全程监控

运维部门需要进行7*24的全程监控,故障将要发生前能提前预

警,故障出现时可以立刻通知到管理员,定位到故障环节,快速

恢复系统。

⑶后期扩展设备的支持

对企业来说,新的业务在不断开展,设备和新的软件应用也在不

断扩展,运维部门期望现有的网管软件对未来的扩展也能有较好

的支持。

⑷清楚地掌控设备部署间的关系

设备之间的物理关系、设备与业务的关系,是运维部门进行全局

掌控的基本条件,随着时间的变化、人员的流动、设备的变更、

业务的迁移,导致设备和业务的拓扑关系很难管理。

(5)IT复杂性与管理方便性的矛盾

IT基础设施本身就越来越复杂,技术也越来越高级,面对复杂的

IT设施进行管理,对运维部门技能的要求也将更高。因此对网管

的功能要求也是越来越高,造成网管软件功能操作复杂,难以上

手。

⑹多层次的安全管理

对于企业中的不同部门,需要对不同的部门分配不同的管理权限

以及设备权限,权限的管理分配是运维部门关注的重要指标。

⑺结合业务监控

传统网管监控软件往往只监控网络设备,无法对公司业务情况进

行多层级业务可视化展示和实时监控,难以有效反馈业务运行情

况,因此需要一款产品可深入业务进行实时监控。

⑻成本的控制

运维部门作为服务中心,如何保障IT投资收益,提升IT投资价

值,实现最大的业务目标,是运维部门重点关注的指标。

第3章大型集团企业一体运维监控方案

大型集团企业中,旗下各分子公司通常分别建设数据中心和运维

体系,但随着集团信息化建设的发展,运维需求越来越多样,各

分子公司独立建设运维系统的技术和成本飞速增长,且各级公司

“烟囱式”分散部署的运维系统,难以实现一体化管理与协同融

合。北京智和信通一体化运维监控方案,引入万物互联理念和技

术打造一体化运维系统,为企业信息化、数字化转型奠定基础。

方案通过智和网管平台对管理区域内的各类网络设备进行集中

监控、操作维护和资源配置调度等,实现对网络资源的管理、运

行监测、策略配置、故障管理,并通过自动化运维能力实现故障

资源,对于无法自愈的故障与报修,通过运维工单调动现场运维

人员进行处理,提高企业IT设备资源的可靠性与安全性,保障

企业业务稳定运行,为用户带来更高质量的信息服务。

智和信通大型集团企业一体化运维监控架构

3.L多级架构一体化监控

一般大型集团企业会根据地域、业务等设立多个分子公司、事业

部或办事处,如何建立“一体化”“集中式”的IT运维体系,

保障集团核心网络、业务的持续稳定,降低故障率是每个大型集

团企业必须思考的问题。

在运维管理上,北京智和信通一体化运维监控方案将大型集团企

业网络中的IT设施均纳入智和网管平台中一站管控,避免分散

管理,减少运维成本。采取智能技术,实现网络拓扑可视化的能

力,通过动态智能拓扑实现全网设备、资源、链接关系、IP等实

时更新、快速定位。

大型集团企业网络拓扑示意图

通过按片区、按地域、按层级等多种布局方式划分网络,使用不

同颜色、粗细、图标表示被管理对象的状态信息,助力运维人员

实时了解网络架构及全网运行状态,快速感知资源、链路、流量

等异常信息。

大型集团企业网络拓扑示意图

32全网资源统一监控

通过对大型集团企业网络中海量交换机、路由器、接入设备、无

线AC、AP、摄像头、操作系统、应用、数据库、虚拟化、中间

件、云、存储等智能解析和关联分析,结合全流量采集分析能力,

形成整个网络通信链路的多端网络流量分析链,助力运维人员从

多个维度实现对相应告警的智能分析,解决传统运维监控中关联

数据缺失,辅助排障信息不足的问题。

33虚拟化资源统一管理

方案支持对虚拟化环境下的虚拟机、宿主机等进行全方位运维监

控,全面支持Exi5、KVM>Xen>Hyper・v等,监测指标涵盖物理

机内部虚拟化设备的电源、操作系统、CPU、内存、磁盘等,最

大化利用计算资源,保障虚拟化平台运行稳定。

3.4.云上云下资源统一监控

方案对复杂的多云异构环境、云上云下资源、信创云等进行全面

管理,实现云下服务器、网络设备、安全设备、机房、机柜、专

线、配件等设施,云上各类云服务器、云磁盘等云产品以及各类

IP、NAT、DNS等资源的真正一站式运维,并支持对纳管资源的

快速扩展。

35端到端全链路可视化

方案通过对交换机光口和网络接口的监控,通过数据采集分析,

实现对网络流量和关键连接的预测性维护,从整体维度到局部维

度全面展示大型集团企业网络内IT设备间链路各项指标,整体

可观测、可告警、可分析、可统计。

36弹性扩展,满足网络发展需求

方案支持设备及资源弹性伸缩,满足网络中设备量持续增长及更

新的需求。可对设备类型模型进行扩展,可自定义新设备的类型、

图标、类型识别策略;可对设备资源模型进行扩展,自定义新设

备类型的网口、指示灯、风扇、电源的图标、识别发现策略;可

自定义设备面板图,以拖拽、鼠标操作完成设备面板模板的制作;

支持故障和性能扩展。

37实时故障预警

全面采集大型集团企业网络内所有联网设备,如交换机、路由器、

接入设备、无线AC、AP、摄像头、操作系统、应用、数据库、

虚拟化、中间件、云、存储等状态信息,通过对告警机制以及阈

值的设置,第一时间获取准确的告警信息,快速定位告警设备,

提升告警处理效率,降低因设备故障带来的损失。

38异常事件管理

将事件和告警分离管理,接收设备/服务器主动发送的消息,集

中处理后,及时地通知用户,并可以通过集中的管理界面进行管

理。接收设备/服务器主动发送的消息,极大地提高了管理的主

动性,通过统一界面集中管理事件,降低了管理的难度。

39跨地域自动巡检

传统的人工巡检,尤其是应用巡检,缺乏统一的规范、标准,导

致巡检的范围和深度都存在一定的局限性,并且是基于人工的手

工统计,工作效率比较低,同时耗费较大的人力资源。本方案依

托平台将以前依赖手工进行的日常巡检转换为自动化、定时执行

的巡检策略,日常例行巡检、节假日和重要事件前的巡检均可自

动化执行。

3.10,全网带宽、流量监控与分析

随着大型集团企业信息化建设的加速,其业务、应用层出不穷,

对网络带宽的需求越来越高。正常的业务需要良好的带宽环境保

障机制,避免被一些与业务无关的杂事干扰,影响工作效率。方

案对大型集团企业流量和带宽实时监控,将出入双方向流量情况

可视化展现。基于海量流量数据的存储挖掘,统计分析流量峰值、

谷值、流量趋势、设备流量等数据,为网络流量管理提供数据支

撑。

3.11.全网IP合规监控

对于大型集团企业的IP资产,采取统一数据标准,对整体网络

中的IP和MAC进行梳理和管理,建立健全IP资产台账,端到端

规划、部署、管理和监控IP地址。通过智能IP扫描能力,定义

多层次子网,然后扫描其范围内每个IP地址的当前状态,包括

IP地址,MAC地址等信息,也可以查看IP段内地址使用详情,

便于IP地址分配管理等。

3.12.端到端业务运维体系

随着业务的不断增长,企业内部应用系统也越来越多,如果建设

统一的应用维护、管理体系,将给企业运维管理带来不小的压力。

通过搭建端到端业务监控体系,实现集团业务系统运维管理的主

动化和体系化,通过实时的监测和分析发现系统潜在的问题和风

险,实现主动式运维管理,保障关键业务稳定运行。

大型集团企业业务系统示意图

针对业务应用性能与用户体验进行检测分析,无需安装插件即可

提供开箱即用的主动拨测试业务监测。从前端用户体验、网络延

迟到后端的业务服务和基础架构,全栈溯源为用户提供端到端的

完整全链路数据融合和关联分析,为用户快速发现业务性能瓶颈,

提升用户体验奠定基础。

大型集团企业业务看板示意图

直观、便捷地帮助运维人员对大型集团企业的ERP、MES、LIMS、

CRM、人事管理系统、0A管理系统、项目管理系统、桌面安全、

ITSM、数据存储备份等进行监控,掌握业务的运行状态和健康水

平,了解业务动态变化趋势,快速定位故障源,降低运营风险。

3.13,无人值守的设备远程配置

大型集团企业网络承载的业务经常发生变更,面对业务的变更运

维工程师往往要对大量设备进行操作,此时如果依靠工程师逐一

登录设备进行命令下发、策略配置,将产生大量重复性的工作,

不但导致运维效率低下,也不可避免地产生人为配置错误。

通过智和信通全场景自动化运维方案纳入监控的设备进行单独、

批量的配置操作,设备策略远程配置管理,可以自动批量进行设

备配置修改,并可对设备配置进行备份、对比、恢复,宕机后设

备配置可快速复原,保隙设备及时恢复运行,全面提升配置效率、

质量和安全性通过批量作业并行处理能力,实现多设备并发批

处理操作,将简单的设备控制操作在大批量设备进行执行,并对

执行过程进行监督,对执行结果进行检查。在安全合规的前提下,

将运维人员从整体的变更流程及变更内容的准备中解脱出来,实

现网络变更、设备配置自动化。

多类型多厂商设备支持:

针对不同类型的设备,支持进行各种控制、配置操作。

对服务器/主机/虚拟化,支持一键开关机、进程管理、应用管理、

容量管理等

对交换机/路由器,支持ACL、QoS、流量策略、端口策略等

对安全设备,支持防护管理、认证管理、NAT管理、VPN管理、

内容控制等

对数据库/中间件,支持空间管理、池管理、会话管理、连接控

制等

对传输设备,支持终端管理、链路管理、信号控制、功率配置等

对其他设备,支持结合用户实际场景,通过拖拽流程的方式实现

自定义管控策略

对不同厂商,如Cisco、HP、Nortel、Juniper、3com、D-link、Foundry、

Dell>Proxim>NetScreen>华为、H3C>锐捷、中兴等多家厂商

的网络设备。

3.14.全场景自动化运维

方案将大型集团企业网络运维中涉及的服务、命令、操作、执行

组件化、策略化,将需要进行的运维服务、操作等以组件、策略

的形式托管至平台中进行维护和管理,通过简单灵活地编排能力,

使用者可以选择业务场景所需的策略,通过可视化拖拽的编排方

式进行组合,即可完成应用场景端到端的图形化编排,最后以多

种方式触发执行即可完成期望的运维变更任务,从而实现高效、

稳定、安全的智能运维。

3.15•人工运维与故障自愈结合

将人工运维与故障自愈结合,无需针对告警进行手动处置,只需

预编排告警处理流程,平台根据场景自动触发,实现故障自愈。

通过实时发现告警,进行预诊断分析,判断告警类型和级别,如

果是一般告警,平台进行自动恢复,如果是严重复杂告警则通过

告警通知、运维工单等形式通知运维管理人员,进行人工处理。

同时,将只能由专家处理的各类操作和判断转化为可存在于平台

内的流程,形成可保留可复用的运维知识。

3.16.运维大数据分析

大型集团企业网络设施及各业务系统产生的海量数据无法得到

深层次的应用,管理者决策缺乏数据依据,难以参考各类网络业

务指标、数据等实现对运行态势、隐患风险的实时掌控及运营管

理。

为解决此难题,智和信通大型集团企业监控运维方案利用图形、

图表、图表等易于理解的形式,提取和分析大量复杂的各类运维

数据,呈现分析结果,将全域资源融合展示。从而帮助运维人员

在短时间内更好地理解和获得更多的信息,帮助运维中心能够实

时了解业务和其所依赖IT资源的运行状况,以及提供系统运维

和优化的指示和依据。

大型集团企业运维大屏示意图

3.17.IT资产生命周期监管

对于资产管理,采取统一数据标准,对整体网络资产进行梳理和

调用,避免资产信息在运维系统和实物间的差异,减少网络运维

过程中信息不一致、数据不统一等问题通过平台将资产实物与运

维数据库一一对应,解决网络设备在日常运维过程中出现“脱管”

或“半脱管”的问题。

建立健全资产台账,实现一机一档,通过自定义多级资产分类,

细化资产类别,实现资产分类管控,提高资产精细管理程度。从

资产入库、领用、变更、维修、调拨、到报废处置,资产每一步

操作均实现完整记录,支持追溯,通过平台实现资产整个生命周

期的全流程闭环管理。

3.18.可量化运维工单体系

通过方案实现运维工单“无纸化”,支持于设备和故障管理页面

快速创建工单,把控故障处理进度,通过工单平台简化故障处理

流程,形成自动化故障处理机制,并在每个处理流程的节点上责

任到人,实现在快速响应故障的同时,实现兼顾运维流程管控。

通过建立工单服务基准,预设工单在不同优先级、不同状态时

受理人应该响应的时间及未响应时的处理方式,生成工单自动化

处理规则,并以多种方式进行通知,避免超时响应提升全流程服

务管理质量。

第4章智和信通信创国产化支持

方案涉及的所有产品与模块,均由北京智和信通自主研发,从功

能模块、数据库、界面全部基于统一Java技术平台和统一数据

关系模型,不包含任何第三方功能库。

智和信通提供的信创运维方案,立足于北京智和信通10年的国

产融合经验,与国产软硬件产品深度适配,方案应用覆盖各行各

业。方案支持在中标麒麟、银河麒麟、红旗Linux等国产操作

系统上运行,支持在达梦、金仓、神州等国产数据库进行数据存

储,通过东方通等国产中间件提供对外服务,支持龙芯、申威等

国产CPU架构,并实现对国产化CPU、服务器、数据库、中间

件等IT软硬件设备的综合监控与运维管理。

第5章标杆案例■中国移动北方十三省集中监控运维项目

2010年中国移动通信集团在全国建设了不良信息过滤系统,此

系统由不良信息过滤软件、Windows服务器、Linux服务器、数

据库、分流设备、交换机、存储服务器等构成。

建设范围:中国移动不良信息过滤系统的北方区域:北京、天津、

黑龙江、吉林、辽宁、山东、山西、甘肃、青海、西藏、河南、

宁夏共13个省公司。

设备类型:过滤软件、Windows服务器、Linux服务器、数据库、

分流设备、交换机、存储服务器等

5.1.核心需求

需要一套集中的OMC(操作维护中心)监控软件,对不良信息

过滤系统的所有的设施进行监控。

集中部署OMC,分区域管理:各省市管理人员从Internet登录到

OMC系统,对本省的设备进行监控;

穿透私网:要管理的设备分散在各省公司下不同城市的机房中,

网管服务器无法直接访问各省设备;在北京的中心机房

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论