IT运维监控系统课件_第1页
IT运维监控系统课件_第2页
IT运维监控系统课件_第3页
IT运维监控系统课件_第4页
IT运维监控系统课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

F8BSM-BM-V4.0系统介绍福莱特信息技术有限公司400-676-3738

189222088102023/10/11福莱特信息技术有限公司1目录福莱特信息技术有限公司2背景目标3结构4功能一、背景信息化技术的发展、企业对业务系统平台的依赖程度越高。行业用户比以前任何时候都更加依赖于网络、IT基础设施以及应用系统来满足其核心业务需要。故此,网络管理与维护对企业的发展也就变得至关重要。在企业网络管理这程中仍存在一些困难与问题,不仅影响了网络管理效率的提高,同时还妨碍了企业的发展:缺少智能分析过滤与自动化处理,导致故障告警泛滥,无法准确定位故障根源;运维人员数量与技术能力有限,故障无法及时恢复和解决;网络规模庞大、设备分散,没有规范性的分级管理;网络环境复杂化与分散化,无法做到集中监控以及实时掌握网络整体运行情况;对IT资源的配置、分布以及性能缺乏了解,造成IT管理与投资方面的盲目性;传统IT管理工具相互不能兼容,造成信息孤岛,网络扩展与升级难、成本高;2023/10/11福莱特信息技术有限公司18922208810400-676-37383二、目标建立以业务为导向的综合监控平台:建立业务系统的可用性、健康性等KPI指标,评价业务系统质量。增加告警、故障对业务影响度分析,快速定位,提高业务故障解决速度。建立标准化、规划化的服务流程管理,提高服务工作效率,提升企业内部和外部用户对维护部门的服务满意度。建立综合、统一的业务视图建立综合的业务指标分析,涵盖:IT基础设施、中间件、应用服务、网络等。实现业务监测的统一管理、统一展现、统一调度。与“传统IT网管”区别:运维工作都是围绕业务系统服务进行的,业务系统运行好坏,成为运维的重要衡量指标,也是使用部门满意度的重要指标。“传统IT网管”面向设备,缺少业务系统监视。三、业务监控管理系统的总体结构各种主机AIXWindowsLinux

文件进程业务监视性能管理采集层配置管理各种网络设备路由器交换机防火墙中间层巡检管理展示层各种数据库及应用

DB2OracleSql

ServerWebsphere

MQNetflowSflowNetsream、、、性能采集告警、日志采集SnmpTrap采集远程命令巡检任务下达流量采集设备控制仿真任务下达性能分析第三方系统告警处理配置管理日志分析流量分析预警分析巡检任务调度仿真任务调度业务仿真流量管理流程管理四、主要功能模块介绍统一接入管理配置管理事件管理性能管理业务流程管理4.1、统一接入管理统一接入:通过业务监控管理的统一的、插件式接入管理,接入所有需要管理资源,包括:网络设备、主机、数据、中间件以及应用等。网络设备接入:CISCO、华为、中兴、3COM、安全网关、防火墙、存储设备等.主机接入:AIX、SUN、SCO、LINUX、HP-UNIX、SUSE、WINDOWS、VMWare

ESX/ESXi等.数据库接入:Oracle、DB2、Sybase、MSSQL、MYSQL、SQL查询等中间件及应用接入:WebSphere、MQ、APACHE、

Tomcat、IIS、TCP、FTP/SFTP、HTTP、POP3、文件、目录等4.2、配置管理资产类型定义支持定义资产树支持定义资产包括那些属性。以及属性的类型。属性可以继承父级资产定义资产维护根据资产属性定义,生成资产维护界面提供资产增加、删除、修改功能资产管理信息配置,以及检测。(例如:SNMP连接信息、SSH连接信息等)资产管理项发现:根据管理配置信息,发现管理项,例如:网络设备包括那些接口,主机包括那些分区等。拓扑管理:包括物理拓扑、业务拓扑、机房拓扑等管理功能资产树维护定义属性字段定义资产包含的属性根据资产定义的属性自动生成配置界面,实现资源动态管理4.2.1、资产类型定义4.2.2、资产维护4.2.3、资产管理信息自动发现自动开启设备数

据采集、可用性、告警管理等自动发现设备管理信息设备配置

设置管理信息配置简单操作方便模块化管理4.2.4、物理拓扑4.2.5、业务拓扑4.2.6、机房拓扑4.3、事件管理屏蔽基础架构层次的复杂性和技术细节,按照业务影响和故障的严重程度,帮助用户一目了然地了解各项业务的重要性和紧迫性,不是简单的把IT事件进行呈现。事件包括:IT事件告警:设备故障、网络接口故障等阀值预警:设置性能指标阀值,制定预警规则,生成预警信息业务告警:根据设备的业务属性,按照业务组织结构分析、查看告警信息传统业务监控的缺陷只能进行进程、数据库或中间件的单点监控不能按照业务的资源组成进行关联分析需要从庞大的告警数据中寻找问题源无法实现对业务流程的监控业务影响分析多点监控,有效的发现业务问题关联业务资源模型,对告警进行向上传递或过滤等策略设置业务的预警和决策支持告警管理告警监视实时告警处理告警认知告警处理告警派送告警清除邮件发送恢复告警恢复告警认知移到历史库历史告警4.3.1、告警处理流程4.3.2、预警管理支持丰富的指标阀值设置,系统采集到的所有指标都可以进行配置,支持按照设备类型的模版配置。所有管理项支持独立的采集启动定义以及可用性定义。管理项

可用性分析1.Title数据采集3.Title阀值预警4.3.3、业务监控cmhk/按照业务系统,展现告警、健康度、可用性。4.3.4、告警通知提供邮件、短信、语音通知方式4.4、性能管理网络设备:实时查看网络设备当前运行状态,包括CPU、内存、网络接口。指标包括:风扇状态、环境温度以及网络接口的指标。链路、链路组:流入、流出、速率、丢包、错包等主机:CPU、内存、SWAP、磁盘、网络接口。提供查看主机当前TCP连接信息、UDP信息,和当前进程信息数据库:包括数据库管理器以及各数据库情况。具体包括:缓存情况、锁情况、排序情况、表空间情况等。中间件:包括JVM、JDBC连接、会话、事务、连接池、Servlet、线程池、事务等各详细指标数据。进程:包括可用性、CPU利用率、占用内存、进程数量等。服务:包括TCP端口、HTTP、FTP等,指标具体包括:可用性、响应时间。Ping检测:对网元设备进行时延丢包和抖动的测试,指标包括:可用性、时延、抖动、丢包。SQL查询:SQL执行结果、SQL执行时间文件监视:文件是否存在,文件大小目录监视:目录是否存在,目录大小,子文件数、子目录数据POP3、SMTP……4.4.1、网络设备性能cmhk/、网络设备端口情况cmhk/4.4.2、服务器监控-linux监控cmhk/2023/10/20福莱特信息技术有限公司24、服务器监控-linux监控(续)UDP信息对于Linux、AIX等UNIX服务器,提供扩展信息检索UDP、TCP信息,包括连接信息以及系统中那个进程使用该连接,点击进程可以查看进程详细信息。当前登录用户信息:可以查看到当前设备、那个用户登录到系统,如:命令(who)磁盘、路由、接口信息TCP信息远端99连接到本地oracle进程号为4152进程4398,命令

tnslsnr启动了

TCP端口1521当前登录用户信息当前磁盘信息路由信息接口信息2023/10/20福莱特信息技术有限公司25、服务器监控-linux监控(续)对于Linux、AIX等UNIX服务器,提供扩展信息处理进程列表,查看到进程以及CPU、MEM等信息。可以进一步提供终止进程操作。提供关机、重启服务器操作。cmhk/4.4.3、服务器监控-Windows监控cmhk/4.4.4、服务器监控-VMWare包含那些主机包含那些虚拟机主机情况虚拟机情况cmhk/4.4.5、服务器监控-Oracle2023/10/20福莱特信息技术有限公司29、服务器监控-Oracle(续)提供扩展信息检索TOPSQL语句,最耗CPU的TOP10,缓冲区取得数最高的TOP10

。回滚段情况、锁情况会话情况,当前有那些连接,来自那些主机最耗CPU的TOP10个SQL语句缓冲区取得数最高的TOP10个SQL语句回滚段情况锁情况来自机器sles215,有26个活动连接,22个非活动连接,点击可以查看详细信息会话情况机器sles215,26个活动连接的详细信息cmhk/4.4.6、服务器监控-MySQLcmhk/4.4.7、WEB服务监控-Tomcatcmhk/4.4.8、WEB服务监控-Apache2023/10/20福莱特信息技术有限公司334.4.9、其他监控-进程2023/10/20福莱特信息技术有限公司344.4.10、其他监控-目录2023/10/20福莱特信息技术有限公司354.4.11、其他监控-SQL查询支持丰富报表定义,包括报表即时查询、日报、周报、月报、年报。可以设置不同的报表模版。4.4.12、性能报表业务服务流程管理包含:工作流、事件、问题、变更、值班、知识库、公告管理。对IT运维提供规范化的流程管理,提升运维工作服务水平以及运维满意度,记录维护中的知识,形成知识库。告警数据根据事件条件,自动产生事件发送到服务台进行处理。4.5、业务服务流程管理为客户和系统事件提供统一的接入点,事件来源包括:IT系统,电话、邮件等接收到事件后,指派人员进行事件处理,跟踪事件处理进度。在相关人员处理完事件后,进行事件处理回访,填写事件处理满意度。4.5.1、受理台事件管理是一个很关键的流程,它首先提供检测事件,然后准确确定正确的支持资源以便尽快解决事件的能力。目标是尽快恢复正常服务运作,并最小化对业务运营的的负面影响,从而确保维持良好的服务质量和可用性级别。4.5.2、事件管理问题管理是对所有未根本解决的问题和已知错误进行管理,并采取主动性预防措施来降低事件数量,重大或紧急事件在处理完后也被定义为问题以分析其产生的根本原因。一般对IT服务影响最大或最占用支持人员资源的事件优先进行分析。4.5.3、问题管理变更管

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论