




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、运维管理系统运维管理系统 方案书方案书 【摩卡软件摩卡软件】 【2008】年年【08】月月 目录目录 目录目录.2 1 xxxxx 需求分析需求分析.4 1.1 环境描述.4 1.2 管理需求.4 1.3 本期管理目标.5 2 方案功能详述方案功能详述.7 2.1 网络拓扑管理.7 2.2 网络性能检测.11 2.2.1 网络设备的管理功能.12 2.2.2 路由器监控指标举例.17 2.2.3 交换机监控指标举例.18 2.3 服务器监测.20 2.3.1 服务器管理功能.20 2.3.2 摩卡代理软件(mram)概述.27 2.3.3 非代理软件(mocha agentless)概述.28
2、 2.3.4 aix服务器监控指标举例.29 2.3.5 window 2003服务器监控指标举例.31 2.4 配置管理.33 2.5 故障管理.35 2.6 告警事件管理.36 2.6.1 邮件.36 2.6.2 短信.36 2.6.3 mocha alert.36 2.7 报表管理.36 2.7.1 报表管理.37 2.7.2 报表分析.37 2.7.3 报表和报告订阅.38 2.8 角色管理.39 2.9 网管工具.40 2.10 管理方式.40 3 方案的典型特点和优势方案的典型特点和优势.43 3.1 开放的体系架构.43 3.2 分布式体系架构.43 3.3 单一代理,资源占用少
3、.43 3.4 可扩展业务流程管理.43 3.5 安全的管理系统.44 3.6 灵活的权限控制.44 3.7 使用与维护简单.45 3.8 良好的扩展性.45 3.9 模块化结构.45 1 xxxxx 需求分析需求分析 1.1 环境描述环境描述 xxxxx 现有的 it 系统,包含 cisco,f5 等多种网络设备,aix、linux、windows 等 各种类型的服务器,以及 oracle、sqlserver 数据库,iis 等。 目前 xxxxx 主要面临以下一些问题: it 应用不断扩大,各种不同的应用和业务系统在网络上运行越来越多,对网络的 依赖越来越大,要求对网络管理的内容日趋增多,
4、包括网络管理、性能管理、应 用管理、使用管理、安全系统等内容 。 网络的规模增大,规划、维护、安全、管理等分工更加细致,管理迫切要求对网 络的使用和维护建立统一的、规范的、体系化的、层次化的服务管理流程 。 多设备、多系统的运行信息、告警信息的多样化,要求对这些信息进行集中化的 管理,进行智能化的分析、统计,得出有利于网络管理和维护的数据,更有效、 更快捷的解决问题 。 1.2 管理需求管理需求 通过对 xxxxx 环境的充分了解和分析,摩卡软件公司认为,xxxxx 运维管理系统应该 包括如下的管理需求: 以业务的角度将传统的技术设备的管理整合到基于业务的管理平台上来,不仅能 完成对设备监控的
5、需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈, 预测业务发展趋势和稳定性。 采用的技术成熟、先进,并具有较强的集成性和可扩充性的管理平台; 解放人力,依靠智能化技术化的管理手段,降低故障发生率,降低维护成本,并 同时提高维护效率。 基于统一、集中的管理体系,统一的数据处理和展现,统一的告警平台。统一的 数据处理和展现,消除各个监控工具之间各自为政、系统管理员在各个界面间频 繁切换的情况,将旧的监控工具的数据和事件统一融入到新的监控平台中来,并 通过统一的展现界面进行展现。统一的告警平台,将所有告警纳入监控管理监控 平台,并通过短信、邮件和桌面客户端统一告警。 易于使用和维护。管理软件
6、本身的作用就是为了降低运维成本、提高运维效率。 这就要求管理软件本身必须是易于使用和维护的。 对主机系统资源的占用比较少的情况下,实现对各种服务器 (aix、linux、windows 等)监控管理。包括主机硬件、操作系统、文件系统、进 程和应用等。主机监控的重点是对操作系统关键指标,如 cpu、内存、进程、文 件系统等进行全面的监控管理,要求不仅能够在状态改变或性能指标超越门限时 生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数 据,以形成统计分析报表; 各种数据库(oracle、ms sql server 等)监控管理,包括数据库的重要配置 参数以及运行状况的监控。主
7、要关注数据库的关键指标,如 sga 使用率、表空 间占用情况、锁竞争和使用情况、缓冲区命中率等; 其它应用的监控管理,支持 iis、tomcat、dns、weblogic、tuxedo 等 实现对某种业务服务水平的管理。通过业务服务管理,可以某种业务在过去一段 时间内的运行状况有一个总体的评价和衡量。 实现 it 资源管理和业务系统的关联,可以从业务的视角进行 it 管理。当某台主 机或者应用发生问题、产生告警时,系统管理员可以在第一时间发现该设备影响 了哪个应用的正常运行。 统一的报告和报表,多台设备性能比较,其它格式导出,柱图、xy 坐标、饼图、 折线图,定期的运维报告等等 系统的自管理,
8、系统的自我管理功能,包括角色管理,权限视图管理,资源管理 等。 1.3 本期管理目标本期管理目标 在保证对现有的网络和系统没有太大影响的情况下,实现如下管理目标: 建立统一的监控管理平台,消除各自为政的局面,消除管理对象之间的差别,消 除数据采集手段的差别,消除管理软件的差别,对各种不同数据来源数据统一处 理、统一展现、统一用户登录、统一权限控制。 建设开放、具有良好扩展性的监控管理平台。监控管理平台应具有很好的开放性, 保证跟相关系统的集成。监控管理平台应具有良好的扩展性,不仅可以满足现阶 段 xxxxx 运维系统管理的需要,未来,随着鄞州业务的不断发展,监控功能添加, 或管理节点数量增加时
9、,监控管理平台也可以很好满足 xxxxx 的需求。 实现针对网络设备的高效管理,包括自动拓扑,设备监控,链路流量监控,网络 性能分析。 实现针对各种小机,pc 服务器的高效管理,包括可用性,性能,配置等管理。 实现监控系统自动产品监控事件,并通过邮件,短信等多种方式第一时间通知 it 管理员。 2 方案功能详述方案功能详述 本技术方案建议书是根据 xxxxx 运维管理项目需求而撰写,介绍了 mocha bsm 运 维管理系统的逻辑架构、部署方式和功能特点。并在分析 xxxxx 运维管理项目需求的基础 上,结合 xxxxx 的运维管理现状及未来管理模式,详细阐述了摩卡公司针对 xxxxx 服务器
10、 管理、网络管理、报表管理、的整个解决方案。 2.1 网络拓扑网络拓扑管理管理 xxxxx 要求能自动发现全网网络拓扑,图形化显示物理拓扑,直观清晰地显示全网所 有骨干网络设备(主要为 cisco、迈普、神码等) 、子网和互联关系 mocha bsm 完全满足 xxxxx 要求: mocha bsm 自动发现全网络的物理拓扑图,并能够自动更新拓扑图。图形化显示物理 拓扑,直观清晰地显示全网所有骨干网络设备、子网和互联关系,支持 vlan、 ospf、mpls 的拓扑。 为了支持网络拓扑的发现,mocha bsm支持主流的lan、wan等网络协议,包括: ip mpls ppp hdlc fra
11、merelay atm 等 作为一个网络管理系统,管理员希望所见到的管理界面是现实世界对象的真实反映。 mocha bsm 内置的网络自动发现引擎,能够快速的发现企业中二层和三层的网络设备,并 根据发现设备之间的关系自动生成全局的网络拓扑结构图。mocha bsm 自动发现时使用 icmp、snmp 这两种协议。网络管理人员能够看到整个运营网络系统的网络拓扑结构,包 括各个分布地区的子网、各个子网之间的网络连接关系、及其每一子网上的资源。经过网 络拓扑结构的生成后,可以在拓扑图上看到整个网络的拓扑结构图,并能直观地看到各个 资源的状态变化。 当网络中的结构发生变化时,自动发现引擎能够迅速的发现
12、并及时调整网络的拓扑结 构图,保证了与实际网络状态的一致。 mocha bsm可以自动发现以下信息: 第二层和第三层网络设备 网络协议,包括 tcp/ip、ethernet、mpls-vpn、fddi、atm、帧中继、令牌环等 设备包含信息(如卡、端口、接口、ip 和 mac) 设备之间的物理连接和逻辑关系 设备连接信息(如电缆、中继、网络连接和 vlan) 通过对网络节点状态的轮询,mocha bsm 可以实时监控网络中所有资源的状态。拓扑 图上所显示的各被管对象的颜色可以直接反映出其内部被监控对象的状态。如绿色表示用 户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误。当我们从表面
13、看到这 些状态信息后,利用与数据库的关联功能可以进一步进入被管对象内部,详细查看到底是 什么因素造成该设备的状态变化。包括链路流量的大小变化,链路使用率的变化,以及包 长,错包率,误包率,arp 包率等信息的变化等。 图表 2.1 自动发现二层网络拓扑图 图表 2.2 自动发现三层网络拓扑图 mocha bsm支持视图管理。当用户网络设备大量增加之后,网络结构异常复杂,用户 的网络拓扑就很难在一个荧光屏上展现或者很难找到想查阅的网络拓扑。 mocha bsm为使网络的展现和管理更适用,支持网络视图功能。管理员可以对拓扑图 的节点进行区域,组或网段的管理,比如按照不同地区,组或网段将设备划分到不
14、同视图 中。同时,对不同视图可分配不同用户的浏览权限。这样可实现资源管理的规范性和高效 性,同时也保证了安全性。 由于有些网络存在某些比如租用的线路,拓扑生成发现不到这些节点之前的实际链路。 系统管理员可以在网络节点之间绘制手工连线,代表节点之间实际存在的链路,并可设置 连线的粗细、颜色、虚线线型来显示此种链路的特殊性。管理员也可根据实际情况删除手 工连线。这让整个拓扑图更加完整。 网络拓扑提供了个性化的设置功能:页面设置,视图管理和权限管理。其中: 管理员可自定义拓扑节点状态的刷新速率 定义节点图标的4种显示大小 为了引起关注,有故障的链路和宕机设备,可以设置闪烁效果。 为更清晰,更直观的展
15、现遍布各省市、全国、全球的庞大的广域网,系统默认提供了 中国、世界地图背景,管理员也可以根据实际的拓扑显示上传相应的图片来更换背景。这 样可以把网络节点摆放到地图上合适的地点,使得网络视图管理更加直观易懂。 图表 2.3 网络拓扑图的视图管理 mocha bsm 支持对网络设备 ping 监控,可监控交换机端口;支持拓扑显示网络设备 的实际流量,支持网络设备流量告警 网络拓扑左键点击设备,通过小工具 的链接,可以直接管理网络设备背板、流量等信息,就和工作人员亲临机房一样 如图:链接到背板管理信息; 2.2 网络网络性能检测性能检测 mocha bsm 可对网络设备、服务器、pc 的端口出入流量
16、、丢包、错包率、链路出入 流量及丢包、错包率、ping 延时及丢包率、cpu、内存利用率做出全面的监控和分析。 图表 2.4 网络设备性能参数设定 1 图表 2.5 网络设备性能参数设定 2 2.2.1 网络设备的管理网络设备的管理功能功能 mocha bsm 对网络设备的管理,不仅仅局限在网络设备本身。mocha bsm 网络管理 模块除可以实时监控网络设备自身的 cpu 利用率、网络设备内存利用率、网络设备端口通 断等自身的指标外,还可以从更低层次、更细粒度来监控网络设备端口的情况,包括端口 的名称、操作管理状态、接口发送接受速率、端口的 icmp 包率、端口的通断信息、端口 的发送接收包
17、率等等,并产生报表,以各种方式展现。mocha bsm 对网络设备的可用性监 控以红、绿、黄、灰 状态灯展示,管理员可以一目了然地看到发生故障的设备及当前接口 的性能。 图表 2.6 网络设备端口的流量 图表 2.7 网络设备信息 mocha bsm 支持网络链路监控。对网络设备的可用性的监控的同时,设备之间的链路 可用性的可视化管理更直观的展示了网络设备的运行状态。链路的畅通与否以红、黄、灰、 绿四种状态显示,根据这些状态,管理员可直观地看到故障发生的范围所在,大幅度减少 查找故障的工作量。 图表 2.4 网络链路监控 同时,mocha bsm 支持对网络设备日志的收集和处理,当网络设备产生
18、日志后,可以 发送给 mocha bsm,并经 mocha bsm 统一处理后产生告警。 通过产品的二次开发,可以实现网络设备真实设备面版图查看,设备面版视图可以拖 动、缩放,同时支持多张设备真实面版图同时查看,支持在面版图界面上直接显示设备端 口所属 vlan,能够提供网络设备端口下联设备列表。 支持网络设备的 top n 排名。设备 cpu、内存、端口的速率、流入/流出量、利用率 等指标可以进行统计排名,并以 topn 的形式展现。 为方便在复杂的网络拓扑中查看某些设备,mocha bsm提供了灵活的设备搜索功能, 用户可以定义多种搜索条件来查找网络设备。搜索的条件包括:设备名称、ip地址
19、和设备 类型。并且可以将设定好的查询条件保存起来便于以后的搜索。通过搜索,网络管理人员 可直接查看特定的服务器或网络设备的运行状态、性能状况,对网络的资源状况有一个细 致的了解。 mocha bsm 网络监控模块支持 ip 地址和 mac 地址定位功能,当网络中某一台主机 感染病毒,需要断开网络时,mocha bsm 的 ip 地址定位可以通过主机的 ip 地址查找到该 主机连接的网络设备端口号。由于 mocha bsm 系统中已经有 ip-mac 地址-网络设备的对 照表数据,所以 mocha bsm 还支持 ip-mac-设备端口绑定,支持全网 ip 定位等功能。 图表 2.5ip 地址、
20、mac 地址定位 mocha bsm 网络监控模块支持网络设备的配置变更,当网络设备的配置发生变化,比 如 cpu、内存、端口数目或者 startup config 文件发生变化时,mocha bsm 会自动发现并 告警通知用户。针对网络设备的配置备份,可根据具体的设备二次开发实现。 mocha bsm 通过底层关联来展示网络设备的性能和该设备在网络拓扑中的位置。当浏 览一台网络设备的性能时,可以通过定位功能迅速查找到这台网络设备在网络拓扑中的位 置。反之亦然。 网络设备发现和监控需要开放设备的 snmp,mocha bsm 支持标准的 snmp 版本包 括 snmp v1,snmp v2c
21、和 snmp v3。 mocha bsm 支持网络的根本原因分析,当网络中某一台网络设备发生问题影响其它的 网络设备时,mocha bsm 可以找到根本原因。 mocha bsm系统的网络设备性能管理,可以查看网络设备端口流量、利用率等监控指 标的历史性能数据。 图表 2.6 网络性能管理 网络的历史数据记录与分析管理:通过mocha bsm的报告功能,可以订阅关注设备的 性能、可用性报告。 2.2.2 路由器监控指标路由器监控指标举例举例 资源指标类别指标名称(67 个)英文名称 可用性指 标 网络设备在线可用性network device availability cpu 平均利用率avg
22、 cpu percent utilization 内存利用率memory percent utilization 网络设备内存池占用容 量 total used memory 网络设备内存池可用容 量 total available memory 总接收吞吐量receive throughput 总发送吞吐量transmit throughput 吞吐量throughput 丢包率discard packets per second 所有接口接收的丢包数receive discard packets per second 所有接口发送的丢包数transmit discard packets p
23、er second 接收和发送 icmp 包率 receive & transmit icmp packets per second 发送的 icmp 包率transmit icmp packets per second 性能指标 接收的 icmp 包率receive icmp packets per second 网络设备的 oidos id 连续运行时间uptime 网络设备说明network device info 交换机下的 ip 地址contained ip 信息指标 网络设备 mac 地址mac address cisco config 状态cisco config status
24、cpu 个数no. cpu 内存总容量total memory capacity 网络接口个数no. nic ip 地址ip address router 配置指标 网络设备名称network device name 性能指标cpu 利用率cpu percent utilization cpu 名称cpu name cpu( 子资源) 信息指标 cpu id 号cpu frequency 管理状态management status可用性指 标操作状态operation status arp 包率arp packet per second 接收的 arp 包数receive arp packet
25、s per second 发送的 arp 包数transmit arp packets per second 单播包率unicast packet per second 接收单播包数receive unicast packet per second 网络接 口(子 资源)性能指标 发送单播包数transmit unicast packet per second 发送利用率transmit percent utilization 发送的丢包数transmit discard packets 发送的错包数transmit error packets 发送速率transmit velocity 广播
26、包率broadcast packet per second 接收的广播包数receive broadcast packet per second 发送的广播包数transmit broad packet per second 接收利用率receive percent utilization 接收和发送利用率总和interface receive & transmit percent 接口累计接收和发送的 包数 accumulative interface receive & transmit packets 接口累计接收的包数accumulative interface receive pac
27、kets 接口累计发送的包数accumulative interface transmit packets 接收的丢包数receive discard packets 接收的错包数receive error packets 接收速率receive velocity 组播包率multicast packet per second 发送组播包数receive multicast packet per second 接收组播包数transmit multicast packet per second 接口带宽bandwidth 网卡 id 号nic id 接口名称nic name 索引index 接
28、口类型type 接口带宽bandwidth 信息指标 mac 地址mac address 可用性指 标 链路可用性link availability 链路名称name 链路 id 号id 所属网络接口nic 链路 (子资 源)信息指标 目标 iptarget ip 图表 2.7 路由器监控指标举例 2.2.3 交换机监控指标交换机监控指标举例举例 资源指标类别指标名称英文名称 可用性指 标 网络设备在线可用性network device availability cpu 平均利用率avg cpu percent utilization 内存利用率memory percent utilizati
29、on switch 性能指标 网络设备内存池占用容 量 total used memory 网络设备内存池可用容 量 total available memory 总接收吞吐量receive throughput 总发送吞吐量transmit throughput 吞吐量throughput 丢包率discard packets per second 所有接口接收的丢包数receive discard packets per second 所有接口发送的丢包数transmit discard packets per second 接收和发送 icmp 包率 receive & transmit
30、 icmp packets per second 发送的 icmp 包率transmit icmp packets per second 接收的 icmp 包率receive icmp packets per second 网络设备的 oidos id 连续运行时间uptime 网络设备说明network device info 交换机下的 ip 地址contained ip 信息指标 网络设备 mac 地址mac address cpu 个数no. cpu 内存总容量total memory capacity 网络接口个数no. nic ip 地址ip address 配置指标 网络设备名称
31、network device name 性能指标cpu 利用率cpu percent utilization cpu 名称cpu name cpu(子资 源)信息指标 cpu id 号cpu frequency 管理状态management status可用性指 标操作状态operation status arp 包率arp packet per second 接收的 arp 包数receive arp packets per second 发送的 arp 包数transmit arp packets per second 单播包率unicast packet per second 接收单播包
32、数receive unicast packet per second 发送单播包数transmit unicast packet per second 发送利用率transmit percent utilization 发送的丢包数transmit discard packets 发送的错包数transmit error packets 发送速率transmit velocity 广播包率broadcast packet per second 接收的广播包数receive broadcast packet per second 发送的广播包数transmit broad packet per
33、second 接收利用率receive percent utilization 接收和发送利用率总和interface receive & transmit percent 网络接口 (子资源) 性能指标 接口累计接收和发送的 包数 accumulative interface receive & transmit packets 接口累计接收的包数accumulative interface receive packets 接口累计发送的包数accumulative interface transmit packets 接收的丢包数receive discard packets 接收的错包数
34、receive error packets 接收速率receive velocity 组播包率multicast packet per second 发送组播包数receive multicast packet per second 接收组播包数transmit multicast packet per second 接口带宽bandwidth 网卡 id 号nic id 接口名称nic name 索引index 接口类型type 接口带宽bandwidth 信息指标 mac 地址mac address 可用性指 标 链路可用性link availability 链路名称name 链路 id
35、号id 所属网络接口nic 链路(子资 源) 信息指标 目标 iptarget ip 图表 2.8 交换机监控指标举例 2.3 服务器监测服务器监测 该项目,xxxxx 提出:支持对 windows、linux、aix、unix 操作系统,对主机系统 的 cpu、mem 利用率、网络端口流量、文件系统利用率、磁盘 io、应用进程服务情况、 系统服务、服务器集群、操作系统及应用系统日志的监测 mocha bsm 完全满足需求 2.3.1 服务器管理功能服务器管理功能 mocha bsm 支持多种不同的操作系统,包括以下: windows 2000,windows xp,windows 2003
36、server aix linux(suse linux、redhat linux、redflag linux 等) sco unixware、sco openserver solaris hp-ux mocha bsm 通过 mram 代理软件或者 mocha agentless 无代理监控,能够实现对 aix、windows、solairs、red hat linux、hp-ux 等各种操作系统关键资源的自动监控,帮 助管理员及时发现故障和故障隐患。 mocha bsm 针对服务器监控提供的核心功能包括: 1)服务器运行情况的实时图形化展现,即摩卡软件公司的专利技术 mocha vm, 通过
37、图形的方式实时展现服务器运行情况。展现的内容包括,多个 cpu 中每 个 cpu 的利用率、物理内存利用率、虚拟内存利用率、进程运行情况、网卡 流量等等。 图表 2.9 服务器可视化监控图 2)针对 cpu 的监控,监控 cpu 的 1 分钟、五分钟和 15 分钟的 cpu 负载,监控 cpu 用户态使用时间、cpu 系统态使用时间、cpu 等待 io 的时间和 cpu 空 闲时间等,当 cpu 的使用率超过阈值时,产生告警通知。针对 cpu 瞬时增高 的问题,mocha bsm 提供了 flapping 技术,用户可以自己定义 flapping 的值, 保证 cpu 在确实已经多次超过阈值的
38、情况下产生告警。 图表 2.10 cpu 监控可视化监控图 3)针对内存的监控,mocha bsm 提供了内存利用率、交换空间利用率、交换空 间大小、交换空间使用情况、内存页交换速率、内存错页率、内存页面调进速 率、内存页面调出速率等指标来监控物理内存、虚拟内存、以及系统页面调入、 调出情况。当这些指标超过预先设定的阈值值,产生告警。 图表 2.11 内存监控可视化监控图 4)针对磁盘的监控,mocha bsm 通过分区利用率、分区容量、磁盘分区利用率、 硬盘容量等指标监控硬盘和分区的使用情况,通过硬盘读速率、硬盘写速率、 硬盘平均读速度和硬盘平均写速率等指标监控硬盘的使用情况。 图表 2.1
39、2 磁盘监控可视化监控图 5)mocha bsm 提供对进程的进程名称、进程 id、父进程 id、运行该进程的用户、 进程优先级、运行终端等的监控,其中有运行权限的用户可以修改进程的优先 级和杀死进程。mocha bsm 还提供对进程运行状态的监控,这包括进程活、 进程死、进程 sleep、进程等待等状态。当进程启动或者僵死时,产生告警, 通知系统管理员。 图表 2.13 进程监控可视化监控图 6)mocha bsm 提供灵活的监控策略批量监控服务器,并可以灵活定制监控指标 的阈值,产生事件的严重程度和紧急程度,事件的接受人等。 图表 2.14 策略管理定制监控指标图 7)mocha bsm
40、提供统一的监控界面监控所有的服务器,通过统一的界面展现服 务器的状态和监控指标的状态,并可在服务器状态和具体监控界面之间来回切 换。 mocha bsm 对于各类操作系统提供了大量的资源模型: 服务器状态 cpu:监控系统 cpu 的占用情况,如 cpu 的利用率等 硬盘:磁盘活动时间、磁盘读写速率等指标 内存:监控系统内存的状态,内存占用率等 文件系统:实时监控文件系统的利用率,如根文件系统、var 文件系统、tmp 文件 系统、应用文件系统等。 虚拟内存:监控虚拟内存的总量、利用率等。 进程:监控所有重要的进程的启动、停止和状态改变情况。 网络:监控服务器网络端口的丢包率、利用率、发送速率
41、等指标。 日志:监控 unix 系统的 syslog 日志和 window 的 event log。 端口:ftp 端口、dns 端口等 mocha bsm 通过连续监视重要系统资源,自动检测瓶颈问题和潜在的问题,同时对事 件主动做出反应,来帮助管理大型的异构环境。它扩展了现有关键业务服务器的监视能力, 能够帮助您实施智能化管理,在终端用户受到影响之前发现问题。 图表 2.15 服务器监控图 mocha bsm 可视化监控提供灵活强大的个性化监控 定制监控内容 用户能根据需要定义在首页看到关注的资源。 图表 2.16 定制监控内容 定制监控频率 根据硬件情况通过设定不同的监控频率,在满足用户响
42、应速度要求的同时,占用最少 系统资源。 图表 2.17 定制监控频率 定制指标阈值 图表 2.18 定制监控阈值 2.3.2 摩卡代理软件(摩卡代理软件(mram)概述)概述 图表 2.19 代理软件结构图 mram 代理软件是安装在被管理主机的轻量级的代理软件,它完全采用 c 语言实现, 因此具有极高的运行效率,是真正意义上的“c-agent” 。跟其它厂商的代理软件相比, mram 的系统消耗的资源更少,对网络通讯的影响更小,且具有以下显著特点: 只有一个 agent,不同的应用监控通过不同的 plug-in 来实现。对一台主机,不管运行 几个应用,对这台主机的监控,只需要一个 agent
43、 代理软件,对不同应用的监控,通 过不同的 plug-in 来实现,oracle 监控,需要通过 oracle 监控的 plug-in,对 db2 的监 控,需要通过 db2 监控的 plug-in。 提供安全的数据加密。mram 代理软件和服务器之间通讯采用 ssh 通道加密技术, 确保了数据的安全性。同时由于数据传输之前要经过加密压缩,所以在网络中传输的 数据量更少。 支持请求者身份判断与权限判断。mram 代理软件支持请求者身份判断和权限判断。 只有当请求者经过 mram 允许,并且有请求数据的权限时,mram 才会响应。 支持 event log、syslog。window 主机的 e
44、vent log 和 unix、linux 主机的 syslog 反 应了系统的运行状况,可以及时反应系统运行中的问题,mram 支持 event log 和 syslog 日志的关键字检索功能,用户可以定义自己关心的关键字,当日志中出现相应 的关键字时,mram 产生告警。 对资源的自动发现功能。某一台主机上安装 mram 代理软件后,mram 自动发现和 识别系统中有多少硬盘、多少分区、多少网卡等,并自动对其监控。 远程部署、管理功能。mram 提供了远程安装的部属工具,系统管理员通过部属工具, 不需要到每一台主机上安装 mram 代理软件,通过远程部属即可实现对 mram 的安 装。 图
45、表 2.20 摩卡远程部署工具 2.3.3 非代理软件(非代理软件(mocha agentless)概述)概述 mocha agentless 无代理监控技术是真正的无代理,不需要在被管理的主机或者应用上 安装任何的软件。mocha agentless 代理技术采用多种采集方式达到对主机、应用和数据库 的监控,这些技术包括: wmi perfmon http/https sql*net ping dns snmp secure shell (ssh) telnet jdbc odbc 等 对于重要性相对较低,不需要进行全面监控、只需要了解大体运行状况的主机,我们建议 采用 agentless
46、监控方式。 2.3.4 aix 服务器监控指标举例服务器监控指标举例 资源指标类别所有指标英文名称 可用性指 标 主机在线可用性host availability cpu 平均利用率avg cpu percent utilization cpu 平均负载(15 分钟)cpu load average (15 minute) cpu 平均负载(5 分钟)cpu load average (5 minute) cpu 平均负载(1 分钟)cpu load average (1 minute) cpu 用户模式百分比cpu user mode (%) cpu 空闲时间百分比cpu idle mode
47、 (%) cpu 系统模式百分比cpu system mode (%) 内存利用率memory percent utilization 内存页面调进速率pages in 内存页面调出速率pages out 硬盘平均写速率avg write velocity 硬盘平均读速率avg read velocity 分区平均利用率avg partition percent utilization 接收和发送的 icmp 包率 receive & transmit icmp packets per second 等待处理队列processor queue length 主机总内存容量total memor
48、y capacity 主机总可用内存容total available memory 主机已经使用的内存容量total used memory 内存错页率page swap velocity 内存页交换速率percent page fault paging space 利用率paging space percent utilization 分区总容量total partition capacity 分区总可用容量total available partition 发送的 icmp 包率transmit icmp packets per second 接收的 icmp 包率receive icmp
49、 packets per second unix 主机 信息指标主机操作系统的 oidos oid 主机操作系统operating system 主机操作系统版本os version 连续运行时uptime 主机说明host info 系统 spos sp 进程数processes 僵死进程数hanged process 线程数threads 当前在线用户数users paging space 总大小total paging space capacity paging space 已用大小used paging space capacity cpu 个数no. cpu 内存总容量total m
50、emory capacity 硬盘个数no. disk 网卡个数no. nic mac 地址nic type ip 地址ip address 主机名host name 分区个数no. partitions 分区总容量total partition capacity 硬盘总容量total disk capacity 配置指标 主机的所有 ip 地址all ip 性能指标cpu 利用率cpu percent utilization cpu id 号cpu id cpu 名称cpu name cpu 频率cpu frequency cpu(子 资源)信息指标 cpu 型号cpu type 硬盘读速率
51、read velocity 性能指标 硬盘写速率write velocity 硬盘容量disk capacity 硬盘 iddisk id 硬盘(子 资源) 信息指标 硬盘名称disk name 分区总可用容量total available partition capacity 性能指标 分区利用率partition percent utilization 分区容量partition capacity 分区名称partition name 分区(子 资源) 信息指标 分区 id 号partition id 管理状态management status可用性指 标操作状态operation sta
52、tus 发送利用率transmit percent utilization 发送利用率transmit discard packets 发送的丢包数transmit error packets 发送的错包数transmit velocity 网络接口 (子资源) 性能指标 发送速率receive percent utilization 接收利用率interface receive & transmit percent 接收的丢包数receive discard packets 接收的错包数receive error packets 接收速率receive velocity 接口带宽bandwi
53、dth 网卡 id 号nic id 接口名称nic name 索引index 接口类型type 接口带宽bandwidth mac 地址mac address 信息指标 ip 地址ip address 图表 2.21 aix 服务器监控指标举例 2.3.5 window 2003 服务器监控指标举例服务器监控指标举例 资源指标类别所有指标英文名称 可用性指标主机在线可用性host availability cpu 平均利用率avg cpu percent utilization cpu 非空闲模式百分比cpu non-idle mode (%) cpu 中断时间百分比cpu interrupt
54、 mode (%) cpu 特权模式百分比cpu privilege mode (%) cpu 用户模式百分比cpu user mode (%) 内存利用率memory percent utilization 内存页交换速率page swap velocity 内存错页率percent page fault 硬盘平均等待队列avg wait queue length 硬盘平均磁盘时间avg percent disk active time 硬盘平均写速率avg read & write velocity 分区平均利用率avg partition percent utilization 接收和发
55、送的 icmp 包 率 receive & transmit icmp packets per second 核心内存利用率core memory percent utilization 虚拟内存利用率virtual memory percent utilization 认可用量利用率 committed charges(%) 主机总内存容量total memory capacity 主机总可用内存容量total available memory 主机已用用内存容量total used memory 分区总容量total partition capacity 分区总使用容量total used
56、 partition 发送的 icmp 包率transmit icmp packets per second 接收的 icmp 包率receive icmp packets per second windows 主机 性能指标 页面调进速率pages in 页面调出速率pages out 硬盘平均读速率avg read velocity 硬盘平均写速率avg write velocity 连续运行时间uptime 主机基本信息host info 操作系统operating system mac 地址mac address 主机操作系统的 oidos oid 包含的 ip 地址contained
57、 ip 系统版本os version 系统 spos sp 等待处理队列processor queue length 进程数processes 线程数threads 句柄数handles 当前在线用户数users 核心内存总量total core memory capacity 剩余核心内存available core memory 已用核心内存used core memory 虚拟内存总量total virtual memory capacity 虚拟内存已用量used virtual memory 认可用量总量total commited charges capacity 已用认可用量us
58、ed committed charges cpu 个数no. cpu 内存总容量total memory capacity 硬盘个数no. disk 硬盘总容量total disk capacity 网卡个数no. nic 网卡类型nic type ip 地址ip address 主机名host name 分区个数no. partitions 配置指标 分区总容量total partition capacity 性能指标cpu 利用率cpu percent utilization cpu 名称cpu name cpu id 号cpu id cpu 型号cpu type cpu(子资源) 信息指
59、标 cpu 频率cpu frequency 硬盘等待队列wait queue length 硬盘磁盘时间percent disk active time性能指标 硬盘读写速率read & write velocity 硬盘名称disk name 硬盘 iddisk id 硬盘(子资源) 信息指标 硬盘容量disk capacity 分区总已用容量total used partition capacity 性能指标 分区利用率partition percent utilization 分区名称partition name 分区 id 号partition id 分区(子资源) 信息指标 分区容量
60、partition capacity 管理状态management status 可用性指标 操作状态operation status 发送利用率transmit percent utilization 发送的丢包数transmit discard packets 发送的错包数transmit error packets 发送速率transmit velocity 接收利用率receive percent utilization 接收和发送利用率总 和 interface receive & transmit percent 接收的丢包数receive discard packets 接收的错
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关键国际物流术语及试题及答案
- 人体免疫系统机制试题及答案
- 2024年CPMM备考时间规划及试题及答案
- 小麦赤霉病全生育期综合防控技术
- 精准训练CPSM考试试题及答案
- SCMP创建与教育考试试题及答案
- 2024年CPMM资源分析与试题及答案
- DNA与RNA的结构比较试题及答案
- 柳暗花明2024年CPSM考试试题及答案
- 视野开阔的2024年国际物流师试题与答案
- GB/T 36187-2024冷冻鱼糜
- 2024年《监察法》知识考试题库及答案
- 抽水蓄能电站地下厂房岩锚梁开挖施工方案
- 奥鹏东北财经大学东财《EXCEL在财务工作中的应用》单元作业2参考答案
- 22G101三维彩色立体图集
- 数独比赛“六宫”练习题(96道)
- 2020年新人教版必修三《Unit 2 Morals and Virtues》单元教案(附导学案)
- 单个军人队列动作教案
- 自家停车位申请按照充电桩四方协议书
- 水质 浊度的测定 浊度计法HJ 1075-2019方法验证报告
- DL-T 1476-2023 电力安全工器具预防性试验规程
评论
0/150
提交评论