版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 系统学习 Zabbix 系统监控(一)Windows 系统监控 目 录 TOC o 1-3 h z u HYPERLINK l _Toc66477761 1 介绍 PAGEREF _Toc66477761 h 5 HYPERLINK l _Toc66477762 1.1 摘要 PAGEREF _Toc66477762 h 5 HYPERLINK l _Toc66477763 1.2 背景 PAGEREF _Toc66477763 h 5 HYPERLINK l _Toc66477764 1.3 系统简介 PAGEREF _Toc66477764 h 6 HYPERLINK l _Toc664
2、77765 1.4 名词术语 PAGEREF _Toc66477765 h 6 HYPERLINK l _Toc66477766 1.5 系统架构 PAGEREF _Toc66477766 h 8 HYPERLINK l _Toc66477767 2 指标 PAGEREF _Toc66477767 h 8 HYPERLINK l _Toc66477768 2.1 软件版本 PAGEREF _Toc66477768 h 9 HYPERLINK l _Toc66477769 2.1 硬件指标 PAGEREF _Toc66477769 h 9 HYPERLINK l _Toc66477770 3 安
3、装部署 PAGEREF _Toc66477770 h 9 HYPERLINK l _Toc66477771 4 windows 系统状态监控 PAGEREF _Toc66477771 h 10 HYPERLINK l _Toc66477772 4.1.2 添加端口 PAGEREF _Toc66477772 h 11 HYPERLINK l _Toc66477773 4.1.3 配置自启动 PAGEREF _Toc66477773 h 11 HYPERLINK l _Toc66477774 4.2 windows 事件查看器监控 PAGEREF _Toc66477774 h 11 HYPERLI
4、NK l _Toc66477775 4.2.1 zabbix 官网指导说明 PAGEREF _Toc66477775 h 11 HYPERLINK l _Toc66477776 4.2.2 创建监控项 PAGEREF _Toc66477776 h 12 HYPERLINK l _Toc66477777 4.2.3 创建触发器 PAGEREF _Toc66477777 h 13 HYPERLINK l _Toc66477778 PAGEREF _Toc66477778 h 14 HYPERLINK l _Toc66477779 4.2.4 事件查看器注意事项 PAGEREF _Toc664777
5、79 h 14 HYPERLINK l _Toc66477780 4.2.5 监控结果 PAGEREF _Toc66477780 h 16 HYPERLINK l _Toc66477781 PAGEREF _Toc66477781 h 16 HYPERLINK l _Toc66477782 4.3 windows 系统 CPU 监控 PAGEREF _Toc66477782 h 16 HYPERLINK l _Toc66477783 4.3.1 监控 CPU 使用率 PAGEREF _Toc66477783 h 16 HYPERLINK l _Toc66477784 4.3.2 创建监控项 P
6、AGEREF _Toc66477784 h 16 HYPERLINK l _Toc66477785 4.3.3 创建触发器 PAGEREF _Toc66477785 h 16 HYPERLINK l _Toc66477786 4.3.4 配置图形 PAGEREF _Toc66477786 h 17 HYPERLINK l _Toc66477787 4.3.5 配置 zabbix_agentd.win.conf PAGEREF _Toc66477787 h 18 HYPERLINK l _Toc66477788 4.3.6 监控结果 PAGEREF _Toc66477788 h 18 HYPER
7、LINK l _Toc66477789 4.4 windows 系统内存监控 PAGEREF _Toc66477789 h 19 HYPERLINK l _Toc66477790 4.4.1 创建监控项 PAGEREF _Toc66477790 h 20 HYPERLINK l _Toc66477791 4.4.2 创建触发器 PAGEREF _Toc66477791 h 21 HYPERLINK l _Toc66477792 4.4.3配置图形 PAGEREF _Toc66477792 h 22 HYPERLINK l _Toc66477793 4.4.5 监控结果 PAGEREF _Toc
8、66477793 h 23 HYPERLINK l _Toc66477794 4.5 windows 磁盘读写监控 PAGEREF _Toc66477794 h 24 HYPERLINK l _Toc66477795 4.5.1 创建监控项 PAGEREF _Toc66477795 h 25 HYPERLINK l _Toc66477796 4.5.2 配置图形 PAGEREF _Toc66477796 h 26 HYPERLINK l _Toc66477797 4.5.3 监控结果 PAGEREF _Toc66477797 h 26 HYPERLINK l _Toc66477798 4.6
9、windows 磁盘容量监控 PAGEREF _Toc66477798 h 27 HYPERLINK l _Toc66477799 4.7 windows 网卡流量监控 PAGEREF _Toc66477799 h 27 HYPERLINK l _Toc66477800 4.8 windows 系统时间监控 PAGEREF _Toc66477800 h 28 HYPERLINK l _Toc66477801 4.8.1 创建监控项 PAGEREF _Toc66477801 h 28 HYPERLINK l _Toc66477802 4.8.2 创建触发器 PAGEREF _Toc6647780
10、2 h 29 HYPERLINK l _Toc66477803 4.9 windows 系统进程监控 PAGEREF _Toc66477803 h 31 HYPERLINK l _Toc66477804 4.9.1 创建监控项 PAGEREF _Toc66477804 h 31 HYPERLINK l _Toc66477805 4.9.2 创建触发器 PAGEREF _Toc66477805 h 32【导读】本文介绍了zabbix 基本概念及其特点,阐述 zabbix 系统环境搭建与基础安装,如何实现对各类操作系统、硬件设备、应用软件监控告警。1 介绍1.1 摘要本文深入浅出,切近实际运维应用
11、,由 zabbix 3.4 版本入手,学习 zabbix 监控告警实现方式,由 zabbix 5.0 浅出实现快速部署、快速应用。本人从业多年,关注 zabbix 开源社区,以及 zabbix 官方组织的各种峰会,了解到的前沿技术,因随着运维监控软件的不断发展,未来软件将是开箱即用的模式,运维人员在使用监控软件,不必再去花精力编写运维监控程序,而是完善监控项,这样的方式对于初学者越来越不容易学习。因此,学习 zabbix 3.4 版本是非常必要的, zabbix 官方那时候还没有集成更多的模板以直接使用,那里有大量的监控项需要自己编写实现,不仅全面了解了 zabbix ,也是对 linux 命
12、令、 shell 脚本、 Python 语言等的很好学习,也有助于二次开发,自定义监控项的配置。1.2 背景以下是部署实施基于 zabbix 监控系统的建设背景,以解决诸多运维实际问题:目前公司系统运维主要采用人工检查的方式,问题发现的时效性较低,容易出现问题不被立刻发现,人工也容易疏忽漏查,导致问题处理不及时,影响信息化系统服务效果,就需要更好保障系统稳定运行。公司信息化系统、操作系统、设备种类多,各类信息化系统如:OA 、 U9 , PLM 、企业邮箱等,又有 Linux 、 Windows 、 VMware 、 EMC 等系统,设备有服务器、交换机、存储等,机房环境有动环系统进行监测。如
13、此众多的信息化系统平台,当然需要统一运维界面,实时监测各系统运行状况,为运维工作提供便利。为适应时代的发展,未来是个智能化的时代,运维工作要实现自动化,运维工作者要向开发去转变,开发即运维,或许有一天人工智能将代替运维人员,而今的运维人员希望是人工智能创造者的一份子,了解自动化运维,与时俱进是非常必要的。综上,为了提高运维效率,节约人力资源,对设备、机房环境实时监控,能有效、实时发出告警信息,从而及时发现问题快速响应。急需一套能满足以上需求的监控系统,经考量 zabbix 监控系统应用广泛,可实现上述功能。1.3 系统简介Zabbix 是一个企业级解决方案,支持实时监控数千台服务器,虚拟机和网
14、络设备,采集百万级监控指标。Zabbix 完全开源免费。Zabbix 的主要特点有:指标收集:从任何设备、系统、应用程序上进行指标采集问题监测:定义智能阈值可视化:单一界面管理平台告警和修复:确保及时、有效的告警安全和认证:保护您所有层级的数据轻松搭建部署:大批模板,开箱即用,节省您宝贵的时间自动发现:自动监控大型动态环境分布式监控:无限制扩展ZABBIX API :将 Zabbix 集成到您 IT 环境的其他任何部分1.4 名词术语Zabbix 系统有一些自己定义的专业术语,为更好的熟悉系统名词,下面主要介绍本文以及 zabbix 常用的术语。主机( host)一台你想监控的服务器、工作站、
15、交换机等网络设备,用 IP 或者域名表示。主机组( host group)多台具有某种相同角色、属性的集合。例如,所有 windows 服务器放在一个叫 “windows server” 的主机组中。监控项( item)你想要监控、获取主机或主机组的哪些数据。例如:我想监控所有机器的 CPU 使用情况,则需要建一个监控项,用于获取所有服务器的 CPU 使用率。触发器( trigger)由逻辑表达式组成的按照预先设置好的阀值来评估由监控项采集到的数据。触发器有两种状态,分别为 “ 问题 ” 和 “ 已解决 ” 。例如:在上述通过监控项获取了 CPU 的使用率,假如我想超过 CPU 使用超过 80
16、% 的就预警,则可以创建一个触发器,当监控项获取的值超过 80% 时就按照预设的情况报警,状态为 “ 问题 ” ;低于 80% 时认为报警解除,状态恢复为 “ 已解决 ” 。事件( event)单次发生的需要注意的事情,例如上述触发器状态由问题变成了正常或者由正常变成了问题,均可以称为一个事件。事件包括触发器事件、自动发现事件、自动注册事件和内部事件 4 个部分。动作( action)一个对事件做出反应的预定义的操作;例如 CPU 使用超过 80% 时,触发器状态变成了问题,即产生了一个事件,我们可以针对此事件预设一个动作(比如执行命令 reboot ),则系统会自动针对此事件的预设动作执行命
17、令 reboot 。媒介( media)发送告警通知的手段或途径。例如:当 CPU 超过 80% 报警后,通过媒介(邮件、短信、自定义脚本、微信等)形式告知。模板( template)一组可以被应用到一个或多个主机上的实体(监控项,触发器,图形,聚合图形,应用, web 场景等)的集合。简单的说,即多个监控项的集合。应用集( application)一组监控项组成的逻辑分组。例如, CPU 的监控项,归集至 cpu ,在想查看有关 cpu 方面的信息时,可以直接在界面上提供的搜索框内查询所有有关 cpu 的信息。zabbix serverzabbix 系统实现监控的核心程序,主要功能是与被监控
18、主机、代理机等进行交互、触发器计算、发送告警通知、收集数据并存储等。zabbix agent一个部署在监控对象上的,能够主动监控本地资源和应用的程序;一般来讲,我们需要在所有被监控服务器上安装此程序。zabbix proxy一个帮助 zabbix server 收集数据,分担 zabbix server 的负载压力的程序;另外,还可以用在 server 与 agent 机器网络不通,使用 proxy 作为网络代理,实现两者的通信功能。1.5 系统架构系统结构说明:由 web 、 linux 、 php 、 mysql 等组件部署安装,实现 zabbix server 服务端;由被监控对象例如:
19、Windows 系统, linux 系统、 Vmware 虚拟化平台、交换机,存储等组成了 agent 端。Zabbix server 可采用主动模式,获取 agent 上数据,也可采用被动模式,接收 agent 定时发送的数据。2 指标2.1 软件版本版本选择说明:目前 zabbix 3 版本成熟稳定,各大企业公司运维监控系统运行于该平台上,提供的监控项比 zabbix 第 1 和 2 版本丰富,完全能满足监控对象的需要;至今 zabbix 第 3 版已持续发布 4 年多时间,开源系统积累了大量的资料与研究人员,可供交流学习,能很好服务于 zabbix 定制化;zabbix 4.0 版本 2
20、018 年 10 月正式发布, 4.2 版本于 2019 年 4 月正式发布,目前最新的是 zabbix 5.2 版本,版本持续更新满足未来升级发展的需要,新版本增加了 ELK 、时序数据库,以及前端 web 优化,但监控本质并未发生大的变化。2.1 硬件指标名称CPU/内存数据库可监控主机数量小型4核心/16GMySQL + 500GB普通硬盘500台以内中型4核心/32GMySQL + 500GB普通硬盘500-1000台大型8核心/64GMySQL + 1TB RAID存储盘1000-3000台超大型16核心/128GMySQL + 2TB RAID存储盘3000台以上Zabbix 可以
21、运行于虚拟环境也可以部署在服务器上,因 zabbix 采集数据主要是文本,对网络带宽要求不高,千兆速率足矣,只要满足性能上的要求即可,主要为 CPU 、内存和硬盘三项。结合 zabbix 官网给出的指标、实际监控项数量、历史记录保存时间长度。根据上表的参考标准,测试环境建议小型化部署。3 安装部署Zabbix 安装方式主要是两种:1 、 yum 源安装 2 、 zabbix 源码安装,安装方法互联网上搜索非常多,这里就不再阐述。主要安装组件:PHP 、 Apache 或 Nginx 、 Mysql 、 Zabbix 软件包。4 windows 系统状态监控本节介绍实现对 windows 系统状
22、态监控。使用zabbix 3.4版本,一起了解学习zabbix监控数据采集过程,这样对我们自定义监控项非常有帮助,提供方法扩展思路 。诚然zabbix 5.0版本等高版本,许多监控项已经被zabbix agent集成,但那并不利于初学者学习与实践。通过在被监控主机上,部署安装 zabbix_agent ,实现事件查看器监控、 CPU 监控、内存监控、磁盘读写监控、磁盘容量监控、网卡流量监控、系统时间监控、系统进程和服务监控。考虑到公司使用的服务器目前多数为 windows server ,对于个别服务器安装了PC 操作系统不深入研究,经测试 Windows 版本支持情况如下表:版本是否支持备注
23、Windows server 2003是需要运行32位程序Windows server 2008是Windows server 2012是Windows 7是Windows 10否测试zabbix-agent程序有报错4.1 windows 部署 zabbix_agent为了监控 window 系统,首先需要在该系统下部署 zabbix_agent 代理,用于收集该系统信息。自研程序包列表:角色安装包说明适用版本基于zabbix-agent-3.4.6Zabbix目录bin conf scriptWindows server 2003、2008、20124.1.1 解压安装Zabbix age
24、nt 的原始文件为 zabbix_agents_3.4.6.win.zip ,一般部署是:解压在 window 服务器 C 盘根目录下,再改写 conf 下的配置文件。为了部署方便快捷,现提供已经配置成熟的 zabbix 目录,直接复制 zabbix 目录到 window 服务器的 C 盘根目录下,最后进行程序安装和启动。因此,涉及 C:zabbixscriptconfzabbix_agentd.win.conf 文件的均可以忽略,供学习与交流。cmd 或 powershell 下安装和启停命令如下:cd C:zabbixbinwin64.zabbix_agentd.exe -c C:zabb
25、ixconfzabbix_agentd.win.conf -i 安装.zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -s 启动.zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -x 停止4.1.2 添加端口Windows 防火墙需要添加端口的出站和入站规则,将 TCP 协议 10050 、 10051 端口开放。不然 zabbix 主动或被动模式就获取不到该设备的数据。10050 10051 是 zabbix 程序使用端口。4.1.3 配置自启动Zabbix age
26、nt 安装过程中,会自动将 zabbix agent 服务、开机自启动配置好,只需要检查下, agent 是否正常运行即可。4.2 windows 事件查看器监控对 windows 系统下 事件查看器中系统日志进行监控和信息获取,将事件查看器中的错误( Error )、关键( Critical )等系统、程序重要信息打印在 zabbix 界面中,也可以添加监控项,触发器来针对某个信息实现告警。例如:当事件查看器中,有磁盘坏块告警信息时, zabbix 界面会进行告警提示。或是配合研发部门程序日志,程序可将告警信息写入到事件查看器中,zabbix 对其进行监控告警。4.2.1 zabbix 官网
27、指导说明/documentation/3.4/manual/config/items/itemtypes/zabbix_agent/win_keys截图如下:4.2.2 创建监控项类型:必须是 zabbix 客户端(主动式)键值:参考 zabbix 官方文档,例子eventlogSystem,Critical|Error 将事件查看器中 “ 系统 ” 栏中 “Critical|Error” 类型的信息过滤出来eventlogSystem,Error,.Disk. 事件查看器中 “ 系统 ” 栏中 “Critical|Error” 类型的信息过滤,并使用正则表达式匹配详细信息中的来源:Disk
28、的关键字eventlogSecurity,Success Audit,4624$,skip.nodata(60)=0 andeventlogSecurity,Success Audit,4624$,skip.regexp(administrator,1)=0如果在 60 秒内有监控到数据,并且监控内容不包含字符串 administrator 则触发告警,如果 60 秒内没有新的数据了,则触发器恢复 OK 。简单点说就是,用户登录后触发器触发至少会持续 60 秒,如果用户不断的登录成功,间隔小于 60 秒,则触发器一直是 problem 状态。应用集:Event 事件日志4.2.3 创建触发器名
29、称:HOST.NAME 代表主机名表达式:添加 “ 最新一条日志级别不等于 N” , N 取值是 0 、 1 或其他, 0 表示正常, 1 和其他值表示不正常。所以 N 取值不等于 0 ,触发告警。4.2.4 事件查看器注意事项系统:System 安全:Security级别:错误( Error )、关键( Critical )、信息( Information )等,参考 zabbix 官网指导说明来源:一定要看详细信息中的 Provider Name ,次截图上,详细信息与常规来源不一致,一个是 Microsoft-Windows-TerminalServices-Printers ,一个是
30、TerminalServices-Printers 。容易导致正则匹配出错,建议使用含有匹配的方式。4.2.5 监控结果4.3 windows 系统 CPU 监控4.3.1 监控 CPU 使用率因为 zabbix 未提供能查看 cpu 使用率的监控项,只提供了 cpu 负载的监控项,就需新增建监控项,监控 CPU 用户使用率与其类似,不再说明。(zabbix 3.4版本)4.3.2 创建监控项名称:CPU 使用率键值:为了规范命名 cpu_time信息类型:浮点数更新时间:1m单位:%应用集:CPU 状态4.3.3 创建触发器名称:CPU 使用率过高:HOST.NAME表达式:Windows
31、Server Model:cpu_time.avg(5m)90 5 分钟均值大于 90% 告警4.3.4 配置图形注:根据需要调整绘图风格4.3.5 配置 zabbix_agentd.win.conf最后行添加# CPU 使用率PerfCounter=cpu_time,Processor(_Total)% Processor Time,60# CPU 用户使用率PerfCounter=cpu_usertime,Processor(_Total)% User Time,60注:cpu_time 为 zabbix 界面上监控项配置的键值,虽然可以自定义,但要规范命名。60 为数据更新时间,单位秒,
32、要小于等于 zabbix 界面上监控项配置 “ 更新时间 ” ,这样才有更新的意义。配置完成后,重启 zabbix_agentd 生效cd C:zabbixbinwin64.zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -x.zabbix_agentd.exe -c C:zabbixconfzabbix_agentd.win.conf -s4.3.6 监控结果4.4 windows 系统内存监控应用集:Memory 内存状态Memory 内存状态主要监控项有:Memory 内存使用率、 Memory 内存使用量、 Memory
33、内存总量(带上 Memory 方便了排序归类)。Swap 交换分区使用率、 Swap 交换分区使用量、 Swap 交换分区总量。zabbix 自带内存监控项,可以直接创建使用。监控项配置:说明:windows 系统下没有支持 system.swap.sizepused , swap 使用率监控项,一般 swap 分区被使用了,就可以说明物理内存不足,可以使用 pfree 替代。4.4.1 创建监控项以监控内存使用率为例:名称:内存使用率键值:vm.memory.sizepused其他键值:vm.memory.sizeused vm.memory.sizetotal信息类型:浮点数更新时间:1m
34、单位:%应用集:Memory 内存状态4.4.2 创建触发器名称:内存使用率过高:HOST.NAME表达式:Windows Server Model:vm.memory.sizepused.avg(5m)90 5 分钟均值大于 90% 告警4.4.3配置图形4.4.5 监控结果4.5 windows 磁盘读写监控Windows 下磁盘监控,可以细分到监控各个磁盘数据如 C 、 D 、 E 等,目前未想到到自发现规则配置,就对所有磁盘进行监控取总体值,以总体值为例进行监控配置。细分:LogicalDisk(E:)Disk Write Bytes/secLogicalDisk(C:)Disk Wr
35、ite Bytes/secLogicalDisk(D:)Disk Write Bytes/secLogicalDisk(_Total)Disk Write Bytes/sec总体:PhysicalDisk(_Total)Disk Read Bytes/sec4.5.1 创建监控项磁盘读写监控项较多,配置监控项如下图:键值:disk_read_speed 、 disk_write_speed 、 disk_free_percent 、 disk_rw_percent 、 disk_rw_percent 等。C:zabbixscriptconfzabbix_agentd.win.conf 文件配置
36、为:# Disk 磁盘读速率 Bytes/sPerfCounter=disk_read_speed,PhysicalDisk(_Total)Disk Read Bytes/sec,60# Disk 磁盘写速率 Bytes/sPerfCounter=disk_write_speed,PhysicalDisk(_Total)Disk Write Bytes/sec,60# Disk 磁盘空闲状态百分比PerfCounter=disk_free_percent,PhysicalDisk(_Total)% Idle Time,60# Disk 磁盘读和写总共用时百分比PerfCounter=disk_
37、rw_percent,PhysicalDisk(_Total)% Disk Time,60# Disk 磁盘读用时百分比PerfCounter=disk_read_percent,PhysicalDisk(_Total)% Disk Read Time,60# Disk 磁盘写用时百分比PerfCounter=disk_write_percent,PhysicalDisk(_Total)% Disk Write Time,60# Disk 磁盘平均读写队列长度PerfCounter=disk_queue_length,PhysicalDisk(_Total)Avg. Disk Queue Length,60# Disk 磁盘平均读队列长度PerfCounter=disk_read_queue_length,PhysicalDisk(_Total)Avg. Disk Read Queue Length,60# Disk 磁盘平均读队列长度PerfCounter=disk_wri
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025门面、车库出租合同
- 《DNA提取与保存》课件
- 上海体育大学《微生物代谢工程》2023-2024学年第一学期期末试卷
- 上海体育大学《航拍技术》2023-2024学年第一学期期末试卷
- 上海师范大学天华学院《沟通技巧》2023-2024学年第一学期期末试卷
- 上海师范大学《数据采集》2023-2024学年第一学期期末试卷
- 医院个人述职报告范文
- 课题申报书:高校战略规划实施模式及绩效评估研究
- 课题申报书:高校辅导员名师工作室建设有效路径研究
- 课题申报书:多重风险冲击下玉米供应链韧性治理及安全水平提升策略研究
- PLC机械手臂搬运加工标准流程控制
- 肃南裕固族民俗文化旅游资源开发研究
- 食品级塑料材质
- JTG 3432-2024 公路工程集料试验规程(正式版)
- 现代小提琴演奏技巧智慧树知到期末考试答案章节答案2024年四川音乐学院
- 孙子兵法中的思维智慧智慧树知到期末考试答案2024年
- 降水的变化与分布课件
- 2024年幼儿园安全知识竞赛培训题题库及答案
- 班车服务项目服务方案
- 公司法(上海财经大学)智慧树知到期末考试答案2024年
- 金融数据分析 课件 第2章金融时间序列线性模型
评论
0/150
提交评论