Zabbix深入分析某某某_第1页
Zabbix深入分析某某某_第2页
Zabbix深入分析某某某_第3页
Zabbix深入分析某某某_第4页
Zabbix深入分析某某某_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

{管理信息化BI商务智能}Zabbix深入分析某某某Zabbix深入分析2015目录1研究目标82系统架构92.1Server102.2数据库存储(Databasestorage)102.3WEB界面102.4Proxy102.5Agent112.6Get122.7Sender122.8工作机制123WEB界面菜单功能134主要功能名词及概念144.1.1SNMP144.1.2IPMP144.1.3配置(configuration)154.1.4主机和主机组(Hostsandhostgroup)154.1.5模板(Templates)154.1.6监控项(Items)154.1.7网站监控(WEB)154.1.8触发器(Triggers)164.1.9宏(Macro)164.1.10事件(Events)174.1.11图形(Grahps)184.1.12Screen184.1.13报表(Reports)184.1.14IT服务(ITservices)194.1.15发现(Discovery)194.1.16队列(Queue)204.1.17应用(Applications)204.1.18分布式监控(Distributedmonitoring)204.1.19维护(Maintenance)205监控项类型(ItemType)215.1Zabbix客户端代理(ZabbixAgent)215.2SNMP代理(SNMPAgent)385.3SNMP被动方式(SNMPTrap)395.4IPMI检测395.5简单检测395.6日志文件监控395.7计算监控395.8内部检查405.9SSH检查455.10Telnet检查455.11外部检查455.12汇总检查455.13被动监控455.14JMX监控465.15ODBC监控466触发器(Triggers)466.1概述466.2配置触发器466.3触发器表达式(Expression)476.3.1Function476.3.2Functionparameter516.3.3运算符516.3.4触发器举例526.3.5滞留状态546.4触发器依赖性(Dependency)546.5触发器严重性(Severity)556.6触发器的单位符号(Unitsymbols)566.6.1单位后缀566.6.2使用举例567报警及其策略577.1概述577.2报警流程587.3报警媒介(Mediatype)587.4报警动作(Action)587.4.1Action(基本属性)597.4.2Conditions(条件)597.4.3Operations(操作)597.5报警升级(Esacalations)618Quickstart629数据模型6410ZabbixAPI6410.1概览6410.1.1API使用说明6410.1.2ZabbixAPI支持的数据类型6510.1.3“get”方法支持的通用参数6510.2监控6710.2.1History6710.2.2Events6710.2.3Servicemonitoring6710.3配置6710.3.1Hostsandhostgroups6710.3.2Itemsandapplications6810.3.3Triggers6910.3.4Grahps6910.3.5Templates7010.3.6Exportandimport7010.3.7Low-leveldiscovery7010.3.8Screens7110.3.9Actionsandalerts7210.3.10ITservices7210.3.11Maps7310.3.12Webmonitoring7310.3.13Networkdiscovery7310.4管理7410.4.1Users7410.4.2General7510.4.3Proxies7510.4.4Scripts7610.5API信息7610.6API引用的对象(Object)的属性7610.6.1Historyobject7611图表套件-FusionChats7811.1概述7811.2套件7911.2.1FusionChartsXT7911.2.2FusionWidgetsXT8511.2.3PowerChartsXT9011.2.4FusionMapsXT9611.3开发(PHP)9612调研总结9712.1Zabbix可监控的基本模块9712.2ZabbixAPI9812.3Zabbix图表9812.3.1外部查看图表可行性9812.3.2利用FusionCharts展现9812.4报警策略的可定制性9812.5与Zabbix用户会话同步策略10012.5.1统一用户10012.5.2动态登录10013系统的集成10013.1方案10013.1.1方案一:内建模块10113.1.2方案二:iframe嵌入10113.1.3方案三:图表接口10213.2方案总结1021研究目标通过对ZABBIX的研究实现如下目标:熟悉可监控的基本模块研究API,并且要写代码测试到监控任务的API控制,包括创建,暂停,更改选项,删除任务。研究API,写代码看是否能读取到全部监控结果研究Zabbix报表,搞清楚两个问题,是否能直接调用Zabbix的出图组件或选项或api,如果Zabbix图形体验不能满足我们的要求,是否我们能拿到出图的全部数据来自己组openflashchart,接下来我们可能会采购fusionchart图表组件),研究Zabbix的报警策略,看看能否做出根据监控的任务或选项来实施不同的报警规则,与zb集成。研究Zabbix的用户登录设置,看看如何实现我们的应用集成时免登录(特别是需要查看监控结果时)在熟悉了zb的前提下,考虑并设计我们的应用跟zb做集成的方案2系统架构图:Zabbix架构图:Zabbix基本数据流2.1ServerServerZabbixagent和proxiesserver本身就可以使用简单服务检测来检测远程网络服务(比如web服务器和mail服务器)。Server何一部分出现问题时,它向管理员发送报警信息。一个基本的ZabbixServer被分为三个不同的组件:ZabbxiServer、基于Web的管理界面(webfrontend)和数据库存储。所有的Zabbix配置信息存储在数据库中,Server和frontend与数据库进行交互。例如,当你用frontend或者API创建一个新的监控项时,事实上是被加入到数ZabbixServer将查询监控项表获取数据库中的可用监控项并把它们存储在Serverfrontend中做任何改变,需要等两分钟后才会在最新数据这一部分反映出来。2.2数据库存储(Databasestorage)所有的配置信息以及Zabbix采集的数据都保存在数据库中。2.3WEB界面为方便从不同平台去访问管理Zabbix,Zabbix提供了一个基于WEB的界面,可以通过界面实现监控及其各项系统配置管理。WEB界面作为ZabbixServer的一部分也可以运行在不同的物理服务器上。2.4Proxy在Zabbix的部署中ZabbixProxy是一个可选的组件。一个Zabbix代理(Proxies)可以代表ZabbixProxies)可以负担采集数据的任务并且减轻Zabbix服务器负载。同时,使用代理(Proxies)是实施统一和分布式监控的最简单方式,因为所有的客户端和代理(Proxies)向一个Zabbix服务器报告数据,并且所有数据集中保存在服务器数据库。图:ZabbixProxy示意图一个Zabbix代理(Proxies)可以用在以下:监控远程区域;监控拥有不可靠链接的区域;当监控数以千计的设备时分担Zabbix服务器的负载;简化分布式监控的维护;所有代理(Proxies)采集到的数据在传送给服务器之前都保存在本地。这样,临时与服务器断开连接也不会导致数据丢失。proxy配置文件中的参数ProxyLocalBuffer和ProxyOfflineBuffer控制数据在本地保存多久。Zabbix代理(Proxies)是一个数据收集器。它不进行触发器计算,处理事件或发送报警信息。2.5AgentZabbixAgent盘,内存,处理器统计等)。ZabbixAgentZabbixserver报告以做Zabbixserver可以积极的发送报警信息提醒管理员注意相应的情况。由于使用了内地系统调用来采集统计信息,Zabbix客户端代理(Agent)十分高效。被动与主动检测Zabbix客户端代理(Agent)可以执行被动和主动检测。在被动检测中,Zabbix客户端代理(Agent)负责数据请求。服务器或代理请求数据,例如,CPU负载,客户端代理返回结果。主动检测需要更复杂的处理。Zabbix客户端代理(Agent)首先必须从服务器获取监控项列表来进行独立处理,然后它将定期发送新数据给服务。可以通过选择各自的监控项类型来决定执行主动检测还是被动检测。Zabbix客户端代理(Agent)处理监控项类型为'Zabbixagent'或'Zabbixagent(active)'的检测。2.6GetZabbix_get是一个用来与Zabbixagent通信并从Zabbixagent获取所需信息的程序。这个工具常用来客户端排错。2.7SenderZabbix_Sender是用于向ZabbixServer个工具常用于执行需要长时间运行的用户脚本并发送可用性及性能数据。2.8工作机制图:报警流程CPUloadittoohighonServerX必须首先为ServerXHostCPUload的监控项(item),然后创建一个触发器(trigger)来判断cpu负载是否高了,然后在创建一个操作(actioncpu负载高时发送报警邮件。这看起来进行非常灵活的设置。3WEB界面菜单功能监控(Monitoring)仪表盘(Dashboard)总览(Overview)网站(WEB)最新数据(Latestdata)触发器(Triggers)事件(Events)图形(Graphs)多屏(Screens)拓扑图(Maps)发现(Discovery)IT服务(ITservices)资产(Inventory)总览(Overview)主机(Hosts)报表(Reports)Zabbix状态(StatusofZabbix)可用性报表(Availabilityreport)触发器Top100(Triggerstop100)自定义条状图报表(Barreports)配置(Configuration)主机组(Hostgroups)模板(Templates)主机(Hosts)维护(Maintenance)网站(WEB)动作(Actions)多屏(Screens)简报片显示(Slideshows)拓扑图(Maps)发现(Discovery)IT服务(ITservices)管理(Administration)一般(General)节点管理(DM)认证(Authentication)用户(Users)示警媒体类型(Mediatypes)脚本(Scripts)审计(Audit)队列(Queue)警报(Notifications)4主要功能名词及概念4.1.1SNMP也是agent的一种,指支持SNMPSNMP的参数将相关监控数据传送至服务器端(大部份的交换机、防火墙等网络设备都支持SNMP4.1.2IPMPAgent的另一种方式,主要应用于设备的物理性能监控,例如设备的温度、风扇的转速等。4.1.3配置(configuration)在Zabbix中一切的开始需从配置开始,可以配置的包含主机组、主机、监控模板、被监控主机的维护时段、web、动作(ActionZabbix提供将所有配置导出为标准XMLXML配置文件。4.1.4主机和主机组(Hostsandhostgroup)Host是Zabbix监控的基本载体,所有的监控项都是基于host的。要想使用Zabbix做监控我们的设备的话第一步就是创建一个主机,只有创建了主机才能监控并且查看该设备的各种性能参数图表。主机组就是对主机的一个多对多分组。4.1.5模板(Templates)如果有大量的同一类设备,需要监控的信息也大致类似,一个个去修改相关参数比较麻烦,我们可以通过创建一个template来简化操作。4.1.6监控项(Items)Item是监控项,是监控的基本元素,每一个监控项对应一个被监控端的采集值。在Configuration->Hostshost所包含的items的itemsitemitems可以引用自templates己创建。4.1.7网站监控(WEB)WEB是针对网站的性能监控,主要是speedResponsetimeResponsecode(响应代码,httpWebMonitoringwebweb方案由一个或多个HTTP请求或步骤组成。Zabbix服务器以预定义的顺序顶起执行这些步骤。在任何web方案中都将收集下面的信息:整个方案所有步骤的平均下载时间,以秒计;失败的步数;最后一个错误信息;在任何web方案的每一步将收集下面的信息:每秒下载速度;响应时间;响应代码;Zabbix也能够检查获取到的HTML页面是否包含预定义的字符串。它可以执行一个虚拟的登录表单提交等。Zabbix网站监控(WebMonitoring)支持HTTP和HTTPS两种情况。当执行一个web方案时,Zabbix经常接受重定向。在执行一个方案期间,cookies被保存。4.1.8触发器(Triggers)触发器是评估监控项收集到的数据的逻辑表达式,然后反应系统的当前状态。数据的工作可以交给触发器做。器发动--或者把状态变为PROBLEM。一个触发器可能有下列状态:值描述OK触发器的正常状态。PROBLEM通常意味着有情况发生。举个例子说,处理器负载太高。4.1.9宏(Macro)Zabbix支持可以在各种场合可以使用的大量宏(MarcosMarcos)可以让你节省时间并且让配置文件更清晰。MarcosC语言里的宏的作用一样,是用一个简单的宏名称来替代繁琐的代码片段。ZabbixMarcos义。这些宏(Marcos)有一个特殊的语法:($MACRO宏(Marcos)可以使用在下列情况:监控项关键字和描述触发器表达式和名称其他宏(Marcos)名字可以使用下面的字母:A-Z,0-9,_,.zabbix替代宏按照下面的优先权:主机级别宏(优先检查)ID存储为主机第二层模版定义的宏,以模版ID存储为主机第三层模版定义的宏,以模版ID存储…全局宏(最后检查)zabbix到,并且全局宏存在,则使用全局宏4.1.10事件(Events)Zabbix中的事件被三种源生成:触发器(triggers)-任何时候一个触发器改变它的状态;发现(discovery)-检查到主机或服务时;自动注册(autoregistration)-当活动客户端是被服务器自动注册时;1.触发器事件(Triggerevents)触发器状态改变是最频繁也是最重要的时间源。时候触发器状态改变了和现在触发器是什么状态。2.发现事件(Discoveryevents)Zabbix定期扫描网络发现规则中定义的IP列表。每个规则的检测频率是可以单独配置的。一旦一个主机(或服务的情况改变)被发现了,一个(或)多个发现性事件生成了。Zabbix生成下列事件:事件(Event)什么时候产生(Whengenerated)服务正常运行每次Zabbix能检查到服务服务停止每次Zabbix检查不到服务主机正常运行如果一个IP至少有一个服务正常主机停止如果所有的服务都没有回应服务发现如果一个服务从停止状态恢复或者第一次被发现服务丢失如果服务在正常状态被检查到找不到了主机发现如果一个主机从停止状态恢复或者第一次被发现主机丢失如果主机在正常状态被检查到找不到了3.活动客户端自动发现事件(Activeagentauto-discoveryevents)活动客户端自动注册在Zabbix产生事件。如果配置了,当之前一个不知名的活动客户端请求检查时,活动客户端自动注册事件产生。服务器使用接收到的客户端的IP地址和端口来添加一个新的自动注册主机。4.1.11图形(Grahps)随着大量数据流入Zabbix,对于用户来说,观看能够图形比观看数据更容易了解Zabbix正在发生的事件。了或者分析出一些或许会进入故障状态的事件。Zabbix可以提供给用户内置的简单图形,也可以提供给用户更复杂的自定义图形。Zabbix的Graphsitemitems绘制在一configuration->hosts选择要绘制图表的hostgraphscreategraphsY轴最大最小值;通过additems可以添加在同一个图表中展示的多个items。4.1.12ScreenScreenhosthosts的同一种信息,这些信息可以为graphsmapsserverinfosZabbix所有的监控信息。4.1.13报表(Reports)如果有大量的同一类设备,需要监控的信息也大致类似,一个个去修改相关参数比较麻烦,我们可以通过创建一个template来简化操作。在Zabbix中关于报表的功能有三项:Avaliabilityreport:整个系统可用的系统报表提供过滤功能。Mostbusytriggerstop100:提供最常用的triggers预览。Barreport:可定制报表可以报多个报表整合到一起。4.1.14IT服务(ITservices)关心的是我们的ITIT服务的SLAIT基础设施的结构,以及其它更高级别的信息。IT服务的目的是关联对应于业务的IT/服务/的IT基础架构。4.1.15发现(Discovery)Zabbix提供了一个自动网络发现检测功能,通过正确的配置后可以实现:加快Zabbix部署简化管理在经常变化的环境中无需过多的管理Zabbix网络发现功能是基于以下信息的:IP范围外部可用的服务(如:FTP,SSH,WEB,POP3,IMAP,TCP等)收到的来自ZabbixAgent的信息收到的来自SNMPAgent的信息网络发现功能不提供网络拓扑的发现。网络发现一般包括两个阶段:Discovery(发现)和ActionsDiscovery(发现)Zabbix按照预定义的频率规则定期扫IP。每一个发现主机或一个服务时也触发一个相应的动作Action产生。Actions(动作)Discovery触发了一个Action后可以执行的相关操作如:发送通知添加/删除主机启用/禁用主机添加主机组从组中删除主机主机与模板的关联和断开执行远程脚本4.1.16队列(Queue)zabbix中没有IPC队列或任何其他的队列。队列中的统计数据是一个良好的Zabbix服务器的性能指标。4.1.17应用(Applications)应用是用来将监控项组织成一个逻辑组。举例来说,MySQL服务应用可以保存所有与MySQL有关的监控项:MySQL可用性,磁盘空间,处理器负载,每秒的存取次数,低速查询的数量等。Monitoring→Latestdata(最新数据)中你将看到每个应用中的监控项和网络分组方案。4.1.18分布式监控(Distributedmonitoring)Zabbix为IT代理,可以代表ZabbixServer收集本地数据,然后提交到ZabbixServer;多节点,这种方式是在每个节点上部署完整的Zabbix;4.1.19维护(Maintenance)可以为Zabbix主机和主机组定义维护(maintenance)时间。这里有两种维护(maintenance)类型:有数据收集和无数据收集。在主机维护(maintenance)期间为了避免收到报警信息,action应该修改配置,在报警条件中修改'Maintenancestatus=notin“maintenance”'——这样,在维护(maintenance)期间,你将不会收到报警信息。如果在维护(maintenance)期间发生了一个不可修复的错误,那么在维护(maintenance)时间结束后,才能接到该问题的报警。如果要想在维护(maintenance)期间收到错误的报警信息,那么就需要将上面的条件去掉。5监控项类型(ItemType)5.1Zabbix客户端代理(ZabbixAgent)ZabbixAgent可以得到的监控项的key。监控项对各个操作系统的支持参考:2.0appendixsupported_by_platform针对Win32平台特有的监控项参考:2.0configitemtypes/zabbix_agent/win_keysKey描述返回值参数备注agent代理Agent主机名称Stringvalue-返回的主机名称就是agent客户端的配置中定义的主机名称检查agent的可用性1表示可用;无返回值表示不可用-使用nodata()方法检查主机可用性Agent版本String-Example:1.8.2Kernel内核操作系统支持打开的文件的最大数量Integer.文件数量操作系统支持的进程的最大数量。Integer.进程数量Log日志log[file,<regexp>,<encoding>,<maxlines>,<mode>]file-日志的完整路径Theitemmustbeconfiguredasanactivecheck.监控的日志文件Log.regexp-正在表达式Examplekey:encoding–编码log[zabbixlogfile,,,100]maxlines-每秒向ZabbixServer或Seeamoredetaileddescription.Proxy发送的最大行数,该参数会mode参数从2.0开始支持.覆盖zabbix_配置文件的“MaxLinesPerSecond”mode–模式可选值:all(default),skip(跳过旧数据的处理).logrt[file_format,<regexp>,<encoding>,<maxlines>,<mode>]file_format–正则匹配regexp–正则Theitemmustbeconfiguredasanactivecheck.encoding–编码Examplekey:监控多个匹配到的日志文件Log.maxlines-每秒向ZabbixServer或Proxy发送的最大行数,该参数会覆盖zabbix_配置文件的logrt["zabbix^logfile[0-9]{1,3}$",,,100]Logrotationisbasedonthelastmodificationtimeoffiles.“MaxLinesPerSecond”Seeamoredetaileddescription.mode-模式可选值:mode参数从2.0开始支持.all(default),skip(跳过旧数据的处理).Net网络[<ip>,zone,<type>,<timeout>,<count>]检查DNS服务是否可用0–DNS不可用(没有响应或解析失败)1-DNS正常ip–DNS的IP(留空表示是默认DNS,windows忽略)zone-zonetotesttheDNStype–要查询的记录类型(defaultisSOA)timeout(Windows)–请求超时(默认1秒)count(Windows)–请求尝试次数(defaultis2)Examplekey:[,,MX,2,1]type可选的值有:ANY,A,NS,CNAME,MB,MG,MR,PTR,MD,MF,MX,SOA,NULL,WKS(非windows),HINFO,MINFO,TXT,SRV不支持国际域名,pleaseuseIDNAencodednamesinstead.Zabbix2.0以前的名称为(任然支持):.dns.record[<ip>,zone,<type>,<timeout>,<count>]执行一个DNS查询当成功时返回一ip–DNS的IP(留空表示是默认Examplekey:个带有相关信息DNS,windows忽略).record[,,MX,2,1]的Stringzone-zonetotesttheDNStype可选的值有:type–要查询的记录类型ANY,A,NS,CNAME,MB,MG,MR,PTR,MD,MF,MX,SOA,(defaultisSOA)NULL,WKS(非windows),HINFO,MINFO,TXT,SRVtimeout(Windows)–请求超SRVrecordtypeissupportedsinceZabbixagentv时(默认1秒)ersion1.8.6.count(Windows)–请求尝试不支持国际域次数(defaultis2)名,pleaseuseIDNAencodednamesinstead.Zabbix2.0以前的名称为(任然支持):.dns.collisions[if]Out-of-windowcollision.Numberofcollisions.Integer.if-interface.discovery网络接口列表.用于low-leveldiscovery.JSONobject2.0版本的agent开始支持.in[if,<mode>]Multi-byteinterfacenamesonWindowsaresuppoif–接口名称rtedsinceZabbixagentversion1.8.6.mode–可选值:Examplekeys:网络接口输入统计Integer.bytes–字节数(default)packets–数据包数.in[eth0,errors].in[eth0]errors-错误数YoumayusethiskeywithaDelta(speedperseconddropped–丢包数)storevalueinordertogetbytespersecondstatistics..out[if,<mode>]if–接口名称Multi-byteinterfacenamesonWindowsaresuppo网络接口输出统计Integer.mode–可选值:bytes–字节数(default)rtedsinceZabbixagent1.8.6version.Examplekeys:packets–数据包数.out[eth0,errors]errors-错误数.out[eth0]dropped–丢包数YoumayusethiskeywithaDelta(speedpersecond)storevalueinordertogetbytespersecondstatistics..total[if,<mode>]Examplekeys:网络接口的I/O流量统计Integer.if–接口名称mode–可选值:bytes–字节数(default)packets–数据包数errors-错误数dropped–丢包数.total[eth0,errors].total[eth0]YoumayusethiskeywithaDelta(speedpersecond)storevalueinordertogetbytespersecondstatistics.Notethatdroppedpacketsaresupportedonlyifboth.inand.outworkfordroppedpacketsonyourplatform..listen[port]Example:检查端口监听状态0–没有监听1–监听状态port–tcp端口.listen[80]OnLinuxsupportedsinceZabbixagentversion1.8.4.port[<ip>,port]Example:.port[,80]可用检查web服务器80端口是否可用.0–连接失败ip-(defaultis)旧名称:check_port[*]果可用尝试TCP连接1–可用连接port–端口对于简单的TCP性能测试可以用.[tcp,<ip>,<port>]志信息(SMTP和SSH会话通常记录)。.service[service,<ip>,<port>]则接受tcp连接0–服务挂了1–服务在运行service–以下任意值:ssh,ntp,ldap,smtp,ftp,http,pop,nntp,imap,tcp,https,telnetExamplekey:.service[ftp,,45]–可以测试端口为45的FTP服务测试.ip-(defaultis)port-(默认将使用服务的默认端口)志信息(SMTP和SSH会话通常记录)。该方法目前不支持加密协议(如IMAP端口993orPOP端口995),这些检查可以使用.port.windows版本的agent目前不支持检查LDAP和HTTPS.Notethatthetelnetchecklooksforaprompt(':'attheend).旧名称:check_service[*]NotethatbeforeZabbix1.8.3versionshouldbeusedinsteadofntp.httpsandtelnetservicesaresupportedsinceZabbix2.0..[service,<ip>,<port>]Examplekey:.[ssh]–可用于测试从SSH服务器的初始响应速度.该方法目前不支持加密协议(如IMAP端口993orPOP端口995).可以用.[tcp,<ip>,<port>]检查服务性能0–服务挂了;如果服务可用,则返回连接到服务的秒数service–以下任意值:ssh,ntp,ldap,smtp,ftp,http,pop,nntp,imap,tcp,https,telnetip-(defaultis)port-()替代.windows版本的agent目前不支持检查LDAP和HTTPS..Notethatthetelnetchecklooksforaprompt(':'attheend).就名称:check_service_perf[*]NotethatbeforeZabbix1.8.3versionshouldbeusedinsteadofntp.httpsandtelnetservicesaresupportedsinceZabbix2.0..listen[port]检查UDP端口状态.0–不可用1–监听状态port–UDP端口号Example:.listen[68]OnLinuxsupportedsinceZabbixagentversion1.8.4Proc进程[<name>,<user>,<mode>,<cmdline>]Examplekeys:name–进程名称(默认是所有进程)用户的所有进程占用内存情况指定用户的指定进程内存使用情况.内存使用量(单位:bytes).user–用户名(默认为所有用户)mode–可选值:avg,max,min,sum(default)[zabbix_server,zabbix]-行在zabbix用户下的zabbix_server所有进程的占用[,oracle,max,oracleZABBIX]–oracle进程含cmdline–附加的过滤命令有oracleZABBIX命令时在内存最紧张的情况下的内存用量[<name>,<user>,<state>,<cmdline>]Examplekeys:name–进程名称(默认是所有名称)[,mysql]–mysql用户的进程数某用户的指定状态下的进程数.Numberofprocesses.user–用户名(默认是所有用户的)state–可选值:all(default),run,sleep,zomb[apache2,www-data]–www-data用户下apache2的进程数[,oracle,sleep,oracleZABBIX]-oracle用户含cmdline-附加的过滤命令有oracleZABBIX命令的状态为sleep的进程数在Windows上,仅支持name和user参数Sensor传感器sensor[device,sensor,<mode>]OnLinux2.4,readssyssensors.Examplekey:硬件传感器读数device–设备名称(如果使用了<mode>参数,这是一个正则)sensor–传感器名称(如果使用了<mode>参数,这是一个正则)mode–可选值:avg,max,min.sensor[w83781d-i2c-0-2d,temp1]PriortoZabbix1.8.4,thesensor[temp1]formatwasused.OnOpenBSD,readstheMIB.Examplekeys:sensor[cpu0,temp0]-onetemperatureofoneCPUsensor[cpu[0-2]$,temp,avg]-averagetemperatureofthefirstthreeCPU'sSupportedonOpenBSDsinceZabbix1.8.4.System系统系统启动时的时间Integer.返回的是UNIX时间戳.intr设备中断.Integer..load[<cpu>,<mode>]CPU负载.Processorload.Float.cpu–可选值:all(default),percpu(总载荷/CPU个数)mode–可选值:avg1(1),avg5(5分钟平均值),avg15(15分钟平均值)Examplekey:.load[,avg5]Oldnaming:.loadXParameterpercpuissupportedsinceZabbix2.0.0..num[<type>]CPU个数可用的CPU个数.type–可选值:online(default),maxExamplekey:.num.switchesContextswitches.Switchescount.Oldnaming:system[switches].util[<cpu>,<type>,<mode>]cpu-CPU号(defaultisallCPUs)type–可选值:CPU(s)使用情况.处理器使用率的百分比.idle,nice,user(default),system(defaultforWindows),iowait,interrupt,softirq,stealExamplekey:.util[0,user,avg5]Oldnaming:.idleX,.niceX,.systemX,.userXmode–可选值:avg1(1),avg5(5分钟平均值),avg15(15分钟平均值)[<type>]type(仅Windows,其它系统忽略)ThevalueisacquiredbyeitherGetComputerName系统主机名称Stringvalue-可选值:()(fornetbios)orgethostname()(forhost)funnetbios(default)orhostctionsonWindowsandby“hostname”mandonothersystems.Thetypeparameterforthisitemissupportedsince1.8.6version.Examplesofreturnedvalues:onLinux:→linux-w7x1→onWindows:→WIN-SERV2008-I6[host]→Win-Serv2008-I6LonGSeealsoamoredetaileddescription..chassis[<info>]Example:.chassis[full]机架信息Stringvalueinfo-oneoffull(default),model,serial,typeorvendorHewlett-PackardHPPro3010SmallFormFactorPCCZXXXXXXXXDesktop]应为该值需要从内存中读取所以需要Root权限.SupportedsinceZabbixagentversion2.0..cpu[<cpu>,<info>]Example:.cpu[0,vendor]AuthenticAMDCPU信息Stringornumericvaluecpu-CPUnumberorall(default)info-oneoffull(default),curfreq,maxfreq,modelorvendorGathersinfofromcpuinfoanddevicescpu/[cpunum]cpuinfo_max_freq.IfaCPUnumberandcurfreqormaxfreqisspecified,anumericvalueisreturned(Hz).SupportedsinceZabbixagentversion2.0..devices[<type>]Example:.devices[pci]00:00.0Hostbridge:AdvancedMicroDevices[AMPCI或USB设备列表Textvaluetype-pci(default)orusbD]RS780HostBridge[..]Returnstheoutputofeitherlspciorlsusbutility(executedwithoutanyparameters)SupportedsinceZabbixagentversion2.0..macaddr[<interface>,<format>]Example:.macaddr["eth0$",full][eth0]00:11:22:33:44:55MAC地址清单Stringvalueinterface-all(default)oraregularexpressionformat-full(default)orshortListsMACadressesoftheinterfaceswhosenamesmatchthegiveninterfaceregex(“all”listsforallinterfaces).Ifformatisspecifiedasshort,interfacenamesandidenticalMACaddressesarenotlisted.SupportedsinceZabbixagentversion2.0.[<type>]utc-(default)thetimesincetheEpoch(00:00:00UTC,January1,1970)系统时间Integerorstringvalue.,measuredinseconds.local-thetimeinthe'yyyy-mm-dd,hh:mm:,+hh:mm'formatParametersforthisitemsupportedfromversion2.0.[mand,<mode>]Upto512KBofdatacanbereturned(64KBbeforeZabbix2.0.5),includingtrailingwhitespacethatistruncated.在主机上运行指定命令Textresultofthemand.mand-mandforexecutionmode-oneofwait(default,waitendofexecution),nowait(donotwait)Tobeprocessedcorrectly,theoutputofthemandmustbetext.Example:[ls-l/]-detailedfilelistofrootdirectory.Note:如果要使用此功能,agent的配置文件中必须要有EnableRemoteCommands=1选项.[resource,<type>]ent–该分区有权接收的处理单元(float)虚拟内存统计Numericvaluekthr,<type>-内核线程状态信息:r–运行的内核线程平均数(float)b-放在虚拟内存管理的等待队列中的内核线程平均数(float)memory,<type>-虚拟内存和实际内存的使用信息:avm–活动的虚拟页面(integer)fre–空闲列表大小(integer)page,<type>-错误页面和可用页面的信息:fi-fileinspersecond(float)fo-fileoutspersecond(float)pispagedinfrompagingspace(float)pospagedouttopagingspace(float)fr–释放的页面(pagereplacement)(float)srsscannedbyreplacementalgorithm(float)faults,<type>-trapandinterruptrate:in–设备中断(float)sy–系统调用(float)cs-kernelthreadcontextswitches(float)cpu,<type>-breakdownofpercentageusageofprocessortime:us-usertime(float)sy-systemtime(float)id–闲置时间(float)wa-在系统未完成磁盘/NFSI/O请求过程中的闲置时间(float)pc–消耗的物理处理器的数量(float)ec-消耗的授权容量的百分比(float)lbusy-indicatesthepercentageoflogicalprocessor(s)utilizationthatoccurredwhileexecutingattheuserandsystemlevel(float)app-示在共享池中的可用物理处理器(float)disk,<type>-磁盘统计:bps–每秒数据读写的字节数(integer)tps-indicatesthenumberoftransferspersecondthatwereissuedtothephysicaldisk/tape(float)Thisitemissupportedstartingfromversion1.8.1..arch软件架构StringvalueExample:.archi686Infoisacquiredfromuname()function.SupportedsinceZabbixagentversion2.0..os[<info>]Example:.os[short]Ubuntu2.6.35-28.50-generic1Infoisacquiredfrom(notethatnotallfilesare系统信息Stringvalueinfo-oneoffull(default),shortornamepresentinalldistributions):[full]-version[short]-version_signature[name]-SupportedsinceZabbixagentversion2.0..packages[<package>,<manager>,<format>]Example:.packages[mini,dpkg,short]python-minimal,python2.6-minimal,ubuntu-minimalLists(alphabetically)installedpackageswhosenamesmatchthegivenpackageregex(“all”liststhemall).Supportedpackagesmanagers:package-all(default)oraregularmanager(executedmand)expressiondpkg(dpkg--get-selections)已安装的包清单Textvaluemanager-all(default)orapackagepkgtool(lslog/packages)managerrpm(rpm-qa)format-full(default)orshortpacman(pacman-Q)Ifformatisspecifiedasfull,packagesaregroupedbypackagemanagers(eachmanageronaseperatelinebeginningwithit'snameinsquarebrackets).Ifformatisspecifiedasshort,packagesarenotgroupedandarelistedonasingleline.SupportedsinceZabbixagentversion2.0..in[<device>,<type>]device-deviceusedforswapping(dExamplekey:efaultisall).in[,pages]Swap(从设备到内存)Numericvaluetype–可选值:count(numberofswapins),sectors(sectorsswappedin),pages(pagesThesourceofthisinformationis:Linux2.4:swaps,partitions,statswappedin).SeesupportedbyplatfLinux2.6:ormfordetailsondefaults.swaps,diskstats,vmstat.out[<device>,<type>]device-deviceusedforswapping(dExamplekey:efaultisall).out[,pages]Swap(从内存到设备).Numericvaluetype–可选值:count(numberofswapouts),sectors(sectorsswappedout),pages(pagThesourceofthisinformationis:Linux2.4:swaps,partitions,statesswappedout).SeesupportedbyplLinux2.6:atformfordetailsondefaults.swaps,diskstats,vmstat.size[<device>,<type>]device-deviceusedforswapping(defaultisall)Swap空间大小.Numberofbytesorpercentage(百分比).type–可选值:free(freeswapspace,default),pfree(freeswapspace,inpercent),pused(usedswapspace,inpercent),Examplekey:.size[,pfree]-freeswapspacepercentageOldnaming:.free,.totaltotal(totalswapspace),used(usedswapspace)Exampleofreturnedvalue:主机的详细信息StringvalueFreeBSDlocalhost4.4-RELEASEFreeBSD4.4-RELEASE#0:TueSep1811:57::srcpile/GENERICi386系统正常运行时间NumberofsecondsInitemconfiguration,usesoruptimeunitstoge.treadablevalues..num登陆的用户数Numberofusers.whomandisusedontheagentsidetoobtainthevalue.Vfs文件系统.read[<device>,<type>,<mode>]device-diskdevice(defaultis“aIntegeriftypeisin:sectors,oper磁盘读取统计ations,bytesFloatiftypeisin:sps,ops,bpsll”1)type–可选值:sectors,operations,bytes,sps,ops,bps(mustbespecified,sincedefaultsdifferundervariousOSes).sps,ops,bpsstandfor:sectors,operations,bytespersecond,respectivelymode–可选值:avg1(1),avg5(5分钟平均值),avg15(15分钟平均值).Note:type是:sps,ops,bps的时候Examplekey:.read[,operations]Oldnaming:io[*]Usageofthetypeparametersops,bpsandspsonsupportedplatformsislimitedto8devices(7individualdevicesandone“all”).StartingwithZabbix2.0.1thislimitisincreasedto1024(1023individualdevicesandonefor“all”).SupportsLVMsinceZabbix1.8.6.UntilZabbix1.8.6,onlyrelativedevicenamesmaybeused(forexample,sda),since1.8.6anoptionalprefixmaybeused(forexample,sda)才支持<mode>参数.write[<device>,<type>,<mode>]device-diskdevice(defaultis“aExample:.write[,operations]Oldnaming:io[*ll”1)]type-oneofsectors,operations,bThetypeparametersops,bpsandspsonsupportedIntegeriftypeisytes,sps,ops,bps(mustspecifyexplatformsarelimitedto8devices(7individualin:sectors,operactlywhichparametertouse,sincedevicesandone“all”).StartingwithZabbix2磁盘写入统计ations,bytesdefaultsaredifferentundervario.0.1thislimitisincreasedto1024(1023indiviFloatiftypeisinusOSes).dualdevicesandonefor“all”).:sps,ops,bpssps,ops,bpsmeans:sectors,operaSupportsLVMsinceZabbix1.8.6.tions,bytespersecondrespectiveUntilZabbix1.8.6,onlyrelativedevicenamesmlyaybeused(forexample,sda),since1.8.6optionmode–可选值:alprefixmaybeused(forexample,sda)avg1(1),avg5(5分钟平均值),avg15(15分钟平均值).Note:type是:sps,ops,bps的时候才支持<mode>参数.cksum[file]Exampleofreturnedvalue:000文件校验通过Unix校验算法对文件校验.file–完整的文件路径Example:.cksum[passwd]Oldnaming:cksumThefilesizelimitdependsonlargefilesupport..contents[file,<encoding>]Example:.contents[passwd]获取文件内存文件内容file–完整的文件路径Thisitemislimitedtofilesnolargerthan64Kbytes.SupportedsinceZabbixagentversion2.0..exists[file]Example:.exists[]1–文件或链接存ThereturnvaluedependsonwhatS_ISREGPOSIXma校验文件是否存在在.file–完整的文件路径croreturns.0-otherwiseThefilesizelimitdependsonlargefilesupport..md5sum[file]Exampleofreturnedvalue:b5052decb577e0fffd622d6ddc017e82Example:MD5文件校验文件的MD5hash值.file–完整的文件路径.md5sum[localzabbix_]Thefilesizelimit(64MB)forthisitemwasremovedinversion1.8.6.Thefilesizelimitdependsonlargefilesupport..regexp[file,regexp,<encoding>]在文件中查找字符串在文件中查找匹配的字符串,如果没有匹配到则返回EOFfile–完整路径regexp-GNU正则表达式encoding–编码Onlythefirstmatchinglineisreturned.Example:.regexp[passwd,zabbix].regmatch[file,regexp,<encoding>]0–没有匹配到1–匹配到了file–完整路径regexp-GNU正则表达式encoding–编码FindstringinafileExample:.regmatch[log/,error].size[file]FilemusthavereadpermissionsforuserzabbixExample:.size[log/syslog]文件大小Sizeinbytes.file–完整的文件路径Thefilesizelimitdependsonlargefilesupport..time[file,<mode>]文件的时间信息.Unix时间戳.file–完整的文件路径mode-oneofmodify(default,modificationtime),access-lastaccesstime,change-lastchangetimeExample:.time[passwd,modify]Thefilesizelimitdependsonlargefilesupport..discovery挂载的文件系统列表.用于JSONobjectSupportedsinceZabbixagentversion2.0.low-leveldiscovery..inode[fs,<mode>]fs-filesystem节点数Numericvaluemode-oneoftotal(default),free,used,pfree(free,percentage),puExample:.inode[/,pfree]Oldnaming:.[*],.[*],.[*]sed(used,percentage).size[fs,<mode>]fs-filesystemIncaseofamountedvolume,diskspaceforlocalf磁盘空间Diskspaceinbytesmode-oneoftotal(default),free,used,pfree(free,percentage),puilesystemisreturned.Example:.size[/tmp,free]Oldnaming:.free[*],.total[*],.used[*],sed(used,percentage).pfree[*],.pused[*].size[<mode>]Oldnaming:.buffers,.cached,.free,.shared,.totalItem.size[]acceptsthreecategoriesofparameters.内存大小Memorysizeinbytesorinpercentagefromtotal字节数或百分比mode-oneoftotal(default),active,anon,buffers,cached,exec,file,free,inactive,pinned,shared,wired,used,pused,available,pavailableFirstcategoryconsistsoftotal-totalamountofmemory.Secondcategorycontainsplatform-specificmemorytypes:active,anon,buffers,cached,exec,file,free,inactive,pinned,shared,wired.Thirdcategoryareuser-levelestimatesonhowmuchmemoryisusedandavailable:used,pused,available,pavailable.Seeamoredetaileddescriptionof.sizeparameters.Web网站.get[host,<path>,<port>]host-hostname获取网页内容网页源码path-pathtoHTMLdocument(defaultis/)ReturnsEOFonfail.Example:.get[,,80]port-portnumber(defaultis80).perf[host,<path>,<port>]host-hostname完整的网页加载时间Timeinsecondspath-pathtoHTMLdocument(defaultis/)Returns0onfail.Example:.perf[,,80]port-portnumber(defaultis80).regexp[host,<path>,<port>,<regexp>,<length>]host-hostnamepath-pathtoHTMLdocument(defaul网页内容第一次正则匹配到的内容Matchedstringtis/)port-portnumber(defaultis80)regexp-GNUregularexpressionReturnsEOFonfail(nomatch).Example:.regexp[,,80,OK,2]length-maximumnumberofcharacterstoreturn5.2SNMP代理(SNMPAgent)通常打印机、网络交换机、路由器、UPS这些设备是无法配置为ZabbixAgent客户端,但他们默认都支持SNMPSNMPAgentZabbixServer配置中设置支持SNMP。5.3SNMP被动方式(SNMPTrap)5.4IPMI检测Zabbix可以对IPMI(IntelligentPlatformManagementInterface,智能平台接口)设备的健康状态和可用性进行监控。要使用IPMI功能ZabbixServer服务器必须在配置中设置对IPMI支持。IPMI是一个标准化的接口远程“lights-out”或“out-of-band”的计算机系统管理。它允许直接从所谓的“out-of-band”管理卡,独立于操作系统或机器是否开机时监控硬件状态。仅适用于具有IPMI支持(HPiLO,DELLDRAC,IBMRSA,SunSSP等)的设备的ZabbixIPMI监视。5.5简单检测简单的检查,通常用于远程代理服务检查。ZabbixAgent是没有必要做简单检查的,ZabbixServer负责处理简单检查。5.6日志文件监控Zabbbix可以用于被自动切割了的多个的日志文件的集中监控与分析。当一个日志文件包含特定的字符或者字符模式时,Zabbix向用户发送报警信息。要进行日志文件监控,以下是必须的Zabbix客户端代理(Zabbixagent)设置日志文件监控的监控项5.7计算监控它基于一个算术表达式,改值将被定期计算,得到数据将被存储在Zabbix数据库中,这意味着我们将为图形生成历史趋势数据。5.8内部检查内部检查允许监控Zabbix的内部。要使用此项则选择Zabbixinternal类型。内部检查是由ZabbixServer计算的。下表示所支持的检查项:5.9SSH检查SSH检查属于低限的代理监控,ZabbixAgent是不需要进行SSH监控的。要进行SSH检查之前要对ZabbixServer进行配置支持SSH2.5.10Telnet检查与SSH检查类似,Telnet检查也是低限的代理监控,ZabbixAgent也不需要进行Telnet检查。5.11外部检查外部检查是通过ZabbixServer运行一个shell脚本或二进制程序实现。外部检查不需要被监控主机上运行任何一种代理。5.12汇总检查汇总检查是直接通过ZabbixServer对数据库查询收集汇总的信息来实现。汇总检查不需要任何被监控主机上运行代理。5.13被动监控被动监控项目是接受输入数据而不是查询,它可以将任何有用的数据push到Zabbix。要使用被动监控项,你必须:在Zabbix里设置一个被动监控项目将数据发送到Zabbix5.14JMX监控JMX监控可以通过对JMX计数器来对JavaZabbix2.0添加了一个新的守护进程叫“ZabbixJavaGateway”的原生的JMX监控支持。5.15ODBC监控ODBC监控是对应在Zabbix前端里的数据库监控项。6触发器(Triggers)6.1概述详见:4.1.8触发器(Triggers)6.2配置触发器要配置一个触发器,按照下面的步骤点击:Configuration→Hosts在host那一行,点击trigger在右边点击Createtrigger(或者点击触发器的名称来编辑一个已经存在的触发器)在表单中输入触发器的参数Trigger标签所有必要的触发器属性:参数触发器名称

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论