Zabbix监控HP服务器硬件信息_第1页
Zabbix监控HP服务器硬件信息_第2页
Zabbix监控HP服务器硬件信息_第3页
Zabbix监控HP服务器硬件信息_第4页
Zabbix监控HP服务器硬件信息_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Zabbix监才$HP服务器硬件信息2014-05-1722:35:01标签:原创作品,允许转载,转载时请务必以超链接形式标明文章、作者信息和本声明。否则将追律法律责任。做为Linux系统工程师,在服务器的维护管理当中,除了对系统进行维护管理之外,最重要的还要对服务器的硬件进行监控,比如服务器Raid状态是否正常(如果Raid卡出问题,会影响数据的读写速度),服务器硬盘是否正常(如果硬盘坏掉,严重的情况会丢失数据),服务器电源是否有故障等。除此之外还要对服务器的CPU内存,处理器等重要设备的温度进行监控,如果温度超过服务器的临界温度则进行报警通知。HP的服务器在硬件管理方面提供了自己管理工具h

2、pacucli,通过该工具可以查看HP服务器的RAID信息,服务器硬盘等信息。1)安装hpacucli工具(下载地址:)1rootmonitor#rpm-ivh)查看服务器RAID信息,硬盘是否正常。1rootmonitor#hpacuclictrlallshowconfig2SmartArrayP410iinSlot0(Embedded)(sn:18042FF0)3arrayA(SAS,UnusedSpace:0MB)4logicaldrive1GB,RAID1,OK)5physicaldrive1I:1:1(port1I:box1:bay1,SAS,300GB,OK)6physicaldr

3、ive1I:1:2(port1I:box1:bay2,SAS,300GB,OK)3)通过hpacuclictrlallshowconfigdetail命令可以详细地查看RAID和硬盘的信息。1 rootmonitor#hpacuclictrlallshowconfigdetail2 SmartArrayP410iinSlot0(Embedded)3 BusInterface:PCI4 Slot:05 SerialNumber:18042FF06 CacheSerialNumber:PBCDH0CRH1FH627 RAID6(ADG)Status:Disabled8 ControllerStat

4、us:OK9 ChassisSlot:10HardwareRevision:RevC11FirmwareVersion:12RebuildPriority:Medium13ExpandPriority:Medium14SurfaceScanDelay:15secs15MonitorandPerformanceDelay:60min16ElevatorSort:Enabled17DegradedPerformanceOptimization:Disabled18InconsistencyRepairPolicy:Disabled19PostPromptTimeout:0secs20CacheBo

5、ardPresent:True21CacheStatus:OK22AcceleratorRatio:25%Read/75%Write23DriveWriteCache:Disabled24TotalCacheSize:512MB25No-BatteryWriteCache:Disabled26CacheBackupPowerSource:Capacitors27Battery/CapacitorCount:128Battery/CapacitorStatus:OK29SATANCQSupported:True30Array:A31InterfaceType:SAS32UnusedSpace:0

6、MB33Status:OK34LogicalDrive:135Size:GB36FaultTolerance:RAID137Heads:25538SectorsPerTrack:3239Cylinders:6553540StripeSize:128KB41Status:OK42ArrayAccelerator:Enabled43UniqueIdentifier:600508B000244DiskName:/dev/cciss/c0d045MountPoints:/boot99MB46LogicalDriveLabel:A00ADBD9PR7AMU1472898D47MirrorGroup0:4

7、8physicaldrive1I:1:1(port1I:box1:bay1,SAS,300GB,OK)49MirrorGroup1:50physicaldrive1I:1:2(port1I:box1:bay2,SAS,300GB,OK)51physicaldrive1I:1:152Port:1I53Box:154Bay:155Status:OK56DriveType:DataDrive57InterfaceType:SAS58Size:300GB59RotationalSpeed:1000060FirmwareRevision:HPD461SerialNumber:ECA1PC80GTS312

8、3462Model:HPEG0300FBDSP63PHYCount:264PHYTransferRate:,Unknown65physicaldrive1I:1:266Port:1I67Box:168Bay:269Status:OK70DriveType:DataDrive71InterfaceType:SAS72Size:300GB73RotationalSpeed:1000074FirmwareRevision:HPD775SerialNumber:PMX6902D76Model:HPEG0300FBDBR77PHYCount:278PHYTransferRate:,UnknownHP官方

9、还有一个hpasmcli管理工具,可以很详细查看服务器CPU内存,处理器,电源等的温度信息。1)安装hpasmcli工具(下载地址:1rootmonitor#rpm-ivh通过工具hpasmcli可以查看服务器各部件的温度信息,其中Tempft示各部件当前的温度,Threshold表示临界温度,当当前温度超过临界温度的时候就要注意啦。1 rootmonitor#hpasmcli-s'showtemp'2 SensorLocationTempThreshold4#1AMBIENT23C/73F42C/107F5#2CPU#140C/104F82C/179F6#3CPU#240C/

10、104F82C/179F7#4MEMORY_BD33C/91F87C/188F8#5MEMORY_BD33C/91F78C/172F9#6MEMORY_BD-87C/188F10#7MEMORY_BD32C/89F78C/172F11#8MEMORY_BD32C/89F87C/188F12#9MEMORY_BD32C/89F78C/172F13#10MEMORY_BD-87C/188F14#11MEMORY_BD32C/89F78C/172F15#12POWER_SUPPLY_BAY33C/91F59C/138F16#13POWER_SUPPLY_BAY47C/116F73C/163F17#1

11、4MEMORY_BD29C/84F72C/161F18#15PROCESSORZONE32C/89F73C/163F19#16PROCESSORZONE30C/86F64C/147F20#17MEMORY_BD28C/82F63C/145F21#18PROCESSOR_ZONE39C/102F69C/156F22#19SYSTEM_BD35C/95F69C/156F23#20SYSTEM_BD38C/100F71C/159F24#21SYSTEM_BD44C/111F65C/149F25#22SYSTEM_BD45C/113F71C/159F26#23SYSTEM_BD39C/102F69C/

12、156F27#24SYSTEM_BD47C/116F69C/156F28#25SYSTEM_BD35C/95F63C/145F29#26SYSTEM_BD45C/113F66C/150F30#27SCSI_BACKPLANE_ZONE35C/95F60C/140F31#28SYSTEM_BD73C/163F110C/230F3)通过hpasmcli-s'show'查看类似于help的帮助信息,监控的时候要重点关注DIMM(内存)、FANS%扇)、POWERSUPPLY模块)、SERVE鹰统)、CPUTEMP&度)等信息。1rootmonitor#hpasmcli-s&#

13、39;show2 InvalidArguments3 SHOWASR4 SHOWBOOT5 SHOWDIMMSPD6 SHOWF17 SHOWFANS8 SHOWHT9 SHOWIML10SHOWIPL11SHOWNAME12SHOWPORTMAP13SHOWPOWERMETER14SHOWPOWERSUPPLY16SHOWSERIALBIOS|EMBEDDED|VIRTUAL17SHOWSERVER18SHOWTEMP19SHOWTPM20SHOWUID21SHOWWOL4)hpasmcli几种常用的例子。查看内存信息:hpasmcli-s'showdimm'|egrep-i

14、'module|stat'查看风扇信息:hpasmcli-s'showfans'查看硬件温度:hpasmcli-s'showtemp'查看电源模块:hpasmcli-s'showpowersupply'查看机器型号,序列号,CPU,内存大小:hpasmcli-s'showserver'由于各种服务器的厂商不同,管理工具不同,因此Zabbix对服务器硬件方面没有很详细,全面的解决方案。之前dl528888写过zabbix通过omsa工具监控DEL务器,也是一种很好路思路,我也借鉴过,这里非常感谢。Zabbix监控总结

15、起来有两种思路:第一就是server通过agentd方式获取数据,这种方式需要定义UserParameter参数,即KEY第二就是server通过trapper的方式获取数据,即agentd将数据主动sender给server或者proxy。我这里是通过第二种traper的方式监控的。第种方式server有时候会取不至U数据,becamenotsupported:Receivedvalue口isnotsuitableforvaluetypeNumeric(unsigned)anddatatypeDecimal,会产生上面的错误。首先查看我监控的脚本,由于是通过traper的思路进行监控,log

16、_file文件依次定义了要监控服务器的主机名(hostname),监控项key以及监控的值。1rootmonitorscripts#cat2#!/bin/sh3#createbysfzhang4#ThisscriptsmonitoringHPserver,suchassmartarraystatus,Hardwareinformationandserv5ertemperature。6zabbix_server="*.*.*.*"#IPfromZabbixServerorproxywheredatashouldbesendto.zabbixsender="/usr/

17、local/zabbix/bin/zabbixsender"7log_file='/tmp/'#Inthefiletodefinethemonitorhost,keyandvalue8-9hpacucli='/usr/sbin/hpacucli1options='ctrlallshowconfigdetail'0hpacucli_log="/tmp/"1PATH=$PATH:/usr/sbin:/sbin1$hpacucli$options>$hpacucli_log12Cache_status='cat$hp

18、acuclUog|awk'/CacheStatus:/print$NF'、1Controller_status='cat$hpacucli_log|awk'/ControllerStatus:/print$NF'、3Battery_capacitor_status=、cat$hpacucli_log|awk'/BatteryVCapadtorStatus:/pri1nt$NF'、4Physicaldrive_status=$(awk-1vtotal='hpacuclictrlslot=0pdallshowstatus|grepph

19、ysicaldrive|wc-l'-5vnormal='hpacuclictrlslot=0pdallshowstatus|awk'/physicaldrive/if($NF="OK")count+=1ENDprintcount'、'BEGINif(total=normal)print"OK"elseprint"NO"')16Memory_status=$(awk-vtotal='hpasmcli-s'SHOWDIMM'|grep-i'Status'

20、;|wc-l'-vnormal='hpasmcli-1s'SHOWDIMM'|awk'/Status:/if($NF="Ok")count+=1ENDprintcount'、'BEGINif(total=normal)print"OK"elseprint"NO"')8Fans_status=$(awk-vtotal='hpasmcli-s'SHOWFANS'|grep"#"|wc-l'-vnormal='hpas

21、mcli-s'SHOWFANS'|awk'/#/if($3="Yes")count+=1ENDprintcount'、'BEGINif(total=norm1al)print"OK"elseprint"NO"')9Power_status=$(awk-vtotal='hpasmcli-s'SHOWPOWERSUPPLY'|grep"Powersupply"|wc-l'-2vnormal='hpasmcli-0s'SHOW

22、POWERSUPPLY'|awk'/Condition:/if($NF="Ok")count+=1ENDprintcount'、'BEGI2Nif(total=normal)print"OK"elseprint"NO"')1Processor_status=$(awk-vtotal='hpasmcli-s'SHOWSERVER'|grep"Processor:"|wc-l'-2vnormal='hpasmcli-2s'SHOWS

23、ERVER'|awk'/Status/if($NF="Ok")count+=1ENDprintcount'、'BEGINif(total=normal)print"OK"elseprint"NO"')23Power_temp_num=$(hpasmcli-s'SHOWTEMP'|awk'/POWER_SUPPLY_BAY/print$3'|awk-F"C"'print$1'|awk'BEGINmax=0if($1>

24、max)max=$1fiENDprintmax')24Ambient_temp_num=$(hpasmcli-s'SHOWTEMP'|awk'/AMBIENT/print$3'|awk-F"C"'print$1')25Cpu_temp_num=$(hpasmcli-s'SHOWTEMP'|awk'/CPU/print$3'|awk-F"C"'print$1'|awk'BEGINmax=0if($1>max)max=$1fiENDprint

25、max')26Memory_temp_num=$(hpasmcli-s'SHOWTEMP'|awk'/MEMORY_BD/print$3'|awk-F"C"'print$1'|awk'BEGINmax=0if($1>max)max=$1fiENDprintmax')7System_temp_num=$(hpasmcli-s'SHOWTEMP'|awk'/SYSTEM_BD/print$3'|awk-F"C"'print$1'|aw

26、k'BEGINmax=0if($1>max)max=$1fiENDprintmax')28Processor_temp_num=$(hpasmcli-s'SHOWTEMP'|awk'/PROCESSOR_ZONE/print$3'|awk-F"C"'print$1'|awk'BEGINmax=0if($1>max)max=$1fiENDprintmax')29echo$HOSTNAME$Cache_status>$log_file3echo$HOSTNAME$Controller_status>>$log_file0echo$HOSTNAME$Battery_capacitor_status>>$log_file3echo$HOSTNAME$Physicaldrive_status>>$log_file1echo$HOSTNAME$Memory_status>>$log_file32echo$HOSTNAME$Fans_status>>$log_file3echo$HOSTNAME$Power_status>>$log_file3echo$HOST

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论