Linux系统管理员应该知道的20个系统监控工具讲解学习_第1页
Linux系统管理员应该知道的20个系统监控工具讲解学习_第2页
Linux系统管理员应该知道的20个系统监控工具讲解学习_第3页
Linux系统管理员应该知道的20个系统监控工具讲解学习_第4页
Linux系统管理员应该知道的20个系统监控工具讲解学习_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Good is good, but better carries it.精益求精,善益求善。Linux系统管理员应该知道的20个系统监控工具Linux系统管理员应该知道的20个系统监控工具需要监控Linux服务器系统性能吗?尝试下面这些系统内置或附件的工具吧。大多数Linux发行版本都装备了大量的监控工具。这些工具提供了能用作取得相关信息和系统活动的量度指标。你能使用这些工具发现造成性能问题可能原因。此次讨论到的工具只是分析和调试服务器下面问题时最基本工具中的一部分。1.找出瓶颈2.硬盘(存储)瓶颈3.CPU及内存瓶颈4.网络瓶颈#1:top-进程活动top提供一个当前运行系统实时动态的视图,

2、也就是正在运行进程。在默认情况下,显示系统中CPU使用率最高的任务,并每5秒钟刷新一次。图01.Linuxtop命令常用热键热键用途t显示摘要信息开关.m显示内存信息开关.A分类显示系统不同资源的使用大户。有助于快速识别系统中资源消耗多的任务。f添加删除所要显示栏位.o调整所要显示栏位的顺序.r调整一个正在运行的进程Nice值.k结束一个正在运行的进程.z彩色/黑白显示开关相关链接:HYPERLINK/tips/how-do-i-find-out-linux-cpu-utilization.htmlHowdoIFindOutLinuxCPUUtilization?译者推荐链接:HYPERLIN

3、K/imlidapeng/blog/item/c33b42e41170b925b83820e3.htmlLinux系统管理员必备工具系列之top(原创)#2:vmstat-系统活动、硬件及系统信息使用vmstat命令可以得到关于进程、内存、内存分页、堵塞IO、traps及CPU活动的信息。#vmstat3输出样例:procsmemoryswapiosystemcpurbswpdfreebuffcachesisobiboincsussyidwast000254098852218851304000023242419600100254098852218851304000007201199665109

4、90000025409565221885130400000011511569419500000254095652218851305000006111743910990000025409405221885130512000536118993210980000025384445221885130588000011871417419600000249006052218851306400001812531123519400显示内存使用详细信息#vmstat-m显示内存活动/不活动的信息#vmstat-a相关链接:HYPERLINK/tips/linux-resource-utilization-to-

5、detect-system-bottlenecks.htmlHowdoIfindoutLinuxResourceutilizationtodetectsystembottlenecks?译者推荐链接:HYPERLINK/imlidapeng/blog/item/51872329329ab8335243c1c9.htmlLinux系统管理员必备工具系列之vmstat(原创)#3:w-显示谁已登录,他们正在做什么?w命令显示系统当前用户及其运行进程的信息。#wusername#wvivek输出样例:17:58:47up5days,20:28,2users,loadaverage:0.36,0.26

6、,0.24USERTTYFROMLOGINIDLEJCPUPCPUWHATrootpts/04514:555.00s0.04s0.02svim/etc/resolv.confrootpts/4517:430.00s0.03s0.00sw#4:uptime-告诉系统已经运行了多久?uptime命令过去只显示系统运行多久。现在,可以显示系统运行多久、当前有多少的用户登录、在过去的1,5,15分钟里平均负载时多少。#uptime输入样例:18:02:41up41days,23:42,1user,loadaverage:0.00,0.00,0.001可以被认为是最优的负载值。负载是会随着系统不同改变得

7、。单CPU系统1-3和SMP系统6-10都是可能接受的。#5:ps-显示进程ps命令显示当前运行进程的快照。使用-A或-e显示所有进程。#ps-A输出样例:PIDTTYTIMECMD1?00:00:02init2?00:00:02migration/03?00:00:01ksoftirqd/04?00:00:00watchdog/05?00:00:00migration/16?00:00:15ksoftirqd/14881?00:53:28java4885tty100:00:00mingetty4886tty200:00:00mingetty4887tty300:00:00mingetty48

8、88tty400:00:00mingetty4891tty500:00:00mingetty4892tty600:00:00mingetty4893ttyS100:00:00agetty12853?00:00:00cifsoplockd12854?00:00:00cifsdnotifyd14231?00:10:34lighttpd14232?00:00:00php-cgi54981pts/000:00:00vim55465?00:00:00php-cgi55546?00:00:00bind9-snmp-stat55704pts/100:00:00psps与top非常相似,但ps提供更多的信息。

9、输出长格式#ps-Al输出附加全格式(显示进程在执行时传入的参数)#ps-AlF显示进程结构#ps-AlFH在进程后显示线程#ps-AlLm打印服务器上所有进程#psax#psaxu打印进程树#ps-ejH#psaxjf#pstree打印安全信息#ps-eoeuser,ruser,suser,fuser,f,comm,label#psaxZ#ps-eM查看使用Vivek用户名运行的进程#ps-Uvivek-uviveku设置自定义输出格式#ps-eopid,tid,class,rtprio,ni,pri,psr,pcpu,stat,wchan:14,comm#psaxostat,euid,ru

10、id,tty,tpgid,sess,pgrp,ppid,pid,pcpu,comm#ps-eopid,tt,user,fname,tmout,f,wchan只显示Lighttpd的进程ID#ps-Clighttpd-opid=或者#pgreplighttpd或者#pgrep-uvivekphp-cgi显示PID为55977的进程名称#ps-p55977-ocomm=找出消耗内存最多的前10名进程#ps-auxf|sort-nr-k4|head-10找出使用CPU最多的前10名进程#ps-auxf|sort-nr-k3|head-10#6:free-内存使用情况free命令显示系统中空闲的、已用

11、的物理内存及swap内存,及被内核使用的buffer。#free输出样例:totalusedfreesharedbufferscachedMem:123028969739664256323205231245154740-/+buffers/cache:40618008241096Swap:105224801052248相关链接:HYPERLINK/faq/linux-check-the-size-ofsize/LinuxFindOutVirtualMemoryPAGESIZEHYPERLINK/faq/cpu-usage-limiter-for-linux/LinuxLimitCPUUsage

12、PerProcessHYPERLINK/tips/how-much-ram-does-my-linux-system.htmlHowmuchRAMdoesmyUbuntu/FedoraLinuxdesktopPChave?#7:iostat-CPU平均负载,硬盘活动iostat命令可报告中央处理器(CPU)的统计信息,各种设备、分区及网络文件系统输入/输出的统计信息。#iostat输出样例:Linux2.6.18-128.1.14.el5(www03.nixcraft.in)06/26/2009avg-cpu:%user%nice%system%iowait%steal%idle3.500.0

13、90.510.030.0095.86Device:tpsBlk_read/sBlk_wrtn/sBlk_readBlk_wrtnsda22.0431.88512.0316193351260102868sda10.000.000.002166180sda222.0431.87512.0316189010260102688sda30.000.000.0016150相关链接:HYPERLINK/faq/howto-linux-track-nfs-client-disk-metrics/LinuxTrackNFSDirectory/DiskI/OStats#8:sar-搜集和报告系统活动sar命令用来

14、搜集、报告和储存系统活动信息。查看网路计数器,输入:#sar-nDEV|more显示最近24小时网络计数器#sar-nDEV-f/var/log/sa/sa24|more你亦可以用sar显示实时情况#sar45输出样例:Linux2.6.18-128.1.14.el5(www03.nixcraft.in)06/26/200906:45:12PMCPU%user%nice%system%iowait%steal%idle06:45:16PMall2.000.000.220.000.0097.7806:45:20PMall2.070.000.380.030.0097.5206:45:24PMall

15、0.940.000.280.000.0098.7806:45:28PMall1.560.000.220.000.0098.2206:45:32PMall3.530.000.250.030.0096.19Average:all2.020.000.270.010.0097.70相关链接:HYPERLINK/tips/howto-write-system-utilization-data-to-file.htmlt_blankHowtocollectLinuxsystemutilizationdataintoafile#9:mpstat-多处理器使用率mpstat命令可以显示所有可用处理器的使用情况

16、,处理器编号从0开始。mpstat-PALL显示每个处理器的平均使用率。#mpstat-PALL输出样例:Linux2.6.18-128.1.14.el5(www03.nixcraft.in)06/26/200906:48:11PMCPU%user%nice%sys%iowait%irq%soft%steal%idleintr/s06:48:11PMall3.500.090.340.030.010.170.0095.861218.0406:48:11PM03.440.080.310.020.000.120.0096.041000.3106:48:11PM13.100.080.320.090.0

17、20.110.0096.2834.9306:48:11PM60.020.000.110.0095.250.0006:48:11PM33.770.110.380.030.010.240.0095.4644.8006:48:11PM42.960.070.290.040.020.100.0096.5225.9106:48:11PM53.260.080.280.030.010.100.0096.2314.9806:48:11PM64.000.100.340.010.000.130.0095.423.7506:48:11PM73.300.110.390.030.010.460.0

18、095.6976.89相关链接:HYPERLINK/faq/linux-mpstat-command-report-processors-related-statistics/t_blankLinuxdisplayeachmultipleSMPCPUprocessorsutilizationindividually.#10:pmap-进程的内存使用pmap命令可以显示进程的内存映射,使用这个命令可以找出造成内存瓶颈的原因。#pmap-dPID显示PID为47394进程的内存信息。#pmap-d47394输出样例:47394:/usr/bin/php-cgiAddressKbytesModeOf

19、fsetDeviceMapping00000000004000002584r-x-0000000000000000008:00002php-cgi0000000000886000140rw0000000000286000008:00002php-cgi00000000008a900052rw00000000008a9000000:00000anon0000000000aa800076rw00000000002a8000008:00002php-cgi000000000f6780001980rw000000000f678000000:00000anon000000314a600000112r-x

20、-0000000000000000008:00002ld-2.5.so000000314a81b0004r000000000001b000008:00002ld-2.5.so000000314a81c0004rw000000000001c000008:00002ld-2.5.so000000314aa000001328r-x-0000000000000000008:00002libc-2.5.so000000314ab4c0002048000000000014c000008:00002libc-2.5.so.00002af8d48fd0004rw0000000000006000008:0000

21、2xsl.so00002af8d490c00040r-x-0000000000000000008:00002libnss_files-2.5.so00002af8d49160002044000000000000a000008:00002libnss_files-2.5.so00002af8d4b150004r0000000000009000008:00002libnss_files-2.5.so00002af8d4b160004rw000000000000a000008:00002libnss_files-2.5.so00002af8d4w-s-00000000000

22、00000000:00009zero(deleted)00007fffc95fe00084rw00007ffffffea000000:00000stackffffffffff60000081920000000000000000000:00000anonmapped:933712Kwriteable/private:4304Kshared:768000K最后一行非常重要:*mapped:933712K内存映射所占空间大小*writeable/private:4304K私有地址空间大小*shared:768000K共享地址空间大小相关链接:HYPERLINK/tips/howto-find-mem

23、ory-used-by-program.htmlt_blankLinuxfindthememoryusedbyaprogram/processusingpmapcommand#11和#12:netstat和ss-网络相关信息netstat可以显示网络链接、路由表信息、接口统计信息、伪装链接和多播成员(multicastmemberships),ss命令用来显示网络套接字信息,它允许显示类似netstat一样的信息。关于ss和netstat使用,可参考下列资源。相关链接:HYPERLINK/tips/linux-investigate-sockets-network-connections.ht

24、mlss:DisplayLinuxTCP/UDPNetworkandSocketInformationHYPERLINK/tips/netstat-command-tutorial-examples.htmlGetDetailedInformationAboutParticularIPaddressConnectionsUsingnetstatCommand#13:iptraf-网络实时信息iptraf是一个可交互式的IP网络监控工具。它可以生成多种网络统计信息包括:TCP信息、UDP数量、ICMP和OSPF信息、以太网负载信息、节点状态、IP校验错误等。有下面几种信息格式:不同网络TCP链接

25、传输量不同网络接口IP传输量不同协议网络传输量不同TCP/UDP端口和不同包大小网络传输量不同第二层地址网络传输量图02:一般接口信息:不同网络接口IP传输量图03:不同网络TCP链接传输量#14:tcpdump:详细的网络流量分析tcpdump是一个简单网络流量转储工具,然而要使用好需要对TCP/IP协议非常熟悉。例如要显示关于DNS的网络流量,输入:#tcpdump-ieth1udpport53显示所有进出80端口IPv4HTTP包,也就是只打印包含数据的包。例如:SYN、FIN包和ACK-only包输入:#tcpdumptcpport80and(ip2:2-(ip0&0 xf)2)!=0

26、)显示所有到的FTP会话,输入:#tcpdump-ieth1dstand(port21or20显示所有到的HTTP会话#tcpdump-nieth0dstandtcpandporthttp用wireshark浏览转储文件中的详细信息,输入:#tcpdump-n-ieth1-s0-woutput.txtsrcordstport80#15:strace-系统调用追踪系统调用和型号,这对于调试Web服务器和其他服务器非常有用。HYPERLINK/tips/linux-strace-command-examples.htmlt_blank了解怎样追踪进程和他功能。#16:/proc文件系统-各种内核信

27、息/proc目录下文件提供了很多不同硬件设备和内核的详细信息。更多详情参见HYPERLINK/files/linux-kernel/Documentation/filesystems/proc.txtLinuxkernel/proc。一般/proc例如:#cat/proc/cpuinfo#cat/proc/meminfo#cat/proc/zoneinfo#cat/proc/mounts#17:Nagios-服务器及网络监控HYPERLINK/t_blankNagios是一款非常流行的系统及网络监控软件。你可以轻松监控所有的主机、网络设备及服务。它能在发生故障和重新恢复后发送警讯。FAN是FullyAutomatedNagios的缩写。FAN的目标就是由Nagios社群提供Nagios的安装。为了使安装Nagios服务器更加容易,FAN提供一个标准ISO格式的光盘镜像。此发行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论