F5-LTM--故障检测及信息收集_第1页
F5-LTM--故障检测及信息收集_第2页
F5-LTM--故障检测及信息收集_第3页
F5-LTM--故障检测及信息收集_第4页
F5-LTM--故障检测及信息收集_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、F5 LTM故障检测及信息收集这篇文章是介绍硬件故障的处理和报错信息的收集,用于向F5 SUPPORT提出RMA或DOA申请(软件以及系统设置方面的故障这里没有包括),综合现场工程师和我所经手处理过的故障现象,总结了F5提供的解决方案和现场处理方法,以及RMA处理的一些经验。主要分以下三个方面:l 常见故障现象l 故障处理和报错信息的收集l 注意事项一、 主要故障现象分为两个部分:V4.5系统和V9系统。V4.5系统对应的机型为 F5 1000、2400、5100系列。V9系统对应的机型为 F5 1500、3400、6400、6800系列1、 V4.5系统常见的故障现象l 电源故障l 风扇故障

2、l CF存储卡故障l 光纤端口故障l 系统启动故障2、 V9系统常见故障l 电源故障l 风扇故障l CPU温度过高的故障l 系统启动故障l 机器内部的板卡故障二、 故障处理和报错信息的收集1、对于V4.5的系统由于没有专项的检测程序,所以我们要收集以下主要内容:l QKVIEW的运行结果(机器能够启动进入OS)l LOG文件(机器能够启动进入OS)l 观察机器故障时的前面板状态灯的情况、风扇工作情况、电源和电源风扇的工作情况;l CONSOLE口的输出内容;l 有条件的话,对故障机器拍照(针对一些特殊的故障现象)。2、对于V9系统由于有硬件检测程序,我们主要收集以下内容:l 硬件检测程序 EU

3、D 的运行结果(机器能够启动或使用外置USB光驱运行);l CONSOLE口的输出内容l 观察机器故障时的前面板状态灯的情况、风扇工作情况、电源和电源风扇的工作情况以及前面板液晶屏幕的显示内容;l 有条件的话,对故障机器拍照(针对一些特殊的故障现象);l 启动进入系统后,运行一些命令的结果。3、 下面介绍一些针对不同故障的信息收集和一些常见故障的解决方法。(1) 电源故障现象:开机无反应、风扇不工作、CONSOLE口无输出等。这种故障比较明显,只需观察机器故障时的前面板状态灯、风扇工作情况、电源和电源风扇的工作情况以及前面板液晶屏幕的显示内容并记录下来即可。(2) 风扇故障现象:系统报警,提示

4、风扇错误,这种故障情况要观察风扇是否工作,因V4.5 的系统出现过风扇误报警的情况,针对这个情况工程师包宏宇已经提出了解决方法,具体现场操作时要分清情况区别处理。如风扇确实不工作或转速过低可运行/usr/local/bin/system_check d 命令并将运行结果保存起来,还要保存系统LOG文件以便用于RMA操作。 (3) CF卡有坏块(针对V4.5的系统)现象:系统提示文件系统故障。系统启动过程中,出现如下信息,可确认CF卡有错误。.numdirs is zero, try using an alternate superblockAutomatic file system check

5、 failed!Initiating automatic fsck -y.* /dev/rwd0gnumdirs i/var: filesystem not clean, cannot mount read/writes zero, try using an alternate s/var: filesystem not clean, cannot mount read/writeuperblock* FILE SYSTEM STILL DIRTY */dev/wd0g on /var: filesystem not clean, cannot mount read/write/dev/wd0

6、g on /var: filesystem not clean, cannot mount read/write对于这种故障,F5 SUPPORT要求在单用户模式下运行diskdefect命令来修复,具体命令如下:# /sbin/diskdefect -a -swcv wd0,执行后还要运行CompactFlash Repair Utility命令进行检测,命令为:#/sbin/hwtest/cfrepair wd0执行结果的最后三行如下:这说明还有2016个坏扇区* Sectors scanned: * Bad sectors found: 2016* Bad sectors fixed:

7、0需要将所作的过程和结果保存下来用于做RMA操作。(4) 光纤接口损坏现象:光纤连接中断,无数据流量,端口状态灯不亮。多出现于2400机型对于这种故障的确认缺乏有效的检测命令,要申报F5的RMA 需要收集qkview的运行结果,里面有各个网络接口的连接状态,现场有条件的话拍摄故障机器照片。其他网络接口故障的信息收集也与此相同。下面是我在维修操作间拍摄的一组照片,用于表明光纤接口2 .1故障(5) 系统启动故障现象:系统启动过程中止,console口输出信息如下:System is booting, please wait.Hit any key to stop autoboot: 0 kern

8、el.core_uses_pid = 0kernel.core_pattern = /var/core/%e.sccp.coreHost Console Shell - Press ( for command menu.对于这种故障可以进行的操作是通过网络重新安装系统,V9的系统还可以使用外置USB接口的CD-ROM/DVD来重新安装系统。如果无法重装系统则需申请F5公司的RMA操作。注:以上介绍的故障都是V4.5的系列为主,V9系列机型的故障检测相对容易,因为V9操作系统有了专用的硬件检测程序End User Diagnostics(EUD),所以故障的检测均以运行EUD为主。(6) CPU

9、温度过高造成系统挂起。现象:系统启动后报警,Cpu 1: temperature (99) is too high. 然后系统挂起。这个故障多见于6400系列,在其他机型也偶有出现。进入系统后要运行两个命令来确认故障点:#system_check d#b platform运行结果示例如下rootbigip:Active config # system_check -dCpu 1: temperature 26, fan_speed 6750Cpu 2: temperature 99, fan_speed 6750Chassis fan 101: status 1 - (good)Chassis

10、 fan 102: status 1 - (good)Chassis fan 103: status 1 - (good)Chassis fan 104: status 1 - (good)Chassis fan 105: status 1 - (good)Chassis fan 106: status 1 - (good)Chassis power supply 101: status 1 - (good)Chassis power supply 102: status 2 - (not present)Chassis temperature 101: temperature 35Chass

11、is temperature 102: temperature 28rootbigip:Active config # b platformPLATFORM INFORMATION -| Type D63a| Chassis: serial bips| 200 Level part number: 200-0215-03 REV B| Switch board: serial PCA0101MP8F9 part PCA-0101-01 REV A| Host board: serial TY6FB35A0063 part MOB-0018-03 REV A| Annunciator board

12、: serial part OEM-0029-05 REV A| base MAC: 00:01:D7:5E:5E:C0+- CPU 1 temp 26degC fan speed 6750rpm+- CPU 2 temp 99degC fan speed 6750rpm| CHASSIS TEMPERATURE| (101) 35degC (102) 27degC| CHASSIS FAN| (101) active (102) active (103) active (104) active (105) active| (106) active| POWER SUPPLY| (101) a

13、ctive (102) missing通过察看输出结果,可以看到这两个命令可以有效检测CPU温度和散热风扇的转速,机箱内部温度和风扇的状态以及电源工作情况。三、注意事项:1、 EUD的版本尽量使用最新的。因为旧版本的EUD对于F5公司新出的机器支持的不好,旧版本的EUD在检测第8项的时候会报错,例如9.1.2系统的EUD,而新版本则不会。下面为EUD的检测菜单:01 - Hardware Report02 - Run the switchboard CPLD tests03 - Verify switchboard I2C devices04 - Verify PCI devices05 -

14、Run the System Ram test06 - Run the LCD functionality test07 - Internal Packet Path test08 - Run the Disk Drive test09 - Run the PVAx memory tests10 - Run the SSL test11 - Run the FIPS test12 - Run the Compression test13 - S.M.A.R.T test14 - Run fsck on all drive partitions15 - Run all of the above applicable Non User Interactive tests16 - Run all of the above applicable tests17 - Display Test Report Log18 - Exit EUD Test and Reboot System2、 6400及以上机型的电源为可更换模块,对于此类机型申请电源故障的RMA请求,F5公司只更换电源模块。附件:V4.5系统如何进入单用户重新启动系统1. CMOS 检测之后,当显示BSD boot sequence

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论