IBM小型机常见故障的基本定位_第1页
IBM小型机常见故障的基本定位_第2页
IBM小型机常见故障的基本定位_第3页
IBM小型机常见故障的基本定位_第4页
IBM小型机常见故障的基本定位_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、故障的定义.找出系统发生了什么。系统现在能做什么?不能做什么?.故障是什么时候发生的?.平时做了别的工作吗?.故障有规律吗?计时还是不规则?发生频率是多少?.一台机器坏了,还是多台机器坏了?症状相同吗?.最近有变化吗?新硬件,安装软件后,系统的某些设置已更改。收集两个茄子故障信息1)故障信息收集对于判断和诊断故障原因而言,系统维修至关重要。2)系统故障记录(errorlog)Errdemon进程在系统启动时自动运行记录包括硬件、软件和其他操作信息故障日志文件是/var/adm/ras/errlog,可以备份或复制到其他系统进行分析使用Errpt命令(也可以使用最终用户权限)#errpt |mo

2、re列出简单的错误消息error _ id timestamp t c resource _ name error _ description192 AC 071 0723100300 t0 err demon error logging turned off0e 017 ed 1 0720131000 p h me m2 memory failure9 DBC fdee 070100000 t0 err demon error logging turned on038f 2580 0624131000u h sc磁盘0 undetermined erroraa8ab 241 04051309

3、00t o operator operator notificationTIMESTAMP: MMDDHHMMYY(月、日、年)t(类型): P永久;t临时U未知(永久错误应注意)c(分类): H硬件;s软件O用户未知#errpt -d H列出所有硬件错误消息#errpt -d S列出所有软件错误消息#errpt -aj ERROR_ID列出详细的错误信息# errpt -aj 0502f666 - ERROR_ID可以同时使用大小写示例:标签: SCSI _ err1ID: 0502F666date/time : jun 19 22:29:51Sequence Number: 95机器ID:

4、 123456789012节点id :主机1Class: HType: PERMResource Name: scsi0Resource class :适配器资源类型3360 hscsi位置: 00-08VPD: -虚拟产品数据Device driver level.00Diagnostic Level.00 00Displayable message.SCSIEc level.c25928Frunumber.30f 8834制造程序。.IBM 97f零件编号(Part number).59f 4566Serial number.00002849Ros级别和id.24Read/Write Re

5、gister Ptr.0120DescriptionADAPTER ERRORProbable CausesADAPTER HARDWARE CABLEcable terminator deviceFailure Causes适配器(软件)CABLE LOOSE OR DEFECTIVERecommended Actionsperform problem determination proceduresCHECK CABLE AND ITS CONNECTIONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000

6、0000 0000 00003)控制面板上的指示灯代码.8位代码,通常系统故障指示灯同时亮起。某些型号还显示出现故障的设备位置代码。.4位代码(通常为Exxx)。.3位数的代码,通常是0yyy,只能看到最后3位。.8位和4位代码可查看系统服务手册。3位数代码可查看“diagnostic information for multiple bus system(系统诊断指南)”。闪烁的888,由系统崩溃、硬件或软件原因引起。按Reset键显示更多内容。888-102通常是软件故障(888-102-207例外)系统生成dump。888-102-xxx-0C9系统正在执行dump。请等一下。888-1

7、02-xxx-0C0系统dump已完成,可以关闭电源并重新启动。888-103或105硬件故障,通常有SRN代码和位置代码。4)系统管理服务(SMS)错误日志记录如何进入SMS菜单如果控制台上出现键盘图标(指示灯牙齿显示E1F1),请按1键。选择“实用程序”选择“错误日志”以复制8位错误代码(在SMS中,您还可以更改系统引导顺序表。)5)邮件#mail向根用户发送邮件报告以报告错误消息。一般而言,如果系统故障后未进行检查更正,则定期通知root。6)运行故障诊断程序(诊断程序)检查和诊断系统硬件。发现硬件故障时,应立即使用diag#diag选择“Advance Diagnostic(高级诊断)

8、”“Problem Determination(问题诊断)”或系统验证选项(System Verification)(选择PD将分析系统错误记录。)运行Diag时,将提供SRN代码、故障设备名称和百分比以及地址代码。对于PCI型号,必须在系统错误报告7天内运行diag程序来分析错误记录中的sense数据。7)收集系统信息的其他命令关于Lsdev -C系统设备# lsdev-cc磁盘Hdisk 0 available 00-06-00-2,0 4.5gb 16位SCSI磁盘驱动器Hdisk 1 available 00-06-00-1,0 4.5gb 16位SCSI磁盘驱动器Hdisk 2 de

9、fined 00-06-00-4,0 16位SCSI磁盘驱动器查看Lspv物理卷信息#lspvHdisk0 0007821160af3d76 rootvgHdisk1 000782117f571294 rootvgHdisk2 0000000045c45bde datavg查看Lsvg卷组信息#lsvg datavgvolume group : datavg VG identifier : 00000055 e 2458 bVg state : active PP size 3360 4兆字节(s)VG permission 3360 read/write total PPS : 2169(8

10、676兆字节)最大LVS : 256 free PPS : 1 (4兆字节)Lvs : 3 used PPS : 2168 (8672兆字节)open LVS : 2 quad 3360 2total PVS : 1 VG descriptors : 2STALE PVs: 0 STALE PPs: 0 0ACTIVE PVs: 1 AUTO ON:是最高PPS per pv: 2032最高PVS 3360 16#lsvg -l rootvgRootvg:LV name type LPS PPS PVS LV state mount pointHd5引导1 1 1 closed/syncd n

11、/a.lv00 jfs 51 102 1 closed/stale/IBM cxxlv01 jfs 1 1 open/syncd/CICS _ regionsLv02 jfs 4 4 1 open/syncd /var/mqm查看Lslpp档案组信息# lslpp -L |grep 23100020。devices . PCI . 23100020 . rte 4 . 3 . 2 . 7 c IBM PCI 10/100以太网适配器确定是否安装了档案组,如以太网卡驱动程序。也用于查询补丁程序版本。查看Lsattr设备参数设置# lsattr -El ent2busio0x 7 ffc 00 b

12、us I/o address falseBusintr 9 Bus interrupt level Falseintr _ priority 3 interrupt priority falsetx _ que _ size 512 transmit queue size truerx _ que _ size 256 receive queue size truerx buf _ pool _ size 384 receive buffer pool size truemedia _ speed 10 _ half _ duplex media speed trueuse _ alt _ a

13、ddr no enable alternate Ethernet address truealt _ addr0x 0000000000 alternate Ethernet address trueIp_gap 96 Inter-Packet Gap True查看Lscfg VPD信息(Virtual Product Data)# lscfg -vl ssa1DEVICE LOCATION DESCRIPTIONSsa1 30-68 IBM SSA增强raid适配器(14104500)零件编号(Part number).097h 0645Frunumber.097h0645 -备件编号Ser

14、ial number.c8217227Ec level.0000f 20825制造程序。.IBM 053Ros级别和id.7201-微码版本Loadable Microcode Level。04Device driver level.00Displayable message.SSA到适配器Device specific.(z0).dram=032Device specific.(Z1).cache=0Device specific.(z2).00000062955 dab2Device specific.(yl).p2-i7-插槽编号VPD因硬件设备而异,格式和信息也不同。一般备件编号和微码

15、版本最有参考价值。注:现场更换部件(FRU)是实际备件编号。3茄子硬件故障定位方法IBM SFF错误定位方法包括SFF I/O机柜的显示器面板中的Checkpoints信息、错误代码和SRNs。Checkpoints检查点是系统电源CMOS初始化节目(牙齿运行初始程序加载(IPL)后,I/O机柜的显示器面板中显示的一系列信息)。IPL流程交流电源连接到系统后,IPL流程开始,IPL流程包含四个步骤。.初始化phase 1:服务处理器Phase 1在交流电源连接到系统后开始,直到OK显示在I/O机柜的显示器面板中。牙齿阶段显示8xxx或9xxx检查点代码。.初始化由Phase 2:服务处理器驱动的硬件Phase 2从按I/O机柜中的白色电源开关开始。牙齿步骤显示9xx检查点。91FF是最后一个代码,标记第三步的开始.初始化phase:系统固件在第3阶段,系统处理器接管控制并继续初始化系统资源。牙齿阶段显示Exxx。E105用最后一个代码标记步骤4 AIX引导的开始。在牙齿过程中,还会显示各种位置代号(位置代号表示系统的各个部分).启动phase43360 AIXAIX启动后,显示面板的代码为0xxx,位置代码出现在第二行。当AIX登

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论