hp_ux日常维护手册范本_第1页
hp_ux日常维护手册范本_第2页
hp_ux日常维护手册范本_第3页
hp_ux日常维护手册范本_第4页
hp_ux日常维护手册范本_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 HP-UX日常检查日常维护检查项目,主要由以下:机房环境 、硬件、 操作系统、备份以与应用 硬件1. 硬件主要从面板指示灯和服务器中各个扩展卡的指示灯来查看:面板指示灯:在大多数的服务器中,都有一个液晶面板或多个指示灯,用来显示服务器的运行状态。在系统出现故障时,液晶面板上会出现WARNING或FAULT的提示;WARNING 或FAULT的指示灯会亮。(1). 服务器中的各个扩展卡的指示灯 在服务器中存在多种扩展卡,例如SCSI卡、以太网卡等。这些卡上都有一个或多个指示灯,从这些指示灯可以了解这些卡的工作情况。 SCSI卡: 在正常情况下,自检灯(self test)应该是暗的; 终结电源

2、指示灯(Terminator PWR)应该是亮的。 以太网卡: 在正常情况下,自检灯(self test)应该是暗的; 连接灯(Link)是亮的。(2). 外设的状态大部分外设也都有自己的状态指示。下面是比较常见的几种:RAID磁盘阵列 : 该磁盘阵列有一个液晶面板。如果出现故障,在面板上会出现 WARNING提示信息。磁带库 : 磁带库一般也有一个液晶面板。如果出现故障,在面板上会出现报错提示信息。2. MP(管理处理器)是基于单元服务器的独立支持系统,可以连接到服务器组合系统。同时,还可以执行服务器硬件的管理或监视任务。主要功能包括:(1). 从MP上检查硬件PSps:显示详细的电源和硬件

3、配置状态(2). 从MP上检查硬件LSls:显示Lan连接的控制台(3). 从MP上检查硬件SYSREVSysrev:显示组合系统中所有固件实体的版本操作系统在这一部分,通过一些实用、简单的命令,检查系统的运行情况。在系统出现问题时,常常会在控制台上显示一些出错信息,应该定期检查这些信息,这往往是最便捷的方式。 系统日志 syslog.log,ccerrlog,eventlog, dmesg 系统运行状态 cmviewcl、bdf、ioscan、vgdisplay、top、sar、swapinfo、netstat (1). 系统日志-syslog.log系统日志:syslog是系统重起到当前的

4、日志,重起后将自动保存为OLDsyslog.log应检查的容:有无SCSI Reset告警(启动前后的SCSI reset信息可忽略)有无EMS告警。如: 09:43:05 bj_rz3 EMS 2286: - EMS Event Notification - Value: "SERIOUS (4)" for Resource: "/system/events/core_hw/core_hw" (Threshold: >= " 3") Execute the following command to obtain event d

5、etails: /opt/resmon/bin/resdata -R 149815298 -r /system/events/core_hw/core_hw -n 149815299 -a 凡是Value为Majorwarning、Serious或Critical的报警都应关注。有无“PV Powerfail、”IO error报错如有重起操作,建议保存当前的syslog日志(2). 系统日志-dmesg驻留在存中的系统最近一段时间的日志信息:$Revision: vmunix: vw: -proj selectors: CUPI80_BL2000_1108 -c 'Vw for CU

6、PI80_BL2000_1108 build' - cupi80_bl2000_1108 'CUPI80_BL2000_1108' Wed Nov 8 19:24:56 PST 2000 $ Memory Information: physical page size = 4096 bytes, logical page size = 4096 bytes Physical: 4177920 Kbytes, lockable: 3859368 Kbytes, available: 3859944 Kbytes Using 3162 buffers containing

7、24576 Kbytes of memory. 常见的异常信息: SCSI Reset Detected LPMC I-Cache error File System Full 发现后应与时察看syslog.log中的相应条目(3). 系统运行状态cmviewcl 观察双机状态,执行cmviewcl v,确认STATUS和STATE为up 和running,同时包自动切换(AUTO_RUN)属性为enableCLUSTER STATUS hpcluster up NODE STATUS STATE GMS_STATE bjscp1a up running halted Network_Para

8、meters: INTERFACE STATUS PATH NAME PRIMARY up 0/5/0/0 lan1 PRIMARY up 0/0/0/0 lan0 STANDBY up 1/12/0/0 lan2 PACKAGE STATUS STATE AUTO_RUN NODE scppkg up running enabled bjscp1a厖 NODE STATUS STATE GMS_STATE bjscp1b up running halted Network_Parameters: INTERFACE STATUS PATH NAME PRIMARY up 0/5/0/0 la

9、n1 STANDBY up 1/12/0/0 lan2 PRIMARY up 0/0/0/0 lan0 (4). 系统运行状态bdf检查文件系统的使用率Filesystem kbytes used avail %used Mounted on/dev/vg00/lvol3 204800 48168 155424 24% /dev/vg00/lvol1 295024 38856 226664 15% /stand/dev/vg00/lvol8 4706304 1523976 3157592 33% /var /dev/vg00/lvol7 1163264 708304 451464 61% /u

10、sr /dev/vg00/lvol4 204800 96408 107568 47% /tmp /dev/vg00/lvol6 1048576 766024 280360 73% /opt/dev/vg00/lvol5 1048576 4456 1036024 0% /home应检查有无使用率大于90%的文件系统(5). 系统运行状态-文件系统维护发现文件系统已满,应与时删除无用文件或扩大文件系统。可定期清理日志 :# /var/adm/syslog/syslog.log(系统日志)# /etc/rc.log(运行日志)# /var/adm/wtmp(登录成功日志)可清理(#>wtmp)

11、# /var/adm/btmp(登录失败日志)可清理(#>btmp)core 文件的清理(#find / -name core -exec rm 大文件(#find / -name -size +10000)注:以上文件确认无用后rm 删除 /var/adm/crash:核的卸入卸出目录。 核崩溃时映像文件会自动保存到这个目录下。该目录下的文件建议应该由hp的工程师删除.(6). 系统运行状态-ioscan fn 检察IO设备是否正常:Class I H/W Path Driver S/W State H/W Type Description=root 0 root CLAIMED BU

12、S_NEXUS ioa 0 0 sba CLAIMED BUS_NEXUS System Bus Adapter (803)ba 0 0/0 lba CLAIMED BUS_NEXUS Local PCI Bus Adapter (782)lan 0 0/0/0/0 btlan3 CLAIMED INTERFACE HP PCI 10/100Base-TX Core /dev/diag/lan0 /dev/ether0 ext_bus 0 0/0/1/0 c720 CLAIMED INTERFACE SCSI C895 Ultra Wide Single-Endedtarget 0 0/0/1

13、/0.1 tgt CLAIMED DEVICE disk 0 0/0/1/0.1.0 sdisk NO_HW DEVICE HP DVD-ROM 305 /dev/dsk/c0t1d0 /dev/rdsk/c0t1d0应检查有无状态为NO_HW的设备 (7). 系统运行状态vgdisplay显示卷组状态,重点检查vg00,执行vgdisplay v vg00- Volume groups -VG Name /dev/vg00VG Write Access read/write VG Status available Max LV 255 厖 - Logical volumes - LV Nam

14、e /dev/vg00/lvol1 LV Status available/syncd LV Size (Mbytes) 100 Current LE 25 Allocated PE 50 Used PV 2 厖 - Physical volumes - PV Name /dev/dsk/c4t0d0 PV Name /dev/dsk/c6t0d0Alternate Link PV Status available Total PE 12992 Free PE 0 Autoswitch Off 检查各项status值为available/sync,不是stale(8). 系统运行状态top观察

15、CPU和存使用情况CPU LOAD USER NICE SYS IDLE BLOCK SWAIT INTR SSYS 0 0.28 20.2% 0.0% 2.6% 77.2% 0.0% 0.0% 0.0% 0.0% 1 0.17 14.6% 0.0% 3.4% 82.0% 0.0% 0.0% 0.0% 0.0% 2 0.33 18.6% 0.0% 3.0% 78.4% 0.0% 0.0% 0.0% 0.0% 3 0.20 13.0% 0.0% 4.2% 82.8% 0.0% 0.0% 0.0% 0.0% 4 0.11 14.4% 0.0% 2.0% 83.6% 0.0% 0.0% 0.0% 0

16、.0% 5 0.44 19.8% 0.0% 4.2% 76.0% 0.0% 0.0% 0.0% 0.0% 6 0.28 13.2% 0.0% 11.2% 75.6% 0.0% 0.0% 0.0% 0.0% 7 0.17 14.8% 0.0% 1.8% 83.4% 0.0% 0.0% 0.0% 0.0% - - - - - - - - - -avg 0.25 0.0% 0.0% 0.0% 100.0% 0.0% 0.0% 0.0% 0.0% Memory: 1106604K (999800K) real, 1527608K (1362680K) virtual, 1987924K free Pa

17、ge# 1/6CPU TTY PID USERNAME PRI NI SIZE RES STATE TIME %WCPU %CPU COMMAND2 ? 18777 informix 156 20 7404K 5052K sleep 9233:02 30.49 30.43 oninit 6 ? 19002 tellin 154 20 29248K 22572K sleep 5256:03 17.05 17.02 manager0 ? 18779 informix 156 20 7404K 4784K sleep 1681:27 9.62 9.60 oninit 重点检查有无占用CPU过大的进程

18、,并检查free memory是否足够(9).系统运行状态-sar u 观察CPU使用情况: sar u M 3 1010:02:18 cpu %usr %sys %wio %idle10:02:21 0 37 2 1 60 1 18 5 1 75 2 15 10 2 72 3 9 4 2 85 4 21 3 1 75 5 23 2 4 70 6 10 4 3 83 7 15 5 1 79 system 19 5 2 75检查%idle是否足够(一般不小于25%) (10). 系统运行状态-sar v观察文件线程资源使用情况:sar v 3 10HP-UX bjscp1a B.11.00 U

19、9000/800 07/07/0310:02:48 text-sz ov proc-sz ov inod-sz ov file-sz ov 10:02:51 N/A N/A 189/664 0 2119/7360 0 1127/12018 010:02:54 N/A N/A 188/664 0 2102/7360 0 1121/12018 010:02:57 N/A N/A 187/664 0 2067/7360 0 1114/12018 010:03:00 N/A N/A 187/664 0 2037/7360 0 1108/12018 010:03:03 N/A N/A 187/664 0

20、 2033/7360 0 1108/12018 010:03:06 N/A N/A 187/664 0 2036/7360 0 1108/12018 010:03:09 N/A N/A 187/664 0 2033/7360 0 1108/12018 010:03:12 N/A N/A 188/664 0 2032/7360 0 1113/12018 010:03:15 N/A N/A 187/664 0 2032/7360 0 1108/12018 010:03:18 N/A N/A 187/664 0 2032/7360 0 1108/12018 0重点检查有无即将达到上限的值(11).系

21、统运行状态-sar d观察IO使用情况:sar d 3 10HP-UX bjscp1a B.11.00 U 9000/800 07/07/0310:03:18 device %busy avque r+w/s blks/s avwait avserv 10:03:21 c1t6d0 4.33 0.50 7 49 5.97 5.57 c2t6d0 3.67 0.50 6 43 5.86 4.78 c4t0d0 1.00 0.50 10 51 5.11 2.94 c4t0d1 1.67 0.50 11 53 4.49 3.27 c4t0d2 1.67 0.50 10 52 5.16 2.63 c4t0d3 1.67 0.50 16 75

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论