版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、IBM 小型机日常管理与故障处理第1页,共47页。内容提要系统健康检查HMC的使用ASMI 的使用常用操作故障的处理IBM 服务热线第2页,共47页。系统健康检查第3页,共47页。系统健康检查巡检用户:xunjian(普通权限)。至/tmp/xunjian/ 目录下执行common_check.sh脚本。查看输出的日志:more pxxx20160920.log,进行系统的状态查看。第4页,共47页。系统健康检查检查文件系统查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX的基本文件系统。如/ (根文件系统)满则会导致用户不能登录。# df -k (查看AIX的基本文件
2、系统)Filesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 24576 1452 95% 2599 22% /dev/hd2 614400 28068 96% 22967 15% /usr/dev/hd9var 8192 4540 45% 649 32% /var/dev/hd3 167936 157968 6% 89 1% /tmp/dev/hd1 16384 5332 68% 1402 35% /home第5页,共47页。系统健康检查查看卷组信息lsvg -l vg_name有没有stale状态的逻辑卷。用syn
3、cvg 命令修复。# smitty syncvgLV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 2 2 closed/syncd N/Ahd6 paging 48 96 2 open/syncd N/Apaging00 paging 32 64 2 open/syncd N/Ahd8 jfslog 1 2 2 open/syncd N/Ahd4 jfs 1 2 2 open/stale /hd2 jfs 32 64 2 open/syncd /usrhd9var jfs 5 10 2 open/syncd /varhd3 jfs
4、4 8 2 open/syncd /tmphd1 jfs 1 2 2 open/syncd /home第6页,共47页。系统健康检查网络检查netstat -i 查看网卡状态Ierrs/Ipkts 和 Oerrs/Opkts是否1%ping host_name /IP Address查看是否通和是否有丢包。路由表#netstat -rn查看路由表是否正确,ping 各路由器是否通。核 对 主 机 名#hostname第7页,共47页。系统健康检查#ifconfig -aen0: flags=4e080863inet 172.40.10.31 netmask 0 xffff0000 broadc
5、ast 172.40.255.255lo0: flags=e08084binet 127.0.0.1 netmask 0 xff000000 broadcast 127.255.255.255inet6 :1/0第8页,共47页。系统健康检查#lsattr El inet0authm 65536 Authentication Methods Truehostname qtsms Host Name Truegateway Gateway Trueroute net,0,172.40.10.1 Route Truebootup_option no Serial Optical Network I
6、nterface Truerout6 FDDI Network Interface Trueroute属性是否有相应的路由信息。格式为:net,0,172.16.23.81如果没有缺省路由,执行命令:#chdev l inet0 a route=0,172.16.23.81其中172.16.23.81为网关如果缺省路由不正确,则先删除路由,再增加缺省路由:#chdev l inet0 a delroute= net,0,133.16.23.81#chdev l inet0 a route=0,172.16.23.81第9页,共47页。系统健康检查系统故障记录(errorlog)errdemon
7、 进程在系统启动时自动运行记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析errpt 命令的使用(普通用户权限也可使用)第10页,共47页。系统健康检查第11页,共47页。系统健康检查第12页,共47页。系统健康检查第13页,共47页。HMC的使用第14页,共47页。Hardware Management Console进行P系列小型机的硬件管理、维护,以及逻辑分区的划分等必须配置HMC对其进行管理如果需要划分逻辑分区,则必须配置HMCHMC通过TCP/IP与需要管理的主机进行连接HMC 使用第15页,共47页。HMC 使用
8、 操作界面第16页,共47页。HMC 使用 操作界面第17页,共47页。HMC 使用 操作界面第18页,共47页。HMC 使用 操作界面第19页,共47页。HMC 使用 操作界面第20页,共47页。HMC 使用 操作界面第21页,共47页。HMC 使用 操作界面点击关闭事件第22页,共47页。HMC 使用 操作界面点击机器前面板黄灯第23页,共47页。ASMI的使用第24页,共47页。ASMI的使用Advanced System Management Interface 硬件故障信息硬件设备信息硬件状态信息CUoD可以在任何时候访问(机器在Power Off状态,或者Operating 状态)
9、第25页,共47页。ASMI的使用 连接方式HMC GUI使用硬件管理终端访问网页模式使用PC或笔记本,用网线连接到负责HMC和FSP通信的交换机、或者HUB上通过浏览器,输入FSP的IP地址即可访问ASMI串口模式使用串口线链接到串口,可访问字符界面ASMI第26页,共47页。ASMI的使用 连接方式第27页,共47页。ASMI的使用 访问界面(Web)第28页,共47页。ASMI的使用 访问界面(Web)第29页,共47页。常用操作第30页,共47页。常用操作-HACMP的操作HACMP的操作启动:smitty clstart停止:smitty clstop启动/停止过程可以查看/tmp/
10、hacmp.out文件:#tail f /tmp/hacmp.out 检查Cluster是否运行正常Cluster进程是否运行:#lssrc g cluster,至少两个进程,且为active。IP地址是否获取:#netstat i,看boot IP是否变为service ip。VG是否varyon:#lsvg o文件系统是否mount:#mount应用进程是否启动:#ps ef | grep app_name第31页,共47页。常用操作-HACMP的操作HACMP相关日志/usr/adm/cluster.log; 以事件为单位的纪录/tmp/hacmp.out; 详细记录/usr/sbin/
11、cluster/history/cluster.mmdd; 历史纪录第32页,共47页。常用操作-HACMP的操作使用clstat -o 命令查看hacmp的状态第33页,共47页。常用操作-HACMP的资源切换smitty hacmp-System Management (C-SPOC)-Resource Group and Applications-Move Resource Groups to Another Node第34页,共47页。常用操作-HACMP的资源切换第35页,共47页。Administration GuideConcepts and Facilities GuideHA
12、CMP Troubleshooting GuidePlanning and Installation Guide 以上文档可以在随机所带的光盘上找到常用操作-HACMP参考文档第36页,共47页。故障处理第37页,共47页。故障处理-故障的定义弄清楚系统发生了什么问题系统现在能做什么?不能做什么?故障什么时候发生的?有没有做平时不同的操作?故障有没有规律?定时还是不定时?发生的频率有多高?是一台机器出现故障还是多台机器故障?故障现象是否相同?最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置(如 HACMP配置)等 。第38页,共47页。故障处理-故障信息的收集收集故障信息对于判断
13、、诊断故障原因,修复系统非常重要。系统故障记录(errorlog)errdemon 进程在系统启动时自动运行记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析errpt 命令的使用(普通用户权限也可使用)第39页,共47页。故障处理-故障信息的收集 HMC Service focal point记录了连接在此台HMC上的所有P系列主机的硬件报错信息。选择“Service focal point“,选择“Manage Serviceable Events“。可以根据主机、机柜序列号进行查询#mail系统会向root用户发mail
14、报告出错信息。通常系统出现故障后没有进行检查修复,系统会定时提醒root第40页,共47页。故障处理-故障信息的收集其他用于收集系统信息的命令lsdev -C 系统设备信息#lsdev -Cc diskhdisk0 Available 00-06-00-2,0 4.5 GB 16 Bit SCSI Disk Drivehdisk1 Available 00-06-00-1,0 4.5 GB 16 Bit SCSI Disk Drivehdisk2 Defined 00-06-00-4,0 16 Bit SCSI Disk Drive lspv 查看物理卷信息#lspvhdisk0 0007821160af3d76 rootvghdisk1 000782117f571294 rootvghdisk2 0000000045c45bde datavglsvg 查看卷组信息第41页,共47页。故障处理-故障信息的收集第42页,共47页。故障处理-故障信息的收集第43页,共47页。故障处理-故障信息的收集第44页,共47页。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工地应急救援预案及演练方案
- 工程项目劳务冲突处理方案
- 2025年兰溪市慢性病综合防制和监测业务技术培训班试题附答案
- 2025年抗菌药物的合理使用培训考核试题附答案
- 2024年工业锅炉G1证理论考试练习题附答案
- 突发公共公共卫生事件报告流程
- 2025年产品经理国际资格认证考试产品伦理道德试卷及答案
- 养老院健康检查与疾病预防制度
- 2026年碳交易代理项目投资计划书
- 2026年锂电池极片涂布设备项目公司成立分析报告
- 消防维保计划实施方案
- 学堂在线 雨课堂 学堂云 新闻摄影 期末考试答案
- 新疆阿合奇托什干河国家湿地公园建设项目环境影响报告书
- 维修工作计划模板范文
- DB13(J)-T 8401-2021 钢丝网片复合保温板应用技术标准
- 设计公司部门领导发言稿
- 深圳科技馆新馆展教工程常设展区整体展教方案
- 《重庆市北碚区高标准农田建设规划2021-2030年》
- T-CI 451-2024 构网型光伏变换器并网技术规范
- 《公路工程预算定额》(JTGT3832-2018)
- 粤港车牌合同模板
评论
0/150
提交评论