AIX系统软硬件问题征兆及解决办法.doc_第1页
AIX系统软硬件问题征兆及解决办法.doc_第2页
AIX系统软硬件问题征兆及解决办法.doc_第3页
AIX系统软硬件问题征兆及解决办法.doc_第4页
AIX系统软硬件问题征兆及解决办法.doc_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一部分、系统启动问题cfgmgr : configures devices and optionally installs device software into the systemlast : display all the previous logins and logoffs that still have entries in /var/adm/wtmp fileuptime : show how long the system has been up要在maintenance mode作 installing new or updated software and running diagnostic checksalog : trace the boot process and find out if sht went wrong,alog命令调用rc.boot脚本将启动信息导入/var/adm/ras/bootlog中# alog -L 显示定义在alog Database中的logs# alog -o -t 显示启动日志cfgmgr命令:在系统启动阶段,cfgmgr命令配置对使用系统必须的所有设备系统启动包括两个阶段:阶段一: cfgmgr f 一旦系统启动就不能运行了阶段二: cfgmgr s ( second boot phase for normal boot )阶段三: cfgmgr p ( second boot phase for service boot )# cfgmgr i /usr/sys/inst.images 该命令尝试自动安装设备的软件 FOR 新检测到的设备-I 选项指定安装的媒质在哪里在此处有一个seq field ,该field 是一个整数指定了优先权,值越小,优先级越高,0的优先级最低,1的优先级最高# cfgmgr l scsi0 ( 配置检测到的连接到SCSI0适配卡的设备 )-如果你想查找root用户什么时候logged on and off from the console # last root console如果你想决定系统上次shutdown是什么时候# last shutdown为了显示一个启动列表# bootlist m normal o如果你想改变你的启动列表# bootlist m normal fd0 hdisk0 cd0注意:加到bootlist的每一个设备必须处于Avalable的状态如果你怀疑你的系统被shutdown或restarted,你可以使用uptime命令去查明,uptime命令显示系统已经运行了多长时间# mpcfg df To find out what the status is of your diagnostic flags# mpcfg cf 11 1 如果你想Fast IPL system,你可以改变diagnostic flag的值注意: mpcfg 和 service information相关shutdown -v 或 h Halt the operating system completely-k Avoids shuting down the system-m Bring the system down to maintenance mode-I specifies interactive mode , Display interactive messages to guide the user through the shutdown注意 : /etc/rc.shutdown文件由 /usr/sbin/shutdown script调用来关闭在关机的时候想中断的进程,该文件的必须是可执行的才能被正确调用安装媒质有问题的征兆:1、安装时意外挂起 2、 无法从介质读数据 3、意外重起如果安装媒质没有问题的话,在你的系统中两个设备可能共享相同的SCSI地址LED Error CodeLED 201 - Damaged boot image解决方法:1、访问你的rootvg ( 进入 system maintenance 模式 )2、检查 / 和 /tmp文件系统,看看他们是否已经满了,如果是创建更多的空间3、决定 bootdisk 通过用命令 lslv m hd54、重新创建 boot image 使用 bosboot a d /dev/hdisk05、检查 CHECKSTOP errors in the error log , 如果这样的错误发现的话可能是失败的硬件6、关机 重起LED 223-229 - Invalid boot list 1、决定启动磁盘 lslv m hd52、创建新的bootlist 使用 bootlist命令LED 551,555,and 557 - Errors Including corrupted file system and corrupted JFS log1、进入维护模式 access rootvg before mounting and file system2、fsck y /dev/hd1 fsck y /dev/hd2 fsck y /dev/hd3 fsck y /dev/hd4 fsck y /dev/hd9var3、再次Format the JFS log/usr/sbin/logform /dev/hd84、使用 lslv m hd5 去决定 boot disk5、重新创建boot image bosboot a d /dev/hdisk0 LED 552,554,and 556 - Super block corrupted or corrupted customized ODM databaseFsck1、Repeat steps 1 and 2 for LEDs 551 555 and 5572、If fsck inidicates that block 8 is corrupted, the super block for the file system is cororupted and needs to be repaired , Enter the command :Dd count=1 bs=4k skip=31 seek=1 if=/dev/hdn of=/dev/hdn3、rebuild your JFS log by using the command :/usr/sbin/logform /dev/hd84、if this solves the problem, stop here otherwise ,continue with step 55、Your ODM database is corrupted ,restart your system and 进入 maintenance mode6、Mount the root and usr file system Mount /dev/hd4 /mntMount /usr7、copy system configuration to a backup directorymkdir /mnt/etc/objrepos /backupcp /mnt/etc/objrepos/Cu* /mnt/etc/objrepos /backupLED 553 - corrupted /etc/inittab file1、进入系统维护模式2、检查 / /var /tmp 使用 df命令3、检查 /inittab文件4、检查 execution problems/etc/environment/bin/sh/bin/bsh/etc/fscketc/profile/.profile5、shutdown and reboot第二部分、硬件相关为了列出系统中的磁带(盘),使用 # lsdev C c tape(disk)列示在预定义ODM数据库中的设备 # lsdev P H列示在定制定义ODM数据库中的设备 # lsdev C H# lspv 显示在系统中的每一个PV along with its physical disk name ,PVID,and with VG it belongs to.# lspv pvname 仅仅显示该PV的信息 eg: # lspv hdisk0 # lspv p hdisk0 列示 range , state , region , LV name , type , and mount point for each PP on the PVcfgmgr 配置设备在软件层SMS检查和配置系统在硬件层如何进入SMS:1、关机2、如果需要的话插入 SMS 软盘 ,启动机器3、Press F1 得到一个图形化的 SMS菜单或 Press F4去得到一个ASCII SMS菜单( 要眼疾手快 ) 你可以改变访问的口令在SMS菜单,从而只有授权的人才可以访问SMS工具,但如果你忘了这个口令,唯一的解决方法是给主板放电(将电池拿掉)当显示一个定制设备的有效属性时,信息的获得是从 Configuration daabase 而不是设备本身,一般来说,chdev with P or T flag 将刷新设备的配置,如果没有的话,lsattr 命令显示设备的信息有可能是不准确的,一直到重起后 # lsattr El rmt0 显示磁带的当前的属性 # lsattr l rmt0 D 显示磁带默认的属性 # lsattr l scsi0 a bus_intr_lvl E # lsattr l tty0 a login R To list possible values of the login attribute for the TTY device tty0# smitty devices 该命令可以使用smit菜单1、安装或配置设备(在IPL之后)2、删除设备3、列示存在的设备4、改变或显示设备的属性5、执行设备相关的问题的决定# /usr/lib/errdemon 启动errdemon# /usr/lib/errdemon l 决定系统错误日志文件的路径# errpt 产生错误报告 # errpt a # errpt a s 0828093001# errpt a j AA8AB241(最后为 error identifier )# errloger 命令允许你记录管理员的信息到系统错误日志中# diag 执行硬件问题诊断AIX使用syslogd记录系统的信息,在这里有一个/etc/syslog.conf配置文件,该文件控制syslogd进程的行为,系统日志应该被升级通过编辑/etc/syslog.conf文件,在你编辑并增加了条目在/etc/syslog.conf文件,你需要重新启动syslogd进程# smitty tty 增加一个TTY第三部分、系统和软件的安装为了安装BOS,应该启动系统进入Maintenance mode三种安装方法的区别:(1)New and Complete Overwrite Installation 情形一、一台新的机器 情形二、你想安装到那个硬盘(包含在一个已经存在的卷组)你想完全覆盖掉,或者rootvg已经损坏 情形三、你想重新分配你的硬盘,使你的rootvg更小,分配少些磁盘空间给它安装后要使用 Configuration Assistant application手工配置系统相关设置,该程序也可以手工运行,/usr/sbin/install_assist(2)Migration Installation (升级安装) 使用该安装方法去升级AIX 3.2 4.1 4.2 4.3 To AIX 5L Version 5.1 升级时保留了已经存在的rootvg卷组,除了/tmp,该方法保留了所有的文件系统,包括rootvg,lv和系统配置文件,同时保留了用户配置文件。(3)Preservation Installation 该方法覆盖了/usr , /tmp, /var, 和 / 文件系统,在这些目录中任何用户数据将丢失,任何其他的LPP和Filesets将会丢失,系统配置将重做在安装结束后 有一个 /etc/preserve.list文件,在该文件中的条目将会被保留# bootinfo y 标示系统硬件的类型 ( 32bit或64bit )oslevel 的运行 # oslevel ( to see the current maintenance level of your system ) 软件的组成以及各部分的含义 vv.rr.mmmm.ffffvv : 两个数字 标示 version numberrr : 两个数字 标示 release numbermmmm: 四个数字 标示 modification leverffff: 四个数字 标示 fix level在升级后,oslevle后,如果你的系统没有显示出新的维护层,使用After an update, if your system is not showing the new maintenance level . use the l flag with the oslevle command to detemine what filesets have note been upgraded to match the new BOS levle# oslevle l Current Level 去决定还有什么filesets没有被升级到新的BOS LevelPTF and APARsPTF : Program Temporary Fix , a PTF is an updated fileset or a fileset that fixes a previous system problem PTF 的安装是使用 installp 命令APAR: Authorized Program Analysis Report , An APAR is an emergency fix. Or e-fix . to a unique problem on the system , APARS will eventually become PTFs after tesing and verification. APAR 的安装是使用 instfix 命令Installp命令-X 如果在安装过程中空间不够将扩展文件系统-v 在安装结束后确认在文件集中的所有安装的文件备正确地检查过。可以同-a 和 ac一起使用来确认一个成功的安装。-a 应用一个或更多的软件产品或升级,该参数是默认的行为,该参数可以和 c 一起使用来apply 和 commit一个软件的升级或安装-p 执行一个安装预览,运行预安装的所有检查 -B 表示请求的行为被限制到软件的升级-C 清除一个中断的安装和删除所有没有完成的安装-c commit applied的升级到系统-d 指定安装媒质-F 强迫安装,无论是否存在,是否新旧-f read the names of the software products from listfileg 当用来install和commit的时候, 该选项自动安装或commit,软件可以以两种方式进行安装:applied state: 该状态安装软件到系统同时保留以前版本的软件 ,该状态是非常有用来测试新的软件,在有必要的时候可以返回到以前版本的软件committed state : 安装软件同时删除以前的软件例如:1、安装在 软件包中的所有的filesets 到 /usr/sys/inst.images目录( in the applied state)InstallpavX d/usr/sys/inst.images 2、预安装在软件包中的所有的文件集到/usr/sys/inst.images目录( In the committed state )同时检查磁盘空间的需求3、清除一个中断的安装和删除所有没有完成的安装 # installp C4、committing applied updates 命令: # installp cgx all 或者是 smitty install_commit这个命令将commit所有的updates同时删除以前版本的filesets5、Rejecting applied updates 命令 # installp rBfX ./reject.list或是smitty install_reject该命令将删除所有uncommitted updates listed in ./reject.list 同时将系统带回到以前的maintenance level6、删除一个安装的软件 # installp ugp V2 .ipsec.rte 运行该命令将显示一个将要删除的文件的列表,但并不真正删除它 或是 # smitty install_remove7、列示在媒质上的所有的软件 # installp L d /dev/cd08、使用smitty安装软件 # smitty install_latest注意: 在安装结束后,无论命令的状态报告是成功的还是失败的,都应该看看 $HOME/smit.log文件,因为你想安装的fileset系统可能并没有安装A version number and a release number : 标示 release levelA modification level and a fix level number : 标示 the level of the update用下面的步骤使一个系统升级到最新的maintenance level:1、列示软件的 maintenance level2、下载 fixs3、显示并升级安装的软件到最新的level为了看你当前运行的filesets的maintenance level ,使用下面的命令:# lslpp l为了display all files installed with the bos.64bit fileset# lslpp f bos.64bit为了显示filesets安装和升级的历史 : # lslpp h bos.sysmgt.trace下载 FIXs :1、2、通过fixdist的工具 访问: 通过fixdist 下载的软件BFF的格式的,是用backup命令创建的,如*.bff,可以用restore命令来读。如果你经常应用升级并将所有的升级软件放在相同的目录中,.toc文件可能会过期,installp命令使用.toc文件来执行安装,为了当你执行安装的时候使正确并最新的软件安装,推荐重构.toc文件,命令如下:# inutoc ; 还有一个 inutoc /usr/sys/inst.images/.toc该命令在运行installp的时候自动调用你可以使用fixdist工具下载个别的fix,为了决定一个fix是否安装在系统上或为了安装一个fix,使用instfix命令( 和fix有关)instfix命令允许你安装一个fix或set of fixes without knowing any information 除了APAR号或唯一的关键字来标示这个fix例一:为了列示在一个CD-ROM中的fixes# instfix T d /dev/cd0例二:为了决定是否APAR IX75893安装到系统# instfix ik IX75893例三:To examine information about APAR IX75893 and what it does# instfix aik IX75893例四:To list what maintenance levels have been installed on your system with the instfix command # instfix i | grep ML例五:为了从/dev/cd0安装APAR IX75893 # instfix k IX75893 d /dev/cd0例六:To view the new maintenance level of your software # lslpp l 主要还是显示 fix levelthis will show you the latest maintenance level of the filesets including those you just updated为了创建installation images on your hard disk# smitty bffcreate为了克隆rootvg到一个新的磁盘 # smitty alt_clone条件: The target disk should be a stand-alone disk not belonging to a VG,同时,SSA disks cannote be used as your target disks第四部分: ODM大多数的系统 object classes 和 objects存储在/usr/lib/objrepos目录,然而,ODM信息存储在1、/usr/lib/objrepos2、/usr/share/lib/objrepos3、/etc/bojrepos ODM的相关命令: odmadd: add objects to an boject class odmcreate: create empty object classes odmchange: change specific objects in a specified object class odmdelete remove objects from an boject class odmdrop remove an entire object class odmget retrives objects from object classes odmshow display the description of an object class第五部分:存储管理和文件系统VGDA:The VGDA, located at the beginning of each physical volume,contain informatino that describes all the logical volumes and all the physical volumes that belong to the volume group of which that physical volume is a memoberThe VGDA is allocated when the disk is assigned as a physical volume,When the PV is assigned to a VG ,The actual VG informationg is placed in the VGDAVGSA: The VGSA contains state information about PP and PVLVCB:The LVCB is located at the start of every LV , It contains information about the LV and users a few hundred bytesDisk Quorum:Each Physical disk in a VG has at least one VGDA/VGSA,single PV in a VG: two VGDAs on one disktwo PV in a VG: two VGDAs on the first disk, one VGDA on the second diskThree or more : one VGDA on each diskDisk Mirroring :disk mirroring is the association of two or three PP with each LP in a LV,在LV创建的时候就可以做Mirroring 。mklv 命令允许你选择 one or two additional copied for each LV,Mirror也可以加在一个已经存在的LV,通过使用mklvcopy命令mirrorvg命令镜像在一个给定VG中的所有的LV,相同的功能可以被完成通过mklvcopy命令,如果在一个VG中运行mklvcopy命令for 每一个单独的LV,注意此处就是目标磁盘必须和源磁盘等等在同一个VG中例一:# mirrorvg -c 3 workvg 三重镜像一个卷组例二:# mirrorvg workvg 以默认的方式镜像卷组为了删除一个卷组中已经损坏的磁盘: # unmirrorvg workvg hdisk7 # reducevg work hdisk7 # remdev -l hdisk7 -d删除后添加一个新的磁盘(以同样的名称) # extendvg workvg hdisk7 # mirrorvg workvg同步新建的镜像 # mirrorvg -S -c 3 workvg注意:在这个例子中,mirrorvg 将创建两个copy for the LV in workvg,他将创建新的镜像在新替换的磁盘上,但如果原来的系统被三重的镜像的话,将没有新的镜像创建在hdisk7上,因为其他的copy已经存在为了创建一个卷组精确的映射 # mirrorvg -m datavg hdisk2 hdisk3当rootvg mirroring完成后,下列的任务必须做:一、运行bosboot命令 ( 从RAM磁盘文件系统和内核创建一个boot image )二、运行bootlist命令三、reboot system( 默认情况下,mirrorvg命令使quorum to be turned off, 为了 turn on the quorum on a rootVG,系统必须重启)注意: 不要reboot 系统当 bosboot命令没有成功创建一个boot disk的时候非rootvg的 mirroring:当一个非rootvg的卷组被镜像时,the quorum state is deactivated,为了解决这个问题,all open LV must be closed, 然后vary off and vary on the VG for the changes to take effectThe dump device can be queried and modified with the sysdumpdev command有三种方法用来配置一个新的disk ,如果你的LVM想用这磁盘的话,同时还必须做成一个PV方法一:shutdown 然后Power on # lspv 的输出结果中如果对应的hdiskx有PVID,说明该hdisk已经是PV了,可以被LVM使用,但如果没有PVID的话,就要使该disk成为PV方法二:手工运行cfgmgr一个新的磁盘只有被分配给一个VG才可以使用,必须作为一个PV才可以被LVM使用 相应命令: chdev -l hdisk1 -a pv=yesThe following command is used to turn off the allocation permission for the PV hdisk1# chpv -a n hdisk1To turn the allocation permission back on .use the following command# chpv -a y hdisk1当一个PV由于损坏要被从该系统删除时,该PV should be made unavailable :# chpv -v r pvnameThe following command will make a PV available to the system# chpv -v a pvname注意:当运行chpv命令失败了的时候,检查/tmp的空间A PV must be unconfigured before it can be removed from the system,The following example shows how to unconfigure a PV and change its state from available to defined# rmdev -l hdisk1该PV的定义仍然保留在ODM中,使用 -d 将 remove the definition from the ODMList PV on the system # lspvList PV on the system along with the status of each PV # lspv -C -c diskList PV characteristic # lspv hdisk1List all the LV on the PV # lspv -l hdisk1List PP allocation by PV region # lspv -p hdisk1List PP allocation table # lspv -M hdisk1下列的过程描述了如何从一个failing disk移出数据 before it is removed for repair or replacement1、首先确定source and destinatino PV are in the same VG # lsvg -p rootvg2、a、make sure the disk is available # lsdev -Cc disk b、if the disk is listed and in the available state , make sure it does not belong to another VG # lspv c、if the disk is not listed or is not available,you need to check or install the disk d、add the new disk to the Vg # extendvg VGNAME hdisknumber3、确定目标磁盘有足够的空间可以容纳源盘的内容4、如果准备移动的数据所在的磁盘属于rootvg: a、检查是否 boot logical volume(BLV)也就是hd5在 sourec disk中 # lspv -l sourcedisknumber | grep hd5 如果在的话: # migratepv -l hd5 SourceDiskNumber DestinationDiskNumber 注意: migratepv命令cannot migrate striped LV ,if htis is the case , to move data from one PV to another,use the cplv命令 to copy the data,and then use the rmlv command to remove the old copy migratepv command is not allowed if the VG is varied on in a concurrent mode b、在目标磁盘上执行bosboot命令 当BLV is migrated from a PV ,the boot record on the source should be cleared ,Failure to clear this record may result in a system hang c、在源磁盘上执行bosboot -c命令 to clear the boot record on the source # bosboot -a -d /dev/DestinationDiskNumber # bootlist -m normal DestinationDiskNumber # mkboot -c -d /dev/SourceDiskNumber5、如果你要移动的数据所在的磁盘属于用户定义的卷组 # smitty migratepvTo remove source disk from the Vg ,such as when it is failing # reducevg VGNAME SourceDiskNumber在物理的卸掉Source disk之前,运行 # rmdev -l SourceDiskNumber -d创建一个新的VG ,# mkvg 或 # smitty mkvg当使用mkvg创建VG的时候,root filesystem 至少需要2MB的Free space才能够保证VG成功创建To make a VG to be varied on automatically each time a system is restarted# chvg -ay newvgTurn off the automatic varying on of the VG at system restart# chvg -an newvgUnlock a Vg# chvg -u newvgAdd the PV hdisk3 to Vg newvg# extendvg newvg hdisk3The Vg must be varied on before it can be reduced# reducevg myvg hdisk3Remove a PV reference# reducevg VG PVIDTo remove the system definition of a VG from the ODM database,the VG need to be exported using the exportvg command,This command will not remove any user data in the VG ,but will only remove its definition from the ODM database# exportvg myvg# importvg y myvg hdisk12你也可以使用exportvg 和importvg来给一个用户定义的卷组改名 # varyoffvg vg00 # exportvg vg00 (导出前要先varrry off) # importvg y cadsvg hdisk1A VG that has a paging space volume on it cannot be exported while the paging space is active在导出一个包含活动的paging space的卷组的时候,首先: # chps a n paging_space_name然后重起系统,从而该paging space处于inactive的状态if you dont activate the VG that contains file systems, or if you activated the VG through smitty importvg,It is highly recommended that you run the fsck command before you mount the file systems, if you are moving the VG to another system,be sure to unconfigure the disks before moving themThe smitty exportvg command deletes references to file system in /etc/filesystems,but it leaves the mount points on the system激活一个卷组: # varyonvg newvgDeactivate a Vg (The varyoffvg command will deactivate a VG and its associated LV,This requires that the LV be closed ,which requires that file systems associated with LV be unmounted,)# varyoffvg myvgList all the Vg known to the system# lsvgList the Vg that are currently active # lsvg oList the characteristics of a VG# lsvg rootvgList the LV in a VG# lsvg l rootvgList the PV status within a VG# lsvg p rootvg使用reorgvg命令的两个必要的条件:1、VG must be varied on2、Must have free partitionsThe relocatable flag of each LV must be set to y using the chlv r command for the reorganization to take effect,otherwise, the LV is ignored注意:对于LV的relocatable必须用chlv -r设置成 y ,reorgvg命令对含条带集的逻辑卷无效,同时在该卷组中至少包含一个自由的物理分区To synchronize the copies on PV hdisk04 and hdisk05 # syncvg p hdisk04 hdisk05To synchronize the copies on VG vg04 and vg05 # syncvg v vg04 vg05# mklv newlv 创建逻辑卷# rmlv newlv 删除逻辑卷# extendlv newlv 3 扩展该逻辑卷的逻辑分区(增加了3个LP)使用cplv命令来拷贝一个逻辑卷到另外的新的磁盘或已经存在的逻辑卷# cplv v myvg y newlv oldlv 该命令将拷贝oldlv的内容到一个新的逻辑卷newlv ,如果卷组没有指定的话,该命令将在相同的卷组中创建一个新的逻辑卷拷贝一个逻辑卷的内容到一个已经存在的逻辑卷(existinglv卷组中的数据将被覆盖)# cplv e existinglv oldlv如果卷组is varied on in concurrent mode的话,使用cplv命令来创建一个新的LV将失败# splitlvcopy y newlv oldlv 2 (以前的oldlv的一个LP对应三个PP)该命令执行后: oldlv的一个LP对应两个PPnewlv的一个LP对应一个PPBefore splitting LV ,You must unmount file system and close the LV下列的LV在系统安装的时候自动创建hd5 :This is boot logical vol

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论