华为虚拟化FusionSphere常见故障管理_第1页
华为虚拟化FusionSphere常见故障管理_第2页
华为虚拟化FusionSphere常见故障管理_第3页
华为虚拟化FusionSphere常见故障管理_第4页
华为虚拟化FusionSphere常见故障管理_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华为虚拟化FusionSphere常见故障管理

目录1故障处理概述 31.1故障处理流程 31.2故障分类 42常见故障处理 62.1用户虚拟机故障 62.1.1虚拟机蓝屏 62.1.2重启或关闭主机网络服务后,主机网络异常 92.1.3本地磁盘的ext4文件系统损坏 102.1.4虚拟机内存数值显示异常 132.1.5虚拟机重启后网络不通 152.2FusionCompute管理节点故障 162.2.1单个VRM虚拟机操作系统故障 162.2.2主机操作系统故障 252.2.3VRM虚拟机本地存储双盘故障 302.2.4VRM虚拟机关机后无法启动 412.3FusionManager管理节点故障 422.3.1修改FusionManager管理IP地址导致FusionManager连接异常 422.3.2修改VSAM管理IP地址导致VSAM连接异常 432.3.3单个FusionManager虚拟机故障 452.3.4VSAM虚拟机故障 502.3.5主备VSAM虚拟机同时故障 542.4FusionCompute操作维护类故障 582.4.1FusionComute无法获取监控数据 582.4.2修改虚拟机IP后虚拟机通信中断 602.4.3主机管理网络配置与交换机不匹配 622.4.4异常掉电再上电后,任务长时间无响应 632.4.5使用虚拟化SAN存储的主机异常重启 652.5FusionManager操作维护类故障 672.5.1修改虚拟机IP后虚拟机通信中断 672.5.2主机关联的数据存储异常 692.5.3界面字符显示乱码 702.5.4主备VSAM节点无法ping通仲裁IP地址 712.5.5删除创建失败的网络后仍残留端口组信息 733故障应急处理 743.1主备VRM虚拟机操作系统同时故障 743.2主备VRM物理节点操作系统同时故障 903.3共享存储的VIMS文件系统损坏 1003.4主备FusionManager虚拟机同时故障 108

1故障处理概述1.1故障处理流程故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排除。具体实施过程如图1所示。说明:处理重大故障前,请先联系技术支持处理。图1常见故障处理流程故障信息收集故障信息是故障处理的重要依据,系统维护人员应尽可能多的收集故障信息。故障判断排除故障之前,系统维护人员根据收集的故障详细信息,对故障范围和类型进行判断。故障定位故障定位是指从众多可能原因中找出故障原因的过程。通过一定的方法或手段分析、比较各种可能的故障成因,不断排除非可能因素,最终确定故障发生的具体原因。以下是故障定位的常用方法:在管理界面查看告警信息在管理界面查看监控信息是否正常查询操作日志,分析操作过程是否有误在管理界面检查数据配置是否正确观察设备指示灯状态是否正常故障排除故障排除是指根据不同的故障原因清除故障的过程。故障排除包括检修线路、修改配置数据、重启相关进程、重启服务器等。说明:当系统维护人员无法自行排除故障时,请联系技术支持。确认故障是否被排除通过查询设备状态、查看设备指示灯和告警等方法确认系统已正常运行,并进行相关业务调测以确保业务正常。记录故障处理过程故障排除后应记录故障处理要点,给出针对此类故障的防范和改进措施,避免同类故障再次发生。1.2故障分类FusionCompute提供的故障处理如表1所示。

表1故障处理一览表故障大类故障子类故障名称常见故障处理用户虚拟机故障虚拟机蓝屏SUSE虚拟机网卡不可用Ubuntu10.04及以上版本操作系统中uvp-monitor进程未启动WindowsServer2003虚拟机绑定USB2.0设备后,虚拟机黑屏或关机失败SUSE10虚拟机不能正常使用USB2.0设备SUSE11SP232bit多网卡虚拟机无法获取到网关重启或关闭主机网络服务后,主机网络异常虚拟机同时绑定SCSI磁盘和IDE磁盘时无法正常启动本地磁盘的ext4文件系统损坏虚拟机内存数值显示异常跨主机通信的虚拟机间通信带宽过低虚拟机重启后网络不通管理节点故障单个VRM虚拟机操作系统故障单个VRM物理节点操作系统故障主机操作系统故障VRM虚拟机本地存储双盘故障VRM虚拟机关机后无法启动操作维护类故障FusionComute无法获取监控数据修改虚拟机IP后虚拟机通信中断主机管理网络配置与交换机不匹配异常掉电再上电后,任务长时间无响应网络数据残留导致添加主机失败主备VRM节点无法ping通仲裁IP地址高斯数据库分区使用率超过95%,导致FusionCompute无法登录卷删除成功后解关联或销毁数据存储失败使用虚拟化SAN存储的主机异常重启交换机开启STP功能导致添加主机失败Tools故障Windows下安装Tools时弹出警告提示Windows下安装Tools时异常中止应急处理管理节点故障主备VRM虚拟机操作系统同时故障主备VRM物理节点操作系统同时故障共享存储的VIMS文件系统损坏部件更换-部件更换策略更换主机拆卸/增加/更换物理网卡FusionManager提供的故障处理如表2所示。表2故障处理一览表故障大类故障子类故障名称常见故障处理管理节点故障修改FusionManager管理IP地址导致FusionManager连接异常修改VSAM管理IP地址导致VSAM连接异常单个FusionManager虚拟机故障VSAM虚拟机故障主备VSAM虚拟机同时故障VSA虚拟机故障VSAM数据库密码不一致导致连接异常操作维护类故障修改虚拟机IP后虚拟机通信中断主机关联的数据存储异常界面字符显示乱码主备VSAM节点无法ping通仲裁IP地址高斯r数据库分区使用率超过95%,导致FusionManager与VSAM无法通信删除创建失败的网络后仍残留端口组信息应急处理管理节点故障主备FusionManager虚拟机同时故障系统时间故障-系统时间错误2常见故障处理2.1用户虚拟机故障2.1.1虚拟机蓝屏现象描述虚拟机蓝屏或黑屏。可能原因虚拟机安装的操作系统与虚拟机选项中的操作系统类型或版本不同。主机异常下电,导致主机上的虚拟机操作系统文件被破坏。定位思路无。处理步骤检查操作系统类型以及版本号登录FusionCompute。在出现故障的虚拟机的“选项>操作系统”页面查看虚拟机选择的操作系统类型以及版本号。对比查看到的操作系统类型以及版本号与虚拟机实际安装的是否一致。是,执行步骤8。否,执行步骤4。关闭虚拟机。在虚拟机的“选项>操作系统”页面,将操作系统类型以及版本号修改为实际安装的。启动虚拟机。故障是否恢复?是,处理完毕。否,执行步骤10。重启虚拟机重启虚拟机。故障是否恢复?是,处理完毕。否,执行步骤10。删除虚拟机是否为新创建的虚拟机?是,步骤11。否,步骤12。删除该虚拟机,重新创建新虚拟机。处理完毕。恢复虚拟机说明:以下操作以WindowsXP操作系统为例,使虚拟机通过光驱启动,并完成相应的操作。在FusionCompute中,使用VNC方式登录故障虚拟机。挂载操作系统的ISO文件并重启虚拟机。虚拟机重启过程中,出现以下提示信息时,按任意键,使虚拟机通过光驱启动。PressanykeytobootfromCD.按“Enter”。进入安装程序界面。输入“R”。系统开始修复安装。根据界面提示,按照默认设置完成安装。卸载光驱。每个主机以本地方式最多只能给32个虚拟机挂载光驱。因此,使用完毕后,请及时卸载光驱。修改虚拟机启动方式选择“虚拟机和模板”。在“虚拟机”页签,单击虚拟机名称。显示“概要”页签。在“选项”页签,将虚拟机的启动方式修改为“硬盘启动”。检查虚拟机状态重新登录故障虚拟机。故障是否恢复?是,处理完毕。否,执行步骤24。恢复虚拟机的系统盘在FusionCompute中,强制关闭该虚拟机。解绑定故障虚拟机的系统盘。将该磁盘以用户磁盘的方式,绑定给另一台虚拟机(以下操作中称为“虚拟机B”)。以VNC方式登录虚拟机B。右键单击“我的电脑”,选择“管理”。弹出“计算机管理”窗口。选择“存储>磁盘管理”。右键单击新绑定的磁盘,选择“更改驱动器号和路径”。单击“更改”,并分配驱动器号,例如:E。单击“确定”。弹出确认提示框。单击“是”。返回“计算机管理”窗口,更改完成。对该磁盘中的系统文件进行恢复,并备份用户数据。具体操作请参考对应操作系统的文档。将该磁盘以系统磁盘的方式,重新绑定给原故障虚拟机。以VNC方式登录故障虚拟机。故障是否恢复?是,处理完毕。否,请联系技术支持。参考信息无。2.1.2重启或关闭主机网络服务后,主机网络异常现象描述重启或关闭主机的网络服务后,主机网络异常,主机上的虚拟机无法对外通信。可能原因关闭网络服务后,系统会清除该主机上所有IP。网络服务重启后,主机上的网桥对象仍存在,但主机的IP已从Mgnt-0管理系统接口转移至上行链路物理网口。带有IP的上行链路物理网口连接在网桥上,因此主机及其上的虚拟机无法对外通信。定位思路无。处理步骤在本地PC上打开浏览器,在浏览器地址栏输入以下地址,按“Enter”。http://主机BMCIP地址或https://主机BMCIP地址进入登录界面。根据界面提示登录主机BMC系统。主机的BMC默认用户名为“root”,默认密码为“Huawei12#$”。登录后进入主机管理页面。说明:如果刀片式服务器无法登录单个刀片的BMC系统,建议登录刀片所在机框的管理模块(SMM板),然后打开对应刀片的远程控制窗口。单击“远程控制”。部分华为服务器需要在“远程控制”页面选择“远程虚拟控制台(JRE支持)”打开远程控制窗口。弹出主机远程控制窗口。以“root”用户登录主机。执行以下命令,重启主机。reboot主机重启成功后,检查主机及主机上的虚拟机对外通信是否正常。是,操作结束。否,请联系技术支持。参考信息无。2.1.3本地磁盘的ext4文件系统损坏现象描述当服务器被异常下电时,存在虚拟机无法启动。虚拟化本地磁盘的ext4文件系统变为只读,甚至无法挂载。具体查看的方法:登录异常的主机,执行命令cat/proc/mounts,回显ro,说明本地磁盘的ext4文件系统已损坏。可能原因超级块损坏。超级块是文件系统中最重要的数据结构,它是来描述整个文件系统信息。文件元数据损坏。元数据用来描述一个文件特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息等等。定位思路无。处理步骤停止故障存储设备上的业务运行使用“PuTTY”登录故障存储设备所在主机。停止故障的存储设备上运行的所有业务。说明:停止虚拟机会使该虚拟机上运行的业务暂停,请在无业务时执行该操作。停止虚拟机的方法:用户虚拟机:在FusionCompute界面上关闭所有的用户虚拟机,VRM虚拟机:VRM虚拟机无法在界面上关闭,需登录VRM所在主机,执行命令关闭。命令为:virshdestroy虚拟机ID执行以下命令,记录挂载目录。mount回显类似如下信息:/dev/sdgon/mnttypeocfs2(rw,_netdev,noatime,nodiratime,novdilock,commit=1,localalloc=2048,heartbeat=local)其中,/mnt为ext4文件系统在主机上的挂载目录。依次登录所有使用该文件系统的主机,执行以下命令卸载该文件系统,确保其不被任何节点使用。注意:不可对该文件系统进行格式化操作。umountmount_point其中,mount_point为步骤3中记录的ext4文件系统在主机上的挂载目录。修复损坏的数据执行如下命令,检查故障设备。fsck.ext4-fndevice其中,device为故障存储设备在主机上的存放路径,例如“/dev/sda”。当回显信息出现“fsck.ext4:Superblockinvalid,tryingbackupblocks...”字样时,表示超级块损坏。当回显信息出现“/dev/sda9:**********WARNING:Filesystemstillhaserrors**********”字样时,表示文件元数据损坏。根据损坏的数据类型,执行相应的操作。超级块损坏,执行步骤7。文件元数据损坏,执行步骤8。执行以下命令,恢复超级块数据。注意:如果损坏的文件系统中的数据非常重要,建议先通过ddif=<device>of=/backupdir/backupfile备份数据,再执行修复命令。fsck.ext4-bnumdevice-y其中,num为备份的超级块序号,可选择设备大小范围内对应的任意块编号,具体见如下说明。device为步骤5中的存放路径。说明:ext4会通过备份文件系统超级块的方式来提供文件系统的容错性,会在磁盘的多处备份超级块。例如一个500G的设备,分别在设备的块号为32768,98304,163840,229376,294912,819200,884736,1605632,2654208,4096000,7962624,11239424,20480000,23887872,71663616,78675968,102400000处备份。主超级块损坏时可以用文件系统一致性检查工具(fsck.ext4)把备用超级块写回主超级块处,恢复文件系统。该步骤执行完成后,执行步骤9。执行以下命令,恢复文件元数据。注意:如果损坏的文件系统中的数据非常重要,建议先通过ddif=<device>of=/backupdir/backupfile备份数据,再执行修复命令。fsck.ext4-ydevicedevice为步骤5中的存放路径。执行如下命令,查看文件系统是否还有异常?fsck.ext4-fndevice是,请联系技术支持。否,处理完毕。参考信息无。2.1.4虚拟机内存数值显示异常现象描述如果虚拟机为以下操作系统,且虚拟机所在集群已启用“主机内存复用”,虚拟机的内存数值可能会出现异常,即total(总内存)的数值小于free(空闲内存)的数值。RedHatEnterpriseLinux6.032位RedHatEnterpriseLinux6.132位CentOS6.032位CentOS6.132位查询虚拟机内存数值时,回显如下所示。其中total的值(1904388)小于free的值(1916752)。[root@vm01~]#freetotalusedfreesharedbufferscachedMem:190438899124180526402322088268-/+buffers/cache:42949549321916752Swap:625868006258680可能原因虚拟机中关闭了kdump服务,同时在Linux内核启动配置文件中配置了参数“crashkernel=auto”,由于操作系统内核本身对内存初始化的特殊处理方法,导致Tools初始化时得到的内存相关值与操作系统内核本身的值存在差异,最终导致内存数值出现异常。定位思路无。处理步骤登录虚拟机。在命令行窗口中,执行以下命令,使用vi编辑器打开“menu.lst”文件。vi/boot/grub/menu.lst按“i”键,进入编辑模式。配置文件示例如下。default=0timeout=5splashimage=(hd0,0)/grub/splash.xpm.gzhiddenmenutitleRedHatEnterpriseLinuxServer(2.6.18-164.el5)root(hd0,0)kernel/vmlinuz-2.6.18-164.el5roroot=/dev/VolGroup00/LogVol00crashkernel=autorhgbquietide0=noprobeide1=noprobeinitrd/initrd-2.6.18-164.el5.img删除“crashkernel=auto”。按“Esc”退出编辑模式,并输入:wq保存退出。重启虚拟机。参考信息无。2.1.5虚拟机重启后网络不通现象描述配置了静态IP地址和网关的虚拟机在重启后出现网络不通,VNC登录该虚拟机查看网络配置,发现网关丢失。可能原因虚拟机的计算机名与网络中其他虚拟机计算机名相同,在网络中注册IP地址时导致冲突。定位思路对于Windows虚拟机,VNC登录虚拟机,在“开始菜单”右键单击“计算机”,选择“管理”,在计算机管理中选择“计算机管理(本地)>系统工具>事件查看器>Windows日志>系统”中查看日志,其中存在级别为“错误”的日志信息,描述为虚拟机的计算机名不能注册到某IP地址,因为另一个IP地址已经占用该计算机名。对于Linux虚拟机,VNC登录该虚拟机,查看网卡配置,发现网卡的网关丢失。处理步骤判断虚拟机操作系统类型。Windows虚拟机,执行步骤2。Linux虚拟机,执行步骤7。(Windows虚拟机操作以Windows7操作系统为例)使用VNC登录虚拟机,在“开始菜单”右键单击“计算机”,选择“属性”。在右侧单击“更改设置”。弹出“系统属性”窗口。在“计算机名”页签单击“更改”。弹出“计算机名/域更改”对话框。修改计算机名为环境中唯一的计算机名,然后单击“确定”。重新设置计算机的网卡属性。处理完毕。(Linux虚拟机操作以SUSE操作系统为例)使用VNC登录虚拟机,执行vi/etc/hostname命令以VI编辑器打开主机名配置文件。说明:对于RedHat操作系统,需要先执行echo'HOSTNAME='$hnOld>>$mountpath/etc/sysconfig/network命令将原主机名写入配置文件,然后执行vi/etc/sysconfig/network命令以VI编辑器打开主机名配置文件。按“i”进入编辑模式,修改“HOSTNAME”的值为全网段唯一的名称。按“ESC”并输入:wq保存修改。执行vietc/syscionfig/network/route命令以VI编辑器打开网关配置文件。按“i”进入编辑模式,修改“default”后的值为正确的网关。按“ESC”并输入:wq保存修改。处理完毕。说明:对于有操作界面的Linux系统,可通过界面直接修改网卡的网关信息。参考信息无2.2FusionCompute管理节点故障2.2.1单个VRM虚拟机操作系统故障现象描述系统运行过程中,出现以下故障现象,需要参考本故障处理操作,使业务快速恢复正常。VRM主备部署时,单个VRM虚拟机故障,且重启该虚拟机后业务仍无法恢复。出现“ALM-15.1002000主备间节点心跳故障”告警。VRM主备部署时,单个VRM虚拟机所在主机异常下电。主机重新上电后切换该VRM虚拟机为VRM主节点,可打开FusionCompute登录界面,但无法登录。可能原因VRM虚拟机文件系统被破坏。定位思路无。处理步骤查询故障VRM节点的信息登录FusionCompute。说明:若出现“现象描述”中第三种情况,此时无法登录FusionCompute,则需要重启故障VRM所在主机,待主备VRM倒换后,再登录FusionCompute。在“监控>告警”页面,找到生成的“ALM-15.1002000主备间节点心跳故障”告警,查看该告警的附加信息并记录该故障节点的IP地址。选择“虚拟机和模板”。在“虚拟机”页面,通过虚拟机的IP地址找到故障VRM虚拟机。查看并记录故障VRM虚拟机所属的主机。在“主机”页签,通过主机名称找到故障VRM虚拟机所在主机。查看并记录该主机的IP地址。修改主机配置使用“PuTTY”,登录故障VRM节点所在主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,修改VRM监控配置。cd/opt/galax/eucalyptus/usr/share/eucalyptusshvrm_monitor.shset显示如下信息,表示VRM监控配置修改成功。setVM_RECOVER_TIMEsucceed重新安装故障VRM虚拟机在FusionCompute中,使用VNC方式登录故障VRM虚拟机。挂载光驱,选择“FusionComputeV100R006C00U1_VRM.iso”。此处不勾选“立即重启虚拟机,安装操作系统”。使用“PuTTY”,登录故障VRM虚拟机所在主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,设置故障VRM虚拟机从光驱启动。/opt/galax/NCclientncModifyBootVRM虚拟机IDcdrom执行以下命令,强制重启故障VRM虚拟机。/opt/galax/NCclientncRebootVMVRM虚拟机ID1例如:/opt/galax/NCclientncRebootVMi-000000011重新安装VRM虚拟机。安装之前,请记录VRM虚拟机原有的IP地址、主机名和用户密码,重新安装时,这些信息需要与原有的保持一致。说明:重新安装的VRM版本必须与故障前保持一致,如不一致,请重新安装或者升级到相同版本。卸载光驱在虚拟机“硬件”页签中,单击“光驱”。在光驱页面,单击“卸载光驱”。弹出提示框。单击“确定”。完成卸载光驱。是否使用智能网卡?是,执行步骤30。否,执行步骤24。检测和恢复网卡乱序使用“PuTTY”,登录故障VRM虚拟机所在主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,查询VRM虚拟机的DomainID。xllist回显如下类似信息,其中“ID”列显示的值为虚拟机的DomainID。NameIDMemVCPUsStateTime(s)Domain-0035842r191256.0i-00000002130712-b125717.7i-0000000D33163832-b27127.6说明:以查询到的VRM虚拟机的DomainID为33为例,则eth0对应的虚拟网口为vif33.0。执行以下命令,查询VRM虚拟机的eth0网口是否已乱序。xenstore-ls-f|grep"vif/DomainID/0/bridge"例如:xenstore-ls-f|grep"vif/33/0/bridge"显示如下类似信息,如果显示信息中包含“br.1.pg.1”,说明网卡没有乱序,否则说明网卡已乱序。/local/domain/0/backend/vif/33/0/bridge="br.1.pg.1"是,执行步骤29。否,执行步骤30。恢复乱序的网卡。恢复VRM虚拟机的规格说明:故障前VRM虚拟机的规格,可在FusionCompute中VRM虚拟机的“硬件”页签中查询。使用“PuTTY”,登录新安装的VRM节点。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,进入/opt/galax/vrm/tomcat/script目录。cd/opt/galax/vrm/tomcat/script/执行以下命令,运行配置脚本。shmodifyVrmNodeMemory.sh命令参数命令参数的取值范围如下:表1管理虚拟机配置脚本数据参数说明取值样例命令参数虚拟机规格的参数。取值范围:S:虚拟机规格为2个CPU、3GB内存M:虚拟机规格为4个CPU、5GB内存L:虚拟机规格为8个CPU、8GB内存XL:虚拟机规格为12个CPU、16GB内存XXL:虚拟机规格为20个CPU、30GB内存S例如:shmodifyVrmNodeMemory.shS回显如下信息,表示执行成功。modifyvrmjavaheapsuccessmodifyOMjavaheapsuccessmodifyPortaljavaheapsuccessmodifygaussdbspecsuccess执行以下命令,重启节点。reboot配置主备关系重新安装VRM节点后,需要手动配置该节点主备关系。判断故障节点之前是否做过磁盘扩容操作。是,执行步骤37。否,执行步骤38。参考为VRM节点磁盘进行扩容(VRM虚拟化部署)中的“为VRM虚拟机扩容”部分,对磁盘分区空间进行扩容。使用“PuTTY”,登录之前运行正常的VRM节点。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,停止软件监控进程。servicehadstop使用“PuTTY”,登录新安装的VRM节点。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,配置新安装的VRM节点为备节点。sh/opt/galax/gms/common/ha/configHA.sh-mslave-l本节点管理IP地址-p对端节点管理IP地址-L本节点名称-P对端节点名称-f浮动IP地址-g仲裁IP地址例如:sh/opt/galax/gms/common/ha/configHA.sh-mslave-l-p-LVRM01-PVRM02-f-g说明:仲裁IP地址最多可以配置三个,配置多个仲裁IP地址时需要使用英文逗号隔开,如:IP1,IP2。如果之前更换过VRM主备间HA的证书,需要重新更换证书,如果之前更新过VRM主备间HA加密私钥口令的密钥,需要重新更新密钥,。在之前运行正常的VRM节点,执行以下命令,判断该节点是否为默认主节点。cat/opt/galax/data/ha/hainfo|grepdftmode查看执行结果,dftmode的值是否为primary。是,执行步骤50。否,执行步骤47。在新安装的VRM节点上,执行以下命令恢复默认主节点HA配置。sh/opt/galax/gms/common/ha/InitPrimary.sh回显“InitHAsuccessfully.”,表示执行成功。执行如下命令,检查软件监控进程是否运行。servicehadstatus是,执行步骤50。否,执行步骤49。执行如下命令,启动软件监控进程。servicehadstartFusionCompute的数据业务是否部署到独立的Oracle数据库?是,执行步骤51。否,执行步骤53。在新安装的VRM节点上,执行以下命令切换目录。cd/opt/galax/vrm/tomcat/script/db_shift执行以下命令,切换为oracle数据库。shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-instance"实例名"或shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-service"服务名"其中,“IP地址”:访问Oracle服务器的IP地址。“端口”:访问Oracle数据库的端口号。“实例”或“服务”:Oracle数据库中已创建的实例或服务。执行该命令大约耗时20秒。显示如下信息,表示执行成功。SwitchDBtoOraclesuccessed!完成后,执行步骤53。在之前运行正常的VRM节点,执行以下命令启动软件监控进程。servicehadstart等待约1分钟,执行以下命令,查看主备状态。servicehadquery显示如下信息,表示主备状态正常。dNODEROLEPHASERESSVERSTARTNODEROLEPHASERESSVERSTARTha2(VRM02)activeActivednormalV100R001C012014-11-0614:11:27ha1(VRM01)standbyDeactivednormalV100R001C012014-11-0614:10:31说明:如果之前更换过VRM主备HA的证书,需要参考更换VRM主备间HA的认证证书重新更换证书。如果之前更新过VRM主备HA加密私钥口令的密钥,需要参考更新VRM主备间HA加密私钥的密钥重新设置。恢复VRM备节点NTP服务新安装的VRM节点需要执行此操作。在FusionCompute上选择“系统管理>系统配置>时间管理”,记录NTP服务器的IP地址。使用“PuTTY”登录主VRM节点,并切换至“root”用户。执行以下命令,获取时区信息。cat/etc/sysconfig/clock|grepTIMEZONE显示如下信息:TIMEZONE="Asia/Beijing"使用“PuTTY”登录恢复后的VRM节点,并切换至“root”用户。执行以下命令,为恢复后的VRM节点配置NTP服务。perl/opt/galax/gms/common/config/configNtp.pl-ntpipNTP服务器1的IP地址,NTP服务器12的IP地址,NTP服务器12的IP地址-cycle6-timezone时区信息-forcetrue例如:perl/opt/galax/gms/common/config/configNtp.pl-ntpip-cycle6-timezoneAsia/Beijing-forcetrue显示如下信息:excuteconfigNtp.plbegin.Shuttingdownnetworktimeprotocoldaemon(NTPD)excuteconfigNtp.plsuccess修改ftppatchuser帐户的密码如果故障之前已经修改过VRM节点的ftppatchuser帐户的密码,则需要在VRM节点恢复后修改它的ftppatchuser帐户密码,以保证主备VRM节点的密码一致。故障之前是否修改过VRM节点的ftppatchuser帐户的密码?是,参考修改ftppatchuser帐户密码修改恢复后的VRM节点的ftppatchuser帐户密码。否,无需处理,跳转至下一步。还原主机配置使用“PuTTY”,登录备VRM节点所在的主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,还原VRM监控配置。cd/opt/galax/eucalyptus/usr/share/eucalyptusshvrm_monitor.shreset显示如下信息,表示VRM监控配置还原成功。resetVM_RECOVER_TIMEsucceed配置告警上报和单点登录功能如果系统已配置单点登录和告警上报功能,VRM虚拟机恢复后,需重新配置该虚拟机(另一台VRM虚拟机无需重新配置)。配置FusionCompute告警上报,配置单点登录,检查系统状态在FusionCompute中,查看“ALM-15.1002000主备间节点心跳故障”告警是否已自动清除。是,处理完毕。否,联系技术支持。参考信息无。2.2.2主机操作系统故障现象描述主机不能正常登录或存在“ALM-10.1000027心跳异常”的告警。可能原因主机的操作系统故障。主机的硬件故障。定位思路无。处理步骤排查告警登录FusionCompute。查看告警列表中是否存在“ALM-10.1000027心跳异常”告警。是,执行步骤3。否,执行步骤5。单击告警ID,按照弹出的告警帮助进行告警恢复。恢复完成后,告警是否自动清除?是,执行步骤18。否,执行步骤5。重启主机在FusionCompute中,重启故障主机。故障主机是否恢复?是,执行步骤18。否,执行步骤7。重新安装主机重新安装主机的操作系统。安装完操作系统后,需对主机网络信息进行配置,并确认配置的IP地址、主机名等信息和原主机保持一致。如果有用户虚拟机使用了该主机的本地磁盘,则在重装操作系统时,如果装在原操作系统所在的磁盘上,则主机操作系统的分区大小必须与重装之前的大小保持一致,也可以选择装在无用户数据的新磁盘上,避免覆盖用户虚拟机的数据。查看原操作系统所在磁盘的方法:在FusionCompute中,选择“计算池”。在左侧导航树上选中故障主机,并在右侧选择“配置>存储设备”。列表中显示该主机所有存储设备。找到磁盘名称为“xxxxx-part10”的磁盘,则原操作系统所在磁盘名称为“xxxxx”。安装主机时,选择磁盘的方法:进入主机配置界面后,选中“Partition”,按“Enter”,即可进入选择磁盘的界面,如图1所示。图1选择磁盘恢复主机数据使用“PuTTY”,登录VRM主节点。以“gandalf”用户,通过管理平面浮动IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,恢复主机配置。cd/opt/galax/vrm/tomcat/script/hostpowerscriptshhostfaultrestore.sh根据界面提示,输入故障主机的管理平面IP地址和gesysman帐号的密码,密码为GeEnginE@123。例如:VRM01:/opt#cd/opt/galax/vrm/tomcat/script/hostpowerscriptVRM01:/opt/galax/vrm/tomcat/script/hostpowerscript#shhostfaultrestore.shPleaseinputhostIP:Pleaseinputpasswordofgesysman:显示如下信息时,表示数据恢复成功。Isbeingrestored,pleasewait...hostfaultrestoresuccess.说明:重新安装的CNA版本必须与故障前保持一致,如不一致,请重新安装或者升级到相同版本。恢复命令不能重复执行,如果执行失败,请在排除问题后重新安装操作系统,进行数据恢复操作。如果无法排除问题,请联系技术支持。恢复多路径数据当使用的是华为的存储设备时,需要手动对多路径信息进行恢复。当前使用的存储设备是否为华为的存储设备?是,执行步骤13。否,执行步骤18。使用“PuTTY”,登录主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,恢复多路径信息。/opt/uvp/multipath/change_multipath_mode.sh1执行以下命令,重启主机。reboot启动管理虚拟机被恢复的主机是否是VRM、FusionManager、FusionStorageManager等管理虚拟机所在主机?是,执行步骤19。否,处理完毕。在FusionCompute中,查看VRM、FusionManager、FusionStorageManager等管理虚拟机的状态是否均为“运行中”。是,执行步骤21。否,执行步骤20。启动未运行的管理虚拟机。备份VRM数据若未重新安装主机的操作系统,无需执行该操作。在FusionCompute中,查看并记录该主机上运行的VRM虚拟机ID。例如,VRM虚拟机的ID为“i-00000001”。使用“PuTTY”,登录VRM主节点。以“gandalf”用户,通过管理平面浮动IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,查看VRM节点配置文件的名称。cd/etc/galax/vm_xmlll说明:“VRM节点配置文件”的格式为“VRM虚拟机ID.xml”。VRM节点配置文件保存在VRM默认主节点上,如果当前主节点没有该配置文件,请登录另一个VRM节点获取。执行以下命令,将运行在该主机上的VRM节点的配置文件拷贝到该主机上。scpxml文件的名称gandalf@主机的IP地址:/home/GalaX8800例如:scpi-00000001.xmlgandalf@0:/home/GalaX8800输入“yes”,保存配置。按照界面提示输入主机操作系统密码。说明:主机操作系统gandalf用户的默认密码为“Huawei@CLOUD8”。使用“PuTTY”,登录主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,进入“/home/GalaX8800”目录。cd/home/GalaX8800执行以下命令,将配置文件拷贝至“/etc/galax/eucalyptus”目录。cpxml文件的名称/etc/galax/eucalyptus例如:cpi-00000001.xml/etc/galax/eucalyptus参考信息无。2.2.3VRM虚拟机本地存储双盘故障操作场景该任务指导维护工程师对VRM虚拟机和FusionCompute主机操作系统所属的两块组为RAID1的磁盘同时故障时的恢复操作。对系统的影响VRM管理单节点故障,可能会发生主备倒换。必备事项前提条件已获取VRM节点的浮动IP地址以及gandalf用户和root用户的密码。已获取VRM节点数据库galax用户的密码。已登录FusionCompute。已获取PuTTY工具(获取途径:/)。已获取WinSCP工具(获取途径:/)。操作步骤记录故障信息并更换故障硬盘在FusionCompute中,记录以下故障信息。故障硬盘上运行的VRM虚拟机的ID,例如:i-00000001。查看VRM虚拟机的ID的路径为:“虚拟机和模板>虚拟机”。故障硬盘所对应的数据存储的名称,例如:autoDS01。查看数据存储名称的路径为:“存储池>数据存储”。更换故障的两块本地硬盘,并且为更换后的硬盘重新创建RAID组。修改数据存储的关联状态使用“PuTTY”,登录主VRM。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,修改数据存储的关联状态。sh/opt/galax/vrm/tomcat/script/brm/mod_ds_status.sh"数据存储的名称"例如:sh/opt/galax/vrm/tomcat/script/brm/mod_ds_status.sh"datastore"删除故障硬盘上的虚拟机和逻辑磁盘执行以下命令,修改VRM虚拟机的操作权限。说明:系统默认VRM虚拟机不允许删除,所以需要修改VRM虚拟机的操作权限,才可以在FusionCompute中删除故障硬盘上运行的VRM虚拟机。sh/opt/galax/vrm/tomcat/script/OpenRights.sh故障硬盘上VRM虚拟机ID根据界面提示,输入VRM数据库的密码,默认密码为“SingleLOUD!1”。提示以下信息说明权限修改成功。OpenVMoperatingauthoritysucceed在FusionCompute中,删除故障硬盘上的虚拟机和逻辑磁盘。故障硬盘上的虚拟机和逻辑磁盘可以通过以下路径查询。虚拟机:“存储池>数据存储名称>虚拟机”逻辑磁盘:“存储池>数据存储名称>磁盘”故障硬盘对应数据存储上的虚拟机和裸机磁盘删除后,在FusionCompute中删除该数据存储。重新安装主机重新安装主机的操作系统。安装完操作系统后,需对主机网络信息进行配置,并确认配置的IP地址、主机名等信息和原主机保持一致。如果有用户虚拟机使用了该主机的本地磁盘,则在重装操作系统时,要将操作系统安装在原操作系统所在磁盘或是无用户数据的新磁盘上,避免覆盖用户虚拟机的数据。查看原操作系统所在磁盘的方法:在FusionCompute中,选择“计算池”。在左侧导航树上选中故障主机,并在右侧选择“配置>存储设备”。列表中显示该主机所有存储设备。找到磁盘名称为“xxxxx-part10”的磁盘,则原操作系统所在磁盘名称为“xxxxx”。安装主机时,选择磁盘的方法:进入主机配置界面后,选中“Partition”,按“Enter”,即可进入选择磁盘的界面,如图1所示。图1选择磁盘

恢复主机数据使用“PuTTY”,登录VRM主节点。以“gandalf”用户,通过管理平面浮动IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,恢复主机配置。cd/opt/galax/vrm/tomcat/script/hostpowerscriptshhostfaultrestore.sh根据界面提示,输入故障主机的管理平面IP地址和gesysman帐号的密码。例如:VRM01:/opt#cd/opt/galax/vrm/tomcat/script/hostpowerscriptVRM01:/opt/galax/vrm/tomcat/script/hostpowerscript#shhostfaultrestore.shPleaseinputhostIP:Pleaseinputpasswordofgesysman:显示如下信息时,表示数据恢复成功。Isbeingrestored,pleasewait...hostfaultrestoresuccess.说明:恢复命令不能重复执行,如果执行失败,请在排除问题后重新安装操作系统,进行数据恢复操作。恢复多路径数据当使用的是华为的存储设备时,需要手动对多路径信息进行恢复。使用“PuTTY”,登录主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,恢复多路径信息。/opt/uvp/multipath/change_multipath_mode.sh1执行以下命令,重启主机。reboot扫描并添加数据存储在FusionCompute中,进入故障硬盘所在主机的配置页面,扫描并添加数据存储。重新创建并安装VRM虚拟机在FusionCompute中,根据当前正常运行的VRM虚拟机规格,通过模板导入方式重新创建一个VRM虚拟机,创建的VRM虚拟机名称需与原故障VRM虚拟机一致。且其所有的虚拟机设置、虚拟机属性规格以及IP地址、主机名和用户密码均需要与原来的VRM虚拟机保持一致。说明:重新安装的VRM版本必须与故障前保持一致,如不一致,请重新安装或者升级到相同版本。恢复VRM虚拟机的规格说明:故障前VRM虚拟机的规格,可在FusionCompute中VRM虚拟机的“硬件”页签中查询。使用“PuTTY”,登录新安装的VRM节点。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,进入/opt/galax/vrm/tomcat/script目录。cd/opt/galax/vrm/tomcat/script/执行以下命令,运行配置脚本。shmodifyVrmNodeMemory.sh命令参数命令参数的取值范围如下:表1管理虚拟机配置脚本数据参数说明取值样例命令参数虚拟机规格的参数。取值范围:S:虚拟机规格为2个CPU、3GB内存M:虚拟机规格为4个CPU、5GB内存L:虚拟机规格为8个CPU、8GB内存XL:虚拟机规格为12个CPU、16GB内存XXL:虚拟机规格为20个CPU、30GB内存S例如:shmodifyVrmNodeMemory.shS回显如下信息,表示执行成功。modifyvrmjavaheapsuccessmodifyOMjavaheapsuccessmodifyPortaljavaheapsuccessmodifygaussdbspecsuccess执行以下命令,重启节点。reboot配置主备关系重新安装VRM节点后,需要手动配置该节点主备关系。判断故障节点之前是否做过磁盘扩容操作。是,执行步骤29。否,执行步骤31。参考为VRM节点磁盘进行扩容(VRM虚拟化部署)的“为VRM虚拟机绑定新磁盘”部分,为VRM虚拟机绑定新磁盘。参考为VRM节点磁盘进行扩容(VRM虚拟化部署)的“为VRM虚拟机扩容”部分,对磁盘分区空间进行扩容。使用“PuTTY”,登录之前运行正常的VRM节点。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,停止软件监控进程。servicehadstop使用“PuTTY”,登录新安装的VRM节点。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,配置新安装的VRM节点为备节点。sh/opt/galax/gms/common/ha/configHA.sh-mslave-l本节点管理IP地址-p对端节点管理IP地址-L本节点名称-P对端节点名称-f浮动IP地址-g仲裁IP地址例如:sh/opt/galax/gms/common/ha/configHA.sh-mslave-l-p-LVRM01-PVRM02-f-g说明:仲裁IP地址最多可以配置三个,配置多个仲裁IP地址时需要使用英文逗号隔开,如:IP1,IP2。如果之前更换过VRM主备间HA的证书,需要重新更换证书,如果之前更新过VRM主备间HA加密私钥口令的密钥,需要重新更新密钥,。在之前运行正常的VRM节点,执行以下命令,判断该节点是否为默认主节点。cat/opt/galax/data/ha/hainfo|grepdftmode查看执行结果,dftmode的值是否为primary。是,执行步骤43。否,执行步骤40。在新安装的VRM节点上,执行以下命令恢复默认主节点HA配置。sh/opt/galax/gms/common/ha/InitPrimary.sh回显“InitHAsuccessfully.”,表示执行成功。执行如下命令,检查软件监控进程是否运行。servicehadstatus是,执行步骤43。否,执行步骤42。执行如下命令,启动软件监控进程。servicehadstartFusionCompute的数据业务是否部署到独立的Oracle数据库?是,执行步骤44。否,执行步骤46。在新安装的VRM节点上,执行以下命令切换目录。cd/opt/galax/vrm/tomcat/script/db_shift执行以下命令,切换为oracle数据库。shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-instance"实例名"或shswitchDbToOracle.sh-mode"slave"-dbtype"oracle"-ipaddress"IP地址"-port"端口"-service"服务名"其中,“IP地址”:访问Oracle服务器的IP地址。“端口”:访问Oracle数据库的端口号。“实例”或“服务”:Oracle数据库中已创建的实例或服务。执行该命令大约耗时20秒。显示如下信息,表示执行成功。SwitchDBtoOraclesuccessed!完成后,执行步骤46。在之前运行正常的VRM节点,执行以下命令启动软件监控进程。servicehadstart等待约1分钟,执行以下命令,查看主备状态。servicehadquery显示如下信息,表示主备状态正常。dNODEROLEPHASERESSVERSTARTNODEROLEPHASERESSVERSTARTha2(VRM02)activeActivednormalV100R001C012014-11-0614:11:27ha1(VRM01)standbyDeactivednormalV100R001C012014-11-0614:10:31恢复其他管理虚拟机若该故障磁盘上有其他的管理虚拟机,例如FusionManager,则参考对应产品的产品文档进行管理虚拟机的恢复。配置VRM虚拟机随主机启动属性在主VRM上执行以下命令。sh/opt/galax/vrm/tomcat/script/configVRM.sh按照提示依次输入当前的新创建的VRM虚拟机ID,VRM数据库密码。默认密码为“SingleLOUD!1”。执行以下命令,重启VRM进程。servicevrmdrestart使用“PuTTY”,登录新创建的VRM。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,关闭新创建的VRM虚拟机。halt在FusionCompute上,选择“虚拟机和模板>虚拟机”,在虚拟机列表中启动新创建的VRM虚拟机,使配置生效。关闭新创建VRM虚拟机的操作权限使用“PuTTY”,登录主VRM虚拟机。以“gandalf”用户,通过浮动IP地址登录。系统同时支持密码和公私钥对进行身份认证,如果使用公私钥对进行登录认证,执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,关闭修改VRM节点的权限。sh/opt/galax/vrm/tomcat/script/CloseRights.sh新创建VRM虚拟机的ID显示如下信息:Pleaseimportdatabasepassword:按照提示输入VRM数据库密码。默认密码为“SingleLOUD!1”。生成新创建VRM虚拟机的配置文件在VRM主节点上,执行以下命令,生成新创建VRM虚拟机的配置文件。perl/opt/galax/vrm/tomcat/script/vrmWindowsInstall/bin/importVrmDb.pl-g-i新创建VRM虚拟机的ID虚拟机ID输入新创建VRM虚拟机的ID,配置文件的格式为“新创建VRM虚拟机的ID.xml”,生成的配置文件保存在“/home”目录下。执行以下命令,将新创建VRM虚拟机的配置文件拷贝到其运行的主机上。scpxml文件的名称gandalf@主机的IP地址:/home/GalaX8800/例如:scp/home/i-00000002.xmlgandalf@:/home/GalaX8800/按照界面提示输入主机操作系统密码。使用“PuTTY”登录新创建VRM虚拟机所在的主机,并切换至“root”用户。执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行如下命令,将新创建VRM虚拟机的配置文件移动至“/etc/galax/eucalyptus/”目录下。mv/home/GalaX8800/xml文件的名称/etc/galax/eucalyptus/例如:mv/home/GalaX8800/i-00000002.xml/etc/galax/eucalyptus/(可选)若主机操作系统安装在U盘,则执行以下命令,持久化新创建VRM虚拟机的配置文件。uvp_configer_bakup-uGE-a/etc/galax/eucalyptus/xml文件的名称例如:uvp_configer_bakup-uGE-a/etc/galax/eucalyptus/i-00000002.xml配置新创建VRM虚拟机的NTP服务在FusionCompute上选择“系统管理>系统配置>时间管理”,查看系统是否配置了NTP服务器。是,记录NTP服务器的IP地址后,执行步骤69。否,执行步骤73。使用“PuTTY”登录主VRM虚拟机,并切换至“root”用户。执行以下命令,获取时区信息。cat/etc/sysconfig/clock|grepTIMEZONE显示如下信息:TIMEZONE="Asia/Beijing"使用“PuTTY”登录新创建VRM虚拟机,并切换至“root”用户。执行以下命令,配置新创建VRM虚拟机的NTP服务。perl/opt/galax/gms/common/config/configNtp.pl-ntpipNTP服务器1的IP地址,NTP服务器12的IP地址,NTP服务器12的IP地址-cycle6-timezone时区信息-forcetrue例如:perl/opt/galax/gms/common/config/configNtp.pl-ntpip-cycle6-timezoneAsia/Beijing-forcetrue显示如下信息:excuteconfigNtp.plbegin.Shuttingdownnetworktimeprotocoldaemon(NTPD)excuteconfigNtp.plsuccess配置FusionCompute告警上报和单点登录FusionSphere场景时,在新安装的VRM上配置FusionCompute告警上报和单点登录,具体方法请参考配置FusionCompute告警上报与配置单点登录。2.2.4VRM虚拟机关机后无法启动现象描述当主备VRM虚拟机由于人为或者系统内部异常原因,同时被下电后,致使依赖其运行的FusionCompute服务异常,无法重新启动VRM虚拟机。可能原因在FusionCompute中对虚拟机执行关机操作。在VRM虚拟机上执行关机命令。VRM操作系统异常引发VRM自动关机。处理步骤使用“PuTTY”,登录VRM节点所在主机。以“gandalf”用户,通过管理IP地址登录。执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su-root执行以下命令,防止系统超时退出。TMOUT=0执行以下命令,查看以虚拟机id开头的xml文件,查找虚拟机id。ll/etc/galax/eucalyptus执行以下命令,使用NCclient工具启动虚拟机/opt/galax/NCclientncStartInstances虚拟机ID例如:/opt/galax/NCclientncStartInstancesi-00000001说明:该命令仅用于主备VRM都关机的场景。通过命令可以启动一个VRM虚拟机,另一个VRM虚拟机需要通过FusionCompute启动。2.3FusionManager管理节点故障2.3.1修改FusionManager管理IP地址导致FusionManager连接异常现象描述修改FusionManager管理IP地址后,出现以下故障现象,需要参考本故障处理操作,使业务快速恢复正常。无法登录FusionManager界面。无法ping通FusionManager管理IP地址。可能原因新的FusionManager管理IP地址不可用。FusionManager管理IP地址未配置成功。定位思路无。处理步骤检查网络,确保新的FusionManager管理IP地址网络正常,IP地址可用。说明:若要修改FusionManager的网关地址,需要根据组网情况,同步修改管理平面的其他网络配置。例如,相关物理设备上配置的网关地址。使用VNC方式,以“galaxmanager”用户登录FusionManager节点。执行以下命令,查看当前FusionManager管理IP地址是否为正确的新的管理IP地址。ifconfig是,请联系技术支持。否,执行步骤4。重新手动配置FusionManager管理IP地址,具体操作方法请参考配置FusionManager。参考信息无。2.3.2修改VSAM管理IP地址导致VSAM连接异常现象描述修改VSAM管理IP地址后,出现以下故障现象,需要参考本故障处理操作,使业务快速恢复正常。VSAM连接状态异常。无法ping通VSAM管理IP地址。可能原因新的VSAM管理IP地址不可用。VSAM管理IP地址未配置成功。定位思路无。处理步骤在FusionCompute上,通过VNC登录VSAM节点虚拟机。VSAM节点为主备部署时,先登录VSAM主节点进行操作。以“root”用户登录后,执行以下命令,查看并记录管理网卡的IP地址。ifconfig-a执行以下命令,使用vi编辑器编辑打开文件。vi/opt/omm/ha/module/harm/plugin/conf/mngrFloatIp.xml按“i”进入编辑模式,修改“primaryIp”的值为步骤2中记录的IP地址。如果“primaryIp”已经是步骤2中记录的IP地址,无需进行操作。按“ESC”,输入:wq,保存并退出。执行如下命令,清除路由信息。echo>/etc/sysconfig/network/routes执行以下命令,修改VSAM节点的管理IP地址。sh/opt/galax/gms/common/modsysinfo/modifyMgntIP.shPrimaryIPSecondaryIPFloatIPFM_IPNetmaskGateway“PrimaryIP”:待修改的VSAM主节点管理IP地址。VSAM单节点部署时,设置为VSAM节点管理IP地址。“SecondaryIP”:待修改的VSAM备节点管理IP地址。VSAM单节点部署时,设置为VSAM节点管理IP地址。“FloatIP”:待修改的VSAM节点浮动IP地址。VSAM单节点部署时,设置为VSAM节点管理IP地址。“FM_IP”:如果VSAM未接入FusionManager,设置为“”;如果VSAM已接入FusionManager,设置为FusionManager的浮动IP地址。“Netmask”:待修改的IP地址所在网段的子网掩码。“Gateway”:待修改的IP地址所在网段的网关。示例:sh/opt/galax/gms/common/modsysinfo/modifyMgntIP.sh120执行如下命令,重新配置VSAM的网关。echo"default待修改的IP地址所在网段的网关--">/etc/sysconfig/network/routesservicenetworkrestart示例:echo"default--">/etc/sysconfig/network/routesservicenetworkrestartVSAM节点主备部署时,参考步骤1~步骤8,登录VSAM备节点进行操作。在VSAM主节点上,执行以下命令,登录数据库。psql-Ugalaxvsam数据库默认密码为“SingleLOUD!1”。执行以下命令,查询所有VSA虚拟机信息。select*fromtbl_vsa;回显信息示例如下:VSA_ID|ADMIN_STATE|DESCRIPTION|IP_ADDRESS|NAME|STATUS+++++000000004f78889b014f788b22d00000|t|VSA91|1|VS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论