FusionManager云平台告警处理指南_第1页
FusionManager云平台告警处理指南_第2页
FusionManager云平台告警处理指南_第3页
FusionManager云平台告警处理指南_第4页
FusionManager云平台告警处理指南_第5页
已阅读5页,还剩223页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、FusionManager 云平台告警处理指南目 录前 言ii HYPERLINK l _bookmark0 ALM-FusionManager.9001 FusionManager 和域服务器连接异常1 HYPERLINK l _bookmark2 ALM-FusionManager.9002 FusionManager 与 SNMP 管理站连接异常3 HYPERLINK l _bookmark4 ALM-FusionManager.9201 FusionManager 与上级时间服务器同步时间失败5 HYPERLINK l _bookmark13 ALM-FusionManager.920

2、2 NTP 服务启动失败8 HYPERLINK l _bookmark18 ALM-FusionManager.9203 FusionManager 服务器时间被修改11 HYPERLINK l _bookmark22 ALM-FusionManager.9204 FusionManager 与上级时间服务器时间差异过大13 HYPERLINK l _bookmark26 ALM-FusionManager.9206 FusionManager 数据备份失败15 HYPERLINK l _bookmark50 ALM-FusionManager.9207 License 即将过期23 HYPE

3、RLINK l _bookmark53 ALM-FusionManager.9208 License 已经过期25 HYPERLINK l _bookmark56 ALM-FusionManager.9209 当前资源数量大于 License 许可上限27 HYPERLINK l _bookmark61 ALM-FusionManager.9210 当前 License 已失效30 HYPERLINK l _bookmark64 ALM-FusionManager.9215 系统磁盘使用率过大33 HYPERLINK l _bookmark72 ALM-FusionManager.9216 专

4、享升级服务即将到期36 HYPERLINK l _bookmark75 ALM-FusionManager.9217 专享升级服务已经过期39 HYPERLINK l _bookmark78 ALM-FusionManager.9220 虚拟机模板丢失41 HYPERLINK l _bookmark85 ALM-FusionManager.9221 FusionManager F5 设备吞吐量超过告警阈值43 HYPERLINK l _bookmark90 ALM-FusionManager.9222 部署服务健康告警45 HYPERLINK l _bookmark91 ALM-FusionM

5、anager.9223 应用健康告警47 HYPERLINK l _bookmark92 ALM-FusionManager.9300 VDC 资源不足49 HYPERLINK l _bookmark93 ALM-FusionManager.9301 计划任务执行失败51 HYPERLINK l _bookmark99 ALM-FusionManager.9400 网络的端口组数据一致性校验异常54 HYPERLINK l _bookmark100 ALM-FusionManager.9401 VTEP 网络子网校验异常56 HYPERLINK l _bookmark101 ALM-Fusio

6、nManager.9801 FusionManager 资源异常58 HYPERLINK l _bookmark111 ALM-FusionManager.9803 FusionManager 与内部部件连接异常63 HYPERLINK l _bookmark120 ALM-FusionManager.9804 VM 在 Hypervisor 上丢失66 HYPERLINK l _bookmark130 ALM-FusionManager.9805 FusionManager 与第三方部件连接异常69 HYPERLINK l _bookmark132 ALM-FusionManager.980

7、7 从 UDS 下载话单文件失败71 HYPERLINK l _bookmark134 ALM-FusionManager.9808 上传话单文件到 FTP 失败73 HYPERLINK l _bookmark136 ALM-FusionManager.9809 二级存储断连75 HYPERLINK l _bookmark138 ALM-FusionManager.9811 VDC 容量 CPU 分配率超过阈值77 HYPERLINK l _bookmark139 ALM-FusionManager.9812 VDC 容量内存分配率超过阈值79 HYPERLINK l _bookmark140

8、 ALM-FusionManager.9813 VDC 容量存储分配率超过阈值81 HYPERLINK l _bookmark141 ALM-FusionManager.9814 虚拟机规格一致性检验异常83 HYPERLINK l _bookmark142 ALM-FusionManager.9902 FusionManager 双机心跳中断85 HYPERLINK l _bookmark147 ALM-FusionManager.9903 FusionManager 双机文件同步失败87 HYPERLINK l _bookmark151 ALM-FusionManager.9905 Fus

9、ionManager 第三方仲裁心跳中断90 HYPERLINK l _bookmark154 ALM-0 x000803220001 FusionManager 所在服务器 CPU 利用率超过阈值93 HYPERLINK l _bookmark158 ALM-0 x000803220002 FusionManager 所在服务器内存利用率超过阈值95 HYPERLINK l _bookmark162 39 ALM-0 x000803220005 设备离线97 HYPERLINK l _bookmark167 40 ALM-0 x000803220103 交换机堆叠分裂99 HYPERLINK

10、 l _bookmark172 41 ALM-0 x000803220104 SMM 板离线101 HYPERLINK l _bookmark177 42 ALM-0 x000803220105 刀片服务器不在位103 HYPERLINK l _bookmark180 43 ALM-0 x000803220106 交换机堆叠异常105 HYPERLINK l _bookmark183 44 ALM-0 x000803220107 交换机数据恢复失败107 HYPERLINK l _bookmark185 45 ALM-0 x000803220108 硬盘状态异常109 HYPERLINK l

11、_bookmark189 46 ALM-0 x000803220109 硬盘不在位111 HYPERLINK l _bookmark193 47 ALM-0 x000803220110 电源状态异常113 HYPERLINK l _bookmark197 48 ALM-0 x000803220111 风扇状态异常115 HYPERLINK l _bookmark201 ALM-0 x000803220112 服务器硬盘占用率超过提示阈值117 HYPERLINK l _bookmark205 ALM-0 x000803220113 服务器硬盘占用率超过次要阈值120 HYPERLINK l _

12、bookmark209 ALM-0 x000803220114 服务器硬盘占用率超过重要阈值123 HYPERLINK l _bookmark213 ALM-0 x000803220115 服务器硬盘占用率超过紧急阈值126 HYPERLINK l _bookmark217 ALM-0 x000803220116 服务器 CPU 温度超过提示阈值129 HYPERLINK l _bookmark228 ALM-0 x000803220117 服务器 CPU 温度超过次要阈值132 HYPERLINK l _bookmark239 ALM-0 x000803220118 服务器 CPU 温度超过

13、重要阈值135 HYPERLINK l _bookmark250 ALM-0 x000803220119 服务器 CPU 温度超过紧急阈值138 HYPERLINK l _bookmark261 ALM-0 x000803220120 服务器下行网络带宽超过提示阈值141 HYPERLINK l _bookmark266 ALM-0 x000803220121 服务器下行网络带宽超过次要阈值143 HYPERLINK l _bookmark271 ALM-0 x000803220122 服务器下行网络带宽超过重要阈值145 HYPERLINK l _bookmark276 ALM-0 x000

14、803220123 服务器下行网络带宽超过紧急阈值147 HYPERLINK l _bookmark281 61 ALM-0 x000803220124 服务器网口状态异常149 HYPERLINK l _bookmark286 62 ALM-0 x000803220125 服务器离线152 HYPERLINK l _bookmark291 63 ALM-0 x000803220126 CPU 状态异常154 HYPERLINK l _bookmark297 64 ALM-0 x000803220127 内存状态异常156 HYPERLINK l _bookmark303 65 ALM-0 x

15、000803220128 GPU 状态异常158 HYPERLINK l _bookmark307 66 ALM-0 x000803220129 SMM 板帐户异常160 HYPERLINK l _bookmark317 67 ALM-0 x000803220130 FusionManager 硬件管理服务中断163 HYPERLINK l _bookmark319 68 ALM-0 x000803220131 BMC 离线165 HYPERLINK l _bookmark323 69 ALM-0 x000803220132 风扇不在位167 HYPERLINK l _bookmark328

16、70 ALM-0 x000803220133 电源不在位169 HYPERLINK l _bookmark333 71 ALM-0 x000803220134 服务器 RAID 组降级171 HYPERLINK l _bookmark337 72 ALM-0 x000803220135 防火墙主备故障173 HYPERLINK l _bookmark340 73 ALM-0 x000803220136 防火墙安全域端口故障175 HYPERLINK l _bookmark342 74 ALM-0 x000803220137 防火墙管理链路故障178 HYPERLINK l _bookmark3

17、44 ALM-0 x000803220138 系统同步配置到交换机/板功能被去激活180 HYPERLINK l _bookmark345 ALM-15.1002000 VSAM 主备间节点心跳故障182 HYPERLINK l _bookmark354 ALM-15.1007006 VSAM 时钟同步进程异常186 HYPERLINK l _bookmark357 ALM-15.1007007 VSAM 系统定时服务进程异常189 HYPERLINK l _bookmark360 ALM-15.1007009 VSAM 与 NTP 服务器心跳状态异常192 HYPERLINK l _book

18、mark368 ALM-15.1007010 VSAM 系统时钟跳变超过一分钟196 HYPERLINK l _bookmark374 81 ALM-15.1007011 配置通道客户端进程异常199 HYPERLINK l _bookmark377 ALM-15.1007017 VSAM 双机备份进程异常202 HYPERLINK l _bookmark388 ALM-15.1007019 VSAM 未配置 NTP 服务器207 HYPERLINK l _bookmark390 ALM-15.1007099 VSAM 备份或上传关键数据失败209 HYPERLINK l _bookmark3

19、96 ALM-15.1010000 VSA 与 VSAM 心跳异常212 HYPERLINK l _bookmark406 86 ALM-15.1010001 系统存在未受控 VSA216 HYPERLINK l _bookmark410 87 ALM-15.1010002 VSAM 和 VSA 配置数据不一致218 HYPERLINK l _bookmark413 88 ALM-15.1010003 VSA 业务异常2201 ALM-FusionManager.9001 FusionManager和域服务器连接异常告警解释FusionManager启动10s定时任务周期检测域服务器是否在位,

20、通过ping对端IP的方式实现,10s为周期如果连续3次出现ping超时,触发此告警。告警属性告警ID告警级别可自动清除9001重要是告警参数参数名称参数含义附加信息告警内容补充信息。流水号按照告警产生的先后顺序为每条告警信息顺序分配的编号。告警名称固定为“FutionManager与域服务器连接异常”。对象类型固定为“AD Server”。告警对象域服务器IP地址。部件类型固定为“FusionManager”。产生时间告警产生的时间。清除时间告警清除的时间。参数名称参数含义清除类型告警清除的类型,例如手工清除和自动清除。清除用户清除告警的用户名称。对系统的影响当出现此告警时,由于Fusion

21、Manager与域服务器连接异常,则FusionManager中对应的域用户将无法登录FusionManager。可能原因域服务器配置参数不正确。网络中断。服务器异常。处理步骤单击“监控”。进入“告警列表”页面。在本条告警所在行点击,在弹出的窗口中查看告警详细信息,记录附加信息中的告警对象。单击“系统”。单击“第三方认证配置”。进入“第三方认证配置”页面。在第三方认证配置页面中,根据告警附加信息中的告警对象,找到对应的配置信息,检查域服务参数是否正确。根据检查结果,配置正确的参数信息,并单击保存。大约2分钟后,查看告警是否清除?是,处理完毕。否,执行 HYPERLINK l _bookmark

22、1 步骤8。请联系技术支持。-结束参考信息无。2 ALM-FusionManager.9002 FusionManager 与 SNMP 管理站连接异常告警解释FusionManager启动10s定时任务周期检测SNMP管理站是否在位,通过ping对端IP的方式实现,10s为周期如果连续3次出现ping超时,触发此告警。告警属性告警ID告警级别可自动清除9002重要是告警参数参数名称参数含义附加信息告警内容补充信息。流水号按照告警产生的先后顺序为每条告警信息顺序分配的编号。告警名称固定为“FusionManager与SNMP管理站连接异常”。对象类型固定为“SNMP Manager Stati

23、on”。告警对象SNMP管理站名称。部件类型固定为“FusionManager”。产生时间告警产生的时间。清除时间告警清除的时间。参数名称参数含义清除类型告警清除的类型,例如手工清除和自动清除。清除用户清除告警的用户名称。对系统的影响当出现此告警时,由于FusionManager与SNMP管理站连接异常,则FusionManager与对应SNMP管理站之间的业务功能将不可用。可能原因SNMP管理站IP地址配置不正确。网络中断。服务器异常。处理步骤单击“监控”。进入“告警列表”页面。在本条告警所在行点击,在弹出的窗口中查看告警详细信息,记录附加信息中的SNMP管理站名称和SNMP管理站IP。单击

24、“系统”。进入“SNMP管理站”页面。在“SNMP管理站”页面,配置正确的IP地址,并单击保存。大约2分钟后,查看告警是否清除?是,处理完毕。否,执行 HYPERLINK l _bookmark3 步骤6。请联系技术支持。-结束参考信息无。3 ALM-FusionManager.9201 FusionManager与上级时间服务器同步时间失败告警解释时间管理模块按设置的同步周期检测上级时间服务器状态,当连续10次检测到上级时间服务器不可用时,系统产生此告警。当系统检测到上级时间服务器可用时,告警恢复。告警属性告警ID告警级别可自动清除9201重要是告警参数参数名称参数含义附加信息告警内容补充信

25、息。流水号按照告警产生的先后顺序为每条告警信息顺序分配的编号。告警名称固定为“FusionManager与上级时间服务器同步时间失败”。对象类型固定为“Time Management”。告警对象固定为“Time Management”。部件名称固定为“FusionManager”。产生时间告警产生的时间。清除时间告警清除的时间。参数名称参数含义清除类型自动清除。清除用户清除告警的用户名称。对系统的影响此告警产生时,FusionManager节点不能正常的将上级时间服务器作为时间服务器,从而难以获得精准的时间。可能原因FusionManager节点与上级时间服务器时间差异大于1分钟。Fusion

26、Manager节点与上级时间服务器网络连接异常。上级时间服务器时间同步服务异常。处理步骤1单击“系统管理”。进入“系统管理”页面。2在“系统管理”页面,单击“时间管理”。进入“时间管理”页面。3查看时间服务器1的IP,即为上级时间服务器的IP。4使用“PuTTY”,登录FusionManager节点。用“galaxmanager”用户,以FusionManager节点的管理IP登录。5执行以下命令,查看通信状况。ping 上级时间服务器的IP,如ping 0返回信息如下所示,则通信正常。ping 0 (0) 56(84) bytes of data.64 bytes from 0: icmp_

27、seq=1 ttl=64 time=0.035 ms 64 bytes from 0: icmp_seq=2 ttl=64 time=0.028 ms 64 bytes from 0: icmp_seq=3 ttl=64 time=0.025 ms6通信是否正常? 是,执行 HYPERLINK l _bookmark5 步骤7。 否,检查网络连接,确保网络通畅。7执行以下命令,并按提示输入“root”用户的密码,切换至“root”用户。su - root8执行以下命令,查看上级时间服务器时间同步服务是否可用。ntpq -p 上级时间服务器的IP,如ntpq -p 1返回信息如下所示,则服务正常

28、。GMN01: # ntpq -p 1remoterefidst t when poll reachdelayoffset jitter=*LOCAL(0).LOCL.11 l 41064 3770.0000.0000.004上级时间服务器时间同步服务是否可用?是,执行 HYPERLINK l _bookmark7 步骤11。否,执行 HYPERLINK l _bookmark6 步骤10。修复上级时间服务器,确保同步服务正常。查看上级时间服务器的时间和FusionManager节点的时间差是否小于一分钟?是,执行 HYPERLINK l _bookmark11 步骤17。否,执行 HYPER

29、LINK l _bookmark8 步骤12。在“系统管理”页面单击“时间管理”,进入“时间同步”页面。在“时间同步”界面,单击“强制时间同步”。强制时间同步过程中,会重启系统服务,耗时约20分钟。等待大约20分钟后,重新登录FusionManager,进入“时间同步”页面,查看强制时间同步是否成功?是,执行 HYPERLINK l _bookmark9 步骤15。否,执行 HYPERLINK l _bookmark12 步骤18。查看告警是否清除?是,处理完毕。否,执行 HYPERLINK l _bookmark10 步骤16。按照产品文档“故障处理”章节中的“系统时间错误”指导进行处理。等

30、待1015个时间同步间隔,查看告警是否自动清除?是,处理完毕。否,执行 HYPERLINK l _bookmark12 步骤18。请联系技术支持。-结束参考信息无4 ALM-FusionManager.9202 NTP 服务启动失败告警解释时间管理模块监测NTP服务状态,如果检测到NTP服务停止将尝试重启NTP服务,尝试3次,如果都失败,系统产生此告警。当时间管理模块监测NTP服务状态正常时告警自动清除。告警属性告警ID告警级别可自动清除9202重要是告警参数参数名称参数含义附加信息告警内容补充信息。流水号按照告警产生的先后顺序为每条告警信息顺序分配的编号。告警名称固定为“NTP服务启动失败”

31、。对象类型固定为“Time Management”。告警对象固定为“Time Management”。部件名称固定为“FusionManager”。产生时间告警产生的时间。参数名称参数含义清除时间告警清除的时间。清除类型自动清除。清除用户清除告警的用户名称。对系统的影响此告警产生时,系统不能正常的与上级时间服务器同步,从而难以获得精准的时间。可能原因时间同步进程停止。时间同步进程出现故障。处理步骤使用“PuTTY”,登录FusionManager节点主机。用“galaxmanager”用户,以FusionManager节点的管理IP登录。执行以下命令,并按提示输入“root”用户的密码,切换至

32、“root”用户。su - root执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,查看进程状态。service ntp status返回信息如下所示,状态为“running”则进程正常。remoterefidst t when poll reachdelayoffset jitter=*LOCAL(0).LOCL.5 1164 3770.0000.0000.001Checking for network time protocol daemon (NTPD):running进程是否正常?是,执行 HYPERLINK l _bookmark17 步骤12。否,执行 HYP

33、ERLINK l _bookmark14 步骤6。执行service ntp restart。执行以下命令,查看进程状态。service ntp status返回信息如下所示,状态为“running”则进程正常。remoterefidst t when poll reachdelayoffset jitter=*LOCAL(0).LOCL.5 1164 3770.0000.0000.001Checking for network time protocol daemon (NTPD):running进程是否正常?是,执行 HYPERLINK l _bookmark15 步骤9。否,执行 HYP

34、ERLINK l _bookmark16 步骤10。等待23分钟,查看告警是否清除。是,处理完毕。否,执行 HYPERLINK l _bookmark17 步骤12执行ps -aux | grep ntpd查看服务进程ID。执行kill -9 进程ID,执行是否成功?是,执行 HYPERLINK l _bookmark14 步骤6否,执行 HYPERLINK l _bookmark17 步骤12请联系技术支持。-结束参考信息无。5 ALM-FusionManager.9203 FusionManager服务器时间被修改告警解释时间管理模块监测到FusionManager节点时间被修改,同时修改

35、的时间超出了FusionManager节点允许的时间调整阈值(默认60秒),系统产生此告警。告警处理完成后,告警自动清除。告警属性告警ID告警级别可自动清除9203重要是告警参数参数名称参数含义附加信息告警内容补充信息。流水号按照告警产生的先后顺序为每条告警信息顺序分配的编号。告警名称固定为“FusionManager服务器时间被修改”。对象类型固定为“Time Management”。告警对象固定为“Time Management”。部件名称固定为“FusionManager”。产生时间告警产生的时间。参数名称参数含义清除时间告警清除的时间。清除类型自动清除。清除用户清除告警的用户名称。对系

36、统的影响此告警产生时,系统的功能会产生异常,如FusionManager使用定时器的业务等。同时如果FusionManager配置了上级时间服务器可能会产生“FusionManager与上级时间服务器时间差异过大”的告警。可能原因人为修改了FusionManager节点的时间。处理步骤单击“系统管理”。进入“系统管理”页面。单击“时间管理”。进入“时间同步”页面。在“时间同步”界面,单击“强制时间同步”。强制时间同步过程中,会重启系统服务,耗时约20分钟。等待大约20分钟后,重新登录FusionManager,进入“时间同步”页面,查看强制时间同步是否成功?是,执行 HYPERLINK l _

37、bookmark19 步骤5。否,执行 HYPERLINK l _bookmark21 步骤7。查看告警是否清除?是,处理完毕。否,执行 HYPERLINK l _bookmark20 步骤6。按照产品文档“故障处理”章节中的“系统时间错误”指导进行处理。请联系技术支持。-结束参考信息无6 ALM-FusionManager.9204 FusionManager与上级时间服务器时间差异过大告警解释时间管理模块监测NTP服务状态,如果NTP服务异常是由于与上级时间服务器时间差异超过阈值造成的NTP服务停止,系统产生此告警。告警处理完成后,告警自动清除。告警属性告警ID告警级别可自动清除9204重

38、要是告警参数参数名称参数含义附加信息告警内容补充信息。流水号按照告警产生的先后顺序为每条告警信息顺序分配的编号。告警名称固定为“FusionManager与上级时间服务器时间差异过大”。对象类型固定为“Time Management”。告警对象固定为“Time Management”。部件名称固定为“FusionManager”。产生时间告警产生的时间。参数名称参数含义清除时间告警清除的时间。清除类型自动清除。清除用户清除告警的用户名称。对系统的影响此告警产生时,FusionManager节点不能正常的与上级时间服务器同步。此时,因为缺少了可靠的上级时间服务器,将无法对FusionManage

39、r节点的时间进行精确校准。可能原因FusionManager节点与上级时间服务器时间差异超过阈值(默认60秒),停止与上级时间服务器同步。处理步骤单击“系统管理”。进入“系统管理”页面。单击“时间管理”。进入“时间同步”页面。在“时间同步”界面,单击“强制时间同步”。强制时间同步过程中,会重启系统服务,耗时约20分钟。等待大约20分钟后,重新登录FusionManager,进入“时间同步”页面,查看强制时间同步是否成功?是,执行 HYPERLINK l _bookmark23 步骤5。否,执行 HYPERLINK l _bookmark25 步骤7。查看告警是否清除?是,处理完毕。否,执行 H

40、YPERLINK l _bookmark24 步骤6。按照产品文档“故障处理”章节中的“系统时间错误”指导进行处理。请联系技术支持。-结束参考信息无7 ALM-FusionManager.9206 FusionManager数据备份失败告警解释备份恢复模块在每天2:00进行本地自动备份,每隔30分钟,把备份文件上传到第三方服务器。当本地自动备份失败或上传备份文件到第三方服务器失败,系统产生此告警。在告警的附加信息中会说明产生告警的错误码和错误信息。由于本地自动备份失败产生的告警,告警级别为重要,需要用户手工清除。由上传备份文件到第三方服务器失败产生的告警,告警级别为重要,会自动清除。告警属性告

41、警ID告警级别可自动清除9206重要/次要是/否告警参数参数名称参数含义附加信息告警内容补充信息。流水号按照告警产生的先后顺序为每条告警信息顺序分配的编号。告警名称固定为“FusionManager数据备份失败”。对象类型固定为“backup and restore”。参数名称参数含义告警对象包括:LocalAutoBackup_UnknownLocalAutoBackup_SystemLocalAutoBackup_DBStatusLocalAutoBackup_DBOpLocalAutoBackup_SpaceLocalAutoBackup_SNLocalAutoBackup_LocalF

42、ileLocalAutoBackup_ScriptParamLocalAutoBackup_InitLogUploadBakFile_UnknownUploadBakFile_SNUploadBakFile_UserPassUploadBakFile_UnreachSvrUploadBakFile_LocalFileUploadBakFile_RemoteFileUploadBakFile_FileNumUploadBakFile_ScriptParamUploadBakFile_InitLog部件名称固定为“FusionManager”。产生时间告警产生的时间。清除时间告警清除的时间。清除类

43、型告警清除的类型,例如手工清除和自动清除。清除用户清除告警的用户名称。对系统的影响当出现一次本地自动备份失败,系统会缺少一天的备份数据。当出现一次上传备份文件到第三方服务器失败,第三方服务器会缺少一份备份数据。可能原因本地自动备份失败或上传备份文件到第三方服务器失败。处理步骤确认原因处理故障1 处理故障2请参见下表。序号错误码错误描述处理方案110409101本地自动备份失败,内部错误。执行 HYPERLINK l _bookmark27 处理故障1210409106本地自动备份失败,数据库状态异常。执行 HYPERLINK l _bookmark28 处理故障2310409108本地自动备份

44、失败,本地主机备份空间不足。执行 HYPERLINK l _bookmark30 处理故障3410409109本地自动备份失败,本地主机备份文件序号超过上限。执行 HYPERLINK l _bookmark40 处理故障4510409301上传备份文件到第三方服务器失败,内部错误。执行 HYPERLINK l _bookmark27 处理故障1610409309上传备份文件到第三方服务器失败,本地主机备份文件序号超过上限。执行 HYPERLINK l _bookmark43 处理故障5710409310上传备份文件到第三方服务器失败,连接第三方服务器时用户名密码错误。执行 HYPERLINK

45、l _bookmark44 处理故障6810409311上传备份文件到第三方服务器失败,无法连接第三方服务器。执行 HYPERLINK l _bookmark46 处理故障7910409316上传备份文件到第三方服务器失败,本地主机的备份文件数超过上限。执行 HYPERLINK l _bookmark48 处理故障8请联系技术支持。使用“PuTTY”,登录FusionManager节点主机。用“galaxmanager”用户,以FusionManager节点主机的管理IP登录。执行以下命令,防止“galaxmanager”用户超时退出。TMOUT=0执行以下命令,进入数据库启停脚本所在目录。c

46、d /opt/GalaxManager/bin执行以下命令,检查数据库的状态。sh pg_monitor.sh status数据库状态是否正常?处理故障3显示status:abnormal,数据库状态异常,执行 HYPERLINK l _bookmark31 步骤8。显示status:normal,数据库状态正常,执行 HYPERLINK l _bookmark32 步骤10。执行以下命令,启动数据库。sh start_pt.sh启动数据库是否成功?显示start pt successfully,启动数据库成功,执行 HYPERLINK l _bookmark32 步骤10。显示start p

47、t fail,启动数据库失败,执行 HYPERLINK l _bookmark29 步骤2。登录告警页面,手工清除告警。使用“PuTTY”,登录FusionManager节点主机。用“galaxmanager”用户,以FusionManager节点主机的管理IP登录。执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,检查备份目录所在分区的空间。df -mFilesystem1M-blocksUsedAvailableUse%Mounted on/dev/sda1100773152641333%/devtmpfs241171241171%/devtmpfs2411702411

48、70%/dev/shm/dev/sda520163618782%/home/dev/sda92015348811424926%/opt/dev/sda134283152624062971%/opt/GalaxManager/data/dev/sda101007715194142%/opt/UHM/data/dev/sda740313177380891%/opt/cnalog/dev/sda111007715194142%/opt/gmbackup/dev/sda21007715194142%/sysback/dev/sda31007715294142%/tmp/dev/sda610077184

49、93812%/var/log/GalaxManager/dev/sda81007715194142%/var/log/UHM显示每个分区的空间使用情况,查看第6列(Mounted on),目录/opt/gmbackup对应的第4列(Available),可用磁盘空间是否小于900。小于900,执行 HYPERLINK l _bookmark34 步骤14大于等于900,执行 HYPERLINK l _bookmark32 步骤10。执行以下命令,进入目录“/opt/gmbackup/db”。cd /opt/gmbackup/db执行以下命令,查看目录“/opt/gmbackup/db”下的文件

50、和目录。ls检查目录“/opt/gmbackup/db”下是否有不合法的文件和目录。有,执行 HYPERLINK l _bookmark35 步骤17。没有,执行 HYPERLINK l _bookmark36 步骤19。 说明目录和文件的合法性请参见“参考信息”中的说明。执行以下命令,逐个删除目录“/opt/gmbackup/db”下不合法的文件和目录。rm -r 不合法的文件或目录的名字执行 HYPERLINK l _bookmark33 步骤13。执行以下命令,进入目录“/opt/gmbackup/db/manualbk”。cd /opt/gmbackup/db/manualbk执行以下

51、命令,查看目录“/opt/gmbackup/db/manualbk”下的文件和目录。ls检查目录“/opt/gmbackup/db/manualbk”下是否有不合法的文件和目录。有,执行 HYPERLINK l _bookmark37 步骤22。没有,执行 HYPERLINK l _bookmark38 步骤24。执行以下命令,逐个删除目录“/opt/gmbackup/db/manualbk”下不合法的文件和目录。rm -r 不合法的文件或目录的名字执行 HYPERLINK l _bookmark33 步骤13。执行以下命令,进入目录“/opt/gmbackup/db”。cd /opt/gmb

52、ackup/db执行以下命令,查看配置的自动备份文件个数。cat /opt/gmbackup/backup.conf | grep MAX_AUTO_BACKUP_NUM 说明如果用户不进行配置,自动备份文件个数默认为7。执行以下命令,查看目录“/opt/gmbackup/db”下的备份文件。ls 说明备份文件名的格式请参见“参考信息”中的说明。检查目录“/opt/gmbackup/db”下的备份文件个数是否大于所配置的自动备份文件个数。大于,执行 HYPERLINK l _bookmark39 步骤28。不大于,执行 HYPERLINK l _bookmark41 步骤30。执行以下命令,删

53、除序号最小的备份文件。rm -r 序号最小的备份文件的名字处理故障4 说明备份文件的序号查看方法请参见“参考信息”中的说明。执行 HYPERLINK l _bookmark33 步骤13。执行以下命令,进入目录“/opt/gmbackup/db/manualbk”。cd /opt/gmbackup/db/manualbk查看目录“/opt/gmbackup/db/manualbk”下是否存在备份文件。存在,执行 HYPERLINK l _bookmark42 步骤32。不存在,执行 HYPERLINK l _bookmark29 步骤2。执行以下命令,删除序号最小的备份文件。rm -r 序号最

54、小的备份文件的名字执行 HYPERLINK l _bookmark33 步骤13。使用“winscp”,以“galaxmanager”用户登录FusionManager节点主机。进入目录“/opt/gmbackup/db”,查看是否存在序号大于4294967295的备份文件。存在,删除序号大于4294967295的备份文件后,执行 HYPERLINK l _bookmark32 步骤10。不存在,执行 HYPERLINK l _bookmark32 步骤10。处理故障5处理故障6处理故障7 说明备份文件的序号查看方法请参见“参考信息”中的说明。使用“winscp”,以“galaxmanager

55、”用户登录FusionManager节点主机。进入目录“/opt/gmbackup/db”,查看是否存在序号大于4294967295的备份文件。存在,删除序号大于4294967295的备份文件后,执行 HYPERLINK l _bookmark45 步骤38。不存在,执行 HYPERLINK l _bookmark45 步骤38。 说明备份文件的序号查看方法请参见“参考信息”中的说明。进入目录“/opt/gmbackup/db/manualbk”,查看是否存在序号大于4294967295的备份文件。存在,删除序号大于4294967295的备份文件后,执行 HYPERLINK l _bookma

56、rk32 步骤10。不存在,执行 HYPERLINK l _bookmark32 步骤10。准备第三方服务器的IP,ftps服务的用户名和密码,以及第三方服务器ftps服务设置指导书。 说明请参考第三方服务器ftps服务设置指导书,获取ftps服务的用户名和密码。使用“PuTTY”,登录FusionManager节点主机。用“galaxmanager”用户,以FusionManager节点主机的管理IP登录。执行以下命令,以便后续可以执行启用远程备份命令,并防止“galaxmanager”用户超时退出。. /etc/profile; TMOUT=0执行以下命令,启用远程备份,并设置ftps服务

57、端的ip、端口、用户名和密码。remoteBackupMgr -e -h 第三方服务器的IP -p 21 -U “ftps服务的用户名” -P “ftps 服务的密码”例如:remoteBackupMgr -e -h 0 -p 21 -U gmbackupuser -P gmbackup显示:Config remote backup information ok,执行 HYPERLINK l _bookmark32 步骤10。显示:Config remote backup information error,执行 HYPERLINK l _bookmark29 步骤2。准备第三方服务器的IP和

58、第三方服务器ftps服务设置指导书。使用“PuTTY”,登录FusionManager节点主机。用“galaxmanager”用户,以FusionManager节点主机的管理IP登录。执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,查看FusionManager节点主机和第三方服务器之间的网络连接是否正常。ping 第三方服务器IP,如ping 0返回信息如下所示,则通信正常。ping 0 (0) 56(84) bytes of data.64 bytes from 0: icmp_seq=1 ttl=64 time=0.035 ms 64 bytes from 0: i

59、cmp_seq=2 ttl=64 time=0.028 ms 64 bytes from 0: icmp_seq=3 ttl=64 time=0.025 ms通信是否正常?是,执行 HYPERLINK l _bookmark47 步骤48。否,执行 HYPERLINK l _bookmark29 步骤2。检查第三方服务器ftps服务是否正常。正常,执行 HYPERLINK l _bookmark32 步骤10。不正常,请参考第三方服务器ftps服务设置指导书,进行恢复。处理故障8 说明请参考第三方服务器ftps服务设置指导书,检查第三方服务器ftps服务是否正常。执行 HYPERLINK l

60、_bookmark32 步骤10。使用“PuTTY”,登录FusionManager节点主机。用“galaxmanager”用户,以FusionManager节点服务器的管理IP登录。执行以下命令,防止“PuTTY”超时退出。TMOUT=0执行以下命令,进入目录“/opt/gmbackup/db”。cd /opt/gmbackup/db执行以下命令,查看配置的自动备份文件个数。cat /opt/gmbackup/backup.conf | grep MAX_AUTO_BACKUP_NUM 说明如果用户不进行配置,自动备份文件个数默认为7。执行以下命令,查看目录“/opt/gmbackup/db

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论