WHUMG应急维护指导书_第1页
WHUMG应急维护指导书_第2页
WHUMG应急维护指导书_第3页
WHUMG应急维护指导书_第4页
WHUMG应急维护指导书_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、WH500220UMG8900 应急维护指导书 (cover)ISSUE 1.0模板使用说明:(Notes Heading,F10) 1. 本模板为培训手册写作专用模板。模板中蓝字字体为该段落应选取的样式,红色字体为模板的使用说明。(Notes Text,F8)2. 套用该模板时,请按正确步骤加载模板。3. 建议直接用该模板建一个新文件来进行写作。写作时一定不要删除文中的分节,直接将封面、课程说明、正文、小结等几部分内容直接拷贝到相应位置,并删除该位置的示例内容,再套用相应的样式。样式说明:(Notes Heading,F10)1. 本模板中标题号、页码为自动编号,不需要修改。2. 表格和图形

2、编号会在章内自动重新编号,正文中的表格和图形编号需要手动插入“交叉引用”。3. Notes Text为自动编号。若不需要编号,需要手动取消编号。(Notes Text,F8)4. 页眉中左侧的课程名称需手动修改;右侧的章节名称及编号由原来的“交叉引用”改为“域”,会自动更新。设置好后就不再需要插入和更新。样式快捷键样式快捷键标题1 (Heading 1)Alt+1表格题注 (Table Description)F5标题2 (Heading 2)Alt+2表头 (Table Heading)F6标题3 (Heading 3)Alt+3表正文 (Table Text)F7标题4 (Heading

3、4)Alt+4说明内容 (Notes Text)F8正文 (Normal)F2特别说明 (Notes Heading)F10正文项目 (Item List)F3图题注 (Figure Description)F11自动编号 (Item Step)F4图文本 (Figure Text)F12模板中样式与快捷键对应表:1. 强烈推荐大家使用快捷键,真的又快又方便。2. 请将该模板放到MicrosoftTemplate下,只有这样快捷键才能生效。WH500220 UMG8900应急维护指导书 ISSUE1.0目 录(TOC Heading) 目 录(TOC Heading)课程说明1课程介绍1课程目

4、标1相关资料1第1章 紧急事故与应急维护流程21.1 紧急事故的界定21.1.1 设备类事故21.1.2 业务类事故31.2 应急处理过程31.2.1 总体处理流程3第2章 设备类事故处理52.1 排除机柜供电故障52.1.1 判断机柜供电是否正常52.1.2 检修供电系统然后加电重启52.2 排除主控框运行故障62.2.1 判断主控框供电是否正常62.2.2 检查OMU单板是否故障62.2.3 检查其它单板是否故障72.3 排除中心交换框运行故障72.3.1 判断中心交换框供电是否正常72.3.2 检查MPU单板是否故障82.3.3 检查其它单板是否故障82.3.4 检查级联系统是否故障82

5、.4 排除业务框运行故障92.4.1 判断业务框供电是否正常92.4.2 检查MPU单板是否故障92.4.3 检查其它单板是否故障102.4.4 检查级联系统是否故障102.5 排除扩展控制框运行故障112.5.1 判断扩展控制框供电是否正常112.5.2 检查MPU单板是否故障112.5.3 检查其它单板是否故障122.5.4 检查级联系统是否故障122.6 排除业务模块运行故障13是否为修改配置数据引起132.6.1 恢复正确的配置数据132.6.2 复位该业务模块所对应的单板132.6.3 更换该业务模块所对应的单板14第3章 业务类故障应急处理153.1 全局业务阻塞的处理153.1.

6、1 全局业务阻塞的处理流程153.1.2 检查硬件设备是否正常163.1.3 检查承载网运行是否正常163.1.4 备份配置数据173.1.5 排除配置数据错误173.1.6 排除主机过载引起的紧急情况183.2 局部业务阻塞的处理183.2.1 局部业务阻塞的处理流程183.2.2 检查硬件设备是否正常193.2.3 检查承载网运行是否正常193.2.4 备份配置数据193.2.5 检查该UMG8900是否正常注册193.2.6 检查UMG8900与MGC之间的通信是否正常203.2.7 检查目的信令点是否可达203.2.8 是否为修改信令数据引起203.2.9 恢复正确的信令数据203.2

7、.10 恢复正确的中继数据203.2.11 转对端交换局处理事故2121华为技术有限公司 版权所有, 未经许可不得扩散WH500220 UMG8900应急维护指导书 ISSUE1.0课程说明(标题1,ALT+1) 课程说明(标题1,ALT+1)课程介绍(标题2,ALT+2)本课程主要介绍UMG8900设备在发生紧急事故的情况下,如何迅速判断事故原因,排除故障,快速恢复系统或设备的正常运行,并将事故损失降到最低。本课程的主要内容如下:第一章介绍紧急事故的分类;第二章针对事故种类和场景进行判断,采取应急措施;第三章介绍如何搜集故障信息,采集哪些故障信息。(正文,F2)课程目标(标题2)完成本课程的

8、学习后,您应该能够: (正文,F2)l 了解UMG8900设备的应急维护方法(Item List,F3)l 掌握UMG8900设备的应急维护措施相关资料(标题2)UMG8900 应急维护手册WH500220 UMG8900应急维护指导书 ISSUE1.00第1章 紧急事故与应急维护流程(标题1,Alt+1)1.1 紧急事故的界定所谓紧急事故,是指突然发生的、影响面广、涉及范围大、并对网络的安全运行与服务质量造成严重后果的设备或网络事故。常见的现象包括:l 大量用户无法使用语音业务;l 大量用户通话过程中出现频繁掉话;l 频繁出现单通、双不通、串话、杂音等现象;l 大量用户不能做主叫或不能做被叫

9、;l 大量用户无法进行数据业务;l 数据业务使用不正常、速率慢、时断时续;l 系统的CPU占用率过高。为便于紧急事故的处理,我们可以从两个方面对与UMG8900有关的紧急事故进行界定:l 按事故影响到的设备功能进行界定,即判断本次事故是否为设备类事故;l 按事故影响到的业务范围进行界定,即判断本次事故是否为业务类事故。1.1.1 设备类事故设备类事故表现在UMG8900整机或者主要部件运行发生了故障,导致在网络中发生了功能完全丧失或大部分丧失的恶性事故。在故障定位的过程中,当出现以下任何一种情况时,我们称本局UMG8900发生了设备类事故:l 所有机柜全部掉电;l 主控框掉电;l 业务框掉电;

10、l 中心交换框掉电;l OMU主备单板故障;l 业务模块瘫痪。业务模块瘫痪是指某个业务模块发生了功能完全丧失的恶性事故,主要表现为该业务模块所对应的主备用单板或者负荷分担的单板的运行均出现了故障或“宕机”。1.1.2 业务类事故业务类事故表现为UMG8900提供的业务出现全局或部分阻塞。1. 全局业务阻塞全局业务阻塞是指本局UMG8900发生了长时间的、全局范围内的业务中断或呼叫阻塞事故。在故障定位的过程中,当出现以下任何一种情况时,我们称本局UMG8900发生了全局业务阻塞事故:l 全部媒体网关均不能正常注册,如无法注册到媒体网关控制器MGC、注册后又立即断开等;l 在UMG8900接入的用

11、户终端中,全部用户终端均发生呼叫阻塞,如无法呼入、无法呼出等;l UMG8900提供的所有中继电路不能正常使用,如TDM电路全部故障、无法呼入、无法呼出等。2. 局部业务阻塞局部业务阻塞是指本局UMG8900发生了长时间的、局部范围内的业务中断或呼叫阻塞事故,其常见的表现形式有:l 部分媒体网关不能正常注册到媒体网关控制器MGC,如无法注册、注册后又立即断开等;l 在UMG8900接入的用户终端中,部分用户终端均发生呼叫阻塞,如无法呼入、无法呼出等;l UMG8900提供的部分中继电路不能正常使用,如TDM电路部分故障、无法呼入、无法呼出等。1.2 应急处理过程1.2.1 总体处理流程应急维护

12、以快速恢复设备的正常运行与业务的正常提供为核心指导思想,其总体处理流程如1. 所示。应急维护的总体处理流程写作说明:1. 章节小结一定要有,而且要新起一页。2. 章节小结可以不用胶片,直接用文字来表述。3. 小结不一定非要在章节结束才有,一个相对独立的内容讲解完后就可以有一个小结。第2章 设备类事故处理设备类事故表现在全部机柜掉电、机框掉电、OMU主备单板故障等,通过查看系统告警、单板指示灯等方法可以判断。对于硬件类故障产生的告警,比如单板温度致命告警、单板电压致命告警、风扇框通讯故障、配电框通讯故障等,请按照相关告警联机帮助介绍来处理有关紧急和重要告警。2.1 排除机柜供电故障2.1.1 判

13、断机柜供电是否正常机柜全部掉电或综合配置机柜掉电必然导致主机设备瘫痪。维护人员可通过以下方法判断机柜的供电是否正常:l 若机柜配电框面板上的“RUN”运行指示灯(绿色)点亮、并每秒钟闪烁1次,则表示机柜的供电正常,即配电框的进线电源正常、配电框的内部电路正常。l 若机柜配电框面板上的“RUN”运行指示灯(绿色)熄灭,则表示机柜的供电不正常,即配电框的两路进线电源全部失压。2.1.2 检修供电系统然后加电重启机柜供电不正常一般是由于机房的供电系统发生故障而引起,在这种情况下,维护人员应按照以下操作步骤进行恢复:在机房的供电系统恢复正常之前,为防止意外,请断开机柜配电框面板上的所有电源开关(SW1

14、SW6)。立即检修机房的供电系统,比如机房的空气开关是否跳闸等。在机房的供电系统恢复正常之后,请对机柜执行加电重启操作。-结束2.2 排除主控框运行故障2.2.1 判断主控框供电是否正常由于主控框内配置有OMU、TNU等重要单板,因此,主控框掉电将直接导致框内的重要单板不能使用,从而导致主机设备瘫痪。维护人员可通过以下方法判断主控框的供电是否正常:l 若主控框内各单板的面板指示灯均被点亮,则表示主控框的供电正常。l 若主控框内单板的面板指示灯均没被点亮,则表示主控框的供电不正常。如果发现为电源模块故障,可按照如下方式尽快处理电源问题,恢复系统。确认提供整框的-48V电源是否有问题,检查机柜上部

15、的配电盒以及配电柜,是否工作正常。检查电源线路是否正常。通过万用表测试电源输出是否正常。如为单板电源模块问题,请更换单板。-结束2.2.2 检查OMU单板是否故障OMU单板作为整个设备的管理控制中心,采用主备方式工作。如果主OMU单板发生故障,设备会自动倒换到备OMU单板,不影响设备运行,如果主备板都发生了故障,则会导致设备无法正常运行。当出现以下任何一种情况时,维护人员即可判断主控框内OMU单板的运行已经处于瘫痪状态:l 主备用OMU单板面板上的“RUN”运行指示灯熄灭或常亮。l 主备用OMU单板面板上的“ALM”故障指示灯点亮。l 在本地维护终端上运行MML命令DSP CPUR,查询主备用

16、OMU单板的CPU占用率在长时间范围内接近100%。当确定OMU单板发生故障后,请更换故障的OMU单板,有关OMU单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.2.3 检查其它单板是否故障主控框内除OMU单板外的其它单板如果发生故障,根据单板的具备功能不同,可能会局部影响设备的运行,造成局部业务中断。当出现以下任何一种情况时,维护人员即可判断主控框内该单板的运行已经处于瘫痪状态:l 该单板面板上的“RUN”运行指示灯熄灭或常亮。l 该单板面板上的“ALM”故障指示灯点亮。l 该单板的CPU占用率在长时间范围内接近100%。当确定该单板发生故障后

17、,请更换有故障的该单板,有关该单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.3 排除中心交换框运行故障2.3.1 判断中心交换框供电是否正常由于中心交换框内配置有MPU、TNU、BLU等重要单板,因此,中心交换框掉电将直接导致框内的重要单板不能使用,从而导致与之相级联的业务框、扩展控制框瘫痪。维护人员可通过以下方法判断中心交换框的供电是否正常:l 若中心交换框内各单板的面板指示灯均被点亮,则表示中心交换框的供电正常。l 若中心交换框内单板的面板指示灯均没被点亮,则表示中心交换框的供电不正常。如果发现为电源模块故障,可按照如下方式尽快处理电源问题

18、,恢复系统。确认提供整框的-48V电源是否有问题,检查机柜上部的配电盒以及配电柜,是否工作正常;检查电源线路是否正常;通过万用表测试电源输出是否正常;如为单板电源模块问题,请更换单板。-结束2.3.2 检查MPU单板是否故障MPU单板作为整个设备的主处理单元,在中心交换框内位于前插7、8槽位,采用主备方式工作。如果主MPU单板发生故障,设备会自动倒换到备MPU单板,不影响设备运行,如果主备板都发生了故障,则会导致设备无法正常运行。当出现以下任何一种情况时,维护人员即可判断中心交换框内MPU单板的运行已经处于瘫痪状态:l 主备用MPU单板面板上的“RUN”运行指示灯熄灭或常亮。l 主备用MPU单

19、板面板上的“ALM”故障指示灯点亮。l 主备用MPU单板的CPU占用率在长时间范围内接近100%。当确定MPU单板发生故障后,请更换故障的MPU单板,有关MPU单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.3.3 检查其它单板是否故障中心交换框内除MPU单板外的其它单板如果发生故障,根据单板的具备功能不同,可能会局部影响设备的运行,造成局部业务中断。当出现以下任何一种情况时,维护人员即可判断中心交换框内该单板的运行已经处于瘫痪状态:l 该单板面板上的“RUN”运行指示灯熄灭或常亮。l 该单板面板上的“ALM”故障指示灯点亮。l 该单板的CPU占

20、用率在长时间范围内接近100%。当确定该单板发生故障后,请更换有故障的该单板,有关该单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.3.4 检查级联系统是否故障中心交换框提供交换与级联功能,通过TNU、NET、BLU单板与主控框、业务框、扩展控制框实现级联功能。当出现以下任何一种情况时,维护人员即可判断级联系统已经处于紧急事故状态:l FE级联网口LINK指示灯频繁出现闪断。l LMT上有级联网口故障告警频繁上报。l 中心交换框主备的BLU单板不停复位,启动失败。当确定级联系统发生故障后,可以尝试从以下几种方法处理故障:l 级联网线的质量有问题、

21、与网口接触不良,需要更换网线、保证与网口接触良好。l 与设备相连的LAN Switch芯片出现问题,需要更换LAN Switch。l 先拔掉BLU上的TDM光纤,如果BLU单板能正常启动,说明是TNU的级联部分频繁倒换引起的BLU复位,这是由于时钟信号不稳定导致,需要更换NET单板或CLK时钟板,保证系统提供稳定的时钟。也可能是TNU单板故障,需要更换TNU单板。2.4 排除业务框运行故障2.4.1 判断业务框供电是否正常由于业务框内配置有MPU、TNU等重要单板,因此,业务框掉电将直接导致框内的重要单板不能使用,从而导致业务中断。维护人员可通过以下方法判断业务框的供电是否正常:l 若业务框内

22、各单板的面板指示灯均被点亮,则表示业务框的供电正常。l 若业务框内单板的面板指示灯均没被点亮,则表示业务框的供电不正常。如果发现为电源模块故障,可按照如下方式尽快处理电源问题,恢复系统。确认提供整框的-48V电源是否有问题,检查机柜上部的配电盒以及配电柜,是否工作正常;检查电源线路是否正常;通过万用表测试电源输出是否正常;如为单板电源模块问题,请更换单板。-结束2.4.2 检查MPU单板是否故障MPU单板作为整个设备的主处理单元,在业务框内位于前插7、8槽位,采用主备方式工作。如果主MPU单板发生故障,设备会自动倒换到备MPU单板,不影响设备运行,如果主备板都发生了故障,则会导致设备无法正常运

23、行。当出现以下任何一种情况时,维护人员即可判断业务框内MPU单板的运行已经处于瘫痪状态:l 主备用MPU单板面板上的“RUN”运行指示灯熄灭或常亮。l 主备用MPU单板面板上的“ALM”故障指示灯点亮。l 主备用MPU单板的CPU占用率在长时间范围内接近100%。当确定MPU单板发生故障后,请更换故障的MPU单板,有关MPU单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.4.3 检查其它单板是否故障业务框内除MPU单板外的其它单板如果发生故障,根据单板的具备功能不同,可能会局部影响设备的运行,造成局部业务中断。当出现以下任何一种情况时,维护人员即

24、可判断业务框内该单板的运行已经处于瘫痪状态:l 该单板面板上的“RUN”运行指示灯熄灭或常亮。l 该单板面板上的“ALM”故障指示灯点亮。l 该单板的CPU占用率在长时间范围内接近100%。当确定该单板发生故障后,请更换有故障的该单板,有关该单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.4.4 检查级联系统是否故障业务框提供业务处理功能,通过TNU或者NET单板与中心交换框实现级联功能,当出现以下任何一种情况时,维护人员即可判断级联系统已经处于紧急事故状态:l FE级联网口指示灯频繁出现闪断。l LMT上有级联网口故障告警频繁上报。l 中心交换

25、框主备的BLU单板不停复位,启动失败。当确定级联系统发生故障后,可以尝试从以下几种方法处理故障:l 级联网线的质量有问题、与网口接触不良,需要更换网线、保证与网口接触良好。l 与设备相连的LAN Switch芯片出现问题,需要更换LAN Switch。l 先拔掉BLU上的TDM光纤,如果BLU单板能正常启动,说明是TNU的级联部分频繁倒换引起的BLU复位,这是由于时钟信号不稳定导致,需要更换NET单板或CLK时钟板,保证系统提供稳定的时钟。也可能是TNU单板故障,需要更换TNU单板。2.5 排除扩展控制框运行故障2.5.1 判断扩展控制框供电是否正常由于扩展控制框内配置有MPU、NET等重要单

26、板,因此,扩展控制框掉电将直接导致框内的重要单板不能使用,从而导致业务中断。维护人员可通过以下方法判断扩展控制框的供电是否正常:l 若扩展控制框内各单板的面板指示灯均被点亮,则表示扩展控制框的供电正常。l 若扩展控制框内单板的面板指示灯均没被点亮,则表示扩展控制框的供电不正常。如果发现为电源模块故障,可按照如下方式尽快处理电源问题,恢复系统。确认提供整框的-48V电源是否有问题,检查机柜上部的配电盒以及配电柜,是否工作正常;检查电源线路是否正常;通过万用表测试电源输出是否正常;如为单板电源模块问题,请更换单板。-结束2.5.2 检查MPU单板是否故障MPU单板作为整个设备的主处理单元,在扩展控

27、制框内位于前插7、8槽位,采用主备方式工作。如果主MPU单板发生故障,设备会自动倒换到备MPU单板,不影响设备运行,如果主备板都发生了故障,则会导致设备无法正常运行。当出现以下任何一种情况时,维护人员即可判断扩展控制框内MPU单板的运行已经处于瘫痪状态:l 主备用MPU单板面板上的“RUN”运行指示灯熄灭或常亮。l 主备用MPU单板面板上的“ALM”故障指示灯点亮。l 主备用MPU单板的CPU占用率在长时间范围内接近100%。当确定MPU单板发生故障后,请更换故障的MPU单板,有关MPU单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.5.3 检查

28、其它单板是否故障扩展控制框内除MPU单板外的其它单板如果发生故障,根据单板的具备功能不同,可能会局部影响设备的运行,造成局部业务中断。当出现以下任何一种情况时,维护人员即可判断扩展控制框内该单板的运行已经处于瘫痪状态:l 该单板面板上的“RUN”运行指示灯熄灭或常亮。l 该单板面板上的“ALM”故障指示灯点亮。l 该单板的CPU占用率在长时间范围内接近100%。当确定该单板发生故障后,请更换有故障的该单板,有关该单板更换的详细操作,请参考HUAWEI UMG8900 通用媒体网关 部件更换相关部分内容。2.5.4 检查级联系统是否故障扩展控制框提供呼叫控制消息处理,通过NET单板与中心交换框实

29、现级联功能。当出现以下任何一种情况时,维护人员即可判断级联系统已经处于紧急事故状态:l FE级联网口指示灯频繁出现闪断。l LMT上有级联网口故障告警频繁上报。l NET单板不停复位,启动失败。当确定级联系统发生故障后,可以尝试从以下几种方法处理故障:l 级联网线的质量有问题、与网口接触不良,需要更换网线、保证与网口接触良好。l 与设备相连的LAN Switch芯片出现问题,需要更换LAN Switch。l 可能是NET单板故障,需要更换NET单板。2.6 排除业务模块运行故障当维护人员确认系统发生了业务模块瘫痪的紧急事故后,应立即按照如下的基本思路来进行处理。是否为修改配置数据引起恢复正确的

30、配置数据复位该业务模块所对应的单板更换该业务模块所对应的单板Error! Reference source not found.-结束是否为修改配置数据引起一般情况下,维护人员不能修改UMG8900的公共参数、模块参数、与对端的协商参数等重要配置数据。如果维护人员不合理地修改了这些配置数据,某些单板可能会出现无法加载或反复加载的现象,从而导致该单板无法正常运行。在这种情况下,维护人员可使用LST LOG命令来查询系统的日志信息,查询有关SET、MOD等命令的操作记录。2.6.1 恢复正确的配置数据若维护人员不合理地修改了上个步骤所描述的配置数据,请立即恢复正确的配置数据,或在华为公司技术服务人

31、员的指导下恢复正确的配置数据。2.6.2 复位该业务模块所对应的单板在维护人员没有错误修改配置数据的情况下,若系统发生了业务模块瘫痪的紧急事故,为快速恢复设备的正常运行与业务的正常提供,维护人员继续如下操作:对该业务模块所对应的单板执行硬件复位操作,然后观察该业务模块的运行是否恢复正常。2.6.3 更换该业务模块所对应的单板在对该业务模块所对应的单板执行硬件复位操作后,若该业务模块的运行仍然未能恢复正常,请尝试通过更换该业务模块所对应的单板来排除故障。第3章 业务类故障应急处理业务类事故表现在UMG8900全局或者大范围业务使用发生阻塞,可以通过大量用户投诉、告警等发现。按照紧急情况发生时故障

32、的现象,初步判断是全局业务阻塞还是局部业务阻塞。全局业务阻塞包括的情况如下:l 由病毒引起的大面积的全局业务受到影响l 硬件线路、电源等导致的全局业务中断l 话务量大时的全局业务阻塞局部业务阻塞包括的情况如下:l 某种业务的故障、某个局向的用户故障l 某块单板上用户的故障(可以根据分配的用户地址来判断)3.1 全局业务阻塞的处理3.1.1 全局业务阻塞的处理流程当维护人员确认系统发生了全局业务阻塞的紧急事故后,应立即按照如下基本思路来进行处理。检查硬件设备是否正常检查承载网运行是否正常备份配置数据排除配置数据错误排除主机过载引起的紧急情况Error! Reference source not

33、found.-结束3.1.2 检查硬件设备是否正常由于硬件设备瘫痪必然同时引发全局业务阻塞事故,因此,维护人员在处理全局业务阻塞事故时,应首先检查UMG8900是否发生了硬件设备瘫痪的事故。3.1.3 检查承载网运行是否正常在UMG8900硬件设备运行正常的情况下,当系统发生业务阻塞事故时,维护人员应首先检查承载网的运行是否正常。常用的检查方法有:l 登录告警台查看是否存在承载网故障的告警。l 查看单板、LAN Switch、Firewall端口上的指示灯,检查是否存在物理连线故障。l 在UMG8900上使用ping命令,检查到相关设备的连接是否正常。在本地维护终端的接口跟踪任务中使用“PIN

34、G” 跟踪任务,向目的地发送ping报文,如果到目的地网络连接工作正常,则目的地主机接收到ping报文后,向源主机发送ping应答报文。ping命令的输出信息包括目的地对每个ping报文的响应情况:l 如果在超时时间内收到响应报文,则输出报文的字节数、报文序号、TTL和响应时间等。l 如果在超时时间内没有收到响应报文,则输出“Requested time out”,最后的统计信息,包括发送报文个数、接收到响应报文个数、未响应报文数百分比和响应时间的最小、最大和平均值。 注意:1. 请先确认哪些地址是可以ping通的,比如公网地址往往由于防火墙的隔离功能,是无法ping通的。使用ping命令时需

35、要注意以下几点:l 如果网络传输速度较慢,可以适当加大等待响应的超时时间。l 如果是在Telnet方式下,可以通过“CTRL+C”中断ping命令。l 每个单板最多同时可以进行5个ping操作。l ping操作是从具有IP接口的单板的网口向目的地发送ping报文,以分析到目的地的网络连接是否正常。当用ping命令测试发现网络出现故障后,可以用tracert测试网络何处有故障。在本地维护终端的接口跟踪任务中使用“TRACERT”跟踪任务,定位承载网中发生故障的路由器的IP地址。与数据通信部门联系,使用专用的仪器或软件测试承载网的传输时延、误码率、丢包率、抖动等参数,以确认承载网是否存在网络拥塞、

36、网络风暴、病毒攻击等故障。当承载网的运行出现故障时,请立即联系数据部门执行承载网事故处理。3.1.4 备份配置数据由于在事故处理的过程中,维护人员可能要执行修改配置数据、复位单板、复位模块甚至复位机框等重大操作,为确保数据安全,在执行修改配置数据等涉及修改BAM数据库的操作之前,维护人员应预先备份配置数据。有关备份配置数据的详细操作请参见“HUAWEI UMG8900 通用媒体网关 系统备份与恢复”。3.1.5 排除配置数据错误在UMG8900正常投入运行以后,维护人员不能随意修改配置数据。如果维护人员不正确地修改了配置数据,例如删除了VPU单板的TC资源管理功能、更改了FE端口的IP地址等,

37、则当系统重新启动后,UMG8900将可能出现全局业务阻塞的事故。通过命令LST LOG查看操作日志可以判断是否有影响全局的数据改动操作,此时应该根据具体的操作进行相应的恢复手段。 注意:1. 数据修改必须在话务量低的时候进行,在数据修改完成后必须进行详细的拨测,确认修改正确,避免引发事故。对于数据改动错误的紧急情况可以按照以下步骤处理:按照操作日志中的操作记录,逐一检查数据,找出导致紧急情况发生的错误数据。修改错误数据。观察是否解决问题。如果找不出数据错误的地方,可以使用紧急情况出现前最近备份的数据来对系统进行重新加载,恢复业务。-结束3.1.6 排除主机过载引起的紧急情况主机过载表现为CPU

38、占用率持续偏高,一般是因为极大话务量、性能测量任务(或者跟踪任务)太多或者流量控制设置不当造成。若CPU占用率持续过高,超过正常的门限,会产生相应的告警。UMG8900支持应用H.248.10/11协议进行过载控制,由MGC对UMG8900的过载情况进行相应的处理,保证UMG8900的系统安全,需要MGC和UMG8900配合完成。当MGC过载控制不成功时,MG需要启动过载保护,防止过载控制不成功时对网关造成损害。过载保护时网关自我实现保护功能,不需要与MGC进行交互,可以进行单独配置与实现。主机过载应该查看是否因为性能测量任务过多,跟踪任务过多,或者性能测量任务周期过短造成。如果是这种情况,则

39、应该删除已登记的不必要性能测量任务和跟踪任务,以减轻CPU的处理负担和前后台通信的消息量。但是对于一些必要的性能测量任务,建议不要删除,对于跟踪任务可以全部关闭。也有可能是因为单板业务忙造成的,或者负荷分担的单板中有一块或多块发生故障或被下电、拔出。此时对于负荷分担的单板,可以考虑增加单板数目。也可以考虑扩容业务框。3.2 局部业务阻塞的处理3.2.1 局部业务阻塞的处理流程当维护人员确认系统发生了UMG8900业务阻塞的紧急事故后,应立即按照如下的基本思路来进行处理。检查硬件设备是否正常检查承载网运行是否正常备份配置数据检查该UMG8900是否正常注册检查UMG8900与MGC之间的通信是否正常检查目的信令点是否可达是否为修改信令数据引起恢复正确的信令数据恢复正确的中继数据转对端交换局处理事故Error! Reference source not found.-结束3.2.2 检查硬件设备是否正常由于硬件设备瘫痪必然同时引发局部业务阻塞事故,因此,维护人员在处理局部业务阻塞事故时,应首先检查UMG8900是否发生了硬件设备瘫痪的事故。3.2.3 检查承载网运行是否正常承载网发生故障也会造成局部业务故障,具体处理方法请参见“3.1.3 检查承载网运行是否正常”。3.2.4 备份配置数据由于在事故处理的过程中,维护人员可能要执行修改配置数据、复位单板、复位模块甚至复位机框等重大操

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论