UMG8900产品黄埔培训系列教材-16 问题定位-操作维护与硬件类_第1页
UMG8900产品黄埔培训系列教材-16 问题定位-操作维护与硬件类_第2页
UMG8900产品黄埔培训系列教材-16 问题定位-操作维护与硬件类_第3页
UMG8900产品黄埔培训系列教材-16 问题定位-操作维护与硬件类_第4页
UMG8900产品黄埔培训系列教材-16 问题定位-操作维护与硬件类_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、HUAWEI TECHNOLOGIES CO., LTDHUAWEI Confidential Security Level: 内部公开UMG8900产品问题定位-操作维护与硬件类ISSUE1.0HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 2第第2章章 硬件类常见问题处理硬件类常见问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 31.1 加载类常见问题处理加载类常见问题处理1.2 LMT无法登陆问题处理无法登陆问题处理HUAWEI TECHNOLOGIES CO.

2、, LTD.HUAWEI Confidential Page 4加载类常见问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 5加载类常见问题处理l版本配置文件(vercfg_xxx.ini)是加载的核心 ,其中记录着主版本号、各主机软件的标准版本号、各种配置文件的标准CRC校验值l版本配置文件使用LOD TOBAM上传之后就可以直接生效,无需复位系统,但CHK VERSION的主版本号需要复位任意一块单板后才会修改HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 6加载类

3、常见问题处理l启动方式设置为LOAD方式,备OMU从主OMU硬盘加载主机软件到本板FLASH中,然后从FLASH解压软件启动,启动过程中不会从主用OMU单板同步配置文件和主机软件l启动后,备用OMU一般会上报“bam文件系统损坏告警”,因为主机软件跟硬盘上的配置文件不配套。只要有此告警备用OMU在LMT面板上就会一直显示“备份态”,所以不要试图等待其变为正常态l手动执行SYC BAMFILE命令,将主用OMU单板的配置文件和主机软件同步到备用OMU上。然后将备用OMU单板启动方式设置为FLASH,手动将其复位,使配置文件生效l备用OMU启动后,会从主用OMU同步告警和日志,此过程中其在LMT面

4、板上显示“备份态”,同步完毕后,显示为“正常态”HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 7加载类常见问题处理l问题现象:连接FTP服务器出错FTP服务器没有打开用户名或密码输入有误导致 l问题现象:FTP文件操作错误硬盘空间不足导致,首先用DSP DISK命令查询硬盘空间,看空间占用是否正常主用OMU硬盘出现问题,处理措施参考UMG8900统一维护手册硬盘故障处理指导书HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 8加载类常见问题处理l问题现象:文件加载超时主用OM

5、U单板内存碎片过多,申请不到大块内存,需要倒换OMU单板加载软件文件不标准,用CHK VERSION和CHK FILE命令查看硬盘上软件是否标准低版本下个别单板无法加载新版本软件,将加载失败的单板设置为LOAD方式启动HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 91.1 加载类常见问题处理加载类常见问题处理1.2 LMT无法登陆问题处理无法登陆问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 10LMT无法登录问题处理检查物理连接检查软件版本检查用户连接数检查系统任

6、务数检查系统内存检查连接数组收集调试信息检查用户锁定倒换单板检查用户时限HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 11第第1章章 操作维护类常见问题处理操作维护类常见问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 122.1 概述概述 2.2 单板不启动问题处理单板不启动问题处理2.3 单板运行中异常复位单板运行中异常复位2.4 常见硬件类告警问题处理常见硬件类告警问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confident

7、ial Page 13概述常见硬件问题:常见硬件问题:l单板不启动单板不启动 单板故障、配置问题l异常复位异常复位 软件BUG、硬件BUG、硬件故障l硬件类告警硬件类告警 硬件故障、软件误告HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 14概述定位思路:定位思路:l常见问题按照固有方法排查常见问题按照固有方法排查l非常见问题收集定位信息联系研发非常见问题收集定位信息联系研发 告警日志(告警日志(LST ALMLOG) 运行日志(运行日志(LST LOG) 系统日志(系统日志(LST SYSLOG) 配置信息(配置信息(DSP CFG

8、) 复位日志(复位日志(do resetlog dump) 异常信息(异常信息(do except dump) 单板信息(单板信息(lst brdver、lst brdarc) 串口信息串口信息HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 152.1 概述概述 2.2 单板不启动问题处理单板不启动问题处理2.3 单板运行中异常复位单板运行中异常复位2.4 常见硬件类告警问题处理常见硬件类告警问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 16单板不启动问题处理l单板

9、不上电单板不上电板类型错误软硬件不匹配MBUS扣板故障板类型存储器故障保险管烧毁/电源模块故障l单板上电后无法正常启动单板上电后无法正常启动板类型错误启动方式设置错误硬盘出错关联性问题电压问题其它HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 17单板不启动问题处理l上电原理上电原理48V 保险管5V 保险管MBUS扣板电源模块.3.3V2.5V1.8V1.0V48V输入5V输入导通控制点OFFLINE蓝灯板类型存储器I2C总线温感1温感2微动开关电压检测HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Conf

10、idential Page 18单板不启动问题处理l单板不上电单板不上电 现象:现象:单板拉手条OFFLINE蓝灯亮,RUN、ALM、ACT灯都不亮;l常见原因常见原因板类型错误软硬件不匹配板类型存储器故障HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 19单板不启动问题处理l单板不上电单板不上电板类型错误板类型错误处理方法:处理方法:1、硬件板类型对应的领域不一致,比如移动领域使用了FNET单板。可以通过修改板 类型解决。(R6B048及其以后版本无此限制)2、非法板类型,修改成实际板类型。HUAWEI TECHNOLOGIES C

11、O., LTD.HUAWEI Confidential Page 20单板不启动问题处理l案例一案例一某局点某局点UG01SCMUUG01SCMU不上电不上电现象:拉手条上offline蓝色指示灯常亮,其它指示灯不亮; LMT面板上SCMU为暗红色不匹配状态;排查步骤:1、查询板类型:mnt mbusinfo slotno: 6; plugin:install; boardtype:virtual; running:no run; power: off; Ugver: 02、修改板类型:mnt wbt scmu 0 6 slotno: 6; plugin:install; boardtype:

12、SCMU; running:running; power: on; Ugver: 03、再次确认指示灯状态:offine灯灭,run灯亮,LMT面板显示为鲜红色,3分钟后成 功启动;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 21单板不启动问题处理l单板不上电单板不上电软硬件不匹配软硬件不匹配处理方法:处理方法:对照硬件配套关系确认是否符合要求HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 22单板不启动问题处理l案例二案例二某局点某局点UG02MS2LUG02MS2L不

13、上电不上电现象:拉手条上offline蓝色指示灯常亮,其它指示灯不亮; LMT面板上对应槽位为暗红色不匹配状态;排查步骤:1、查询MBUS板类型,结果 slotno: 16; plugin:install; boardtype:MS2L; running:no run; power: off; Ugver: 1 ;2、查询软硬件配套关系表,确定UG02MS2L用于SSM256无限制,用于SSM32必须 是R7主机版本支持;3、确认软件版本是R5C10B039,所用机框是SSM32框;4、更换单板到SSM256框后,单板成功启动;HUAWEI TECHNOLOGIES CO., LTD.HUAW

14、EI Confidential Page 23单板不启动问题处理l单板不上电单板不上电板类型存储器故障板类型存储器故障处理方法:处理方法:1、查询板类型,查询板类型为非法值(virtual);2、修改板类型,如果修改后还是virtual值,则是存储器故障,更换单板;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 24单板不启动问题处理l单板不上电单板不上电 现象:现象:单板拉手条上所有灯都不亮;l常见原因常见原因主控板故障MBUS扣板/电源/保险管故障保险管烧毁/电源模块故障HUAWEI TECHNOLOGIES CO., LTD.H

15、UAWEI Confidential Page 25单板不启动问题处理l单板不上电单板不上电主控板故障(主控板故障(TNC/TND/OMU/MPUTNC/TND/OMU/MPU)处理方法:处理方法:解决主控板故障,保证主用主控板正常启动。HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 26单板不启动问题处理l单板不上电单板不上电MBUSMBUS扣板扣板/ /电源电源/5V/5V保险管故障保险管故障处理方法:处理方法:1、确认TNC/TND/OMU/MPU主控板是否正常启动;2、查询单板板类型,结果中没有列出此板信息;3、MBUS扣板上

16、指示灯全部熄灭;4、更换单板HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 27单板不启动问题处理l案例三案例三某局点某局点4 4槽槽UG01MNLUUG01MNLU不上电,不上电,5 5槽槽UG01MNLUUG01MNLU正常正常现象:拉手条上offline蓝色指示灯不亮,其它指示灯不亮; LMT面板上对应槽位看不到此单板;排查步骤:1、查询MBUS板类型,结果中看不到对应槽位信息;2、4、5槽NLU对调位置,故障转移到5槽;3、观察MBUS扣板,发现指示灯不亮,更换故障NLU上的MBUS扣板后正常启动;HUAWEI TECHNOL

17、OGIES CO., LTD.HUAWEI Confidential Page 28单板不启动问题处理l单板不上电单板不上电48V48V保险管烧毁保险管烧毁/48V/48V电源模块故电源模块故障障处理方法:处理方法:1、查询板类型可以返回正常值,而且显示为power on状态;2、上报“致命电压告警”;3、更换单板;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 29单板不启动问题处理l案例四案例四某局点某局点1010槽槽UG01MHRDUG01MHRD不上电,不上电,1111槽槽UG01MHRDUG01MHRD正常正常现象:拉手条上

18、offline蓝色指示灯不亮,其它指示灯不亮; LMT面板上10槽HRD显示红色故障状态;排查步骤:1、查询MBUS板类型,结果正常;slotno: 10; plugin:install; boardtype:MHRD; running:running; power: on; Ugver: 0slotno: 11; plugin:install; boardtype:MHRD; running:running; power: on; Ugver: 02、查看告警信息,发现10槽HRD上报“单板电压致命告警”;3、更换单板HUAWEI TECHNOLOGIES CO., LTD.HUAWEI C

19、onfidential Page 30单板不启动问题处理l单板上电后无法正常启动单板上电后无法正常启动现象现象 LMT上显示单板故障 拉手条上RUN灯常亮 拉手条上RUN灯时而常亮时而快闪原因原因 UG版本错误 启动方式设置错误 硬盘出错 关联性问题 电压问题 其它 HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 31单板不启动问题处理l单板上电后无法正常启动单板上电后无法正常启动UGUG版本错误版本错误 UG版本错误处理方法:处理方法:1、确认软件识别的的UG版本和真实的UG版本是否一致2、对照软硬件配套表确认软件版本是否支持此UG

20、版本3、如果不支持需要升级或换板HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 32单板不启动问题处理l单板上电后无法正常启动单板上电后无法正常启动启动方式设置错误启动方式设置错误 FLASH方式无法获取正确的软件版本文件处理方法:处理方法:修改启动方式设置 SET BRDSTART: MOD=FLASH; - 设置为FLASH方式启动 SET BRDSTART: MOD=LOAD; - 设置为LOAD方式启动HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 33单板不启动问题

21、处理l单板上电后无法正常启动单板上电后无法正常启动硬盘出错硬盘出错情况情况1:文件损坏:文件损坏 LMT中执行CHK FILE:;可以确认文件是否损坏处理方法:处理方法:从服务器重新load文件;情况情况2:硬盘本身故障(:硬盘本身故障(OMU复位)复位) 无法读取硬盘内的加载文件,上报“单板硬件故障”告警,故障原因为“11”可 以确认是硬盘故障。处理方法:处理方法:更换单板硬盘,重新同步文件,同步完成后复位OMU单板。(详细步骤见硬盘&CF卡故障相关信息查询和操作指导书.doc)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 34单

22、板不启动问题处理l案例五案例五某局点升级后,所有某局点升级后,所有HRUHRU单板不能正常启动单板不能正常启动现象:局点升级后,所有HRU不能正常启动,其它单板启动正常排查步骤:1、查询单板启动方式,确认为load方式;2、执行 CHK FILE,发现“hru.vfs”文件校验错误;3、重新加载所有软件;4、加载完毕后,单板启动正常;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 35单板不启动问题处理l案例六案例六某局点升级后,某局点升级后,OMUOMU单板不能正常启动单板不能正常启动现象:局点升级后复位系统,OMU单板不能正常启动

23、排查步骤:1、主用OMU不启动,整个设备瘫痪,只能通过串口信息定位;2、查看串口信息,反复打印“Ide read error , then try my best to repair it”,确定硬盘故障;3、通过串口重新上电加载后正常;(重新加载时有格式化硬盘的操作);HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 36单板不启动问题处理l单板上电后无法正常启动单板上电后无法正常启动关联性问题关联性问题 有些单板的启动有制约关系情况情况1:TDM接口板不启动(包括接口板不启动(包括S1L/S2L/E32/T32/E63/T63/S4

24、L) 主备CLK单板不在位或异常; 主备NET板时钟都不锁定; TNU/TNB与同框接口板类型不匹配; 检查中心交换框的TNU单板没有启动;情况情况2:HRU/ASU单板不启动单板不启动 后插板(E8T/G1O/A4L)故障;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 37单板不启动问题处理l案例七案例七某局点某局点UG01ME32UG01ME32无法启动无法启动现象:某局点3框所有UG01ME32无法启动,其它框的UG01ME32启动正常;排查步骤:1、查询单板启动方式,确认为load方式;2、查看告警信息,发现3框主备NET板

25、都上报时钟失锁;3、检查时钟分发线,发现主备NET板时钟分发线都脱落;4、接好时钟分发线,主备NET板时钟失锁告警恢复,E32正常启动;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 38单板不启动问题处理l案例八案例八某局点某局点UG01MHRUUG01MHRU无法启动无法启动现象:某局点10槽HRU无法启动;排查步骤:1、查询单板启动方式,确认为load方式;2、查看告警信息,发现后插10槽G1O上报电压致命告警,G1O单板状态显示正常;3、更换后插10槽G1O单板,前插10槽HRU正常启动;HUAWEI TECHNOLOGIES

26、 CO., LTD.HUAWEI Confidential Page 39单板不启动问题处理l单板上电后无法正常启动单板上电后无法正常启动电压问题电压问题 电压异常会导致单板芯片不能正常工作处理方法:处理方法:确认有没有电压类告警(详情见后面电压告警处理)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 40单板不启动问题处理l单板上电后无法正常启动单板上电后无法正常启动其它其它 扣板故障、器件故障、软件配置问题等等处理方法:处理方法:扣板故障:VPU类单板居多,需要查看串口信息确认;器件故障:Flash、Cpu、网口芯片 故障居多,需

27、要查看串口信息确认;配置问题:HRD问题最多,添加HRD单板后,必须手动添加IPIF选择对应的接口类型 才能正常启动;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 41单板不启动问题处理l案例九案例九某新建局点某新建局点1 1框主备框主备HRDHRD无法启动无法启动现象:10、11槽主备HRD一直处于故障状态,无法启动;排查步骤:1、查询单板启动方式,确认为load方式;2、查询IPIF是否添加,确认没有添加;3、根据接口类型添加IPIF,3分钟后单板成功启动;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI

28、Confidential Page 42单板不启动问题处理l案例十案例十某新建局点某新建局点VPDVPD无法启动无法启动现象:某局点新扩5块UG01MVPD有一块无法启动;排查步骤:1、查询单板启动方式,确认为load方式;2、查询板类型,确认为UG01MVPD;3、收集串口信息,发现打印“Dsp 1 load fail because of DSP bug!”,确定为0号扣板有问题;4、将扣板重新插拔安装后启动成功;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 43单板不启动问题处理l案例十案例十某新建局点某新建局点VPDVPD无

29、法启动无法启动DSP0-DSP7为0号扣板上的DSP芯片,DSP8-DSP15为1号扣板上的DSP芯片,DSP16DSP23为2号扣板上的DSP芯片;扣板位置图:HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 44单板不启动问题处理l案例十一案例十一某局点某局点UG01MNETUG01MNET板无法启动板无法启动现象:某局点新扩5块UG01MVPD有一块无法启动;排查步骤:1、查询单板启动方式,确认为load方式;2、查看告警信息中只有单板故障告警;2、查询板类型,确认为UG01MNET;3、对照版本配套表确认配置正确;4、收集串口信

30、息,打印 “FLASH_FileWriteByType():Call FLASH_MemWrite Return Error! (f-flash/FlashDrv.c,l-814)”5、Flash芯片故障;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 45思考题l单板不上电有哪些常见原因?l单板上电后不启动有哪些常见原因?l如何确认单板实际板类型?如果错误如何修改?l开局时经常遇到主备HRD都不能启动,为什么?HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 462.1 概述

31、概述 2.2 单板不启动问题处理单板不启动问题处理2.3 单板运行中异常复位单板运行中异常复位2.4 常见硬件类告警问题处理常见硬件类告警问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 47单板运行中异常复位l OMU/OMB/OME因硬盘因硬盘/CF卡故障而复位卡故障而复位l 750 CPU故障复位故障复位l VPD单板内存参数问题复位单板内存参数问题复位HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 48单板运行中异常复位l OMU/OMB/OME因硬盘因硬盘/C

32、F卡故障而复位卡故障而复位现象:现象:OMU/OMB/OME单板运行时突然复位,复位后可以正常启动; 一般会有硬盘故障告警,有些情况没有此告警;处理方法:处理方法:查询此单板的复位日志:(do resetlog dump)+ RESET LOG Output Time: 2006-01-02 12:48:33+ Reset time : 2006-01-02 04:00:50 Reset type : 1(PROGRAM) Reset info : Reset Board for dsik error at ./././src/fam/src/mnt/mnt_main.c(4821) Star

33、t time : 2006-01-02 04:04:58 Start info : Last software watchdog is 0 ticks Last task switch: 0 x30536a8(RPCQ) = 0 x3084338(VIDL)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 49单板运行中异常复位l OMU/OMB/OME因硬盘因硬盘/CF卡故障而复位卡故障而复位处理方法:处理方法:按照指导书步骤修复,如果修复不成功更换硬盘;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Conf

34、idential Page 50单板运行中异常复位l 750CPU单板单板L2Cash问题复位问题复位现象:现象:单板运行中突然复位,复位后可以正常启动 750单板涉及OMU/MPU/PPB/CMF/SPF/TNU/TCLU/HRU处理方法:处理方法:查询单板复位日志(do resetlog dump)和异常堆栈信息(do except dump),有以下记录:HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 51单板运行中异常复位l 750CPU单板单板L2Cash问题复位问题复位+RESET LOG Output Time: 200

35、8-03-26 12:52:58+Reset time : 2008-03-26 12:07:15Reset type : 2(EXCEPT)Reset info : Fatal except. Start time : 2008-03-26 12:09:02+do except dump(查询结果节选):= Exception Info Begin =Exception Time : 2008-03-26 12:07:15Exception VosTick : 537402Exception CpuTick : 0 x0000001f 6d58ed33Exception Type : MAC

36、HINE CHECK EXCEPTIONException Vector Num : 0 x200Exception Task : _MFAM (ID = 14, OsalID = 0 x341bd70)HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 52单板运行中异常复位l 750CPU单板单板L2Cash问题复位问题复位处理方法:处理方法:此故障属于CPU固有问题,与工艺和芯片内部校验方式相关,不可避免;如果故障频率很低可以不用处理;如果一周内连续两次出现问题则将单板作为坏件返回;HUAWEI TECHNOLOGIES CO.,

37、LTD.HUAWEI Confidential Page 53单板运行中异常复位l 750 CPU问题复位问题复位现象:现象:单板运行中突然复位,复位后可以正常启动; 750单板涉及OMU/MPU/PPB/CMF/SPF/TNU/TCLU/HRU处理方法:处理方法:通过调试台查询单板复位日志和异常堆栈信息,有以下记录:do resetlog dump查询结果:+ No reset reason recorded! Last reset : Power-On, pressing or MBUS Start time : 2008-03-03 06:00:41+ Reset time : 2008

38、-03-03 01:31:48 Reset type : 2(EXCEPT) Reset info : Fatal except. Start time : 2008-03-03 01:33:31HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 54单板运行中异常复位l 750 CPU问题复位问题复位 do except dump查询结果节选:= Exception Info Begin =Exception Time : 2008-03-03 01:31:48Exception VosTick : 11645922Exception

39、CpuTick : 0 x0000029f 92f1f5d8Exception Type : DATA ACCESS EXCEPTIONException Vector Num : 0 x300Exception Task : VBDR (ID = 11, OsalID = 0 x3434620)Exception PID : -1Exception CPUID : 43Dopra Version : DOPRA_C V100R005B080CPC013Application Version : UMG8900V200R005C02B052SP06HUAWEI TECHNOLOGIES CO.

40、, LTD.HUAWEI Confidential Page 55单板运行中异常复位l 750 CPU问题复位问题复位处理方法:处理方法: 复位原因是fatal except,堆栈中可以看到0 x300和0 x700异常是750问题导致,此问题为芯片BUG,解决方案有两种:(1)通过UMG8900硬件健康检查工具-750单板测试工具进行检测和修复(2)升级版本,在R5C02B072/R5C10B039/R6/R7版本中已合入750问题的解决方案 【注1】并不是所有的750问题都可以通过软件方案解决,因此现网如果通过750单板测试工具无法修复或已合入解决方案版本仍出现0 x300或0 x700异

41、常的单板,需要申请备件更换。【注2】2007年7月后生产的单板没有750问题HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 56单板运行中异常复位l VPD内存参数问题复位内存参数问题复位现象:现象:单板反复复位,少则几天一次,多则几分钟一次 查询复位日志如下:+ No reset reason recorded! Last reset : Power-On, pressing or MBUS Start time : 2008-03-03 06:00:41+HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Co

42、nfidential Page 57单板运行中异常复位l VPD内存参数问题复位内存参数问题复位处理方法:处理方法:升级软件版本或者打热补丁,如下版本已经合入V100R007C01B041V100R006C02B039 Hotpatch13V100R006C02B048 Hotpatch03V200R007C03B041V200R005C10B039 Hotpatch09V200R005C02B072 Hotpatch03V200R007C05B045HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 582.1 概述概述 2.2 单板不

43、启动问题处理单板不启动问题处理2.3 单板运行中异常复位单板运行中异常复位2.4 常见硬件类告警问题处理常见硬件类告警问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 59常见硬件类问题处理l 电压告警电压告警l 硬件模块类故障硬件模块类故障l 机框监控类故障机框监控类故障HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 60常见硬件类问题处理l 电压告警电压告警 ALM-0006 ALM-0006 单板电压致命告警单板电压致命告警 ALM-0011 ALM-0011 严

44、重低压告警严重低压告警 ALM-0012 ALM-0012 严重高压告警严重高压告警故障影响:故障影响:单板电压致命告警:单板无法启动。严重低压/高压告警:单板反复复位或者单板无法启动。附注:VPD单板在扣某些扣板时可能上报误告警,下文有专题说明。HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 61l 电压监控原理电压监控原理常见硬件类问题处理MBUS扣板MBUS扣板016.MBUS扣板016.MBUS扣板016.MBUS扣板016.016.MBUS扣板016.MBUS扣板016.MBUS扣板016.MPU/OMU/TNCMPU/OM

45、U/TNCHUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 62l 电压类问题处理办法电压类问题处理办法1、确认单板是否有相关告警、确认单板是否有相关告警 2 2、确认单板是否故障、确认单板是否故障 4 4、确认单板板类型是否正确、确认单板板类型是否正确5 5、查询单板电压是否异常、查询单板电压是否异常常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 63l 电压类问题处理办法电压类问题处理办法UMG电压问题处理指导书(通用版)常见硬件类问题处理HUAWEI T

46、ECHNOLOGIES CO., LTD.HUAWEI Confidential Page 64l 电压类问题处理办法电压类问题处理办法VPDVPD误告警处理误告警处理常见硬件类问题处理1 1、确认是否上报、确认是否上报“ALM-0012 ALM-0012 严重高压告警严重高压告警”并且单板还处于正常状态并且单板还处于正常状态 是:步骤2 否:其它问题2 2、确认告警单板是否为、确认告警单板是否为UG01VPD + VDB(VB) UG01VPD + VDB(VB) 或者或者 UG01VPD + ECUG01VPD + EC扣板扣板( (无无TCTC扣板扣板) ) 是:步骤3 否:其它问题3

47、3、确认系统日志中是否记录、确认系统日志中是否记录 Syslog: FamMntGetVltStatusByVolt: High severity volt alarm! The volt of channel 4 in frame 1 slot 1 is 147!” 是:软件误告警,升级至最新热补丁 否:其它问题HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 65l 电压类问题处理办法电压类问题处理办法VPDVPD误告警处理误告警处理常见硬件类问题处理VPD电压误告警确认指导书:HUAWEI TECHNOLOGIES CO., LT

48、D.HUAWEI Confidential Page 66常见硬件类问题处理l案例十二案例十二某局点某局点UG01MNLUUG01MNLU上报电压告警上报电压告警现象:NLU单板上报电压致命告警;排查步骤:1、确认单板是否故障;- 故障2、查询各通道电压值;测量点 正常电压范围(V) 测量电压值(V) 0 3.133.45 3.33 1 1.711.88 0.55 2 0.000.00 0.00 3 0.000.00 0.00 4 0.000.00 0.00 5 0.000.00 0.00 6 4.485.49 4.92(结果个数 = 1)- END3、复位MBUS和插拔单板后故障依旧4、单板

49、故障,更换单板;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 67l 硬件模块类告警处理办法硬件模块类告警处理办法ALM-0007 ALM-0007 单板硬件故障单板硬件故障ALM-0021 ALM-0021 单板硬件模块故障单板硬件模块故障ALM-1059 FMEAALM-1059 FMEA检测告警检测告警常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 68l 硬件模块类硬件模块类告警告警处理办法处理办法ALM-0007 ALM-0007 单板硬件故障单

50、板硬件故障 11 11 硬盘故障硬盘故障 故障原因:故障原因:OMU硬盘硬件损坏。 影响:影响:主用OMU发生此故障后倒换。 解决办法:解决办法:更换硬盘或者单板。 12 MBUS12 MBUS串口通信失败串口通信失败 故障原因:故障原因:主控板(OMU/MPU/TNC/TND)的MBUS扣板故障。 影响:影响:主控板无法刷新本框内MBUS总线信息,故障单板自己复位。 解决办法:解决办法:更换单板。常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 69l 硬件模块类硬件模块类告警告警处理办法处理办法ALM-0007 A

51、LM-0007 单板硬件故障单板硬件故障 13 NET13 NET板板CXECXE芯片故障芯片故障 故障原因:故障原因:主用NET板上的GE交换芯片故障。 影响:影响:此NET板GE平面故障,主备倒换。 解决办法:解决办法:更换单板。常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 70l 硬件模块类告警处理办法硬件模块类告警处理办法ALM-0021 ALM-0021 单板硬件模块故障单板硬件模块故障 21- OMU 21- OMU 时间模块故障时间模块故障 故障原因:故障原因:OMU/OMB/OME时钟芯片故障 影响

52、:影响:系统时间异常 解决办法:解决办法:更换RTC时钟模块。常见硬件类问题处理OMUOME图中黄色部分为RTC时钟模块位置RTC模块编码:39130075 RTC-RTC&256Kb NVRAM-SOH28OMBHUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 71l 硬件模块类告警处理办法硬件模块类告警处理办法ALM-0021 ALM-0021 单板硬件模块故障单板硬件模块故障 22- OMU/MPU22- OMU/MPU单板通信信道故障单板通信信道故障 故障原因:故障原因:OMU/MPU上FE Lanswitch被复位,或者FE

53、Lanswitch故障。 影响:影响:本框内FE平面故障。 解决办法:解决办法: 1、确认告警前是否有lod lan操作,此操作会导致Lanswitch复位,告警可以恢复; 2、确认是否人为复位过Lanswitch,复位后可以告警恢复 3、如果告警不恢复,更换单板。常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 72l 硬件模块类告警处理办法硬件模块类告警处理办法ALM-0021 ALM-0021 单板硬件模块故障单板硬件模块故障 23- TNC23- TNC单板单板BCM5338BCM5338芯片故障芯片故障 故障

54、原因:故障原因:TNC上的BCM5338芯片检测失败。 影响:影响:非误告警情况下会导致本框内FE平面故障。 解决办法:解决办法: 情况1:单板无故障,告警能够恢复,或者反复恢复后上报。 1)确认TNC PCB版本是否为VC,如果为VC则是误告警。 2)确认两点,如果都满足则是误告警 a、告警的TNC是否连接IWF并且为主控框 b、软件版本是不是V1/V2R6C02/R5C10B046以下 情况2:其它情况需要更换单板常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 73l 硬件模块类告警处理办法硬件模块类告警处理办法

55、ALM-0021 ALM-0021 单板硬件模块故障单板硬件模块故障 24- TNC24- TNC单板单板CKMBCKMB时钟扣板故障时钟扣板故障 故障原因:故障原因:TNC单板时钟扣板硬件故障或者不在位或者没有插稳。 影响:影响:系统无法从时钟扣板上上获取时钟 解决办法:解决办法: 1、重新插稳扣板,告警恢复则不用处理。 2、如果告警不恢复,更换时钟扣板。常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 74l 硬件模块类告警处理办法硬件模块类告警处理办法ALM-0021 ALM-0021 单板硬件模块故障单板硬件模

56、块故障 25- NET/BLU25- NET/BLU单板单板BCM5338BCM5338芯片故障芯片故障 27- OMB27- OMB单板单板BCM5338BCM5338芯片故障芯片故障 故障原因:故障原因: NET/BLU/OMB上的BCM5338芯片检测失败。 影响:影响:FE级联接口故障。 解决办法:解决办法: 情况1:告警10秒后能够恢复,或者反复恢复后上报,可以确认是误告警。 情况2:告警不恢复,更换单板。常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 75l 硬件模块类告警处理办法硬件模块类告警处理办法A

57、LM-0021 ALM-0021 单板硬件模块故障单板硬件模块故障 26- LSW26- LSW自检故障自检故障 故障原因:故障原因:OMU/MPU单板FE Lsw芯片故障 影响:影响:经过本OMU/MPU的FE平面,FE通道倒换到另一个OMU/MPU的LSW上 解决办法:解决办法:更换单板常见硬件类问题处理HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 76常见硬件类问题处理l案例十三案例十三某局点某局点UG01MTNCUG01MTNC上报硬件模块故障告警上报硬件模块故障告警现象:TNC上报硬件模块故障告警,10S后恢复,但是反复上

58、报;排查步骤:1、确认TNC版本,执行 lst brdver,节选部分内容如下1框8槽后插MTNC单板-PCB版本 = REV C2、确认单板正常运行,软件误告警;HUAWEI TECHNOLOGIES CO., LTD.HUAWEI Confidential Page 77l 硬件模块类告警处理办法硬件模块类告警处理办法ALM-1059 FMEAALM-1059 FMEA检测告警检测告警 内部内部PHY PHY 芯片故障芯片故障 网口芯片网口芯片a a故障故障 网口芯片网口芯片b b故障故障 66M 66M 时钟故障时钟故障 25M 25M 时钟故障时钟故障 125M 125M 时钟故障时钟故障 33M 33M 时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论