PTN设备故障处理总体解决方案_第1页
PTN设备故障处理总体解决方案_第2页
PTN设备故障处理总体解决方案_第3页
PTN设备故障处理总体解决方案_第4页
PTN设备故障处理总体解决方案_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 PTN设备故障处理总体解决方案烽火通信PTN设备故障处理总体解决方案1 PTN设备常见告警解析2 OAM简介及其应用3 典型故障处理案例内容摘要4 性能法5 WRAPPING环保护E1J1单盘告警及解释告警名称 中文解释 POWERALM 电源故障告警 SCLK_LOS 系统时钟丢失 PPI_LOS PDH物理接口信号丢失 LINK_LOS 连接信号丢失 CONTEXT_FAIL 建链失败 DZB_IN 端子板不在位 CONTEXT_PACKET_ LOS 本端链路包丢失 CARD_ABSENT 盘不在位 E1J1单盘告警原因及检查名称:POWERALM中文解释:电源故障告警原因:1.2V

2、1.5V 1.8V 2.5V 3.3V 5V任何一路检测到电源值不在设定范围内就产生告警。检查方法: 1、读取E1J1单盘状态、性能,核对相应软硬 件版本; 2、软件复位E1J1单盘; 3、插拔单盘; 4、替换单盘。E1J1单盘告警原因及检查名称:SCLK_LOS中文解释:系统时钟丢失原因:检测不到从背板过来的有效参考时钟时,会上报系统时钟丢失告警检查方法: 1、读取XCU的状态、性能,看XCU是否正常工作; 2、进行XCU主备切换; 3、进行E1J1软件复位; 4、插拔E1J1单盘; 5、替换E1J1单盘; 6、更换E1J1单盘相应槽位。E1J1单盘告警原因及检查名称:PPI_LOS中文解释

3、:PDH物理接口信号丢失原因:E1信号没有正常接入检查方法: 1、检查E1信号是否正常从端子板前面板接入; 2、读取本盘状态、性能,看是否正常。E1J1单盘告警原因及检查名称:LINK_LOS中文解释:连接信号丢失原因:系统口没有和交叉盘连接检查方法: 1、读取XCU的状态、性能,看XCU是否正常工作; 2、进行XCU主备切换; 3、进行E1J1软件复位; 4、插拔E1J1单盘; 5、替换E1J1单盘; 6、更换E1J1单盘相应槽位。E1J1单盘告警原因及检查名称:CONTEXT_FAIL中文解释:建链失败原因:单盘未正常运行或者仿真芯片没有正常工作检查方法: 1、检查单盘配置; 2、读取E1

4、J1状态、性能,看E1仿真是否正常运行; 3、软件复位; 4、插拔单盘; 5、替换单盘。E1J1单盘告警原因及检查名称:DZB_IN中文解释:端子板不在位原因:相应槽位端子板不在正常工作状态检查方法: 1、插拔端子板; 2、替换端子板; 3、更换E1J1及IEJ1的槽位。E1J1单盘告警原因及检查名称:CONTEXT_PACKET_ LOS中文解释:本端链路包丢失原因: 1、网络环境震荡; 2、单盘缓存工作不正常; 3、恢复出来的TDM时钟锁定状态不好。检查方法: 1、通过状态监视查看混存里面的包数是否正常; 2、查看交叉配置是否正确; 3、查看时钟锁定状态。E1J1单盘告警原因及检查名称:C

5、ARD_ABSENT中文解释:盘不在位原因:单盘没有上网管检查方法: 1、相应槽位是否有单盘; 2、相应槽位单盘是否插好; 3、相应槽位单盘是否工作正常。ESJ1单盘告警及解释告警名称 中文解释 POWERALM 电源故障告警 LINK_LOS 连接信号丢失PK_LOS 丢包率过限 PTP_LOS PTP同步丢失 RX_ERR 收坏包过限 ESJ1单盘告警原因及检查名称:POWERALM 中文解释:电源故障告警 原因:电源模块的输出出现过压或欠压 检查方法: 1、读取ESJ1单盘状态、性能,核对相应软硬件版本; 2、软件复位ESJ1单盘; 3、插拔单盘; 4、替换单盘。ESJ1单盘告警原因及检

6、查名称:LINK_LOS 中文解释:链路信号中断 原因:以太网接口接收信号中断 检查方法: 1、检查网线是否接好; 2、检查单盘与交叉盘的GE口工作模式是否一致。ESJ1单盘告警原因及检查名称:PK_LOS 中文解释:丢包率过限 原因:交换机内的丢包数超过了设定的门限值 。检查方法: 1、检查网管界面上端口的收发包数; 2、检查单盘配置中门限设置。 ESJ1单盘告警原因及检查名称:PTP_LOS 中文解释:PTP同步丢失 原因:PTP同步丢失 。检查方法:本地和对端PTP设置是否匹配。 ESJ1单盘告警原因及检查名称:RX_ERR 中文解释:收坏包过限 原因:交换机接收到的坏包数超过了设定的门

7、限值。检查方法:检查网管界面上端口的收发包数和门限设置。GSJ2单盘常见告警及解释告警名称 中文解释 POWERALM 电源故障告警 LINK_LOS 连接信号丢失 TF 发送失效 TMC_LOC TMC连接确认信号丢失 TMP_LOC TMP连接确认信号丢失 TMS_LOC TMS连接确认信号丢失 SCK_LOC 系统时钟丢失 TEMP_TCT 机盘温度过限 GSJ2单盘告警及解释(续)告警名称 中文解释 PTP_ LOS PTP同步丢失 IOP_HIGH 输入光功率过高 IOP_LOW 输入光功率过低 LASER_TCT 激光器温度过限 GSJ2单盘告警原因及检查名称:POWERALM 中

8、文解释:电源故障告警 原因:电源模块输出电压过高或过低 检查方法:1、核对相应软硬件版本是否匹配;2、插拔单盘,重新上电检查是否告警消除;3、使用替换法检测是否为单盘硬件故障。GSJ2单盘告警原因及检查名称:LINK_LOS 中文解释:连接信号丢失 原因:千兆以太网接口接收信号中断 检查方法: 1、检查有无输入光信号,检查输入光功率; 2、检查光纤是否折断; 3、拆下机盘,然后上电检查激光器是否工作正常。 GSJ2单盘告警原因及检查名称:TF 中文解释:发送失效 原因:千兆以太网光模块发送信号失效 检查方法: 1、检查光模块是否在位; 2、检查光模块是否损坏。 GSJ2单盘告警原因及检查名称:

9、TMC_LOC 中文解释:TMC连接确认信号丢失 原因:TMC层通道连接失效 。检查方法: 1、对端相连通的TMC通道中OAM的CV使能是否打开; 2、该TMC通道业务不通,检查线路配置。 GSJ2单盘告警原因及检查名称:TMP_LOC 中文解释:TMP连接确认信号丢失 原因:TMP层通道连接失效 检查方法: 1、对端相连通的TMP通道中OAM的CV使能是否打开; 2、该TMP通道业务不通,检查线路配置。GSJ2单盘告警原因及检查名称:TMS_LOC 中文解释:TMS连接确认信号丢失 原因:TMS层通道连接失效 检查方法: 1、对端相连通的TMS通道中OAM的CV使能是否打开; 2、该TMS通

10、道业务不通,检查线路配置。 GSJ2单盘告警原因及检查名称:SCK_LOC 中文解释:系统时钟丢失 原因:本盘没有收到来自系统的25M时钟 检查方法: 1、读取XCU的状态、性能,看XCU是否正常工作; 2、进行XCU主备切换; 3、进行GSJ2软件复位; 4、插拔GSJ2单盘; 5、替换GSJ2单盘; 6、更换GSJ2单盘相应槽位。GSJ2单盘告警原因及检查名称:TEMP_TCT 中文解释:机盘温度过限 原因:机盘温度过高 检查方法: 1、检查单盘状态中机盘温度是否为合理值,检查温度上报是否准确; 2、检查风扇是否能对单盘良好散热。 GSJ2单盘告警原因及检查名称:PTP_ LOS 中文解释

11、:PTP同步丢失 原因:PTP端口通信中断 检查方法: 1、线路口出现异常; 2、PTP端口配置不正确,应该是Master和Slave对应; 3、有一侧的PTP功能没开启。 GSJ2单盘告警原因及检查名称:IOP_HIGH 中文解释:输入光功率过高 原因:激光器输入光功率过高 检查方法: 1、检查光模块是否在位; 2、检查光输出端输出的光功率是否过高; 3、检查端口门限设定是否合适。 GSJ2单盘告警原因及检查名称:IOP_LOW 中文解释:输入光功率过低 原因:激光器输入光功率过低 检查方法: 1、检查光模块是否在位; 2、检查光输出端输出的光功率是否过低; 3、检查端口门限设定是否合适。G

12、SJ2单盘告警原因及检查名称:LASER_TCT 中文解释:激光器温度过限 原因:激光器温度过高检查方法: 1、检查光模块是否在位; 2、检查激光器散热是否良好。 XSJ2单盘常见告警及解释告警名称 中文解释 POWERALM 电源故障告警 TEMP_TCT 盘温过限 RF 收无光 TF 激光器发送失效 LASER_OFF 激光器软关断 TMC_LOC TMC连接确认信号丢失 TMS_LOC TMS连接确认信号丢失 TMP_LOC TMP连接确认信号丢失 XSJ2单盘常见告警及解释(续)告警名称 中文解释 LINK_LOS 连接信号丢失 PK_LOS 丢包率过限 PTP_LOS PTP同步丢失

13、 CRC_ERR CRC校验错 SCK_LOS 系统时钟丢失 IOP_LOW 输入光功率不足 IOP_HIGH 输入光功率过载 LASER_TCT 激光器温度过限 XSJ2单盘告警原因及检查名称:POWERALM 中文解释:电源故障告警 原因:1.0V 1.2V 1.25V 1.8V 2.5V 3.3V 5V任何一路检测到电源值不在设定范围内告警 检查方法: 1、核对相应软硬件版本是否匹配; 2、插拔单盘,重新上电检查是否告警消除; 3、使用替换法检测是否为单盘硬件故障。XSJ2单盘告警原因及检查名称:TEMP_TCT 中文解释:盘温过限 原因:单盘温度超过网管设置的温度告警门限值 检查方法:

14、 1、检查网管界面设置的温度告警门限值,可能设置的告警门限太小; 2、检查机架风扇是否停转; 3、检查单盘硬件、软件版本是否和网管软件版本匹配。 XSJ2单盘告警原因及检查名称:RF 中文解释:收无光 原因:光模块没有检测到接收光 检查方法: 1、检查有无输入光信号; 2、检查光纤是否折断; 3、在线更换XFP光模块。 XSJ2单盘告警原因及检查名称:TF 中文解释:激光器发送失效 原因:发送光功率小于-10dBm认为发送失效 检查方法:在线更换XFP光模块 XSJ2单盘告警原因及检查名称:LASER_OFF 中文解释:激光器软关断 原因:激光器被软关断 检查方法:检查网管配置是不是关掉了激光

15、器 XSJ2单盘告警原因及检查名称:TMC_LOC 中文解释:TMC连接确认信号丢失 原因:当某路TMC的CV帧使能打开,但是又没有从背板接收到TMC的CV帧时,会有TMC_LOC告警产生 检查方法: 1、检查远端有没有将TMC CV使能打开; 2、检查远端的TMC OAM配置中MEG_ID MEP_ID等是否和本端一致; 3、检查交叉盘是否转发了数据包; 4、检查背板接口的link状态。XSJ2单盘告警原因及检查名称:TMS_LOC 中文解释:TMPLS段层连接确认信号丢失 原因:当某路TMS的CV帧使能打开,但是又没有从线路口接收到TMS的CV帧时,会有TMS_LOC告警产生检查方法: 1

16、、检查对端有没有将TMS CV使能打开; 2、检查对端的TMS OAM配置中MEG_ID MEP_ID等是否和本端一致; 3、抓包看是否收到了数据包; 4、检查线路口的link状态。 XSJ2单盘告警原因及检查名称:TMP_LOC 中文解释:TMPLS通道连接确认信号丢失 原因:当某路TMP的CV帧使能打开,但是又没有接收到TMP的CV帧时,会有TMP_LOC告警产生 检查方法: 1、检查远端有没有将TMP CV使能打开; 2、检查远端的TMP OAM配置中MEG_ID MEP_ID等是否和本端一致; 3、检查交叉盘是否转发了数据包; 4、检查背板接口的link状态。 XSJ2单盘告警原因及检

17、查名称:LINK_LOS 中文解释:连接信号丢失 原因: 1、线路口没有和对端link; 2、系统口没有和交叉盘link。检查方法: 1、线路口时,检查光模块是否有问题,光纤是否有折断,对端的线路口是否有问题,可以用光纤自环检测; 2、系统口应该检测交叉盘是否正常工作。XSJ2单盘告警原因及检查名称:PK_LOS 中文解释:丢包率过限 原因:当丢包数超过网管配置的告警门限时告警检查方法: 1、查看“全局配置块”中的性能门限值; 2、检查是否有插拔光纤; 3、检查是否有交叉盘复位。XSJ2单盘告警原因及检查名称:PTP_LOS 中文解释:PTP同步丢失 原因:单盘做线路盘时,某条线路link_l

18、os或者线路收无光,如果该线路PTP功能打开,那么这条线路会上报PTP_LOS告警检查方法: 1、此线路是否link_los; 2、此线路是否收无光; 3、是否配置了PTP。 XSJ2单盘告警原因及检查名称:CRC_ERR 中文解释:CRC校验错 原因:如果某端口收到CRC校验错包数超过网管“全局配置块”中设置的“校验错门限值”,则会上报CRC_ERR告警检查方法: 1、查看“全局配置块”中的性能门限值; 2、检查是否有插拔光纤; 3、检查是否有交叉盘复位。XSJ2单盘告警原因及检查名称:SCK_LOS 中文解释:系统时钟丢失 原因:当ZL30132检测不到从背板过来的有效参考时钟时,会上报系

19、统时钟丢失告警检查方法: 1、检查交叉盘是否在位; 2、检查交叉盘是否正常工作。 XSJ2单盘告警原因及检查名称:IOP_LOW 中文解释:输入光功率不足 原因:接收光功率小于-25dBm认为接收光功率不足 检查方法:检查光纤质量,擦拭光纤头 XSJ2单盘告警原因及检查名称:IOP_HIGH 中文解释:输入光功率过载 原因:接收光功率大于+3dBm认为接收光功率过载检查方法:更换光模块XSJ2单盘告警原因及检查名称:LASER_TCT 中文解释:激光器温度过限 原因:激光器检测的温度值超过网管“性能门限配置块”中的“CARD_TCT”时,上报激光器温度过限检查方法: 1、检查机架风扇; 2、更

20、换光模块。 1 PTN设备常见告警解析3 典型故障处理案例内容摘要2 OAM简介及其应用1 PTN设备常见告警解析5 WRAPPING环保护4 性能法OAM简介 什么是OAM? OAM英文为Operation,Administration and Maitenence.即操作、管理和维护。为什么需要OAM? 在工程开通及维护过程中,熟悉和掌握OAM的使用方法,对快速定位故障和快速监测业务性能起到至关重要的作用。怎样使用OAM功能进行维护? 利用CV帧、LB帧等特定的帧信息来进行故障检测及定位。 OAM相关名词解释 ME:维护实体,需要管理的一个实体,它是两个维护实体组端点之间的一种关系。MEG

21、:维护实体组。MIP:MEG中间点。MEP:MEG的端点。MEG-ID:识别MEP所属的MEG。MEP-ID:在MEG中MEP本身的身份识别。MEG-ICC:国际电联运营商编码。MEG-UMC:唯一的MEG-ID编码。LBM:环回消息。LBR:环回回复。MEP、MIP相应OAM操作OAM的层次相应层次在PTN设备中的位置OAM告警 MMG:收不匹配的MEG-ID。UNM:MEG-ID匹配的情况下,收到CV帧的源MEP-ID与本地期望值不匹配。UNP:MEG-ID和期望的MEP-ID匹配的情况下,收到CV帧的时间间隔和本地发送时间间隔不匹配。LOC:连续个发送周期内没有收到正确的CV帧。RDI:

22、用于MEP通知其对等MEP它发生了缺陷情况,只应用于双向T-MPLS连接中。其信息由存在缺陷的MEP发起,并周期性地向其对等MEP发送直至缺陷情况被清除。以太网业务OAM初始配置目标:实现ETH OAM实体之间的互通性初始握手ETH-CC:对端OAM初始状态发现,完成握手ETH-CC消息的主要内容 MEG (包括MEG-ICC和MEG-UMC) 本地MEP ID 对端MEP ID 发送周期网管中相关配置项TMP层OAM配置项(与LABEL对应)TMC层OAM配置项(与入出PW标签对应)工程维护中常用的OAM帧OAM帧快速定位故障及监测业务性能时主要使用上述表格标准的功能,即 1、故障判定:CV

23、帧,LB帧 2、性能监测:LM帧,DM帧在OAM功能结构体系中,有TMS层、TMP层、TMC层三层OAM帧,下面以660设备为例,模拟出现常用故障时相应的故障定位定位解决方案。一般性思路1 PTN设备常见告警解析内容摘要2 PTN设备性能采集解析1 PTN设备常见告警解析3 典型故障处理案例2 OAM简介及其应用5 WRAPPING环保护4 性能法OAM检测方案示例 故障一:经过某站点的所有业务只能直通,不能上下话 .故障二:某站点上下话业务时部分业务正常,部分业务不通 .故障三:某站点业务性能出现劣化 .故障一网络拓扑故障现象描述:局1经过局2向局3下业务,业务正常,局1向局2下业务,业务不

24、通。故障一故障分析:此故障属于TMS层故障或硬件故障,初步判定为连纤接错或交叉盘出现故障。故障定位方案:使用TMS层 CV帧检测光路连接是否正确,并对连接错误的位置进行快速定位,若光路连接正常,将进行主备交叉盘的切换,以此来判断交叉盘工作是否正常。故障一操作步骤 1:将局1 (0B槽位)、局2(08槽位)的XSJ2(线路盘)中的单盘配置打开,找到LINE口物理接口配置下的TMS-OAM配置中的CV帧发送使能故障一操作步骤2:查看局1( 0B槽位)、局2(08槽位)的XSJ2(线路盘)中的当前告警,看有无TMS_LOC告警 。若有TMS_LOC告警,则说明此时局1( 0B槽位)不是接的局2(08

25、槽位),将局2(0B槽位)的XSJ2(线路盘)中的单盘配置的CV帧发送使能后,若局1(0B槽位)TMS_LOC告警消失,即连纤有问题。若无TMS_LOC告警,则说明连纤没问题,故障定位在了局2支路盘上,即支路盘出现故障,可以通过软复位、硬件插拔或更换单盘来定位故障。故障一 配置文件拓扑连纤 实际连纤情况 故障一总结:在PTN设备中,光口属于TMS层,光口之间连纤非常重要,一定要遵循东发西收的原则。并且在判断线路盘初相故障时一定要非常确定,由于线路盘上有很多直通的业务,不能轻易对线路盘进行插拔纤、更替单盘等物理操作。故障二网络拓扑故障现象描述:局1沿长径到局3有若干条百兆业务(不同支路盘) ,部

26、分业务正常,部分业务不通。 (备注:此类问题在工程现场较复杂,有可能涉及到外部交换机等设备,定位方式采用先内部、后外部,先内口、后外口。)故障二故障分析:首先根据现象可以排除光路即TMS层故障,此故障就定位在TMP或TMC层。 故障定位方案:使用TMP、TMC层CV帧、LB帧的故障定位能力。主要包括交叉配置错误定位,单盘硬件故障定位等。 故障二操作步骤 1:将局1、局3的XCUJ1中的单盘配置打开,找到入TUNNEL表配置下不通业务的所在条目(通过LABEL值进行查找),将相应的TMP-OAM配置中的CV帧发送使能故障二操作步骤2:查看局1( 0B槽位)、局2(08、0B槽位)局3 (08槽位

27、)的XSJ2(线路盘)中的当前告警,看有无TMP_LOC告警。若无TMP_LOC告警,则说明通道正常,这时请查看源宿站点相应单盘的状态,看业务是否正常上下话 ,若没有正常上下话,请检查交叉及相应的单盘配置若有TMP_LOC告警,则说明此单盘没有收到相应方向发过来的CV帧,那么故障就定位在与此单盘通信的单盘和此单盘之间。故障二若无TMP_LOC告警操作为:查看上话的线路盘XSJ2的单盘状态出TUNNEL转发表,有速率,说明上话正常,无速率说明上话不正常。如上图,301的业务上话正常,303的业务上话不正常,这时需检查303业务的交叉及单盘配置故障二若有TMP_LOC告警,用TMP环回帧来确定故障

28、究竟在哪个盘上 ,例如故障二局2 0B槽位XSJ2盘出Tunnel转发表配置 局3 08槽位XSJ2盘出Tunnel转发表配置 故障二故障二操作为:使用XSJ2盘与之相对应出TUNNEL转发表的MEP和TMP管理 ,使能环回帧,并在该单盘上进行状态监视故障二若0B槽位的LBM帧数=LBR帧数,则对端的XSJ2单盘无故障,若LBM帧数不等于LBR帧数,则对端的XSJ2单盘存在故障故障三网络拓扑故障现象描述:在无任何主观操作(限速、设置优先级等)的前提下,带宽稳定在100M的业务在后来只有50M,丢包率过高 故障三解决方案:由于LM帧(检测丢包)、DM帧(检测时延)的使用与CV帧类似,只是多了一些

29、前期数据准备工作,因此定位方案可以参考示例二 故障三LM、DM帧具体配置如下:TMC层配置故障三 在交叉盘采集业务相应性能(由于性能较多,根据需要采集)故障三百兆业务正常情况下性能:时延:30us左右,丢包率0以上性能采集说明业务时延在正常范围(小于7000uS)之内,业务没有丢包。1 PTN设备常见告警解析内容摘要2 PTN设备性能采集解析1 PTN设备常见告警解析3 OAM2 OAM简介及其应用 4 性能法3 典型故障处理案例5 WRAPPING环保护拓扑说明如下图所示:局1、2、3为660设备,局4、5、6为640设备,局7、8、9为620设备。现由局1做一条百兆业务到局8。拓扑说明由Smartbits表发单播包6000660-ESJ1盘(源站)在660(源站)的百兆盘上,性能如下:因此在ESJ1单盘上,业务走向为:660-XCUJ1盘(源站)在XCUJ1单盘上,性能如下:在XCUJ1单盘上,业务走向如右图所示:660-XSJ2盘(源站)在XSJ2单盘上,性能如下:在XSJ2单盘上,业务走向为:660(直通站)业务经过局2为直通,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论