传输常见告警分析及处理_第1页
传输常见告警分析及处理_第2页
传输常见告警分析及处理_第3页
传输常见告警分析及处理_第4页
传输常见告警分析及处理_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

传输常见告警分析及处理网络部/根底网维护中心PTN设备ETH端口告警PTN设备SDH及E1端口告警PTN设备硬件常见告警PTN设备其他常见告警PTN业务故障与告警对应关系PTN告警分析及处理ETH链路故障及告警BTS1CESCESBTS2PTNPTNETHBTS3PTNMPLSPTNPTNMPLSPTNBSCCoreNetwrokPTNBSC10G/GEGE/FESTM-1STM-110G/GEETH_LOS光信号丧失故障原因:(1)光纤断;(2)光模块坏;(3)光衰减过大;ETH_LINK_DOWN网口连接故障故障原因:两端工作模式不一致,造成协商失败;电缆、光纤连接或者对端设备故障。MAC_FCS_EXC误码越限故障原因:MAC层检测到误码越限;线路信号劣化;光纤性能劣化;光口不洁净ETH端口常见告警处理方法:ETH_LOS—以太网端口连接丧失告警步骤1:检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。步骤2:检查电缆或光纤是否存在故障,更换故障的电缆或光纤。步骤3:在网管上查看对端网元是否存在OUT_PWR_ABN告警。假设存在,优先去除该告警后,查看本告警是否去除。假设告警未去除,清洁接收光口及光纤头外表。假设告警仍未消除,检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。正确使用法兰盘或光衰减器。假设告警仍未消除,通过增减光衰减器调整光功率至正常范围内。步骤4:更换上报告警的处理板。假设告警未消除,更换对端网元对应的处理板。可能原因:原因1:以太网端口的电缆或光纤没有连接好。原因2:电缆或光纤故障。原因3:本端网元接收光功率过低。原因4:单板故障。ETH端口常见告警ETH_LINK_DOWN——网口连接故障告警可能原因:原因1:本端网元和对端网元的端口工作模式不一致,造成协商失败。原因2:端口内环回。原因3:纤缆连接到错误的端口。原因4:单板故障。处理方法:步骤1:在网管上查看两端网元的以太网端口工作模式是否一致。假设不一致,修改设置,使两端的端口工作模式一致后,查看告警是否去除。步骤2:在网管上查看两端端口是否存在LOOP_ALM告警,假设存在,优化去除LOOP_ALM告警后,查看本告警是否去除。步骤3:对照网元规划表,查看上报告警的端口是否错插了纤缆,造成两端端口工作模式不一致。重新正确连接纤缆,去除告警。步骤4:在网管上查看两端网元的相关单板是否存在HARD_BAD等硬件类告警。假设存在,更换存在硬件类告警的单板后,查看本告警是否去除。ETH端口常见告警MAC_FCS_EXC——MAC层检测到误码越限告警可能原因:原因1:线路信号劣化。原因2:输入光功率不正常。原因3:光纤头外表不清洁。处理方法:步骤1:在网管上查看是否存在LOOP_ALM告警。假设存在,优先清楚LOOP_ALM告警后,查看本告警是否去除。假设告警未去除,在网管上检查是否存在DOS攻击等。假设存在,消除非法发送大量数据的根源,查看告警是否去除。假设告警仍未去除,查看光纤或电缆是否存在故障。更换故障的光纤或电缆后,查看告警是否去除。步骤2:查看上报本告警的端口是否同时上报IN_PWR_ABN告警。假设存在,优先去除IN_PWR_ABN告警后,查看本告警是否去除。步骤3:清洁光纤头外表和处理板接收光口。PTN设备ETH端口告警PTN设备SDH及E1端口告警PTN设备硬件常见告警PTN设备其他常见告警PTN业务故障与告警对应关系SDH链路告警排查BTS1CESCESBTS2PTNPTNETHBTS3PTNMPLSPTNPTNMPLSPTNBSCCoreNetwrokPTNBSCGEGE/FESTM-1STM-1GE/10GER_LOS光信号丧失故障原因:〔1〕断纤;〔2〕线路衰耗过大;〔3〕对端站发送局部故障,线路发送失效;R_LOC时钟丧失故障原因:(1)接收到的信号失效;(2)时钟提取模块故障;R_LOF帧丧失故障原因:〔1〕接收信号衰减过大;〔2〕对端站发送信号无帧结构;〔3〕本板接收方向故障SDH端口常见告警R_LOS——线路接收侧信号丧失告警可能原因:激光器原因1:本端光口未使用,却开启激光器。激光器原因2:本端网元开启了激光器,但对端网元激光器关闭,造成无光信号输出。光纤原因1:本端单板光接口处未连接尾纤或者尾纤连接错误。光纤原因2:断纤。光纤原因3:接收光功率过低。单板原因1:本端网元接收单板故障,线路接收失效。单板原因2:对端网元发送单板故障,线路发送失效。SDH端口常见告警处理方法:步骤1:在网管上查看光口的“激光口开启状态〞是否为“关断〞。假设不是,关闭光口的激光器。在网管上查看对端网元对应光口的“激光口开启状态〞是否为“开启〞。假设不是,开启对端光口的激光器。步骤2:检查本端单板光接口处是否正确连接尾纤。假设尾纤未连接或者尾纤连接错误,请正确连接尾纤。检查是否存在断纤。假设存在,更换光纤。在网管上查看对端发送光口是否存在OUT_PWR_ABN告警。假设存在,优先去除对端光口的告警后,查看本告警是否去除。假设告警未去除,清洁接收光口和光纤头外表。假设告警仍未去除,检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。正确使用法兰盘或光衰减器。假设告警仍未去除,通过增减光衰减器调整接收光功率至正常范围内。步骤3:假设本端单板接收光功率正常,设置端口为“内环回〞。假设告警未去除,说明本端单板故障。更换故障单板。更换对端网元相应的处理板。假设告警未去除,更换对端网元的交叉板。SDH端口常见告警R_LOF——线路接收侧帧丧失告警可能原因:原因1:两端光接口类型,即光模块类型不一致。如一端为STM-1,另一端为STM-4。原因2:接收光功率异常。原因3:光纤错连。原因4:对端发送信号无帧结构。原因5:本端接收单板故障。处理方法:步骤1:依照网络规划,查看两端光模块类型是否正确。假设不正确,更换正确的光模块。步骤2:在网管上查看上报告警的光口是否存在IN_PWR_ABN告警。假设存在,优先去除IN_PWR_ABN告警后,查看本告警是否去除。步骤3:检查光纤是否存在错连。如存在,修正错误的连接后,查看告警是否去除。步骤4:在网管上查看对端发送单板是否存在HARD_BAD告警。假设存在,优先去除对端发送单板的HARD_BAD告警后,查看本告警是否去除。E1链路告警BTS1CESCESBTS2PTNPTNETHBTS3PTNMPLSPTNPTNMPLSPTNBSCCoreNetwrokPTNBSCGE/10GEGE/FESTM-1STM-1GE/10GET_ALOS信号丧失故障原因:〔1〕E1/T1业务未接入;〔2〕DDF架侧E1/T1接口输出端口脱落或松动;〔3〕本站E1/T1接口输入端口脱落或松动;〔4〕单板故障;〔5〕电缆故障ALM_E1RAI远端告警指示故障原因:对端有告警;E1端口常见告警T_ALOS——E1接口信号丧失告警可能原因:原因1:对端未发送E1业务。原因2:E1电缆脱落或松动。原因3:对端设备故障。原因4:电缆故障。原因5:上报告警的接口板故障。处理方法:步骤1:查看对端的E1业务是否正常发送。假设没有,恢复对端E1业务的正常发送。步骤2:检查E1电缆是否存在脱落或松动。假设存在,插紧脱落或松动的电缆,确保电缆与端口良好接触。步骤3:在DDF架处对告警通道做自环〔硬件内环回〕。优先排除对端设备的故障。步骤4:假设在DDF架处对告警通道做自环后告警未消失,在接口板处对告警通道做自环〔硬件内环回〕。假设告警消失,说明E1电缆故障。更换E1电缆。步骤5:假设在接口板处对告警通道做自环后告警未消失,在网管上对告警通道进行内环回设置。假设告警消失,说明接口板故障,更换接口板。E1端口常见告警ALM_E1RAI——对端网元E1链路告警可能原因:原因1:对端网元的E1链路上报T_ALOS、LFA、LMFA、UP_E1_AIS或DOWN_E1_AIS告警,本端网元收到对端网元下插的告警指示ALM_E1RAI。原因2:物理链路中断。处理方法:步骤1:检查对端网元的E1链路是否存在T_ALOS、LFA、LMFA、UP_E1_AIS或DOWN_E1_AIS告警,假设存在,优先去除对端网元上的告警后,查看本告警是否消除。步骤2:查看物理链路是否存在中断。假设存在,修复中断的物理链路。E1端口常见告警UP_E1_AIS——上行方向2M信号告警指示

如果上行E1信号全1,上报此告警可能原因:原因1:对端网元存在T_ALOS告警。原因2:E1端口设置了内环回。原因3:单板故障。处理方法:步骤1:在网管中查看对端网元是否存在T_ALOS告警。假设存在,优先去除对端的T_ALOS告警后,查看本告警是否去除。步骤2:在网管上查询E1端口是否存在LOOP_ALM告警。假设存在,修改E1端口配置为“不环回〞后,查看本告警是否去除。步骤3:在网管上查询本端网元和对端网元是否存在HARD_BAD等硬件类告警。假设存在,硬复位上报硬件告警的单板,查看本告警是否去除。假设告警未去除,更换相应单板后,查看本告警是否去除。E1端口常见告警DOWN_E1_AIS——下行方向2M信号告警指示

如果单板检测到下行E1信号全1时就会上报此告警可能原因:原因1:本单板存在UP_E1_AIS或者T_ALOS告警。原因2:单板故障。处理方法:步骤1:在网管上查看本单板是否存在UP_E1_AIS或者T_ALOS告警。假设存在,优先去除UP_E1_AIS或T_ALOS告警后,查看本告警是否去除。步骤2:在网管上查看本单板和交叉板是否存在HARD_BAD等硬件类告警。假设存在,硬复位上报硬件类告警的单板,假设本告警未去除,更换相关单板后,查看本告警是否去除。PTN设备ETH端口告警PTN设备SDH及E1端口告警PTN设备硬件常见告警PTN设备其他常见告警PTN业务故障与告警对应关系硬件常见告警HARD_BAD——硬件故障告警可能原因:原因1:外接电源失效。原因2:单板与母板未良好接触。原因3:单板硬件故障。原因4:假设接口板上报HARD_BAD告警,可能是对应的处理板出现故障。处理方法:步骤1:确保正常电源接入后,查看告警是否去除。步骤2:拔出故障单板,确认背板上的导针无异常。重新插入单板,使单板与母板良好接触。步骤3:硬复位上报告警的单板,查看告警是否去除。假设告警未消除,更换上报告警的单板。步骤4:硬复位接口板对应的处理板,参看告警是否去除。硬件常见告警BUS_ERR——总线错误告警可能原因:原因1:单板与背板接触不良。原因2:单板故障。原因3:单板检测到板间总线故障。处理方法:步骤1:检查背板是否存在倒针。假设存在,修正背板的倒针。重新插拔上报告警的单板。步骤2:硬复位上报告警的单板。假设告警未消除,硬复位交叉板。假设告警仍未消除,更换上报告警的单板。步骤3:在网管上查看是否存在指示时钟源丧失或时钟源劣化的告警。假设存在,优先去除时钟类告警后,查看本告警是否去除。假设告警未去除,查看单板与背板接触是否良好。硬件常见告警BD_STATUS——物理单板离线告警可能原因:原因1:单板正在硬复位。原因2:单板未插上,或单板插上,但与母板接触不良。原因3:板间通讯故障。处理方法:步骤1:在网管的“运行态〞槽位视图中查看该单板的工作状态是否为蓝色,假设是,那么该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。步骤2:检查相应槽位的单板是否插入。假设未插入,请插入相应物理单板,告警将自动去除。检查单板与母板是否接触良好,母板连接器的导针是否歪斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动去除。步骤3:在网管上查询是否上报告警的单板或主控板是否存在HARD_BAD或COMMUN_FAIL告警。假设存在,更换上报告警的单板,查看告警是否消除。硬件常见告警COMMUN_FAIL——单板间通信失效告警可能原因:单板排查原因1:单板处于硬复位状态。单板排查原因2:单板故障。主控板排查原因1:38M系统时钟故障。主控板排查原因2:电源板故障,造成主控板3.3V电压异常。主控板排查原因3:主控板不在位或故障。主控板排查原因4:主控板的EXT接口直接连接HUB或者交换机。硬件常见告警POWER_ABNORMAL——电源失效告警可能原因:单块单板上报告警原因:单板电源模块失效。多块单板上报告警原因1:电源板故障。多块单板上报告警原因2:电源输入异常。硬件常见告警THUNDERALM——防雷失效告警可能原因:原因1:防雷电路保险管断开。原因2:单板故障。处理方法:更换上报告警的单板,查看告警是否去除。硬件常见告警可能原因:原因1:制冷〔热〕设备故障,导致环境温度过高〔低〕。原因2:温度告警上下限设置不符合实际情况。原因3:风扇停止工作或防尘板积累灰尘太多。原因4:单板故障。处理方法:步骤1:检测环境温度是否高于45℃或者低于0℃。假设温度异常,检查制冷〔热〕设备是否能正常调节环境温度,优先处理制冷〔热〕设备故障。步骤2:查询单板当前工作温度和温度上下限设置,根据实际情况判断温度上下限值是否合理。假设温度上下限设置不合理,重新设置上下限的数值。步骤3:检查风扇是否存在FAN_FAIL告警。假设存在,优先处理该告警。检查防尘网上积累的灰尘是否过多而导致散热不及时。可将手置于风扇出风处感觉出风的温度和出风是否顺畅。假设因防尘网被堵塞而影响散热效果,取出并清洁防尘网。步骤4:查看上报告警的单板是否还存在其它硬件类的告警,如HARD_BAD。假设存在,更换上报告警的单板。TEMP_OVER——单板工作温度越限告警硬件常见告警可能原因:风扇板上存在风扇失效停转。处理方法:FAN_FAIL——风扇故障告警可能原因:风扇板上存在风扇失效停转。重新拔插风扇板。假设告警未消除,更换风扇板。硬件常见告警可能原因:原因1:光口使能,但没有安装光模块。原因2:光模块或单板故障,监测不到安装的光模块。处理方法:步骤1:查看光口是否安装了光模块。假设未安装,对照工程文档,安装适宜的光模块后,查看告警是否去除。步骤2:更换上报告警端口的光模块,查看告警是否去除。假设告警未去除,更换上报告警的单板,查看告警是否去除。LSR_NO_FITED——激光器未安装告警硬件常见告警可能原因:原因1:激光器老化。原因2:单板的检测电路故障。处理方法:步骤1:更换光模块,查看告警是否去除。步骤2:更换上报告警的单板,查看告警是否去除。LSR_WILL_DIE——激光器寿命即将终止告警硬件常见告警可能原因:原因1:拉手条被扳开。原因2:单板拉手条微动开关故障。处理方法:步骤1:查看上报告警的单板的拉手条是否被扳开。如果被扳开,重新扣好拉手条后,查看告警是否去除。步骤2:重新插拔上报告警的单板。假设告警未消除,更换上报告警的单板。W_OFFLINE——拉手条离位告警PTN设备ETH端口告警PTN设备SDH及E1端口告警PTN设备硬件常见告警PTN设备其他常见告警PTN业务故障与告警对应关系其他链路常见告警IN_PWR_ABN—输入光功率异常告警可能原因:原因1:对端网元发送光功率不正常。原因2:接收光功率高于正常范围。原因3:接收光功率低于正常范围。原因4:接收单板故障。处理方法:步骤1:在网管上,查询对端网元是否存在OUT_PWR_ABN告警。假设存在,优先去除对端网元的OUT_PWR_ABN告警。假设告警未去除,在网管上查询本端网元接收光功率。步骤2:在接收光口处增加适当的光衰减器,将输入光功率调节到正常范围内,查看告警是否去除。其他链路常见告警处理方法:步骤3:检查本端网元尾纤弯曲半径是否小于6cm。假设是,重新盘放尾纤后,查看告警是否消除。确认光衰减器的衰减值是否适宜。假设不适宜,将光衰减器调整至适宜值,查看告警是否去除。检查本端网元的光模块是否存在松动或未插紧的情况。假设是,重新插好光模块,查看告警是否去除。假设告警未去除,更换新的光模块。清洁两端网元的光纤接头后,查看告警是否去除,具体操作请参见检查及清洁光纤连接器。步骤4:检查本端网元处理板和交叉板是否存在HARD_BAD或TEMP_OVER等硬件类告警。假设存在,更换上报告警的单板。其他链路常见告警OUT_PWR_ABN——输出光功率异常告警可能原因:原因1:输出光功率过高或过低。原因2:单板故障。处理方法:步骤1:更换上报告警的端口的光模块,查看告警是否去除。步骤2:更换上报告警的单板,查看告警是否去除。其他链路常见告警LOOP_ALM——环回告警可能原因:原因1:端口配置了环回。原因2:业务配置成了环路。处理方法:步骤1:在网管上查询上报告警的端口虽否配置了环回。假设是,解除端口的环回,查看告警是否去除。步骤2:在网管上检查业务是否配置成为环路。假设是,修改业务配置,消除业务环路。对于以太网业务,使能环路端口自动关断功能,解除业务环回,查看告警是否去除。Tunnel常见告警MPLS_TUNNEL_LOCV——Tunnel连通性丧失告警可能原因:原因1:Tunnel的Ingress节点停止CV/FFD。原因2:物理链路故障。原因3:Ingress节点的单板正在复位。原因4:业务接口配置错误。原因5:网络出现严重拥塞。原因6:CPU占用率饱和,无法处理ARP协议报文。Tunnel常见告警处理方法:步骤1:查看两端的“检测方式〞和“检测报文类型〞参数配置是否一致。如不一致修改为一致。查看Ingress节点的“CV/FFD状态〞参数,如果为“停止〞,那么启动。步骤2:在网管上查看Egress节点是否存在HARD_BAD、ETH_LOS或ETH_LINK_DOWN告警,如有,去除告警。步骤3:在网管上查看Ingress节点是否存在COMMUN_FAIL告警,如有,去除告警。步骤4:对照网元规划表,查看Tunnel是否配置在正确的接口之上,例如查看下一跳IP地址。步骤5:检查故障Tunnel的带宽是否已被完全占用。如是,增大Tunnel带宽配置或消除非法发送大数据量的根源。查看告警是否去除。对于动态Tunnel,查看业务路由是否经过了带宽较低的物理链路。如是,重新配置正确的路由约束条件。查看告警是否去除。步骤6:在网管上查看是否存在CPU_BUSY告警。如果存在,优先去除CPU_BUSY告警后,查看本告警是否去除。Tunnel常见告警MPLS_TUNNEL_FDI/BDI——Tunnel前/后向缺陷指示告警可能原因:原因:上游网元检测到物理层Tunnel发生了故障。处理方法:检查本端网元与上游网元之间的物理链路是否存在故障,如纤缆中断,光模块故障,单板故障等。如存在,排除相关故障后,查看本告警是否去除。APS常见告警ETH_APS_LOST——APS帧丧失告警可能原因:原因1:对端网元未配置APS保护。原因2:APS保护组两端配置不一致。原因3:APS保护组状态未激活。原因4:保护通道业务中断。处理方法:步骤1:在网管上查询对端网元是否配置了APS保护。假设没有,在对端网元配置与本端网元一致的APS保护组,并使能协议。步骤2:在网管上查询APS保护组两端配置是否一致。假设不一致,修改APS保护组配置,使两端配置一致。步骤3:检查两端是否都激活了APS保护协议。将已激活的协议状态设置为“禁止〞,再重新激活两端的协议状态。步骤4:检查保护通道是否存在信号丧失或业务质量劣化等告警,如ETH_LOS。假设存在,优先去除这些告警。APS常见告警ETH_APS_SWITCH_FAIL——保护倒换失败告警可能原因:APS保护组两端配置不一致处理方法:在网管上查询APS保护组两端配置是否一致。修改APS保护组配置,使两端配置一致。去激活、重新激活两端APS保护组。LAG常见告警LAG_DOWN—聚合组不可用告警可能原因:原因1:对端网元未配置LAG聚合组。原因2:聚合组所有成员端口不可用。处理方法:步骤1:在网管上查询对端网元是否配置了LAG聚合组。假设未配置,在对端网元上配置LAG聚合组后,查看告警是否去除。步骤2:LAG聚合组成员端口不可用时,系统中会存在ETH_LOS、ETH_LINK_DOWN或LAG_MEMBER_DOWN告警。处理并去除这些告警,激活聚合组的成员端口后,该告警将自动去除。LAG常见告警LAG_MEMBER_DOWN——聚合组成员端口不可用告警可能原因:原因1:端口连接不可用。原因2:端口未收到LACP报文。原因3:端口工作模式为半双工。原因4:端口设置了环回。处理方法:步骤1:在网管上,根据告警参数,查看上报告警的LAG成员端口是否已使能。假设未使能,使能LAG成员端口后,查看本告警是否去除。假设告警未去除,查看上报告警的端口是否存在ETH_AUTO_LINK_DOWN告警。假设存在,优先去除告警后,查看本告警是否去除。步骤2:在网管上,查看对端端口是否参加了LAG组。假设没有,在LAG组中添加对端端口后,查看告警是否去除。假设告警未去除,查看上报告警的端口是否存在ETH_LOS或FLOW_OVER告警。假设存在,优先去除告警后,查看本告警是否去除。步骤3:修改端口工作模式为“自协商〞或“全双工〞后,查看告警是否去除。步骤4:解除端口的环回设置,查看告警是否去除。时钟常见告警SYN_BAD—同步时钟源信号劣化告警可能原因:原因1:所跟踪的时钟源质量变坏。原因2:上报告警的单板故障。处理方法:步骤1:在网管上查看是否存在B1_EXC、B2_EXC或B3_EXC等表示误码增多的告警,如存在,优先去除这些告警后,查看本告警是否去除。假设告警未去除,更换当前跟踪的时钟源,查看本告警是否去除。假设告警仍未去除,检查输入时钟配置是否正确。如不正确,修改时钟配置后,查看本告警是否去除。步骤2:在网管上查看上报告警的单板是否还存在HARD_BAD或TEMP_OVER等硬件类告警。假设存在,优先去除这些告警后,查看本告警是否去除。时钟常见告警LTI——同步时钟源丧失告警可能原因:原因1:XCS单板上外时钟接口接入的外部时钟源丧失。原因2:线路时钟源丧失。原因3:时钟源被设置为不可自动恢复或被锁定,导致当前跟踪的时钟源丧失时,无法自动倒换到其它时正常钟源上。处理方法:步骤1:在网管上查看是否存在EXT_SYNC_LOS告警。假设存在,优先去除EXT_SYNC_LOS告警后,查看本告警是否去除。步骤2:在网管上查看是否存在ETH_LOS或R_LOS等信号丧失类告警,假设存在,那么优先去除这些告警后,查看本告警是否去除。假设告警仍未去除,硬复位XCS板,查看告警是否去除。假设告警仍未去除,请更换XCS板,查看告警是否去除。步骤3:在网管上查看时钟源是否被设为不可自动恢复,如是,将其设置为自动恢复后,查看告警是否去除。在网管上查看是否存在SYNC_LOCKOFF告警,假设存在,优先去除SYNC_LOCKOFF告警后,查看本告警是否去除。时钟常见告警CLK_NO_TRACE_MODE——时钟进入非跟踪工作模式告警可能原因:原因1:未启动SSM协议。原因2:没有配置系统时钟源优先级表,网元使用自带的默认优先级表。原因3:时钟源优先级表中除了内部源以外的其他时钟源存在状态丧失,无法跟踪。原因4:时钟源优先级表中除了内部源以外的其他时钟源频偏过大,无法跟踪。处理方法:步骤1:在网管上检查两端网元是否都使能了SSM协议。假设没有,使能两端网元的SSM协议。步骤2:在网管上检查系统时钟源优先级表是否已配置。假设未配置,重新配置时钟源优先级表,使其包含其他可用时钟源。步骤3:在网管上查看是否存在SYNC_C_LOS告警,表示时钟源存在状态丧失。假设存在,优先去除SYNC_C_LOS告警后,时钟可跟踪除内部源以外的任何一个源。步骤4:在网管上查看是否存在SYN_BAD告警,表示时钟源频偏过大。假设存在,去除SYN_BAD告警后,时钟可跟踪除内部源以外的任何一个源。PTN设备ETH端口告警PTN设备SDH及E1端口告警PTN设备硬件常见告警PTN设备其他常见告警PTN业务故障与告警对应关系CES业务常见故障处理方法原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作查询并处理以下告警:HARD_BAD、TEMP_OVER、COMMUN_FAIL或BUS_ERR告警。原因2:处理板、接口板的接口接入的信号丧失或恶化查询并处理以下告警:T_ALOS、UP_E1_AIS、DOWN_E1_AIS、R_LOS、LASER_MOD_ERR、LSR_WILL_DIE、IN_PWR_ABN、TEM_HA或LSR_BCM_ALM告警。原因3:承载CES业务的Tunnel或PW中断查询并处理以下告警:MPLS_TUNNEL_LOCV告警。原因4:网元的同步时钟源级别丧失,或同步时钟源丧失查询并处理以下告警:SYNC_C_LOS或LTI告警。原因5:承载CES业务的PW在单位时间内丢包数、错包数或抖动缓冲超过阈值查询并处理以下告警:CES_LOSPKT_EXC、CES_MISORDERPKT_EXC、CES_STRAYPKT_EXC、CES_JTRUDR_EXC或CES_JTROVR_EXC告警。ETH业务常见故障处理方法原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作查询并处理以下告警:HARD_BAD、TEMP_OVER、COMMUN_FAIL或BUS_ERR告警。原因2:接收信号丧失查询并处理以下告警:ETH_LOS、R_LOS、LASER_SHUT、LSR_WILL_DIEMAC_FCS_EXC告警。原因3:以太网网口连接错误,端口协商失败查询并处理以下告警:ETH_LINK_DOWN告警。原因4:端口配置了环回查询并处理以下告警:LOOP_ALM、ETH_EFM_LOOPBACK告警。原因5:接口流量限值配置过低,源宿两端接口配置不一致查询并处理以下告警:FLOW_OVER、ETH_CFM_UNEXPERI告警。SDH告警分析及处理SDH告警及性能事件产生原理SDH常见告警分析与处理SDH告警分析及处理SDH告警及性能事件产生原理下行信号流上行信号流下行信号流、上行信号流低阶信号流高阶信号流高阶信号流、低阶信号流两种通用告警AIS告警〔AlarmIndicationSignal〕:对下一级电路下插全“1〞,告知该信号不可用。常见的AIS告警有:MS_AIS、AU_AIS、TU_AIS、E1_AISRDI告警〔RemoteDefectIndication〕:指对端站检测到LOS、AIS、TIM等告警后,而传给本站的回送告警,常见的告警有:MS_RDI、HP_RDI、LP_RDI高阶告警、性能事件的产生和检测帧同步器和再生段开销处理器(RST)复用段开销处理器(MST)指针处理器和高阶通道开销处理器

(MSA、HPT)LOSLOFB1ErrA1,A2B1AISMS_AISB2ErrK2B2MS_REIM1MS_RDIK2“1”AISAU_AISAU_LOPH1,H2H4B3ErrJ1HP_SLMC2“1”HP_LOMHP_TIMHP_UNEQHP_REIHP_RDIH1,H2C2B3G1G1“1”交叉板STM-N光接口下行信号流告警上报或回告信号传递点〔下插全“1〞信号〕告警终结点〔上报主控〕异步物理接口模块低阶通道适配功能块高阶通道适配功能块和低阶通道终端功能块信号流程告警上报或回告信号传递点〔下插全“1〞信号〕告警终结点〔上报主控〕(PPI)(LPA)(HPA、LPT)LP_TFIFO全“1”LP_SLMLP_UNEQV1,V2H4BIP-2J2TU_AISV5HP_LOMLP_TIMTU_LOPLP_REILP_RDIV5V5交叉板E1接口V5V1,V2LP_RFIFOE1_AIS全“1”T_ALOSE1_AIS交叉板E1接口低阶告警、性能事件的产生和检测告警信号间的抑制关系:主要告警抑制树R_LOSR_LOFR_OOFAU_AISAU_LOPB1_SDB2_SDHP_TIMHP_SLMHP_LOMHP_UNEQB3_EXECB3_SDTU_AISTU_LOPBIP_EXECLP_UNEQLP_TIMLP_SLMBIP_SDMS_RDIHP_RDILP_RDI图例:ABA抑制BJ0_MMMS_AISB1_EXECB2_EXECA1、A2字节RSOH、MSOH〔除A1、A2外〕SDH告警及性能事件产生原理SDH常见告警分析与处理SDH告警分析及处理SDH接口板常见告警分析与处理R_LOF--表示接收线路侧帧丧失R_LOS—端口无收光原因1:光纤故障;原因2:对端站发送故障;原因3:本端接收故障。可能原因:原因1:接收光功率过低或过高;原因2:对端站发送信号无帧结构;原因3:本板接收方向故障。可能原因:SDH接口板常见告警分析与处理

R_LOF/R_LOS的处理步骤:<Step1>检查本端收光功率与对端发光功率<Step2>检查本端和对端光板的告警<Step3>检查本端和对端光板的性能事件<Step4>检查本端和对端光板之间的线路<Step5>检查是否上游交叉时钟板故障<Step6>更换故障单板或器件,解决问题SDH接口板常见告警分析与处理MS_AIS--复用段告警指示可能原因:1:对端站发送MS_AIS信号;2:对端站时钟板故障;3:本板接收局部故障。处理步骤:<Step1>检查对应的线路板是否有R_LOS、R_LOF告警<Step2>处理完R_LOS、RLOF后MS_AIS是否消失<Step3>复位、更换本端、对端线路板,告警是否消失<Step4>更换对端交叉单板,检查告警是否消失SDH接口板常见告警分析与处理AU_AIS--AU告警指示1:对端站发送AU_AIS;2:对端站发送局部故障;3:本站接收局部故障。可能原因:处理步骤:<Step1>

找出该告警涉及业务的流向<Step2>

沿业务流向检查本地光板是否存在更高级别的告警<Step3>检查上游站点该业务是否为VC4穿通,是否有高级别告警<Step4>检查设备是否处于倒换态,恢复正常态后故障是否消失<Step5>检查设备告警、性能事件,进行告警性能分析<Step6>环回定位至故障单板,更换故障单板AU_AIS是会沿VC4穿通方向下插的!SDH接口板常见告警分析与处理告警名称告警含义MS_RDI表示复用段远端接收失效指示,为次要告警。MS_REI表示复用段远端误码指示,为提示告警。AU_LOP表示AU指针丢失,为主要告警。HP_TIM表示高阶通道追踪识别符失配,为次要告警。HP_SLM表示高阶通道信号标记失配,为次要告警。HP_RDI表示高阶通道远端接收失效指示,为次要告警。HP_REI表示高阶通道远端误码指示,为提示告警。HP_UNEQ表示高阶通道未装载,为次要告警。IN_PWR_ABN表示输入功率异常,为主要告警。LASER_SHUT表示单板在激光器关闭,为主要告警。LOOP_ALM表示设置了环回,为次要告警。COMMUN_FAIL表示单板网口或串口通信失效,为主要告警。其它告警PDH处理板常见告警分析与处理T_ALOS--2M接口模拟信号丧失可能原因:1、2M业务未接入;2、DDF架侧2M接口输出端口脱落或松动;3、本站2M接口输入端口脱落或松动;4、单板故障;5、电缆故障。处理步骤:<Step1>在DDF架处对告警通道的业务自环〔硬件内环回〕<Step2>在接口板处对该通道进行自环〔硬件内环回〕,<Step3>网管上对该通道进行内环回设置<Step4>更换故障单板、接口板、电缆,检查告警是否排除。PDH处理板常见告警分析与处理TU_AIS--TU告警指示可能原因:1、业务配置错误;2、对端站对应通道失效;3、由更高阶告警引起;4、交叉板故障。处理步骤:<Step1>检查告警涉及业务的流向,检查沿业务流向是否存在高级别的会导致TU_AIS下插的告警<Step2>检查网元是否处于倒换态,排除倒换问题<Step3>检查网元业务配置是否正确<Step4>环回分析、更改业务时隙定位故障到单板<Step5>更换故障单板PDH处理板常见告警分析与处理TU_LOP--TU指针丧失可能原因:支路板与交叉板间接口故障;业务配置错误。处理步骤:<Step1>检查告警涉及业务的流向,检查沿业务流向是否存在高级别的告警<Step2>检查网元是否处于倒换态,排除倒换问题<Step3>检查网元业务配置是否正确<Step4>环回分析、更改业务时隙定位故障到单板<Step5>复位相关故障单板,更换故障单板PDH处理板常见告警分析与处理告警名称告警含义LP_RDI表示低阶通道远端接收失效指示,为次要告警。LP_REI表示低阶通道远端误码指示,为次要告警。NO_BD_SOFT表示单板无软件,为紧急告警。TPS_ALM表示已发生TPS保护倒换,为主要告警。UP_E1_AIS表示2M上行信号告警指示,为次要告警。DOWN_E1_AIS表示2M下行信号告警指示,为次要告警。ALM_SUBCARD_ABN表示检测到子卡状态错误,为主要告警。BD_STATUS表示单板不在位,为主要告警。COMMUN_FAIL表示单板网口或串口通信失效,为主要告警。LOOP_ALM表示设置了环回,为次要告警。其它告警以太网单板常见告警告警名称告警含义AU_AIS表示高阶业务告警中断,为主要告警。ETH_LOS表示以太网端口连接丢失,为紧急告警。PROTOCOL_MM表示封装协议类型不匹配,为紧急告警。NO_BD_SOFT表示单板无软件,为紧急告警。BD_STATUS表示单板不在位,为主要告警。COMMUN_FAIL表示单板网口或串口通信失效,为主要告警。LOOP_ALM表示设置了环回,为次要告警。交叉时钟单元常见告警分析与处理告警名称告警含义APS_FAIL表示保护倒换失败指示,为主要告警APS_INDI表示保护倒换指示,主要告警,在环倒换两端网元上报。LTI表示同步源丢失,为主要告警。BUS_ERR表示总线错误,为主要告警。CLK_NO_TRACE_MODE表示时钟进入非跟踪工作模式,为次要告警。S1_SYN_CHANGE表示在S1字节模式下时钟源发生倒换,为主要告警。SYN_BAD表示同步源劣化,为次要告警。SYNC_C_LOS表示同步源级别丢失,为提示告警。NO_BD_SOFT表示单板无软件,为紧急告警。BD_STATUS表示单板不在位,为主要告警。TEMP_OVER告警表示工作温度过限,为次要告警。COMMUN_FAIL表示单板网口或串口通信失效,为主要告警。主控单元常见告警告警名称告警含义HARD_BAD表示硬件故障,为紧急告警,根据参数含义处理NESF_LOST表示缺少一套主机软件,为提示告警。NODEID_MM表示复用段节点号失配,为主要告警。POWER_ABNORMAL表示电源失效,为主要告警。POWER_FAIL表示锂电池电量不足或失效,为主要告警。WRG_BD_TYPE表示所插板类型错误,为次要告警。BD_STATUS表示单板不在位,为主要告警。COMMUN_FAIL表示单板网口或串口通信失效,为主要告警。APS_MANUAL_STOP表示复用段协议人工停止,为次要告警。硬件常见告警HARD_BAD——硬件故障告警可能原因:原因1:外接电源失效。原因2:单板与母板未良好接触。原因3:单板硬件故障。原因4:假设接口板上报HARD_BAD告警,可能是对应的处理板出现故障。处理方法:步骤1:确保正常电源接入后,查看告警是否去除。步骤2:拔出故障单板,确认背板上的导针无异常。重新插入单板,使单板与母板良好接触

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论