PTN运行维护知识介绍剖析_第1页
PTN运行维护知识介绍剖析_第2页
PTN运行维护知识介绍剖析_第3页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目录1.1 网络故障处理基本思路和方法 21.1.1 PTN与MSTP告警对比 21.1.2 常见告警故障处理方法 41.1.3 以太网业务丢包类故障处理方法 61.1.4 OAM/PING 调试法 61.1.5 环回逐段定位法 91.2PTN 网络例行监控 101.1 网络故障处理基本思路和方法PTN的组网、业务配置愈发复杂,需分组厂商网管尽快做好SDH Like功能。为尽快恢复业务,将检测的故障点最小化,需了解 SDH原理、IP网络原理知识、告警信号流及告警产生机理、PTN设备和网管基本操作、常用仪表的基本操作,了解网络拓扑,业务配置,设备运行状态。告警、性能分析法OAM/PING 调试法

2、环回法PTN 对于 Tu nnel 的故障可用 MPLS OAM 来检测,MPLS OAM 包括 CV/FFD、Pi ng 和 Traceroute。 通过 CV(Connectivity Verification )/FFD (Fast Failure Detection )检测可以检测 LSP 的连通性。 CV 检 测和FFD检测的过程基本一致,其不同在于CV检测发送CV报文的频率固定为 1帧/s并且不可设置,而FFD检测发送FFD报文的频率是可以自行定义的。MPLS Ping/Traceroute为用户提供了发现 LSP错误、并及时定位失效节点的机制。 MPLS Ping/Tracero

3、ute 使用 MPLS Echo Request 和 MPLS Echo Reply 检 测 LSP 的可用性。 MPLS Echo Request 中携带需要检测的 FEC(Forwarding Equivalence Class )信息, 和其他属于此 FEC 的报文一样沿 LSP 发送,从而实现对 LSP 的检测。为了更好的理解PTN,我们就把PTN与熟悉的SDH的业务层面告警类比一下,与大家共享。PTN 与 MSTP 告警对比对应于业务模型,PTN的告警分为物理层、数据链路层、Tunnel层、PW层、仿真业务层五个层次。对应 SDH 的物理层、再生段复用段层、服务层、路径层。上层功能的

4、实现依赖于相邻下层提供的服务。低 层与高层同时有故障产生时,低层故障的消除是处理高层故障的基础,物理层故障引发的告警屏蔽其它层 故障引发的告警。SDH的告警与PTN的最根本的区别在于 SDH的告警都是由字节承载上报的,而PTN告警E1/E净荷CES/ATM/Etherne净荷路径层(LO-VC1服务层(HO-VC4? TE/PE之间的净荷传送?净荷圭寸装到对应的 Lin e/Tu nn el层>?通过物理层或数据链路层提供净荷路径的传送?多元的 LO-VC到 HO-VC 或者 PWs到PSN tunnels再生段复用段层?STM-N帧格式或以太报文通过物理介质传送物理层(Fiber)?物

5、理层以光或电脉冲的方式处理传送PW业务 层X>Tunn el 层数据链路(Ethern物理层(Fiber)PTNSDH图28 PTN网络与 MSTP告警对比图业务模型中,PW可类比VC12、Tunnel类比VC4管道,CES即电路仿真业务就是传统的 E1 ;告警可划分为业务类告警,系列类通用类告警,下面表格按业务告警,与SDH进行类比,各业务层告警对比:MST告 警SDH PTN类比结果PTN告 警业务层(VC12 (ETH/CES/IMA /ATM)TU_AIST_ALOSUP_E1_AISD0WN_E1_A等继承了 SDH E1、ATM IMA 业务告警的 特点PW_DOWN T_A

6、 LOS TU_AIS_VC12UP_E1_AIS DOWN E1 A 等PW业务层 (ETH/CES/IM A/ATM)服务层(VC4)HP_SLM HP_UNEQ继承了服务层SDH告警, 新增加了MPLS Tu nnel类告警MPLS_TUNNEL_LOCVHP_SLMHP_UNEQTunnel层(Tu nn el/ PW / MPLS APS)再生段复用段层(开销)B1、B2误码检测告警复用段告警IMA业务告警继承了 SHD误 码类,复用段 类告警(线 性),增加了 多协议标签 交换(MPLS) 告警,LAG类告警B1、B2误码检测 线性复用段告警 IMA业务告警LAG_DOWNMP_D

7、OWN ETH_APS_LOSTETH_APS_PATH_MISMATC ETH_APS_SWITCH_FAIL ETH CFM MISMERGE数据链路层(MLPPP/ STM / LAG)H物理层(单板 / ETH端 口 /SDH 端口 / E1 口)R_LOSETH_LOST_ALOSLASER_MOD_ER ETH_LINK_DOWN物理层告警 与SDH相同, 完全继承了RSDI光口、ETHJ电口、光口的 习惯R_LOSETH_LOST_ALOS LASER_MOD_ERR ETH_LINK_DOWN物理层(单板/ ETH 端 /SDH 端口 /E1 口)常见告警故障处理方法CES业务

8、常见告警故障处理方法:序号告警名称产生原因处理方法1T_ALOSE1信号丢失,主要上报在支路接 口板上;环回E12UP_E1_AIS D0WN_E1_AIS分别是上行2M言号指示、和下行 2M言号指示,产生原因和 SDH勺 相同察看对端是否有TU_LOP_VC12、T_ALOS 或TU_AIS_VC12 告警。或者 E1 环回方式3MPLS_TUNNEL_LOC;VMPLS TUNNEL LOCV为 Tunnel 连通性丢失告警。连续3个周期 内没有收到希望的 CV/FFD报文 时出现此告警。产生g该告警时,该TUNNE承载的业务已中 断,原因1:往往是下层网络异常引 起,例如物理链路故障等,

9、光模 块故障原因2:网络出现严重的拥塞。原因1:物理链路故障。1.在 网管上检查该链路两端网元 是否存在单板或光模块相关 的告警。若存在,消除这些 告警,查看告警是否消除。2.若告警未消除,查看光纤 是否故障,更换故障的光纤。原因2:网络出现严重拥塞。1. 选择较大的“ CC测试发 送周期”的参数值,具体操 作见本文的创建维护联盟。2. 检查故障Tunnel的带宽 占用情况,如发现已满,请 增大Tunnel带宽配置或消 除非法发送大数据量的根 源,查看告警是否消除。4TU_AIS_VC12系统中存在更咼阶的告警,如R LOS R LOF HP SLM AU AIS上游站点存在硬件故障告警交叉板

10、故障对端站对应通道失效按照产生原因点,逐步排除; 先看疋否有咼级别的 R_LOSR_LOF HP_SLM AU_AIS 告 警,然后看是否存在硬件故 障支路板?交叉?取后对端对应通道?需要用到经验 法、替换法等。与SDI类似业务中断类常见告警原因:光纤、电缆故障、环境温度、误操作设置了光路的环回、误操作更改、保护业务配置数据有误。应急处理时优先恢复业务,排除外部设备的问题,将业务倒换到备用通道,复位单 板、单站重启、重新下发配置等。以太网业务常见告警故障处理方法:序号告警名称产生原因处理方法1ETH_LOS以太网端口连接丢失, 可能原 因:以太网端口的电缆或光纤 没有连接好;电缆或光纤故 障;

11、本端网元接收光功率过 低;单板故障。属于物理层故障类,察看物 理连接,端口、单板故障; 逐一排除。2MAC_FCS_EXCMAC_FCS_EX(为 MAC 层检测 到误码越限告警。软件定时检测MAC芯片接收字节数和误1:检测是否链路出现故障, 维护光纤或网线,查看告警 是否消除。码字节数,计算误码是否超过 门限,超过设置越限门限发出 此报警。2:若告警仍未消除,检测是 否存在DOS攻击等,隔离 DOS攻击源,查看告警是否 消除。3.若告警仍未消除,是否出 现配置环路或物理等问题, 解除环路,查看告警是否消 除。3ETH_LINK_DOWN以太网连接错误,端口协商失 败;可能原因:端口模式不一

12、致;电缆光纤连接故障;单板 故障。对应需要察看和排除端口 协商问题,主要关注端口模 式,端口速率级别。最后使 用替换法检验是否是硬件 故障4FLOW_OVER端口接收流量超限告警; 可能 原因为实际接收的端口流量 大于设定的端口流量限值。增加端口带宽。丢包类故障常见原因:光功率问题、环境温度、数据业务端口协商故障、时钟配置错误、业务流控配置。可通过查看光功率、 RMON、丢包率等性能事件解决。MPLS保护倒换类告警排除:倒换告警告警信息故障原因ETH_APS_TYPE_MISMATCH保护类型信息不 致1、两端配置的1 + 1或1:1模式不一致;2、两端配置的单端或双端倒换的模式不一致;3、两

13、端配置的恢复式或非恢复式的模式不一 致;ETH_APS_PATH_MISMATCHAPS工作、保护路 径不一致1、保护组两端设备配置的工作路径、保护路 径不一致;2、物理链路上存在有错连;ETH APS SWITCH FAIL保护倒换失败1、倒换失败;ETH_APS_LOSTAPS帧丢失1、对方没有配置保护;2、保护通道业务中断;以太网业务丢包类故障处理方法业务丢包、错包的可能原因端口光功率异常或光功率不稳定,这是最常见的丢包原因时钟未跟踪,或跟踪源不稳定,会导致周期性丢包Tunnel下一跳端口 IP设置错误(如设置为本端端口,扩容或调整业务时)可能会导致丢包网络侧发生拥塞,由于现网基本是轻载

14、状态,拥塞可能性较小排查业务丢包、错包的思路:找出与 有问题的业务”走相近链路的业务,看是否有类似问题,以此缩小范围业务A如果业务A有丢包,业务B不丢,则问题应该在网元 A与网元C之间调试法常用场景:数据业务通断判断维护中,工作难点主要在于如何能够快速有效地排除故障。在众多的故障中,以“业务不通”最为常见。应该如何着手解决呢?首先我们将PTN专线业务做成下图所示的分段。PTN网络关于OAM的规划主要涉及:MPLS OAM、以太网端口的OAM。适用于故障定位到单站,主要用于检查网络连接是否可达, 以及分析网络什么地方发生了故障。常用OAM排障步骤1 Tunnel OAMPW配置Tunnel配置P

15、W配置 1透传设备(PTN,波分设备等)NODEB接入侧PTN UNI接入侧PTN NNI核心侧PTN NNI核心侧PTN UNIRNCJ7业务配置业务配置红色标识部分是维护关键区域 ,因为这一区域的网元多,外部因素多(光缆,光模块,波分 设备等),需考虑业务扩容,业务归属关系调整排障的主要工具:Tunnel OAM使用方法:到两侧(接入侧、核心侧)网元查看Tunnel OAM状态结果分析:两侧Tunnel OAM状态都是远、近端可用”该区域基本没有问题Tunnel OAM检测有任何缺陷上报-根据“ LS缺陷位置可锁定故障位置查MPLS_TUNNEL_LOCV 告警:含义:Tunnel链路中断

16、 解决措施:需要检查Tunnel链路的连通性,发起 LSP Ping确认故障节点/链路,并观察Tunnel 链路中其它节点的相关告警信息,需启动OAM功能。排障步骤2 LSP故障位置分析HTunnel | 口册纳LE円尤态eL£J熾p吐翌LS镖用曲门限宕节芒jfiSnJy&T可用状态pLOCV6553500045.1 21234.1.0 1Q运琳可用就恣k-0a46.1 0.104&.U 123红框内的LSP缺陷位置指示了问题网元的 LSR ID (GCP NODE ID)在LSP缺陷位置及相邻网元范围内,进一步排障步骤:检查光纤原因检查业务告警ETH_LINK_DO

17、WN, ETH_LOS, R_LOS等链路异常告警IN_PWR_ABN等光功率异常告警HARD_BAD、BUS_ERR、BD STATUS 等硬件异常告警检查配置源宿节点是否正确相邻网元的出 入标签是否一致下一条端口 IP是否正确其它可能原因:源宿节点是否正确相邻网元的出 入标签是否一致下一条端口 IP是否正确查看各端口收光功率的当前 /历史性能是否过低或过高:有可能端口收光功率接近但未超过阈值,导致无告警上报,所以需要查性能 有可能端口收光功率不稳定,导致当前性能值正常,所以需要查历史性能 下一条端口 IP是否正确查看各NNI端口的设置:耳衣国总|密星控剖.ZEW1 - EJEWU |誣厲性

18、诰口謡口贷童諾口複式封装盍型二工蚀式用如牖口-口uB02.1QR7in压EI=G2<2躺口舟三尾B02.1Q自惋厨1620基4居性'谕足性制丁二E馬1汀三层居性 高够性琲口宀QINQgJJit TAGiH嚴省VLAN IDVLAN6-EFG2-16S;a-1)FF FF106-EFG2-26WQ-2)FFFFTao Aware10性|蛙鱼F鈿二层夙性 HEK'l I高最凰性Tunrwl険能技态鈕弋留械减i阔TE靈里它型目IPtitJIF摺玛6-EFG2-1(.|10000HD100手工皓走IB.1.4S255.255.255.25216-EFG2-2Uft能loooaoD

19、1D0手工聒走46.1.58.21255.255.255.252ETH OAM的简易操作步骤A.两端网元发起LB测试,用于命令触发的连通性检查,对以太网业务执行不中断业务环回检测(LB),可以检验业务的连通性情况,以便定位和修复故障。注:只须输入对端 UNI端口 MAC地址就可以启动测试了,其他参数可用默认OAM功能产生的告警概览:MELS OAMMPLS_TUNNEL_LO告警含义:Tunnel链路中断解决措施:需要检杳 Tunnel链路的连通性,发起LSP Ping确认故障节点/链路,并观察Tunnel链路 中其它节点的相关告警信息。MPLS状态Init(初始)状态Ingress端没有使能

20、OA或者Tunnel链路中断;Available( 可用)状态Tunnel状态正常;Unavailable(不可用)状态Tunnel状态不可用,需要检查 Tunnel链路的连通 性,发起LSP Ping确认故障节点/链路,并观察 Tunnel链路中其它节点的相关告警信息ETH OAMETH_CFM_LOC警含义:ETH业务中断解决措施:需要发起ETH LB进行故障确认,发起 LT进行故障定位;对于MPL承载的ETH业务,需要 观察MPLS Tunnel的连通性。ETH_CFM_R告 警含义:对端检测到ETH业务的告警后的回告指示 解决措施:需要在对端进行告警确认和排查操作;ETH_EFM_告警含义:ETH链路发现失败解决措施:检查两端的 ETH Link OAM的配置是否 一致,检查ETH链路的连通性;ETH_EFM_EVE告警含义:ETH链路存在误码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论