ptn常见故障处理_第1页
ptn常见故障处理_第2页
ptn常见故障处理_第3页
ptn常见故障处理_第4页
ptn常见故障处理_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1案例分析1.故障处理方法2.故障处理建议步骤3.实际案例基础理论3.网架构与设备总体介绍无线语音无线业务 无线宽带无线电视E1BTSE1/FENode B视频会议CGE1/FE企业数据宽带专线业务视频电话FEIP HOTELFE视频监控GE/FE商业楼宇数字电视FE/E1家庭业务数据宽带FTTH用户FE网络游戏FTTB用户BRAS/SR/MS核心层RNC/MGW/GGSN3900iManager U200010GE汇聚层10GE19003900GE接入层GE接入层OLT9109501900案例分析1. 故障处理方法(1) 故障处理基本原则 先排除外部原因,然后到传输 先排除线路问题,然后到支

2、路 先定位故障到单站,然后到单板 先排除高阶告警,然后处理低阶告警(2) 故障处理基本手段 观察分析法 测试法 替换法 更改数据配置法 经验处理法3故障案例分析2.故障处理建议步骤Step 1:观察 维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重程度、Step 2:询问程度。. 询问相关操作人员,是否有直接原因导致此故障。查询清 楚设备的历史操作,历史告警等。Step 3:思考 根据现场查看的故障现象和询问的结果,结合自己的知识 进行分析,进行故障定位,判断故障点和故障原因。Step 4:操作 根据前三个步骤,采取相应的操作,例如更换单板、端口 等。4故障

3、定位信息收集(1) 该业务是创建后一直没有通,还是历史上通,突然间不通。(2) 该业务端到端的完整路径,包括源节点、目的节点、transt节点。(3) 完整的业务定位信息,包括业务ID,业务属性。(4) 业务的源宿端口信息。(5) 业务所在的Tunnel和PW信息。(6) 业务涉及的保护信息。(7) 当前告警信息。(8)各种相关性能计数(如业务涉及的端口性能计数,业务本身的性能计数等)。故障案例分析3.实际案例案例1 : CES业务闪断案例PTN环132BSC故障现象某PTN网络,1号站经3号站,至2号站间,开有CES仿真2M业务,承载1号站的基站业务。某日,发现1站点的基站业务发生闪断可能原

4、因 基站自身原因 PTN网络内光功率异常产生线路误码 业务流向中的某一处设备故障。故障案例分析排查过程1. 基站专业维护人员经排查,已排除基站原因。2. 在1号站支路端口做内环,在2号站支路端口进行伪随机码测试,发现有大误码,倒换主备Tunnel,当业务工作在备Tunnel时,2M电路测试仍然有大误码。3. 检查1号站至2号站的主备tunnel业务流向,及所有经过的传输网元光功率、光路性能,未发现异常。在3号站至2号站之间配置2M测试业务(除源端外,业务路径与故障基站业务一致),新配2M电路分别工作在主、备tunnel上时,测试结果均正常,故障定位到1号站至2号站之间设备故障。可能为某站交叉板

5、或线路板、1号站支路板问题。4. 对3号站、1号站的PTN设备主、备交叉板先后进行复位,让另一块交叉板处理所有交叉业务,同时在单板复位期间对业务进行测试,测试发现仍有误码,排除了1号站、3号站的交叉板存在故障的可能性。5. 因为线路板光功率正常,先安排维护人员更换1号站ML1支路单板后,误码仍未消除,进一步更换1号站设备EG2单板后,误码消除。CES业务故障常见原因 原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。 原因2:处理板、接口板的接口接入的信号丢失或恶化。 原因3:承载CES 业务的Tunnel 或PW 中断。 原因4:网元的同步时钟源级别丢失,或同步时钟源丢失。 原因5

6、:承载CES 业务的PW 在单位时间内丢包数、错包数或抖动缓冲超过阈值。CES业务常见告警(一)CES_JTROVR_EXC/ CES_JTRUDR_EXCCES缓冲上溢/下溢告警可能原因: 原因1:时钟未同步。 原因2:链路质量下降,抖动变大。 原因3:设置的缓冲区太小。 原因4:网络侧跳数过多,抖动变大。处理步骤:原因1:时钟未同步。在上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同步,缓冲区入与出速率不一致。 若存在,优先清除LTI告警和时钟相关告警后,查看本告警是否清除。原因2:链路质量下降,抖动变大。在上查询业务所在端口上是否存在IN_PWR_ABN或TEM_HA告警。若存

7、在,优先清除IN_PWR_ABN或TEM_HA告警后,查看本告警是否清除。原因3:设置的缓冲区太小。在上查询缓冲区的配置数值。根据网络规划,确认是否可以增大“抖动缓冲时间”的数值。如果是,扩大缓冲区,查看告警是否清除。原因4:网络侧跳数过多,抖动变大。若网络侧跳数过多,可能造成CES业务抖动变大。根据网络规划,确认是否可适当减少网络侧跳数。CES业务常见告警(二)CES_LOSPKT_EXCCES业务丢包告警可能原因: 原因1:时钟未同步。 原因2:CES业务两端网元参数配置不一致。 原因3:Tunnel或PW带宽配置过低,链路拥塞。 原因4:电缆、光纤或光模块故障导致链路信号变差或中断。处理

8、步骤:原因1:时钟未同步。在上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同步,缓冲区入与出速率不一致。 若存在,优先清除LTI告警和时钟相关告警后,查看本告警是否清除。原因2:CES业务两端网元参数配置不一致。在上查看CES业务两端网元参数配置是否一致,例如“64K时隙”等。若不一致,修改配置参数,使两端一致。原因3:Tunnel或PW带宽配置过低,链路拥塞。在上查看业务所在Tunnel或PW的带宽配置是否过低。如果是,重新为该Tunnel或PW配置较大的带宽,查看告警是否清除。原因4:电缆、光纤或光模块故障导致链路信号变差。检查并确认电缆或光纤与接口良好连接。清洁光纤或光模块后,

9、查看告警是否清除。若告警未清除,更换 相应的电缆、光纤或光模块。故障案例分析案例2:ETH_LINK_DOWN告警的处理967510GE环BSC21243故障现象8BSC1某本地网PTN10GE汇聚环7号站点EX2-2口上报ETH_LINK_DOWN告警,链路上的TUNNEL发生保护倒换。7号站与5号站之间开有多条业务.是到6号站可能原因上检查,7号站告警的光口连纤 与物理连接的对端网元的端口工作模式不一致,造成协商失败; 传输链路误码严重,造成丢包; 纤缆连接错误,致使2层链路协商错误; 该单板硬件故障。故障案例分析思考1.物理连接的对端是指哪个站?如果两端端口工作模式不一致,应如何排查?思

10、考2.如果是链路误码原因,又该如何排查? 排查过程1.检查5、6号站连接的EX2光口工作模式,均为10GE全双工,模式匹配。2. 检查网络历史和当前告警、性能,网络上无其他告警,无光功率下降。在上查询5号站EX2和6号站EX2端口RMON性能值,收发报均正常,无异常广播报文,无错误包,也无丢包。排除传输链路误码原因。3.在5、6号站之间,拔纤或关闭激光器判断,产生ETH_LOS告警在正常的光口上, 说明纤缆连接正确。5.在5号站现场检查设备硬件情况,发现EX2光口的光模块卡口松动,于是对该端口的光模块进行了拔插复位,之后告警消除。故障案例分析案例3:热插拔主控板导致业务中断故障故障现象某站PT

11、N 950设备,只配置了单个主控板。因主控板故障,维护人员携带备件到站,先把备用主控板插入备用主控槽位,观察运行正常后(目的在于让主备主控板完成数据同步),再拔掉故障的主控板,促发主备倒换,结果发现该网元部分业务中断。可能原因 主备主控倒换异常; 备用主控板硬件故障; 业务配置错误; 网元数据同步失败故障案例分析排查过程1.通过查询主备主控倒换状态,处于正常的倒换状态,主备倒换成功;2. 倒换后,只是部分业务中断,其余业务正常,排除备用主控板硬件问题;3 .查询该网元的业务配置,发现中断业务的数据配置已丢失,故障定位为业务配置问题;4.分析业务数据丢失的原因:当网元配置有主备主控板时,备用主控

12、板工作正常的时候是start、prog、srv 3个绿灯亮,因此维护人员在单主控情况下,插上备用主控板,过了一段时间后发现备用板start、prog、srv 3个绿灯亮,认为PTN备用板工作正常,但其实此时主用主控板还没有完全把数据同步到备用主控板,在这个时候做了热拔插单板的操作,触发主备主控板倒换, 原来的备用主控板变为了主用主控板,而备用主控板的数据库配置只是原主用主控板的一部分,即原来的数据配置发生了丢失,导致部分业务中断的情况。5.经维护人员重新配置业务数据后,业务恢复,故障排除。经验总结为避免类似故障,建议当备用主控板指示灯正常后,先在切换一次主备主控板,如果数据同步未完成,切换失败

13、可以第一时间被发现。只有无异常后,才去拔板。故障案例分析案例4:工程中网线不当连接导致PTN网元脱管故障故障现象某日,某PTN网络突然出现大量网元脱管。各网关网元可ping通,但丢包严重。可能原因系统配套的数据以太网交换机之间,成环或交换机故障; 其他原因导致丢包严重;故障案例分析排查过程1.维护人员赶往核心机房,检查PTN1号以太网i交换机(汇聚A、B、C、D四个区域PTN网络DCN电路)、2号以太网交换机(汇聚X、Y、Z三个区域PTN网络DCN电路)之间是否成环,确认这两台交换机之间只有一条网线相连,未成环。拔掉1号交换机、2号交换机之间相连的网线,再用ping命令检查,发现 2号交换机(汇聚X、Y、Z三个区域PTN网络DCN电路)到所辖各网关网元通信不正常。怀疑2号交换机故障。2.重启2号交换机,但无效。请厂家数通工程师协助检查,发现2号交换机#36以太口不正常,连通的MAC地址数量很多。拔掉2号交换机#36口网线(至X区域PTN网络网关网元X1的DCN电路),该PTN深入分析(可选):监控恢复正常。事后发现网元

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论