大比武学习材料传输以太网故障处理_第1页
大比武学习材料传输以太网故障处理_第2页
大比武学习材料传输以太网故障处理_第3页
大比武学习材料传输以太网故障处理_第4页
大比武学习材料传输以太网故障处理_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Security Level: Internal Use Only以太网故障处理TECHNOLOGIES Co.,.课程目标 学习完此课程,您应能:掌握以太网故障常用熟悉与理解以太网故障了解一些常见典型案例思路Page 2TECHNOLOGIES CO.,.内容提纲¥ 以太网故障¥ 以太网故障思路¥ 以太网故障案例分析Page 3TECHNOLOGIES CO.,.以太网单板维护扁鹊看病是望、闻、问、切:以太网故障也需要熟练掌握几种常见的Ø 告警与性能分析Ø RMON(Remote Network Mmonitoring)性能分析操作日志分析&

2、#216;Ø 测试帧功能通过以上几种常见的维护大部分的问题,在一问题:可以帮助些特殊或复杂的情况下可以借助其他方式来Ø 单板还回功能Ø 测试仪表测试Ø 捕获报文分析,既抓包分析Ø 数据设备PINGTRACERT功能Page 4TECHNOLOGIES CO.,.以太网单板维护告警与性能分析Ø SDH告警及性能检查影响SDH业务的告警:LOP、AIS、UNEQ等SDH性能统计:误码、 B3SD、LPBBE等Ø层告警LCAS带宽减少告警及LCAS实际协商时隙Ø 封装层告警FCS_ERR及GFP帧失步告警Ø 以

3、太网告警和性能检查影响业务的告警:ETH_LOSRMON性能告警:错误报文计数及性能统计越限告警注意:底层性能劣化可能引起上层告警Page 5TECHNOLOGIES CO.,.以太网单板维护T2000告警显示T2000V002R002版本截图,推荐使用F1联机帮助Page 6TECHNOLOGIES CO.,.以太网单板维护RMON性能分析以太网统计组(Ethernet statistics)Ø以太网端口的当前实时性能统计数据;统计组的作用是组(History control)历史历史Ø组的作用是各以太网端口历史数据的获取方式,设置的属性包括:历史表类型:30秒/30分/

4、可设周期,对于可设周期,需要设置采样周期;每个统计值保存的项数;以太网历史组(Ethernet history)历史数据组保留对以太网性能的历史时段的统计,满足用户对Ø过去某些时间段内的以太网端口统计数据的要求,其支持的性能项和以太网统计组相同;组(alarm control)告警Ø实现告警功能。完成告警的上报。需要提供告警的设置、时间间隔;,告警的设置包括告警的上报方式,告警上限/下限,告警数据的Page 7TECHNOLOGIES CO.,.以太网单板维护T2000RMON性能分析-统计组通过端口实时速率统计功能,可以大致了解本端口的报文收发速率Page 8TECHNO

5、LOGIES CO.,.以太网单板维护T2000RMON性能分析-告警组注意:首先必须启动性能监视功能Page 9TECHNOLOGIES CO.,.以太网单板维护T2000RMON性能分析-参数含义ØA类错包AlignmentErrors对齐错误:碰撞引起或硬件故障(对端居多);FCSErrors CRC校验错:碰撞(对端硬件故障;Ø B类碰撞相关工VS半双工)、网线质量差或受到干扰、Collisions:端口实际工作在半双工模式,建议调整到工模式;CSMA/CD算法所决定,非故障;ØC类流控反映了通道的“拥挤”程度;ØD类硬件异常DropEvents

6、:由于FIFO溢出而导致的丢包;F1联机帮助推荐使用Page 10TECHNOLOGIES CO.,.以太网单板维护操作日志分析对事故前的操作对快速问题有很好的帮助Page 11TECHNOLOGIES CO.,.以太网单板维护测试帧功能以太网单板提供一种验证VCTRUNK端口之间互通性的,使用GFP管理帧实现的测试帧功能.通过测试帧请求和应答的交互,可以验证单板之间VCTRUNK连接的配置正确性, 即SDH业务配置和VCTRUNK通道绑定配置,以及SDH线路侧通断情况.Page 12TECHNOLOGIES CO.,.以太网单板维护T2000实现测试帧功能业务正常情况下,测试帧的数量和收到的

7、测试帧数量应该相同.Page 13TECHNOLOGIES CO.,.以太网单板维护命令行实现测试包功能-只有EFGS系列支持定义测试包:ethn-cfg-set-testpktpara:bid,vctrunk,length,testtype,datatype,dstmac,srcmac,dstip,srcip,vlanid;(0xFFFF表示不带VLANID)测试包: ethn-cfg-set-testpkten:bid,vctrunk/ip,number ;注意:此功能需要谨慎使用Page 14TECHNOLOGIES CO.,.MACVCTRUNKVCTRUNKMAC测试包NE1NE2M

8、ACVCTRUNKVCTRUNKMAC测试包以太网单板维护以太网单板还回功能SDH时隙外环回MAC环回SDH时隙内环回交叉/线路环回SDH交叉与线路PHY环回环回位置及方向注意:二层交换模式下不能使用环回功能此功能需要谨慎使用Page 15TECHNOLOGIES CO.,.SDH VC12 VC3 VC4VCG LCAS封装GFP LAPS HDLC MLPPP虚通道MPLSQinQ以太网透传 二层交换以太网透传 二层交换虚通道MPLSQinQ封装GFP LAPS HDLC MLPPPVCGLCASSDH VC12 VC3 VC4以太网单板维护Ø 测试仪表测试利用外接仪表的强大功能

9、,可以实现模拟以太网业务数据流; 测试以太网业务的四个性能指标;也可以实现报文捕获分析; 常用的仪表有SMARTBITS6000,Tesgine2000等;Ø 捕获报文分析,既抓包分析利用仪表,或是PC+抓包软件(SNIFFER)等工具捕获数据流,并提供分析报文分析,可以让维护深入分析业务异常;Ø 数据设备PINGTRACERT功能在和数通设备配合组网,借助数通设备或是利用PC机的PINGTRACERT来故障点;Page 16TECHNOLOGIES CO.,.:PING 命令的使用方法维护可以通过PING命令各种长度、数量的ping包,参数解释如上图所示。Page 17T

10、ECHNOLOGIES CO.,.以太网OAM功能简介维护引入:随着以太网业务的发展,运营商对设备的可维护性越来越关注,在 以太网向城域、广域网扩展的时候,迫切需要解决传送网的OAM(OAM-Operations, Administration and Maintenance)问题。而当前以太网二层的维护便应运而生。非常有限,于是以太网OAM功能Page 18TECHNOLOGIES CO.,.以太网OAM功能简介维护以太网OAM主要具有一下几个功能:故障的自动发现故障的故障的提供一些供用户、用服问题的;替代私有的测试帧功能,解决测试帧和数通设备之间不能互通的问题;二层交换业务不能支持还回功能

11、;现有的专线业务报文环回处理,不 能对报文选择性的环回;能够比现有的发现更低级的错误;Page 19TECHNOLOGIES CO.,.以太网OAM功能简介操作:网元管理器-à某块以太网单板-à以太网OAM管理维护功能Page 20TECHNOLOGIES CO.,.以太网OAM功能简介维护操作:用户首先创建各维护节点(MEP_A/MEP_B/链路上各MIP),并设置维护点相关属性(输入MPID、Type、Level、Direction、OAM时间参数)。注意: 创建维护点之前需要首先创建业务,Link或者LSP。Page 21TECHNOLOGIES CO.,.以太网OA

12、M功能简介维护如图:在MEP_A下发启动LB命令(需要指定目的节点MPID,假设为MEP_B),启动LB检测定时器。1.网络无故障则MEP_B返回LBR,MEP_A收到此LBR后上报,否则返回超时。2.Page 22TECHNOLOGIES CO.,.内容提纲¥ 以太网故障¾以太网故障思路¥ 以太网故障案例分析Page 23TECHNOLOGIES CO.,.以太网故障思路以太网故障以太网故障原则可以参照“先性能后告警、先SDH后以太网、先日志后测试、先内部后外部”的原则,充分利用告警、性能事件、逐段环回、测试帧、替换法等,结合工具软件、测试仪表、PING功能等进

13、行有计划、有步骤的除了遵照上述原则外,还应尽可能采取其它的应急措施(如提供、切换备用链路),以减少业务中断时长故障的经验和对并没有一种固定不变的思路,完全可以根据的熟悉程度,灵活的运用Page 24TECHNOLOGIES CO.,.以太网故障以太网故障思路界面内部外部SDH以太网Page 25TECHNOLOGIES CO.,.以太网故障以太网故障思路思路业务中断Page 26TECHNOLOGIES CO.,.以太网故障思路以太网故障思路业务中断常见问题端口TAG属性(TAG/UNTAG)设置不当该种故障出现概率较大,常见 行端口属性同步更改,导致业务中断;端口工作模式引起的故障Ø

14、;是以太网端口未能与数据设备进Ø物理层出现故障,表现为实际端口工作模式不正确,或者端口某些参数异常,或接口板故障,物理层寄存器被随意改写等。当端口设置为自协商时,要求在link上后工的情况出现;网线或者光纤出现故障端口实际工作模式,杜绝半双工VSØ以太网端口LINK灯(绿色)不亮,网线可能坏了,或者是交叉和公网线弄混了; 通过以太网RMON实时性能,如果存在较多的CRC错误等异常错包,在首先排除端口工作模式问题的前提下,也可能是网线光纤存在问题;VC通道需重点情况错或不一致也可致使业务中断;Ø在非LCAS状态下Page 27TECHNOLOGIES CO.,.以太

15、网故障思路以太网故障思路业务中断常见问题Ø 以太网配置的静态路由错误或者丢失检查配置后修改;Ø 单板硬件故障一般都会有上报TU-AIS,TU-LOP等SDH层告警,现象比较好Ø 封装协议不匹配;对于EFGS系列单板,N1单板支持LAPS和GFP,N2只支持GFP,不同的;的封装协议是无法对接Ø GFP帧失GFP封装FCS_ERROR可能GFP封装的参数设置不一致造成的问题,如N1的EFGS单板默认的GFP封装是“小字节序”而N2的单板默认值是“Ø 因为大量丢包造成的业务中断参考下”业务劣化”的处理思路;Ø 端口的默认vlan id设置

16、序”;关注端口PVID和业务VLAN ID之间的关系;对于EFGS单板的Hybrid端口的PVID设置也要注意两端设备的一致问题;Page 28TECHNOLOGIES CO.,.以太网故障思路以太网故障思路业务劣化Page 29TECHNOLOGIES CO.,.以太网故障思路以太网故障思路业务劣化常见问题业务量大,配置带宽不够通过以太网端口性能统计数据进行判别,一般对端设备可以接收到比较多而且Ø持续的PAUSE帧;如果实际流量接近我们配置的带宽,也证明我们的带宽了。可以尝试多绑定几个2m来验证问题。带宽足够,但是业务突发比较大流量很可能平均流量远小于我们配置的带宽,但对端设备还是

17、在时不时收到我们设备发出的PAUSE帧,此时一是增加带宽,但是更主要的是要求对端的设备做一量整形,这样效果会好很多。业务量过大的时候,对端设备不响应流控造成丢包一端支持使能流控,对端设备不响应流控,引起大量丢包;建议对于业务量较大的站点,要不和对端设备同时使能流控,要不同时都不使能,不要出现一方使能另一方不使能的情况;单板设置的最大传输包长MTU小于实际设备的传输包长不足ØØØ或是MPLS网络这种情况不太常见,但是发生了也很难确认。常出现在有中,通过测试仪表可以测试出网络最大的MTU.Page 30TECHNOLOGIES CO.,.以太网故障思路以太网故障思路业

18、务劣化常见问题端口模式和对端设备不匹配,造成工作在异常状态这种情况多半会导致AUTO一端被错误协商成100M HALF,引起工作模式不匹配。小业务流量还是可以传输,但是数据量一大就会导致大量的碰撞和冲Ø突包被检测到,可以通过性能统计网线或者光纤出现故障到。Ø出,如果存在较多的CRC错误等异常错包,在首先通过告警基本上可以排除端口工作模式问题的前提下,也可能是网线光纤存在问题;单板硬件故障一般都会有上报TU-AIS,TU-LOP或BBE等SDH层告警或性能;交换业务存在回路,而未启动生成树ØØ以太网业务层可能存在环路,例如人为的或是业务配置错误,如该情况未

19、启用生成源;网络存在异常通过抓包分析,如存在超量的广播报文或是后果与广播风暴类似;在以太接口上插环回电缆等,存在广播风暴消耗网络带宽资Ø报文,占用大部分转发带宽,Page 31TECHNOLOGIES CO.,.知识回顾Ø 以太网故障原则Ø 以太网故障分界Ø 以太网故障的思路Ø 以太网常见故障现象和Page 32TECHNOLOGIES CO.,.内容提纲¥ 以太网故障¥ 以太网故障思路¸以太网故障案例分析Page 33TECHNOLOGIES CO.,.以太网故障案例分析EFS单板瞬报ETH_LOS告警的问题处理

20、【问题现象】某局EFS单板瞬报ETH_LOS告警,通过检查有多个站点出现过5秒的ETH_LOS告警,然后告警结束。通过对照发现只要是10MFull连接到用户的计费系统的EFS单板MAC端口会出现瞬报ETH_LOS告警的现象,其他端口均正常【问题分析】由于单板上报ETH_LOS告警,属于网口连接丢失告警,与SDH系统无关,且多块单板均瞬报告警,单板故障的可能性也非常的小。通过深入的观察为用户偶尔关闭或重启计算机,导致Link偶尔中断:每次分析发现故障重启或关闭计算机时,由于网卡有暂时的掉电,在上就会反映出几秒钟的瞬断告警。由于EFS单板对端口的Link状态是5秒左右的周期巡检一次,所以会出现5秒

21、的ETH_LOS告警【问题解决】属正常现象,不需要处理。Page 34TECHNOLOGIES CO.,.以太网故障案例分析以太网业务丢包严重【问题现象】用户反映上网速度很慢,ping外部【问题分析】思路:端口模式问题?线路故障 ?单板故障?数通故障?1、 端口模式不一致引起大量丢包,此种情况可以迅速通过以太网性能出现较多丢包。确工且收到大量CRC错包,可确认为对端工作在半双工认:如果本端为模式所导致,当然,也有可能是网线故障或受到干扰所致;2、 线路如果出现误码,从而导致以太网帧所在的VC虚通道产生误码,而单板在从VC虚通道恢复以太网帧的时候会进行CRC校验,此时必然CRC校验不过而丢弃改帧

22、;3、单板硬件故障导致丢包,通过还【问题解决】处理此类故障时,首先查看SDH侧是否产生了误码,其次通过以太网性能测试来,确认后更换单板解决;来PC直连来是否存在端口工作模式不一致的问题,再次数通设备通过是否数通故障,如为以太网问题,则更换以太网单板继续观测。Page 35TECHNOLOGIES CO.,.以太网故障案例分析以太网业务FTP测试速率不达标【问题现象】50KM用户FTP测试速率只有几K字节【问题分析】分析过程:线路无误码,FCS校验正常,网络流量也比较小,没有超过绑定带宽,但在进行仪表测试时,发现网络时延很大FTP软件采用TCP传输方式,和TCP的窗口机制有关,时延越大,该TCP

23、的服务速率会相应降低,和设备带宽无关。一种简单的计算方法:假设PC机的MTU=1500,最大窗口数w16;则每次最大可以传送的字节数 16×1500×8192000bits,时延192000/测试速率 =Nms;【问题解决】尽量减少网络传输的时延,加大FTP传输的TCP窗口,如用FTP软件多进程功能Page 36TECHNOLOGIES CO.,.以太网故障案例分析EGS2每个vctrunk只支持4个VC4,转发不能线速【问题现象】用户采选了SSN2EGS2数据单板组网, 却无法实现千兆流量的传送.【问题分析】OSN设备数据单板N2EGS2的VCTRUNK带宽因为受到的限制

24、,一个VCTRUNK只能支持622M(4*VC4)的带宽。因此当组网出现一个MAC(GE 端口)口或是多个MAC(GE端口)对应一个SDH系统侧端口(VCTRUNK端口) 时, 并且用户流量超过622M 的情况下, 就会出现SDH系统侧端口(VCTRUNK端口)带宽瓶颈问题!【问题解决】1、这应该是一个已知的规格限制,所以建议在组网时规避,尽量采用一个GE端口对应多个VCTRUNK的组网方式,来缓解带宽瓶颈问题。2、流量比较大的专线接入业务建议采用EGT单板组网。Page 37TECHNOLOGIES CO.,.以太网故障案例分析GFP封装不一致导致业务中断【故障现象】某局计划使用SSN1EFS0单板,开通以太网业务两端都采用了GFP 的封装方式,在配置完成后,业务始终不通;查看线路侧上无任何异常告警,但有时存在FCS_ERR告警【问题处理】FCS_ERR告警是由封装方式触发FCS校验出错告警,可能的是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论