26-DR020004 NE8040设备故障处理_第1页
26-DR020004 NE8040设备故障处理_第2页
26-DR020004 NE8040设备故障处理_第3页
26-DR020004 NE8040设备故障处理_第4页
26-DR020004 NE8040设备故障处理_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DR020004NE8040设备故障处理学习完此课程,您将会:掌握一般的故障排除步骤掌握常用的故障排除工具掌握故障处理常用方法了解华为数据通信产品故障处理资源目标第一章 网络故障处理技术概述第二章故障排除常用工具第三章故障排除常用方法第四章 故障处理资源内容介绍网络故障处理技术概述当今的网络互连环境是复杂的,而且其复杂性还在日益增长,主要原因如下:现代的因特网络要求支持更广泛的应用,包括数据、语音、视频及它们的集成传输;新业务发展使网络带宽的需求不断增长,这就要求新技术的不断出现。例如:十兆以太网向百兆、千兆以太网的演进;MPLS技术的出现;提供QoS能力等。新技术的应用同时还要兼顾传统的技术。例如,传统的SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承载SNA的一种技术而被应用。网络故障处理技术概述能够正确地维护网络尽量不出现故障,并确保出现故障之后能够迅速、准确地定位问题并排除故障,对网络维护和管理人员来说是个挑战。这不但要求对网络协议和技术有着深入的理解,更重要的是要建立一个系统化的故障处理思想并合理应用于实际中,以将一个复杂的问题隔离、分解或缩减排错范围,从而及时修复网络故障。网络故障的一般分类连通性问题性能问题硬件、媒介、电源故障配置错误不正确的相互作用网络拥塞到目的地不是最佳路由供电不足路由环路网络错误一般网络故障的解决步骤故障处理系统化是合理地一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。故障处理的实例用户网段广播包过多造成该网段的服务器FTP业务传输速度慢网云A:18/24C:20/24B:53/16D:3/16ETHERNETETHERNETETHERNET该案例组网如上:某校园网的三个局域网,其中为一个用户网段,18为一个日志服务器;是一个集中了很多应用服务器的网段1.故障现象描述要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象“日志服务器与备份服务器间备份发生问题。”这是一个不完整不清晰的故障现象描述。因为这个描述没有讲述清楚下列问题:这个问题是连续出现,还是间断出现的?是完全不能备份,还是备份的速度慢(即性能下降)?哪个或哪些局域网服务器受到影响,地址是什么?正确的故障现象描述是:在网络的高峰期,日志服务器1到集中备份服务器53之间进行备份时,FTP传输速度很慢,大约是0.6Mbps。2.相关信息收集搜集有助于查找故障原因的详细信息:向受影响的用户、网络人员或其他关键人员提出问题;根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关display和debug命令等;测试性能与网络正常情况下的记录进行比较。通过该步骤,我们收集到了下面一些相关信息:最近网段的客户机不断在增加;网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为6Mbps3.经验判断和理论分析利用前两个步骤收集到的数据,并根据自己以往的故障处理经验和所掌握的的知识,确定一个排错范围。通过范围的划分,就只需注意某一故障或与故障情况相关的那一部分产品、介质和主机。如上述案例,我们现在能够确定是一个网络性能下降问题。那么,是网段的性能问题?是中间网络的性能问题?还是网段的性能问题呢?根据网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps这一事实,我们可以排除掉网段的性能问题。4.各种可能原因列表该步骤列出根据经验判断和理论分析后总结的各种可能原因如上述案例,可能原因如下:网段的性能问题,其原因可能为:日志服务器A的性能问题网络的网关性能问题网络本身的性能问题中间网络性能问题,主要是到网络的路由不是最佳路由5.对每一原因实施排错方案根据所列出的可能原因制定故障排查计划,分析最有可能的原因确定一次只对一个变量进行操作,这种方法使你能够重现某一故障的解决办法如果有多个变量同时被改变,而问题得以解决,那么如何判断哪个变量导致了故障发生呢6.观察故障排查结果当我们对某一原因执行了排错方案后,需要对结果进行分析判断问题是否解决,是否引入了新的问题问题解决,那么就可以直接进入文档化过程没有解决问题,那么就需要再次循环进行到故障排查过程7.循环进行故障排查过程在进行下一循环之前必须做的事情就是将网络恢复到实施上一方案前的状态。如果保留上一方案对网络的改动,很可能导致新的问题循环排错可以有两个切入点:当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可能原因制定排错方案并实施;当所有可能原因列表的排错方案均没有达到排错目的,重现进行故障相关信息收集以分析新的可能原因。我们在列出了可能原因列表后,开始制定方案进行故障处理7.循环进行故障排查过程可能原因1:网络到网络的路由不是最佳路由。制定的方案:在网段的网关上使用“tracert53”命令,发现探测报文返回时长仅为10ms,表明该可能原因并不是造成故障的原因。我们进入循环排错过程。7.循环进行故障排查过程可能原因2:日志服务器A的性能问题。制定的方案:测试同一网段的主机C和日志服务器间的FTP传输速度,是6Mbps,正常。可见问题与服务器A无关。7.循环进行故障排查过程可能原因3:网络的网关性能问题。制定的方案:测试主机C和备份服务器B间FTP传输速度是7Mbps,正常。排除了网关因素,因为B、C在不同网段上而速度正常。7.循环进行故障排查过程可能原因4:网络本身的性能问题。制定的方案:在网段的以太网交换机上使用命令“displaymac”,输出如下:PortRcv-UnicastRcv-MulticastRcv-Broadcast----------------------------------------------------------------6/321031781208665PortXmit-UnicastXmit-MulticastXmit-Broadcast----------------------------------------------------------------6/3266679872866522474038(输出的广播:输出的单播比例为1:3,太大了。)PortRcv-OctetXmit-Octet---------------------------------------------------------------6/32140948293581516443041在网段上的以太网交换机上使用命令“showmac”输出如下:PortRcv-UnicastRcv-MulticastRcv-Broadcast-------------------------------------------------------------6/36557802870285PortXmit-UnicastXmit-MulticastXmit-Broadcast--------------------------------------------------------------6/3627879749190257119430(广播:单播比例=1:270,属于正常。)PortRcv-OctetXmit-Octet---------------------------------------------------------------6/366717258708149988168097.循环进行故障排查过程由此得知,网段上广播包和单播包比例为1:3,确实太大了。再次询问用户该网段主要运行的业务是什么,而得出了故障最终原因如下:是普通用户网段,由于业务原因每个用户需要发送大量广播包和多播包随着近期越来越多的用户接入该网络,在这个网段上的服务器需要花费更多的资源来处理越来越多的广播和多播包,因此其服务的传输速度自然减慢。这是一个网络布局不恰当的问题,需要重新安排服务器的位置,将服务器移动网段后,故障解决。8.故障处理过程文档化当最终排除了网络故障后,流程的最后一步就是对所做的工作进行文字记录。文档记录主要包括以下几个方面:故障现象描述及收集的相关信息网络拓扑图绘制网络中使用的设备清单和介质清单网络中使用的协议清单和应用清单故障发生的可能原因对每一可能原因制定的方案和实施结果本次排错的心得体会其他:如排错中使用的参考资料列表等第一章 网络故障处理技术概述第二章故障排除常用工具第三章故障排除常用方法第四章 故障处理资源内容介绍路由器常用诊断工具ping命令tracert命令display命令reset命令debug命令PING命令命令ping用于检查IP网络连接及主机是否可达。“ping”这个词源于声纳定位操作,指来自声纳设备的脉冲信号。ping命令的思想与发出一个短促的雷达波,通过收集回波来判断目标很相似;即源站点向目的站点发出一个ICMPEchoRequest报文,目的站点收到该报文后回一个ICMPEchoReply报文,这样就验证了两个节点间IP层的可达性--表示了网络层是连通的由于ping和tracert命令不仅是路由器VRP平台的常用网络命令,也是windows平台上常用的网络命令,下面对两种平台下的命令使用均进行介绍PING命令在NE系列路由器上,ping命令的格式如下: ping[-aX.X.X.X|-ccount|-d|-httl_value|-i{interface-typeinterface-number|interface-name}|ip|-n|-ppattern|-q|-r|-spacketsize|-ttimeout|-v|vpn-instancevpn-instance-name]*host

-aping报文中使用的源IP地址-cping报文的个数,缺省值为5-t设置ping报文的超时时间,单位为毫秒,缺省值为2000-s设置ping报文的大小,以字节为单位,缺省值为56PING命令在PC机上或WindwosNT为平台的服务器上,ping命令的格式如下:ping[-nnumber][-t][-lnumber]ip-address-nping报文的个数,缺省值为5;-t持续地ping直到人为地中断,Ctr+Breack暂时中止ping命令并查看当前的统计结果,而Ctr+C则中断命令的执行。-l设置ping报文所携带的数据部分的字节数,设置范围从0至65500用ping命令进行故障处理案例一连通性问题还是性能问题工程师小L,在配置完一台路由器之后执行ping命令检测链路是否通畅。发现5个报文都没有ping通,小L断定是连通性问题检查双方的配置命令并查看路由表,却一直没有找到错误所在。最后又重复执行了一遍相同的ping命令,发现这一次5个报文中有1个ping通了--原来是线路质量不好存在比较严重的丢包现象用ping命令进行故障处理工程师小L又配置了一台路由器,然后执行ping命令访问Internet上某站点的IP地址,但没有ping通。有了上次的教训小L,再一次ping了20个报文,仍旧没有响应。于是这次小L觉得能够断定是连通性故障。在费劲周折检查了配置链路之后仍没有发现任何可疑之处,最后小L采取逐段检测的方法对链路中的网关进行逐级测试,发现都可以ping通,但是响应的时间越来越长,最后一个网关的响应时间在1800ms左右。会不会是由于超时而导致显示为ping不同呢?受此启发,小L将ping命令报文的超时时间改为4000ms,这次成功ping通了,显示所有的报文响应时间都在2200ms左右。用ping命令进行故障处理建议和总结:真的是ping不通吗?这个问题需要定位清楚,因为连通性问题和性能问题排错的关注点是不一样的――问题定位错误必然会导致排错过程的周折使用一般的ping命令,缺省是发送5个报文的,超时时长是2000ms。如果ping不通情况发生,最好能够再用带参数-c和-t的ping命令再执行一遍,如:ping-c20-t4000ip-address,即连续发送20个报文,每个报文的超时时长为4000ms,这样一般可以判断出到底是连通性问题还是性能问题。用ping命令进行故障处理案例二使用大包ping对端进行MTU不一致的故障处理?某次开局,使用Quidway路由器与其他厂商的某路由器互连,并运行OSPF协议。数据配置完毕后,一切正常,并在今后相当长的时间内设备运转稳定。但两个月后,用户反馈网络中断相关信息显示:登录到两台路由器上,发现双方连接正常,可以相互ping通对端地址。但OSPF协议中断;登录Quidway路由器查看邻居状态,发现邻居状态机处于Exstart状态。打开相应的debug开关查看相应的报文信息,发现双方都可以收到Hello报文,但Quidway路由器发送DD报文后,一直没有收到对方回应的DD报文登录其他厂商的那台路由器,打开相应的debug开关,发现对方收到Quidway路由器发送的DD报文后,已发送了相应的DD报文予以回应。用ping命令进行故障处理原因分析:初步断定,Quidway路由器没有收到DD回应报文,但对方确实发出来了既然可以接收到HELLO报文说明链路是通畅的,而且多播报文的收发也没有问题。那么有可能是对方发送的DD报文有错误导致Quidway路由器拒收,但查看相应的信息,并没有报告接收到错误的DD报文仔细查看某厂商路由器的调试信息发现这个DD报文很大有2000多字节。会不会是由于报文太大导致的问题呢?试着ping了一个2000字节的报文,结果不通。那么故障原因很可能是--由于双方的MTU不一致导致大包不通用ping命令进行故障处理处理过程:检查配置,发现对方路由器的MTU设置为4000多而Quidway路由器的MTU设置为1500,于是修改对端路由器的MTU为1500。故障消除。那么为什么工程初期没有问题呢?这是因为前期DD报文长度小于1500字节,而后来网络扩容导致路由信息过多使DD报文的长度超过了1500字节。建议和总结:由于ping缺省报文是56个字节,所以显示的ping通信息只是表示56字节的报文可以通而并不一定表示其他大小的报文仍旧可以通。所以,应当善于使用ping的其他参数来进行故障处理。用ping命令进行故障处理E0:/8E0:/8S0:/8S0:/8RouterARouterB案例三A能ping通B,B就一定能ping通A吗?在RouterA上配置一条指向/8的静态路由:[Quidway]iproute-static在RouterA上ping路由器RouterB的以太网地址,显示可以正常ping通;但是在RouterB上ping路由器RouterA的以太网地址,却无法ping通用ping命令进行故障处理原因分析:由于在RouterB上没有相应的配置到/8路由,所以在RouterB上ping不通RouterA的以太网口。但是为何在A上可以ping通呢?同样是没有回程路由。打开路由器上的IP报文调试开关发现,原来从RouterA上发出的ICMP报文的源地址填写的是而不是,由于两台路由器的s0口处于同一网段,所以响应报文可以顺利到达RouterB建议和总结:A能够ping通B则B一定能够ping通A(不考虑防火墙的因素),这句话的对错取决于A和B到底是指主机还是指路由器。如果是指两台主机,那么这句话就是正确的。如果是指两台路由器那就是错误的,因为路由器通常会有多个IP地址。现在就有如下问题:当从一台路由器上执行ping命令它发出的ICMPEcho报文的源地址究竟选择哪一个呢?实际情况是路由器选择发出报文的接口的IP地址TRACERT命令tracert命令用于测试数据报文从发送主机到目的地所经过的网关,主要用于检查网络连接是否可达,以及分析网络什么地方发生了故障。tracert利用IP报文的TTL域在每经过一个路由器的转发后减一,当TTL=0时则向源节点报告TTL超时这个的特性。TRACERT命令在华为NE系列路由器上,tracert命令的格式如下:tracert[-a

X.X.X.X|-f

first_TTL|-m

max_TTL|-p

port|-q

nqueries|-w

timeout]*host-a指定一个发送UDP报文的源地址;-f指定初始报文的TTL大小,缺省值为1;-m指定最大TTL大小,缺省值为30;-p目的主机的端口号,缺省值为33434;-q每次发送的探测报文的个数,缺省值为3;-w指明UDP报文的超时时间,单位为毫秒,缺省值为5000。TRACERT命令在PC机上或WindwosNT为平台的服务器上,tracert命令的格式如下: tracert[-d][-h

maximum_hops][-j

host-list][-w

timeout]host-d不解析主机名;-h指定最大TTL大小;-j设定松散源地址路由列表;-w用于设置UDP报文的超时时间,单位毫秒;使用tracert命令进行故障处理网云RIP域E1:/8/8E0:/8S0:/8S1:/8S0:/8s1:/8/8RouterARouterBRouterC案例一使用tracert命令定位不当的网络配置点某校园网中,RouterB和RouterC同属于一个运行RIPv2路由协议的网络,主机访问数据库服务器,用户抱怨访问性能差。使用tracert命令进行故障处理相关信息显示登录到RouterC,使用带参数的ping远端服务器,显示如下:[RouterC]ping-c10-s4000-t6000PING:4000databytes,pressCTRL_CtobreakReplyfrom:bytes=4000Sequence=0ttl=249time=552msReplyfrom:bytes=4000Sequence=1ttl=249time=5733msReplyfrom:bytes=4000Sequence=2ttl=249time=552msReplyfrom:bytes=4000Sequence=3ttl=249time=5714ms使用tracert命令进行故障处理原因分析上面的ping显示出一个规律:奇数报文的返回时长短,而偶数报文返回时长很长(是奇数报文的10倍多)。可以初步判断奇数报文和偶数报文是通过不同的路径传输的。现在我们需要使用tracert命令来追踪这不同的路径。在RouterC上,tracert远端RouterA的以太网接口[RouterC]tracert-q8tracerouteto()30hopsmax,40bytespacket16ms4ms4ms4ms4ms4ms4ms4ms……520ms16ms15ms16ms16ms16ms16ms16ms630ms278ms25ms279ms25ms278ms25ms277ms从上面的显示可看到,直至,UDP探测报文的返回时长都基本一致,而到时,则发生明显变化,呈现奇数报文时长短,偶数报文时长长的现象。于是判断,问题发生在RouterB和RouterA之间使用tracert命令进行故障处理原因分析通过询问该段网络的管理员,得知这两路由器间有一主一备两串行链路,主链路为2.048Mbps(s0口之间),备份链路为128Kbps(s1口之间)。网络管理员在此两路由器间配置了静态路由RouterB上如下配置:[RouterB]iproute-static[RouterB]iproute-staticRouterA上如下配置:[RouterA]iproute-static[RouterA]iproute-static于是问题就清楚了。例如RouterB,由于管理员配置时没有给出静态路由的优先级,这两条路由项的优先级就同为缺省值60,于是就同时出现在路由表中,实现的是负载分担,而不能达到主备的目的使用tracert命令进行故障处理处理过程,可以有两种处理方法:继续使用静态路由,进行配置更改RouterB上进行如下更改:[RouterB]iproute-static(主链路仍使用缺省优先级60)[RouterB]iproute-static100(备份链路的优先级降低至100)RouterA上进行如下更改:[RouterA]iproute-static[RouterA]iproute-static100这样,只有当主链路发生故障,备份链路的路由项才会出线在路由表中,从而接替主链路完成报文转发,实现主备目的。在两路由器上运行动态路由协议,如OSPF等,但不要运行RIP协议(因为RIP协议仅以hop作为Metric的)使用tracert命令进行故障处理建议和总结本案例的目的不是为了解释网络配置问题,而是用来展示ping命令和tracert命令的相互配合来找到网络问题的发生点。在一个大的组网环境中,维护人员可能无法沿着路径逐机排查,此时,能够迅速定位出发生问题的线路或路由器就非常重要了使用tracert命令进行故障处理E1:/8/8E0:/8E0:/8S0:/8S0:/8E0:/8RouterARouterBRouterC案例二使用tracert命令发现路由环路三台路由器均配置静态路由,完成后,登录到RouterA上ping主机,发现不通使用tracert命令进行故障处理相关信息显示[RouterA]ping-c6-t5000PING:56databytes,pressCTRL_CtobreakRequesttimeoutRequesttimeout[RouterA]tracerttracerouteto()30hopsmax,40bytespacket16ms4ms4ms(RouterB)28ms8ms8ms(RouterA)312ms12ms12ms(RouterB)416ms16ms16ms(RouterA)……使用tracert命令进行故障处理原因分析从上面的tracert命令的显示可以立即发现,在RouterA和RouterB间产生了路由环路。由于是配置的是静态路由,基本可以断定是RouterA或RouterB的静态路由配置错误检查RouterA的路由表,配置的是缺省静态路由:iproute-static,没有问题检查RouterB的路由表,配置到网络的静态路由为:iproute-static――下一跳配置的是,而不是。这正是错误所在使用tracert命令进行故障处理处理过程修改RouterB的配置如下:[RouterB]noiproute-static[RouterB]iproute-static建议和总结tracert命令能够很容易发现路由环路等潜在问题。当路由器A认为路由器B知道到达目的地的路径,而路由器B也认为路由器A知道目的地时,就是路由环路发生了。使用ping命令只能知道接收端出现超时错误,而tracert能够立即发现环路所在――如果tracert命令两次或者多次显示同样的接口。当通过tracert发现路由环路后,如果配置为:静态路由:几乎可以肯定是手工配置有问题单动态路由协议:可能是地址聚合产生的问题多动态路由协议:可能是路由引入产生的问题DISPLAY命令display命令是用于了解路由器的当前状况、检测相邻路由器、从总体上监控网络、隔离因特网络中故障的最重要的工具之一。几乎在任何故障处理和监控场合,display命令都是必不可少的常用的display命令DisplayVersionDisplaycurrent-configuration和displaysaved-configurationDisplayinterfacesDisplayVersion<Quidway>displayversionHuaweiVersatileRoutingPlatformSoftwareVRP(tm)software,Version3.10,RELEASE0323Copyright(c)1997-2003HUAWEITECHCO.,LTD.QuidwayNetEngine80CoreRouteruptimeis0week,0day,1hour,14minutesMPU17(Master):uptimeis0week,0day,1hour,14minutes512MbytesSDRAM16384KbytesFlashMemory512KbytesNVRAM20GbytesHardDiskPcbVersion:CR01MPUBREV1LogicVersion:001BootROMVersion:003-130SoftwareVersion:VRPsoftware,Version3.10RELEASE0323.displaycurrent-configuration

与displaysaved-configurationDisplaycurrent-configuration用于查看当前的配置信息。Displaysaved-configuration用于显示NVRAM或Flash中的路由器配置文件,即路由器下次上电启动时所用的配置文件。Current-configuration是路由器目前正在运行的配置文件,当更改某一配置时,current-configuration会立即改变;如果不使用save命令将改变保存到启动配置文件saved-configuration中,路由器重启时该改动将丢失。因此请注意到修改运行配置并验证正确后,应当将之保存到启动配置文件中强烈建议网络维护或管理人员保存一份启动配置文件的拷贝存放到路由器以外的其他设备上。这有几点好处:这将使维护人员能够迅速配置一个替代的路由器;这个保存在外部的文本文件也可以按上述规定的格式脱机编辑然后使用Downloadconfig命令加载到路由器上;可以将该配置文件通过E-mail形式发给华为技术支持人员以帮助定位配置问题。Displayinterfacesdisplayinterfaces命令可以显示所有接口的当前状态,如果只是想查看特定接口的状态,请在该命令后输入接口类型和接口号,例如:displayinterfacesethernet0/0/1命令将查看以太口0的运行状态和相关信息。<Quidway>displayinterfaceethernet1/0/0.1Ethernet1/0/0.1currentstate:administrativelydown,lineprotocolisdownPhysicallineisWAN-FastEthernet,Cardinfo:100BASE-TX-RJ45LineType:Twisted-pairAddressis0001-0021-2900Description:HUAWEI,QuidwaySeries,Ethernet1/0/0.1InterfaceTheMaximumTransmitUnitis1500bytes,theBandWidthis10000KbitsSend-frame-typeisEthernet_II,loopbacknotsetNegotiationenabled,half-duplex,10MbpsNotrust802.1pThisportworksasaRouterStatisticslastcleared:neverTrafficstatistics:Input:0octets,0UcastPkts,0NUcastPkts,0discards0MulticastOctets,0MulticastPktsOutput:0octets,0UcastPkts,0NUcastPkts,0discards0MulticastOctets,0MulticastPktsReset命令Reset命令的作用――用于清空当前的统计信息以排除以前积累的数据的干扰Reset命令中最主要的是resetcountersinterface和resetipstatistics命令对于二层帧收发的各计数器的刷新必须使用resetcountersinterface,可通过displayinterfaces命令来观察对于三层报文的收发统计可使用resetipstatistics来刷新,通过displayipinterface命令来观察debug命令NE系列路由器提供大量的debug命令,可以帮助用户在网络发生故障时获得路由器中交换的报文和帧的细节信息,这些信息对网络故障的定位是至关重要的。display命令能够提供某个时间的设备运行状况的视图(静态),而debug命令能够展示一段时间内设备运行的变化情况(动态)一般说来,display命令不会影响系统的运行性能,而debug命令则会对系统性能造成影响。因此两者的使用应遵循如下规则:首先使用相关的多个display命令查看设备当前的运行状况,分析可能原因,缩减故障到适当范围,然后打开某个特定的debug命令观察变化情况,以定位和排除问题使用debug命令的注意要点应当使用debug命令来查找故障,而不是用来监控正常的网络运行。尽量在网络使用的低峰期或网络用户较少时使用,以降低debug命令对系统的影响性。由于debug命令在各个输出方向对系统资源的占用情况不同。视网络负荷状况,我们应当在使用方便性(info-centerconsoledebugging命令)和资源耗费小(info-centerlogbufferdebugging命令)间做出权衡。不要轻易使用类似debugall之类将产生大量输出的命令。仅当寻找某些类型的流量或故障并且已将故障原因缩小到一个可能的范围时,才使用某些特定的debug命令。debug命令案例一

忘记关闭debug开关引起的路由器报文转发速度变慢的故障处理某电信局安装了Quidway路由器作为接入服务器的出口网关,一段时间运转良好。某日用户反映该设备明显速度变慢。执行PING操作,PING对端路由器设备,所用时间为正常的2倍多。相关信息收集该路由器的日志中记录了大量的收发IP报文的信息。原因分析初步分析可能有以下几种原因:线路质量不好对端设备问题,导致回应较慢自身配置错误网络繁忙软硬件故障

debug命令处理过程检查线路,没有发现问题;PING与之相连的其他路由器设备,故障依旧,说明对端设备无问题;对照以前运转良好时备份的current-configuration文件,检查路由器上的配置,没有错误;当时并非上网高峰期,且只是变慢,而无丢包,应当不是网络负荷问题;检查该路由器的日志信息,发现其中记录了大量的收发IP报文的信息,执行命令displaydebugging命令,发现该路由器的debugippacket处于打开状态。由于设备需要记录每一个被转发的IP报文,大大降低了路由器的处理速度,导致变慢。关闭该debug开关后,故障解决第一章 网络故障处理技术概述第二章故障排除常用工具第三章故障排除常用方法第四章 故障处理资源内容介绍故障处理常用方法分层故障处理法分块故障处理法分段故障处理法替换法分层故障处理法分层法思想很简单:所有模型都遵循相同的基本前提--当模型的所有低层结构工作正常时,它的高层结构才能正常工作。在确信所有低层结构都正常运行之前,解决高层结构问题完全是浪费时间。案例分析:在一个帧中继网络中,由于物理层的不稳定,帧中继连接总是出现反复失去连接的问题,这个问题的直接表象是到达远程端点的路由总是出现间歇性中断。这使得维护工程师第一反应是路由协议出问题了,然后凭借着这个感觉来对路由协议进行大量故障诊断和配置,其结果是可想而知的。如果他能够从OSI模型的底层逐步向上来探究原因的话,维护工程师将不会做出这个错误的假设,并能够迅速定位和排除问题。分层故障处理法—各层次的关注点物理层:电缆、连接头、信号电平、编码、时钟和组帧,这些都是导致端口处于down状态的因素。数据链路层:数据链路层负责在网络层与物理层之间进行信息传输;规定了介质如何接入和共享;站点如何进行标识;如何根据物理层接收的二进制数据建立帧。封装的不一致是导致数据链路层故障的最常见原因。可以使用displayinterfaces命令初步判断数据链路层是否存在故障。网络层:地址错误和子网掩码错误是引起网络层故障最常见的原因;网络中的地址重复是网络故障的另一个可能原因;另

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论