【网络工程】网络故障-01-故障排除概述_第1页
【网络工程】网络故障-01-故障排除概述_第2页
【网络工程】网络故障-01-故障排除概述_第3页
【网络工程】网络故障-01-故障排除概述_第4页
【网络工程】网络故障-01-故障排除概述_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、华为中低端路由器故障处理手册目 录PAGE 1PAGE 83目 录TOC o 1-3第1章故障排除技术概述 PAGEREF _Toc14526998 h 1-11.1网络故障排除技术概览 PAGEREF _Toc14526999 h 1-11.1.1在当今日益复杂的网络中进行故障排除 PAGEREF _Toc14527000 h 1-11.1.2网络故障的一般分类 PAGEREF _Toc14527001 h 1-21.1.3一般网络故障的解决步骤 PAGEREF _Toc14527002 h 1-21.2华为中低端路由器产品介绍 PAGEREF _Toc14527003 h 1-61.1.1

2、 Quidway R1600系列低端路由器 PAGEREF _Toc14527004 h 1-61.1.2 Quidway R2500/4000系列低端路由器 PAGEREF _Toc14527005 h 1-61.1.3 Quidway R1700系列低端路由器 PAGEREF _Toc14527006 h 1-61.1.4 Quidway R2600系列和R3600系列中端路由器 PAGEREF _Toc14527007 h 1-61.3路由器常用诊断工具介绍 PAGEREF _Toc14527008 h 1-61.3.1 Ping命令 PAGEREF _Toc14527009 h 1-6

3、1.1.2 Tracert 命令 PAGEREF _Toc14527010 h 1-61.1.3 Show命令 PAGEREF _Toc14527011 h 1-61.1.4 Clear命令 PAGEREF _Toc14527012 h 1-61.1.5 Debug命令 PAGEREF _Toc14527013 h 1-61.4故障排除常用方法 PAGEREF _Toc14527014 h 1-61.4.1分层故障排除法 PAGEREF _Toc14527015 h 1-61.1.2分块故障排除法 PAGEREF _Toc14527016 h 1-61.1.3分段故障排除法 PAGEREF _

4、Toc14527017 h 1-61.1.4替换法 PAGEREF _Toc14527018 h 1-61.5故障排除对网络维护和管理人员的要求 PAGEREF _Toc14527019 h 1-61.5.1对协议要求有精深的理解 PAGEREF _Toc14527020 h 1-61.5.2能够引导客户详细描述出故障现象和相关信息 PAGEREF _Toc14527021 h 1-61.5.3充分了解自己所管理和维护的网络PAGEREF _Toc14527022 h 1-61.5.4及时进行故障排除的文档记录和经验总结 PAGEREF _Toc14527023 h 1-61.6华为数据通信产

5、品故障排除资源 PAGEREF _Toc14527024 h 1-61.1.1 Huawei Datacomm Online PAGEREF _Toc14527025 h 1-61.1.2 Huawei Technical Support PAGEREF _Toc14527026 h 1-6华为中低端路由器故障处理手册 REF _Ref13538896 r h 第1章 REF _Ref13538900 h 故障排除技术概述故障排除技术概述网络故障排除技术概览在当今日益复杂的网络中进行故障排除当今的网络互连环境是复杂的,而且其复杂性的日益增长也是可以预见的,主要原因如下:现代的互连网络要求支持更

6、广泛的应用,包括数据、语音、视频及它们的集成传输;新业务发展使网络带宽的需求不断增长,这就要求新技术的不断出现。例如:十兆以太网向百兆、千兆以太网的演进;MPLS技术的出现;提供QoS能力等。新技术的应用同时还要兼顾传统的技术。例如,传统的SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承载SNA的一种技术而被应用。多样业务的需求和各种先进技术的引入使网络日益复杂因此,现代的互连网络是协议、技术、介质和拓扑的混合体。互连网络环境越复杂,意味着网络的连通性和性能故障发生的可能性越大,而且引发故障的原因也越发难以确定。同时,由于人们越来越多的依赖网络处理日常的工作和事务,一旦网络故障不

7、能及时修复,其所造成的损失可能很大甚至是灾难性的。能够正确地维护网络尽量不出现故障,并确保出现故障之后能够迅速、准确地定位问题并排除故障,对网络维护人员和网络管理人员来说是个挑战,这不但要求他们对网络协议和技术有着深入的理解,更重要的是要建立一个系统化的故障排除思想并合理应用于实际中,以将一个复杂的问题隔离、分解或缩减排错范围,从而及时修复网络故障。本书着眼于帮助网络维护人员和管理人员将他们所掌握的知识有条理的应用于诊断和排除网络故障的过程中;帮助他们针对各种网络环境中的常见故障现象进行定位和解决。网络故障的一般分类网络故障一般分为两大类:连通性问题和性能问题。它们各自故障排除的关注点如下:连

8、通性问题硬件、媒介、电源故障配置错误不正确的相互作用性能问题网络拥塞到目的地不是最佳路由供电不足路由环路网络错误一般网络故障的解决步骤故障排除系统化是合理地一步一步找出故障原因并解决的总体原则。它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。故障排除时有序的思路有助于解决所遇到的任何困难,下图给出了一般网络故障解决的处理流程。说明:该处理流程是网络维护人员所能够采用的排错模型中的一种,如果你根据自己的经验和实践总结了另外的排错模型并证明是行之有效的,请继续使用它网络故障解决的处理流程是可以变化的,但故障排除有序化的思维模式是不可

9、变化的。网络故障排除基本步骤下面我们以一个故障排除的实例来学习如何应用这些步骤。案例:用户网段广播包过多造成该网段的服务器FTP业务传输速度慢该案例组网图如下:某校园网的三个局域网,其中为一个用户网段,18为一个日志服务器;是一个集中了很多应用服务器的网段。用户网段广播包过多造成该网段的服务器FTP业务传输速度慢故障现象描述要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象,然后才能确定可能产生这些现象的故障根源或症结。因此,对网络故障做出完整、清晰的描述是重要的一步。如上述案例,用户反映:“日志服务器与备份服务器间备份发生问题。”这就是一个不完整不清晰的故障现象描述。因为这个描

10、述没有讲述清楚下列问题:这个问题是连续出现,还是间断出现的?是完全不能备份,还是备份的速度慢(即性能下降)?哪个或哪些局域网服务器受到影响,地址是什么?正确的故障现象描述是:在网络的高峰期,日志服务器1到集中备份服务器53之间进行备份时,FTP传输速度很慢,大约是0.6Mbps。故障案例相关信息收集本步骤是搜集有助于查找故障原因的更详细的信息。主要是三种途径:向受影响的用户、网络人员或其他关键人员提出问题;根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议分析仪、相关show和debug命令等;测试性能与网络基线进行比较。如上述案例,可以向用户提问或自行收集下列相关信息:网络结构或配

11、置是否最近修改过,即问题出现是否与网络变化有关?是否有用户访问受影响的服务器时没有问题?在非高峰期日志服务器和备份服务器间FTP传输速度是多少?通过该步骤,我们收集到了下面一些相关信息:最近网段的客户机不断在增加;网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为6Mbps;经验判断和理论分析利用前两个步骤收集到的数据,并根据自己以往的故障排除经验和所掌握的互连网络设备和协议的知识,来确定一个排错范围。通过范围的划分,就只需注意某一故障或与故障情况相关的那一部分产品

12、、介质和主机。如上述案例:我们现在能够确定是一个网络性能下降问题。那么,是网段的性能问题?是中间网云的性能问题?是网段的性能问题呢?由于网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps这一事实,我们可以排除掉网段的性能问题。各种可能原因列表该步骤列出根据经验判断和理论分析后总结的各种可能原因。如上述案例,可能原因如下:网段的性能问题,其子原因可能为:日志服务器A的性能问题网络的网关性能问题网络本身的性能问题网云性能问题,主要是到网络的路由不是最佳路由对每一原因实施排错方案根据所列出的可能原因制定故障排查计划,分析最有可能的原因,确定一次只对一个变量进行操作,这种方法使你能够重现某一

13、故障的解决办法。如果有多个变量同时被改变,而问题得以解决,那么如何判断哪个变量导致了故障发生呢?说明:我们在对故障处理流程5、6、7步骤介绍完毕后,再继续进行上述实例案例的排错步骤介绍。观察故障排查结果当我们对某一原因执行了排错方案后,需要对结果进行分析,判断问题是否解决,是否引入了新的问题。如果问题解决,那么就可以直接进入文档化过程;如果没有解决问题,那么就需要再次循环进行到故障排查过程。循环进行故障排查过程当实施了一个方案没有达到预期的排错目的时,我们进入到该步骤这是一个努力缩小可能原因的清单过程。在进行下一循环之前必须做的事情就是将网络恢复到实施上一方案前的状态。如果保留上一方案对网络的

14、改动,很可能导致新的问题,例如:假设修改了访问列表但没有产生预期的结果,此时如果不将访问列表恢复到原始状态,就会导致出现不可预期的结果。循环排错可以有两个切入点:当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可能原因制定排错方案并实施;当所有可能原因列表的排错方案均没有达到排错目的,重现进行故障相关信息收集以分析新的可能原因。如上述案例,我们在列出了可能原因列表后,开始制定方案进行故障排除。可能原因1:“网络到网络的路由不是最佳路由”制定的方案:在网段的网关上使用“Tracert 53”命令,发现探测报文返回时长仅为10ms,表明该可能原因并不是造成故障的原因。我们进入循环排错过程

15、。可能原因2:“日志服务器A的性能问题”制定的方案:测试同一网段的主机C和日志服务器间的FTP传输速度,是6Mbps,正常。可见问题与服务器A无关。可能原因3:“网络的网关性能问题”制定的方案:测试主机C和备份服务器B间FTP传输速度是7Mbps,正常。排除了网关因素,因为B、C在不同网段上而速度正常。可能原因3:“网络本身的性能问题”制定的方案:在网段的以太网交换机上使用命令“Show mac”,输出如下:Port Rcv-Unicast Rcv-Multicast Rcv-Broadcast 6/32 10317812 0 8665Port Xmit-Unicast Xmit-Multic

16、ast Xmit-Broadcast 6/32 6667987 286652 2474038(输出的广播:输出的单播比例为1:3,太大了。)Port Rcv-Octet Xmit-Octet 6/321516443041在网段上的以太网交换机上使用命令“Show mac”输出如下:Port Rcv-Unicast Rcv-Multicast Rcv-Broadcast 6/36 55780287 0 285Port Xmit-Unicast Xmit-Multicast Xmit-Broadcast 6/36 27879749 190257 119430(广播:单播比

17、例1:270,属于正常。)Port Rcv-Octet Xmit-Octet 6/36 67172587081 4998816809由此知道,网段上广播包和单播包比例为1:3,确实太大了。再次询问用户该网段主要运行的业务是什么,从而得出了故障最终原因如下:是普通用户网段,由于业务原因每个用户需要发送大量广播包和多播包,随着近期越来越多的用户接入该网络,在这个网段上的服务器需要花费更多的资源来处理越来越多的广播和多播包,因此其服务的传输速度自然减慢。由于这是一个网络布局不恰当的问题,于是重新安排服务器的位置,将服务器移动网段后,故障排除。故障排除过程文档化当最终排除了网络故障后,那么排除流程的最

18、后一步就是对所做的工作进行文字记录。文档化过程决不是一个可有可无的工作,原因如下:文档是排错宝贵经验的总结,是 “经验判断和理论分析”这一过程中最重要的参考资料;文档记录了这次排错中网络参数所做的修改,这也是下一次网络故障应收集的相关信息。文档记录主要包括以下几个方面:故障现象描述及收集的相关信息网络拓扑图绘制网络中使用的设备清单和介质清单网络中使用的协议清单和应用清单故障发生的可能原因对每一可能原因制定的方案和实施结果本次排错的心得体会其他:如排错中的使用的参考资料列表等请读者对照上述案例完成文档记录工作。华为中低端路由器产品介绍如图1-2所示,Quidway系列路由器依托华为公司拥有自主知

19、识产权的VRP(Versatile Routing Platform,通用路由平台)软件平台,使用高性能的处理器、总线技术及快速路由策略,为电信、专网、ISP、金融、税务、公安、铁路等行业用户和大中型企业用户提供从中低端、高端到核心端的全方位的网络解决方案。华为IP网络产品线Quidway NetEngine80是面向电信级运营网络及骨干核心网络的GSR路由器,以满足核心网络高速转发数据的需求并实现不同业务的不同级别服务。Quidway NetEngine16/08是面向运营级核心网络的高端网络产品,是具有高性能、高可靠性、高可扩展性、多业务的边缘交换层的高端路由器。本书所举的故障排除案例分析

20、主要是针对Quidway中低端路由器的系列产品,下面将详细介绍一下华为中低端路由器系列产品的特性。华为中低端路由器产品主要包括:Quidway 1600系列低端路由器Quidway 2500系列低端路由器Quidway 1700系列低端路由器Quidway 2600系列中端路由器Quidway 3600系列中端路由器Quidway R1600系列低端路由器Quidway R1600系列路由器包括R1602、R1603和R1604三款路由器,是华为公司面向家庭办公、小型办公室(SOHO)开发的新一代路由器产品,主要应用于企业上网、家庭办公、公司远程机构互连和Internet上网等。Quidway

21、 R1602路由器定位为桌面级远程分支路由器。采用M68360 33M RISC CPU;提供1个10Base-T、2个同/异步串口(可达2Mbps)、1个AUX口。Quidway R1603/1604路由器定位为桌面级分支ISDN接入路由器。采用M68360 33M RISC CPU;提供1个10Base-T、1个ISDN BRI接口(R1603提供BRI S/T接口,R1604提供BRI U接口)、1个同/异步串口(可达2Mbps)、1个AUX口和2个模拟电话接口。Quidway R2500系列低端路由器Quidway R2500系列路由器包括R2501/2501E、R2509/2509E

22、、 R2511/2511E、 R4001/4001E八款路由器。是华为公司面向中、小型办公室开发的新一代路由器产品,主要应用于电信记费、电信网管、机构互连、Internet访问、电信设备配套IP接入网关等。Quidway R2501路由器定位为网络远程分支路由器。采用M68360 25M RISC CPU;提供1个10Base-T、1个以太网口、2个高速同/异步串口、1个AUX口。Quidway R2509/R2511路由器定位为网络远程分支接入路由器。采用M68360 33M RISC CPU;提供1个10Base-T、1个以太网口、2个高速同/异步串口、1个AUX口、1/2个8异步串行口;

23、可作为小企业PSTN接入服务器。Quidway R4001路由器定位为企业级分支路由器。采用M68360 33M RISC CPU;提供1个10Base-T;1个AUI口;1个高速同/异步串口、1个AUX口、1个E1/CE1/PRI接口。可作为企业ISDN接入服务器使用;它是以低端产品价格提供E1接口的路由器,具有超高性价比。Quidway R2500E系列路由器(R2501E、R2509E、R2511E、R4001E)内置一个接口插槽,可以插入128位以上硬件序列码加密的加密板,升级为一台高性能边缘加密路由器。应用于需要数据保密领域,如:安全办公、机要部门等特殊应用;去掉加密卡就是普通路由器

24、。Quidway R1700系列低端路由器QuidwayR1700系列路由器目前有R1760一款,是华为公司最新开发的边缘接入路由器。它采用模块化结构,在提供了集成的快速以太网接口、AUX口和同/异步串口的同时,又提供了丰富的可选配的智能接口卡SIC(Smart Interface Card,智能接口卡)及多功能接口模块MIM(Multifunctional Interface Module,多功能接口模块)。与同类产品相比,R1760模块化路由器具有更高的性能价格比和可扩展能力,既适合于在一些大的分支机构担当接入路由器,也可以在中小型企业网中担当核心路由器。R1760路由器采用MPC8241

25、 200MHz高速CPU,提供的网络接口和插槽数量如下:三个固定的网络接口,包括1个10/100M以太网口、一个AUX口和1个同/异步串口;三个插槽,包括1个MIM插槽和2个SIC插槽。R1760路由器支持多种SIC和MIM,其中SIC是R1760路由器特有的智能接口卡,MIM是R1760/2600/3600路由器共用的多功能接口模块,用户可以通过更换或扩展接口卡及接口模块的方法满足未来变化的需求。SIC的种类如下:1端口10/100M以太网接口卡(SIC-1FEA)1端口多协议同/异步串口接口卡(SIC-1SA)3端口异步串口接口卡(SIC-3AS)1端口ISDN BRI S/T接口卡(SI

26、C-1BS)2端口ISDN BRI S/T接口卡(SIC-2BS)1端口ISDN BRI U接口卡(SIC-1BU)2端口ISDN BRI U接口卡(SIC-2BU)1端口E1/CE1/ PRI兼容接口卡(SIC-EPRI)1端口T1/CT1/ PRI兼容接口卡(SIC-TPRI)1端口模拟调制解调器接口卡(SIC-1AM)2端口模拟调制解调器接口卡(SIC-2AM)1端口语音用户电路接口卡(SIC-1FXS)2端口语音用户电路接口卡(SIC-2FXS)1端口语音AT0模拟中继接口卡(SIC-1FXO)2端口语音AT0模拟中继接口卡(SIC-2FXO)MIM的种类请参阅下文Quidway R2

27、600/R3600中端路由器的相关介绍。Quidway R2600系列和R3600系列中端路由器Quidway R2600系列和Quidway R3600系列路由器是华为公司面向企业级的网络产品。其中,Quidway R2600系列路由器部分采用模块化结构,在提供集成的高速以太网接口和同步串口同时,还具有丰富的可选配模块。Quidway R3600系列路由器则完全采用模块化结构。Quidway R2620系列Quidway R2620系列路由器包含两款:R2620和R2621。 R2620系列路由器既可在中小型企业网中担当核心路由器,也可在一些大的分支机构担当接入路由器。R2620系列路由器提

28、供的网络接口和模块插槽数量如下:R2620提供1个固定的10/100M以太网口、2个固定的同步串口和2个标准的MIM模块插槽。R2621提供2个固定的10/100M以太网口、2个固定的同步串口和2个标准的MIM模块插槽。Quidway R2630系列Quidway R2630系列路由器包含四款:R2630、R2631、R2630E、R2631E。与R2620系列相比,R2630系列路由器具有更灵活的配置方式和更高的处理能力。既适合于在中小型企业网中担当核心路由器,也可在一些大的分支机构担当接入路由器。R2630系列路由器提供的固定网络接口与模块插槽数量如下:R2630、R2630E:1个固定的

29、10/100M以太网口和3个标准的MIM模块插槽。R2631、R2631E:2个固定的10/100M以太网口和3个标准的MIM模块插槽。Quidway R3600系列Quidway R3600系列路由器包含四款: R3640、 R3680、 R3640E、 R3680E。面向企业级网络的产品,和R2620、R2630系列相比, R3600系列路由器具有更高的处理能力和更大的接入密度。 R3600系列路由器既适合于在中小型企业网中担当核心路由器,也可以在大型网络中担当汇聚层路由器。R3600系列路由器提供的模块插槽数量如下:R3640、R3640E提供4个标准的MIM模块插槽。R3680、R36

30、80E提供8个标准的MIM模块插槽。Quidway R1760/R260/R3600系列路由器支持的模块种类1端口10Base-T/100Base-TX快速以太网接口模块(1FE)2端口10Base-T/100Base-TX快速以太网接口模块(2FE)2端口高速同/异步串口模块(2SA)4端口高速同/异步串口模块(4SA)8端口低速同/异步串口模块(8LSA)2端口同/异步串口 + 1端口ISDN BRI S/T接口模块(2S1B)1端口可拆分通道化cE1/PRI模块(1E1)2端口可拆分通道化cE1/PRI模块(2E1)4端口可拆分通道化cE1/PRI模块(4E1)4端口ISDN BRI S

31、/T接口模块(4BS)8端口异步串口模块(8AS)16端口异步串口模块(16AS)2端口语音模块(FXS接口)(2FXS)2端口语音模块(FXO接口)(2FXO)2端口语音模块(E&M接口)(2E&M)4端口语音模块(FXS接口)(4FXS)4端口语音模块(FXO接口)(4FXO)4端口语音模块(E&M接口)(4E&M)1端口E1语音模块(E1VI)路由器常用诊断工具介绍华为Quidway 系列路由器提供了一套完整的命令集,可以用于监控网络互联环境的工作状况和解决基本的网络故障。主要包括以下命令:Ping命令Tracert命令说明:由于上面命令不仅是Quidway系列路由器VRP平台的常用网络

32、命令,也是windows平台上常用的网络命令,所以本手册对两种平台下的命令使用均进行介绍。Show命令Clear命令Debug命令Ping命令原理:“ping”这个词源于声纳定位操作,指来自声纳设备的脉冲信号。Ping命令的思想与发出一个短促的雷达波,通过收集回波来判断目标很相似;即源站点向目的站点发出一个ICMP Echo Request报文,目的站点收到该报文后回一个ICMP Echo Reply报文,这样就验证了两个节点间IP层的可达性表示了网络层是连通的。功能Ping命令用于检查IP网络连接及主机是否可达。VRP平台的ping命令在Quidway系列路由器上,Ping命令的格式如下:P

33、ing -c number -tnumber -s number ip-address-c Ping报文的个数,缺省值为5;-t 设置Ping报文的超时时间,单位为毫秒,缺省值为2000;-s 设置Ping报文的大小,以字节为单位,缺省值为56。说明:实际上Quidway系列路由器Ping命令的参数非常多,这里只介绍其中最重要的三个参数。其他参数介绍请参考VRP用户手册命令参考。例如,向主机发出2个8100字节的Ping报文Quidway# ping -c 2 -s 8100 PING: 8100 data bytes, press CTRL_C to break Reply from : b

34、ytes=8100 Sequence=0 ttl=123 time = 538 ms Reply from : bytes=8100 Sequence=1 ttl=123 time = 730 ms ping statistics 2 packets transmitted 2 packets received 0.00% packet loss round-trip min/avg/max = 538/634/730 ms Windows平台的Ping命令在PC机上或Windwos NT为平台的服务器上,Ping命令的格式如下:Ping -n number -t -l number ip-a

35、ddress-n Ping报文的个数,缺省值为5;-t 持续地ping 直到人为地中断,Ctr+Breack暂时中止ping命令并查看当前的统计结果,而Ctr+C则中断命令的执行。-l 设置Ping报文所携带的数据部分的字节数,设置范围从0至65500。例:向主机 发出2个数据部分大小为 3000 Bytes的ping报文C:ping -l 3000 -n 2 Pinging with 3000 bytes of dataReply from : bytes=3000 time=321ms TTL=123Reply from : bytes=3000 time=297ms TTL=123Pin

36、g statistics for : Packets: Sent = 2, Received = 2, Lost = 0 (0% loss),Approximate round trip times in milli-seconds: Minimum = 297ms, Maximum = 321ms, Average = 309ms说明:实际上Windows平台的Ping命令的参数非常多,这里只介绍其中最重要的三个参数。其他参数介绍请参考Windows在线帮助。巧用Ping命令进行故障排除案例一:连通性问题还是性能问题?案例描述工程师小L,在配置完一台路由器之后执行Ping命令检测链路是否通畅

37、。发现5个报文都没有Ping通,于是检查双方的配置命令并查看路由表,却一直没有找到错误所在。最后又重复执行了一遍相同的Ping命令,发现这一次5个报文中有1个Ping 通了原来是线路质量不好存在比较严重的丢包现象。工程师小L又配置了一台路由器,然后执行Ping命令访问Internet上某站点的IP地址,但没有Ping通。有了上次的教训小L,再一次Ping了20个报文,仍旧没有响应。于是小L断定是网络故障。但是在费劲周折检查了配置链路之后仍没有发现任何可疑之处,最后小L采取逐段检测的方法对链路中的网关进行逐级测试,发现都可以Ping 通,但是响应的时间越来越长,最后一个网关的响应时间在1800m

38、s左右。会不会是由于超时而导致显示为Ping 不同呢?受此启发,小L将Ping 命令报文的超时时间改为4000ms,这次成功Ping通了,显示所有的报文响应时间都在2200ms 左右。建议和总结:真的是Ping不通吗?这个问题需要定位清楚,因为连通性问题和性能问题排错的关注点是不一样的问题定位错误必然会导致排错过程的周折。使用一般的Ping命令,缺省是发送5个报文的,超时时长是2000ms。如果Ping不通情况发生,最好能够再用带参数-c和-t的Ping命令再执行一遍,如:Ping -c 20 -t 4000 ip-address,即连续发送20个报文,每个报文的超时时长为4000ms,这样一

39、般可以判断出到底是连通性问题还是性能问题。案例二:使用大包ping对端进行MTU不一致的故障排除现象描述:某次开局,使用Quidway路由器与其他厂商的某路由器互连,并运行OSPF协议。数据配置完毕后,一切正常,并在今后相当长的时间内设备运转稳定。但两个月后,用户反馈网络中断。相关信息显示:登录到两台路由器上,发现双方连接正常,可以相互Ping通对端地址。但OSPF协议中断;登录Quidway路由器查看邻居状态,发现邻居状态机处于Exstart状态。打开相应的debug开关查看相应的报文信息,发现双方都可以收到Hello报文,但Quidway路由器发送DD报文后,一直没有收到对方回应的DD报文

40、;登录其他厂商的那台路由器,打开相应的debug开关,发现对方收到Quidway路由器发送的DD报文后,一发送了相应的DD报文予以回应。原因分析:初步断定,Quidway路由器没有收到DD回应报文,但对方确实发出来了。既然可以接收到HELLO 报文说明链路是通畅的,而且多播报文的收发也没有问题。那么有可能是对方发送的DD 报文有错误导致Quidway路由器拒收,但查看相应的信息,并没有报告接收到错误的DD 报文。仔细查看某厂商路由器的调试信息发现这个DD报文很大有2000 多字节。会不会是由于报文太大导致的问题呢?试着Ping了一个2000字节的报文,结果不通。那么故障原因很可能是由于双方的M

41、TU不一致导致大包不通。处理过程:检查配置,发现对方路由器的MTU设置为4000多而Quidway路由器的MTU设置为1500,于是修改对端路由器的MTU为1500。故障排除。那么为什么工程初期没有问题呢?这是因为前期DD报文长度小于1500字节,而后来网络扩容导致路由信息过多使DD 报文的长度超过了1500 字节。建议和总结:由于Ping 缺省报文是56 个字节,所以显示的Ping 通信息只是表示56字节的报文可以通而并不一定表示其他大小的报文仍旧可以通。所以,应当善于使用Ping的其他参数来进行故障排除。案例三:A能Ping通B,B就一定能Ping通A吗?现象描述组网图如下:案例:A能Pi

42、ng通B,B就一定能Ping通A吗?在RouterA上配置一条指向/8的静态路由:RouterA(config)# ip route 在RouterA 上Ping RouterB 的以太网地址,显示可以正常Ping通;但是在RouterB上Ping RouterA的以太网地址,却无法Ping通。原因分析:由于在RouterB 上却没有相应的配置到/8 路由,所以从RouterB 上Ping不通RouterA的以太网口 。但是为何在A上可以Ping 通 呢?同样是没有回程路由呀?打开路由器上的IP报文调试开关发现,原来从RouterA上发出的ICMP报文的源地址填写的是而不是,由于两台路由器的s

43、0口处于同一网段,所以响应报文可以顺利到达RouterB。建议和总结:A能够Ping通B则B一定能够Ping通A(不考虑防火墙的因素),这句话的对错取决于A和B到底是指主机还是指路由器。如果是指两台主机,那么这句话就是正确的。如果是指两台路由器那就是错误的,因为路由器通常会有多个IP地址。现在就有如下问题:当从一台路由器上执行Ping命令它发出的ICMP Echo报文的源地址究竟选择哪一个呢?实际情况是路由器选择发出报文的接口的IP地址。Tracert 命令原理Tracert是为了探测源节点到目的节点之间数据报文所经过的路径。利用IP报文的TTL域在每经过一个路由器的转发后减一,当TTL=0时

44、则向源节点报告TTL超时这个的特性。Tracert首先发送一个TTL为1的UDP报文,因此第一跳发送回一个ICMP错误消息以指明此数据报不能被发送(因为TTL超时),之后Tracert再发送一个TTL为2的报文,同样第二跳返回TTL超时,这个过程不断进行,直到到达目的地,此时由于数据报中使用了无效的端口号(缺省为33434)此时目的主机会返回一个ICMP的目的地不可达消息,表明该Tracert操作结束。Tracert记录下每一个ICMP TTL超时消息的源地址,从而提供给用户报文到达目的地所经过的网关IP地址。功能Tracert 命令用于测试数据报文从发送主机到目的地所经过的网关,主要用于检查

45、网络连接是否可达,以及分析网络什么地方发生了故障。VRP平台的Tracert命令在华为Quidway系列路由器上,Tracert命令的格式如下:Tracert -a ip-address -ffirst_TTL -m max_TTL -p port -q nqueries -wtimeout host-a 指定一个发送UDP报文的源地址;-f 指定初始报文的TTL大小,缺省值为1;-m 指定最大TTL大小,缺省值为30;-p 目的主机的端口号,缺省值为33434;-q 每次发送的探测报文的个数,缺省值为3;-w 指明UDP报文的超时时间,单位为毫秒,缺省值为5000。例如:查看到目的主机 中间

46、所经过的网关。Quidway# tracert traceroute to () 30 hops max,40 bytes packet 1 1 4 ms 5 ms 5 ms 2 4 10 ms 5 ms 5 ms 3 54 10 ms 5 ms 5 ms 4 77 175 ms 160 ms 145 ms 5 54 185 ms 210 ms 260 ms 6 230 ms 185 ms 220 ms Windows平台的Tracert 命令在PC机上或Windwos NT为平台的服务器上,Tracert命令的格式如下:tracert -d -hmaximum_hops -jhost-lis

47、t -wtimeout host-d 不解析主机名;-h 指定最大TTL大小;-j 设定松散源地址路由列表;-w 用于设置UDP报文的超时时间,单位毫秒;例如:查看到目的主机 中间所经过的前两个网关。C:tracert -h 2 Tracing route to over a maximum of 2 hops: 1 3 ms 2 ms 2 ms 2 5 ms 3 ms 2 ms 4Trace complete.使用Tracert命令进行故障排除案例一:使用Tracert命令定位不当的网络配置点现象描述组网情况如下图所示:案例:使用Tracert命令定位不当的网络配置点某校园网中,Router

48、B和RouterC同属于一个运行RIPv2路由协议的网络,主机访问数据库服务器,用户抱怨访问性能差。相关信息显示登录到RouterC,使用带参数的Ping远端服务器,显示如下:RouterC#ping -c 10 -s 4000 -t 6000PING: 4000 data bytes, press CTRL_C to break Reply from : bytes=4000 Sequence=0 ttl=249 time = 552 ms Reply from : bytes=4000 Sequence=1 ttl=249 time = 5733 ms Reply from : bytes

49、=4000 Sequence=2 ttl=249 time = 552 ms Reply from : bytes=4000 Sequence=3 ttl=249 time = 5714 ms Reply from : bytes=4000 Sequence=4 ttl=249 time = 552 ms Reply from : bytes=4000 Sequence=5 ttl=249 time = 5711 ms Reply from : bytes=4000 Sequence=6 ttl=249 time = 552 ms Reply from : bytes=4000 Sequenc

50、e=7 ttl=249 time = 5709 ms Reply from : bytes=4000 Sequence=8 ttl=249 time = 552 ms Reply from : bytes=4000 Sequence=9 ttl=249 time = 5710 ms原因分析上面的Ping显示出一个规律:奇数报文的返回时长短,而偶数报文返回时长很长(是奇数报文的10倍多)。可以初步判断奇数报文和偶数报文是通过不同的路径传输的。现在我们需要使用Tracert命令来追踪这不同的路径。在RouterC上,Tracert远端RouterA的以太网接口。RouterC(config)#tr

51、acert -q 8 traceroute to () 30 hops max,40 bytes packet 1 6 ms 4 ms 4 ms 4 ms 4 ms 4 ms 4 ms 4 ms 。(中间省略) 20 ms 16 ms 15ms 16 ms 16 ms 16 ms 16 ms 16 ms 30 ms 278 ms 25 ms 279 ms 25 ms 278 ms 25 ms 277 msRouterC(config)#从上面的显示可看到,直至,UDP探测报文的返回时长都基本一致,而到时,则发生明显变化,呈现奇数报文时长短,偶数报文时长长的现象。于是判断,问题发生在Router

52、B和RouterA之间。通过询问该段网络的管理员,得知这两路由器间有一主一备两串行链路,主链路为2.048Mbps(s0口之间),备份链路为128Kbps(s1口之间)。网络管理员在此两路由器间配置了静态路由。RouterB上如下配置:RouterB(config)# ip route RouterB(config)# ip route RouterA上如下配置:RouterA(config)# ip route RouterA(config)# ip route 于是问题就清楚了。例如RouterB,由于管理员配置时没有给出静态路由的优先级,这两条路由项的优先级就同为缺省值60,于是就同时出

53、现在路由表中,实现的是负载分担,而不能达到主备的目的。处理过程可以有两种处理方法:继续使用静态路由,进行配置更改RouterB上进行如下更改:RouterB(config)# ip route (主链路仍使用缺省优先级60)RouterB(config)# ip route 100(备份链路的优先级降低至100)RouterA上进行如下更改:RouterA(config)# ip route RouterA(config)# ip route 100这样,只有当主链路发生故障,备份链路的路由项才会出线在路由表中,从而接替主链路完成报文转发,实现主备目的。在两路由器上运行动态路由协议,如IGRP

54、、EIGRP、OSPF等,但不要运行RIP协议(因为RIP协议仅以hop作为Metric的)建议和总结本案例的目的不是为了解释网络配置问题,而是用来展示Ping命令和Tracert命令的相互配合来找到网络问题的发生点。尤其在一个大的组网环境中,维护人员可能无法沿着路径逐机排查,此时,能够迅速定位出发生问题的线路或路由器就非常重要了。案例二:使用Tracert命令发现路由环路现象描述组网情况如下图所示:三台路由器均配置静态路由,完成后,登录到RouterA上Ping主机,发现不通。相关信息显示RouterA#ping -c 6 -t 5000 PING: 56 data bytes, press

55、 CTRL_C to break Request time out Request time out Request time out Request time out Request time out Request time outRouterA# tracert traceroute to () 30 hops max,40 bytes packet 1 6 ms 4 ms 4 ms(RouterB) 2 8 ms 8 ms 8 ms(RouterA) 12 ms 12 ms 12 ms(RouterB) 16 ms 16 ms 16 ms(RouterA)。原因分析从上面的Tracer

56、t命令的显示可以立即发现,在RouterA和RouterB间产生了路由环路。由于是配置的是静态路由,基本可以断定是RouterA或RouterB的静态路由配置错误。检查RouterA的路由表,配置的是缺省静态路由:ip route ,没有问题。检查RouterB的路由表,配置到网络的静态路由为:ip route 下一跳配置的是,而不是。这正是错误所在。处理过程修改RouterB的配置如下:RouterB(config)# no ip route RouterB(config)# ip route 故障排除。建议和总结Tracert命令能够很容易发现路由环路等潜在问题。当路由器A认为路由器B知道

57、到达目的地的路径,而路由器B也认为路由器A知道目的地时,就是路由环路发生了。使用Ping命令只能知道接收端出现超时错误,而Tracert能够立即发现环路所在如果Tracert命令两次或者多次显示同样的接口。当通过Tracert发现路由环路后,如果配置为:静态路由:几乎可以肯定是手工配置有问题,如本案例所示。OSPF协议:可能是地址聚合产生的问题。请参阅相关章节内容。多路由协议:可能是路由引入产生的问题。请参阅相关章节内容。Show命令Show命令是用于了解路由器的当前状况、检测相邻路由器、从总体上监控网络、隔离互连网络中故障的最重要的工具之一。几乎在任何故障排除和监控场合,Show命令都是必不

58、可少的。例如:基于VRP1.6路由平台的Show命令选项如下所示:Quidway#show ? aaa Display AAA information access-list Display access-list structurearp ARP table call-history Display voice port call history client Display current client information clock Display the system clock configfile Show the memory in which config.ini is s

59、tored controller Display an E1/T1 entry crypto Show information about IPSec and crypto map debugging State of each debugging option dialer Dialer parameters and statistics dlsw Data Link Switch Information encrypt-card Show information about encrypt-card firewall Display firewall status frame-relay

60、Frame Relay information ftp-server Ftp server information gateway Display status of gateway gw-h323 Show voice store information history Display the session command history host Display hosts name and IP Address hostname Display hostname interfaces Interface status and configuration ip IP informatio

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论