网络工程网络故障-故障排除概述_第1页
网络工程网络故障-故障排除概述_第2页
网络工程网络故障-故障排除概述_第3页
网络工程网络故障-故障排除概述_第4页
网络工程网络故障-故障排除概述_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(建筑工程管理)网

络工程网络故障T

障排除概述

2020年4月

多年的企业咨询顾问经验,经过实战验I画以落地执行的卓越管理方案,值得您下载陋!

目录

第1章故障排除技术概述1-1

1.1网络故障排除技术概览1-1

LL1在当今日益复杂的网络中进行故障排除1-1

1.1.2网络故障的一般分类1-2

1.1.3一般网络故障的解决步骤1-2

1.2华为中低端路由器产品介绍1-8

l.l.lQuidwayR1600系列低端路由器1-9

1.1.2QuidwayR2500/4000系列低端路由器1-9

1.1.3QuidwayR1700系列低端路由器1-10

1.1.4QuidwayR2600系列和R3600系列中端路由器1-11

1.3路由器常用诊断工具介绍1-13

131Ping命令1-13

1.1.2Tracert命令1-18

1.1.3Show命令1-23

1.1.4Clear命令1-29

1.1.5Debug命令1-30

1.4故障排除常用方法1-34

1.4.1分层故障排除法1-34

1.1.2分块故障排除法1-35

1.1.3分段故障排除法1-36

1.1.4替换法1-37

1.5故障排除对网络维护和管理人员的要求1-37

1.5.1对协议要求有精深的理解1-37

1.5.2能够引导客户详细描述出故障现象和相关信息1-38

1.5.3充分了解自己所管理和维护的网络1-40

1.5.4及时进行故障排除的文档记录和经验总结1-42

1.6华为数据通信产品故障排除资源1-42

l.l.lHuaweiDatacommOnlinel-42

1.1.2HuaweiTechnicalSupportl-43

第1章故障排除技术概述

1.1网络故障排除技术概览

1.1.1在当今日益复杂的网络中进行故障排除

当今的网络互连环境是复杂的,而且其复杂性的日益增长也是可以预见

的,主要原因如下:

•现代的互连网络要求支持更广泛的应用,包括数据、语音、视频及它

们的集成传输;

・新业务发展使网络带宽的需求不断增长,这就要求新技术的不断出现。

例如:十兆以太网向百兆、千兆以太网的演进;MPLS技术的出现;

提供QoS能力等。

・新技术的应用同时还要兼顾传统的技术。例如,传统的SNA体系结

构仍在某些场合使用,DLSw作为通过TCP/IP承载SNA的一种技术

而被应用。

图1-1多样业务的需求和各种先进技术的引入使网络日益复杂

因此,现代的互连网络是协议、技术、介质和拓扑的混合体。互连网络环

境越复杂,意味着网络的连通性和性能故障发生的可能性越大,而且引发

故障的原因也越发难以确定。同时,由于人们越来越多的依赖网络处理日

常的工作和事务,一旦网络故障不能及时修复,其所造成的损失可能很大

甚至是灾难性的。

能够正确地维护网络尽量不出现故障,并确保出现故障之后能够迅速、准

确地定位问题并排除故障,对网络维护人员和网络管理人员来说是个挑

战,这不但要求他们对网络协议和技术有着深入的理解,更重要的是要建

立一个系统化的故障排除思想并合理应用于实际中,以将一个复杂的问题

隔离、分解或缩减排错范围,从而及时修复网络故障。

本书着眼于帮助网络维护人员和管理人员将他们所掌握的知识有条理的

应用于诊断和排除网络故障的过程中,•帮助他们针对各种网络环境中的常

见故障现象进行定位和解决。

1.1.2网络故障的一般分类

网络故障一般分为两大类:连通性问题和性能问题。它们各自故障排除的

关注点如下:

・连通性问题

硬件、媒介、电源故障

配置错误

不正确的相互作用

・性能问题

网络拥塞

到目的地不是最佳路由

供电不足

路由环路

网络错误

1.1.3一般网络故障的解决步骤

故障排除系统化是合理地一步一步找出故障原因并解决的总体原则。它的

基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔

离)成几个小的子集,从而使问题的复杂度迅速下降。

故障排除时有序的思路有助于解决所遇到的任何困难,下图给出了一般网

络故障解决的处理流程。

CQ说明:

该处理流程是网络维护人员所能够采用的排错模型中的一种,如果你根据

自己的经验和实践总结了另外的排错模型并证明是行之有效的,请继续使

用它——网络故障解决的处理流程是可以变化的,但故障排除有序化的

思维模式是不可变化的。

图1-2网络故障排除基本步骤

下面我们以一个故障排除的实例来学习如何应用这些步骤。

案例:用户网段广播包过多造成该网段的服务器FTP业务传输速度慢

该案例组网图如下:

某校园网的三个局域网,其中为一个用户网段,18

为一个日志服务器;是一个集中了很多应用服务器的网段。

图1-3用户网段广播包过多造成该网段的服务器FTP业务传输速度慢

1.故障现象描述

要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现

象,然后才能确定可能产生这些现象的故障根源或症结。因此,对网络故

障做出完整、清晰的描述是重要的一步。

如上述案例,用户反映:"日志服务器与备份服务器间备份发生问题。"

这就是一个不完整不清晰的故障现象描述。因为这个描述没有讲述清楚下

列问题:

・这个问题是连续出现,还是间断出现的?

・是完全不能备份,还是备份的速度慢(即性能下降)?

・哪个或哪些局域网服务器受到影响,地址是什么?

正确的故障现象描述是:

在网络的高峰期,日志服务器1到集中备份服务器

53之间进行备份时,FTP传输速度很慢,大约是0.6Mbps。

2.故障案例相关信息收集

本步骤是搜集有助于查找故障原因的更详细的信息。主要是三种途径:

向受影响的用户、网络人员或其他关键人员提出问题;

・根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议

分析仪、相关show和debug命令等;

・测试性能与网络基线进行比较。

如上述案例,可以向用户提问或自行收集下列相关信息:

・网络结构或配置是否最近修改过,即问题出现是否与网络变化有关?

・是否有用户访问受影响的服务器时没有问题?

・在非高峰期日志服务器和备份服务器间FTP传输速度是多少?

通过该步骤,我们收集到了下面一些相关信息:

・最近网段的客户机不断在增加;

・网段的机器与备份服务器间进行FTP传输时速度正常为

7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;

・在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为

6Mbps;

3.经验判断和理论分析

利用前两个步骤收集到的数据,并根据自己以往的故障排除经验和所掌握

的互连网络设备和协议的知识,来确定一个排错范围。通过范围的划分,

就只需注意某一故障或与故障情况相关的那一部分产品、介质和主机。

如上述案例:我们现在能够确定是一个网络性能下降问题。那么,是网段

的性能问题?是中间网云的性能问题?是网段的性

能问题呢?

由于网段的机器与备份服务器间进行FTP传输时速度正常为

7Mbps这一事实,我们可以排除掉网段的性能问题。

4.各种可能原因列表

该步骤列出根据经验判断和理论分析后总结的各种可能原因。

如上述案例,可能原因如下:

(1)网段的性能问题,其子原因可能为:

・日志服务器A的性能问题

・网络的网关性能问题

・网络本身的性能问题

⑵网云性能问题,主要是到网络的路由不是最佳路由

5.对每一原因实施排错方案

根据所列出的可能原因制定故障排查计划,分析最有可能的原因,确定一

次只对一个变量进行操作,这种方法使你能够重现某一故障的解决办法。

如果有多个变量同时被改变,而问题得以解决,那么如何判断哪个变量导

致了故障发生呢?

£3说明:

我们在对故障处理流程5、6、7步骤介绍完毕后,再继续进行上述实例案

例的排错步骤介绍。

6.观察故障排查结果

当我们对某一原因执行了排错方案后,需要对结果进行分析,判断问题是

否解决,是否引入了新的问题。如果问题解决,那么就可以直接进入文档

化过程;如果没有解决问题,那么就需要再次循环进行到故障排查过程。

7.循环进行故障排查过程

当实施了一个方案没有达到预期的排错目的时,我们进入到该步骤--这

是一个努力缩小可能原因的清单过程。

在进行下一循环之前必须做的事情就是将网络恢复到实施上一方案前的

状态。如果保留上一方案对网络的改动,很可能导致新的问题,例如:假

设修改了访问列表但没有产生预期的结果,此时如果不将访问列表恢复到

原始状态,就会导致出现不可预期的结果。

循环排错可以有两个切入点:

・当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可

能原因制定排错方案并实施;

・当所有可能原因列表的排错方案均没有达到排错目的,重现进行故障

相关信息收集以分析新的可能原因。

如上述案例,我们在列出了可能原因列表后,开始制定方案进行故障排除。

⑴可能原因1:“网络到网络的路由不是最佳

路由"

制定的方案:在网段的网关上使用"Tracertl53"

命令,发现探测报文返回时长仅为10ms,表明该可能原因并不是造成故

障的原因。

我们进入循环排错过程。

⑵可能原因2:"日志服务器A的性能问题"

制定的方案:测试同一网段的主机C和日志服务器间的FTP传输速度,

是6Mbps,正常。可见问题与服务器A无关。

(3)可能原因3:"网络的网关性能问题”

制定的方案:测试主机C和备份服务器B间FTP传输速度是7Mbps,正

常。排除了网关因素,因为B、C在不同网段上而速度正常。

(4)可能原因3:"网络本身的性能问题"

制定的方案在网段的以太网交换机上使用命令"Showmac",

输出如下:

PortRcv-UnicastRcv-MulticastRcv-Broadcast

6/321031781208665

PortXmit-UnicastXmit-MulticastXmit-Broadcast

6/3266679872866522474038

(输出的广播:输出的单播比例为1:3,太大了。)

PortRcv-OctetXmit-Octet

6/32140948293581516443041

在网段上的以太网交换机上使用命令"Showmac"输出如下:

PortRcv-UnicastRcv-MulticastRcv-Broadcast

6/36557802870285

PortXmit-UnicastXmit-MulticastXmit-Broadcast

6/3627879749190257119430

(广播:单播比例二1:270,属于正常。)

PortRcv-OctetXmit-Octet

6/36671725870814998816809

由此知道,网段上广播包和单播包比例为1:3,确实太大了。

再次询问用户该网段主要运行的业务是什么,从而得出了故障最终原因如

下:是普通用户网段,由于业务原因每个用户需要发送大量广

播包和多播包,随着近期越来越多的用户接入该网络,在这个网段上的服

务器需要花费更多的资源来处理越来越多的广播和多播包,因此其服务的

传输速度自然减慢。

由于这是一个网络布局不恰当的问题,于是重新安排服务器的位置,将服

务器移动网段后,故障排除。

8.故障排除过程文档化

当最终排除了网络故障后,那么排除流程的最后一步就是对所做的工作进

行文字记录。文档化过程决不是一个可有可无的工作,原因如下:

・文档是排错宝贵经验的总结,是“经验判断和理论分析"这一过程中

最重要的参考资料;

・文档记录了这次排错中网络参数所做的修改,这也是下一次网络故障

应收集的相关信息。

文档记录主要包括以下几个方面:

・故障现象描述及收集的相关信息

・网络拓扑图绘制

・网络中使用的设备清单和介质清单

网络中使用的协议清单和应用清单

故障发生的可能原因

・对每一可能原因制定的方案和实施结果

・本次排错的心得体会

・其他:如排错中的使用的参考资料列表等

请读者对照上述案例完成文档记录工作。

1.2华为中低端路由器产品介绍

如图1-2所示,Quidway系列路由器依托华为公司拥有自主知识产权的

VRP(VersatileRoutingPlatform,通用路由平台)软件平台,使用高性

能的处理器、总线技术及快速路由策略,为电信、专网、ISP、金融、税

务、公安、铁路等行业用户和大中型企业用户提供从中低端、高端到核心

端的全方位的网络解决方案。

图1-4华为IP网络产品线

QuidwayNetEngine80是面向电信级运营网络及骨干核心网络的GSR路

由器,以满足核心网络高速转发数据的需求并实现不同业务的不同级别服

务。

QuidwayNetEnginel6/08是面向运营级核心网络的高端网络产品,是具

有高性能、高可靠性、高可扩展性、多业务的边缘交换层的高端路由器。

本书所举的故障排除案例分析主要是针对Quidway中低端路由器的系列

产品,下面将详细介绍一下华为中低端路由器系列产品的特性。

华为中低端路由器产品主要包括:

・Quidwayl600系列低端路由器

•Quidway2500系列低端路由器

・Quidwayl700系列低端路由器

・Quidway2600系列中端路由器

・Quidway3600系列中端路由器

1.2.1QuidwayR1600系列低端路由器

QuidwayR1600系列路由器包括R1602、R1603和R1604三款路由器,

是华为公司面向家庭办公、小型办公室(SOHO)开发的新一代路由器产

品,主要应用于企业上网、家庭办公、公司远程机构互连和Internet上网

等。

QuidwayR1602路由器定位为桌面级远程分支路由器。采用

M6836033MRISCCPU;提供1个10Base-T、2个同/异步串口(可达

2Mbps)、1个AUX口。

QuidwayR1603/1604路由器定位为桌面级分支ISDN接入路由器。采用

M6836033MRISCCPU提供1个10Base-T、1个ISDNBRI接口(R1603

提供BRIS/T接口,R1604提供BRIU接口)、1个同/异步串口(可达

2Mbps),1个AUX口和2个模拟电话接口。

1.2.2QuidwayR2500系歹加氐端路由器

系列路由器包括、

QuidwayR2500R2501/2501ExR2509/2509E

R2511/2511E,R4OO1/4OO1E八款路由器。是华为公司面向中、小型办

公室开发的新一代路由器产品,主要应用于电信记费、电信网管、机构互

连、Internet访问、电信设备配套IP接入网关等。

QuidwayR2501路由器定位为网络远程分支路由器。采用

M6836025MRISCCPU;提供1个10Base-T、1个以太网口、2个高速

同/异步串口、1个AUX口。

QuidwayR2509/R2511路由器定位为网络远程分支接入路由器。采用

M6836033MRISCCPU;提供1个10Base-T、1个以太网口、2个高速

同/异步串口、1个AUX口、1/2个8异步串行口;可作为小企业PSTN

接入服务器。

QuidwayR4001路由器定位为企业级分支路由器。采用

M6836033MRISCCPU;提供1个10Base-T;1个AUI口;1个高速同

/异步串口、1个AUX口、1个E1/CE1/PRI接口。可作为企业ISDN接

入服务器使用;它是以低端产品价格提供E1接口的路由器,具有超高性

价比。

QuidwayR2500E系列路由器(R2501E、R2509E、R2511E、R4001E)

内置一个接口插槽,可以插入128位以上硬件序列码加密的加密板,升级

为一台高性能边缘加密路由器。应用于需要数据保密领域,如:安全办公、

机要部门等特殊应用;去掉加密卡就是普通路由器。

1.2.3QuidwayR1700系列低端路由器

QuidwayR1700系列路由器目前有R1760一款,是华为公司最新开发的

边缘接入路由器。它采用模块化结构,在提供了集成的快速以太网接口、

AUX口和同/异步串口的同时,又提供了丰富的可选配的智能接口卡SIC

(SmartlnterfaceCard,智能接口卡)及多功能接口模块MIM

(MultifunctionallnterfaceModule,多功能接口模块)„与同类产品相

比,R1760模块化路由器具有更高的性能价格比和可扩展能力,既适合于

在一些大的分支机构担当接入路由器,也可以在中小型企业网中担当核心

路由器。

R1760路由器采用MPC8241200MHZ高速CPU,提供的网络接口和插

槽数量如下:

・三个固定的网络接口,包括1个10/100M以太网口、一个AUX口

和1个同/异步串口;

・三个插槽,包括1个MIM插槽和2个SIC插槽。

R1760路由器支持多种SIC和MIM,其中SIC是R1760路由器特有的

智能接口卡,MIM是R1760/2600/3600路由器共用的多功能接口模块,

用户可以通过更换或扩展接口卡及接口模块的方法满足未来变化的需求。

SIC的种类如下:

・1端口10/100M以太网接口卡(SIC-1FEA)

・1端口多协议同/异步串口接口卡(SIC-1SA)

・3端口异步串口接口卡(SIC-3AS)

・1端口ISDNBRIS/T接口卡(SIC-1BS)

・2端口ISDNBRIS/T接口卡(SIC-2BS)

・1端口ISDNBRIU接口卡(SIC-1BU)

・2端口ISDNBRIU接口卡(SIC-2BU)

・1端口E1/CE1/PRI兼容接口卡(SIC-EPRI)

1端口T1/CT1/PRI兼容接口卡(SIC-TPRI)

・1端口模拟调制解调器接口卡(SIC-1AM)

・2端口模拟调制解调器接口卡(SIC-2AM)

・1端口语音用户电路接口卡(SIC-1FXS)

・2端口语音用户电路接口卡(SIC-2FXS)

・1端口语音ATO模拟中继接口卡(SIC-1FX0)

・2端口语音ATO模拟中继接口卡(SIC-2FX0)

MIM的种类请参阅下文QuidwayR2600/R3600中端路由器的相关介绍。

1.2.4QuidwayR2600系列和R3600系列中端路由器

QuidwayR2600系歹怀口QuidwayR3600系歹IJ路由器是华为公司面向企业

级的网络产品。其中,QuidwayR2600系列路由器部分采用模块化结构,

在提供集成的高速以太网接口和同步串口同时,还具有丰富的可选配模

块。QuidwayR3600系列路由器则完全采用模块化结构。

1.QuidwayR2620系歹

QuidwayR2620系列路由器包含两款:R2620和R2621。R2620系歹U路

由器既可在中小型企业网中担当核心路由器,也可在一些大的分支机构担

当接入路由器。

R2620系列路由器提供的网络接口和模块插槽数量如下:

•R2620提供1个固定的10/100M以太网口、2个固定的同步串口和

2个标准的MIM模块插槽。

・R2621提供2个固定的10/100M以太网口、2个固定的同步串口和

2个标准的MIM模块插槽。

2.QuidwayR2630系歹

QuidwayR2630系列路由器包含四款:R2630、R2631、R2630E,

R2631E。与R2620系列相比,R2630系列路由器具有更灵活的配置方式

和更高的处理能力。既适合于在中小型企业网中担当核心路由器,也可在

一些大的分支机构担当接入路由器。

R2630系列路由器提供的固定网络接口与模块插槽数量如下:

•R2630、R2630E:1个固定的10/100M以太网口和3个标准的MIM

模块插槽。

•R2631、R2631E:2个固定的10/100M以太网口和3个标准的MIM

模块插槽。

3.QuidwayR3600系歹[j

QuidwayR3600系列路由器包含四款:R3640、R3680、R3640E、

R3680E。面向企业级网络的产品,和R2620、R2630系列相比,R3600

系列路由器具有更高的处理能力和更大的接入密度。R3600系列路由器既

适合于在中小型企业网中担当核心路由器,也可以在大型网络中担当汇聚

层路由器。

R3600系列路由器提供的模块插槽数量如下:

・R3640、R3640E提供4个标准的MIM模块插槽。

•R3680、R3680E提供8个标准的MIM模块插槽。

4.QuidwayR1760/R260/R3600系列路由器支持的模块种类

・1端口10Base-T/100Base-TX快速以太网接口模块(1FE)

・2端口10Base-T/100Base-TX快速以太网接口模块(2FE)

•2端口高速同/异步串口模块(2SA)

•4端口高速同/异步串口模块(4SA)

・8端口低速同/异步串口模块(8LSA)

•2端口同/异步串口+1端口ISDNBRIS/T接口模块(2S1B)

•1端口可拆分通道化cEl/PRI模块(1E1)

・2端口可拆分通道化cEl/PRI模块(2E1)

・4端口可拆分通道化cEl/PRI模块(4E1)

•4端口ISDNBRIS/T接口模块(4BS)

・8端口异步串口模块(8AS)

・16端口异步串口模块(16AS)

•2端口语音模块(FXS接口)(2FXS)

•2端口语音模块(FXO接口)(2FX。)

・2端口语音模块(E&M接口)(2E&M)

・4端口语音模块(FXS接口)(4FXS)

・4端口语音模块(FXO接口)(4FX0)

•4端口语音模块(E&M接口)(4E&M)

•1端口E1语音模块(E1VI)

1.3路由器常用诊断工具介绍

华为Quidway系列路由器提供了一套完整的命令集,可以用于监控网络

互联环境的工作状况和解决基本的网络故障。主要包括以下命令:

,Ping命令

,Tracert命令

D3说明:

由于上面命令不仅是Quidway系列路由器VRP平台的常用网络命令,也

是windows平台上常用的网络命令,所以本手册对两种平台下的命令使

用均进行介绍。

•Show命令

•Clear命令

•Debug命令

1.3.1Ping命令

1.原理:

"ping"这个词源于声纳定位操作,指来自声纳设备的脉冲信号。Ping

命令的思想与发出一个短促的雷达波,通过收集回波来判断目标很相似;

即源站点向目的站点发出一个ICMPEchoRequest报文,目的站点收到该

报文后回一个ICMPEchoReply报文,这样就验证了两个节点间IP层的

可达性--表示了网络层是连通的。

2.功能

Ping命令用于检查IP网络连接及主机是否可达。

3.VRP平台的ping命令

在Quidway系列路由器上,Ping命令的格式如下:

Ping[~cnumbef\[-tnumbef][-snumber]ip-address

-cPing报文的个数,缺省值为5;

-t设置Ping报文的超时时间,单位为毫秒,缺省值为2000;

-s设置Ping报文的大小,以字节为单位,缺省值为56。

£3说明:

实际上Quidway系列路由器Ping命令的参数非常多,这里只介绍其中

最重要的三个参数。其他参数介绍请参考《VRP用户手册-命令参考》。

例如,向主机发出2个8100字节的Ping报文

Quidway#ping-c2-s8100

PING:8100databytes,pressCTRL_Ctobreak

Replyfroml:bytes=8100Sequence=0ttl=123time=538ms

Replyfroml:bytes=8100Sequence=lttl=123time=730ms

—pingstatistics—

2packetstransmitted

2packetsreceived

0.00%packetloss

round-tripmin/avg/max=538/634/730ms

4.Windows平台的Ping命令

在PC机上或WindwosNT为平台的服务器上,Ping命令的格式如下:

Ping[-nnumbef\[-i\[-\number\ip-address

-nPing报文的个数,缺省值为5;

-t持续地ping直到人为地中断,Ctr+Breack暂时中止ping命令并查看

当前的统计结果,而Ctr+C则中断命令的执行。

-I设置Ping报文所携带的数据部分的字节数,设置范围从0至65500。

例:向主机发出2个数据部分大小为3000Bytes的ping报

C:\>ping-l3000-n

Pinginglwith3000bytesofdata

Replyfroml:bytes=3000time=321msTTL=123

Replyfroml:bytes=3000time=297msTTL=123

Pingstatisticsforl:

Packets:Sent=2,Received=2,Lost=0(0%loss),

Approximateroundtriptimesinmilli-seconds:

Minimum=297ms,Maximum=321ms,Average=309ms

03说明:

实际上Windows平台的Ping命令的参数非常多,这里只介绍其中最重

要的三个参数。其他参数介绍请参考Windows在线帮助。

5.巧用Ping命令进行故障排除

案例一:连通性问题还是性能问题?

(1)案例描述

・工程师小L,在配置完一台路由器之后执行Ping命令检测链路是否通

畅。发现5个报文都没有Ping通,于是检查双方的配置命令并查看

路由表,却一直没有找到错误所在。最后又重复执行了一遍相同的

Ping命令,发现这一次5个报文中有1个Ping通了--原来是线路

质量不好存在比较严重的丢包现象。

・工程师小L又配置了一台路由器,然后执行Ping命令访问Internet

上某站点的IP地址,但没有Ping通。有了上次的教训小L,再一次

Ping了20个报文,仍旧没有响应。于是小L断定是网络故障。但是

在费劲周折检查了配置链路之后仍没有发现任何可疑之处,最后小L

采取逐段检测的方法对链路中的网关进行逐级测试,发现都可以Ping

通,但是响应的时间越来越长,最后一个网关的响应时间在1800ms

左右。会不会是由于超时而导致显示为Ping不同呢?受此启发,小L

将Ping命令报文的超时时间改为4000ms,这次成功Ping通了,显

示所有的报文响应时间都在2200ms左右。

(2)建议和总结:

真的是Ping不通吗?这个问题需要定位清楚,因为连通性问题和性能问

题排错的关注点是不一样的一-问题定位错误必然会导致排错过程的周

折。使用一般的Ping命令,缺省是发送5个报文的超时时长是2000ms。

如果Ping不通情况发生,最好能够再用带参数-c和-t的Ping命令再执

行一遍,如:Ping-c20-t4000ip-address,即连续发送20个报文,每个

报文的超时时长为4000ms,这样一般可以判断出到底是连通性问题还是

性能问题。

案例二:使用大包ping对端进行MTU不一致的故障排除

(1)现象描述:

某次开局,使用Quidway路由器与其他厂商的某路由器互连,并运行

OSPF协议。数据配置完毕后,一切正常,并在今后相当长的时间内设备

运转稳定。但两个月后,用户反馈网络中断。

(2)相关信息显示:

・登录到两台路由器上,发现双方连接正常,可以相互Ping通对端地

址。但OSPF协议中断;

・登录Quidway路由器查看邻居状态,发现邻居状态机处于Exstart

状态。打开相应的debug开关查看相应的报文信息,发现双方都可

以收到Hello报文,但Quidway路由器发送DD报文后,一直没有

收到对方回应的DD报文;

・登录其他厂商的那台路由器,打开相应的debug开关,发现对方收

到Quidway路由器发送的DD报文后,一发送了相应的DD报文予

以回应。

⑶原因分析:

初步断定,Quidway路由器没有收到DD回应报文,但对方确实发出来

了。

既然可以接收到HELLO报文说明链路是通畅的,而且多播报文的收发也

没有问题。那么有可能是对方发送的DD报文有错误导致Quidway路由

器拒收,但查看相应的信息,并没有报告接收到错误的DD报文。

仔细查看某厂商路由器的调试信息发现这个DD报文很大有2000多字

节。会不会是由于报文太大导致的问题呢?试着Ping了一个2000字节

的报文,结果不通。那么故障原因很可能是--由于双方的MTU不一致

导致大包不通。

(4)处理过程:

检查配置,发现对方路由器的MTU设置为4000多而Quidway路由器

的MTU设置为1500,于是修改对端路由器的MTU为1500。故障排除。

那么为什么工程初期没有问题呢?这是因为前期DD报文长度小于1500

字节,而后来网络扩容导致路由信息过多使DD报文的长度超过了1500

字节。

(5)建议和总结:

由于Ping缺省报文是56个字节,所以显示的Ping通信息只是表示56

字节的报文可以通而并不一定表示其他大小的报文仍旧可以通。所以,应

当善于使用Ping的其他参数来进行故障排除。

案例三:A能Ping通B,B就一定能Ping通A吗?

(1)现象描述

组网图如下:

图1-5案例:A能Ping通B,B就一定能Ping通A吗?

在RouterA上配置一条指向/8的静态路由:

RouterA(config)#iproute

在RouterA上PingRouterB的以太网地址222.2,显示可以正常Ping

通;但是在RouterB上PingRouterA的以太网地址,却无法Ping

通。

⑵原因分析:

由于在RouterB上却没有相应的配置到/8路由,所以从RouterB

上Ping不通RouterA的以太网口。

但是为何在A上可以Ping通呢?同样是没有回程路由呀?打开

路由器上的IP报文调试开关发现,原来从RouterA上发出的ICMP报文

的源地址填写的是1.1.L1而不是3.3.33,由于两台路由器的s0口处于

同一网段,所以响应报文可以顺利到达RouterB。

(3)建议和总结:

A能够Ping通B则B一定能够Ping通A(不考虑防火墙的因素),这句

话的对错取决于A和B到底是指主机还是指路由器。

•如果是指两台主机,那么这句话就是正确的。

•如果是指两台路由器那就是错误的,因为路由器通常会有多个IP地

址。现在就有如下问题:当从一台路由器上执行Ping命令它发出的

ICMPEcho报文的源地址究竟选择哪一个呢?实际情况是路由器选择

发出报文的接口的IP地址。

1.3.2Tracert命令

1.原理

Tracert是为了探测源节点到目的节点之间数据报文所经过的路径。利用

IP报文的TTL域在每经过一个路由器的转发后减一,当TTL=0时则向源

节点报告TTL超时这个的特性。Tracert首先发送一个TTL为1的UDP

报文,因此第一跳发送回一个ICMP错误消息以指明此数据报不能被发送

(因为TTL超时),之后Tracert再发送一个TTL为2的报文,同样第二

跳返回TTL超时,这个过程不断进行,直到到达目的地,此时由于数据报

中使用了无效的端口号(缺省为33434)此时目的主机会返回一个ICMP

的目的地不可达消息,表明该Tracert操作结束。Tracert记录下每一个

ICMPTTL超时消息的源地址,从而提供给用户报文到达目的地所经过的

网关IP地址。

2.功能

Tracert命令用于测试数据报文从发送主机到目的地所经过的网关,主要

用于检查网络连接是否可达,以及分析网络什么地方发生了故障。

3.VRP平台的Tracert命令

在华为Quidway系列路由器上,Tracert命令的格式如下:

Tvacev\[-aip-address\[-^first_TTL\[-rx\max_TTL\[-ipporf[[-qnqueries\

[-\Ntimeou^host

-a指定一个发送UDP报文的源地址;

-f指定初始报文的TTL大小,缺省值为1;

-m指定最大TTL大小,缺省值为30;

-P目的主机的端口号,缺省值为33434;

-q每次发送的探测报文的个数,缺省值为3;

-w指明UDP报文的超时时间,单位为毫秒,缺省值为5000。

例如:查看到目的主机中间所经过的网关。

Quidway#tracertl

traceroutetol(10.15.50.l)30hopsmax,40bytespacket

14ms5ms5ms

410ms5ms5ms

35410ms5ms5ms

477175msl60msl45ms

554185ms210ms260ms

6230msl85ms220ms

4.Windows平台的Tracert命令

在PC机上或WindwosNT为平台的服务器上,Tracert命令的格式如下:

tracert[-d][-hmaximum_hops\[-jhost-Hsf[[-wtimeouthost

-d不解析主机名;

-h指定最大TTL大小;

-j设定松散源地址路由列表;

-w用于设置UDP报文的超时时间,单位毫秒;

例如:查看到目的主机中间所经过的前两个网关。

C:\>tracert-h

Tracingroutetoloveramaximumof2hops:

13ms2ms2msl

25ms3ms2msl4

Tracecomplete.

5.使用Tracert命令进行故障排除

案例一:使用Tracert命令定位不当的网络配置点

(1)现象描述

组网情况如下图所示:

图1-6案例:使用Tracert命令定位不当的网络配置点

某校园网中,RouterB和RouterC同属于一个运行RIPv2路由协议的网

络,主机访问数据库服务器,用户抱怨访问性能差。

(2)相关信息显示

登录到RouterC,使用带参数的Ping远端服务器,显示如下:

RouterC#ping-cl0-s4000-t6000

PING:4000databytes,pressCTRL_Ctobreak

Replyfrom:bytes=4000Sequence=0ttl=249time=552ms

Replyfrom:bytes=4000Sequence=lttl=249time=5733ms

Replyfrom:bytes=4000Sequence=2ttl=249time=552ms

Replyfrom:bytes=4000Sequence=3ttl=249time=5714ms

Replyfrom:bytes=4000Sequence=4ttl=249time=552ms

Replyfrom:bytes=4000Sequence=5ttl=249time=5711ms

Replyfrom:bytes=4000Sequence=6ttl=249time=552ms

Replyfrom:bytes=4000Sequence=7ttl=249time=5709ms

Replyfrom:bytes=4000Sequence=8ttl=249time=552ms

Replyfrom:bytes=4000Sequence=9ttl=249time=5710ms

⑶原因分析

上面的Ping显示出一个规律:奇数报文的返回时长短,而偶数报文返回

时长很长(是奇数报文的10倍多)。可以初步判断奇数报文和偶数报文

是通过不同的路径传输的。现在我们需要使用Tracert命令来追踪这不同

的路径。在RouterC上,Tracert远端RouterA的以太网接口5.001。

RouterC(config)#tracert-q

tracerouteto()30hopsmax,40bytespacket

6ms4ms4ms4ms4ms4ms4ms4ms

………(中间省略)

20msl6msl5msl6msl6msl6msl6msl6ms

30ms278ms25ms279ms25ms278ms25ms277ms

RouterC(config)#

从上面的显示可看到,直至,UDP探测报文的返回时长都基本一

致,而到时,则发生明显变化,呈现奇数报文时长短,偶数报文

时长长的现象。于是判断,问题发生在RouterB和RouterA之间。

通过询问该段网络的管理员,得知这两路由器间有一主一备两串行链路,

主链路为2.048Mbps(s0口之间),备份链路为128Kbps(si口之间)o

网络管理员在此两路由器间配置了静态路由。

RouterB上如下配置:

RouterB(config)#iproute

RouterB(config)#iproute

RouterA上如下配置:

RouterA(config)#iproute

RouterA(config)#iproute

于是问题就清楚了。例如RouterB,由于管理员配置时没有给出静态路由

的优先级,这两条路由项的优先级就同为缺省值60,于是就同时出现在

路由表中,实现的是负载分担,而不能达到主备的目的。

(4)处理过程

可以有两种处理方法:

・继续使用静态路由,进行配置更改

RouterB上进行如下更改:

RouterB(config)#iproute(主链路仍使用缺省优先级60)

RouterB(config而proute100(备份链路的优先级降低至100)

RouterA上进行如下更改:

RouterA(config)#iproute

RouterA(config)#iproute100

这样,只有当主链路发生故障,备份链路的路由项才会出线在路由表中,

从而接替主链路完成报文转发,实现主备目的。

・在两路由器上运行动态路由协议,如IGRP、EIGRP、OSPF等,但不

要运行RIP协议(因为RIP协议仅以hop作为Metric的)

(5)建议和总结

本案例的目的不是为了解释网络配置问题,而是用来展示Ping命令和

Tracert命令的相互配合来找到网络问题的发生点。尤其在一个大的组网

环境中,维护人员可能无法沿着路径逐机排查,此时,能够迅速定位出发

生问题的线路或路由器就非常重要了。

案例二:使用Tracert命令发现路由环路

⑴现象描述

组网情况如下图所示:

三台路由器均配置静态路由,完成后,登录到RouterA上Ping主机

,发现不通。

(2)相关信息显示

RouterA#ping-c6-t5000

PING:56databytes,pressCTRL_Ctobreak

Requesttimeout

Requesttimeout

Requesttimeout

Requesttimeout

Requesttimeout

Requesttimeout

RouterA#tracert

tracerouteto()30hopsmax,40bytespacket

6ms4ms4ms(RouterB)

8ms8ms8ms(RouterA)

12msl2msl2ms(RouterB)

16msl6msl6ms(RouterA)

oooooo

⑶原因分析

从上面的Tracert命令的显示可以立即发现,在RouterA和RouterB间

产生了路由环路。由于是配置的是静态路由,基本可以断定是RouterA

或RouterB的静态路由配置错误。

检查RouterA的路由表,配置的是缺省静态路由:

iprouteO.O.O.OO.0.0.0,没有问题。

检查RouterB的路由表,配置到4.0.0.0网络的静态路由为:

iprouteF一跳配置的是100.2,而不是

。这正是错误所在。

(4)处理过程

修改RouterB的配置如下:

RouterB(config)#noiproute

RouterB(config)#iproute

故障排除。

(5)建议和总结

Tracert命令能够很容易发现路由环路等潜在问题。当路由器A认为路由

器B知道到达目的地的路径,而路由器B也认为路由器A知道目的地时,

就是路由环路发生了。使用Ping命令只能知道接收端出现超时错误,而

Tracert能够立即发现环路所在--如果Tracert命令两次或者多次显示

同样的接口。

当通过Tracert发现路由环路后,如果配置为:

静态路由:几乎可以肯定是手工配置有问题,如本案例所示。

・OSPF协议:可能是地址聚合产生的问题。请参阅相关章节内容。

・多路由协议:可能是路由引入产生的问题。请参阅相关章节内容。

1.3.3Show命令

Show命令是用于了解路由器的当前状况、检测相邻路由器、从总体上监

控网络、隔离互连网络中故障的最重要的工具之一。几乎在任何故障排除

和监控场合,Show命令都是必不可少的。

例如:基于VRP1.6路由平台的Show命令选项如下所示:

Quidway#show?

aaa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论