《网络故障诊断》课件第8章_第1页
《网络故障诊断》课件第8章_第2页
《网络故障诊断》课件第8章_第3页
《网络故障诊断》课件第8章_第4页
《网络故障诊断》课件第8章_第5页
已阅读5页,还剩139页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.1局域网中的在线测试

8.2局域网中的离线测试

8.3以太网故障诊断

8.4交换式局域网故障诊断

8.5VLAN

8.6以太网故障诊断实例

8.7小结

第8章局域网故障诊断8.1局域网中的在线测试

8.1.1信号状态测试信号状态测试主要是用示波器测量信号波形,可以直接在收发器的接头(如同轴电缆或双绞线上的接头)处测量信号状态,也可以在活动的网络组件(如中继器、网桥或路由器)的接口处测量信号状态。8.1.2相对分析和统计测量协议分析器可以记录并分析网络中传输的数据包,它是监测数据包类型和协议处理过程,收集统计数据并分析统计参数运行趋势的有力工具。在使用协议分析器时,可以将其看做被测LAN网段的一个网络节点,在广播式LAN拓扑(如10/100/1000Mb/s以太网、4/16Mb/s令牌环或FDDI)中,协议分析器可以监测和分析网段中的所有通信过程。协议分析器只能监测它所在网段的流量,对跨路由器或跨网桥的流量则无法监控,这是因为路由器或网桥将本地流量限制在了本地网段内。为了能同时分析两个网段,需要协议分析器系统具备两个端口,很明显,只有一个端口的协议分析器是无法同时连接到多个网段的。在进行全网范围监测时,可以使用测量探针或软件代理,将它们安装在LAN网段中即可。由这些代理收集相关数据并采用简单网络管理协议将采集到的数据传送给集中的网络监测系统,由其负责分析和处理。在实际的局域网测试过程中,对那些基于交换原理的LAN拓扑(如交换式LAN或ATM网络)进行网络分析是比较困难的。因为交换机上的端口只负责传输那些目的地址属于本端口所连网段或节点的数据,这与以太网集线器或令牌环集中器是不同的。如果某个LAN或ATM交换机端口所连接的只是一个节点,则应使用多个端口协议分析器系统。为此,开发出了可用于交换机LAN环境下的多端口LAN探针,这些LAN探针一般拥有4个、8个、12个或更多的测试端口,可同时监测相应数量的交换端口。此外,许多交换机都可以将其未用的交换端口配置为测试端口,并能将活动端口的数据拷贝到指定的测试端口(即镜像端口)上。基于这一特性,单端口的协议分析器也可以同时监测多个活动的交换端口。但需要注意的是,由于在通常情况下,测试的容量与其他任一被测交换端口的容量相同,故在数据包超出测试端口容量时就会被随机丢弃,因此,在交换机处于峰值负载时,单个测试端口很难可靠地监测其他所有的交换端口,甚至无法同时监测多个交换端口。8.2局域网中的离线测试8.2.1线缆测试线缆测试是最常见的一种需要中断整个网段的测试过程,至于具体需要测量哪些线缆参数,应视被测线缆是同轴电缆、双绞线还是光缆而定。

1.双绞线测试测量双绞线时,应测量的参数包括电缆长度、衰减、串扰、引线分配、噪声、阻抗及电容。首先要检查的就是电缆连接器的引线分配情况,手工布线差错是电缆连接器引线分配错误的常见原因,有时也会因使用了不同色标编码系统而导致引线分配错误。例如,EIA/TIA568B就为双绞线布线定义了多种色标编码方案。引线检查可以通过将墙插连接到不同阻值的电阻上,并用每个电阻来测量配线柜中的每块接线板来实现。但是,这种方法并不能检查所有的布线差错,如串接线对(SplitPair)等。这类布线故障只能通过近端串扰(NEXT)来间接测试,即NEXT测试结果特别差时,则表明可能存在串接线对故障。

1)衰减衰减测量主要是测量信号在给定网段中传输的幅度损耗,衰减常以dB来表示,任何传输路径上的总衰减值都不能超过标准所规定的极限值,传输通路所能允许的最大衰减称为损耗预算。除了线缆本身会引起的衰减之外,用于扩展网段跨距的连接器也会产生很大的衰减。

2)串扰和近端串扰串扰是使用双绞线介质的局域网中最主要的噪声源,它是一根双绞线对中的信号在相邻双绞线对中产生的容性和感性耦合现象。串扰的大小以实际信号的幅度(单位为V)与耦合信号的幅度之比来衡量。如果实际信号与耦合信号的幅度都是在同一端测量的,则称为NEXT,以dB来表示。NEXT的值越大,线路上的串扰就越小,传输通路的质量也就越高。串扰与数据信号的频率有关,因此要测量不同频率下的所有线对组合的串扰大小。

3)衰减/串扰比为了正确评价衰减和串扰对传输通路误码率的影响,还需要测量双绞线的衰减/串扰比(ACR,AttenuationtoCrosstalkRatio)。ACR的计算很简单,只要用被测线路的NEXT(单位为dB)减去被测线路的衰减(单位也为dB)即可,ACR的值越趋近于0dB,通信差错的概率就越大。

4)信噪比信号幅度与噪声幅度比值就称为信噪比(SNR,SignaltoNoiseRatio),SNR与ACR非常类似,唯一的区别就在于SNR反映的是所有噪声的大小,而不仅仅是NEXT。不过,与NEXT引起的噪声相比,其他干扰源引起的噪声要小得多。

5)反射(回波损耗)反射是由电缆连接器的阻抗异常引起的,反射信号叠加在有用信号上就会产生信号抖动,将测得的实际信号波形与相关标准给出的眼图相比较,就可以得出信号抖动的大小。与NEXT相同,反射也以dB来表示,也应在不同频率下进行多次测量。

6)阻抗阻抗是LAN电缆段较为复杂的一个参量,其大小决定了电缆的电容、电感和电阻值大小。无差错数据通信系统要求整个电缆段和所有连接器的阻抗都保持不变,因为阻抗的突变会产生信号反射,而信号反射又会引起信号的抖动和误码。随着数据速率的提高,数据流对阻抗变化的敏感度也越大,因此非绞合电缆段的最大长度只能达到13mm。此外,在某些情况下,阻抗不同的电缆段常常无法耦合在一起。需要说明的是,阻抗测量还有助于识别串接线对的故障。

7)电阻电阻测量可以指示连接失败、短路以及线缆折断等故障,100m的UTP对绞电缆的电阻值应介于9~100Ω之间,而100m的STP对绞电缆的阻值则介于6~7Ω之间。

8)线缆长度线缆长度可以用时域反射计(TDR,TimeDomainReflectometer)来测量,即由TDR向被测线缆插入测试信号脉冲,并记录脉冲从测线缆对端返回所经历的时间(以ms为单位),然后再乘以该线缆中的信号传播速度即可得到被测线缆的长度。因为被测线缆段的两端及沿途的连接点处均会产生反射信号,所以这种测试方法能够检测线缆的故障数量及其位置。

2.同轴电缆测试在同轴电缆测试中,最重要的测试项目有电缆长度、衰减和终端电阻。通过这些测试,可以很快地检测出以下常见故障现象:打结、短路、BNC连接松动、终端电阻不正确或丢失、电缆过长等。需要引起注意的是,在进行同轴电缆的电压和TDR测试时,一定要确保所有网络节点均为“打开”状态,且都不再发送数据。此外,由于中继器具有自动分段功能,可以在发现网络异常时自动去活(Deactivate)整个网段,并定期发送测试信号以查看网络异常情况是否已清除。而该测试信号会引起电压和TDR的测量结果出现偏差,因此在被测网段中有中继器时,应先将其去活后再进行测试。为了测量同轴电缆的电阻,必须切断该网段上所有节点的电源,或断开所有节点与网络的连接。在断开节点与LAN的连接时,要留意节点和LAN电缆的接地电位是否存在电位差。为了避免由此引起的放电损害,千万不要同时接触MAU电缆和LAN电缆。收发器和MAU的工作电压一般均为12V,在任一个MAU出现短路时,该压降都会全部加在电缆上。如果LAN电缆接地不正确,那么LAN电缆上的压降会更高。因此,最好不要接触LAN电缆。

3.光纤链路测试

LAN中的光纤链路测试方法与WAN中测试方法一样,应测量光纤链路的衰减和反射以及发射器和接收器的信号功率,其中,信号功率可以用光功率计来衡量,而信号反射则可以由光时域反射仪(OTDR)来测量。通过这些测试,我们能发现以下故障:●光纤链路的损耗(衰减);●熔接头损耗;●连接器损耗、杂质;●老化;●光功率问题;●线路中断。

8.2.2检测外部干扰在外部电磁干扰(EMI)较为严重时,其引入的噪声会严重干扰同轴电缆的信号传输,如果被干扰网段周围无明显的EMI干扰源,则可以采用测量频率的方法来找出EMI干扰源。这类测量可使用频谱分析仪,它能显示给定频段内的所有信号。常见的EMI干扰源主要有FM广播和TV信号、GSM电话、寻呼机、PC机、荧光灯、电车等。避免EMI干扰的最佳方法就是采用光缆作为传输介质,因为光缆可以免受电干扰。8.2.3一致性和兼容性测试

LAN技术主要用于私有网络,因此LAN网络设备所应遵循的国家和国际标准就没有以法规的形式加以强制限定,LAN中的一致性测试也就不像WAN中显得那么重要。但是,由于LAN技术越来越复杂,网元之间互操作性需求也就越来越强烈,为此,越来越多的工业论坛(如快速以太网协会、吉比特以太网联盟和ATM论坛等)开发了大量的测试程序集(称为标准测试协议)供设备厂商对其生产的网络设备进行一致性和互操作性测试。快速以太网有以下五种测试程序集:●快速以太网中继器测试程序集;● 100Base-TXMAC和PCS测试程序集;● 100Base-TXTPPMD测试程序集;● 100Base-X互操作性测试程序集;●自动协商测试程序集。8.2.4负载测试与WAN一样,LAN的负载测试也非常重要,虽然目前的网络设备可以轻而易举地工作于传统LAN技术(10Mb/s以太网、令牌环和FDDI)的最大负载状态下,但对100/1000Mb/s以太网和ATM等高速网络来说却比较困难,因为在高速网络环境下,不同厂商的产品性能差异较大,而且经常会出现某些厂商的产品指标不正确或所遵循的互操作性标准不一致的情况。例如,某ATM交换机厂商声称其产品每秒能处理的连接数量如何如何多时,要注意该厂商所说的连接可能只是在固定的输入、输出端口间完成的下述信令过程:●建立;●呼叫处理;●连接;●连接确认。但是,由于在实际的负载状态下,数据流会流向不同的端口,而且一条连接应包括完整的建立和拆除信令过程,即●建立;●呼叫处理;●连接;●连接确认;●释放;●释放完成。因此,在实际测试条件下测得的ATM交换机的信令处理能力可能远小于厂商所声称的性能指标。例如,某厂商声称其ATM交换机每秒能处理2000个呼叫,而实际上它可能只能处理500个左右的呼叫。为了使厂商提供的性能指标具有可比性,ATM论坛和IEEE基准工作组(IETF-BMWG)起草了一系列文件,以统一网络组件的性能测试术语,即● LAN交换设备的基准方法学;● LAN交换设备的基准术语;● IP多播的基准方法学;● IP多播的基准术语;● ATM基准方法学;● ATMABR基准术语;● ATM基准术语;● ATM论坛性能测试规范;●网络互连设备基准术语;●网络互连设备基准方法学;●防火墙性能的基准术语。

上述标准文档中所定义的性能参数主要描述了网络组件的如下重要功能:●包吞吐量;●包延时;●传输;●包丢失率;●突发包大小。在决定购买或使用某网络设备之前,应先了解该设备是否遵循RFC2544标准,如果条件允许,还应自行测试。8.3以太网故障诊断

8.3.1以太网故障现象以太网中的许多故障现象常常出现于正常的网络运行过程中,而不一定都是由网络差错引起的。如包括网络重载、网段中大量活动站点引发的高冲突率、某些特定协议产生的大量广播包(如WindowsNT的资源共享)等。我们可以通过分析坏帧(即被损坏的数据包)的类型来确知哪些故障现象与正常的网络操作无关。

1.冲突处于同一网段的两个站点如果同时发送以太网数据帧,就会产生冲突。在半双工传输模式下,冲突现象是极为普遍的。在10Mb/s以太网中,如果考虑到最大传输距离,那么冲突发生的最坏情况就是站点A以10Mb/s速率向相距最远的对端站点B发送以太网数据包。当该数据包的第一个比特在经过了25.51μs才到达站点B的时候,站点B又恰好开始发送数据,此时就会发生冲突。冲突发生后,两个冲突信号的电平将叠加在一起,并再次经过25.51μs后冲突信号才返回到站点A,此时站点A才知道已经发生了冲突。

2.远端和本地冲突在本地网段发生的冲突被称为本地冲突。在10Base2网络中,这类冲突是指在无中继器的同一个电缆段上发生的冲突;在10Base-T网络中,本地冲突是指集线器与站点之间发生的冲突,本地冲突产生的冲突碎片长度均小于64字节,信号电平也高于正常信号,而且其中携带的FSC也是无效的。远端冲突是指冲突碎片被中继器或集线器传播到其他网段的情况。这类冲突信号由于受到中继器的电平校正,所以在信号电平上与正常信号一样。中继器和集线器在检测到冲突发生后立即发出阻塞比特,通知连接在其上的网段停止发送数据,从而防止冲突的进一步蔓延,因此,在大多数情况下,这种远端冲突碎片的末尾带有一串阻塞比特。

3.滞后冲突滞后冲突碎片是指长度大于64字节的冲突碎片,对本地滞后冲突来说,可以通过其增高的信号电平来识别;而对远端滞后冲突来说,则可以通过冲突碎片中缺少校验和以及带有一串阻塞比特来识别。滞后冲突主要发生于接口硬件出现故障,或网段的线缆长度超过允许的极限值的情况下。对于滞后冲突来说,由于发送站点在得知冲突发生之前已经将数据包完全发送出去了,所以发送站点无法检测到这种滞后冲突。因此,滞后冲突产生的危害是双向的,即一方面需要由高层协议来控制完成数据包的重传,同时,这又会反过来影响高层应用的性能。

4.短包短包是指携带有效FCS但长度小于64字节的数据包。这类数据包往往是差错数据包,但是在某些场合,网桥等有源网元也可能会用这类短包来交换数据信息。短包常常又被称为“携带有效FCS的不足长数据包”。

5.不足长传输不足长传输虽然是一个非正式术语,但经常被用来指代短而无效的数据包。它通常指长度小于64字节的数据包,包括本地或远端冲突碎片、有/无有效FCS的短帧。

6.超时传输根据IEEE802.3,“Jabbers”是指任何大于1518字节的数据帧(不论其FCS是否有效)。超时传输通常是由接口硬件、线缆故障以及接地问题引起的。

7.长包长包是指携带有效FCS但长度大于1518字节的数据包。长包通常是由网桥或路由器中的接口卡驱动错误或软件问题产生的。

8.帧对齐差错任何长度不是8bit整数倍的以太网数据包都称为帧对齐差错。帧对齐差错常常是由驱动程序软件或冲突碎片产生的。

9.噪声差错噪声差错是指由于外部噪声的干扰使得网络线缆中传输的信号电平升高,致使其他站点误以为网络介质正处于数据发送“忙”状态。中继器和集线器有时还会加剧这种差错现象,噪声差错现象会大大降低网络带宽的利用率,降低网络性能。噪声差错常常是由接地回路、MAU的电源泄漏到电缆中或布线差错产生的。

10.帧长度差错帧长度差错是指以太网帧中的数据字段实际长度与长度字段中给出的数据长度不匹配。

8.3.2线缆故障在以太网中,线缆故障十分普遍,主要有线缆质量低劣,线缆有缺陷,特性阻抗不正确,终端电阻有问题,布线错误以及电磁干扰(噪声)等。8.3.3以太网接口卡故障以太网使用两种类型的网络接口卡:一种是集成了MAU的网卡,它可以通过BNC接头、RJ45或光纤用户接头(SC)直接与传输介质相连;另一种是带外接MAU的网卡,这种网卡需要使用外接MAU来适配不同的传输介质(如同轴电缆、双绞线或光缆),MAU与网卡之间需要通过AUI电缆进行连接。一般需要使用网卡制造商提供的软件进行网卡配置,或利用网卡上的硬件开关进行配置。像无效FCS、超时传输数据包、滞后冲突等差错在大多数时候都是由网卡故障引起的。在定位有故障的网卡时,从可疑节点着手,通过协议分析器找出所有发送了错误数据包的节点(大多数协议分析器在自动测试模式下都能做到这一点)。如果错误数据包中的源地址无效或无法解析,则可以尝试下面的方法:首先以图表方式列出所有可疑站点的活动,以及网段上产生的错误数据包的数量,分析两者之间的对应关系,进而找到故障网卡。如果没有发现什么对应关系的话,那么就必须采用网络分段故障排除法,逐一断开各网段,直至故障消失。网卡出现故障时可能会产生以下故障现象:高冲突率、产生超时传输数据包、产生带有无效FCS的数据帧以及节点出现间歇性连接问题。这些故障主要是由MAU故障、网卡上的保险丝熔断、网卡配置不当或网卡元器件损坏造成的网卡失效等原因造成的。

1.载波侦听失效超时传输数据包和高冲突率大多是由MAU故障造成的,因为MAU损坏之后,网卡的载波侦听功能将失效,此时故障站点将不顾其他站点是否在发送数据都进行数据发送操作。

2.配置错误如果站点根本就不能发送和接收数据包,那么首先要做的就是检查网卡的配置情况。常见的网卡配置错误有:●网卡端口激活有误(如应该激活RJ45接头却激活了AUI接头,或应该激活AUI接头却激活了RJ45接头);●为网卡配置的中断等级已被其他设备所占用。

3. MAU(收发器)断电如果网卡是通过外接收发器连接到网络上的,那么就可以使用AUI测试接头来检测网卡和收发器之间的工作是否正常。如果网卡不能为收发器提供正确的工作电压,那么就可能是网卡上的保险丝熔断了(如果有保险丝的话)。如果保险丝完好,那么一定是网卡已损坏。

4.同轴电缆连接不正确在小型10Base2网络中,没经验的网络管理员有时会用电缆来互连网卡和以太网总线T型接头,这会导致网络无法工作。因为根据IEEE标准的规定,网卡和T型接头之间的最大连接距离只有4cm,所以,必须将网卡直接安到以太网总线电缆上。

8.3.4介质访问单元故障外接的介质访问单元(MAU)可以极大提高节点与网络连接的灵活性,比如,在节点与以太网电缆相距几米时,就可以使用外接MAU来实现连接;15针的AUI接头也一样,有了它,就可以适应任何类型的传输介质(如光缆、双绞线、细同轴电缆、粗同轴电缆等);而多端口的收发器则可以将多个节点从同一个物理接入点接入到网络中。由于MAU(收发器)和AUI起到实际连接节点和网络的作用,所以它们必须正常工作。

目前的MAU和AUI电缆同时适用于Ethernetv2.0和10/100Mb/sIEEE802.3网络,而且能够通过LED来显示冲突、数据发送、SQE信号等工作状态。其中,SQE信号是MAU在接收到非标准信号(如冲突信号)后向网卡发送的。但是,并不是所有的网卡都能按照统一的标准去处理SQE信号,因为老的Ethernetv2.0网卡在每次读、写操作之后都需要一个SQE信号(被称为心跳(heartbeat)信号)。因此,连接到这类网卡上的MAU就必须工作在心跳模式。一般来说,在MAU上都有一个模式选择开关,用来调整工作模式。

1. AUI电缆和MAU连接与拆除

MAU连接到处于活动状态的节点时会产生一个电压脉冲,从而导致计算机硬盘数据的丢失和硬件的损坏。因此,在连接和拆除MAU之前都应该先切断节点电源。

2.故障检测和修复的工具和设备在测试MAU和AUI电缆时常常需要以下设备:●一个与故障网络具有相同拓扑的迷你型网络(10Base2和10Base5网络的迷你型网络为一个带终端电阻的T型接头;10/100/1000Base-T网络的迷你型网络为一个迷你型集线器);●一个全功能的MAU;●一个带有LED的AUI测试接头;●一根正常的AUI电缆;●一只万用表。

3. MAU的故障现象及原因MAU发生故障常常会导致节点无法连接到网络上,或者产生非常高的冲突率(并伴随有超时传输帧)。

MAU故障的主要原因如下:

1) IEEE802.3与Ethernetv2.0AUI电缆使用错误如果使用与IEEE802.3兼容的AUI电缆来连接与Ethernetv2.0兼容的MAU和网卡,将会产生严重的后果。因为根据IEEE802.3标淮,AUI接口的第四个引脚为接地引脚,第一个引脚是信号输入引脚,而在Ethernetv2.0标准中,这两个引脚的功能恰好相反。

2) SQE问题正如前面所讨论的,MAU既可以工作在心跳模式下,也可以工作在SQE模式下。如果将一个工作于心跳模式下的MAU连接到一块与IEEE802.3兼容的网卡上,那么由于在每次读、写操作之后MAU都要发送SQE信号,以致使网卡误认为发生了冲突,进而重发数据包。

3)接头连接松动接头连接松动常常会导致网络发生间歇性故障,但是检查接头是否松动在很多情况下并不如想象的那么简单,在某些场合下甚至无法办到。如果在某些情况下无法直接检查AUI电缆插的是否结实(如AUI电缆位于地板下或天花板上),可以利用环回测试进行检查。在10Base2和10Base5以太网中,除了要检查MAU的连接外,还要检查其终端电阻和接地是否存在问题,因为在某些情况下可能会错误地将AUI接到线缆末端而不是终端电阻上。对10/100/1000Base-T以太网来说,还应该检查屏蔽电缆的接地和墙插是否有问题。经过上述检查之后,如果故障依然存在,则可以将MAU从实际的网络上断开并接到迷你型网络上进行环回测试。如果环回测试没问题,则表明网络节点、AUI电缆和MAU均没有故障,因此故障源一定处于网络中的其他地方。如果环回测试失败,则应该依次替换MAU、AUI电缆和网卡,直至故障消失。为了检查MAU和网卡是否损坏,可以测试网卡提供给MAU的电压是否正常(用万用表测试MAU的引脚13和引脚6之间的电压),正常工作电压范围应该是11.28~15.75V。此外,某些网卡为了防止瞬时电压脉冲给硬件带来损坏,常常配有保险丝,因此还应该检查保险丝是否完好,如果被烧断了,则表明网络连接故障是MAU断电所引起的。8.3.5中继器故障为了克服以太网段的距离限制,常常使用中继器来互连以太网段。以星型拓扑连接10/100/1000Base-T的中继器被称为集线器或多端口中继器,它们的基本功能都一样。如今的中继器基本上都采用模块化的结构,能够互连不同传输介质(如同轴电缆、光缆、双绞线)的网段。但是中继器在延长传输距离时也带来了额外的传输延时,因此在一个网段传输路径上所能使用的中继器的数量有限制,而且随着信号传输时间的延长,冲突发生的概率也将随之增大,进而降低网络的传输效率。

1.定位冲突域中继器在检测到某端口发生冲突后就立即生成阻塞比特,并发送到其他所有端口,某个网段中发生的本地冲突相对于连接在该中继器上的其他网段来说则为远端冲突,因此,远端冲突数据包可以看做被中继器或集线器转发到其他网段的本地冲突数据包。如果在同时检测所有网段之后发现远端冲突都与某个网段的本地冲突有关,那么就能很容易地确定远端冲突源。但是,这种方法仅适用10Base2和10Base5网络。

2. MAU处于超时传输锁定状态

MAU的超时传输锁定机制是中继器故障中一个非常重要的故障现象。对中继器来说,如果打开的端口没有连接任何网段,那么它就会每隔0.01ms(帧间距)发送5ms时长的阻塞比特,0.01ms的帧间距可以避免激活网卡的超时传输锁定功能。如果网卡检测到超时传输持续时间超过5ms,那么网卡就生成并发送阻塞比特,以阻止“超时传输站点”;如果超时传输包长度为6250字节(相当于10Mb/s以太网中5ms时间内传送的数据帧长度),且间距为10µs(相当于10Mb/s以太网中传送100bit所需要的时间),那么其原因很可能是中继器上存在空的打开的端口,或者终端电阻不匹配。

3.假地址在使用协议分析器分析以太网数据帧时,时常会看到某些数据帧中的源地址与目的地址字段中的内容为“55555555”或“AAAAAAAA”。有差错的数据包常常携带有这种类型的地址,乍一看还以为出现了什么神秘的差错,但是将“55555555”、“AAAAAAAA”以二进制形式表示出来即为55555555:01010101010101010101010101010101AAAAAAAA:10101010101010101010101010101010由此可以看出,这些其实就是阻塞比特序列,是由中继器在检测到某个端口有冲突发生时所生成并发送到所有连接在其上的网段的阻塞比特(如前所述,阻塞信号是由多个交替的0和1组成的)。

8.3.6集线器故障集线器的典型故障现象表现为网络性能降低、出现间歇性的连接中断、高冲突率以及出现超时传输帧。下面分析这些故障现象的主要原因。

1.帧间距过短造成的数据包丢失如果网卡在发送数据包时没有保持最小帧间距(10Mb/s以太网中为9.6µs,100Mb/s以太网中为9.6µs),则中继器可能会来不及转发所有的数据帧,从而导致数据包的丢失。同时,由于上层协议能够检测出数据包丢失差错,故会产生重传请求,这在经过一个或多个路由器的网络连接中会极大地降低应用的性能。帧间距过短主要是由于某些接口在冲突发生后立即传送数据,而没有遵守9.6µs间距规则,还有些发送的数据帧之间的帧间距非常接近甚至小于9.6µs。此外,数据包碎片有时也会产生帧间距过短差错,这是因为每个集线器都必须把冲突碎片扩展到96bit的最小长度(包括前导码)。如果集线器接收到一个64字节的冲突碎片,则需要在该冲突碎片后添加32个阻塞比特,同时将该冲突碎片与其后的数据帧之间的间距减少32bit时间(即3.2μs),这将导致帧间距过短。不过,目前的集线器基本上都能使用缓存技术调整帧间距。这种帧间距过短的故障现象通常只能在应用层上进行识别。典型情况如通过集线器进行文件传输的两个站点之间的通信时间远远大于在同一个网段进行文件传输的两个站点之间的通信时间。假设TCP数据包在到达集线器之前都携有正确的序列号,但经过集线器转发之后部分序列号丢失了,站点就需要花费很长时间重传那些序列号丢失的数据包,致使文件传输吞吐量由几Mb/s降至几百Kb/s。

2. 10Base2中继器的接地问题

10Base2和10Base5网段中只能有一个接地点,如果接地的中继器和接地的终端电阻之间经由电缆形成一个电流环路,且两个地之间存在压降,就会产生干扰电流,进而引发严重的干扰信号,导致高冲突率,甚至网络的中断。

3.传输路径上中继器数量过多数据帧在经过多个中继器的长距离传输之后,由中继器引入的延时可能会大于标准允许的最大延时25.6µs。由于在以太网中延时越大,CSMA/CD算法的效率就越低,引发的冲突也就越频繁,而经常以滞后冲突形式出现的冲突会劣化网络性能,并导致网络连接的间歇性中断,故传输路径上的中继器数量不宜过多。标准规定每个网段使用的中继器数量不能超过4个。

4.安装和配置错误集线器的故障常常来源于安装和配置错误,如端口配置错误(如端口没有被激活、工作模式设置有误)、连接松动(如电缆、接头以及插板松动)、后面板或配线柜中的布线错误等等。

5.硬件故障定位和排除硬件故障一般都可以从电源、接头以及集线器的自测功能着手。8.3.7网桥故障网桥工作在OSI分层模型中的第一层(MAC子层),用来互连二层网段,与具体的高层协议无关,只负责存储、过滤接收到的以太网数据帧,并将其转发到目的网段。工作于MAC子层的网桥主要功能有:防止本地流量传播到相邻网段,克服特定网络拓扑对网段所能拥有的最大节点数的限制以及对传输延时和传输距离的限制。网桥的数据包过滤功能基于网桥的地址表(又称为转发表),地址表既可以由网桥在自学习工作模式下自动建立,也可以由网络管理员手工建立。在自学习模式下,网桥的功能类似于中继器,但是网桥可以将某端口上收到的数据包的源地址与该端口的对应关系存储在地址表中。自学习工作模式又名“透明桥接”,是每个兼容IEEE802.3标准的网桥必备的基本功能。网桥在转发表建立之后,就可以工作于桥接模式下了,此后的数据帧转发操作都基于该转发表。为了尽量减小转发表的尺寸,并体现网络拓扑的变动情况,所有地址表项的维护都遵照老化过程,即一旦某个地址表项在一定的时间内没有进行任何操作,则自动删除该表项。

网桥的另一个重要功能就是检查所有的以太网数据帧。与中继器不同,网桥对所有长度非法的FCS无效,或帧对齐有错的数据帧都采取直接丢弃的处理方法。与本地网桥用于连接相邻网段类似,广域网桥用来互连通过广域网(WAN)链路连接的两个网络,这两个网络可以处于不同的地理位置。网桥的相关标准定义在1990年发布的IEEE802.1中,目前这份标准文档已被ISO的100038更替。查找网桥故障的主要难点在于需要将故障现象与多个网段对应起来并找出它们之间的对应关系,此时可以采用基于探头的监测系统同时测试多个网段。在测试网桥性能时并不需要使用昂贵的、专业的多端口测试系统。这是因为目前的网桥在任何场合下都不能以线速转发数据包,所以在大多数情况下进行的网桥性能测试仅仅是验证网桥生产厂商的设备技术参数而已。因此最便捷的方法就是直接向网桥生产厂商索取网桥的技术参数,当然,这些技术参数应该是基于RFC1242和RFC2544中规定的标准测试方法得到的。多数由网桥引起的故障都可以通过分析特定测试结果与网络拓扑之间的对应关系,采用排除法解决。网桥的故障现象主要表现在以下几个方面:部分网段的性能出现劣化、部分站点出现间歇性或永久性的网络连接丢失、某些协议或网络服务失效等。和以往一样,进行故障检测和修复的第一步就是检查故障发生前网络配置、发生的变动情况,并收集其他相关信息。如果发现故障现象与某条特定的网络连接有关,则应该检查该连接路径下的所有网桥设备。否则,下一步就应该列出网络中所有受故障影响的站点、网络连接以及网络协议和网络服务。下面就来分析和总结一下网桥的典型故障现象及其主要成因。

1.吞吐量问题网桥的吞吐量是以每秒转发的数据帧数来衡量的,其标称值差常常指的是某种网络拓扑的最小帧长度。但是,当吞吐量以每秒转发的字节数表示时,其数值常常指的是平均(或最大)帧长度。一般在处理网桥故障时都应测试网桥的吞吐量和实际的吞吐率,特别是在处理老式网桥模型的故障时更应如此。不过,目前的网桥吞吐量一般都大于数据帧的实际速率,因此吞吐量通常已不再是网桥的瓶颈。

2.数据帧丢失除了由于吞吐量不够而造成的数据包丢失之外,处于正常工作状态的网桥也会丢弃无效数据包和超过生存期的数据包。虽然网桥并不检查数据帧的时间戳,但是它可以限制数据包在缓存中暂存的时间,一旦暂存时间超时(最长为4秒),就丢弃数据包。因此,如果暂存时间定义过短,则会给重载网络带来严重问题。

3.网桥过滤器故障在使用网桥的过滤功能时,可能会产生以下典型问题:●定义的过滤器结构过于复杂,难以预料每一种运行情况下的过滤结果,以致在某些特定运行条件下产生了一些违背本意的过滤结果。●在冗余结构的网络中使用多端口网桥时,由于存在多条数据传输路径,所以数据包可能会被传送到备用端口。因此,此时要确保过滤器不会阻塞到达备用端口的数据包。●某些网桥会随过滤器结构和开启的过滤器数量不同而表现出不同程度的性能劣化。因此,在进行网络故障检测与修复时应咨询网桥生产厂商,明确启用过滤器会给网桥带来哪些性能上的影响。

4.缓存溢出为了应付瞬时峰值流量,网桥会把接收到的数据包先暂存在缓存中,以使CPU有足够的时间来转发这些数据包。但是,如果突发数据包过多而致使缓存溢出,网桥就只能丢弃数据包而别无他途。

5.数据包超长引发的故障在OSI分层结构中并没有为工作在第二层的网桥定义相应的帧分段机制,因此当网桥互连不同拓扑(如以太网和FDDI)的网络时,经常会遇到需要转发的数据包超过目的网络所能允许的最大帧长度,此时网桥只能丢弃这些数据包。虽然可以人为地定义网桥所能处理的最大帧长度,但是,如果设定的最大帧长度值过低,则将会导致性能劣化,特别是在网络中使用了对时间敏感的协议(如LAT和局域网传送协议)时更是如此。

6.数据包次序发生变化网桥通常按照接收到的数据包顺序来转发数据包,但是在网桥使用了分布式负载均衡(DLS)时,如果是无FIFO的负载均衡,则数据包在经由多条冗余链路或网桥端口到达网桥时的次序已与发送时的次序发生了很大的变化。此时,只有那些能够容忍数据包次序发生变化的协议(如TCP/IP、XNS、IPX等)才能利用网桥进行正常的通信,对于像UDP这样的需要数据包按序到达的传输协议来说,就必须依赖于上层应用来纠正数据包的次序,但是在实际应用中很少会有人这么做,这也是UDP能很好地工作于局域网中,而一旦工作于网桥或路由器连接的网络中就会产生很多问题的原因之所在。

7.地址表(转发表)引起的故障如前所述,网桥使用老化算法来处理地址表中的每一个表项,一旦某个表项在规定的生存期内都未被使用,就删除该表项。表项的最大生存期可以手工定义,一般介于10~1000000s之间。大多数网桥除了拥有这种动态地址表之外,还拥有一个由手工建立的静态地址表,静态地址表一般都包含一些特殊的地址(如广播地址和组地址)。如果网桥的运行完全基于静态地址表,则称网桥工作于“保护模式”下。

8.错误的工作模式对一些老式网卡来说,在网桥工作于Ethernetv2.0而不是IEEE802.3模式下时,有时会产生一些故障现象,但是对于现在的网卡来说,则不存在这种问题。因为新的网卡能够自动调整工作模式。另外一个常见的网卡配置错误就是将10Mb/s以太网端口错误配置为100Mb/s以太网端口,反之亦然。不过目前大多数的网络组件都能自动调整到所需要的以太网帧格式。

9.远程网桥问题连接远程网桥端口的广域网链路普遍存在速率低和质量较差的状况,因此在峰值负载时,常常会由于超时和丢包而引发频繁的重传操作。一般这类问题都可用数据压缩技术和升级WAN链路带宽来解决,但是仍然建议经常使用协议分析器来检测WAN链路的带宽利用率及其质量,以避免突发这类严重的通信问题。

10.网桥互连不同网络拓扑时产生的问题不同网络拓扑存在线路速率和访问机制的差异,因此,网桥在互连不同拓扑的网络时常常会遇到一些不可避免的问题。

(1)令牌环与以太网的互连:在IEEE802.5的数据帧格式定义中,帧状态字节中的A比特和C比特用来通知发送站 “接收站是否已经接收数据包并将数据包拷贝到接收缓存中”。虽然可以默认配置网桥将这些比特设置为“数据包已收到”和“数据帧已拷贝”,但是在接收站没有准备好接收数据时会产生以下问题:接收站处于非活动状态,或根本就没有接收到数据帧的情况下,发生站却认为数据包已成功传送。

(2) FDDI与以太网的互连:与令牌环一样,帧状态字节中的A比特和C比特用来通知发送站“其数据包是否已成功发送”。同样,应该将这些比特默认设置为数据包确实已成功发送时才起作用,否则,即便以太网接收站点处于非活动状态FDDI,发送站点也能接收到该消息。

11.安装和配置有误网桥故障的首要原因常常是网桥的安装和配置有误,如端口配置错误(端口没有被激活;端口运行模式错误,如应为10Mb/s,却被设置为100Mb/s)、连接差错(如线缆松动、接头松动或插板松动等)以及设备后面板或配线柜中的布线错误等等。

12.硬件故障为了定位和排除网桥的硬件故障,一般可以从网桥的电源、接头以及网桥的自测功能着手。8.4交换式局域网故障诊断

8.4.1开始进行网络的故障检测与修复交换式LAN中的网络故障与LAN中的网络故障类似,但是,在检测交换式LAN故障时,主要困难在于如何发现差错,而不是如何找出各个故障源。LAN交换机直接将接收端口收到的数据包转发至目的端口,因此简单地将协议分析器连接到交换机端口上就很难监视数据包的流向情况,为此,需要采取不同于其他共享式网络环境的测试方法来获得交换式LAN的运行信息。

LAN交换机中的网管信息由SNMP代理来承载,SNMP代理可以使用标准的MIB(如MIBⅠ、MIBⅡ和RMON)或专用MIB存储交换机上的运行状态数据。一般来说,从交换机的MIB中可以得到以下信息:●每个端口上的流量负载;●每个端口的差错率;●广播包和组播包的数量;●丢弃包的数量。但是,在实际情况中,这些监视功能的实现很有限,特别是在峰值网络负载下(一般而言,此时非常需要网络的运行信息)更容易出故障。因此,在检测交换式LAN故障时,除分析交换机MIB外,还要借助专用的测量系统进行详细的测量,例如协议分析器、LAN探针。在具体操作中可以采用多种实现方式,有些交换机提供一个专用的检测端口,通过在该端口上采用端口分接、电路分接或交换分接技术就可以分析网络的通信状况。采用端口分接时,LAN交换机被配置为将被测端口的所有数据拷贝到监测端口,从而使用协议分析器分析被测端口的数据包。从理论上来说,可以将多个被测端口的流量同时拷贝到一个监测端口上,但是,在被测端口的带宽与监测端口的带宽不同时,这种做法很容易引起数据包的丢失,特别是在网络重载情况下更是如此。电路分接与端口分接基本相同,只是其需要监测两个端口间的流量,而不是某个给定端口的流量。对交换分接来说,所有交换端口上的流量都被拷贝到监测端口上,如果LAN交换机上无专用监测端口,则需要插入一个微型Hub,以便将测试仪连接到被测端口上。在检测和修复交换式LAN故障时,首先应确定网络负载和交换端口上的数据包类型(广播包和组播包数量、包长度、差错率)以及集成交换管理软件中的数据,其次检查交换机中的转发表和端口配置情况。在大多数情况下,通过这些检测操作都能将故障域缩小到特定网段或节点上。8.4.2交换机网络故障现象包含LAN交换机的故障现象主要有:LAN交换机所连网段的网络连接出现中断、广播风暴的吞吐量问题。跨越LAN交换机的连接问题中断现象的主要原因是线缆损坏、电源问题以及交换机硬件故障。在使用以太网交换机时,如果网络中出现了大量的广播包,则可能是桥接回路引起的,出现回路的原因是网络不支持(或去活了)生成树协议功能,致使从某个网段发出的广播包被LAN交换机转发到其他相邻网段,接着又被相邻网段的交换机转发回源网段从而形成桥接回路,引起广播风暴。8.4.3交换式局域网故障诊断

(1) LAN交换机互连的网段之间无连接,可能的故障原因是:①布线差错;②交换机电源失效;③交换机硬件故障;④交换机配置差错:例如,环速率配置差错(令牌环)、10Mb/s以太网被配置为100Mb/s以太网、半双工以太网被配置为全双工以太网等;⑤交换机的IP地址、子网掩码或默认网关地址不对;⑥VLAN配置差错:不能通信的节点位于不同的VLAN中;⑦源路由未被激活(令牌环);⑧某个FDDI交换端口被配置了重复的FDDI地址;⑨某个令牌环交换端口被配置了重复的令牌环地址;⑩不能通信的节点的网卡损坏。

(2)当出现广播风暴时,可能是由于未激活或不支持生成树算法,从而在传输路径上形成回路。

(3)当LAN中吞吐量很低时,可能的原因是:①网络设计质量低劣:交换端口上的对称带宽上出现了不对称负载;②交换机端口配置不正确(10Mb/s以太网被配置为100Mb/s以太网,半双工以太网被配置为全双工以太网);③交换机端口损坏,产生了大量的差错帧;④线缆长度超出了规定范围。下面给出交换式LAN中最常见的差错原因,以供参考:●多个交换机中间的环回引起的广播风暴:生成树算法未激活;●交换机硬件损坏;●某个FDDI交换机端口配置了重复的FDDI地址;●给某个令牌环端口配置了重复的令牌环地址;●电缆设施故障、电缆长度超标;●网络设计拙劣,对称带宽的交换机端口上出现不对称的流量;●交换机安装错误(电缆、连接器或插板松动,背板布线错误);●三层交换机设置不正确,如IP地址、子网掩码或默认网关等设置有误;●路由器或网桥上的交换端口运行于路由/桥接模式下;● VLAN配置不正确:位于不同VLAN中的站点无法通信;●源路由被去活(令牌环);●交换机过载;●交换机电源系统故障;●交换机配置不正确:端口未激活,环速率不正确(令牌环),以太网速率不正确,应为半双工模式却被设为全双工模式(或相反)。8.5VLAN

8.5.1VLAN概述虚拟局域网(VLAN,VirtualLocalAreaNetwork),是指在交换局域网的基础上,采用网络管理软件构建的可跨越不同网段、不同网络的端到端的逻辑网络。一个VLAN组成一个逻辑子网,即一个逻辑广播域,它可以覆盖多个网络设备,允许处于不同地理位置的网络用户加入到一个逻辑子网中。

VLAN是建立在物理网络基础上的一种逻辑子网,因此建立VLAN需要相应的支持VLAN技术的网络设备。当网络中的不同VLAN间进行相互通信时,需要路由的支持,这时就需要增加路由设备—要实现路由功能,既可采用路由器,也可采用三层交换机来完成。从技术角度讲,VLAN的划分可依据不同原则,一般有以下三种划分方法。

1.基于端口的VLAN划分这种划分是把一个或多个交换机上的几个端口划分为一个逻辑组,这是最简单、最有效的划分方法。该方法只需网络管理员对网络设备的交换端口进行重新分配即可,不用考虑该端口所连接的设备。

2.基于MAC地址的VLAN划分

MAC地址其实就是指网卡的标识符,每一块网卡的MAC地址都是唯一且固化在网卡上的。MAC地址由12位十六进制数表示,前8位为厂商标识,后4位为网卡标识。网络管理员可按MAC地址把一些站点划分为一个逻辑子网。

3.基于路由的VLAN划分路由协议工作在网络层,相应的工作设备有路由器和路由交换机(即三层交换机)。该方式允许一个VLAN跨越多个交换机,或一个端口位于多个VLAN中。就目前来说,对于VLAN的划分主要采取上述第1、3种方式,第2种方式为辅助性的方案。8.5.2VLAN的优点

VLAN具有以下优点。

1.控制广播风暴一个VLAN就是一个逻辑广播域,通过对VLAN的创建,隔离了广播,缩小了广播范围,可以控制广播风暴的产生。

2.提高网络整体安全性通过路由访问列表和MAC地址分配等VLAN划分原则,可以控制用户访问权限和逻辑网段大小,将不同用户群划分在不同VLAN,从而提高交换式网络的整体性能和安全性。

3.网络管理简单直观对于交换式以太网,如果对某些用户重新进行网段分配,需要网络管理员对网络系统的物理结构重新进行调整,甚至需要追加网络设备,增大网络管理的工作量。而对于采用VLAN技术的网络来说,一个VLAN可以根据部门职能、对象组或者应用将不同地理位置的网络用户划分为一个逻辑网段。在不改动网络物理连接的情况下,可以任意地将工作站在工作组或子网之间移动。利用虚拟网络技术,大大减轻了网络管理和维护工作的负担,降低了网络维护费用。在一个交换网络中,VLAN提供了网段和机构的弹性组合机制。8.5.3三层交换技术传统的路由器在网络中有路由转发、防火墙、隔离广播等作用,而在一个划分了VLAN以后的网络中,逻辑上划分的不同网段之间通信仍然要通过路由器转发。在局域网中,不同VLAN之间的通信数据量很大,如果路由器对每一个数据包都路由一次,随着网络中数据量的不断增大,则路由器将不堪重负,路由器将成为整个网络运行的瓶颈。在这种情况下,出现了第三层交换技术,它是将路由技术与交换技术合二为一的技术。三层交换机在对第一个数据流进行路由后,会产生一个MAC地址与IP地址的映射表,当同样的数据流再次通过时,将根据此表直接从二层通过而不是再次路由,从而消除了路由器进行路由选择而造成网络的延迟,提高了数据包转发的效率,消除了路由器可能产生的网络瓶颈问题。可见,三层交换机集路由与交换于一体,在交换机内部实现了路由,提高了网络的整体性能。在以三层交换机为核心的千兆网络中,为保证不同职能部门管理的方便性、安全性以及整个网络运行的稳定性,可采用VLAN技术进行虚拟网络划分。VLAN子网隔离了广播风暴,对一些重要部门实施了安全保护,且当某一部门物理位置发生变化时,只需对交换机进行设置,就可以实现网络的重组,非常方便、快捷,同时节约了成本。8.5.4VLAN故障诊断在如图8-1所示的网络中,各部分的配置如下:

1. Cisco7206的配置●以太网口配置:210.18.1.19(合法IP)● S4/0/0配置:192.168.5.2/30

● S4/0/1配置:192.168.6.2/30● S4/0/2配置:192.168.7.2/30●路由配置:2. Catalyst6509的配置● VLAN1配置:210.18.1.18● VLAN2配置:192.168.1.4● VLAN的路由:0.0.0.00.0.0.0VLAN1● 210.xxx.xxx.xxx为合法IP● 192.xxx.xxx.xxx为非法IP图8-1VLAN故障诊断网络拓扑未作VLAN前用户都能通过阿尔卡特交换机登录教育网等。在Catalyst6509上加了VLAN后就不能ping通210.18.1.10,而只能ping通210.18.1.19与210.18.1.18。

(1)在Cisco7206、Catalyst6509或阿尔卡特上怎么配置?

(2)每台作了VLAN的交换机是不是都要一个IP地址?在Catalyst6509上作了VLAN以后就不能ping通210.18.1.10,但是可以完全ping通210.18.1.19与210.18.1.18,而从上述的描述中,以上的三个地址处于同一子网中,这样,假如在确保连通性的基础上,应该检查一下210.18.1.10所在的端口是否划到了与210.18.1.19、210.18.1.18相同的子网中。应该说,Catalyst6509结构的改变,实际上是在内部增加了两个网关,这样在Cisco7206和阿尔卡特交换机上应该对路由进行相应改动,将到210.X.X.X的包发到210.18.1.18,将到192.X.X.X的包发到192.168.1.4。另外,在Catalyst6509上也要打开相应的路由,而这里Catalyst6509的默认路由应该指向阿尔卡特的交换机,才能够保障内部网络的终端顺利上网。至于每台VLAN交换机是否有IP地址这要看实际情况而定,但是每个VLAN的网关地址是必不可少的。8.6以太网故障诊断实例

8.6.1网络性能降低的同时伴有FCS差错

CSMA/CD算法在冲突发生时会引起校验和无效(即FCS差错),在发生次数不多的情况下属于正常现象。因此FCS差错与冲突同时发生,且发生次数在合理的范围内时就无需担忧。对于本故障现象,可以采用协议分析器来检测某段时间内冲突发生的次数与FCS差错的次数,并分析它们之间的特性曲线。如果在这两点之间找不到对应关系,则可能是如下原因之一:

(1)网络中存在噪声和干扰。在网络设备没有接地或接地不正确的时候就会产生噪声干扰,可以用电缆扫描仪或万用表来检测网络中的噪声电平。一个10Base2/10Base5网络中只能有一个接地连接,如果还存在另一个接地连接(如网卡差错或电缆损坏),则由于两个地之间存在压降而引起电缆中的电流泄漏。

(2)电缆路由上有电磁干扰。复印机、电梯、手机以及寻呼机带来的电磁干扰都可能会引起FCS差错,可以用万用表来检测干扰情况,并使用电缆测试仪来检测噪声情况。在检测电磁干扰时,可以检查电缆路由上是否存在电梯、电机、变压器、灯带以及带有高时钟频率或X射线仪器的系统。

(3)网卡有故障。在检查是否由网卡故障引起FCS差错时,可以检查按网络节点排序的所有无效数据包。如果发现某个节点比较可疑,则可以检测该节点的活动率(如以数据包/秒为统计单位)与该节点所处网段的FCS差错发生次数。如果发现两者之间存在某种对应关系,那就有机会找到故障源。需要记住的是,由于网卡故障经常间歇性地出现(如网卡达到一定的温度时才出现),所以需要经过较长时间的监测才有可能得到准确和重复出现的故障结果。

(4)接头(如NIC、墙插、MAU、中继器、集线器等)松动或损坏。定位这类故障源的方法就是仔细检查网络路径上的所有连接情况。8.6.2网络性能降低的同时伴有滞后冲突以太网中冲突次数的增加常与线缆问题(如线缆段过长)、网卡损坏、级联的中继器数量过多、终端电阻损坏或缺失等原因有关。如果能确定冲突属于滞后冲突还是正常冲突,将有助于我们缩小故障源的范围。滞后冲突可能的原因如下:

(1)线缆长度超过了特定网络拓扑所能允许的最大长度。此时,只需使用线缆测试仪测量一下线缆的长度即可。

(2)网络中级联的中继器数量过多。此时,可以用网桥替代其中的一个中继器,或者改变网络的配置。

(3)网卡或MAU损坏。利用协议分析器收集发送无效数据包最多的站点的运行统计数据,并收集冲突发生次数与活动站点的统计数据,以检查两者之间是否存在对应关系。如果用这些方法无法找到故障源,就必须使用网络分段法来排除网络故障了。8.6.3网络性能降低的同时伴有早期冲突这种故障可能的原因有:

(1)终端电阻损坏或缺失。

10Base2和10Base5以太网必须带有50Ω的终端电阻,检查网络中所有需要终端电阻的地方是否均已安装了正确的终端电阻,其阻抗可以用万用表来测量(阻抗值应介于48~52Ω之间)。

(2) T型接头松动或损坏。检查网络中的所有接头,以确定是否有松动或损坏现象。

(3)网段中的节点数过多。检查每个网段的MAU数量,一个10Base2网段中最多不能超过30个MAU,而一个10Base5网段中最多也只能有100个MAU。

(4)线缆被扭折。可以使用线缆扫描仪来定位并替换被扭折的线缆。

(5)电缆与IEEE802.3不兼容。

IEEE802.3的10Base5电缆每隔2.5m就以一种颜色加以标记,为了减少连接点处的反射干扰,接头的插入点应选择在这些颜色的标记处。此外要记住,并不是所有的BNC接头都使用50Ω的电缆。尽管以太网能在75Ω的电缆上传输几十米,但是长度的增加迟早会引发网络故障,因此,在检测网络故障时要检查所用电缆的规范。8.6.4网速慢、响应时间长当发现网速慢、响应时间长,但是冲突和FCS差错均处于正常范围时,可能的故障原因有:

(1)传输路径上的网桥或路由器的缓存溢出。检查路由器或网桥的统计数据(如CPU使用率、端口使用率等),利用协议分析器检测哪个站点产生的经由网桥或路由器转发的流量最大?是否有超时现象出现?一般可以用ping命令来测试通过网桥或路由器的响应时间,以查明网络互连设备是否是引起故障的部分原因。如果是,就需要重新配置网络。例如,将部分服务器或客户机移至其他网段,以减轻重载互连设备的流量。

(2)光纤链路的传输问题。在光纤链路衰耗过大,或发射光功率过低的情况下,如果光纤链路的传输距离过长,则可能引起性能劣化(即使没有出现任何FCS校验差错)。此时,可以用ping命令来检测有问题的光纤链路的响应时间,并检查光纤耦合器及线路衰耗的设置情况。

(3)存在本地网段路由。本地路由是网络速度减慢的常见原因,常常发生于子网地址不同,但在同一个LAN交换机下的两个节点之间的连接上,且LAN交换机连接在一个路由器下。此时,尽管这两个节点均连接在同一个交换机下,但它们之间的数据包交换必须经过路由器的路由之后才能到达对方。8.6.5间歇性网络连接、性能及帧对齐故障当网络出现间歇性的连接故障,或网络性能降低,出现帧对齐差错时,可能的故障原因有:

(1)网卡在每个FCS之后还发送了一些额外的比特。可以使用协议分析器捕获在FCS之后有额外比特的数据帧(称为帧对齐差错数据帧),从数据帧的源地址中就可以找到有故障的网卡。

(2)最大传输距离超出了以太网的规范。数据包能否到达最终目的地取决于发送站点和接收站点,在两个站点相距较近时一般没有什么问题,但是在两个站点相距较远且处在同一个网段中时就有可能出现连接问题。此时,就需要尽力找出这类连接问题是否只与某些特定节点有关。可以使用线缆测试仪来检测传输路径的线缆长度和质量,必要时,可以在传输路径上插入一个网桥或路由器。

(3)传输路径上级联了过多的网桥或路由器。如果在传输路径上级联了过多的网桥或路由器,则将导致信号的传输延时增加和协议超时(如TCP超时)。此时,可以使用ping命令或响应时间代理来检测响应时间。8.6.6网络连接间歇性故障并伴有短包网络连接出现间歇性故障,同时伴有短包现象。此时,可能是由于网卡有故障。可以使用协议分析器捕获短包并从短包的源地址中找到发送节点。8.6.7网络连接间歇性故障并伴有超时传输包网络连接出现间歇性故障,同时伴有超时传输包(JabberPacket)。此时,可能是由于:

(1)在10Base2和10Base5以太网中存在两个接地连接,故在网线中产生直流电流。可以使用电缆测试仪来检测网线中的直流电流。

(2)网卡损坏。网卡损坏有时会产生Jabber数据帧(即超长数据帧),导致所处网段出现连接故障。此时,可以从协议分析器捕获的Jabber数据帧的源地址字段中找到失效网卡的位置。8.6.8网络连接间歇性故障并伴有帧间距过短现象网络连接出现间歇性故障,同时伴有帧间距过短现象。可能的故障原因是帧间距过短引起数据包丢失。如果以太网中的站点不能维持正常的最小帧间距(10Mb/s以太网中为9.6µs,100Mb/s以太网中为0.96µs),某些集线器设备就无法正确处理接收到的数据包。此时,数据包有可能会转变为Jabber数据包。在进行故障检测时,可以用协议分析器来测量帧间距(可由数据包的时间戳得到帧间距),之后,再从协议分析器捕获的数据帧的源地址字段中找到失效网卡的位置。8.6.9网桥经由路径上间歇性网络连接故障如果在经由网桥互连的传输路径上出现间歇性的网络连接故障,则可能的故障原因是:网桥使用了负载均衡功能而打乱了数据包的到达次序。此时,可以检查网桥的配置并在必要时关闭网桥的负载均衡功能。8.6.10路由器经由路径上间歇性网络连接故障如果在经由路由器互连的传输路径上出现间歇性的网络连接故障,则可能的故障原因是:路由器连接在重载WAN链路上,或所连接的WAN链路质量较差。排除这类故障可以使用协议分析器检测路由器所连接的WAN链路的使用率、FCS差错率以及误码率。此外,还可以分析路由器端口的日志,这也有助于我们找到故障原因。8.6.11单个节点与网络失去连接若单个节点与网络失去连接,则可能的故障原因有:

(1) MAU与网线,或网卡与网络的连接松动或连接失效。此时需要检查电缆、接头、网卡是否有问题,在必要时应予以替换。为了确定故障是否是节点本身,可以用一个工作正常的节点完全替换有故障的节点。如果网络连接恢复正常,则表明故障源在节点内部,否则表明故障源在网络侧。

(2)网卡配置错误,如接头激活有误(如应激活AUI接头,却激活了双绞线接头),或选择的中断资源已被占用。此时可以利用ping命令(ping127.0.0.1)来检查网卡的工作是否正常,以及数据包能否被正确地发送和接收。此外,还应检查最近是否有人在网络中安装了软件或硬件。当然,也可以采用原因1中的方法,用一个工作正常的节点完全替换故障节点,以确定故障源在节点本身还是在网络侧。

(3)网卡损坏或保险丝被烧断。使用外接MAU时需要检查其供电系统是否完好。利用ping命令(ping127.0.0.1)来检查网卡的工作是否正常,以及数据包能否被正确地发送和接收。

(4)不兼容的网卡把外接MAU发送的心跳信号当成了SQE信号,进而发生差错。此时应监视MAU上的LED。如果每次发送数据时SEQLED都点亮,则应关闭MA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论