《网络故障诊断》课件第7章_第1页
《网络故障诊断》课件第7章_第2页
《网络故障诊断》课件第7章_第3页
《网络故障诊断》课件第7章_第4页
《网络故障诊断》课件第7章_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

7.1路由器

7.2路由器的配置7.3路由器故障诊断命令

7.4路由器常见故障诊断7.5RIP故障诊断

7.6OSPF故障诊断

7.7BGP故障诊断7.8小结

第7章网络层故障诊断7.1路由器

1.静态路由表由系统管理员事先设置好的固定的路由表称为静态路由表,一般是在系统安装时就根据网络的配置情况预先设定的,它不会随未来网络结构的改变而改变。

2.动态路由表路由器根据网络系统的运行情况而自动调整的路由表称为动态路由表。路由器根据路由选择协议提供的功能,自动学习和记忆网络运行情况,在需要时自动计算数据传输的最佳路径。7.2路由器的配置

路由器在计算机网络中有着举足轻重的地位,是计算机网络的桥梁。通过它不仅可以连通不同的网络,还能选择数据传送的路径,并能阻隔非法的访问。路由器的配置对初学者来说,并不是件十分容易的事。下面以Cisco2501为例,将路由器的一般配置和简单调试介绍给大家,供配置路由器时作参考。

Cisco2501有一个以太网口(AUI)、一个Console口(RJ45)、一个AUX口(RJ45)和两个同步串口,支持DTE和DCE设备,支持EIA/TIA-232、EIA/TIA-449、V.35、X.25和EIA-530接口。

1.配置以太网端口

#conft(从终端配置路由器)

#inte0(指定E0口)

#ipaddrABCDXXXX(ABCD为以太网地址,XXXX为子网掩码)

#ipaddrABCDXXXXsecondary(E0口同时支持两个地址类型。如果第一个为A类地址,则第二个为B或C类地址)

#noshutdown(激活E0口)

#exit完成以上配置后,用ping命令检查E0口是否正常。如果不正常,通常都是因为没有激活该端口,初学者往往容易忽视。

2. X.25的配置

#conft

#intS0(指定S0口)

#ipaddrABCDXXXX(ABCD为以太网S0的IP地址,XXXX为子网掩码)

#encapX25-ABC(封装X.25协议。ABC指定X.25为DTE或DCE操作,缺省为DTE)

#x25addrABCD(ABCD为S0的X.25端口地址,由电信局提供)

#x25mapipABCDXXXXbr(映射的X.25地址。ABCD为对方路由器,例如:S0的IP地址;XXXX为对方路由器,例如:S0的X.25端口地址)

#x25htcX(配置最高双向通道数。X的取值范围1~4095,要根据电信局实际提供的数字配置)

#x25nvcX(配置虚电路数,X不可超过电信局实际提供的数,否则将影响数据的正常传输)

#exit

S0端口配置完成后,用noshutdown命令激活S0口。如果pingS0端口正常,ping映射的X.25IP地址即对方路由器端口IP地址不通,则可能是以下几种情况引起的:

(1)本机X.25地址配置错误,重新与邮局核对(X.25地址长度为13位);

(2)本机映射IP地址或X.25地址配置错误,重新配置正确;

(3)对方IP地址或X.25地址配置错误;

(4)本机或对方路由配置错误。能够与对方通信,但有丢包现象。出现这种情况,一般有以下几种可能:

(1)线路情况不好,或网卡、RJ45插头接触不良;

(2) x25htc最高双向通道数X的取值范围和x25nvc虚电路数X超出电信局实际提供的数字。最高双向通道数和虚电路数这两个值越大越好,但绝对不能超出电信局实际提供的数字,否则就会出现丢包现象。

3.专线的配置

#conft

#int

S2(指定S2口)

#ipaddrABCDXXXX(ABCD为S2的IP地址,XXXX为子网掩码)

#exit专线口配置完成后,用noshutdown命令激活S2口即可。

4.帧中继的配置

#conft

#ints0

#ipaddrABCDXXXX(ABCD为S0的IP地址,XXXX为子网掩码)

#encapframe_relay(封装frame_relay协议)

#nonrzi_encoding(NRZI=NO)

frame_relaylmi_typeq933a(LMI使用Q933A标准。LMI(LocalmanagementInterface)有3种:ANSI:T1.617、CCITTY:Q933A和Cisco特有的标准)

#frame-relayintf-typABC(ABC为帧中继设备类型,它们分别是DTE设备、DCE交换机或NNI(网络接点接口)支持)

#frame_relayinterface_dlci110br(配置数据链路连接标识符DLCI)

#frame-relaymapipABCDXXXXbroadcast(建立帧中继映射。ABCD为对方IP地址,XXXX为本地DLCI号,broadcast允许广播向前转发或更新路由)

#noshutdown(激活本端口)

#exit帧中继S0端口配置完成后,用ping命令检查S0口。如果不正常,通常是因为没有激活该端口,用noshutdown命令激活S0口即可。如果pingS0端口正常,ping映射的IP地址不正常,则可能是帧中继交换机或对方配置错误,需要综合排查。

5.配置同步/异步口(适用于2522)

#conft

#ints2

#phasyn(配置S2为异步口)

#phsync(配置S2为同步口)

6.动态路由的配置

#conft

#routereigrp20(使用EIGRP路由协议。常用的路由协议有RIP、IGRP、IS-IS等)

#passive-interfaceserial0(若S0与X.25相连,则输入本条指令)

#passive-interfaceserial1(若S1与X.25相连,则输入本条指令)

#networkABCD(ABCD为本机的以太网地址)

#networkXXXX(XXXX为S0的IP地址)

#noauto-summary

#exit

7.静态路由的配置

#iprouterABCDXXXXYYYY90(ABCD为对方路由器的以太网地址,XXXX为子网掩码,YYYY为对方对应的广域网端口地址)

#dialer-list1protocolippermit7.3路由器故障诊断命令

路由器故障诊断的常用命令有四种:

(1) show命令。show是一个很有用的监控命令,也是系统出现问题时的有效解决工具。下面是几个经常用到的show命令:● showinterface——显示接口统计信息。一些常用的showinterface命令:● showinterfaceethernet;● showinterfacetokenring;● showinterfaceserial;● showcontrollers——显示接口卡控制器统计信息。一些常用的showcontrollers命令:● showcontrollerscxbus;● showcontrollerse1;● showrunning-config——显示当前路由器正在运行的配置;● showstartup-config——显示存在NVRAM配置;● showflash——Flashmemory内容;● showbuffers——显示路由器中bufferpools统计信息;● showmemory——路由器使用内存情况的统计信息,包括空闲池统计信息;● showprocesses——路由器活动进程信息;● showversion——显示系统硬件、软件版本、配置文件和启动的系统映象;

(2) debug命令。在超级用户模式下的debug命令能够提供端口传输信息、节点产生的错误消息、诊断协议包和其他有用的诊断数据。使用debug命令要注意,它会占用系统资源,引起一些不可预测的现象。要终止使用debug命令,请用nodebugall命令。debug命令默认是显示在控制台端口上的,可用logbuffer命令把输出定向到buffers里面。若是telnet过去的,可用Router#terminalmonitor监控到控制台信息。

(3) ping命令。ping命令确定网络连通。

(4) trace命令。trace命令跟踪路由器包传输。7.4路由器常见故障诊断

下面总结一下典型的路由器故障及其常见原因。

1.吞吐量问题高速网络技术的不断发展,使得即便是采用了现代RISC处理器技术的路由器,仍然是网络峰值流量时的瓶颈。如果路由器厂商提供了基于标准测试方法(RFC1242、RFC2544)得到的路由器详细运行参数,则可以用来与实际峰值负载时的参数进行比较,通过这种比较就能粗略估计出网络故障是否是由路由器的吞吐量不足造成的。此外,检查路由器的运行统计日志也有助于找出路由器的性能故障问题。

2.地址表问题路由器的许多故障都能归结到路由器的地址表错误,或地址表没有得到及时更新。这主要是由于网络配置的变化没有在路由器上及时体现出来。地址表引起的故障现象一般在受到影响的服务被使用时才出现,因此这种故障常常在网络配置发生变化后的几小时或几天之后才发生。在实际工作中很难将网络配置的变动与特定服务(如数据库操作、访问Internet)的失效对应起来。此时,就需要有足够的耐心来检测和排除这类故障,特别是在没有记录网络配置变动情况的时候,更需要花费大量的时间。

3.子网掩码错误路由器的另一个常见错误就是子网掩码配置错误。例如,路由器的子网掩码配置错误可能会使普通的主机地址变为子网的广播地址。解决这类问题的方法只能是全面检查网络文档中有关子网掩码的所有配置情况。

4.无默认网关部分网络连接丢失(如对某些节点或子网可用的网络连接对其他节点或子网却不可用)的典型原因常常是没有在路由器上配置默认网关地址。此时,与路由器直接相连的子网之间能够实现正常的通信连接,而那些需要经过多个路由器互连的通信连接则无法正常工作。这是由于在无可用默认网关时,路由器不知该如何转发那些目的地址不在路由表中的数据包。

5.定时器配置错误在路由器上设置协议定时器的值时应非常小心,因为定时器设置错误会导致网络路由信息分发的延时(如OSPF的Hello、Dead定时器和IGRP的Active定时器)和特定连接的过早超时,特别是在网络中存在多厂商的路由器时,更应检查定时器的设置情况并在必要时予以调整。

6. WAN链路问题除了地址表错误之外,路由器故障的第二根源就在于WAN链路。WAN链路的常见问题主要有WAN链路失效、误码率过高、延时过长、链路带宽不够以及协议配置错误(如定时器或窗口尺寸设置有误等)。

7.路由协议问题另一类路由器故障是路由器之间的通信故障,这可以借助于协议分析器来分析路由协议的活动状况及其内容,进而找出故障的根源。

8.安装和配置错误与集线器和网桥一样,路由器的安装和配置错误也是路由器故障的主要原因。如路由器端口配置错误(端口没有被激活、协议没有被激活、运行模式错误等)、连接错误(线缆松动、接头松动或插板松动等)以及设备后面板或配线柜中的布线错误等。7.4.1路由器接口故障

1.串口故障排除串口出现连通性问题时,为了排除串口故障,一般是从showinterfaceserial命令开始,分析它的屏幕输出报告内容,找出问题之所在。串口报告的开始提供了该接口状态和线路协议状态。接口和线路协议的可能组合有以下几种:

(1)串口运行、线路协议运行。这种情况说明该串口和线路协议已经初始化,并正在交换协议的存活信息。

(2)串口运行、线路协议关闭。这种情况说明路由器与提供载波检测信号的设备连接,表明载波信号出现在本地和远程的调制解调器之间,但没有正确交换连接两端的协议存活信息。可能的故障是路由器配置问题、调制解调器操作问题、租用线路干扰或远程路由器故障,数字式调制解调器的时钟问题,通过链路连接的两个串口不在同一子网上,都会出现这个报告。

(3)串口和线路协议都关闭。这种情况可能是电信部门的线路故障、电缆故障或者是调制解调器故障。

(4)串口管理性关闭和线路协议关闭。这种情况是在接口配置中输入了shutdown命令。通过输入noshutdown命令,打开管理性关闭。在接口和线路协议都运行的情况下,虽然串口链路的基本通信建立起来了,但仍然可能由于信息包丢失和信息包错误导致许多潜在的故障问题。正常通信时接口输入或输出信息包不应该丢失,或者丢失的量非常小,而且不会增加。如果信息包丢失这一现象规律性地增加,表明通过该接口传输的通信量超过接口所能处理的通信量。

2.以太接口故障排除以太接口的典型故障问题是:带宽的过分利用、碰撞冲突次数频繁以及使用不兼容的帧类型。使用showinterfaceethernet命令可以查看该接口的吞吐量、碰撞冲突、信息包丢失和帧类型的有关内容等。通过查看接口的吞吐量可以检测网络的利用。如果网络广播信息包的百分比很高,则网络性能开始下降。光纤网转换到以太网段的信息包可能会淹没以太网口。互联网发生这种情况可以采用优化接口的措施,即在以太接口使用noiproute-cache命令,禁用快速转换,并且调整缓冲区和保持队列。两个接口试图同时传输信息包到以太电缆上时,将发生碰撞。以太网要求冲突次数很少,不同的网络要求是不同的,一般情况发现冲突每秒有三五次就应该查找冲突的原因了。碰撞冲突产生拥塞,碰撞冲突通常是由于铺设的电缆过长、过分利用、或者“聋”节点引起的。以太网在物理设计和铺设电缆系统管理方面应有所考虑,超规范铺设电缆可能引起更多的冲突发生。如果接口和线路协议报告运行状态,并且节点的物理连接都完好,可是不能通信,则引起此问题的原因也可能是两个节点使用了不兼容的帧类型。解决问题的办法是重新配置使用相同帧的类型。如果要求使用不同帧类型的同一网络的两个设备互相通信,则可在路由器接口使用子接口,并为每个子接口指定不同的封装类型。

3.异步通信口故障排除互连网络的运行中,异步通信口的任务是为用户提供可靠服务,但又是故障多发部位。主要的问题是,在通过异步链路传输基于LAN的通信量时,将丢失的信息包的量降至最少。异步通信口故障一般的外部因素包括拨号链路性能的低劣、电话网交换机的连接质量问题以及调制解调器的设置。检查链路两端使用的调制解调器:连接到远程PC机端口调制解调器的问题不太多,因为每次生成新的拨号时通常都初始化调制解调器,利用大多数通信程序都能在发出拨号命令之前发送适当的设置字符串;连接路由器端口的问题较多,这个调制解调器通常等待来自远程调制解调器的连接,连接之前,并不接收设置字符串。

showline命令输出的EIA信号及网络状态包括:① noCTSnoDSRDTRRTS:调制解调器未与异步接口连接;② CTSnoDSRDTRRTS:调制解调器与异步接口连接正常,但未连接远程调制解调器;③ CTSDSRDTRRTS:远程调制解调器拨号进入并建立连接。确定异步通信口故障一般可用下列步骤:检查电缆线路质量;检查调制解调器的参数设置;检查调制解调器的连接速度;检查rxspeed和txspeed是否与调制解调器的配置匹配;通过showinterfaceasync命令和showline命令查看端口的通信状况;从showline命令的报告检查EIA状态显示;检查接口封装;检查信息包丢失及缓冲区丢失情况。7.4.2主机到本地路由器的以太网口不通故障现象:主机到本地路由器的以太网口不通。此时,可以把路由器的以太网口看做是普通主机的以太网卡,这就成了一个局域网连接问题。

(1)用showinterfaceEthernetnumber命令。

Router#showinterfaceEthernet0

Ethernetisup,lineprotocolisdown

(2)若Ethernetisdown,请把线缆(同轴线缆或双绞线)接上。若已接上,Ethernet依然是down,请与代理商联系。

(3)若Ethernetisadministrativelydown。

Router#conft

Router(config)#interfaceEthernet0

Router(config-if)#noshutdown

Router(config-if)#^Z

Router#

(4)若Ethernetisup,而lineprotocolisdown。主机10M网卡接到路由器100M的以太网口,它不是自适应的(目前版本),反之无问题。

(5)若Ethernetisup,lineprotocolisup,但ping不通,请查看路由器以太网口的IP地址与主机IP地址是否在同一个网段上。

(6)经过以上几个步骤,问题仍未解决,请与代理商联系。7.4.3主机到对方路由器广域网口或以太网口不通故障现象:主机到对方路由器广域网口或以太网口不通。假设主机到本地路由器的以太网口已通,在路由器上检查两个广域网口之间是否通,若路由器两个广域网口之间是通的,则在主机上用“netstat–rn”命令查找路由,若没有,请用“routeadd”加入。

以SCOUNIX为例:

#netstat-rn

#routeadd目的网段掩码网关1或

#vi/etc/gateways

net目的网段gateway本地路由器以太网口地址metric1passive若主机上有默认网关,检查路由器路由协议配置。

Router#showiproute

Router#showrunning-config

routereigrp1

network...

network...两端路由器配置路由协议是否一致,是否在一个自治系统中。“network”加入的网段是否正确。7.4.4主机到对方目的主机不通若主机到对方目的主机不通,建议按以下步骤解决:

(1)检查主机到本地路由器的以太网口。

(2)检查两个广域网口。

(3)检查主机到对方路由器广域网口。

(4)检查主机到对方路由器以太网口。可用telnet命令远程登录到对方路由器上,按检查本地主机到本地路由器的以太网口的方法,检查对方局域网连接情况。

(5)重复步骤(3)和(4),检查对方到本地情况。

(6)经过以上几个步骤,问题仍未解决,请与代理商联系。7.4.5串口连接故障在专线连接时,若路由器直连的两个广域网口间不通,建议把两个路由器广域网口之间分成三段,如下所示:路由器A——1——ModemA——2——ModemB——3——路由器B

我们的任务就是要检查出是哪一段不通并予以解决。

(1)用showinterfaceserialnumber命令。

(2)若是Serialisdown,表示路由器到本地的Modem之间无载波信号CD。连接串口和Modem,开启Modem。看Modem的发送灯TD是否亮,TD灯亮表示路由器有信号发送给Modem;TD灯若不亮,请检查Modem、线缆和端口。也可以用另外一个串口再试试看。

(3)若Serialisup,但Lineprotocolisdown,则有几种可能:①本地路由器未作配置。②远端路由器未开或未配置。路由器两端需要配置相同的协议打包方式。例如:路由器A打包HDLC,路由器B打包PPP,那么两台路由器的lineprotocol始终是down的。改变打包方式:

Router#conft

Router(config)#interfaceserial0

Router(config-if)#encapsulationppp

Router(config-if)#^Z

Router#③若是使用Newbridge的26XX,27XX的DTU设备,它不发送CD信号,则在路由器上设置:

Router#configureterminal

Router(config)#intserial0

Router(config-if)#ignored-dcd

Router(config-if)#^Z

Router#④ Modem之间没通,即专线没通。解决办法:作测试环路。请电信局帮助确定具体是哪一段线路出现问题。若作环路成功,lineprotocol会变成up(looped)。

(4)若Serialisup,但Lineprotocolisup(looped),则进行以下判断:①用showrunning-config查看端口是否进行了loopback配置,若有,删掉它。② Modem是否进行了环路测试。③专线是否进行了环路测试。

(5)若Serialisadministrativelydown,lineprotocolisdown,则在路由器上设置:

Router#conft

Router(config)#interfaceserial0

Router(config-if)#noshutdown

Router(config-if)#^Z

Router#7.4.6Modem和路由器间无连接若Modem和路由器间无连接,登录无反应或用户收到“ConnectionRefusedbyForeignHost”信息。建议:

(1)用showline看Modem一栏是否是“inout”,若不是,则在路由器上设置:

Router#conft

Router(config)#lineaux0

Router(config-line)#modeminout

Router(config-line)#^Z

Router#

(2)确定正确的线缆。

(3)硬件问题,请与代理商联系。7.5RIP故障诊断

当IP连通失败时,我们首先要检查的是源到目标间所有物理连接是否正常,所有接口和线路协议是否运行。当物理层和数据链路层检查无误后,我们将排错重点转向网络层,假定网络运行的路由协议为RIP,那么一般故障处理的步骤如下:

(1)检查从源到目的间的所有路由设备的路由表,看是否丢失路由表项。例如:从源设备ping目标设备161.7.9.10没有响应,我们应当使用displayiprouting-table命令依次检查从源到目的间所有路由表项为161.7.x.x(x.x根据使用的RIP版本不同可能会有所不同)的项。

(2)若发生路由表项丢失或其他问题,则检查网络设备的RIP基本配置。①使用displayrip命令查看RIP的各种参数设置。检查RIP是否已经启动,相关的接口是否已经启用,network命令设置的网段是否正确。②用debuggingrip系列命令查看RIP的调试信息。

(3)若RIP基本配置没有问题,请检查如下项目:应当考虑是否在接口上配置了undoripwork命令;验证是否有问题;引入其他路由是否有问题;访问控制列表配置是否不正确等。使用displaycurrent-config命令查看接口和RIP的相关配置。例如:[Quidway]displaycurrent-config!interfaceEthernet1ipaddress100.1.1.5255.255.255.0ripauthenticationsimpleaaaripversion2multicast!quitrouterripnetwork10.0.0.0network137.11.0.0!quit!return查看接口的displaycurrent-configuration信息,可以看到RIP在接口模式下的配置信息是否正确。例如:该接口是否收发RIP报文,接口是否配置了验证以及验证的类型,接口向外发送的报文是RIP-1还是RIP-2,是广播发送还是多播发送,接口在接收和发送路由时是否增加附加的路由权。查看displaycurrent-config信息可以看到RIP在协议模式下的配置信息是否正确。例如:是否引入其他协议的路由,如果引入,是以多大的路由权值引入的;是否对路由进行过滤和按什么规则过滤等。7.6OSPF故障诊断

OSPF协议正常运行的标志是:在每一台运行该协议的路由器上,应该得到的路由一条也不少,并且都是最优路径。排除故障的步骤:

(1)配置故障处理:检查是否已经启动,并正确配置了OSPF协议。

(2)局部故障处理:检查两台直接相连的路由器之间协议运行是否正常。

(3)全局故障处理:检查系统设计(主要是指区域的划分)是否正确。

(4)其他疑难问题:路由时通时断、路由表中存在路由却无法ping通该地址。需要针对不同的情况具体分析。7.6.1协议基本配置是否正确在排除故障之前,应首先检查基本的协议配置是否正确。

(1)是否已经配置了RouterID。使用命令routeridRouter-id进行配置;使用disospf查询配置的RouterIDRouter-id可以配置为与本路由器一个接口的IP地址相同,需要注意的是,不能有任何两台路由器的RouterID是完全相同的。

(2)检查OSPF协议是否已成功地被激活。使用命令ospfenable启动协议的运行,该命令是协议正常运行的前提。

(3)检查需要运行OSPF的接口是否已配置属于特定的区域。使用命令ospfenablearea将接口配置属于特定区域,可通过命令displayospfinterfaceinterfacename来查看该接口是否已经配置成功。

(4)检查是否已正确地引入了所需要的外部路由。实际运行中可能经常需要引入自治系统外部路由(其他协议如BGP或静态路由),如果需要,是否已经通过命令import-route配置了引入。7.6.2邻居路由器之间的故障

OSPF协议需要整个自治系统中所有路由器的协调工作,因此,任意两台相邻路由器之间的故障都会导致网络中全部或部分路由错误。

若出现故障可按下列几点来检查:

(1)检查物理连接及下层协议是否正常运行。。

(2)检查双方在接口上的配置是否一致。

(3) hello-interval与dead-interval之间的关系。

(4)若网络的类型为广播或NBMA,至少有一台路由器的priority应大于零。

(5)区域的STUB属性必须一致。

(6)接口的网络类型必须一致。

(7)在NBMA类型的网络中是否手工配置了邻居。7.6.3系统规划的故障系统规划中的故障主要体现在区域划分中的错误。协议中对区域划分的要求是:如果自治系统被划分成一个以上的区域,则必须有一个区域是骨干区域,并且保证其他区域与骨干区域直接相连或逻辑上相连,且骨干区域自身也必须是连通的。区域划分错误的表现形式是:在一个区域内通常路由都是正常的,但无法得到区域外部的路由。这是从全局规划的角度来看的,如果落实到具体的配置上,可以这样认为:如果在一台路由器上配置了两个以上的区域,则至少应该有一个是骨干区域,或者配置了一条虚连接。在图7-1中用此方法判断,配置了两个以上区域的是RTB和RTC,其中RTB符合要求,RTC上由于没有配置骨干区域,所以是错误的配置。表现的形式可能是在RTD上无法得到RTA和RTB的路由,同理,RTA和RTB上也无法得到RTD的路由。修改的方法是将Area0和Area1互相调换一下位置,或者在RTB和RTC之间配置一条虚连接。但这种判断方法只是配置正确的必要条件,而非充分条件。图7-1系统规划错误一例如在图7-2中,每台路由器的配置都符合上面的条件,但配置仍旧是不正确的。错误在于骨干区域自身没有连通。改正的方法是:在RTB与RTC之间配置一条虚连接。图7-2系统规划错误二7.6.4其他疑难杂症如果经过以上分析之后,仍无法定位错误产生的原因,可从其他角度着手进行分析。

1.路由表中丢失部分路由可以查询一下是否本路由器配置了路由过滤。可查看是否配置了命令filter-policy(在OSPF协议配置模式下)。如果配置,再查询acl中的访问规则,是否丢失的路由恰好是访问列表中所过滤的。

2.路由表不稳定表现形式为:路由表中的部分或者全部路由表现不稳定,一会儿加上了,一会儿又丢失,且变化很快。这种错误不太好分析,可能由以下几种原因产生:

(1)网络中线路质量不好,导致线路时通时断,造成OSPF的路由随之不停地更改。可以通过检查相应的链路层协议是否正常来确定问题的原因。

(2)在拨号的情况下,如果是多台路由器同时拨一台路由器时,则应将所有的这些拨号的接口类型改为point-to-multipoint。因为缺省的网络类型是point-to-point,如果不加更改,当有多台路由器同时拨入时,接入方会在这些拨入的路由器之间不停地选择其中的一个并建立邻接关系,导致路由不稳定。

(3)有可能是自治系统中有两台路由器的RouterID相同。协议中规定,一台路由器的RouterID应该在整个自治系统中唯一。如果有两台路由器的RouterID相同,协议运行就会出现故障。这两台路由器如果是邻居,在相互接收对方的hello报文时会检测到这一错误,导致无法建立邻接关系。如果这两台路由器不是直接相连,而是分别位于自治系统中的两个不同的地方,则表现出的现象是部分路由时断时通。可以通过查看这部分不正常的路由所属的路由器来定位此问题。

3.无法引入自治系统外部路由某台路由器引入了自治系统外部路由后,却无法在其他路由器上发现这些路由。这很可能是由于本路由器处于一个STUB区域之内,因为按照协议规定,STUB区域内不传播Type5类型的LSA,所以这种类型的LSA既不能由区域外传播进来,也同样不能由区域内传播出去。实际上即使是同一个区域内的其他路由器也无法获得这些路由信息。

4.区域间路由聚合的问题通过在ABR上配置路由聚合可以大大减少自治系统中的路由信息,但如果配置不当,也会出现如下问题:某个区域配置了聚合之后,在其他区域中虽然有聚合后的路由,但未聚合前的路由仍旧存在。 出现这种现象的原因多半是因为该区域有两个以上的ABR,用户只在其中一台ABR上配置了聚合命令,而没有在其他的ABR上配置相同的命令。在图7-3中,Area1内有两个网段10.1.1.0/24、10.1.2.0/24,在其中的一个ABR(RTA)上配置了聚合命令,将这两条路由聚合为一条10.1.0.0/16的路由。而在另一个ABR(RTB)上,由于没有配置聚合命令,所以仍旧向Area0发送两条未经聚合的路由10.1.1.0/24、10.1.2.0/24。因此,在Area0中会有3条路由同时出现。图7-3区域间路由聚合配置错误一配置了路由聚合之后,路由表显示正常,但却无法ping通某些目的地址。可能是由于聚合命令配置错误导致。例如在图7-4中,Area1中有两个网段10.1.1.0/24和10.1.2.0/24,被ABR(RTA)聚合成一条10.1.0.0/16的路由后发送到Area0。与此同时,在另一个区域Area2中也有两个网段10.1.3.0/24和10.1.4.0/24,也被ABR(RTB)聚合成一条相同的路由10.1.0.0/16后发送到Area0中。这样RTA和RTB同时发布一条相同的到达10.1.0.0/16的路由。RTC由于距离RTA较近(花费值为5,而到RTB为10),所以选择RTA为到达此目的地址的下一跳。图7-4区域间路由聚合配置错误二7.7BGP故障诊断

7.7.1建立邻居时出现故障

BGP邻居的建立需要两个条件:能够建立TCP会话;能够正确地交换Open报文。建立TCP会话时需要关注两点:一是端口179能够使用,二是IP层的连接有效(有从IGP得到的路由,或者配置了静态路由)。正确交换Open报文也有两点需要关注:一是配置的邻居地址必须与TCP会话实际使用的地址一致,二是在本地配置的AS参数保持与对端一致。能够满足以上的条件,基本就可以解决建立邻居的故障了。下面就一些常见的故障介绍其分析与处理方法。

[故障一]邻居关系不能建立。

[分析处理](1)检查AS号是否正确。使用displaycurrent-configuration命令检查本端的AS号配置,在对端使用displaybgpsummary检查其邻居的AS号是否与本端一致。

(2)检查对等体的IP地址是否正确。如果是EBGP邻居,且EBGP连接在物理上不是直连的,检查是否配置了peer的ebgp-max-hop。默认情况下,EBGP邻居的TTL被置为1,如果不是直连,则必须配置peer的ebgp-multihop值。

(3)使用扩展的ping命令检查TCP连接是否正常。由于一台路由器可能有多个接口能够到达对端,所以应使用ping-aip-address命令指定发送ping包的源IP地址。如果ping不通,则使用displayiprouting-table命令检查路由表中是否存在到邻居的可用路由。如果能ping通,则检查是否配置了禁止TCP端口179的ACL。如果有,则取消对179端口的禁止。

[故障二]已经建立好的邻居又丢失了。

[分析处理]除对端发生重启的情况外,已经建立好的邻居又丢失了,一般是由于链路层的问题导致的。

(1) MTU问题:使用扩展的ping命令检查是否存在MTU问题,ping-ssize指定ping包的包长。

(2) QoS问题:检查是否在接口上设置了流量整形或物理接口限速。

MTU和QoS设置不当可能导致大的Update报文被丢弃。由于TCP的重传机制,当发送多个大的Update报文时,可能产生大量等待重传的Update报文,从而抑制了keepalive报文的正常发送,当连续收不到keepalive报文时,BGP认为邻居已经Down。

(3)网络拥塞问题:网络拥塞可能导致Keepalive报文收发失常,邻居状态不断改变。另外,如果到达邻居的路由是通过IGP(如OSPF)发现的,则网络拥塞可能导致该路由丢失,从而使邻居间的连接中断。下面列举一些可能导致BGP重启的事件:对端关闭会话、人为关闭、远端AS改变、修改路由反射器客户机配置、修改对等体组的策略、由同步改为非同步或反之、由联盟改为非联盟或反之、通告被发送/接收、对端发送的报文错误(与Cisco互通时,如果Quidway路由器上没有配置confederationnonstandard-compatible,则会认为对端发来的Update报文格式错,从而发送Notification消息,断开BGP连接)。常用的命令:●扩展的ping/tracert命令:可以用来验证接口间的IP连接、TTL、MTU等问题,包括对loopback接口的验证。● displaybgpsummary:显示所有邻居的状态。● displaybgppeer:提供BGP连接的详细信息。● debuggingbgpall:提示为何无法建立邻居关系。● debuggingbgpevents:显示邻居的状态变化。7.7.2路由丢失我们先回顾一下BGP发布路由的基本规则。

BGP对等体通过Update报文交换路由信息,在邻居关系第一次建立时,双方交换Update报文,通告所有本地已知的路由(对同一目的地仅通告最佳路由),此后,采用增量更新方式发送Update报文。从EBGP对等体接收到的最佳路由通告给所有对等体;从IBGP对等体接收到的最佳路由仅通告给EBGP对等体,必须存在一个完整的IBGP全连接;配置了同步的情况下,IBGP路由必须与IGP路由同步后才会被通告给EBGP对等体,如果没有配置同步,则直接通告。下面,我们分别对路由发起、路由更新、对路由应用过滤规则这三种情况下路由丢失的可能原因进行分析。

1.路由发起过程的路由丢失

1)使用network命令发布路由使用network命令发布路由时,如果不指定发布网络的掩码,则BGP认为发布的是自然网段的路由,使用displayiprouting-table检查路由表中是否存在该自然网段的路由。在Quidway路由器中,BGP缺省不进行子网路由的自动聚合。因此,如果仅有子网路由,则不能被正确发布。

2)使用networkmask命令发布路由使用networkmask命令可以发布带子网掩码的路由,必须存在精确匹配的路由才能被正确地发布,使用displayiprouting-table检查路由表中是否存在网络地址和掩码都精确匹配的路由。

3)使用aggregate-address命令发布聚合路由使用aggregate命令可以对本地路由进行任意子网掩码长度的聚合,待聚合的路由需要存在于BGP路由表中,使用displaybgp确认BGP路由表是否存在这些路由。如果使用aggregatedetail-suppressed命令进行聚合,则只有聚合后的路由才能被发布,而具体路由都将被抑制。

4)故障处理提示

network命令发布路由时进行精确匹配。

Quidway路由器缺省不进行子网路由聚合(summary被禁止),而Cisco路由器缺省进行子网路由聚合。

aggregate对BGP路由表中的路由进行聚合,使用参数detail-suppressed将导致具体路由被抑制发布。

displayiprouting-table查看路由表的内容。

displaybgp查看BGP路由表的内容。

2.交换Update报文过程的路由丢失

1) Router_ID如果配置了路由反射,缺省情况下,以Router_ID作为群ID(Cluster_ID),当BGP邻居使用了相同的Router_ID时,就有可能导致在收到其他路由反射器发来的路由时,因为检查到Update报文的Cluster_List中包含自己的Cluster_ID而将报文丢弃。

2)存在一个以上路由反射器的群为了增加冗余度,预防单点故障,一个群中可能有一个以上的路由反射器,这时,群中所有的客户机必须与所有反射器都建立IBGP对等体关系。

3)被自动拒绝的路由满足以下条件的路由将会被自动丢弃:

(1) AS_PATH中包含本路由器的AS;

(2)路由反射器的Cluster_List中包含本路由器的Cluster_ID,这是为了防止由于引入路由反射器而在AS内部引起路由环路;

(3)路由反射器的ORIGINATOR_ID是本路由器,这也是为了防止由于引入路由反射器而在AS内部引起路由环路;

(4) martainNEXT_HOP(martain,一种非正常的IP地址);

(5) BGP对等体通告的路由下一跳为接收者的某一接口;

(6) EBGP对等体通告的路由的下一跳不属于该EBGP连接所在的网段;

(7) EBGP对等体通告的路由中,AS_PATH中的最近一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论