2015版S系列园区交换机维护手册第2册共3册_第1页
2015版S系列园区交换机维护手册第2册共3册_第2页
2015版S系列园区交换机维护手册第2册共3册_第3页
2015版S系列园区交换机维护手册第2册共3册_第4页
2015版S系列园区交换机维护手册第2册共3册_第5页
已阅读5页,还剩147页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2015版S系列园区交换机维护手册第2册,共3册SS维护宝典4故障定位指南04(2015-10-25)PAGE04(2015-10-25)PAGE150?.1.display命令表4-30display命令命令说明displaytrafficpolicystatistics查看接口流量统计displaydiagnostic-information查看诊断信息?.2.debugging命令表1调试命令命令说明debuggingcsshigig查看堆叠链路状态故障现象发生时,如何定位?.1.判断转发路径个端口所在单板是否同框,来判断转发路径是否是跨框转发。对于入端口和出端口是ETH-TRUNK叠口。可以通过在设备上配置流量统计,根据流量统计结果所在的槽位判断是否跨框转发。<Quidway>displaytrafficpolicystatisticsinterfaceEth-Trunk10inboundInterface:Eth-Trunk10Trafficpolicyinbound:testRulenumber:1Currentstatus:OK!Board:1/1ItemPacketsBytesMatched00+--Passed00+--Dropped00+--Filter00+--CAR00Board:2/1ItemPacketsBytesMatched00+--Passed00+--Dropped00+--Filter00+--CAR00路径为跨框转发,且丢包在堆叠设备上,则进入下一步。查询LPU与MPU以及MPU与堆叠卡hg连接拓扑。目的:确定流量走向,即路径的起点到终点,确定流量丢在哪条路径。方法:shell下:hgShow可以显示本板的hg连接信息,再通过BCM的showc来逐步确认流量在路径中哪个节点丢弃。?.2.查看转发表项是否正常对于堆叠设备做二层转发的情况,检查MAC表项是否正常。对于堆叠设备做三层转发的情况,检查ARP表项和路由表项是否正常。如果转发表项正常,则可能丢包在堆叠口上,进入下一步。?.3.检查HG统计对于V100R006以上版本,可以配置HIG口统计,将HIG统计的结果与面板口统计结果比较确认丢包在接口板还是主控板上,具体统计方法见S系列交换机流量统计使用指导,如果丢包在故障单板,则进入下一步。?.4.检查堆叠链路判断堆叠故障链路可以通过观察日志或者使用displaytrapbuffer命令查看是否有堆叠链路DOWN的告警信息,如果发现堆叠链路的状态为DOWN且一直没有恢复,或者频繁出现UP/DOWN的告警信息可以判断该条堆叠链路存在问题。Jun19201221:39:39XXW-CS-S9312-PCR.C01-01CSSM/4/STACKLINKDOWN:OID1.3.6.1.4.1.2011.5.25.183.3.3.2.12/14CSSport3down.Jun19201221:50:01XXW-CS-S9312-PCR.C01-01CSSM/4/STACKLINKUP:OID1.3.6.1.4.1.2011.5.25.183.3.3.2.22/14CSSport3up.Jun19201221:50:02XXW-CS-S9312-PCR.C01-01CSSM/4/STACKLINKDOWN:OID1.3.6.1.4.1.2011.5.25.183.3.3.2.12/14CSSport3down.Jun19201221:50:50XXW-CS-S9312-PCR.C01-01CSSM/4/STACKLINKUP:OID1.3.6.1.4.1.2011.5.25.183.3.3.2.22/14CSSport3up.如果工程师在现场,可以观察堆叠子卡的链路指示灯,如果堆叠线缆两端的堆叠指示灯不亮,即可判断该条堆叠链路存在问题。图中红框位置为堆叠指示灯。图4-19堆叠卡面板图排查具体的故障点堆叠系统的组建比较复杂,一条完整的堆叠链路涉及主控板,堆叠子卡,以及堆叠线缆,某条链路故障并不能简单判断具体的故障点,需要通过硬件替代测试来排查出具体的故障点。一般来说需要申请如下备件:1根堆叠线缆,1块堆叠子卡,1块主用主控板。首先判断出具体是哪条链路有故障,然后按照线缆、子卡、主用主控板的顺序依次进行更换,确认堆叠故障点。如果现场没有备件,也可以利用现有资源进行替代测试,依次交换故障线缆、故障子卡,进一步判断故障点。排除以上信息后仍不能定位,请联系研发人员处理。向研发求助时,应该采集哪些信息问题现象详细描述问题现象。组网信息详细描述组网,具体到出问题的端口号。操作过程详细描述从配置到问题出现的过程。详细描述按照定位步骤操作的定位过程和已经确认的信息。诊断信息displaydiagnostic-informationFAQ&定位经验?.1.堆叠基本查看命令由于堆叠相关的配置命令不会生成buildrun,必须使用相关命令才能查看的堆叠的配置信息。普通视图下,displaycssstatusall命令可以看到当前系统的基本配置,包括堆叠ID,堆叠优先级,堆叠是否使能了强制主等信息。[Quidway]displaycssstatusPropertyItemPropertyValueFrameID1Priority1EnableswitchOnCSSmasterforceOnCSSstatusmaster[S9306_21_21stack2]displaycssstatusallPropertyItemPropertyValueFrameID1Priority1EnableswitchOnCSSmasterforceOnCSSstatusmasterPropertyItemPropertyValueFrameID2Priority100EnableswitchOnCSSmasterforceOffCSSstatusbackup[S9306_21_21stack2]V200R003及后续版本新增命令行如下:<Quidway>displaycsschannelChassis1||Chassis2================================================================================Num[SRUAHG][VSTSPort(Status)]||[VSTSPort(Status)][SRUAHG]11/7HG0--1/7/0/1(UP16G)||2/7/0/4(UP16G)--2/8HG1421/7HG1--1/7/0/3(UP16G)||2/8/0/2(UP16G)--2/7HG1531/7HG14--1/8/0/4(UP16G)||2/7/0/1(UP16G)--2/7HG041/7HG15--1/8/0/2(UP16G!)||2/8/0/3(UP16G)--2/8HG151/8HG0--1/8/0/1(UP16G!)||2/8/0/4(UP16G)--2/7HG1461/8HG1--1/8/0/3(UP16G)||2/7/0/2(UP16G)--2/8HG1571/8HG14--1/7/0/4(UP16G)||2/8/0/1(UP16G!)--2/8HG081/8HG15--1/7/0/2(UP16G)||2/7/0/3(UP16G)--2/7HG1Currentsystemtime:2014-10-2513:37:10:0980Csschannel2lastphysicaldowntime:2014-10-2411:31:29:0780Csschannel3lastphysicaldowntime:2014-10-2411:31:29:0780Csschannel5lastphysicaldowntime:2014-10-2411:31:30:0280Csschannel7lastphysicaldowntime:2014-10-2513:21:29:0690Csschannel8lastphysicaldowntime:2014-10-2411:31:30:0280?.2.显示堆叠系统MAC及各板MAC命令查看堆叠系统MAC命令<Quidway>displaysystem-macMAC-num:1IndexMACAddrdefault0025-9e14-787bcurrent0000-0a88-1516其中回显字段MAC-num项表示当前堆叠系统是单MAC还是多MAC,current项显示为当前堆叠系统的MAC地址。堆叠合并以后,系统主的MAC就成为堆叠系统的系统MAC。单MAC情况下,接口的MAC、所有VLANIF的MAC也都是系统的MAC地址;此时my_station_tcam的MAC地址,每个板也都使用系统MAC的值。查看各单板MAC<Quidway>displaycsssystem-macSystem-mac:0000-0a88-1516,num:1CSSsystem-macconfiguration:SlotCurrentMAC(Num)ConfiguredCSSsystem-mac(Num)---------------------------1/7101b-54d8-0f50(1)NA(NA)1/8101b-54d8-0f50(1)NA(NA)2/70000-0a88-1516(1)NA(NA)2/80000-0a88-1516(1)NA(NA)Eth-Trunk故障定位Eth-Trunk是一种捆绑技术。将多个物理接口捆绑成一个逻辑接口,这个逻辑接口就称接口,捆绑在一起的每个物理接口称为成员接口。Eth-Trunk增加带宽、提高可靠性和负载分担的功能。在一个Eth-Trunk内,可以实现流量负载分担,同时也提供了更高的连接可靠性和更大的带宽。用户通过对逻辑口进行配置,实现各种路由协议以及其它业务。以Eth-Trunk为例。两台交换机通过3个接口直连,将这3个接口捆绑,形成一个Eth-Trunk接口,从而实现了增加带宽和提高可靠性的目的。图4-20Eth-Trunk示意图Eth-Trunk分类Eth-Trunk可分为手工负载分担模式和静态LACP模式。手工负载分担模式Eth-Trunk接口手工负载分担模式是一种最基本的链路聚合方式。在该模式下,Eth-Trunk的建立,成员接口的加入,以及哪些接口作为活动接口完全由手工来配置,没有链路聚合控制协议的参与。该模式下所有活动接口都参与数据的转发,分担负载流量,因此称为负载分担模式。该模式下所有的成员接口可以平均分担数据流量。如果活动链路中出现故障链路,链路聚合组自动在剩余的活动链路中平均分担数据流量。静态LACP(LinkAggregationControlProtocol)模式Eth-Trunk接口静态LACP模式下,Eth-Trunk手工负载分担模式链路聚合不同的是,该模式下活动接口的选择由LACP协议报文负责。也就是说,当把一组接口加入Eth-Trunk接口后,这些成员接口中哪些接口作为活动接口,哪些接口作为非活动接口还需要经过LACP协议报文的协商确定。静态LACP模式也称为M∶N模式。这种方式同时可以实现负载分担和冗余备份的双重功能。在链路聚合组中M条链路处于活动状态,这些链路负责转发数据并进行负载分担,另外N条链路处于非活动状态作为备份链路,不转发数据。当M条链路中有链路出现故障时,系统会从N条备份链路中选择优先级最高的接替出现故障的链路,同时这条链路状态变为活动状态开始转发数据。常用定位命令Eth-Trunk故障定位常用的定位命令如表4-31所示。表4-31display命令命令描述displayeth-trunk查看Eth-Trunk接口的配置信息。displayinterfaceeth-trunk查看Eth-Trunk接口的状态信息。displaytrunkmembershipeth-trunk查看Eth-Trunk接口及其成员口信息。displaytrunkfwdtbleth-trunk查看Eth-Trunk转发表。displayload-balance-profile查看指定增强负载分担模板的详细信息。displaylacpstatisticseth-trunk查看LACP模式下的LACP报文收发统计信息。displaytrunkindex-map查看Eth-TrunkID和内部索引值Index的对应关系。displaye-trunk查看E-Trunk的信息。Eth-TrunkUP故障定位流程图4-21手工负载分担模式Eth-Trunk接口不能UP的处理流程通过命令行displayeth-trunk下的WorkingMode字段查看是手工负载分担模式还是静态LACP模式:如果WorkingMode字段显示为NORMAL,说明是手工负载分担模式Eth-Trunk。<Quidway>displayeth-trunk1Eth-Trunk1'sstateinformationis:WorkingMode:NORMAL Hasharithmetic:AccordingtoSIP-XOR-DIPLeastActive-linknumber:3MaxBandwidth-affected-linknumber:8Operatestatus:down NumberOfUpPortInTrunk:1PortName Status WeightGigabitEthernet1/0/0 Up 1GigabitEthernet1/0/1 Down 1故障定位步骤步骤1检查成员口物理状态是否UP。成员口物理状态UP是Eth-Trunk正常工作的前提。通过命令displayeth-trunk查看Eth-Trunk接口下的成员口信息。如果成员口在Eth-Trunk下的状态为Down,通过命令displayinterface查看成员口的物理状态,如果成员口的物理状态为Down,则需要检查成员口的链路状态。步骤2检查Eth-Trunk接口下的配置。通过命令displayeth-trunk查看Eth-Trunk接口下是否配置了活动接口数目的下限阈值。如果Eth-Trunk接口下UP的成员口数目少于配置的活动接口数目的下限阈值时,Eth-Trunk状态会变为Down。<Quidway>displayeth-trunk1Eth-Trunk1'sstateinformationis:WorkingMode:NORMAL Hasharithmetic:AccordingtoSIP-XOR-DIPLeastActive-linknumber:3MaxBandwidth-affected-linknumber:8Operatestatus:down NumberOfUpPortInTrunk:1PortNameStatusWeightGigabitEthernet1/0/0Up1GigabitEthernet1/0/1Down1缺省情况下,Eth-Trunk活动接口数目下限阈值为1,可以通过命令leastactive-linknumberlink-number配置;活动接口数目上限阈值为8,可以通过命令maxactive-linknumberlink-number配置。步骤3如果以上步骤不能解决问题,请收集相关信息后联系技术支持工程师处理。结束LACPEth-Trunk故障定位流程4-22LACPEth-TrunkUP的处理流程Eth-Trunk的工作方式。方法一:通过命令行displayeth-trunk下的WorkingMode字段查看是手工负载分担模式还是LACP模式:Eth-Trunk;字段显示为STATIC,说明是LACP模式Eth-Trunk;版本,如果WorkingMode字段显示为LACP,说明是LACP模式Eth-Trunk。方法二:在Eth-Trunk视图下,查看Eth-Trunk视图下的配置。对于V100R006C03/V100R006C05/V200R001版本,在Eth-Trunk视图下查看是否有modelacp-static配置,如果有则是LACP模式Eth-Trunk。版本,在Eth-Trunk视图下查看是否有modelacp配置,如果有则是LACP模式Eth-Trunk。故障定位步骤步骤1检查成员口物理状态是否UP。Eth-Trunk正常工作的前提。通过命令displayeth-trunk查看Eth-Trunk接口下的成员口信息。如果成员口在Eth-Trunk下的状态为Down,通过命令displayinterface查看成员口的物理状态,如果成员口的物理状态为Down,则需要检查成员口的链路状态。步骤2检查Eth-Trunk接口下的配置。查看Eth-Trunk两端配置是否对等。因涉及到设备LACP报文的协商,需要两端都配置为LACP模式,Eth-Trunk下的其他配置也都建议配置对等。通过命令行displayeth-trunk查看Eth-Trunk下是否配置了活动接口数目的上限阈值和下限阈值。如果Eth-Trunk接口下UP的成员口数目少于配置的活动接口数目的下限阈值,则Eth-Trunk状态会变为Down。<Quidway>displayeth-trunk1Eth-Trunk1'sstateinformationis:Local:LAGID:1 WorkingMode:STATICPreemptDelay:Disabled Hasharithmetic:AccordingtoSIP-XOR-DIPSystemPriority:32768 SystemID:4cb1-6c3b-aaf5LeastActive-linknumber:1MaxActive-linknumber:8Operatestatus:down NumberOfUpPortInTrunk:ActorPortName Status PortTypePortPriPortNoPortKeyPortStateWeightGigabitEthernet1/0/1Unselect1GE3276811329 101000101GigabitEthernet1/0/2Partner:Unselect1GE3276821329 101000101ActorPortName SysPri SystemID PortPriPortNoPortKeyPortStateGigabitEthernet1/0/100000-0000-000000010100011GigabitEthernet1/0/200000-0000-000000010100011缺省情况下,Eth-Trunk活动接口数目下限阈值为1,可以通过命令leastactive-linknumberlink-number配置;活动接口数目上限阈值为8,可以通过命令maxactive-linknumberlink-number配置。如果在配置此命令前已经配置了leastactive-linknumber命令,则需要保证此命令所配置的上限阈值大于或等于leastactive-linknumber命令中设置的下限阈值。步骤3检查Eth-Trunk成员口的LACP报文收发是否正常。通过命令行displaylacpstatisticseth-trunk查看Eth-Trunk成员口下的LACP协商报文收发是否正常。<Quidway>displaylacpstatisticseth-trunk1Eth-Trunk1'sPDUstatisticis:Port LacpRevPdu LacpSentPduMarkerRevPduGigabitEthernet1/0/1 100 100 0 0报文增长数目同Eth-Trunk接口下配置的报文超时时间相关:[Quidway-Eth-Trunk1]lacptimeoutslow/fast配置fast的超时时间后,对端发送LACP报文的周期为1源相对slow参数情况较大;配置slow的超时时间后,对端发送LACP报文的周期为30秒,响应性较fast低一些,但占用系统资源也比较少。两端配置的超时时间可以不一致,但为了便于维护,建议用户配置一致的LACP协议报文超时时间。如果接收的LACP协议报文计数增长不正确,则检查是对端设备没有发出还是被本端设备收到后丢弃;如果本端收到的LACP报文计数不正确,需要检查为什么本端口没有正常接收LACP协议报文。对于S2700、S3700SI、S3700EI、S5700EI、S5700SI、S5710LI,如果对端设备发出LACP报文而本端设备没收到,需要查看Eth-Trunk接口上是不是使能了bpduenable。S9300和其他盒式设备:通过ACL来上抓LACP报文进行处理,如果对端设备发出LACP报文而本端设备没收到,需要查看下ACL是否正常下发:步骤4如果经过以上定位,LACP模式Eth-Trunk仍不能正常协商成功,请搜集相关信息后联系技术支持工程师处理。结束Eth-Trunk故障定位流程图4-23Eth-Trunk接口下流量负载分担不均的处理流程故障定位步骤步骤1确认转发报文是已知单播还是非已知单播。已知单播和非已知单播的转发流程不一样,且默认的HASH确认转发报文是已知单播还是非已知单播。步骤2检查Eth-Trunk下的HASH算法。对于已知单播,通过命令displayeth-trunk查看Hasharithmetic字段确认配置的HASH方式,也可以通过Eth-Trunk接口下的配置来查看。<Quidway>displayeth-trunk1Eth-Trunk1'sstateinformationis:Local:LAGID:1 WorkingMode:STATICPreemptDelay:Disabled Hasharithmetic:AccordingtoSIP-XOR-DIPSystemPriority:32768 SystemID:4cb1-6c3b-aaf5LeastActive-linknumber:1MaxActive-linknumber:8Operatestatus:down NumberOfUpPortInTrunk:ActorPortName Status PortTypePortPriPortNoPortKeyPortStateWeightGigabitEthernet1/0/1Unselect1GE3276811329 101000101GigabitEthernet1/0/2Partner:Unselect1GE3276821329 101000101ActorPortName SysPri SystemID PortPriPortNoPortKeyPortStateGigabitEthernet1/0/100000-0000-000000010100011GigabitEthernet1/0/200000-0000-000000010100011缺省情况下,Eth-Trunk接口默认负载分担模式如表4-32所示。表4-32Eth-Trunk接口默认负载分担模式版本Eth-Trunk接口默认负载分担模式V100R006C03/V100R006C05src-dst-macV200R0015700SI、S5710LI、S5700EI为src-dst-mac,其他形态交换机为src-dst-ip。V200R002/V200R003/V200R005S5700SI、S5700EI为src-dst-mac,其他形态交换机为src-dst-ip。V200R006src-dst-ip对于广播报文和组播报文,可在系统视图下执行命令unknown-unicastload-balancedmac|smac|smacxordmac|enhanced}来配置其负载分担方式。说明框式交换机:V200R001/V200R002/V200R003/V200R005/V200R006都支持此命令。盒式交换机:V100R006C03版本:仅S2752EI、S3700支持此命令,但是不支持enhanced参数。V100R006C05版本:仅S2710SI、S2700-52P-EI、S2700-52P-PWR-EI、S3700支持此命令,但是不支持enhanced参数。V200R001版本:仅S5700EI、S5710EI、S5700HI支持此命令,另外仅S5700HI支持enhanced参数。V200R002版本:仅S5700EI、S5710EI、S5700HI支持此命令,另外仅S5700HI、S5710EI支持enhanced参数。V200R003版本:仅S5700EI、S5710EI、S5700HI、S5710HI支持此命令,另外仅S5700HI、S5710HI、S5710EI支持enhanced参数。V200R005版本:只有S6700、S5700EI、S5710EI、S5710HI和S5700HI支持此命令。V200R006版本:只有S5720HI支持此命令。如果配置了增强型负载分担方式,可以通过命令行displayload-balance-profile查看针对每一种特征报文的HASH方式。增强HASH和非已知单播同样生效,针对不同报文类型选取不同的字段进行计算。说明框式交换机:除了SA系列单板不支持增强型的负载分担模式,其他单板都支持。盒式交换机:V200R001C01:仅S5700HI支持增强型的负载分担模式。V200R002:仅S5710EI、S5700HI支持增强型的负载分担模式。S5710EI、S5700HI、S5710HI支持增强型的负载分担模式。V200R005:所有形态都支持。[Quidway-load-balance-profile-a]displayload-balance-profileaLoad-balance-profile:aPacket HashField---------------------------------IPV4 sip dipIPV6 sip dipL2 smac dmacMPLS top-label 2nd-label步骤3判断转发报文的报文特征和配置的HASH方式是否一致。确认Eth-Trunk接口下的转发报文的报文特征和配置的HASH方式是否一致。如果不一致,例如转发报文的MAC地址变化而设置的HASH方式为src-ip,则无法负载分担。每一种HASH方式根据对应字段的特定bit位进行计算,如果源IP地址/MAC地址字段变化的bit没有参与HASH计算,即使转发报文的报文特征和配置的HASH方式一致,流量也不能均衡负载分担,此时就需要使用增强HASH模板。另外,部分特殊报文如MPLS报文转发也需要应用增强模板。步骤4查看Eth-Trunk接口下被选中的成员口数。如果转发报文是已知单播或非已知单播,且为普通负载分担方式,假设被Eth-Trunk选中的成员口数为x,在流量特征变化相对均衡时,当x为2的变化次数是x的整数倍时,流量会负载分担均衡。如果配置了增强HASH,端口号也会参与HASH计算,使得HASH更为均匀。步骤5如果以上步骤不能解决问题,请收集相关信息后联系技术支持工程师处理。结束Ping不通故障定位Ping概述Ping是基于ICMP协议实现的。通过从源端向目的端发送ICMP回显请求(EchoRequest)报文后,根据是否收到目的端的ICMP回显应答(EchoReply)报文来判断目的端是否可达。即源端在一个有效时间内(等待回显应答报文超时时间之前)收到目的端返回的ICMP回显应答报文,则说明目的端可达。如果在有效时间内,没有收到应答报文,则说明目的端不可达。对于可达的目的端,根据发送报文个数、接收到响应报文个数来判断链路的质量,根据Ping报文的往返时间来判断源端与目的端之间的“距离”。Ping流程解析

如图4-24所示,PC1想要Ping通PC2,即ping11.1.1.2。图4-24Ping过程过程如下:PC1的Ping程序生成一个ICMP请求回显报文。ICMP报文沿协议栈向下传输到IP层,封装IP头,包含源地址IPIP。在此封装过程中,IP层已经根据IP地址和掩码判断出了源IP与目的IP不属于同一网段。ICMP的MAC地址,暂时无法进行封装。由于已经知道了源IP与目的IP不属于同一网段,故PC1要查找FIB的下一跳。如果PC1没找到下一跳,则得不到下一跳的IP,也得不到下一跳的MAC地址,以太帧头无法进行封装,于是PC1就ping不通PC2。如果PC1找到了下一跳,得到了下一跳的IPMAC地址,故PC1要发送ARP广播请求。下一跳(Switcha10.1.1.2/24)收到此请求以后,发现请求所对应的IP地址是自己,于是回复一个ARP单播应答给PC1,此应答包含了10.1.1.2/24所对应的MAC址。PC1此时已经收到ARP应答,得到了下一跳的MAC然后将数据报发送给Switch。当PC1向Switch发送ARP请求时,将自己的IP地址到物理地址的映射写入ARP请求中。当Switch收到PC1的ARP请求后,Switch就将PC1的这一映射写入到了自己的ARP缓存中。这是因为以后很可能Switch也要向PC1进行数据传送,为了以后彼此通信的方便,避免老是发送ARP请求及应答,减少网络上的通信。Switch收到数据报后,拆掉以太帧头,上送到IP层,发现IP首部中的目的IP地址11.1.1.2/24当封装到以太帧头时,发现目的MAC地址(11.1.1.2/24对应的MAC地址)未知,故Switch也要发ARP广播请求。PC2收到此请求以后,发现请求所对应的IP地址是自己,于是回复一个ARP应答给Switch,此应答包含了11.1.1.2/24所对应的MAC地址。与前面Switch学习PC1的ARP映射一样,PC2也相应地在自己的ARP缓存中记录了Switchb口的IP地址到物理地址的映射。Switch此时已经收到ARP应答,得到了PC2的MAC地址,进行以太帧头的封装。然后将数据报发送给PC2PC2收到此数据报后,拆封以太帧头,拆封IP首部后发现是个ICMP请求回显报文,于是会回复一个ICMP回显应答报文给PC1。此时的源IP地址变成了PC2的地址11.1.1.2/24,目的IP地址变成了PC1的IP地址10.1.1.1/24。由于目的IP与源IP不在同一网段,所以PC2也要查找FIB表,经查找得知下一跳为Switchb口11.1.1.1/24。如前所述,PC2的ARP缓存中已经记录了Switchb口的映射信息,故不需要再向Switch发送ARP请求,直接在ARP缓存中读到Switch11.1.1.1/24的MAC地址进行封装,将数据报发给Switch。同理Switch也不用向PC1发送ARP请求,直接在自己的ARP缓存中读到PC1的MAC地址,将数据报转发给PC1。PC1收到数据报后,逐层拆封以太帧头、IP首部,得到ICMP回显应答,显示Ping通。Ping故障定位流程图4-25Ping不通故障定位流程图故障定位步骤步骤1检查配置检查交换机上端口配置、VLAN配置、VLANIF接口配置、IP地址配置是否正确,首先排除配置问题。确认两端端口的端口类型,两端VLAN的封装方式是否一致,配置的VLANIF接口网段是否存在问题。步骤2检查链路检查物理链路连接,如有问题,立即排除。光纤或网线连接的端口需要和网络要求的部署一致。光纤所带的光模块波长参数需要一致,光模块建议使用华为认证光模块。Eth-Trunk接口连接,两端设备上Eth-Trunk需要保持一致;若Eth-Trunk启用LACP协议,需要保证LACP协议状态稳定。检查两端设备之间是否有传输设备,两端的物理端口是否处于UP状态。确认Ping业务经过的物理端口是否存在CRC长。检查物理端口是否存在阻塞现象。检查设备上是否运行了STP、RRPP或SMARTLINK等二层协议,确认Ping业务经过的物理端口是否被阻塞。参考命令如表4-33所示。表4-33检查端口是否存在阻塞命令命令功能displaystpbrief查看生成树的状态和统计信息摘要。displayrrppverbosedomiandomain-id查看设备上RRPP配置的详细信息。displaysmart-linkgroupall查看所有SmartLink组的状态信息。步骤3检查路由检查设备上是否存在到Ping目的地址的路由。如果和交换机连接的是终端设备,检查终端设备上是否配置了正确的网关地址。由。参考命令:displayiprouting-table如果路由不正常,检查接口协议状态是否UP,设备上运行的路由协议是否正常,排查路由故障。步骤4检查ARP表项检查直连地址的ARP相关命令:displayarpdisplayarpinterfacevlanifvlanif-id如果ARP学习正确,查看MAC表项,确认MAC地址的出端口和ARP的物理出端口是否一致。相关命令:displaymac-addressmac-addressdisplaymac-addressmac-addressvlanvlan-id如果ARP学习不到,排查ARP故障,步骤如下:检查设备上是否使能严格ARP学习,若配置将其去使能后观察能否正常学习ARP。在不能互相学习ARP的两端设备的其中一端执行Ping-c操作(即发送多个Ping报文),命令行如下:ping-c100000ip-address也可视情况添加-t/-m等参数将Ping的速率适当调整。pingc操作会不断触发本端设备发出ARP请求报文,可通过流量统计确认ARP请求报文是否从端口送出。通过流量统计检查对端设备的物理端口是否收到了ARP请求报文。若收到ARP请求,查看是否能生成ARP表项,并是否能回应同样可采用流量统计方法确认报文是否从对端设备物理口发出。若未发出,联系技术支持工程师处理。检查本端设备是否收到报文,若物理端口上收到但没有上送CPU,联系技术支持工程师处理。ARP请求和ARP回应报文的流量统计配置,步骤示例如表4-34所示。说明以下步骤中接口编号、VLAN编号、MAC地址只是举例,实际定位过程中,请注意替换。表4-34ARP请求和ARP回应报文的流量统计配置步骤说明配置命令进入系统视图执行命令system-view,进入系统视图。配置流分类执行命令trafficclassifierclassifier-nameoperator流分类。执行命令if-matchl2-protocolarp,配置匹配ARP报文。执行命令if-matchsource-macmac-address,配置匹配源MAC。执行命令if-matchdestination-macmac-address,配置匹配目的MAC。执行命令if-matchvlan-idvlan-id,配置匹配VLAN。执行命令quit,退回到系统视图。说明ARP请求报文的目的MAC匹配FFFF-FFFF-FFFF,源MAC匹配发送端设备MAC;ARP回应报文目的MAC匹配对端设备MAC,源MAC匹配本端设备MAC。步骤说明配置命令配置流行为执行命令trafficbehaviorbehavior-name,新建一个流行为。执行命令statisticenable,使能流量统计。执行命令quit,退回到系统视图。配置流策略执行命令trafficpolicypolicy-name,新建一个流策略。执行命令classifierclassifier-namebehaviorbehavior-name,关联流分类和流动作。执行命令quit,退回到系统视图。将流策略应用到需要进行流量统计的接口执行命令interfaceinterface-typeinterface-number行流量统计的接口。执行命令traffic-policypolicy-nameinbound接口的入方向。执行命令quit,退回到系统视图。步骤5检查报文收发情况Ping不通问题或Ping有丢包问题的定位关键是确认报文丢在哪,可以通过如下几个方式进行确认。ICMP统计进行Ping操作时,通过命令displayicmpstatistics查看ICMP报文的收发情况,echo和echoreply报文收发是否一致,是否存在checksum错误统计计数。通过resetipstatistics命令用来清除统计计数。<HUAWEI>displayicmpstatisticsInput:badformats0badchecksum0echo521destinationunreachable0sourcequench0redirects0echoreply19parameterproblem0timestamp0informationrequest0maskrequests0maskreplies0timeexceeded0timestampreply0Mpingrequest0Mpingreply0Output:echo19destinationunreachable0sourcequench0redirects0echoreply512parameterproblem0timestamp0informationrequest0maskrequests0maskreplies0timeexceeded0timestampreply0Mpingrequest0Mpingreply0IP层调试开关这一层调试开关需要定义ACL匹配Ping报文,即源IP、目的IP地址,进行Ping操作同时打开IP层调试开关,观察报文的收发情况。配置命令如下:#aclnumber3333rule5permiticmpsourcex.x.x.x0destinationy.y.y.y0rule10permiticmpsourcey.y.y.y0destinationx.x.x.x0#debuggingippacketacl3333verbose下面举例说明:如:ping7.8.20.5PING7.8.20.5:56databytes,pressCTRL_Ctobreak*0.55569503L3FC-4IP/7/debug_case:Sending,interface=Vlanif20,version=4,headlen=20,tos=0,pktlen=84,pktid=35000,offset=0,ttl=255,protocol=1,checksum=64727,s=7.8.20.4,d=7.8.20.5prompt:SendingthepacketfromlocalatVlanif204500005488b80000ff01fcd707081404070814050800009eabcf0001034fec5e8100c00150494e000000ff05000102030405060708090a0b0c0d0e0f101112131415161718191a1b1c1d1e1f2021222324252627Replyfrom7.8.20.5:bytes=56Sequence=1ttl=255time=2ms*0.55569603L3FC-4IP/7/debug_case:Receiving,interface=Vlanif20,version=4,headlen=20,tos=0,pktlen=84,pktid=44132,offset=0,ttl=255,protocol=1,checksum=55595,s=7.8.20.5,d=7.8.20.4prompt:ReceivingIPpacketfromVlanif2045000054ac640000ff01d92b070814050708140400000e9dabcf0001034fec5e8100c001504e470000000002000102030405060708090a0b0c0d0e0f101112131415161718191a1b1c1d1e1f2021222324252627CPCAR统计查看CPCAR的统计情况,检查ICMP报文是否由于CPCAR超出限制被丢弃。相关命令:框式V100R002版本、盒式V100R005版本:displaycpu-defendicmpstatisticsall框式V100R003及之后、盒式V100R006及之后的版本:displaycpu-defendstatisticspacket-typeicmpall主要关注Drop计数是否在增加。如果Drop计数在增加,说明存在CPCAR丢包,可以适当增加car值再进行Ping测试,看问题是否解决。最后建议恢复car值。流量统计配置流量统计,确认报文的收发情况。步骤示例如表4-35所示。表4-35流量统计配置步骤说明配置命令进入系统视图执行命令system-view,进入系统视图。定义ACL,匹配Ping的源和目的IP地址执行命令aclnumberacl-number,新增一个ACL。说明这里的ACL一定要是高级ACL,编号范围为3000~3999。执行命令rulerule-idpermiticmpsourcesource-ip0destinationdestination-ip0,定义ACL下的规则,匹配ICMP请求报文。执行命令rulerule-idpermiticmpsourcesource-ip0destinationdestination-ip0,定义ACL下的规则,匹配ICMP应答报文。执行命令quit,退回到系统视图。配置流分类执行命令trafficclassifierclassifier-nameoperator流分类。执行命令if-matchaclacl-number,配置匹配前面定义的ACL。执行命令quit,退回到系统视图。步骤说明配置命令配置流行为执行命令trafficbehaviorbehavior-name,新建一个流行为。执行命令statisticenable,使能流量统计。执行命令quit,退回到系统视图。配置流策略执行命令trafficpolicypolicy-name,新建一个流策略。执行命令classifierclassifier-namebehaviorbehavior-name,关联流分类和流动作。执行命令quit,退回到系统视图。将流策略应用到需要进行流量统计的接口执行命令interfaceinterface-typeinterface-number行流量统计的接口。执行命令traffic-policypolicy-nameinbound接口的入方向。执行命令traffic-policypolicy-nameoutbound在接口的出方向。执行命令quit,退回到系统视图。配置完成后,执行Ping命令,查看流量统计情况。相关命令:displaytrafficpolicystatisticsinterfaceGigabitEthernet0/0/1inbounddisplaytrafficpolicystatisticsinterfaceGigabitEthernet0/0/1outbound如果outbound方向没有统计计数,说明报文没有发送出去;如果inbound方向没有统计计数,说明没有收到应答报文。说明S2752-EI、S3700SI、S3700EI设备不支持接口出方向的流量统计。配置镜像查看报文收发情况如果端口上流量不大,可以直接用端口镜像,配置步骤示例如表4-36所示。如果端口上流量较大,可以使用流镜像,配置步骤示例如表4-37所示。表4-36端口镜像配置步骤说明配置命令进入系统视图执行命令system-view,进入系统视图。配置观察端口执行命令observe-portport-numberinterfaceinterface-typeinterface-number,配置观察端口。配置端口镜像执行命令interfaceinterface-typeinterface-number镜像的端口。执行命令port-mirroringtoobserve-portport-numberboth,将接口上的收发报文都镜像到观察端口。表4-37流镜像配置步骤说明配置命令进入系统视图执行命令system-view,进入系统视图。配置观察端口执行命令observe-portport-numberinterfaceinterface-typeinterface-number,配置观察端口。配置ACL,定义需要进行镜像的流执行命令aclnumberacl-number,新增一个ACL。说明这里的ACL一定要是高级ACL,编号范围为3000~3999。执行命令rulerule-idpermiticmpsourcesource-ip0destinationdestination-ip0,定义ACL下的规则,匹配ICMP请求方向的报文。执行命令rulerule-idpermiticmpsourcesource-ip0destinationdestination-ip0,定义ACL下的规则,匹配ICMP应答方向的报文。执行命令quit,退回到系统视图。配置流分类执行命令trafficclassifierclassifier-nameoperator新建一个流分类。执行命令if-matchaclacl-number,配置匹配前面定义的ACL。执行命令quit,退回到系统视图。配置流行为执行命令trafficbehaviorbehavior-name,新建一个流行为。执行命令mirroringobserving-portport-id为镜像到观察端口。执行命令quit,退回到系统视图。配置流策略执行命令trafficpolicypolicy-name,新建一个流策略。执行命令classifierclassifier-namebehaviorbehavior-name,关联流分类和流动作。执行命令quit,退回到系统视图。口下应用流策略。执行命令interfaceinterface-typeinterface-number要进行流量统计的接口。执行命令traffic-policypolicy-nameinbound应用在接口的入方向。执行命令traffic-policypolicy-nameoutbound应用在接口的出方向。执行命令quit,退回到系统视图。通过对镜像报文进行分析,不仅可以确认报文的收发情况,同时可以对报文进行校验,包括:报文的VLAN是否正确、报文的目的MAC地址是否是设备系统MAC地址、报文IP头的checksum是否正确、ICMP的checksum是否正确。步骤6如果以上步骤不能解决问题,请收集相关信息后联系技术支持工程师处理。结束STP故障定位常用命令STP故障定位常用的定位命令如表4-38所示。表4-38display命令命令描述displaycurrent-configuration|includestp查看全局STP配置。displaycurrent-configurationinterfaceinterface-typeinterface-number查看接口配置信息。displaystpregion-configuration查看MST域配置信息。displaystpbrief查看生成树的状态和统计信息摘要。displaystp查看生成树的状态信息和统计信息。displaystptc-bpdustatistics(框式V100R006版本/盒式V100R005版本开始)displaystptopology-change(框式V100R006版本/盒式V100R005版本开始)查看端口TC/TCN报文收发计数。故障定位流程图4-26端口无法快速收敛故障处理流程故障定位步骤步骤1确认对端端口是否使能STP。终端、服务器都不支持STP协议,如果这些设备和交换机连接,建议将交换机上的端口配置为边缘端口或直接去使能STP,端口下配置stpedged-portenable或stpdisable。否则,当用户拔插链路、或shutdown/undoshutdown端口后,因对端端口不会发送STP协议报文进行协商,导致交换机上的端口进入慢收敛,2倍的forward-delay(默认15秒)时间后才能正常转发报文。如果端口下已经配置stpedge-portenable,通过displaystpinterface命令检查是否边缘端口失效,只有Config、Active均为enabled,边缘端口配置才生效:<Quidway>displaystpinterfaceGigabitEthernet1/0/1[Port43(GigabitEthernet1/0/1)][UP]PortProtocol :EnabledPortRole PortPortPriority :128PortCost(Dot1T) :Config=autoActive=200000000DesignatedBridge/Port :32768.4cb1-6c3b-aaf5128.43PortEdged :Config=enabled/Active=enabled当边缘端口收到STP报文后,Active标志会置为disabled,此时该端口功能等同于普通STP口,已经没有边缘端口的特性,会记录如下日志:MSTP/4/EDGE_PORT:Edged-port[port-name]receivedBPDUpacket,thentheactivestateoftheedged-portwillbedisabled!此时需要排查该端口互联设备配置是否变化或透传了STP报文。步骤2检查端口是否工作在传统STP工作模式。STP协议在其发展过程中,始终保持向下兼容。全局配置为RSTP/MSTP模式的设备,当端口接收到传统STP模式报文后,端口可以自动迁移到STP模式下工作。通过命令行displaystpinterface查看端口实际的工作模式:<Quidway>displaystpinterfaceGigabitEthernet2/0/6[Port28(GigabitEthernet2/0/6)][FORWARDING]PortProtocol :EnabledPortRole :DesignatedPortPortPriority 128PortCost(Dot1T) :Config=auto/Active=20000DesignatedBridge/Port :32768.0026-0000-9140/PortEdged :Config=default/Active=disabledPoint-to-point :Config=auto/Active=trueTransitLimit :147packets/sProtectionType :NonePortSTPMode :STPPortProtocolType:Config=auto/Active=dot1sBPDUEncapsulation:Config=stp/Active=stpPortTimes :Hello2sMaxAge20sFwDly15sRemHopTCorTCNsend 12TCorTCNreceived 5BPDUSent 24TCN:0,Config:24,RST:0,MST:0BPDUReceived 1TCN:0,Config:1,RST:0,MST:0接口快速迁移机制,即Proposal/Agreement机制。由于传统STP模式不能提供快速迁移机制,端口状态变化后需要等待2倍的forward-delay(默认15秒)才能迁移到转发状态。同时,可以通过BPDUSent、BPDUReceived发送、接收的STP报文类型。S系列交换机支持Proposal/Agreement机制的两种实现方式,默认为增强方式:增强方式:当前端口在计算同步标志位时计算根端口。上游设备发送Proposal报文,请求进行快速迁移,下游设备接收到后,把与上游设备相连的端口设置为根端口,并阻塞所有非边缘端口。上游设备继续发送Agreement报文,下游设备接收到后,根端口转为Forwarding状态。下游设备回应Agreement报文,上游设备接收到后,把与下游设备相连的端口设置为指定端口,指定端口进入Forwarding状态。普通方式:当前接口在计算同步标志位时忽略根端口。上游设备发送Proposal报文,请求进行快速迁移,下游设备接收到后,把与上游设备相连的端口设置为根端口,并阻塞所有非边缘端口,根端口转为Forwarding状态。下游设备回应Agreement报文,上游设备接收到后,把与下游设备相连的端口设置为指定端口,指定端口进入Forwarding状态。可以通过在S系列交换机端口配置stpno-agreement-check命令来避免端口连接的上游桥设备为RSTP交换机或者与MSTP实现存在私有性差异的厂商设备时,上游桥设备不能快速迁移问题。当端口自动迁移到STP兼容工作模式后,以下情况端口无法自动迁回MSTP模式,需要在端口上执行stpmcheck操作,将端口手动迁移到MSTP模式:运行STP的交换机被关机或移走运行STP的交换机切换为MSTP模式说明在一棵生成树中,对于互相连接的两台交换设备,离根桥近的交换机设备即为另外一台交换设备的上游设备。步骤3检查端口链路类型是否为点对点。RSTP/MSTP模式提供了端口快速迁移机制:当两端均使能STP,而且链路类型为点对点时,才能实现端口状态的快速迁移。可以通过stppoint-to-point命令配置链路类型,端口的链路类型默认为auto,即由RSTP/MSTP来检测与端口相连的链路是否是点到点链路。两端均工作在全双工模式时才可能为点对点链路。通过命令行displayinterfaceinterface-typeinterface-number查看端口的双工状态是否为Full。<Quidway>displayinterfacegigabitethernet2/0/6GigabitEthernet2/0/6currentstate:UPLineprotocolcurrentstate:UPDescription:SwitchPort,PVID: 1,TPID:8100(Hex),TheMaximumFrameLengthis9216IPSendingFrames'FormatisPKTFMT_ETHNT_2,Hardwareaddressis0025-9ef4-abcdLastphysicaluptime :-Lastphysicaldowntime:2012-05-2421:01:26Currentsystemtime:2012-06-0518:56:41PortMode:COMMONFIBER,Transceiver:1000_BASE_SX_SFPSpeed:1000, Loopback:NONEDuplex:FULL, Negotiation:通过命令行displaystpinterface查看端口的链路类型。<Quidway>displaystpinterfaceGigabitEthernet2/0/6[CIST][Port14(GigabitEthernet2/0/6)][FORWARDING]PortProtocol :enabledPortRole :DesignatedPortPortPriority 128PortCost(Dot1T) :Config=auto/Active=20000Desg.Bridge/Port :32768.4c1f-cc1f-56b7/PortEdged :Config=default/Point-to-point :Config=auto/Active=trueTransitLimit :147packets/hello-timeProtectionType :NonePortStpMode :MSTPPortProtocolType:Config=auto/Active=trueBPDUEncapsulation:Config=stp/Active=stpPortTimes :Hello2sMaxAge20sFwDly15sRemHopTCorTCNsend 2TCorTCNreceived 0BPDUSent 103219TCN:0,Config:0,RST:0,MST:103219BPDUReceived 0TCN:0,Config:0,RST:0,MST:0Config=auto表示配置值为auto,Active=true表示当前工作在点对点链路类型。步骤4处理。结束镜像故障定位镜像规格S7700/S9700的端口镜像规格整机支持配置8个观察端口,这8个端口可以分布在同一块单板或不同的单板。E系列、系列、S系列单板入方向支持2个观察端口,FC/SC1个观察端口,观察端口可以跨板或同板,没有限制。每块单板出方向支持1个观察端口,观察端口可以跨板或同板,没有限制。E系列、系列、S系列共2+1=3个,FC/SC系列共1+1=2个。在入方向完成复制。S2700/S3700/S5700/S6700的端口镜像规格表4-39S2700/S3700/S5700/S6700的端口镜像规格产品形态|可绑定观察端口数量镜像端口数量S2700SI入方向和出方向共1个无限制产品形态|可绑定观察端口数量镜像端口数量S2700EI入方向和出方向共1个无限制S3700SI4|1无限制S3700EI4|1无限制S3700HI2|1无限制S5700SI入方向和出方向共1个无限制S5700EI4|1无限制S5700HI2|1无限制S5700LI入方向和出方向共1个无限制S6700入方向和出方向共1个无限制镜像常见问题和定位指导

为什么配置镜像获取报文后,PC查看与PC相连的交换机端口是否有流量发出<Quidway>displayinterfaceGigabitEthernet1/0/1GigabitEthernet1/0/1currentstate:DOWNLineprotocolcurrentstate:DOWN//端口是否UPDescription:SwitchPort,PVID: 1,TPID:8100(Hex),TheMaximumFrameLength9216IPSendingFrames'FormatisPKTFMT_ETHNT_2,Hardwareaddressis4cb1-6c3b-aaf5Lastphysicaluptime :-Lastphysicaldowntime:2013-07-1119:15:42UTC+08:00Currentsystemtime:2013-08-0201:18:07+08:00PortMode:COMMONCOPPERSpeed:1000, NONEDuplex:FULL, ENABLEMdi :AUTO, DISABLELast300secondsinputrate0bits/sec,0secLast300secondsoutputrate0bits/sec,0packets/sec//计Inputpeakrate0bits/sec,Recordtime:-Outputpeakrate0bits/sec,Recordtime:-如果与PC相连的端口有报文发出,则可能是PC机的问题导致没有获取到报文:如果需要获取的数据帧长比较大,您可以确认下PC能,如下所示,注意不同厂商PC网卡显示可能会有差异;图4-27PC网卡显示不同网卡差异比较大,会有PC网卡的其他问题,可换台PC文。为什么获取到的报文没有带VLAN获取到的报文没有带VLANTag,与PC机的设置有关。使用PC进行报文获取时,会发现其在接受数据包的时候过滤了VLANTag,使得Ethereal获取到的数据包中不含VLANTag,此时需要通过修改注册表让驱动保留VLANTag。

端口镜像注意事项镜像端口的总流量不能超过观察端口的带宽。观察端口专门用于故障定位或流量分析,不作为普通业务口。同一台设备中,镜像报文不可以再做镜像。某些PC机无法带双层的报文,需要更换不同网卡的PC掉一层再抓包。远程端口镜像注意事项对于S7700/S9700V100R003/V100R006版本,ETH-TRUNK接口作为二层远程端口镜像观察端口时,配置为远程镜像观察口的ETH-TRUNK不可以配置static工作模式。三层远程端口镜像抓到的报文是带GRE头的,用Wireshark不能正常解析。S2700/S3700/S5700不支持三层远程端口镜像。二层网络互通。二层远程镜像VLAN只作为镜像用,建议在镜像VLAN下关闭MAC学习功能。传输结点上镜像VLANID和PVID一致,需要和porttrunkallow-passvlanvlan-id或porthybridtaggedvlanvlan-id中的VLANID保持一致。镜像问题定位指导检查镜像配置是否正确检查使用观察口是否超过规格检查是否存在镜像注意事项

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论