网络故障分析与处理课件_第1页
网络故障分析与处理课件_第2页
网络故障分析与处理课件_第3页
网络故障分析与处理课件_第4页
网络故障分析与处理课件_第5页
已阅读5页,还剩278页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 常见网络故障分析与处理8.1 网络故障概述8.2 网络故障的方法8.3 网络故障的排查工具8.4 网络故障的分类处理8.5 常见网络故障诊断及维护案例 网络是复杂的,网络出现故障的原因是多种多样的,那么该如何诊断网络故障,以及如何进行网络故障的修复呢? 在修复网络故障的过程中,常常会遇到许多问题,有没有可以遵循的原则呢? 对于大多数管理员来说,主要任务就是整个企业网络系统的维护。每当网络系统出现故障时,是最令管理员们头痛的事。因此,故障管理成为整个网络管理的重中之重。8.1 网络故障概述 1网络复杂性的原因 当今的网络互联环境是复杂的,而且其复杂性还在日益增长.主要原因如下: 现代的因

2、特网要求支持更广泛的应用,包括数据、语音、视频及它们的集成传输; 新业务发展使网络带宽的需求不断增长,这就要求新技术的不断出现。例如:十兆以太网向百兆、千兆以太网的演进; 提供QoS能力等。新技术的应用同时还要兼顾传统的技术。例如,传统的SNA体系结构仍在某些场合使用,DLSw作为通过TCP/IP承载SNA的一种技术而被应用。8.1 网络故障概述 2网络故障及故障管理 什么是网络故障?网络故障就是网络不能提供服务,局部的或全局的网络功能不能实现。 用户感知的只是应用层的服务不能实现,但应用层的服务要依赖它下面几层的正确配置和连接;不仅仅是依靠服务器,同样也需要客户端的正确配置。 8.1 网络故

3、障概述 2网络故障及故障管理 故障(失效)管理(fault management)是网络管理中最基本的功能之一。用户都希望有一个可靠的计算机网络。当网络中某个组成失效时,网络管理系统必须迅速找到故障,及时排除。 分析网络故障原因是网络故障管理的核心内容。对故障的处理包括故障检测、故障定位、故障隔离、重新配置、修复或替换失效的部分,使系统恢复正常状态。 故障管理具有如下功能。 8.1 网络故障概述 1)故障警告功能 由管理对象主动向管理主机报告出现的异常情况,叫故障警告,其必须包含足够多的信息,详细说明出现异常的地点、原因、特征,以及可能采取的应对措施等。 8.1 网络故障概述 2)事件报告管理

4、功能 事件报告管理功能目的是对管理对象发出的通知进行先期的过滤处理,并加以控制,以决定通知是否应该改善给其它有关管理系统,是否需要改善给后备系统以及控制改善的频率等。 有两个管理对象,一个是区分器,主要作用是对管理对象发出的通知进行测试和过滤;另一个是事件转发区分器,主要用于确定转发的目标。 8.1 网络故障概述 5)确认和诊断测试的分类 确认和诊断测试可分为连接测试、可连接测试、数据完整测试、端连接测试、协议完整性测试;资源界限测试、资源自测;测试基础设施的测试。用故障标签对故障的整个生命周期进行跟踪。 所谓故障标签就是一个监视网络问题的前端进程,它对每一个可能形成故障的网络问题,甚至偶然事

5、件都赋予唯一的编号,自始至终对其进行监视,并且在必要时调用有关的系统管理功能以解决问题。 8.1 网络故障概述 3网络故障管理的一般思路 首先,网络故障管理首先能够自动发现、生成和维护网络拓扑结构,形成网络模型。 该模型应该与管理员头脑中的网络图像一致。通过核对该图,管理员可以纠正错误认识,或者发现用户私自增加和改变的网络连接。 一般网管软件可以生成基于IP网络的拓扑结构图, 高级网管软件则可以生成和维护基于交换机的物理连接的拓扑结构图。 8.1 网络故障概述 然后,故障管理以此模型为基础自动定期轮询网络设备,监视线路设备的运行状况和故障情况。 故障管理的核心是对采集到的故障信息的处理。 网管

6、软件可以理解网络拓扑结构和故障来源、严重性,自动、及时、直观地在网络拓扑界面表示该故障。这对实时监视和解决问题非常有效。界面的直观易用性是考察此类软件的侧重点。第八章常见网络故障分析与处理8.1 网络故障管理概述8.2 网络故障管理的方法8.3 网络故障管理的工具8.4 网络故障管理的分类处理8.5 常见网络故障诊断及维护案例 8.2 网络故障管理的方法有很多工具可以辅助管理员发现网络什么时候出故障了,同时有几种方法可以用来应对这些警报。但是哪种方法是最佳的呢?没有任何一种方法适用于所有情况。本节将阐述故障修复中所使用的几种方法。 8.2 网络故障管理的方法8.2.1 网络故障诊断及解决的一般

7、步骤8.2.2 分层故障排除法8.2.3 分段故障排除法8.2.4 替换法8.2.5 隔离法8.2.6 各种方法总结8.2.1 网络故障诊断及解决的一般步骤 故障处理系统化是合理地一步一步找出故障原因并解决的总体原则。 它的基本思想是系统地将由故障可能的原因所构成的一个大集合缩减(或隔离)成几个小的子集,从而使问题的复杂度迅速下降。 网络故障解决的处理流程是可以变化的,但故障处理有序化的思维模式是不可变化的。下面以华为技术有限公司的一个故障处理的实例来介绍如何应用这些步骤。该处理流程是网络维护人员所能够采用的排错模型中的一种,如果根据自己的经验和实践总结了另外的排错模型并证明是行之有效的,请继

8、续使用它。8.2.1 网络故障诊断及解决的一般步骤8.2.1 网络故障诊断及解决的一般步骤1. 故障现象描述要想对网络故障做出准确的分析,首先应该了解故障表现出来的各种现象。用户反映“日志服务器与备份服务器间备份发生问题”这就是一个不完整、不清晰的故障现象描述。因为这个描述没有讲述清楚下列问题:这个问题是连续出现,还是间断出现的?是完全不能备份,还是备份的速度慢(即性能下降)?哪个或哪些局域网服务器受到影响,地址是什么?8.2.1 网络故障诊断及解决的一般步骤正确的故障现象描述是:在网络的高峰期,日志服务器18到集中备份服务器53之间进行备份时,FTP传输速度很慢,大约是0.6Mbps。 8.

9、2.1 网络故障诊断及解决的一般步骤2相关信息收集搜集有助于查找故障原因的详细信息。向受影响的用户、网络人员或其他关键人员提出问题。根据故障描述性质,使用各种工具搜集情况,如网络管理系统、协议。使用分析仪、相关display和debug命令等。测试性能,与网络正常情况下的记录进行比较。 8.2.1 网络故障诊断及解决的一般步骤如上述案例,可以向用户提问或自行收集下列相关信息:网络结构或配置是否最近修改过,即问题出现是否与网络变化有关?是否有用户访问受影响的服务器时没有问题?在非高峰期日志服务器和备份服务器间FTP传输速度是多少? 8.2.1 网络故障诊断及解决的一般步骤通过该步骤,收集到了下面

10、一些相关信息:最近网段的客户机不断在增加;网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps,与日志服务器间进行FTP传输时速度慢,只有0.6Mbps;在非高峰期日志服务器和备份服务器间FTP传输速度正常,大约为6Mbps。 8.2.1 网络故障诊断及解决的一般步骤3经验判断和理论分析利用前两个步骤收集到的数据,并根据自己以往的故障处理经验和所掌握的知识,确定一个排错范围。通过范围的划分,就只需注意某一故障或与故障情况相关的那一部分产品、介质和主机。如上述案例,现在能够确定是一个网络性能下降问题。那么,是网段的性能问题,是中间网络的性能问题,还是

11、网段的性能问题呢?根据网段的机器与备份服务器间进行FTP传输时速度正常为7Mbps这一事实,可以排除网段的性能问题。 8.2.1 网络故障诊断及解决的一般步骤4各种可能原因列表该步骤列出根据经验判断和理论分析后总结的各种可能原因。如上述案例,可能原因如下。网段的性能问题,其原因可能为:日志服务器A的性能问题;网络的网关性能问题;网络本身的性能问题;中间网络性能问题,主要是到网络的路由不是最佳路由。 8.2.1 网络故障诊断及解决的一般步骤5对每一原因实施排错方案根据所列出的可能原因制定故障排查计划,分析最有可能的原因,确定一次只对一个变量进行操作,这种方法能够重现某一故障的解决办法。如果有多个

12、变量同时被改变,而问题得以解决,那么如何判断哪个变量导致了故障发生呢?8.2.1 网络故障诊断及解决的一般步骤6观察故障排查结果当对某一原因执行了排错方案后,需要对结果进行分析,判断问题是否解决,是否引入了新的问题。如果问题解决,那么就可以直接进入文档化过程;如果没有解决问题,那么就需要再次循环进行到故障排查过程。8.2.1 网络故障诊断及解决的一般步骤7循环进行故障排查过程在进行下一循环之前必须做的事情就是将网络恢复到实施上一方案前的状态。如果保留上一方案对网络的改动,很可能导致新的问题。循环排错可以有两个切入点:当针对某一可能原因的排错方案没有达到预期目的,循环进入下一可能原因制定排错方案

13、并实施;当所有可能原因列表的排错方案均没有达到排错目的,重新进行故障相关信息收集以分析新的可能原因。 8.2.1 网络故障诊断及解决的一般步骤如上述案例,在列出了可能原因列表后,开始制定方案进行故障处理。可能原因1:网络到网络的路由不是最佳路由。制定的方案:在网段的网关上使用tracert 53命令,发现探测报文返回时长仅为10ms,表明该可能原因并不是造成故障的原因。进入循环排错过程。可能原因2:日志服务器A的性能问题。制定的方案:测试同一网段的主机C和日志服务器间的FTP传输速度,是6Mbps,正常。可见问题与服务器A无关。 8.2.1 网络故障诊断及解决的一般步骤可能原因3:网络的网关性

14、能问题。制定的方案:测试主机C和备份服务器B间FTP传输速度是7Mbps,正常。排除了网关因素,因为B、C在不同网段上而速度正常。 8.2.1 网络故障诊断及解决的一般步骤再次询问用户该网段主要运行的业务是什么,而得出了故障最终原因如下:是普通用户网段,由于业务原因每个用户需要发送大量广播包和多播包,随着近期越来越多的用户接入该网络,在这个网段上的服务器需要花费更多的资源来处理越来越多的广播和多播包,因此其服务的传输速度自然减慢。这是一个网络布局不恰当的问题,需要重新安排服务器的位置,将服务器移到网段后,故障解决。 8.2.1 网络故障诊断及解决的一般步骤8故障处理过程文档化当最终排除了网络故

15、障后,流程的最后一步就是对所做的工作进行文字记录。文档化过程决不是一个可有可无的工作,原因如下:文档是排错宝贵经验的总结,是“经验判断和理论分析”这一过程中最重要的参考资料;文档记录了这次排错中网络参数所做的修改,这也是下一次网络故障应收集的相关信息。8.2.1 网络故障诊断及解决的一般步骤文档记录主要包括以下几个方面:故障现象描述及收集的相关信息;网络拓扑图绘制;网络中使用的设备清单和介质清单网络中使用的协议清单和应用清单;故障发生的可能原因;对每一可能原因制定的方案和实施结果;本次排错的心得体会;其他,如排错中使用的参考资料列表等。8.2 网络故障管理的方法8.2.1 网络故障诊断及解决的

16、一般步骤8.2.2 分层故障排除法8.2.3 分段故障排除法8.2.4 替换法8.2.5 隔离法8.2.6 各种方法总结8.2.2 分层故障排除法1分层故障排除法的原理所谓分层的思路,是把TCP/IP的分层模型和现实的网络环境相对应,从高到低或从低到高地判断故障。由于TCP/IP的层次结构把每层功能及职责范围定义得非常清晰,为管理员分析和排查故障提供了非常好的组织方式。 由于各层相对独立,按层排查能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。 8.2.2 分层故障排除法 据统计,网络故障有35%在物理层,25%在数据链路层,12%在网络层,10%在传输层,8%在对话层,7%在表示

17、层,3%在应用层。 由此可以看出网络故障通常发生在网络分层模型的下3层,即物理层、链路层和网络层。 故一般主要是考虑分层模型的下3层的对应关系,即把维护的网络设备的各种故障现象归类到物理层、链路层和网络层。 通常有两种逐层排查方式,自上而下和自下而上。8.2.2 分层故障排除法 2. 自下而上的方法 对于自下而上的网络故障修复,首先要检查网线,接着是协议堆栈。具体的分析按“物理层数据链路层网络层传输层上层应用”的次序分析问题。 如果使用自下而上的方法,那么需要检查所有的物理媒介,并且这个步骤是不可以跳过的,因为可以ping一下设备或者查看连接信号灯。 另外一方面,如果我们没有看到连接信号灯亮那

18、问题就很明显了。这样,可以继续检查步骤检查网卡诊断、交换机端口统计,然后到应用。 8.2.2 分层故障排除法 当有一个用户出现故障时,可以很容易地从物理层开始,然后一直往上修复。 该方法适用于物理网络不够成熟稳定的情况,如组建新的网络、重新调整网络线缆、增加新的网络设备;如果错误的出现要么是连续的要么是间歇性的,检查一下物理层。8.2.2 分层故障排除法 3. 自上而下的方法 在自上而下的方法中,从TCP/IP协议栈的最上层开始分析。要先测试应用是否正常工作,然后ping服务器,等等。直到到达协议栈的最底层,也就是物理层。 自上而下的方法适用于物理网络相对成熟稳定的情况,如硬件设备没有变动。

19、这个方法最适用于多用户登录服务器的情况。物理层问题几乎很少可能成为影响所有用户的问题。当然,除非遇到服务器连接问题时。 这个方法可以用来确定应用或服务器是否Down了、变慢了,或者其它某些原因没有响应网络命令。 8.2.2 分层故障排除法 4各层可能的故障 1)物理层 物理层的故障一般包括以下几个方面:线路方面故障;端口设置方面的故障;集线器故障;电源方面的故障;网卡故障。 网卡故障包括:网卡参数设置错误、在同一网段的网络设备的参数设置要一致、对网卡的干扰和网卡驱动不正常等。 8.2.2 分层故障排除法 案例8-2:各种指示灯的状态。 例如调制解调器的灯指示的是物理层的信息,CD代表载波,不亮

20、的话指示电话线的连接有问题。CTS代表与电脑的接口是否正确地连接,不亮的话要么是连接线有问题,要么就是RS232口有问题。 网卡的Link灯代表网线的好坏或者与Hub的连接是否正确,网卡的100M灯代表是否100M连接。 大中型的服务器上一般都有液晶的小条,实时显示服务器的运行状态,可以从中看出设备的故障情况。大部分网络设备的物理层的信息虽然标识一样,但在细节上很不相同,需要仔细研读产品说明书来了解。 8.2.2 分层故障排除法 2) 数据链路层 数据链路层的故障一般包括以下几个方面: 数据链路层帧的问题,通常的帧错发、重发、丢失及帧碰撞等; 数据帧的流量控制及差错控制; 链路层地址的设置;

21、链路层协议的匹配问题,在相互连接的两端口应该使用同一种协议封装; 链路通信的时钟同步问题; 数据终端设备(DTE)在数据链路层驱动程序的加载问题。 8.2.2 分层故障排除法 案例8-3:数据链路层。 从链路层开始就需要对网络协议有比较清晰的了解。在网络中运行的设备一般都严格遵守分层协议,可以运用网络规程仪表对网络进行监控,也可以运用本地环或者远端环对线路的质量进行检查。 在以太网上,一般可以运用Sniffer对所有的包进行窃听来判断故障的位置。 目前交换机普及后,也可在交换机上观察各以太口上获得的MAC地址来判断故障。链路层的信息一般和物理层的信息交织在一起,除非出现误码率高和设备运行状态不

22、稳定等,都不需要对链路层进行排障。 8.2.2 分层故障排除法 3)网络层 网络层提供建立、保持和释放网络层连接的手段,包括路由选择、流量控制、传输确认、中断、差错及故障恢复等。 案例8-4:网络层。 排除网络层故障的基本方法是沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。 如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障,包括RIP或者IGRP路由协议出现的故障。到了网络层,随着故障的复杂化,网络管理员可以运用的工具也多了。8.2.2 分层故障排除法 4)传输

23、层 传输层故障主要包括: 差错检测纠错等,如数据包的重发; 通信拥塞控制错误或上层协议在网络层协议上的捆绑错误; 私密性和可靠性问题,例如SSL安全协议握手连接失败。 8.2.2 分层故障排除法 5)应用高层 应用层故障检查主要包括以下几个方面: 终端系统的系统资源状态,如CPU、内存、磁盘利用、I/O系统、进程等。 应用程序对系统资源的占用及调度管理。 安全管理、用户管理、文件管理等高层服务。 8.2.2 分层故障排除法 案例85:分层故障排除法一例。 某公司的分公司进行了一次网络改造,分公司的网络用户报告说其中有一台客户端在调整办公室后无法访问总部服务器。由于总公司到分公司的路途遥远,所以

24、采用了电话支持和网络设备远程排错的方法,最终排除了故障。 8.2.2 分层故障排除法 (1)选择排查故障的思路 由于分公司的其他客户端都能访问到总部的服务器,而只有一个客户端无法访问,所以应该确认服务器的应用程序是没有问题的,所以可以采用“从下至上”的方法排除网络故障,即从物理层开始。 由于是远程管理,在处理此次网络故障时总部工程师并没有到现场,但最终排除了故障。他们并不是通过经验直接判断问题的症结之处,而是根据分层故障排除方法,从“物理层”开始排除问题的,当确保网卡和网络连接没有问题的时候,再“上升一层”排除问题,直至找到了最终答案。 8.2.2 分层故障排除法 (2)故障解决思路与步骤 客

25、户端无法访问网络的情况在企业网络故障中应该是最常见的一种,但很多管理员在排查故障的时候,不知道从何处入手。将主机搬回到原信息点后能够访问网络,这就使总部工程师首先怀疑连接这台客户端的物理层链路出现了问题。 检查物理层 总部工程师首先要求用户检查网络客户端网络的物理连接是否正常,查看网线是否与墙上端口和设备相连,连接点是否牢靠等。用户反馈这些连接部件都是正常的,所以总部工程师决定让用户查看交换机端口的工作状态。 8.2.2 分层故障排除法 由于分公司采用了标准的布线环境,交换机管理良好,有完备的网络记录文档。因此,总部查找到这位用户使用的墙上插座端口号为A201,而且知道A201号口与交换机2号

26、口相连。 如果工程师在现场就可查看交换机端口的指示灯状态是否正常,但现在是不可能了。所以只能远程登录到这台交换机,利用show ip interface brief 命令查看其端口是否工作正常。 8.2.2 分层故障排除法 一般持续绿色代表链路正常运行,如果闪烁绿色则表明正在发送或者接收数据。 3750-24#show ip interface brief Interface IP-Address OK? Method Status ProtocolGigabitEthernet1/0/1 unassigned YES unset up upGigabitEthernet1/0/2 unass

27、igned YES unset up upGigabitEthernet1/0/3 unassigned YES unset up upGigabitEthernet1/0/4 unassigned YES unset up upGigabitEthernet1/0/5 unassigned YES unset down down 从这条命令的执行结果中看到:GigabitEthernet1/0/2状态(Status)和协议(Protocol)工作都是up状态,这证明此终端的线缆连接到交换机是正常的,初步可以排除是物理层的问题。 8.2.2 分层故障排除法 检查数据链路层 既然有连接,说明网络

28、是通的,发生物理层错误的可能性很小,所以可以将故障排查上升一层到数据链路层。 因为交换机对数据包的转发是建立在MAC地址(物理地址)基础之上的,对于IP来说,它是透明的,即交换机在转发数据包时,不知道也无须知道信源机和信宿机的IP地址,只需其物理地址,即MAC地址。 8.2.2 分层故障排除法 是不是过分相信网络记录文档中的接口信息了,交换机的这个接口没有真正连接到这台客户端,而是连接到其他的客户端呢?此时,可以利用第二层信息的排查来确定这个错误是否存在。 第二层的关键是MAC地址,可以对照交换机接口上的MAC地址和客户端的MAC地址是否相同,这样也能排除是不是当初施工时网络记录文档出现了问题

29、。 使用show mac address-table interface gigabitEthernet 1/0/2 命令可以显示连接此接口计算机的MAC地址信息。8.2.2 分层故障排除法 3750-24#show mac address-table interface gigabitEthernet 1/0/2Mac Address Table-Vlan Mac Address Type Ports- - - -10 0014.2275.57ac DYNAMIC Gi1/0/2Total Mac Addresses for this criterion: 1 此时在客户端上查看本机的MAC

30、地址,如果不匹配则说明交换机上的接口并不是真地连接了这台客户端。 工程师让用户在客户端执行IPCONFIG /ALL命令,然后将MAC地址和上面的进行对比,发现MAC地址是相同的。可能在数据链路层还有其他的错误,但至少“网络记录文档”并没有欺骗我们,交换机端口和客户端主机是对应的。 8.2.2 分层故障排除法 检查网络层 接下来查看第三层。在PC上使用IPCONFIG /ALL命令进行检查,输出结果显示如下 IP Address. . . . . . . . . . . . : 1Subnet Mask . . . . . . . . . . . : 92Default Gateway . .

31、 . . . . . . . : 2DHCP Server . . . . . . . . . . . : DNS Servers . . . . . . . . . . . : Primary WINS Server . . . . . . . : 这里,可以看到PC有IP地址,但是这地址对吗?这台PC通过DHCP获得10.88.范围内的地址,但是现在地址却是10.10.。8.2.2 分层故障排除法 终于发现了问题,DHCP服务器分发的IP地址不属于子网。这种问题多出现在PC从某个子网挪到另一个子网时,PC依然请求旧的IP地址就产生了问题。由于这台主机从另外的办公室挪过来才出现的问题,因此可

32、以断定问题出现在网络层。 管理员尝试这样解决问题,让PC的网络接口租用的IP地址重新交付给DHCP服务器(即归还IP地址)。 使用ipconfig /release, 然后使用ipconfig /renew命令, PC就会获得正确的IP地址,所有的网络应用就都可以使用了。 8.2 网络故障管理的方法8.2.1 网络故障诊断及解决的一般步骤8.2.2 分层故障排除法8.2.3 分段故障排除法8.2.4 替换法8.2.5 隔离法8.2.6 各种方法总结8.2.3 分段故障排除法 所谓分段的思路,就是把故障分成几个段落,再逐一排除。分段的中心思想就是缩小网络故障涉及的设备和线路,来更快地判定故障,然

33、后再逐级恢复原有网络。 分段检查包括用户端、接入设备、主干交换设备、中继设备等之间的链路连通及相应端口的状态。 8.2.3 分段故障排除法 链路连通包括:物理线路的介质类型、物理线路的连通、物理线路的质量(线路的距离、衰耗、终端设备的电气特性等)、物理线路的最大数据承载能力、收发线路的对应等。 相应端口的状态包括:两端设备对应的端口类型的统一、速率的匹配、双工设置、收/发时钟的时钟源、数据收/发的线路接通、数据流控制和拥塞控制等。 总之,分段故障排除就是: 按“数据终端设备网络接入设备网络主干设备网络中继设备网络主干设备网络接入设备数据终端设备”的次序分析问题。 8.2.3 分段故障排除法 案

34、例8-6:分段故障排除法一例。 某高校有两个校区,租用DDN专线把两处分校连起来,发现两地网络不能ping通。 分段判断,让用户ping本地网关,发现也不通。迅速排除Hub故障(因为用户ping其他电脑正常),发现是用户的路由器在停电后设置丢失,重新设置后网络正常。 在网络故障修复中使用ping命令将有助于减小Windows PC连接问题原因的分析范围。 8.2.3 分段故障排除法 案例8-7:网络系统故障的分段排查的步骤一例。 分段的首要问题是确定问题出在哪个环节、本机或本地的线路和网络提供方(网管中心)。 (1)判断是否本机或本地的线路的问题。具体的排错过程如下。 检查本机的网络连接。 首

35、先右击“网上邻居”,选择“属性”命令,察看“我的连接”是否为灰色,也即判断其有没有被禁用。8.2.3 分段故障排除法 检查本机的网卡灯。 首先查看网卡上的指示灯是否亮,以及和本机连接的交换机(或Hub)上的相应指示灯是否亮。查看电脑网络端口的指示灯的工作状态。 一般网卡都有工作的指示灯,可以通过指示灯的状态,来判断网络的运行状态。 若网卡指示灯是桔黄色的,说明电源是通的,但是没有数据包的传递; 若有绿色的灯一闪一闪的,则说明网卡是正常的。 如果不亮,则有可能是下列原因造成的:电缆接触不良;Hub掉电或者掉线;网线的水晶头损坏。 8.2.3 分段故障排除法 检查网卡驱动程序是否正常。启动设备管理

36、器,步骤如下: 右击“我的电脑”,选择“属性”命令,选择“硬件”选项卡,再单击“设备管理器”,找到网络适配器. 若网卡图标上出现X、?、!符号,说明网卡驱动程序有故障或被禁用,重新安装驱动或启用。 8.2.3 分段故障排除法 检查网络设置(与IP分配表对照)是否正常。 步骤如下:右击“网上邻居”,选择“属性”命令;右击“本地连接”,选择“属性”命令;选中“Internet协议(TCP/IP)”。 8.2.3 分段故障排除法 使用两个网络检测常用命令:ipconfig和ping命令。 利用ping命令来判断是否能够连上网关。有时候用户反映他们连不上网了,其实,不一定是连不上交换机或者路由器。 有

37、可能是其他原因所造成的网络故障,如上网相关参数没有配置准确等。所以,遇到这个故障的话,首先应该用ping命令进行测试,看是否能够连通网关。若可以连上网关,说明网络是通的,可能是因为本机DNS等参数配置错误或者本机可能存在病毒的原因所造成的。 反之,如果ping不通网关,则继续ping ,再有问题即可判断出是TCP/IP有故障,需重装TCP/IP。 8.2.3 分段故障排除法 接下来判断网络层以上的问题。 就终端设备(网卡)进行判断。 只有发送,没有收到的数据包说明:本机的防火墙禁止收发数据;网络提供方设备出错等。 收发的包都有但很少说明:网络设置出错,软件故障;线缆出现信号衰减,导致包丢失;网

38、络服务器出错。 包正常,打不开网页,但可以使用网上邻居和聊天工具:可能与浏览器设置有关或者受病毒的影响。 8.2.3 分段故障排除法 (2)如何确定问题出在网络提供方。 可以根据以下几点确定问题出在网络提供方: 同一问题大规模出现(整层,整栋楼); 一台电脑在相邻接口确定是可用的,在这个接口不可用; 没有条件进行排除法,但网络经验富足,可以果断判断为网络提供方的问题。8.2 网络故障管理的方法8.2.1 网络故障诊断及解决的一般步骤8.2.2 分层故障排除法8.2.3 分段故障排除法8.2.4 替换法8.2.5 隔离法8.2.6 各种方法总结8.2.4 替换法 所谓替换法,是指用运行正常的部件

39、替代那些被怀疑的网络设备,直到故障解决。 替换法主要用于解决单个或少数站点网络故障。 替换法是检查硬件问题最常用的方法。当怀疑是网线问题时,更换好的网线试一试; 当怀疑是接口模块有问题时,更换其它接口模块试一试。 8.2.4 替换法 案例8-8:替换法解决单个站点不能上网的问题。 首先,从最基础的一级、电缆开始,替换PC上的连接线,验证故障是否解除。如果出现故障的PC没有变化,恢复原始的连接,并替换下一个可能出现故障的设备,如集线器、网卡等,直到故障消失为止。利用替换方法解决网络故障要花点时间,因此,要作好心理准备。8.2.4 替换法 替换法优点是当没有网络维护工具时,仍能有能力解决网络故障;

40、 缺点是必须备有可替换的设备,时间可能会很长,甚至无功而返,即使问题解决后,对网络故障产生的原因也只能是知其然,不知其所以然,不能深入了解。8.2 网络故障管理的方法8.2.1 网络故障诊断及解决的一般步骤8.2.2 分层故障排除法8.2.3 分段故障排除法8.2.4 替换法8.2.5 隔离法8.2.6 各种方法总结8.2.5 隔离法 所谓隔离法是指网络出现故障时,切断网络部分或个别设备的连接,逐步缩小故障查找的范围,直到确定最终的故障源。 隔离法主要用于排查那些影响了网络部分或整体运行的故障。 8.2.5 隔离法 案例8-9:隔离法解决不明原因导致整个网络宕机问题。 首先将网络主干连接部分相

41、互断开,即把网络拆分成若干部分,验证哪些网络恢复正常,哪些网络故障依旧。尽快恢复正常运行的网络连接,减少不必要的损失,对存在故障的网络部分保持断开状态,并继续拆分,直到故障解决为止。 隔离法会耗费大量的时间和精力,极大地妨碍网络的正常工作,对于对服务质量要求很高的网络系统一般不会采用这种方式。 采用隔离法一定要事前制定详细缜密的方案,缩短故障排查时间,并尽可能保证网络关键部分的正常工作,以减少相应的损失。 8.2 网络故障管理的方法8.2.1 网络故障诊断及解决的一般步骤8.2.2 分层故障排除法8.2.3 分段故障排除法8.2.4 替换法8.2.5 隔离法8.2.6 各种方法总结8.2.6

42、各种方法总结 至于排障是先分层还是先分段,基本要靠网管员的经验。对于复杂的故障,如果有条件分段的话,可以先采用分段法确定故障点,再通过分层或其它方法排除故障。 替换法和隔离法都是在没有维护工具的情况下,排除故障普遍采用的方法,但对于复杂的网络问题往往无能为力。 总体上看,它们共同的缺点是会耗费大量的时间和精力,过多地依赖网络管理人员的技术和经验,有时甚至是运气。 8.2.6 各种方法总结 总之,网络故障千差万别,最主要的是通过分层和分段使排障时有个清晰的层次,然后循序渐进地排除各种可能性。这里面,经验是非常重要的,可以帮助网管员少走弯路。 利用分层和分段的方法,前提是对网络的结构要有很好的认识

43、,所以网管员需要及时掌握所管理的网络的任何拓扑改变和设置变动,才能在故障发生时最迅速地解决它。第八章常见网络故障分析与处理8.1 网络故障管理概述8.2 网络故障管理的方法8.3 网络故障管理的工具8.4 网络故障管理的分类处理8.5 常见网络故障诊断及维护案例 8.3 网络故障管理的工具 像医生看病需要听诊器,网管人员也需要自身行业的专用工具。即所谓“工欲善其事,必先利其器”。处理故障仅仅通过设备内置的常用命令、一些简单工具或增加维护人员数量是远远不够的,必须采用专业的维护工具。利用专业的网络维护工具,不仅能够快速地进行故障定位,还能帮助分析故障原因,避免了网管人员无谓的猜测,减少故障排除的

44、时间。网管人员在选择维护工具上,应该综合考虑功能、价格、使用效率等因素,特别是在功能和使用效率上;按照统计,网络下3层的故障约占总计的72%,所以,工具选择应着重其下3层故障的排查能力。8.3 网络故障管理的工具 网络故障诊断形式:包括软件形式工具和硬件形式工具。 软件形式工具: 比如操作系统提供的网络诊断命令及专业管理软件。 使用简单、方便、成本低,但诊断不能深入网络内部,具体反映各项网络参数,功能有限。 硬件形式工具: 比如各种网络万用表、网络协议分析仪等。功能强大,能够对网络进行系统、全面、深入的诊断,但使用较复杂,成本较高。 8.3 网络故障管理的工具 8.3.1 常用故障诊断及维护命

45、令 8.3.2 利用日志文件自动监控网络故障 8.3.3 利用设备管理器远程判断硬件故障 8.3.4 利用远程服务诊断网络故障 8.3.1 常用故障诊断及维护命令1使用Ping命令检查网络的连通性1使用Ping命令检查网络的连通性一般情况下,可以通过使用一系列ping命令来查找问题出在什么地方,或检验网络运行时。典型的检测次序及对应的可能故障如下。1)ping 本机IP/ 该命令用于检查本机的网卡与操作系统网络配置是否正确。如果测试不成功,则表示本地配置或安装存在问题,应当对网络设备和通信介质进行测试、检查并排除。 8.3.1 常用故障诊断及维护命令2)ping 局域网内其他IPping 局域

46、网内其它机器的IP,检查本机到其它机器的连通情况。如果测试成功,表明本地网络中的网卡和载体运行正确。但如果收到0个回送应答,那么表示子网掩码不正确或网卡配置错误或电缆系统有问题。3)ping 网关IP这个命令如果应答正确,表示局域网中的网关路由器正在运行并能够做出应答;如果不通则表明本机或者到网关之间的网络线路、设备存在故障。 8.3.1 常用故障诊断及维护命令4)ping 远程IP检查本机到远程网络是否通畅。如果收到正确应答,表示成功地使用了默认网关。对于拨号上网用户则表示能够成功地访问Internet。 ping 远程服务器地址或域名ping (检查本机到学校网络中心是否通畅)ping w

47、ww. 8.3.1 常用故障诊断及维护命令5)ping local host local host是系统的网络保留名,它是的别名,每台计算机都应该能够将该名字转换成该地址。如果没有做到这一点,则表示主机文件(/Windows/host)中存在问题。 8.3.1 常用故障诊断及维护命令6)Ping (一个著名网站域名)对此域名执行ping命令,计算机必须先将域名转换成IP地址,通常是通过DNS服务器。如果这里出现故障,则表示本机DNS服务器的IP地址配置不正确,或DNS服务器有故障。如果上面所列出的所有Ping命令都能正常运行,那么计算机进行本地和远程通信基本上就没有问题了。 8.3.1 常用故

48、障诊断及维护命令案例8-10:用好Ping命令。要想让ping命令有效发挥作用,首先需要掌握使用该命令排查故障的一些测试顺序,只要依照顺序依次排查,再难解决的网络故障也能被很快解决,下面就是使用ping命令测试故障原因的具体操作顺序。首先对本地工作站的循环地址进行ping测试。当遇到一些无法直接找到故障原因的特殊网络故障时,首先需要使用ping命令测试一下本地工作站的循环地址能否被正常ping通,倘若该地址无法被正常ping通的话,说明本地工作站的TCP/IP程序受到了破坏,或者网卡设备发生了损坏。 8.3.1 常用故障诊断及维护命令此时,打开本地工作站系统的设备管理器窗口,从中找到网卡设备选

49、项,右击该选项,从弹出的快捷菜单中选择“属性”命令,打开网卡设备的属性设置对话框,在“常规”选项卡中就能看到当前的网卡工作状态是否正常了。当发现网卡工作状态正常的话,很有可能是本地工作站的TCP/IP程序受到了破坏,此时打开本地连接属性设置对话框,选中并删除该设置对话框中的TCP/IP选项,之后再重新安装一下TCP/IP程序。相信这么一来本地工作站的循环地址就能被正常ping通了。 8.3.1 常用故障诊断及维护命令其次对本地工作站的IP地址进行ping测试。在确认地址能够被ping通的情况下,继续使用ping命令测试一下本地工作站的静态IP地址是否能被正常ping通,倘若该地址不能被正常pi

50、ng通的话,说明本地工作站的网卡参数没有设置正确,或者网卡驱动程序不正确,也有可能是本地的路由表受到了破坏。此时可以重新检查一下本地工作站的网络参数是否设置正确,如果在网络参数设置正确的情况下仍然无法ping通本地IP地址的话,最好重新安装一下网卡设备的原装驱动程序,。一旦本地工作站的静态IP地址被顺利Ping通的话,那就表明本地工作站已经能够加入到局域网网络中了。 8.3.1 常用故障诊断及维护命令接着对本地局域网的默认网关地址进行ping测试。由于本地工作站是通过网关与局域网中的其他工作站进行相互通信的,只有本地工作站与默认网关之间连接正常,才能确保本地工作站与其他工作站通信正常。倘若网关

51、地址能被正常Ping通的话,那就表明本地工作站可以与局域网中的其他工作站进行正常通信。同时,也说明本地网络的连接工作正常,至少在IP地址层上是正常的。 要是ping命令操作不成功的话,那很有可能是网关设备自身存在问题,或者是本地工作站与网关之间的线路连接不正常,也有可能是本地工作站与网关没有设置成同一个子网中。此时,可以先用专业的线缆测试工具测试一下网络线缆的连通性,在线缆连通性正常的情况下,再检查本地工作站的网络参数是否与网关的参数设置成同一个子网中。 8.3.1 常用故障诊断及维护命令倘若网络参数设置正确的话,再从其他工作站ping一下网关地址,以便确认网关自身是否存在问题,如果局域网中的

52、其他工作站也无法ping通网关的话,那多半是网关设备自身存在问题,这个时候只要将故障排查重点锁定在网关设备上就可以了。下面对局域网中任意一台远程工作站的IP地址进行ping测试,以便检验本地工作站能否通过网关设备与局域网中的其他工作站进行通信。要是发现远程工作站的IP地址无法ping通的话,那很有可能是远程工作站自身无法响应,或者是远程工作站与网关设备之间的线路连接出现了问题,此时可以将网络故障的排查重点聚焦到远程工作站上或者是局域网的网络设备上。 8.3.1 常用故障诊断及维护命令最后对局域网的远程工作站主机名称进行ping测试。在确认能够Ping通远程工作站IP地址的情况下,仍然出现无法访

53、问远程工作站内容的时候,就有必要进行这一项测试操作。如果该主机名称无法被ping成功的话,那很有可能是DNS解析出现了问题,而不是网络连接发生了故障,此时把故障检查重点锁定在DNS服务器上。8.3.1 常用故障诊断及维护命令应注意以下几点(1)为了有效地找出网络故障原因,在使用ping命令进行测试检查时,尽量确保局域网中只配置了一个网关,同时确保本地工作站没有启用IP安全设置策略,这样可以保证Ping命令能够获得正确的测试结果。8.3.1 常用故障诊断及维护命令(2)在网络访问一切正常的情况下,有时使用ping命令测试某个地址的连通性时,会出现ping不通的现象。这种现象并不一定是网络故障,因

54、为目前不少病毒程序会通过ping命令向局域网中发送大量的垃圾包,以便实施DDos攻击,而许多服务器或工作站为了远离这样的非法攻击,常常会采取措施将ping功能关闭,如此一来就会出现在网络访问一切正常的情况下,仍然发生ping不通的奇怪现象。8.3.1 常用故障诊断及维护命令(3)在Windows 2000以上版本的工作站系统中,pathping命令找到网络故障原因。这个命令工作起来就像是把ping和tracert这两个命令结合在了一起。 在命令行输入pathping:pathping目标。这里的目标可以是一个主机名称,也可以是一个IP地址,例如,或者21。接下来,将得到一个分为两部分的报告。第

55、一部分是通向目的地的线路上的每一个跳点的列表,第二部分是每一个跳点的统计,包括每一个跳点的数据包丢失的数量。它使用下面例子中显示的一些开关(switch): pathping-n-w1000 这个命令告诉pathping不解析路由器的IP地址,并且为每一个回显应答信息等待1秒钟(1000毫秒)。 8.3.1 常用故障诊断及维护命令下面是一些最重要的pathping命令开关(switch): n:不显示每一台路由器的主机名。 hvalue:设置跟踪到目的地的最大跳点数量。默认是30个跳点。 wvalue:设置等待应答的最多时间(按毫秒计算)。 p:设置在发出新的ping命令之前等待的时间(按毫秒

56、计算)。默认是250毫秒。 qvalue:设置ICMP回显请求信息发送的数量。默认是100。例如在网络访问速度非常缓慢的情况下,使用ping命令或许根本找不到造成网络访问速度缓慢的故障原因,此时使用pathping命令,就能轻易地找到究竟在哪一个网络连接环节出现了数据丢包现象。8.3.1 常用故障诊断及维护命令当发现本地工作站上网速度非常缓慢的时候,可以选择“开始”“运行”命令,在弹出的对话框中输入cmd字符串命令,单击“确定”按钮后,将系统切换到MS-DOS运行状态。其次在DOS命令行中,输入字符串命令pathping (其中为本地工作站指定的DNS服务器IP地址),按Enter键后,就能从

57、随后的结果信息中看到在访问DNS服务器过程中,中途经过了几个中间路由器。并且能清楚地知道究竟在哪一个跳转环节发生了数据丢包或网络延时现象。如果我们发现某一个路由器的数据丢包率非常高的话,那么该路由器很有可能出现了意外,此时我们只要将故障检查重点锁定在对应路由器设备上就可以了。 8.3.1 常用故障诊断及维护命令2利用ipconfig检查IP配置来修复Windows网络连接 ipconfig命令常用于显示本机网络配置, 它可以查看本机的IP地址等信息,而这也通常是判断网络故障入手的第一步。一台终端用户报告不能上网了,首先第一步就是查一下该用户的IP地址、网关等信息是正确。 8.3.1 常用故障诊

58、断及维护命令使用ipconfig /all可以查看网络的详细信息,比不加参数时显示的信息更详细,因此建议在使用时加上参数all。ipconfig /all显示包括上述参数及网卡的MAC地址等详细的网络参数。当使用all选项时,ipconfig 能为DNS和WINS服务器显示它已配置且所有使用的附加信息,并且能够显示内置于本地网卡中的物理地址(MAC)。如果计算机和所在的局域网使用了动态主机配置协议DHCP,使用ipconfig /all命令可以了解到你的计算机是否成功地租用到了一个IP地址,及目前分配的子网掩码和缺省网关等网络配置信息。8.3.1 常用故障诊断及维护命令使用 ipconfig

59、/all,可以将命令输出重定向到某个文件,并将输出粘贴到其他文档中。也可以用该输出确认网络上每台计算机的 TCP/IP 配置,或者进一步调查 TCP/IP 网络问题。8.3.1 常用故障诊断及维护命令案例8-11:ipconfig /all的使用。当机器使用静态的IP配置时,只需要检查确认所列出的IP地址、子网掩码、默认网关和DNS服务器地址与输入的TCP/IP属性列表上的相匹配。当机器使用动态的IP地址时,可能想看一看地址,并查看它是否处于预期的地址范围内。当修复一个不熟悉的网络问题时,可能无法获知地址范围。在这种情况下,可以查找一些有特定意义的值。 8.3.1 常用故障诊断及维护命令一个非

60、常明显的提示是IP地址可能出现了问题。这个地址的出现往往意味着以下三个原因的其中一个:网络适配器没有连接到网络上(可能是因为网线问题或者交换机端口坏了);IP地址已释放;发生IP地址冲突。当出现这个地址时,可以输入以下3个命令: ipconfig /releaseipconfig /renew ipconfig /all 8.3.1 常用故障诊断及维护命令这些命令实际上会告诉计算机放弃它现存的地址,并尝试获取一个新的地址,然后显示新的配置信息。有时候这个程序可以解决问题,但是有时侯则不可以。尽管如此,它往往会报告问题产生的根源所在。之所以提出加参数/RENEW重新获取IP地址,是因为部分情况下

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论