网络设备巡检服务工作规范_第1页
网络设备巡检服务工作规范_第2页
网络设备巡检服务工作规范_第3页
网络设备巡检服务工作规范_第4页
网络设备巡检服务工作规范_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-.z.**信息中心网络设备巡检效劳工作标准〔H3C设备网络〕V1.0信息中心目录1概述22巡检工作流程22.1巡检前期准备PAGEREF_Toc301361129\h22.2数据采集阶段22.3数据分析和报告生成阶段22.4汇报和满意度调查阶段2HYPERLINK\l"_Toc301361133"3网络巡检数据采集方法23.1手工数据采集方法23.2网络管理平台数据收集方法23.3巡检工具数据采集方法24网络巡检效劳基准数据库的建立25网络巡检工作内容25.1巡检工作的主要内容1361139\h25.2网络巡检工作技术涵盖26网络系统巡检根本判断标准27设备相关信息收集2HYPERLINK\l"_Toc301361143"7.1软件版本及硬件信息分析2当前设备硬件信息2当前设备运行软件信息27.2设备板卡硬件配置信息分析27.3设备运行状况检查2设备CPU工作状态检查2设备CPU利用率分析2设备MEMORY使用状态检查2设备MEMORY利用率分析表27.4设备运行状态检查2电源的工作状态2风扇的工作状态2设备工作温度28端口的可用性、准确性检查6\h28.1端口状态检查2根本网络接口状态分析2接口半/全双工模式和链路类型2接口稳定性统计信息28.2端口状态检查表29设备端口负载及流量检查29.1设备缓存信息检查PAGEREF_Toc301361163\h210网络架构、配置信息分析210.1网络构造检查2检查内容2HYPERLINK\l"_Toc301361167"检查方式210.2网络配置信息检查2检查内容2检查方式\h211LOG信息检查211.1标准的LOG格式211.2LOG日志等级211.3日志信息分析表错误!未定义书签。关于文档为保障**信息中心网络的平稳运行,将在每月进展网络巡检,并根据巡检结果给出相应的网络系统改良和优化建议。本文档面向**的技术人员和外部支持公司网络工程师,通过参考本文档,共同完成对**信息中心网络运行状况的检查与分析。通过本文档使**技术人员和外部支持公司网络工程师充公了解**信息中心对网络巡检的根本要求,以该标准为参考,使得网络系统巡检工作更加标准化、标准化。由于网络技术的不断开展和设备的更新换代,本标准需要逐步地更新、完善,增加网络设备硬件、软件、固件的新版本和新硬件的内容。同时,随着网络安康效劳的不断深入,对网络系统检查的深度和范围也将发生变化,本标准也会逐步地完善。文档适用对象本文档仅适用参与**网络工程相关技术人员和外部支持公司的网络工程师。1概述为确保**信息中心网络平安生产,提升网络效劳质量,确保设备的正常运行,将每月对**信息中心网络设备进展巡检,巡检范围根据巡检工作需要而确定,通过对网络设备的数据采集和分析,能够对**信息中心网络设备的状态具有更加深入地了解。网络巡检是指通过标准的方法和流程定期地对客户一定范围内的网络进展网元级的系统检查,内容包括现场数据采集、分析、客户报告生成等。通过对关键网元设备的关键检查点参数进展数据采集、并将采集到的数据与有关标准进展比拟,从而确定关键网元设备所处的运行状态。通过定期网络巡检,可以及时发现网络中可能存在的隐患,并消灭在萌芽状态。2巡检工作流程网络巡检工作分为前期准备、现场数据采集、数据分析、报告生成和汇报、满意度调查和问题整改追踪等五个阶段。效劳流程如下:2.1巡检前期准备在网络巡检的前期准备阶段,工程师需要在与客户进展充分沟通的情况下,确定要巡检的设备范围及巡检重点,形成"网络巡检方案书"。网络巡检书至少包括:巡检设备范围和巡检工作重点巡检各个工作环节的方式数据采集的命令集协商具体的巡检时间安排巡检报告输出样表和图形在得到客户认可的情况下,进入下一阶段的工作。2.2数据采集阶段在网络巡检的数据采集阶段,对于网络数据采集的手段和工具需要得到用户的授权,遵守用户运行管理的相关规定,在指定时间和网络设备范围内进展数据采集工作。在用户的协助下收集相关网元的技术数据,并记录输出结果。2.3数据分析和报告生成阶段巡检工程师对现场采集到的数据进展分析,形成"**信息中心**中心网络巡检报告"。经过南天公司的网络专家审核通过后,由工程师负责以纸质文档或电子文档的方式提交给客户。2.4汇报和满意度调查阶段通过定期交流的方式,讨论巡检工作中发现的问题及隐患,给出网络运行状况的检查、评估及建议,并进展问题跟踪。同时进展客户满意度调查,以便发现和纠正工作中的问题,改良网络系统巡检工作。3网络巡检数据采集方法网络巡检效劳的数据采集方法有两种,一是手工命令采集,并配合网管平台进展辅助性数据采集的方法;一是巡检工具数据采集的方法。3.1手工数据采集方法手工采集就是登录到网络设备上,通过手工输入命令并记录输出结果的方式进展数据采集。为加强手工数据采集的准确性和合理性,需要对数据进展屡次,重复性数据收集。如考量CPU的利用率和MEM的利用率等信息,可以采用日起、日中、日结等三个阶段,分时段收集并进展汇总比。对于网络设备运行状态、数据流量等信息的趋势性数据采集需要结合一定时间段数据的采集工作,需要利用网络管理系统进展相关数据的采集工作。3.2网络管理平台数据收集方法通过网络管理系统收集相关的数据,可以进展一个阶段的趋势分析,以便更加准确地了解网络系统的整体运行情况,并可以与手工数据采集的结果进展比照,确保数据采集和分析的合理性和可靠性。3.3巡检工具数据采集方法通过H3C提供的专用巡检工具进展数据采集。该工具集合了常用的设备状态检查的命令,可以自动化收集输出结果,并在后期导出巡检报告。但是需要H3C提供软件及其授权。在没巡检工具软件的情况下,可以由第一巡检方法来替代。4网络巡检效劳基准数据库的建立由于网络系统的巡检效劳是一个长期的、持续性的工作,首先需要对网络系统具有一定的了解,建立一个根本信息库。主要包括:设备清单:设备名称、IP地址、位置、功用、序列号等设备模块硬件配置:模块种类、型号等设备软件版本设备使用、维修记录设备性能基准,包括CPU、Memory利用率、设备端口流量的初始数据等设备端口信息:相关计数器初始状态通过第一次巡检完成根本信息库的建立,作为以后巡检工作的数据比照性分析的根底和依据,并保持数据更新,动态调整根本信息库的参考点。5网络巡检工作内容5.1巡检工作的主要内容本工程中,网络巡检工作中涉及的相关内容如下:设备根本信息收集采集设备的根本信息,包括用户定义的设备名称、设备序列号、设备型号、运行的软件版本、内存大小、CF卡的大小等设备运行状态检查主要采集和分析网络设备的CPU、Memory利用率,并在可能是的情况下,观察其变化趋势。设备管理运行环境检查主要通过设备的相关命令收集网络设备的运行环境,主要包括机框内部各个检测点的温度及其变化,电源工作状态和工作输出电压等相关信息。场地环境检查检查设备的运行环境,如机房温度、湿度、设备供电、网络线缆走线等网络设备硬件检查检查设备状态、设备连线状态等网络设备日志检查使用display命令,收集设备运行日志,并做分析核心设备的端口可用性、准确性检查使用display命令查看设备各端口的工作情况,包括端口的输出、输入错误丢包信息等,buffer占用情况和缓冲器溢出现象等核心设备端口负载及流量检查通过网管及其他手段,对设备端口的带宽占用、负载和流量进展统计分析,便于掌握网络设备及其连接线路的情况。网络系统总体性能评估针对巡检的内容及分析结果,对网络运行的整体情况做评估。5.2网络巡检工作技术涵盖网络系统巡检工作主要涵盖以下技术内容:工程分类参数数据来源设备根本信息软件ComwareVersion命令采集BootstrapVersion命令采集启动与运行Boot-loader命令采集uptime命令采集硬件Device命令采集Flash命令采集NVRAM命令采集TotalMemory命令采集SDRAM命令采集设备运行环境环境温度命令采集电源命令采集风扇命令采集性能CPU利用率PeakUtil命令采集AvgUtil命令采集内在利用率PeakUsedMemory命令采集AvgUsedMemory命令采集线路稳定性网络端口InDropsOutDrops命令采集网络事件LOG6网络系统巡检根本判断标准我们将依照依据华三公司的技术指标和业界遵循的阈值、惯例和相关技术标准,将采集的数据结果与其对照分析,以判断当前网络运转情况是否良好,根据具体发现的问题提出合理改良意见。设备运行记录设备运行时间少于7天的〔即运行时间过短的设备〕需要关注,有可能发生意外重启,同样对于设备启动时间过长的设备建议维护性重启。设备报警温度电源风扇状态电源正常标准Normal〔指示灯为绿色〕非正常标准Fail〔指示灯为红色〕风扇正常标准Normal〔指示灯为绿色〕非正常标准Fail〔指示灯为红色〕CPU内存状态电源〔重点关注后两列〕H3C建议值巡检建议值变化值关注65%<*<74%>35%差值大于10%告警>75%>50%差值大于20%风扇〔重点关注后两列〕H3C建议值巡检建议值变化值关注75%<*<90%>40%差值大于5%告警>90%>50%差值大于10%接口丢包错包率〔增量〕InputdropOutputdropInputerrorOutputerror关注>0.5%>0.5%>1%>1%告警>5%>5%>5%>5%接口负载率防火墙状态检查工程正常值运行时间>7DaysCPU使用率<35%内存使用率<40%Failover状态Active、Standby会话连接<+30%地址转换<+30%7设备相关信息收集7.1软件版本及硬件信息分析使用命令displayversion,查看路由器信息,在巡检过程中用此命令收集来的数据主要作用是:查看当前设备型号,及当前启动软件版本查看当前设备已运行时间查看当前设备引擎内存大小查看当前设备Flash大小具体关注方法如下:7.1.1当前设备硬件信息设备硬件信息主要包括如下参数:H3CS7500with1MPC8245Processor256MbytesSDRAM32768KbytesFlashMemory512KbytesNVRAMMemory〔如图第7-10行〕当前设备引擎号、内在与Flash大小H3CS7500LPUwith1MPC8241Processor128MbytesSDRAM0KbytesFlashMemory0KbytesNVRAMMemory〔如图第18-21行〕如果设备有冗余引擎,此处显示7.1.2当前设备运行软件信息设备软件信息主要包括如下参数:BootROMVersion〔如图第23行〕自启动文件的版本,可用于路由器启动前配置,修改超级管理密码。中低端设备亦称之为Bootstrap。ComwaresoftwareVersion〔如图第3行〕系统文件的版本,不同的版本支持的功能不尽一样。一般情况下向下兼容。前期设备称之为VRPsoftwareUptime(如图第6行)Uptime列出了该设备已运转的时间,这些信息可以帮助客户判断机器是否发生过意外的重启等7.2设备板卡硬件配置信息分析设备板卡硬件数据采集分析的主要任务是通过检查网络设备的板卡和模块配置,对网络设备的负载、容量和扩展能力进展分析。查看根本信息检查的命令主要有:displaydevicedisplaydiagnostic等命令设备硬件统计信息主要包括以下参数:Slot所在位置的槽号Status显示板卡状态SftVer显示板卡上软件的版本设备硬件分析的参考标准Status:当设备启动正常后,所有板卡状态就为Normal,如果有双引擎进展冗余状态配置时状态为一个Master,另一个是Normal。当板卡有故障时此板卡状态有可能显示FAULT 或显示不出装载的板卡。7.3设备运行状况检查运行状况检查包括:CPU的工作状态内存的工作状态Buffer的情况设备CPU工作状态检查使用命令displaycpu可以检查cpu的利用率,可以得到5秒、1分钟和5分钟的统计结果。内容内容说明CPUbusystatus交换机CPU的占用率状态18%inlast5seconds19%inlast1minute19%inlast5minutes最近5秒CPU占用率为18%最近一分钟CPU占用率为19%最近五分钟CPU占用率为19%处理器利用率分析的参考建议:这个数值在80%-90%之间时需要引起注意,大于90%时则影响网络稳定性和设备的正常处理。此数值可通过命令行窗口或网管软件采集连续值得出。当CPU使用率偏高时排查各个进程CPU使用情况。设备CPU利用率分析通过displaycpu命令采集相关设备一天当中三次数据,并对数据进展整理分析得到:序号设备名称一天三个时间段CPU利用率变化范围日起日中日结平均10.00%0.00%0.00%0.00%0.00%23.00%4.00%4.00%3.67%1.00%3【注】:日起数据为08:30-09:00的5分钟CPU的平均利用率日起数据为11:00-12:00的5分钟CPU的平均利用率日起数据为16:30-17:30的5分钟CPU的平均利用率设备MEMORY使用状态检查在任意视图下使用displaymemory或displaymemory-usage命令可采集相关设备MEM利用率的数据。<H3C>displaymemoryslot0SystemTotalMemory(bytes):197932416TotalUsedMemory(bytes):65234704UsedRate:32%[H3C]displaymemory-usageMemoryutilizationstatisticsat2011-08-1215:52:09200msSystemTotalMemoryIs:171774608bytesTotalMemoryUsedIs:128234928bytesMemoryUsingPercentageIs:74%内容内容说明SystemTotalMemory(bytes)系统的内存总大小,以字节为单位TotalUsedMemory(bytes)已经使用的内存大小,以字节为单位UsedRate已经使用的内存所占的比例另外,可以用displaymemorylimit显示内存配置消息<H3C>displaymemorylimitCurrentmemorylimitconfigurationinformation:systemmemorysafety:40(MBytes)systemmemorylimit:30(MBytes)auto-establishenabledFreeMemory:108120672(Bytes)Thestateinformationaboutconnection:Thetimesofdisconnect:0Thetimesofreconnect:0Thecurrentstate:Normal设备MEMORY利用率分析表使用displaymemory命令采集相关设备一天三次MEM利用率的数据,并进展数据比拟,从表中看到内存占用是否稳定,并关注其变化范围。序号设备名称内存〔KB〕日起日中日结平均变化范围127.4设备运行状态检查电源的工作状态使用displaypower命令查看电源状态是否正常,电源是否冗余。<H3C>displaypowerPower1State:AbsentPower2State:NormalPower3State:Absent风扇的工作状态使用displayfan命令查看风扇状态是否正常。<H3C>displayfanFan1State:Normal设备工作温度使用displayenvironment命令,查看设备内部板卡、机框的工作温度是否正常。<H3C>displayenvironmentSystemtemperatureinformation(degreecentigrade):BoardTemperatureLowerlimitUpperlimit1301070343108053310708端口的可用性、准确性检查8.1端口状态检查使用displayinterface查看设备端口运行状况。在巡检过程中用此命令收集来的数据的主要作用是:<H3C>displayinterfaceEthernet2/0/1Ethernet2/0/1currentstate:DOWNIPSendingFrames'FormatisPKTFMT_ETHNT_2,Hardwareaddressis000f-e20f-3f11TheMa*imumTransmitUnitis1500Mediatypeistwistedpair,loopbacknotsetPorthardwaretypeis100_BASE_T*Unknown-speedmode,unknown-duple*modeLinkspeedtypeisautonegotiation,linkduple*typeisautonegotiationFlow-controlisnotenabledTheMa*imumFrameLengthis1536Broadcast-suppressionratio:20%AllowjumboframetopassPVID:1Mditype:autoPortlink-type:accessTaggedVLANID:noneUntaggedVLANID:1Last300secondsinput:0packets/sec0bytes/secLast300secondsoutput:0packets/sec0bytes/secInput(total):0packets,0bytes-broadcasts,-multicastsInput(normal):0packets,0bytes0broadcasts,0multicastsInput:0inputerrors,0runts,0giants,0throttles,0CRC0frame,-overruns,-aborts,-ignored,-parityerrorsOutput(total):0packets,0bytes-broadcasts,-multicasts,-pausesOutput(normal):0packets,0bytes0broadcasts,0multicasts,0pausesOutput:0outputerrors,-underruns,-bufferfailures-aborts,0deferred,0collisions,0latecollisions-lostcarrier,-nocarrier参数指标如下:字段描述Ethernet2/0/1currentstate以太网端口当前开启或关闭状态IPSendingFrames'Format以太网帧格式Hardwareaddress端口硬件地址TheMa*imumTransmitUnit最大传输单元Mediatype介质类型Porthardwaretype端口硬件类型Flow-controlisnotenabled端口流控状态TheMa*imumFrameLength端口允许通过的最大以太网帧长度Broadcast-suppressionratio端口播送风暴抑制比Allowjumboframetopass端口允许长帧通过PVID端口缺省VLANIDMditype网线类型Portlink-type端口链路类型TaggedVLANID标识在该端口有哪些VLAN的报文需要打Tag标记UntaggedVLANID标识在该端口有哪些VLAN的报文不需要打Tag标记Last300secondsinput:0packets/sec0bytes/secLast300secondsoutput:0packets/sec0bytes/sec端口最近300秒输入和输出速率和报文数Input(total):0packets,0bytes-broadcasts,-multicastsInput(normal):0packets,0bytes0broadcasts,0multicastsInput:0inputerrors,0runts,0giants,0throttles,0CRC0frame,-overruns,-aborts,-ignored,-parityerrorsOutput(total):0packets,0bytes-broadcasts,-multicasts,-pausesOutput(normal):0packets,0bytes0broadcasts,0multicasts,0pausesOutput:0outputerrors,-underruns,-bufferfailures-aborts,0deferred,0collisions,0latecollisions-lostcarrier,-nocarrier端口输入/输出报文和错误信息统计,其中"-〞表示不支持该统计项。根本网络接口状态分析接口的状态有两个方面的组件构成:物理层状态和数据链路层状态。第一个组件是"物理层状态〞,亦即接口是否有物理连接,是否收到正确的传信。对于串口来说,正确的传信应该是载波检测"CarrierDetect,CD〞信号或者是来自WAN的一个计时信号。而对Ethernet接口来说,正确的传信应当是来自交换机或HUB的链路传信。第二个组件是:"数据链路层状态〞,就是通常我们所说的线路协议状态,它指出接口是否收到了"存活〞信号〔如果允许的话〕。所谓"存活〞〔keepalive〕信号,是指一条小的第二层消息,该消息由网络设备发出,使那些与它直连的网络设备知识它:"仍然存在〞。接口半/全双工模式和链路类型接口的双工模式和链路类型一般为AUTO模式,需要链路两端进展自协商,如果对两端的双工模式和链路类型进展配置,则必须保证两端的配置一定要一致,否则链路进展匹配时可能出现丢包或者链路协议DOWN的问题。接口稳定性统计信息网络端口统计信息主要包括的以下参数:Interface显示接口或子接口的名字。Input列出了所有进入接口的帧的数量和种类。Output列出了所以离开接口的帧的数量和种类。8.2端口状态检查表设备名称端口号SpeedDuple*InputOutput9设备端口负载及流量检查9.1设备缓存信息检查使用命令查看设备缓存信息,在巡检过程中用此命令收集的数据的主要作用是查看各种缓存的使用情况。9.2流量信息检查查看设备端口的吞吐、错误信息和丢弃信息,使用displayinterface命令实现。由于网络系统的流量信息需要经过长期的观测和分析,建议采用网络管理系统进展数据采集,并对网络管理系统的数据进展分析,手工采集数据仅供参考。输出表格如下:10网络架构、配置信息分析10.1网络构造检查检查内容网络拓扑图网络物理连接示意图,包括节点或位置名称、网络设备名、端口名称与带宽、管理IP地址网络逻辑连接示意图,包括路由、STP、端口信息等网络路由构造示意图,包括的路由协议的邻居关系、认证、路由器的ID、缺省与静态路由等。网络协议书策略检查检查方式查看设备使用何种路由协议和路由表信息,检查网络设备连接关系,使用以下命令:Displayiprouting-table用于查看网络中路由协议及路由条目信息Displayospfpeer如果网络中使用ospf协议,此命令用于显示ospf的邻居信息。Displayospfinterface如果网络中使用ospf协议,此命令用来显示ospf的接口信息。Displayipinterfacebrief用于查看端口的连接状态DisplayVLAN用于查看网络配置中的VLAN信息Displayporttrunk用于查看网络配置启用TRUNK协议的端口信息Displaystp用于查看生成树的状态和统计信息。网络构造信息主要参考指标:路由局部:暂时空缺二层链路局部:TRUNK禁用定义连接非交换设备的端口是否关闭了trunk功能参考标准与端设备相连的端口必须设置成access模式VLAN局部:对应的IP网段定义每一个VLAN是否对应一个IP网段参考标准每一个VLAN最好对应一个IP网段ManagementVLAN定义是否有独立的ManagementVLAN参考标准应该配置统一的专用管理VLANDefaultVLAN定义DefaultVLAN当中是否承载用户数据流参考标准DefaultVALN应该专用,不应该有端口划分到该VLANSTP局部:根交换机定义生成树的根是否在核心交换机上参考标准生成树的根应该在核心交换机上〔核心交换机的优先级最好配置为0〕根端口定义非根交换机的根端口是否为距离根交换机费用最低的端口参考标准非根交换机的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论