机房巡检内容及设备检查标准汇编_第1页
机房巡检内容及设备检查标准汇编_第2页
机房巡检内容及设备检查标准汇编_第3页
机房巡检内容及设备检查标准汇编_第4页
机房巡检内容及设备检查标准汇编_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机房巡检内容及设备检查(jinch)标准XX部 主讲人:XX共五十一页FAQ巡检内容1巡检方法23共五十一页巡检内容1共五十一页系统整体架构以下内容作为基本IT系统信息被首先调查记录,供分析参考使用。 IT系统架构拓扑图网络设备配置-设备型号, IOS版本, 模块型号和数量,用途存储系统配置-设备型号, IO带宽, Cache容量,磁盘(c pn)数量,接入模式,存储容量,LUN配置,所属应用主机系统配置-设备型号,CPU 配置(类型,主频,数量),内存容量,网卡配置(数量,速率),内置硬盘配置(数量,容量,Raid),所属应用数据库软件-产品名称,版本号,所属应用中间件软件-产品名称,版本号

2、,JDK版本,所属应用应用系统-产品名称,版本号,架构平台,系统架构类型共五十一页机房(j fn)环境项目描述满足标准机房功能服务于何种业务系统N/A温度机房温度范围摄氏16-25度湿度机房湿度范围30%-55%UPS保护稳压继电作用,是否部署存在UPS设备,供电时间根据客户实际情况确定防雷保护是否存在是接地保护是否存在是防静电保护是否存在是地板承重能力最大承重800KG/平方米防火设施是否存在是防鼠设施是否存在是门禁控制是否存在是监视器是否存在是卫生状况环境清洁是以上的条件可以现场观察和询问用户(yngh)完成。 共五十一页网络设备项目描述满足标准设备外观状况无破损是设备状态灯是否有告警灯闪

3、亮无设备运转状况功能正常是带宽利用率是否在80以内是CPU利用率是否在80以内是日志系统是否有错误无线路冗余冗余线路的负载能力要能够满足生产系统负载需求。是网络系统监控机制是否存在是共五十一页防火墙项目描述满足标准部署情况是否部署在系统中是访问控制策略是否配置是在线访问审计是否配置是保护范围保护哪些设备N/A设备外观状况无破损是设备运转状况功能正常是共五十一页IPS项目描述满足标准部署情况是否部署在系统中是在线攻击防御是否配置是在线攻击审计是否配置是保护范围保护哪些设备N/A设备外观状况无破损是设备运转状况功能正常是共五十一页IDS项目描述满足标准部署情况是否部署在系统中是旁路访问审计是否配置

4、是旁路攻击审计是否配置是保护范围保护哪些设备N/A设备外观状况无破损是设备运转状况功能正常是共五十一页VPN项目描述满足标准部署情况是否部署在系统中是安全策略配置包过滤规则是保护范围保护哪些设备N/A设备外观状况无破损是设备运转状况功能正常是共五十一页存储系统项目描述满足标准设备外观状况无破损是设备运转状况功能正常是RAID级别根据业务类型和容错需求判断是否适合是Hot Spare是否配置热备盘是硬件冗余配置硬件是否存在单点故障否访问控制是否配置访问控制是可用容量20%以上数据增长率评估可用容量的可用时间N/A系统日志是否有严重报错无共五十一页主机(zhj)系统1项目描述满足标准设备外观状况无

5、破损是设备运转状况功能正常是硬件系统日志是否有严重报错无网卡状态可用是IP地址配置N/A路由配置N/A网络联通状况链路是否畅通N/A文件系统类型N/A分区剩余状况是否存在即将写满的分区无分区合理性Swap分区达到物理内存的2倍,VAR分区是否达到2GB是外存储接入设备设备型号N/A外存储接入设备速率传输速率N/A共五十一页项目描述满足标准RAID级别根据业务类型和容错需求判断是否适合是应用数据部署位置N/ACPU负载情况利用率小于85%是内存使用情况使用率低于90%是磁盘状况使用率低于80%是网络负载平均利用率低于80%是口令管理密码复杂程度高,1.长度超过8个字符。2.设置为无意义字符组合。

6、3.多类型字符组合。4.大小写混合组合。定期修改,强制口令过期。限制口令重试次数。是主机(zhj)系统2共五十一页项目描述满足标准系统补丁更新为最新是病毒防范措施安装防病毒软件是系统日志不存在验证错误警告是主机系统监控机制是否存在是主机(zhj)系统3共五十一页应用(yngyng)系统-1项目描述满足标准运行状态功能正常是关键业务执行效率性能响应时间满足客户需求是稳定性状况满足客户需求是可承受的最大负载最大并发用户负载N/A口令管理密码复杂程度高,1.长度超过8个字符。2.设置为无意义字符组合。3.多类型字符组合。4.大小写混合组合。定期修改,强制口令过期。限制口令重试次数。是共五十一页应用(

7、yngyng)系统-2项目描述满足标准用户访问接入形式广域网,局域网,专线,VPN局域网,专线,VPN数据传输形式是否加密是权限控制机制分级权限控制是否存在,访问应用中任何资源都需要身份验证为前提。是版本控制机制是否存在是应用审计机制是否存在是共五十一页备份(bi fn)与恢复系统项目描述满足标准制定备份策略 按一段时间周期,将完全备份、增量备份和差分备份组合使用制定备份策略 是备份方式 备份设备可选取磁带机或磁带库 N/A恢复应急预案制定恢复应急预案是恢复流程制定恢复流程是定期恢复演习 按一段时间周期,将定期备份的数据进行模拟恢复演练,验证数据恢复的正确性是共五十一页巡检方法2共五十一页对照

8、巡检计划的安排,对主机系统进行硬件、操作系统进行功能及性能(xngnng)检查。注意:系统中所使用的每台主机都要单独列表检查。 主机(zhj)部分共五十一页巡检对象:XX系统XX服务器(HOSTNAME)巡检目的(md):检查XX系统XX服务器的状态巡检平台:XX系统主机,超级用户前提条件:线路通畅序号巡检步骤正确结果巡检结果是否1主机物理外观检查主机系统外观正常,没有明显损坏状态2主机加电检查主机系统正常启动。3登录测试:录到服务器上正常登录4检查主机的内置硬盘大小显示硬盘大小符合要求5网卡状态巡检:用ipconfig all命令查看,并且可以看到网卡的地址和网络掩码显示所有网卡信息, ip

9、config命令显示网卡状态为UP,网卡指示灯状态正确.网卡的地址和规划中一样6察看系统的补丁的级别确认是当前比较新的。 说明:检测主机的目的是:A.确认系统运行正常;B.确认系统配置与设计一致;C.确认网络状态正常;D.确认操作系统安装状态正常。范例(fnl):共五十一页对照巡检计划的安排,对网络设备进行硬件、操作系统进行功能及性能巡检。注意:系统中所使用的每台网络设备都要单独(dnd)列表巡检。 网络(wnglu)部分共五十一页巡检对象:XX系统网络设备(NAME)巡检目的(md):XX系统网络设备的系统状态巡检平台:XX系统网络设备,超级用户前提条件:线路通畅序号巡检步骤正确结果巡检结果

10、是否1网络设备外观检查网络设备外观正常,没有明显损坏状态2网络设备加电检查网络设备正常启动。3登录测试:从主控制台(console)及用telnet命令远程登录网络设备上正常登录4检查版本和硬件配置show version (路由器ios)show module (交换机catalyst os)显示版本和配置同设计相符。5检查CPU利用率show processes cpu显示正常的CPU使用率。6检查内存利用率show processes memory显示正常的内存使用率。7检查端口状态show ip interface brief检查正在使用的主要端口的状态show interface 显

11、示工作的端口为UP状态;Interface没有冲突等错误信息。范例(fnl):共五十一页8用PING扩展命令检查本网络设备到其它设备接点的连通性:#ping Target ip_address: Repeat count:1000Datagram size 100:1500 (多个接点按此项扩展)显示“!”,所发包全部成功9查看路由配置#show ip route显示正确的路由,指向正确的路由器10(10-12条,根据不同路由协议,填写相关的检查要点和命令)检查ospf neighborshow ip ospf neighbor显示ospf neighbor,( )个neighbor11检查o

12、spf数据库信息show ip ospf database显示ospf链路状态数据库的信息,其中Link ID为路由器的ID。12检查ospf路由表信息show ip route summaryshow ip route ospf显示ospf路由的条数和ospf路由表13检查HSRP的状态:#show standby具有高priority值的端口处于active的状态,低priority值的端口处于standby状态。14在具有高priority值的网络设备上reload重启动#reload在具有低priority值的上网络设备 interface由standby状态转换为active状态共五

13、十一页15从用户PC ping通过网关访问其它接点地址:ping -s xxx.xxx.xxx.xxx切换正常,用户设备到其它设备的连接中断之间小于5s16(高端交换机,例如65系列)在引擎上reset 重启动引擎(交换机引擎catalyst os)#(enable)reset在具有高priority值的网络设备interface由standby状态转换为active状态17从用户PC ping通过网关访问其它接点地址:ping -s xxx.xxx.xxx.xxx切换正常,用户设备到其它设备的连接中断之间小于5s说明:检测网络设备的目的是:A.确认网络设备运行正常;B.确认网络设备配置与设计

14、一致;C.确认网络状态正常;D.确认网络设备安装状态正常。共五十一页路由器的管理(gunl)方式带外管理(gunl)通过带外对路由器进行管理(PC 与路由器直接相连)带内管理通过Telnet 对路由器进行远程管理通过Web 对路由器进行远程管理通过SNMP 工作站对路由器进行远程管理共五十一页RJ45-DB9转换器反转(fn zhun)线缆DB9-RJ45线缆Console口(RJ45)AUX口(连接(linji)拨号网络 )Console口(RJ45)Console口及配置线缆共五十一页带外管理(gunl)配置连线利用配置(pizh)线将主机的COM口和路由器或交换机的console口相连打

15、开超级终端从开始-程序-附件-通讯-超级终端打开超级终端程序配置超级终端为连接命名选择合适的COM口配置正确的参数共五十一页TELNET管理(gunl)在主机(zhj)DOS命令行下输入: telnet ip address(路由器管理IP)共五十一页TELNET管理(gunl)续 输入telnet密码和特权密码即可进入(jnr)到路由器的配置界面共五十一页基于(jy)WEB的管理 在web页面中输入路由器的管理IP可以(ky)进入路由器的web管理页面共五十一页基于(jy)SNMP协议的管理共五十一页总体的信息收集 show tech查看ios版本(bnbn)等信息show version查

16、看logshow log查看设备的时钟show clock查看接口状态show ip int bri查看设备路由情况show ip route查看ios软件包show flash (或show bootflash /show disk0)Cisco系统的一些(yxi)巡检常用命令列表:共五十一页Router#show processes cpuCPU utilization for five seconds: 1%/0%; one minute: 2%; five minutes: 1% PID Runtime(ms) Invoked uSecs 5Sec 1Min 5Min TTY Proc

17、ess 1 0 1 0 0.00% 0.00% 0.00% 0 Chunk Manager 2 0 19 0 0.00% 0.00% 0.00% 0 Load Meter 3 4328 151 28662 0.87% 2.34% 1.14% 0 Exec 4 0 1 0 0.00% 0.00% 0.00% 0 EDDRI_MAIN 5 32 15 2133 0.15% 0.02% 0.00% 0 Check heaps 6 0 1 0 0.00% 0.00% 0.00% 0 Pool Manager 7 0 2 0 0.00% 0.00% 0.00% 0 Timers 8 0 2 0 0.00

18、% 0.00% 0.00% 0 Serial Backgroun 9 0 2 0 0.00% 0.00% 0.00% 0 ATM Idle Timer 10 0 2 0 0.00% 0.00% 0.00% 0 ATM AutoVC Perio 11 4 2 2000 0.00% 0.00% 0.00% 0 ATM VC Auto Crea 12 0 2 0 0.00% 0.00% 0.00% 0 AAA high-capacit 13 36 148 243 0.00% 0.01% 0.00% 0 EnvMon 14 0 1 0 0.00% 0.00% 0.00% 0 OIR Handler 1

19、5 0 3 0 0.00% 0.00% 0.00% 0 IPC Dynamic Cach 16 0 1 0 0.00% 0.00% 0.00% 0 IPC Zone Manager 17 4 149 26 0.00% 0.00% 0.00% 0 IPC Periodic Tim 18 0 149 0 0.00% 0.00% 0.00% 0 IPC Deferred Por 19 0 1 0 0.00% 0.00% 0.00% 0 IPC Seat Manager 20 56 15 3733 0.00% 0.00% 0.00% 0 ARP Input 21 0 8 0 0.00% 0.00% 0

20、.00% 0 HC Counter Timer show processes cpu /查看当前CPU资源使用(shyng)的情况共五十一页Router#show processes memoryTotal: 25963296, Used: 9722148, Free: 16241148 PID TTY Allocated Freed Holding Getbufs Retbufs Process 0 0 268816 56216 7117992 0 0 *Init* 0 0 692 75968 692 0 0 *Sched* 0 0 15862728 4588556 105816 18012

21、8 0 *Dead* 1 0 0 0 6852 0 0 Chunk Manager 2 0 188 188 3852 0 0 Load Meter 3 0 819176 764812 80816 0 0 Exec 4 0 65580 0 90432 0 0 EDDRI_MAIN 5 0 0 0 6852 0 0 Check heaps 6 0 0 0 6852 0 0 Pool Manager 7 0 188 188 6852 0 0 Timers 8 0 188 188 6852 0 0 Serial Backgroun 9 0 188 188 6852 0 0 ATM Idle Timer

22、 10 0 188 188 9852 0 0 ATM AutoVC Perio 11 0 188 188 6852 0 0 ATM VC Auto Crea 12 0 188 188 6852 0 0 AAA high-capacit 13 0 0 0 6852 0 0 EnvMon 14 0 0 0 9852 0 0 OIR Handler 15 0 0 0 6852 0 0 IPC Dynamic Cach 16 0 0 0 6852 0 0 IPC Zone Manager 17 0 0 0 6852 0 0 IPC Periodic Tim 18 0 0 0 6852 0 0 IPC

23、Deferred Porshow processes mem /查看当前内存(ni cn)资源使用的情况共五十一页Router#show version Cisco Internetwork Operating System Software IOS (tm) 7200 Software (C7200-JS-M), Version 12.3(20), RELEASE SOFTWARE (fc2)Technical Support: /techsupportCopyright (c) 1986-2006 by cisco Systems, Inc.Compiled Tue 08-Aug-06 1

24、8:43 by kesnyderImage text-base: 0 x60008AF4, data-base: 0 x6207E000ROM: ROMMON Emulation MicrocodeBOOTLDR: 7200 Software (C7200-JS-M), Version 12.3(20), RELEASE SOFTWARE (fc2)Router uptime is 6 minutesSystem returned to ROM by unknown reload cause - suspect boot_dataBOOT_COUNT 0 x0, BOOT_COUNT 0, B

25、OOTDATA 19System image file is t55/unknowncisco 7206VXR (NPE400) processor (revision A) with 81920K/16384K bytes of memory.Processor board ID 4294967295R7000 CPU at 150MHz, Implementation 39, Rev 2.1, 256KB L2 Cache6 slot VXR midplane, Version 2.1show version /查看当前设备软件(run jin)版本共五十一页show ip route /

26、查看(chkn)IPv4路由表RCMS# show ip routeCodes: C - connected, S - static, R - RIP O - OSPF, IA - OSPF inter area N1 - OSPF NSSA external type 1, N2 - OSPF NSSA external type 2 E1 - OSPF external type 1, E2 - OSPF external type 2 * - candidate defaultGateway of last resort is 93 to network S* /0 1/0 via 93

27、C 92/26 is directly connected, FastEthernet 1/0C 07/32 is local host. C /24 is directly connected, FastEthernet 1/1C /32 is local host. 共五十一页show log /查看保存在设备(shbi)内存中的日志信息S2150G#show logSyslog logging: Enabled Console logging: Enabled(debugging)Monitor logging: DisabledBuffer logging: Enabled(debug

28、ging)Server logging severity: debuggingFile logging: Disabled Logging history:2007-12-04 16:34:10 5-WARMSTART:System warmstart2007-12-04 16:34:11 5-LINKUPDOWN:Fa0/1 changed state to up 2007-12-04 16:34:11 5-LINKUPDOWN:VL1 changed state to up 2007-12-09 15:41:58 5-CONFIG:Configured from outband2007-1

29、2-09 15:42:06 5-CONFIG:Configured from outband2007-12-09 15:44:53 5-CONFIG:Configured from outband2007-12-09 15:48:32 5-LINKUPDOWN:Fa0/8 changed state to up 2007-12-09 15:48:33 5-LINKUPDOWN:Fa0/12 changed state to up 2007-12-09 15:48:33 5-LINKUPDOWN:Fa0/8 changed state to down 2007-12-09 15:48:33 5-

30、LINKUPDOWN:Fa0/12 changed state to down 2007-12-09 15:50:19 5-LINKUPDOWN:Fa0/8 changed state to up -More-共五十一页show interface count /查看接口的流量统计(tngj)信息S2150G#show interfaces countInterface : Fa0/15 minute input rate : 6872 bits/sec, 12 packets/sec5 minute output rate : 832 bits/sec, 1 packets/secInOct

31、ets : 5828954InUcastPkts : 5264InMulticastPkts : 3689InBroadcastPkts : 70565OutOctets : 4866613OutUcastPkts : 4657OutMulticastPkts : 149OutBroadcastPkts : 68886Undersize packets : 0Oversize packets : 0collisions : 0Fragments : 0Jabbers : 0CRC alignment errors : 0AlignmentErrors : 0FCSErrors : 0dropp

32、ed packet events (due to lack of resources): 0packets received of length (in octets): 64:142204, 65-127: 6105, 128-255: 4370, 256-511: 242, 512-1023: 69, 1024-1518: 220共五十一页show interface state /查看(chkn)接口工作的状态S2150G# show interfaces status Interface Status vlan duplex speed type - - - - - -Fa0/1 up

33、 1 Full 100 10/100BaseTX Fa0/2 down 1 Unknown Unknown 10/100BaseTX Fa0/3 down 1 Unknown Unknown 10/100BaseTX Fa0/4 down 1 Unknown Unknown 10/100BaseTX Fa0/5 down 1 Unknown Unknown 10/100BaseTX Fa0/6 down 1 Unknown Unknown 10/100BaseTX Fa0/7 down 1 Unknown Unknown 10/100BaseTX Fa0/8 down 1 Unknown Un

34、known 10/100BaseTX Fa0/9 down 1 Unknown Unknown 10/100BaseTX Fa0/10 up 1 Full 100 10/100BaseTX 共五十一页FAQ3共五十一页对机房的基础设施(shsh)配备应该按照标准实施,不符合标准的项目应该尽可能整改,添加应有设施(shsh)。对UPS的维护应该定期进行检测,巡检其供电的有效时间,一旦发现电池老化应尽快更换。 机房(j fn)环境共五十一页网络设备问题描述解决方法设备外观状况存在破损检测设备可用性,一旦发现功能问题及时更换维修设备运转存在功能问题更换维修带宽利用率过高检测网络数据流状态,判断是否存

35、在病毒、网络攻击以及设计不合理的应用造成的原因,排除上述因素后考虑升级网络交换设备。CPU利用率过高检测网络数据流状态,判断是否存在病毒、网络攻击以及设计不合理的应用造成的原因,排除上述因素后考虑升级网络交换设备。不存在网络系统监控机制建议部署相关产品共五十一页防火墙问题描述解决方法未部署防火墙建议部署未配置访问控制建议配置未配置在线访问审计建议配置设备外观状况存在破损检测设备可用性,一旦发现功能问题及时更换维修设备运转存在功能问题更换维修共五十一页IPS问题描述解决方法未部署IPS建议部署是否配置在线攻击防御建议配置是否配置在线攻击审计建议配置设备外观状况存在破损检测设备可用性,一旦发现功能问题及时更换维修设备运转存在功能问题更换维修共五十一页I

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论