SAN交换机维护操作手册_第1页
SAN交换机维护操作手册_第2页
SAN交换机维护操作手册_第3页
SAN交换机维护操作手册_第4页
SAN交换机维护操作手册_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SAN交换机健康检查操作手册

目录目录CONTENTSTOC\o"1-2"\f\h\z\u第一章 SAN交换机健康检查操作手册 11.1 目的 11.2 合用范畴 11.3 交换机工作环境温度检查 11.4 SAN交换机状态查询 11.5 SAN交换机的登录 31.6 交换机Firmware版本检查 31.7 Zoning检查 41.8 SAN交换机日志信息收集 41.9 SAN交换机配备文献备份 121.10 惯用操作系统HBA卡WWN号查看办法 121.11 惯用存储HBA卡WWN号查看办法 161.12 微码升级 181.13 健康检查统计 19SAN交换机健康检查操作手册目的本文档为工程师提供每季度一次SAN交换机健康检查的办法指导。合用范畴本文档的区域范畴为广州市公安局信息中心,设备范畴为区域内的brocade(博科)、IBMSAN交换机网络设备。交换机工作环境温度检查巡逻维护工程师对每个SAN交换机的工作环境温度进行检查并做好统计。命令行方式以下:交换机运行环境温度检查远程登录(telnet)到交换机,执行以下命令:>tempshow屏幕显示状态为“OK”:SAN交换机状态查询SAN交换机,以下图所示,电源、光纤模块端口等批示灯位置,其颜色代表SAN交换机设备的不同工作状态,设备巡逻重要是检查设备各批示灯的状态。SAN交换机批示灯序号批示灯颜色描述1端口状态批示灯不亮未检测到信号,需要检查SFP和线缆绿灯长亮端口连接正常,但没有数据传输绿灯慢闪(1秒亮,1秒灭)端口连接,但是连接设备不兼容或端口设立错误绿灯快闪(1/4秒亮,1/4秒灭)内部环回,用于故障检测绿灯闪(无规律)连接正常,有数据正在传输黄灯长亮端口接受到信号,但未上线(正常状态)黄灯慢闪(1秒亮,1秒灭)端口或交换机被禁用(disablePort或disableSwitch)黄灯快闪(1/4秒亮,1/4秒灭):端口故障2电源状态批示灯绿色正常工作状态黄色不正常工作状态巡逻电源工作状态巡逻维护工程师对每个SAN交换机的电源工作状态批示灯进行检查并做好统计。命令行方式以下:电源状态远程登录(telnet)到交换机,执行以下命令:>psshow屏幕显示状态为“OK”:powersupply1:okpowersupply2:ok巡逻电扇工作状态巡逻维护工程师对每个SAN交换机的散热电扇工作状态进行检查并做好统计。命令行方式以下:电扇状态远程登录(telnet)到交换机,执行以下命令:>fanshow屏幕显示状态为“OK”:Fan#1isOKFan#2isOKFan#3isOK巡逻端口工作状态巡逻维护工程师对每个SAN交换机的各端口工作状态批示灯进行检查并做好统计。检查各个端口数据传输采用抽查的方式。远程登录(telnet)到交换机,执行以下命令:>porterrshow检查各个端口连接状况及交换机domainID的唯一性远程登录(telnet)到交换机,执行以下命令:>switchshow1.可监控到各个端口状态:Online(已连接主机的端口FPort)或者No_Light(没有联接主机的端口GPort)2.显示交换机的domainID为:switchDomain:IDSAN交换机的登录串口线登陆交换机自带一种串口线。将串口盖拿掉,将串口线连接上去连接串口线到笔记本的串口。打开“超级终端”,配备以下:每秒位数9600;数据位8;其它默认当超级终端停止报告信息,按“Enter”显示login信息,login默认顾客:admin,默认密码:password。网络连接登陆用telnet工具通过IP地址登陆。iP地址默认为7。默认顾客:admin,默认密码:passwordWeb方式登录使用浏览器登录,主机需安装java控件。默认顾客:admin,默认密码:password交换机Firmware版本检查巡逻维护工程师对每个SAN交换机的Firware版本进行检查并做好统计。命令行方式以下:交换机firmware版本远程登录(telnet)到交换机,执行以下命令:>version屏幕打印版本信息为:FabricOS:v4.4Zoning检查巡逻维护工程师对每个SAN交换机的zoning进行检查并做好统计。命令行方式以下:检查zoning远程登录(telnet)到交换机,执行以下命令:#zoneshow能够列出全部的zone配备。并且,定义的zone配备与生效的zone配备相似SAN交换机日志信息收集Uptime显示交换机工作时间,检查该交换机现在时钟,现在有几个顾客登录到这台交换机,以及它已经正常工作了多长时间等信息。switch:admin>uptime07:00:15up1143days,19:11,1admin,loadaverage:0.00,0.01,0.04Ipaddrshow显示交换机IP地址信息。switch:admin>ipaddrshowSWITCHEthernetIPAddress:43EthernetSubnetmask:GatewayIPAddress:DHCP:OffIPv6AutoconfigurationEnabled:YesLocalIPv6Addresses:IPv6Gateways:Licenseshow显示现在交换机所添加的license信息。licenseshow:edbcyeby9fecdzL:WeblicenseRy9cdQyy9RSzAdeb:ZoninglicenseSyRbeyR9zcTzScfQ:FabriclicenseSwitchshow检查交换机信息及端口状态。switch:admin>switchshowswitchName:SW1switchType:34.0switchState:OnlineswitchMode:NativeswitchRole:PrincipalswitchDomain:1switchId:fffc01switchWwn:10:00:00:05:1e:06:d7:04ADFeature:ActiveCurrentAD:0zoning:ON(cfg)switchBeacon:OFFAreaPortMediaSpeedStateProto=====================================00id2GNo_Light11id2GOnlineF-Port10:00:00:00:c9:6f:4b:4222id2GOnlineF-Port10:00:00:00:c9:6f:af:9833id2GOnlineF-Port10:00:00:00:c9:6f:57:d344id2GOnlineF-Port50:06:01:69:41:e0:ad:4255id2GOnlineF-Port50:06:01:61:41:e0:ad:4266id2GNo_Light77id2GNo_Light88--2GNo_Module(NoPODLicense)Disabled99--2GNo_Module(NoPODLicense)Disabled1010--2GNo_Module(NoPODLicense)Disabled1111--2GNo_Module(NoPODLicense)Disabled1212--2GNo_Module(NoPODLicense)Disabled1313--2GNo_Module(NoPODLicense)Disabled1414--2GNo_Module(NoPODLicense)Disabled1515--2GNo_Module(NoPODLicense)DisabledSwitchstatusshow显示交换机运行状态,重点检查如果交换机状态为healthy,则表达交换机现在运行正常,如果有不是healthy的状态出现,则需要根据具体问题使用有关命令继续检查。switch:admin>switchstatusshowSwitchHealthReportReporttime:07/15/10:11:35AMSwitchName:SW1IPaddress:43SwitchState:HEALTHYDuration:224:06PowersuppliesmonitorHEALTHYTemperaturesmonitorHEALTHYFansmonitorHEALTHYFlashmonitorHEALTHYMarginalportsmonitorHEALTHYFaultyportsmonitorHEALTHYMissingSFPsmonitorHEALTHYFabricWatchisnotlicensedDetailedportinformationisnotincludedFirmwareshow显示微码版本信息检查交换机现在微码与否符合微码评定规定,与否存在Bug,与否需要升级。firmwareshow:ApplPrimary/SecondaryVersionsFOSv6.2.1bv6.2.1bFanshow显示电扇运行状态重点检查现在交换机散热电扇状态与否为OK。fanshow:Fan1isOk,speedis2045RPMFan2isOk,speedisRPMFan3isOk,speedisRPMTempshow显示交换机现在温度信息检查现在交换机的温度传感器与否为OK状态。tempshow:SensorSlotStateCentigradeFahrenheitID=====================================================11Absent22Absent33Ok298444Ok288255Ok298466Ok308677Ok298488Absent99Absent1010Absent各部分温度正常(20-50度)(Absent表达插槽为空)。Psshow显示电源运行状态:电源状态都是OK则表明电源运行正常,absent表达没有插电源。psshow:PowerSupply#1isOKDELTADPS1001AB-1EM230060301FL2L9018699PowerSupply#2isOKDELTADPS1001AB-1EM230060301FL2L9018658PowerSupply#3isabsentPowerSupply#4isabsentSlotshow显示板卡运行状态如果板卡状态为ENABLE,则表达此槽位板卡正常如果板卡状态为VACANT,板卡类型为UNKNOWN,则需要根据具体配备状况检查该槽位与否真的没有插卡,如确实没有插卡,则此状态正常。slotshow:SlotBladeTypeIDStatus1UNKNOWNVACANT2UNKNOWNVACANT3SWBLADE36ENABLED4SWBLADE36ENABLED5CPBLADE16ENABLED6CPBLADE16ENABLED7SWBLADE36ENABLED8UNKNOWNVACANT9UNKNOWNVACANT10UNKNOWNVACANTHashow显示CP板卡HA状态重点检查activeCP板卡和standbyCP板卡状态与否为health。检查HA状态与否为enabled和synchronized。switch:admin>hashowLocalCP(Slot6,CP1):Active,WarmRecoveredRemoteCP(Slot5,CP0):Standby,HealthyHAenabled,HeartbeatUp,HAStatesynchronizedErrdump显示错误日志重点检查错误日志中与否存在ERROR或者WARNING信息。errdump:FabricOS:v6.2.1b/06/21-16:36:25,[PORT-1010],1383,FID128,WARNING,SW1,Port(ID:3)QOSisdisabled/06/21-16:36:29,[PORT-1010],1384,FID128,WARNING,SW1,Port(ID:3)QOSisdisabledFabricshow显示fabric信息重点检查Fabric信息与实际Fabric中交换机数量与否一致。fabricshow:SwitchIDWorldwideNameEnetIPAddrFCIPAddrName100:fffc6410:00:00:05:1e:36:3f:944"HE-CCB-SFB1"200:fffcc810:00:00:05:1e:0c:1c:fb02>"swd77-L"TheFabrichas2switches确认交换机与否级联SwitchIDWorldwideNameEnetIPAddrFCIPAddrName1:fffc0110:00:00:05:1e:06:d7:0443>"SW1"Cfgshow显示交换机配备信息检查交换机zoning信息与否符合配备规定。Definedconfiguration:cfg:CopyOfcfgnorthking1_H0_emc_spa;northking1_H1_emc_spb;northking2_H0_emc_spa;northking2_H1_emc_spbcfg:cfgnorthking1_H0_emc_spa;northking1_H1_emc_spb;northking2_H0_emc_spa;northking2_H1_emc_spbzone:northking1_H0_emc_spa1,2;1,4zone:northking1_H1_emc_spb1,3;1,5zone:northking2_H0_emc_spa1,0;1,5zone:northking2_H1_emc_spb1,1;1,4zone:test1,4;1,9Effectiveconfiguration:cfg:cfgzone:northking1_H0_emc_spa1,21,4zone:northking1_H1_emc_spb1,31,5zone:northking2_H0_emc_spa1,01,5zone:northking2_H1_emc_spb1,11,4Porterrshow显示交换机端口错误统计。重点关注Crc_Err和Enc_Out报错信息。注意:对于LossofSync;LossofSignal;Enc_OutError这些报错,客户每次重启主机或存储,重新插拔光纤线,禁用或启用端口等动作都会产生这类报错。当端口进行速率协商时,Enc_OutErrors也会产生。如果设备速率已知,则能够通过portcfgspeed命令来固定端口速率,方便跟踪这个报错与否为端口速率协商所致。根据经验统计,如果Enc_Out报错单独产生很可能是光纤线问题,如果Enc_Out和Crc_Err一起产生则很大的可能是GBIC/SFP问题造成。Portperfshow能够查看各端口实时流量。Sfpshow能够查看各端口sfp模块的信息。sfpshow:=============Slot1/Port0:=============Identifier:3SFPConnector:7LCTransceiver:150c40000000100,200,400_MB/sM5,M6swInter_distEncoding:18B10BBaudRate:42(units100megabaud)Length9u:0(unitskm)Length9u:0(units100meters)Length50u:15(units10meters)Length62.5u:7(units10meters)LengthCu:0(units1meter)VendorName:FINISARCORP.VendorOUI:00:90:65VendorPN:FTLF8524P2BNVVendorRev:AWavelength:850(unitsnm)Options:0032Loss_of_Sig,Tx_DisableBRMax:0BRMin:0SerialNo:UA72ES1DateCode:060816Temperature:32CentigradeCurrent:6.948mAmpsVoltage:3303.4mVoltsRXPower:265.0uWattsTXPower:355.0uWattsSupportshow收集交换机的技术支持配备信息,以供分析。SAN交换机配备文献备份实施安装完光纤交换机后、更改光纤交换机配备、在SAN中添加或者更换交换机时、在升级光纤交换机微码之前,都应当在一台PC机器(安装了FTP服务器)上创立每台光纤交换机配备文献的备份。配备文献备份的作用重要有下列几个方面:灾难恢复、故障诊疗及恢复、恢复一台无效配备的交换机、修改或者扩展SAN、恢复意外删除的许可、恢复或者重配分区配。首先登陆到光纤交换机,如前所述,使用串口登陆或者网络管理口登陆均可用命令“configupload”完毕配备文献备份任务,检查配备文献对的可用后请妥善保管。惯用操作系统HBA卡WWN号查看办法WINDOWS操作系统在Windows系统中,能够使用FCHBA卡厂家提供的管理软件查看光纤适配器的WWN号码,具体以下:Qlogic:SANsurferEmulex:HBAnyware在实际中Windows主机能够安装一种工具软件,fcinfo以ODSM主机为例,在主机的设备管理器中可见有三块HBA卡在cmd输入fcinfo即可查看该光纤卡的WWN号HPUX操作系统以UAM主机81为例,扫描主机的光纤卡ioscan–funCfc然后以fcmsutil/dev/fcd*查看光纤卡的具体信息其中N_PortPortWorldWideName为WWN号单个hba卡(单口)的状况下:wwnn只有一种

wwpn和wwnn同样

单个hba卡(双口)的状况下:wwnn只有一种

wwpn有两个

两个hba卡(单口)的状况下:wwnn有两个

wwpn有两个

两个hba卡(双口)的状况下:wwnn有两个

wwpn有四个对于IBMb16来说:

只有一种wwnn

有16个wwpn

对于存储hpeva8100来说:

只有一种wwnn

有8个wwpnQlogic的卡WWPN以21开头,WWNN以20开头

Emulex的卡WWPN以10开头,WWNN以20开头

CISCOSwitch的WWN以20开头

McData和Brocade的switch的WWN以10开头

DS4000的WWN以20开头

ESS800/DS6000/DS8000的WWN以50开头AIX操作系统#lsdev-Ccadapter//找出HBA卡#lscfg-vplfcs0Networkaddress为WWN号备注:Emulex的HBA的WWN的第一种数字为1Qlogic的HBA的WWN的第一种数字为2HPTachyonHBA的WWN的第一种数字为5LINUX操作系统cd/sys/class/fc_host/惯用存储HBA卡WWN号查看办法HPEVA系列IBMDS系列Hostinterface:Fibre其它存储其它存储,基本上能够通过图形化界面查看,例如EMCCX3-20F存储:微码升级以博科光纤交换机位例,办法环节以下。将微码拷贝到指定的管理控制台服务器上。打开ftp服务(IP地址:7,顾客名root,口令是root;将ftp的根目录设定为…/v5.3.0)登陆到交换机的StandbyCP;键入firmwaredownload命令。switch:admin>firmwareDownload7,root,/release.plist,rootThiscommandwillupgradebothCPsintheswitch.IfyouwanttoupgradeasingleCPonly,pleaseuse-soption.YoucanrunfirmwareDownloadStatustogetthestatusofthiscommand.ThiscommandwillcausetheactiveCPtoresetandwillrequirethatexistingtelnet,securetelnetorSSHsessionsberestarted.Doyouwanttocontinue[Y]:FirmwareDownloadhasstartedinStandbyCP.Itmaytakeupto10minutes.AndyouwillthefollowingonStandbyCP:Starttoinstallpackagesdir################################################terminfo################################################termcap################################################glibc################################################sin################################################WritekernelimageintoflashVerificationSUCCEEDEDFirmwaredownloadcompletessuccessfully.使用firmwareshow命令查看升级与否完毕,如果没有完毕,耐心等待。使用hashow命令查看交换机的CP工作与否正常。switch:admin>hashowLocalCP(Slot6,CP1):ActiveRemoteCP(Slot5,CP0):Standby,HealthyHAEnabled,HeartbeatUp,HAStateSynchronized如果不是这个Synchronized的状态,需要查找因素解决。健康检查统计SAN交换机状态检查统计SAN交换机硬件检查(HardwareChecking)硬件名称执行操作检查成果电源批示灯观察状态灯MACROBUTTONCheckIt正常MACROBUTTONCheckIt异常阐明:电扇观察运行状态MACROBUTTONCheckIt正常MACROBUTTONCheckIt异常阐明:光纤模块批示灯观察状态灯MACROBUTTONCheckIt正常MACROBUTTONCheckIt异常阐明:主机面板批示灯观察状态灯MACROBUTTONCheckIt正常MACROBUTTONCheckIt异常阐明:SAN交换机配备检查统计SAN交换机配备检查(SystemConfigurationChecking)交换机现在时钟,有几个顾客登录switch:admin>uptime统计:交换机IP地址信息switch:admin>ipaddrshow统计:license信息switch

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论