netapp产品维护指南_第1页
netapp产品维护指南_第2页
netapp产品维护指南_第3页
netapp产品维护指南_第4页
netapp产品维护指南_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Netapp系列产品维护指南

概述 一:介绍二:基本信息

三:日常检查

四:产品健康状态检查指南2介绍本培训内容是为NetApp存储系统的人员编写的日常维护的手册,详细的系统描述和管理命令参见随机手册,在线帮助及或从您可从上面获得几乎所有得产品支持信息,如:电子版手册,知识库,软件下载,等等。3基本信息

1)

开机开机顺序:先按照磁盘架编号顺序加电磁盘架的双电源,10秒钟后加电控制器

2)

关机关机顺序:先关控制器电源,依次关闭磁盘架电源。

43)指示灯存储系统前面板有3个指示灯:Activity,Status,Power

Activity绿-------操作活动正常闪烁----检测到CPU活动灭-------没有活动Status绿-------系统运行正常橙-------系统正加载内核Power绿-------已经加电灭-------没加电存储系统后部电源指示灯:橙色灯和绿色灯橙色灯亮-----------有交流电源供电灭-----------无交流电源供电绿色灯亮-----------电源输出正常灭-----------无电源输出磁盘灯绿色--------正常绿色闪动--正常读写红色--------磁盘故障54)用户管理存储系统管理用户名:root,负责存储系统的资源分配和管理。系统管理员需牢记口令,注意口令更改。密码更改:在开机时按ctrl+c出现一菜单可迭changepasswd改变root密码新建用户:使用useradminuseradminuseraddlogin_nameuseradminuserdellogin_nameuseradminuserlist具体可参考command手册65)CLI管理连接笔记本串行口到console线,取缺省设置9600,8,N,1在Password:提示后输入root用户口令,进入CLI管理,提示符:主机名〉输入help或?可以查看所有命令,命令具体使用方法参见随机命令手册

76)管理在Web浏(Netscape高于4.7版,IE高于5.0版)的URL输入:http://主机名/na_admin输入用户名root和管理员口令,进入管理系统。具体内容可以使用在线帮助

87)空间管理NetApp存储系统空间管理分3个层次:若干物理磁盘构成磁盘组,1个校验盘,其余数据盘。若干磁盘组构成卷,卷是管理的基本单位,容量只能增大,不能缩小。快照是基于卷的。在卷上可以建立Qtree,是逻辑概念,可以通过Quota限制容量等。注意:系统必须保留至少1块热备份盘。

98)网络管理网络端口分为物理端口和虚拟端口,虚拟端口有多个物理端口组成。虚拟端口配置与物理端口配置相同。虚拟端口(vif)由Single和Multi两种模式。

109)NFS输出Unix用户通过NFS协议实现数据访问。可以在中修改/etc/exports文件设置NFS输出。NFS输出有3种模式:Access,Root,Rw/RoAccess:用户可以访问(mount)文件系统Root:以超级用户身份进行数据访问Rw/Ro:以读写方式或只读方式进行数据访问修改完成,用Apply保存,然后输出。或在CLI中运行exportfs–a。

1110)CIFS映射Windows用户通过CIFS协议实现数据访问。CIFS设置命令:cifssetup,也可以在设置。CIFS有3种认证方式:域认证方式,本地用户认证方式,工作组方式,分别适合不同环境。

1211)SnapshotSnapshot是存储系统的特点技术,是文件系统的只读拷贝。

Snapshot可以手工创建,也可以设定后由系统自动创建。可以设置保留的每周、每日、每时的Snapshot数目。注意:手工创建的Snapshot在使用后手工删除,否则占用系统空间。

1312)SnapRestoreSnapRestore是快速数据恢复手段。除根卷外,其余数据卷可以在线立即恢复。具体命令参见随机手册

snaprestore[-f][-tvol|file][-sname][-r<restore_as_path>]<vol-name>|<restore_from_path>1413)系统监控采用Web进行观察或登陆到控制台进行操作:>sysstat1观察存储系统运行状况>rd阅读存储系统日志>cfstatus观察双机系统工作状况1514)

硬盘更换保持系统中存在热备份盘,一旦数据磁盘发生物理损坏,存储系统会自动进行数据重建。损坏的磁盘可以通过RMA在线更换。

Raid472G的硬盘重建时间是75分种;Raiddp同样的环境下重建时间是160分钟例:16例:硬盘更换及问题的解决方法显示硬盘的分配owned情况:diskshow–v如:1)

neapp1>diskshow-vDISKOWNERPOOLSERIALNUMBER0b.16netapp1(84203626)Pool03KR0YZBM00007608Y7DE0b.17netapp1(84203626)Pool03KR0VJ2900007609L45P0b.20NotOwnedNONE3KR0XE240000760926CP0b.21NotOwnedNONE3KR0X0J400007609MC220b.22NotOwnedNONE3KR0X63B00007609ME5J0b.23NotOwnedNONE3KR0XE38000076099U4L0b.24NotOwnedNONE3KR0X0AA000076099RFK0b.18netapp2(84203626)Pool03KR0YZBM00007608Y7DE0b.19netapp2(84203626)Pool03KR0VJ2900007609L45P2)分配硬盘到到270c其中一个机头模块上neapp1>diskassign0b.200b.21

(硬盘分配到当前270c机头使用)neapp1>diskassign0b.220b.230b.24–onetapp2(指定这三个硬盘分配到另外的一个270c机头上使用)则:Netapp1>diskshow显示如下173)neapp1>diskshowDISKOWNERPOOLSERIALNUMBER0b.16netapp1(84203626)Pool03KR0YZBM00007608Y7DE0b.17netapp1(84203626)Pool03KR0VJ2900007609L45P0b.20netapp1(84203626)Pool03KR0XE240000760926CP0b.21netapp1(84203626)Pool03KR0X0J400007609MC220b.22netapp2(84204112)Pool03KR0X63B00007609ME5J0b.23netapp2(84204112)Pool03KR0XE38000076099U4L0b.24netapp2(84204112)Pool03KR0X0AA000076099RFK0b.18netapp2(84204112)Pool03KR0YZBM00007608Y7DE0b.19netapp2(84204112)Pool03KR0VJ2900007609L45PNetapp1>diskshow–a4)如果当netapp1机头没有spare盘,而netapp2还有三个spare硬盘,可把netapp2的其中一个spare盘重新分配给netapp1机头当作spare盘操作如下:18Netapp2>diskassign–f0b.24–sunowned把0b.24硬盘重新指定为末分配过的硬盘权限如下:Netapp2>Diskshow–vDISKOWNERPOOLSERIALNUMBER0b.16netapp1(84203626)Pool03KR0YZBM00007608Y7DE0b.17netapp1(84203626)Pool03KR0VJ2900007609L45P0b.20netapp1(84203626)Pool03KR0XE240000760926CP0b.21netapp1(84203626)Pool03KR0X0J400007609MC220b.22netapp2(84204112)Pool03KR0X63B00007609ME5J0b.23netapp2(84204112)Pool03KR0XE38000076099U4L0b.24NotOwnedNONE3KR0X0AA000076099RFK0b.18netapp2(84204112)Pool03KR0YZBM00007608Y7DE0b.19netapp2(84204112)Pool03KR0VJ2900007609L45P上面0b.24为末分陪的状态;重新指定给netapp1机头使用,操作如下:Netapp2>diskassign0b.24–onetapp119Netapp1>sysconfig–r则会显示0b.24自动成为spare盘

netapp1>sysconfig-r..RAIDDisk HA.ID HASHELFBAYCHANUsed(MB/blks) Phys(MB/blks)spare 0b.24 8b22FC:B0 68444/140174232注:如果硬盘坏了换新的硬盘时如果系统当时没有分配的话则输入如下指令重新分配给所需的机头既可:Diskassignxxxxxx2015)Autosupport说明Autosupport是为了简化存储系统管理的工具,通过配置邮件服务器可以接收到存储系统发来的事件报告,包括正常的磁盘扫描和故障报告,可以及时、准确了解存储系统的状态,配合NetApp的支持服务更可以预先发现系统可能的隐患,做到防患未然。Autosupport可以在控制台和中配置。如果考虑到系统对外访问不方便,可以先发送到内部管理员的邮箱。管理员可以根据情况决定是否转给NetApp。

21二:日常检查1)

目测现场首先进行指示灯和LCD面板检查,判断是否有异常情况发生

2)通过控制台或Telnet进行系统检查

22231:netapp1>cfenable2:netapp2>cfenable3:Netapp1>Cftakeover把另外一个机头的服务接过来4:Netapp1(takeover)>当前是已接过来状态5:Netapp1(takeover)>vfilerstatus当前netapp1机头所运行的服务vfiler0running6:Netapp1(takeover)>partnervfilerstatus,显示正常,说明cluster已经成功的运行能接管所运行的服务vfiler0runningvfiler1running7:上面操作已经常可以正常接管了,现在

将接管的服务

应用还给另外那台机头来运行操作如下:netapp1(takeover)>cfgiveback–f在接管模式下,将服务返回给原节点8:netapp1>服务和应用已还给netapp2了,双机cluster运行状态正常

能正常接管冗余服务CLUSTER检查24通过来管理cluster25产品健康状态检查指南目标:为无法使用AutoSupport之用户使用

一:Autosupport功能及使用方法二:如何自己解读Autosupport文件,了解系统状态.

26Autosupport功能及使用方法主要是方便自动监控files的系统运行状态基于系统的状态信息,自动发送电子邮件立刻发现系统的故障(如磁盘,风扇,电源模块, 系统重启动,Cluster的切换)并自动创建问题立案打开autosupport功能的每个系统均会发送信息文件对警告信息主动进行分析可以人工配置可能发生系统不稳定的警告条件包含每周日志以及磁盘整理的信息收集系统配置和状态信息,方便对系统的了解和 快速解决问题收集系统的统计信息,从而跟踪系统的可用性 以及监控系统部件的可靠性容许对系统进行24x7x365监控27Autosupport功能

-快速服务对“可采取行动”的信息(如告警和硬件故障),系统自动创建问题立案如需备件更换,例如磁盘,风扇和电源,系统会根据支持条款,自动邮寄备件到指定地址加快平均故障修复时间(MTTR智能-MeanTimetoRepair).28Autosupport(asup)功能

-主动支持

NetApp公司的软件工具PanicMessageAnalyzer(PMA)分析收到的asup信息,判断是否是因为某个bug引起,是否在某个版本中解决。如果没有的话,系统会提示我们的工程师需要对系统的核心文件进行进一步分析。 我们同时亦有另外一个软件分析syslog中的警告信息,判断是否有硬软件部件故障,发现问题时自动创建问题立案,并同时告知用户需采取的行动。这样一来,可排除不必要的系统宕机。29自动化流程处理系统的问题NetApp邮箱自动接受asup信息根据信息自动确定问题优先级对asup信息逐行进行检查与NetApp公司的故障数据库进行配对检查如有配对成功,系统自动生成问题立案如有其他异常,工程师手动进行处理将每周日志进行归档30NetApp使用专门系统处理asup….该系统功能强大并可扩展该系统采用独立系统并硬件冗余对所有asup进行实时处理所有信息均储存到Oracle数据库中Autosupport信息包括...系统触发的事件系统主动提示的信息和警告信息内容的描述定义在

31

自动化处理

完全自动化处理: -在系统中自动生成case -备件更换的自动化处理 -验证用户信息然后结束立案在NOW网站中定义个人资料自动备件运输故障发生后,授权配件发送32Autosupport–如何使用步骤1:打开该功能在NetApp的机器上请确保

是其中的一个邮件接受者.在Now网站中的‘TurnonAutosupport’

一页中详细列出操作指令。注:Autosupport功能无需付费。33命令和设置如下:autosupport.enable:on,off

缺省为on.此选项用于打开和关闭autosupport的电子邮件功能.如需关闭,需在/etc/rc文件中使用: optionsautosupport.enableoffautosupport.mailhost:用逗号间格的邮件服务器列表

缺省为mailhost.列表数最大为五个.Autosupport逐个测试直到成功为止。可在/etc/hosts设置:optionsautosupport.mailhostmercury,venus,marsautosupport.to:用逗号间格的邮件列表 缺省为.列表数最大为五个 optionsautosupport.tosysadm,34autosupport.noteto:用逗号间格的邮件列表

缺省为空。列表数最大为五个 optionsautosupport.noteto,autosupport.from:本地用户名 缺省为autosupport.用于电子邮件的回复 optionsautosupport.fromsysadmautosupport.doit:text原因

用于电子邮件的标题。如: optionsautosupport.doitSYSTEM_INFO35步骤2:正确填写您的联系信息和邮寄地址确保您的联系信息在六个月内

确保您的联系信息在六个月内,以免延迟(超出六个月,我们会重新确认)信息的修改既可通过电话,亦可通过我们的Now网站。

36Autosupport–如何发送测试信息为验证信息能被NetApp收到:使用doitoption命令:

options autosupport.doit‘正文’

在以下网站中验证

37人工检查Autosupport文件

由于特殊原因,你无法将Autosupport信息发送到,您将无法享受Autosupport带来的许多好处。您只好自己做些工作来弥补。在此介绍如何自己解读Autosupport文件,以了解系统状态.38获取Autosupport文件首先,请你激活(enable)Autosupport。这样不论是否发送,Autosupport信息将会自动生成于系统中建议将Autosupport信息自动发送至系统管理员的email信箱或经cifsmap(windows)或nfsmount(unix)存取filer的根卷/vol/vol0,进入/etc/log/autosupport目录。在此目录下,每个子目录包含了每次autosupport需发出的文件。你可选择目录,将这些文件拷贝出来,自己解读或送给NetApp帮你解读

39Autosupport包含的文件及信息

autosupport文件包含一个文本文件及6~7个压缩的系统配置信息文件:Z:\etc\log\autosupport>dir2.0.files

VolumeindriveZisC$VolumeSerialNumberisC401-6B21DirectoryofZ:\etc\log\autosupport\2.0.files2004-07-1417:03<DIR>.2004-07-1511:32<DIR>..2004-07-1417:03130,1222.02004-07-1417:0311,8542.0.ems.gz2004-07-1417:032342.0.rc.gz2004-07-1417:031082.0.exports.gz2004-07-1417:031292.0.hosts.gz2004-07-1417:031442.0.nsswitch_conf.gz40系统正常时的文件内容

GENERATED_ON=WedJul1417:03:33CST2004VERSION=NetAppRelease6.5R2:TueMar1613:38:36PST2004SYSTEM_ID=0084175649HOSTNAME=fas270caSNMP_LOCATION=lsPARTNER_SYSTEM_ID=0084175812PARTNER_HOSTNAME=fas270cbCLUSTER_NODE_STATUS=UPConsoleisusingunspecifiedcharacterset=====SYSCONFIG-A===== NetAppRelease6.5R2:TueMar1613:38:36PST2004 SystemID:0084175649(fas270ca);partnerID:0084175812(fas270cb) SystemSerialNumber:110445922(fas270ca) slot0:SystemBoard650MHz(TSANTSAC0)ModelName:FAS270PartNumber:110-00046Revision:C0SerialNumber:289569Firmwarerelease:CFE1.2.0Processors:2Processorrevision:B2Processortype:1250MemorySize:1022MBNVMEMSize:128MBofMainMemoryUsed=====SYSCONFIG-C=====sysconfig:Therearenoconfigurationerrors.

=====SYSCONFIGHARDWAREIDS=====

=====SYSCONFIG-D=====DeviceHASHELFBAYCHANDiskVitalProductInformation------------------------------------------------------------0b.160b10FC:A3HW12XTS000074327X7T0b.170b11FC:A3HW12ZGZ000074327XAU

NOTE:theselicensecodesareencrypted!41系统异常时的内容举例

SatJul300:00:00KST[remote2:kern.uptime.]:12:00amup11days,8:29576NFSops,0CIFSops,57HTTPops,0DAFSops,3268FCPops,0iSCSIopsSatJul300:00:54KST[remote2:rsm_volinfo_daemon:notice]:Syncsnapmirrorsettingviewofthevolumeca_vol_ssmtosnapshot1.SatJul300:00:58KST[remote2:snapmirror.sync.fail:notice]:SynchronousSnapMirrorfromcamain:ca_voltoremote2:ca_vol_ssmfailed.SatJul301:05:00KST[remote2:snapmirror.dst.err:error]:SnapMirrordestinationtransferfromcamain:ca_voltoca_vol_ssm:destinationisnotinsnapmirroredstate.SatJul306:44:25KST[remote2:ems.engine.startReplay:info]:ReplaybeginsforEMSNVRAMcacheSatJul3SatJul301:09:33KST[remote2:sk.panic:ALERT]:Panic732872667bytesinprocessworker_thread_162onreleaseNetAppRelease6.5.1R1SatJul306:44:25KST[remote2:ems.engine.endReplay:info]:ReplayendsforEMSNVRAMcacheSatJul306:44:25KST[remote2:ems.engine.startReplay:info]:ReplaybeginsforEMSboot-timecacheSnapMirror镜像失败系统Panic42SunJun2710:00:00KST[remote2:kern.uptime.]:10:00amup5days,18:29345NFSops,0CIFSops,57HTTPops,0DAFSops,1662FCPops,0iSCSIopsSunJun2710:00:52KST[remote2:rsm_volinfo_daemon:notice]:Syncsnapmirrorsettingviewofthevolumeca_vol_ssmtosnapshot4.SunJun2710:03:52KST[remote2:rsm_volinfo_daemon:notice]:Syncsnapmirrorsettingviewofthevolumeca_vol_ssmtosnapshot10.SunJun2710:05:04KST[remote2:rsm_volinfo_daemon:notice]:Syncsnapmirrorsettingviewofthevolumeca_vol_ssmtosnapshot4.SunJun2710:06:49KST[remote2:rsm_volinfo_daemon:notice]:Syncsnapmirrorsettingviewofthevolumeca_vol_ssmtosnapshot12.SunJun2710:07:35KST[remote2:rshd_0:warning]:Permissiondeniedtorshrequestfromrootathost67IPaddress67SunJun2710:07:35KST[remote2:rshd_0:error]:rsherror:Permissiondenied.SunJun2710:08:50KST[remote2:rshd_0:warning]:Permissiondeniedtorshrequestfromrootathost67IPaddress67SunJun2710:08:50KST[remote2:rshd_0:error]:rsherror:Permissiondenied.Sun

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论