netapp产品维护指南分析课件_第1页
netapp产品维护指南分析课件_第2页
netapp产品维护指南分析课件_第3页
netapp产品维护指南分析课件_第4页
netapp产品维护指南分析课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Netapp 系列产品维护指南 第1页,共47页。概述一:介绍二:基本信息 三:日常检查 四:产品健康状态检查指南第2页,共47页。介绍本培训内容是为NetApp存储系统的人员编写的日常维护的手册,详细的系统描述和管理命令参见随机手册,在线帮助及或从您可从上面获得几乎所有得产品支持信息,如:电子版手册,知识库,软件下载,等等。第3页,共47页。基本信息 1)开机开机顺序: 先按照磁盘架编号顺序加电磁盘架的双电源,10秒钟后加电控制器 2)关机关机顺序: 先关控制器电源,依次关闭磁盘架电源。 第4页,共47页。3) 指示灯存储系统前面板有3个指示灯:Activity, Status, Power

2、 Activity绿-操作活动正常闪烁-检测到CPU活动灭-没有活动Status绿-系统运行正常橙-系统正加载内核Power绿-已经加电灭-没加电存储系统后部电源指示灯:橙色灯和绿色灯橙色灯亮-有交流电源供电灭-无交流电源供电绿色灯亮-电源输出正常灭-无电源输出磁盘灯绿色-正常绿色闪动-正常读写红色-磁盘故障第5页,共47页。4) 用户管理 存储系统管理用户名:root,负责存储系统的资源分配和管理。 系统管理员需牢记口令,注意口令更改。 密码更改:在开机时按ctrl+c 出现一菜单 可迭 change passwd 改变root 密码 新建用户: 使用useradmin useradmin

3、useradd login_name useradmin userdel login_name useradmin userlist 具体可参考command手册第6页,共47页。5) CLI管理 连接笔记本串行口到console线,取缺省设置9600,8,N,1 在Password:提示后输入root用户口令,进入CLI管理,提示符:主机名 输入help或?可以查看所有命令,命令具体使用方法参见随机命令手册 第7页,共47页。6) FilerView管理在Web浏(Netscape高于4.7版,IE高于5.0版)的URL输入:http:/主机名/na_admin 输入用户名root和管理员口

4、令,进入管理系统。具体内容可以使用在线帮助 第8页,共47页。7) 空间管理NetApp存储系统空间管理分3个层次: 若干物理磁盘构成磁盘组,1个校验盘,其余数据盘。 若干磁盘组构成卷,卷是管理的基本单位,容量只能增大,不能缩小。快照是基于卷的。 在卷上可以建立Qtree,是逻辑概念,可以通过Quota限制容量等。注意:系统必须保留至少1块热备份盘。 第9页,共47页。8) 网络管理 网络端口分为物理端口和虚拟端口,虚拟端口有多个物理端口组成。虚拟端口配置与物理端口配置相同。 虚拟端口(vif)由Single和Multi两种模式。 第10页,共47页。9)NFS输出 Unix用户通过NFS协议

5、实现数据访问。可以在FilerView中修改/etc/exports文件设置NFS输出。 NFS输出有3种模式:Access,Root,Rw/RoAccess:用户可以访问(mount)文件系统Root:以超级用户身份进行数据访问Rw/Ro:以读写方式或只读方式进行数据访问修改完成,用Apply保存,然后输出。或在CLI中运行exportfs a。 第11页,共47页。10) CIFS映射 Windows用户通过CIFS协议实现数据访问。CIFS设置命令:cifs setup,也可以在FilerView设置。CIFS有3种认证方式:域认证方式,本地用户认证方式,工作组方式,分别适合不同环境。

6、第12页,共47页。11) Snapshot Snapshot是存储系统的特点技术,是文件系统的只读拷贝。 Snapshot可以手工创建,也可以设定后由系统自动创建。可以设置保留的每周、每日、每时的Snapshot数目。注意:手工创建的Snapshot在使用后手工删除,否则占用系统空间。 第13页,共47页。12) SnapRestoreSnapRestore是快速数据恢复手段。除根卷外,其余数据卷可以在线立即恢复。具体命令参见随机手册 snap restore-f -t vol | file -s name -r | 第14页,共47页。13)系统监控采用Web进行观察或登陆到控制台进行操作

7、:sysstat 1观察存储系统运行状况rdfile /etc/messgaes阅读存储系统日志cf status观察双机系统工作状况 第15页,共47页。14) 硬盘更换 保持系统中存在热备份盘,一旦数据磁盘发生物理损坏,存储系统会自动进行数据重建。损坏的磁盘可以通过RMA在线更换。 Raid4 72G的硬盘重建时间是75分种;Raiddp 同样的环境下重建时间是160分钟例:第16页,共47页。例:硬盘更换及问题的解决方法显示硬盘的分配owned情况: disk show v如:1) neapp1 disk show -v DISK OWNER POOL SERIAL NUMBER 0b.

8、16 netapp1 (84203626) Pool0 3KR0YZBM00007608Y7DE0b.17 netapp1 (84203626) Pool0 3KR0VJ2900007609L45P0b.20 Not Owned NONE 3KR0XE240000760926CP0b.21 Not Owned NONE 3KR0X0J400007609MC220b.22 Not Owned NONE 3KR0X63B00007609ME5J0b.23 Not Owned NONE 3KR0XE38000076099U4L0b.24 Not Owned NONE 3KR0X0AA00007609

9、9RFK0b.18 netapp2 (84203626) Pool0 3KR0YZBM00007608Y7DE0b.19 netapp2 (84203626) Pool0 3KR0VJ2900007609L45P2) 分配硬盘到到270c其中一个机头模块上neapp1 disk assign 0b.20 0b.21 (硬盘分配到当前270c机头使用)neapp1 disk assign 0b.22 0b.23 0b.24 o netapp2 (指定这三个硬盘分配到另外的一个270c机头上使用)则:Netapp1disk show 显示如下第17页,共47页。3)neapp1 disk show

10、 DISK OWNER POOL SERIAL NUMBER 0b.16 netapp1 (84203626) Pool0 3KR0YZBM00007608Y7DE0b.17 netapp1 (84203626) Pool0 3KR0VJ2900007609L45P0b.20 netapp1 (84203626) Pool0 3KR0XE240000760926CP0b.21 netapp1 (84203626) Pool0 3KR0X0J400007609MC220b.22 netapp2 (84204112) Pool0 3KR0X63B00007609ME5J0b.23 netapp2

11、(84204112) Pool0 3KR0XE38000076099U4L0b.24 netapp2 (84204112 ) Pool0 3KR0X0AA000076099RFK0b.18 netapp2 (84204112 ) Pool0 3KR0YZBM00007608Y7DE0b.19 netapp2 (84204112 ) Pool0 3KR0VJ2900007609L45PNetapp1disk show a4)如果当netapp1机头没有spare 盘,而netapp2还有三个spare硬盘,可把netapp2的其中一个spare盘 重新分配给netapp1机头当作spare盘操作

12、如下:第18页,共47页。Netapp2disk assign f 0b.24 s unowned 把0b.24硬盘重新指定为末分配过的硬盘权限 如下:Netapp2Disk show vDISK OWNER POOL SERIAL NUMBER 0b.16 netapp1 (84203626) Pool0 3KR0YZBM00007608Y7DE0b.17 netapp1 (84203626) Pool0 3KR0VJ2900007609L45P0b.20 netapp1 (84203626) Pool0 3KR0XE240000760926CP0b.21 netapp1 (84203626

13、) Pool0 3KR0X0J400007609MC220b.22 netapp2 (84204112) Pool0 3KR0X63B00007609ME5J0b.23 netapp2 (84204112) Pool0 3KR0XE38000076099U4L0b.24 Not Owned NONE 3KR0X0AA000076099RFK 0b.18 netapp2 (84204112 ) Pool0 3KR0YZBM00007608Y7DE0b.19 netapp2 (84204112 ) Pool0 3KR0VJ2900007609L45P上面0b.24为末分陪的状态;重新指定给neta

14、pp1机头使用,操作如下:Netapp2disk assign 0b.24 o netapp1第19页,共47页。Netapp1sysconfig r 则会显示0b.24 自动成为spare盘 netapp1 sysconfig -r.RAID DiskHA.IDHA SHELF BAY CHAN Used (MB/blks)Phys (MB/blks)spare0b.248b 2 2 FC:B 0 68444/140174232注:如果硬盘坏了 换新的硬盘时 如果系统当时没有分配的话 则输入如下指令 重新分配给所需的机头既可:Disk assign xx xx xx第20页,共47页。15)

15、 Autosupport说明 Autosupport是为了简化存储系统管理的工具,通过配置邮件服务器可以接收到存储系统发来的事件报告,包括正常的磁盘扫描和故障报告,可以及时、准确了解存储系统的状态,配合NetApp的支持服务更可以预先发现系统可能的隐患,做到防患未然。 Autosupport可以在控制台和FilerView中配置。如果考虑到系统对外访问不方便,可以先发送到内部管理员的邮箱。管理员可以根据情况决定是否转给NetApp。 第21页,共47页。二:日常检查1) 目测 现场首先进行指示灯和LCD面板检查,判断是否有异常情况发生 2)通过控制台或Telnet进行系统检查 第22页,共47

16、页。检查频度 任务 命令或文件 每天 文件器性能和cpu利用率 Sysstat 磁盘使用情况(卷或快照) df 检查磁盘失败或其他信息 /etc/messages文件 CIFS操作情况 cifs stat NFS操作情况 nfsstat 每周 用户水平磁盘使用 quota report NT域的连接情况 cifs testdc CIFS共享目录 cifs shares NFS输出卷 /etc/exports文件 网络流量统计 netstat 网络接口性能统计 ifstat 每月 磁盘架连接 shelfchk 上线时间 uptime 设备环境状态检查Environment status第23页,

17、共47页。1:netapp1 cf enable 2:netapp2cf enable3:Netapp1 Cf takeover 把另外一个机头的服务接过来4:Netapp1(takeover) 当前是已接过来状态 5:Netapp1(takeover) vfiler status 当前netapp1机头所运行的服务 vfiler0 running6:Netapp1(takeover)partner vfiler status ,显示正常,说明cluster 已经成功的运行能接管所运行的服务 vfiler0 running vfiler1 running7:上面操作已经常可以正常接管了,现在

18、将接管的服务 应用还给另外那台机头来运行操作如下:netapp1(takeover) cf giveback f 在接管模式下,将服务返回给原节点8:netapp1 服务和应用已还给netapp2了,双机cluster 运行状态正常 能正常接管冗余服务CLUSTER 检查第24页,共47页。通过Filerview来管理cluster第25页,共47页。产品健康状态检查指南目标:为无法使用AutoSupport 之用户使用 一:Autosupport 功能及使用方法二:如何自己解读Autosupport文件,了解系统状态. 第26页,共47页。Autosupport 功能及使用方法主要是方便自动

19、监控files的系统运行状态基于系统的状态信息,自动发送电子邮件立刻发现系统的故障(如磁盘,风扇,电源模块,系统重启动,Cluster的切换)并自动创建问题立案打开autosupport功能的每个系统均会发送信息文件对警告信息主动进行分析可以人工配置可能发生系统不稳定的警告条件包含每周日志以及磁盘整理的信息收集系统配置和状态信息,方便对系统的了解和快速解决问题收集系统的统计信息,从而跟踪系统的可用性以及监控系统部件的可靠性容许对系统进行 24x7x365 监控第27页,共47页。Autosupport 功能- 快速服务对“可采取行动” 的信息(如告警和硬件故障) ,系统自动创建问题立案如需备件

20、更换,例如磁盘,风扇和电源,系统会根据支持条款,自动邮寄备件到指定地址加快平均故障修复时间 (MTTR智能- Mean Time to Repair) . 第28页,共47页。Autosupport(asup) 功能- 主动支持 NetApp公司的 软件工具Panic Message Analyzer (PMA) 分析收到的asup信息 ,判断是否是因为某个bug引起,是否在某个版本中解决。如果没有的话,系统会提示我们的工程师需要对系统的核心文件进行进一步分析。我们同时亦有另外一个软件分析syslog中的警告信息,判断是否有硬软件部件故障,发现问题时自动创建问题立案,并同时告知用户需采取的行动

21、。这样一来,可排除不必要的系统宕机。第29页,共47页。自动化流程处理系统的问题NetApp邮箱自动接受asup信息根据信息自动确定问题优先级对 asup信息逐行进行检查与NetApp公司的故障数据库进行配对检查如有配对成功,系统自动生成问题立案如有其他异常,工程师手动进行处理将每周日志进行归档第30页,共47页。NetApp使用专门系统处理asup.该系统功能强大并可扩展该系统采用独立系统并硬件冗余对所有asup进行实时处理所有信息均储存到Oracle数据库中Autosupport 信息包括. 系统触发的事件 系统主动提示的信息和警告 信息内容的描述定义在 /NOW/knowledge/do

22、cs/olio/autosupport/matrices第31页,共47页。 自动化处理 完全自动化处理:- 在系统中自动生成case- 备件更换的自动化处理- 验证用户信息然后结束立案在网站中定义个人资料自动备件运输故障发生后,授权配件发送第32页,共47页。Autosupport 如何使用步骤 1: 打开该功能在NetApp的机器上请确保 autosupport 是其中的一个邮件接受者. 在Now网站中的 Turn on Autosupport 一页中详细列出操作指令。/NOW/knowledge/docs/olio/autosupport/注: Autosupport 功能无需付费。第3

23、3页,共47页。命令和设置如下:autosupport.enable: on,off 缺省为 on. 此选项用于打开和关闭autosupport 的电子邮件功能. 如需关闭,需在/etc/rc文件中使用:options autosupport.enable off autosupport.mailhost: 用逗号间格的邮件服务器列表缺省为mailhost. 列表数最大为五个. Autosupport逐个测试直到成功为止。 可在/etc/hosts设置:options autosupport.mailhost mercury,venus,mars autosupport.to:用逗号间格的邮件

24、列表缺省为autosupport.列表数最大为五个options autosupport.to sysadm,autosupport 第34页,共47页。autosupport.noteto:用逗号间格的邮件列表缺省为空。列表数最大为五个options autosupport.noteto sysadm1,sysadm2 autosupport.from: 本地用户名缺省为autosupport. 用于电子邮件的回复options autosupport.from sysadm autosupport.doit:text 原因 用于电子邮件的标题。如:options autosupport.d

25、oit SYSTEM_INFO 第35页,共47页。步骤 2: 正确填写您的联系信息和邮寄地址确保您的联系信息在六个月内确保您的联系信息在六个月内,以免延迟(超出六个月,我们会重新确认)信息的修改既可通过电话,亦可通过我们的Now网站。 /SelfService/FORMS/frmPrdPurchaseView.asp?SN=21451&SNId=538220&OS=&SiteId=98736&RSP=第36页,共47页。Autosupport 如何发送测试信息为验证信息能被NetApp收到:使用 doit option 命令:optionsautosupport.doit 正文 在以下网站中

26、验证/gsc/mail_report/rv.cgi第37页,共47页。人工检查Autosupport文件 由于特殊原因,你无法将Autosupport信息发送到 autosupport,您将无法享受Autosupport带来的许多好处。您只好自己做些工作来弥补。在此介绍如何自己解读Autosupport文件,以了解系统状态.第38页,共47页。获取Autosupport 文件 首先,请你激活(enable)Autosupport。这样不论是否发送,Autosupport 信息将会自动生成于系统中 建议将Autosupport信息自动发送至系统管理员的email信箱 或经cifs map(win

27、dows)或nfs mount(unix)存取filer的根卷/vol/vol0, 进入/etc/log/autosupport目录。在此目录下,每个子目录包含了每次autosupport需发出的文件。你可选择目录,将这些文件拷贝出来,自己解读或送给NetApp帮你解读 第39页,共47页。Autosupport 包含的文件及信息 autosupport 文件包含一个文本文件及67个压缩的系统配置信息文件 :Z:etclogautosupportdir 200407141703.0.files Volume in drive Z is C$ Volume Serial Number is C4

28、01-6B21 Directory of Z:etclogautosupport200407141703.0.files2004-07-14 17:03 .2004-07-15 11:32 .2004-07-14 17:03 130,122 200407141703.02004-07-14 17:03 11,854 200407141703.0.ems.gz2004-07-14 17:03 234 200407141703.0.rc.gz2004-07-14 17:03 108 200407141703.0.exports.gz2004-07-14 17:03 129 200407141703

29、.0.hosts.gz2004-07-14 17:03 144 200407141703.0.nsswitch_conf.gz第40页,共47页。系统正常时的文件内容GENERATED_ON=Wed Jul 14 17:03:33 CST 2004VERSION=NetApp Release 6.5R2: Tue Mar 16 13:38:36 PST 2004SYSTEM_ID=0084175649HOSTNAME=fas270caSNMP_LOCATION=lsPARTNER_SYSTEM_ID=0084175812PARTNER_HOSTNAME=fas270cbCLUSTER_NODE

30、_STATUS=UPConsole is using unspecified character set= SYSCONFIG-A =NetApp Release 6.5R2: Tue Mar 16 13:38:36 PST 2004System ID: 0084175649 (fas270ca); partner ID: 0084175812 (fas270cb)System Serial Number: 110445922 (fas270ca)slot 0: System Board 650 MHz (TSANTSA C0) Model Name: FAS270 Part Number:

31、110-00046 Revision: C0 Serial Number: 289569 Firmware release: CFE 1.2.0 Processors: 2 Processor revision: B2 Processor type: 1250 Memory Size: 1022 MB NVMEM Size: 128 MB of Main Memory Used= SYSCONFIG-C =sysconfig: There are no configuration errors.= SYSCONFIG HARDWARE IDS = SYSCONFIG-D =Device HA

32、SHELF BAY CHAN Disk Vital Product Information- - - -0b.16 0b 1 0 FC:A 3HW12XTS000074327X7T0b.17 0b 1 1 FC:A 3HW12ZGZ000074327XAU NOTE: these license codes are encrypted!第41页,共47页。系统异常时的内容举例 Sat Jul 3 00:00:00 KST remote2: kern.uptime.filer:info: 12:00am up 11 days, 8:29 576 NFS ops, 0 CIFS ops, 57 H

33、TTP ops, 0 DAFS ops, 3268 FCP ops, 0 iSCSI opsSat Jul 3 00:00:54 KST remote2: rsm_volinfo_daemon:notice: Sync snapmirror setting view of the volume ca_vol_ssm to snapshot 1.Sat Jul 3 00:00:58 KST remote2: snapmirror.sync.fail:notice: Synchronous SnapMirror from camain:ca_vol to remote2:ca_vol_ssm fa

34、iled.Sat Jul 3 01:05:00 KST remote2: snapmirror.dst.err:error: SnapMirror destination transfer from camain:ca_vol to ca_vol_ssm : destination is not in snapmirrored state.Sat Jul 3 06:44:25 KST remote2: ems.engine.startReplay:info: Replay begins for EMS NVRAM cacheSat Jul 3 Sat Jul 3 01:09:33 KST re

35、mote2: sk.panic:ALERT: Panic13114566625732872667 bytes in process worker_thread_162 on release NetApp Release 6.5.1R1Sat Jul 3 06:44:25 KST remote2: ems.engine.endReplay:info: Replay ends for EMS NVRAM cacheSat Jul 3 06:44:25 KST remote2: ems.engine.startReplay:info: Replay begins for EMS boot-time

36、cacheSnapMirror 镜像失败系统Panic第42页,共47页。Sun Jun 27 10:00:00 KST remote2: kern.uptime.filer:info: 10:00am up 5 days, 18:29 345 NFS ops, 0 CIFS ops, 57 HTTP ops, 0 DAFS ops, 1662 FCP ops, 0 iSCSI opsSun Jun 27 10:00:52 KST remote2: rsm_volinfo_daemon:notice: Sync snapmirror setting view of the volume ca_

37、vol_ssm to snapshot 4.Sun Jun 27 10:03:52 KST remote2: rsm_volinfo_daemon:notice: Sync snapmirror setting view of the volume ca_vol_ssm to snapshot 10.Sun Jun 27 10:05:04 KST remote2: rsm_volinfo_daemon:notice: Sync snapmirror setting view of the volume ca_vol_ssm to snapshot 4.Sun Jun 27 10:06:49 K

38、ST remote2: rsm_volinfo_daemon:notice: Sync snapmirror setting view of the volume ca_vol_ssm to snapshot 12.Sun Jun 27 10:07:35 KST remote2: rshd_0:warning: Permission denied to rsh request from root at host 67 IP address 67Sun Jun 27 10:07:35 KST remote2: rshd_0:error: rsh error: Permission denied.Sun Jun 27 10:08:50 KST remote2: rshd_0:warning: Permission denied to

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论