![HC1209208-HCNP-V3.0-第八章-大数据存储系统维护与故障处理课件_第1页](http://file4.renrendoc.com/view/e5b7a6cb2a245dda76ed8b9fc2ef81e5/e5b7a6cb2a245dda76ed8b9fc2ef81e51.gif)
![HC1209208-HCNP-V3.0-第八章-大数据存储系统维护与故障处理课件_第2页](http://file4.renrendoc.com/view/e5b7a6cb2a245dda76ed8b9fc2ef81e5/e5b7a6cb2a245dda76ed8b9fc2ef81e52.gif)
![HC1209208-HCNP-V3.0-第八章-大数据存储系统维护与故障处理课件_第3页](http://file4.renrendoc.com/view/e5b7a6cb2a245dda76ed8b9fc2ef81e5/e5b7a6cb2a245dda76ed8b9fc2ef81e53.gif)
![HC1209208-HCNP-V3.0-第八章-大数据存储系统维护与故障处理课件_第4页](http://file4.renrendoc.com/view/e5b7a6cb2a245dda76ed8b9fc2ef81e5/e5b7a6cb2a245dda76ed8b9fc2ef81e54.gif)
![HC1209208-HCNP-V3.0-第八章-大数据存储系统维护与故障处理课件_第5页](http://file4.renrendoc.com/view/e5b7a6cb2a245dda76ed8b9fc2ef81e5/e5b7a6cb2a245dda76ed8b9fc2ef81e55.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、修订记录课程编码适用产品产品版本课程版本ISSUEHC1209208大数据存储V1(C30)3.0开发/优化者时间审核人开发类型(新开发/优化)李锋2015-09-01代锦秀、周颂书新开发本页不打印第八章 大数据存储系统维护与故障处理目标学完本课程,您将能够:掌握OceanStor 9000日常维护方法及维护工具的使用熟悉OceanStor 9000主要部件更换方法掌握OceanStor 9000存储系统故障排查思路和方法掌握OceanStor 9000版本升级流程及版本回退方法目录系统维护 例行维护 安全维护 巡检与信息收集 部件更换系统升级故障处理维护基本原则日常维护按照正确的流程操作使用
2、原厂提供的资源和软件现场保留备件,以便故障时及时更换创建日志制定可靠的备份计划严格遵守设备安全注意事项管理软件介绍介绍OceanStor 9000的管理方式,包括GUI和CLI: OceanStor 9000支持GUI(Graphical User Interface)和CLI(Command Line Interface)两种管理方式。 OceanStor DeviceManager提供GUI的管理方式,其中服务器端部署在OceanStor 9000上,用户通过终端浏览器连接到OceanStor 9000所在业务网,访问OceanStor 9000进行管理和维护。OceanStor Devi
3、ceManager是存储单元管理平台,支持同时管理集群和节点。 CLI是命令行接口,能够高效、快捷地管理和维护设备。P25/P12节点设备运行指示灯1系统电源指示灯/开机按钮2系统告警指示灯3系统定位指示灯4USB端口5硬盘运行指示灯6硬盘告警/定位指示灯C36/P36设备运行指示灯1系统电源指示灯/开机按钮2系统告警指示灯3系统定位指示灯4USB端口5硬盘运行指示灯6硬盘告警/定位指示灯Page 9C36/P36设备运行指示灯1电源模块拉手2电源运行/告警指示灯3电源接口4PCI-E扩展插槽5SAS卡6GE网口7IPMI管理网口8USB端口9系统串口10VGA端口11系统告警指示灯12系统定
4、位指示灯13IPMI管理网口LNK指示灯14IPMI管理网口ACT指示灯15GE网口ACT指示灯16GE网口LNK指示灯17硬盘运行指示灯18硬盘告警/定位指示灯1910GE SFP+以太网光接口指示灯2010GE SFP+以太网光接口Page 10C72设备运行指示灯Page 11C72设备运行指示灯Page 121电源运行指示灯2电源开关3风扇运行指示灯4MODE模式切换按钮/ID指示灯5管理网口指示灯6USB开局指示灯7堆叠主从指示灯8系统运行状态灯交换机指示灯Page 13交换机指示灯1系统运行状态灯2堆叠主从指示灯3STAT模式状态灯4SPEED模式状态灯5STACK模式状态灯6模式
5、切换按钮/ID指示灯7业务接口指示灯(10GE光口)8业务接口指示灯(40GE光口) 940GE接口的10GE模式指示灯(1/2/3/4)-设备管理软件维护项-查看硬盘信息查看硬盘信息设备硬盘状态异常,可能会影响业务的正常运行。通过检查设备硬盘的运行状态,用户可以及时发现异常状态并进行处理。操作步骤步骤一:登录设备管理软件。步骤二:在导航树中单击“设备管理 硬盘信息”,查看硬盘信息,相应 的参数说明如下表所示。参数说明ID硬盘的编号。在位状态硬盘的在位状态,包括:在位、不在位上电状态硬盘的上电状态,包括:上电、未上电故障灯硬盘故障灯的状态,包括:亮、灭设备管理软件维护项-查看告警信息操作步骤步
6、骤一 登录设备管理软件。步骤二 在导航树中选择并单击“告警管理 告警浏览”查看告警信息,相应的参数说明如下表所示参数说明流水号告警的编号。描述对告警信息的具体描述。类型告警模块的类型。告警模块的类型如下:Power Supply:电源模块类Cooling Device:风扇在位类Fan:风扇转速类Temperature:温度传感器类Voltage:电压传感器类System ACPI Power State:系统ACPI电源状态类Reserved:自定义类动作Deasserted:告警解除Asserted:告警发生时间告警信息发生的时间。DeviceManager维护项-查看系统信息登陆Devi
7、ceManager在首页中查看当前设备中的系统信息。系统信息:在“基本信息”区域,查看当前设备的集群名称、集群容量,以及节点个数,节点类型等。告警:在“告警”区域,查看当前设备的告警信息。性能:在“性能”区域,查看当前设备的性能总体数据。客户端:在“服务信息”区域,查看当前设备各个类型的客户端数量DeviceManager维护项-查看集群状态操作步骤步骤一 登录OceanStor DeviceManager。步骤二 在左上方基本信息中查看集群状态,相关参数说明如下表所示。参数名称说明集群名称标识了集群的名称。健康状态集群的健康状态,包括:“正常”、“故障”、“部分损坏”、“降级”。运行状态集群
8、的运行状态,包括“正在启动”、“运行”、“正在升级”、“正在下电” 。集群容量集群的总容量及可用容量。DeviceManager维护项-查看节点状态操作步骤步骤一 登录OceanStor DeviceManager。步骤二在右侧导航中单击 “系统”进入“节点列表”界面。步骤三 在中间信息展示区浏览节点信息,相关参数说明如下表所示。参数名称说明名称标识了节点的名称。健康状态节点的健康状态,包括“正常”、“故障”和“未知”几种状态。运行状态包括“在线”、“离线”和“未知”几种状态。总容量(TB)此节点的总容量,单位为TB。容量利用率(%)已使用的容量与总容量的百分比。吞吐量(in/out)集群系统
9、每秒接收/发送的字节数。CPU(%)-内存(%)-DeviceManager维护项-查看节点文件系统服务状态查看节点文件系统服务状态介绍通过OceanStor DeviceManager检查节点文件系统服务状态的具体操作。通过检查节点文件系统服务的状态,可以及时发现和处理故障。操作步骤步骤一:登录OceanStor DeviceManager。步骤二:在右侧导航中单击 “系统”进入“节点列表”界面。步骤三:单击某个节点的名称进入节点基本信息界面。步骤四:在节点基本信息中查询此节点“文件系统服务运行状态”是否为“正常”。DeviceManager维护项-查看性能信息查看性能信息通过查看性能的数据
10、变化情况,及时发现系统中的异常现象,并根据相应的告警信息进行故障处理。操作步骤登录OceanStor DeviceManager。在首页的左下方统计了系统的性能信息包括吞吐量、CPU/内存。异常处理当CPU/内存平均值长期大于90%,需要及时扩容提升性能目录系统维护 例行维护 安全维护 巡检与信息收集 部件更换系统升级故障处理OceanStor 9000系统安全概述OceanStor 9000具有安全的物理组网结构,将用户的业务网络和管理网络隔离,保护系统运行的安全。分层的安全维护应用层安全维护的目的是从安全角度保障业务系统可以正常运行和对外提供服务。系统层安全维护的目的是保障操作系统、数据库
11、、中间件可以正常运行,以支撑应用层各个应用软件的运行。网络层安全维护的目的是保障交换机、路由器、防火墙等网络设备的正常运行,确保网络层的安全策略得到落实。管理层安全维护的目的是加强人为管理,防范于未然。管理层维护涉及上述各个层面。OceanStor WushanFS账户管理管理OceanStor DeviceManager账户WushanFS的OceanStor DeviceManager管理员拥有不同的操作权限,包括超级管理员、管理员、只读用户、资源管理员和设备管理员。系统默认提供了admin(超级管理员),该管理员不允许修改和删除。管理方法登录OceanStor DeviceManager
12、。选择“设置 查看与设置 权限设置 管理用户”。 在中间信息展示区,超级管理员可以执行创建、删除、锁定、解锁、强制下线等操作。修改系统密码(C01)系统密码是登录系统的必要条件,修改系统密码能够防止密码的泄露。对于OceanStor 9000的Linux操作系统自带特权账户root,建议定期更新一次账户密码。修改系统密码方法有如下方式:以root用户使用PuTTY工具登录系统,输入passwd后设置root的新密码。使用CLI命令change system root_password修改。登录OceanStor DeviceManager,选择“设置 集群设置 集群节点设置”,勾选需要修改的节
13、点后单击左下角的“修改Root密码”。检查系统账户(C01)系统会拥有很多账户,定期检查系统账户能够防止账户的不合理扩散和泄露,规避安全隐患。建议您每季度对系统维护账户、应用系统的运行账户进行检查,查看是否存在不合理的账户和不合理的账户权限。检查方式:以root用户使用KVM工具登录节点。查看所有群组的信息:cat /etc/group查看所有账户的信息:cat /etc/passwd检查系统账户(C30)系统会拥有很多账户,定期检查系统账户能够防止账户的不合理扩散和泄露,规避安全隐患。建议您每季度对系统维护账户、应用系统的运行账户进行检查,查看是否存在不合理的账户和不合理的账户权限。检查方式
14、:以root用户登录节点。P12/P25/P36/C36:使用KVM工具登录节点。C72:通过左侧控制框的系统串口登录节点。波特率为115200、8位数据位、1位停止位、无奇偶校验和无数据流控制。查看所有群组的信息:cat /etc/group查看所有账户的信息:cat /etc/passwd检查系统进程(C01)系统运行中会触发众多进程,不合理进程的存在会带来性能、安全等方面的风险,而检查系统进程并做相应处理能避免这些风险。管理员进行安全维护时,需要检查是否有多余的进程,及时发现不合理进程并处理,避免风险。检查方式:以root用户使用KVM工具登录节点。输入ps -ef检查不相关的账户进程。
15、检查系统进程(C30)系统运行中会触发众多进程,不合理进程的存在会带来性能、安全等方面的风险,而检查系统进程并做相应处理能避免这些风险。管理员进行安全维护时,需要检查是否有多余的进程,及时发现不合理进程并处理,避免风险。检查方式:以root用户登录节点。P12/P25/P36/C36:使用KVM工具登录节点。C72:通过左侧控制框的系统串口登录节点。波特率为115200、8位数据位、1位停止位、无奇偶校验和无数据流控制。输入ps -ef检查不相关的账户进程。检查服务/端口(C01)系统会提供各种服务/端口,但多余服务/端口会带来安全风险,需要及时停止。检查是否有多余的服务/端口,如果有多余服务
16、/端口建议联系技术支持分析确认后及时停止,以避免安全风险。系统提供的详细服务、端口请参见通信端口矩阵文档。检查方式:以root用户使用KVM工具登录节点。输入netstat -an |grep LISTEN |grep tcp检查TCP服务/端口。输入netstat -an |grep udp检查UDP服务/端口。检查服务/端口(C30)系统会提供各种服务/端口,但多余服务/端口会带来安全风险,需要及时停止。检查是否有多余的服务/端口,如果有多余服务/端口建议联系技术支持分析确认后及时停止,以避免安全风险。系统提供的详细服务、端口请参见通信端口矩阵文档。检查方式:以root用户登录节点。P12
17、/P25/P36/C36:使用KVM工具登录节点。C72:通过左侧控制框的系统串口登录节点。波特率为115200、8位数据位、1位停止位、无奇偶校验和无数据流控制。输入netstat -an |grep LISTEN |grep tcp检查TCP服务/端口。输入netstat -an |grep udp检查UDP服务/端口。安全组网组网划分需要考虑安全区域划分、边界访问控制、网络入侵检测等方面,并根据这些规则规划出系统的安全组网。在存储系统业务网络中,OceanStor 9000系统集群与网管系统置于同一个安全网络中。远程用户需要通过防火墙才能连接OceanStor 9000系统。检查交换机安
18、全以华为QuidWay S5700-52C-SI交换机为例进行说明,通过检查其ACL配置来确保业务系统接收的数据包是安全的。可以使用如下命令查看ACL的配置结果。display acl acl-number | all查看以编号创建的ACL规则。display acl name acl-name查看以名称创建的ACL规则。display time-range all | time-name查看时间段信息。display acl resource slot slot-id查看ACL的资源信息。上述ACL命令均以S5700 V200R001C00版本为例,实际所用的ACL相关命令请参照交换机对应版
19、本的产品文档。检查VLAN/IP地址VLAN的作用是将一个物理的LAN在逻辑上进行隔离,使得广播报文等通信受到VLAN划分的限制。检查VLAN配置信息及相关IP地址、处理异常能保障网络的安全性。当网络中需要跨越防火墙设备时,建议按IP地址放行流量。如果需要按IP地址+端口放行流量,则需获取端口列表,避免屏蔽掉OceanStor 9000使用的端口。 账户维护建议建议系统管理员对账户例行检查,检查的内容包括:操作系统、OceanStor DeviceManager的账户是否有必要,临时账户是否已删除。各类账户的权限是否合理,不同的管理员拥有不同的权限。对各类账户的登录、操作日志进行检查和审计。密
20、码维护建议用户的账户和密码的复杂性、有效期等需根据客户的安全要求进行配置。对密码的维护建议如下:专人保管系统root密码。密码需要满足一定的强度要求,例如密码最少字符数、混合大小写等。密码传递时注意加密,尽量避免通过邮件传递密码。密码需要加密存储。系统移交时提醒客户更改系统默认密码。首次登录后请及时修改系统默认密码。定期修改密码。日志维护建议定期检查日志定期查看系统日志,若发现有非法操作、非法登录用户等异常情况,应根据异常情况进行相应的处理。定期备份日志日志应当进行定期备份,同时将备份文件在安全的保存介质(磁盘、磁带、光盘等)上存档。日志在备份后应当及时删除,以释放日志空间。缺陷报告建议为了更
21、好的解决故障,建议客户在发现问题后及时的将问题反馈给华为,并在寻求华为技术支持前做好必要的准备工作,包括收集必要的故障信息和做好必要的调试准备等。如果现场发生了安全事故,华为技术支持工程师将提供远程或者现场支持,协同用户维护人员减轻系统遭受攻击的影响,并且完善现场事故报告的处理过程。如果没有发生安全事故,华为技术支持工程师将把问题录入数据库并传给研发团队。研发团队找到解决方案后,技术支持工程师将分析方案实施对现场业务的影响,并提供建议的解决方法。注意:将问题数据传出客户网络时,必须得到客户授权,且必须对其中的个人数据进行匿名化处理,确保华为不能以任何方式还原个人数据。安全应急响应机制客户需要建
22、立应对安全事故的应急响应处理机制,以保证出现安全事故后,可以尽快恢复生产和解决问题,将损失降至最低。如果系统发生了故障,可以先根据故障的具体情况,查阅华为技术有限公司提供的相关产品指导文档。指导文档能解决在日常维护或故障处理过程中遇到的常见问题。如果仍不能解决问题,可以寻求华为的技术支持。为了更好的解决故障,建议在寻求华为技术支持前做好必要的准备工作,包括收集必要的故障信息和做好必要的调试准备。目录系统维护 例行维护 安全维护 巡检与信息收集 部件更换系统升级故障处理巡检内容(1)性能指标磁盘利用率CPU利用率内存利用率节点吞吐量硬件状态电源状态风扇状态网口状态光模块状态巡检内容(2)集群软件
23、状态集群状态节点状态DeviceManager运行状态软件设置时钟同步外部DNS连通性License状态日志级别巡检内容(3)文件系统运行状态节点池内存一致性检测检查打开的文件句柄数文件系统运行状态数据恢复状态其他风险检查近30天是否存在core和crash恢复任务执行时间过长本地文件系统是否有操作超时OceanStor Toolkit进行巡检(1)界面列出了所有的巡检项,根据需求进行选择,默认全部进行巡检。OceanStor Toolkit进行巡检(2)待巡检完成后,单击“查看巡检报告”可以进行查看。 步骤一:选择“所有功能 维护 信息收集”。OceanStor Toolkit进行信息收集(
24、1)步骤二:勾选待收集的设备后单击“收集”。步骤三:当进度变成100%时,单击“打开收集目录”查看信息收集结果。OceanStor Toolkit进行信息收集(2)常见巡检不通过项分析Nvdimm从原始信息可看到巡检不通过原因。常见巡检不通过项分析BMC状态从原始信息可看到巡检不通过原因。打开收集OceanStor 9000设备信息结果目录,进入以收集信息设备IP为名称的目录。将信息收集结果压缩包解压到当前目录,获得名为“DataCollect”的文件夹。进入“DataCollect”目录,获取每个节点的信息收集结果包。OceanStor Toolkit进行日志分析(1)在OceanStor
25、Toolkit工具主界面中,选择“所有功能 维护 日志分析”,打开日志分析工具。OceanStor Toolkit进行日志分析(2)单击“选择”按钮,依次导入步骤2中获取的每一个节点的信息收集包,进行日志分析。此处以其中一个节点的信息包为例说明。在“设备类型”中选择“OceanStor 9000”。如果更新了日志分析的配置文件AnalyzeRule.xml,要先单击“清空临时文件”,再重新导入日志包进行日志分析。OceanStor Toolkit进行日志分析(3)单击“开始分析”并选择要分析的内容。单击提示框中的“确定”后开始进行分析。目录系统维护 例行维护 安全维护 巡检与信息收集 部件更换
26、系统升级故障处理基本操作流程基本操作流程-确定操作的可行性在执行故障处理或设备检修的过程中,当维护人员需要对某个设备部件执行更换操作时,首先需要对本次操作的可行性进行评:设备库房有待安装或待更换部件的可用部件,当缺少可用部件时,请及时联系华为技术支持工程师以获取帮助。确认新部件良好,无氧化、无化学腐蚀、无元器件脱落、无运输损坏等缺陷。维护人员是否有能力执行本次更换操作,除CRU外,其他部件的更换操作只能由有经过专业培训技术支持工程师执行, CRU包括 :硬盘模块、电源模块、电缆、光模块。 基本操作流程-准备备件与工具准备好待安装或待更换的部件。 准备好十字螺丝刀、防静电腕带等工具。 准备好一个
27、防静电平台,方便设备、工具的放置。 在拿放、运输部件时,必须使用专用的防静电包装袋。 在设备的日常维护中,应做好部件的整理、登记和送修工作。安全注意事项在更换部件的过程中,请配戴防静电腕带或防静电手套,防止静电对人体和设备造成损伤。 在更换部件时,确保袖口扎紧或卷到肘部以上,为了安全,建议不要穿戴首饰、手表、金属框眼镜或有金属扣子的衣服。 请保持部件所在区域的清洁。 避免用力过大或强行插拔等操作,以免损坏部件的外观或导致接插件故障(例如插针弯曲、插针短路等)。 确保设备接地良好。防静电措施在运输、保管部件的过程中,必须使用专用的防静电袋与防静电盒。更换过程中,部件应放置在防静电桌上。防静电腕带
28、分为插孔式的防静电腕带和带金属夹的防静电腕带两种。对于插孔式的防静电腕带,需要将防静电腕带的接地端插入机柜的ESD(Electro Static Discharge )插孔。对于带金属夹的防静电腕带,需要将防静电腕带的金属夹夹在机柜侧面的方孔中。FRU更换工具FRU更换工具目前FRU更换工具支持在线更换硬盘、电源模块、电缆(或光模块)。目录系统维护系统升级故障处理升级概述OceanStor 9000支持在线升级和离线升级两种升级方式。在线升级是不需要中断业务的升级方式,在升级过程中OceanStor 9000仍然可以为用户提供业务。离线升级是需要中断业务的升级方式,在升级过程中OceanSto
29、r 9000不能继续为用户提供业务。升级影响-对现行系统的影响在线升级方式对业务的影响如下: 在线升级过程不会影响业务正常运行。 在线升级方式单节点升级需要约30分钟,且为保证业务不中断,需要逐个节点进行升级,所以集群升级时间与集群内节点数量相关。 升级某个节点时如果其他节点发生故障,可能导致部分业务数据无法访问。 在全部节点升级成功之前用户都只能使用旧版本的功能。离线升级方式对业务的影响如下:离线升级过程会中断业务运行,业务中断时间依赖于升级执行时间。离线升级方式是集群中所有节点同时执行升级操作,整个集群升级需要约1小时。升级影响-对现行系统的影响对网络通信的影响在线升级和离线升级方式均对网
30、络通信无影响。对管理功能的影响在线升级和离线升级方式在升级过程中,均只能提供查询类管理功能,不能提供设置类管理功能。升级前准备-升级前检查检查项目检查标准建议起始时间 耗时准备升级参考文档升级操作人员已获取参考文档并熟练掌握相关说明和操作要点。升级前一周1小时获取新版本的License文件(可选,若升级后需要更新License文件则需要获取)升级操作人员已申请新版本所需加载的License文件。升级前一周3小时准备升级软件包升级操作人员已获取升级软件包并完成校验。升级前三天 1小时准备升级工具升级操作人员已获取升级所需工具并掌握使用方法。升级前三天3小时检查设备运行状态升级操作人员已完成设备运
31、行状态检查并排除现有告警和故障件更换。升级前一天3小时升级前准备-升级工具工具名软件名说明SSH工具putty.zip用户准备SSH工具SSHSecureShellClient-3.2.9.ext用户准备FTP工具wftpd32.exe用户准备巡检工具OceanStor Toolkit V100R001CxxSPCxxx.zip请登录华为官网下载升级流程图升级步骤-上传软件包步骤1:打开浏览器(例如Internet Explorer),输入存储设备管理IP地址登录OceanStor Toolkit,(例如0:8098/tools),默认用户名为admin,默认密码为Adminstorage。步
32、骤2:单击“升级”,弹出“升级”窗口。步骤3:单击“浏览”,选择升级目标版本的软件包,单击打开。步骤4:单击“导入”,软件包上传成功后界面显示“导入升级包成功”。步骤5:单击“确定”后,单击“下一步”,系统开始加载节点信息。升级步骤-选择升级模式在“升级模式”后选择“离线”,则采用离线升级模式进行升级操作;选择“在线”,则采用在线升级模式进行升级操作。离线升级模式只能所有节点同时升级。在线升级模式可以所有节点同时升级,也可以选择部分节点进行升级。如果只需要升级某个节点,可只选择该节点前面的复选框。升级步骤-选择升级模式选择升级模式后可执行“预检测”和“启动升级”操作。预检测:操作只检查存储集群
33、是否满足升级的条件,不执行升级操作。启动升级:操作会首先检查存储集群是否满足升级条件,并在检查通过时执行升级操作。升级步骤-升级前预检测升级前预检测的目的是检查设备是否符合升级条件,预检测成功可进行升级操作,预检测失败则必须先处理检测问题再进行升级。预检测所需时间从5min到10min,若集群内存在同步恢复操作时检查时间较长。升级预检测完成后,可以单击“完成”结束操作,也可以单击“启动升级”直接进行升级操作。升级步骤-执行升级操作离线升级和在线升级都包括“升级进程自升级” 、“下载升级包”、“升级前检查”、“升级中”和“升级后验证”几个阶段,界面上的“总体状态”信息会根据升级所处的不同阶段显示
34、对应的提示信息。升级完成并验证成功后,“总进度”为100%,且每个节点的“升级状态”为升级后验证成功,“进度”为100%。若在离线升级的过程中有节点升级不成功,本次升级的所有节点会自动回滚,将版本退回到升级前的状态,待回滚结束后,可再次进行升级。若在在线升级的过程中有节点升级不成功,升级失败的节点会自动回滚,将版本退回到升级前的状态。版本回退采用离线升级方式时,任何一个节点升级失败,本次离线升级的所有节点都会自动进行版本回退,无需人工干预。采用在线升级方式时,升级失败的节点会自动进行版本回退,升级成功的节点不进行回退,无需人工干预。验证升级结果验证项目检查标准收集存储设备信息可通过信息收集工具
35、收集设备运行信息检查系统状态使用巡检工具进行检查,各检查项结果均为通过检查系统配置配置数据与升级前一致,系统配置不丢失注意事项(1)升级前请保证系统盘空闲空间至少大于4GB。升级前如果系统中存在故障节点或系统中集群版本(每个节点的版本和导入的升级包的版本)超过2个,不允许进行升级操作。打开升级界面后,OceanStor Toolkit会向OceanStor 9000查询上一次上传的升级包的位置、版本和上传时间等信息。如果上述三个值不为空,则可以直接点击“下一步”进行升级操作或查询上次升级的进度。如果为空,则必须上传升级包。升级和扩容操作不能同时进行。注意事项(2)升级过程中会出现节点的状态为“
36、离线”或“故障”状态,属于正常现象,升级成功后即恢复正常,无需特殊处理。确保升级或者回退后,OceanStor 9000 产品与DeviceManager对应的版本是匹配的。不支持deploy agent和驱动、OS补丁的单独升级。升级过程中会切换操作系统,这些组件的升级都是通过升级到新系统实现。目录系统维护系统升级故障处理 先外部后内部先高级后低级先共性后个别故障处理原则故障处理方法分析法替换法看告警信息并配合对性能数据的分析替换怀疑工作不正常的部件告警告警分为四种级别:紧急、重要、次要、警告告警通知:短信通知邮件通知声音通知故障的分类设备类故障设备硬件、物理状态相关问题部署扩容类故障部署和
37、扩容的软件、硬件问题业务类故障以文件共享服务为主的各类业务功能故障管理类故障通过DeviceManager为主的管理工具修改、查看配置时遇到的故障设备类故障-基础知识诊断流程和方案检查硬件型号检查接口、线缆连接问题更换故障部件修改软件配置典型举例-节点重启后无法进入操作系统现象描述节点重启后,停留在SAS卡初始化阶段,无法进入操作系统。典型举例-节点重启后无法进入操作系统定位思路典型举例-设备开机无法启动现象描述按下系统电源开关时,系统电源指示灯不亮,系统无法开机。P25系统电源指示灯的位置如图1所示;C36系统电源指示灯的位置如图2所示。图1图2典型举例-设备开机无法启动定位思路部署扩容类故
38、障-基础知识诊断流程和方案检查信号线缆连接检查节点是否恢复出厂设置检查Deploy进程是否正常典型举例-节点无响应现象描述启动部署后,部署工具界面提示“节点无响应”。可能原因部署工具和deploy版本不匹配,导致deploy消息解析失败。典型举例-节点无响应定位思路用KVM登录部署失败的OceanStor 9000节点设备。执行如下命令rpm -qa |grep deploy,查看deploy版本号。 显示如下报文 deploy-V100R00 xC0 xB0 xx-1执行如下命令,查看部署工具版本号。 cat /opt/Runtime/perties 显示如下报文: =OceanStor ISM-N V100R00 xC0 xB0 xx subversion=OceanStor ISM-N V100R00 xC0 xB0 xx ismVer
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度脚手架施工项目风险评估与应急预案协议
- 合同备案申请书
- 2025年度环保型刮瓷涂料供应与施工合同
- 2025年度国内贸易代理合同(含金融结算)
- 申请书的申请人格式
- 电子商务平台的AI智能技术应用研究
- 癌症患者的健康教育
- 生产过程管理与能源监控的信息化实践
- 电信行业节能减排策略与绿色发展路径
- 电商环境下木地板销售的客户关系管理策略
- 钢结构考试试题(含答案)
- 彭大军桥牌约定卡
- 新能源整车装配工艺培训的资料课件
- 房车露营地的研究课件
- 园艺疗法共课件
- DB33T 628.1-2021 交通建设工程工程量清单计价规范 第1部分:公路工程
- 医院-9S管理共88张课件
- 设立登记通知书
- 2022医学课件前列腺炎指南模板
- MySQL数据库项目式教程完整版课件全书电子教案教材课件(完整)
- 药品生产质量管理工程完整版课件
评论
0/150
提交评论