版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
NEC_ExpressclusterX3.0产品维护手册文档声明: 本文档针对Windows平台下NECExpressCluster集群软件运行过程中故障的快速定位和快速处理方法。此文档截止目前适用于“Windows2003、Windows2008”操作系统平台下的“NECExpressClusterX3.0和X3.1版本”。有关其他版本及相关手册可登陆“/”论坛。文档中"ExpressCluster"简称"EC"。对于本文档中的内容有任何意见或建议可随时发送邮件至wangbing@管理界面介绍 通过浏览器输入服务器任意IP地址加29003端口进入EC管理界面(下图为EC_X3.0_Win的管理配置界面),界面主要分为【菜单栏】、【树形结构】、【信息栏】和【日志栏】,通过菜单栏中的按钮可以更改有关参数、控制集群的启动停止等。三种管理模式:操作模式:对集群执行启动、停止、转移等操作设定模式:对集群的配置进行修改查看参照模式:与操作模式看到相同的内容,但无法执行启动停止等操作注:本文档内容主要涉及到操作模式下的相关操作树形结构图 树形结构图中主要显示集群的资源、服务器和资源监视。Server:所有集群内的服务器基本信息,展开各台服务器可以看出集群的心跳状态Group:所有的资源组,资源组内包含各类资源(用于执行集群内应用的启动停止)。浮动IP地址、应用服务和磁盘等统称为集群资源,而将这些资源放到同一组内即可实现一个应用的双机热切换。资源在组内一般会设定依赖关系(即启动顺序)Monitor:各项资源的监视,用于监视资源组内的相关资源,通过对监视器的调整可以改变故障切换的时间信息栏:点击左侧树形结构任意内容会在右侧信息栏中显示相关项目的详细信息注:本手册主要针对浮动IP、镜像磁盘、应用服务这三类资源为维护对象日志栏 EC管理界面中,日志栏会实时显示EC的相关信息。日志存在服务器中,每次打开浏览器都能显示所有日志内容。日志主要分为三个级别:信息:记录对EC的操作信息以及内部信息警告:此信息出现可能存在单点故障,集群不处于最佳状态,此时需要查看集群树状结构以确保集群工作正常,一般在警告状态下至少还有一台服务器可以工作错误:出现此类信息表示集群内有某项资源或位置发生错误,出现此类错误需要立即查看故障点以给出相应解决办法资源故障分析 在集群的资源中可能会出现各个资源故障,本手册将会针对Md资源在各种故障情况下的恢复方法进行详细阐述。对于浮动IP资源和服务资源进行简单地表述解决方法和常见问题。浮动IP资源 浮动IP资源主要和网卡有关,在浮动IP资源出现故障或警告的情况下,首先要查看集群的网卡状态以及心跳是否都工作正常。当确定网卡和心跳都工作正常时确定局域网内是否有IP地址与之冲突。在这些初步判断无法定夺时需要结合EC日志和Windows系统日志内容来确定故障的原因,并制定出对应解决方案(详细内容可参考官方“ExpressCluster®X3.0forWindows参考指南”)Md资源 在不正常关机或断电等情况下对Md资源的正确操作非常重要,操作不慎就会丢失数据。以下主要针对各种情况下Md可能会出现的状态以及对应的解决办法。mdw1出现黄色警告 此状态一般会在首次做完集群配置和服务器重启后出现,如果仅出现mdw1警告,其他资源一切正常时表示两台服务器的数据不完全一样,可能正在从最新数据同步到非最新数据服务器,也可能是根本无法从主机镜像到备机。区别这两种情况可以点击mdw1在右侧信息栏就可以看出,如果一台服务器警告,一台正常则一般表示正在同步,若一台出现异常,一般则表示无法实现镜像。此时还可以右键Md资源显示Md的详细信息在Md的详细信息栏中将会看到以下内容则表示正在从服务器“Win0302”往“Win0301”上同步数据,通过文本框内的信息可以看出当前的状态。此时不需要进行任何操作,只需等待其完成即可,在此期间不可以执行重启服务器和断开网络等操作。Md资源启动失败 在机房出现断电导致主备机同时断电后主备机不同时启动(大于五分钟)时可能会出现Md资源无法启动,其他认为等因素也可能导致此故障发生。出现以上情况时需要手动指定最新数据源才可恢复集群,由于磁盘被锁定无法人为判断最新数据时可以采取以下方法(操作之前最好保证客户端无法连接到服务器):解锁磁盘查看并比较两台服务器数据打开Md资源详细信息,会显示如下状态:点击图标以更改其状态至以下状态并点击按钮,则Win0301的磁盘将被解锁同样在另一台机器执行相同操作,结果将显示如下:此时可以查看各个服务器的磁盘内容,可以进行大小和日期的对比来判断新数据,比较完成后还需要在Md的详细信息中还原到初始状态,即:关闭认为数据较旧的那台服务器,将显示如下状态:点击win0302的磁盘图标,到最新数据关闭详细信息后停止资源组,并重新启动资源组 在win0302上启动后应当首先确定数据是否为最新数据,当确认为最新数据(用客户端访问查询最新数据)时,可以选择让另一台机器启动。如果当前需要客户端立即访问数据库,建议可以先不启动另一台机器,直接单机服务,可以选择下班后开启另一台机器。这样做的目的是可以防止在业务运行期间执行数据同步占用一定的服务器资源。若确定为另一台机器为新数据,则应当关闭服务器开启另一台服务器,执行以上的操作步骤。服务资源 当应用程序服务资源启动出现错误时可能会出现如下状态首先停止启动失败的服务资源 当资源停止后需要手动去启动服务资源,在手动启动服务过程中根据出现的错误描述来判断问题出现的原因,并有针对性的解决应用程序服务本身的故障。 服务启动故障需要根据具体的应用情况来甄别问题的原因。 总结:除了以上发生故障时的排查外还需要不定期的查看EC日志,以确保服务器一直处于健康稳定的状态。Md资源可能会因为各种误操作导致两边数据不同步,而不同步的结果都
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度外墙保温项目质量监督与施工承包协议4篇
- 2025年度文化产业实习生劳动合同书(二零二五版)4篇
- 2025版离婚协议中关于房产抵押及贷款合同处理范本8篇
- 2024版远洋货运合同协议
- 2025版绿色环保社区共享租赁合同可下载4篇
- 2025版体育项目提成协议书(赛事赞助收入分成协议)3篇
- 2025年智慧仓储与运输管理系统合同3篇
- 长春师范高等专科学校《数据结构与算法》2023-2024学年第一学期期末试卷
- 2025年度海洋工程精密焊管采购合同范本3篇
- 电子设备的防雷防潮措施
- 2024生态环境相关法律法规考试试题
- 有砟轨道施工工艺课件
- 两办意见八硬措施煤矿安全生产条例宣贯学习课件
- 40篇短文搞定高中英语3500单词
- 人教版高中数学必修二《第九章 统计》同步练习及答案解析
- 儿科护理安全警示教育课件
- 三年级下册口算天天100题
- 国家中英文名称及代码缩写(三位)
- 人员密集场所消防安全培训
- 液晶高压芯片去保护方法
- 拜太岁科仪文档
评论
0/150
提交评论