Lifekeeper技术白皮书方案_第1页
Lifekeeper技术白皮书方案_第2页
Lifekeeper技术白皮书方案_第3页
Lifekeeper技术白皮书方案_第4页
Lifekeeper技术白皮书方案_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、NCR LifeKeeper技术简介及其应用(共享磁盘阵列柜方式)(一) NCR LifeKeeper 原理1、NCR LifeKeeper定义、特性、资源保护LifeKeeper For Windows NT提供了一个完全容错的软件解决方 案,并提供数据、应用程序和通信资源的高度可用性。LifeKeeper不 需要任何特别的容错硬件。你可以集合使用二到十六个NT结点。并访问特定地点的配置数据。然后,LifeKeeper会自动地提供错误检测 和多层现场恢复。在出现故障的情况下,LifeKeeper会将保护资源自动转换到一个 根据优先权而设定的系统。在实际进行切换用户时,会经历一个十分短暂的

2、休眠,但是,当系统完成了切换操作后,LifeKeeper会在所选择的系统上自动地恢复操作。可以被LifeKeeper2.0保护起来的资源是:?卷(Volume)? IP地址? 共享文件? LAN (局域网)管理器服务器名称?应用程序?定义的用户? MSCS应用程序2、心跳故障检测HeartbeatLifeKeeper在集群节点间保持着间歇的通信信号,也叫做心跳信 号,是错误检测的一个机制。即通过每一个通信路径,在两个对等系 统之间进行周期性的握手,如果连续没有收到的心跳信号到了一定的 数目,LifeKeeper就把这条路径标示为失效(红色)。如果你只定义了一条通信路径,当LifeKeeper把

3、这唯一的一条通信路径标为失效时,LifeKeeper便立即开始恢复过程。然而,如 果你有冗余路径,LifeKeeper能够通过第二条路径确定是系统故障还是只是通信路径有问题。如果LifeKeeper开启优先级第二的通信路径并收到了心跳信号,它就不开始 failover恢复,只需要把第一条 通信路径标成红色(失效),作为信号告诉你需要修理一下有故障的 路径。一般情况下LifeKeeper只在下列事件发生时,启动系统恢复功 能:?所有的通信路径故障。如果所有节点都没能收到心跳信号, 把所有通信路径都标为失效,Lifekeeper开始安全检查。? 安全检查失败。当所有通信路径故障时,LifeKeep

4、er向整个网络发出安全检查信号。如果信号指出配对系统还“活”着的时候,LifeKeeper不启动Failover。如果安全检查没从配对 节点返回信号,LifeKeeper就开始Failover。因而,为了减少由于潜在的通讯错误所引起的不必要的系统切 换,建议您使用不同介质的多条通信路径。3、通信路径LifeKeeper支持在节点之间和心跳通讯中,使用如下通讯路径:(1) socket,即套接字。你使用任何的网络硬件接口,只要它能 够支持TCP/IP的通讯协议。这样的硬件包括:以太网、快 速以网、令牌环网以及 FDDI或CDDI。(2) 串行口在LifeKeeper配置中,你应当配置有一个串行口

5、通信路径。串口通信路径需要利用RS232的拟调解线路来与LifeKeeper系统相连接。(3) 共享磁盘你可以定义一个共享磁盘分区来作为LifeKeeper的通讯中介。可以只使用小至 1MB的分区,当然,也可以 使用更大的空间。LifeKeeper假定,当通过心跳信号检测其它服务器失败时,则认为此服务器是关闭的。因此,为了避免不必要的失效切换,最好建立 两种以上独立的物理路径,使用至少两种心跳。例如,如果两个服务器被一个串口连接起来,并且,从属服务器 来的心跳信号无法被主服务器所检测到,则下面之一是可能引起这一 现象的原因:? 服务器的RS-232卡或者端口失败? 电缆失效? 主服务器暂时挂起

6、? 主服务器失败失效切换只可能在最后一种情况下才发生。因此,节点间的多种通信路径可以帮助避免不必要的失效切换。(二) NCR LifeKeeper 配置示范LifeKeeper应用系统Windows NT Server硬件平台注解; 支持的数据库系统:NT SQL Server、Sybase Orcale等;支持的群件:lotus Notes ExchangeServer等;其他:SAP R/3。NCR除了提供以上的恢复工具包外,还提供了一个用 户自定义接口,使您的应用也能处于 LifeKeeper的保护之下II1萨A软件、硬件配置1、软件:NCR LifeKeeper 2.0 及 Recov

7、ery Kit2、 硬件:服务器可以是任何Intel基础上的平台,Server的型号、配置不必一致,只需硬件平台能保证NT运行;磁盘阵列正常使用。NCR LifeKeeper 运行机制1、共享的SCSI和LifeKeeper软件锁定LifeKeeper For Winddows NT 软件锁定:LifeKeeper管理共享磁 盘上的数据,以防止多个服务器在同一时间访问数据。 LifeKeeper在 逻辑设备级(卷)上控制对数据的访问,并让Windows NT软件或硬 件 RAID Controllers 管理物理级。有了 Lifekeeper For Windows NT 来 管理对共享数据的

8、访问,用户就可以不必担心群中的其它服务器访问LifeKeeper自动在被应用程当被保护的应用程序由一个LifeKeeper控制这些锁定,数据时,可能会带来的数据访问冲突。 序定义为共享资源的磁盘卷上设置锁定。 服务器被移动/转换到另一个服务器时, 以保证激活服务器对共享卷的访问。在主系统发生故障的情况下,次节点系统将能够在磁盘上建立SCSI锁定,并在备份的系统上将资源投入使用。2、Local Recovery (局部恢复)LifeKeeper 2.0 在快速检查(Quickcheck)和深入检查(deepchecR 的时间间隔执行预先定义的行为,以察看资源本身是否失效。如果快 速检查和深入检查

9、均局部告失败,系统将尝试局部恢复资源。如果尝 试成功,资源将不会向下一优先级的节点进行失效切换(failover )。 如果局部恢复尝试失败,系统将向下一优先级的节点进行失效切换。例如,你可以在LifeKeeper服务器上配置多块 NIC卡,当定 义的NIC发生故障时, 你就可以配置将IP资源切转到另一个 NIC 上,从而避免不必要的失效切换。3、Failover (失效切换)指定主要的节点或资源失败时,重新恢复资源的过程。一个失效 切换通常是没有事先计划的,它将发生在一个被从属系统所检测到并 确定为失败的情况下。4、ACS (管理员可配置的迁回)Admi nistrator Con figu

10、rable Switchback( ACS )允许 LifeKeeper管理员通过命令行或GUI界面来指疋资源,其所在LK节点发生故 障而后又恢复正常,该资源将被自动地切换回到原来节点上。可能的值是Intelligent(智能的)和Automatic(自动的)。如果选择Automatic , 那么,一旦发生故障的节点回到服务状态时,被配置失效切换的层次都将被切换回到该节点上。如果策略是In tellige nt,即使当发生故障的节点回到服务状态时,被配置失效切换的层次也会留在它们被失效 切换到的节点上,等待由管理员决定合适的时间进行切换。5、Switchover (正常切换)指用一个有顺序的方

11、式关闭资源,然后将它们恢复到一个备份系 统的过程。这通常发生在当你处于维护或者测试模式中的情况下。这时,没有任何东西失败。工作方式1、Active/Sta ndbyActiveSta ndbyOHrROTCP/IP在一个激活/备用对中,主节点处于处理状态,从属节点处于备 用状态,以防主节点上发生失败。备用系统可以是一个小一点、性能 低一点的系统,但是,当主节点失败时,它必须有保证资源可达性的 处理能力。例如,假设 NT Server1是主“激活”节点,NT Server2 是次“备用”节点。如果 NT Server1发生故障了,它的被保护资源由NT Server2节点来恢复。当节点NT Ser

12、verl恢复后,资源可以被NT Serverl重新获得。然而,当NT Server2节点失败时,NT Server2 节点上并没有需要被NT Serverl节点恢复的资源。2、Active/ActiveDisk ArrayRS232TCP/IPNT Server221在一个激活/激活对中, 两个节点都是激活的处理器,但是它们 也可分别作为其对应节点上的资源和资源层次的从属节点。在激活/激活的图表中,有两个主要应用:APPA处于Volume w中,并且在 NT Server1上激活。APPB存储在 Volume M上,并且在 NT Server2上激活。在这一配置中,NT Server1应该是V

13、olume W:资源的主节点,NT Server2应该是Volume M :资源的主节点。当NT Server2失败时,LifeKeeper应该将Volume M :转换到 NT Server1上去。如果系统资源是足够的,这一转换不会影响到已经 在NT Server1上运行的APPA,转换只是简单地将 NT Server2上的被 保护应用程序(APPB)加到NT Server1的运行负载上去。3、N-Way (N=3, N=4N=16)服务器AAppAAppBAppCActive服务器BDisk o ArrayActive服务器CAppBAppBAppCAppCN-Way配置是激活/激活或激活

14、/备用的一个有三到十六个服务器 的扩展。服务器A被配置为服务器B和服务器C的备份。而且,服 务器A可以被配置为除了服务器B和服务器C的其他服务器做备份。 当任何一个服务器发生故障时,被保护的应用程序被从该服务器上转 到备用的服务器上。在N-WAY配置中,可以配置 Cascading Recovery (层叠恢复)。当主节点发生故障时,层叠恢复允许多个从属节点被按照一定的优先 级次序恢复一个资源或层次。对于在一对节点上的资源恢复,如果节 点A发生故障了,资源将会失效切换到节点 B上;如果节点B再发 生故障而节点A仍然不可用,资源将会失效切换到节点 C上。多个 从属节点被指定一个恢复优先级。在上面

15、的例子中,节点A有最高的优先级,节点B有第二优先级,而节点C有最低优先级。LifeKeeper 按优先级次序测验节点来决定在失效切换时哪一个服务器将进行工 作。二、NCR LifeKeeper with Extended Mirroring技术简介及其应用(支持非共享磁盘阵列的扩展方式)(一) NCR Extended Mirroring 原理1、NCR Extended Mirroring 简介NCR扩展镜像是一种软件产品,专为 Windows NT系统设计的 客户/服务器环境下一种有效、高性能的高可用性解决方案。单独使 用NCR扩展镜像软件,无需较贵的 RAID磁盘子系统,无需考虑小 型计

16、算机系统接口( SCSI)对缆线长度的限制,去除了单点故障(磁 盘阵列子系统)。集群计算机环境所要考虑的主要问题是系统总开销, 而使用NCR扩展镜像软件的 NCR Lifekeeper For Windows NT 是解 决这个问题的首选方案。公司只需最小的硬件集成便可以得到低价、 高可用性的方案。NCR扩展镜像软件在局域网的服务器之间提供完全基于软件的 镜像。一个服务器被指定为主服务,另一个为从服务器。客户只能对 主服务器上的镜像卷进行读或写,从服务器上相应的卷被锁定以防对 数据的存取,除非在主服务器上检测到故障状态。 这是实现一个高性 能方案要考虑的一个重要问题,因为数据的完整性是主要因素

17、。尽管 NCR扩展镜像软件可以单独使用,但是与NCR LifeKeeper forWindows NT配合使用会显著增强它的功能。2、NCR Extended Mirroring 特性在NCR扩展镜像环境下,一个镜像是主服务器上的一个卷,其 内容与从服务器上的相关磁盘通过 LAN同步。NCR扩展镜像软件使 卷镜像的创建更为容易。在卷镜像建立后,主服务器和从服务器上的驱动器已经同步,并且两个服务器都已启动运行,出现下面的事件:?最初的镜像建立后,系统禁止所有用户存取从镜像卷,不允许 对从服务器上的镜像卷读和写。主服务器镜像则可以进行读和 写操作。?到达主服务器的所有镜像和非镜像卷的读操作被传递给

18、卷后, 可以无干扰的正常完成。对从服务器上镜像卷不能以Sta ndby模式读,例如,从服务器尚未承担主服务器发生故障时的角色。?无论何时主服务器收到一个写请求,系统首先决定这个请求是 否针对某个镜像卷。如果不是,写操作可以完全正常的完成。 如果主服务器写请求是针对镜像卷的,那么请求首先被送到从 镜像卷去。从系统在自己的镜像卷上执行写请求后,向主系统 发送写回状态。主服务器在收到这个写回状态前不做任何写操 作。?当从系统返回一个成功状态时,主系统在自己的镜像卷执行写 操作,并返回到请求方。如果从系统执行镜像卷写操作时发生 错误,那么从系统上的写操作将被中止,主系统结束自己的镜 像卷写请求,镜像状

19、态从 Normal变为Broken。3、NCR LifeKeeper with Extended Mirroring 特性NCR LifeKeeper For Windows NT 与NCR扩展镜像软件互有优 点,两者的结合给用户提供了不少好处。? NCR LifeKeeper For Windows NT的自动检测与恢复功能和NCR扩展镜像软件的卷镜像功能相辅相成,使NCR LifeKeeper 系统配置中,无需昂贵的 RAID磁盘子系统。?使用扩展镜像的 LifeKeeper由于数据被镜像到另一个系统上去,因此 NCR LifeKeeper For Windows NT 与 NCR 扩展镜

20、像软 件的结合去除了 RAID磁盘子系统中单点故障的可能性。?因为没有共享SCSI缆线的长度限制,NCR扩展镜像软件使用 户能够将LifeKeeper服务器放置在局域网上任意处,这使带有 NCR扩展镜像功能的 NCR Lifekeeper For Windows NT有可能 在独立楼房中通过对服务器的定位来达到灾难恢复的目的。(二) NCR LifeKeeper with Extended Mirroring 配置示范LifeKeeper WithExtended Mirroring应用系统Windows NT Server硬件平台NT ServerlNT Server2TCP/IPHeart

21、beat ConnectionsLifeKeeper WithExtended Mirroring应用系统Windows NT Server硬件平台注解;支持的数据库系统:NT SQL Server、Sybase Orcale等;支持的群件:lotusNotes、Exchange Server等;其他:SAP R/3。 NCR 除了提供以上的恢复工 具包外,还提供了一个用户自定义接口,使您的应用也能处于LifeKeeper的保护之下。使用带有NCR扩展镜像功能的NCR LifeKeeper for Windows NT 来进行配置,其中NT Server1是主服务器,NT Server2是从服

22、务器。 当一个客户向NT Served上的镜像卷发出写命令,NCR扩展镜像软件 保证写命令通过网络送给NT Server2, NT Server2上的写操作成功完 成时,NT Server1上的写操作才能完成。因此,两处系统能够同时更 新,因此主、从服务镜像卷中的数据一致性得以保证。软件、硬件配置1、软件:NCR LifeKeeper 2.0 及 Recovery Kit2、硬件:服务器可以是任何INTEL基础上的平台,两台Server的型号、配置不必一致,只需硬件平台能保证NT运行NCR LifeKeeper with Exte nded Mirrori ng运行机制1、通讯路径“ Hear

23、tbeat是服务器间发出的周期性检测信息,它允许NCRLifekeeper For Windows NT决定服务器的状态。当一个服务器向另一 处服务器发送一个“ Heartbeat消息,并且在规定时间段里没有得到任何回应时,发送消息的服务器开始评测接收消息的服务器是否正在发生故障。多种“ Heartbeat检测信号保证故障检测的可靠性,以 防止不必要的资源服务切换。NCR LifeKeeper For Windows NT为NCR扩展镜像提供下列途径上的“ Heartbeat通信:(1) Socket (TCP/IP )(2) RS-232 TTY 通信端口( Communications p

24、ort )NCR扩展镜像软件消除了共享SCSI的需要。2、主服务器发生故障客户向NT Server1上运行的一个程序发送一个请求,而NTServer1出现写错误时,使用带有NCR扩展镜像功能的NCRLifekeeper For Windows NT能够检测出系统失败。然后,NCRLifeKeeper For Windows NT 执行恢复规则,试图关闭 NT Server1上 的应用,并且在NT Server2上重新启动它们。NT Server2现在承担主 服务器的角色,镜像卷地址从 NT Server1转移到NT Server2上去, 这个转换过程对用户来说是透明的,客户一般不会发现系统曾经

25、发生 这样的故障。一旦系统发生的故障被被纠正过来,管理员必须重新同步镜像 卷。重新同步这些卷并被锁定,目的是不接受任何客户的存取。在这 个过程中,非镜像应用不会受到影响,因此这些应用可以毫无干扰的 继续运行。系统管理员可以选择何时对镜像卷进行同步,通过提供选择时间的灵活性达到对整个系统的影响减为最小。重新同步主服务器和从服务器上镜像的时间依赖于卷的大小。 一般情况下,在100MB以太网上, 恢复1Gigabyte(GB)的数据只 需要10分钟。3、从服务器发生故障当从系统发生故障时,受影响的镜像卷标志为Broken。有必要纠 正这些故障,并重新同步有关的卷。当从系统发生故障时,任何写请 求不会

26、送给从系统。当从服务器发生故障后再次恢复时,扩展镜像管理器用来重新同步主镜像卷和从镜像卷工作方式1、Active/Sta ndbyLifeKeeper WithExtended Mirroring应用系统Windows NT Server硬件平台ActiveSta ndbyLifeKeeper WithExtended Mirroring应用系统Windows NT Server硬件平台Activ2、 Active/ActiveActivLifeKeeper WithExtended Mirroring应用系统Windows NT Server硬件平台AppB=(AppA镜像盘去 appaRS

27、232 串口血ppBHeartbeat ConnectionsTCP/IPLifeKeeper WithExtended Mirroring 应用系统Windows NT Server硬件平台LifeKeeper With Extended Mirroring 具有以上两种工作方 式,可支持两个NT Server系统。三、LifeKeeper For Windows NT 2000年问题安全测试报告及测试步骤目的和范围本文件涉及的产品是 NCR公司的LifeKeeper。LifeKeeper (2.0) 是一个为 Windows NT 4.0和MP-RAS3.02系统提供高可用性的软件 工具。

28、LifeKeeper能够为系统资源(例如应用程序、数据库、IP地址 等)提供成熟的恢复和切换能力。本文件的目的在于为NCR的客户提供有关信息,以帮助他们有 效地制订2000年问题的计划。本文件应在 NCR销售和专业服务人 员的协助和指导下使用。有关2000年问题的其它信息以及NCR的相关解决方案可以在 NCR200(年站点上找到,NCR200年占点网址为 http: 为解决客户的2000年问题,NCR提供了一整套服务项目,其中 包括项目管理、详细目录、项目评估、项目策划、转换、测试、实施 以及应用程序软件开发。要获取详细信息,请访问NCR2000年服务站点或与您的NCR销售商联系。NCR200

29、0年服务站点是http : www.ncr .com/year 2000/y2k-serv.htm.本文件内容仅作提供信息之用,如有改变不再另行通知,而且本 文件不影响NCR的产品规范或保证。本文件信息的提供基于以下前 提-(即使NCR得知使用的信息具有造成损害的可能性,由于使用本信息造成间接、直接、特殊以及由此而生的其他损害,NCR也概不负责。)资格声明LifeKeeper 2.0版本已经解决了 2000问题,所有由NCR销售和 支持的LifeKeeper2.0版本的恢复工具软件包也都已经解决了 2000年 问题。然而,安装已解决2000年问题的LifeKeeper版本并不能保证系 统也能够

30、正确处理2000年问题。对系统进行进一步的升级和综合测 试是必要的。如欲获取详细信息,请查询这方面的相关产品信息。对 以下项目应当加以重视并进行测试。对于本地开发的应用程序,应当仔细检查其影响。对于第三方或合作方设计的产品,应当仔细检查其影响。 对于系统备份以及备份和恢复工具,应当对其进行彻底检测。 将系统固件升级到适应2000年问题的版本。相关产品LifeKeeper NT ( 2.0)版本要求 Windows NT 4.0,同时要求 TCP/IP协议,有关 Windows NT 4.0和TCP/IP协议的详细信 息,请查询相应的产品信息资料。LifeKeeper MP-RAS( 2.0)版

31、本要求 MP-RAS 3.02,同时要求 TCP/IP协议。有关UNIX MP-RAS和TCP/IP协议的详细信息, 请查询相应的产品信息资料。服务器的固件版本必须能够解决 2000年问题。有关固件版本 的详细信息,请查询 PC产品信息资料或服务器产品信息资 料。其他注意事项第三方或本地开发的应用软件必须能够解决2000年问题。为解决客户的2000年问题,NCR提供了一整套服务项目,其中 包括项目管理、详细目录、项目评估、项目策划、转换、测试、实施 以及应用程序软件开发。要获得详细信息,请访问NCR 2000年服务站点或与你的NCR销售商联系。NCR 2000年服务站点是 http:/www

32、.n 2000/y2k-serv.htm四、LifeKeeper与同类产品的性能评测比较1、LifeKeeper 与 Microsoft Windows NT Cluster 的比较特征/功能LifeKeeperNT Cluster软件工作环境LifeKeeper微软独有的软件环境否是NT和UNIX解决方案共用相同的集群结构是否必须使用NT及SQL Server企业版否是NT4.0server and Workstati on是否硬件工作环境双节点集群台匕 冃匕能支持多节点集群台匕 冃匕否支持共享SCSI环境(磁盘阵列柜)台匕 冃匕能支持非共享SCSI工作环境(扩展镜像)台匕 冃匕否应用保护

33、SQL Server、MS Exchange台匕 冃匕能保护 Sybase Oracle、Informix、SAP、Notes Excha nge等数据库和群件台匕 冃匕否集群特征Active/Active (相互备援)台匕 冃匕否保护NTFS文件系统台匕 冃匕能保护FAT、HPFS文件系统台匕 冃匕否多条局域心跳通信路径台匕 冃匕能并行应用恢复台匕 冃匕能自动回切台匕 冃匕否2、LifeKeeper 与 Vinca Co-Standby Server 的比较LifeKeeperCo-Sta ndby容错方式及容错 级别支持共享磁盘阵列和扩展镜像两种方式 且Lifekeeper真正实现了用户硬

34、件或软 件发生故障时,系统级别、应用级别上的 在线热切换。仅支持扩展镜像方式,除实现硬盘 镜像功能外,在用户的应用网卡、 操作系统、数据库发生故障时,并 不能实现切换。镜像方式对磁盘逻辑分区镜像对物理磁盘镜像切换机制的周全 程度处于LifeKeeper保护下的资源失效(包括 通讯链路线)时实施切换通讯路径全部失效时实施切换占用系统资 源程度LifeKeeper占用系统资源极少,且不打扰 任何具体应用系统的任何操作。对系统资源占用比较大当主服务器修复 后,资源回切复 杂性及可操作性主服务器修复后,资源回切操作十分简 单,可以设置为自动回切或由管理员决定 资源回切的时间。主服务器修复后,资源回切操

35、作比 较复杂而且必须由管理员决定资 源回切时间。对 SQL Server的支持能实现对 SQL Server的镜像,当 SQLServer失效时,进行切换能实现对SQL Server的镜像,但 当SQL Server单独失效时,不能 进行切换对其它数据库管 理系统的支持支持 Oracle、Sybase、Informix、 SAP不支持 Oracle、Sybase、Informix对电子邮件(或群 件)的支持支持 Exchange server、Lotus Notes不支持 Exchange server、Notes通讯路径Socket , Serial Port , Shared DiskSo

36、cket对 NT Server 安装类型的要求主域控制器、备份域控制器、独立服务器 三种类型之中任何一种均可以。必须为主域控制器、备份域控制 器。3、LifeKeeper 与 Fulltime Software 公司 Octopus 的比较LifeKeeperOctopus容错方式支持共享磁盘阵列和扩展镜像两 种方式仅支持扩展镜像方式切换机制的周全程 度支持用不同介质或网络连接建立 多条心跳检测路径,避免由于通 讯路径失效造成LifeKeeper保护 下的资源误切换。不能支持用不同介质或网络连接 建立多条心跳检测路径,容易造成 通讯路径失效时 LifeKeeper误切 换。占用系统资源程度Li

37、feKeeper占用系统资源极少, 且不打扰任何具体应用系统的任 何操作。对系统资源占用比较大当主服务器修复后, 资源回切复杂性及 可操作性主服务器修复后,资源回切操作 十分简单,可以设置为自动回切 或由管理员决定资源回切的时 间。主服务器修复后,资源回切需要七 个步骤,操作相当复杂。支持的 Application支持 SQL Server、Oracle、Sybase Informix、Exchange、Lotus Notes、SAP不支持 Oracle、Sybase Informix、 Lotus Notes、SAP。工作方式既支持 Active/Standby也支持 Active/Acti

38、ve 方式,即主机、备 份机可以运行不同的应用,实现 主从双机互相热备份。仅支持 Active/Standby方式,即主 机、备份机无法做到运行不同的应 用,做到互相备份。国外评测(D.H.Brown公司)D.H.Brown Associates 公司Grace Church 街 222 号 纽约州,切斯特港(914) 937-4302 分机 272 电传:(914) 937-2485NT集群容错NC独占敖头Competitive Sta nding Of NT Clusteri ng Solutio ns摘要当大多数的NT集群商还在犹豫观望,而不是开发领先于微软公司的 Wolfpack标准时

39、,NCR公司则领先推出了用于NT的软件LifeKeeper,从而获得了提供高可用性 NT集群解决方案的技术领先 地位。但是随着微软公司及其它 NT服务供应商提出标准的NT集群, NCR面临着LifeKeeper与微软公司 Wolfpack标准相协调的问题。 诚然,尽管Digital公司无论在发展思路上还是在市场份额上都曾建 立过早期NT集群的领先地位,但现在也面临着同样的两难境地,Digital公司正计划修改其核心集群技术以适应微软件公司提出的 Wolfpack标准。Digital公司的顺从态度给它的竞争对手以巨大压力, 比如康柏公司,它为更大数量的 NT服务器提供集群功能。对 NT供 应商而

40、言,单纯通过产品开发领先于微软公司而不考虑兼容性是应努 力避免的。成功来自于持续快速的优化、高度的市场敏感性以及快速 的适应能力。供应商不应局限于狭小的市场,而应谋 求自身更快速的发展,除此之外别无选择。集群概览集群通过将多个服务器的处理能力和存储资源合入单一的虚拟系统,使得管理员可以提高服务器的可用性和处理能力。完全成熟的集群解决方案可以带来以下好处:高度可用性:如果某个服务器由于硬件或软件失败而导致崩溃, 一个或多个服务器可以予以接管,以保证处理过程的继续,有 时,集群也可以对某些单独组件,如磁盘或适配器,或是单独的 应用程序的失败作出反应。通过隔离失败节点的错误,其它节 点可以继续运行,

41、保证整个集群系统的功能。扩展性:如果某一系统虽然处理能力有所下降,处理的能力, 包括性能和存储将被耗尽,可以通过在系统中增加额外的节点 来予以补充。为了扩展一个节点,应用软件应与集群软件协同 工作以平衡集群系统中各服务器的工作负载。例如,数据服务 器可以并行工作在多个节点上,同时从共享磁盘中获取数据。可管理性:通过管理因失败而导致的计划外停机以及计划内停 机,系统集群可协助完成某些管理任务。比如说,集群允许在 工作系统中对新的软件或硬件进行测试并保护相应的失败。功能回顾现在,我们从三个功能领域对Digital公司的Clusters forWin dows NT, NCR 公司的 LifeKee

42、per for Win dows NT,Tan dem 公司 的 Cluster Availability Solution,以及(CAS),和 Veritas 公司的 FirstWabch on Data General 进行评估。硬件体系结构:包括与某一特定的 NT集群解决方案相关的硬件 特点和作用。完备的服务:包括系统集群商事先提供的内容完备的一揽子服务,以及可供用户根据自身服务内容进行选择的服务。集群操作和管理:包括安装、配置和操作 NT集群的工具和机制。NCR公司的LifeKeeper for NT在集群硬件特点上较竞争对手占 有明显优势。在上述集群中,只有LifeKeeper支持超

43、过两个节点的集 群,这一优势有助于在失败时减少处理性能的下降。而且,只有NCR可以访问所有的共享存储库。除了支持简单的共享SCSI配置对于保护应用的最基本的技术,NCR还提供了连接RAID子系统以增加其 可靠性,和远程镜像选择生成灾难恢复配置。最后, Life Keeper支 持广泛的心跳介质和网络适配器类型。完备的服务除了 FirstWatch on Data General的现有版本以外,上述所有的解 决方案均通过远程文件系统提供完备的服务。除了 Digital的Clusters for NT以外,所有产品都为检测,用户应用程序的失败提供有效的工 具,这些都领先于微软的 Wolfpack标

44、准。LifeKeeper for NT在提供完备的服务方面保持着强大的优势,LifeKeeper提供了最广泛的全方位选择应用程序“工具套件”,比如为集群中应用程序失败重启提供预包装恢复解决方案。应特别指出的是,LifeKeeper也支持NT中所有文件系统类型的目录恢复,这是 一个不小的优点。Tan dem CASWith Data Generax| x| x| x| x| *| 覽 I x|Very Poor Poor WeakOkGood Very GoodExcelle ntLifeKeeper在操作和管理便利性上保持优势,但竞争对手在缩小这方面的差距。上述所有解决方案都通过GUI提供了基本的单一系统图象,以维护影响集群中所有节点的参数,而且全部解决方案都支持联机切换集群配置。更进一步,所有方案都可设置诸如心跳检测频 率这样的关键参数,这有助于防止错误。LifeKeeper独有的对多机集群所提供的支持,为定义失败切换和 自恢复规则,保证双节点冗余,以及均衡分流失效节点工作负载到可 用节点的能力和减少失败时的性能降低提供了最大的灵活性。在LifeKeeper的发展过程中,NCR与许多国际大公司结成合作 伙伴。今天,LifeKeeper已经在全球众多大型企业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论