




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文介绍Windows Server 2008故障转移群集的操作步骤,包括硬件、软件和网络基础结构的准备、安装、创建、配置等内容。一、准备故障转移群集必须满足硬件、软件和网络基础结构的某些要求,并且它需要一个具有适当域权限的管理帐户。具体如下:(一)故障转移群集的硬件要求在一个故障转移群集中,需要配备有以下硬件:(1)服务器:建议使用一组包含相同或相似组件的匹配计算机。注意,仅当所有硬件组件均标记为Certified for Windows Server 2008时,Microsoft 才支持故障转移群集解决方案。此外,完整配置(服务器、网络和存储)必须通过验证配置向导中的所有测试,该向导包含在故障转移群集管理单元中。(2) 网络适配器和电缆(用于网络通信):与故障转移群集解决方案中的其他组件一样,网络硬件必须被标记为针对 Windows Server 2008 进行了认证。如果使用 iSCSI,则必须将网络适配器专用于网络通信或 iSCSI,而不能同时用于两者。在将群集节点连接在一起的网络基础结构中,要避免具有单个故障点。实现这一点有多种方法。可以通过多个不同网络来连接群集节点。或者,您可以通过一个网络来连接群集节点,该网络由成组网络适配器、冗余交换机、冗余路由器或可消除单故障点的相似硬件组成。注:如果你是通过一个网络来连接群集节点,则该网络需满足验证配置向导中的冗余要求。但是,该向导中的报告将包含一条警告,指明网络不应具有单故障点。(3) 用于存储的设备控制器或相应适配器:- 对于串行连接 SCSI 或光纤通道:如果您在所有群集服务器中使用的是串行连接 SCSI 或光纤通道,则专用于群集存储设备的海量存储设备控制器应相同。它们还应使用相同的固件版本。注:通过 Windows Server 2008,您无法使用并行 SCSI 将存储连接到群集服务器。- 对于 iSCSI:如果你使用的是 iSCSI,则每台群集服务器必须具有一个或多个专用于群集存储设备的网络适配器或主机总线适配器。不能将用于 iSCSI 的网络用于网络通信。在所有群集服务器中,用来连接到 iSCSI 存储目标的网络适配器应相同,建议使用 Gigabit 以太网或更高速的以太网。对于 iSCSI 而言,不能使用成组网络适配器,因为它们不受 iSCSI 支持。- 存储:必须使用与 Windows Server 2008 兼容的共享存储。多数情况下,存储应包含在硬件级配置的多个独立磁盘 (LUN)。对于某些群集,使用一个磁盘作为见证磁盘。其他磁盘则包含群集服务或应用程序所需的文件。存储要求包括下列各项:- 若要使用故障转移群集中包含的本机磁盘支持,请使用基本磁盘,而不要使用动态磁盘。- 建议以 NTFS 格式对分区进行格式化(对于见证磁盘,分区必须为 NTFS 格式)。- 对于磁盘的分区形式,可以选择使用主启动记录 (MBR) 或使用 GUID 分区表 (GPT)。见证磁盘是群集存储中的一个磁盘,它被指定用于保存群集配置数据库的一个副本。只有在将见证磁盘指定为仲裁配置的一部分的情况下,故障转移群集才会具有见证磁盘。(二)故障转移群集的软件要求一个故障转移群集中的所有服务器必须运行相同版本的 Windows Server 2008。服务器可以运行以下任一版本的操作系统:- Windows Server 2008 Enterprise- Windows Server 2008 Datacenter- Windows Server 2008 Enterprise 的服务器核心安装- Windows Server 2008 Datacenter 的服务器核心安装另外,所有服务器必须运行相同硬件版本的操作系统(32 位、基于 x64 或基于 Itanium 体系结构)。例如,如果一台服务器运行的是基于 x64 版本的 Windows Server 2008 Enterprise,则故障转移群集中的所有服务器都必须运行该版本。所有服务器还应具有相同的软件更新(修补程序)和 Service Pack。(三)故障转移群集的网络基础结构和域帐户要求将需要以下故障转移群集的网络基础结构和拥有以下域权限的管理帐户:- 网络设置和 IP 地址:当针对网络使用相同的网络适配器时,还要在这些适配器上使用相同的通信设置(如速度、双工模式、流控制和媒体类型)。另外,还要比较网络适配器与它所连接的交换机之间的设置,并确保设置不发生冲突。如果所拥有的专用网络未路由到网络基础结构的其余部分,则确保每个此类专用网络都使用唯一的子网。这样做非常必要,即使为每个网络适配器分配了唯一的 IP 地址也是如此。例如,如果在使用一个物理网络的总部中拥有两个群集节点,在使用单独物理网络的分支机构中拥有另外两个节点,则不要同时为两个网络指定 10.0.0.0/24,即使为每个适配器分配了唯一的 IP 地址也是如此。- DNS:群集中的服务器必须使用域名系统 (DNS) 来进行名称解析。可以使用 DNS 动态更新协议。- 域角色:群集中的所有服务器必须处于相同的 Active Directory 域中。最好的做法是,所有的群集服务器应具有相同的域角色(成员服务器或域控制器)。建议的角色为成员服务器。- 域控制器:建议的群集服务器为成员服务器。如果它们是成员服务器,则其他服务器将是包含故障转移群集的域中的域控制器。- 客户端:对于客户端来说,除了连接和兼容性方面的明显要求外,没有特定要求:客户端必须能够连接到群集服务器,并且,它们必须运行与群集服务器提供的服务兼容的软件。- 用于管理群集的帐户:首次创建群集或者向群集中添加服务器时,必须使用对该群集中所有服务器具有管理员权限的帐户登录到域。该帐户无需是 Domain Admins 帐户 - 它可以是位于每个群集服务器上的 Administrators 组中的一个 Domain Users 帐户。另外,如果该帐户不是 Domain Admins 帐户,则必须为该帐户(或该帐户是其成员的组)委派域中的创建计算机对象权限。注:与 Windows Server 2003 相比,Windows Server 2008 中群集服务运行的方式发生了变化。在 Windows Server 2008 中,没有群集服务帐户。群集服务将在一个提供了服务所需的特定权限的特定上下文中自动运行(与本地系统上下文相似,但权限减少)。二、安装对于服务器集群的概念大家可能并不陌生,在Windows Server 2008中,它被赋予了新的名字:故障转移集群。一个群集就是一组协同工作以提高服务和应用程序可用性的独立计算机。多台群集服务器(称为节点)之间由物理电缆和软件连接。如果其中一个节点出现故障,另外一个节点就会通过称为故障转移的一个进程开始提供服务。在 Windows Server 2008 中,对故障转移群集进行改进的目的是为了简化群集,使它们更加安全,并增强群集稳定性。群集设置和管理更加容易。同故障转移群集与存储进行通信的方法获得改进一样,群集中的安全性和联网也得到了改进。需要注意的是,故障转移群集功能包含在 Windows Server 2008 Enterprise 和 Windows Server 2008 Datacenter 中。而 Windows Server 2008 Standard 或 Windows Web Server 2008 中则不具有这样的特性。安装故障转移群集功能以管理员身份登陆,可通过使用初始配置任务或服务器管理器中的添加功能命令安装故障转移群集。具体步骤如下:1. 如果最近已在服务器上安装 Windows Server 2008,并且已显示初始配置任务界面,则在自定义此服务器下单击添加功能。(跳到步骤 3。)2. 如果未显示初始配置任务,则通过服务器管理器来添加功能:- 如果服务器管理器已运行,则在功能摘要下单击添加功能。- 如果服务器管理器没有运行,则单击开始,单击管理工具,单击服务器管理器,然后,如果出现提示需要具有继续的权限,则单击继续。然后,在功能摘要下,单击添加功能。3. 在添加功能向导中,单击故障转移群集,然后单击安装。4. 向导结束时,将其关闭。5. 为要包括到群集的每台服务器重复该过程。至此,故障转移群集功能安装完毕,接下来即可进行故障转移集群的创建。三、创建当你的硬件环境完全满足故障转移集群的创建条件,并且已经完成了故障转移集群功能的添加。接下来即可进行故障转移集群的创建。创建新故障转移群集1. 确认已按下列主题所述连接了硬件并且验证了硬件配置:- 验证故障转移群集之前准备硬件- 验证新的或现有的故障转移群集。注:仅当完整配置(服务器、网络和存储)可以通过验证配置向导中的所有测试时,Microsoft 才支持故障转移群集解决方案。另外,解决方案中的所有硬件组件均必须标记为Certified for Windows Server 2008。2. 在故障转移群集管理管理单元中,确认已选定故障转移群集管理,然后在管理下面,单击创建群集。3. 按照向导中的说明指定:- 要在群集中包括的服务器。- 群集的名称。- 您的 DHCP 设置未自动提供的 IP 地址信息。4. 在向导运行并且摘要页出现时,如果要查看向导所执行任务的报告,请单击查看报告。若要在关闭向导后查看报告,请查看以下文件夹,其中 SystemRoot 是操作系统的位置(例如,C:Windows):SystemRootClusterReports小提示:要打开故障转移群集管理单元,请依次单击开始、管理工具,然后单击故障转移群集管理。 如果出现用户账户控制对话框,请确认所显示的是您想要执行的操作,然后单击继续。将服务器添加到故障转移群集1. 确认已经将网络和存储连接到要添加的服务器。2. 验证硬件配置,包括现有的群集节点和建议的新节点。重要:仅当完整配置(服务器、网络和存储)可以通过验证配置向导中的所有测试时,Microsoft 才支持故障转移群集解决方案。另外,解决方案中的所有硬件组件均必须标记为Certified for Windows Server 2008。3. 如果故障转移群集管理管理单元中没有显示要配置的群集,请右键单击控制台树中的故障转移群集管理,单击管理群集,然后选择或指定需要的群集。4. 选择群集,然后在操作窗格中,单击添加节点。5. 按照向导中的说明指定要添加到群集的服务器。6. 在向导运行并且摘要页出现时,如果要查看向导所执行任务的报告,请单击查看报告。四、仲裁配置故障转移群集中的仲裁配置确定群集允许的故障数。如果出现更多故障,则群集必须停止运行。仲裁的意义在出现网络问题时,仲裁可以干预群集节点之间的通信。一小组节点可能在网络的一个功能部分中间相互通信,但是无法与网络另一部分中不同的一组节点进行通信。这可能导致严重问题。在这种分隔情况下,至少有一组节点必须停止作为群集运行。为防止群集中的分隔所引起的问题,群集软件要求作为群集运行的任何节点集必须使用投票算法确定该节点集在指定时间是否有仲裁。由于指定群集包含特定的一组节点和一个特定的仲裁配置,群集将知道多少投票会构成多数(即,一次仲裁)。如果投票数低于多数,群集就停止运行。节点仍将侦听其他节点的存在,当另一个节点在网络上重新出现时,节点不会开始作为一个群集运行,直到重新获得仲裁。例如,在使用节点多数的五节点群集中,请考虑如果节点 1、2 和 3 可以相互通信,而不能与节点 4 和 5 通信,会发生什么情况。节点 1、2、3 构成多数,它们继续作为群集运行。节点 4 和 5 占少数,停止作为群集运行。如果节点 3 失去与其他节点的通信,则所有节点停止作为群集运行。但是,所有运行的节点都将继续侦听通信,以便在网络重新开始工作时,群集能够组成并开始运行。请注意,群集的整个功能不只是取决于仲裁,还取决于每个节点上用来支持故障转移到该节点的服务和应用程序的容量。例如,包含五个节点的群集在两个节点出现故障后仍然拥有仲裁,但是只有每个剩余的群集节点拥有足够容量来支持故障转移到它的服务和应用程序时,它才会继续服务客户端。(一)仲裁配置选项可以从四个可能的仲裁配置中选择:- 节点多数(推荐用于含有奇数个节点的群集)可以承受的故障节点数为节点数的一半(四舍五入)减去一。例如,七个节点的群集可以承受三个节点出现故障。- 节点和磁盘多数(推荐用于含有偶数个节点的群集)在见证磁盘保持联机时可以承受的故障节点数为节点数的一半(四舍五入)。例如,在见证磁盘联机时,六个节点的群集可以承受有三个节点出现故障。在见证磁盘脱机或出现故障时可以承受的故障节点数为节点数的一半(四舍五入)减去一。例如,见证磁盘有故障的六个节点的群集可以承受两 (3-1=2) 个节点故障。- 节点和文件共享多数(适合有特殊配置的群集)与节点和磁盘多数的工作方式类似,但是此群集使用见证文件共享,而不是见证磁盘。请注意,如果使用节点和文件共享多数,则至少必须有一个可用的群集节点包含群集配置的最新副本,然后才能启动群集。否则,您必须通过特定节点来强制启动群集。- 无多数:仅磁盘(不推荐)可以承受除一个节点外的所有节点出现故障(如果磁盘联机)但是,建议不使用此配置,因为磁盘可能成为单一故障点。二)仲裁配置图例如下图说明三种仲裁配置的工作方式。第四种配置只是用文字进行了描述,因为它与节点和磁盘多数配置插图类似。注:在插图中,对于仅磁盘之外的所有配置,注意大多数相关元素是否都在通信(与元数数量无关)。当它们在通信时,群集继续工作。当它们不再通信时,群集停止运行。(图1)节点多数仲裁配置,三个节点如前面的插图所示,在使用节点多数配置的群集中,在计算多数时仅统计节点。(图2)节点和磁盘多数仲裁配置,四个节点(加磁盘)如前面的插图所示,在使用节点和磁盘多数配置的群集中,在计算多数时统计节点和见证磁盘。节点和文件共享多数仲裁配置在使用节点和文件共享多数配置的群集中,在计算多数时统计节点和见证文件共享。这与前面插图中所示的节点和磁盘多数仲裁配置类似,只不过见证是群集中所有节点可以访问的文件共享,而不是群集存储中的磁盘。(图3)无多数(仅磁盘)仲裁配置,三个节点在使用仅磁盘配置的群集中,节点数不影响如何实现仲裁。磁盘就是仲裁。但是,如果失去与磁盘的通信,群集将变得不可用。(三)选择群集的仲裁选项1. 如果故障转移群集管理管理单元中没有显示要配置的群集,请右键单击控制台树中的故障转移群集管理,单击管理群集,然后选择或指定需要的群集。2. 在选定了群集时,在操作窗格中,单击更多操作,然后单击配置群集仲裁设置。3. 按照向导中的说明选择群集的仲裁配置。如果选择包括见证磁盘或见证文件共享的配置,请按照指定见证的说明进行操作。4. 在向导运行并且摘要页出现时,如果要查看向导所执行任务的报告,请单击查看报告。五、管理当创建了故障转移集群后,免不了要对其进行这样或那样的操作。因此,对其正确管理就显得异常重要。本文则重点分享有关故障转移集群的典型管理操作。(一)使群集服务或应用程序联机或脱机在维护或诊断过程中有时候会涉及故障转移群集中的服务或应用程序,您可能需要使该服务或应用程序联机或脱机。虽然群集服务会以有序方式处理该过程,使应用程序联机或脱机并不会触发故障转移。例如,如果特定的群集应用程序需要特定磁盘,群集服务将确保在应用程序启动之前该磁盘可用。具体步骤如下:A、使用 Windows 界面使群集服务或应用程序联机或脱机1. 在故障转移群集管理管理单元中,如果要管理的群集未显示,则在控制台树中,右键单击故障转移群集管理,再单击管理群集,然后选择或指定您需要的群集。2. 如果控制台树已折叠,则在要管理的群集下面展开控制台树。3. 在服务和应用程序下面,展开控制台树。4. 通过单击服务或应用程序,查看中心窗格中的状态列,检查您要使其联机或脱机的服务或应用程序的状态。5. 右键单击要使其联机或脱机的服务或应用程序。6. 单击相应的命令:使此服务或应用程序联机或使此服务或应用程序脱机。B、使用命令提示符窗口使群集服务或应用程序联机或脱机1. 若要打开命令提示符窗口,请单击开始,再右键单击命令提示符,然后单击以管理员身份运行或单击打开。2. 如果出现用户账户控制对话框,请确认所显示的是您想要执行的操作,然后单击继续。3. 通过键入下列命令检查群集服务和应用程序的状态:CLUSTER cluster-name GROUP /STATUS4. 键入以下命令之一:- 若要使群集服务或应用程序联机,请键入:CLUSTER cluster-name GROUP service-or-application name /ON:node-name /WAIT:timeout-seconds- 若要使群集服务或应用程序脱机,请键入:CLUSTER cluster-name GROUP service-or-application name /ON:node-name /WAIT:timeout-seconds(二)暂停或恢复故障转移群集中的节点在暂停一个节点时,现有组和资源可以保持联机,但是该节点上的其他组和资源不能联机。通常暂停一个节点是为了对该节点应用软件更新。如果需要在一个群集节点上执行广泛的诊断或维护,只是暂停该节点可能不行。在这种情况下,可以停止该节点上的群集服务。A、使用 Windows 界面暂停或恢复故障转移群集中的节点1. 在故障转移群集管理管理单元中,如果没有显示要进行管理的群集,则在控制台树中右键单击故障转移群集管理,再单击管理群集,然后选择或指定所需的群集。2. 如果控制台树已折叠,则在要管理的群集下将该树展开。3. 展开节点下的控制台树。4. 右键单击要暂停或恢复的节点,然后单击暂停或恢复。B、使用命令提示符窗口暂停或恢复故障转移群集中的节点1. 若要打开命令提示符窗口,请单击开始,再右键单击命令提示符,然后单击以管理员身份运行或单击打开。2. 如果出现用户账户控制对话框,请确认所显示的是您想要执行的操作,然后单击继续。3. 键入以下命令之一:- 若要暂停一个节点,请键入:CLUSTER cluster-name NODE node-name /PAUSE- 若要恢复一个节点,请键入:CLUSTER cluster-name NODE node-name /RESUME(三)启动或停止群集节点上的群集服务在某些疑难解答或维护操作过程中,可能需要停止和重新启动某个群集节点上的群集服务。当停止节点上的群集服务时,该节点上的服务或应用程序将发生故障转移,节点将在群集中停止运行,直到群集服务重新启动。如果要使某个特定节点正常运行以便支持它当前拥有的服务或应用程序,同时防止其他服务和应用程序故障转移到该节点,则请暂停该节点(不停止群集服务)。A、使用 Windows 界面启动或停止群集节点上的群集服务1. 在故障转移群集管理管理单元中,如果没有显示要进行管理的群集,则在控制台树中右键单击故障转移群集管理,再单击管理群集,然后选择或指定所需的群集。2. 如果控制台树已折叠,则在要管理的群集下将该树展开。3. 若要使对客户端造成的中断降到最低程度,请在停止节点上的群集服务之前,将当前由该节点拥有的应用程序移动到另一个节点。若要执行此操作,请在要管理的群集下展开控制台树,然后展开服务和应用程序。单击每个服务或应用程序,然后(在中心窗格中)查看当前所有者。如果所有者是您要停止群集服务的节点,则请右键单击相应的服务或应用程序,在单击将此服务或应用程序移动到另一个节点,然后选择节点。4. 展开节点下的控制台树。5. 右键单击要启动或停止的节点,然后单击更多操作。6. 单击相应的命令:- 若要启动服务,请单击启动群集服务。- 若要停止服务,请单击停止群集服务。B、使用命令提示符窗口来启动或停止群集节点上的群集服务1. 若要打开命令提示符窗口,请单击开始,再右键单击命令提示符,然后单击以管理员身份运行或单击打开。2. 如果出现用户账户控制对话框,请确认所显示的是您想要执行的操作,然后单击继续。3. 若要使对客户端造成的中断降到最低程度,请在停止节点上的群集服务之前查看群集服务和应用程序的状态,然后移动当前由需要停止群集服务的节点所拥有的服务和应用程序。执行此操作的步骤:1)键入:CLUSTER cluster-name GROUP /STATUS2)然后,针对要移动的每个服务或应用程序,键入:CLUSTER cluster-name GROUP service-or-application-name /MOVE:node-name如果移动称为群集组的组,请确保将名称放在引号内。3)若要确认已根据需要移动了服务和应用程序,请按向上键一次或多次,直到看见以下命令,然后按 Enter:CLUSTER cluster-name GROUP /STATUS4)键入以下形式的命令:- 若要启动节点上的群集服务,请键入:CLUSTER cluster-name NODE node-name /START /WAIT:timeout-seconds若要停止节点上的群集服务,请键入:CLUSTER cluster-name NODE node-name /STOP /WAIT:timeout-seconds (四)查看故障转移群集的事件和日志过故障转移群集管理管理单元查看事件,一次可以查看该群集中所有节点的事件,而不是一次只能查看一个节点的事件。在使用命令提示符窗口生成和查看日志时,您可以查看故障转移群集软件最近所采取操作系列的详细列表(跟踪)。A、使用 Windows 界面查看故障转移群集的事件和日志1. 在故障转移群集管理管理单元中,如果群集未显示,则在控制台树中右键单击故障转移群集管理,再单击管理群集,然后选择或指定所需的群集。2. 如果控制台树已折叠,则在要查看其事件的群集下展开控制台树。3. 在控制台树中,右键单击群集事件,然后单击查询。4. 在群集事件筛选对话框中,选择要显示的事件须满足的条件。若要返回到默认条件,请单击重置按钮。5. 单击确定。6. 若要对事件排序,请单击标题,例如级别或日期和时间。7. 若要查看特定事件,请单击事件,在事件详细信息窗格中查看详细信息。B、使用命令提示符窗口查看故障转移群集的详细日志1. 若要打开命令提示符窗口,请单击开始,再右键单击命令提示符,然后单击以管理员身份运行或单击打开。2. 如果出现用户账户控制对话框,请确认所显示的是您想要执行的操作,然后单击继续。3. 输入以下格式的命令:CLUSTER cluster-name LOG /GEN /COPY:pathname系统会生成每个节点的详细跟踪日志,并且复制到您指定的路径。4. 若要更改为日志所在的文件夹,请记下在上一步骤中指定的 pathname,输入以下格式的命令:CD pathname5. 键入:DIR6. 若要在记事本中查看日志,请找到该日志文件的名称,然后键入:NOTEPAD filename六、网络配置修改对于与故障转移群集中的服务器(节点)实际连接的每个网络,你都可以指定是否该网络由群集使用,如果由群集使用,该网络是仅由节点使用还是也由客户端使用。请注意,在这种情况下, 客户端不仅包含访问群集服务和应用程序的客户端计算机,而且包含用于管理群集的远程计算机。如果你为 iSCSI(存储设备)使用一个网络,则不要将它用于群集中的网络通信。修改故障转移群集的网络设置1. 如果故障转移群集管理管理单元中没有显示要配置的群集,请右键单击控制台树中的故障转移群集管理,单击管理群集,然后选择或指定需要的群集。2. 如果控制台树已折叠,则展开要配置的群集下面的树。3. 展开网络。4. 右键单击要为其修改设置的网络,然后单击属性。5. 如果需要,请更改网络的名称。6. 选择以下选项之一:- 允许群集使用此网络如选择此选项,并希望仅由节点(不是客户端)使用该网络,则清除允许客户端通过此网络进行连接。否则,请确保将其选中。- 不允许群集使用此网络如果你的网络仅用于 iSCSI(与存储设备进行通信)或仅用于备份,则选择此选项。(这些是选择此选项的最常见原因。)配置群集网络的选项选项 说明 允许群集使用此网络(专用网络)如果希望群集服务仅使用此网络进行跨节点通信,请仅选择此选项。客户端将无法使用此网络连接到 CMS。允许群集使用此网络并允许客户端通过此网络(混合网络)进行连接如果希望群集服务使用网络适配器进行群集节点间通信和与外部客户端的通信,则选中这两个选项。群集服务将使用此网络进行节点间通信,并且客户端将能够使用此网络连接到 CMS。不允许群集使用此网络(非托管网络)如果不希望在群集中使用网络或希望让群集服务管理网络,请仅选择此选项。这样,群集服务将无法使用此网络进行节点间通信,客户端也无法使用此网络连接到 CMS。附:将存储添加到故障转移群集步骤1. 如果故障转移群集管理管理单元中没有显示要配置的群集,请右键单击控制台树中的故障转移群集管理,单击管理群集,然后选择或指定需要的群集。2. 如果控制台树已折叠,则展开要配置的群集下面的树。3. 右键单击存储,然后单击添加磁盘。4. 选择要添加的磁盘。自从在 Windows NT 4.0 Enterprise Edition 中首次引入群集以来,用户就一直在抱怨它太难于设置,维护则更是难上加难。管理群集要求管理员不仅要了解群集本身,还需要精通存储技术以及群集服务与各种存储解决方案交互的方式。许多组织都难以获取用于启动和运行高可用性解决方案以及之后对其进行维护所需的所有技能。多年来群集一直在不断改进,但直到 Microsoft 开始研究 Windows Server 2008 时,仍有许多地方有待改进。明确这一点后,团队以简单为主要目标开始着手重新设计群集。在 Windows Server 2008 中,Microsoft 群集服务 (MSCS) 得到了完全的改观,并且现在改称为“故障转移群集”。这并不是说简单是新的“故障转移群集”带来的唯一改进。这些年来,由于许多组织都提供了有关他们希望在群集解决方案中看到哪些功能的有价值反馈,因此 Microsoft 积累了大量经验教训。新的“故障转移群集”功能可解决用户报告的许多首要问题,并且还加入了一些使其更具吸引力的激动人心的新功能。因此在本文中,我将向您介绍 Windows Server 2008 故障转移群集中包含的一些非常酷的新功能。新的管理界面安装“故障转移群集”之后,可在“管理工具”中或通过运行 Cluadmin.msc 访问“故障转移群集管理”界面。“故障转移群集管理”管理单元(类似于 Windows Server 2008 中的其他管理界面)是一个 Microsoft 管理控制台 (MMC) 3.0。对于群集老手来说,首次打开“故障转移群集管理”管理单元的感觉就像来到国外却没有带地图一样。新界面分为三个不同的窗格,如图 1 所示。左侧窗格列出了组织中的所有 Windows Server 2008 故障转移群集。中间的窗格提供了有关在左侧窗格中选择的群集配置部分的详细信息,而右侧窗格显示可执行的操作。图 1“故障转移群集管理”管理单元例如,在左侧窗格中选择 Storage。中间的窗格将随后显示群集中提供了哪些存储以及哪些存储(如果有)当前可用的详细信息。如图 1 所示,该群集包含支持见证磁盘的一块存储区、已为 File Server 置备的存储以及一些可用存储。右侧窗格列出了相关的操作,如添加更多存储。请注意,“故障转移群集管理”管理单元不能用于管理之前版本的“Microsoft 群集服务”。改进了配置过程配置“故障转移群集”变得非常简单。许多配置、重新配置和维护群集的操作都有向导。有了这些向导的帮助,管理员不必再担心资源是否已配置正确或者它们是否会以正确的顺序联机。图 2 显示了“高可用性向导”。在该特定示例中配置了一个 File Server。左侧显示了向导已指引管理员完成的步骤列表。此过程一旦完成,就会显示摘要页面并可查看报告。图 2 高可用性向导嵌入了验证过程在之前版本的 Windows Server 中,要成为受支持的群集解决方案,必须在“Windows Server 目录”中将硬件配置列为“群集解决方案”。它包括在“地理位置分散型”类别下单独列出的多站点群集。要列在该目录中,硬件供应商必须运行一组 Windows 硬件质量实验室 (WHQL) 测试并将结果提交给 Microsoft。这对于供应商来说成本很高,并且难以维护“Windows Server 目录”数据库。在 Windows Server 2008 中,“故障转移群集”包含一个内置的验证过程。该过程由分为四个大类别的一系列测试组成,如图 3 所示。图 3 故障转移群集验证测试类别您可以看到 Network 类别已展开以显示运行的测试;每个类别都包含一系列测试。Storage 类别也许是四个类别中最关键的一个类别,它包括用于确保存储解决方案符合 Windows Server 2008 故障转移群集提出的新要求的测试。具体地说,硬件供应商现在必须使用基于 Microsoft Storport 驱动程序的驱动程序,并且它们必须支持 SCSI-3 持久保留。此外,在使用多路径软件“设备专用模块”时,必须遵循“Microsoft 多路径输入输出”标准。由于并入了验证过程,支持模型发生了更改。所有硬件必须具备 Windows Server 2008 徽标,并且必须通过所有的验证测试。唯一例外的是包含两个单独且完全不同的储存柜(每个站点一个)的多站点群集,以及并未使用任何共享存储的 Exchange Server 2007 群集连续复制实现。新的仲裁模型Windows Server 2008 故障转移群集中的仲裁模型也发生了更改。在较老的系统中,当管理员听到“仲裁”这个词时,他可能想到的是包含群集配置和一些复制文件的某个共享磁盘。它是群集中的一个单点故障。如果仲裁磁盘出现故障,群集服务将终止并失去高可用性。Windows Server 2003 服务器群集提供了另一种仲裁类型,即“多数节点集”仲裁。此类仲裁类型通常是在多站点群集中实现,并且不需要共享存储。“多数节点集”仲裁由驻留在每个群集节点上的系统驱动器上的文件共享组成。通过服务器消息块 (SMB) 连接来连接到该仲裁类型。同样,为使群集能正常运行,必须有大多数节点的参与。引入 Exchange Server 2007 群集连续复制 (CCR) 之后,文件共享见证 (FSW) 功能也添加到了 Windows Server 2003 服务器群集中。它允许单个 Exchange 2007 CCR 群集节点(或任意多站点群集)继续提供服务,只要能够实现到大多数 FSW 的连接即可。在 Windows Server 2008 故障转移群集中,仲裁的概念现在才真正意味着达成共识。现在实现仲裁(或达成共识)的方式是拥有足够的投票才能开始使用群集。可通过多种方法获取足够的投票,具体取决于仲裁配置。在 Windows Server 2008 故障转移群集中共有四种仲裁模式,如图 4 所示。在列出的四种模式中,只有前两种(“多数节点”和“节点和磁盘多数”)可在创建群集过程中自动选择。应使用以下逻辑:如果在群集中配置的节点数目为奇数,则选择“多数节点”模式。如果在群集中配置的节点数目为偶数且共享存储已连接并可访问,则选择“节点和磁盘多数”。图 4 配置群集仲裁向导中的仲裁模式要从可用存储选择一个见证磁盘,可选择大小至少 500 MB 且配置了 NTFS 分区的首个磁盘。其余仲裁模式仅可通过运行“配置群集仲裁向导”来手动选择。“节点和文件共享多数”选项通常用在多站点群集配置或 Exchange 2007 CCR 群集中。最后一个选项“非多数:仅磁盘”模式等同于传统群集中的共享仲裁模式。它是一个单点故障,通常不应使用此选项。在群集中仅有两种见证资源(物理磁盘和文件共享)经过配置后能帮助达成共识。见证磁盘是群集服务可将其联机的一块存储区。该磁盘与群集“网络名称”及相关 IP 地址资源一同位于“群集核心资源组”中。配置了见证磁盘后,该磁盘上将出现一个 Cluster 文件夹并放置一个完整的群集配置副本(群集配置单元或副本)。FSW 是一个网络共享,在理想情况下位于不属于群集的网络服务器上。为 FSW 建立 SMB 连接,由 FSW 维护见证日志文件(它包含了群集配置的版本信息)的副本。一个群集中仅可配置一种见证资源。在群集实现仲裁时需要该资源提供一张额外的投票。换句话说,如果群集仅差一张选票(即一个节点)即可达成共识,那见证资源将联机以便实现仲裁。如果群集还差多张选票才可实现仲裁,则见证资源不会联机,且群集将继续保持休眠状态并等候其他群集结点的加入。增强了安全功能故障转移群集包含多个新的安全增强功能。其中最重要的也许是不再需要群集服务帐户 (CSA)。在之前版本的 Microsoft 群集服务中,在配置过程中需要用到域用户帐户。该帐户的目的是用于启动群集服务,因此需将它添加到每个群集节点上的本地管理员组中,并且向其提供必要的本地用户权限以便群集服务能正常运行。作为域用户帐户,CSA 需要遵守许多可应用到群集节点的域级别策略。这些策略可能会导致群集服务失败,对高可用性产生负面影响。现在,群集服务是以一个本地系统帐户的名义运行,该帐户对本地群集节点具备一组特定权限,能够正常运行。群集的安全上下文已转换成“群集名称对象”(CNO),该对象是首次创建群集时在 Active Directory 的“计算机”容器中默认创建的计算机对象。一旦成功创建群集且 Active Directory 中存在 CNO,就不再需要用于安装和配置群集的用户帐户。在 Active Directory 的“计算机”容器中创建的其他计算机对象与“故障转移群集”相关联。这些对象称为“虚拟计算机对象”(VCO),等同于在群集中作为客户端访问点 (CAP) 的一部分创建的群集“网络名称”资源。CNO 负责创建群集中的所有 VCO,它会被添加到 Active Directory 中对象的系统访问控制列表 (SACL) 中(请参阅图 5)。图 5 Active Directory 中 VCO 的安全性CNO 还负责同步它创建的所有 VCO 的域密码。将根据配置的密码轮换域策略完成此过程。此外,由于 CNO 负责创建与群集中的 VCO 相关联的所有计算机对象,因此 CNO(计算机帐户)必须具有域级别权限以便能够在创建 VCO 的容器(默认情况下为“计算机”容器)中创建计算机对象。另一项更改是 Kerberos 现在已成为默认的身份验证方法。由于 Active Directory 中存在计算机帐户,因而使得此项增强的安全功能成为可能。但是,如果某个应用程序虽然无法使用 Kerberos 来执行身份验证却需要访问群集资源,则群集可以使用 NT LAN Manager (NTLM) 身份验证。直接处理群集过程的群集节点间的通信也更加安全。所有群集内部的通信都会默认进行签名。可通过使用 cluster.exe 通用语言接口 (CLI) 来更改此群集属性,这样可加密节点之间的所有通信以提供更高级别的安全性。扩展了网络功能“故障转移群集”中的新网络功能使得高可用性和灾难恢复解决方案的设计更加灵活。同时,这些网络增强功能在群集中的节点间提供了更加可靠的连接。在单个网络中找到群集节点可能是客户最迫切需要的功能。现在已实现这项功能。群集网络驱动程序已彻底重新编写,因此只要每个节点都连接至少两个分别路由的单独网络,它就可以在群集中的节点间提供高度可靠且容错的通信。群集网络驱动程序根据群集启动过程中提供的连接信息构造自己的内部路由表。这包括本地连接信息以及在群集配置数据库(群集注册配置单元)中提供的信息。群集验证过程的一项内容是网络连接发现过程。在不同路由网络中找到群集节点的功能减轻了多站点群集的网络需求。因而使得组织部署它们时更加轻松且成本更低。它还使在“故障转移群集”中使用 iSCSI 存储成为更具吸引力的存储解决方案。群集节点还可通过 DHCP(动态主机配置协议)获取 IP 地址信息。如果网络管理员允许其环境中的服务器使用动态地址,则此功能可以减轻他们的负担。群集节点网络接口的配置决定了哪些网络使用静态或动态 IP 地址。尽管群集中的 IP 地址资源是从 DHCP 服务器获得的,也可以在“故障转移群集管理”管理单元中将其更改为静态 IP 地址。在过去,所有的群集通信都使用用户数据报协议 (UDP) 广播,或者有时使用多播。现在已停止使用多播功能,且群集通信转为使用 UDP 单播。(端口 3343 仍是 Microsoft 群集使用的公共端口。)许多网络管理员对于不再使用广播都感到非常高兴。但是,群集中真正的回报在于群集服务内部的新消息传递过程。(不过,该内容超出了本文的介绍范围。)即使将 UDP 用作传输机制,群集内部的通信现在也是更加可靠的 TCP 通信。增强了与存储交互时的可靠性“故障转移群集”与存储交互的方式发生了翻天覆地的变化。群集磁盘驱动程序 (clusdisk.sys) 已彻底重新编写,现在它才是真正的即插即用 (PnP) 驱动程序。而且它与存储交互的方式也已发生改变。在 Windows Server 2003 中,群集磁盘驱动程序位于一个直接存储路径中。但在 Windows Server 2008 中,群集磁盘驱动程序需要与分区管理器 (partmgr.sys) 驱动程序进行通信才能与存储实现交互。图 6 中展示了这两种方法。图 6 存储堆栈在 Windows Server 2008 中的变化分区管理器主要负责保护群集磁盘资源。首次映射到群集节点时,共享存储总线上的所有磁盘都会自动处于脱机状态。因此,即使是在创建群集之前,也可将存储同时映射到群集中的所有节点。不再需要一次一个地引导节点,在一个节点上准备磁盘然后关闭节点,再引导另一节点,检验磁盘配置等等。但仍然需要执行存储测试,该测试是群集验证过程的一个部分并且需要初始化磁盘。可在执行验证过程之前在群集的一个节点上完成该操作。一旦存储被添加到群集,磁盘将在“磁盘管理”界面中显示“保留”状态,并且会一直处于受保护状态。另一项更改与 SCSI 命令有关。在 Windows Server 2003 中,SCSI-2 ReserveRelease 命令与写入磁盘自身扇区中的群集磁盘驱动程序搭配使用。在 Windows Server 2008 中,必需使用 SCSI-3 PR (Persistent Reservation) 命令。群集节点必须先注册然后才能保留存储,并且群集节点需定期使用“注册保护协议”来保护其保留。验证过程中的其中一项存储测试将验证此功能。如果某个存储解决方案并不支持 SCSI-3 (PR) 命令,则“故障转移群集”也将不支持它。在连接到存储时,许多组织使用多路径软件来实现冗余。这种方法不但受到支持,甚至还推荐做为最佳实践。但是,必须使用“Microsoft 多路径输入输出”标准来重新编写第三方多路径软件解决方案(即设备专用模块),以便得到“故障转移群集”的支持。从而确保所有的 SCSI-3 PR 命令都同时沿所有路径发送到存储,无论路径是否处于活动状态。验证过程也会确认此功能。其他存储改进包括有所改进的检查磁盘 (chkdsk.exe) 过程、之前“群集服务器恢复实用程序”中的内置磁盘修复功能以及自修复磁盘。在“故障转移群集”中,确定群集磁盘资源时将同时用到磁盘签名和 LUN ID。如果任意一项发生更改,群集配置都会更新。正是由于物理磁盘资源上的属性更改提供了更好的高可用性,因而减少了错误。内置恢复过程之前提到的磁盘修复显然是一项内置恢复功能。还有一个是 Active Directory 修复功能。如果删除了代表 CNO 的计算机对象,您将无法再创建与群集 CAP 相关联的计算机对象。但是,您会遇到的第一个问题可能是高度可用的应用程序或用户由于无法获得安全令牌而无法访问群集外部的资源。从已删除的 CNO 恢复包括以下两个步骤。首先,必须让域管理员从 Active Directory 的 DeletedObjects 容器恢复已删除的计算机对象。然后,在还原并重新启用该对象之后,执行“故障转移群集管理”管理单元中的“修复 Active Directory 对象”过程。在 Windows Serve
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论