HA (高可用性)核心概念- FDM (容错域管理)角色与职责_第1页
HA (高可用性)核心概念- FDM (容错域管理)角色与职责_第2页
HA (高可用性)核心概念- FDM (容错域管理)角色与职责_第3页
HA (高可用性)核心概念- FDM (容错域管理)角色与职责_第4页
HA (高可用性)核心概念- FDM (容错域管理)角色与职责_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

HA核心概念--

FDM角色与职责版权说明本文档来自百度文库:/view/adaa3ddc50e2524de5187ebe.html。若作者对本资料的使用持有异议,请及时与本网站联系,我们将第一时间妥善处理。

一、vSphereHAandFT减少了服务中断时间,而不需要传统高可用解决方案的成本和复杂性vSphereHA提供服务中断后的快速恢复能力vSphereFaultTolerance提供持续的可服务性Downtime

CoverageApplicationGuestOSVM FaultToleranceHardwarenoneminutes高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)3二、vSphere

HA

简介vSphere

HA

在5.0中全面重写,包括•

简化HA集群的设置与管理•

为更大的规模和功能提供基础•

提高了HA健壮性和troubleshoot的能力HA的新架构

二个关键概念•

概述主机故障响应高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)4三、HA架构

称为

FaultDomainManager(FDM)•

在Host上提供所有的HA相关功能新的

vSphere

HA代理和旧的HA

Aagent类似的是:•vCenterServer(VC)用来配置和管理集群•

发生Failover的切换操作是独立于VC•

FDMs默认仍然通过主机管理网络进行通信vCenter

Server

(VC)高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)5三、FDM

Master集群中一台

FDM

被选举称为master

一般来说,一个cluster仅有一个master

其他的FDM被指定为slaves任何一台FDM都可以被选举为master•

不再有primary/secondary的概念•

通过选举选择masterMasterFDM职责•

监控整个cluster中主机/VM的可用性•负责主机/VM失效后的VM重启•向VC报告cluster的状态和failover信息•

维护cluster的持久状态信息高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)6四、FDM

SlaveSlave

FDM

职责

将关键的状态变化信息转发给Master

根据Master的指示重启VM

如果Master失效,参与新的master的选举每个FDM通用职责

(master

or

slave)•

监控本地主机和VM的状态•实现VM/应用的监控特性ESX

3ESX

4

ESX

1ESX

2高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)7五、Master选举机制Master选举时机:

vSphereHA

被启动时

Master’s

主机失效

•在Master主机上HA被重新配置

•进行管理网络分区时

如果发生多个Master的情况,除了保留一个

master之外的所有主机要进行退出master状态的

操作

Master选举算法

•选举时间为15到25秒

•选举Master的依据主要为主机挂载的Datastore的

数量(数据相等时通过HostID)10ESX

3ESX

4

ESX

1ESX

2高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)8六、FDM代理通讯FDM代理之间的通讯是通过:•管理网络•Datastores当管理网络不可用时通过Datastore进行通讯

•当主机被隔离时使用Datastore进行FDM通讯网络通讯•所有通讯为点对点的通讯•通过UDP进行选举•所有的Master-Slave之间的通讯通过SSL进行加密高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)9七、使用Datastore进行通讯解决的问题

SlaveMaster主机是否对我的VM负责?

Masterslave被隔离了吗?虚拟机是否还在运行?高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)10七、使用Datastore进行通讯解决的问题

Masterslave被隔离了吗?虚拟机是否还在运行?

SlaveMaster主机是否对我的VM负责?cDatastores

Used由VC选择Datastores,叫做HeartbeatDatastoresDatastores包含了VM的配置文件高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)11八、Heartbeat

Datastores

为每个主机,VC

选择(默认)

两个Datastore

管理员可以覆盖默认选择并设定首选项•

通过cluster“编辑设置”对话框进行设置高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)12主机被声明为“Dead”

Master

声明一台主机为Dead的时机:•Master无法通过管理网络和该主机进行通信

•主机无法连接到Master•主机无法响应ICMPpings

•Master无法观察到该主机的存储心跳

结果:

•Master尝试重启该主机上所有VM

•在网络可达的其他Host上或者Master本身重启其VM九、网络、主机失败响应高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)13 主机被网络分区

Master声明一台主机为网络分区的时机:

•Master无法通过网络和该主机通信

•Master可以检测到其存储心跳结果:

•每个网络分区会选举一个Master

•在网络隔离的情况下,VC只会和一个Master通信

•任意一个VM只能被一个Master管理

•在其他分区中的VM

将会:

•通过heartbeat

datastores进行监控

•一旦失效将会在所在的分区中重启VM

•当网络分区解决后,仅仅保留一个master,其他master退出九、网络、主机失败响应高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)14主机发生网络隔离主机发生网络隔离时机:

无法看到

vSphereHA网络通信

无法ping通隔离地址

结果:

主机进入隔离响应

•检查是否有master控制一个VM

•如果VM被master控制或者

datastore

不可访问,则应用

隔离响应

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论