




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HA核心概念--
FDM角色与职责版权说明本文档来自百度文库:/view/adaa3ddc50e2524de5187ebe.html。若作者对本资料的使用持有异议,请及时与本网站联系,我们将第一时间妥善处理。
一、vSphereHAandFT减少了服务中断时间,而不需要传统高可用解决方案的成本和复杂性vSphereHA提供服务中断后的快速恢复能力vSphereFaultTolerance提供持续的可服务性Downtime
CoverageApplicationGuestOSVM FaultToleranceHardwarenoneminutes高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)3二、vSphere
HA
简介vSphere
HA
在5.0中全面重写,包括•
简化HA集群的设置与管理•
为更大的规模和功能提供基础•
提高了HA健壮性和troubleshoot的能力HA的新架构
•
二个关键概念•
概述主机故障响应高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)4三、HA架构
•
称为
FaultDomainManager(FDM)•
在Host上提供所有的HA相关功能新的
vSphere
HA代理和旧的HA
Aagent类似的是:•vCenterServer(VC)用来配置和管理集群•
发生Failover的切换操作是独立于VC•
FDMs默认仍然通过主机管理网络进行通信vCenter
Server
(VC)高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)5三、FDM
Master集群中一台
FDM
被选举称为master
•
一般来说,一个cluster仅有一个master
•
其他的FDM被指定为slaves任何一台FDM都可以被选举为master•
不再有primary/secondary的概念•
通过选举选择masterMasterFDM职责•
监控整个cluster中主机/VM的可用性•负责主机/VM失效后的VM重启•向VC报告cluster的状态和failover信息•
维护cluster的持久状态信息高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)6四、FDM
SlaveSlave
FDM
职责
将关键的状态变化信息转发给Master
根据Master的指示重启VM
如果Master失效,参与新的master的选举每个FDM通用职责
(master
or
slave)•
监控本地主机和VM的状态•实现VM/应用的监控特性ESX
3ESX
4
ESX
1ESX
2高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)7五、Master选举机制Master选举时机:
vSphereHA
被启动时
•
Master’s
主机失效
•在Master主机上HA被重新配置
•进行管理网络分区时
如果发生多个Master的情况,除了保留一个
master之外的所有主机要进行退出master状态的
操作
Master选举算法
•选举时间为15到25秒
•选举Master的依据主要为主机挂载的Datastore的
数量(数据相等时通过HostID)10ESX
3ESX
4
ESX
1ESX
2高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)8六、FDM代理通讯FDM代理之间的通讯是通过:•管理网络•Datastores当管理网络不可用时通过Datastore进行通讯
•当主机被隔离时使用Datastore进行FDM通讯网络通讯•所有通讯为点对点的通讯•通过UDP进行选举•所有的Master-Slave之间的通讯通过SSL进行加密高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)9七、使用Datastore进行通讯解决的问题
SlaveMaster主机是否对我的VM负责?
Masterslave被隔离了吗?虚拟机是否还在运行?高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)10七、使用Datastore进行通讯解决的问题
Masterslave被隔离了吗?虚拟机是否还在运行?
SlaveMaster主机是否对我的VM负责?cDatastores
Used由VC选择Datastores,叫做HeartbeatDatastoresDatastores包含了VM的配置文件高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)11八、Heartbeat
Datastores
为每个主机,VC
选择(默认)
两个Datastore
管理员可以覆盖默认选择并设定首选项•
通过cluster“编辑设置”对话框进行设置高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)12主机被声明为“Dead”
Master
声明一台主机为Dead的时机:•Master无法通过管理网络和该主机进行通信
•主机无法连接到Master•主机无法响应ICMPpings
•Master无法观察到该主机的存储心跳
结果:
•Master尝试重启该主机上所有VM
•在网络可达的其他Host上或者Master本身重启其VM九、网络、主机失败响应高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)13 主机被网络分区
Master声明一台主机为网络分区的时机:
•Master无法通过网络和该主机通信
•Master可以检测到其存储心跳结果:
•每个网络分区会选举一个Master
•在网络隔离的情况下,VC只会和一个Master通信
•任意一个VM只能被一个Master管理
•在其他分区中的VM
将会:
•通过heartbeat
datastores进行监控
•一旦失效将会在所在的分区中重启VM
•当网络分区解决后,仅仅保留一个master,其他master退出九、网络、主机失败响应高可用与容错技术深度解析(源自:VMware公司文档—刘承罡)14主机发生网络隔离主机发生网络隔离时机:
无法看到
vSphereHA网络通信
无法ping通隔离地址
结果:
主机进入隔离响应
•检查是否有master控制一个VM
•如果VM被master控制或者
datastore
不可访问,则应用
隔离响应
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代网络安全防护策略试题及答案
- 如何在工作中体现礼仪素养试题及答案
- 2025年铬氧化铝陶瓷材料项目合作计划书
- 网络测试与评估工具试题及答案
- 离子预嵌入锰氧化物的制备及其储能性能研究
- 清末民初四川地区的民俗演剧研究
- 2025年初二下历史知识点总结模版
- 部编版五年级下册知识点总结五年级下册知识点总结
- 亚高山灌丛地带SPAC系统中不同水体稳定同位素差异及其受降水的影响研究
- 医务科季度工作总结模版
- 【苏州工学院智能建造研究院】2025中国低空经济产业链全面解析报告
- 浙江省义乌市宾王中学教育集团2024-2025学年九年级3月作业检测道德与法治试题(原卷版+解析版)
- 2025年甘肃省兰州市政建设集团有限责任公司招聘笔试参考题库附带答案详解
- 2025世界防治结核病日主题宣传教育课件
- 2025年驾照理论测试题及答案
- 物理-安徽省天一大联考2024-2025学年(下)2025届高三3月调研考试试题和答案
- 美容行业:美容师简历
- 2025年甘肃白银有色集团股份有限公司招聘笔试参考题库含答案解析
- 2025年上半年安徽明光市事业单位招聘笔试易考易错模拟试题(共500题)试卷后附参考答案
- 铁塔分部工程专业监理实施细则
- 2024-2025学年高二下学期《提高效率向时间要成果》主题班会课件
评论
0/150
提交评论