VMware云计算数据中心运维管理解决方案建议书V6.2_第1页
VMware云计算数据中心运维管理解决方案建议书V6.2_第2页
VMware云计算数据中心运维管理解决方案建议书V6.2_第3页
VMware云计算数据中心运维管理解决方案建议书V6.2_第4页
VMware云计算数据中心运维管理解决方案建议书V6.2_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 2VMware云计算数据中心运维管理解决方案概述 2.1概述82.2主要价值 2.3功能特性 2.4成功案例 2.5版本比较 3解决方案技术详解 3.1运维可见性与性能管理 3.1.1产品概览 3.1.2体系架构 3.1.3基本功能 3.1.4典型应用场景 3.2变更、配置与合规性管理 543.2.1产品概览 553.2.2主要价值 553.2.3功能特性 553.3性能监控、分析与告警 583.3.1产品概览 583.3.2功能特性 593.3.3典型功能举例 3.4应用依赖关系映射 3.4.1产品概览 3.4.2功能特性 3.4.3典型功能例举 4运维方法论与规划建议 4.1运维方法论 24.1.1容量管理 4.1.2性能管理 4.1.3事件与问题管理 4.1.4配置与合规性管理 4.2规划建议 4.2.1容量与性能管理规划 4.2.2配置与合规性管理规划 934.2.3性能监控与分析规划 954.2.4应用依赖关系映射规划 965方案优势总结 986配置清单与说明 996.1硬件配置 996.2软件配置 997专业咨询服务 7.1VMware专业服务介绍 7.2专业咨询服务内容 7.2.1VMwareAccelerate咨询服务 7.2.2技术咨询服务 7.2.3技术客户经理(TAM)服务 7.3专业服务实施流程 7.3.1评估 7.3.2规划与设计 7.3.4运维 8全球支持服务 8.1VMware支持的角色和职责 8.2全球技术支持服务 8.3.1社会支持 8.3.2其他资源 9.1认证体系与学习路径 9.2培训课程 310略语解释113不断增长的业务对IT部门的要求越来越高,因此,数据中心需要更为快速的提供所需要的能力。近些年来,虚拟化在市场中的采用呈现稳定一致的态势,虚拟化的比例越来越高。从虚拟化利用率的角度来讲,虚拟化的发展可以分为三个阶段:第一阶段为0-30%,第二阶段为最多70%,第三阶段则达到70%以上,如下图所I年目前,市场上的VMware虚拟化程度大约在65%以上,随着虚拟化比率的不断提高,客户也在不断扩大对虚拟化功能的运用范围,开始采用软件定义的存储以及网络与安全模式,从而逐步完全过渡到云计算数据中而这一转变使得IT部门能够转变运维方式,从本质上被动反应也就是往往需要竭力应付业务需求并面对日益积压的应用请求的部门,转变为主动创新的部门,将节约的IT资源重新投入到有助于实现关键的新应用、服务和计划。主动创新的部门更能与业务目标保持一致,并且对企业的发展、创新和竞争能力起着更为关键的作用OXXX客户作为国内大型企业,信息化建设不断发展,目前信息化网络以信息中心为运营维护单位,覆盖市场计费、生产经营等多套业务系统,服务器资源庞大。虽然该客户己经完成了对其数据中心的服务器虚拟化改造,但是,仅仅完成服务器的虚拟化已经远远不能满足各种业务对其数据中心的新需求了,因此尽快采用虚拟化环境下运维管理解决方案己成为必须。4器上运行着十四台虚拟机,负责承载人力资源、市场计费、生产经营、资产管理、网络管理、邮件、安全等业务系统,具体的虚拟机与业务系统的分布情况如下所示。物理服务器业务系统虚拟机视频服务器Production_VM01PowerEdge2950ProductionVM02XeonE5410*2/4GB生产经营管理系统Production_VM03Production_VM04移动站业务管理系统Production_VM05PowerEdge2950Production_VM06XeonE5410*2/4GBProduction_VM07Production_VM08Production_VM09PowerEdge2950XeonE5410*2/4GBProduction_VM10人力资源系统Production_VM11任务管理系统Production_VMl2PowerEdge2950XeonE5410*2/4GB库存管理系统Production_VM13身份认证系统Production_VM14虽然XXX客户数据中心的服务器虚拟化建设已经取得了阶段性进展,但是伴随着虚拟化进程的推进,传统运维管理方式已经不能满足虚拟化环境对运维管理的新需求,现有的这些运维方法在虚拟化环境下存在现有的传统管理工具和方法是为了支持孤立的计算环境而设计的,因此IT团队面临着如何利用传统管理工具和方法有效地支持新的动态IT基础设施(虚拟化环境)的挑战第一,虚拟化环境中有大量的数据需要管理,相对于物理环境而言,管理员可管理的虚拟机数量要多出达510倍,服务器和变更的数量也明显增多。这些都使得IT专业人员在尝试部署新的虚拟化管理计划时要面对重重困难。同时,环境中的伪警报数量大幅度增加,使得客户非常难以应对其环境所面临的挑战和性能问题。现有的运5超额配置图:当前传统运维管理方式的不足相互指责第二,对于虚拟化平台的管理员而言,工作中遇到的问题大多是性能方面的问题,处理性能问题所花费的精力大约占到全部管理任务的80%,要迅速定位并解决性能问题,需要高效的工具来辅助,单纯地使用“红黄绿”三色交通灯的性能指示是无法迅速地解决这些性能问题的。因此,这就需要一种主动管理基础架构和应用利用硬件平台的处理能力,增加投资回报。另一方面,虚拟化的主要特征就是资源池化,资源整合以后,调配资源的灵活性大大提高,但同时也对性能和容量的管理带来了更大的挑战,如果不能有效地管理资源分配,则可能出现资源滥用,资源匮乏等情况。实际的生产环境中一个比较常见的问题就是容量“过度调配”和硬件利用率低下,它会损害组织最初在节约成本方面寻求的核心价值,同时它还会使组织无法实现最初部署虚拟化和云计算时所寻求的敏捷性。因此,这就需要推动更高的整合率,管理员需要随时保证业务增长对性能和容量的施,以及如何尽快恢复服务。为了解决这个问题,新的运维管理方法应该能够帮助管理员高效地定位问题的根源,它应该可以快速地缩小问题的范围,迅速定位问题所属的范畴,例如:计算,存储,网络等。6拴制与合规性下图显示的是在一项调查中,众多已经部署虚拟化的客户选出的他们在运维管理方面所面临的主要难题,拴制与合规性这项数据从另一方面展示了现有的传统运维管理方法在虚拟化环境下存在的主要问题。*M91.与■"图:虚拟化环境下运维管理的棘手问题通过上图可以看出,容量监控与规划,协同合作,性能问题定位与调优以及根本原因定位是客户在虚拟化环境下进行运维管理所面临的主要难题。由于.传统运维管理方法在虚拟化环境下存在上述诸多不足,因此,运维管理方面的新需求应运而生,这些需求可以从如下三个方面进行概括。缁短同时的平均ft?决时闻(MTTR).提淘堪地设施和应用的可见性.主动颈防间状.迅速斛决影响业务的间地湾低爽金成本和运金成本.捷富团队炊率和W彷珂用比率运堆效率运堆效率遵守仃策略和标准.运推合战慢消是用了.在各种资源和基础设施之间实施IT破路图:虚拟化环境对运维管理的新需求客户所追求的基本能力,因为这个能力直接关系着服务的质量。这意味着该方案不仅需要优化环境中的计算资源,同时也需要优化该环境中的人力资源。化相关的问题。对许多组织来说,他们以前就已经碰到过这个难题,但由「部署了新的虚拟环境,并VMware的云计算数据中心运维管理(vRealizeOperations)解决方案可以帮助客户很好地解和运维性能。除了可以解决上述这些在服务器虚拟化后会立即显现的运维管理问题外,从长远来看,尽早地采用VMware提供的运维管理方法也是大势所趋,越早采用,越早受益。可见,无论是对眼前问题的考虑,还是着眼于长远的效益,尽早使用VMware高效的运维管理方法都是一个必然的选择,而VMware的云计算数据中心运维管理解决方案是这一选择的最佳起点。722VMware云计算数据中心运维管理解决方案概述关联异常现象,并可识别出构成性能问题的根本原因。它提供的容量管理可优化资源使用率,基于策略的配置管理则可确保合规性并消除数量剧增和配置偏差问题。应用发现、依赖关系映射和成本计量功能为基础设施和运维团队带来了更高级别的应用感知和财务责任。vRealizeOperations使IT部门可以获得更好的可见性和可操作的智能信息,从而主动确保动♦自动化:根据Forrester的调查,凭借获得专利的自学式分析方法,该产品可实现比传统管理工具高得多的自动化程度,使工作效率提高近70%,资源消耗减少30%,还可带来更♦集成式:本产品采用集成式方法实现性能、容量和配置管理,以集成式套件的方式提供,它聚合了各种管理规程,并将不同基础设施和运维部门的团队统一成一体。从而能以尽可能高效率的方式确保服务质量。>体系架构vRealizeOperations的核心功能如下图所示:8云计算运营控制台云计算运营控制台向虚振融虢融图:运维管理产品体系架构第一个功能是环境状况的统一视图,该视图支持虚拟环境。这是组织的运维团队关注的主要功能,因为该功能可以提供有关环境状况的统一视图。想要获取一个有关虚拟云计算环境状态的统一视图,是很难做到的,而VMware提供了一个解决方案。其次,该方案还提供了一套全面的集成功能。在虚拟环境中,遗留给IT运维团队的问题是需要不同的运维团队管理网络资源、存储资源和计算资源。但在虚拟化环境中,所有这些资源一一具备,虚拟另外,就管理性能而言,该方案所采用的方法与该领域其他传统供应商所采用的方法颇为不同,它更加注重分析。VMware了解什么对环境而言是正常的并将该信息用于智能警报,而不是依赖会导致产生大量误报的某些传统阈值方法。此核心功能是该产品组合的核心组成部分,该产品组合能够提供大量的优势功能,与虚拟化和云计算数据中心管理领域的传统管理供应商和新供应商的功能有很大的差异。由于客户需要管理虚拟环境,而且管理的虚拟环境是基于物理环境构建的,并且他们需要通过云来进行管理。因此,该方案提供了一套异构功能,不仅能够解决物理和虚拟环境的问题,而且能够满足同时跨私有云和公有云或混合云管理的需求,这套功能对客户非常重要。最后,该方案还提供可延展性和开放式框架,以用于将该解决方案以及将其他解决方案集成到云计>vROps提升了vSphere的价值9如果只使用vSphere,用户可以节约28%的运维成本,如果在vSphere环境下使vRealizeEQ\*jc3\*hps37\o\al(\s\up22(么可),v)EQ\*jc3\*hps37\o\al(\s\up22(50%的运维成本,可见),ps提升了)EQ\*jc3\*hps39\o\al(\s\up23(vR),v)EQ\*jc3\*hps39\o\al(\s\up23(s),p)EQ\*jc3\*hps37\o\al(\s\up22(幅),r)EQ\*jc3\*hps37\o\al(\s\up22(提),e)EQ\*jc3\*hps39\o\al(\s\up23(升vS),的)EQ\*jc3\*hps39\o\al(\s\up23(pher),价)EQ\*jc3\*hps37\o\al(\s\up22(e的价值。),值)未使用使用使用vSphereVMwarevSphere和vROpsvROps可以帮助管理员提高70%的工作效率,降低30%的资源使用并减少约45%的在确保合规性在确保合规性方面投入的精力在价值实现时间(TimetoValue)方88%的客户在3个月内见到了成效“我们的环境中当前同时运行着超过2.0。。台计算机,我们利用vCenterOp。间iss来浜入、准确地了解这些计算机的使用情况。在部署OperationsManager三周之后,我们就已经对计算机的规模做出了大量决策和调整."AlexFreixas,MicroStrategy副总裁在虚拟化环境下,管理员需要管理的虚拟机的数量有了很大的增加,而vROps可以帮助管理员应对这一挑战。在使用vROps后,管理员可以管理的虚拟机数量增加了60%,同时,管理模式也从被动管理转变为主每个管理员管理的虚拟机数量VI管理员管理的虚拟机并且其管理模式也可从被动管理转变为图:管理员可管理的虚拟机数量大幅增加♦提高基础架构和应用可用性■将应用的停机时间减少36%-将故障诊断和解决问题的时间减少26%♦降低成本MS提高容量利用率MS■将vSphere容量利用率提高40%,将整合率提高37%vROps相对于单独使用vSphere所带来的运维成本收益,如下图所示。SEQ53U2-pWOd30:93U<S3Y(VA493U<S3Y(VA4OperationsManagemefitSuiteCapacityutilizationavailabilityLevelofautomationperformance^Incremental fromvCenterOperationsManagementSuke图:在^Sphere环境下部署vROps所带来的性加收益值,它拥有单独部署vSphere所无法比拟的优势。方面进行改变以适应新环境下运维管理的需求,本部分将阐述vROps是如何在这三大方面满足新的需求。运维成本来提高运维效率,通过将虚拟基础设施和物理基础设施以及操作系统的配置标准化来实现控制与合规性方面的要求,它可以有效地满足云计算数据中心在服务质量、运维效率以及合规性与控制等方面的新需求并缩短问题的平均解决时间(MTTR)■全面监控异构云计算环境的运行状况、风险和效率.从而场保满足SLA■基于动态阈值的智能警报彻底缩短了隔离和修爱问题的时间降低资金成本和运维成本■破少与性能故障摔除和正输配置环境相关的工作■通过自动化容量管理提高了较合率,迸而降低陵件采购成本■集成式基地设旅成本计量服务有助于管理和控制成本控制与合规性控制与合规性>服务质量■虚拟基础设施和多个操作系统的配置管理任务的自动化能等确保控制并降低运维成本■OOTB合规性楔极能券坳保遵守内部运维标准、行业安全最佳实践和法规要求VMware的vROps采用了自学式的性能分析方法,具有动态阈值和智能报警功能,监控和操作起来都非常简单。同时,该方案还可以轻松的通过第三方管理包进行扩展。现状多种览控工具械动式貂决问题管理孤岛自学式性能分析方法监控操作超缎简化动态蒯伯和智能警报可轻松通过第3方管理包遴行犷展展物减少了90%可耀的多达24个小时进行主动监测并疑免意外情况对每个团队使圉重一窗口支持虚拟云Q物理云.公有云和只他虚拟化管修岸序队都使用单一的窗口,无需新的监控工具,提高了生产系统的无需新的监拽工具提高了生产系统的可用径并延长了正偌运行时间vROps非常注重处理异构环境的运行状况、风险和效率,它在控制面板中提供这些组件的集成视图,这些做法可以缩短问题的平均解决时间进而保证服务质量。>运维效率Ops可以调整并回收超额配置的容量,规划和预测未来的需求。同时,自动化的工作流提高了修复速度。P2V不会优化虚设基地架构的系统配W域芝容■管理流程和技能需要提高自动化程度调储井问收超稳鬣富的容期刎和预测未来的需求自动化工作流提高了修复速度VI管理员可管理的虚股机敛■故W排除时间犍少了SO%vROps套件可以使每位VI管理员可管理的虚拟机数量增加60%,故障排除时间减少50%,同时还可以回收总的来讲,该方案能够迅速查明问题源头并提高运维效率,它能够迅速查明、隔离并解决问题,这有助于帮助客户降低运维开销。该套件还能处理容量的利用,可让客户完全了解容量利用情况,对其建模,并了解应>控制与合规性性。而VMware的vROps套件可以监控配置与合规性数据以及应用性能,同时对vSphere、物理云、公有云和其他虚拟化管理程序都有很好的支持。配置偏差是以控制监控配置与合规性效据以及应用性能在确保合规恒方面花费的时间腌少合坝性审核需要时间针对PCI、HIPAA.SOX等的。。自动配置和合设性管理日常操作无法维持合规性支持vSphere.物理云1公右云和其他虚拟化管理程序营控制台vROps能够满足控制力与合规性要求,它可以让客户将虚拟基础设施和物理基础设施以及操作系统的配置标准化,无论是出于运维目的还是出于遵守安全最佳实践或法规要求而将这些配置标准化。该套件可以进行自动配置以及合规性管理,它可以使管理员在确保合规性方面花费的时间减少45%o>智能运维深入了解基础架构和应用的运行状况、风险和效率,帮助确保服务质量并及早检测性能、容量和配置♦增强型应用监控通过VMwarevRealizeHyperic提供了针对关键业务应用(MicrosoftSQL、Exchange)的即时可用的控制面板。♦存储分析跨主机总线适配器、结构和阵列将拓扑、统计信息和事件视图聚集在一起,从而提供对存储基础架构的深入可见性。存储分析使用通用信息模型(CIM)、SIM-S和vStorageAPIsforStorageAwareness(V♦可白动分析监控数据,并以运行状况、风险和能效测量值来表示,使IT部门能更轻松地检测到环♦通过预构建的可配置运维控制面板,可以实时洞悉基础架构的行为、即将发生的问题以及效率提♦跨虚拟基础架构、操作系统和应用对变更事件与性能数据进行可视化关联有助于深入了解因配置♦灵活的组策略可以在组级别定义具体的阈值、警报类型、通知以及其他配置设置,以便确定关键业务应用和产品工作负载运维活动的优先级。100,000多个虚拟机。vRealizeOperations专为VMwarevSphere而设计,并针对云计算而构建,是用于管理动态VMware环境的最佳解决方案。与第三方监>基于策略的自动化使用咨询工具和编排工作流白动执行根本原因分析,以实现最佳资源利用率和运维效率,并强制实施♦基础架构和操作分析可通过自动执行的根本原因分析消除耗时的问题解决过程。♦切实可行的建议可简要说明底层问题和纠正措施以修复这些问题。♦自动触发工作流使管理员可以将在VMwarevRealizeOrchestrator中创建的工作流与vRealizeOperations警报关联在一起。有助于优化容量并推迟不必要的硬件投资。>统一管理全面了解性能、容量和配置问题以及基础架构和应用依赖关系背后的推动因素。使用跨混合云环境和♦Hyper-V和AmazonWeb服务监控控制面板可提供跨私有云、公有云和混合云的单一运维控制台。♦借助可延展性实现与现有监控工具的集成,从而跨混合云基础架构提供全面视图和主动管理功能,♦自学式性能分析方法和动态阈值可适应环境以简化运维管理并消除假警报。♦通过实时的集成式性能、容量和配置变更事件控制面板,可实现主动式管理方法,并帮助确保满足♦应用依赖关系发现和直观显示可帮助基础架构和运维团队了解应用级别的信息,确保所有关键应用♦即时可用的合规性模板可确保跨数据中心基础架构的各个方面对最佳安全实践、强化指导原则和法>丰富的管理包扩展丰富的管理包扩展可以实现vRealizeOperations的产品扩展以及与第三方集成的功能。管理包可进一步分成代理插件、内容包以及合规包,具体内容如下图所示。♦高级管理包:监控整个基础架构与操作系统♦企业级管理包:监控关键业务应用♦操作系统代理插件:与vRealizeHyperic一起部署,用来收集操作系统相关数据♦应用程序代理插件:与vRealizeHyperic一起部署,用来收集应用程序相关数据♦合规包:与vRealizeConfigurationManager一起部署,包含很多合规性模板♦内容包:提供日志数据源与分析上述这些管理包会在随后的章节详细阐述。本部分将介绍介绍三个成功部署vROps的案例:波音公司、野村证券和TUIInfoteco>减少警报管理员不再每天收到5001000个阈值警报,而只会收到50-100个vRealizeOperation警报,过去>故障排除速度更快管理员使用该产品对环境中的特定问题进行故障排除,与使用其他工具相比,这种工具能够帮助客户>提高容量利用率在部署vROps之前,超额配置情况的比例达到了92%,而vRealizeOperationsManager可以回2)野村证券>调整虚拟机通过使用vROps管理员很快发现,许多虚拟机在构建时使用的虚拟CPU/内存远远超出了工作负载所需的数量。接下来,管理员可以据此作出相应的容量调整。>假设情景借助虚拟环境变更前建模功能,管理员可以在进行任何可能给运维业务的应用带来风险的变更之前,对预测的性能和容量进行建模分析。>帮助实施数据中心战略vRealizeOperationsManager可以帮助客户提高虚拟主机与物理主机的比率,并保证相应的服务>提高可见性vRealizeOperationsManager将故障排除时间减少了50%,客户检测到了很多未曾留意的问题。>完整基础架构的整合视图通过提供的运行状况信息,客户可以提前发现存储和虚拟基础架构中可能会发生的问题。>更出色的容量规划借助vRealizeOperationsManager提供的趋势判断信息,’客户的容量规划速度提高了40%而主要特性和功能横向扩展平台运绘馍表盘、视图和报缶可自定义的馍表盘、视图和报告超级衡量指标策略管理灵活的运维策略和运维组基于角色的访问控削性能监控与分析智能.报根本原因分析和建议针对Linux、Windows阅Solaris等〈物理知虚拟)的掾作系统费源(CPU、顽盘、内存、网络)监控容量管理容量计量、趋势分析、适当调整规模和资源优化创建自定义数据中心保存顼目为模型更动分析调配于沼容■vREALIZEOPERATIONS产品版本StandardAdvanced*■******■.********适用于任何对象的资源监控、现更和优化*工作负畿均衡用于工作负戴技划和均衡的即时可用仪或查变更、配置和合规性管理vSphere强化vSQgre变更、配置和法规遵从性操作系统级别的变更、配置和朴丁程序管理操作系统级别的合规性管理包(PQ、HIPAA.SOX3?)*****Enterprise*■******■*■*■****vREALIZEOPERATIONSvREALIZEOPERATIONS主要特性和功能Standard产品版本AdvancedEnterprise应用依赖关系映射自动发现应用并直双显示关系•命名和版本管理CMPU理包(vRAxvRB、LI、vRO)••SDDC管理包(MPSD4XNSX、vCloudAiGMPND>混合云管理包(AWS、Hyper-V*OoenStack)*■针对基册簿构(网皓、存气、物理机务器)的第三方管理包〜**API基本API-出站数抠/警报抽取、警报定义/管理、用户管理等**•高级API-资源/数据添加、报告生成等•及用、中间件知数据库监控•应用(Microsoft.Oracle.Exchange等)的第三方管理包"•EPIC和Meditech管理包,OperationsManagervRealizeHyperic^vRealizeConfigurationManager和vRealizeInfrastructureNavigatorc在介绍完上述产品组件后,本方案建议书还将介绍运维方法论和每个产品的规划设计方案。3解决方案技术详解本部分将对vROps所包含的如下四个产品组件进行详细的介绍。♦vRealizeOperationsManager♦vRealizeHyperic♦vRealizeConfigurationManager♦vRealizeInfrastructureNavigator3.1运维可见性与性能管理3.1.1产品概览vRealizeOperationsManager从虚拟环境的每个级别的每个对象(从单个虚拟机和磁盘驱动器到整个群集和数据中)收集性能数据。它存储并分析这些数据,而且使用该分析提供关于虚拟环境中任意位置的问题或潜在问题的实时信息。vRealizeOperationsManager是整个套件的基础,它提供了获得全面可见性以及在动态虚拟环境和云计算环境中主动确保服务级别和管理容量所需的运维控制面板、性能分析和容量优化功能。vRealizeOperationsManager可以与现有VMware产品配合使用来添加以下功能。♦将关键衡量指标组合成环境运行状况和效率以及容量风险的单个评分♦计算每个衡量指标的正常行为范围,并突出显示异常。根据入站数据调整动态阈值,以便更好地定义衡量指标的正常值♦以图形表示整个虚拟环境或选定部分的当前和历史状况♦在虚拟环境层次结构中显示关于变动的信息,例如,将某个虚拟机移至其他ESXi主机后,管理员可查看这些变动如何影响所涉及对象的性能♦用于按照环境的结构定义“组”容器来组织受监控对象♦全面的可见性:获取关于基础架构和应用运行状况、风险和效率的全面视图和深入运维洞察信息♦主动管理性能:停止监控并开始主动管理基础架构和应用性能。自动化的根本原因分析和建议的修复操作可帮助用户发现并消除潜在瓶颈♦容量优化:发现容量不足和超额配置情况,以便合理调整虚拟机大小、回收闲置资源并放心提高整vRealizeOperationsManager的运维管理解决方案的管理界面可以显示虚拟基础设施的健康状态、风险和效率。此外,管理界面还可以显示当前虚拟基础架构中各节点(可以在vCenter级别,数据中心级别,集观地呈现负教的高低。对于主要的环境资源,包括CPU,内存,网络以及存储等,进行使用情况汇总。3.1.2体系架构vRealizeOperationsManager6.0之前版本的两台虚拟机Analytics虚拟机和UI虚拟机己经被一个单独的虚拟机替代,该虚拟机的结构如下图所示。♦用户接口:是一个Web应用程序,使用户和管理员可以通过图形界面的方式来完成相应的操作♦收集器:负责从企业的所有组件中收集相关数据♦控制器:对用户接口、收集器和分析器之间信息进行处理♦数据存储:每个节点都有其本地数据存储,数据存储层完成对其底层数据库的读写操作,其中:■GlobalxDB:存储所有对象的元数据■FileSystemDatabase:一个可扩展的针对监控数据形式设计的文件系统数据库,它存储收集到的衡量指标数据■xDB:存储对象、关联、事件、动态阈值和警告3.1.3基本功能vRealizeOperationsManager的基本功能。♦操作仪表板操作仪表板显示了虚拟基础设施的健康状态、风险和效率。vmwarevmwarevReaHzeOperation*Manager♦健康状况和工作负载视图快速识别异常、故障和受压的工作负教,它直接影响着基础设施的性能和健康状况。♦工作负载细节视图深入地分析影响虚拟机、主机、数据存储、集群的性能和健康状况。在终端用户受影响之前,图:工作负载细节视图tATW3小tATW3小aj.^料”下牛331*鹏MB—,VWVAOfOvRetiizeOperattontManaxr金里卫、时理纯,1-爆”牛;丁琳-黑^珠世”.金里卫、时理纯,1-爆”牛;丁琳-黑^珠世”.WaW黑盥gzai-.黑.K器w-黑.K器w-♦9<9W80nwraf♦UtlRfteHB♦4HFW5HB王,王,।4兑i.a.羯2a♦引导式修复和自动触发工作流获取针对性能、容量和配置问题的清楚的说明和建议的解决方案。将匚作流与智能警报相关联以在达到♦自动关联变更事件以检测性能影响针对运行状况恶化或性能下降的情况,可直观地追溯到基础架构和客户操作系统级别的特定配置变更。通过各个领域的基础设施,来识别资源的约束和瓶颈。♦容量趋势研究和分析通过性能趋势、前瞻性预测、扩展预测等方法,深入的了解当前和未来的资源需求、容量管理的使用和规♦大小合适的虚拟机回收未使用的资源,在没有性能影响的前提下优化整合率和虚拟机密度。持续确保vSphere强化虚拟和物理基础架构所有方面的合规性。详细的模板可参照数百个强化条件向管理员表明环境状况,以便可以快速追溯到不合规的领域并进行修复。♦用户和访问控制管理基于用户角色(例如VI管理员和存储管理员)进行授权,从而针对个人控制其对于对象、功能、操作和报值户.户Wit♦灵活的组策略和策略管理通过在组级别定义阈值、警报和配置设置来确定关键工作负载的优先级。要进行更高级的监控,可以为特定工作负载类型、应用或集群创建自定义策略。w干心”1干心”12s2s11GWtMKcm”*CM,2M4112S-3U**CM,2M4112S♦增强型DistributedResourceScheduler(DRS)集成vRealizeOperationsManager与vCenterDistributedResourceScheduler(DRS)的增强型集Manager可以确定跨集群布置机会,而vCenterDistributedResourceScheduler可确定集群内的最佳目的地。增强型集成使用所有DRS规则、限制和企业级功能。增强型DRS集成增强型DRS集成功能会生成再平衡计划,管理员通过执行该计划完成各种资源调配。再平衡计划依据智能策略生成,该策略主要考虑平衡度和整合度两个方面,如下所示。♦以避免容量瓶颈为目标进行分布■最大化可用容量为未来的项目需求-避免容量风险♦以尽可能节省硬件资源为目标■在保证性能的前提下,尽可能使用较少的服务器硬件资源-提高服务器密度,节省硬件资源投资▲e眠庄超机丁柞负我整合最大化智能平衡为了让vRealizeOperationsManager按照预定策略平衡环境中的工作负载,管理员可以为策略设置工作负载自就化BalanceWorkloads保守根极Aggressiveminimizescontentionbutmovesworkloadsmore,whichcancausedlsrupbonGoodformorestablepopulations.Conservativeexposespotentialcontention,butmovesworkloadsless.Goodformoredynamicpopulations.ConsolidateWorkloadsMoreconsoltdat>onwillputworkloadsintoasfewclustersaspossibletoreducelicensingandpowercosts,butallowstorlessresponsivecapacityGoodforpopulationswithsteadydemandLessconsolidationusesallavailableclusters,whichleavesmoreroomfordemandspikes,butcanrunuplicensingandpowercosts.Goodforpopulationswitherraticdemand.▼獭sx在平衡期间迁移时,按以下方式确定优糊:图:工作负载自动化选项平衡工作负载设置vRcalizcOperationsManager如何平衡平衡工作负载争用,但是迁移工作负载的次数较多,可能会导致中断。整合工作负载设置vRcalizcOperationsManager如何合并整合工作负载工作负载需求稳定时选择较多整合。这会将工作负载置于尽可能少的主机中,以减少许可和电力成本。但这可能会工作负载需求不稳定时时选择较少整合。Cutton这将使用所有可用主机,从而为需求高峰留出更多空间。Cutton但这可能会增加许可和电力本o设置vRcalizcOperationsManager针对工作负载首先移动哪类虚拟图:工作负载自动化选项释义工作负载利用率仪表板该仪表板可以让管理员对数据中心中所有工作负数的整体运行情况有一个直观的理解,如下图所示。vmwar图:工作负载利用率仪表板这个仪表板包含一个更新的“容量利用率”小组件,其名称为“当前对象利用率。它可以显示当前数据中心内各对象工作负载使用率的分布情况。该组件可确定未充分利用、使用过度以及在最佳容量级别上运行的未充分利用区域优化区域ClusterCompute过度使用区域O0maQWtujiMMMnt图:显示在“工作负载利用率”仪表板上的“容量利用率”小组件如上图所示,小组件从左到右表示资源竞争越来越激烈。针对每个对象,衡量指Owviiaec6-vl,uW标会计算出一个具体的用的容量以及在对象上限制容量资源的原因。要显示有关对象上的容量的分析详细信息以便可以对问题进行进一步的故障排除,用户需要单击详细信息。当有多个对象受影响时,相应的对象数会出现在利用率标签旁。例如下图中,集群对象图标会显示“1”以指示环境中使用过度的集群数。当指向集群对象图标时,集群摘要随即出现,其中包括集群名称、显示“分析”T“剩余容量”选项卡,以便可以对问题进行进一步故障排除°如下图所示。OptimalQOveiutdired。Pfoducliondwortdoad63%ConstranedBy:CPUDetailsQ过度使用集群过度使用集群管理员可以使用该仪表板确保所有对象都尽可能接近最佳使用情况,解决办法视对象类型而定。对于使用者对象,例如虚拟机,解决办法通常是适当调整对象大小以使其达到最佳使用情况。对于其他对象,例如集群,管理员可以确定是否必须添加容量或迁移现有工作负载以降低环境中的压力3.1.4典型应用场景性能监控与故障修复vRealizeOperationsManager6.0及其之后的版本相对于V6.0之前的版本在性能监控与故障修复方面有了很大的改进,之前的徽章告警方式只限一个症状,例如工作负载大于90时告警或者KPI指标。不给出解决问题的指导性建议。在vRealizeOperationsManager6.0及其之后的版本中,基于策略的告警将多个症状综合分析体现除此之外,新版本还提供了故障排错参考建议,用户可以点击按钮来触发修复行为,很大程度上提高了运维♦虚拟机内存负载异常♦虚拟机快照引起的性能问题♦数据存储链接异常首先以“虚拟机CPU负载异常(VirtualMachinehasUnexpectedhighCPUworkload)”为例进行说1)虚拟机CPU负载异常下图显示了集群Cluster.2所存在的问题,其中红框显示虚拟机有异常的过高CPU负载,有三个对象受检查受影响的相关对象并查看群集中告警等级最高的Web虚拟机"PVMAPP_O”。AVirtualmachinehasunexpectedhighCPUworkloadvirtualmacmnoisrunninoaopiicatonstnatareun3oDjec!(s)sxhiDittnisalertC4Kl8!tty小AJ8DetailsViewDetailsviewDetailsHW_1PVMAPP.O 9J28/149J28/1410111AM9/28H410:11AM9/28/1410:11AM9/28/1410:11AM9/27/14216PM查看告警详细信息界面,并逐步分析虚拟机CPU负载异常,如下图所示。3.解决问题的建议:需要应用负责人配合调查4.或由管理员直接介入修复问题分析问题虚拟机的各项指标如下,可见CPU负载100%。PVMAPPOActions▼g②QvSphereSummaryAlertsAnalysisTroubleshootingDetailsEr■Workload▲Anomalies■FaultsCapacityRemainingWorkloadTrenWorkloadishighestbyCPU.CriticalWorkloadBreakdov/nMemory01,338,1012,796,2034-.194,304□Capacity4GB图:问题虚拟机各项指标为问题虚拟机增加vCPU(未开启热添加,需重启),如下所示。HawA,HewCPUCurrentCPUPowerSimePowerOffAlo-rfvedSnopsnetHowAdarterhitaMS而,□E42cKp.bcRvCenMUoM”再次查看问题虚拟机的运行情况,可见CPU负载恢复正常,如下图“3”所示。vmwarevRealizevmwarevRealizeOperationsManagerAlertDetails出PVMAPP_OActions▼SummaryAlerts[AnalysispiroubieshootingvSpheiDetails■virtualmacnmenasunexpoctocnighCPUworkloadSVirtualMachine•/^crkioaa▲Anomalies■Faults•capaciwRemainingWorkloadTreWarningMemoryofCaoacit/)DCapacity4GB载问题解决下图展示了“数据存储链接丢失告警(DatastoreLostConnectivityAlert)”,该告警指出数据存储ds-site-a-iscsi02与存储设备的链接已经丢失,并指出了相应的修复建议。Dau&WffrOiui&oofezstofitcaiMciMtvioanui^d<16\K4Aries»SunmaryOtRCggtOfETEImReieocn亦p?Mft—3b*eor*i«EQ\*jc3\*hps18\o\al(\s\up7(M),C)EQ\*jc3\*hps17\o\al(\s\up7(,),c)EQ\*jc3\*hps17\o\al(\s\up7(M),C)EQ\*jc3\*hps17\o\al(\s\up7(r),»)EQ\*jc3\*hps18\o\al(\s\up7(M),h)EQ\*jc3\*hps17\o\al(\s\up7(onn),3fr)EQ\*jc3\*hps17\o\al(\s\up7(^),?)EQ\*jc3\*hps17\o\al(\s\up7(ctwlt),n6113)EQ\*jc3\*hps17\o\al(\s\up7(.),e)EQ\*jc3\*hps17\o\al(\s\up7(s),f)EQ\*jc3\*hps17\o\al(\s\up7(t),:)EQ\*jc3\*hps17\o\al(\s\up7(y),E)EQ\*jc3\*hps17\o\al(\s\up7(d),〃)EQ\*jc3\*hps17\o\al(\s\up7(・),o)—3b*eor*i«EQ\*jc3\*hps17\o\al(\s\up5(y),M)EQ\*jc3\*hps17\o\al(\s\up5(f),Ni)EQ\*jc3\*hps17\o\al(\s\up5(^),p)EQ\*jc3\*hps17\o\al(\s\up5(»),siN)EQ\*jc3\*hps17\o\al(\s\up5(t),t)EQ\*jc3\*hps17\o\al(\s\up5(Th),»)EQ\*jc3\*hps17\o\al(\s\up5(a),1)EQ\*jc3\*hps17\o\al(\s\up5(t),O)EQ\*jc3\*hps17\o\al(\s\up5(h),M)EQ\*jc3\*hps17\o\al(\s\up5(nc),6)EQ\*jc3\*hps17\o\al(\s\up5(S),a)EQ\*jc3\*hps17\o\al(\s\up5(K),n)EQ\*jc3\*hps17\o\al(\s\up5(s),s)EQ\*jc3\*hps17\o\al(\s\up5(t),a)EQ\*jc3\*hps17\o\al(\s\up5(e),e)EQ\*jc3\*hps17\o\al(\s\up5(ft),ar)EQ\*jc3\*hps17\o\al(\s\up5(h),6)EQ\*jc3\*hps17\o\al(\s\up5(a),a)EQ\*jc3\*hps17\o\al(\s\up5(d),m)EQ\*jc3\*hps17\o\al(\s\up5(r),t)EQ\*jc3\*hps17\o\al(\s\up5(IK),EG)EQ\*jc3\*hps17\o\al(\s\up5(«),a)EQ\*jc3\*hps17\o\al(\s\up5(p),q)EQ\*jc3\*hps17\o\al(\s\up5(h),t)EQ\*jc3\*hps17\o\al(\s\up5(»),t)EQ\*jc3\*hps17\o\al(\s\up5(!),a)EQ\*jc3\*hps17\o\al(\s\up5(x),GS)EQ\*jc3\*hps17\o\al(\s\up5(n),/)EQ\*jc3\*hps17\o\al(\s\up5(l),S)EQ\*jc3\*hps17\o\al(\s\up5(«),c)EQ\*jc3\*hps13\o\al(\s\up4(HA),rn)EQ\*jc3\*hps13\o\al(\s\up3(O),e)EQ\*jc3\*hps17\o\al(\s\up5(TH),a)EQ\*jc3\*hps17\o\al(\s\up5(u),i)EQ\*jc3\*hps17\o\al(\s\up5(a),t)EQ\*jc3\*hps17\o\al(\s\up5(im),uus)EQ\*jc3\*hps17\o\al(\s\up5(»),cs)EQ\*jc3\*hps17\o\al(\s\up5(«),&)EQ\*jc3\*hps17\o\al(\s\up5(«),ya)EQ\*jc3\*hps17\o\al(\s\up5(ia),w)EQ\*jc3\*hps13\o\al(\s\up3(M),n)EQ\*jc3\*hps17\o\al(\s\up5(»),w)ZcangggcsPjthE/EEHFabrePcEEQ\*jc3\*hps17\o\al(\s\up8(1),C)EQ\*jc3\*hps17\o\al(\s\up8(For),eOr)U!4cgtieSEa»lmsXrtss\W*jres5ttiereC1HOH?E”Mi即rfiecomwtr4tEQ\*jc3\*hps17\o\al(\s\up7(n),2)EQ\*jc3\*hps17\o\al(\s\up7(r),:)EQ\*jc3\*hps17\o\al(\s\up7(ze),dt)EQ\*jc3\*hps17\o\al(\s\up7(3),f)EQ\*jc3\*hps25\o\al(\s\up10(、),z)EQ\*jc3\*hps17\o\al(\s\up7(a),w)EQ\*jc3\*hps17\o\al(\s\up7(i),p)EQ\*jc3\*hps17\o\al(\s\up7(0),r)EQ\*jc3\*hps17\o\al(\s\up7(03),»)EQ\*jc3\*hps17\o\al(\s\up7(4),j)EQ\*jc3\*hps17\o\al(\s\up7(6),u)E6e<*th,1fieBHMcpE,?K&hdnMbe15nEQ\*jc3\*hps17\o\al(\s\up3(r),w)EQ\*jc3\*hps17\o\al(\s\up3(o),/)EQ\*jc3\*hps17\o\al(\s\up3(u),s)EQ\*jc3\*hps17\o\al(\s\up3(Mw),is)EQ\*jc3\*hps17\o\al(\s\up3(e),a)EQ\*jc3\*hps17\o\al(\s\up3(ajw),oui)EQ\*jc3\*hps17\o\al(\s\up3(i),c)EQ\*jc3\*hps17\o\al(\s\up3(ar),or)EQ\*jc3\*hps17\o\al(\s\up3(w),")EQ\*jc3\*hps17\o\al(\s\up3(.),u)EQ\*jc3\*hps17\o\al(\s\up3(c),c)EQ\*jc3\*hps17\o\al(\s\up3(^),:)EQ\*jc3\*hps13\o\al(\s\up2(S),R)EQ\*jc3\*hps17\o\al(\s\up4(M),S)EQ\*jc3\*hps13\o\al(\s\up2(AR),C)EQ\*jc3\*hps17\o\al(\s\up4(W),f)EQ\*jc3\*hps13\o\al(\s\up2(E),i)EQ\*jc3\*hps17\o\al(\s\up4(h),t)EQ\*jc3\*hps17\o\al(\s\up4(w),n)EQ\*jc3\*hps17\o\al(\s\up4(!),a)EQ\*jc3\*hps17\o\al(\s\up4(e),h)EQ\*jc3\*hps17\o\al(\s\up4(f),u)EQ\*jc3\*hps17\o\al(\s\up4(e),F)EQ\*jc3\*hps17\o\al(\s\up4(0),r)EQ\*jc3\*hps17\o\al(\s\up4(f),a)EQ\*jc3\*hps17\o\al(\s\up4(s),w)EQ\*jc3\*hps17\o\al(\s\up4(e),r)EQ\*jc3\*hps17\o\al(\s\up4(H),o)AMhtonnwonOOedNameCor4rc4SUMAj酎AcdWer^ertTfpe:emails-sufliimci孙WN3IJ2-Opf<i.WAcv»eXrtMin 图:数据存储连接丢失告警容量优化例如虚拟机CPU容量压力、虚拟机内存容量压力以及集群层面容量压力等,下面以虚拟机CPU容量压力与>虚拟机CPU容量压力如下图所示,主界面发现容量风险告警"VirtualmachinehaschronichighCPUworkloadleadingtoCPUstressv,该告警指明虚拟机的容量问题如下。♦虚拟机长期出现负载过大的情况,通常意味着虚拟机分配的资源过少,容量不够EnvironmentHealthtompeatMheeithKXXWCMOZtr8,g.lemforEnvironmentHealthAlertsTopHealthAlertsForDes...ftunexpectedhighmemoryworkload5objectsimoacte(l|2Recommendation(s)Artri彩EflYiroomentRiskAleEnvironmentEfficiGncy...¥TopEHlciencyAledsFo...公./?RecommenOaUon(s)DeteaVMsthatareconftguredwithmorenowprmemnf。SummaryknoactedSummaryknoactedoofectSymptomsHeaoon86MetncChartsBlmchinthatchronichighCPUworkloadiMdingtoCPUttrtttmachineisexcentnofKCPUsressduetomsuhaentCPUresourcesRrcomtnaaunsAMrweCFuCapaciyrcrvrwaMacntre/U»<tmtormMionS«tCRJCovrtbrVUPVMAPP.t•0=WPP_3doosnothav«syrnptonetudWactinoCPUC>stopisatWammghwdE图:容量告警详细信息CriteaHbLACWCAcntcal92M41XI2PM此处指出了相应的操作建议:增加虚拟机的CPU数量,管理员可以按照“性能监控与故障修复”中的>集群层面发现容量问题如下图所示,“剩余容量”中显示该集群存在CPU和磁盘空间紧张的容量问题。314.3%Allocation314.3%AllocationrttoadAnomalies[.三apacityRemaining]TimeRemaining■Stress'RectaimableCapacity■,日8eM发LjvSp^weSokrtionsOeUuttPolicy(昵加141125amReportsActions.Aterts,An而DelailsEntwonmentSummaryProjeUsCapacityRemainingTrerMtLa6WaiHCapaciyRemartna?FurtherAnalysisViewlVMwareClusterCPUDemandForecastTrendClusterComputeResourceResources0VirtualMachineAverageProfile0VirtualMachineSmallproBe0VirtualMachineLargeProfile0VirtualMachineMediumProOeRunningVMS:VirtualSummary|NumberofRuonCapacityandTimeRemainingPolicySet...详细信息查看如下图所示,该图显示CPU和磁盘都己经没有剩余容量可用了。WhatWillFit0VirtualMachineAverageProfile0VirtualMachineMediumProfile▼EQ\*jc3\*hps26\o\al(\s\up7(0V),Lar)EQ\*jc3\*hps26\o\al(\s\up7(i),g)EQ\*jc3\*hps26\o\al(\s\up7(r),e)EQ\*jc3\*hps26\o\al(\s\up7(ual),Pro)EQ\*jc3\*hps26\o\al(\s\up7(Mac),ile)0VirtualMachineSmallprofile▼TotalCapacityJsabUeCapacity►►MemoryvSphere24.47GHzConfigured64GBConfiguredOvercommrt0.0%100MBpsEstimated56.59GBConfiguredOvercommrt0.0%1.024VirtualMachine(s)Configured-♦10%-♦10%——22.02GHz90%57.6GB90%o*Total90MBps90%orTotal90%ofTotal50.93GB90%1.024VirtualMachine(s)Demand39.06%Allocation3.21%289MBpsDemand5035%Demand428.29%21814GBAllocation0.88%9VirtualMachine(s)DemandEQ\*jc3\*hps26\o\al(\s\up1(O),n)36&23*Demand24.25%Aliocationi4.3%3.87M8psDemand67.43,75.75%4-3.63GB95.7%86.13MBps32.57%Demand1125VirtualMachine(s)Demand98.9%1.01275VirtualMachine(s)下图可以协助运维人员定位关联对象的容量状况,并采取相关的操作来解决容量问题。CapacityinRelatedObjectsStatusvSphcre安全加固vRealizeOperationsManager可以持续确保vSphere强化虚拟和物理基础架构所有方面的合规性。详细的模板可参照数百个强化条件向管理员表明环境状况,以便可以快速追溯到不合规的领域并进行修复。下图显示了在当前运行环境中存在的两个合>物理主机告警触发此“物理主机合规性告警”的四个对象如下图所示。SewnKartemgSOM2*C*c*h-小C*c*h-AavSphece6.6HordmgGuidewcisncE“JUIEErc-vngenanocce<mWMNCEJ力84o43a4c*flac«竹0“4S”33Wil'dga”oa”3f%mM4sarvtY4iM4SdRM图:物理主机合规性告警的相关对象主机esx-02a触发的合规性告警详细情况如下图所示。,,,#.**-JWWW”*4%dVew»^©y4afwwnlVm«xam»)pagM—ag.aMar“trjar”tatwkacrc«8ka*war*mew \3xSR”sAlPsIltU八廿—D'a.”4041图:与主机esx-02a合规相关朕的对象虚拟机告警上述的虚拟机告警VirtualMachineisViolatingvSphere5.5HardingGuide与物理主机告警类似,虚拟机PVMAPP02的所有合规以及相关的对象如下图所示。▼F3ltr&nol@,0gWinehowMccitcrContc4bnotdtJbMFcalireno!exposedin^Sphereao^BSlsnotdFakr《nole*pc^din

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论