vRealize-Operations云管理解决方案交流_第1页
vRealize-Operations云管理解决方案交流_第2页
vRealize-Operations云管理解决方案交流_第3页
vRealize-Operations云管理解决方案交流_第4页
vRealize-Operations云管理解决方案交流_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

云管理解决方案交流自动化服务目录流程管理发布自动化智能运维服务健康状况容量优化配置标准化成本透明成本透明行业基准比较服务质量VMware对于云管理的理解–

SDDC与混合云的控制面板2计算PhysicalHardware私有云公有云混合云VMware&

vCloudDatacenterPartners虚拟化基础架构抽象&池化计算资源抽象=

服务器虚拟化存储存储资源抽象

=软件定义网络网络网络资源抽象

=网络虚拟化应用移动应用SaaS服务传统应用软件定义数据中心带来的IT成效保密资料3数据中心虚拟化和

标准化基础架构自带安全控制功能精简并自动化的数据中心运维管理应用和基础架构交付自动化可用性高、恢复能力强的基础架构软件定义的

数据中心效益

控制力敏捷性CAPEX降低OPEX降低安全性与工作量之比

提高可用性提高服务交付时间缩短4云自动化云运维云业务行动决策结构化数据MetricsAlertsEvents非结构化“大数据”LogsMessages成本模型成本透视分析运维洞察业务洞察VMware云管理解决方案理念:洞察

决策

行动

打造高度集成的、自动化的云管理平台全面的决策依据敏捷的IT服务交付云环境下的运维管理:化繁为简、浑然自成保密资料5数据中心虚拟化和标准化基础架构自带安全控制功能精简并自动化的数据中心运维管理应用和基础架构交付自动化可用性高、恢复能力强的基础架构软件定义的

数据中心效益

控制力

敏捷性需要回答的问题目标是否可以满足或超越SLA定义的预期目标?是否能够在最终用户受到影响之前修复问题?如何在复杂异构的环境中进行统一管理?App服务质量平均响应与解决问题的时间是多少?能否对基础架构进行容量管理?如何对未来的需求进行合理的规划?运维效率IT基础架构是否符合最佳的运维规范?能否在企业内部主动地施行IT标准?合规管控云环境下运维管理的目标6然而现阶段上述目标“可望而不可及”监控数据过载告警风暴管理界面过多DBAVIStorage资源过度分配7运维分析技术的演进8主动发现被动相应自动化人工Hyperic,SCOM,Nagios,…传统监控方式数据采集

(指标,日志,…)静态阀值告警预测分析vRealizeOperations

6.0从不同的症状侦测复杂的异常事件自愈式修复,自动化提供弹性扩展的平台应对海量数据分析DataCollection数据采集事件关联BMC,HP,CA,IBM,…整合比对过滤基于规则的告警压制DataCollection数据采集性能分析VROps1.0-5.x,Netuitive,…自学习动态阀值超级指标(按需提取重铸指标)数据采集10倍的告警数量消减VMware应对运维分析课题的方法论9运维分析与自动化性能与可用性日志与其他非结构化数据库拓扑分析配置检测容量规划vRealizeOperations运维管理界面

可扩展性可集成的管理组件性能合规配置容量可用性弹性可扩展的平台架构应用可视性日志*分析报表/告警自动化SDK第三方管理内容包APIs

服务质量vRealizeOperations方案构成概述

运维效率合规管控10*vRealizeLogInsightisnotpartofvRealizeOperationsbutincludedwithvRealizeOperationsInsightandvRealizeSuite管理层决策层维护人员故障发现容量规划技术管理提高可用性降低风险和成本容量优化故障分析合规审计安全加固vRealize

Operations

多层次的价值创造配置管理故障解决专业报表专家面板成本管理运行分析故障管理

面向故障,面向系统

面向问题,面向风险管理项功能故障管理故障发现,故障分析,故障解决容量管理容量优化,容量规划风险管理安全加固,合规审计资产管理配置管理,成本管理运行管理专业报表,专家面板业务运营效率风险过度购买硬件产生不必要的CAPEX虚拟机和资源超额配置基础架构缺乏可见性精简并自动化的数据中心运维管理保密资料12之前的客户体验虚拟机大小合适虚拟机超额配置虚拟机容量不足闲置虚拟机计算问题平均解决时间过长成效示例优化性能和容量提高性能并避免中断对基础架构和应用进行统一管理自动实施工作流和

策略精简并自动化的数据中心运维管理保密资料13之后的客户体验虚拟机大小合适虚拟机超额配置虚拟机容量不足虚拟机闲置运行状况良好运行状况异常运行状况不良高效运维可降低IT管理的OPEX缩短问题平均解决时间成效示例与软件定义数据中心愿景一致的运维管理14OS,

存储&网络监控物理服务器、存储与网络设备vSphere健康、性能与容量

应用到存储的端到端可视性,日志管理,依赖关系映射、自定义专家面板与报表服务器虚拟化(vSphere)CONFIDENTIAL&INTERNALUSEONLY存储虚拟化(VSAN)VSAN健康状况、vVOL,vFlash,

SSD/HDD网络虚拟化(NSX)NSX健康状况,物理到虚拟网络的关联混合云(AWS,Azure,vCloudAir)公有云与私有云的管理与调配所需的管理能力软件定义数据中心vRealizeOperationsManagementPack

StorageDevicesManagementPack

NSXManagementPack

vCloudAirvRealize

Operations

6.0全新的弹性可扩展架构

15经铁道部12306余票查询系统验证过的NoSQL内存数据库新架构可以扩展至原来5.x版本5倍数量的监控对象、监控指标以及并发使用用户高可用,弹性,自我监控的平台横向扩展由业界领先的高扩展性&高弹性内存数据库重新架构的运维平台,支撑未来复杂多变的环境需要回答的问题目标是否可以满足或超越SLA定义的预期目标?是否能够在最终用户受到影响之前修复问题?如何在复杂异构的环境中进行统一管理?App服务质量平均响应与解决问题的时间是多少?能否对基础架构进行容量管理?如何对未来的需求进行合理的规划?运维效率IT基础架构是否符合最佳的运维规范?能否在企业内部主动地施行IT标准?合规管控云环境下运维管理的目标16vRealize

Operations如何帮助提高服务质量通过带有自学习能力的管理工具优化性能,避免业务中断

关键能力益处消减90%的告警数量主动侦测&尽早避免事故服务质量自学习的预测分析智能告警通过比对多种症状识别问题17无需其他额外的管理工具,避免碎片化管理各领域特色的管理内容包

MS,SAP,NSXetc.动态阀值基于问题分析和解决告警消减到原来1/10未来问题预测分析活用监控数据静态的阀值看重症状本身原始告警传递只对过去现状分析监控数据孤岛传统监控

预测分析从“传统监控”向“运营分析”转变18智能告警1智能告警2智能告警3智能告警4告警风暴基于问题分析与多个症状结合关键字:数据挖掘、数据聚合、信息透明预见性分析由多个症状侦触发告警,记忆故障的告警模式,提供标本兼治的建议以及捕捉故障发生的预兆健康风险效率动态阀值vRealize

Operations自学习分析系统的独到之处19超级指标动态阀值会适应业务系统工作负载的变化曲线,消除告警风暴与误报亟待解决的问题未来的问题可优化的机会超级指标将数百个KPI指标整合成健康、风险、效率的综合记分板123将分析运用到过去、现在与将来的应用和基础架构资源消耗行为自学习可预计的资源需求实时事件<>历史数据项目计划可预测的行为自动化的工作流程响应或修复问题改善分析&规避风险发现负载压力&改善效率vRealizeOperationsInfrastructureOSMiddlewareApplications采用基于数据分析的的运维流程21找到需要衡量的关键技术指标从vSphere开始,逐渐扩展监控的范围(应用、存储、FC交换机、其他运维平台etc)构建由最佳实践和可重用工作流组成的“工具库”激励团队预防故障方面多下功夫基于分析的运维流程4步曲分析现在的维运瓶颈预估未来的容量与趋势找寻优化的机会短期内出现的虚拟机内存不足的情形

vRealizeOperations6.0界面概述22内存过度分配的闲置的虚拟机长期出现的的业务系统CPU压力“性能问题”快速定位示例之一23发现存储性能引起的健康告警:虚拟机的快照造成磁盘IO延迟过大…智能告警不仅找到问题的根本原因

并直接给出解决问题解的建议24跨多个指标关联分析症状建议:删除虚拟机时间较久的快照性能问题”快速定位示例之二CONFIDENTIAL25预测近期的容量风险、资源瓶颈CONFIDENTIAL26定制个性化符合环境实际需求的告警27增加修复的动作

(vCenter,vRealizeOrchestratororPythonscripts)基于多种症状给出建议某银行利用vRealize

Operations定制急需处理的一级告警CONFIDENTIAL28私人定制:

报表和面板定制化可定制的视图,报告和仪表板CustomViews对象细节可见性大量的视图类型和选项建立一次使用很多次CustomReports拖拽视图到报告中CustomDashboards拖放一个视图到仪表板拖放一个小部件到仪表板(前)TechnicalOverviewViewsReportsDashboardsWidgets(fromtheOldCustomUI)ViewyourdatathewayyouneedtovRealizeOperations高级版以上版本CONFIDENTIAL30vRealizeOperations专家报表vRealizeOperations与LogInsight尽可能利用所有的IT数据用于全面的可视性结构化数据MetricsAlertsEventsVMwarevRealizeOperations容量,性能,配置管理基于日志关键字匹配的告警发送基于某个对象日志的上下文检索非结构化数据LogsMessagesVMwarevRealizeLogInsight日志分析,聚合,搜索AppAppAppAppAppAppAppAppAppAppAppPublicCloud31大数据日志分析平台–根源故障分析的最后一公里32SCSIErrorsNFSErrorsvMotionFailuresHostDisconnectsDroppedPacketsFailedTasksSlowHostSyncsSlowDBQueries预制的vCenter日志分析引擎轻松读懂晦涩的日志CONFIDENTIAL33让虚拟化管理员与LOG文件Say

Goodbye

!订阅管理员关心的日志内容34不同角色查看不同权限的日志编辑日常运维所需监控的事件列出日常运维的事件报告打开告警从现象到本质,与vRealize

Operations界面紧密集成将订阅的告警存储延迟事件日志事件投射到性能监控面板应用健康与性能监控对传统数据中心支持的监控指标:/hyperic-58/topic/com.vmware.ICbase/PDF/vcenter-hyperic-58-resource-config-guide.pdf示例:Weblogic性能监控Metric与Hyperic模块对应关系CONFIDENTIAL37响应时间监控监控最终用户Web应用响应监控,支持Web请求的整体响应和分段响应时间监控。具体包括监控应用名,状态,平均响应时间,成功请求数,失败请求数,总请求数等。HypericWeblogicGeneral平均响应时间,成功请求数,失败请求数,总请求数等,等应用响应时间监控。服务器监控服务器健康监控:监控应用服务器CPU、线程池,通过率百分比,监控heap使用率,换页率和垃圾回收率历史HypericWebloicGeneral垃圾回收监控垃圾回收率监控:监控JVM

Heap使用率趋势,垃圾回收率分析,包括内存使用字节数,空余字节数等HypericWeblogicGeneral应用健康监控监控应用服务器响应时间,通过率,JVM和系统CPU使用率,数据源平均响应时间等HypericWeblogicGeneral应用监控应用健康监控:监控应用名,应用状态,应用健康状态HypericWeblogicApplicationHTTP会话监控监控HTTP会话情况,监控webcontainer、protalcontainer情况HypericWeblogicJMSServerMetric请求分析监控Application,JCA,JMS,JNDI,SQLconnection/query/update响应时间HypericWeblogicJTAMetricEJB监控监控EJB的CreateCalls数,Accivates次数,创建次数,清除次数,平均响应时间,平均CreateCall时间,平均RemoveCall时间HypericWeblogicEJBMetricCache分析缓存监控:监控内存最大缓存数,内存命中率等HypericWeblogicEJBMetricJDBC监控监控JDBC池使用情况,监控某个JDBCPOOL可用性,创建连接数,释放连接数,分配连接数,返回连接数,平均等待时间,超时连接数HypericWeblogicJDBCConnecionPoolMetricPool分析监控ORB池中的线程数、WebContainer池容量,监控J2C,DB2连接池,最大连接数HypericWeblogicJDBCConnectionPoolMetric跨虚拟、物理、公有云资源监控应用定位问题出现在Linux上的Oracle数据库深入挖掘问题指标应用发现问题38OracleEM监控整体视图CONFIDENTIAL39OracleEM监控整体视图CONFIDENTIAL40OracleEM管理环境视图CONFIDENTIAL41OracleEM整体视图CONFIDENTIAL42Oracle

RAC关系视图CONFIDENTIAL43Oracle虚拟机视图CONFIDENTIAL44OracleWeblogic中间件视图CONFIDENTIAL45IBM

Tivoli监控环境整体视图CONFIDENTIAL46IBM

Websphere中间件视图

1CONFIDENTIAL47IBM

Websphere中间件视图

2CONFIDENTIAL48IBM

DB2视图CONFIDENTIAL49IBM

DB2视图CONFIDENTIAL50MSSQLServer视图

1CONFIDENTIAL51MSSQLServer视图

1CONFIDENTIAL52EMC

VNX存储视图1CONFIDENTIAL53EMC

VNX存储视图总览CONFIDENTIAL54EMC

VNX存储拓扑视图CONFIDENTIAL55EMC

VNX存储Cache视图CONFIDENTIAL56EMC

VNX存储LUN视图CONFIDENTIAL57EMC

VNX存储硬盘视图CONFIDENTIAL58SGM开发测试环境群集资源视图CONFIDENTIAL59CONFIDENTIAL60专家面板:群集综合角度Dashboard

(ClusterLevel->CPU->Mem->Storage)CPU

Usage

|

CapacityCPU

Usage

|

DemandCPU

Usage

|

ContentionMemory

|

BaloonMemory

|

Swap

in

Rate

Central

Information

Health

TreeDatastore

ThresholdCPU

HealthMemory

HealthCluster

HealthCPU

ResourceMemory

ResourceCapacity

Remaining应用之间的映射关系CONFIDENTIAL61专家报表,创建自定义报表将“视图”拖曳到报表中62CONFIDENTIALvRealize

Operations定制报表封面CONFIDENTIAL63vRealize

Operations

定制报表(OS指标)CONFIDENTIAL64vRealize

Operations定制报表(MSSQL指标)CONFIDENTIAL65vRealize

Operations

定制报表

(Oracle

&

Tomcat指标)CONFIDENTIAL66CONFIDENTIALSolutions:1652Companies:81Solutions:278Solutions:36Solutions:555Companies:138Solutions:83Companies:27vR

Ops:

88LogInsight:

38

vRO:

58vRA:

94https://VMwareSolution

Exchange

–企业级应用商店需要回答的问题目标是否可以满足或超越SLA定义的预期目标?是否能够在最终用户受到影响之前修复问题?如何在复杂异构的环境中进行统一管理?App服务质量平均响应与解决问题的时间是多少?能否对基础架构进行容量管理?如何对未来的需求进行合理的规划?运维效率IT基础架构是否符合最佳的运维规范?能否在企业内部主动地施行IT标准?合规管控云环境下运维管理的目标68vRealize

Operations如何帮助改善运维效率69通过基于策略的管控方式自动化关键的IT流程,提升运维效率

关键能力益处运维更具效能缩减50%排错时间向导式的故障修复虚拟和物理层面的容量优化30%资源回收vRealize

Operations带来更高的生产率60%increase虚拟基础架构管理员可以管理

1.6倍

的虚拟机,同时管理方式由被动响应向主动发现转变ManagementInsightsCustomerSurvey,September201270紧迫的问题即将发生的问题可以优化的机会发现性能问题:磁盘设备延迟增加引起健康问题整体环境各种资源的关联分析运营分析驱动的自动化之一71合并不同的症状找出根源问题造成问题的主要技术指标解决这个问题的建议“一键修复”式的自动化手段:将虚拟机迁移到空闲的存储CONFIDENTIAL72运营分析驱动的自动化示例之二性能优先资源利用率优先忽略浪费情况追求更高的虚拟机整合密度安全生产环境开发测试环境如何管理容量风险?运行环境效率优化的目标是什么?73如何为不同的需求度身定制容量模型?

正确的监控策略=正确的控制分配与需求模型资源过度分配的比例容量风险的法制缓存业务运行时间(例如周一/周五)70%利用率(刚刚好)90%利用率(危险)35%利用率(过度分配)实时:容量监控与分析异构环境下的容量模型建模轻松制定容量策略提供预报功能以及Top-Down的细颗粒数据分析74vRealize

Operations简化容量管理的两个维度预测:项目计划“如果-假定”资源变化场景未来的项目规划、变更可视化、容量预留各种针对容量的视图、报表、告警定义资源分配不多也不少恰好够用资源变更结果未卜先知(新项目采购之前模拟资源增加;旧设备下电维护之前模拟资源减少;)容量分析CONFIDENTIAL75容量分析告诉管理员何时、为什么、什么资源、在哪里会遇到瓶颈将容量指标分解成CPU、内存、网络、存储容量规划–新项目CONFIDENTIAL76模拟一个新业务系统上线项目:假定在生产群集新增N个虚拟机用于部署ERP应用参考近似资源开销的现有虚拟机尺寸,估算容量需求结论:新项目的需求超过现有剩余容量,该生产群集需要扩容容量规划–模拟增加容量CONFIDENTIAL77结论:若增加3台主机可以满足新ERP系统的上线需要模拟另一个服务器扩容项目估算需要多少台服务器弥补计算资源的短缺优化–识别过度分配的资源CONFIDENTIAL–SharedunderNDAONLY78可回收容量的分析自动化–采取行动回收资源79一键操作优化容量需要回答的问题目标是否可以满足或超越SLA定义的预期目标?是否能够在最终用户受到影响之前修复问题?如何在复杂异构的环境中进行统一管理?App服务质量平均响应与解决问题的时间是多少?能否对基础架构进行容量管理?如何对未来的需求进行合理的规划?运维效率IT基础架构是否符合最佳的运维规范?能否在企业内部主动地施行IT标准?合规管控云环境下运维管理的目标80

vRealize

Operations如何帮助强化管控与合规在基础架构与应用领域获得持续的合规性以及主动管理能力

关键能力益处管控与合规81通过灵活的组策略进行主动管理获得安全最佳实践与合规标准减少45%的安全合规所需时间完全的管控而无需人工干预IT合规的挑战82监控与合规的孤岛监控合规缺少集成缺少性能与变更的关联分析性能变更管理用户与访问控制e.g.不同部门的用户只能看到各自的资源池缺少洞察多方需求安全最佳实践供应商的加固指南行业合规标准VMware覆盖了IT合规的各个方面83vSphere安全加固手册安全部署与管理基于Vmware虚拟化的生产环境IT供应商最佳实践采取最新IT供应商的最佳实践,例如Microsoft,Ciscoetc.行业合规通过行业的合规规范,例如PCI,HIPAAetc.自定义IT配置基线确保符合内部IT策略与安全最佳实践自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论