FusionSphere系统运行洞察技术白皮书_第1页
FusionSphere系统运行洞察技术白皮书_第2页
FusionSphere系统运行洞察技术白皮书_第3页
FusionSphere系统运行洞察技术白皮书_第4页
FusionSphere系统运行洞察技术白皮书_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 DOCPROPERTY Product Project Name 华为FusionSphere DOCPROPERTY DocumentName 系统运行洞察技术白皮书 STYLEREF Contents 目 录 DOCPROPERTY DocumentName 系统运行洞察技术白皮书 目 录 TOC o 1-1 h z t 标题 2,2,标题 3,3,Appendix heading 2,2,Appendix heading 3,3 HYPERLINK l _Toc418849493 1 FusionSphere SOI简介 PAGEREF _Toc418849493 h 3 HYPERL

2、INK l _Toc418849494 1.1 SOI性能监控概述 PAGEREF _Toc418849494 h 3 HYPERLINK l _Toc418849495 1.2 SOI方案简介 PAGEREF _Toc418849495 h 3 HYPERLINK l _Toc418849496 2 SOI监控分析功能介绍 PAGEREF _Toc418849496 h 5 HYPERLINK l _Toc418849497 2.1 SOI系统框架 PAGEREF _Toc418849497 h 5 HYPERLINK l _Toc418849498 2.2 SOI监控指标 PAGEREF

3、_Toc418849498 h 5 HYPERLINK l _Toc418849499 2.2.1 虚拟机 PAGEREF _Toc418849499 h 5 HYPERLINK l _Toc418849500 2.2.2 主机 PAGEREF _Toc418849500 h 6 HYPERLINK l _Toc418849501 2.2.3 集群 PAGEREF _Toc418849501 h 6 HYPERLINK l _Toc418849502 2.3 SOI分析功能 PAGEREF _Toc418849502 h 6 HYPERLINK l _Toc418849503 2.3.1 综合

4、运行监控 PAGEREF _Toc418849503 h 6 HYPERLINK l _Toc418849504 2.3.2 动态阈值 PAGEREF _Toc418849504 h 7 HYPERLINK l _Toc418849505 2.3.3 趋势预测 PAGEREF _Toc418849505 h 7 HYPERLINK l _Toc418849506 2.3.4 容量合规 PAGEREF _Toc418849506 h 8 HYPERLINK l _Toc418849507 2.4 SOI监控规模和规格 PAGEREF _Toc418849507 h 9 HYPERLINK l _

5、Toc418849508 3 综述总结 PAGEREF _Toc418849508 h 10 HYPERLINK l _Toc418849509 4 术语 PAGEREF _Toc418849509 h 11 STYLEREF Contents 目 录FusionSphere备份方案白皮书FusionSphere SOI简介SOI性能监控概述随着云计算业务的发展和虚拟数据中心的兴起,越来越多的企业或组织使用虚拟化平台,在提升资源利用率和资源管理效率的同时,也给性能管理工作带来了巨大的挑战。云计算基础设施的运维管理走向融合,性能、容量和配置管理变得密不可分。虚拟化基础设施动态变化,而传统的工具是

6、孤立设计的,静态物理基础设施不提供自动化和控制流程。FusionSphere SOI(System Operation Insight,以下简称SOI)的推出有利于简化和自动化FusionSphere的运维管理,填补自动化性能管理存在的差距。SOI提供深入的虚拟基础设施的性能的洞察能力,是虚拟化性能管理的一次变革。通过SOI,管理员能够快速找出和诊断性能问题,同时有效地平衡管理虚拟环境中不同的性能目标,其中包括:最大化虚拟机、主机的性能,以确保虚拟机和云环境的服务水平优化整个虚拟化基础设施的性能,保持较高的虚拟机整合率预测和保证容量来应对业务增长等变化SOI具有专利的以学习为基础的分析算法,管

7、理员不再必须依赖于经典的监控工具和技术。SOI并提供整个虚拟环境的详细的行为的分析,从而实现智能运营。SOI方案简介SOI是性能监控和分析系统,用来对FusionCompute系统中虚拟资源的性能指标进行采集和展示,建立模型进行分析,根据历史和当前数据对未来性能变化进行预测,从而为管理员提供系统性能管理建议。SOI的总体逻辑架构如 REF _Ref418618371 r h 图1-1所示。FusionSphere SOI的总体逻辑架构SOI安装启动后,采用标准的FusionCompute的北向API接口,自动收集性能数据并进行分析。SOI从虚拟化基础设施每个层面的每个对象收集性能数据,包括虚拟

8、机、主机、集群和数据中心。它存储并分析数据提供运营控制面板,从健康、风险和效率三方面综合分析和展现系统性能容量状况,以发现当前的性能问题,或潜在的问题。SOI适用于现有的FusionSphere产品,提供以下功能:综合运行监控:结合相关的CPU、内存、磁盘和网络归一化为0100的分数,从健康、风险和效率三个维度进行打分,综合分析系统性能和容量状况,并使用直观的视图进行呈现。动态阈值:提供自学习功能,计算对象的正常行为,设定为动态阈值。估算其范围内,并突出异常,判断系统是否出现异常波动。趋势预测:支持前瞻性地分析系统容量的未来趋势,了解目前及未来的资源需求和使用情况,提前进行合理的容量管理和规划

9、。容量合规:支持评估系统中虚拟机和主机的容量规格是否合理。SOI监控分析功能介绍SOI系统框架SOI系统框架如 REF _Ref418618511 r h 图2-1所示。SOI系统框架图SOI系统运行洞察系统,用来对FusionSphere云计算系统中物理机和虚拟机的性能环境指标进行采集和展示,建立模型进行分析,根据历史和当前数据对未来性能变化进行预测,从而给出对管理员的系统性能管理建议。SOI监控指标SOI支持云基础设施从虚拟机到集群,包括CPU、内存、磁盘、网络各个维度的丰富的性能指标监控。虚拟机虚拟机性能指标,主要从CPU、内存、磁盘、网络四个维度对运行的虚拟机进行动态监控分析,具体指标

10、包括:CPU:CPU占用率、CPU就绪时长内存:内存占用率磁盘:磁盘IO读写速率、磁盘读写IOPS、平均磁盘读写延迟、磁盘IO利用率网络:网络收发速率、网卡收发包数SOI采集虚拟机的CPU、内存、磁盘、网络的相关指标,对虚拟机的健康度进行实时动态分析和打分,并向客户提供虚拟机的健康度评估建议。主机主机性能指标,主要从CPU、内存、网络、虚拟机数四个维度对主机及主机上运行的虚拟机进行动态监控分析,具体指标包括:CPU:CPU占用率内存:内存占用率磁盘:磁盘IO读写速率网络:网络流入流出速率SOI采集主机的CPU、内存、网络的指标,对主机的健康度进行监控分析和打分,并向客户提供主机的健康度评估建议

11、;同时提供容量分析,并对容量数据展开趋势预测。集群集群性能指标,主要从CPU、内存、网络、虚拟机数四个维度对集群性能及集群下的虚拟机进行动态监控分析,具体指标包括:CPU:CPU占用率内存:内存占用率磁盘:磁盘IO读写速率网络:网络流入流出速率SOI采集集群的CPU、内存、网络的指标,对集群的健康度进行监控分析和打分,并向客户提供集群的健康度评估建议;同时提供容量分析,并对容量数据展开趋势预测。SOI分析功能综合运行监控SOI从健康、风险和效率三个维度进行打分,综合分析系统性能和容量状况,并使用直观的视图进行呈现。技术原理:SOI从健康、风险和效率三个维度进行打分,使用直观的视图全面展现系统中

12、的虚拟机、主机和集群等对象的性能和容量状况。用户每天只需要花上几分钟时间,便可全面掌控系统性能和容量情况。性能监控维度包括:1、健康:关注系统当前性能状态是否良好。通过监控虚拟机、主机和集群等对象的工作负载(例如CPU占用率),结合动态阈值检测异常波动,提供准确可靠的性能评估结果。以便管理员及时发现性能问题,提升系统运行的稳定性。2、风险:关注系统未来资源是否充裕。通过分析虚拟机、主机和集群等对象的历史性能数据,提供系统资源过载详情、资源剩余容量和资源耗尽可能时长。以便管理员从容应对业务扩张带来的系统资源不足等问题,提升系统的维护效率。3、效率:关注系统是否存在优化机会。通过分析虚拟机、主机和

13、集群等对象的资源占用率,提供系统中负载过低的资源对象和资源优化建议。以便管理员可以及时调整监控对象负载,提升系统资源的使用效率。SOI提供灵活的综合打分策略,不同状态的指标分别取用不同的权重,状态严重的指标取用更高的权重,这样可以重点突出有问题的指标,防止“偏科”。客户价值:用户通过直观的视图可以全面监控系统性能状况,及时发现并处理系统问题及规避潜在风险,提高维护效率,降低维护成本。动态阈值SOI提供自学习功能,动态设定阈值,判断系统是否出现异常波动。技术原理:监控系统性能的异常变化是性能监控管理的重要内容。目前在性能监控管理中对性能异常变化的监控多采用基于阈值的方法,即由有经验的管理员设定好

14、阈值,当系统发现性能指标超过阈值时产生告警。这样的系统有一个缺点:性能变化存在突发性和随机性,实际运行中难以设定阈值。如果设定阈值太小,系统可能出现大量误报;如果设定阈值太大,则不容易发现网络中存在的细微突变,导致漏报。SOI评估监控对象的异常波动时采用动态阈值算法,根据对象和时间的不同,自学习每个对象在各时间段的正常负荷来智能设定上下限阈值。若监控的指标不在设定或者自学习的阈值范围内,系统就会报出异常事件。管理员根据异常事件对系统进行针对性修复,提高了系统的工作效率。SOI通过自回归模型计算动态阈值,它根据自变量自身的规律来预测未来的情况。SOI动态阈值的包含两部分,一部分是基于历史数据统计

15、,用于判断系统不同寻常的变化;另一部分是基于短期的时间序列(AR自回归模型)动态阈值,用于判断系统的突变。通过这样一些有专利的自学习方法,检测出系统超出正常范围的变化,使负载异常波动的检测更为准确,同时避免静态阈值带来的误报。客户价值:减少性能问题的误报现象,提升管理员维护系统的效率。趋势预测SOI支持前瞻性地分析系统容量的未来趋势。它能够直观的展示资源容量未来趋势走向。通过性能趋势和前瞻性预测可以清楚了解目前及未来的资源需求和使用情况,提前进行合理的容量管理和规划。技术原理:SOI分析过去一段时间的系统CPU、内存、磁盘资源消耗情况,综合运用线性预测和非线性回归等算法,预测未来一段时间内,资

16、源可能的消耗情况。趋势预测主要采用回归算法,通过对已知指标样本序列的多种拟合,选出相关系数最大的回归方式,然后推测指标的发展趋势。所采用的主要回归算法有:一元线性回归指数回归(EXP)幂函数回归(POW)对数回归(LOG)S曲线回归(S-Curve)例如,一元线性回归表达式如下:最简单的线性式是写成行列式:直接给出该式的参数解:其中,为t值的算术平均值。也可解得如下形式:客户价值:趋势预测根据历史数据分析趋势情况,预测可能出现的过载、资源不足等问题,以便提前准备,变被动检测为主动预警。通过趋势预测,可以提前了解当前及未来的资源需求和可能出现的资源瓶颈,从而合理的进行系统容量管理和规划。容量合规

17、SOI支持评估系统中虚拟机和主机的容量规格是否合理。技术原理:SOI根据虚拟机、主机长期的资源使用情况,评估可满足工作负载要求的建议资源数量。判断系统中的虚拟机和主机的配置是否过度或不足,避免过度配置造成的资源浪费和过少配置造成的性能问题,以便减少硬件购买投资和预算,节省资源。SOI提供容量优化视图详细展现资源优化数据。容量优化视图有助于更高效地使用资源。利用这些视图可以确定如何回收浪费的容量。包括:未充分利用的主机过度利用的主机容量过剩的虚拟机容量不足的虚拟机SOI长期监控虚拟机和主机的性能指标,获取其工作负载Workload,并取忙时结果作为虚拟机和主机资源的实际需求量。然后在充分考虑资源

18、预留的情况下,对比实际分配的资源,以判断虚拟机和主机是否存在容量不足,或者容量过剩。客户价值:SOI评估判断系统中的虚拟机和主机的配置是否过度或不足,这样可以避免过度配置造成的资源浪费和过少配置造成的性能问题。管理员通过识别未充分利用的资源详情,可以了解哪些资源容量过剩或者使用不足,为提升和调整资源使用效率提供决策依据。SOI监控规模和规格SOI以虚拟机方式,单机部署在管理平面,并提供单独的Portal界面。一套FusionCompute(VRM)对应部署一套SOI进行监控。一套SOI最大支持10000VM的监控规模,具体支持的监控规模和对应虚拟机规格如 REF _Ref418618799 r h 表2-1所示。FusionSphere SOI最大监控规模和规格节点类型规划模式CPU内存硬盘最大用户规模FusionSphere SOI单点(虚拟机)4VCPU8G300G3000 VM以内8VCPU12G300G30005000VM16VCPU16G300G500010000VM综述总结FusionSphere SOI收集和分析性能数据,关联异常并确定性能问题。SOI全面分析性能三维度:工作负载、性能和容量。它考察虚拟机和主机的工作负

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论