企业级性能管理与容量规划概述_第1页
企业级性能管理与容量规划概述_第2页
企业级性能管理与容量规划概述_第3页
企业级性能管理与容量规划概述_第4页
企业级性能管理与容量规划概述_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、企业数据中心建设最佳实践企业数据中心建设最佳实践构建高性能,高可扩展性及高可用性的企业信息系统构建高性能,高可扩展性及高可用性的企业信息系统企业级性能管理与容量规划概述企业级性能管理与容量规划概述建立企业级容量规划、性能管理的业务效益建立企业级容量规划、性能管理的业务效益针对业务部门的需求,集成信息科技主管部门、软件开发中心、测试中心针对业务部门的需求,集成信息科技主管部门、软件开发中心、测试中心及运行中心等部门,通过统一、规范化的管理平台,对业务服务生命周期及运行中心等部门,通过统一、规范化的管理平台,对业务服务生命周期的容量规划、性能管理的流程。的容量规划、性能管理的流程。通过对通过对IT

2、IT资源容量有效的管理及对运行性能持续地监控,降低业务服务中资源容量有效的管理及对运行性能持续地监控,降低业务服务中断的风险。断的风险。提前在新应用开发、测试阶段,建立起性能管理、容量规划的基线,从而提前在新应用开发、测试阶段,建立起性能管理、容量规划的基线,从而了解新应用、或现有应用大版本变更对于现有生产运营带来的影响,从而了解新应用、或现有应用大版本变更对于现有生产运营带来的影响,从而降低与新的或改进的服务项目相关的风险。降低与新的或改进的服务项目相关的风险。提高提高ITIT资源容量的利用效率,在恰当的时候及时适量投资,这意味着采购资源容量的利用效率,在恰当的时候及时适量投资,这意味着采购

3、流程再也不需要应付临时的采购或超前于需求而购买过度的容量,从而总流程再也不需要应付临时的采购或超前于需求而购买过度的容量,从而总体成本降低了。体成本降低了。通过在确定变更对通过在确定变更对ITIT容量的影响时与变更管理密切配合,防止了由于不恰容量的影响时与变更管理密切配合,防止了由于不恰当或不正确的容量估计所导致的紧急变更,从而降低了业务运作中断的次当或不正确的容量估计所导致的紧急变更,从而降低了业务运作中断的次数。数。更为灵活的预测使得对业务需求的响应变得更快速和更准确。更为灵活的预测使得对业务需求的响应变得更快速和更准确。 职业装定制职业装定制 工服定做工服定做容量规划、性能管理及相互关系

4、容量规划、性能管理及相互关系容量规划主要管理以下几个方面:容量规划主要管理以下几个方面:-处理容量的购买成本相对于业务需求来说,是否合理以及处理容量是否以最有效处理容量的购买成本相对于业务需求来说,是否合理以及处理容量是否以最有效的方式的方式( (成本成本vsvs容量容量) )被加以利用?被加以利用?-当前的处理容量是否足够满足业务当前以及未来的需求当前的处理容量是否足够满足业务当前以及未来的需求( (供给供给vsvs需求需求) )?-现有的处理容量是否发挥了最大的效率现有的处理容量是否发挥了最大的效率( (性能管理、调整性能管理、调整) )?-额外的处理容量准确地讲应该在什么时候形成?额外的

5、处理容量准确地讲应该在什么时候形成?-是否知道未来需要什么样的是否知道未来需要什么样的ITIT容量以及何时需要这种容量?容量以及何时需要这种容量?容量规划与性能管理是互为包含的关系,是一个循环的交互关系容量规划与性能管理是互为包含的关系,是一个循环的交互关系: :-性能管理:为优化整体运营绩效而评价、监控和调整性能管理:为优化整体运营绩效而评价、监控和调整ITIT基础设施组件的性能的活基础设施组件的性能的活动。动。-容量规划:根据容量管理数据库分析当前的情况、预测容量规划:根据容量管理数据库分析当前的情况、预测ITIT基础设施未来的使用情基础设施未来的使用情况以及为满足预计的况以及为满足预计的

6、ITIT服务需求而需要的资源,从而制定容量计划的过程。服务需求而需要的资源,从而制定容量计划的过程。-建模:使用分析、模拟和趋势预测模型来确定服务的容量需求以及确定最佳的容建模:使用分析、模拟和趋势预测模型来确定服务的容量需求以及确定最佳的容量方案的过程。模拟需要分析各种不同的情形,并分析各种量方案的过程。模拟需要分析各种不同的情形,并分析各种“如果如果怎么办怎么办”式的问题。式的问题。 职业装定制职业装定制 工服定做工服定做通过获取系统性能信息通过获取系统性能信息, ,全面掌控历史性能与容量趋势全面掌控历史性能与容量趋势依据当前系统信息依据当前系统信息, ,预测业务增长的情况下预测业务增长的

7、情况下, ,系统资源的使用的和性能响应系统资源的使用的和性能响应目标目标:维持现有维持现有ITIT服务能力的成本相对于组织的业务需求而言是合理的吗?服务能力的成本相对于组织的业务需求而言是合理的吗? 现有的现有的ITIT服务能力能满足当前及将来的客户需求吗?服务能力能满足当前及将来的客户需求吗? 现有的现有的ITIT服务能力发挥了其最佳效果吗?服务能力发挥了其最佳效果吗? 方法方法: 量化管理量化管理致力于解决以下问题致力于解决以下问题:评价和改进现有服务能力,确保服务水平的承诺评价和改进现有服务能力,确保服务水平的承诺评估当前评估当前ITIT资源的使用,确保高效地使用资源资源的使用,确保高效

8、地使用资源分析并预测未来的业务需求,据此确定当前最佳容量以及未来应当配置的容量和对应的服务水平能力分析并预测未来的业务需求,据此确定当前最佳容量以及未来应当配置的容量和对应的服务水平能力容量规划和性能管理目标及方法容量规划和性能管理目标及方法生成管理报告异常?分析异常性能瓶颈?需调优?系统或应用调优生成容量计划采购并部署新加容量是否下一个流程周期下一个流程周期否是是否采集数据: 生产系统数据 新应用性能数据 测试中心压力测试数据容量和性能管理是一个持续的管理流程容量和性能管理是一个持续的管理流程容量规划和性能管理是一个持续的管理流程容量规划和性能管理是一个持续的管理流程 流程负责人流程负责人设

9、计并确定容量规划和性能管理流程设计并确定容量规划和性能管理流程 流程负责人流程负责人设计并确定该流程的角色和责任设计并确定该流程的角色和责任 技术专家分析并确定管理需求,相关指标以及需要使用的工具技术专家分析并确定管理需求,相关指标以及需要使用的工具 对于优化建议,技术专家负责规划优化行动对于优化建议,技术专家负责规划优化行动 技术专家负责利用相应的调优工具,进行相应的系统或应用的调优工作技术专家负责利用相应的调优工具,进行相应的系统或应用的调优工作 优化后仍不满足要求,容量规划师负责提出增容建议优化后仍不满足要求,容量规划师负责提出增容建议 各管理环境的数据采集专各管理环境的数据采集专家负责

10、建立数据采集机制家负责建立数据采集机制 数据采集专家根据流程定数据采集专家根据流程定义的采集周期定期地使用义的采集周期定期地使用相关的工具采集所需的容相关的工具采集所需的容量和性能指标并进行存储量和性能指标并进行存储收集数据收集数据生成容量计划生成容量计划规划容量和性能管理流程规划容量和性能管理流程监控并分析数据监控并分析数据规划并启动优化行动规划并启动优化行动汇报结果汇报结果 容量规划师根据容量管理报告,根据历容量规划师根据容量管理报告,根据历史信息定期预测未来容量需求史信息定期预测未来容量需求 对于增容建议,容量规划师负责制定相对于增容建议,容量规划师负责制定相应的容量规划应的容量规划 各

11、管理环境的数据评估专家根据已各管理环境的数据评估专家根据已存的容量和性能指标,生成所需的存的容量和性能指标,生成所需的性能管理报告、异常报告以及容量性能管理报告、异常报告以及容量管理报告管理报告 技术专家根据异常报告分析异常指技术专家根据异常报告分析异常指标,结合性能管理报告找到异常原标,结合性能管理报告找到异常原因并提出改进建议因并提出改进建议(优化或增容优化或增容) 流程负责人负责监督管理流程流程负责人负责监督管理流程的执行的执行 流程负责人定期向上级汇报容流程负责人定期向上级汇报容量规划和性能管理的结果量规划和性能管理的结果容量和性能管理是一个持续的管理流程容量和性能管理是一个持续的管理

12、流程容量规划和性能管理是一个持续的管理流程容量规划和性能管理是一个持续的管理流程重要角色重要角色企业系统性能架构师企业系统性能架构师从宏观把控性能与容量的需求,技术以及流程业务代表业务代表作为业务部门的代表,提供性能标准,未来新业务开展及已有业务增长情况数据评估与采集专家数据评估与采集专家采集,存储基础数据,生成所需的报告容量规划师容量规划师跟踪项目确保与容量相关的服务级别合乎既定的要求技术专家技术专家作为某个特定领域的资深技术人员,深入分析优化的可能性并优化流程负责人流程负责人类似于项目经理的角色,确保流程合规执行容量和性能管理的人员组成容量和性能管理的人员组成容量和性能管理的人员组成容量和

13、性能管理的人员组成管理报表分类管理报表分类报表类型-管理层报表,技术层报表-概况、趋势、异常、详细报表-固定报表(日、周、月、年趋势)和交互报表专业条线报表-专业条块分类l主机系统,分布式系统l网络系统l存储系统-专业报告类型l性能报表l健康检查报表l性能对比报表l系统容量报表l容量预估报表业务条线-交易种类和渠道统计报表主机平台主机平台容量和性能管理报表容量和性能管理报表性能管理日报-生产主机系统性能健康检查日报-生产主机系统性能管理日报-生产主机操作系统专业性能日报-生产主机系统RMF III日报-生产主机联机子系统性能管理日报-生产主机数据库子系统性能管理日报-生产主机批量性能日报-生产

14、主机存储性能及容量指标日报性能管理周报-生产主机系统性能健康检查周报-生产主机系统性能管理周报性能管理月报-生产主机系统性能健康检查月报-生产主机系统性能管理月报系统容量管理报表容量预估管理报表 哪些由性能容量工具产生? 哪些需要系统手段产生分布式系统平台监控系统硬件资源的性能报表分布式系统平台监控系统硬件资源的性能报表系统信息-包括虚拟空间利用率、页面读写错误情况、物理内存和虚拟内存使用情况、CPU利用率、平均负载情况磁盘资源-包括空间利用率、节点(i-node)利用率、磁盘读写繁忙程度等。进程-包括CPU利用率的进程、耗用内存最大的十个进程、进程利用情况列表其它监控资源-磁盘性能-RPC调

15、用的性能情况-用户访问情况-服务器网络使用情况-文件情况网络硬件资源的性能报表,端口或线路的质量和使用率网络硬件资源的性能报表,端口或线路的质量和使用率网络设备级报表-CPU利用率-内存利用率-Buffer利用率端口、线路的报表:-端口速率-带宽利用率-丢包率-错包率-SAA存储容量和性能管理报表存储容量和性能管理报表与系统有关的性能管理,参照主机系统、开放系统相关的内容就存储子系统本身而言-卷和数据的均衡分布是使性能达到最大的最重要的因素-需要考虑cache block与文件系统及数据库的匹配-联机交易系统l最重要的IO性能指标是每秒的IO数和响应时间l其次是吞吐量-批处理应用l吞吐量是最需

16、要重点考虑的-采用TPC等工具来实现对存储性能的监测。其中TPC所监测到的存储前端性能指标,可以和服务器上取得的RMF report,IO stat的值相对应。-监测存储前端的卷的性能参数包括IO rate, data rate, response time,读写比,IO块大小等,其中读操作的cache命中率是判断IO特性的重要指标-后端性能参数主要包括array和rank级别的IO rate, data rate,response time,NVS full等参数,可以判断存储后端是否存在瓶颈,这些参数通常无法在服务器上取得-通过取得的性能指标,结合disk magic和capacity m

17、agic可以对存储更好地planning容量、性能管理贯穿在整个解决方案的生命周期中容量、性能管理贯穿在整个解决方案的生命周期中异地灾备中心异地灾备中心运行中心运行中心及及同城灾备中心同城灾备中心开发中心开发中心测试中心测试中心数据中心数据中心信息科技信息科技主管部门主管部门SLA的性能需求业务部门业务部门1.建立 容量、性能管理委员会,由一部三中心的人员组成2.按照SLA形成、维护性能的KPI3.技术研究(产品性能白皮书,性能基线)4.定期的容量规划评估会5.根据容量预测,安排资源采购1.性能监控及跟踪2.性能、容量信息收集,分析,评估3.系统性能调优1.新应用性能预估、建模2.大版本变更性

18、能预估、建模3.应用性能调优4.应用性能建模1.按照SLA进行性能测试2.压力测试需求、设计需求、设计开发开发测试测试发布发布生产生产研讨:公司在构建企业级容量评估、性能管理方面需要研讨:公司在构建企业级容量评估、性能管理方面需要做哪些改进?做哪些改进?思考一下-组织架构?-规范流程?-人员技能?-辅助工具?-预算开销?企业级性能、容量管理总体功能架构企业级性能、容量管理总体功能架构容量Performance投资回报服务级别报告性能报告技术条线,业务服务管理报表记录/结构定义历史数据储存SQL 查询被管理技术模块主机开放网络存储数据收集容量/性能分析汇总报表监控系统性能建模基于业务的性能管理企

19、业级性能、容量管理总体平台参考架构企业级性能、容量管理总体平台参考架构TivoliPerformance Modeling RMF, SMFEnterprise Portal开发中心开发中心测试中心测试中心数据中心数据中心信息科技信息科技主管部门主管部门性能管理的定义性能管理的定义性能管理就是计划、定义、测性能管理就是计划、定义、测量、分析、报告和调整计算机量、分析、报告和调整计算机资源性能的过程。这些资源包资源性能的过程。这些资源包括:括:-主机系统硬件,如主机系统硬件,如CPUCPU,I/OI/O等等-操作系统和子系统,如操作系统和子系统,如z/OSz/OS,CICSCICS,DB2DB2

20、等等-数据网络数据网络-应用系统应用系统-服务服务历史趋势分析和报告以及资源历史趋势分析和报告以及资源容量的规划也是和性能管理相容量的规划也是和性能管理相关的重要内容关的重要内容性能管理的目标性能管理的目标性能管理的目标就是:通过有效地使用资源来达到性能服务水性能管理的目标就是:通过有效地使用资源来达到性能服务水平平(SLA)(SLA)的承诺。的承诺。通过对性能的调整降低响应时间、提高吞吐量,在满足通过对性能的调整降低响应时间、提高吞吐量,在满足SLASLA的的基础上减少消耗。基础上减少消耗。性能管理的目标性能管理的目标统一的性能报告统一的性能报告制定性能管理的标准和程序手册制定性能管理的标准

21、和程序手册性能管理的组织架构性能管理人员和他们的职责性能管理所适用的环境性能测量的标准报告的需求性能管理工具历史文件趋势分析性能管理例会报告和解决性能管理中的问题。性能管理的主要模块性能管理的主要模块数据收集:每日收集性能数据,积累形成周、月、年度等数据为性能分析和趋势分析提供原始数据;每日收集性能数据,积累形成周、月、年度等数据为性能分析和趋势分析提供原始数据;数据保留:制定性能数据的保存介质和期限;制定性能数据的保存介质和期限;信息处理:日常规定的性能报告或管理层要求的报告处理作业;日常规定的性能报告或管理层要求的报告处理作业;信息报告:主要以管理层的要求为主。主要针对性能瓶颈的分析和确定

22、何时需要进行升级。主要以管理层的要求为主。主要针对性能瓶颈的分析和确定何时需要进行升级。性能管理周期性能管理周期当解决了一个瓶颈后,重新测量、重新评估性能来验证没有造成别的限制并确保所做的变更升效了性能管理的步骤性能管理的步骤定义服务水平目标(SLA)和度量标准收集性能数据从性能数据中创建有价值的报表分析性能报告来确定是否满足了目标识别系统中的潜在瓶颈分析可疑瓶颈处的详细性能数据决定从哪可以获得所需的资源验证是否消除了性能瓶颈主机性能指标主机性能指标 - -宏观性能指标宏观性能指标响应时间(Response Time)外部吞吐率(ETR)和内部吞吐率(ITR)系统饱和点(SDP)资源使用率(U

23、tilization)主机性能指标主机性能指标 - -宏观性能指标宏观性能指标 响应时间响应时间主机性能指标主机性能指标 - -宏观性能指标宏观性能指标 吞吐率吞吐率ETR: 按照Elapse Time来测量,注重系统容量;ITR: 按照CPU时间来测量,注重CPU的容量提问:对于相同的工作负载提问:对于相同的工作负载, 哪个系统更好?哪个系统更好?主机性能指标主机性能指标 - -宏观性能指标宏观性能指标 系统饱和点系统饱和点SDPSDP的定义是,为保证一个的定义是,为保证一个系统在小间隔内的使用率不系统在小间隔内的使用率不超过超过100%100%,最大的平均大间,最大的平均大间隔的使用率。隔

24、的使用率。大间隔、小间隔的选择(例大间隔、小间隔的选择(例如如1 1小时、小时、1 1分钟),决定于分钟),决定于用户的忍耐程度。用户的忍耐程度。例如,用户在一小时内不能例如,用户在一小时内不能容忍任何一分钟的使用率达容忍任何一分钟的使用率达到到100%100%,那么小时平均使用,那么小时平均使用率就不能超过计算出的率就不能超过计算出的SDPSDP值。值。假设,小时平均值为假设,小时平均值为80%80%,而此小时内分钟峰值为而此小时内分钟峰值为92%92%,则,则SDP=80SDP=80* *100/92 = 87%100/92 = 87%0102030405060708090100CPU %

25、 busy0.000.501.001.502.00Response Time (seconds)Low PrtyMedium PrtyHigh PrtyResponse Time vs CPU (%) BusyCompares Different Prty Workloads混合工作负载时响应时间与混合工作负载时响应时间与CPUCPU利用率关系图利用率关系图主机性能指标主机性能指标 - - 微观性能指标微观性能指标 I/O I/OIO Response = IOSQ + Pending + Connect + DisconnectI IOS Queue Time: 表示在表示在z/OSz/OS

26、中设备等待的时间中设备等待的时间. . Pending time: 表示从发出表示从发出SSCHSSCH指令直到指令直到ChannelChannel和和I/OI/O控制器之间开始对话控制器之间开始对话. .Disconnect time: I/OI/O操作已经开始,但是操作已经开始,但是ChannelChannel和和I/OI/O控制器之间没有对话控制器之间没有对话. .Connect time: ChannelChannel和和I/OI/O控制器控制器CacheCache之间作数据传输或交换控制信息之间作数据传输或交换控制信息. .应用性能指标应用性能指标 不同的代码编写方式对系统性能的影响

27、是不一样的不同的代码编写方式对系统性能的影响是不一样的应用程序性能指标体现在应用程序性能指标体现在-代码的编写方式-CICS指令写法-DB2 SQL语句写法-文件组织方式及定义属性-其他如果应用程序存在性能问题,如果应用程序存在性能问题,ITRITR往往不会线性增长,导致不能正确预估系统容往往不会线性增长,导致不能正确预估系统容量量如果某支交易存在应用程序性能问题,往往会影响其他如果某支交易存在应用程序性能问题,往往会影响其他80%80%正常交易的运行正常交易的运行性能管理的工具性能管理的工具联机工具-Tivoli OMEGAMON 系列-SMF-CICS CMF-DB2 Trace-RMF-

28、z/OS Management Console-后处理工具-Tivoli Decision Support-CICSPA-DB2 PE-应用性能分析工具-Application Performance Analyzer -高级管理系统-包括性能数据仓库以及报表/展现工具性能管理交付件性能管理交付件性能管理手册性能管理的系统和数据仓库SMFRMF IRMF IIITDSTPMC programDB2DSDSDSDSREPORTHTMLWEBUIWebBIRTWASPer & Cap DataData CollectTWSDataSourceBusinessLogicView Layer各种日常报

29、告和趋势分析报告、系统资源调优/升级建议等性能管理日志性能管理自动化及其主要需求性能管理自动化及其主要需求全面的数据源采集,支持技术人员在对性能问题进行深层次的分析时能够及时获取所需的所有数据,提高问题分析的效率数据采集、加工与存储应形成一个高度自动化的流程根据管理需要,采集关键的性能指标性能分析支持中长期分析和短期分析通过生成日趋势、周趋势、月趋势报告支持长期历史趋势分析性能好坏的评判通常是通过与历史同期性能数据对比得出的相对结论提供面向业务的性能统计信息易于扩展及维护,尽量避免由于核心系统软件升级,SMF数据格式改变时所带来的开发维护工作量难点难点直接从SMF中抽取并加工数据,确保主机性能

30、容量数据的完整性生产SMF数据的庞大,要求数据抽取的高效率支持对用户自定义数据包括业务数据的采集存放。例如为主机成本核算系统提供参数数据(交易与业务的对应表、业务与部室的对应表等)确定由于新需求或核心系统软件升级引起的SMF格式变更,所带来的开发和维护工作量实现高度自动化的统计加工机制设定历史数据的维护策略,自动清理大量的过期数据实现方法实现方法采用专门管理工具,做到:-实现SMF数据抽取、统计加工、存储以及报表生成的高度自动化-在出现SMF格式变更时只需通过打补丁的方式即可支持-提供最佳管理经验的样本报表,提高实施速度利用一个现有的、不太繁忙的LPAR进行性能容量管理每天晚间通过批量方式自动

31、提交SMF数据采集作业,自动生成固定报表考虑所在系统和数据库的性能,建议只采集管理所需的数据根据用户角色对用户访问权限进行设定对原始数据表设定过期清理策略对特定时间段,建立专门的数据表,永久保存性能趋势分析功能 可以生成日报、周报和月报等性能趋势报表性能健康检查功能 可以对异常指标进行提示完善数据采集功能 通过批量作业方式完成对SMF等历史数据的全面采集 报表功能 可以生成概况、趋势、异常、详细等各种类型的性能报表图形化视图功能 提供Web图形报表展现短期性能分析功能 可以收集RMFIII数据,并存储到性能容量数据库中,通过SQL生成相应报表 用户分级访问功能 可以提供多角色报表访问功能具体的

32、功能要求具体的功能要求原理示例原理示例SMF数据其它日志数据日志收集器性能容量数据仓库各种性能容量报表SQL SMF数据日志定义日志例外处理记录定义记录例外处理加工定义映射表数据表加工定义SQL查询报表数据采集流程数据采集流程主机平台容量规划主机平台容量规划容量规划的定义容量规划的定义容量规划就是根据容量管理数据库分析当前的性能和容量规划就是根据容量管理数据库分析当前的性能和容量情况、预测容量情况、预测ITIT基础设施未来的使用情况以及为满基础设施未来的使用情况以及为满足预计的足预计的ITIT服务需求而需要的资源,从而制定容量计服务需求而需要的资源,从而制定容量计划的过程划的过程容量规划包括了

33、系统建模,即使用分析、模拟和趋势容量规划包括了系统建模,即使用分析、模拟和趋势预测模型来确定服务的容量需求以及确定最佳的容量预测模型来确定服务的容量需求以及确定最佳的容量方案的过程。建模需要分析各种不同的情形,并分析方案的过程。建模需要分析各种不同的情形,并分析各种各种“如果如果怎么办怎么办”式的问题式的问题当前、历史趋势以及容量规划也是和性能管理相关的当前、历史趋势以及容量规划也是和性能管理相关的重要内容重要内容容量规划的目标容量规划的目标容量规划的目标就是:在恰当的时间增加容量来达到服务水平容量规划的目标就是:在恰当的时间增加容量来达到服务水平(SLA)(SLA)的承诺。的承诺。通过对容量

34、的科学分析和预测,准确预测出未来的容量需求和通过对容量的科学分析和预测,准确预测出未来的容量需求和服务水平服务水平创建容量规划数据库创建容量规划数据库业务预测 服务数据 技术数据 财务数据 CDB 管理报告 容量规划 技术报告 容量规划报告容量规划报告容量规划报告描述了当前及未来对IT基础设施容量的需求、IT服务需求方面的预期变化容量规划报告还说明了在考虑未来服务级别需求的情况下,以可接受的成本提供SLA中约定的服务级别而需要做出的变更容量规划报告不仅需要描述预计的变更,而且要指出相关的成本容量规划报告应当每年进行一次修订,同时为保证其准确性应当每季度进行一次审查容量规划报告是容量规划流程最重

35、要的交付件容量规划报告应当包含性能预测、升级点、基础设施升级的预计成本等方面的信息容量规划自动化容量规划自动化根据性能容量管理数据库分析当前的情况、预测IT基础设施未来的使用情况以及为满足预计的IT服务需求而需要的资源,从而制定容量计划的过程使用分析、模拟和趋势预测模型来确定服务的容量需求以及确定最佳的容量方案的过程。建模需要分析各种不同的情形,并分析各种“如果怎么办”式的问题容量规划的效益:-防止由于不恰当或不正确的容量估计所导致的业务风险-前瞻性地科学预测为容量采购的决策提供了依据,避免超前于需求而购买过度容量的采购行为,从而节省总体成本关键点 - - 确保满足服务水平确保满足服务水平 -

36、 - 及时的、主动的、前瞻性预测及时的、主动的、前瞻性预测 - - 性能是核心指标性能是核心指标( (而不是利用率而不是利用率) )上级主管部门有时会问难以量化回答的问题上级主管部门有时会问难以量化回答的问题- 如果不升级,情况会糟糕到什么程度?- 如果升级,情况会好到什么程度?- 在下次升级前,可以维持多长时间? 需要借助于方法论及自动化工具进行量化预测需要借助于方法论及自动化工具进行量化预测- 模拟方法- 分析方法 需要具备性能建模的能力需要具备性能建模的能力驱动力一:量化驱动力一:量化 不断变化的复杂环境不断变化的复杂环境 工作负载的性能取决于多个因素:工作负载的性能取决于多个因素:-

37、负载优先级- 高优先级负载的占比- CPU的数量与速度- Paging - I/O子系统的限制- LPAR的影响 性能难于推测性能难于推测 没有适当的工具,容量规划将只能依靠没有适当的工具,容量规划将只能依靠“拍脑袋拍脑袋”驱动力二:预测驱动力二:预测 实现方法实现方法科学的预测手段:精确、简便易用预测多维度:不仅关注CPU的性能,还要关注存储的未来增长以具有代表性的高峰期数据为基准,而不是某段均值建立周期性预测机制环境变化时,需要重新依据新基准值进行预测不能忽略低优先级负载的性能运行环境基本不变,包括交易模式、应用和系统不变业务行为规律不变,根据业务行为规律,建立不同时期的模型分别进行建模预

38、测重大变更发生时,例如新应用上线或系统核心组件升级,需要重新建模预测最佳实践:建立容量规划自动化操作流程,每月建模预测准确预测的前提准确预测的前提系统建模系统建模系统建模主要用于预测基础设施的运行状况建模方法-线性预测(趋势分析,大致预测)-分析性模拟(结果可靠性不高)-仿真模拟仿真模拟( (预测复杂环境较准确预测复杂环境较准确) )-系统实际运行基线(最准确,但代价最高)建模结果应包括反映服务水平的核心指标,为容量规划提供量化依据仿真模拟技术示例仿真模拟技术示例根据实际数据,选择具有代表性的时间段建立模型模型生成过程中,时间被划分成多个时间片。在每个时间间隔(最小间隔为0.01秒)的开始,模

39、型会检查每个工作负载。对于联机交易来说,模型会决定是否产生一个新的交易。模型将根据平均到达率来产生新的交易模型产生后,将确定工作负载运行情况,确定每个工作负载的交易率和单个交易消耗的CPU以及I/O率等模拟指标利用假设条件,基于模型进行模拟运算,得出预测结果仿真模拟方法仿真模拟方法根据一个特定的时间段内的实际系统的运行情况创建一个模型选择的时间段非常重要,因为模拟会以此作为基准,来比较不同的预测场景最佳实践是挑出一个典型的系统利用率比较高的时间段(不必盲目追求所有高峰期中的最高点) 模拟不是试图去预测未来的平均性能情况,而是预测接近于最坏性能的情况,这种情况通常会导致服务中断模拟数据收集与预测

40、模拟数据收集与预测从SMF记录中生成CPU和工作负载报告作为基础数据可以通过选择若干天的某个特定时段来缩短报告的大小最佳实践是选择五个连续工作日的高峰时段的系统利用率 依据长期历史趋势分析出的交易增长结果作为预测假设条件,预测未来保持现有环境或假设硬件升级的情况下,CPU利用率和响应时间主机平台主机平台应用容量评估应用容量评估54系统资源系统资源-CPU资源-内存-存储应用交易处理容量衡量标准应用交易处理容量衡量标准-吞吐量(每秒处理交易数)-响应时间应用容量评估应用容量评估55基准理论基准理论 吞吐量与吞吐量与CPUCPU使用率的关系使用率的关系56基准理论基准理论 响应时间与吞吐量的关系响

41、应时间与吞吐量的关系5720%20%的交易消耗的交易消耗80%80%的资源的资源20%20%的交易在某些情况下,微小的交易量变化会影响整个系统的交易的交易在某些情况下,微小的交易量变化会影响整个系统的交易处理处理在真实环境中,会同时有许多不同种类的交易并发运行,因为不同在真实环境中,会同时有许多不同种类的交易并发运行,因为不同交易占用的交易占用的CPUCPU资源不一样,因此对系统影响也会不一样,在实际环资源不一样,因此对系统影响也会不一样,在实际环境中,应尽量避免长交易(高境中,应尽量避免长交易(高CPUCPU消耗)的大量运行,比如可以通过消耗)的大量运行,比如可以通过设置设置TCLASSTC

42、LASS来保证系统资源的分配。来保证系统资源的分配。通常情况下,批量作业相当于长交易通常情况下,批量作业相当于长交易基准理论基准理论 二八定律二八定律58理想情况下,单系统交易处理的拐点在理想情况下,单系统交易处理的拐点在98-99%98-99%左右左右多节点环境下,因为并行耦合器有一定的内耗,通常情况下,从多节点环境下,因为并行耦合器有一定的内耗,通常情况下,从单系统到单系统到2 2节点的系统,内耗在节点的系统,内耗在10-12%10-12%左右左右随节点数目的增加,每增加一个节点,内耗会增加随节点数目的增加,每增加一个节点,内耗会增加2%2%左右左右耦合效率计算公式耦合效率计算公式基准理论

43、基准理论 多节点内耗多节点内耗59I/OI/O对交易处理能力的影响对交易处理能力的影响-如果交易有I/O问题,则交易响应时间与吞吐量往往不呈线性关系,工作负载的增加对CPU利用率的变化也不呈线性关系。并行耦合器并行耦合器CPUCPU利用率对交易处理能力的影响利用率对交易处理能力的影响-理论上,并行耦合器的CPU利用率超过50%,会对交易处理有一定的影响其他因素对交易处理能力的影响60确保交易不存在明显的确保交易不存在明显的I/OI/O问题问题-如果交易存在有I/O问题,就无法通过增加CPU资源来提升交易处理能力。避免并行耦合器的避免并行耦合器的CPUCPU利用率过高,不要超过利用率过高,不要超

44、过50%50%确定交易混和比例确定交易混和比例-尽量与真实生产系统接近-考虑联机交易和批量作业间的互相影响明确测试目标明确测试目标-通常以交易响应时间为标准-明确交易优先级别压力测试前提压力测试前提61当交易响应时间合乎性能指标时,计算不同工作负载的当交易响应时间合乎性能指标时,计算不同工作负载的ITRITR分析分析ITRITR是否线性增长,如果线性增长,以此是否线性增长,如果线性增长,以此ITRITR值来估算系值来估算系统容量配置统容量配置估算时,应考虑估算时,应考虑I/OI/O对交易的影响,工作负载越大,对交易的影响,工作负载越大,I/OI/O竞争竞争越多,建议工作负载应尽量接近真实生产系

45、统环境越多,建议工作负载应尽量接近真实生产系统环境测试结果分析测试结果分析What is Performance?响应时间描述系统的速度响应时间描述系统的速度 联机响应时间联机响应时间 批量运行时间批量运行时间吞吐量描述单位时间内系统处理的业务量吞吐量描述单位时间内系统处理的业务量 每秒交易数(每秒交易数(TPS) 每小时记录数每小时记录数容量描述系统拥有的各种资源总量容量描述系统拥有的各种资源总量 处理器颗数以及处理器速度处理器颗数以及处理器速度 磁盘空间磁盘空间 网络带宽网络带宽性能指标分为三大类:性能指标分为三大类:响应时间,吞吐量,容量响应时间,吞吐量,容量对于新应用开发而言,容量估计

46、工作开始的越早越好对于新应用开发而言,容量估计工作开始的越早越好全面的了解业务规模,各项应用与系统指标是进行精确全面的了解业务规模,各项应用与系统指标是进行精确性能估算的前提性能估算的前提如今的系统通常都包含了异构的客户机和服务器,跨多如今的系统通常都包含了异构的客户机和服务器,跨多个地理区域和逻辑层级个地理区域和逻辑层级性能架构师必须端到端的考量整个系统结构,包括涉及性能架构师必须端到端的考量整个系统结构,包括涉及到的单个组件的特征和应用的特性到的单个组件的特征和应用的特性系统是如何组织的?-逻辑层级,地理区域以及系统的拓扑逻辑-系统内各个组件的功能系统内有哪些资源可供调用?-它们的性能特征

47、又如何?应用变更的影响有多大?-批量与联机-响应时间-补丁策略 有多种实现方法有多种实现方法 有有“胖胖”客户端与客户端与“瘦瘦”客户端客户端 根据具体配置进行分析根据具体配置进行分析 网络流量非常关键网络流量非常关键客户机服务器客户机服务器系统结构系统结构绝大多数新系统的架构绝大多数新系统的架构 把若干个单一功能的组件用多个逻辑层级的方式组装起来把若干个单一功能的组件用多个逻辑层级的方式组装起来 网络是性能的关键所在网络是性能的关键所在 良好的用户体验是一个极其重要的需求良好的用户体验是一个极其重要的需求 小心美工小心美工 负载难以预测负载难以预测 要充分考虑到可扩展性要充分考虑到可扩展性基于基于WebWeb的系统的系统系统结构系统结构操作系统 通讯控制器交易中间件数据库等待I/O 服务时间 处理时间CPU (milliseconds)# I/OSELECT - one row352FETCH - next100.1DELETE - one row604典型的原子资源消耗典型的原子资源消耗处理器服务器处理器服务器组件特性组件特性l 内存 尽可能消除页面调度(paging) 估算工作集(working sets) 分别考虑系统自身的消耗以及各组件的消耗 千万别按照软件的最小需求配置内存l 任务调度逻辑 管理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论