版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1数据中心算力技术要求和测评方法本文件规定了面向数据中心算力全生命周期,覆盖算力接入、算力度量、算力调度、算力运营等的技术要求以及算力测评方法。本文件适用于数据中心规划、设计、建设、运维等环节。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件。仅该日期对应的版本适用于本文件,不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T43331-2023互联网数据中心(IDC)技术和分级要求3术语和定义下列术语和定义适用于本文件数据中心datacenter由计算机场地(机房),其他基础设施、信息系统软硬件、信息资源(数据)和人员以及相应的规章制度组成的实体。服务器对数据进行处理并实现结果输出的一种能力,是衡量设备或系统计算能力的一个综合指标,数值越大代表综合计算能力越强,包含以CPU为代表的通用计算能力和以GPU为代表的高性能算力。数据中心算力与功率的比值,即“数据中心单位功率所产生的算力”,是同时考虑计算性能与功率的一种效率。数值越大,代表单位功率的算力越强,效能越高。算力度量hashratemeasurement对不同计算类型的异构算力资源进行统一抽象描述,实现异构物理资源的统一资源描述,形成算力能力模板,为算力路由、算力设备管理、算力计费等提供标准的算力度量规则。通过对不同业务的算力资源和算力需求进行匹配,使合理的算力去处理相应数据的一种以多样性算力为基础,以算力网络为连接,以供给有效算力求,算力服务需满足绿色、共享、智能、可信等特征才能更好地支撑算力的典型应用场景。包含算力设备的注册、OAM(操作维护管理)、运营等。统一的管理面可以对网络和算力进行管理4缩略语下列缩略语适用于本文件AI:人工智能(artificialintelligence)ASIC:专用集成电路(applicationspecificintegratedcircuit)CE:算效(computationalefficiency)CP:算力(computationalpower)CPM:算力管理(computationalpowermanagement)FPGA:现场可编程门阵列(fieldprogrammablegatearray)HPC:高性能计算(highperfornancecomputing)HPL:高性能浮点运算(highperfornaneelinpack)GPU:图形处理器(graphicsprocessingunit)HM:算力度量(hashratemeasurenent)NPU:神经网络处理器(NeuralnetworkProcessingUnit)SLA:服务等级协议(service-levelagreement)5数据中心算力接入算力资源的感知主要指对数据中心物理设备算力能力的感知与抽象,便于上层应用对与存储等算力资源的统一协调调度,对分布式,动态的数据中心算力资源进行多维度的进行按需实时调用,快速实现业务部署。算力资源的感知与抽象应满足以下要求。b)对不同维度的算力资源进行感知,如计算能力(算力)与功耗水平(算效):c)对异构物理算力资源建立统一的算力资源描述模型,根据不同需求与应用的算力指标,与该算d)对数据中心算力资源提供统一的算力资源标识,便于上层应用的统一识别与调用。包括消费和生产两类需求。消费类需求水平通过移动互联网月来呈现:生产需求可通过产数规模指标。应用场景需求能够中文全称M1lionInstructionsPerDhrystoneMillionInstructiFloating-pointOperationsPerSec中文全称4超算算力(CPa):指超级计算机输出的计算能力,超级计算利用并行工作的多台计算机系统的集中式计算资源,并通过专用的操作系统来处理极端复杂或数据密集型的问题,计算系统由CPU和智算算力(CPw算):指通过使用大规模异构算力资源,包括CPU输出的计算能力和智能算力6.3算力评级6.3.1算力评级概述数据中心的算力评级是指对数据中心服务器算力进行综合测算,并根据总分得到数据等级。根据得分对通用算力、超算算力、智算算力进行1~5级的评级,其中1级为最低等级,5级为最高等表4算力评级1级国内落后国内领先国际领先7.1算力智能调度引擎规范作业调度包括一级调度和二级调度。一级调度系统根据二级调度系统提供的集群状态态,能够通过最优调度策略将用户作业下发到某个目标资源池集群进行排队,再由该计算集群的二级调度系统进行调度。通过统一接口进行对接两层调度系统。作业状态应包括提交后等待调度状态、调度后下发到目标集群状态、目标集群等待调度执行状态、目标集群执行状态、目标集群结束状态。作业调度过程应主要围绕作业生命周期,推动作业状态的跳转,直到作业达到结束状接口接口b(见图2)接口c(见图2)入接口d(见图2)3)分布式通信模块接口深度学习训练框架与异构硬件设备适配后的软硬件平台应具备多能力:应提供对应软/硬件环境下的深度学习开发框架镜像、容器编译镜像,支持安装,卸载功能支持容器内运行环内源码编译:宜支持异构CPU编译并支持纯CPU训练场景,支持CPU算子深度学习训练框架与异构硬件设备适配后的软硬件平台应支持在图像分类、目标检测、图像分割、语义表示、机器翻译、视频分类、智能推荐等应用领深度学习训练框架与异构硬件设备适配后的软硬件平台应在训练与稳定性、可靠性、大规模分布式等方面达到要深度学习框架在多硬件接入适配工作上应满足易扩展性的技术要8算力调度适用场景主要有资源直接调度场景、资源间接调用场景、业务调用场景、用户驱动业务调用场景。具体如下:a)资源直接调用场景:用户通过算力网络发布业务需求,并可直接寻找到匹配需求的算力基础资源节点。算力网络在用户与基础资源之间建立有效的资源链接,用户可直接调用基础资源:b)资源间接调用场景:用户并不直接与算力网络直接交互,而是通过具体的业务平台实现。业务平台通过算力网络发布服务需求,寻找匹配服务需求的算力基础资源,并建立资源连接。用户单纯通过业务平台使用相应的业务服务即可:c)业务调用场景:业务提供方已事先在算力网络中某个节点位置完成了业务部署,并通过算力网络完成业务信息发布。用户通过算力网络发起服务需求后,在算力网络中直接匹配到满足需求的业务信息,并直接调用相应的业务服务:d)用户驱动业务调用场景:通过细化上述几个场景后衍化得到,即用户驱动业务调用场景。该场景下尽管业务需求依然由用户在算力网络中发布,并直接寻找到匹配需求的算力基础资源节点,但用户自身并不直接负责业务服务提供和部署。用户将匹配到的节点信息告知相应的(第三方)业务平台完成相应的部署,并实现服务调用。8数据中心算力运营8.1算力服务规则8.1.1自服务能力算力服务平台应具备自服务能力包括但不限于:a)用户可通过公开平台访问算力资源;b)用户可自行在平台进行咨询、试用、选购、售后等服务;c)用户可进行算力、数据、软件等资源管理、监控与调整;d)用户可进行组织、人员、对账等运营服务。8.1.2按需服务算力服务平台应具备按雷服务的能力,包括但不限于:a)用户可根据需求进行资源选择及使用;b)用户可根据需求进行资源计量计费c)算力服务平台可根据资源使用情况进行弹性伸缩。8.2算力管理规则算力服务应具备统一的用户及任务管理能力,包括但不限于a)具备统一的用户管理和用户环境配置:b)具备多种优先级的资源调度策略;c)具备多种策略管理能力,为作业请求提供最佳资源。算力服务应具备算力服务调度的能力,包括但不限于:a)应具有统一的管理中心,进行用户、编排策略、服务目录、定价管理等:b)应具有统一协同中心,能够进行系统监视、数据管理、作业管理等;9c)应能够协同多种算力引擎。9算力测评方法9.1通用算力测评9.1.1通用算力测评方法现代通用计算服务器典型应用场景的性能需求a)评价指标体系个秒b)综合评分方法采用加权算术平均数计算法实现对系统每个维度的性能评分参考基础配置,见附录A,根据公式(1)将实测数据通过归一化方法换算为无量纲的指标得分,另外当指标值大于基准平台参考值时,指标得分取100。将各项指标得分和权重代入公式(2)计算综合得分w,T——不同测试指标的权重,权重取值可参考附录B。9.1.2通用算力评级根据得分对通用算力进行1~5级的评级,其中1级为最低等级,5级为最高等级。具体分级情况见表10。9.2.1超算算力测试方法根据待测集群的HPL性能将系统规模分为大超算算力测试指标涵盖浮点性能、稀疏线性系统性能、存储系统带宽、网络带宽、AI推理及训练力宽宽迟测试系统使用MaskR-CNN模型在C参考基础配置,见附录C,根据公式(3)将实测数据通过归一化方法换算为无量纲的指标得分,另式中:将各项指标得分和权重代入公式(4)计算综合得分w,P₁——指标i在被测集群上的性能得分;T——不同测试指标的权重,权重取值可参考附录D。9.2.2超算算力评级根据得分对超算算力进行1~5级的评级,其中1级为最低等级,5级为最高等级,具体分级情况见表13。9.3智算算力测评9.3.1智算算力评测工具智算算力测试主要分为训练性能测试和推理性能测试,评测工具主要包括模型和14和表15.a)训练测试模型训练性能测试所用模型及数据集如表14.目标检测目标检测目标检测能nrecall练的性能参考基础配置,见附录E.1,根据公式(5)将实测数据通过归一化方法换算为无量纲的指标得分另外当指标值大于基准平台参考值时,指标得分取100。将各项指标得分和权重代入公式(6)计算综合得分w。P——指标i在被测集群上的性能得分;T——不同测试指标的权重,权重取值可参考附录F.1。b)推理性能测试推理性能测试主要包括不同种类推理任务的性能测试,推理任务具体包括:图像分类、目标检测、型目标检测能1.1数据集上的推理性能参考基础配置,见附录E.2,根据公式(7)将实测数据通过归一化方法换算为无量纲的指标得分。另外当指标值大于基准平台参考值时,指标得分取100。将各项指标得分和权重代入公式(8)计算综合得分w。T——不同测试指标的权重,权重取值可参考附录F.2。9.3.3智算算力评级智算算力按照训练类和推理类进行分别评级,其中1级为最低等级,5级为最高等a)训练类评级通用算力基准平台性能参考值A.1基准平台性能参考通用算力基准平台性能参考值如表A.1所示表A.1基准平台性能参考(根据IntelXeon4214)超算算力基准平台性能参考值C.1基准平台性能参考超算算力基准平台性能参考值如表C.1所示。表C.1基准平台性能参考值(根据top500排名的指标值)网络系统带宽8网络系统带宽
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版锅炉设备维护保养与能源审计合同范本3篇
- 2025版内河水路危险品运输合同及应急救援协议3篇
- 二零二五年度挖机操作技能竞赛赞助合同
- 1 如何合理选择抗凝药物
- 二零二五版民房建筑项目施工合同履约监督协议范本4篇
- 2018年税务稽查风险防范及企业应对策略
- 2025年度个人房屋买卖价格调整及支付合同2篇
- 二零二五年度户外广告牌发布与社区宣传合作合同范本3篇
- 2025年度农用土地托管服务与机械租赁合同4篇
- 2025年度个人二手房买卖协议书范本:房屋交易环保评估合同2篇
- 2025贵州贵阳市属事业单位招聘笔试和高频重点提升(共500题)附带答案详解
- 2024年住院医师规范化培训师资培训理论考试试题
- 期末综合测试卷(试题)-2024-2025学年五年级上册数学人教版
- 招标采购基础知识培训
- 2024年广东省公务员录用考试《行测》试题及答案解析
- 五年级口算题卡每天100题带答案
- 结构力学本构模型:断裂力学模型:断裂力学实验技术教程
- 2024年贵州省中考理科综合试卷(含答案)
- 无人机技术与遥感
- PDCA提高卧床患者踝泵运动的执行率
- 黑色素的合成与美白产品的研究进展
评论
0/150
提交评论