DB63T 2226-2023绿色算力基础设施智能运维规范_第1页
DB63T 2226-2023绿色算力基础设施智能运维规范_第2页
DB63T 2226-2023绿色算力基础设施智能运维规范_第3页
DB63T 2226-2023绿色算力基础设施智能运维规范_第4页
DB63T 2226-2023绿色算力基础设施智能运维规范_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

IDB632024-01-28实施青海省市场监督管理局发布I 1 1 1 2 2 2 2 2 3 3 3 3 4 4请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。责任公司、中国移动青海公司、中国电信青海分公司、中国联通青海胜民、王国宁、王怀成、宋继红、文森、张国瑜、李伟民、汪澜1绿色算力基础设施智能运维规范本文件规定了绿色算力基础设施智能运维管理的基本要求本文件适用于绿色算力基础设施规划设计、建造、运营管理、运行维护时采用执行,也可供第三方仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本GB/T51314数据中心基础设施运行维护采用虚拟化技术提供的服务器以及实际物理硬件2一定时间周期内算力基础设施总电能消耗量与信息设备电4缩略语5绿色算力基础设施智能运维基本要求绿色算力基础设施智能运维的范围和技术内容应监管方要求、客户SLR及签订SLA中的要求。智能运维不能覆盖的部分,应保留非5.2建立智能运维目标绿色算力基础设施智能运维应设定具体的、可测量的、可达成的且有明确截止期限的目标绿色算力基础设施智能运维管理目标应至少包括在绿色算力基础设施安全运行、业务连续性的要求下,将基础设施运维工作由现场人工运维转向“智能平台基础设施运维工作效率与质量,提升业务保障能力,降低运维成本,减少绿色算力基础设施对各类资源的消耗,持续优化电能使用效率,实现绿色、低碳可持续发绿色算力基础设施绿色智能运维能力由感知力、分析力、决策力、执行力组成,应能够有效支撑智注1:感知力是指对运维对象及其相关内部及外部环境变化采集的数字化信息以及含义进行认知的水平,应根据运维注2:执行力是指为实现预定运维目标通过自动化的手段对运维对象及内外部环境施加影响的行为和过程的能力。执行过程应有明确的目标、条件、方法、效果的定义,执行力应与感知力衔接,对运维对象及其内外部环境变化注3:决策力是指为了实现确定的运维目标而对未来一定时期内的运维活动及方式进行智能化选择或调整的过程,由开放的提炼能力、准确的预测能力和准确的决断能力构成。决策过程应有数据、算法、模型、流程的支撑,并在设定的运维场景替代人工的判断和决策。决策力体现绿色算力基础设施运维智5.3赋能平台绿色算力基础设施智能运维应构建赋能平台,并满足a)绿色算力基础设施运营组织应构建、维护、持续优化算力基础设施统一的赋能平台以实现绿色b)赋能平台应有效支撑绿色算力基础设施的智能管控,并完整涵盖智能运维的规划设计、部署实施、例行管理、风险管控、服务支持、服务交付、监督改进全生命3c)赋能平台应通过数字化、自动化、智能化等功能模块有效支撑绿色算力基础设施智能运d)应通过数据采集、数据管理提升赋能平台的e)应通过自动化、可视化能力的构建提升赋能平台f)应通过能感知、会描述、会预测、会学习、会诊断、会决策的能g)应实现基础设施和虚拟与物理资源智能运维全场景融合的一体化智能运维,宜实现跨算力a)绿色算力基础设施运营组织应持续识别对绿色智能运维目标的优化和内外部环境变化的影响,b)组织应建立支持绿色算力基础设施绿色化智能化转型的治理结构和管理组织,明确绿色智能运维组织的职责及要求,落实绿色智能运维相关的策划、实施、运行、改进工作,有效c)组织应明确绿色算力基础设施智能运维能力建设的整体策略,并落实到对应的治理结构组织、人员要求、技术实现、资源要求、管理指导、监控以及沟通机制,以保证智能运维能力的管理、治理有e)组织应建立、培育、维护促进绿色算力基础设施智能运维的精神文化。提升人员对绿维和管理的认知、认可和认同度,建设开放、共享、创新、持续改b)应配置平台支撑管理的团队,负责管理智能运维平台运营,保证平c)宜设立专业技术团队,负责研究设施、系统绿色化智能化技术,以及绿色智能运维平台d)应设立信息安全管理岗,或者将算力基础设施智能运维平台及其相关系统纳入上级组织全管理团队的管理范围,以确保智能运维工作的信息安全,避免发生e)应设置绿色运维管理岗位,持续识别绿色节能低可以及时感知算力基础设施各组件的运行状态,可以实现对用电、用油、用水等能源4质的使用依据来源、性质与用途的不同进行分项计量,具备实现部分关键组件的远程b)自动化级(二级绿色算力基础设施运营组织拥有开展绿色化智能运维活动所需台,可以通过及时感知算力基础设施各组件的运行状态、周边环境数据并依据预设的过对运行模式和关键组件的自动控制和资源能源使用的自动调度,实现系统最c)智能化级(三级绿色算力基础设施运营组织拥有开展绿色化台及平台迭代优化的能力,可以通过及时感知绿色算力基础设施各组件的运行状态数据,并依据现有规则和历史数据自主学习,基于数据进行预测,实现对运行模式的自主控制和资源能源使用的自主调度,能够基于规则和预测,实现算力和资源在设施内部和跨设施的自主调度,实现多算力基础设施整体6.2绿色算力基础设施智能运维水平绿色算力基础设施智能运维水平等级应按照实现智能运维场景中智能特征分级要求进行智能运维场景实现是围绕质量可靠、安全可控、效率提升、成本降低、绿色低碳的运维目标,通过场景分析、场景构建、场景交付、效果评估四个关键过程,建设智能运维场景的一组活动。通过迭代调a)场景分析是指通过前期调研和评估,确定场景构b)场景构建是指按既定方案和计划开展场景相关能力建c)场景交付是指场景构建完成后进行d)效果评估是指场景交付后检查是否达到预期效果,并5机房能耗智能优化制系统运行模式和系统组件可以根据人工预定义的规则,自动调整系统运行模式和系统组件运行状态,通过自主学习数据挖掘,丰富运行规则,自通过设备全生命周期的智能化管理,实现从设备采管理覆盖率=实现全生命周期管理设备量/总设备量通过对设备的运行监控和效支持硬件远程运维,实现对设备全生命周期的全面能够根据历史数据,通过自主学习和数据挖掘,实现设备故障趋势预测、设备退化趋势预测、设备寿命预测,自应用智能混合部署内存密集型、IO密集型等等),同一应用服务在不不同资源类型的服务自动在同一主机上混合部署可应用混合部署自动化率=自动化混合部署次数/总按照人工预定规则实现自基于自学习成果和预资源调整自动化率=自动化调整资源次数/总调整需要时按照预定规则分配资能够动态监测资源利用情况按照预定的规则,调度能够根据历史数据,自主学习,挖掘数据,根据数据与预测,自主动6告警聚合率=1-聚合后告基于自学习成果,实现智能化诊断,对无效、重复告警实现智能化筛选故障自愈率=自愈故障数/按照人工预定义的规则识别可自愈的故障,实现故通过自主学习和数据挖掘完善自愈故障特征,识别可自愈故障,实现健康检查覆盖率=自动健康检查运维对象数/总运系统可以提供丰富完善的数可以基于人工定义的检查通过自主学习和数据挖掘不断完善检查规则,运维工单流程自工单自动化率=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论