2024年多主体数据中心算力-电力跨域协同优化报告_第1页
2024年多主体数据中心算力-电力跨域协同优化报告_第2页
2024年多主体数据中心算力-电力跨域协同优化报告_第3页
2024年多主体数据中心算力-电力跨域协同优化报告_第4页
2024年多主体数据中心算力-电力跨域协同优化报告_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北电力大学多主体数据中心算力-电力跨域协同优化丁肇豪华北电力大学目录华北电力大学目录华北电力大学3模型方案4算例分析5结论与展望华北电力大学NORTHCNAELECToCPoWERUNVLRS/TY>数字经济时代的到来,数据中心已经成为支撑社会经济发展的重要新型基础设施,其能耗巨大,且占比持续增长。>特别是以ChatGPT为代表的生成式人工智能的兴起,引发了数据中心能耗的新一轮飙升。0全国数据中心在用机架数(万架)2.3520103ChatGPT每天需要响应约1.95亿次查询请求,预计每天进行推理0模型训练能耗(MWh)研究背景华北电力大学NORTMCNAELECTeCPoWERUNVELRSTY研究背景华北电力大学NORTMCNAELECTeCPoWERUNVELRSTY>数据中心处理的计算任务类型多样,在线任务和离线任务具有不同计算特性,在时空多维度展现出灵活性。需要实时响应,时间延迟敏感,但多为轻量级计算,可以在不同地理位置数据中心间转移。■时间灵活性——离线任务处理时间长,对数据和资源依赖性强,异地转移难度大,可在满足服务水平协议(SLA)前提下适当推迟执行。网页服务流式计算电商业务计算任务空间转移机器学习机器学习调度后计算任务处理完成时间任务任务到达时间时间转移截止时间第4页共23页华北电力大学华北电力大学>CloudOrchestration技术的发展为不同主体云运营商的开展合作提供了技术基础,使得多云数据中心能够实现在跨域市场信号(电力侧、算力侧)的引导下,协同调度任务并异地执行。从而可以改变数据中心能耗,降低整体运营成本,实现数据中心间资源的余缺-kubernetes/第5页共23页华北电力大学NORTHCHNAELECrpCPOWERUNVELRSiTY关键挑战1:大规模计算任务调度ECE2024华北电力大学NORTHCHNAELECrpCPOWERUNVELRSiTY大规模计算任务调度:准确、高效的任务调度是多云协同优化的基础。然而,计算任务具有大规模、高并发和复杂依赖关系等特性,使得数据中心任务调度面临强随机、非线性和NP-hard问题。计算任务执行拓扑关系计算任务执行拓扑关系计算资源占用嵌套约束异构任务-异质资源匹配第6页共23页华北电力大学NORTHCNAELECreCPoWERUNVERSrTY关键挑战2:多云隐私安全保护ECE2024华北电力大学NORTHCNAELECreCPoWERUNVERSrTY>多云隐私安全保护:集中式协同调度需要所有数据中心都具有可见性和可控性。然而,分属不同主体的数据中心部分/加密/匿名信息共享数据挖掘运行数据反推商业机密资源使用信息卷积神经网络特征提取业务信息调度管理策略业务信息共享原始数据易带来商业机密泄露的风险关键数据个本地信息数据中心1数据中心2数据中心3需要对关键数据进行隐私安全保护第7页共23页第8页共23页关键挑战3:多主体个性化决策华北电力大学NORTMCNAELECTeCPoWERUNVELRS/TY园数据中心1企业数据中心2数据中心3银行独立同分布更新局部最优非独立同分布更新分布多云数据中心的环境异质性导致数据非独立同分布非独立同分布数据学习易偏离最优点华北电力大学NORTHCNAELECTbCPOWE华北电力大学NORTHCNAELECTbCPOWE为了解决上述挑战,我们提出了一种考虑隐私约束和主体异质特性的联邦强化学习方法,实现了在跨地域市挑战1挑战1■提出适配大规模任务到达的调度模型,能够为每个云数据中心高效分配本地计算资源,协同传输任务。并通过融合图神经网络,保证了任务执行的底层逻辑。挑战2挑战2多云隐私安全保护■提出基于分散式联邦强化学习调度框架,实现在协同优化任务调度过程的同时,保挑战3■提出一种损失函数个性化重构方法挑战3>将每个云数据中心运营商(CSP)视为一个智能体,基于任务信息与跨域电价信号,进行任务转移与资源分配灵活性。资源任务信息联邦强化学习迭代多云任务迁移决策迭代多云任务迁移决策聚合参数更新聚合参数更新高电价时段高电价时段低电价时段本地资源分配决策个性化本地更新NORTMCNAELECTbCNORTMCNAELECTbC-状态:每个CSP的状态包括计算任务信息、计算资源特征、电价信息、时间四个部分,记作s,=[s7,s,s°,t。其中,计算任务信息包括可转移性、依赖关系拓扑、资源占用三种属性。口可转移性口依赖关系拓扑(DAG)口资源占用口可转移性1表示可以转移,0表示不可转移每个任务的当前完成率:[fin⁴,…,fin:"]1表示可以转移,0表示不可转移在任务调度过程需要考虑计算任务的底层执行逻辑,通常被表示为有向无环拓扑结构(DAG),具有高度非线性特征。华北电力大学NORTMCHNAEECrpcPoNERUNV华北电力大学NORTMCHNAEECrpcPoNERUNV-动作:包括多云数据中心间任务转移动作(离散)和本地计算资源分配动作(连续)。首先决定任务的执行地点,进而为在本地处理的任务分配计算资源,并确保分配资源的总和不超过可用资源的上限。■任务转移决策,表示将任务j分配到CSPi'执行■资源分配约束,分配资源的总和不超过可用资源上限Z₁输出层Z₁特征提取特征提取Z₂Z₂图神经网络图神经网络第13页共23页华北电力大学NORTHCHINAELECTPCPOWERUNVLRSiTY-奖励:奖励r,定义为任务调度过程中的收益和负成本之和。R,是任务调度期间的累计折扣奖励。奖励函数r=r"+r+r"+r①完成任务收益fin=100%:完成计算任务后获得的收益。②能耗成本=-(α(res,-res,)+βres")p,:运行时能耗成本,分为运行和空载成本。③任务转移成本r,=-∑cost!":任务转移时的交换机和传输带宽成本。④超出截止时间惩罚:如果任务未在SLA约定截止时间前完成,则相应CSP受到违约处罚。从时间步t到调度周期T结束的累计折扣奖励可以计算为R,=,+yr,+…+yr,,其中y∈[0,1]是衡量当前收益和分布式联邦强化学习框架华北电力大学NORTHCINAELECTPCPoWERUNV1每个云数据中心各自执行调度策略并独立收集轨迹,并利■步骤二:局部参数聚合更新从邻近数据中心收集参数,并通过联邦强化学习框架与邻■步骤三:聚合模型参数θagg回传将聚合模型参数θagg回传给云数据中心,引导其继续进行华北电力大学NORTHCNAELECTbCPOWE个性化损失函数重构华北电力大学NORTHCNAELECTbCPOWE通过重构云数据中心的局部损失函数,实现对决策网络参数权重的修改,平衡了本地异质特征和全局聚合特征间的更新权重,进一步改变优化更新方向,实现了异构环境感知的主体个性化决策。主体1理论最优下降方向本地更新本地损失函数理想下降方向不一致,导致个体决策偏离最优。实际下降方向输入状态特征值当该状态维度异质性低时,趋近于聚合参数当该状态维度异质性高时,增强该特征影响主体1理论最优下降方向B偏差减小本地更新原下降方向重构后的损失函数对下降方向进行修改,更贴近于个体决策最优方向。第15页共23页第16页共23页收敛性证明华北电力大学NORTHCNAELECTeCPOWERUNVLRSTY我们进一步证明了基于重构损失函数的算法收敛性,证明如下:其中简记为D。算例验证华北电力大学NORTM算例验证华北电力大学NORTMCHNAELECTuCPoWERUNVERSTY3个分布不同主体的数据中心在市场信号引导下跨地域协同调度的场景,细节如下:数据中心1任务到达电价00■凌晨0-7时和晚上21-24时数据中心1的电价明00■凌晨0-7时和晚上21-24时数据中心1的电价明显低于数据中心2和3;■数据中心1的计算任务主要在8-15时到达,数据中心2的计算任务主要在8时以后到达,数据中心3的计算任务到达时间较为平均。时间(h)任务到达数量任务到达数量0(美元兆瓦时电价数据中心2任务到达02412345678910111213141516171819202时间(h)云数据中心参数时间时间(h)CSP1、CSP2CSP1、CSP2和CSP3的任务到达情况和电价分布任务信息来自阿里巴巴数据集第17页共23页华北电力大学NORTHCNAELECTbCPOWE跨域信号引导的协同任务调度华北电力大学NORTHCNAELECTbCPOWE我们验证了所提方法在跨域电价信号引导下多主体数据中心协同调度的有效性,提出的协同调度机制可将任务转移至电价低且资源充足的区域进行执行,降低了运行成本,实现了更大程度的灵活性释放。计算能耗计算能耗(pu)电价(美元兆瓦时)时间(h)CSP1口任务转移决策可以考虑到目标数据中心计算资源使用状况时间(h)CSP2时间(h)CSP2情况,例如:在9:00-15:00间,由于其他数据中心此时资源利用率也较高,数据中心1只转移一小部分任务给其他数据中心。时间(h)CSP3CSP1、CSP2和CSP3计算能耗的变化第18页共23页华北电力大学NORTHCNAELECreCPoWERUNVERSTY跨域信号引导的协同任务调度华北电力大学NORTHCNAELECreCPoWERUNVERSTY>以数据中心3为例,从微观视角出发,分析电价信号引导下多主体数据中心协同决策的底层调度逻辑。■任务转移决策可以充分利用任务灵活性:■本地资源分配过程,任务执行依赖关系得到保障:计算任务数量计算任务数量可执行任务O已完成任务未完成任务新到达任务法资源利用率5法资源利用率55可执行任务:83①①4410口根据任务执行各个环节的资源分配情况分析,所提方法在资源分配时只分配给当前可执行任务,保证了任务执行约束。口转移更多离截止时间近的任务去往数据中心1,因为这部分任务时间灵活性有限,需尽快利用数据中心1的低电价口根据任务执行各个环节的资源分配情况分析,所提方法在资源分配时只分配给当前可执行任务,保证了任务执行约束。第19页共23页华北电力大学NORTMCNAELECTeCPoWERU考虑隐私约束的协同调度华北电力大学NORTMCNAELECTeCPoWERU■集中调度方法:集中调度方法需要掌握全局信息,无法实现多云隐私保护。■完全分散调度方法:完全分散调度方法不允许多云数据中心之间进行任务转移,无法利用空间灵活性。所提方法一集中调度方法—口所提出的方法比完全分散调度方法总成本降低18.6%,口所提出的方法比集中式调度方法收敛速度提高了30.3%。DDL违反率降低30.8%。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论