算力网络技术白皮书_第1页
算力网络技术白皮书_第2页
算力网络技术白皮书_第3页
算力网络技术白皮书_第4页
算力网络技术白皮书_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

算力网络技术白皮书中国移动通信集团有限公司2022年6月前,科技竞争和产业革命大潮澎湃,经济社会的数字化发展加速前进。为推动国家新基建战略的落实和东数西算工程走向纵深,中国移动充分发挥中央企业“网络强国、数字中国、智慧社会”主力军作用,深化创世界一流“力量大厦”战略,积极构建“连接+算力+能力”新型信息服务体系,制定了算力网络总体发展策略,提出了算力网络全新发展计划,并于2021年11月2日在中国移动全球合作伙伴大会上发布了《算力网络白皮书》,向业界系统性的介绍了算力网络的定义内涵和愿景目标,明确了算网基础设施层、编排管理层和运营服务层的三层体系架构,提出了泛在协同、融合统一和一体内生的三个发展阶段,并联合10余家合作伙伴发起了算力网络发展倡议,引发了业界的广泛关注和热烈讨论。半年多以来,算力网络的愿景理念已经得到了业界的高度关注和广泛认可,在产学研各界同仁的共同努力下,算力网络的标准和开源体系、产品研发、产业生态正逐步完善。为进一步推动算力网络的稳步健康发展,本次发布《算力网络技术白皮书》基于过去的研究成果,结合最新的政策、产业、标准发展情况,对算力网络的十大技术发展方向进行了展望,并以此为基础阐述了算力网络的技术体系和技术路线。本白皮书的版权归中国移动所有,未经授权,任何单位或个人不得复制或拷贝本白皮书之部分或全部内容。1算力网络的发展情况 1 11.2产业生态 11.3标准开源 2 32算力网络十大技术发展方向 42.1方向一:泛在智能的新型算力赋能智慧社会转型升级 42.2方向二:以数据为中心的多样性计算架构铸就高效算力服务 42.3方向三:光电联动的全光网技术支撑东数西算纵深发展 42.4方向四:超低时延驱动的确定性网络成为产业数字化刚需 52.5方向五:算网深度融合的原创技术驱动新型业务创新突破 52.6方向六:算网大脑使能多要素融合的一体化信息基础设施构建 52.7方向七:可信共享的算网服务开创行业发展新业态 62.8方向八:端到端的绿色低碳技术推动数字社会可持续发展 62.9方向九:能力内生的新安全理念保障算网一体化全程可信 62.10方向十:空天地一体的星云算网实现全时全域信息服务 73算力网络核心技术体系 83.1核心技术体系 83.2核心技术构建 93.2.1面向泛在智能的新型算力发展 93.2.2面向多样性计算架构构建 3.2.3面向光电联动的全光网 3.2.6面向融合统一的算网大脑构建 213.2.7面向新型算网服务供给 243.2.8面向绿色低碳可持续发展 253.2.9面向一体化的内生安全保障 283.2.10面向未来全时全域的信息服务 4总结与倡议 32 “近年来,数字经济发展速度之快、辐射范围之广、影响程度之深前所未有,正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。”党的十八大以来,党中央高度重视发展数字经济,将其上升为国家战略,数字经济的新引擎作用不断凸显。2022年1月,习近平总书记发表题为《不断做强做优做大我国数字经济》的署名文章,进一步深刻阐明发展数字经济意义重大,是把握新一轮科技革命和产业变革新机遇的战略选择。为推动我国数字经济健康稳步向前,实现算力基础设施区域协同、绿色集约、安全可信等发展目标,2020年4月至2021年7月,国家围绕数据中心的算力统筹规划,连续发布系列指导政策,提出了以“东数西算”为核心的多层次、一体化数据中心全新布局。2022年2月17日,国家发改委、工信部等四部委联合印发通知,进一步明确“东数西算”工程行动计划,在京津冀、长三角、内蒙古、甘肃等8地启动建设“4+4”国家算力枢纽节点,并规划了10个国家数据中心集群,标志着我国“东数西算”工程正式拉开序幕。“东数西算”工程的启动,是国家将数据中心的整体布局与能源、气候、经济、网络等因素统筹规划的结果,将有助于解决数据中心东西部供需失衡的问题,同时将推动我国数据中心差异化、互补化、协同化和规模化发展,有利于发挥区域优势、避免重复投资、形成规模效应。随着数字经济时代新技术的不断涌现,算力和网络日益走向融合,基础设施、算力和网络编排、业务运营管理向算网一体化方向不断演进和发展。中国移动于2021年11月联合华为、中兴等11家合作伙伴正式发布了《算力网络白皮书》,确立了算力网络为中国移动全新的发展计划和愿景目标。中国电信发布的《云网融合2030技术白皮书》和中国联通发布的CUBE-Net3.0网络体系中,也都把“算力网络”作为公司未来网络演进的重要方向。2021年6月,在第五届未来网络大会上,中国移动主导的《算力感知架构和技术体系创新》,成功入选中国通信学会2021年未来网络领先创新科技成果。在峰会上,中国移动同时展示了业界首个算力感知网络概念原型系统。2021年9月,中国移动联合高校自主研发的首个分布式算力路由原型和泛在调度原型在国际信息通信展览会上亮相。2022年1月,中国移动提供的任务式云服务——“视觉计算及渲染云服务”为浙江省杭州东站日均10万客流量的视觉智能检测分析需求提供后端能力支撑,助力杭州东站打造未来枢纽样板。2022年1月10日,中国移动牵头筹备成立了多样性算力产业及标准推进委员会(TC622),目前已聚集34家合作伙伴,将持续致力于推动多样性算力软硬件生态繁荣,带动中国计算产业成熟;2022年3月31日,中国信息通信研究院、中国移动、华为等16家单位联合发起成立了算网融合产业及标准推进委员会(TC621),以“计算网络化”和“网络计算化”两大方向为抓手,推动计算与网络技术的深度融合,构建繁荣健康的算网产业生态。为了进一步明确算力网络的技术发展路线,构建完善的技术体系,以中国移动为代表的国内运营商、通信设备商等在国内外标准组织、产业联盟中持续推动算力网络相关标准体系构建。在国际标准方面,中国移动在国际电信联盟(ITU)牵头初步建立起包含5个标准的算力网络国际标准体系,并在ITU形成了统一术语ComputingandNetworkConvergence(CNC),覆盖IMT-2030及未来网络、NGN、新型计算等技术领域,涉及需求、架构、服务保障、信令协议和管理编排等方向。同时,中国移动联合多家单位在国际互联网工程任务组(IETF)推动成立ComputinginNetworkResearchGroup(coinrg),面向数据中心内部,研究网络设备集成计算能力的需求和应用场景,并扩展至在网计算等领域。2022年3月,中国移动在IETF第113次会议中牵头发起算力感知网络(CAN)的BoF,推动算力感知和算力路由在需求、场景等方面达成共识。在国内标准方面,中国通信学会、CCSA、网络5.0联盟、IMT-2030(6G)推进组等行业组织和产业联盟纷纷启动算力网络相关标准的制定。2020年9月,国内未来IP网络研究的主要组织——网络5.0产业联盟成立了“算力网络特设工作组”,启动算力网络需求、场景和技术等研究工作。2021年4月至今,CCSATC3通过了算力网络总体技术要求、算力路由协议技术要求和算力交易等立项;TC1通过了泛在计算总体技术要求、泛在算力调度管理技术要求和算力度量等立项,初步建立了算力网络行标体系。IMT-2030(6G)网络技术工作组已正式启动6G网络中的算网一体需求和关键技术研究。工业互联网产业联盟(AII)和开放数据中心委员会(ODCC)也已完成算力网络相关项目立项,涵盖面向工业互联网的算力网络技术、可编程算力路由网关等方向。在开源方面,中国移动在Linux基金会、Openlnfra基金会等多个开源社区致力于推动算力网络开源社区与标准的协同,并推动开源社区关注算力网络演进过程中对技术创新的新需求。用进程。2020年,中国移动牵头在Linux基金会成立首个电信云原生项目XGVela,进一步推动移动网络云原生化发展。中国移动积极拥抱云化、虚拟化技术体系,参与贡献K8s、KubeEdge等多个项目,已经成为OIF基金会OpenStack项目在国内最大的生产环境使用者,并在社区积极分享落地实施过程中自动化集成运维的经验。在边缘计算领域,中国移动与合作伙伴共同发起EdgeGallery边缘计算平台项目,同时在Linux基金会Edge项目Akraino牵头了多个端到端集成的蓝图项目,持续推动跨物联网、电信、企业和云生态系统的跨行业合作。1.4创新实践中国移动高度重视算力网络的发展,启动了面向算力网络应用场景孵化和关键技术验证的试验网规划建设,并基于试验网开展了算力网络新型创新应用的探索工作。中国移动算力网络技术和应用创新试验网以构建国家级示范创新基地为目标,将充分挖掘算力网络新需求,验证新技术和自主能力,孵化新应用、新场景,探索新模式、新业态,促进算力网络技术和产业成熟,打造具有行业影响力的技术创新和生态聚合大平台。试验网遴选北方信息港和浙江、江苏、广东、河南、山东、山西、贵州、内蒙古、甘肃等18个省节点作为试验节点,构建跨域跨平面的试验验证环境,以面向算网基础设施、面向CHBN、面向前沿原创技术三条主线为指引,为行业应用提供从运营、认证测试到部署上线的端到端解决方案。在东数西算场景下,将针对海量大数据处理、科学计算、重点行业温冷数据存储、人工智能模型训练推理等开展东数西算、东数西存、东数西训、东数西渲的应用孵化;在社会算力并网场景下,将联合超算、智算等社会算力开展算力并网验证;在云边端协同场景下,打造算网融合创新技术方案,探索算网大脑雏形,深入车联网自动驾驶、超边缘生产现场、XR文娱、公共安全等特色行业场景,配合智能化技术,实现不同生产要素间的高效协同,从而提高生产效率,满足行业应用智能感知、泛在连接、实时分析、精准控制等需求;在北方信息港将力争突破算力路由、空芯光纤、新型智算等一系列原创前沿技术,为行业发展注入新动能。2算力网络十大技术发展方向2.1方向一:泛在智能的新型算力赋能智慧社会转型升级随着智慧城市、智慧工厂、智慧家庭等智能场景的逐步落地,人工智能正深刻地改变我们的生产、生活方式,一个以数字化、网络化、智能化为特征的智慧社会正加速到来。机器学习、计算机视觉、自然语义处理等训练模型架构设计上趋向大规模并行,数据量已达千G量级,参数量迈向万亿级,此外无人驾驶、ARNR云游戏、元宇宙等场景对数据的传输处理速度和快速分析、推理、决策能力提出了更高要求,需要构建多元化、规模化、泛在化的智能算力。一方面,以智算集群、无损网络、高性能存储为核心的智能算力解决方案有效提升计算效能、降低计算成本、缩短人工智能训练周期;另一方面,基于多样性算力的能力评估体系、云边端算力高效协同调度能力和智能应用的敏捷构建方式等新型技术,构建泛在协同的智能算力底座,推动人工智能从“单点突破”迈向“泛在智能”,实现智慧社会转型升级。2.2方向二:以数据为中心的多样性计算架构铸就高效算力服务全社会数字化转型带来多样化的海量数据处理需求,对处理效率提出了更高的要求,传统的以CPU为中心的计算架构难以高效应对复杂的数据处理场景,以数据为中心的新型多样化计算架构正在迅速兴起。以GPU、FPGA、Al芯片为代表的异构算力增长迅猛,以DPU/IPU为代表的软硬件深度融合的一体化计算架构逐渐兴起,突破传统冯·诺伊曼架构的近存计算、存算一体等存算融合新计算架构不断出现。这些架构变革以数据处理的高效性为目标,通过数据流驱动计算,对底层数据按需就近处理,极大提升数据处理效率。此外,面向多样性的新型计算架构,跨架构的开放编译平台已成趋势,通过屏蔽底层硬件架构差异,构筑开发环境友好、性能高效的算力服务。2.3方向三:光电联动的全光网技术支撑东数西算纵深发展PON、FTTR、硅光、新型光纤等为代表的新技术蓬勃发展,推动光传送网向基于光电联动的大带宽、扁平化、低时延的智慧全光网演进。通过大容量全光高速互联、灵活光电联动和智能全光调度,围绕算力构建高容量、高可靠、确定性低时延、绿色节能的光网络,以光筑底,支撑东数西算新型算力服务的创新发展。传统网络侧重公平性原则,提供尽力而为的服务,在消费互联网时代很好的满足了用户访问网络的需求。随着产业数字化转型进程加速,网络正从消费互联网向工业互联网演进,以超低时延和确定性为特征的网络正从辅助生产逐步嵌入到核心生产环节,成为产业数字化刚需。确定性要素从带宽向时延、抖动、丢包等多要素转变,满足算网连接业务多维质量需求;确定性范围逐步从局域走向广域,通过切片和SRv6/G-SRv6实现端到端确定性保障;确定性粒度逐步从粗粒度向精细化转变,通过小颗粒切片、应用感知等技术满足差异化服务体验。传统的算力和网络相对独立,二者仅为简单的连接关系。以NFV/SDN为核心技术的下一代网络规模部署,算力和网络开始在基础设施层面逐步融合,随着5G+MEC的飞速发展,进一步驱动网络开始感知算力的位置,实现就近分流,算网融合的一体化平台服务已成趋势。未来,算网将在协议和形态层面进一步融合,网络将深度感知算力,通过在网络协议中引入算力信息,将应用请求沿最优路径调度至算力节点;网络设备通过共享自身算力,对数据进行在网计算,降低通信延迟,将推动无人驾驶、元宇宙等超低时延类新型业务创新突破。但深度融合计算和网络双学科并非一日之功,两大架构如何共存,如何互补是需要长期研究的课题,也面临许多科学难题有待攻克,需要两大学科共同研究和碰撞,推进算网向一体共生发展。全行业数字化转型的加速对算网一体化基础设施和融合人工智能、大数据等多要素融合服务能力的要求日益提升。当前算网各自编排、分域管理,难以提供算网融合的产品、服务和端到端的质量保障。算网大脑通过算网数据感知获取全域实时动态数据,结合算网智能化、多要素融合编排实现要素能力的一体供给和智能匹配,横向全面融合网、云、数、智、安、边、端、链(ABCDNETS)多种能力要素,纵向深度贯穿应用、平台到底层资源,进而为新型信息基础设施对外提供一体化服务提供能力支撑。2.7方向七:可信共享的算网服务开创行业发展新业态随着信息技术的发展,算力和数据的流动性持续增强,以多方可信的算力交易和安全可控的数据流通为代表的新型算网服务,将重塑信息服务产业价值链分配体系。通过算力交易创新模式广泛吸纳社会算力,基于区块链的多方算力可信共享将推动算力的供给侧改革,使算力的使用成本进一步降低,实现算力普惠,同时提升社会空闲算力使用效率,最大化发挥算力的价值。数据流通服务可实现跨行业、跨主体的数据共享和开放,通过联邦学习、隐私计算等技术为多方协作模式下的数据价值挖掘提供可靠保障,推动数据合法、高效利用,助力数据产业应用升级,打造数据应用服务新范式。2.8方向八:端到端的绿色低碳技术推动数字社会可持续发展全球气候变暖是当前人类面临的重大挑战,碳达峰、碳中和已成为应对气候变化的全球共识。根据权威机构统计,2021年底我国在用数据中心规模达到520万标准机架,算力达到120EFLOPS,未来仍将保持每年10%以上的速度增长。同时,数据中心能耗快速增长,2019年数据中心年耗电量占全国总用电量的2.4%左右,预计到2025年数据中心年耗电量将达到全社会用电量的3.6%。为实现可持续发展,助力国家双碳目标,算网基础设施的建设和发展要以绿色低碳贯穿始终。随着芯片、服务器能耗控制技术的日趋成熟,模块化、工业化等新型建造技术的规模推广,高效、节能制冷技术的推陈出新,融合、低碳能源技术的广泛应用,辅以精准的碳评估与管理手段,从而形成从芯片、主设备到基础配套设施全生命周期、绿色低碳的数据中心建设与运营体系,并以数据中心为核心,结合数据中心间的网络连接,充分利用智能化手段实现网络和算力的跨地域、跨领域的节能调度协同,形成端到端的一体化节能体系,最终实现算力网络的创新节能、智慧洁能、绿色赋能,助力数字社会可持续发展。2.9方向九:能力内生的新安全理念保障算网一体化全程可信从云计算到边缘计算再到分布式云,算力的泛在化引入了更多的安全风险点,更加开放的网络架构和更大范围的数据流动导致不确定性安全威胁增加,传统以安全防护为主的“外挂式”或“补丁式”安全建设模式无法应对上述安全问题,以安全能力内生、安全可信为基础的新安全理念应运而生。在资源高度协同、网络灵活开放、数据高速流通的算网环境中,充分应对动态变化的安全需求,引入安全编排、隐私计算、全程可信等技术,提升安全风险自动发2.10方向十:空天地一体的星云算网实现全时全域信息服务以卫星通信为代表技术的空天地一体化网络突破地形地貌对于通信网络的限制,从地面扩展到太空、天空、海洋等自然空间,形成全球全域覆盖和泛在连接的空天地一体化网络。空天地一体化网络突破时间限制,在瞬息之间完成大量数据的传输,并实现全域算力连接,通过天基和地基一体化信息构型,实现通信、感知、计算等要素的融合,赋能通感算一体化星云算网。空天地一体化星云算网将成为未来6G网络架构的重要发展趋势之一,为多域融合、算网融合的业务和应用的发展提供支持和动力。3算力网络核心技术体系3算力网络核心技术体系3.1核心技术体系为加快算力网络十大技术方向的发展,中国移动基于算力网络三层架构和技术图谱,在提出算力原生、算力度量、算力路由等新技术理念的基础之上,进一步对算力网络的关键技术进行了体系化的梳理和深度挖掘,聚焦三十二大核心技术,与十大发展方向、三层架构进行了关方向七:方向七:算力交易多要素融合编排算网数据感知算网原生编排算力路由在网计算空天地一体算网智能化光电联动全光网络智能网络调度OTN灵活光电全光高速互联PON高速全光端到端绿色低碳服务器数据中心方向四:应用感知确定性网络新一代算力原生算力卸载能力内生新安全方向六:算网基础设施层运营服务层编排管理层绿色计安全数据流通存算一体智能算力算力度量泛在调度算力网络的发展需要在推动单点创新技术成熟的基础上,穿通多种关联技术,形成针对纵向技术栈的端到端解决方案,实现算力网络技术簇的有效连接和共同成熟,避免产生“技术孤岛"。为此,中国移动进一步梳理了各核心技术之间的关联关系,具体如下:算力方面:存算一体、智能算力、在网计算、算力卸载、空天地一体等算力技术通过层次化的算力度量评价评测体系,形成标准可量化的能力度量模型,一方面使能算力路由实现分布式算力调度,一方面赋能算网数据感知,实现算力节点的有效算力实时上报。合光电联动技术实现传输资源的动态调度和实时响应。同时,智能网络调度向上对接泛在调度,实现传送网基于业务需求的灵活全光调度,向下实现传送网各专业拉通。承载网以SRv6/G-SRv6头压缩技术为基础,形成技术统一的Overlay+Underlay网络协议栈,支持新一代SD-WAN产品和切片功能,并基于SRv6/G-SRv6的可编程特性构建应用感知、确定性保障的差异化网络服务。编排管理和运营服务方面:算网数据感知实时捕捉算网业务与资源的动态特性,算网原生编排提供算网服务化、意图化接口,算网智能化构建算网自智能力,三者共同支撑多要素融合编排。多要素融合编排向下对接泛在调度,实现算网资源和应用的跨域拉通和部署,向上为算力交易和数据流通新型算网服务的构建提供能力支撑,实现多技术要素融合能力供给。绿色安全方面:结合低碳能源技术,从芯片节能、服务器节能、数据中心节能,由点及面,端到端的节能技术逐层递进;隐私计算、安全编排、全程可信技术共同打造一体化安全内生防护机制。3.2.1面向泛在智能的新型算力发展中国移动将主动契合算力的发展趋势,进一步提升数据中心智能化比例,并联合业界对算力度量、泛在调度、智能算力和云原生等重点领域开展技术攻关,为智慧社会提供泛在智能的算力服务。面向未来差异化业务需求,需要建立统一算力度量体系,关联整合映射异构计算资源,实现算力资源合理分配和高效调用。为此,中国移动原创性的提出构建层次化的算力度量模型与评价测试体系,通过从计算、网络、存储、内存等多维度构建异构算力资源度量及节点综合能力评估模型,实现对多样化算力资源信息的抽象整合,通过对业务的深入分析,构建多量纲业务能力度量模型,实现对业务能力的有效表征。算力度量的体系模型的构建需要重点关注以下三个方面:存储、内存、网络等多因子,研究多维度融合的算力节点层面的度量算法和指标。度量,可以从宏观的角度实现算力整体的统计分析,然而,理论浮点计算能力与实际浮点计算能力相差较大,且无法有效的完成对于算力调度、算力标识等其它技术的支撑,因此,需要考虑CPU利用率、内存配比、业务支撑能力等因素,构建节点运行状态下算力的评估。●面向远期,由硬到软,重点针对任务式服务(TaaS),需要实现从底层硬件资源度量向上层软件业务度量的纵向拉通,保证各层次间度量指标的可映射、可转化、可利用。当前由于业务种类繁多且实现方式各异,对于业务的精准度量体系和评估方法的研究还处于早期,需要产业界予以重视。整体来看,当前算力度量的评估体系和算法模型还未成熟,需产学研各界展开联合攻关,尤其是针对多样性异构算力资源度量以及节点综合能力评估开展研究并推动相关标准体系的构建。3.2.1.2泛在调度业务场景的不断丰富对泛在化算力的协同能力提出了更高的要求。泛在调度技术综合考虑用户的位置、数据流动、业务SLA保障等要素,通过跨域拉通云间、云内多段网络,跨层调度云、边、端多级算力,最终实现应用在云计算、边缘计算、超边缘计算、端计算节点之间的敏捷部署和动态调整。泛在调度是算力网络近中期的关键技术之一,为实现算网基础设施高效利用和应用的灵活调度,需要重点突破以下三大问题:一是要实现服务和应用的跨集群全域调度。以资源为中心的服务模式已经不能完全满足算力网络的应用需求,需要结合正快速发展的分布式云原生方案实现更细粒度的资源和应用感知、敏捷管理及弹性调度,实现云、边多级异构算力以及多方算力的全局监控、统一管理及协同调度,面向应用提供一致的容器服务、编排支持、DevOps、服务网格和微服务管理等;二是实现算和网一体化调度。通过算和网的深度融合,汇集算和网实时动态数据的基础上,实现基于算和网的全量感知的弹性调度机制,同时进一步运用Al等新技术,对用户需求的感知、预测以及高效的资源利用率等提供多维度的调度决策支持,进一步实现泛在调度技术的智能化、自动化。三是实现泛在终端算力调度。端侧设备数量巨大,芯片、操作系统等异构性较强,需要攻关适合在终端部署的资源占用低、平台兼容性高、安全隔离能力强的一整套泛终端调度架构。3.2.1.3智能算力当前,人工智能、大数据等技术加速渗透到各行各业,庞大的数据处理和价值挖掘,对以AI为核心的智能算力需求激增。智能算力是指以GPU、NPU、FPGA等异构芯片为主构建的算力,将在未来5~10年成为全球主流。目前智能算力发展存在多条技术路线,生态割裂问题突出,底层硬件差异导致业务开发、迁移、部署的成本居高不下。为了释放智能算力的极致性能,技术架构既要考虑计算、网络、存储三大维度的横向协同,也要兼顾软件平台与硬件资源的纵向协同,从而广泛且高效地支撑智能化应用场景。智能算力的发展需要重点考虑以下四个方面:●在计算方面,由于传统的通用计算已经不能高效支撑海量的数据处理和计算,智能算力的硬件技术路线不应局限于通用计算范式,近期需要加快以CPU+XPU异构计算范式为主的AI异构服务器、GPUBox等多种硬件技术成熟,并加强CPU与XPU协同,高效处理复杂逻辑运算、高并发矢量、矩阵和张量运算。●在网络方面,由于AI应用中数据、模型的巨量化趋势对智能算力的扩展性提出高要求,资源需要以集群模式部署以提供并行计算能力。集群中的网络互联方案涉及单服务器节点内多卡互联和节点间的多卡互联。综合考虑带宽、时延等性能指标及产业开放性、成熟度等因素,节点内的多卡互联方案近期要加快推动PCle、OAM等标准互联协议成熟、规模落地,远期应推动CPU和GPU之间的高速互联协议的成熟落地;节点间的网络,建议近期以RoCE为基础,搭建连接XPU、CPU、存储等资源集群的高性能无损网络,实现数据直接存取,保证数据访问的极低时延。远期通过创新多样性网络拓扑,重构转发设备、路由寻址机制、引入端网协同的的智能拥塞控制算法,实现对异构算力的全无损以太统一承载。●在存储方面,为突破计算节点大量密集数据存取带来的性能瓶颈,近期需要围绕异构存储集群,提供高性能、可扩展和易备份的存储系统。●在软硬件纵向协同方面,针对日益割裂的智算生态,面向中远期应用可跨架构迁移的目标,需考虑AI框架优化与底层异构硬件编译的协同。应推动构建以AI框架优化结合异构硬件编译的跨架构开发、编译、优化环境,屏蔽底层硬件差异,最大化使能异构算力。智能算力技术的成熟需要智算产业链各方凝聚共识,明确共性行业应用和服务要求,统一行业标准,进一步推动国内智能算力生态繁荣发展。3.2.1.4云原生云原生是算力网络基于异构、多样化、分布式算力提供算力服务供给的重要技术。云原生提供的微服务化、Serverless技术等可以让应用专注于核心业务代码本身,实现应用轻量化;云原生提供的工作流调度、批处理任务调度、多集群调度等技术可实现任务和数据跨域调度到不同算力;云原生提供的laaS解耦、资源弹性伸缩等技术可屏蔽底层异构laaS,满足公有云、私有云、混合云、边缘云的需求。云原生是一个贯穿算力网络近中远期的关键技术,其演进是不断迭代的,总体可划分为四个阶段:●一阶段:容器云阶段,以容器服务为核心,为客户提供基础云原生能力,支持云原生化应用的开发、快速部署、维护能力。●二阶段:云原生技术栈阶段,进一步抽象数据服务能力,让应用无需关注PaaS能力的部署、运维、高可用等;探索多云纳管支持,让应用可以统一管理多云的资源;探索低代码、Serverless等降低应用代码复杂度的技术。●三阶段:分布式云原生阶段,应用可以一次部署,分发至不同的资源(含多云、本地),数据服务(数据库、数据湖等)支持全球场景,用户不感知数据存储地点,自动化数据随计算流动/计算随数据流动,数据服务、应用等均可Serverless化。●四阶段:算网原生阶段,应用不需要了解所需算力的大小、算力的位置、所需网络条件等,仅需关注业务需求,算网调度系统将智能化的对底层算网资源进行拉通,满足业务需求的同时实现用户成本的最优化。目前,云原生发展阶段已经经历了容器云阶段,发展到云原生技术栈,逐步向分布式云原生阶段过渡。面向近中期,重点推动云原生技术和产品演进,以支撑算力封装、算力感知和PaaS算力自适应等需求。面向中远期,需进一步针对电信网元挖掘特有PaaS能力需求,逐一探索包含电信业务运维管理能力、服务网格、微服务框架、“CI-CT-CD-运营运维”流水线、负载均衡器等在内的多种PaaS能力特性,规范化相关能力并明确其在现有云网系统中的引入方法。为体系化推进云原生在算力网络中落地,中国移动愿与产业合作伙伴一道进行关键技术攻关、标准体系构建,并通过开源能力集成与输出、试验试点验证等多种方式推进云原生的构建与成熟。中国移动将进一步探索多样性计算架构,联合产业力量,攻关算力原生、算力卸载、存算一体等重点技术方向,丰富算力类型,提升算力效率,提供差异化的算力服务能力。3.2.2.1算力原生随着业务多样化需求的增长,以CPU为主的通用计算逐渐难以满足计算性能的要求,以CPU、GPU、FPGA、DPU等不同架构计算单元组合而成的异构计算开始出现,用于满足通用计算和专有计算的不同需求。当前不同异构芯片的开发生态相对独立,应用的跨架构开发和迁移困难,不利于应用的创新和算力资源的合理规划和高效利用,亟需通过开源、开放的方式建立可屏蔽底层硬件差异的跨架构开发平台。中国移动面向算力网络中远期的发展,原创性的提出了算力原生的概念,旨在屏蔽用户在开发流程中对底层硬件架构的感知,通过抽象化的设计建立一套支持多种异构硬件的开发框架模型,并通过跨架构、异厂家硬件支持一套代码编程的抽象方法,实现算力应用的跨硬件架构的开发、编译。目前算力原生存在两条技术路线:第一种路线是基于C++和SYCL规范构建统一的开发语言,并基于统一的开发语言建立异构编译器,在编译器的后端实现多指令集的匹配和兼容,实现“一套代码,跨架构运行”,当前业内此路线的代表方案为Intel的OneAPI统一编程模型和华为的毕昇编译器;第二种路线是基于主流的AI框架构建Al编译器,通过算子拆分,实现模型与AI框架的解耦,并通过定义统一编程标准接口,屏蔽异构硬件的差异,实现“不同框架模型,跨架构运行”,当前此路线的代表方案有阿里的HALO异构编译框架。两条路线各有优劣势,第一条路线从开发语言的层面进行统一,后续编译器的开销小,不用进行语言的转换,但是开发难度较大,编译器层面的调优有一定局限性。第二条路线针对主流的Al框架模型去编译,程序开发者更易上手,开发的难度较小,但是目前主要针对Al中CPU+GPU的异构计算场景,尚未实现对多类异构场景的支持。当前业界对算力原生的研究刚刚起步,存在技术路线尚未统一,技术开放度不足等一系列问题,中国移动将采取多路径探索模式,近期重点针对统一的编程模型、统一的异构编译器平台和标准的算力抽象接口三个方向进行攻关,并联合产业合作伙伴共同推动算力原生框架、算力抽象接口的标准化和开源开放。网络流量的爆发增长和虚拟机、容器、裸金属等多样的算力服务对构建高效敏捷的算力基础设施底座提出了挑战,算力卸载技术应运而生。算力卸载指将平台或应用中需要高速处理的功能单元从通用CPU上抽离,由智能网卡硬件实现,综合专用硬件的高效性和软件灵活性,构建高性能、低损耗、灵活的云化能力。面向不同的需求场景,算力卸载主要包含两种技术●vSwitch智能网卡算力卸载方案面向虚拟化场景,使用智能网卡卸载vSwitch转发面以及virtio后端,释放vSwitch转发面占用的CPU资源、提升转发性能、支持热迁移。虚拟化软件实现vSwitch控制面,完成流表的分析和下发。●DPU算力卸载方案面向虚拟机、容器、裸金属服务场景,构建统一的计算平台。使用DPU作为虚拟化功能实体,卸载网络、存储、管理等功能,将虚拟化服务与CPU分离,从而提供基于虚拟化服务的弹性裸金属资源。对于虚拟化场景,需要进一步卸载Hypervisor后端,配合轻量化Hypervisor前端提供虚拟化服务。智能网卡/DPU北向对接虚拟化软件、南向对接服务器硬件,标准化水平是算力卸载落地的关键挑战。●面向近期,针对vSwitch智能网卡方案,需要重点关注智能网卡与vSwitch控制面软件之间的标准化对接。基于用户态DPDK-OvS的卸载模式,通过规范软件版本、标准化rte-flow流表和配置接口,以实现智能网卡与上层软件的解耦。●面向中远期,为推动DPU的标准开放,重点攻关两个方面:一方面是虚拟化软件与DPU硬件的协同方案与解耦模式,包括明确虚拟化管理、网络、存储的功能要求以及在软硬结合架构上的具体实现,虚拟化场景Hypervisor前后端架构设计;另一方面是服务器与DPU硬件之间的标准化对接,需要规范服务器的整机设计来兼容DPU在硬件规格、供电、BMC等方面的多样化方案。当前,业界的算力卸载产品形式各样,主要通过与云平台厂商的定向开发解决适配问题,缺乏统一的标准体系和集成环境。为形成体系化的解决方案,中国移动将成立开放标准实验室,以实验室为载体开展产业多方合作、集成测试、标准制定等工作。为解决经典冯·诺依曼架构下,存储与计算分离导致的“存储墙”问题,存算一体技术近年来引发国内外的极大关注。存算一体是指不断拉近存储器与计算器的距离,通过减少数据存取的开销,在提供更大算力的同时实现访存高效节能。当前,人工智能深度渗透到各个领域,存算一体作为一种全新的计算架构,对冯·诺依曼架构进行大规模并行运算操作时给予了有效补充。根据“存”与“算”的距离由远及近,我们认为存算一体存在三种技术分类,包括“近存计算”、“存内处理”和“存内计算”。其中,存内计算直接在存储原位进行计算,存储计算高度融合,是真正意义的存算一体。存算一体依赖不同存储介质实现,如SRAM、RRAM、PCM、MRAM等。当前存算一体技术正处在从学术界向产业界转化的关键窗口期,主要面临两方面问题。一方面,高校和企业积极参与,推动多条技术路线并行探索,但多技术路线导致的差异化在一定程度上延缓了产业化进程;另一方面,存算一体芯片仍然面临产业链与工艺水平的制约,还未形成系统化的设计方法与标准化的制造工艺,器件本身也有待进一步成熟,因此存算一体产业化亟需打通设计、工艺、封装、产品等完整的产业链条。中国移动结合算力网络业务发展需求,将从以下两个方面推动存算一体逐步成熟:●面向近期,针对“近存计算”、“存内处理”等相对成熟的技术和产品,通过需求拉动、应用牵引,积极开展试验测试,加快新产品规模商用的节奏。●面向中远期,一是对于存算一体“存内计算”新型计算架构和芯片,勇敢践行“链长”责任,构建产业协作平台,聚集产业力量加快存算一体SRAM、RRAM、MRAM等技术路线收敛,同步推动相关芯片、部件以及产品的成熟,加快存算一体产业化进程;二是加强存算一体芯片和上层编译软件、算法框架的适配,扶植和培育产业链上下游创新科技企业,为未来存算一体的繁荣生态铺平道路。3.2.3面向光电联动的全光网中国移动将以算力为中心不断优化网络布局,同时联合产业伙伴,以400G/800G全光高速互联、OTN灵活光电联动、智能网络调度、算网SPN承载和PON高速全光接入为主要方向开展攻关,综合运用CPE-OTN/SPN/PON/FTTR等多种方式提升末端接入能力,提供差异化承载,构建算力网络高速、敏捷的基础网络底座。光通信是信息产业发展的基石,是基础网络的重要组成部分。随着算力网络概念的出现,对光网络的组网架构、带宽提供和时延保障等方面提出了新的挑战。首先,一体化大数据中心规划改变了网络基础设施的布局方式,光网络布局从以行政区划为中心向以算力为中心演变;其次,由于算力资源高度集中,网络带宽需求急剧上升,光网络需要提供更大规模、更高传输速度、更大容量的传输链路;最后,算力协同、算力应用对网络时延要求不断提高,需要光网络提供更低时延的直联传输链路。●面向近期,引入集成式OXC,减少算力业务在路由器中转发跳数,中间节点尽量采用集成式OXC全光交换技术降低转发时延。OXC通过LCOS、光背板、光层OAM等核心技术实现高维度、高稳定和高速转发的全光交换,提升组网的可靠性和灵活性。●面向中远期,引入400G/800G超长距离传输技术,提升全光高速传输性能和容量。目前超长距离传输存在多种调制格式技术选择,需尽早统一技术路线,中国移动将联合产业界收敛高速传输调制格式,推进相关高性能ODSP、波特率在130G+以上的高速调制器、硅光和低噪声光放大器等关键技术实现,延伸传输距离;同时通过采用空芯光纤等新型光纤,扩展光纤的可用频谱,提升光纤传输容量。中国移动将持续推动骨干网由100G/200G到400G/800G的代际演进,加快制订全系列OXC光交叉节点模型,构筑光网络内部波长一跳直达的新型网络架构,通过扁平化组网、路由优化等多种举措,构建低时延和差异化时延算网能力,打造传送网骨干(20ms)、省域/区域(3-5ms)、地市(1ms)三级时延圈,保障网络传输时延最优。3.2.3.2OTN灵活光电联动东数西算、东数西存等业务要求传送网具备超低时延、弹性调度、高安全性等能力。实现光传输链路的灵活调度是光网络面临的巨大挑战,由于数据流向和目的地随机性强,传统静态电路配置的传输链路供给方式难以满足业务灵活多变的传输需求,需要光网络提供灵活光电协同能力,实现传输资源动态调度动态响应。灵活光电联动技术通过光层(波长级)+电层(ODU、OSU)资源的动态拆建、灵活调整,实现光网络带宽资源的动态供给,根据传输性能和业务需要合理设置电交叉和光交叉,充分发挥光层/电层全颗粒调度的低能耗、低成本优势,满足突发式数据迁移需要。●面向近期,在管控层面引入自动化的光电协同管控能力,实现光电管控深度协同,统一调度光层和电层资源(例如路由计算、业务开通等)。支持基于业务请求直接打通光层和电层连接、通过光层实时调度策略实现故障业务动态恢复等功能。●面向中远期,引入光层OAM机制,实现波长信号的光层管理。通过给每个光层波长信号调制生成唯一的“光标签”,在每一个监测点(OAWSS)检测波长标识“光标签”,实现光层的管理和调度。通过定义光层OAM标准帧格式,实现业务速率、发送光功率监测、光波长路由信息同步、光波长路由控制等功能。中国移动将进一步完善光电联动管控功能及光层OAM技术方案,加速推动现网OTN设备及管控系统升级演进,进一步提高全光网业务开通速度、提升运维效率。光网络需要具备面向用户直接提供更灵活敏捷、更高品质的算网服务的能力,以实时动态响应算力业务需求变化,满足海量运力随需调度的需求。同时还需支持算网资源智能化、实时化呈现,帮助运维人员直观、全面地评估算网能力。面向算网业务,光网络调度系统需要自动化评估用户入算、算间互联的光网连接能力,支撑上层算网编排调度系统智能决策算力和网络的调度方案。●面向近期,引入业务感知能力,自动建立满足服务质量要求的连接。当业务流量、流向、SLA等发生变化后,光网络实时匹配业务需求,实现带宽的自动调整,并调度业务转向满足算力资源要求的节点。通过算网运力可视化技术展示算网一体化拓扑、时延和带宽利用率、算力的时延覆盖范围,算间的时延带宽状态等,支撑算网优化布局,促进网络从以行政区划为中心向以算力节点为中心演进。●面向中远期,通过多因子算路技术,感知算网实时状态,针对不同业务SLA需求,采取不同选路策略,通过对网络利用率、时延、能耗等多因子进行综合评估,计算最优路径。●面向远期,引入AI技术自学习算网业务分布特征、时长模式和增长趋势等,优化多因子算路能力。面向算网一体化调度,并发计算用户到所有可选算力节点的路由,支撑包含算网大脑在内的上层系统根据网络运力度量数据智能决策算网调度方案。中国移动将持续推动光层设备管控系统北向标准规范的制定,拉通产业合作,形成体系化的解决方案,推进算网资源可视、多因子算路、Al增强等技术实现,推动智能全光网试点应用,实现基于业务需求的灵活全光调度。SPN技术具备软硬隔离、低时延、电信级大规模L3组网和SDN智能化管控能力,为边缘计算等算网业务提供灵活承载。当前SPN承载算力业务主要面临三大挑战:一是广覆盖、高品质算力服务承载能力,二是基于细粒度的SPN承载能力,三是算网一体化支撑能力。为充分发挥SPN技术和网络优势,并提供一体化算网服务体验,中国移动提出算网SPN承载总体技术架构,以Underlay为基础,整体融入到端到端算网服务体系中,打造具备传送特性的算网感知承载技术体系。通过算网SPN能力抽象和虚拟化,一方面继承原有SPN技术架构和理念,另一方面增强算网SPN感知服务能力。以算网SPN感知承载和跨域无缝对接技术为核心,为算力提供边缘感知、服务开放、灵活连接、业务质量可视可管、快速故障定位和恢复的电信级算网承载连接,形成端到端算网一体化服务体验。●SPN感知承载:面向近期,打造算网一体小型化SPN设备,实现算网SPN承载服务与算力差异化需求的精准匹配;面向中远期,推进SPN接入层设备集成算力资源,为行业用户提供工业质检、数据分析、故障预测等便捷的超边缘算力服务。●算网SPN跨域无缝对接:面向近期,在转发面支持转发协同,支持SID+MTN/FGU硬切片+SR隧道连接协同能力,支持OAM、随流检测、保护和重路由对接,提供一体化高效连接;面向中远期,在管控面增强网络能力开放,为算网大脑提供专有业务的连接协同管理能力,支持业务协同管理控制,管控系统可将SPN网络虚拟为算网SPN资源为算力网络提供开放的服务,也为端到端算网连接实现高效协同。中国移动已联合业界开展算网SPN研究,同时联合业界设备、芯片厂商大力推进算网一体小型化SPN设备研发,共同推动算网SPN为算力网络提供高品质连接。PON高速全光接入随着数字家庭、中小微企业信息化、智慧城市等千行百业数字化转型,以及接入网络的连接数量和场景的不断扩展,全光接入网作为接入运营商网络的第一跳入口,在提升光接入网络的带宽、时延和确定性等网络基础能力的同时,还需要融合网络感知和网络切片能力,以支撑面向服务的差异化链路资源的隔离、匹配和路径调度的优化。●提升全光接入性能:面向近中期,全面部署10GPON提升光接入带宽,逐步向50GPON升级进一步实现带宽倍增,同时通过创新跨层协同DBA调度、ComboDAW、队列调度等机制对接入时延和确定性实现全面优化;面向中远期,加速光纤向最后“黄金十米”延伸,基于强管控维FTTR创新架构支撑光接入网服务能力向家庭房间和写字楼房间的延伸,基于光+WLAN融合调度技术实现光接入网端到端千兆无缝覆盖和低时延保障优化。●增强光接入网感知能力:面向近期,结合10GPON、FTTR、WiFi6等技术,增加算力网络接入段带宽、时延保障能力;面向中远期,结合随流检测、DPI/DFI技术等技术融合,实现业务和网络质量可视,并依托50GPON、网络切片、SDN技术、跨域编排平台,构建OLT多边缘组网能力,支撑面向不同算力需求的网络链路资源的匹配和路径调度的优化。3.2.4面向超低时延的确定性网络保障确定性网络、中国移动将持续提升网络能力,与业界合作伙伴一同攻关SRv6/G-SRv6、确定性网络、新一代SD-WAN、应用感知等关键技术,对网络带宽、时延、抖动、隔离性等提供确定性保障能力,满足行业用户和应用多样化的网络需求。IP网络作为连接用户、数据、算力的主动脉,需要满足算力节点间高质量互联以及用户和算力节点间泛在、灵活连接的需求。SRv6/G-SRv6技术因其强大的路径可编程能力、协议极简等特征,可为端、边、云、网的灵活互联提供高品质的确定性连接服务保障,而逐渐成为算网融合时代新一代IP网络的演进方向和核心技术。然而原生SRv6使用128位IPv6地址进行路径编排,存在报文头部开销过大、承载效率低、现网升级困难等问题,严重阻碍了现网的规模部署、制约了新一代IP网络的发展演进。中国移动创新性提出了G-SRv6头压缩技术,对IP报文头/帧头格式以及转发机制进行了重新定义和优化,很好的解决了原生SRv6的现有问题,目前已通过国际和国内标准立项,成为业界的主流标准。G-SRv6可广泛应用于IP网络,包括中国移动的云专网、CMNet、IP专网等传统承载网络以及SD-WAN新型Overlay网络,并在未来逐步向数据中心/云内网络深入。中国移动将以云专网为切入点推动SRv6/G-SRv6的全面部署。面向近期,将首先推进SRv6/G-SRv6在云专网的部署,同步开展SRv6/G-SRv6随流检测技术标准制定和试点验证;面向中期,逐步推动SRv6/G-SRv6在CMNet、IP专网的全面部署和随流检测技术的现网应用;面向远期,逐步实现端到端SRv6/G-SRv6统一组网,简化网络协议,拉通端边云网,满足业务差异化承载的目标,构建统-SRv6/G-SRv6协议栈的IP算力网络底座。确定性网络通过结合资源预留、流量整形、网络切片、路径规划等技术,实现可预期、可规划的流量调度,将时延、抖动和丢包率控制在确定的范围内,满足高带宽、低时延、高可靠的新型业务需求。一方面,可以通过网络切片提升网络整体效率并实现业务隔离,保障确定性业务需求;另一方面,可以通过精细的时间同步、队列调度等机制,实现微秒级的时延和抖动控制,满足行业应用严格的业务指标。同时,还需要端到端考虑网络跨域协同,实现端到端的网络确定性。当前,可利用SRv6/G-SRv6实现承载网基础切片功能,将不同业务调度到不同转发路径实现业务质量保障和资源隔离。未来将进一步结合转发面切片,实现单客户多业务的层次化切片。转发面的切片结合路径规划实现业务数据传输的确定性链路控制。切片子接口通过资源预留实现带宽保障,结合控制面Flex-Algo技术,动态规划拓扑,为不同业务灵活规划确定性资源保障。目前该方案已经通过实验室验证,后续将进一步压缩Flex-Algo对控制面资源的占用,减少系统影响,增加切片数量。面向近期,中国移动将开展基础切片的业务部署,通过SRv6/G-SRv6Policy实现粗粒度的切片,为不同切片提供差异化转发路径和隔离资源,保证切片业务互不影响。面向中远期,随着切片用户数量和网络流量的持续增大,海量切片以及切片间资源保障要求进一步增强,将推动增强切片和细粒度切片的演进升级,转发面需要通过SliceID选择切片转发路径,通过切片子接口实现带宽隔离,进一步提升切片能力,并结合控制面Flex-Algo技术,动态规划拓扑,为不同业务提供确定性和细粒度的资源保障,满足算网调度在时延、抖动、丢包率等方面的确定性体验要求。为解决传统SD-WAN多厂商设备互通解耦、端到端网络质量保证等问题,中国移动创新推出新一代SD-WAN(智享WAN),并逐步推进现网原生SD-WAN向智享WAN演进。智享WAN基于SRv6/G-SRv6技术统一Overlay+Underlay网络协议栈,整合接入和骨干等多段网络资源,在简化网络的基础上进一步增强了算力+网络资源协同能力,拉通端、边、云、网,并将用户意图与网络资源调度能力结合实现“应用+算力+网络”协同调度,提升业务质量保障能力,实现端到端、差异化、确定性、可增值的算力网络服务。当前,智享WAN已在国际标准组织BBF完成立项,获得国际主要运营商、芯片商、设备商的支持,成为运营商SD-WAN发展新方向。中国移动也将智享WAN作为算力网络近中期的重要技术,将重点攻关智享WAN技术方案中存在的“网络+算力+应用+安全”融合的关键技术问题,如SRv6/G-SRv6下沉到用户侧带来的安全可信问题、应用和算力感知、穿越4G/5G网络实现端到端无缝对接、融合业务链增值能力等,同步推进智享WAN端到端技术方案研究、标准制定、实验室和试点验证等工作,从而推动智享WAN技术和产业成熟。3.2.4.4应用感知应用感知存在多种技术,传统方式如ACL、优先级等通过字段匹配加策略控制的方式实现。DPI方式通过报文特征字识别、关联识别和行为识别等多种识别方式,利用会话连接流的包长、连接速率、传输字节量、间隔等信息建立流量特征模型。上述应用感知技术方案相对较成熟,可在算力网络业务部署初期使用。随着算力与网络进一步深度融合,需要网络支持精细化应用感知能力和运营运维,以提供差异化服务,新型的应用感知技术应运而生。应用感知利用SRv6/G-SRv6的可编程空间,在用户侧将应用信息和需求内嵌在业务报文中,在网络侧进行标记、识别和应用质量保障,使网络有效且低成本地感知应用差异化需求,提供应用级网络服务。同时,应用感知还可以结合业务链技术实现灵活丰富的算力增值服务能力。此外,中国移动原创性地提出了利用DNS代理结合SRv6路径策略绑定的技术方案,利用SD-WAN控制器通过DNS代理机制集中化、按需分发应用策略给CPE,实现按需的端到端路径保障,解决CPE进行应用识别时存在的资源消耗过大、伸缩性不强且策略调整困难等问题。通过利用DNS域名标识应用,控制器根据DNS选定的最优的算力服务节点IP地址,编排端到端SRv6路径,并将路径策略通过DNS响应带给CPE,CPE记录应用策略和目标IP地址绑定关系,实现“应用+算力+网络”协同最优调度。面向近期,在用户接入边缘(如智享WANCPE)进行应用识别及标记、准入控制,在网络侧(如运营商边缘路由器)根据应用标识和需求将其映射进入相应SLA等级的隧道或切片满足应用质量保障的要求。面向中远期,逐步将业务感知能力延伸到终端,允许终端直接按需进行服务ID的标记,通过DNS、五元组等多种方式支持更加灵活、细粒度的应用级服务场景,同时可实现应用性能测量可视化、快速故障定位,使能应用级精细化运营,提供弹性化、差异化、可增值的算网一体服务。综合来看,应用感知技术目前尚未形成业界统一的技术路线,终端侧APP提供统一服务标记也存在较大难度,中国移动希望联合产业各界继续共同研讨,制定可推广落地的技术方案和标准,推动应用感知技术发展。面向算网一体的原创技术突破中国移动将持续推动算网技术的创新,希望凝聚产业力量,共同探索算力路由和在网计算关键技术,从协议和设备形态方面逐步推动算网一体共生发展,支撑未来算力网络业务创新。面对算网一体阶段,网络演进的核心需求是算力与网络相互协同感知,需要通过网络感知、调度、编排算力,融合计算和网络形成新的架构和协议,进一步推动基础设施走向算网融合,使海量的应用能够按需、实时调用不同位置、差异化的算力资源,通过连接和算力的全局优化,实现用户体验、资源利用率和网络效率的最优组合。为实现上述目标,中国移动原创地提出算力路由技术,推进算力和网络在协议上一体共生。算力路由基于对算力资源/服务的部署位置、实时状态、负载信息、业务需求的感知,将感知信息在网络中通告,通过“算力+网络”的多因子联合计算,按需动态生成业务调度策略,将应用请求沿最优路径调度至算力节点,提高算力和网络资源效率,保障用户体验。算力路由技术的构建需要重点关注以下方面:●面向近期,构建算网协同感知技术体系。完成单一网络维度的感知,并向算力、网络和业务多维资源感知体系的演进。通过多维资源感知方法、算力信息通告模板、汇聚处理方法、算力通告协议等技术,形成算网协同感知技术体系,实现对算力资源和服务的部署位置、实时状态、负载信息、业务需求等的全域感知,构建全局统一的算网状态视图。同时完成对业务算网需求的统一解析,实现对业务的全面感知,为基于业务需求进行算力调度提供保障。●面向中远期,攻关算力路由和寻址机制。研究从单一距离向量路由到算力、距离多要素叠加融合路由演进,基于IPv6/SRv6等协议进行继承性创新,探索Underlay、Overlay以及两者协同的多种技术路线,形成新型路由协议和寻址机制。结合算力路由信息表和业务需求,通过“算力+网络”的多因子联合计算,按需动态生成业务调度策略,使业务沿最佳网络路径调度到目的算力节点,实现算网一体调度。●面向远期,探索新型算力路由协议。结合信息通信网络由数据转发向数据处理转变的趋势,研究新型融合路由协议,助力构建转发及计算融合的新范式,推动实现算网一体共生发展。3.2.5.2在网计算当前数据总量增速加快和单芯片算力增速不足之间矛盾日益明显,为了弥补端侧算力不足的问题,通过在网计算,将应用相关的功能卸载至网络设备,在完成数据转发的同时实现高效的数据处理,提升系统整体计算效率,降低通信延迟,减少总体能耗。为实现在网计算技术,需要结合上层应用和底层硬件进行一体化设计,对底层硬件进行抽象,同时将应用相关的部分功能以计算原语的形式下放到网络设备,从而实现数据转发和数据处理的并行操作。在网计算作为中国移动算网一体创新技术之一,重点从以下两个方面进行推进:●面向近中期,提升网络设备的可编程能力。利用可编程交换机、FPGA智能网卡、DPU等异构可编程硬件在分布式计算、Al计算以及网络安全检测等特定应用场景的局部卸载和加速方法,将数据聚合、流量统计及过滤的相关计算操作卸载至网络设备,提升系统计算效率。●面向远期,推动构建在网计算体系架构。将底层网络设备硬件进行统一抽象和管理,同时不断完善上层软件框架,将计算任务实时动态地发送到具备空闲计算能力的网络设备完成,实现更加高效的数据处理,同时大幅提升网络资源利用率,推动在网计算技术从数据中心或局部应用成为全局泛在的技术。中国移动将着力构建融数注智的算网大脑,与产业合作伙伴一起,重点突破多要素融合编排、原生编排、算网智能化和算网数据感知等技术,为算力网络提供多要素融合的一体化智能编排调度和运营支撑能力。3.2.6.1多要素融合编排随着5G+边缘计算的兴起,流量模型从“云-网-端”演进到“云-网-边-端”,用户需求从使用单一算力节点演变到需要多个算力节点的最优组合,算力的高效编排和精准调度面临新的挑战。未来,算力节点的地理位置、资源容量、算力成本、网络质量、数据中心PUE和上架率等都将成为算网编排需要考虑的因子,对多要素融合编排的能力提出了更高的要求。算网多要素融合编排是在业务需求和算网基础设施之间实现的最优供需匹配。一方面,针对不同的算网业务和SLA需求,算网编排需结合算力解构技术,将多样化、大粒度、复杂的算力任务分解成小粒度、简化的算力任务,同时综合考虑计算、存储等算力因素,带宽、时延等网络因素,以及能耗、位置等环境因素进行一体化的规划,对泛在分布的算网资源进行均衡调度;另一方面,需根据业务需求对AI、大数据、安全等要素能力灵活组合、统一编排,实现多要素能力的融合供给和最优匹配,在高效利用资源的同时,提供更为丰富的算力网络产品和服务。算网多要素融合编排近期主要实现算力网络多要素编排模型构建,攻关泛在资源调度算法、算力解构等技术,构建可将客户意图解析为当前算网可计量计费的产品能力;中期逐步构建除算力和网络之外的其他要素、能力和应用的融合编排能力;远期实现结合业务的融合编排,并引入意图驱动等前沿技术提升智能化能力。3.2.6.2原生编排算网多要素融合的智能编排调度依赖于底层基础设施的能力抽象和模型化。为保障算网大脑对算力、网络、数据、IDC、安全、应用等各要素的统一编排及管理,需要各专业遵循“原生编排”的理念,即具备自身独立管理调度能力的同时,能够按需向算网大脑提供服务化、意图化接口,以支持对各专业域内各技术要素的感知、编排、调度等操作。原生编排调度是算网大脑构建符合业务需求、多要素可灵活组合/封装的一体化编排能力的基础,通过不断提升算力网络的基础设施层、编排管理层智能化程度,构建跨网、跨域的高层智能接口,使用用户“意图”作为算力网络基础设施生命期管理的驱动因素,通过自动化方式将业务需求即时转化为网络和算力基础设施的执行,实现两者的快速适配。原生编排需要考虑算力和网络能力抽象的巨大差异。对于云算力,资源节点和云管系统通常一体部署,云管系统天然具备北向开放能力,API定义和调用方法相对完善,但是不同云管系统之间的能力开放程度、接口定义可能存在较大差异,因此在构建云的原生编排调度能力时,将重点考虑对不同云管系统能力抽象的差异化适配;对于网络,网络设备和管控平台通常分开建设,未来在既有的各个网管平台基础上,将增强租户级业务管理功能和能力开放,在意图接口基础上实现网络业务的灵活编排;对于应用、安全等,未来更多以云服务模式提供,能力抽象和开放方式可以参考云管系统的模式。面向近期,原生编排重点关注不同网络和算力能力的差异化适配,从而实现网络加算力的融合调度;面向中期,实现完整的、标准化的能力抽象和模型构建,统一服务化接口API定义和调用方法;面向远期,实现用户“意图”驱动的意图化接口,并在意图接口基础上实现网络随着网络和算力技术的发展,业务需求呈现多样化、综合化、自动化和智能化的特点,成为算网智能化的主要驱动力。同时,对于算网大脑而言,面向算力网络多要素、多因子的融合编排管理需求,管理对象种类多、数量大,算网大脑本身也需要通过与Al、大数据等技术深度融合,探索算网自智、数字孪生、意图网络等新方向,不断增强算力网络自动化、智能化能力,并提供智能闭环的保障能力,逐步实现算网自智。算网大脑智能化技术的构建包括平台、能力和应用三个层面。在平台层面,算网智能化平台面向算网智能提供数据接入和处理、能力研发和编排、应用研发和运营等功能,为算网智能化应用和能力提供端到端生命周期管理能力;在能力层面,面向算力网络预测、感知、决策、诊断、控制类Al能力,支撑能力从研发、发布、推广到运营运维监控的全生命周期。实现对算网智能化能力的体系化管理,实现算网智能化能力的共享和快速复用;在应用层面,面向算网智能化运维,围绕规划、建设、维护、优化、运营五大运维流程,支撑算网业务从部署、推广到运营运维的全生命周期智能化应用。面向近期,算网智能化重点攻关平台、能力和应用的智能化框架研究,构建算网智能化的系统体系;面向中期,支持和完善算网智能编排管理、智能故障管理、智能性能管理、智能运维管理能力,支撑算网规、建、维、优、营全流程、全周期智能化维护;面向远期,逐步实现从用户意图感知、故障定位到故障解决等端到端自助服务能力。算网数据感知是对业务与算网资源状态的实时捕捉、理解以及预测能力,是算网大脑进行多要素智能编排与一体化运维的重要保障,为最终实现算网数字孪生和算网自智奠定基础。算网数据感知需要延伸现有算、网资源模型,统一算网感知对象,围绕感知对象分主题、分层次、分维度构建一体化的算网感知模型,实时捕捉算网业务与资源的动态特性,并通过对算网资源及运行数据的采集、存储、处理等环节,保障算网感知信息传递的及时性、有效性,为多要素编排提供底层数据基础。算网数据感知能力的构建需重点考虑以下两方面,一是持续完善针对新型算力(如GPU、FPGA等)与网络协议(如RoCE)的状态感知方案,构建分层次、分维度的指标体系,统一量化异构算力节点可用性、连接可用性、网络负载状态等指标;二是推动动态采集工具进一步向轻量化、敏捷化演进,以实现对算网资源、可调度可售卖能力的实时采集,契合算网环境的动态特性。为实现最优算网资源配置与最佳业务体验,中国移动将以算网全局视角统一规划算网感知体系,对感知对象、数据结构、数据采集、数据流转、数据存储和治理等关键环节形成统一能力与要求,制定算网一体化的感知指标体系,并开展算网一体数据采集、融合、治理的联合创新与验证工作,促进算网感知技术发挥更大价值。面向近期,构建算和网的一体化感知体系,将网络和算力的数据纳入统一的算网数据感知体系;面向中期,实现算网资源状态的实时捕捉、理解以及预测能力,为算网的实时感知和动态调整能力提供数据支撑;面向远期,构建算网数字孪生和算网自智的算网数据感知体系。中国移动不断探索算力网络新型服务模式,联合业界攻关多方算力共享和跨域数据融通场景下的算力交易、数据流通关键技术,通过盘活社会算力资源,深挖数据价值,打造算网服务新业态。3.2.7.1算力交易技术数字化经济时代下的算力需求不断增加,我国算力规模持续扩大,但是社会算力利用率却难以提升,大量闲散算力资源亟待盘活使用。为解决上述问题,在商业模式上需要打破传统的算力供给方和消费方的界限,通过多方算力并网,构筑“算力电商”平台,使客户既可以成为算力服务的提供者,也可以成为算力服务的消费者。算力交易技术重点从以下三个方面进行推进:●面向近期,明确算力交易流程和标准。推进运营商、云服务商、以及智算超算中心等可共享闲置算力的各方积极参与,联合研究制定统一的算力注册、接入、度量、运行、计费、评级等端到端流程和标准,探索通过云原生和终端插件的方式实现对多方算力的灵活调度,实现对多方泛在、形态异构的算力进行统一的纳管、封装、使用。●面向中期,攻关可信交易关键技术。借助区块链技术,通过联盟链的形式构建算网交易可信平台,将算力交易中的关键环节上链存证,利用区块链的多方共识、数据不可篡改特性,追踪记录业务全流程数据,解决信息流转不畅、数据篡改、来源不可追溯等问题。●面向远期,实现服务模式升级。对外深入挖掘用户的任务式服务业务需求,对内与意图引擎、数字孪生等技术深度融合,逐步实现对于用户意图的全方位快速感知和精准识别,自动选择最适合的算网服务方案,使客户享受智能无感的服务体验。3.2.7.2数据流通技术在数字经济时代,数据已成为关键生产要素。国家政策积极引导数据流通,促进数据价值的释放。但数据流通目前面临三大问题亟须解决:第一,地方和企业独立建设数据系统,呈现较强区域和行业特性,技术标准冗杂不统一,“数据群岛”现象凸显;第二,数据安全和隐私保护的重要程度越来越高,在充分发挥数据价值的同时要保证数据流通的合规性要求;第三,数据在确权、定价等方面的机制尚不完善,市场尚未成熟,导致用户参与度不高。数据流通总体技术方案通过基础能力、流通调度和服务运营三层架构实现,能够有效解决上述问题,实现跨主体、跨区域、跨层级的数据流通与治理,激活数据价值。其中,基础能力层针对数据流通“可信”需求,提供联邦学习等隐私计算能力,助力大规模多边协作。联邦学习可在数据不出本地的情况下进行数据联合训练,建立共享的机器学习模型,解决数据不出域,无法共享以及数据汇聚成本高的问题。流通调度层面向云、边、端的数据流通,提供可信的数据流通机制,解耦运营应用和算网能力,基于数据流通需求,高效调用数据、算力、网络、算法等数据流通的关键服务要素,实现数据的高效可靠流通。服务运营层包括运营、开放、管理以及监管四类平台。运营平台面向大规模数据交易,建立规范化的运营机制,提供一站式的运营能力;开放平台面向跨平台、跨中心的多样化数据应用,提供自动化、智能化的多方联合数据挖掘能力;管理平台面向跨区域的海量数据资源,提供全覆盖、多粒度的标准化管理;监管平台面向数据产业新业态,提供科学化、精准化监管。数据流通将重点从以下两个方面持续推进。面向近期,制定并完善数据流通总体架构设计,对数据运营、开放、管理、调度等关键问题形成端到端解决方案,并推动业界形成共识;面向中远期,打造关键核心能力,构建数据流通调度与共享的技术体系,推动数据服务能力向纵深发展。3.2.8面向绿色低碳可持续发展中国移动将联合产业伙伴,持续推动算力网络基础设施的绿色化、低碳化发展,在芯片、服务器、数据中心基础设施三个层面引入绿色低碳技术及措施,不断提升算力算效,同时加速能源转型,构建以新能源为主体的绿色低碳新型电力系统,助力国家双碳目标实现。芯片的能耗是影响算力网络整体能耗的最关键因素,随着算力需求的不断增长及芯片设计制造技术的不断发展,芯片集成度越来越高,单位面积上的晶体管密度也越来越高、布局越来越复杂,随之而来单位面积功耗也迅速增长,但相应的算力增长超过功耗增长,即芯片的算效也在不断增长。从算力网络的绿色和低碳角度出发,中国移动大力引入先进芯片,在大幅提升整体算力的同时着力提升算效。当前芯片提升算效实现绿色低碳主要有以下四个技术方向

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论