李锴:通过总线技术实现数据中心级先进封装_第1页
李锴:通过总线技术实现数据中心级先进封装_第2页
李锴:通过总线技术实现数据中心级先进封装_第3页
李锴:通过总线技术实现数据中心级先进封装_第4页
李锴:通过总线技术实现数据中心级先进封装_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

演讲人:李锴演讲单位:中国移动研究院在Chiplet条件下,Intel、AMD、Arm、Hygon等处理器的核心数量不断增加,通用服务器算存比没有大幅波动情况下,对服务器内存容量需求大幅提升;图片来源:Intel图片来源:AMDIntelSapphireRapids提供多达60个内核,120线程,8个内存通道AMDGenoa提供多达128个内核,256线程,12个内存通道不断增加的核心数量进一步提升了算力能力,与此匹配的服务器内存需求也同步匹配•

新一代人工智能依赖数据、算法和算力,然而,当前AI硬件的算力增长远远超过内存发展速度,导致原有内存的分层架构效果无法完全满足现在业务需求;•

在边缘场景下,海量、高维模型、稀疏特征数据需要强大的内存支持系统来实现更好的在线推理能力;在大模型的训练和推理场景,GPU/AI卡的显存或内存容量不足,呈现出明显的「内存墙」问题。这些数据的高维、稀疏特征又为计算和存储带来了很大的挑战,隐藏层大小可能就是数百万的量级,总参数量甚至能达到十万亿的量级,对显存/内存需求大训练、推理场景在应用需求对大内存迫切性增加•

需要通过芯片层级的架构改进来缓解内存墙瓶颈,例如将内存堆叠在逻辑芯片上,使内存更靠近处理器,从而更近、更快且更容易访问数据,无论在是通用计算还是智算都殊途同归;传统计算架构芯片级共封装内存内存内处理器加速器处理器加速器存同封装内来源:TSMC同封装存芯片内部正在使内存更接近逻辑和加速器,内存将不是通过PCB连接的,而是放在封装之中,CPU和加速器的速度更快、性能更高来源:AMD来源:NVIDIA•

面向大模型的训练、推理场景,单机8卡已经不能单纯作为单台服务器的边界,需要构建更大型的超级计算机提高计算效率和能力,通过实现计算架构的改进,以确保其满足算、存要求,使数百级别处理器进行总线级互联;•

做为另外一种“先进的封装技术”,其规模已扩大至数据中心,总线连接可被视为中介层;Super

Server(S²)Server1Server2内存a-b内存b-c内存a-e处理器加速器内存a-e处理器加速器处理器加速器处理器加速器总线总线交换机、路由器总线互联总线总线Server3Server4实现总线互联的数据中心“先进封装”内存c-d处理器加速器内存d-e处理器加速器内存a-e内存a-e处理器加速器处理器加速器传统数据中心S²架构数据中心•

当前业界有多种通过总线技术实现拓展带宽的技术,并将CPU、GPU、存储介质等异构部件实现全连接,增加缓存一致性、纳秒级时延、百处理器级别的技术能力,力争通过总线技术将大规模的存、算融为一体;•

PCIe/CXL、Nvlink、CCIX、AMBA等技术正在加速演进;总线协议CXL/PCIe5.0NVLINK4.0100Gbps;封闭PCIe5.032GT;PCIe6.064GT;速率开放性开放•

中国移动正在密切探索包括CXL在内的多种总线技术,目的统一异构部件的算力和存储资源,实现大带宽芯片连接;PCIe连接CXL连接•

当总线可以实现多种应用场景,从现实需求的优先级来说,建议在构建统一内存池和GPU/AI芯片层级的总线互联进行同步推进;•

内存池可以实现处理器和内存设备之间的缓存一致性访问,扩大内存容量和带宽;推进总线互联的内存池推进GPU/AI芯片层级的总线互联总线Switch总线Switch总线SwitchServerServerServer计算总线计算总线总线Switch总线Switch总线Switch总线Switch总线Switch总线Switch总线Switch总线Switch...........N0

1

2

3

4

5N0

1

2

3

4

5N0

1

2

3

4

5N0

1

2

3

4

5.多Server共享存储资源多Server共享存储资源一组有N张GPU/AI卡一组有N张GPU/AI卡更灵活的存储结构更高效应用开发更多样的存储介质更低延迟的内部通信更高效的数据读写更灵活的拓扑连接通过探索包括CXL在内的总线级内存池;新型总线的卡间互联模式,形成技术突破和应用•

Type

1:主要用于连接处理器和SmartNic等加速器,以提高处理器的转发效率性能;•

Type

2:主要用于连接处理器、GPU等加速器和内存,以提高多处理器对内存的使用,提升多处理器协同效率。•

Type

3:主要用于连接处理器和扩展内存,以满足内存带宽和容量的拓展DDRDDRDDRDDRDDRDDRDDRDDRDDR主机主机主机CXL.ioCXL.ioCXL.ioCXL.cacheCXL.cacheCXL.memCXL.memSSDSSDSSDSSDSSDHBMHBMHBMExpandorGPU/AISmartNIC加速器加速器加速器CacheCacheCacheType1Type2Type3允许加速器访问和缓存主机连接的DDR内存允许加速器访问和缓存主机连接的DDR内存允许主机访问加速器的易失性(RAM)和持久性非易失性(闪存)存储允许主机访问加速器的易失性(RAM)和持久性非易失性(闪存)存储•

提供新型计算模型的解决方案,为云计算和数据中心提供更高的数据速率、更高的带宽和容量•

适用于多种类型存储器的通用标准接口,可以为系统灵活的利用DRAM、LPDDR等不同内存介质(a)非总线场景寄存器

1nsCPU附加到CPUCacheDDR10ns100nsDRAMDRAMDRAMDRAMDRAMDRAMDRAMDRAM容量增大性能增强通过总线技术实现拓展Memory250ns独立于CPU磁盘(b)总线场景NVMeSSD400ns10-40usCPUCXL等3-10msHDDDRAMDRAMDRAMLPDDRNVMe…ü

可以灵活地添加各种内存,而不会影响本机连接的DIMMü

内存可以针对系统成本、容量、功率、带宽进行独立优化内存技术•

以CXL等总线级技术不仅提供了高速传输,还支持内存共享和虚拟化,使设备之间的协作更加紧密和高效。•

通过带宽提升、多样性存储介质有助于满足现代数据中心对大规模处理和分析的需求,同时也能够为AI、机器学习等新兴应用提供更好的支持,从整体上降低TCO010203带宽多样成本内存带宽提升多样性存储介质内存成本降低•

运行程序可在持久存储中,服务器断•

通过内存扩展器(MemoryExpander)来增加DRAM的容量,可以在不改变系统结构的情况下,提高内存的可用性和灵活性。•

当前CXL基于PCIe5.0接口,支持电内存数据不丢失;32GB/s的双向传输速率;•

总线级互联可直接连接CPU和设备,共享内存空间,避免了多个接口之间的通信开销;•

通过利用主机处理器通过总线连接到各种内存接口来实现内存介质独立性;•

内存控制器提供的灵活性为提供比传统DIMM更精细的容量粒度提供了选择,允许系统实施者调整内存容量以适应其应用并降低成本;•

内存控制器可以设计为支持不同的内存类型,DDR4、DDR5甚至持久内存或存储类内存;•

可实现内存扩展和内存共享,包括非易失性存储介质,使得业务可以快速恢复;•

总线级互联可以在本地系统内实现内存扩展,实现允许跨多个主机池化/共享内存,增加Switch架构后可实现更多主机内存的池化;•

当前利用CXL是实现总线在内存池化的有效方法之一;主机

主机

主机

主机2主机

主机0主机

主机2主机CPU01313总线Link总线Links总线Links总线Links总线内存扩展器MultiPort内存扩展器总线Switch总线Switch内存控制器内存控制器1内存控制器2内存控制器总线Switch总线Switch内存控制器总线Links总线Links内存主机

主机4主机

主机657一、本地内存二、内存池化三、Switch的全内存池化•

在用户空间,总线连接的优化包括利用用户级驱动程序,最大程度发挥总线的高带宽和低延迟特性;•

在内核空间,需实现高效的内核模块,以确保CXL设备的无缝集成和高性能操作;•

对于BMC,应加强安全机制,确保总线在数据传输的安全性,同时整合远程监控和故障诊断功能以提高管理效率。BMC管理硬件层软件层APICXL应用层软件优化••配置管理;探测技术;••用户调用、调度cxl相关的lib库userspacekernelWebUI配置、事件、日志;监控;CXLlib库CXL内核空间•••

cxlEventMgt是一种用于管理CXL事件的软件组件,EventMgt还提供了一种机制,用于将事件传递给其他CXL驱动程序或内核组件;•

cxlPrimarymailbox软件接口;•

CCI接口,提供接收cxl命令主机BMCCXL内核空间•

cxlEventMgtPCIeI2C•

cxlPrimarymailbox软件接口;•

CCI接口,提供接收cxl命令PCIe物理层Driver•

CXLType3•

CCIPrimary/Secondary/OOBCXLType3CCII2C/PCIe/CXLDriverMCTPDriver、I2CDriver•

利用CXL等总线级技术提供内存拓展、分层、池化等多种能力,推动形成内存架构优化机会,实现内存即服务的能力;•

在拓展、分层、池化等多个层面进行优化,提供统一的MaaS服务能力;Memory

as

a持久内存service内存分层非易失持久内存利用持久内存介质来实现数据的持久性存储,同时通过CXL协议与处理器进行连接和访问。在CXL技术中,"MemoryasaService"是一种内存服务模式,允许内存资源在多个处理器之间动态分配和释放,提高内存的资源利用率,降低TCO,增加灵活性和可用性。内存分层将cache、DRAM、NAND等多种存储和计算资源进行有效整合,提高数据处理效率。近存计算内存扩展近存计算可通过CXLEP就近内存池化对CXL内存中的数据进行距离计算,把计算结果送到本地内存中,这样减少数据传送。内存扩展提供了更高带宽和更大容量的内存解决方案,提供了存储资源扩展。内存设备连接在一起,实现缓存一致性、低延迟和高带宽的数据传输。•

优先基于在CXL等总线协议分解内存需求,将内存资源从单个服务器中进行解耦,并在多服务器之间动态分配和共享。这种模式可以提高内存资源的使用效率,增加内存的利用率、灵活性和可用性;总线级内存池化架构设计总线层级内存池化架构设计原则•

内存池化架构的组成和功能•

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论