2025容应对数据驱动的AI带来的IO挑战_第1页
2025容应对数据驱动的AI带来的IO挑战_第2页
2025容应对数据驱动的AI带来的IO挑战_第3页
2025容应对数据驱动的AI带来的IO挑战_第4页
2025容应对数据驱动的AI带来的IO挑战_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Alluxio ScalingLaw:大语言模型(LLM)训练的性能受到训练过程中不断增长的token数量、模型检查点(checkpoint\h\h\h\h源u u \h2 f LLM训练需要大量数据(数十亿至15万亿token)\hu ? L n \h/ 5\h\h大模型的规模从7B到1T *图:训练作业故面向AIAI/MLAlluxioAI/MLAlluxioDevOps能 本 混合 跨 AlluxioAI持100持1002-8x 在机器学习工作流中部署 ,GPU利用率保持90% ML/AIGPUIO编程接口:POSIX数据格式:结构化(Parquet)和非结构化(音频、图片、视频、文本写入:快速Checkpointing(顺序写

基于一致性哈希选择 AlluxioWorker

AlluxioWorker

AlluxioWorkerObject

Alluxio

AWSus-east- Alluxio可被视为是一个逻辑文件系统Alluxio

Alluxioalluxio://ip:port/Data/Sales<-> 数据通道grpc->原生数据通道grpc->原生30解决高达150倍的读放大非结构化文件的并行读性能提升高达9倍结构化文件的随机读性能提升215 使用一致性哈希在workerI/ORPCmaster将master节点从关键路径移除:不再需要

高性能workerGB/sAlluxio3.xvsAlluxio-最新3.xAlluxio2.xAlluxioAlluxio

Alluxio Alluxio

底层存储

AlluxioAlluxio

AlluxioAlluxio

底层存储底层存储

AlluxioStandby

以以AlluxioFUSE为基础的POSIXAPI接口带来的读吞吐和IOPS性能增强,助力大模型训练中,极速加载Checkpoint和/或训练数据集。例如GPU服务器通过AlluxioFuse客户端可在10s内加载完100GB的Checkpoint,即单客户端的加载吞吐达到10GB/s。 (bs=256kb,32

(bs=256kb,32

(bs=256kb,32在训练任务写checkpoint的过程中,所有参与的GPU都需要等待,造成资源闲置。为此,在训练任务写checkpoint的过程中,所有参与的GPU都需要等待,造成资源闲置。为此,Alluxio通过优化checkpoint写入性能,以内存

Alluxio(V3.2)v.s.Alluxio(V3.1)v.s.AlluxioAlluxioAlluxioAlluxioAlluxioAlluxioAlluxioAlluxioAlluxioAlluxioV3.2:在单节点环境下,当Theads=1时可以达到2GiB/s,当Theads=32时可以达到8GiB/s,3.2版本性能明显优于3.1MLPerfStorageGPU卡 GPU卡AlluxioWorkeri3en.metal*5+Fuse:c6in.metal*Resnet50onUnet3donDDN GPUResnet50onH100Unet3donH100 NVMe存储、RDMAGPUDirectStorageGDS),正在重I/O。NVMeRDMACPU,GDS(GPUDirectStorageGPUI/O,绕过系统内存,显著加快数据传输RemoteDirectMemory

通过UCX提供进一步的RDMAUnifiedCoitionXSource:/test-Experimental:Faster 实验项目:GPUDirectoverRDMA通过GPUDrectoverRDMA解决了客户端与worker之间的RDMA问题。GPUDirectAlluxioworkerCPU 主要挑 Alluxio应

使用Alluxio

30%+

提升GPUGPU资源利用率不高:30-

主要挑 Alluxio应

使用Alluxio

GPU GPUAlluxio

Alluxio

解绑NAS:使用AlluxioOBS

Alluxio 高性能 对象存 对象存

减少不必要的ETL Trai

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论