版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、百度大数据离线计算平台流式Shuffle服务目录背景架构关键技术收益与总结下一步计划背景-百度私有云FPGAGPU整机柜Machine Management环境 初始化机器故障 自动化机器 自动流转Container仲裁器StateManagement调度算法队列/优先级资源位移MetaServerNameSpaceStateCenterIterativeRealTimeBatchNFSTableOjbect搜索金融糯米AI开放云ADU服 务 托 管研 发 效 率 相 关 工 具预 算交 付 管 理结 算高精硬件集群/机器管理集群操作系统-Matrix统一资源调度-Normandy分布式文件系
2、统-AFS分布式计算分布式存储产品生态背景-百度大数据计算平台C+PythonJavaSimplified Unified APITMDStreamDCE(MR/DAG)MPI/ELFSparkNormandyMatrixIDC计算引擎资源调度资源管理机器资源API层20142007百度DAG引擎上线20062004MapReduce论文发表Hadoop开源百度MR上线基于Hadoop 0.15.12011百度MR单集群规模 超过5000台2013百度MR单集群规模13000台2015内存流式Shuffle上线2014百度统一计算表 示层发布背景-百度大数据离线计算平台发展历程背景-DAG引擎
3、背景-一般的Shuffle模式MapperMapperReducerMapperReducer目录背景架构关键技术收益与总结下一步计划架构架构 JobMasterMap WorkerMap WorkerMap Worker ShuffleMasterShufflerShufflerShuffler Reduce WorkerReduce WorkerReduce Worker HDFS7. map push to shufflerHDFSHDFS1. create shuffle sessionControl messageData Flow架构-基本概念ShuffleMasterShuffl
4、er(Shuffle Worker)WriterReaderSessionShard目录背景架构关键技术收益与总结下一步计划关键技术-ShuffleMaster智能调度全局视图异常检测负载均衡负载均衡ShufflerShardSessionManagerJobMasterRpcServerCreateSession DeleteSessionShufflerWriterShufflerShufflerWriterWriterHeartBeatSessionUpdatespushShuffleWorkerInfopushSessionUpdateDataPusherRpcClientAssgnI
5、nfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoAssgnInfoSession AShard0Shard1Shard2Shard3Shard4Shard5writer决定 primary 和 backup 的切换HeartBeatpushMapperInfoDataCollectorRpcServerWriter上报ShufflerExceptionShuffler上报负载情况增量更新MapperInfoMapperIDAddressSessonIDUpdateInfoShuffle Worker InfoSWIDAddres
6、sStatusLoadAssignment InfoAssginIdShardIDSWIDPrimarySession InfoShuffle Master关键技术-Writer数据缓存与异步发送异常处理MapProcessWriterSession ASession BWriterBufferDataSenderShuffler分配信息Shuffler分配信息WriterBufferDataSenderSession更新ShuffleMasterShufflersK VrpcK Vrpcrpc状态汇报Shuffler状态关键技术-Writer异常处理wriRPC回调返回Successter发
7、送buffer发送RPC给某个 ShufflerShuffler挂了超时也没有回调重试其他Shuffler所有RPC不再尝试此Shuffler 此Buffer重试其他Shuffler返回给Writer数据发送成功Cancle此Buffer对其他Shuffler的RPCShuffer太忙此Buffer的发送暂时回避这个ShufflerBusy关键技术-Shuffler内存聚合流控Sort&FlushShuffler相同Partition的数据交给一个active Sorter每个Sorter限制一定的内存大小,满内存后交给排序线程Sorter等待过长时间后,也交给排序线程所有Sorter使用内存
8、不超过阈值Rpc with dataRpc with dataRpc with dataRpc with ackSortflushandackSessionHandlerShardHandlerSH.SHSorter.SorterSorterSessionHandlerShardHandlerSH.SHSorterSorterRpc with ackSortflushandackSortflushandackN个排序线程,排序之后写入DFS,并Ack相应数据块待排序的Sorter个数多于排序线程数时,部分Sorter等待RPC ServerCreateSession DeleteSession
9、WritersShuffleMaster关键技术-Reader所有Map完成后,调度Reduce直接读取DFS排好序的数据去重&数据验证多路归并排序关键技术-Map PipelineMap端Writer,要等Shuffler将数据持久化到DFS后,才能将发 送的rpc buffer释放所有发送的数据被Shuffler持久化后,Map才能安全退出MapperMapperMapperWaitingFor FlushMapper关键技术-MIMO无MIMO时:Vetex3和vertex4 收到vertex2的全 部两路数据再做filter。此业务作业多shuffle近10T 数据关键技术-MIMO方
10、案不同边可对应不同 session不同session对应不同的dfs结果目录vertex0vertex1vertex3vertex2broadcastmimonormal shufflebroadcast关键技术-Runtime PartitionSplit1Split2Split3Task1Task2Task3ShuffleAppMa sterSplit1Split2Split3Task1ShuffleAppMa ster目录背景架构关键技术收益与总结下一步计划收益与总结收益流式shuffle:减少旧shuffle mapmerge、reduce pull时间消耗内存Push:map端不落盘
11、Shuffler内存聚合:聚合度高,减少 map端seek,减少reduce端merge路 数,减少IOPipeline:大大提高中小作业map端 运行速度中间数据持久化:避免重算(对dag 作业尤为重要)收益与总结流式Shuffle服务push instead of pullShuffle过程交给能拿到更多全局信息、更专业的shuffler来做Map、Shuffler、Reduce,每个都做自己最适合做且擅长做的事情Shuffle与Reduce解耦,简化Reduce,也为解决分桶不均问题提供可能Pipeline。无缝的流线,减少无谓的等待问题更多的网络io(万兆网卡,网络不是瓶颈)Shuffler资源共享,作业间可能互相影响(让Shuffler资源非瓶颈)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年个人与建筑公司借款合同范本汇编4篇
- 二零二五年度企业员工关系管理与冲突预防协议范本3篇
- 2025年度新型环保材料租赁经营合同模板4篇
- 二零二五年度商业活动场地借用及宣传合同2篇
- 二零二五年度体育产业普通合伙企业合作协议范本4篇
- 2025年度5G产业投资理财协议
- 2025年三方知识产权转让还款协议书范本及内容说明3篇
- 个性化定制2024年版民间资金借贷协议范本版B版
- 2025年酒店住宿赔偿协议范本
- 个人股份转让协议书
- 2024-2030年中国海泡石产业运行形势及投资规模研究报告
- 动物医学类专业生涯发展展示
- 2024年同等学力申硕英语考试真题
- 消除“艾梅乙”医疗歧视-从我做起
- 非遗文化走进数字展厅+大数据与互联网系创业计划书
- 2024山西省文化旅游投资控股集团有限公司招聘笔试参考题库附带答案详解
- 科普知识进社区活动总结与反思
- 加油站廉洁培训课件
- 现金日记账模板(带公式)
- 消化内科专科监测指标汇总分析
- 混凝土结构工程施工质量验收规范
评论
0/150
提交评论