




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
CephRADOS简介(Reliable,AutonomicDistributedObjectStore)京东虚拟化总监何雨heyu@2021/6/271架构简介两个部分组成:由数目可变的大规模OSDs(ObjectStorageDevices)组成的集群,负责存储所有的Objects数据由少量Monitors组成的强耦合、小规模集群,负责管理ClusterMap,其中ClusterMap是整个RADOS系统的关键数据结构,管理集群中的所有成员、关系、属性等信息以及数据的分发。2021/6/2722021/6/273ClusterMap管理cluster的核心数据结构指定了OSDs和数据分布信息monitor上存有最新副本依靠epoch增加来维护及时更新增量信息2021/6/274ClusterMap1.TheMonitorMapclusterfsid,theposition,nameaddressandportofeachmonitor2.TheOSDMapclusterfsid,alistofpools,replicasizes,PGnumbers,alistofOSDsandtheirstatus3.ThePGMap:PGversion,itstimestamp,thelastOSDmapepoch,thefullratios,anddetailsoneachplacementgroupsuchasthePGID,theUpSet,theActingSet,thestateofthePG(e.g.,active+clean),anddatausagestatisticsforeachpool.4.TheCRUSHMapalistofstoragedevices,thefailuredomainhierarchy(e.g.,device,host,rack,row,room,etc.),andrulesfortraversingthehierarchywhenstoringdata5.TheMDSMapMDSmapepoch,thepoolforstoringmetadata,alistofmetadataservers,andwhichmetadataserversareupandin2021/6/275数据存放1.Object到PG的映射。PG(PlacementGroup)是Objects的逻辑集合。相同PG里的Object会被系统分发到相同的OSDs集合中。由Object的名称通过Hash算法得到的结果结合其他一些修正参数可以得到Object所对应的PG。2.RADOS系统根据根据ClusterMap将PGs分配到相应的OSDs。这组OSDs正是PG中的Objects数据的存储位置。RADOS采用CRUSH算法实现了一种稳定、伪随机的hash算法。CRUSH实现了平衡的和与容量相关的数据分配策略。CRUSH得到的一组OSDs还不是最终的数据存储目标,需要经过初步的filter,因为对于大规模的分布式机群,宕机等原因使得部分节点可能失效,filter就是为过滤这些节点,如果过滤后存储目标不能满足使用则阻塞当前操作。2021/6/2762021/6/277关于pools是一个存储对象的逻辑分区概念所有权/访问对象对象副本的数目PG数目CRUSH规则集的使用以上后三项决定ceph最后如何存储数据2021/6/278计算PG的ID1.Client输入poolID和对象ID(如pool=‘liverpool’,object-id=‘john’)2.CRUSH获得对象ID并对其hash3.CRUSH计算OSD个数hash取模获得PG的ID(如0x58)4.CRUSH获得已命名pool的ID(如liverpool=4)5.CRUSH预先考虑到poolID相同的PGID(如4.0x58)2021/6/279DeviceState
— in out— — assignedPGs notassignedPGsup online active online&idle &reachabledown unreachable unreachable failed ¬remapped2021/6/2710peer和setpeer属于同一个PG彼此检查心跳数据同步setActingsetPG内所有osd属于ActingsetUpsetPG内up&in的osd2021/6/2711map传播所有消息传播都有一个epochclient端:首次进入去找monitor要最新副本存取时找OSD对比epochOSD端:peers之间保持心跳只保证两个OSD之间同步2021/6/2712数据复制读文件通过一个OSD主OSD写文件通过多个OSD复制Client把对象写进一个确定的PG组中的主OSD主OSD利用CRUSHmap用来确定二级OSDs,复制的对象放入其中。对象存储成功后进行响应client。2021/6/2713数据复制2021/6/2714错误检测和恢复错误检测:利用心跳上报monitor更新map错误恢复主osd主持恢复工作若主osd挂掉,二级osd选择一个顶上2021/6/27152021/6/2716数据条带化由于存储设备吞吐量的限制,影响性能和可伸缩性。跨多个存储设备的连续块条带化存储信息,以提高吞吐量和性能Ceph条带化相似于RAID0注意:ceph条带化属于client端,不在RADOS范畴2021/6/2717注意:条带化是独立于对象副本的。由于CRUSH副本对象跨越OSDs,所以条带自动的被复制。2021/6/2718条带化参数ObjectSize:足够大可以容纳条带单元,必须容纳一个或者多个条带单元
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2《我向国旗敬个礼》第二课时教学设计-2024-2025学年道德与法治一年级上册统编版
- 12《家庭的记忆》(教学设计)-部编版道德与法治三年级上册
- 《短视频剪与制作PR》教案 下 舒望 常用视频效果-非线性编辑-PR
- 2024-2025学年新教材高中生物 第三章 细胞的物质基础 第五节 元素与生物大分子教学实录 北师大版必修1
- 服装设计制作手册
- 4 试种一粒籽 教学设计-2023-2024学年道德与法治二年级下册统编版
- 2023-2024学年大连理工版小学信息技术六年级下册作品展示(教学设计)
- 10《爬山虎的脚》第二课时教学设计-2024-2025学年四年级上册语文统编版
- 25《灰雀》教学设计-2024-2025学年语文三年级上册统编版
- 过元宵节作文1000字
- 企业对外负面舆情应急预案
- 2004用工合同范本
- 燃气道路中压竣工资料全
- 2025年黑龙江农业工程职业学院单招职业适应性测试题库完整版
- 2025年湖南环境生物职业技术学院单招职业技能测试题库汇编
- 施工驾驶员安全培训
- 2025年贵安发展集团有限公司招聘笔试参考题库含答案解析
- 2024预防流感课件完整版
- (高鸿业)微观经济学习题解析+微观经济学题库解析
- 23J916-1 住宅排气道(一)
- 《2024年 《法学引注手册》示例》范文
评论
0/150
提交评论