批注版1基于hadoop的混合raid容错机制设计与实现_第1页
批注版1基于hadoop的混合raid容错机制设计与实现_第2页
批注版1基于hadoop的混合raid容错机制设计与实现_第3页
批注版1基于hadoop的混合raid容错机制设计与实现_第4页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于Hadoop的混合RAID容错机制的设计与实现程校猛课题意义为什么Hadoop要有容错机制: Hadoop的文件系统HDFS作为一个分布式的存储系统,存储节点出现故障是非常有可能的,一旦出现,如果没有容错机制,将造成数据永久丢失。当前Hadoop的容错机制是什么: 当前Hadoop默认的是3-way的三备份容错机制,原始数据被复制成三分存放在不同节点上。当前Hadoop容错机制的缺点是什么: 1.冗余大,存储效率只有1/3 2.恢复的时候不同节点之间需要移动的数据块较多,恢复带宽比较大国内外研究现况及发展趋势Facebook Hadoop现在Facebook正在运行世界第二大Hadoop集

2、群系统。在写这篇文章的时候,我们在Hadoop上存放的数据超过了2 PB,每天给它加载的数据超过10 TB。我们的Hadoop系统具有2400个内核,大约9 TB的内存,并且在一天之中的很多时间点,这些硬件设备都是满负荷运行的。 国内外研究现况及发展趋势Raid HDFSHDFS-RAID 是Facebook基于hadoop-20-append分支(第一代Hadoop)开发的raid方案,就是对N个数据块就行运算,产生K个校验块。这N+K个块可以同时最多容忍K个块的丢失,丢失的块可以从其余的块中的任意N个恢复出来。在HDFS-RAID里面,N叫做stripeLength,K叫做parityLe

3、ngth。国内外研究现况及发展趋势主要的发展趋势:1.最小化I/O 数据恢复过程中需要大量访问磁盘,因此,最小化I/O能够带来性能的提升2.最小化带宽 在网络受限或者带宽是性能瓶颈的情况下,最小化带宽的受益也是很大的3.并发恢复 并发恢复能够极大提高恢复性能方案原理方案原理混合RAID容错机制 和 传统RAID5容错机制,3-way三备份机制对比(以存储ABCD四个块为例)备份数量恢复读取的块的数目冗余备份数单节点故障需要读取的块数目混合RAID容错机制10个块1个块传统RAID5容错机制5个块4个块3-way三备份容错机制12个块1个块方案设计当某个节点故障时,利用基于RAID1的修复方案来修复方案设计当多个节点故障时,首先利用基于RAID1的修复方案来修复,再用基于RAID5的修复方案来修复。方案目标功能目标实现混合容错上的文件写:机架间先RAID1机架内再RAID5实现混合容错上的修复功能:单节点修复多节点修复性能目标:通过实验,比较备份、RAID6和混合容错机制的恢复时间。通过设计单节点的机架内修复,来优化混合机制下的修复性能课题研究进度安排学期周次工作任务2016-2017第一学期文献阅读、翻译基本环境的搭建、测试2016-2017第二学期第1周-第3周基本实现方案讨论与确定第4周-第5周文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论