存储磁盘阵列中RAD5的实现机制和冗余经济性分析_第1页
存储磁盘阵列中RAD5的实现机制和冗余经济性分析_第2页
存储磁盘阵列中RAD5的实现机制和冗余经济性分析_第3页
存储磁盘阵列中RAD5的实现机制和冗余经济性分析_第4页
存储磁盘阵列中RAD5的实现机制和冗余经济性分析_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、存储磁盘阵列中 RAID5 的实现机制和冗余经济性分析什么是 RAIDRAID是英文 Redundant Array of Independent Disks的缩写,翻译成中文意思是独立磁盘冗余阵列 ”,有时也简称磁盘阵列( Disk Array )。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘 组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。同时利用这项技术, 将数据切割成许多区段, 分别存放在各个硬盘上。 磁盘阵列还能利用同位检查 (Parity Check )的观念, 在数组中任一颗硬盘故障时, 仍可读出数据, 在数据重构时, 将数据经计算后

2、重新置入新硬盘中。RAID技术的两大特点:一是速度、二是安全,由于这两项优点,RAID技术早期被应用于高级服务器中的SCSI接口的硬盘系统中,随着近年计算机技术的发展,pc机的CPU的速度已进入GHz时代。IDE接口的硬盘也不甘落后,相继推岀了ATA66和ATA100硬盘。这就使得 RAID技术被应用于中低档甚至个人pc机上成为可能。RAID通常是由在硬盘阵列塔中的RAID控制器或电脑中的RAID卡来实现的。RAID 主要技术RAID技术主要包含 RAID 0RAID 7等数个规范,它们的侧重点各不相同,常见的规范有如下几种:RAID 0: RAID 0 连续以位或字节为单位分割数据,并行读

3、/ 写于多个磁盘上,因此具有很高 的数据传输率,但它没有数据冗余,因此并不能算是真正的RAID 结构。 RAID 0 只是单纯地提高性能,并没有为数据的可靠性提供保证,而且其中的一个磁盘失效将影响到所有数据。因此, RAID 0 不能应用于数据安全性要求高的场合。RAID 1 :它是通过磁盘数据镜像实现数据冗余, 在成对的独立磁盘上产生互 为备份的数据。 当原始数据繁忙时,可直接从镜像拷贝中读取数据,因此RAID 1 可以提高读取性能。 RAID 1 是磁盘阵列中单位成本最高的, 但提供了很高的数据安全性和可用性。 当一个磁盘失效时, 系统可 以自动切换到镜像磁盘上读写,而不需要重组失效的数据

4、。RAID 0+1:也被称为 RAID 10标准,实际是将 RAID 0和RAID 1标准结合的产物,在连续地 以位或字节为单位分割数据并且并行读 / 写多个磁盘的同时, 为每一块磁盘作磁盘镜像进行冗余。 它的优点是同时拥有 RAID 0 的超凡速度和 RAID 1 的数据高可靠性,但是 CPU 占用率同样也更 高,而且磁盘的利用率比较低。加重平RAID 2:将数据条块化地分布于不同的硬盘上,条块单位为位或字节,并使用称为均纠错码(海明码) ”的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查 及恢复信息,使得 RAID 2 技术实施更复杂,因此在商业环境中很少使用。RAID 3

5、:它同 RAID 2 非常类似,都是将数据条块化分布于不同的硬盘上,区别在于RAID 3使用简单的奇偶校验, 并用单块磁盘存放奇偶校验信息。 如果一块磁盘失效, 奇偶盘及其他数据 盘可以重新产生数据;如果奇偶盘失效则不影响数据使用。RAID 3 对于大量的连续数据可提供很好的传输率,但对于随机数据来说,奇偶盘会成为写操作的瓶颈。RAID 4:RAID 4 同样也将数据条块化并分布于不同的磁盘上,但条块单位为块或记录。 RAID4 使用一块磁盘作为奇偶校验盘, 每次写操作都需要访问奇偶盘,这时奇偶校验盘会成为写操作 的瓶颈,因此 RAID 4 在商业环境中也很少使用。RAID 5:RAID 5

6、不单独指定的奇偶盘,而是在所有磁盘上交叉地存取数据及奇偶校验信息。 在 RAID 5 上,读 / 写指针可同时对阵列设备进行操作,提供了更高的数据流量。RAID 5 更适合于小数据块和随机读写的数据。 RAID 3 与 RAID 5 相比,最主要的区别在于 RAID 3 每进行一次数 据传输就需涉及到所有的阵列盘;而对于 RAID 5 来说,大部分数据传输只对一块磁盘操作,并 可进行并行操作。 在 RAID 5 中有“写损失 ”,即每一次写操作将产生四个实际的读 /写操作, 其中 两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。RAID 6:与 RAID 5 相比, RAID 6 增加了第

7、二个独立的奇偶校验信息块。两个独立的奇偶系 统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。但 RAID 6 需要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5 有更大的 “写损失 ”,因此 “写性能”非常差。较差的性能和复杂的实施方式使得 RAID 6 很少得到实际应用。RAID 7:这是一种新的 RAID 标准,其自身带有智能化实时操作系统和用于存储管理的软件工具,可完全独立于主机运行, 不占用主机 CPU资源。RAID 7可以看作是一种存储计算机 (Storage Computer ),它与其他 RAID 标准有明显区别。除了以上的各种标准(如表 1

8、),我们可以如 RAID 0+1 那样结合多种 RAID 规范来构筑所需的 RAID 阵列,例如 RAID 5+3( RAID 53)就是一种 应用较为广泛的阵列形式。 用户一般可以通过灵活配置磁盘阵列来获得更加符合其要求的磁盘存 储系统。主流方案 RAID 5RAID 5 是一种存储性能、 数据安全和存储成本兼顾的存储解决方案。 RAID 5 可以理解为是RAID 0和RAID 1的折中方案。RAID 5可以为系统提供数据安全保障,但保障程度要比Mirror低而磁盘空间利用率要比Mirror高。RAID 5具有和RAID 0相近似的数据读取速度,只是多了一个奇偶校验信息,写入数据的速度比对单

9、个磁盘进行写入操作稍慢。同时由于多个数据对应一个奇偶校验信息,RAID 5的磁盘空间利用率要比RAID 1高,存储成本相对较低,是目前运用较多的一种解决方案。RAID 5运作原理以四个硬盘组成的 RAID 5为例,其数据存储方式如概述中的图片所示:图中左边为 RAID 5右边为 RAID 10,RAID 5中P0为DO、D1和D2的奇偶校验信息,其它 以此类推。由图中可以看岀,RAID 5不对存储的数据进行备份,而是把数据和与其相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当 RAID5的一个磁盘数据损坏后,利用剩下的数据和相应的奇

10、偶校验信息去恢复 被损坏的数据。RAID5校验位算法P=D1 xor D2 xor D3 orDx ( D1,D2,D3:为数据块,P为校验,xor为异或运算)XOR(Exclusive OR)的校验原理如下表:A值B值Xor结果000101011110这里的A与B值就代表了两个位,从中可以发现,A与B 一样时,XOR结果为0, A与B不一样时,XOR结果就是1,而且知道 XOR结果和A与B中的任何一个数值,就可以反推岀另一 个数值。比如 A为1,XOR结果为1,那么B肯定为0,如果XOR结果为0,那么B肯定为1。 这就是 XOR 编码与校验的基本原理。RAID5 读写原理用简单的语言来表示,

11、至少使用 3 块硬盘(也可以更多)组建RAID5 磁盘阵列,当有数据写入硬盘的时候,按照 1 块硬盘的方式就是直接写入这块硬盘的磁道,如果是RAID5 的话这次数据写入会根据算法分成 3部分,然后写入这 3块硬盘,写入的同时还会在这3 块硬盘上写入校验信息, 当读取写入的数据的时候会分别从 3 块硬盘上读取数据内容, 再通过检验信息进行校 验。当其中有 1 块硬盘岀现损坏的时候 ,就从另外 2 块硬盘上存储的数据可以计算岀第 3 块硬盘 的数据内容。也就是说 raid5 这种存储方式只允许有一块硬盘岀现故障,岀现故障时需要尽快更 换。当更换故障硬盘后, 在故障期间写入的数据会进行重新校验。 如

12、果在未解决故障又坏 1 块, 那就是灾难性的了。RAID5 存储机制RAID5把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上, 其中任意 N-1 块磁盘上都存储完整的数据, 也就是说 有相当于一块磁盘容量的空间用于存储奇偶校验信息。因此当RAID5 的一个磁盘发生损坏后,不会影响数据的完整性,从而保证了数据安全。当损坏的磁盘被替换后,RAID 还会自动利用剩下奇偶校验信息去重建此磁盘上的数据,来保持 RAID5 的高可靠性。(做 raid 5 阵列所有磁盘容量必须一样大, 当容量不同时, 会以最小的容量为准。 最好硬盘 转速一

13、样,否则会影响性能,而且可用空间=磁盘数 n-1 , Raid 5 没有独立的奇偶校验盘,所有校验信息分散放在所有磁盘上, 只占用一个磁盘的容量)RAID5 数据恢复RAID-5 数据恢复思路 RAID-5 阵列中数据的分布与 RAID-0 类似,数据也是分布到每块硬盘上,与 RAID-0 不同的是, RAID-5 中每个条带组中总有一个条带是校验块,如图中的“P0、P1、P2、P3”就是校验块。RAID5结构图RAID-5能够支持在一块盘离线的情况下保证数据的正常访问,如果有两块或两块以上硬盘同时离线,或者 RAID信息岀错等原因,阵列便会失效,这时就需要对数据进行重组。对RAID-5的数据

14、进行重组,也需要先把物理盘区 RAID化,作为单盘进行分析,如图中的四块物理盘,把四块物理盘中的数据按照“AB、C、D、E、F、G、H”的顺序拼接好,就是RAID-5逻辑盘中完整的数据。因为RAID-5的每块物理盘中都有校验信息,所以分析RAID-5就需要比RAID-0多一个因素,即校验块的位置和方向,另外, RAID-5中数据块的走向也会不一样,分为异步和同步,也就是 说,RAID-5有四个因素很重要,第一个是RAID中每个条带的大小,也就是“A或 “B'这些数据块所占用的扇区数;第二个因素是RAID中硬盘的排列顺序,也就是盘序;第三个因素是校验块的循环方向;第四个因素是数据块的走向

15、。以图中四块物理盘组成的RAID-5为例,假设条带的大小为 32个扇区,物理盘的顺序就按照图中的排列顺序,那么只要到硬盘0中取0-31扇区的信息,再到硬盘1中取0-31扇区的信息,再到硬盘2中取0-31扇区的信息,硬盘3中0-31扇区的信息是校验块,跳过不取。接下来再回到硬盘0中取32-63扇区的信息,就这样依次按顺序取下去,把所有取岀来的数据按照顺序衔接成一个镜像文件或者是镜像盘,这就成为完整的原RAID-5逻辑盘的结构了,直接访问这个重组岀来的镜像文件或镜像盘,就得到了原RAID-5逻辑盘中的数据。冗余经济性分析EUID翱加RAID-1HAID-3EUID-5HAID-10别名1r专用奇偶位分布奇偶位条 带镣蒙阵列条 带容诸性没有有有骨有忆余趣厦制觥校验酗校验膜制热呑盘选賄有有1S性能1丄 冋高高中间适机写'性 能高低is中间隹续写性能低ItE中间I需WfflK盘世个或多 个一.QO T A 丿 ITU 4|或倆个1 _ _三个3三个貝需4个或4曲个可用容量恿的確盘 的容嚣盘容噩的50%sasio"hrn 報(n-t) Ai 射总 醞容董耳中 n沁数確盘容重的50%:|典型關1无故険朋 迅穗读鸟 要求空全 注不高.如 图册工作随机数据 写入要 來安全性 高.如服 芻器、数 据库存储

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论