磁盘阵列基本原理_第1页
磁盘阵列基本原理_第2页
磁盘阵列基本原理_第3页
磁盘阵列基本原理_第4页
磁盘阵列基本原理_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上第1章 为什么要使用磁盘阵列 1.1 什么是磁盘阵列磁盘阵列是一种把若干硬磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理的系统。冗余磁盘阵列RAID(Redundant Array of Independent Disks)技术1987年由加州大学伯克利分校提出,最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用(当时RAID称为Redundant Array of Inexpensive Disks 廉价的磁

2、盘阵列),同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术。1.2 磁盘阵列的工作原理与特征RAID的基本结构特征就是组合(Striping),捆绑2个或多个物理磁盘成组,形成一个单独的逻辑盘。组合套(Striping Set)是指将物理磁盘组捆绑在一块儿。在利用多个磁盘驱动器时,组合能够提供比单个物理磁盘驱动器更好的性能提升。数据是以块(Chunks)的形式写入组合套中的,块的尺寸是一个固定的值,在捆绑过程实施前就已选定。块尺寸和平均I/O需求的尺寸之间的关系决定了组合套的特性。总的来说,选择块尺寸的目的是为了最大程度

3、地提高性能,以适应不同特点的计算环境应用。实际的计算环境依据其不同的特点,可被划分为转换速率密集(Transfer Rate Intensive)环境或需求速率密集(Request Rate Intensive),一个计算环境若通常服务于小的用户数量和大的I/O需求,可以被认为是转换速率密集环境,工程学和科学应用属于转换速率密集,例如CAM/CAD、图象处理和数据集合等。一个计算环境,如果它是自然存在的多用户或在线交易系统(OLTP),可以被认为是一个标准的需求速率密集, 交互式的数据库应用能产生大量的小的I/O需求,由这些应用产生的I/O负荷

4、可被称为需求速率密集。具备独立驱动器操作功能的组合套可提供对于需求速率密集环境来说高的性能。对于转换速率密集,I/O需求的尺寸比块尺寸大得多,这样可导致每一个I/O需求分布于所有驱动器,数据由组合套转换的速率可以增加,因为所有的驱动器可并行地传输数据,这样,组合套就象一个单磁盘一样有非常高的容许速度。需求速率密集中I/O需求尺寸比块尺寸小很多,这将导致每一个I/O需求落于一个单个的驱动器中, 在这种情况下,由于有数个驱动器,阵列可同时处理数个需求,或者说比单磁盘快数倍。一个单磁盘某一时刻只能满足一个处理业务,一个转换速率密集应用的阵列某一时刻虽也满足一个处理业务,但能比单磁盘转换数据

5、速度快X倍(X是磁盘数),一个需求速率密集应用的阵列可满足的需求为单一磁盘的X倍,而其转换数据的速率与单磁盘相同。RAID的另一特征是具备数据校验(Parity)功能,校验可被描述为用于RAID级别2,3,4,5的额外的信息,当磁盘失效的情况发生时,校验功能结合完好磁盘中的数据,可以重建失效磁盘上的数据。对于RAID系统来说,在任何有害条件下绝对保持数据的完整性(Data Integrity)是最基本的要求。数据完整性指的是阵列面对磁盘失效时保持数据不丢失的能力,由于数据的破坏通常会带来灾难性的后果,所以选择RAID阵列的基础条件是它能提供什么级别的数据完整性。此外,数据可用性(Da

6、ta Availability)也是RAID系统的指标之一,数据可用性指的是阵列内部容错能力的水平,数据可用性程度越高,可被理解为当发生越多的部件失效时而数据访问仍不丢失。一个RAID阵列能提供的高可用性级别范围可从简单的磁盘冗余到所有部件的冗余性。当选择一个阵列时,重要的是了解所选的设备是否能够满足期望的可使用时间目标。RAID阵列能够适应不同环境,在不同类型的主机之间以及操作系统之间移动一个RAID阵列的能力越高,一般说来,可带来更好的投资保护。1.3 磁盘阵列优点磁盘阵列有许多优点:首先,提高了存储容量;其次,多台磁盘驱动器可并行工作,提高了数据传输率;第三,由于有校

7、验技术,提高了可靠性:如果阵列中有一台硬磁盘损坏,利用其它盘可以重新恢复出损坏盘上原来的数据,而不影响系统的正常工作,并可以在带电状态下更换已损坏的硬盘(即热插拔功能),阵列控制器会自动把重组数据写入新盘,或写入热备份盘而将新盘用做新的热备份盘;另外磁盘阵列通常配有冗余设备,如电源和风扇,以保证磁盘阵列的散热和系统的可靠性。因其独特的特征和可靠的性能被广泛地应用于多个行业,如:ISP、医学影像、银行等在线处理业务部门、影像服务器、6石油工业、关键部门的数据中心、多媒体和数据库应用等。对于磁盘失效的保护通过RAID技术已经成功地实现,但RAID阵列降低数据存储费用的目的没有达到,实际上,RAID

8、阵列的价格通常比标准的磁盘驱动器更高一些。尽管如此,RAID技术确实提供了比通常的磁盘存储更高的性能指标、数据完整性和数据可用性,尤其是在当今面临的I/O总是滞后于CPU性能的瓶颈问题越来越突出的情况下,RAID解决方案能够有效地弥补这个缺口。  第2章 什么是SCSI2.1概述SCSI直译为小型计算机系统专用接口(Small Computer System Interface)是一种连结主机和外围设备的接口,支持包括磁盘驱动器、磁带机、光驱、扫描仪在内的多种设备。它由SCSI控制器进行数据操作,SCSI控制器相当于一块小型CPU,有

9、自己的命令集和缓存。要了解SCSI,必须先了解它的类型,以下是STA(SCSI Trade Association,SCSI同业公会)的标准分类。2.2 SCSI接口类型SCSI连接器分为内置和外置两种,内置数据线的外型和IDE数据线一样,只是针数和规格稍有差别,主要用于连接光驱和硬盘。40针IDE线有40根导线,40针ATA66有80根导线,SCSI内置则分为50针、68针和80针。至于SCSI外置数据线,就有以多种规格,它们的密度均不相同,千万别弄错了。 详见附录A2.3 SCSI ID 相信许多SCSI用户都有这种经历

10、,插上设备之后,操作系统怎样也不认,后来检查总线,才发现是终结和ID没有设置好。ID(identify)作为SCSI设备在SCSI总线的唯一识别符,绝对不允许重复,可选范围从0到15,SCSI主控制器通常占用id 7,即是说我们可以用在设备上的ID号共有15个。在SCSI总线中,控制器也算一个设备, 即实际最大可连接设备数目 = 理论最大支持设备数目-1。 2.4 总线终结器总线终结器能告诉SCSI主控制器整条总线在何处终结,并发出一个反射信号给控制器,必须在两个物理终端作一个终结信号才能使用SCSI总线。常见的错误是把终结设置在ID

11、号最高或最低的地方,而不是设置在物理终端的SCSI设备上。其实,SCSI设备总是以链形来连接的,按顺序就能分辨出哪一个是终结设备。 终结的方式有三种:自终结设备、物理总线终结器和自终结电缆。大多数新型SCSI设备都有自终结跳线,只要把非终结设备的自终结跳线设置成OFF即可避免冲突问题;物理总线终结器是一种硬件接头,又分为主动型和被动型两种,主动型使用电压调整器来进行操作,被动型利用总线上的能源信号来操作,被动型比主动型更为精确;自终结电缆可以代替物理总线终结器,也是一种硬件,它的价格非常昂贵,常用于两个主机连接同一个物理设备,如:两个服务器存取同一个物理SCSI硬盘。 通过

12、检查SCSI ID和总线终结器,我们可以找出大多数冲突现象的解决方法,这是SCSI设备用户必须重视的一点。2.5 SCSI规格公用的几个标准术语解释:2.5.1 SCSI-1:它是最早SCSI,特点是:支持同步和异步SCSI外围设备,支持7台8位的外围设备,使用8位的通道宽度,传输速率为4MB/s,这现在通常是扫描仪在用的2.5.2 SCSI-2:类似SCSI-1,但是可以支持同时连接7个装置,传输速率为 10-20MB/s,目前有CD-R、CD-ROM在使用。 2.5.3 Fast SCSI:8位的通道宽度,使用

13、双倍的频率,传输速率为 10MB/s。2.5.4 Wide SCSI:16位的通道宽度,传输速率为20MB/s。2.5.5 ULTRA SCSI:8位的通道宽度,传输速率为20MB/s,其允许接口电缆的最大长度为1.5米。2.5.6 Ultra Wide SCSI:16位的通道宽度,传输速率为40MB/s,其允许接口电缆的最大长度为1.5米。2.5.7 ULTRA 2 SCSI:8位的通道宽度,其采用了LVD(Low Voltage Differential,低电平

14、微分)传输模式,传输速率为40MB/s,允许接口电缆的最长为12米,大大增加了设备的灵活性,支持同时挂接15个装置。2.5.8 WIDE ULTRA 2 SCSI:它跟Ultra 2 SCSI差不多,也是采用LVD传输模式,允许最长接口电缆为12米,可同时挂接15个装置,不同于Ultra 2 SCSI,它有16位的通道宽度,因此传输速度为80MB/s。2.5.9 Ultra 160 SCSI:支持最高数据传输率为160MB/s。2.5.10 Ultra320 SCS

15、I:支持最高数据传输达到了320MB/s,是目前最新的SCSI接口类型。2.5.11 Single Ended(单终结):许多旧式设备都是单终结设备,它们限制于SCSI-1协议的6米长度。注意:此距离包括设备内部电缆的距离。2.5.12 Differential(分差动):SCSI总线和设备可借助它来沿长传输的距离,附加线的最大长度为25米。缺点是与单终结设备不兼容。STA术语 最大总线速度MB/秒 总线宽度单位:bit 最大总线长度单位(米) 最大支持设备设备数目   单终结 LVD

16、 HVD SCSI1 5 8 6 - 25 8Fast SCSI 10 8 3 - 25 8Fast Wide SCSI 20 16 3 - 25 16Ultra SCSI 20 8 1.5 - 25 8Ultra SCSI 20 8 3 -

17、0;- 4Wide Ultra SCSI 40 16 - - 25 16Wide Ultra SCSI 40 16 1.5 - - 8Wide Ultra SCSI 40 16 3 - - 4Ultra2 SCSI 40 8 - 12 25 8Wide Ultra2&#

18、160;SCSI 80 16 - 12 25 16Ultra3 SCSI 160 16 - 12 - 162.6小结 SCSI的优点与缺点SCSI接口优点:<> 适应面广,在一块SCSI控制卡上就可以同时挂接15个设备<> 高性能(具有很多任务、宽带宽及少CPU占用率等特点)<> 具有外置和内置两种 SCSI接口缺点:<> 价格昂贵 <>

19、 安装复杂 第3章 什么是Fibre Channel(光纤通道)3.1 概述光纤通道是一种跟SCSI或IDE有很大不同的接口,它很像以太网的转换开头。以前它是专为网络设计得,后来随着存储器对高带宽的需求,慢慢移植到现在的存储系统上来了。光纤通道通常用于连接一个SCSI RAID(或其它一些比较常用的RAID类型),以满足高端工作或服务器对高数据传输率的要求。 3.2 光纤的特点光纤现在能提供100MBps的实际带宽,而它的理论极限值为1.06GBps。不过现在有一些公司开始推出2.12Gbps 的产品,它

20、支持下一代的光纤通道(即Fibre Channel II)。不过为了能得到更高的数据传输率,市面的光纤产品有时是使用多光纤通道来达到更高的带宽。不像SCSI,光纤通道的配线非常柔韧。如果带有光纤光学电缆(Fiber Optic Cabling),它支持最长的长度超过了10公里,所以可以说SCSI在接口电缆长度的限制上跟光纤是没法比得,因为SCSI最长接口电缆不得超过12米。 Features Fibre Channel SCSINode to Node 100m 20mMax

21、. Optical Distance 10,000m 12mCurrent Speed 200MB/s 160MB/sFuture Speed 400MB/s 320MB/sMax.Connections 126(loop) 16million(sw) 15Peripherals Supported All Limited typesCost Compared to SCSI Highe

22、r but decreasing Serial Connectivity Yes NoProtocol Supported Universal SCSIANSI Standard Yes YesDual Ported Operation Yes No3.3 小结 光纤的优点与缺点光纤通道优点:<> 具有很好的升级性 <> 可以用非常长的光纤电缆(带有Fiber&#

23、160;Optic Cabling时,光纤长度可以超过10公里) <> 具有非常宽的带宽(现在一般的光纤都具有1.06GBps,而如果采用多光纤通道可以达到更宽的带宽)<> 具有很强的通用性 光纤通道缺点:<> 价格非常昂贵<> 组建复杂 第4章 RAID技术4.1 概述RAID,为Redundant Arrays of Independent Disks的简称,中文为廉价冗余磁盘阵列。作为高性能的存储系统,

24、巳经得到了越来越广泛的应用。RAID的级别从RAID概念的提出到现在,巳经发展了多个级别,有明确标准级别分别是0、1、2、3、4、5等。但是最常用的是0、1、3、5四个级别。其他还有6、7、10、30、50等RAID技术采用若干硬磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理。磁盘阵列有许多特点:首先,提高了存储容量;其次,多台磁盘驱动器可并行工作,提高了数据传输率;第三,由于有校验技术,提高了可靠性:如果阵列中有一台硬磁盘损坏,利用其它盘可以重新恢复出损坏盘上原来的数据,而不影响系统的正常工作,并可以在带电状态下更换已损坏的硬盘(即热插拔功能),阵列控制器会自动把重组数据写

25、入新盘,或写入热备份盘而将新盘用做新的热备份盘;另外磁盘阵列通常配有冗余设备,如电源和风扇,以保证磁盘阵列的散热和系统的可靠性。 4.2 RAID类型4.2.1 逻辑驱动器(logical drives):是一个简单的由独立的物理硬盘组成的队列                 4.2.2 逻辑容量(logical volume):   逻

26、辑容量是由一个或多个逻辑驱动器组成,其成员逻辑驱动器可以是相同RAID集也可以是不同的RAID集4.2.3 RAID的级别RAID Level Description  Minimum  Data Availability Performance  Sequential  Performance  RandomNRAID Non- RAID 1  Drive DriveRAID 

27、;0 Disk Striping  N  = NRAID R:HighestW:Highest R:HighW:HighestRAID 1(0+1) Mirroring PlusStriping(if N>1) N+1 >> NRAID= RAID5 R:HighW:Medium R:MediumW:LowRAID 3 Striping with P

28、arity on dedicated disk N+1 >> NRAID= RAID5 R:HighW:Medium R:MediumW:LowRAID 5 Striping with interspersed parity N+1 >> NRAID= RAID5 R:HighW:Medium R:HighW:LowØ NRAID硬盘连续使用NRAID&

29、#160;意思是不使用RAID功能。它使用硬盘的总容量组成逻辑碟(不使用条块读写)。换句话说,它生成的逻辑碟容量就是物理碟容量的总和。此外,NRAID 不提供资料的备余。Ø JBODJBOD最小需要的硬盘数 1容量 1备余 NoJBOD 的含意是控制器将机器上每颗硬盘都当作单独的硬盘处理,因此每颗硬盘都被当作单颗独立的逻辑碟使用。此外,JBOD并不提供资料备余的功能。Ø RAID 0亦称为带区集。可以把多块硬盘(至少2块)连接在一起而组成一个容量更大的存储设备。处理数据时把数据分块并且同时读写入

30、组成RAID的磁盘,从而大大提高I/O速率。RAID0设计简单且实现成本较低,但RAID0没有冗余或错误修复能力,并且只要组成RAID的磁盘中有一块出现故障,整个RAID系统的数据将丢失,无法进行任何补救。RAID 0可以提供更多的可用空间和更好的性能,但是整个系统是非常不可靠的,所以,在所有的级别中,RAID 0的速度是最快的。但是RAID 0没有冗余功能的,如果一个磁盘(物理)损坏,则所有的数据都无法使用。Ø RAID 1也称为磁盘镜像,至少需要2块硬盘。每一个磁盘都具有一个对应的镜像盘。对任何一个磁盘的数据写入都会被复制到镜像盘

31、中,并且系统可以从一组镜像盘中的任何一个磁盘读取数据。RAID 1下,任何一块硬盘的故障都不会影响到系统的正常运行,而且只要在任何一对镜像盘中有一块磁盘可以使用,系统便可以正常运行;当一块硬盘失效时,系统会忽略该硬盘,转而使用相应的镜像盘读写数据,RAID 1甚至可以在一半数量的硬盘出现问题时不间断地工作。在RAID 1下,我们所能使用的空间只是所有磁盘容量总和的一半,增加了系统的成本,是所有RAID上磁盘利用率最低的一个级别。RAID 1最少需要的硬盘数目 2容量 N/2备余 YesØ RAID

32、0;3RAID 3使用一个专门的独立磁盘存放所有的校验数据,而在剩余的磁盘中以与RAID0相似的方式分割并读写数据,即可视为“RAID3=RAID0+校验盘”。虽然RAID 3具有容错能力,但整个系统会因校验而受到影响,当一块磁盘失效时,该磁盘上的所有数据块必须使用校验信息重新建立;当我们更换了损坏的磁盘之后,系统必须一个数据块一个数据块地重建坏盘中的数据:整个过程包括读取带区,计算丢失的数据块和向新盘写入新的数据块等;所以,重建活动最好是在RAID系统空闲的时候进行,否则整个系统的性能就会受到严重的影响;鉴于这种原因,RAID 3更加适用于那些写入操作较少,读取

33、操作较多的应用环境,例如数据库和WEB服务器等。利用单独的校验盘来保护数据虽然没有镜像的安全性高,但是硬盘利用率得到了很大的提高,为n-1。不过,如果校验盘(物理)损坏的话,则全部数据都无法使用,故为了解决这一缺陷,产生了RAID5技术。RAID 3最小需要的硬盘数 3容量 N-1备余 Yes  Ø RAID 5在运行机制上,RAID 5和RAID 3完全相同,也是由几个数据块共享一个校验块。RAID 5和RAID 3的最大区别在于RAID 5不是把所有的

34、校验块集中保存在一个专门的校验盘中,而是分散到所有的数据盘中。RAID 5使用了一种特殊的算法,可以计算出任何一个校验块的存放位置。这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡,从而消除了产生瓶颈的可能,并避免了像RAID3那样因校验盘损坏而导致系统失去容错能力的严重故障。硬盘的利用率为n-1。RAID 5Minimum Disks required 3Capacity N-1Redundancy YesØ RAID (0+1) 结合了RAID 

35、0 和 RAID 1  条块化读写的同时使用镜像操作。 RAID (0+1) 允许多个硬盘损坏,因为它完全使用硬盘来实现资料备余。如果有超过两个硬盘做RAID 1,系统会自动实现RAID (0+1)。                         

36、                                            RAID (0+1)最少需要的硬盘数目 4容量

37、60;N/2备余 Yes Ø RAID 30实施情况同Level 0数据条阵列,其中,每一段都是一个RAID 3阵列。它的冗余与容错能力同RAID 3。这对需要具有高数据传输率的RAID 3配置的IT系统有益,但是它价格较贵。RAID 0            RAID 3                                RAID 3Ø R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论