(整理)宏杉科技IDDC与CRAID技术_第1页
(整理)宏杉科技IDDC与CRAID技术_第2页
(整理)宏杉科技IDDC与CRAID技术_第3页
(整理)宏杉科技IDDC与CRAID技术_第4页
(整理)宏杉科技IDDC与CRAID技术_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、MacroSAN IDDC 与 CRAID 技术杭州宏杉科技有限公司1. 典型案例某用户配置了 16块1TB磁盘做RAID5,承载其在线关键业务。运行3年后,磁盘开始陆续损坏,发现其重建过程漫长。在其业务未中断的情况下,完成一次重建所需时间长达5天,这种情况还不是最糟的。更糟的是,在某次重建过程中,重建进程完成到 60%时,重建过程被异常中止,RAID 组fail,整个数据卷损坏,数据丢失。经检查发现,在重建过程中,该RAID组中的另一块磁盘发生了读错误,导致磁盘 failed,被RAID组踢出。通过这个案例我们可以看出几个问题:1、磁盘属于消耗品,发生老化后,会产生潜在故障盘或假象故障盘;2

2、、 故障盘或假象故障盘都将导致RAID组重建;3、大容量磁盘 RAID重建时间过长,重建过程风险巨大;4、潜在故障盘将导致 RAID重建失败;什么是假象故障磁盘简单的说,假象故障磁盘就是在使用中发生错误告警,但返厂后经检查发现该磁盘没有任何物 理损坏,检测为正常的磁盘。为什么会有假象故障磁盘通常是与设备运行环境有关的,比如磁盘受到外力导致的振动达到一定程度,就会造成磁盘工 作失灵,这种失灵往往在消除振动后可以恢复。磁头在盘面的水平方面振动,会导致磁头与磁道偏离,磁头与目标磁道位置偏离过大,超过了伺服机构能响应的允许值,此时磁头根本无法定位,造成工作失灵;磁头在与盘面垂直方向的振动,导致磁盘盘面

3、与磁头距离的变化,磁头和盘片的间隙过大,造成磁头感应到的信号电压不足,磁盘无法读/写;什么是潜在故障磁盘简单的说,潜在故障磁盘就是已经存在损坏扇区,但在设备运行状态中却显示为正常的磁盘。为什么会有潜在故障磁盘由于磁盘本身属于易耗品,存储设备长期在线运行后,根据业务类型及机房环境不同,磁盘会 出现不同程度的老化。 这些老化磁盘中可能会存在不同程度的损坏扇区, 而损坏扇区在没有 IO 读写 触发的条件下,通常不会被存储设备感知。这种未被感知,但又存在一定损坏扇区的磁盘,就是潜 在故障磁盘。一般情况下,潜在故障磁盘在非 RAID 环境中可能会导致磁盘中的部份文件埙坏或丢 失。若存在于配置了 RAID

4、 组的存储环境中,其危险性将及有可能会乘以N 倍的数量放大。故障磁盘的危害冗余 RAID 组重建频繁 :存储设备长期在网运行后,由于机械设备老化,磁盘假象故障发 生的机率增加,并且会有越来越多的潜在故障磁盘转化为故障磁盘,这些磁盘的陆续损坏 导致了频繁的 RAID 组重建。传统存储设备的 RAID 组重建过程中,会大量消耗读写性能, 尤其对于大容量磁盘,重建时间过长。因而往往会影响到用户业务的正常访问,且易出现 冗余 RAID 组重建失败,发生数据丢失的事故。冗余 RAID 组重建失败 :根据冗余 RAID 组原理,特别是采用积偶效验算法的 RAID 组, 如 RAID5 、 RAID6 ,在

5、进行 RAID 组重建时,需要读取该 RAID 组中其它成员成盘上的所 有数据,来计算被替换故障磁盘的数据。对于长期在网运行,磁盘老化较严重的设备,往 往会隐藏着一定的潜在故障磁盘,一旦这些磁盘在重建过程中转化为故障磁盘,该 RAID 组会立刻失效,重建失败,导致该 RAID 组所有数据丢失。2.问题与挑战 随着云时代的到来,数据量越来越多,磁盘容量越来越大,发生磁盘损坏的比率也越来越大, 如何解决磁盘故障对存储带来的危害成为重要课题目。问题:1、磁盘属于消耗品,一般 3 年左右,发生机械老化;2、发生老化后,会产生潜在故障盘或假象故障盘;3、故障盘或假象故障盘都将导致 RAID 组重建;4、

6、大容量磁盘 RAID 重建时间过长,重建过程风险巨大;5、潜在故障盘易导致 RAID 重建失败;挑战:1、变被动重建为主动检测;2、提高 RAID 容错度;k坏块9rL复位JFF1主动式磁盘诊断中心IDDC3、降低磁盘误判;4、提高错误修复效率;5、减少数据丢失风险;3. 磁盘维护新方式IDDC主动式磁盘诊断中心基于多年存储维护经验的深刻理解,MacroSAN开发了一套可以在不增加任何附加投资的条件下,最大化提高磁盘及 RAID组安全性的,智能存储磁盘维护检测修复工具。IDDC : Ini tiative Disk Diag no sis Ce nter,主动式 磁盘诊断中心该诊断中心包含了

7、4个模块(磁盘检测、快速修复、坏块复位、磁盘诊断),它可以通过预先设置的策略定期对磁盘进行错误检测,用于发现磁盘中是否存在错误码。再根据错误码叛断磁盘错误 类型,并进行相应的坏块修复、磁盘迁移或磁盘修复等操作,以提早处理磁盘潜在故障隐患,降低 RAID组重建损坏机率,提高设备稳定性。磁盘检测:? 对所有磁盘进行周期性全盘检测,提前发现故障;? 支持磁盘检测速率动态调整,不影响应用性能;? 发现问题的磁盘交由诊断中心统一处理;快速复位:结合CRAID的局部重建机制,可快速修复磁盘逻辑错误,降低全盘重建机率。坏块修复:经过检测的磁盘发现存在坏块(扇区)后,会触发磁盘自身的remap机制,将坏块的指

8、针重定向到好的保留扇区中。然后调用RAID组的校验功能,重建该数据块,确保数据一致性。磁盘诊断:所有告警磁盘、故障磁盘会在诊断中心进行复诊并尝试修复,减少磁盘故障误 判。修复后的磁盘自动转为全局热备磁盘。,时间JilNt堆呃世於测齢亀抬时胡車期目険U立范昂-有棍据L齐醫要许置冬一沮聽瓷化疔F-扃,辛椅甥 讣匕八$益宀卡总玄!北飞 八电钾阳栽却忝不帀茗11孩H订:K专芒丽蚩丸处 S.M A R.TAftS: R层軽罠氏氛此匚检需夫取,着鬣民丁洁息嫌泌因宝ft.僮启倉::诃全戟列诵应检3T号讨的戸F1的廉住陨廿輩賦* Te3.1.磁盘检测对所有磁盘进行周期性全盘检测,提前发现错误并交由磁盘诊断中心

9、统一处理。该功能可以通 过以下几个模块实现:32快速复位磁盘子系统的核心功能之一就是磁盘错误处理,在收到磁盘返回的磁盘错误之后,根据不同的错误,可以采取不同的错误处理方案,包括:? 重试,即针对磁盘可恢复的临时性故障(磁盘的假故障,比如震动引起的读/写错误),磁盘子系统对命令进行重试;? 对磁盘下电再上电, 即从硬件上复位磁盘, 尝试修复磁盘错误, 结合上面提到的 RAID 基于Cell的局部重建机制,复位磁盘过程中新写入的数据可快速完成重建,恢复RAID的数据冗余性;? 磁盘错误透传,由 RAID进行处理。3.3.坏块修复发现磁盘坏块(扇区),根据RAID信息重建数据,触发磁盘自身的rema

10、p机制,实现坏块替换磁盘在出厂前会留有一部份备用扇区,当正常使用的扇区出现损坏的情况下,磁盘会启用remap自动修复机制,将损坏扇区重定位到备用扇区,这样磁盘的整体容量和功能就不会受到影响,对于 用户来讲,这个磁盘还是一个完整的好盘。采用remap机制把备用扇区替换到原始扇区后,虽然磁盘的功能得到恢复,但是原始扇区中的 数据是已经丢失的,IDDC的坏块修复功能可以根据 RAID组校验信息,计算出损坏扇区中的数据, 并进行恢复,这个过程只是针对产生坏扇区的部份,而不需要对整个RAID进行重建,重建过程所耗性能几乎可以忽略不计。34磁盘诊断所有告警磁盘、故障磁盘会在诊断中心进行复诊并尝试修复,减少

11、磁盘故障误判。修复后的磁 盘自动转为全局热备磁盘。磁盘检测中心对磁盘进行扫描后,会根据发现的磁盘错误类型进行标记,如warning盘、fail盘等,并通过相应的功能模块将这部分磁盘替换出来,转移到磁盘诊断中心由于磁盘检测时只能对磁盘进行全读操作,对于一些逻辑错误无法进行准确的判断。所以磁盘诊断中心会对磁盘进行全写操作,并对逻辑错误尝试进行修复。可以通过磁盘诊断中心修复的磁盘会被设置为热备磁盘。不能通过的会被设为fail磁盘,并会通过通知模块提醒用户更换。4. RAID维护新方式CRAID根据前面的统计分析,存储系统的硬件故障90%以上是磁盘故障,而故障磁盘中,只有12%是完全的物理损坏,88%

12、属于部分/完全可用。如果磁盘发生错误后立即被踢出阵列,一方面客户需要 为100%的故障磁盘买单,另外一方面客户还需要承担故障磁盘被踢出阵列到被更换过程中其他磁 盘再次故障所导致的数据丢失风险。ODSP存储软件平台在分层次、模块化设计的基础上,对多个LUNCellRAIDDisk,以提高用户的投资回层次上进行了磁盘错误处理,其目标是:“尽量尝试修复,尽可能减少踢盘”报率,提出基于 Cell的RAID同步和重建技术。Cell,形象称之为“细胞”,指带“活性”的数据单元,是存储资源管理的基本单位。引入Cell的概念后,资源管理层次如下图所示,在具体的实现上,首先用物理磁盘创建RAID,然后把RAID

13、的可用空间根据指定长度(默认1GB )划分为多个Cell,创建LUN时,系统自动分配空闲 Cell,破除了 LUN与RAID、Disk之间的捆绑关系,使RAID的最小维护单位由原来的磁盘变成了更小更灵活的Cell,实现了完全的虚拟化存储架构。RAIDRAID1箱艰理4|RAID5SJ4.1. CRAID基于Cell的重建功能多磁盘损坏,RAIDW遨oanza -* A a-D9:7 WCa S2C#II309年悅冃CtN9 = CtlljCelllO -M!kenn U按照Cell维护健康状态,突破了传统 RAID对可容忍的磁盘数目的限制。比如,传统的RAID5支持1块磁盘故障,第2块磁盘故障

14、时,RAID失效,不能继续使用。在ODSP存储软件平台的实现中,只要磁盘出错区域不在同一个Cell内,RAID中的数据仍然可以访问,即RAID可容忍非同一个Cell内多个磁盘发生介质错误,在极端的情况下,可能出现RAID中所有的成员磁盘上都存在介质错误,但是数据仍然可以访问,提高了存储产品对硬盘的容错性以及业务连续性。同时,针对 多个磁盘出错区域在同一个Cell内的情况,ODSP存储软件平台继承了物理的处理方式,即这些磁盘错误仅影响当前的 Cell,其他Cell仍然可以继续访问,使得错误的影响范围降到最小。4.1.1 .快速重建区别于传统 RAID先踢盘再重建的方式,CRAID的快速重建可只重

15、建错误磁盘上的损坏数据块,未发生错误的区域直接使用拷贝方式将数据块复制到热备盘,重建完成后,再将错误磁盘转移至IDDC磁盘诊断中心处理,该方式可明显降低重建过程对RAID组性能造成的影响。传统RAIDS:CaTl:心日:L_:LnJ:C _J;:)!:ranT :tI;iCaJ:S:r=i:t LJ iGO:Bfl2 1t & &鼻应鼻应* * 1 d U ; 4 A.斗:一: 二二二 . a d 瞬:($;:IS): JXJ:ra:ra: j- Tfc u :E!CS3:l$: t?a? JftM j磁盘拔出IMi:ra:m:云台 :m;(* m:;:ra:ra五隹 :m!:m=m:m!弩字

16、楚1 朝垒盘气: 做良盘3、一超予罠CRAID5传统RAID组重建时,最消耗性能和时间的原因是需要调用所有磁盘进行异或校验。快速重建 由于将全盘校验改成了按Cell校验+磁盘复制,其校验任务只有传统全盘重建的几百分一或千分之一,校验时间几乎可以忽略不记,而磁盘复制的速度可以达到磁盘读写的最大值。以1TB的SATA磁盘为例,在15块盘的RAID中,全盘重建时间约 30小时,而快速重建的时间差最快可以达到6小时。4.12局部重建类似于快速重建,但不是重建热备盘,而是只对原盘的变化部分进行重建,使其同步。适用于磁盘未损坏,但发生过闪断或人为误操作,短时间内拔出又插回的情况。该方法可重建5分钟内磁盘不

17、在位过程中所丢失的数据,重建时间短,极大降低RAID组受影响程度。有敬据写入I _ I I - ACRAID5进盘插回后只重建差异部分CRA1D5C RAIDS数据盘m被热备盘昔逼CelliL热备益RAIDS 组|Cell5J |Ceii2先校殓再拷贝4.13优化重建仅重建被LUN使用的Cell,未使用的 Cell不重建,如下图,仅重建 Celli、2、3、4, Cell5、6不需重建;、t Cellift1LR_-fx1 1f* |Cell2宜-1% 1LUN1 J |Cell3n11-1nnJJ鶯cells1二 1口LLL1|CII6匚1C0D1iftig盘】数摇盘3数数拒盘5J一 一RA

18、ID5重建调度时,优先重建存在介质错误的Cell,然后再使用拷贝的方式重建其他Cell,以尽可能的避免该Cell所处的其它磁盘发生故障导致的Cell损坏;支持多重重建,可同时重建多个故障磁盘,如一个RAID组中的两块磁盘所处的不同Cell存在坏块,可以两个 Cell并发重建,提高重建总体效率。4.1.4.全盘重建与传统RAID组一样,适用于磁盘被拔走或者磁盘严重故障不能继续使用的情况使用。检查 SM.A.R.T.5升钟内籀冋 底盍視异常拔出T5分钟后插回修笑成功修爼夫败热2盘通知更换4.1.5.4.16 IDDC+CRAID处理流程示例IDDC磁盘诊断中心与 CRAID优化同步重建技术相互联动

19、,形成了一套对于磁盘的自动检测、 故障处理,以及 RAID快速恢复的智能处理流程,在提高设备易用性和可维护性的同时,更是大大 的提高了设备的安全性假象故障施盘OK睁全盘检测*坏gii帛建ICell超出闽值 宀快速垂遂IFAIL诊断中4.2.4.2. CRAID基于Cell的同步优化4.3.1.按LUN同步如上图所示,如选择按 LUN同步,则只需同步图中的 Celli、2、3、4即可完成同步,余下的 Cell可在创建其它LUN时再做同步。该方法可大幅缩短同步时间,对于随机读写要求高,又急需使 用的环境,该方法较为有效。4.3.2.4.3.2. 快速同步(全0同步)校验RAID组在初始同步时会计算每个条带的校验值,做过校验的条带会大大提高小数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论