网络存储储备容灾研究_第1页
网络存储储备容灾研究_第2页
网络存储储备容灾研究_第3页
网络存储储备容灾研究_第4页
网络存储储备容灾研究_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络存储储备容灾研究

1备份容灾技术随着网络技术的发展,存储备份灾难技术已成为研究网络技术的热点。绝大多数企业、单位,甚至个人都离不开网络和数据信息,网络和数据信息对一个成功企业来说是至关重要的。由于黑客、病毒、设备器件的失效、火灾及地震等原因,使系统和数据信息遭到破坏甚至毁灭,如果不及时地进行恢复,这将对企业和个人造成损失,所以备份容灾技术显得尤为重要。备份容灾技术已成为IT基础架构的一个关键因素,在企业的数据保护中扮演了非常重要的角色。目前,企业数据系统的安全体系主要包括数据备份系统和高可用系统。数据备份系统提供应用系统的数据后援,确保在任何情况下数据具有完整的恢复能力;高可用系统主要是通过网络、服务器、存储子系统等的冗余,确保系统在发生局部意外的情况下(网络、电源、存储子系统等故障),以最短的时间恢复系统。备份容灾技术主要是指远程备份技术,即在异地建立和维护一个备份系统,利用地理上分散性来保证数据对于灾难性事件的抵御能力。远程备份系统在实现中可分为两个层次:数据备份容灾和应用备份容灾。数据备份容灾指在异地建立一个数据备份系统,进行数据的远程备份;应用备份容灾指在异地建立一套完整的与本地生产系统相当的备份应用系统(可以互为备份),在灾难的情况下,远程系统迅速接管业务运行。本文主要从存储备份的分类、存储备份的关键技术及存储备份的关键产品等方面,对存储备份技术作一个详细地介绍。2备份分类2.1增量备份移动热备份如果按照备份操作的方式划分,备份可分为完全备份和增量备份。完全备份,即将整个磁盘卷或逻辑磁盘的内容拷贝到另一个存储系统,它适用于服务器存储系统的备份。执行完全备份的主要目的是为了提供更快的磁盘卷恢复,即将整个磁盘卷或逻辑磁盘的内容拷贝到单一磁带或一组磁带上,这样灾难恢复将是一个十分简单和容易的过程。其缺点是:当对一个大文件系统进行定时备份时,可能重复备份这个文件中大量未修改的信息,浪费大量的备份介质。增量备份,即备份自从上次备份操作以来新产生的数据,或更新的数据,它一般与完全备份结合。其主要优点是备份时间短,对备份媒介容量的要求比完全备份要小得多。早期的增量备份存在一个主要的缺点:恢复一个文件或一个文件系统速度较慢,因为在恢复过程中需要检查要恢复文件的整个备份记录,即从最近一次完全备份文件到目前增量备份文件的所有变化记录。为了改变这种缺点,目前已出现了多种新型的增量备份方案。如SUN公司的SAM-FS文件系统,将一个大文件分成段,然后利用文件元数据的目录树对文件进行备份和恢复。2.2文件备份的缺陷造成了文件不存储按照备份数据的文件组成方式,可分为基于文件的备份和基于设备的备份。基于文件的备份,即通过文件系统来定位文件的页,然后将整个文件直接地拷贝到备份设备上,这样的备份方法有利于单个文件的恢复。由于存储在磁盘上的文件页并不一定是连续存储的,就会造成在文件恢复过程中磁盘不断地定位操作,增加了磁盘的负载,降低了磁盘的吞吐率。同时,以增量备份时,如果文件仅仅只是一部分发生改变,但也需要备份整个文件,增加了资源的开销。基于设备的备份,也叫做物理备份,它忽略了文件的结构而直接将磁盘上的块拷贝到备份媒介上。因为它不需要通过文件系统定位文件页,因而可以有效地提高备份的性能。为了保持文件和目录与存储在备份媒介上数据的对应关系,基于设备的备份需要保存包含这种关系的文件(称为元数据文件)。但是对于单个文件来说,文件页并不是连续地存储在备份媒介上,造成了恢复比较复杂,速度也很慢。另一个比较复杂的问题是数据的一致性,即基于设备的备份是将磁盘上的块顺序地拷贝到设备上,而数据的更新若采用写回的方式,备份的数据有可能与最新的数据不一样。2.3种“备份窗口”根据备份数据对现有应用产生的影响程度,可分为离线备份和在线备份。离线备份(Off-lineBackup),它是在进行备份操作时,服务器不再接受来自用户或应用对数据的更新。离线备份可以很好地解决在备份过程中数据的完整性的问题,是防止破坏、敌意的病毒袭击、应用失误等的有效方式,但是存在一个“备份窗口”的问题。在备份过程中,服务器不再接受任何更新操作,对于那些需要供24×7服务的系统来说,这就成为一个瓶颈。同时,如果需要备份的数据量很大,“备份窗口”所需的时间很长,就会影响正常的应用。在线备份(On-lineBackup),就是用户和应用正在更新数据时,系统能够进行备份。在线备份可以提供24×7持续服务,但最大的难点是如何保持数据的完整性。为了保护数据的完整性,可以采用两种技术:锁和快照。锁技术就是系统在备份某一文件时拒绝对该文件和目录的任何修改命令,因而锁技术会对数据可用性产生一定的影响,在应用持续的同时进行备份不可避免地降低了系统性能。目前,在线备份大多采用快照技术,快照技术在后面将详细介绍。2.4基于网络传输的传输算法本底是利用远程备份和网络容灾根据备份数据所处的位置,可分为本地备份和远程备份。本地备份,即通过存储网络将数据备份在局域网范围内的备份。这种方式下,可利用现有的各种资源和技术来达到高速的备份。它的性能可以很好地满足我们的需要,如“备份窗口”、数据一致性、容错等要求,而且性能是最高的。但对火灾、地震和洪水等对数据造成的破坏影响效果不太明显。远程备份,即在数据高可用性的网络环境中,异地数据备份是一个必不可少的手段。当本地应用受到灾难性破坏时,通过远程备份和远程容灾,来保护和恢复数据,进而恢复系统,使损失降低到最小。在远程备份过程中,数据传输要跨越校园网、城域网甚至广域网,这时,网络的传输速度对备份性能的影响是关键的因素。为了解决网络传输瓶颈,可以采用光纤通道专线连接的方法。但这种方式只适合于校园网环境,而且代价很大。另一种方法就是采用基于IP的SAN。它建立在成熟的TCP/IP网络基础上,利用FCIP,iFCP,iSCSI,mFCP或Infiniband等技术来达到高速的数据传输。利用此方法建立的数据容灾中心和应用容灾中心相对简单,投资较小,是今后的发展方向。延迟也是影响远程备份性能的重要因素,特别是广域网的数据库备份,可以通过异步的方式来解决。另外,在远程备份中还要解决数据的完整性和一致性的问题,解决这个问题比较成熟的技术是采用快照和镜像相结合的方法。3备份技术分类目前,存储备份涉及到多种关键技术,如镜像技术、快照技术、虚拟私有网络备份技术、无服务器备份技术、磁带虚拟化备份技术、NDMP备份技术、基于IP的SAN的备份技术等,各种备份技术不是彼此互相孤立的,往往是相互融合和互相联系的。3.1同步远程镜头镜像是在两个或多个磁盘或存储系统上产生同一个数据的镜像视图的一个信息存储过程,一个叫主镜像系统,另外一个叫从镜像系统。按主、从镜像存储系统所处的位置可分为本地镜像和远程镜像。远程备份的实现主要是利用远程镜像和快照技术,而远程镜像本身也是远程备份的一种方式。远程镜像技术早已被用在远程容灾和业务持续,它可为两地点间的重要信息传输提供丰富的存储空间。按请求镜像的主机是否需要远程镜像站点的确认信息,又可分为同步远程镜像和异步远程镜像。同步远程镜像需要得到远程证实信息,往返传播延时较长,所以只限于在相对较近的距离上应用。但同步镜像使远程拷贝总能与本地机要求复制的内容相匹配,当主站点出现故障时,用户和应用程序换到一个代替站点后,远程的副本可以继续执行操作。异步远程镜像保证在更新远程存储视图前完成向本地存储系统的基本输入/输出操作,而由本地存储系统提供给请求镜像服务器的操作完成确认信息,不需要等待远程存储系统提供操作完成确认信息,这使得本地系统性能受到很小的影响。但是,许多远程的从属存储子系统的写没有得到确认,当某种因素造成数据传输失败时,可能出现数据一致性问题。为了解决数据一致性问题,目前大多采用延迟复制的技术,它可以在确保本地数据完好无损后进行远程数据更新。当本地存储域服务器对本地的存储系统进行数据刷新(写操作)时,也会对异地的存储系统进行刷新。当远程存储系统正在进行备份操作时,这种远程镜像操作可能被中断,等备份完成后,再进行同步。通常有三种同步方式:①全同步,它把本地存储系统的卷整个拷贝到远程存储系统;②日志同步,在中断期间用日志记录本地存储系统所发生的变化,即新写入或修改的数据块,在同步时,只把新写入或修改的块复制到远程存储系统;③按记分板再同步,其原理是,记分板的每一位对应着一个逻辑磁盘块,当有盘块被改变时,该位为1,否则为0,在同步时,只要找出数字1所对应的盘块进行拷贝即可。3.2采用快照技术远程镜像技术往往同快照技术结合起来实现数据信息的远程备份,即通过镜像把数据备份在远程存储系统中,再借助快照技术把远程存储系统中的信息备份到远程的磁带库、光盘库中。快照就是通过对预先定义的数据的逻辑单元号LUN建立一个快照LUN和快照Cache,然后利用快照LUN和快照Cache实现对原数据的一个完全的拷贝。其中,快照Cache是用来存放即将要修改的数据。快照技术使得用户可以在正常业务应用不受影响的情况下,实时提取当前在线业务数据。这意味着,用户在进行系统数据备份时,“备份窗口”接近于零,从而大大增加了整个业务系统的连续性,为实现真正的7×24运转提供了保证。快照是通过内存作为缓冲区(快照Cache),由软件提供系统磁盘存储的即时数据映像,存在缓冲区调度的问题。采用快照技术的产品有很多种,其中主要有:EMC公司的TimeFinder(Symmetrix)和为远程镜像开发的SnapViewandMirrorView软件;Hitachi公司的InstantSplitforShadowImage(LightningSeries);HP公司的SureStoreBusinessCopy(XP);SUN公司的StorEdgeInstantImage(9900Systems);Veritas公司的VolumeManagerandVolumeReplicator和NetBackupFlashBackup;IBM公司的FlashcopyforFAStT;DataCore公司的SANsymphonySnapshotOption;FalconStor公司的IPStorSnapshotCopyOption;StoreAge公司的MultiView。其中EMC公司开发的SnapViewandMirrorView软件产品具有以下优点:将远程镜像技术和快照技术结合起来用于远程备份容灾;镜像和快照都由专用的存储处理器SP来控制完成,生产主机系统和备份主机系统在比较重的负载情况下也能达到很好的性能;采用递增备份技术,可显著减少备份操作和同步操作所需要的时间。3.3备份系统的选择它是SAN内部的一种备份方式,如图1所示,服务器和存储设备之间是一种多对多的关系。一个服务器可以把数据备份到多个存储设备上,多个服务器也可以把数据备份到一个存储设备上,存储设备之间也可以进行备份,所以称这种备份系统为Lan-free备份。备份的数据是以块的形式通过SAN传输,在局域网内只进行控制信息的通信,大大地降低了局域网的负载并提高了备份的速度。然而,备份的数据需要从磁盘阵列经过备份服务器到备份设备,进行两次拷贝操作,这不仅浪费了SAN的带宽,而且加重了备份服务器的负担。这样,备份服务器性能直接影响了备份的速度,特别是多个备份进程同时运行时这个情况会更加突出。另外,各个厂商的设备缺少统一的标准,也影响了Lan-free备份。为了解决这个问题,可以通过硬件的方法和采用具有共享能力的存储备份软件。其产品主要有:LuncentTechnologies公司和SolutionTechnology公司开发和生产的产品。3.4amoper功能无服务器备份也叫做第三方拷贝,其体系结构与Lan-free相同,不同的是在存储网络中的一些设备如集线器、路由器、交换机等具有智能性,它能将数据从一个设备传输到另一个设备,这些智能设备称作数据移动者(DataMover)。通常数据移动者是在桥设备上实现的。在无服务器备份中,服务器只需通过操作系统的文件分配表建立在需要备份的文件和设备、数据块之间相互对应关系的文件列表,通过备份代理将文件列表传送给发出请求的备份进程,即数据移动者,通过数据移动者来实现数据的备份。这样的好处是非常明显的,服务器不必利用内存将数据通过系统总线和存储接口进行两次拷贝,只负责一些必要的通信,处理器的负载明显降低,而且对于数据移动和文件系统转换的管理也简化了许多。其产品主要有:EMC公司的EDM,Legato公司的NetWorker,Veritas的NetBackup,以及CrossroadsSystems公司开发生产的无服务器备份产品。3.5ndp的工作原理NDMP(NetworkDataManagementProtocol)是由NetworkApplianceCorporation和LegatoSystem公司合作开发的一种基于NAS的容灾备份技术。它提供了一个开放的协议,利用NAS设备进行数据的备份/恢复。在异构或同构的环境下,通过一个通用接口,将文件I/O的数据从文件系统拷贝到备份设备上。NDMP可以看成是一个运行在NAS设备上的专用程序,等待来自异构或同构环境备份软件的服务请求。其工作过程为:当备份软件利用NDMP向NAS设备发出一个备份请求后,NAS设备开始初始化备份或恢复进程。在备份操作过程中,NAS设备发送备份文件的元数据信息给备份服务器,并由备份服务器写入对应的介质上,而需要备份的文件通常由NAS设备传输到下面三个设备之一:①与NAS相连的磁带设备(Direct-attached);②与另一个NAS相连的磁带设备(NASDevice-to-NASDevice);③与备份服务器相连的磁带设备(NASDevice-to-Server)。NDMP的v4版本已经于2000年底提交给IETF(InternetEngineeringTaskForce),它的应用能提供更好的基于NAS的数据容灾备份性能。应用NDMP典型产品是:EMC公司开发生产的ClariionIP4700,它能把NDMP与快照技术、镜像技术有机地结合起来,实现NAS数据信息的本地和远程容灾备份。3.6虚拟数据安全服务器磁带虚拟化备份技术是通过对磁带驱动器或磁带库,应用虚拟化技术而创造的一个抽象化磁带设备的方法,它对备份服务器展现的是一个逻辑的磁带映像设备,而不是实际的物理设备,这主要是通过在服务器和磁带设备之间增加了转换和管理中间层来实现的,这个中间层被称为虚拟磁带服务器VTS(VirtualTapeServer)。通过虚拟磁带服务器,一组磁带设备被转换成一个逻辑存储池,这个逻辑存储池可以被多个备份服务器同时利用。虚拟磁带服务器VTS的核心是磁带卷缓存TVC(TapeVolumeCache)的设备。TVC是一个磁盘缓冲器,可以模拟成磁带设备,备份服务器认为写到磁带上的数据其实写到了磁盘缓冲器上。当备份服务器完成了备份操作后,虚拟磁带服务器再将写在磁盘缓冲器上的数据拷贝到磁带设备上。备份服务器写到磁盘缓冲器上的数据称作虚拟卷,虚拟卷数据写到磁带上时称作物理卷。虚拟卷就像一个磁带上的真实物理卷一样,它具有真实物理卷的所有特点:对备份服务器来说,它有一个卷序列号;在虚拟设备上,能被装入和退出;支持所有的磁带写模式;支持所有形式的磁带格式等。其典型产品由IBM公司和Ultera公司开发生产的产品。Ultera公司生产的虚拟磁带备份产品,可将磁带虚拟化技术与磁带镜像技术相结合,通过磁带卷缓存TVC,可将备份数据镜像到两个磁带上,提高数据的可用性,也可将备份数据镜像到远端的磁带设备上,增强远程容灾备份能力。3.7备份设备在热备份方面的应用并发备份将来自多个服务器的数据流备份到单个或多个磁带设备上,其目的是提高磁带的备份速度,减少备份时间。最简单的方法就是将备份存储系统从物理上划分成几个区域,每个区域拥有它自己的备份设备。这个分区可以是固定的,也可以是动态的。如果是动态的分区,就存在负载平衡的问题。这种分区方法的优点是:操作简单,单一备份设备失效只会影响部分服务器;缺点是:磁带备份设备的利用率低,同时当备份负载比较高时,可能会产生频繁的重新分区和负载平衡。通过磁盘缓冲的方法也可以解决并发备份。其原理是:将一个磁盘作为一个缓冲区,保存服务器备份的数据。当一个备份进程完成以后,就将磁盘上的数据尽可能快地传输到磁带上,同时删除磁盘上的数据。这种方法比分区备份的方法要简单。但是当一个备份的数据量超过了磁盘的容量时,就会对备份的性能产生影响。采用并发备份的产品有:Amanda公司的BackupManager。3.8存储磁盘纤维的存储分层存储管理(HierarchicalStorageManagement,HSM)来源于最初的大型机的存储管理方式,是基于策略的数据迁移的方法,它将不常访问的文件透明地迁移到更经济的存储介质中去,即将最常用的数据存储在磁盘阵列中,偶尔使用的数据存储在磁盘柜或磁光盘库中,最不常用的数据保存在磁带库中,从而减少存储的管理费用。文件由HSM系统选择进行迁移,当文件被正确拷贝后,一个与原文件相同名字的标志文件被创建,但它只占用比原文件小得多的磁盘空间。以后,当用户访问这个标志文件时,HSM系统能将原始文件从正确的介质上恢复过来。分层存储管理以略微降低存取文件性能的方法来获得更好的存储管理性能。由于存储在磁盘阵列上的数据大大减少,可以明显地减少备份窗口的时间和加快恢复的进程。分层存储管理并不能替代备份/恢复过程,而是与备份/恢复技术相结合。为了提高性能,可以在备份的同时进行数据迁移,在不影响备份性能的情况下,将数据迁移到第二层或第三层存储设备中。同时,还可以利用无服务器备份的方式,将第二层或第三层存储设备中的数据备份到本地或异地备份设备中,以提高容灾备份的性能。其典型产品有:IBM公司的TivoliSpaceManager,SUN公司的SolsticeTMBackupTMandStorageManagement。3.9ip认同协议在远程备份中,主要是基于SAN的远程备份,即通过光纤通道FC,把两个SAN信息孤岛连接起来,一个SAN的存储池作为主存储池,另一个作为从存储池,可通过FC协议将主存储池中的数据备份到从存储中,当灾难发生时,从存储池可以代替主存储池工作,保证系统继续工作。这种远程备份方式存在一些缺陷:实现成本高,设备的互操作性差,跨越的地理距离短(10km)等,这些因素阻碍了它的进一步推广和应用。目前,出现了多种基于IP的SAN互连技术协议,这些互连协议可以充分利用现有的TCP/IP数据网络,进行有效和高速的远程数据容灾备份。即可利用这些互连协议,将一个SAN存储池中信息通过现有的TCP/IP网络远程镜像到另一个SAN的存储池中,再利用快照技术将远程SAN存储池中的数据备份到磁带库或光盘库中。这种基于IP的SAN的远程容灾备份技术,可以跨越LAN,MAN和WAN,其成本低,可扩展性好,具有广阔的发展前景。基于IP的SAN的互连协议包括:FCIP,iFCP,InfiniBand,iSCSI,mFCP。FCIP技术原理是将FC帧封装到IP数据包中,再通过IP网络传输到另外一个FC的SAN;目的SAN接收到这个IP包后,将其解包使其恢复成封装之前的FC帧,将FC帧转变成块数据存入相应的存储池中。iFCP是将FC协议映射到TCP协议之上。与FCIP不同,FCIP是一种隧道(Tunneling)协议,除了将FC帧封装成IP数据包以外,不对FC帧作任何处理。而iFCP则是一种网关协议,它对FC帧进行协议转换,重新用TCP/IP协议来表达FC帧,它必须对FC帧进行更多的处理,如读取FC帧的头部,理解其地址,并用IP地址方式来表示,当到达目的SAN后,再进行转换恢复成以前的FC帧。mFCP(metropolitanFibreChannelProtocol),除了用UDP代替TCP外,mFCP与iFCP是相同的。iSCSI技术原理是将SCSI协议映射到TCP/IP之上,即将主机的SCSI命令封装成TCP/IP数据包,在IP网络上传输,到达目的节点后,再恢复成封装前的SCSI命令,从而实现SCSI命令在IP网络上的直接、透明传输。利用iSCSI技术,可以将本地的块数据备份到远程的SCSI盘、阵列、磁带库中。InfiniBand是一种可简化和加快服务器之间的连接,以及服务器与其他相关系统(诸如远程存储和网络设备)之间连接的全新输入/输出(I/O)技术。它通过一套中心机构(中心InfiniBand交换机)在远程存储器、网络以及服务器等设备之间建立一个单一的连接链路,并由中心InfiniBand交换机来指挥流量。其结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论