




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据备份必备知识与策略设计方法
企业IT系统里最核心的就是数据,如何保证数据安全是每
个企业重点关注的领域。数据安全是一个比较大的技术范畴,
本文仅针对数据备份,谈谈如何在企业中做到合理的数据备份
和有效的数据恢复。
1.备份相关的基础知识
1.1.什么备份
首先先了解一下什么是数据备份,数据备份顾名思义,就
是将数据以某种方式加以保留,以便在系统遭受破坏或其他特
定情况下,重新加以利用的一个过程。在日常生活中,我们经
常需要为自己家的房门多配几把钥匙,为自己的爱车准备一个
备胎,这些都是备份思想的体现。
数据备份作为存储领域的一个重要组成部分,其在存储系
统中的地位和作用都是不容忽视的。对一个完整的IT系统而
言,备份工作是其中必不可少的组成部分。其意义不仅在于防
范意外事件的破坏,而且还是历史数据保存归档的最佳方式。
换言之,即便系统正常工作,没有任何数据丢失或破坏发生,
备份工作仍然具有非常大的意义,为我们进行历史数据查询、统
计和分析,以及重要信息归档保存提供了可能。
简单的说,一份数据备份的作用,不仅仅像房门的备用钥
匙一样,当原来的钥匙丢失或损坏了,才能派上用场。有时
候,数据备份的作用,更像是我们为了留住美好时光而拍摄的
照片,把暂时的状态永久的保存了下来,供我们分析和研究。
当然我们不可能凭借一张儿时的照片就回到从前,在这一点
上,数据备份就更显神奇,一个存储系统乃至整个网络系统,
完全可以回到过去的某个时间状态,或者重新“克隆”一个指
定时间状态的系统,只要在这个时间点上,我们有一个完整的
系统数据备份。
还有一个需要澄清的问题,数据备份更多的是指数据从在
线状态,剥离到离线状态的过程,这与服务器高可用集群技术
以及远程灾备技术,在本质上有所区别。虽然从目的上讲,这
些技术都是为了消除或减弱意外事件给系统带来的影响,但
是,由于其侧重的方向不同,实现的手段和产生的效果也不尽
相同。集群和灾备技术的目的,是为了保证业务的连续性,也
就是说,当意外发生时,系统所提供的服务和功能不会因此而
间断,能够重续运行。对数据而言,集群和灾备技术是保护系
统的在线状态,保证数据可以随时被访问。而相对来说,备份
技术的目的,是将整个系统的数据或状态保存下来,这种方式
不仅可以挽回硬件设备坏损带来的损失,也可以挽回逻辑错误
和人为恶意破坏的损失。
然而,一般来说,数据备份技术并不保证系统的实时可用
性。也就是说,一旦意外发生,备份技术只保证数据可以恢
复,但是恢复过程需要一定的时间,在此期间,系统是不可用
的。在具有一定规模的系统中,备份技术、集群技术和灾备技
术互相不可替代,并且稳定和谐的配合工作,共同保证着系统
的正常运转。
1.2.手工备份和自动化备份
相比于系统、数据库管理人员手工备份,自动备份软件有
如下的优势:
稳定性
备份的主要作用是为系统提供一个数据保护的方法,于是
备份本身的稳定性和可靠性就变成了最重要的一个方面。相比
与手工备份,自动备份软件更能保证备份的稳定可靠,能提供
方法确保不会在恢复时才发现备份是不成功的。
全面性
在复杂的计算机网络环境中,可能会包括了各种操作平
台,如各种厂家的UNIX、Linux、Windows等,并安装了各种应
用系统,如数据库、文件系统等。备份软件可以全面支持这些
平台、软件。
自动化
很多公司由于工作性质,对何时备份、用多长时间备份都
有一定的限制。在下班时间系统负荷轻,适于备份。可是这会
增加系统管理员的负担,由于精神状态等原因,还会给备份安
全带来潜在的隐患。自动备份软件能提供定时的自动备份,并
利用磁带库等技术进行自动换带。在自动备份过程中,还有日
志记录功能,并在出现异常情况时自动报警。
高性能
随着业务的不断发展,数据越来越多,更新越来越快,在
休息时间来不及备份如此多的内容,在工作时间备份又会影响
系统性能。备份软件在备份时,可以尽量考虑到提高数据备份
的速度,如利用多个磁带机并行操作的方法、利用合成备份的
方法等等。
操作简单,集中管理
备份软件提供集中管理功能,能够对特别重要数据做多份
拷贝,并能记录跟踪每次备份的不同版本,这样就可以按照需
要恢复不同的数据。数据备份应用于不同领域,进行数据备份
的操作人员也处于不同的层次。备份软件提供了一个直观的、
操作简单的图形化用户界面,缩短操作人员的学习时间,减轻
操作人员的工作压力,使备份、恢复工作得以轻松地设置和完
成。
实时性
有些关键性的任务是要24小时不停机运行的,在备份的时
候,有一些文件可能仍然处于打开的状态。那么在进行备份的
时候,要采取措施,实时地查看文件大小、进行事务跟踪,以
保证正确地备份系统中的所有文件。而这些仅凭借手工备份是
很难做到的。
能更迅速、准确的恢复数据
备份软件精确的知道每次备份发生的时间和内容以及存放
地点,能够迅速找到并恢复数据。同时,也可以采用多种技术
如从快照恢复、多流恢复等方法提高恢复速度。备份软件也能
提供更小颗粒的恢复功能。
1.3.备份和恢复
数据备份的根本目的,是重新利用,这也就是说,备份工
作的核心是恢复,一个无法恢复的备份,对任何系统来说都是
毫无意义的。在实际情况中,厂商或集成商更多的是向用户吹
嘘,自己的产品在备份过程中如何的巧妙。然而,作为最终用
户,一定需要清醒的认识到,能够安全、方便而又高效的恢复
数据,才是备份系统的真正生命所在。也许很多人会以为,既
然备份系统已经把需要的数据备份下来了,恢复应该不成什么
问题。这就大错而特错了,事实上,无论是在金融电信行业的
数据中心,还是在普通的桌面级系统中,备份数据无法恢复,
从而导致数据丢失的例子实在太多了。
众所周知,建造大楼时一定会配备消防系统,但是,并非
有了消防系统就能高枕无忧。人们经常获悉,有的楼房突遭火
灾时,消防系统却无故瘫痪了,或者消防栓里没有水,或者消
防通道被堵塞,以致火势蔓延,造成巨大的生命财产损失。因
此,并非所有的消防系统,在遭遇火灾时都能起作用。一样的
道理,数据备份设施之于IT系统,就相当于消防系统之于楼
房,它是保护IT系统的最后一道防线。即使配备了数据备份设
施,并不表明在IT系统遇到问题时一定能将丢失的数据成功恢
复。
为了进一步阐明恢复的重要性,让我们再来对比一下备份
和恢复操作的区别。
首先、备份是计划内的工作,而恢复则是计划外的工作。
对于IT技术人员来说,备份是按照既定的备份策略,每隔一定
时间,按部就班地操作即可。而恢复则是只有当发生数据丢失
时,或者要查找历史数据时,才会进行的操作。通常情况下,
实施恢复操作时,往往都是十万火急,越快越好,同时还希望
恢复后的数据可用。由于备份对系统环境的影响比较大,所以
备份的工作往往是在特定的时间内完成的,也即所谓的“备份
窗口”,这时生产系统通常不工作。而恢复,因为是计划外的
工作,对生产系统肯定会产生影响。下面以电子邮件数据的备
份和恢复为例,来说明恢复对系统的影响。假定您对电子邮件
系统的备份策略是每晚八点定时备份到磁带,备份完成后磁带
里就会保存有昨天晚上八点之前收到的所有电子邮件。当然,
收发电子邮件是一个连续的动作,晚上八点后,邮箱仍然在不
停地收邮件。假设到了今天中午12点,您发现某一个重要的邮
件不小心被删掉了,如果这个邮件是昨天晚上八点前收到的,
那么您还是有可能从磁带里恢复该邮件。这时就要启动恢复操
作了。如果备份软件能够实现邮件一级的恢复(恢复颗粒是单
个邮件)的话,您只要能找到那封丢失的邮件,直接将它恢复
到邮箱就可以了,恢复的过程对整个邮件系统没有任何影响;
但是,如果您的备份软件只能做到邮箱级的恢复(恢复颗粒是
一个邮箱),那么如果您想恢复该邮件的话,就不得不把整个邮
箱恢复到昨晚八时的状态,造成的后果就是昨天晚上八点到今
天上午12点收进的邮件会全部被覆盖。可见,如果从备份的角
度来说,两者没什么区别;但是从恢复的角度来讲,两者差别
很大。
第二、备份是大批量的数据移动过程,往往需要将所有数
据或所有增量数据全部拷贝到备份设备,而恢复往往是少量的
数据移动过程,只需将需要恢复的数据从备份设备拷贝回主服
务器。现在市场上流行的很多备份软件,基本上都是在上世纪
80年代设计的,那时的数据量相对较小(几十兆到几百兆)。
当进行备份操作的时候,备份软件会把所需要备份的数据文件
打包成一个备份集(backupset),然后将它拷贝至备份设备
中,并且针对该备份集形成相对应的索引,但一般不会对备份
集里的内容建立详细的索引。那么当需要恢复该备份集中的某
一个文件时,备份软件就必须从备份集中搜索到该文件,然后
进行恢复。这在只有几百兆数据量的IT环境下完全可行,然而
来到我们目前所处的海量数据的时代,由于数据量已经高达几
十甚至几百TB,如果继续沿用这种方式,势必产生许多问题:
从浩如烟淼的备份数据里,找到并恢复您需要的那一个,难度
无异于大海捞针!例如,有的用户去电信公司要求查询自己的
历史话单(如两年前的某一个月的通话记录),今天,很多电信
公司无法满足用户的这一需求,因为很多情况下明知该历史话
单一定存在于原先的备份介质中,但由于数据量实在太大,几
乎没有可操作性。这种情况下,备份虽然是成功的,但是恢复
的成功率却很低。早年的调查就揭示了数据恢复的真相,即恢
复作业的平均成功率只有70%左右。
当考虑数据保护时,应着眼于“恢复”,需着重考虑以下几
/占、、、・•
1.确保数据能够恢复
2.恢复速度要尽量快
3.恢复操作对系统的影响要尽可能小
4.能够恢复到用户指定的时间点
5.恢复的数据是可以使用的
当然,恢复是在备份的基础上进行的,如果备份失败,恢
复肯定不会成功。为了确保能达到恢复的目的,对备份操作有
以下几点基本要求:
1.提高备份成功率
备份过程中,当备份介质、备份设备和网络出现问题时,
备份作业就会中断,要提高备份的成功率,备份系统就应具有
容错机制。如果是备份介质或备份设备出现问题,可以将备份
自动切换到其他的备份介质、设备或路径上,并能确保从中断
处继续备份操作。另外,“备份的断点续传”也很重要,当网络
发生阻塞时,备份也会中断;一旦网络恢复正常,备份能从中
断处自动重启并继续进行。
2.精细的备份数据索引
当用户希望恢复数据时,绝大多数情况下并不需要恢复整
个系统,而只要恢复部分数据,甚至只是一个文件或邮件。索
引做得足够精细,有利于在恢复时能快速查找并定位所需要恢
复的数据,实现小颗粒恢复,同时将对系统的影响降到最小,
恢复速度大幅提高。
3.能产生多个数据副本
为了防止备份数据意外损坏,产生多个备份副本是必要
的,也很有效。产生数据副本的方法有两种:同步和异步。同
步的方法是,在备份时,同时把备份数据写入到两个不同的介
质中;异步的做法是,先把备份数据写入一个介质,然后再利
用空闲时段,将备份数据复制到其他介质上。当然也可以通过
网络将其复制到异地,达到数据容灾的目的。
4.离场保护
如果数据备份是为了恢复而进行的,就应该考虑到万一数
据中心遭遇灾难时,怎样进行恢复。这时“离场保护”中保存
的数据副本就会起到很大的作用。
5.操作界面应足够简单
用户界面应该面向恢复,而非面向备份。在面向数据恢复
的用户界面,所有的备份数据是按照数据原先的结构来组织
的,需要恢复哪个数据,很快就能找到,轻松点击一下就能恢
复该数据了。
1.4.备份结构
常见的数据备份系统主要有Host-Base.LAN-Base和基于
SAN结构的LAN-Free、Server-Free等多种结构。
1.Host-Based备份方式:
Host-Based是传统的数据备份的结构这种结构中存储介质
(例如磁带库)直接接在服务器上,而且只为该服务器提供数
据备份服务。在大多数情况下,这种备份大多是采用服务器上
自带的磁带机,而备份操作往往也是通过手工操作的方式进行
的。
Host-Based备份结构的优点是数据传输速度快,备份管理
简单;缺点是不利于备份系统的共享,不适合于现在大型的数
据备份要求。
2.LAN-Based备份方式:
LAN-Based备份,在该系统中数据的传输是以网络为基础
的。其中配置一台服务器作为备份服务器,由它负责整个系统
的备份操作。磁带库则接在某台服务器上,在数据备份时备份
对象把数据通过网络传输到磁带库中实现备份的。
LAN-Based备份结构的优点是节省投资、磁带库共享、集
中备份管理;它的缺点是对业务网络传输压力大。
3.LAN-Free备份方式:
LAN-Free和Server-Free的备份系统是建立在SAN(存储
区域网)的基础上的,其结构如下图所示。基于SAN的备份是
一种彻底解决传统备份方式需要占用LAN带宽问题的解决方
案。它采用一种全新的体系结构,将磁带库和磁盘阵列各自作
为独立的光纤结点,多台主机共享磁带库备份时,数据流不再
经过网络而直接从磁盘阵列传到磁带库内,是一种无需占用网
络带宽(LAN-Free)的解决方案。
目前随着SAN技术的不断进步,LAN-Free的结构已经相当
成熟,而Server-Free的备份结构则不太成熟。LAN-Free的优
点是数据备份统一管理、备份速度快、业务网络传输压力小、
磁带库资源共享;缺点是投资高。
4.Server-Free备份方式
另外一种减少对系统资源消耗的办法是采用无服务器
(ServerIess)备份技术。它是LAN-free的一种延伸,可使数据
能够在SAN结构中的两个存储设备之间直接传输,通常是在磁
盘阵列和磁带库之间。这种方案的主要优点之一是不需要在服
务器中缓存数据,显著减少对主机CPU的占用,提高操作系统
工作效率,帮助企业完成更多的工作。
无服务器备份有几种实施方式。
方法一,备份数据通过名为数据移动器的设备从磁盘阵列
传输到磁带库上。该设备可能是光纤通道交换机、存储路由
器、智能磁带或磁盘设备或者是服务器。数据移动器执行的命
令其实是把数据从一个存储设备传输到另一个设备。实施这个
过程的一种方法是借助于SCSI-3的扩展拷贝命令,它使服务器
能够发送命令给存储设备,指示后者把数据直接传输到另一个
设备,不必通过服务器内存。数据移动器收到扩展拷贝命令
后,执行相应功能。它的主要缺点是必须具备特殊的设备。无
服务器备份要求使用支持SCSI-3扩展复制命令集的智能设备。
方法二,通过备份服务器发送控制指令,首先对需要备份
的数据卷做一个快照(或者其他类似操作),形成一个副本,然后
用备份服务器将此快照卷Mount上,利用备份服务器将此卷上的
数据备份至备份设备上。
1.5.备份分类
备份类型主要有三种:全备份,增量备份,差异备份,除
此之外,很多备份软件在这个基础上还延伸出一些缩短备份或
者恢复时间的备份方式,例如辅助副本备份、合成完全备份等
等。
1.全备份
全备份将备份所有选定的文件,然后将每个文件标记为已
备份(换句话说,存档属性被清除)。如果使用全备份,恢复所
有文件时仅需具备最新的备份文件副本或磁带,全备份通常在
首次创建备份集时执行。全备份的优点是易于查找文件,因为
文件都位于当前备份媒体上。文件恢复只需要一种媒体或一组
媒体。缺点是浪费时间和浪费空间,如果文件不频繁进行更
改,备份内容几乎完全相同。
2.增量备份
增量备份仅备份那些自上次全备份或增量备份以来创建或
更改的文件。增量备份将文件标记为已备份(换句话说,存档
属性被清除)。如果结合全备份和增量备份,恢复所有数据时必
须具备最新的全备份集和所有增量备份集。增量备份的优点是
需要存储的数据最少,备份速度最快。缺点是完全恢复系统需
要的时间比全备份或差异备份长。
3.差异备份
差异备份仅备份那些自上次全备份或增量备份以来创建或
更改的文件。差异备份不将文件标记为已备份(换句话说,存
档属性不被清除)。如果结合全备份和差异备份,恢复所有数据
时既需要最新全备份的文件或磁带,也需要最新差异备份的文
件或磁带。差异备份的优点是恢复时仅需要最新全备份的媒体
和差异备份的媒体,备份速度比全备份快。缺点是完全恢复系
统需要的时间比全备份长。如果大量数据发生变化,备份所需
的时间长于增量备份的时间。
4.辅助副本
辅助(或次要)副本是备份数据的副本。已复制的数据是
主要备份副本的真实映像。如果主要备份服务器、设备和媒体
丢失或损坏,已复制的数据可用作热备用备份副本。主要副本
和次要副本使用不同的媒体,通常使用不同的备份库。辅助副
本的优点是制作备用的备份磁带原样副本。与实际副本相比,
辅助副本的生成速度更快。副本可现场保存供灾难恢复之用。
但是这种延伸的技术不是所有备份管理软件都很好支持的功
能。
5.合成全备份
合成备份(Syntheticbackup)的含义就是将一个全备份和一
些增量备份或者差分备份重新组成一个全备份,这样在恢复的
时候,就好像一■个全备份恢复一样快捷;而且这部分发生在介质
管理器而不是客户端,可以有效利用空间并且减小客户端的负
载。一般的用户可能不熟悉合成备份的用法,一般来说,合成
备份可以将多个备份整合成一个可用的恢复文件,所以可以将
它和传统备份统一起来使用。举例来说,如果用户创建一个三
个月一次的全备份、每天一次的差分备份、一周一次的合成备
份,那么每个星期一次的合成备份就会把上周的全备份和周内
的差分备份,重新合成一个全备份文件,就好像每周一次全备
份一样,而这样做的好处是将合成备份的工作移到介质服务器
中完成,减少了客户端的负载。合成备份的优点是将全备份和
增量备份合并到一个新的全备份中,该全备份位于保存在网络
和/或关键服务器之外的库中。备份和还原时间减少。这种功能
也是某些备份管理软件的增值功能,不具有普适性。
1.6.RTO与RPO
在业务连续性管理中,RPO(RecoveryPointObjective)是指
能把数据恢复到过去的那一个时间点,
RTO(RecoveryTimeObjective)是指在出现问题后,什么时候可
以恢复数据。RPO可简单的描述为企业能容忍的最大数据丢失
量,RTO可简单的描述为企业能容忍的恢复时间。
1.7.备份设备
现在企业常用的备份设备和介质是磁盘,磁带和光盘。历
史上很多其他备份介质逐渐淘汰了。
1.磁盘备份设备
磁盘备份设备通常是HDD(硬盘驱动器(HardDiskDrive))
或者SDD(固态硬盘(SolidStateDrive))介质,用于备份的
磁盘一般考虑大容量,价格低廉。在备份管理软件中通常是由
一个或者多个访问路径组成,可以是本地磁盘,也可以是远程
访问路径的网络文件系统。每个访问路径就是在磁盘上的一个
目录。在备份管理软件中定义的磁盘备份设备一般采用文件系
统,备份的数据都是以文件方式存放在磁盘备份设备上的。这
样便于数据的管理和跨平台的迁移。
磁盘备份设备有一些特点,例如不支持硬件压缩;随机访
问速度快;在大数据流的备份和恢复中,可能比磁带设备慢,
磁带更容易实现多流并发操作;通常情况下,备份数据不能离
线拿走;由于磁盘设备是一个在线检测设备,所以存放备份数
据的可靠性,通常会比磁带高。
2.磁带备份设备
磁带设备通常分为2种:
物理磁带机:只有一个磁带驱动器,通常不包括任何其它
机器装置。通常磁带机都是内置在服务器中的。由于磁带机的
物理特性,所以管理比较复杂。
物理磁带库:包括自动装载机(AutoLoader)和带库
(TapeLibrary)o它们的特点都是除了磁带驱动器外,还有一
个机器手臂,来自动控制和装载磁带。
3.光盘备份设备
光盘是以光信息做为存储的载体并用来存储数据的一种物
品。分不可擦写光盘,如CD-ROM、DVD-ROM等;和可擦写光
盘,如CD-RW、DVD-RAM等。蓝光光碟(BIu-rayDisc,简称
BD)是指DVD之后的下一代光盘格式之一,用以存储高品质的
影音文件以及高容量的数据存储。
光盘是利用激光原理进行读、写的设备,是迅速发展的一
种辅助存储器,可以存放各种文字、声音、图形、图像和动画
等多媒体数字信息。
光盘备份设备也分为光盘刻录机和光盘库。
4.虚拟磁带库
虚拟带库(VirtuaITapeLibrary,VTL)就是以磁盘作为自
身存储介质,并能仿真为物理磁带库的产品。简单的说,虚拟
带库就是将磁盘空间虚拟为磁带空间,能够在传统的备份软件
上实现和传统磁带库同样功能的产品。
传统的磁带库的存储介质为磁带,磁带的优势是可以集中
的保存,数据的移动比较方便,但是磁带介质不是非常稳定,
容易受粉尘、湿度、磁粉、粘连、霉点等因素的影响,出现读
写错误,对保存环境的要求比较高。带库里面的机械手和驱动
器属于精密机械设备,经常容易发生故障,速度比较慢,恢复
时间比较长。
虚拟带库将使用磁盘做为存储介质,使用软件在逻辑上将
磁盘存储系统(包括SCSI或者光纤阵列或者SAN存储网络等)
虚拟为传统的磁带库设备,自动的在逻辑上实现机械手,驱动
器的功能,磁盘存储系统的RAID,镜像等功能可以从底层保护
备份的数据。虚拟磁带库能够和各大厂家的备份软件无缝的兼
容,实现许多高级的备份功能,最大程度上保护用户的数据。
虚拟带库的实现可以大致分为三种方式。第一,纯软件方
式,即将磁带库模拟软件直接安装在备份服务器上,把备份管
理服务器的文件系统分区模拟成磁带库,从而使备份软件以磁
带库方式使用磁盘文件系统,目前有厂家在备份软件里面集成
了类似的产品。这种方式磁盘本质上仍然在线,而且对备份主
机的负担比较大,使用的环境有局限性,优点是成本比较低。
第二种,专用服务器级虚拟磁带库方案,该方案实际上是另外
一种虚拟磁带库的软件实现方案,通过把虚拟磁带库管理软件
安装在一台独立的专用服务器内,而将该服务器及所连接的磁
盘存储设备模拟成磁带库。这种方案的特点是速度比较快,而
且数据受主机的影响小,不足是需要利用一台的服务器作为虚
拟磁带库管理器,系统优化性略低。第三,专用控制器级集成
虚拟磁带库设备方案,将磁带库模拟管理软件固化在特别设计
的硬件设备中,就形成了专用的虚拟磁带库设备,这种设备需
要配置一定数量和类型的主机接口和后端存储磁盘阵列接口。
专用的虚拟磁带库设备硬件结构与不同于服务器,设计采用了
精简的硬件模块和精简的操作系统内核(一般为Linux内核),
并且充分考虑了与主机及存储设备的连接能力。专用的虚拟磁
带库设备的出现标志着虚拟磁带库技术终于突破了操作系统和
PC服务器架构的限制,使虚拟磁带库真正成为了一种独立的外
设,其使用方式也更接近普通磁带库,而其优越性能也体现得
更加充分。
1.8.备份的数据类型
需要备份的数据主要分两类,即非结构化数据和结构化数
据。
通常把没有“数据模型”的计算机信息称为非结构化数
据,例如文字、图、音频、视频MicrosoftOffice文档,Web页
面,等。非结构化数据多存放于文件系统中,所以备份的时候
多数按照文件系统备份方式进行备份。
结构化数据,通常是数据库的数据,例如传统的关系型数
据库。结构化数据的备份根据不同的数据库特点,有各自独特
的备份方式。
2.数据备份策略设计
企业在做数据备份策略设计的时候通常考虑备份对象,备
份结构,备份方式,备份周期,备份窗口,数据保留周期,备
份介质等等方面。
2.1.备份对象的确定
备份对象,即备份哪台主机上的哪些数据,企业用户在收
集这个信息的时候需要细致,因为不同的备份对象,有不同的
备份实现方案,例如操作系统本身的备份,看似和普通文件系
统类似,但是操作系统通常不能按照普通文件系统来进行备
份,需要考虑操作系统崩溃之后如何从备份介质中恢复,如何
引导操作系统启动,同时基于windows和unix、linux操作系
统还有不同的备份和恢复方式。又例如,同样是linux文件系
统,但是挂载本地文件系统和挂载远程共享文件系统,所需要
的备份方案也不尽相同。一个大型的IT系统里自身比较复杂,
有多种类型的备份对象,也有一些大型的IT系统是有很多耦合
度较高的子系统组成,那么在考虑备份对象的时候,不可以只
考虑单一系统的某个单个类型的备份对象,要基于整个系统能
够恢复为出发点来综合考虑所有相关联的备份对象。
2.2.备份方式
备份方式,采用全备份或全备份与增量备份相结合的方
式;这是需要结合恢复来综合考虑的,因为备份的主要目的是
用来恢复,例如每天全备份,那么恢复的时候复杂程度就降低
了,直接拿匹配的备份集来恢复就可以了。但是带来的问题是
每天备份窗口时间长,需要的备份存储空间大,备份时系统性
能影响时间长。如何取舍,需要根据系统的重要程度,备份的
数据量,备份窗口,恢复的要求等等方面综合考虑。
2.3.备份计划
在备份系统中,用户必须制定备份计划来实施备份;备份
计划说明了,用户准备在何时,对哪台服务器上的哪些内容,
进行什么类型的备份。备份计划牵涉到了备份的时间,备份的
内容,备份的类型,备份的方式。一般而言,在备份系统中,
用户可以制定一个或多个备份计划的策略,从而减少制定备份
计划的工作量。
企业用户的IT环境复杂多样,不同的系统、应用对备份都
有各自的需求,所以针对不同的需要,往往需要制定不同的备
份计划。
采用全备份还是全备份与增量备份相结合的备份方式,这
是需要结合恢复来综合考虑的,因为备份的主要目的是用来恢
复,例如每天全备份,那么恢复的时候复杂程度就降低了,直
接拿匹配的备份集来恢复就可以了。但是带来的问题是每天备
份窗口时间长,需要的备份存储空间大,备份时系统性能影响
时间长。如何取舍,需要根据系统的重要程度,备份的数据
量,备份窗口,恢复的要求等等方面综合考虑。
可以参考一些备份计划设计的原则:
典型常用的备份方式
计划特点
适用范围
每天作全备份
备份产生的数据量大恢复的速度快备份数据的可靠性高,
所以可恢复性强
小数据量的,重要的数据备份(例如,小型的数据库系
统,AD等)
每周作1次合成全备份其它工作日作增量备份
比较常规的备份方式,备份的数据量少全备份的时候,不
需要从客户端读取数据;所以全备份效率高;可恢复性较差,
因为必须依赖于每周的全备份;恢复性能很慢;该数据备份必
须支持合成全备份
邮件系统的备份(Exchange,Lotus)文件系统的备份
每周作1次全备份其它工作日作增量备份
比较常规的备份方式,备份的数据量少;可恢复性较差,
因为必须依赖于每周的全备份;恢复性能很慢;
中大型数据库(全备份数据量比较多)
每天作1次全备份每隔1小时作日志备份或者是每周作1
次全备份每天作日志备份
非常特殊的备份方式;日志备份的时候对业务系统基本没
有影响;丢失的数据可能最少;恢复的速度可能最慢,因为采
用的是日志回滚的方式;
非常大型的数据库,作增量备份对应用影响太大用户要求
丢失的数据量最少
2.4.备份周期
备份周期,每隔多长时间进行一次备份;这个需要和备份
方式以及备份窗口相结合来设计。在保护客户投资期间内,一
个完整的备份周期是指包含第n-1次完全备份和第n-1次完全
备份与第n次完全备份之间的增量备份总合。如何评估备份对
象应该每隔多长时间做一次备份呢,可以参考RP0这个指标的
设定,即能够容忍最多丢失多长时间段的数据。比如企业能够
容忍丢失10个小时的数据,一次备份需要花费1个小时的时
间,那么每两个备份周期的时间间隔,应该小于9个小时。
2.5.备份窗口
备份窗口,每次数据备份何时开始,所占用的时间窗口;
业界有两种观点,一种认为备份窗口是备份所消耗的时间,另
一种认为是企业可以允许某个时间段对于某一个系统进行备
份。更多的观点更倾向于后者,请注意,备份作业会占用系统
资源的,所以需要合理规划出一个时间段来进行备份,那么这
就是备份窗口。
2.6.数据保留
数据保存周期,备份数据在多长时间内有效;这是和企业
对数据生命周期管理的约定,以及监管部门对企业数据保护的
要求。
数据备份到备份介质上的时候,会占用介质空间;如果不
制定数据保留策略的话,那么每天产生的备份数据将不停的占
用备份介质,从而将所有的备份介质空间占满。所以必须制定
一个数据保留策略,来回收过期数据所占用的介质空间,或者
将备份数据从一个备份介质上搬迁到其它介质上。
数据保留策略的几个术语:
归档数据:往往指的是这些备份介质必须被保留很长时
间,往往>=1年;同时经常是被保留在异地,例如:银行,保
险柜等。这些数据通常是以全备份的方式保留的。例如:每年
保留1个全备份,保留10年。
循环周期:指的是备份数据经过了一个循环,1个循环包
括了1个全备份和到下一个全备份间的所有其它类型的备份。
保留时间:指的是备份数据需要保留的天数。
数据保留策略关系到介质空间容量的设计,同时还应该定
义一个保护用户投资的期限,即空间容量的设计要满足一定时
期内的峰值。
数据保留设计原则:
典型常用的存储策略
策略说明和特点
适用范围
磁盘保留数据保留15天和2个周期
所有的备份数据都存放在磁盘上磁盘上的数据保留15天或
者是2个循环周期(至少2个全备份和相关备份数据)
最常用的磁盘保留策略
磁带保留数据保留15天和2个周期
所有的备份数据都存放在磁带上磁带上的数据保留15天或
者是2个循环周期(至少2个全备份和相关备份数据)
最常用的磁带保留策略
磁盘和磁带同时保留备份,而磁盘备份是为了快速恢复磁
盘上保留备份的时间短磁带上保留备份的时间长
在磁盘上保留7天1个周期的备份数据在磁带上保留30天
4个周期的数据每周将磁盘上的备份数据复制到磁带上恢复数
据的时候,通过磁盘恢复,恢复速度快;而磁带作为最后一级
保障;
最常用的磁盘,磁带同时保留策略
磁盘上保存增量备份,磁带上保留全备份数据
在磁盘上只保留增量备份数据全备份数据都备份到磁带上
磁带上保留30天4个周期
磁盘备份空间较少的情况
磁盘到磁带或者是磁带到磁带的同时双重保护策略;
在常规磁盘或磁带备份介质上保留15天2个周期的备份数
据在另外一个磁带池上创建Inline备份,保留策略为30天4
周期;此时往上一级备份的同时,也同时往该磁带上备份;
这样防止备份的时候,备份介质或设备出错;
需要归档的磁带备份常规数据保留为15天2周期,在磁盘
或磁带上归档数据为保留7年内的年全备份和保留最近1年的
月全备份
在磁盘或磁带上,设置常规保留策略,为15天2个周期在
需要归档的磁带上设置保留策略是:365天中保留月全备份
365x7中保留年全备份
需要将数据异地并且离线保存,或长期归档
2.7.备份结构
备份结构,采用LAN-Free还是LAN方式进行备份;目前企
业中的备份结构绝大部分都可以归纳为这两种,主要关注的是
备份的时候的数据流和控制流的走向,通常情况下控制流需要
通过LAN网络传输,数据流是根据备份结构设计的。充分计算
数据量的总量和备份效率,评估备份对LAN网络的压力,这里
的LAN网络通常指业务网络,当前企业中通常是以太网网络作
为业务访问网络。LAN-Free的诞生主要就是为了解放对业务网
络的压力,请注意LAN-Free设计的初衷是针对业务网络而不是
特指以太网络,这其实也是SAN网络诞生的时候被称为第二网
络的原因。基于这个观点,只要备份的数据流通过非业务网络
传输,就实现了LAN-Freeo但是业界也有很多人的观点,直接
就把LAN-Free和基于光纤通道技术的SAN网络结合在一起了。
请注意备份结构的设计,在投资允许的情况下
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手术中静脉治疗安全
- 2025-2030中国科技地产行业市场发展分析及前景趋势与投资研究报告
- 工业园区物流通道规划方案
- 2025年中国简易硬脊膜外麻醉穿刺包数据监测研究报告
- 2025年中国履动式气压油压拼板机市场调查研究报告
- 2025-2030中国汽车摩擦材料行业供需分析及发展前景研究报告
- 2025-2030中国樱桃酒行业供需趋势及投资风险研究报告
- 2025-2030中国奢华面膜行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国塑胶围栏行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国商用厨房设备和和电器行业市场发展趋势与前景展望战略研究报告
- 大学物业服务月考核评价评分表
- GB 36893-2024空气净化器能效限定值及能效等级
- 19G522-1钢筋桁架混凝土楼板图集
- RPA财务机器人开发与应用 课件 6.1 RPA网银付款机器人
- 软件开发中介服务协议范本
- 云南省昆明市2025届高三年级第二次联考+物理试卷
- 企业宣传与品牌形象设计手册
- 别墅设备维护方案
- DL∕T 1917-2018 电力用户业扩报装技术规范
- 山东省临沂市莒南县2023-2024学年七年级下学期期末数学试题
- 九宫数独200题(附答案全)
评论
0/150
提交评论