版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
企业备份系统运维管理的关键问题
对于每一个企业来讲,数据备份恢复是企业IT运维当中非
常重要的一部分。如何保障必要的数据在必要的时间完成必要模式
的备份,并且能在需要的时刻将正确的数据在正确的位置恢复,这
是数据备份恢复运维工作必然的考核指标。本文通过大量的运维实
践总结出备份系统运维工作当中遇到的一些关键问题,并且按照实
际解决方案提炼解决思路。
1.如何解决平衡数据库归档频度和数据恢复完整性
1.1数据库恢复的基本原理
对于数据库的恢复来说有很多种,我们只讨论需要介质恢复的情况。在
这种场合下,首先我们需要找到一个最近时刻点的全量备份进行恢复;然后
需要从备份介质上找到这个时刻点之后的重做日志进行数据追平,最后我
们需要找到本地没有丢失的重做日志进行再次追平直到没有可用日志。如
如图所示,在时刻A,我们开始做在线全库备份,在B时刻全库备
份结束。当数据库运行到E时刻之后数据库发生了重大介质故障,只能通
过介质恢复。那么在A~C时间段内,大部分REDO日志文件都已经归档到
备份介质池当中,服务器本地存储目录当中只剩下CE(小于一个归档备
份时间间隔)的归档日志和没有来得及归档的REDO日志文件。假设发生
的故障严重到服务器本地存储目录也无法恢复的时候,那么相当于在C-E
这段时间产生的重做日志就丢失掉了。相当在这种极端场合下,数据丢失的
最大窗口就是一个归档间隔时间段。当然如果把这个间隔设置的足够小的
话,那么另外的问题就产生了,备份作业随着系统增加会呈爆发式并发启动
状态,最终会影响到整个备份系统的健康运行导致归档无法及时转储,最终
还是可能会导致数据库的宕机。这就是一个矛盾,需要我们去很好的平衡。
1.2平衡数据库归档频率的方法
数据库归档备份的频率是指一天24小时内间隔多长时间进行一次归
档日志的备份,一方面是要保障增量数据备份的完整性,另外一方面是要避
免因为恢复空间不足导致数据库的宕机时间。要平衡这个频率窗口需要采
集以下几类数据:
1)单位时间内不同数据库系统平均的归档日志量。
采集这个数据的目的在于详细分析不同业务系统在不同时间段的写操
作频繁程度。对于日志归档速度较快的系统,我们需要提高其恢复区的空间
大小,同时加快归档备份的频率,使得数据库既能处于安全运行状态又能保
障极端故障场合下数据丢失的量在较小范围之内。
2)业务系统类型。
所谓业务系统类型即OLTP或者是OLAP,因为对于OLAP来讲,每
次的读写操作都会是批量的执行,它的归档速度是正常OLAP系统的几十
倍甚至上百倍。最麻烦的是两者皆有的业务系统,比如说银行业中的交易系
统,白天跑联机交易,晚上跑核算批量,白天和晚上的日志归档速度有着巨
大的反差。那么我们就需要在批量作业时间段内将备份频率调快,将恢复区
空间设置提高。
3)备份系统可以容忍的最大并发量。
备份系统可以容忍的最大并发Jobs,不仅仅取决于备份软件系统可
以并发调度的作业数目和备份作业服务器的数目,还要取决于备份介质池
可以容忍的资源消耗限制。及时我们可以同时调度几百个作业,但是当几十
个作业同时写入备份介质池时就会把备份介质池的计算资源或者是10资
源使用殆尽。那么最终整个备份系统的并发数取决于短板因素。
4)不同数据库系统恢复区能够支撑最小时间窗口。
这个最小时间窗口是我们用数据库的恢复区可用空间大小/单位时
间内的最大归档速度来估算出来的时间窗口。因为我们在安装数据库或者
是做变更的时候不可能按照每一个系统的特点详细计算出其日志存储空间
的大小,只能按照有限的几个规格来做初始规划。
有了以上数据之后,我们需要根据以下几个原则来详细设计我们的归
档作业频率。
首先,根据4当中采集到的数据,将时间窗口较小的几个系统进行存
储空间调整,使其日志存储空间能够满足我们期望的最小时间标准。
然后,将一天24小时定义为几个时间段,批量业务集中的时间段、
联机业务集中的时间段、特殊任务集中的时间段等。当然这个定义主要是根
据1&2中采集到的详细数据来定义的。
接着,我们需要根据1中数据估算出一个归档作业大概持续的时间长
度。为保障每一个时刻点的并发执行备份作业数目远小于3中估算出来的
数据。
最后,需要把备份作业的频度根据不同的时间段特点调整到以上条件
都满足的状态,并在此前提条件下可以为了保障极端情况下的数据完整性
而适当调快归档作业的备份频率。下图是一个根据以上采集数据进行多维
分析的实例,仅仅是一个方法示意,归档频率根据数据重要性分级、归档速
度、业务时间段分类等前提进行的粗略分析,最下面的一行数字表示每一个
时刻点并发的归档备份数目,其目标在于平衡每一个时间间隔内的平均备
份作业数。实际情况会比以下情况复杂很多,我们可以将时间间隔划分的更
小,涉及的因素更多,分析的更加细致。
图2数据库归档频率规划分析案例
2.如何评估数据库全量备份的策略
数据库的全量备份来讲,随着数据量的不断增加,其冬份作业耗费的时
间也就会越长,耗费的数据库资源也越多,对在线业务的影响也就越大。另
外同一个时间段内发起的全量备份越多,那么其占用的备份系统整体资源
(备份服务器、备份介质池、链路带宽等)也就会越多,其影响范围也会越
广。
首先,这个问题是一个需要不断优化的问题。对于每一个应用系统来讲,
根据业务服务的特点,其备份的时间窗口也是不同的。可能初期备份作业能
够在备份窗口内完成,但是随着数据量的增长,后期的备份作业就会超过备
份时间窗口。所以我们需要定期监控数据库的全量备份作业时间,在事件窗
口范围内尽量通过调整合适的调度时间来完成全量备份。但是当数据量增
长到完全没办法在备份窗口完成的时候,那么我们就需要进行调整全量备
份的频度和具体调度时间点了。
其次,这个问题是一个跟业务特点密切相关的的问题。有些人喜欢把所
有的业务系统都按照一个标准去定义其数据库全量备份的策略。比如说TB
以下的数据库,每天一次全量备份;比如说业务等级属于重要的系统,每天
一次全量备份;比如说只要能备份的系统,全部进行每天一次的全量备份等
等策略。这些都是不科学的策略。应该从业务系统的数据重要性去评估数据
库全量备分的频率,在现有备份系统有限的处理能力内保障数据重要性高
的系统完成相应的全量备份。
最后,这个问题是一个需要从各个方面着手去解决的问题。从备份网络
的带宽和隔离性考虑,应该用单独的告诉备份网络,备份客户端应该设置区
分于业务的单独网络通道及配置。从备份作业服务器的配置层面,我们应该
配置相对合理的资源(内存、磁盘)来保障备份片在作业服务器层没有瓶颈。
从备份介质池层面,我们需要保障备份介质的10处理能力不能成为备份
作业底端的性能瓶颈。
3.如何解决备份作业分布合理性问题
其实这个问题很简单,目的就是要保障备份时间窗口内调度起来以及
运行过程中的备份作业处于一种平衡状态,不能使其作业调用或者是并发
运行过于集中。但是当系统数目非常多,系统特点复杂,数据重要性级别有
很多种,数据量以及数据增速各不相同时,这个问题就变得比较复杂。我们
很难有一种精确的计算方法来实现其做到绝对,但是我们可以根据以下的
方法进行定性的分析和调整。
假设我们定义一个系统的备份作业在备份体系当中必须具备的属性为:
P1-应用系统数据的重要性级别属性,可以通过业务分析划分为有限
的几个级别。
P2-应用系统在不同时间段内的数据增量属性,需要通过梳理历史数
据来评估。
P3-应用系统当前的备份作业的时间长度属性,需要通过历史数据结
合数据量来评估。
P4-应用系统是否是具备双重业务特性,比如兼备批量和联机业务特
性。
通过以上几个属性的加权计算或者其他方法的定性分析,计算出每一
个系统的不同备份作业的定性矢量,然后我们可以将这些矢量根据其具体
备份窗口设置初始的调度时间点,然后分析其具体分布图是否均衡稳定并
且进行微调。例如下图是一个粗略的分析实例,可以提供相关的参考思路:
ZAfiJlZM0
5翕--二-
ASI二I三三1-8-2§
<11■,37♦、••-■-二um
<G)tt二二三-•--林,林W*.
IL1
VmoSHBDDDDDOI1111II
10Iaoo
y62000
•31
741930
$8■■2145
331奇8
1S640S0
JS1110
144iyo
141■onn■1VO
4」210
SJ4SO
一510
1110■■■■■0X)
•“04□QB■22SO
•17a-2230
)471720
•16.4八g
»»“40
.14?!1!300
•34511188
r,■
£_!011,10
24111300
1311■3IS
UH:■J>0
&2021SO
241•14IS
£so218
1181,,000
21•218
优化目标。0223333J22222222322222122232222123333:232211111
图3备份作业分布定性分析案例
以上案例仅仅是一个相对粗略的分析方式,仅仅是一个基于某一特定
案例的分析思路。我们可以根据业务系统特点结合更好的专业工具进行更
加细节的分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度工业废弃物处理职业健康与环保防护协议3篇
- 2024年船舶改装设计及建造合同3篇
- 保安监控系统招投标文件目录
- 糖果店店员岗位协议
- 隧道工程机械租赁合同
- 医疗紧急事件应对策略
- 2025年度KTV联盟商家品牌合作推广与权益交换协议3篇
- 医疗器械招投标文件封条格式
- 航空航天场地暖施工合同模板
- 2024年防腐刷漆项目承包合同3篇
- 录音艺术教学大纲
- 1000MW汽轮机控制保护系统(介绍)
- 大功率用电器检查表
- 德育导师工作手册完整版
- 初中化学教学中的教学瓶颈及解决策略探讨
- 单层钢结构厂房施工方案(完整版)
- 球墨铸铁管安装施工技术交底
- 中药制剂的新技术与新工艺PPT课件
- 幸福之家暖意浓,凝心聚力建工程——幸福之家经验材料
- 看图写话植树教案
- 投入产出表42部门指标
评论
0/150
提交评论