版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据容灾架构中的数据复制技术随着全球IT产业的飞速发展,金融行业的IT建设逐步成为主导金融企业业务发展的核心驱 动力,基于金融行业IT系统容灾建设的各种行业标准以及监管标准也相应提高。而决定容 灾架构健壮与否的最关键因素就是数据复制技术,它是实现高标准RTO和RPO的前提条 件。本文基于业界主流数据复制技术的原理、复杂度、关键因素以及复制效果等多个维度进 行分析及论述,旨在为同业在此类项目规划和建设过程中提供一些启示和帮助。.背景及综述在金融行业内,众所周知其对业务连续性的要求以及对各种IT风险的应对能力的要 求都是非常高,尤其是对容灾能力的要求,这是由它的业务特殊性以及集中式架构 所决定的。
2、在金融企业容灾架构中,所谓的数据复制技术主要是指能够将结构化数据进行复制, 从而保证数据具备双副本或者多副本的技术。目前业界发展来看,可以实现数据复制的技术多种多样,有基于数据库层面的数据 复制技术,例如Oracle公司的Active Data Gurad、IBM公司的db2 HADR等;有 基于系统层面的数据复制技术,例如赛门铁克的vxvm、传统的逻辑卷管理(LVM)、 Oracle公司的自动存储管理(ASM)冗余技术、旧M公司的GPFS等;有基于存储 虚拟化实现的数据复制技术,例如EMC公司Vplex Stretch Cluster、IBM公司SVC Split Cluster、NetAP
3、P公司Metro Cluster等;也有基于存储底层实现的数据复制 技术,例如IBM公司的DS8000 PPRC技术、EMC公司的SRDF技术、HP公司 的CA技术等等。每一种技术都有其实现的前提条件,也有各自的技术特点和实现的不同效果。本文 将从复制技术的原理、特点、复杂程度以及复制效果等多方面展开分析及论述,并 从多个维度进行对比分析,将业界主流数据复制技术的发展现状以及技术优劣给予 一个清晰的展示,并就数据复制技术发展的未来以及趋势予以展望。.数据复制技术价值分析数据复制在容灾中的必要性一、RPO保障如果没有数据复制技术,那么容灾也就无从谈起。当面临站点及故障时,由于没有 数据复制技术的
4、支撑,我们的数据无法在其他站点再现,这将意味着RPO将无法 保障。对于一个金融企业来讲,最重要的就是客户的数据,它是企业的生命。从这 个意义上来讲,金融企业不能没有容灾体系,容灾体系的前提条件是能够实现数据 复制。那么数据复制的效率如何,复制的效果如何,复制技术的先进与否也就决定 了金融企业生命线的稳固与否。二、RTO保障所谓RTO就是在容灾系统在面临站点级故障时,多长时间能够恢复业务。假设站点 故障恢复的时间不可容忍或者根本没有可能,那么业务必须能够切到另外一个数据 中心,从数据、应用以及网络层都需要具备这个切换能力。但是最终的目的就是要 保障业务能正常恢复,而业务恢复的前提条件就是数据,没
5、有数据的应用切换和网 络切换没有任何意义。也就是说数据恢复是应用切换以及网络切换的前提条件,从 这个意义上讲,数据复制效率和效果直接决定了一些列切换,也就是它使得RTO成 为可能。评价数据复制技术的维度分析对于数据复制来讲,我们可以从多个层面、多种技术去实现。各有各的特点,那么 究竟哪一种数据复制技术更适合我们?活着说哪一种复制技术更科学合理?这需要 一系列从不同纬度进行的科学评估。本文认为应该从以下几个方面来展开分析,并 结合我们自己的需求来选择合理的数据复制方案。一、投资成本分析建设任何一个项目,投资成本的分析都是必不可少的分析维度。对数据复制技术的 投资成本分析来讲,我们需要从它的首次建
6、设成本、持续维护成本以及容灾管理成 本等多方面去考虑。二、技术成熟度及健壮性分析对于数据复制技术的成熟度和健壮性分析来讲,一方面我们要从技术本身的原理上 来分析,另外我们还需要从技术的发展以及应用范围以及应用的持久稳定性等方面 来考虑。三、风险评估分析数据复制技术本身来讲是要帮助我们解决站点级故障带给我们的IT风险,但是对于 技术应用本身来讲,它也会存在一些技术风险。比如说特殊场合下的一些技术风险、 容灾管理过程中的一些风险、极端场合下的一些技术风险等等。四、功能拓展性分析对于数据复制技术本身来讲,其主要功能就是完成数据的复制。但是在完成数据复 制的同时,由于其架构的特点以及技术特点等因素有可
7、能对于我们的应用产生积极 的拓展性作用,也有可能限制了我们的应用架构模式,还有可能对我们的基础架构 扩展性以及灵活性造成一定的限制。.数据复制技术原理分析基于应用事务日志回放技术图3.1是Oracle数据库层面的数据复制技术(ADG)的架构原理图。对于该架构原理图,本文从其实现的基本条件、数据复制原理、数据复制的模式以 及数据复制的关键因素等几个方面来进行深度剖析。图 3.1-1 Oracle Active Data Guard前提条件容灾站点之间需要有三层以太网连通,软件层面需要数据库的集群软件模块(Oracle Active Data Gurard)或者是db2 purscalehadr。
8、服务器层面需要至少两套服务器系 统分别部署于两个数据中心。存储层面需要两套存储空间分别部署于两个站点作为 主库存储和备库存储,他们互相之间独立。复制原理对于主站点的数据库来讲,客户端的数据更新请求首先要由日志写入进程写到重做 日志当中,然后由数据写进程再周期性地写入数据文件当中。重做日志当中以SCN 为数据库独有的时间搓序列来记录所有数据库更新的先后顺序,从而保障数据库恢 复能够按照正确的顺序执行保障数据一致性和完整性。那么对于配置了 Active Data Guard的数据库读写的完成在以上所述过程中,日志写进程在本地日志文件写入过 程的同时,日志传输进程会将缓存里面的重做日志通过ADG传输
9、给灾备站点的备 库实例,备库实例的日志接收进程根据接受到的重做日志在备库上重新执行数据库 的更新操作,从而保证主库和备库的事务性更新行为一致性,最终保证数据的一致。 当然也有一个前提条件,那就是在ADG作用之前,必须保证备库的数据保持与主 库的某一固定时间点的完整副本,这需要靠传统数据备份技术来实现备库的初始数 据复制。因为事务复制的本质是行为复制,那么行为作用的初始数据副本必须保持 一致,才能保证最终两副本的一致性。对于事务日志的复制技术,本文根据主库IO周期特点可以分为绝对同步模式、近似 同步模式和异步模式三种。绝对同步模式是指主库的一个完整更新事务的结束既要 包括主库的重做日志落盘也要包
10、括备库的重做日志落盘,也就是说备库重做日志落 盘之后返回给主库,主库才能执行下一个事务。近似同步模式是指在传输正常情况 下保持与绝对同步模式一样的模式,在网络传输超时的情况下,就会剥离备库重做 日志的过程,只要保证主库重做日志落盘就可以了。异步模式是指主库只保证本地 重做日志落盘,并不会等待备库重做日志落盘的返回信号。在后两种模式下,当主 备库传输管理剥离之后,主库会主动通过以下两种方式探测并尝试重新和备库建立 联系,第一是归档日志进程会周期性ping备库,成功情况下,它会根据获得的备库 控制文件的记录的最后归档点和自己的归档日志决定向备库推送哪些归档日志。第 二是日志发送进程会在重做日志准备
11、发生归档的时刻点主动去ping备库日志接受 进程并把剩余的重做条目发送给备库接受进程。关键因素基于事务日志回放技术的数据复制架构,从技术规划上以及运维管理层面上有几个 关键因素需要把握才能将这种数据复制技术运用自如,才能帮我们真正实现高标准 的容灾体系建设。一、重做日志管理策略设计我们知道对于数据库来讲,我们是靠其在线重做日志和离线重做日志来进行数据恢 复的。对于离线重做日志也就是归档日志,我们是需要周期性备份并删除的,否则 离线重做日志就会无限占用数据库有限的存储资源。那么对于事务日志型数据复制 架构来讲,无论是主库还是备库,都需要有合理的日志管理策略来配合才能正常运 行。策略的规划和设计需
12、要把握以下几个原则:.完成应用的日志要及时转储,包括主库传输完毕的归档日志和备库应用完毕的归 档日志。.没有完成应用的日志必须能够保留,主库没有传输到备库的归档日志如果被提前 转储会造成备库数据丢失,备库没有被应用的日志如果转储,备库同样会丢失数据。.存储资源的科学规划,如果主备库暂时中断,又因为原则2导致归档日志堆积, 那么势必造成存储资源的需求超过正常时刻的存储需求量,如果存储资源不够,又 会造成数据库发生宕机事故。以上各个原则的科学设计既需要依赖于数据库参数的合理设置,又需要依赖于备份 工具的转储策略合理配合,同时更需要根据不同的业务系统以及负载特点,通过历 史数据评估以及仿真测试数据来
13、设计合理的数值并进行动态评估和优化。二、架构扩展性及灵活性在今天的互联网线上时代,系统架构的扩展性和灵活性显得尤为重要。对于容灾架 构来讲,它的扩展性和灵活性同样非常重要。对于业务型的数据复制架构来讲,它 有两种基本架构:级联架构和串联架构。级联架构是指一点为主多点为备,串联架 构是指主备模式依次类推。级联架构更有利于主库的多点保障,串联架构更有利于 主库的性能保障。具体采用什么样的架构组合,是要根据主库数据的具体业务需求 进行合理评估和设计。三、容灾切换管理主备库的切换,包括两种类型的切换:Fail Over & Switch Over。Fail Over是指故障情况下的强制切换,Switc
14、h Over是指计划性的切换。无论是哪 种切换首先是要保障备库数据和主库数据一致或者可容忍范围内的近似一致。其次 当数据发生切换时,实际上主库的服务IP地址就会转化成备库的服务地址,无论是 通过域名转换还是通过应用重连的方式都需要保障上层的服务地址能够无缝切换。 最后切换之后,原来的主库如果没有时间戳恢复功能的话,那么原主库里面的数据 就会变成无效数据,需要重新初始化数据副本。但是如果保持时间戳恢复功能的化, 就会巨大的存储空间消耗。基于系统级逻辑卷镜像技术下面三张图都是基于系统级逻辑卷镜像技术实现的数据双重复制。图3.2-1是基于 ORACLE自动存储卷管理技术实现的ASM磁盘卷镜像复制技术
15、;图3.2-2是基于 UNIX存储卷管理(LVM)实现的逻辑卷镜像技术;图3.2-3是基于旧M GPFS分 布式文件系统底层逻辑磁盘镜像实现的数据复制。三种技术虽然依赖的具体技术不 同,但是其底层原理都是基于系统层面的双写实现的数据复制。图3.2-1 ORACLE ASM复制镜像架构图3.2-3分布式文件系统GPFS镜像复制架构前提条件容灾站点之间需要SAN环境联通。软件层面,架构一需要具备ORACLE集群软件 当中的自动存储卷管理模块,架构二需要借助UNIX操作系统层的逻辑卷管理器, 架构三需要借助GPFS或者类似的分布式文件系统软件。存储层面需要两套存储空 间分别部署于两个站点作为主库存储
16、和备库存储,他们互相之间独立。复制原理对于ASM和LVM模式来讲,都是将底层来自不同站点的两个物理存储卷作为镜像 对组合成一个可用的逻辑存储卷提供给上层应用来存放数据,本地物理卷和远程物 理卷分别是由存储经过本地SAN环境以及跨数据中心SAN环境提供给服务器操作 系统层。LVM是对操作系统的PP写入进行实时双向复制,而ASM是对Oracle数 据文件AU写入进行实时双向复制。本地写完并且远端写完才能算是一个完整的写 入,假设远端存储卷写入超时就会被标为故障或者是离线状态,当远端存储写入恢 复之后,对于LVM来讲需要重新进行手动同步实现镜像副本完全一致。而对于ASM 来讲,会有一个短时间内的日志
17、记录会帮助恢复离线镜像恢复数据,但是如果超过 这个时间,同样需要一个全新的同步来保证数据的一致性。二者的区别在于LVM的 逻辑卷与物理卷的映射关系在创建逻辑卷的时候就已经定义好了,所以对于坏块儿 问题,LVM无法完成块儿指针的动态转移。而ASM是在数据写入时才会分配具体 的AU,完全可以做到通过指针转移的方式避免坏块儿导致的数据写入失败问题。对于GPFS模式来讲,它是通过将底层来自不同站点的两个物理存储卷归属到不同 的Failure Group当中,然后由这些物理存储卷经过文件系统格式化形成分布式文 件系统,提供给上层应用以文件的形式写入数据。文件本身会被GPFS文件系统打 散形成若干文件碎片
18、,这些碎片在落盘时分别落入不同Failure Group当中的物理 磁盘,从而保证底层数据的双副本。这种模式与前两种模式的最大区别在于它的数 据落盘是根据NSD磁盘定义的服务实例顺序来决定的,正常情况下我们需要定义本 站点的服务节点为磁盘的主服务节点,这样的话两个镜像写入的时候是靠GPFS位 于不同中心的两个服务实例节点分别写入,两个服务实例之间也需要私有协议的交 互,相当于数据的双写多了一个环节。关键因素基于系统级逻辑卷镜像技术实现的数据复制,相对于其他类型的数据复制技术来讲 风险性较高,主要表现为以下几个方面:一、性能方面的问题对于LVM和GPFS方式来讲,对于数据库的结构化数据复制性能会
19、有较大损耗。 因为数据库的读写需要经过数据库本身的存储映射以及操作系统层的存储映射之后 才能真正写入存储缓存。纵向的路劲很长,性能损耗会比较大。而ASM本身是将 数据库的映射和系统级的映射做到了一起,相对性能损耗会低很多。所以如果利用 这类型数据复制技术的话,数据库层的存储块儿参数和操作系统层的存储块儿参数 设置要经过一系列优化。二、容错性问题如果我们用做本地存储高可用实现这种方式的镜像,那么容错性就不会有问题。因 为两个镜像副本的链路指标可以认为是同质的,镜像之前的IO读写不会有差异。但 是如果用在容灾场合下,由于两个镜像副本的链路指标完全不同,那么就要求系统 层能对正常场合下、故障场合下以
20、及故障恢复后场合下的读写差异有很好的容错性。 比如说故障场合下的IO超时反馈速度、故障恢复之后的数据再同步问题。再有就是 关于应用数据的容错性,对于纯粹操作系统层面的复制,完全无法避免应用逻辑错 误。三、负担过载问题其实这种技术在设计之初并没有过多考虑过其在容灾中的数据复制问题,设计初衷 还是系统层的存储卷的虚拟化管理。所以其灵活性以及扩展性优于其在容灾数据复 制中的作用。如果非要把这类技术应用到容灾场合的数据复制当中,那么操作系统 层一方面要完成应用功能载体作用,另外一方面要完成本地存储卷虚拟化作用,还 要一个重量级的容灾数据复制作用。这种负担会直接影响到其承载的数据库应用。基于存储网关双写
21、复制技术所谓存储网关双写复制技术,就是在物理存储层之上增加一层网关技术用以实现存 储底层的虚拟化以及高可用镜像,并且由存储网关来控制镜像写入的策略和模式。IBM EMC、NETAPP等公司都有相应技术的产品方案。基于写入原理及策略的不同,又各有区别。图3.3-1、图3.3-2、图3.3-3分别是旧M SVC Split Cluster、EMCVplex Stretch Cluster、Netapp Metro Cluster。下面我们就其图示、从原理上分别Mn;ttir进行分析和论述。图 3.3-1 IBM SVC Split ClusterSVC ClLtJerTCPy-P足月同亚10 GR
22、0UP1SVC-C1图 3.3-2 EMC Vplex Stretch ClusterrCP/111 :G 8( ? rj 怜检叼A钱壬越物用ma图 3.3-3 NetaApp Metro Cluster前提条件容灾站点之间需要SAN环境联通,TCP/IP实现三层可达。两个站点分别要部署各 自的存储集群节点,共同组成存储网关集群。假设要实现双中心的自动化仲裁及切 换,那么第三个仲裁站点以及站点中承载仲裁软件的计算及存储载体也是必须的。复制原理对于Vplex Stretch Cluster来讲,首先两个存储网关节点是一对类似ORACLE RAC 模式的AA模式集群节点。如图3.3.2-2所示,两
23、个节点都可以接受来自上层应用的 读写请求。假设来A和B分别是来自底层存储的两个物理卷,那么经过Vplex集群 化之后,这两个物理卷被虚拟化集成为一个分布式共享卷C,对于C来讲,两边的 应用节点都可以看得到,都可以读写,它的底层又是有A和B两个物理镜像组成。 两个站点在写请求到来时,首先要完成本地A或B的写入,然后需要把写入请求传 送给另外一个VPLEX节点来完成镜像盘B或A的写入。很显然,两边同时写入就 有可能带来同一个数据块儿的访问竞争,这个时候Vplex节点靠他们共同维护的分 布式一致性缓存目录来对竞争数据块儿进行加锁以及释放等协同操作,最终完成对 数据块儿的最后更新。当发生链路故障而导致
24、一边节点无法写入时,那么节点会保 存相应存储日志用以故障恢复之后的数据同步。我们可以理解该同步模式类似于 Oracle的最大可用模式,正常情况下保证镜像数据写入的同步完成,当故障时刻会 有timeout时间阈值来决定是否暂时切断其中一个镜像的写。对于旧M SVC和NETAPP MCC架构来讲,它们同样在存储网关节点上实现对底 层两个物理卷的镜像绑定,但是这个卷并不是一个分布式共享卷的模式,仅仅是一 个实现了镜像绑定的虚拟卷,对于卷的读写只能以其中一侧节点为主,另外一侧节 点为备。节点发生故障场合下实现节点主备切换,它比传统HA模式的切换先进在 哪里呢?它的备节点是要从主节点上同步缓存的,所以一
25、旦切换发生,时间仅仅耗 费在虚拟卷的Ownership转换上,缓存不需要重新读入,从切换的时间上来讲要比 传统HA快很多,从而保障了容灾的RTO。那么MCC和SVC的区别在于什么地方呢?对于SVC的Split Cluster的两个节点 来讲,它们是两个控制器节点组成的一个IO组,这个IO组意味着故障切换只能发 生在这两个控制器节点之间,而且对于一个物理卷来讲只能归属于一个IO组,当这 个IO组不可用时,那么这个卷也就无法读写了。对于MCC来讲,承载虚拟卷读写 的载体是SVM虚拟机,这个虚拟机是一个资源的组合体,可以动态组合网络、存 储以及存储操作系统等资源,所以它能在组成集群的四个控制器节点上
26、进行动态切 换,理论上可以切换到任何一个控制器节点上,只不过其切换本身有一个故障优先 级控制其切换的顺序。如图,SVM可以首先切换到A2节点上,当A2节点也发生 故障时,可以切换到B1节点上,当B1节点也发生故障时可以切换到B2节点上。关键因素基于存储网关双写技术实现的容灾数据复制,可以将数据容灾管理功能从应用及系 统层剥离,从而对上层影响相对很小,而且容灾针对性设计保障其功能实现上会更 优。但是其实施的复杂度相对较高,而且对于以上不同架构来讲,其所承担的风险 也是不一样的,所以在这类技术的应用上,我们需要特别关注以下几个方面: 一、架构复杂性无论是以上哪种存储网关复制技术,那么从硬件条件上来
27、讲,存储这一层需要通过 硬件节点组成一层统一存储集群。要想实现自动切换的话,那需要仲裁站点的参与。 也就是说从存储这一层来讲,其实两个站点就是一个系统的整体了,底层的复杂性 就很高了。如果数据库层、网络层以及应用层的架构再稍微复杂一些的话,那么整 个容灾架构的复杂度就会直线上升。二、架构扩展性问题在这种容灾架构下,其实存储层不仅仅是作了一层虚拟化和集群化,更重要的是作 了一层存储的集中化,存储网关成为存储的统一出口。那么存储网关集群的横向拉 伸能力制约了整个存储系统的可扩展能力。当我们的业务出现快速膨胀的场合下, 存储网关集群的最大扩展能力以及其本身的纵向性能扩展性就会是一个关键性问题, 我们
28、必须考虑。基于存储底层块儿复制技术基于物理存储层之间的软件复制技术是相对比较传统的存储复制技术,应用的时间 也比较长。几乎每一个存储厂商都会有针对性的解决方案。图3.4-1是基于存储软 件复制技术的基本原理图。图3.4-1存储层软件复制前提条件对于物理存储底层的块儿复制技术来讲,对于环境要求主要是存储层的要求。容灾 站点之间需要SAN环境联通,两边的存储一般要求型号一致并且配置有专门的存储 复制软件以及相关许可。复制原理其实对于存储存储底层的块儿复制技术来讲,它跟上层的应用层关系不大,主要是 依靠存储层两个节点来完成源到目标的复制。当上层应用将数据写入存储的时候, 那么由存储将这一 IO请求再
29、以块儿的方式传输到另外一个存储上,从而保证存储设 备在块儿级别上的一致性副本。对于同步复制来讲,需要应用端的IO请求等到存储 层的复制完毕之后才会正常返回,对于异步复制来讲,应用IO请求跟底层复制没有 任何关系,不需要等待复制结果。对于这种复制技术来讲,两个数据副本仅仅是数 据内容相同,在上层没有任何逻辑捆绑或者是虚拟化,所以上层应用也是完全隔离 的两套应用,一旦存储发生故障,无论上层应用节点及网络节点是否可用都需要发 生站点级切换实现业务连续性,存储本身不能隔离开应用发生切换。关键因素对于物理存储层面的块儿复制技术,它剥离了对上层应用的依赖,直接靠存储来完 成数据复制。好的地方在于它的架构相
30、对简单、相关影响面较小,不好的地方在于 它的功能狭窄,功能仅仅在于数据的拷贝,对于上层应用的支撑面儿很窄。所以对 于这种复制技术的把握需要注意以下几个点:一、容灾的切换管理对于容灾的切换管理,我们需要决定好几个问题:.切换的决策问题。如果故障集中在存储层面,而其他层面不受任何影响的场合下, 那么是不是一定要执行容灾切换?这需要一个完善的决策体系来支撑各种场合下的 故障应对。.切换的流程以及技术管理体系建设。由于这种数据复制技术对上层依赖的耦合性 非常低,那么单纯的存储切换无法实现,这就需要从上到下的一系列技术措施和管 理流程来应对容灾切换。.回切的流程及技术管理体系建设。同样当故障恢复之后,我
31、们需要回切的时候, 这个过程虽然是个计划内的事件,但是可能相对比容灾切换更要复杂、更需要关注。 二、技术兼容性基于存储底层的块儿复制技术,其中最重要的软件依赖就是存储复制软件,但是这 个存储复制软件一般都是基于特定的存储设备实现的,具有厂家或者设备壁垒。当 我们的存储呈现五花八样的时候,那么这个核心的复制软件可能也会呈现五花八门。 对于存储的升级换代或者更换品牌等事件更是有诸多限制。所以我们在应用此类技 术的时候要充分考虑到这一点。.数据复制技术对比分析关键维度的对比分析投资成本对比分析对于投资成本的分析,我们不仅仅要看建设成本更需要关注运维成本,不仅仅需要 关注设备成本更需要关注管理成本。本
32、文首先将成本划分为几个部分,然后根据每 一个部分成本按照定性分为高中低三个指标,最终得出的综合分析如表4.1.1所示: 表4.1.1-1成本分析表建设成本项目9石网箔成本血邮款件成本运维官理容灾管理国跄管理A低低低清中低B.1中花布 京1中中B2中低低窗高尚C.1询商低中低高C2中鬲低中任中D中中商但茴中A=基于数堀库关误日志回故技术.日1 =基于至婉靖痛号镜像技术(数摇库管理存储卷彘像) B.2 =基子素统般夏堂卷镜像技术(素辅层管理存情卷舞像. c.i -基于仃储用装双号复制技法T.热怒.模式).C 2 =基于存储限关双写弃制技嗑:SVCSMCC 的).D二基子存懂底层块儿要制技术.A=基
33、于数据库事务日志回放技术。=基于系统级逻辑卷镜像技术(数据库管理存储卷镜像)。=基于系统级逻辑卷镜像技术(系统层管理存储卷镜像)。C.1 =基于存储网关双写复制技术(Vplex模式)。C.2 =基于存储网关双写复制技术(SVC&MCC模式)。D =基于存储底层块儿复制技术。对于以上成本分析,有几个需要说明的地方。对于网络成本,以太网三层可达我们认为成本属于低指标,对于二层可达或者是需 要FC协议环境的我们认为成本属于中指标,对于二层可达或者是FC环境的,而 且对带宽要求非常苛刻的我们认为是高;对于设备成本,对于存储兼容性没有任何 要求的而且不需要购置硬件设备的,我们认为属于低指标。对存储设备型
34、号有关联 性要求的我们认为属于中指标,对需要购置网关设备的我们认为是高指标;对于软 件成本,如果有在数据库层、系统层以及存储层没有任何附带软件许可的我们认为 属于低指标,如果既有附带软件模块儿而且还有容量许可等我们认为属于高指标; 对于运维管理,不需要数据库层面做特殊运维的我们认为属于低指标,需要数据库 维护的属于中指标,需要存储高度支持而且需要数据库应用等熟练实施整套切换的 属于高指标;对于容灾管理来讲,可以实现自动化切换或半自动切换的我们认为低 指标,需要人工切换的我们认为是中指标;需要组成专门的容灾决策管理体系并实 施专家级切换的我们认为是高指标;对于风险管理成本完全取决于架构本身的风险
35、 程度高低。技术健壮性对比分析单就数据库层面的数据来讲,从复制有效性上来讲基于事务日志回放技术可以有效 避开底层物理存储卷的物理视图,就数据库逻辑层面组成很好的逻辑视图,数据的 复制可以很好避开底层发生的逻辑块儿错误等问题。而其他任何一项技术都无法避 免存储块儿逻辑错误问题,因为它们在复制数据的过程中跟上层应用没有任何校验 过程,那么当存储块儿上发生的配置性逻辑错误就会导致上层应用数据出现校验错 误。从技术的专有属性上来讲,基于系统级逻辑卷镜像技术的初衷在于数据的本地保护, 并不是基于容灾需求所生的技术,所以在跨地域链路的容错技术上要弱于其他的专 用容灾数据复制技术。从数据传输的复杂性上来讲,
36、除了上述C.1属于双向同步技术,其他技术全部属于 单向同步技术,双向同步技术的稳定性和技术可靠性相对会低于单向同步技术。技术风险对比分析一、应用数据有效性风险 举一个极端的案例,假设一个系统层面的误操作把数据库卷的元数据清除掉了,那 么主库在下次要访问到这个卷上数据的时候可能就要发生宕机。这个时候如果我们 是基于事务回放技术做的数据复制,那么这部分误操作就不会被复制到备库,备库 数据依然可用。但是如果从操作系统层或者是存储层做的数据复制,它是无法感知 这一误操作的无效性,所以逻辑错误依然会被复制到灾备中心,那么最终的结果就 是两个数据中心的数据库都无法工作。二、远程链路抖动风险容灾必然会涉及到
37、远程链路,那么远程链路相对于本地链路来讲,抖动问题就是一 个很难解决掉的问题。既然不能解决这个问题,那么就应该看到一旦这个问题发生 了,带给我们的风险是什么:首先我们来看事务日志回放技术,假设我们使用的是近似同步模式,那么链路一旦 发生抖动,直接影响就是日志同步会随着发生不间断超时,主库缓存里的日志条目 无法及时同步到备库。当链路恢复稳定之后,归档日志和在线日志分别发起同步请 求将主备库数据追为同步,这期间主库不受任何影响。接着我们来看系统级镜像技术,远程链路抖动导致远程镜像写入失败,当然这个失 败会有一个从底层存储、光纤链路以及操作系统等多层的超时的传递效应,每一层 都会有自己的超时策略,反
38、应到数据库层之后,这就是一个不小的应用等待。当链 路恢复稳定之后,会有一系列的镜像同步过程,这个镜像同步过程需要对主镜像进 行扫描分析,会有很高的性能消耗。然后我们再来看存储网关双写技术,链路抖动一旦超过仲裁阀值就会引起存储网关 集群的仲裁,这个仲裁结果不确定,有可能会发生切换而且会频繁切换,一旦发生 切换不仅仅要面对两边数据主备同步模式频繁变化,而且还会面对上层应用在面临 链路抖动情况下的跨数据中心的频繁访问,相当于将不稳定问题又向上转嫁了一层。 这样的复杂问题组合到一起,风险性相对较高。最后我们再看物理存储层的块儿复制技术,其实他和事务日志回放技术面临的风险 几乎相当,影响的仅仅是远程数据
39、副本的继续同步,本地存储写入不受任何影响。 链路稳定后,同样面临存储层底层数据追平问题,当然这个策略和模式根据不同厂 商的设计原理会有优劣之分,这里就不再详细讨论。三、容灾切换技术复杂度风险探讨这个问题的前提条件是抛开一切其他类似链路抖动之类问题,仅仅探讨当发生 站点级故障并且短时间无法恢复故障时刻,不同数据复制技术带给我们整个容灾切 换的复杂度。基于存储网关双写技术基本上会有一套完善的存储层切换机制,依靠 仲裁站点能够实现自动化切换,只要双中心之间的SAN环境相通,数据库应用层自 然也是无缝切换。基于应用事务日志回放技术就完全要靠人工来实现数据库的切换 以及应用访问的切换了,需要依靠数据库专家来判断主备库状态以及具体的切换策 略。这个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 双11活动策划方案图片内容
- 昆虫记读后感600字范文初中(30篇)
- 生产实习报告范文6篇
- 水库抗旱方案
- 勤工俭学工作总结
- 《设计中的人机关系》说课稿(附教学设计)
- 天津市2024-2025学年高二上学期11月期中物理试题(无答案)
- 山东省枣庄市峄城区2024-2025学年五年级上学期期中道德与法治试题
- 河南省通许县+2024-2025学年七年级上学期期中考试道德与法治试卷
- 2024-2025学年西藏日喀则市昂仁县八年级(上)期中生物试卷 (含解析)
- 2024-2025学年上海市普陀区八年级(上)期中数学试卷
- 假期补课协议书
- 电子商务支付结算系统开发合同
- 服务质量、保证措施
- (必练)广东省军队文职(经济学)近年考试真题试题库(含答案)
- 含羞草天气课件
- 基于数据挖掘的高职学情分析与课堂教学质量提升研究
- 2024人教版道法七年级上册第二单元:成长的时空大单元整体教学设计
- 2024年专技人员公需科目考试答
- 中国软件行业基准数据报告(SSM-BK-202409)
- 十八项医疗核心制度解读
评论
0/150
提交评论