OracleDataGuard容灾方案_第1页
OracleDataGuard容灾方案_第2页
OracleDataGuard容灾方案_第3页
OracleDataGuard容灾方案_第4页
OracleDataGuard容灾方案_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Oracle数据库异地容灾方案介绍1太极计算机股份有限公司Sfl I Ml t < "l'i-n < ! Kf 1 L; 1: fX r | ITI f |'i2008年11月目录第一章 需求分析 41.1 序言 41.2 用户现状 41.2.1 系统平台 41.2.2 数据库平台 61.3 用户需求 71.3.1 日常功能 71.3.2 故障切换 71.3.3 基本要求 71.3.4 性能要求 81.3.5 数据一致性 91.3.6 系统兼容性 91.3.7 高可用性 101.3.8 健壮性要求 101.3.9 设备无关性 101.3.10 管理监控功能

2、 11第二章 Oracle Data Guard介绍 122.1 Data Guard实现原理 122.2 Oracle Data Guard 优势 152.3 Data Guard提供的保护模式 162.4 Data Guard实现方式以及对系统的限制要求 172.5 切换方式 17第三章 系统建议方案 193.1 Data Guard 优势193.2 Data Guard运行模式 193.3 Data Guard保护模式203.4 Data Guard初始安装步骤 203.5 用户需求点对点应答 213.5.1 日常功能 213.5.2 故障切换 223.5.3 基本要求 233.5.4

3、性能要求 233.5.5 数据一致性 253.5.6 系统兼容性 263.5.7 高可用性 263.5.8 健壮性要求 273.5.9 设备无关性 273.5.10 管理监控功能 28第一章 需求分析1.1 序言在信息时代, 数据是企业创造商业价值的生产资料, 数据的丢失将为企业带来毁灭性的灾难。 据 Gartner Group 的调查数据表明, 在经历过大型灾难或长时间系统停运的公司中,有2/5 的公司再也未恢复运行,而在其余的公司中,有 1/3 的公司在两年内破产。有句古谚叫 “别把鸡蛋放在一个篮子里” 。 现在的信息系统, 各种数据高度集中,“鸡蛋 ”全放在一个篮里了。一旦出现突然停电、

4、意外死机或者人为破坏,造成数据丢失是不可避免的。面对各种未可预知的灾难,越来越多的企业将容灾备份系统作为企业安全的保障。银联数据异地灾备项目的目标是保证SF25K 上各银行(民生银行贷记卡系统拟迁移至 IBM 主机,故此次灾备项目暂不考虑;邮储银行贷记卡系统主机为 IBMP570,也不在考虑范围之内)发卡系统的安全,在灾难情况下,最大限度地保护公司资产,减少公司各方面的损失,保证发卡系统的业务连续性。本方案仅对异地容灾数据库复制软件部分做相应阐述。1.2 用户现状1.2.1 系统平台发卡系统运行在一台SunFire E25K企业级服务器上,通过两台Brocade SW4900SAN 交换机与两

5、台企业级存储ST9990、 SE9970 相连,应用系统核心文件和数据库数据文件均存放在该存储上,存储系统磁盘采用RAID 1+0 方式。SF25K划分为四个物理分区(Domain),每家银行均使用其中的两个,一个 Domain作为生产主机,另一个Domain作为热备主机。Domain操作系统为Solaris 10, 数据库系统为Oracle 10.2.0.2 RAC。通过Sun Cluster集群软件,实现了生产机房内 的双机热备份,保证了系统的高可用性。止匕外,在主机端还通过Sun MPXIO多通道负载均衡软件,实现两条光纤通道的负载均衡,进一步避免了单点故障。以下是发卡系统SAN架构图:

6、Domain AHQf Domain B通过在主机端使用VxVM 4.1卷管理软件,已建立了同机房数据灾备系统,两台存储SE9970与ST9990之间实现了同步数据复制,达到了以下灾难恢复目标:日常工作,保证两台存储的数据实时同步保持一致,所有数据不丢失。计划外停机,任一台存储发生灾难,保证数据不丢失,即RPO=0,并确保应用不中断运行,即RTO=0。1.2.2 数据库平台发卡系统中的数据库系统,是整个生产系统中最关键、最复杂的数据对象,发 卡系统的业务运转直接依赖于这些数据的可用性。为了确保数据库的高可用性,发卡系统数据库使用了Oracle 10g RAC版本10.2.0.2,主、备机两节点

7、的数据库实例同时运行,一旦主节点出现问题,数据库实例无需启停,可迅速将应用系统切换至备节点。截至到2008年8月底,各数据库实例数据量情况见下表:实例名总数据量(GBArchive log数据量(GB高峰期 Archive log 变化量(MB/s)平均每天最大帐单日HX25140.42SZ15120.20CR934.550.40DE381.550.58UC27512162.95合计44620324.551.3 用户需求银联数据拟为提供外包服务的各银行发卡系统建设异地灾备系统, 生产系统位于上海, 灾备系统位于北京。 主备中心之间采用数据库复制软件进行异步数据复制,以保证生产数据的安全性,满足

8、发卡系统的业务连续性需求。1.3.1 日常功能将生产中心发卡系统上的数据库变化实时异步复制到灾备中心;灾备中心的Oracle数据库处于打开状态,可提供实时数据查询;对生产系统的资源占用不能太多,不能影响到生产系统的正常运行;对网络带宽的占用较低。1.3.2 故障切换当生产中心的系统无法正常运行,而又不能在短期内恢复时,可利用灾备中心提供业务接管。灾备中心必须在生产中心不可用 6 小时之内完成业务接管。当生产中心服务器恢复正常后,数据复制系统需要将灾备中心的最新数据反向复制回生产中心,实现业务的恢复。1.3.3 基本要求复制软件应满足在单机或 RAC环境下,Xt Oracle在线日志(Onlin

9、e redo log) 的捕捉及复制;支持Oracle中所有的常用数据类型,如Oracle中的LONG、LONG RAW、BLOB、 CLOB、 NCLOB 、 TIMESTAMP 等,可实现用户自定义表、字段进行复制;支持对数据库中常用 DDL 操作的复制;支持事务复制,要求对数据库中较大的事务不会出现过多延迟;支持没有PK/UK字段的表的同步。数据复制过程可根据需要灵活地进行控制或修改复制的方向,以满足业务 需求;支持在数据复制过程中对数据正确性进行校验,如正在复制的数据在之前 就已经不一致,应提供报警功能,以便及时发现错误,避免错误的扩大; 提供专用图形化集中管理软件。1.3.4 性能要

10、求数据库初始化同步要求数据库复制软件能够将发卡系统的数据库中已有数据初始化同步到灾备中 心数据库。在初始化同步过程中,业务不能停止,但可选择业务量较小时段进行。 在解决方案书中要求详细描述初始化数据同步解决方案,以及整个首次同步操作所 需要的时间(以100GB数据为标准),并且要求列出整个首次初始化过程中是否需 要人为干预,从而可以有效地评估整个首次数据初始化的工作量。为了保证生产中心日后业务扩展存在更换服务器厂商以及数据库版本等情况, 需要注明是否支持异构平台下的首次数据初始化同步,是否支持跨数据库版本之间 数据库的初始化同步操作。数据复制性能指标数据复制的性能指标与系统平台、网络带宽、应用

11、系统等因素密切相关,参照 卜列运行环境:项目配置数据源SF15K 24 个 CPU 32GB内存,ORACLE 10.2.0.2 RAC目标端SF15K 24 个 CPU 32GB内存,ORACLE 10.2.0.2总数据量500GB左右(数据+索引)每天的日志量每天20GB日志网络带宽100M和 20M要求提供相应的性能参数指标:类别指标共值首次数据初始化同步首次数据库初始化同步时间(100M带宽)小于10小时首次数据库初始化同步时间(20M带宽)小于48小时首次数据库初始化同步源端CPU占用小于30%增量数据同步(单个复制链路)源端CPU占用小于5%目标端CPU占用小于5%源端内存占用小于

12、200M目标端内存占用小于200M复制数据延迟平均值10s以内业务高峰期对系统的影响源端CPU占用小于10%目标端CPU占用小于10%复制数据延迟平均值10s以内1.3.5数据一致性要求数据库复制软件提供数据库初始化同步、数据恢复后以及日常的数据一致 性检查方案,要求方案中详细注明该数据一致性比对方案的特点以及操作复杂度, 并可满足如下要求:可在应用不停机的情况下,查找和发现不一致的数据;一致性检查需要能够进行对象属性、记录条数和记录的字段内容进行一致 性检查;提供全库的记录级一致性检查时间(以 100GB的数据为例)。支持不含PK/UK字段的表的一致性检查和修复。请提供在没有 PK/UK字

13、段的表中有1000万条记录的比对时间。对于不一致的数据,需要提供不一致记录详细信息,以便进行精确的修复,同 时提供数据修复方案。数据修复工作要求操作简单,修复速度快,且修复过程中不 影响业务正常运行。1.3.6系统兼容性数据库复制软件应支持以下操作系统平台:Sun Solaris 9,10IBM AIX 5.x数据库复制软件应支持 Oracle 9i, Oracle 10g, Oracle 11g及后续数据库版本;支持异构平台, 源端和目标端不同数据库版本; 支持 Cluster/HACMP 和 RAC 模式, 并支持不同操作系统下不同数据库版本之间的复制。1.3.7 高可用性主系统和备用系统

14、的数据库处于双活状态,以保证在灾难发生前可在两个系统上运行不同类型的应用程序。数据库复制软件应支持本地Cluster/HACMP 的高可用方式, 在本地单节点出现故障时,可通过Cluster软件接管到其它节点。1.3.8 健壮性要求数据库复制软件在各种大压力和各种故障情况下不会造成数据复制失败。网络故障:长时间中断、短时间中断及网络时断时续情况下的正常复制;数据库故障: 在目标端数据库故障下, 源端数据库不能受到影响。 当目标端数据库修复后,复制软件继续工作;服务器硬件故障:在目标端服务器故障下, 源端生产系统不能受到影响,当目标端修复后,复制软件继续工作。1.3.9 设备无关性独立于任何硬件

15、设备、操作系统和Oracle数据库的不同版本,能够实现不同平台之间数据库的复制。1.3.10 管理监控功能数据库复制软件需提供统一的管理监控功能,能实现对复制软件的运行状态、运行日志、系统配置等方面进行统一的管理及监控,保证出现错误时具有完整方便的报警及跟踪机制,方便故障的快速定位和解决。第二章 Oracle Data Guard 介绍容灾系统主要包括数据保护和应用切换两大方面,其中最为重要的是数据保护部分。除了要将这些数据存放在高可用的存储设备上之外,最重要的是这些关键数据应该在异地之间保持一致,以使灾难发生后,系统可以尽快恢复。下面是几种主要的数据保护技术。实现数据的异地复制,有软件方式和

16、硬件方式两种途径。软件方式,是通过主机端软件来实现,如第三方软件或者数据库厂家提供的远程数据容灾工具来实现业务数据的远程复制。硬件方式,是基于智能存储系统的控制器的远程拷贝,可以在主、备存储系统之间通过硬件实现复制。在实际的容灾系统中,由于系统的环境不同,安全性要求不同以及采用的软硬件产品不同,数据复制过程中的工作机制也不尽相同。概括地讲,数据复制地工作机制主要包括同步和异步两种。同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的 I/O 事务均需等待远程复制的完成确认信息,方予以释放。异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本

17、地存储系统的基本I/O 操作,而由本地存储系统提供给请求镜像主机的 I/O 操作完成确认信息,远程的数据复制以后台同步的方式进行。因为带宽等因素限制,本次容灾方案仅包括了异步复制的方式的讨论。2.1 Data Guard 实现原理Oracle Data Guard 是当今保护企业核心资产(数据)的最有效解决方案,它能够使数据在24x7 的基础上可用,而无论是否发生灾难或其它中断。Oracle Data Guard 是管理、监控和自动化软件的基础架构,它创建、维护和监控一个或多个备用数据库,以保护企业数据结构不受故障、灾难、错误和崩溃的 影响。Data Guard使备用数据库保持为与生产数据库在

18、事务上一致的副本。这些备 用数据库可能位于距生产数据中心数千公里的远程灾难恢复站点,或者可能位于同 一城市、同一校园乃至同一建筑物内。当生产数据库由于计划中断或意外中断而变 得不可用时,Data Guard可以将任意备用数据库切换到生产角色,从而使与中断相关的停机时间减到最少,并防止任何数据丢失。作为Oracle数据库企业版的一个特性推出的Data Guard能够与其它的Oracle高可用性(HA)解决方案(如真正应用集群(RAC)和恢复管理器(RMAN) 结合使用,以提供业内前所未有的高水平数据保护和数据可用性。下图提供了 Oracle Data Guard 的一个概述。Oracle Dat

19、a Guard包括一个生产数据库,也称为主数据库,以及一个或多个 备用数据库,这些备用数据库是与主数据库在事务上一致的副本。Data Guard利用重做数据保持这种事务一致性。当主数据库中发生事务时,则生成重做数据并将其 写入本地重做日志文件中。通过 Data Guard,还将重做数据传输到备用站点上,并应用到备用数据库中,从而使备用数据库与主数据库保持同步。Data Guard允许管 理员选择将重做数据同步还是异步地发送到备用站点上。备用数据库的底层技术是 Data Guard重做应用(物理备用数据库)和 Data Guard SQL应用(逻辑备用数据库)。物理备用数据库在磁盘上拥有和主数据

20、库逐 块相同的数据库结构,并且使用 Oracle介质恢复进行更新。逻辑备用数据库是一 个独立数据库,它与主数据库包含相同的数据。它使用SQL语句进行更新,具相对 优势是能够并行用于恢复以及诸如报表、查询等其他任务。Data Guard简化了主数据库和选定的备用数据库之间的转换和故障切换,从 而减少了由计划停机和计划外故障所导致的总停机时间。主数据库和备用数据库以及它们的各种交互可以使用SQL*Plus来进行管理。为了获得更简便的可管理性,Data Guard还提供了一个分布式管理框架(称为Data Guard Broker),它不但自动化了 Data Guard 配置的创建、维护和监控,并对这

21、 些操作进行统一管理。管理员可以使用Oracle Enterprise Manager或Broker自己的专用命令行界面(DGMGRL)来利用Broker的管理功能。下图显示了 Oracle Data Guard组件。太极计算机股份有限公司2.2 Oracle Data Guard 优势灾难恢复和高可用性 一Data Guard提供了一个高效和全面的灾难恢复和 高可用性解决方案。易于管理的转换和故障切换功能允许主数据库和备用数据库 之间的角色转换,从而使主数据库因计划的和计划外的中断所导致的停机时间减 到最少。完善的数据保护一使用备用数据库,Data Guard可保证即使遇到不可预 见的灾难也

22、不会丢失数据。备用数据库提供了防止数据损坏和用户错误的安全保 护。主数据库上的存储器级物理损坏不会传播到备用数据库上。同样,导致主数据库永久损坏的逻辑损坏或用户错误也能够得到解决。最后,在将重做数据应用 到备用数据库时会对其进行验证。有效利用系统资源一备用数据库表使用从主数据库接收到的重做数据进 行更新,并且可用于诸如备份操作、报表、合计和查询等其它任务,从而减少执 行这些任务所必需的主数据库工作负载,节省宝贵的CPU和I/O周期。使用逻 辑备用数据库,用户可以在模式中不从主数据库进行更新的表上执行数据处理操 作。逻辑备用数据库可以在从主数据库中对表进行更新时保持打开,并可同时对表进行只读访问

23、。最后,可以在维护的表上创建额外索引和物化视图,以获得更好的查询性能和适应特定的业务要求。灵活的数据保护功能,从而在可用性与性能要求之间取得平衡一OracleData Guard提供了最大保护、最高可用性和最高性能等模式,来帮助企业在系 统性能要求和数据保护之间取得平衡。自动间隔检测及其解决方案一如果主数据库与一个或更多个备用数据库 之间的连接丢失(例如,由于网络问题),则在主数据库上生成的重做数据将无 法发送到那些备用数据库上。一旦重新建立连接,Data Guard就自动检测丢失的存档日志序列(或间隔),并将必要的存档日志自动传输到备用数据库中。备 用数据库将重新与主数据库同步,而无需管理员

24、的任何手动干预。简单的集中式管理 一Data Guard Broker 使一个Data Guard 配置中的 多个数据库间的管理和操作任务自动化。 Broker还监控单个Data Guard配置 内的所有系统。管理员可以使用 Oracle Enterprise Manager 或Broker自己 专用的命令行界面(DGMGRL)来利用这个集成的管理框架。与Oracle数据库集成一Oracle Data Guard是作为Oracle数据库(企 业版)的一个完全集成的功能提供的,无需任何额外费用。2.3 Data Guard提供的保护模式Oracle针对用户的不同需求提供三种保护模式:最大保护模式

25、、最大性能 模式、最大可用模式。Oracle提供的Data Guard在最大保护模式下可以确保数据完全不丢失。它在写本地日志的同时写远程standby的数据库日志。只有两个日志均写成功后一 个操作才是正式完成。这种方式确保了数据的最大安全,能够确保主数据库损坏 的情况下没有任何数据丢失。但这种情况对主数据库性能有较大的影响,即使在高速的局域网内,最大保护模式也会对主数据库性能有超过10%勺性能影响。这种方式对主备两个数据库之间的链路有非常高的要求。在这种保护模式下无论是网路链路还是standby数据库等发生故障导致日志无法正常写均会导致主数据 库无法使用。因此只有在对数据安全要求最高的情况下才

26、会考虑使用这种方式。Oracle也提供最大性能模式。这种模式下,不传输实时修改的日志文件, 传递的是归档日志文件,因此对主数据库性能影响很小。归档日志文件传递是否 能够成功对主数据库运行没有任何影响,因此在网络出现中断或者standby数据 库出现异常也不会影响主数据库的正常运行。但因为日志没有同步写,因此在灾难发生的时候备份数据库与主数据库可能有一定的数据差异。Oracle提供的第三种模式是上述两种方式的折中。在网络正常的情况下它 的运行方式类似于最大保护模式,日志实时传递。当网络或standby出现故障的 时候它的运行模式类似于最大性能模式,日志延迟传递,不会导致主数据库停止运行。这种方式

27、在正常情况下因为日志实时传递,因此同样对主数据库性能有较大影响,而且对网络链路要求较高。综上所述,不同的保护模式比较如下:最大保护取人口用最大性能对主数据库性能影响较局较局低对网络链路要求极高高低备份系统发生故障主数据库不可用无影响无影响数据保护无数据丢失基本无数据丢失少量数据丢失2.4 Data Guard 实现方式以及对系统的限制要求Oracle针对不同的用户情况提供的两种不同的 standby方式。物理standby , 逻辑 standby。物理standby数据库,在通常的模式下备份库始终处于恢复状态,用户无 法访问备份库的数据。如果需要访问数据,需要将恢复模式停止,将数据库打开 到

28、只读状态。这两种状态是排它的,也就是说数据库要么是恢复状态,保持和主 数据库一致,在这种状态下数据库内容不可访问;要么是只读状态,数据库不会做恢复与主数据保持一致。Oracle还提供逻辑standby数据库。这种方式下数据库可以在打开的状态 下保持与主数据库的同步工作。这种打开状态和普通的数据库open状态不同,不能对数据做修改。这种方式通常用于繁忙的系统,如主数据库日常完成业务处 理,逻辑standby数据库在完成容灾的同时分担主数据库的查询统计工作。这样大大节约了系统资源。但这种方式对数据库有一定的限制, 并不是所有的系统都 能够支持。部分较为特殊的数据类型不支持,另外所有的表必须要有主键

29、或者唯 一性索引。无论是物理standby还是逻辑standby均对系统要求如下: 主备数据库必须是完全相同的硬件架构,如均为SUNff台。机器的内存大小、CPUt量主频可以不同。操作系统版本、补丁完全相同。数据库版本完全相同。但 RAC选件可以不同。即主数据库可以是RAC模式,备份节点可以是单机。2.5 切换方式Oracle Data Guard 可以实现 failover 以及 switchover 的切换。Switchover指有计划的切换。如系统主数据库服务器需要硬件维护等有计划的停机操作。这时候可以手工将所有的日志以及归档日志文件传输到备份节点 后执行switchover的切换。这种

30、情况下等主数据库恢复正常后系统可以手工切 换回来。Failover切换是指系统出现了异常情况下的切换。系统管理员发现主数据 库服务器无法提供服务,决定启动容灾系统。在这种情况下的切换后如果主数据 库服务器恢复正常后需要重新配置整个 Data Guard环境,无法切换回主数据库 服务器。无论是那种切换方式,主备系统之间均存在部分差别。如IP地址不同,需要修改服务器IP地址或应用程序重新指向。因为在不同的局域网内,应用中间 件需要跨防火墙访问系统。机器档次不同、网络带宽不同造成的性能下降等问题。 这需要在容灾的预案中考虑。第三章系统建议方案针对本容灾方案,我们推荐采用 Oracle Data Gu

31、ard技术。3.1 Data Guard 优势节约投资Oracle Data Guard 是Oracle原厂自带的容灾产品。该产品完全免费。在 容灾软件上用户无需支付额外费用,这可以大大节约用户的资金投入。技术成熟、稳定早在Oracle 7版本就已经推出该功能(当时名称为 Standby数据库)。其 核心采用了 Oracle成熟的归档、备份、恢复技术。经过多年不断的发展, 已经成为一项技术成熟、稳定,有广泛成功案例的技术。对系统运行性能影响小Data Guard在主数据库服务器端不存在对日志解析等工作,仅需要主数据 库服务器端将归档日志文件传输到容灾节点。因此对生产系统性能影响极 小。能够满足

32、用户基本业务需求Data Guard能够满足用户基本的数据容灾、RTO RPO带宽等相关基本业务需求。3.2 Data Guard运行模式Oracle提供了物理Data Guard以及逻辑Data Guard两种不同的方式。这 两种方式各有优缺点。因为用户数据库中存在大量表,这些表没有PK/UR因此无法满足逻辑Data Guard的使用前提条件。在本方案中,我们推荐采用物理Data Guard的方式。3.3 Data Guard 保护模式根据用户的实际情况,在主数据库服务器和容灾数据库服务器之间距离较 远,使用最大保护模式和最大可用模式均会严重影响主数据库的运行性能。用户允许在出现异常情况下1

33、5分钟内的数据丢失量,因此采用最大性能模式可以在 现有带宽的情况下满足用户的容灾需求。采用最大性能模式,系统不会实时传输日志文件,传递的是归档日志文件, 因此对主数据库性能影响很小。归档日志文件传递是否能够成功对主数据库运行 没有任何影响,因此在网络出现中断或者standby数据库出现异常也不会影响主 数据库的正常运行。但因为日志没有同步写,因此在灾难发生的时候备份数据库 与主数据库可能有一定的数据差异。3.4 Data Guard 初始安装步骤1、确认主数据库运行于归档模式如果主数据库没有处于归档模式,那么需要将数据库运行模式修改为归档 模式。该修改过程需要短暂停止数据库运行。2、物理备份主

34、数据库的所有数据文件该部分工作可以在不影响业务正常运行的情况下执行。该部分工作依据数据量以及I/O速度不同,所需要的时间也不同。一般估算,100G的数据应在1小时内备份完成。该备份操作启动后无需人为干预。3、在主数据库创建standby控制文件通过命令创建灾备中心的控制文件。4、拷贝备份的数据文件、standby控制文件及日志文件到备份节点。因为数据量较大,可以将备份的文件压缩后传递。100G的备份文件经压缩, 通常压缩率在40% - 50%之间。100G文件压缩后约50G。在网速为20M带宽的 情况下,假设网络利用率为70%,那么速度约为6G/每小时;50G的文件需要9 个小时传递完成。在网

35、速为100M带宽的情况下,假设网络利用率为 70%,那么 速度约为30G/每小时;50G的文件需要1.5个小时传递完成。在数据传输启动后 无需人为干预。5、配置主、备中心的数据库服务器 Data Guard环境该操作对主数据库运行没有任何影响。其中灾备中心数据库平台要求与主中心架构一致,如均为SUN小型机。操作系统版本及数据库版本均需要一致。Data Guard不支持异构平台数据容灾,也不支持不同数据库版本之间做数 据容灾。6、使用主中心备份的文件创建灾备中心数据库系统。该操作主要是解压文件、恢复数据文件的时间。约为2小时。7、配置灾备中心环境。根据主中心的归档日志保持灾备中心与主中心一 致。

36、3.5用户需求点对点应答3.5.1 日常功能将生产中心发卡系统上的数据库变化实时异步复制到灾备中心; 应答:满足。Data Guard通过归档日志将数据库变化复制到灾备中心。灾备中心的Oracle数据库处于打开状态,可提供实时数据查询; 应答:部分满足。物理 Data Guard在正常恢复的时候无法处于打开状态,在打 开的状态下无法处于恢复与主数据库保持一致的状态。本系统的RPO<15分钟,RTO<6小时,每天归档日志产生量<20Go可以考虑以下方式解决该问题:如果用户对容灾数据库使用时间为白天,那么在白天,将数据库启动为只 读打开模式,供业务查询。夜间,将数据库启动为恢复模

37、式,保持与主生产中心 一致。如果用户对容灾数据库使用时间为夜间, 那么反之在夜间将数据库打开只 读,白天数据库做恢复。容灾中心数据库只在指定时间内对数据库做恢复,因此该数据库与主数据 库之间存在1天的数据差异。虽然没有实时做数据恢复,归档日志文件在产生后 会同步写入容灾中心,因此系统可以满足RPO<15分钟的要求。当出现需要启动 备用中心的情况,备用中心需要先通过归档日志文件恢复数据。目前每天归档日志量<20G,系统使用这些归档日志恢复数据的时间 < 2小时,能够满足RTO<6 小时的业务需求。如果用户对容灾中心数据库使用为全天 24小时,目前版本Data Guard无

38、法 满足要求,在OraclellG以后的版本提供该功能。对生产系统的资源占用不能太多,不能影响到生产系统的正常运行;应答:满足。采用物理 Data Guard的最大性能模式,生产中心主机仅需要在归 档日志产生后将归档日志文件写入异地容灾中心,对生产系统资源占用极少,不影响生产系统的正常运行。在网络出现故障或容灾中心出现故障时,不会影响到 生产系统的正常运行。对网络带宽的占用较低。应答:满足。Data Guard传输内容数据变化产生的归档日志文件。目前每天归档 日志产生量为20G,那么传输量为20G/天。3.5.2 故障切换当生产中心的系统无法正常运行,而又不能在短期内恢复时,可利用灾 备中心提

39、供业务接管。应答:满足。灾备中心可以提供数据库服务器。灾备中心必须在生产中心不可用 6小时之内完成业务接管。应答:满足。灾备中心可以在 6小时内完成业务接管。当生产中心服务器恢复正常后,数据复制系统需要将灾备中心的最新数 据反向复制回生产中心,实现业务的恢复。应答:部分满足。系统切换可以分为有计划的停机以及故障停机。在有计划停机的情况下,灾备中心数据库在启用的时候,数据库内容保持 与生产中心完全一致。在主中心操作完成后,可以通过简单命令,将灾备中心启 用期间数据修改反向复制回生产中心,实现业务的恢复。在故障停机的情况下,主中心可能有部分数据(15分钟)尚未传递到备份中 心,在灾备中心启用的时候

40、,主、备之间数据已不一致。因此需要将所有数据重 新传递回主中心才能实现业务的恢复。3.5.3 基本要求复制软件应满足在单机或 RAC环境下,对Oracle在线日志(Online redo log)的捕捉及复制;应答:满足。Data Guard通过对Online redo log产生的归档文件复制来完成容灾。支持Oracle中所有的常用数据类型,如 Oracle中的LONG、LONG RAW BLOB、CLOB、NCLOB、TIMESTAMP等,可实现用户自定义表、 字段进行复制;应答:满足。物理Data Guard支持Oracle中所有的常用数据类型支持对数据库中常用DDL操作的复制;应答:满

41、足。物理Data Guard支持Oracle中常用DDL的操作复制。支持事务复制,要求对数据库中较大的事务不会出现过多延迟;应答:满足。物理Data Guard支持事务复制。对较大事务不会出现过多延迟。支持没有PK/UK字段的表的同步。应答:满足。物理Data Guard支持没有PK/UK字段的表的同步。数据复制过程可根据需要灵活地进行控制或修改复制的方向,以满足业务需求;应答:满足。Data Guard可以灵活地控制主、备节点的 swithover切换。支持在数据复制过程中对数据正确性进行校验, 如正在复制的数据在之 前就已经不一致,应提供报警功能,以便及时发现错误,避免错误的扩 大;应答:

42、满足。物理Data Guard复制的前提条件是主、备数据库保持一致,因此 不会出现复制的数据在之前已经不一致的情况。提供专用图形化集中管理软件。应答:满足。Data Guard Broker与OEM可以提供很方便的图形化集中管理。3.5.4 性能要求数据库初始化同步要求数据库复制软件能够将发卡系统的数据库中已有数据初始化同步到灾备中心数据库。在初始化同步过程中,业务不能停止,但可选择业务量较 小时段进行。在解决方案书中要求详细描述初始化数据同步解决方案,以 及整个首次同步操作所需要的时间(以 100GB数据为标准),并且要求列 出整个首次初始化过程中是否需要人为干预,从而可以有效地评估整个首

43、次数据初始化的工作量。为了保证生产中心日后业务扩展存在更换服务器厂商以及数据库版本等情 况,需要注明是否支持异构平台下的首次数据初始化同步,是否支持跨数 据库版本之间数据库的初始化同步操作。应答:满足。详见Data Guard初始安装步骤数据复制性能指标数据复制的性能指标与系统平台、网络带宽、应用系统等因素密切相关,参照下列运行环境:项目配 置数据源SF15K 24个 CPU 32GM存,ORACLE 10.2.0.2 RAC目标端SF15K 24个 CPU 32GM存,ORACLE 10.2.0.2总数据量500G9右(数据+索引)每天的日志量每天20GB日志网络做100蛇口 20M要求提供

44、相应的性能参数指标:类别指标参考值应答首次数 据初始 化同步首次数据库初始化同 步时间(100M带宽)小于10小时满足,首次初始化同步时间小于 5小 时首次数据库初始化同 步时间(20M带宽)小于48小时满足,首次初始化同步时间小于12小时首次数据库初始化同 步源端CPU占用小于30%满足,对主系统资源消耗极小。小于1%增量 数据同步(单个 复制链路)源端CPia用小于5%满足,对主系统资源消耗极小。小于1%目标端CPU占用小于5%满足,对目标资源消耗极小。小于 5%源端内存占用小于200M满足,对主资源消耗极小。无需额外 内存消耗目标端内存占用小于200M满足,对主资源消耗极小。无需额外 内

45、存消耗复制数据延迟平均值10s以内不满足。在最大性能模式下,物理Data Guard在日志切换后将改变的数 据写入灾备中心。频繁的日志切换将 影响数据库运行性能。建议将日志切 换频率设置为10分钟。因此数据复制 最大延迟约为10分钟。业务高 峰期对 系统的 影响源端CPUB用小于10%满足,对主系统资源消耗极小。小于1%目标端CPU占用小于10%满足,对目标资源消耗极小。小于 5%复制数据延迟平均值10s以内不满足。在最大性能模式下,物理 Data Guard在日志切换后将改变的数 据写入灾备中心。频繁的日志切换将 影响数据库运行性能。建议将日志切 换频率设置为10分钟。因此数据复制 最大延迟

46、约为10分钟。3.5.5数据一致性要求数据库复制软件提供数据库初始化同步、 数据恢复后以及日常的数据一 致性检查方案,要求方案中详细注明该数据一致性比对方案的特点以及操作复杂 度,并可满足如下要求:可在应用不停机的情况下,查找和发现不一致的数据;一致性检查需要能够进行对象属性、记录条数和记录的字段内容进行一 致性检查;提供全库的记录级一致性检查时间(以 100GB的数据为例)。支持不含PK/UK字段的表的一致性检查和修复。请提供在没有 PK/UK 字段的表中有1000万条记录的比对时间。对于不一致的数据,需要提供不一致记录详细信息,以便进行精确的修复,同时提供数据修复方案。数据修复工作要求操作

47、简单,修复速度快,且修复过程 中不影响业务正常运行。应答:满足。Data Guard实现的基本原理既:通过备份恢复的基本原理保持灾备 数据库与主数据库的一致。只有主数据库可以修改,备数据库是不能够做任何改 动的。当系统发生Switchover的切换以后,主备关系变化,同样只有主数据库(原 来的备数据库)可以修改,备数据库(原来的主数据库)是不可以修改的。因此Data Guard不存在查找和发现不一致的数据的问题。如果备数据库做了相应修 改,那么数据复制的基础被打破,数据复制将无法继续进行,需要重新构建灾备 中心数据库系统。3.5.6 系统兼容性数据库复制软件应支持以下操作系统平台:Sun So

48、laris 9,10IBM AIX 5.x数据库复制软件应支持Oracle 9i, Oracle 10g, Oracle 11g及后续数据库版 本;支持异构平台,源端和目标端不同数据库版本;支持Cluster/HACMP和RAC 模式,并支持不同操作系统下不同数据库版本之间的复制。应答:部分满足。Data Guard支持 Sun Solaris 9,10以及 IBM AIX 5.xData Guard 支持 Oracle 9i, Oracle 10g, Oracle 11g 及后续数据库版本;支 持 Cluster/HACMP 和 RAC 模式。不支持异构平台,不支持源端和目标端不同数据库版本

49、,不支持不同操作 系统下不同数据库版本之间的复制。3.5.7 高可用性主系统和备用系统的数据库处于双活状态,以保证在灾难发生前可在两个系 统上运行不同类型的应用程序。应答:部分满足。物理 Data Guard在正常恢复的时候无法处于打开状态,在打 开的状态下无法处于恢复与主数据库保持一致的状态。本系统的RPO<15分钟,RTO<6小时,每天归档日志产生量<20G。可以考虑以下方式解决该问题:如果用户对容灾数据库使用时间为白天,那么在白天,将数据库启动为只 读打开模式,供业务查询。夜间,将数据库启动为恢复模式,保持与主生产中心 一致。如果用户对容灾数据库使用时间为夜间,那么反之

50、在夜间将数据库打开只读,白天数据库做恢复。容灾中心数据库只在指定时间内对数据库做恢复,因此该数据库与主数据库之间存在1天的数据差异。虽然没有实时做数据恢复,归档日志文件在产生后 会同步写入容灾中心,因此系统可以满足RPO<15分钟的要求。当出现需要启动 备用中心的情况,备用中心需要先通过归档日志文件恢复数据。目前每天归档日志量<20G,系统使用这些归档日志恢复数据的时间 < 2小时,能够满足RTO<6 小时的业务需求。如果用户对容灾中心数据库使用为全天 24小时,目前版本Data Guard无法 满足要求,在OraclellG以后的版本提供该功能。数据库复制软件应支持本

51、地Cluster/HACMP的高可用方式,在本地单节点出 现故障时,可通过Cluster软件接管到其它节点。应答:满足。数据库复制软件应本地 Cluster/HACMP的高可用方式,在本 地单节点出现故障时,可通过 Cluster软件接管到其它节点。3.5.8 健壮性要求数据库复制软件在各种大压力和各种故障情况下不会造成数据复制失败。 网络故障:长时间中断、短时间中断及网络时断时续情况下的正常复制; 数据库故障:在目标端数据库故障下,源端数据库不能受到影响。当目标端数据库修复后,复制软件继续工作;服务器硬件故障:在目标端服务器故障下,源端生产系统不能受到影响,当目标端修复后,复制软件继续工作。

52、应答:满足。物理Data Guard的最大性能模式下灾备中心服务器硬件、数据库 故障以及网络故障均不会影响主中心的正常运行。如果主数据库与备用数据库之间的连接丢失(例如,由于网络问题、灾备数据库问题、灾备服务器问题),则 在主数据库上生成的重做数据将无法发送到那些备用数据库上。一旦重新建立连接,Data Guard就自动检测丢失的存档日志序列(或间隔),并将必要的存档 日志自动传输到备用数据库中。备用数据库将重新与主数据库同步,而无需管理 员的任何手动干预。3.5.9 设备无关性独立于任何硬件设备、操作系统和Oracle数据库的不同版本,能够实现不 同平台之间数据库的复制。应答:不满足。Dat

53、a Guard要求主备中心硬件架构相同,数据库版本完全一致。 目前本系统中主备中心能够满足 Data Guard的硬件及数据库版本要求。3.5.10 管理监控功能数据库复制软件需提供统一的管理监控功能,能实现对复制软件的运行状态、运行日志、系统配置等方面进行统一的管理及监控,保证出现错误时具有完整方便的报警及跟踪机制,方便故障的快速定位和解决。应答:满足。Data Guard Broker与OEM可以提供统一的管理监控功能,能实现 对复制软件的运行状态、运行日志、系统配置等方面进行统一的管理及监控,保证出现错误时具有完整方便的报警及跟踪机制,方便故障的快速定位和解决。第四章Oracle Dat

54、a Guard 10g R2概念和理论分类: 理论知识2012-12-17 18:49 785 人阅读衽迨(0)收藏 举报网上很多文章都只是介绍如何搭建Oracle Data Guard ,但是很少有介绍到基本的概念和理论知识。同时官方文档是纯英文的,对于英文不好的读起来是非常痛苦。本人因为是英文专业,结合官方文档和自己所学,整理了以下这些文字,和大家一起共同学习。同时感谢谢永生(Warehouse )和OCM群中的其他兄弟们,并以此文献给口香糖同学新出生的儿子。1. Oracle Data Guard 介绍:Oracle Data Guard 是Oracle数据库高可用技术中的一种,通过数据

55、冗余为企业级数据库提供高可用,数据保护和灾难恢复。Data Guard 通过日志同步机制,在主备库之间实现数据同步,由于相互之间是通过网络连接,所以每个库可以放置在不同的地理位置,只要保证Data Guard可以将任何1台网络连接通畅即可。如果主库发生计划中或者异常停机,Standby数据库切换成Primary数据库继续提供服务。1.1. Primary 数据库:RAC集群,Data Guard配置中包含1台生产数据库,这台数据库可以是单实例也可以是 负责对外提供大部分服务,在 Data Guard中这台的角色就是 Primary。1.2. Standby 数据库:在一套Data Guard中

56、最多可以有9台Standby数据库,Primary数据库通过网络将日志传 输到Standby数据库,然后Standby在接收完日志后进行应用,以实现主备库之间的数据 同步和事务一致性。和Primary数据库一样,Standby数据库也可以是单实例或者RAC集群。根据Redo Log的应用方式不同,Standby数据库又可以分为物理Standby和逻辑Standby。另外Data Guard是通过控制文件来识别 Primary和Standby数据库的,所以Standby数据库 的控制文件一定不能用操作系统复制 ,一定要通过命令 ALTER DATABASE CREATE STANDBY CONTROLFILE AS 来进行创建。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论