版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、OracleDataGuard容灾方案Oracle数据库异地容灾方案介绍2008年11月目录第一章 需求分析41.1 序言41.2 用户现状41.2.1 系统平台41.2.2 数据库平台61.3 用户需求71.3.1 日常功能71.3.2 故障切换71.3.3 基本要求71.3.4 性能要求81.3.5 数据一致性91.3.6 系统兼容性91.3.7 高可用性101.3.8 健壮性要求101.3.9 设备无关性101.3.10 管理监控功能11第二章 Oracle Data Guard介绍122.1 Data Guard实现原理122.2 Oracle Data Guard 优势152.3 D
2、ata Guard提供的保护模式162.4 Data Guard实现方式以及对系统的限制要求172.5 切换方式17第三章 系统建议方案183.1 Data Guard优势183.2 Data Guard运行模式193.3 Data Guard保护模式193.4 Data Guard初始安装步骤193.5 用户需求点对点应答203.5.1 日常功能203.5.2 故障切换213.5.3 基本要求223.5.4 性能要求233.5.5 数据一致性243.5.6 系统兼容性253.5.7 高可用性253.5.8 健壮性要求263.5.9 设备无关性273.5.10 管理监控功能27第一章 需求分析
3、1.1 序言在信息时代,数据是企业创造商业价值的生产资料,数据的丢失将为企业带来毁灭性的灾难。据Gartner Group的调查数据表明,在经历过大型灾难或长时间系统停运的公司中,有2/5的公司再也未恢复运行,而在其余的公司中,有1/3的公司在两年内破产。有句古谚叫“别把鸡蛋放在一个篮子里”。现在的信息系统,各种数据高度集中,“鸡蛋”全放在一个篮里了。一旦出现突然停电、意外死机或者人为破坏,造成数据丢失是不可避免的。面对各种未可预知的灾难,越来越多的企业将容灾备份系统作为企业安全的保障。银联数据异地灾备项目的目标是保证SF25K上各银行(民生银行贷记卡系统拟迁移至IBM主机,故此次灾备项目暂不
4、考虑;邮储银行贷记卡系统主机为IBM P570,也不在考虑范围之内)发卡系统的安全,在灾难情况下,最大限度地保护公司资产,减少公司各方面的损失,保证发卡系统的业务连续性。本方案仅对异地容灾数据库复制软件部分做相应阐述。1.2 用户现状1.2.1 系统平台发卡系统运行在一台SunFire E25K企业级服务器上,通过两台Brocade SW4900 SAN交换机与两台企业级存储ST9990、SE9970相连,应用系统核心文件和数据库数据文件均存放在该存储上,存储系统磁盘采用RAID 1+0方式。SF25K划分为四个物理分区(Domain),每家银行均使用其中的两个,一个Domain作为生产主机,
5、另一个Domain作为热备主机。Domain操作系统为Solaris 10,数据库系统为Oracle 10.2.0.2 RAC。通过Sun Cluster集群软件,实现了生产机房内的双机热备份,保证了系统的高可用性。此外,在主机端还通过Sun MPXIO多通道负载均衡软件,实现两条光纤通道的负载均衡,进一步避免了单点故障。以下是发卡系统SAN架构图:SW4900 SW4900 SE9970 L180 (2 LTO-3)V280RNBU Master Server ST9990 SF25KDomain ADomain BDomain CDomain DVTL通过在主机端使用VxVM 4.1卷管理
6、软件,已建立了同机房数据灾备系统,两台存储SE9970与ST9990之间实现了同步数据复制,达到了以下灾难恢复目标:l 日常工作,保证两台存储的数据实时同步保持一致,所有数据不丢失。l 计划外停机,任一台存储发生灾难,保证数据不丢失,即RPO=0,并确保应用不中断运行,即RTO=0。SE9970ST9990生产主机VxVM Mirror Volume1.2.2 数据库平台发卡系统中的数据库系统,是整个生产系统中最关键、最复杂的数据对象,发卡系统的业务运转直接依赖于这些数据的可用性。为了确保数据库的高可用性,发卡系统数据库使用了Oracle 10g RAC版本10.2.0.2,主、备机两节点的数
7、据库实例同时运行,一旦主节点出现问题,数据库实例无需启停,可迅速将应用系统切换至备节点。截至到2008年8月底,各数据库实例数据量情况见下表:实例名总数据量(GB)Archive log数据量(GB)高峰期Archive log变化量(MB/s)平均每天最大帐单日HX25140.42 SZ15120.20 CR934.550.40 DE381.550.58 UC27512162.95 合计44620324.55 1.3 用户需求银联数据拟为提供外包服务的各银行发卡系统建设异地灾备系统,生产系统位于上海,灾备系统位于北京。主备中心之间采用数据库复制软件进行异步数据复制,以保证生产数据的安全性,满
8、足发卡系统的业务连续性需求。1.3.1 日常功能l 将生产中心发卡系统上的数据库变化实时异步复制到灾备中心;l 灾备中心的Oracle数据库处于打开状态,可提供实时数据查询;l 对生产系统的资源占用不能太多,不能影响到生产系统的正常运行;l 对网络带宽的占用较低。1.3.2 故障切换l 当生产中心的系统无法正常运行,而又不能在短期内恢复时,可利用灾备中心提供业务接管。 l 灾备中心必须在生产中心不可用6小时之内完成业务接管。l 当生产中心服务器恢复正常后,数据复制系统需要将灾备中心的最新数据反向复制回生产中心,实现业务的恢复。1.3.3 基本要求l 复制软件应满足在单机或RAC环境下,对Ora
9、cle在线日志(Online redo log)的捕捉及复制;l 支持Oracle中所有的常用数据类型,如Oracle中的LONG 、LONG RAW、BLOB、CLOB、NCLOB、TIMESTAMP等,可实现用户自定义表、字段进行复制;l 支持对数据库中常用DDL操作的复制;l 支持事务复制,要求对数据库中较大的事务不会出现过多延迟;l 支持没有PK/UK字段的表的同步。l 数据复制过程可根据需要灵活地进行控制或修改复制的方向,以满足业务需求;l 支持在数据复制过程中对数据正确性进行校验,如正在复制的数据在之前就已经不一致,应提供报警功能,以便及时发现错误,避免错误的扩大;l 提供专用图形
10、化集中管理软件。1.3.4 性能要求l 数据库初始化同步要求数据库复制软件能够将发卡系统的数据库中已有数据初始化同步到灾备中心数据库。在初始化同步过程中,业务不能停止,但可选择业务量较小时段进行。在解决方案书中要求详细描述初始化数据同步解决方案,以及整个首次同步操作所需要的时间(以100GB数据为标准),并且要求列出整个首次初始化过程中是否需要人为干预,从而可以有效地评估整个首次数据初始化的工作量。为了保证生产中心日后业务扩展存在更换服务器厂商以及数据库版本等情况,需要注明是否支持异构平台下的首次数据初始化同步,是否支持跨数据库版本之间数据库的初始化同步操作。l 数据复制性能指标数据复制的性能
11、指标与系统平台、网络带宽、应用系统等因素密切相关,参照下列运行环境:项目配置数据源SF15K 24个CPU,32GB内存, ORACLE 10.2.0.2 RAC目标端SF15K 24个CPU,32GB内存, ORACLE 10.2.0.2总数据量500GB左右(数据+索引)每天的日志量每天20GB日志网络带宽100M和20M要求提供相应的性能参数指标:类别指标参考值首次数据初始化同步首次数据库初始化同步时间(100M带宽) 小于10小时首次数据库初始化同步时间(20M带宽)小于48小时首次数据库初始化同步源端CPU占用小于30 增量数据同步(单个复制链路)源端CPU占用小于5目标端CPU占用
12、小于5源端内存占用小于200M目标端内存占用小于200M复制数据延迟平均值10s以内业务高峰期对系统的影响 源端CPU占用小于10目标端CPU占用小于10复制数据延迟平均值10s以内1.3.5 数据一致性要求数据库复制软件提供数据库初始化同步、数据恢复后以及日常的数据一致性检查方案,要求方案中详细注明该数据一致性比对方案的特点以及操作复杂度,并可满足如下要求:l 可在应用不停机的情况下,查找和发现不一致的数据;l 一致性检查需要能够进行对象属性、记录条数和记录的字段内容进行一致性检查;l 提供全库的记录级一致性检查时间(以100GB的数据为例)。l 支持不含PK/UK字段的表的一致性检查和修复
13、。请提供在没有PK/UK字段的表中有1000万条记录的比对时间。对于不一致的数据,需要提供不一致记录详细信息,以便进行精确的修复,同时提供数据修复方案。数据修复工作要求操作简单,修复速度快,且修复过程中不影响业务正常运行。1.3.6 系统兼容性数据库复制软件应支持以下操作系统平台:l Sun Solaris 9,10l IBM AIX 5.x数据库复制软件应支持Oracle 9i,Oracle 10g,Oracle 11g及后续数据库版本;支持异构平台,源端和目标端不同数据库版本;支持Cluster/HACMP和RAC模式,并支持不同操作系统下不同数据库版本之间的复制。1.3.7 高可用性主系
14、统和备用系统的数据库处于双活状态,以保证在灾难发生前可在两个系统上运行不同类型的应用程序。数据库复制软件应支持本地Cluster/HACMP的高可用方式,在本地单节点出现故障时,可通过Cluster软件接管到其它节点。1.3.8 健壮性要求数据库复制软件在各种大压力和各种故障情况下不会造成数据复制失败。l 网络故障:长时间中断、短时间中断及网络时断时续情况下的正常复制;l 数据库故障:在目标端数据库故障下, 源端数据库不能受到影响。当目标端数据库修复后,复制软件继续工作;l 服务器硬件故障:在目标端服务器故障下, 源端生产系统不能受到影响,当目标端修复后,复制软件继续工作。1.3.9 设备无关
15、性独立于任何硬件设备、操作系统和Oracle数据库的不同版本,能够实现不同平台之间数据库的复制。1.3.10 管理监控功能数据库复制软件需提供统一的管理监控功能,能实现对复制软件的运行状态、运行日志、系统配置等方面进行统一的管理及监控,保证出现错误时具有完整方便的报警及跟踪机制,方便故障的快速定位和解决。第二章 Oracle Data Guard介绍容灾系统主要包括数据保护和应用切换两大方面,其中最为重要的是数据保护部分。除了要将这些数据存放在高可用的存储设备上之外,最重要的是这些关键数据应该在异地之间保持一致,以使灾难发生后,系统可以尽快恢复。下面是几种主要的数据保护技术。实现数据的异地复制
16、,有软件方式和硬件方式两种途径。软件方式,是通过主机端软件来实现,如第三方软件或者数据库厂家提供的远程数据容灾工具来实现业务数据的远程复制。硬件方式,是基于智能存储系统的控制器的远程拷贝,可以在主、备存储系统之间通过硬件实现复制。在实际的容灾系统中,由于系统的环境不同,安全性要求不同以及采用的软硬件产品不同,数据复制过程中的工作机制也不尽相同。概括地讲,数据复制地工作机制主要包括同步和异步两种。同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。异步远程镜像(异步复制技术)保证在更新远程存储视图
17、前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息,远程的数据复制以后台同步的方式进行。因为带宽等因素限制,本次容灾方案仅包括了异步复制的方式的讨论。2.1 Data Guard实现原理Oracle Data Guard 是当今保护企业核心资产(数据)的最有效解决方案,它能够使数据在 24x7 的基础上可用,而无论是否发生灾难或其它中断。Oracle Data Guard 是管理、监控和自动化软件的基础架构,它创建、维护和监控一个或多个备用数据库,以保护企业数据结构不受故障、灾难、错误和崩溃的影响。 Data Guard 使备用数据库保持为与生产数
18、据库在事务上一致的副本。这些备用数据库可能位于距生产数据中心数千公里的远程灾难恢复站点,或者可能位于同一城市、同一校园乃至同一建筑物内。当生产数据库由于计划中断或意外中断而变得不可用时,Data Guard 可以将任意备用数据库切换到生产角色,从而使与中断相关的停机时间减到最少,并防止任何数据丢失。 作为 Oracle 数据库企业版的一个特性推出的 Data Guard 能够与其它的 Oracle 高可用性 (HA) 解决方案(如真正应用集群 (RAC) 和恢复管理器 (RMAN))结合使用,以提供业内前所未有的高水平数据保护和数据可用性。下图提供了 Oracle Data Guard 的一个
19、概述。Oracle Data Guard 包括一个生产数据库,也称为主数据库,以及一个或多个备用数据库,这些备用数据库是与主数据库在事务上一致的副本。Data Guard 利用重做数据保持这种事务一致性。当主数据库中发生事务时,则生成重做数据并将其写入本地重做日志文件中。通过 Data Guard,还将重做数据传输到备用站点上,并应用到备用数据库中,从而使备用数据库与主数据库保持同步。Data Guard 允许管理员选择将重做数据同步还是异步地发送到备用站点上。 备用数据库的底层技术是 Data Guard 重做应用(物理备用数据库)和 Data Guard SQL 应用(逻辑备用数据库)。物
20、理备用数据库在磁盘上拥有和主数据库逐块相同的数据库结构,并且使用 Oracle 介质恢复进行更新。逻辑备用数据库是一个独立数据库,它与主数据库包含相同的数据。它使用 SQL 语句进行更新,其相对优势是能够并行用于恢复以及诸如报表、查询等其他任务。 Data Guard 简化了主数据库和选定的备用数据库之间的转换和故障切换,从而减少了由计划停机和计划外故障所导致的总停机时间。 主数据库和备用数据库以及它们的各种交互可以使用 SQL*Plus 来进行管理。为了获得更简便的可管理性,Data Guard 还提供了一个分布式管理框架(称为 Data Guard Broker),它不但自动化了 Data
21、 Guard 配置的创建、维护和监控,并对这些操作进行统一管理。管理员可以使用 Oracle Enterprise Manager 或 Broker 自己的专用命令行界面 (DGMGRL) 来利用 Broker 的管理功能。 下图显示了 Oracle Data Guard 组件。 56 / 5656 / 562.2 Oracle Data Guard 优势 灾难恢复和高可用性 Data Guard 提供了一个高效和全面的灾难恢复和高可用性解决方案。易于管理的转换和故障切换功能允许主数据库和备用数据库之间的角色转换,从而使主数据库因计划的和计划外的中断所导致的停机时间减到最少。 完善的数据保护
22、使用备用数据库,Data Guard 可保证即使遇到不可预见的灾难也不会丢失数据。备用数据库提供了防止数据损坏和用户错误的安全保护。主数据库上的存储器级物理损坏不会传播到备用数据库上。同样,导致主数据库永久损坏的逻辑损坏或用户错误也能够得到解决。最后,在将重做数据应用到备用数据库时会对其进行验证。 有效利用系统资源 备用数据库表使用从主数据库接收到的重做数据进行更新,并且可用于诸如备份操作、报表、合计和查询等其它任务,从而减少执行这些任务所必需的主数据库工作负载,节省宝贵的 CPU 和 I/O 周期。使用逻辑备用数据库,用户可以在模式中不从主数据库进行更新的表上执行数据处理操作。逻辑备用数据库
23、可以在从主数据库中对表进行更新时保持打开,并可同时对表进行只读访问。最后,可以在维护的表上创建额外索引和物化视图,以获得更好的查询性能和适应特定的业务要求。灵活的数据保护功能,从而在可用性与性能要求之间取得平衡 Oracle Data Guard 提供了最大保护、最高可用性和最高性能等模式,来帮助企业在系统性能要求和数据保护之间取得平衡。 自动间隔检测及其解决方案 如果主数据库与一个或更多个备用数据库之间的连接丢失(例如,由于网络问题),则在主数据库上生成的重做数据将无法发送到那些备用数据库上。一旦重新建立连接,Data Guard 就自动检测丢失的存档日志序列(或间隔),并将必要的存档日志自
24、动传输到备用数据库中。备用数据库将重新与主数据库同步,而无需管理员的任何手动干预。 简单的集中式管理 Data Guard Broker 使一个 Data Guard 配置中的多个数据库间的管理和操作任务自动化。Broker 还监控单个 Data Guard 配置内的所有系统。管理员可以使用 Oracle Enterprise Manager 或 Broker 自己专用的命令行界面 (DGMGRL) 来利用这个集成的管理框架。 与 Oracle 数据库集成 Oracle Data Guard 是作为 Oracle 数据库(企业版)的一个完全集成的功能提供的,无需任何额外费用。 2.3 Data
25、 Guard提供的保护模式Oracle针对用户的不同需求提供三种保护模式:最大保护模式、最大性能模式、最大可用模式。Oracle提供的Data Guard在最大保护模式下可以确保数据完全不丢失。它在写本地日志的同时写远程standby的数据库日志。只有两个日志均写成功后一个操作才是正式完成。这种方式确保了数据的最大安全,能够确保主数据库损坏的情况下没有任何数据丢失。但这种情况对主数据库性能有较大的影响,即使在高速的局域网内,最大保护模式也会对主数据库性能有超过10%的性能影响。这种方式对主备两个数据库之间的链路有非常高的要求。在这种保护模式下无论是网路链路还是standby数据库等发生故障导致
26、日志无法正常写均会导致主数据库无法使用。因此只有在对数据安全要求最高的情况下才会考虑使用这种方式。Oracle也提供最大性能模式。这种模式下,不传输实时修改的日志文件,传递的是归档日志文件,因此对主数据库性能影响很小。归档日志文件传递是否能够成功对主数据库运行没有任何影响,因此在网络出现中断或者standby数据库出现异常也不会影响主数据库的正常运行。但因为日志没有同步写,因此在灾难发生的时候备份数据库与主数据库可能有一定的数据差异。Oracle提供的第三种模式是上述两种方式的折中。在网络正常的情况下它的运行方式类似于最大保护模式,日志实时传递。当网络或standby出现故障的时候它的运行模式
27、类似于最大性能模式,日志延迟传递,不会导致主数据库停止运行。这种方式在正常情况下因为日志实时传递,因此同样对主数据库性能有较大影响,而且对网络链路要求较高。综上所述,不同的保护模式比较如下:最大保护最大可用最大性能对主数据库性能影响较高较高低对网络链路要求极高高低备份系统发生故障主数据库不可用无影响无影响数据保护无数据丢失基本无数据丢失少量数据丢失2.4 Data Guard实现方式以及对系统的限制要求Oracle针对不同的用户情况提供的两种不同的standby方式。物理standby ,逻辑standby。物理standby数据库,在通常的模式下备份库始终处于恢复状态,用户无法访问备份库的数
28、据。如果需要访问数据,需要将恢复模式停止,将数据库打开到只读状态。这两种状态是排它的,也就是说数据库要么是恢复状态,保持和主数据库一致,在这种状态下数据库内容不可访问;要么是只读状态,数据库不会做恢复与主数据保持一致。Oracle还提供逻辑standby数据库。这种方式下数据库可以在打开的状态下保持与主数据库的同步工作。这种打开状态和普通的数据库open状态不同,不能对数据做修改。这种方式通常用于繁忙的系统,如主数据库日常完成业务处理,逻辑standby数据库在完成容灾的同时分担主数据库的查询统计工作。这样大大节约了系统资源。但这种方式对数据库有一定的限制,并不是所有的系统都能够支持。部分较为
29、特殊的数据类型不支持,另外所有的表必须要有主键或者唯一性索引。无论是物理standby 还是逻辑standby均对系统要求如下:l 主备数据库必须是完全相同的硬件架构,如均为SUN平台。机器的内存大小、CPU数量主频可以不同。l 操作系统版本、补丁完全相同。l 数据库版本完全相同。但RAC选件可以不同。即主数据库可以是RAC模式,备份节点可以是单机。2.5 切换方式Oracle Data Guard可以实现failover 以及switchover的切换。Switchover指有计划的切换。如系统主数据库服务器需要硬件维护等有计划的停机操作。这时候可以手工将所有的日志以及归档日志文件传输到备份
30、节点后执行switchover的切换。这种情况下等主数据库恢复正常后系统可以手工切换回来。Failover切换是指系统出现了异常情况下的切换。系统管理员发现主数据库服务器无法提供服务,决定启动容灾系统。在这种情况下的切换后如果主数据库服务器恢复正常后需要重新配置整个Data Guard环境,无法切换回主数据库服务器。无论是那种切换方式,主备系统之间均存在部分差别。如IP地址不同,需要修改服务器IP 地址或应用程序重新指向。因为在不同的局域网内,应用中间件需要跨防火墙访问系统。机器档次不同、网络带宽不同造成的性能下降等问题。这需要在容灾的预案中考虑。第三章 系统建议方案针对本容灾方案,我们推荐采
31、用Oracle Data Guard技术。3.1 Data Guard优势l 节约投资Oracle Data Guard是Oracle原厂自带的容灾产品。该产品完全免费。在容灾软件上用户无需支付额外费用,这可以大大节约用户的资金投入。l 技术成熟、稳定早在Oracle 7版本就已经推出该功能(当时名称为Standby数据库)。其核心采用了Oracle成熟的归档、备份、恢复技术。经过多年不断的发展,已经成为一项技术成熟、稳定,有广泛成功案例的技术。l 对系统运行性能影响小Data Guard在主数据库服务器端不存在对日志解析等工作,仅需要主数据库服务器端将归档日志文件传输到容灾节点。因此对生产系
32、统性能影响极小。l 能够满足用户基本业务需求Data Guard能够满足用户基本的数据容灾、RTO、RPO、带宽等相关基本业务需求。3.2 Data Guard运行模式Oracle提供了物理Data Guard以及逻辑Data Guard两种不同的方式。这两种方式各有优缺点。因为用户数据库中存在大量表,这些表没有PK/UK;因此无法满足逻辑Data Guard的使用前提条件。在本方案中,我们推荐采用物理Data Guard的方式。3.3 Data Guard保护模式根据用户的实际情况,在主数据库服务器和容灾数据库服务器之间距离较远,使用最大保护模式和最大可用模式均会严重影响主数据库的运行性能。
33、用户允许在出现异常情况下15分钟内的数据丢失量,因此采用最大性能模式可以在现有带宽的情况下满足用户的容灾需求。采用最大性能模式,系统不会实时传输日志文件,传递的是归档日志文件,因此对主数据库性能影响很小。归档日志文件传递是否能够成功对主数据库运行没有任何影响,因此在网络出现中断或者standby数据库出现异常也不会影响主数据库的正常运行。但因为日志没有同步写,因此在灾难发生的时候备份数据库与主数据库可能有一定的数据差异。3.4 Data Guard初始安装步骤1、确认主数据库运行于归档模式如果主数据库没有处于归档模式,那么需要将数据库运行模式修改为归档模式。该修改过程需要短暂停止数据库运行。2
34、、物理备份主数据库的所有数据文件该部分工作可以在不影响业务正常运行的情况下执行。该部分工作依据数据量以及I/O速度不同,所需要的时间也不同。一般估算,100G的数据应在1小时内备份完成。该备份操作启动后无需人为干预。3、在主数据库创建standby 控制文件通过命令创建灾备中心的控制文件。4、拷贝备份的数据文件、standby控制文件及日志文件到备份节点。因为数据量较大,可以将备份的文件压缩后传递。100G的备份文件经压缩,通常压缩率在40% - 50%之间。100G文件压缩后约50G。在网速为20M带宽的情况下,假设网络利用率为70%,那么速度约为6G/每小时;50G的文件需要9个小时传递完
35、成。在网速为100M带宽的情况下,假设网络利用率为70%,那么速度约为30G/每小时;50G的文件需要1.5个小时传递完成。在数据传输启动后无需人为干预。5、配置主、备中心的数据库服务器Data Guard环境该操作对主数据库运行没有任何影响。其中灾备中心数据库平台要求与主中心架构一致,如均为SUN小型机。操作系统版本及数据库版本均需要一致。Data Guard不支持异构平台数据容灾,也不支持不同数据库版本之间做数据容灾。6、使用主中心备份的文件创建灾备中心数据库系统。该操作主要是解压文件、恢复数据文件的时间。约为2小时。7、配置灾备中心环境。根据主中心的归档日志保持灾备中心与主中心一致 。3
36、.5 用户需求点对点应答3.5.1 日常功能l 将生产中心发卡系统上的数据库变化实时异步复制到灾备中心;应答:满足。Data Guard通过归档日志将数据库变化复制到灾备中心。l 灾备中心的Oracle数据库处于打开状态,可提供实时数据查询;应答:部分满足。物理Data Guard在正常恢复的时候无法处于打开状态,在打开的状态下无法处于恢复与主数据库保持一致的状态。本系统的RPO15分钟,RTO6小时,每天归档日志产生量20G。可以考虑以下方式解决该问题:如果用户对容灾数据库使用时间为白天,那么在白天,将数据库启动为只读打开模式,供业务查询。夜间,将数据库启动为恢复模式,保持与主生产中心一致。
37、如果用户对容灾数据库使用时间为夜间,那么反之在夜间将数据库打开只读,白天数据库做恢复。容灾中心数据库只在指定时间内对数据库做恢复,因此该数据库与主数据库之间存在1天的数据差异。虽然没有实时做数据恢复,归档日志文件在产生后会同步写入容灾中心,因此系统可以满足RPO15分钟的要求。当出现需要启动备用中心的情况,备用中心需要先通过归档日志文件恢复数据。目前每天归档日志量20G,系统使用这些归档日志恢复数据的时间 2小时,能够满足RTO6小时的业务需求。如果用户对容灾中心数据库使用为全天24小时,目前版本Data Guard无法满足要求,在Oracle11G 以后的版本提供该功能。l 对生产系统的资源
38、占用不能太多,不能影响到生产系统的正常运行;应答:满足。采用物理Data Guard的最大性能模式,生产中心主机仅需要在归档日志产生后将归档日志文件写入异地容灾中心,对生产系统资源占用极少,不影响生产系统的正常运行。在网络出现故障或容灾中心出现故障时,不会影响到生产系统的正常运行。l 对网络带宽的占用较低。应答:满足。Data Guard传输内容数据变化产生的归档日志文件。目前每天归档日志产生量为20G,那么传输量为20G/天。3.5.2 故障切换l 当生产中心的系统无法正常运行,而又不能在短期内恢复时,可利用灾备中心提供业务接管。 应答:满足。灾备中心可以提供数据库服务器。l 灾备中心必须在
39、生产中心不可用6小时之内完成业务接管。应答:满足。灾备中心可以在6小时内完成业务接管。l 当生产中心服务器恢复正常后,数据复制系统需要将灾备中心的最新数据反向复制回生产中心,实现业务的恢复。应答:部分满足。系统切换可以分为有计划的停机以及故障停机。在有计划停机的情况下,灾备中心数据库在启用的时候,数据库内容保持与生产中心完全一致。在主中心操作完成后,可以通过简单命令,将灾备中心启用期间数据修改反向复制回生产中心,实现业务的恢复。在故障停机的情况下,主中心可能有部分数据(15分钟)尚未传递到备份中心,在灾备中心启用的时候,主、备之间数据已不一致。因此需要将所有数据重新传递回主中心才能实现业务的恢
40、复。3.5.3 基本要求l 复制软件应满足在单机或RAC环境下,对Oracle在线日志(Online redo log)的捕捉及复制;应答:满足。Data Guard通过对Online redo log产生的归档文件复制来完成容灾。l 支持Oracle中所有的常用数据类型,如Oracle中的LONG 、LONG RAW、BLOB、CLOB、NCLOB、TIMESTAMP等,可实现用户自定义表、字段进行复制;应答:满足。物理Data Guard支持Oracle中所有的常用数据类型l 支持对数据库中常用DDL操作的复制;应答:满足。物理Data Guard支持Oracle中常用DDL的操作复制。l
41、 支持事务复制,要求对数据库中较大的事务不会出现过多延迟;应答:满足。物理Data Guard支持事务复制。对较大事务不会出现过多延迟。l 支持没有PK/UK字段的表的同步。应答:满足。物理Data Guard支持没有PK/UK字段的表的同步。l 数据复制过程可根据需要灵活地进行控制或修改复制的方向,以满足业务需求;应答:满足。Data Guard可以灵活地控制主、备节点的swithover切换。l 支持在数据复制过程中对数据正确性进行校验,如正在复制的数据在之前就已经不一致,应提供报警功能,以便及时发现错误,避免错误的扩大;应答:满足。物理Data Guard复制的前提条件是主、备数据库保持
42、一致,因此不会出现复制的数据在之前已经不一致的情况。l 提供专用图形化集中管理软件。应答:满足。Data Guard Broker与OEM可以提供很方便的图形化集中管理。3.5.4 性能要求l 数据库初始化同步要求数据库复制软件能够将发卡系统的数据库中已有数据初始化同步到灾备中心数据库。在初始化同步过程中,业务不能停止,但可选择业务量较小时段进行。在解决方案书中要求详细描述初始化数据同步解决方案,以及整个首次同步操作所需要的时间(以100GB数据为标准),并且要求列出整个首次初始化过程中是否需要人为干预,从而可以有效地评估整个首次数据初始化的工作量。为了保证生产中心日后业务扩展存在更换服务器厂
43、商以及数据库版本等情况,需要注明是否支持异构平台下的首次数据初始化同步,是否支持跨数据库版本之间数据库的初始化同步操作。应答:满足。详见Data Guard初始安装步骤l 数据复制性能指标数据复制的性能指标与系统平台、网络带宽、应用系统等因素密切相关,参照下列运行环境:项目配置数据源SF15K 24个CPU,32GB内存, ORACLE 10.2.0.2 RAC目标端SF15K 24个CPU,32GB内存, ORACLE 10.2.0.2总数据量500GB左右(数据+索引)每天的日志量每天20GB日志网络带宽100M和20M要求提供相应的性能参数指标:类别指标参考值应答首次数据初始化同步首次数
44、据库初始化同步时间(100M带宽) 小于10小时满足,首次初始化同步时间小于5小时首次数据库初始化同步时间(20M带宽)小于48小时满足,首次初始化同步时间小于12小时首次数据库初始化同步源端CPU占用小于30 满足,对主系统资源消耗极小。小于1%增量数据同步(单个复制链路)源端CPU占用小于5满足,对主系统资源消耗极小。小于1%目标端CPU占用小于5满足,对目标资源消耗极小。小于5%源端内存占用小于200M满足,对主资源消耗极小。无需额外内存消耗目标端内存占用小于200M满足,对主资源消耗极小。无需额外内存消耗复制数据延迟平均值10s以内不满足。在最大性能模式下,物理Data Guard在日
45、志切换后将改变的数据写入灾备中心。频繁的日志切换将影响数据库运行性能。建议将日志切换频率设置为10分钟。因此数据复制最大延迟约为10分钟。业务高峰期对系统的影响源端CPU占用小于10满足,对主系统资源消耗极小。小于1%目标端CPU占用小于10满足,对目标资源消耗极小。小于5%复制数据延迟平均值10s以内不满足。在最大性能模式下,物理Data Guard在日志切换后将改变的数据写入灾备中心。频繁的日志切换将影响数据库运行性能。建议将日志切换频率设置为10分钟。因此数据复制最大延迟约为10分钟。3.5.5 数据一致性要求数据库复制软件提供数据库初始化同步、数据恢复后以及日常的数据一致性检查方案,要
46、求方案中详细注明该数据一致性比对方案的特点以及操作复杂度,并可满足如下要求:l 可在应用不停机的情况下,查找和发现不一致的数据;l 一致性检查需要能够进行对象属性、记录条数和记录的字段内容进行一致性检查;l 提供全库的记录级一致性检查时间(以100GB的数据为例)。l 支持不含PK/UK字段的表的一致性检查和修复。请提供在没有PK/UK字段的表中有1000万条记录的比对时间。对于不一致的数据,需要提供不一致记录详细信息,以便进行精确的修复,同时提供数据修复方案。数据修复工作要求操作简单,修复速度快,且修复过程中不影响业务正常运行。应答:满足。Data Guard实现的基本原理既:通过备份恢复的
47、基本原理保持灾备数据库与主数据库的一致。只有主数据库可以修改,备数据库是不能够做任何改动的。当系统发生Switchover的切换以后,主备关系变化,同样只有主数据库(原来的备数据库)可以修改,备数据库(原来的主数据库)是不可以修改的。因此Data Guard不存在查找和发现不一致的数据的问题。如果备数据库做了相应修改,那么数据复制的基础被打破,数据复制将无法继续进行,需要重新构建灾备中心数据库系统。3.5.6 系统兼容性数据库复制软件应支持以下操作系统平台:l Sun Solaris 9,10l IBM AIX 5.x数据库复制软件应支持Oracle 9i,Oracle 10g,Oracle
48、11g及后续数据库版本;支持异构平台,源端和目标端不同数据库版本;支持Cluster/HACMP和RAC模式,并支持不同操作系统下不同数据库版本之间的复制。应答:部分满足。Data Guard支持Sun Solaris 9,10以及IBM AIX 5.xData Guard 支持Oracle 9i,Oracle 10g,Oracle 11g及后续数据库版本;支持Cluster/HACMP和RAC模式。不支持异构平台,不支持源端和目标端不同数据库版本,不支持不同操作系统下不同数据库版本之间的复制。3.5.7 高可用性主系统和备用系统的数据库处于双活状态,以保证在灾难发生前可在两个系统上运行不同类
49、型的应用程序。应答:部分满足。物理Data Guard在正常恢复的时候无法处于打开状态,在打开的状态下无法处于恢复与主数据库保持一致的状态。本系统的RPO15分钟,RTO6小时,每天归档日志产生量20G。可以考虑以下方式解决该问题:如果用户对容灾数据库使用时间为白天,那么在白天,将数据库启动为只读打开模式,供业务查询。夜间,将数据库启动为恢复模式,保持与主生产中心一致。如果用户对容灾数据库使用时间为夜间,那么反之在夜间将数据库打开只读,白天数据库做恢复。容灾中心数据库只在指定时间内对数据库做恢复,因此该数据库与主数据库之间存在1天的数据差异。虽然没有实时做数据恢复,归档日志文件在产生后会同步写
50、入容灾中心,因此系统可以满足RPO15分钟的要求。当出现需要启动备用中心的情况,备用中心需要先通过归档日志文件恢复数据。目前每天归档日志量20G,系统使用这些归档日志恢复数据的时间 2小时,能够满足RTO6小时的业务需求。如果用户对容灾中心数据库使用为全天24小时,目前版本Data Guard无法满足要求,在Oracle11G 以后的版本提供该功能。数据库复制软件应支持本地Cluster/HACMP的高可用方式,在本地单节点出现故障时,可通过Cluster软件接管到其它节点。应答:满足。数据库复制软件应本地Cluster/HACMP的高可用方式,在本地单节点出现故障时,可通过Cluster软件
51、接管到其它节点。3.5.8 健壮性要求数据库复制软件在各种大压力和各种故障情况下不会造成数据复制失败。l 网络故障:长时间中断、短时间中断及网络时断时续情况下的正常复制;l 数据库故障:在目标端数据库故障下, 源端数据库不能受到影响。当目标端数据库修复后,复制软件继续工作;l 服务器硬件故障:在目标端服务器故障下, 源端生产系统不能受到影响,当目标端修复后,复制软件继续工作。应答:满足。物理Data Guard 的最大性能模式下灾备中心服务器硬件、数据库故障以及网络故障均不会影响主中心的正常运行。如果主数据库与备用数据库之间的连接丢失(例如,由于网络问题、灾备数据库问题、灾备服务器问题),则在
52、主数据库上生成的重做数据将无法发送到那些备用数据库上。一旦重新建立连接,Data Guard 就自动检测丢失的存档日志序列(或间隔),并将必要的存档日志自动传输到备用数据库中。备用数据库将重新与主数据库同步,而无需管理员的任何手动干预。 3.5.9 设备无关性独立于任何硬件设备、操作系统和Oracle数据库的不同版本,能够实现不同平台之间数据库的复制。应答:不满足。Data Guard 要求主备中心硬件架构相同,数据库版本完全一致。目前本系统中主备中心能够满足Data Guard的硬件及数据库版本要求。3.5.10 管理监控功能数据库复制软件需提供统一的管理监控功能,能实现对复制软件的运行状态
53、、运行日志、系统配置等方面进行统一的管理及监控,保证出现错误时具有完整方便的报警及跟踪机制,方便故障的快速定位和解决。应答:满足。Data Guard Broker与OEM可以提供统一的管理监控功能,能实现对复制软件的运行状态、运行日志、系统配置等方面进行统一的管理及监控,保证出现错误时具有完整方便的报警及跟踪机制,方便故障的快速定位和解决。第四章 Oracle Data Guard 10g R2概念和理论分类:理论知识2012-12-17 18:49785人阅读评论(0)收藏举报 网上很多文章都只是介绍如何搭建Oracle Data Guard,但是很少有介绍到基本的概念和理论知识。同时官方
54、文档是纯英文的,对于英文不好的读起来是非常痛苦。本人因为是英文专业,结合官方文档和自己所学,整理了以下这些文字,和大家一起共同学习。同时感谢谢永生(Warehouse)和OCM群中的其他兄弟们,并以此文献给口香糖同学新出生的儿子。1Oracle Data Guard介绍:Oracle Data Guard是Oracle数据库高可用技术中的一种,通过数据冗余为企业级数据库提供高可用,数据保护和灾难恢复。Data Guard 通过日志同步机制,在主备库之间实现数据同步,由于相互之间是通过网络连接,所以每个库可以放置在不同的地理位置,只要保证网络连接通畅即可。如果主库发生计划中或者异常停机,Data
55、 Guard可以将任何1台Standby数据库切换成Primary数据库继续提供服务。1.1.Primary数据库:Data Guard配置中包含1台生产数据库,这台数据库可以是单实例也可以是RAC集群,负责对外提供大部分服务,在Data Guard中这台的角色就是Primary。1.2.Standby数据库:在一套Data Guard中最多可以有9台Standby数据库,Primary数据库通过网络将日志传输到Standby数据库,然后Standby在接收完日志后进行应用,以实现主备库之间的数据同步和事务一致性。和Primary数据库一样,Standby数据库也可以是单实例或者RAC集群。根
56、据Redo Log的应用方式不同,Standby数据库又可以分为物理Standby和逻辑Standby。另外Data Guard是通过控制文件来识别Primary和Standby数据库的,所以Standby数据库的控制文件一定不能用操作系统复制,一定要通过命令ALTER DATABASE CREATE STANDBY CONTROLFILE AS来进行创建。1.2.1. 物理Standby:物理Standby使用的是Media Recovery技术,通过Redo Apply,使用从主库接收到的Redo Log进行恢复,是基于block级的恢复,所以主备库中所有的schema都是完全一样的。物理Standby必须在mount阶段才能进行恢复,但是能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重过磷酸钙相关行业投资规划报告范本
- 抑尘剂相关行业投资规划报告范本
- 太子湾公园日常保洁服务实施方案
- 试验和检验方案
- 定制化技术服务方案协议2024版
- 初中英语分层教学方案
- 背景音乐与公共广播系统施工方案
- 铁路工程隧道施工专项方案
- 2024年公司绩效考核管理方案
- 【隧道方案】盾构渣土池施工方案
- 《应用统计学》(第4版)-自测试卷及答案B卷
- 《赋能年轻一代、共筑韧性未来》国际减灾日主题班会教案
- 10.1爱护身体(课件)-2024-2025学年统编版道德与法治七年级上册
- 第四单元测试卷(四)-2024-2025学年五年级语文上册(统编版)
- 2024口腔执业医师聘用合同
- 2024-2025学年人教版生物七年级上册期中备考重点知识
- 《 在民族复兴的历史丰碑上》课件(26张)2024-2025学年统编版高中语文选择性必修上册第一单元
- 四川省成都市2023-2024学年高一上学期语文期中考试试卷(含答案)
- 第10课《我们不乱扔》(课件)-部编版道德与法治二年级上册
- 幼儿园公开课:大班语言《相反国》课件(优化版)
- 雅马哈YS12编程手册
评论
0/150
提交评论