《数据灾备方案》word版.docx_第1页
《数据灾备方案》word版.docx_第2页
《数据灾备方案》word版.docx_第3页
《数据灾备方案》word版.docx_第4页
《数据灾备方案》word版.docx_第5页
已阅读5页,还剩199页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目 录第一章概述91.1项目背景91.2数据保护原则91.3备份系统的位置101.4项目设计目标10第二章备份设备规划142.1备份环境准备142.2硬件安装规划152.3软件安装规划152.4物理带库安装规划15第三章备份系统整体架构163.1整体架构概述163.2备份服务器规划173.2.1服务器173.2.2客户端193.3备份设备规划203.3.1物理带库规划203.3.2备份一体机规划203.4备份SAN规划263.5备份LAN规划263.6备份数据复制273.7备份性能28第四章备份系统容灾设计284.1备份系统容灾架构概述284.2备份服务器规划304.2.1服务器304.2.2客户端314.3备份设备规划314.3.1物理带库规划314.3.2备份一体机规划314.4备份SAN规划324.5备份LAN规划324.6磁带的保存324.6.1磁带异地保存324.6.2磁带离线管理324.7容灾切换324.7.1备份平台的切换344.7.2介质服务器切换354.7.3备份客户端的切换35第五章数据备份方法与策略355.1备份对象分析355.1.1数据库355.1.2应用程序和应用日志385.1.3VMware虚拟机操作系统385.1.4Power 平台操作系统395.1.5X86物理机操作系统405.1.6NBU服务器405.2传输方式选择405.3全量、增量选择415.4备份时间窗口425.5临时备份策略42第六章数据恢复方法与策略436.1生产环境数据恢复436.1.1数据库恢复436.1.2应用程序和日志恢复456.1.3VMware虚机操作系统的恢复466.1.4Power平台操作系统恢复476.1.5X86物理机操作系统的恢复486.1.6NBU服务器的恢复486.2备份数据恢复验证496.3开发测试环境取数50第七章产品实施51第八章硬件实施部分518.1NBU 5240 环境及电气要求518.2NBU 5240 硬件示意图528.3NBU 5240 IPMI IKVM设置使用548.4NBU 5240 登录管理方式568.5NBU 5240 输入正式License638.6NBU master 端配置658.7NBU 5240 应用network 配置658.8NBU 5240 配置LinkAggregation718.9NBU 5240 /etc/hosts 配置798.10NBU 5240 主机名配置798.11NBU 5240 角色设置838.12NBU 5240 时区,时间设置918.13NBU 5240 存储配置978.14NBU 5240 FT Mode配置1038.15NBU 5240 安装EEB1148.16NBU 5240 参数优化1408.17NBU 5240 快速安装客户端1428.18重置 NBU 5240的配置1458.19NBU 5240 使用的网络端口号1468.20NBU 5240 相关日志147第九章软件实施部分1489.1NetBackup Master Server安装1489.2NetBackup AIX Client 安装1569.3NetBackup Oracle Agent安装1579.4NetBackup Windows Java Console安装1589.5带库和磁带配置1599.6备份策略配置171第十章同城灾备实施工艺18010.1VCS集群软件的安装18010.2集群的资源配置18210.3AIR复制配置184第十一章项目小组和售后服务18511.1人员设置18511.2应急预案18511.3基础售后服务(Essential Support)18511.4高级支持服务(consulation Service)188第一章 概述1.1 项目背景甘肃银行新的数据中心即将完工,新的数据中心涉及甘肃银行包括核心系统在内的88个业务应用和全部生产数据。同城双中心的新架构应用,对数据保留的窗口时间、RTO/RPO都有新要求,为了保证业务系统的正常运行和数据安全,必须建设足够强壮的备份系统以满足现在和未来的使用需要。1.2 数据保护原则数据中心往往采用多种数据保护方法来满足不同服务等级的要求,备份是其中唯一采用离线手段,并能提供应用逻辑错误的保护手段,同时,备份能实现的RTO和RPO也是所有保护系统中最低的,只有提升备份系统的效率,才能提升数据中心的可用性,满足更为严格的RTO/RPO要求。通常来说,可以把数据保护分为如下三个层次: 在线保护在线数据保护技术包括跨阵列的数据镜像,双活系统等,此类解决方案的RPO为0,RTO为0或者秒级。在线保护适用于对实时性要求非常高的核心系统,同时它也是最昂贵的数据保护方案。 近线保护近线保护是最近几年在近线存储技术上发展起来的,最典型的就是CDP,它采用的技术有数据复制、克隆、快照等,可以实现秒级RPO和分钟级的RTO,近线保护技术是生产系统开销最大的保护方案。 离线保护离线保护就是传统的备份技术,特点是成本低廉,保存周期和拷贝数量不受限制,但受到备份频率的限制,RPO和RTO往往是小时级或者天级。1.3 备份系统的位置一套系统往往会采用多种保护技术来进行全方位的数据保护,根据前期的环境调研,为了保证备份系统对业务系统的完全保护和满足同城双中心业务运行的要求,备份系统在两个生产中心分别独立运行,同时互为备份。1.4 项目设计目标为了满足银监局的要求和保障我行未来生产系统的RTO/RPO要求,当前的备份方式已经无法满足业务发展要求,迫切需要建设一套集中高效的备份系统。针对我行目前的业务要求、架构规划和灾难恢复要求,结合对现有备份现状和存在的问题的修正,我们将建设跨越生产中心和同城容灾中心的统一备份系统。本次集中备份系统的目标是建设一个集中式的备份恢复平台,业务系统服务器为备份客户端;备份的调度、监控、管理由备份服务器负责,所有备份数据都由备份客户端以SAN或者LAN的方式写到备份存储或者物理带库中。1. 备份系统架构图:2. 备份功能性要求 备份的SAN、LAN和生产是完全独立的网络。 实现LAN和SAN Client的备份。 备份的所有数据将存放在统一的备份一体机和物理带库上。 全面覆盖全行所有应用系统的数据,包括:数据库(ORACLE、DB2、SQL)、应用程序产生的文件、虚机的操作系统、PowerVM client端的操作系统。 实现备份系统的本地容灾。3. 备份系统的特性 通用性支持绝大多数主流操作系统、数据库和备份设备,支持新一代项目的所有操作系统和数据库备份,可以为甘肃银行所有系统提供统一的备份保护。 可扩展性备份系统具有良好的扩展性,可以方便的添加或删除备份客户端、服务器和备份设备,支持跨数据中心数据备份和备份数据容灾,符合甘肃银行两地三中心的规划要求。 高可靠性生产中心的备份服务器和备份一体机都配置成集群和容错模式,具有极高的可靠性,满足甘肃银行724 的数据中心备份需求。对备份的数据按照数据的重要级别设置不同的备份策略,让备份软件自动备份,减少了人工备份易犯的错备、漏备等缺点,提高数据的安全性,且通过备份软件进行恢复验证,确保备份数据的可靠性。 高效率相比较甘肃银行原先备份体系,新的集中备份架构对数据的备份、恢复和维护更有效率。对于大多数系统管理人员来说,备份是一项繁重的任务,每天都要花费大量时间用于手工数据备份,从而影响其他工作的开展。统一备份系统能够实现定时自动备份,大大减轻管理员的压力。 高度自动化新的备份架构将自动完成数据备份,数据的备份对于应用系统来说完全透明理想的备份系统是全方位,多层次的。首先,通过多台一体机的冗余结构和备份主服务器的高可用来防止硬件故障,保证备份业务的不间断运行。其次,备份系统根据策略自动执行,全面保护计算机系统的数据。再次,备份系统采用高可用冗余架构,切换全部自动化,完全排队单点故障,实现7*24小时运行。 集中管理化利用统一备份系统,系统管理员可通过WEB界面,对全网的备份进行状态查看、策略管理、故障监控、报表汇总等统一集中管理。 灾难恢复同城备份容灾的设计是做为同城灾备的辅助手段,把同城灾备不能覆盖的数据保护起来,可以在生产中心发生灾难需要恢复数据时,配合同城灾备进行数据的恢复,以便快速的恢复生产。本架构设计将是后续备份系统详细设计和部署方案的基础和指引。第二章 备份设备规划2.1 备份环境准备在安装NetBackup之前需要确认如下的信息:1、备份服务器(Master Server)的硬件及操作系统版本、补丁情况;2、客户机(Client)的硬件及操作系统版本、补丁情况;3、所连接带库的硬件、驱动器类型;具体的硬件及操作系统兼容性请见以下链接:主机硬件及操作系统兼容性:/docs/278064带库和带机的兼容性:/docs/278692如有数据库需要备份,请查看数据库的兼容性:/docs/279048更多对操作系统的要求请见release notes:/docs/2901962.2 硬件安装规划备份主服务器:备份主服务器采用双电源,双口HBA,四个10GE网卡并配置相应的网线;备份一体机:充当介质服务器,采用双电源,八口HBA,四个10GE网卡并配置相应的网线;2.3 软件安装规划备份主服务器软件版本为Netbackup 7.7.3;备份一体机内置版本为2.7.3,等同于Netbackup 7.7.3;客户端统一部署 Netbackup 7.7.3客户端;2.4 物理带库安装规划物理带库参照物理带库安装要求,物理带库必须接入FC网络。第三章 备份系统整体架构3.1 整体架构概述数据中心的备份采用Veritas的第四代备份架构,利用SAN Client技术实现客户端与备份平台的松耦合。通过松耦合技术,实现备份平台整体的集中管理,所有操作无需在客户端完成,大幅提升管理效率,并实现“云”化的备份平台。3.2 备份服务器规划3.2.1 服务器1. 功能用途备份管理服务器是整个备份平台的“大脑”,它的主要职能是调度备份任务,分配备份资源,同时也是备份平台管理的主要接口。备份一体机和备份客户端接受备份管理服务器的统一管理。OpsCenter是NetBackup的Web管理结构、告警平台以及报表心。简单来说,管理服务器承担三个功能角色: NetBackupMasterServer NetBackupOpsCenter2. 拓扑结构备份管理服务器由两台服务器组成,安装RedHatLinux 64bit操作系统,使用Veritas Cluster Server做成两节点集群,Catalog存放在中低端磁盘阵列上。3. OpsCenter架构在正常情况下OpsCenter和Master Server分别运行在不同的节点上,当一个Master Server节点出现故障时,VCS将自动把服务切换到另外一个节点。OpsCenter通过Netbackup通用通讯组件pbx和Master Server进行通讯,定期从Master Server获取各种备份状态信息,然后SNMP或者邮件方式发送给管理员。OpsCenter和集中监控系统的告警采用标准的SNMP协议。4. 备份一体机架构备份一体机充当介质服务器(Media Server),负责备份存储(一体机存储空间和物理带库)的管理,双中心结构下每中心采用两台等容量的备份一体机进行整体备份、容灾和磁带出带。首先,在日常工作中,每个中心的两台一体机分别负责一部分业务系统的备份,在各自完成备份任务后再后台进行两台一体机之间的优化复制,实现单中心两副本;其次,生产中心和容灾中心的备份一体机采用AIR复制技术进行容灾同步,实现全部备份数据四个副本。3.2.2 客户端备份客户端为新数据中心的所有应用和数据库服务器,在新的数据中心中,客户端的操作系统有PowerVM client端的AIX,X86平台虚拟机操作系统linux、windows、SUSE系统,客户端的数据库有ORACLE、DB2和SQL及非结构化的文件和音视频文件,建议使用多网卡绑定技术提高网路带宽和可靠性。新数据中心200多套系统使用的服务器、操作系统、数据库均在NBU 支持列表之内。3.3 备份设备规划3.3.1 物理带库规划物理带库作为长期保留和辅助备份设备,主要用于存放长期保留的数据和音视频文件。建议新购一台企业级磁带库,新购磁带库配置建议如下: 8 个LTO-6 磁带机 非压缩225T以上可用容量。3.3.2 备份一体机规划备份存储的需求是通过对现网生产备份对存储需求调研的基础上,增加了新建应用的备份需求,同时对新数据中心虚机操作系统的备份对存储的需求做了预估,共需要可用存储容量为225T。详细需求如下:现网生产备份存储需求:具体应用名称系统名称文件(G)数据库(G)二代支付二代支付A 75二代支付B 4770二代支付 前置PMTS A机 二代支付 前置3二代管理密押服务器二代支付前置定制机 1龙图非税嘉峪关5IC卡业务IC卡业务管理 6001260IC卡管理DB1080国际业务国际业务A机 200国际业务B机 (左)21自助银行自助银行APP1 A机 1691自助银行APP2 B机 1自助银行APP01 、APP1 B机 911自助银行数据库01 新ATMP跨平台数据库A机 移动营销2 6150乡村通乡村通A机 app 501乡村通DB1135密码平台密码平台A机 260密码平台B机 60电子验印系统电子验印应用14电子验印数据库90电票系统电票系统APP0118电票系统DB60ACSACSDB012ACSAPP015.4绩效考核管理系统绩效管理数据库A1000出纳管理系统出纳管理系统022支付信息统计分析支付信息统计分析数据库服务器600头寸FTP头寸数据库应用服务器2457国库集中支付国库集中支付APP011国库集中支付DB018网银 电子银行系统网银数据库服务器0121网银交易应用服务器1100网银交易应用服务器2100网银后台管理服务器2160网银后台管理服务器1160呼叫中心呼叫中心VPAPP A机(左)600呼叫中心CTI A机(右)60044.1呼叫中心CTI B机(左)呼叫中心ASE A机(左)600呼叫中心TTS服务器(右)600呼叫中心知识库A(左)600呼叫中心数据库A21短信平台短信平台A机86.8移动营销移动营销MDM数据库服务器2移动营销数据库服务器14内部网站B机 (右)91理财系统理财数据库服务器01100理财应用服务器0121审计系统审计系统A机1370322事后监督事后监督及风险预警OCR数据库161事后监督及风险预警系统ECM数据库196FTPFTP头寸数据库10001104报表系统1104数据库服务器A2201104WEB服务器(右)200积分客户管理积分客户管理数据库服务器600CRMCRM数据库服务器12000反洗钱反洗钱数据库服务器A EAST数据库服务器B20557.2反洗钱数据库服务器B EAST数据库服务器A803.6EAST数据库反洗钱数据库服务器B EAST数据库服务器A100IT风险数据报送系统 风险监控web在虚拟机 生产虚拟化池源数据DB、Web服务器10指标数据DB服务器10人力资源平台人力资源管理数据库,应用21人力资源管理数据库,应用1在线学习系统在线学习系统50精准扶贫明细台帐系统精准扶贫明细台帐系统115内控合规与风险管理三合一系统内控合规与风险管理100内控合规与风险管理3000人力招聘系统人力招聘应用服务器人力招聘数据库服务器60IMC认证系统IMC服务器A机1堡垒机系统运维安全审计系统应用发布系统堡垒机196桌面安全系统桌面安全A204华三智能巡检管家1域控子系统DC02 域控子系统20ITSM监控ITSM监控系统网络ITSM监控系统10060ITIL管理系统ITIL管理系统60ITIL运维管理系统30档案管理系统档案管理系统500IT应用监控平台IT应用监控平台A机(左)1项目管理平台服务器项目管理平台服务器14合计:8T30T38T新建应用备份存储需求:序号系统名称数据类型GB1新一代信贷管理生产数据库10500报表数据库文件数据2Bancs核心系统3个数据库备份300003个数据库备份文件系统3CRM系统数据库数据1000数据库数据数据库数据应用数据4ECIF系统数据库数据3000数据库数据数据库数据应用数据5IBPS超级网银系统数据库数据3000数据库数据数据库数据应用数据日志6ODS系统数据库数据15000文件数据7财务管理系统8风险预警系统数据库数据12009ESB系统数据库4000数据库ESB应用(日志文件)10个人征信系统数据库数据2000应用数据11企业征信系统数据库数据2000应用数据12统一身份认证系统数据库数据200目录数据应用数据13总账系统GL总账文件备份50000AE会计核算(FDM)文件备份AEI会计引擎界面(BPM)文件备份CUA文件备份Solution Manager/SMP文件备份GL总账数据库AE会计核算(FDM)数据库AEI会计引擎界面(BPM)数据库CUA数据库14柜面系统数据库数据350015批量系统财政子系统特色业务系统小前置业务系统中间业务系统数据库数据1500合计126.9T甘肃银行新数据中心备份存储需求统计:现网生产数据库和文件新建系统数据库和文件现网改造加新建应用虚机操作系统38T127T60T合计:225T当前部署的应用是未来计划部署应用的一半,考虑未来应用的扩展,备份存储应该450T,备份一体机提供重复数据删除技术,从测试结果来看,数据库、虚机和文件的备份重复数据删除率都超过80%,故备份一体的可用空间在90T以上就能满足未来新数据中心备份的需求,空间使用率在80%以下时备份一体机性能最好,建议的备份一体机配置为112TB。3.4 备份SAN规划为了和生产SAN完全隔离,专门设计了备份的SAN网络。为实现同城容灾需求,核心备份业务的VF(Virtual Fabric)和其他业务备份SAN交换机,作为Edge Fabric通过备份路由VF Core Fabric与同城灾备中心备份VF实现级联。保证每个生产区备份VF的主机可以与集中备份平台的存储和物理带库互通,以实现LANFree备份。从SAN硬件底层做了高可用,保证了备份的可靠性。物理机采用SAN Client技术实现LAN Free,虚拟化平台需要将DataStore所在的LUN以只读方式Mapping给备份一体机,实现LAN Free。3.5 备份LAN规划备份LAN架构:备份LAN的设计和生产是独立的,每台主机备份网先连到机柜的TOR,新的数据中心专门设计了两台备份汇聚交换机,从TOR上来的备份网络直接连到这两台备份汇聚交换机,在汇聚交换机上,为每个生产区的应用划分了独立的Vlan,使得每个生产区逻辑隔离。备份服务器放在核心生产区,在备份汇聚交换机上设置的策略是备份服务器可以访问每一个区的每一台备份服务器,由于Vlan的隔离,各区之间服务器是不能互访的。Master Server与备份一体机以及Client之间的网络通讯必须通过特定的端口进行,具体要求如下:备份软件现在只支持防火墙静态的NAT技术,不支持动态NAT转换。需要打开443、902、1556、13724 (双向通信)防火墙端口。允许长连接,不要设置连接超时。3.6 备份数据复制双中心之间备份数据和备份索引Catalog通过AIR复制技术从生产中心复制到容灾中心。单个中心内的两台备份一体机采用优化复制技术进行备份数据同步。3.7 备份性能总数据量备份窗口=备份性能第四章 备份系统容灾设计4.1 备份系统容灾架构概述两台Master Server,安装Linux操作系统。两台备份一体机充当Media Server,负责LAN和SAN Client备份;备份设备为两台一体机和一台物理带库。正常情况下,Master Server备机处于开机状态,分别部署Netbackup Master Server和OPSCenter,利用VCS构成互备模式,备份一体机和Client由生产中心的Master Server管理,备份设备由备份一体机管理。当Master Server发生故障时,通过VCS进行切换;当一台备份一体机发生故障时,由另一台备份一体机接管所有备份业务。架构说明:1. 备份容灾环境由如下设备组成:1) 两台NBU master server,两台备份一体机。2) 一台物理带库2. 在设计中加一台物理磁带库有两个作用:1) 直接出带。2) 数据归档和数据恢复。3) 音视频文件的直接备份。3. 备份数据和备份索引Catalog通过AIR复制技术从生产中心复制到容灾中心。4.2 备份服务器规划4.2.1 服务器1. 功能用途灾备环境的备份服务器是热备机,平时用于容灾保护、容灾中心的业务保护和恢复验证,只有生产中心出现故障时会激活生产中心的备份策略,对生产中心进行备份保护。2. 拓扑结构3. 备份管理服务器为两台服务器,利用VCS形成集群,安装RedHat Linux 64bit操作系统,备份服务器需要连接共享存储、备份SAN、备份LAN、生产LAN。4.2.2 客户端容灾中心的备份客户端为所有建设的同城灾备的系统,在同城容灾中,客户端的操作系统有PowerVM client端的AIX,X86平台虚拟机操作系统linux、windows、SUSE系统,客户端的数据有ORACLE、DB2和SQL,建议使用多网卡绑定技术提高网路带宽和可靠性。4.3 备份设备规划4.3.1 物理带库规划建议新购一台企业级磁带库,新购磁带库配置建议如下: 12 个LTO-6 driver 非压缩225T个以上可用容量4.3.2 备份一体机规划Netbackup 5240 112T 两台。4.4 备份SAN规划参照备份系统整体架构中SAN规划。4.5 备份LAN规划参照备份系统整体架构中LAN规划。4.6 磁带的保存4.6.1 磁带异地保存有效期超过1年的数据,将会复制一份,然后在专门的数据中心进行保管(建议在同城容灾中心)。出库频率为每月一次。当带库中没有可用磁带时,把保存时间最长的磁带取出保管,然后放入新磁带。4.6.2 磁带离线管理对于保管在同城容灾数据中心的出库磁带,建议放在专用的磁带介质保存柜,并定期进行恢复测试,以验证磁带的可用性;对于将要达到磁带保存寿命(LTO6的磁带寿命是15年)的磁带,可将磁带从数据中心取回放入生产中心的磁带库,使用集中备份软件的Copy功能来将此磁带复制到一盘新的磁带进行保管;4.7 容灾切换当生产中心出现灾难需要进行容灾切换时,备份系统的切换将分为如下两个层面进行:备份平台的切换:包括Master server、备份一体机,当Master Server发生故障时,由于Catalog库在共享存储上,所以,通过VCS直接对Netbackup主服务器程序和服务IP进行切换后完成;备份一体机两台构成存储池,平时各负责一半的备份任务和备份后的快速同步,当一台发生故障时,由存储池中另一台备份一体机承担所有备份任务。备份客户端切换:备份系统在进行备份时,会访问客户端集群的服务IP,当客户端发生故障切换时,服务IP会随业务切换完成切换,对备份系统而言,这个过程是全透明,无感知的。4.7.1 备份平台的切换Master Server切换当生产中心发生灾难,需要使用容灾中心的备份平台进行备份时,切换流程如下:1) 在容灾端Master Server上启用已经配置好的备份策略。2) 手工配置生产中心的Master Server的IP地址至容灾中心备份平台。3) 生产中心客户端受容灾中心备份平台管理进行备份。4) 完成上述切换过程预计需要1小时。4.7.2 介质服务器切换介质服务器不需要切换,因为容灾端的备份一体机一直是Online的,可以直接使用。4.7.3 备份客户端的切换同城容灾中心的客户端不需要切换。第五章 数据备份方法与策略5.1 备份对象分析新数据中心统一备份系统备份的对象和内容如下表:AIXLinuxWindowsSuseOracleDB2SQL应用PowerVM平台X86的VMware平台X86物理机Power物理机5.1.1 数据库数据库备份原则:数据库是备份系统的主要保护对象,甘肃银行在新数据中心有88套数据库,数据库的类型有ORACLE、DB2、SQL,NBU都可以支持这些数据库的在线备份方式。1. 数据库在线备份1) 备份方法:核心、交易类系统每天全备份一次。管理类系统如果数据量小于500GB的每天全备份一次;大于500GB的每周全备份,每天进行一次增量备份。备份数据库的同时,将会对数据库日志进行备份。1) 备份流程: 2. 数据库日志备份1) 备份方法:核心、交易类系统数据库日志每小时备份一次,管理类系统的数据库每4小时备份一次。每次备份完成后,删除一天以前的日志文件。2) 备份流程:5.1.2 应用程序和应用日志1. 应用程序在备份变更前后,由应用负责人提出申请,备份管理员手工发起备份,备份数据的有效期以各应用的要求为准。2. 设置备份专用目录,应用把需要备份的数据拷贝在备份目录下,备份系统按照应用的要求,进行策略设置、备份,备份完成后,备份系统删除备份过的文件。如果应用系统对应用日志的备份有特定需求,需要在详细的备份需求中提出。5.1.3 VMware虚拟机操作系统1. 备份方法VMware vStorage API for Data Protection通过部署在物理机或者虚拟机上的代理服务器对VMware ESX/ESXi以及其上运行的虚拟机群(Windows,Linux等)进行全面的数据保护。2. 备份的方式有:1) 对虚拟机上的操作系统的全备份;2) 虚拟机增量备份;3. 备份频率所有的虚机操作系统每个季度备份一次,保留两个版本,且每套系统在变更前后进行备份。4. LAN Free备份VMWare的LAN Free备份需要将VMWare的DataStore所在的LUN以只读方式Mapping给备份一体机。5.1.4 Power 平台操作系统备份方法:1. PowerVM client端的AIX系统,使用NBU的BMR备份模块进行备份。每个季度和系统变更前后对操作系统进行一次备份,备份数据保存一季度。2. LPAR和全分区的AIX操作系统,AIX 机器数量比较少,且都是核心系统,仍延用系统克隆的方式进行备份。在系统变更前后对操作系统进行一次备份,备份数据保存在本地硬盘上。5.1.5 X86物理机操作系统备份方法:3. 在新数据中心每个区域内,都设置有X86物理资源池,使用NBU的BMR备份模块进行备份。每个季度和系统变更前后对操作系统进行一次备份,备份数据保存一季度。5.1.6 NBU服务器备份方法:1. 建立本地的高可用环境(即NBU Master Server 分别安装在HA的双机上,而数据库文件则建立在共享的盘阵上)。2. 利用NBU自带的Catalog备份功能,在备份任务完成后进行备份。数据保存在物理带库上。5.2 传输方式选择本项目使用的备份方式有两种:LAN 备份、LAN_Free备份。选择标准如下: 每天备份数据量小于200GB 的采用LAN 备份。 每天备份数据量大于200GB 的采用LAN_FREE 备份。 虚机的操作系统及数据库、应用程序和文件全用LAN Free的方式备份。5.3 全量、增量选择本项目使用全量备份和增量备份两种类型,选择标准如下: 核心类系统每天全备份,备份数据保留一个月。 生产类数据库,如果数据量小于500GB,每天全备,保留7天;如果数据量大于500GB,每周一次全备份加每天的增量备份,备份数据保留一个月。 管理类及其它文件类型数据,如果数据量小于100GB,每天全备,保留7天;如果数据量大于100GB,每周一次全备份加每天的增量备份,备份数据保留一个月。 虚拟机操作系统每个季度和系统变更前后对操作系统进行一次备份,备份数据保存一个季度。 PowerVM的client端AIX操作系统,每个季度和系统变更前后对操作系统进行一次备份,备份数据保存一年。 PowerVM的VIOS和LPAR操作系统,使用磁盘克隆的方式进行备份。保留31天保留7天保留31天保留7天保留7天保留31天保留1个月5.4 备份时间窗口备份调度尽量分散,平均分配。每周预留两个2小时的维护窗口,不执行任何备份作业。初步确定为周三、周六的00:00-02:00。数据库和文件备份一般安排在18:00-8:00,工作时间安排日志备份、备份一体机之间的复制和出带。5.5 临时备份策略临时备份策略以当时沟通为准。第六章 数据恢复方法与策略6.1 生产环境数据恢复6.1.1 数据库恢复1. ORACLE数据库恢复可以通过本地或容灾端的NBU Server结合备份一体机,利用备份数据进行LAN和LAN Free数据恢复。恢复时,NBU可以实现多线程的数据恢复,如果数据在磁带上,可以利用NBU独特的磁带分类集中存放技术,减少磁带的就位时间,提高数据恢复的效率。1) 先用最近一次的全备份恢复恢复最近一次的增量备份增量备份到断点的ARCHIVE LOG来恢复(要求数据库在ARCHIVE LOG模式下工作)。这种恢复方式比全部用ARCIVE LOG恢复要快。2) 如果两份的最近一次增量备份都不可用,可以追溯再上次的增量备份来恢复,然后用增量备份到断点的ARCHIVE LOG恢复。3) 如果最近一次的全备份恢复都不可用,上个周期的全备份上个周期的最后一次增量备份本周期的最近一次增量备份增量备份到断点的ARCHIVE LOG来恢复。4) 如果增量备份都不可用,那么可以用全备份ARCHIVE LOG来恢复。2. DB2数据库恢复NBU支持通过调用DB2的恢复接口进行各种恢复操作。能够利用备份数据通过LAN或者LAN_free完成恢复操作。支持DB2日志的Copy模式和存档模式,建议采用Copy模式,降低业务系统与备份系统的耦合度。SQL Server数据库恢复SQL数据库的恢复操作在NBU图形界面中完成,NBU支持数据库级别、文件级别的恢复以及整个数据库的复原,文件复原和页复原。6.1.2 应用程序和日志恢复应用程序和日志都是做为文件来备份和恢复的,恢复操作的目标是让备份的文件回到期望的某一时间点。备份的方式决定了恢复的方式,NBU对于文件备份的方式采用全量备份和备份加速技术的永久增量备份方式。1. 全量备份的恢复方法全量备份一般会保留若干版本,恢复时只需指定恢复的版本。2. 备份加速的永久增量备份加速备份除了第一次需要进行全量备份之外,以后每次都进行增量备份,在完成备份后,在备份一体机内完成备份后通过合成生产全备份,无须进一步的全量备份,在恢复的时候与全量备份相同,但备份时间会大幅减少。3. GRT恢复无论何种备份方式,在NBU中,都可以通过图形界面选择需要恢复的文件进行粒度恢复,GRT技术无需代理,可直接使用。6.1.3 VMware虚机操作系统的恢复NBU支持虚拟化的无代理备份,可支持虚拟机整体备份和恢复,并支持GRT粒度恢复,提供虚拟化的更名恢复、换ESXi恢复和恢复后的开关机状态选择,同时支持对虚拟机中的单个文件和已认证应用的恢复。6.1.4 Power平台操作系统恢复1. PowerVM平台操作系统的恢复NBU的BMR功能针对主流操作系统进行备份和恢复,提供了网络引导功能和光盘引导两种选择,网络引导需要配置Boot Server,光盘引导需要制作引导用的ISO光盘映像并刻盘备份,无论网络引导或光盘引导,都可以在系统升级后进行升级,在操作系统需要恢复时,只需要发出“prepare to restore”(准备恢复)命令,系统就开始执行恢复。些时,BMR将立即检索客户机配置数据,并使用该数据创建一个定制化的客户恢复程序。然后,通过网络为客户机发送相应的引导数据和文件系统。客户机将通过BMR boot server执行引导,并开始运行定制引导程序。引导程序将执行一列任务:l 通过BMR File Server,安装必需的启动系统。l 根据BMR server中的信息配置磁盘、逻辑卷、文件系统等。l 向NetBackup发送命令,从NetBackup server恢复文件,其中包括操作系统、配置数据、应用程序和用户文件。l 完成这些任务后,客户机将配置引导记录及配置数据库,并重新执行自引导,然后系统即正常运行。2. Power平台LPAR操作系统的恢复由于Lpart的AIX操作系统的备份是通过Clone的方式备份的,如果需要恢复操作系统,只需从Clone的硬盘引导即可恢复。6.1.5 X86物理机操作系统的恢复X86也是通过BMR模块进行备份,恢复过程与PowerVM相同。6.1.6 NBU服务器的恢复当NBU服务器故障按以下步骤处理:1. NBU Sever建立在HA的环境下,一旦运行的NBU Server瘫痪,将由Standby NBU Server自动接管。2. 当NBU Catalog发生损坏时,利用对NBU Catalog数据库所作的磁带备份,利用NBU Restor Catalog功能恢复本地数据库,直接恢复NBU Server。6.2 备份数据恢复验证备份数据的恢复验证是确保备份数据有效性的重要手段。通常情况下,由于生产数据不能直接在生产环境里进行数据的有效性验证,所以把准生产环境做为甘肃银行备份数据的恢复验证区。恢复验证区说明1. 准生产区同时设计为备份的恢复测试区,两个区域复用,无需单独建设恢复测试区域。由于准生产没有备份的需求,不单独设计备份策略。2. NBUserver服务器在核心生产区,它和准生产区是两个安全级别不一致的区域,为了实现NBU的恢复测试功能,在备份的防火墙上开放备份专用端口。甘肃银行全行所有的备份数据都在备份存储上,数据需要恢复验证,数据的流向如下图,把生产的数据直接恢复到准生产区,进行备份数据的有效性验证。6.3 开发测试环境取数根据调研发现,应用人员有很大的从生产取数据的需求,用来模拟生产环境进行开发和测试,由于生产数据含有大量客户的真实信息,为了防止客户信息泄露,必需要对生产的数据进行脱敏,当前脱敏采用的方法是运维人员通过事先编好的脚本,对数据的关键词进行批量替换,这种方法效率低,且仍有数据泄密的风险,我们建议建立专门的脱敏平台,对客户数据进行脱敏。开发测试环境从生产环境取数的流程是:1. 在VMWare平台搭建NBU Velocity虚拟化平台,配置用于Oracle副本管理的存储空间。2. 利用NBU的Velocity模块,对生产系统Oracle数据进行快照。3. Velocity配置脱敏接口并对Oracle快照做快照复制,生成脱敏副本进行脱敏,脱敏成功后删除第一份Oracle快照,只保留脱敏副本。4. 将Velocity平台与生产脱离,接入研发系统供给研发使用。5. 研发使用完成后,将Velocity中数据清零后接入生产系统。第七章 产品实施良好的实施和售后是保证项目可靠运行的基础,本章节就备份系统实施过程中的细节进行描述,以实现最佳的项目执行效果。第八章 硬件实施部分8.1 NBU 5240 环境及电气要求8.2 NBU 5240 硬件示意图5240 前视图5240 后视图5240 扩展柜连接一个扩展柜两个扩展柜8.3 NBU 5240 IPMI IKVM设置使用IPMI is a protocol that runs on the appliance for monitoring and managing devices .The IPMITOOL is a command-responding tool that complies with the IPMI. IPMITOOL utility is used to: Implement the network setting for the IPMI port of the NetBackup 5240/5020 appliances. Query important information of the NetBackup 5240/ 5020 appliances, such as logs, temperature, voltage, and fan speed. Gain access to console to manage the appliance in case of any Network issues using iKVM.IPMI IKVM 是NBU 5240 内部集成的KVM,通过网络进行访问,对硬件设备进行管理,重启NBU5240,检查硬件健康,RAID 配置检查等。此口位于NBU 5240 后面,有文字标示:默认IP: 0 默认用户:sysadmin 默认密码:Pssw0rd以上信息,可以在BIOS里进行修改8.4 NBU 5240 登录管理方式NBU 5240 有三种登录管理方式:Web方式登录方式 , CLISH Interface 登录方式,ro

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论