某人寿保险IT系统基础架构容灾经验分享_第1页
某人寿保险IT系统基础架构容灾经验分享_第2页
某人寿保险IT系统基础架构容灾经验分享_第3页
某人寿保险IT系统基础架构容灾经验分享_第4页
某人寿保险IT系统基础架构容灾经验分享_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

xx人寿IT系统基础架构容灾经验分享

XX人寿保险股份有限公司系1996年8月22日经中国人民银行总行批准成立的全国性、股份制人寿保险公司。

截至2012年,XX人寿总资产超4100亿元,净资产近210亿元,在全国设立了北京、上海、湖北、山东、广东等35家分公司,各级机构超4200家,构建起完整的服务网络为客户提供及时和周到的服务,累计为2776万个人客户和25万机构客户提供过服务,累计理赔客户927万人次,累计理赔金额99亿元。

XX人寿旗下拥有XX资产管理有限责任公司、XX养老保险股份有限公司和XX之家投资有限公司。XX资产是国内资本市场大型机构投资者之一,受托资产管理总规模超4600亿元,综合投资收益率居于行业前列。2012年,XX人寿和XX资产分别通过“保监会不动产投资能力和投资计划产品创新能力备案”,成为《保险资金投资不动产暂行办法》实施以来,行业内第一批取得不动产直接投资、不动产金融产品设立与发行双重资格的保险集团化公司。

未来,XX人寿将坚持专业化经营,深耕寿险产业链,为广大客户提供“从摇篮到天堂”持续一生的全方位金融保险服务,致力于让保险更便捷、更实惠,让XX人寿成为人们生活的一部分。客户简介

1.客户急需解决的问题与需求2.什么是容灾3.容灾方案的选择4.容灾技术5.数据远程容灾软件

6.容灾演练客户需求

ECM系统作为XX人寿重要的在线业务支撑系统,为一线业务人员提供在线的电子文档、电子保单等服务。主数据中心:金融街数据中心,运行所有重要系统的核心机房,满足所有重要系统的数据备份、恢复需求。ECM系统是金融街数据中心中最重要的系统之一。在2008年部署了EMC与HDS存储,作为高速存储负责OLTP事件型oralce数据库核心并且同时存放海量影像文件。为ECM系统提供了一个高性高效率能的存储池。由于现在地址灾难和各种火灾停电等因素造成只有一个数据中心的xx人寿数据安全性相对较低,而随着国家法律法规对于金融保险行业的要求,在同城建设数据容灾中心成了重中之重的任务。规划本地容灾中心:亦庄容灾数据中心,满足ECM系统的本地数据级容灾需求,通过40Mbit带宽传递容灾数据(每天的新增数据),实现了数据级容灾。同时由于本套系统为客户的核心业务数据库存放的系统,所以在保障数据安全性的前提下对存储系统的性能有很高的要求,不能因为部署容灾中心增加了容灾传输的性能压力后就影响当前的客户数据正常访问。客户现状金融街数据中心主业务存储主机群集主机群集主机群集主业务存储性能情况什么是容灾容灾备份系统就是防止意外情况而采取的一种解决方案,其目的只有一个,那就是保证数据安全。根据DisasterRecoveryJounal的调查表明,在受到灾难袭击的5个公司中,将有2个公司无法从灾难中重新开始工作。而那些即使是重新开张的公司中,也将有至少1个将在两年后关张建设容灾系统的目的就是保护所有的业务数据,保证业务的连续性什么是业务连续性业务持续性(ContinuousBusiness)=保证业务的稳定保证企业可以面对计划的和意外的事件发生的时候继续维持运作受到对下面两个方面的理解的驱动业务影响:考虑如何避免对商业的影响业务流程与风险:考虑计划和意外事件发生时的情况数据的可用性保护只是操作灵活性的一部分,最终的解决方案将会围绕着其它方面(例如人员、流程和架构等)(恢复策略)Backup策略Replication策略GeoClusterSynchronousReplicationAsynchronousReplicationDBlog性价比WhataboutApplicationavailabilityandbusinessaccessavailabilityApplicationDataBusinessAccessCMCC运营方式技术难度业务恢复速度维护人员要求资源复用主备中心相对简单慢相对简单相对不高较低双中心相对复杂快相对复杂相对较高较高两种方式同城容灾远距离容灾灾难抵御种类较少较多对用户服务的连续性较差较好网络组织难度较容易难度较大技术复杂度较容易难度较大容灾中心技术支持较好较差人员组织较容易难度较大项目管理协调难度低高工程投资较低较高运营成本较低较高建设周期较短较长两种方式同级设备容灾主机处理能力与生产中心相等存储设备与生产中心配置相等容灾中心系统可靠性与生产中心设置级别相当,如主机集群等投资高,与生产中心平台投资接近降级设备容灾主机处理能力低于生产中心存储设备配置低于生产中心容灾中心系统可靠性低于生产中心设置级别,如不考虑主机集群等投资低于同级规模CMCC设备配置策略存储级数据库级(Oracle)IPStor第三方软件(VVR)LVM(VxVM)数据复制策略Recovery-timeObjective(RTO)多长时间内关键应用必须恢复–

我能承受多长时间宕机?Recovery-pointObjective(RPO)哪一个时间点之前的数据必须被恢复–

我能容忍多少数据丢失?被选定的切实可行的灾难恢复方案必须基于成本和恢复时间的平衡如果我花费多一点,我的恢复过程会快多少?如果我花费少一点,我的恢复过程会慢多少?预定的恢复目标决定相关解决方案需要对中心机房所有的主机系统都有进行改造,改为使用VeritasVolumeManager。而这种方式需要把IBM主机上的VG信息都铲掉,即所有的数据库都要首先备份到磁带库上,然后把IBM主机的卷管理软件改为VeritasVolumeManager,然后重建VG,再把数据从磁带库上恢复出来。系统风险极大!在实施阶段很容易造成现有系统的不稳定、数据丢失项目实施周期长,并且需要每个业务主系统都要多次停机,社会影响较大VeritasVVR通过主机实现,对主机系统和应用系统影响较大性能不可预测、难于优化、需要在每台主机上都进行配置和优化如果采用VeritasVVR解决方案,需要对生产中心的8台IBM主机、将近20个分区、容灾中心将要购买的所有主机和分区都要进行改造,工作量可想而知!如果进行软件升级,则所有的主机则都要重新调整,不但工作量大,而且风险高!如果采用VeritasVVR解决方案,将来的新建系统都要进行相同的工作,工作量很大VeritasVVR是按照CPU个数计算License,成本不菲而采用IBM硬件容灾方案,是与主机无关的;如果采用IBM存储解决方案,那么只对2台存储进行操作。将来微码升级、系统配置也只针对2台存储。软件解决方案

HDS虚拟化方案IBM方案方案复杂度复杂简单实施复杂度复杂简单实施风险在生产端要把EMCDMX3000虚拟化,需要把主机映射关系重做小是否适合大型数据库不适合,目前来看虚拟化方案仅适用于文件系统应用适合对整体系统性能影响对EMCDMX3000的每一次访问都要通过USP机头,对系统性能影响可想而知无影响软件维保成本每年需要维保成本,标准配置无现场服务;如需现场服务,需额外购买软件维保随存储硬件设备提供,不增加额外成本;IBM提供现场服务容灾成功案例较少很多对集成商的工作影响大小硬件解决方案SynchronousRemoteReplication同步复制实时镜像,数据同步系统快速恢复,最少数据丢失理论极限值100km,距离越长,时延越大高带宽需求(I/O峰值计算)对生产端I/O响应时间冲击备份端存储处理能力要求足够好否则会连累生产端,导致宕机Cache、DestagingSynchronous1-Writetoprimary2-Writetosecondary3-Writecompleteonsecondary4-I/OCompletion1生产主机

可以无需备份主机342100公里P-VOLS-VOL同步数据复制的理想条件网络带宽光纤1000Mb/sATM622Mb/s距离<10公里,最长不超过30公里TheRollingDisaster...(IBM,4/8/94)“Exceptinatotaldisaster,(explosion,earthquake)youshouldNEVERexpectyourentiresystemtofailatthesamemoment.Failureswillbeintermittentandgradual,andthedisasterwillactuallyoccurovermanyseconds,evenminutesThisistheRollingDisaster”.除了地震,爆炸等完全毁灭性灾难外,你根本不可能碰到系统同时瘫痪的情况。故障总是间断的,渐渐的累积起来的,整个灾难的过程会持续数秒钟,甚至几分钟,这就是我们所谓的RollingDisaster。同步方式的挑战:RollingDisasterRollingDisaster数据保持I/O的一致性数据结构可能被破坏,数据不可用第一波故障灾难结束-计算终止Corruptioncanoccur保证数据一致性和完整性TimestampwritesequencingConsistencygroup最小的响应时间冲击低带宽(平均I/O计算)很少的数据丢失没有0数据丢失Asynchronous1生产中心容灾中心PrimaryHost

3421-Writetoprimary2-I/OCompletion3-Writetosecondary4-Writecompleteonsecondary任何距离S-VOLP-VOLMainframeVSE,VM,OS390IBMAIXSunSolarisHP-UX,TRU-64andVMSWin2K/WinNTAsynchronousRemoteReplication异步复制容灾方式的采用同步容灾的理想条件距离<30公里两地有光纤连接或者622Mb/sATM异步容灾没有距离限制在实际银行、电信的应用中,同步容灾对联机事务处理类的业务会增加响应时间,对批处理业务处理速度也有很大的影响技术的选择是性能,投资和RPO等指标的平衡应用级容灾,需要针对容灾对应用做出相应的调整cache5nanoseconds/m–speedoflightinFiber2microseconds/switchupto1ms–writeintocachememoryupto30ms–writetoback-enddisk时延考虑Σ=~1ms1,000IOPSforlocalwritetocachesynchronousconsiderationscachecachewriteIOcomplete5ηs/m2μs/switch1mscachewrite+0.3mscachereadremotelinklatency1mscachewriteΣ=~2.3ms 435IOPS@0km100kmFCdirect ~1ms(ROT)DWDM ~250ηs/devFCIPEurope ~19msFCIPtransatlantic ~81msFCIPNorthAmerica ~44msFCIPSing.<->US ~210msΣ=~3.3ms 303IOPS@100kmΣ=~83ms 12IOPS@IPLondon-NY数据远程复制软件移动BOSS/BAS系统容灾(原有系统)CRM计费结算营业帐务经营分析DB2OLAP数据挖掘…

SAN经营分析系统SANSANDWDM钦洲北路机房金桥机房关于容灾链路的问题目前情况看,容灾链路主要有以下方式将长波口放置在大交换机上(湖南、上海移动)将长波口放置在小交换机上大、小交换机不互联(辽宁移动、江苏移动)大、小交换机互联(ISL)容灾链路到底需要多少对光纤需要采集现有生产系统的数据对现有生产系统进行先期优化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论