




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1背景我行多套业务系统(如柜面业务、支付业务、前置服务等)应用服务器集群存在应用节点之间共享目录的文件访问需求,在系统的前期建设中因当时IBM的GPFS技术相对成熟而且同业广泛的实践均反馈良好,同时GPFS在AIX系统上有较为良好的适配性,因此我行对支付业务采用了基于AIX高可用架构搭建GPFS并行文件系统、对柜面业务采用基于虚拟化技术搭建GPFS并行文件系统来实现应用集群共享文件需求。GPFS在行内部署的多年来有效支撑了应用运行与相关业务发展,但是由于我行在实施LINUX替代工作、虚拟化环境部署GPFS存在特殊性,以及GPFS维护管理相对的复杂性。因此在行内藉由数据中心搬迁工作投产了华为OceanStorDorado18000系列SAN/NAS一体化双活的高端存储,同时启动了NAS专业存储设备替换GPFS的工作。本文将围绕GPFS在行内应用的实际情况和华为NAS存储技术的先进性展开讨论中小规模的城商银行在文件共享场景下从GPFS迁移企业级NAS实践路径和思考。
2GPFS的行内前期应用现状(以我行柜面业务为例)我行前期已大规模应用服务器虚拟化技术为业务系统提供计算资源,柜面业务正式部署于虚拟化平台之上,同时又部署了GPFS集群满足文件共享需求。在上图所示的LINUX系统以及虚拟化环境下部署GPFS集群需要达成以下条件:1.首先要在虚拟机之间共享虚拟磁盘。集中式存储通过SAN网络向虚拟化集群映射NSD磁盘;2.虚拟机要添加额外的SCSI控制器管理共享的虚拟磁盘,在第一个虚拟机上首次添加并创建共享虚拟磁盘,在其他应用虚拟机里使用“添加已有磁盘”功能增加同ID的共享磁盘挂载;3.因柜面应用节点是基于同城双活方式部署,在生产中心与同城中心各部署10个节点,为保障GPFS并发文件系统的数据一致性以及高可用,要设置MASTER节点,选取主中心的3个应用节点作为MASTER,以保证在2个及以下Master节点故障的情况下,存活的Master节点能继续控制GPFS集群提供服务。使用虚拟化环境部署GPFS集群在一定程度上简化了系统的组网,并且更高效的利用了物理设备资源,但是也正是因为虚拟化的技术特性同时带来了运维工作存在一定复杂性与技术痛点,结合GPFS的技术特性,总结以下6点:1.在虚拟化平台上使用共享虚拟磁盘的虚拟机不能像普通虚拟机一样执行在线迁移,导致如果出现在虚拟化平台维护时需要关闭应用节点操作系统而不是通过在线迁移完成无停机的维护。2.共享虚拟磁盘的虚机不支持使用快照功能,导致虚拟机不能执行快照、克隆、备份,在需要以上运维操作的场景会对运维工作造成影响。3.GPFS集群的日常维护对于相关技术有门槛,增加了运维工作复杂度。相较于Linux的ext3、ext4、XFS、NFS等传统文件系统的运维管理技术门槛较高。4.从行内部署了GPFS集群文件系统的应用使用场景考虑,柜面业务需要对代发工资文件、配置参数文件、部分日志文件实现共享,这类场景的共享文件经生成或上传后基本不会被修改,同时也没有高并发的写入和修改需求。但是GPFS并发集群文件系统的技术优势在于对大容量文件系统以及大文件的读写支持,尤其是对于大文件高并发的场景具有较大优势,但是我行目前的文件共享需求场景不能充分发挥GPFS的特性优势。5.由于我行GPFS是随前期系统新建时即部署,使用时间已较长,该版本已经处于EOS状态。从后续软件稳定运行以及安全性角度考虑,需要进行版本升级或者产品替代。6.GPFS文件系统对底层的SAN存储网络以及集中式存储设备有着强依赖关系。GPFS磁盘通过集中式存储的远程复制技术实现跨中心容灾,但在我行环境未使用双活技术。各类文件备份通过外接的第三方带库设备实现文件备份。综上6点痛点与原因,我行计划在数据中心新建的契机之上,使用NAS专用存储设备替换现有GPFS文件系统。3NAS技术路线选型目前市场上使用的NAS产品主要分为3类:企业级集中式NAS存储设备,企业级分布式NAS存储设备,开源存储软件NAS。不同的NAS技术路线在产品特性、安全性、冗余性、高可用性、容灾技术、部署与运维成本上具有各自的特点。考虑到我行业务需要共享文件系统的业务特点,即数据规模较小(指数据共享规模一般在TB级数据量),对性能要求根据业务场景不同而需求不同(如支付清算系统对共享文件的性能要求较高,而前文所述的柜面系统业务场景下对性能要求不高)、对数据高安全性、冗余性、高可用性的需求高,我行最终确定选择企业级集中式NAS存储设备作为行内文件共享的解决方案。在企业级集中式NAS存储设备的技术选型上选择了华为企业级NAS存储设备,从NAS存储的软件特性考虑,例如基本的挂载、复制等传统功能的技术差异度并不明显,主要考察的NAS双活等高级特性,其中NAS双活技术的特性对比表格如下:特性HUAWEINetAppHDS名称
HyperMetroMetroClusterNASCluster+SANGDA(Global-ActiveDevice架构融合,站点A和站点B两个独立的集群融合,站点A和B是同一套集群NAS网关+SAN,扩展的NAS集群和两个独立的SAN存储双活最大节点数量:32双活最大节点数量:8双活最大节点数量:2数据双写到本地和从端内存数据双写到本地和从端内存,同时要双写到
本地和从端硬盘,2倍带宽占用数据同步依赖于SAN阵列的双活故障恢复故障自动切换
主端故障恢复后自动恢复镜像关系;
目前已不需要手工Switchback故障自动切换
主端故障恢复后需要手工修复数据才能恢复镜像关系;
需手工Switchback故障自动切换
主端故障恢复后需要手动恢复镜像关系;
需手工Switchback仲裁仲裁服务器/优先站点
支持仲裁服务器冗余
仲裁服务器仲裁服务器网络FC\IP\ROCE
将复制链接,配置链路和心跳链路集
成到单个物理链路中。
集群互联和配置同步使用IP网络;
NVRAM数据镜像使用FC或IP网络
硬盘框数据镜像使用SAS和FC互转的交换机SAN用FC,NAS用IP4华为企业级NAS两地三中心架构我行在两地三中心部署了三台华为OceanStorDorado系列NAS存储设备,形成NAS存储的两地三中心格局。其中生产主中心部署华为OceanStorDorado系列的基于闪存阵列的企业级NAS节点,在同城两中心各部署一台OceanStorDorado系列企业级NAS节点。生产主中心的闪存存储与灾备中心部署双活架构用于承载重要生产业务的共享文件系统资源,因其NVME的闪存特性能够保障生产业务的IO性能需求。同时为保障历史文件归档与备份数据安全,在同城中心部署NAS作为生产业务数据的一体化备份节点以及历史数据归档的存储使用。华为企业级NAS存储在前期支持NAS二层双活架构,即两台阵列要在同一个二层网络,其主要的弊端是依赖于跨中心的二层网络,从网络层面看有一定网络广播风暴和跨中心访问链路不稳定导致的生成树重算问题,从存储容灾层面看发生数据中心级灾难后二层网关需要切换到灾备中心后,存储的网络就绪才能继续对外提供服务。目前华为企业级存储的微码版本更新至6.1.3PH8版本后已经新增支持了跨数据中心NAS三层网络双活的容灾功能,升级后跨数据中心三层网络的两台存储无法提供相同网段的物理IP,需要配置虚拟VIP给主机,让主机通过VIP访问NAS业务。在存储内部实现VIP到实际三层物理IP(BGPLIF)跨网段路由,并将路由关系通过BGP协议上报给汇聚路由器。交换机需要配置BGPpeer以接受存储上报的BGP路由信息。具体双活切换的原理是:当生产站点可用时,实际承载VIP1的BGPLIFA0是在线联机的,灾备中心对应的BGPLIFB0是STANDBY状态。主机配置一条到VIP1的静态路由端口指向其直联的交换机,此时生产交换机接收存储上报的路由信息,计算出到VIP1路由,主机最终通过VIP1访问到生产存储NAS;当生产站点发生灾难不可用或发生切换时,同城存储的BGPLIFB0由STANDBY状态转变成在线联机状态,VIP1切换漂移到同城灾备的存储设备,同样同城存储通过BGP协议上报路由信息,同城交换机需要重新计算出到VIP1路由,此时主机不需要任何更改,不需要重新挂载文件系统或者重启操作系统,经历秒级的中断(存储切换的时间)即可继续访问共享文件系统服务,中断的时间在NFS协议可接受的范围内(没有超过重传等待时间)。从业务角度完全感受不到双活切换造成的短暂中断,真正做到了跨数据中心三层网络NAS双活。
5GPFS迁移方案将GPFS集群文件系统的存量数据迁移至华为企业NAS存储设备的步骤很清晰明了,具体步骤如下:1.对现有GPFS集群的文件系统数据进行备份,防止意外情况发生;2.从华为企业NAS建立该业务系统对应的租户,分配合适的存储空间,并新建NAS文件系统映射给业务系统虚拟机;3.在业务系统上将NAS目录挂载至临时目录,例如/data_migration_temp。4.根据业务系统的运行情况,可以考虑先将部分存量静态文件(即不会被修改和删除的文件目录与文件)通过操作系统的CP命令或者RSYNC命令复制到临时目录下,也可以使用华为提供的数据迁移工具并发迁移存量数据。5.在变更割接窗口,停止应用服务,不再接受新的请求,确保GPFS集群文件系统内的相关数据。通过CP命令全量复制(文件个数少或容量小的情况可选择)或者RSYNC的增量复制命令,将差异数据复制到临时目录。6.运维人员和开发人员手动做一次检查工作,确认文件系统大小、文件个数、文件权限无误后,通过GPFS集群命令执行集群内所有节点的文件挂载点卸载。在所有应用系统节点上将华为企业NAS的挂载点切换到原GPFS的生产目录。7.重新启动应用,检查文件系统完整可用,应用服务正常,相关业务或数据查询正常。8.检查华为企业NAS上配置的文件系统一体化备份策略执行执行,文件系统受到保护。9.业务稳定运行一个月后,确认华为企业NAS的运行可靠稳定,可以开始对原GPFS集群进行资源回收,包括停止GPFS服务、卸载相关软件包、回收磁盘资源。
6总结本文介绍了我行在文件共
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能机器人生产制造合同
- 广东省珠海市斗门区2024-2025学年八年级上学期期末生物学试题(含答案)
- 酒店行业阅读题及答案
- 超级计算中心建设运营合同
- 顶入法法的桥、涵工程 现场质量检验报告单
- 商业综合体设计与施工合同
- 教育培训行业学员个人信息保护合同
- 安徒生童话故事中的道德评析
- 农业产业化发展方案
- 高中英语单词复习策略及实践教案
- 中小学生赌博危害课件
- 部编人教版五年级下册小学道德与法治全册课时作业(一课一练)
- 世界著名童话故事英文绘本故事丑小鸭
- 马小跳玩数学课件
- 三年级劳动课1ppt
- 《乘法交换律和结合律》教学课件数学四年级下册
- 大数据在金融领域的应用方案
- 锚杆(索)检验批质量验收记录
- 生产作业指导书SOP表格模板
- 建筑装饰设计收费标准
- 传统体育养生概论
评论
0/150
提交评论