




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、地震资料处理数据分级存储集群的建设与应用【摘要】本文分析了河南油田地震资料处理对存储系统 的需求,根据地震资料处理的数据特点,通过对并行存储技 术、分级存储技术的研究,设计并建设分级存储系统,满足 地震资料处理中不同应用对存储性能的不同需求,在存储容 量、存储速度和成本之间取得了平衡,建成了高效实用的分 级存储环境。【关键词】分级存储;地震资料处理;并行存储;数据 备份一、建设地震资料处理数据分级存储系统的必要性随着勘探难度增加和技术的发展,野外三维高精度采集 的数据量大规模的增长,加之地震资料处理新技术、新方法 的应用,地震资料处理对存储系统的存储容量和存储性能有 了更高的需求,目前河南油田
2、地震资料处理的存储系统在性 能和容量上还有待提高,但是存储系统的设计要考虑容量、 速度和成本三个问题。容量是存储系统的基础,都希望配置 尽可能大的存储系统;同时要求存储系统的读写速度能与处 理器的速度相匹配;成本也应该在一个合适的范围之内。但 这三个目标不可能同时达到最优。一般情况下,存储设备读 写速度越快,平均单位容量的价格越高,存储容量越小;反 之,存储设备读写速度越慢,平均单位容量的价格越低,存 储容量越大。分析地震资料处理的数据流特点,我们发现:1、在进行叠前时间偏移、深度偏移、逆时偏移等并行 作业处理时, 数据流表现为高并发 IO 和大聚合带宽, 需要高 性能存储系统的支撑。2、在常
3、规处理中的数据流相对平稳, IO 吞吐量相对小, 对带宽和存储的性能要求相对较低。3、需要备份的原始数据及成果数据,需要一定数量安 全级别较高的存储系统进行数据备份。为了在容量、速度和成本这三者之间取得平衡,需要根 据其地震资料处理数据的特点,采用分级存储为不同的应用 提供不同性能的服务,建成高效实用的并行存储环境。二、分级存储方案设计(一)体系架构 地震资料处理数据分级存储系统采用开放式的存储体 系架构,基于分布式的 Glusterfs 并行文件系统,将多台存储 设备的存储容量虚拟成一个具有统一访问接口的存储空间。 按照一定的负载均衡策略存储用户的数据,将数据条带化的 存储到多台物理存储设备
4、上,从而获得更高的并发数据访问 性能,同时可以制定存储策略进行数据分级存储,对所有的 存储设备可以实现统一的管理和监控。分级存储系统包含管理控制器、索引控制器、数据控制 器和应用服务客户端四类组件:管理控制器:安装并行存储管理软件,提供统一的控制 管理界面, 实现存储系统的集中化部署、 管理、监控和维护。索引控制器:内嵌高性能数据索引引擎,管理存储系统 的所有索引数据和命名空间,实现全局统一命名空间,实现 数据索引的负载均衡和故障冗余。数据控制器:提供数据存储空间,并实现数据存取的动作。应用服务客户端:向上层应用提供数据访问接口。(二)配置方案整个存储系统包括 2 台管理控制器、 2 台索引控
5、制器、22个数据控制器,总容量 1197TB。分为三级存储结构:一部分为高速存储,高速为主要特点,由容量较小、价格较贵而性能较高的 SSD固态硬盘构成,为实时提供高性能 的数据 IO 能力;一部分为在线存储,采用容量较大、价格较便宜而读写速度较慢的SAS硬盘构成,支持一般性数据读写;一部分为备份存储,采用容量大,价格低廉,读写速度慢的SATA硬盘,创建高安全备份卷,存储我们的原始、阶段 性数据、成果数据和磁带库数据备份。三、关键技术(一)虚拟化管理平台 OvirtoVirt 是一个基于 x86 架构上的 KVM 虚拟化技术的开源 云服务平台。 它在架构设计上由 ovirt-engine 和 o
6、virt-node 两 部分组成,这种 Node/Engine 分离的结构,方便功能的划分 与管理。Engine 是系统的管理者,并对外提供管理服务,它挂载 了自己的数据库,记录系统中虚拟机的配置,各个存储节点 的状态信息, 网络状态等。 通过在 Engine 中的设置实现系统 的管理逻辑,状态及策略控制。本存储系统通过在管理控制 器上安装 ovirt-engine 来实现管理功能。Node 只负责功能上的实现, 不进行状态的记录和策略的 实现。oVirt里的Node可以由一个普通的 Linux上安装 VDSM (Virtual Desktop Server Manager )构成,也可以由一
7、个专为 oVirt 定制的 Linux 系统构成。本存储系统采用安装 VDSM 的 方法配置数据控制器作为 node 节点,实现网络、存储器、 虚拟机的创建与修改。 VDSM 的功能包括组织数据,实现存 储集群的数据共享与数据保护,故障恢复。(二) GlusterFS集群文件系统GlusterFS是一个开源的分布式文件系统,具有强大的横向扩展能力,通过扩展能够支持数 PB 存储容量和处理数千 客户端。GlusterFS通过TCP/IP或者InfiniBand网络将多个物 理存储资源汇聚在一起,使用全局统一命名空间来管理数据。GlusterFS可为各种不同的数据负载提供优异的性能。Gluster
8、FS文件系统支持标准的网络访问协议,用户可以使用NFS/CIFS等标准协议访问数据。GlusterFS使得用户摆脱 原有的独立、高成本的封闭存储系统,利用普通廉价的存储 设备也可以部署可拥有集中管理、横向扩展、虚拟化的存储 系统。四、生产应用地震资料分级存储系统采用的 Glusterfs 文件系统, 支持 五种逻辑卷,即 Distribute 卷(分布式卷) 、Stripe 卷(条带 卷)、Replica卷(镜像卷)、Distribute stripe卷(分布式条带 卷)和 Distribute replica 卷(分布式镜像卷) 。分级存储系统 搭建完成后,根据地震资料处理需要创建逻辑卷,创建分布 式条带卷来满足并行处理作业时高并发 IO 和大聚合带宽数 据流对高性能存储的需要。创建分布式镜像卷作为备份存储 卷来存储地震资料原始数据和成果数据,满足数据高安全性 的需要。投入生产运行后,多个处理项目使用了该套存储系 统进行生产,在项目结束后成果数据直接转移至备份存储卷, 回收存储空间。五、结束语 根据河南油田地震资料处理的数据特点,采用分级存储系统满足地震资料处理中不同应用对存储性能的不同需求, 在存储容量、存储速度和成本之间取得了平衡,建成了高效 实用的分级存储环境。分级存储系统在存储性能、功能上满 足了生产项目的需要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年税务师考试的前沿动态试题及答案
- 2025信达电梯维修保养合同空白模板
- 2025年赤峰商铺租赁合同范本
- 2025仓库租赁合同详情
- 氧化反应工艺安全操作规程
- 重庆旅游职业学院《英语经典阅读与背诵》2023-2024学年第二学期期末试卷
- 2025届安徽省风阳县皖新中学高三第二次调研测试历史试题含解析
- 新疆农业职业技术学院《管理学导论》2023-2024学年第二学期期末试卷
- 内蒙古电子信息职业技术学院《医疗健康产业的商业模式创新与估值》2023-2024学年第二学期期末试卷
- 淮南师范学院《危机干预》2023-2024学年第二学期期末试卷
- 《用户体验测试》课件
- 隔离与防护措施的正确应用
- 高血压问卷设计(知信行模式)
- 职业病危害告知书
- TRIZ理论――创新方法课件
- CORN术中获得性压力性损伤风险评估量表评定细则解读
- 中国大唐集团公司以热率为核心能耗管理指导意见
- (1.3)-灾害护理学第二章灾害应急体系
- 客户ABC分类管理
- GB/T 12755-2008建筑用压型钢板
- GB 8372-2001牙膏
评论
0/150
提交评论