![基于大数据技术的石油数字化平台设计_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c297868c-d651-433a-9912-e64a3461a64b/c297868c-d651-433a-9912-e64a3461a64b1.gif)
![基于大数据技术的石油数字化平台设计_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c297868c-d651-433a-9912-e64a3461a64b/c297868c-d651-433a-9912-e64a3461a64b2.gif)
![基于大数据技术的石油数字化平台设计_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c297868c-d651-433a-9912-e64a3461a64b/c297868c-d651-433a-9912-e64a3461a64b3.gif)
![基于大数据技术的石油数字化平台设计_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c297868c-d651-433a-9912-e64a3461a64b/c297868c-d651-433a-9912-e64a3461a64b4.gif)
![基于大数据技术的石油数字化平台设计_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/c297868c-d651-433a-9912-e64a3461a64b/c297868c-d651-433a-9912-e64a3461a64b5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于大数据技术的石油数字化平台设计吴巍(中海油能源发展装备技术有限公司,天津,300452)摘要:大数据技术成为驱动石油化工服务类企业数字化转型的有效手段,基于大数据技术的 石油数字化工作平台建设是石油化工服务类企业的大数据应用实践,该技术整合了企业营销、 生产、经营等多个板块的多种业务,串联了企业数据采集、存储、治理、挖掘、分析及应用 的整个数据生命周期。本研究从石汕化工服务类企业数字化发展现状及遇到的问题出发,结 合大数据技术的发展及优势,提出了基于大数据技术的石油化工服务类企业石油数字化工作 平台建设方案,通过对大数据故障信息进行提取,应用dbn大数据学习算法模型实现石油 全寿命周期管理
2、的数据计算和处理。通过实验,本研究的方法数据处理准确度大于90%o 关键词:大数据技术;石油化工;石油数字化工作平台;数据生命周期;dbn大数据学习 算法模型design of petroleum digital platform basedon big data technologywu wei(cnooc energy development equipment technology co., ltd, tianjin 300452, china)abstract: big data technology has become an effective means to drive the
3、 digital transformation of petrochemical service companies. the construction of a petroleum digital work platform based on big data technology is a big data application practice fbr petrochemical service companies. this technology integrates corporate marketing, production, and operation. the multip
4、le businesses in each sector connect the entire data life cycle of enterprise data collection, storage, governance, mining, analysis and application. based on the current status of digital development of petrochemical service companies and the problems encountered, this research puts forward a plan
5、for the construction of a petroleum digital work platform for petrochemical service companies based on big data technology, combined with the development and advantages of big data technology. the fault information is extracted, and the dbn big data learning algorithm model is used to realize the da
6、ta calculation and processing of petroleum life cycle management. through experiments, the data processing accuracy of this research method is greater than 90%.key words: big data technology; petrochemical industry; petroleum digital work platform; data life cycle; dbn big data learning algorithm mo
7、del收稿时间:2020-8-31作者简介:吴巍,出生年月(1986-),男,汉族,天津人,硕士,工程师,主要研究方向:大数据技术、设备设施完整性管理技术服务通讯联系人:吴巍,email:0引舌近年来,大数据技术快速发展,企业 越来越重视数据价值,数据的发掘与应用对 企业发展起到正向引导作用。当前企业数字 化转型,以基于大数据平台建设的业务融合 为主要形式,以数据指导业务为主要模式。 用数据串联企业多个业务板块,发掘数据价 值,提升营销成功率,提高运营效率,改善 管理决策成为新一轮企业数字化转型的主 要导向。如何以整体市场需求布局,将零 碎化产业板块串联形成产业链,综合挖掘各 业务板块的数据价
8、值,提高已有信息系统之 间的关联性,提升管理及工作效率,指导营 销、生产、经营相关决策,实现数据互联互 通、管理融合共享,提升企业竞争力及业务 附加值,是石油化工服务类企业由信息化向 数字化乃至智慧化转型的建设痛点。大数据技术的发展戳中了石油化工服 务类企业的痛点,如何应用大数据手段整合 各业务板块、发掘数据价值、提升运营效率、 改善管理决策,是石油化工服务类企业的数 字化工作重点。文献【1】虽然利用了大数 据技术,但是仅仅是针对某些问题的解决, 但是未提交到石油全寿命周期管理时平台 建构和数据挖掘,技术方案略显抽闲。文献2虽然也通过数据挖掘技术来解决一些 技术问题,但是技术公开地比较笼统,没
9、有 针对针对性地介绍。针对上述技术问题的不 足,本研究结合我国大数据技术发展现状提 出了 “基于大数据技术的石油化工服务类企 业石油数字化工作平台建设”理念。下面将 详细描述。1基于大数据的石油数字化工作平台设计在本研究设计中,设计解决的关键技术 是石油数字化工作平台工作效率的问题,采 用的方法是:充分结合实际情况,融合石油 化工服务类企业产业一体化、管控流程一体 化、数据一体化为目标,提高和石油数字化 工作平台为研究目标,满足企业整个数字化 转型为根据要点,采用数字化平台为技术手 段,实现石汕全寿命经营管理和生产管理, 将各产业板块有机串连,形成一体化服务模 式3】。其整体架构示意图如图1所
10、示。portal门户交m:blpower bltableausupersetechartsso 单点登录数据展示移动道app |webgl_i i_html5微服务生产管理 系统服务 docker施工计划管理工单管理作业管理物料管理经营管理质量管理俄康安全管理职业卫生管理系统服务docker个人档案管理 采办管理合同管理数据查询1 spark ml 1诺义网络11 11 | tensor flow知识图道分析挖掘分析挖掘库业务分析i数据查询连接查询jdbc搜索引擎lucene-solr数据服务web api数据仓库hivehbase|olapkylinmondrian | | saiku |1
11、1分布式存储计算11r1文件管理数据存储/数据日理;| hdfs |mapreduce | | spa* | |1parquetl1流媒体 | | csv | i数据采集/数据etl| sqoop | | flum。| | flink | storm jkafkaspark streamingelasticsearchodbcweb servicel大数据平台数据源业务数据库sql|业务数据库nosql|其他业务系统| 实肘数据源postgresql mysqloraclemongodb redis cassandrarestful api设备日志111大数据 平台管理基于大数据技术的石化服务
12、类企业数字化工作平台图1大数据的石油数字化工作平台化转型战略要求,能够按照系统性、可扩展 本研究的石油数字化工作平台在功能性、成熟性、可靠性、开放性、先进性、安设计上满足了石油化工服务类企业的数字全性、兼容性的原则进行建设,结合实际管理需求,充分利用现有信息系统,以数字化 顶层设计为先导,统筹规划基础设施建设, 搭建统一的石油数字化工作平台。平台建设 完成后,能够实现“数据互联互通,业务协 同贯通,管理融合共享”,实现石油化工服 务类企业的管维、分析和决策数字化转型囹。 在本研究设计中,从逻辑架构上可以将本研 究的石油数字化工作平台划分为大数据平 台层和大数据平台管理等,下面进行详细说 明。在
13、数据源层中,该层包括各种rdbms、no-sql数据库,hyper text transfer protocol 或remote procedure call protocol 等接 口的数 据源也在大数据平台层中,该层包括数据采 集层、存储层、管理层和查询层。其中微服 务层包括各种业务系统的基于web api的 微服务。门户层包括企业在信息化阶段建成 的己有业务系统的单点登录、交互式商业智 能报表工具及相关数据的多样化展示功能 16】。在硬件结构上,其设置了集群管理服务 器、群可视化服务器、zookeeper集群、资 源调度服务器、数据存储计算集群、分布式 缓存及流处理集群和web服务器,其
14、中集 群管理服务器包括 ambari-server , hiveserver2, hue, oozie-server, maria db, kibana, apache ranger等产品或组件,为 集群提供管理、部署等服务。集群可视化服 务器包括superset交互式商业智能报表工具, 数据资产管理系统,以及石油数字化工作平 台的数据门p7o zookeepcr集群主要为整 个集群的组件提供高可用服务(ha)。资源 调度服务器包括 namenode , resourcemanager, hbasemaster 等多种角色, 主要用于集群的资源调度,实现服务器热切 换。数据存储计算集群包括用于
15、集群数据存 储、分析与计算的datanode, joumalnode, nodemanager, regionserver, workernode 等角色。分布式缓存及流处理集群包括实时 数据量处理及数据采集的kafka, flink, redis, logstash等组件,能够实现海量数据 的缓存。web服务器由nginx组件提供网络 代理功能,用于高并发网络的负载均衡,可 对其进行横向扩展圆。其中大数据技术的石油数字化工作平台 物理架构如图2所示。集群管理服务器状态监控瓷源调度服务器resource manager角resource managerzookeeper 集群1znodezno
16、deznode集群可视化服务器集群ha数据存储datanodedatanodedatanode数据存储及计算集群数据计算分布式缓存及流处理集群数据采集数据预处理kafkaflinkredislogstashkafkaflinkredislogstashkafkaflinkredislogstash图2石油数字化工作平台物理架构示意图在本研究中的大数据技术设计中,目前的石 多分布于供应链优化、库存管理、资金统一化行业大石油全生命周期大数据分析应用 管理和生产监管优化、营销决策辅助儿个模大数据记作为g)',石油数字化工作平台大数据特征差异记作为e、=gg (y-y)2(1)tmy-y)2a
17、wtw.(2)- 宁)2s= £ ga=l+p(5)块。基于大数据技术的石油化工服务类企业 石油数字化工作平台建设完成后,可围绕生 产管理、经营管理、装备制造、油田建设等 主题构建多业务板块一体化协同应用场景 石油化工服务类企业原有信息化系统中的 大量数据经过etl数据抽取清洗转换接入 石油数字化工作平台后,按照财务、人力、 采办、营销、生产、运维、施工、物料等大 类进行数据存储9】;经工业大石油全生命周 期大数据分析过程形成生产管理、经营管理、 装备制造、油田建设等主题;结合用户可视 化与数据应用需求,按照经营状态、运维能 力、库存成本等业务大类形成可视化指标; 在数据流转的全生命
18、周期内串联各业务板 块,实现监管、预警、追踪、分析、管理改 善、决策辅助各层面的数据展现,最终满足 企业整体的生产经营目标州。2大数据算法2.1大数据特征信息采取在石汕数字化工作平台中,需要通过提 取石油数字化工作平台大数据特征,然后再 进行石油全生命周期大数据分析,在进行石 油全生命周期大数据分析时,通常对故障数 据信息进行分析,为了计算的方便,将石油 数字化工作平台中内数据进行归一化处理 山,假设大数据的平均值记作为国,将所有 石油数字化工作平台内的数据共同构建成 特征矩阵国,其中的石油数字化工作平台可以将正常数据特征信息与故障数据信息 进行对比分析以,两种大数据可以通过关系 式进行表示:
19、在上述关系中,因表示正常数据与故障 数据之间的关系系数,更g表示正常大数据 的特征矩阵,同表示正常大数据的特征。石油全生命周期故障大数据特征用字母国 表示,则在提取石油全生命周期故障大数据 特征时,可通过以下公式实现:为了提高石油全生命周期故障大数据 计算的精度,通过以下公式对大数据的特征 实施加权计算处理:p§ =" (3)k=k=p+l公式(3)中,区表示石油石油数字化 工作平台大数据加权处理结果,日、回为在 公式(3)中实施加权计算后的次数,司为 正常数据加权结果,区表示为故障数据加 权结果,卜2表示整个石汕数字化工作平台 中国大数据权重的数值。对石油数字化工作平台中
20、的大数据 特征进行提取后的误差可以用以下公式表 示:q-k=p+(4)公式(4)中,网为石油数字化工作平 台中大数据特征提取的误差值,回表示为 石油数字化工作平台中存在的数据特征,当 "g=吗。),了13时为了保 证石汕数字化工作平台大数据特征提取的 误差为最小,同时保证提取精准度回。最终 对数据的提取结果为:公式(5)中,/表示石油数字化工作 平台大数据特征提取结果。在石油数字化工作平台中,确定了正常石油数字化工作平台大数据与故障数据之 间的关系,通过对石油数字化工作平台大数 据石油全生命周期故障特征进行加权处理 四,直到数据特征提取误差最小为止,就实 现了石油数字化工作平台大数据
21、特征提取。 下面采用一种形式的大石油全生命周期故 障大数据计算方法进行计算。2.2 dbn大数据学习算法模型在进行石油全生命周期故障特征计算时, 本研究应用了 dbn大数据学习算法模型实 现石汕全生命周期故障信息的识别和处理, dbn大数据学习算法模型构建了双层rbm 结构,将石油数字化工作平台内包含的不易 为用户识别的高纬度数转换为低纬度数据, 在该技术能力的基础上ml,再次应用bp神 经网络算法模型进行反向微调结构参数,使 得输入的复杂石油全寿命周期内的数据简 易化处理,本研究借助于dbn逐层贪婪训 练算法,将模型从上至下地分为输入层、处 理层和输出层【,其模型算法如图3所示。rbm存在数
22、据集合隹l,2,.,c、 l。rbmhl护处理层俨4输入数据)x-?入层w,反向g播( . .)bp输出层输出数据图3dbn大数据学习算法模型构建计算过程通过多层数据的训练共同完 成,其中在训练第一层数据信息时,可以采 用cd-1算法,使得第一层rbm中的数据信 息按照财务、人力、采办、营销、生产、运 维、施工、物料等不同的类别进行训练,将 石油全生命周期不同类别大数据特征向量 进行分类,将多个石油全生命周期大数据特 征信息进行保存【可。在计算过程中,如果输 入石油全生命周期大数据样本为区,将第一 层中的rbm可视层通过字母x来表示,则 在dbn大数据学习算法模型中的第一个隐 层讪中,这些参数
23、信息可以记作为忡;衣。通过上述方式进行数据训练,能 够将上一步中dbn大数据学习算法模型内 第一层rbm内设置的权重和偏移量作为参 考量稳定下来,完整上述步骤后,将第二层 rbm的向量数据输入上文提到的dbn大数 据学习算法模型。在该步骤过程中,也要考 虑到用户设置隐性神经元的数量和状态情 况h8。上述步骤完成后,然后进行下一层的 rbm训练,这需要在第一层rbm的基础上 进行叠加。以此类推,将不同层的rbm呈 阶梯状排布,直到应用到最后一 rbm层, 然后应用以下逻辑函数进行数据计算:s伽的=mxp(-")";通过上述公式,构成新的层次数据向量/i j2 /3 jj构成的
24、新的上一层区作为下一层的特征向量,此时开,在经过上次的迭代计算后,在dbn大 数据学习算法模型的最后一层设置bp神经 网络模型,以实现石油行业中财务、人力、 采办、营销、生产、运维、施工、物料等大 类进行数据等全寿命周期内的故障数据诊 断顷,用户根据dbn大数据学习算法模型 不同层内设置的权值对故障信息进行诊断, 如果需要将最后的结果达到最优,需要反复 迭代计算叫 使得各层的权值能够达到最优。3试运行结果与分析本研究技术方案在中海油能源发展装 备技术有限公司内进行试运行,大石油全生 命周期大数据分析应用多分布于供应链优 化、库存管理、资金统一管理和生产监管优 化、营销决策辅助几个模块。应用到计
25、算 机硬件环境为:p430g cpu, 8gb ram,软 件环境采用的windows 7,并在该系统上装上matlab 2015,在必要时,进行数据模拟 工服务类企业石油数字化工作平台登录界 仿真。面如图4所示。本研究中的基于大数据技术的石油化图4应用界面示意图输出层y3在上述参数模型中,dbn大数据学习算 法模型的学习效率为0.13,将运行模型进行 189次迭代,下面通过单一的bp神经网络 算法(下文称为方案1)、k-means聚类算 法(下文称为方案2)进行对比分析,输出 表2所示的试验样本数据示意图。表2 试验样本示意图石油数字化工作平台故障数据信息识方案1方案2naivebayesd
26、bn方案150万31.2%63.4%83.2%78.3%92.3%280万35.7%68.9%82.1%82.1%91.4%3120万39.2%71.2%80.7%84.5%93.7%4180万31.3%70.3%83.6%83.2%92.6%别率通过图4的界面,可以将石油化工服务 类企业原有信息化系统中的大量数据经过 etl数据抽取清洗转换接入石油数字化工 作平台后,按照财务、人力、采办、营销、 生产、运维、施工、物料等大类进行数据存 储22】;经工业大石油全生命周期大数据分析 过程形成生产管理、经营管理、装备制造、 油田建设;结合用户可视化与数据应用需求, 按照经营状态、运维能力、库存成本
27、等业务 大类形成可视化指标;在数据流转的全生命 周期内串联各业务板块,实现监管、预警、 追踪、分析、管理改善、决策辅助各层面的 数据展现,最终满足企业整体的生产经营目 标23】。在验证时,dbn大数据学习算法模 型中各项参数信息表如表1所示。表1参数设置示意图神经元数量输入层回10隐层1矿2222隐层h222隐层区隐层h422在上述试验过程中,在石油全生命周期 大数据平台内的数据库中选择了 4组石油全 寿命数据样本,1-3组的数据库样本数量分 别为50万、80万、120万和180万个。通 过对比分析,发现本研究方案效率高。下面通过绘制误差曲线图进行描述,如 图5所示。高了各类型数据组织和处理能
28、力,能够与现有业务系统无缝融合,进一步改进数据操作科多样的业务需求,基于大数据技术的石油 数字化工作平台研究出一种数据存储、管理、 分析、共享和服务的有效载体,本研究集合 数据可视化分析与数据挖掘功能为一体,提服务性能,研发出操作简单的石油全生命周 期大数据分析平台,提升整体石汕化工服务 类企业数字化水平和价值创造能力。本研究的方案虽然具有一定程度的技图5准确率对比曲线图通过图5看出,在相同的时间内,三种 方案的准确度都呈上升趋势,采用本研究的 dbn大数据学习算法模型准确率最高。下 面再从数据的速度上进行分析。输出的曲线 对比图如图6所示。术进步性,仍旧存在一些不足,这需要进一 步的研究。参
29、考文献1 李园园,胡璐.大数据分析技术在油田生产中的应用研 究j.中国管理信息化,2019,45(5): 56-57.2 张以宁,吴庆生.大数据挖掘技术在石油工程的应用分析100 200 300400 500 600 700800 1000数据量/gb18m106 2 处理时间/分#j.中国科技投资,2017,(31):189.3 李小宁.数据挖掘技术在石油工程的应用前景展望j.信息 化建设,2016,(4).307.4 石凯.探析大数据技术在工程项目管理中的应用j.中小 企业管理与科技.2018,(21).125-126.5 潘越,王杰.大数据环境下质量工程项目管理研究j.区域 治理.201
30、8.(52).90.16j周璐,李琳.大数据环境下质量工程项目管理研究jj.商品图6数据处理效率对比曲线图在图6中的对比曲线图中,假设选择不 同的数据库,数据库量分别从 100gb-1000gb不等,本研究的方法在2分 钟左右能够处理上百gb的数据信息,而采 用方案1时,当处理100gb的数据信息就 需要远远多于本研究的技术方案的时间处 理量。随着石油大数据量的增多,方案1和 方案2需要采用更多的时间,而本研究方案 在不到3分钟的时间内能够处理上百亿gb 的数据信息。数据处理大,用时少。4结束语以大数据技术为代表的新一代信息技 术在智慧油田、智能工厂、智能管道、智慧 加油站等石化行业虽然己经广泛应用。但是 仍旧存在
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论