版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、利用数据仓储实现数据智能查询地质大队王瑞2010年9月利用数据仓储实现数据智能查询王瑞(大庆油田第八采油厂地质大队)摘要:油田开发的数据来源多且不规范,在一些互不联系的系统分析、设计人员在分散独立的开发应用系统时,由于数据库的不统一性,使得不同的应用部分之间的信息共享专门难进行。如此就阻碍了数据的共享应用。因此要对数据源进行整合,规范尽量向PCEDM模型靠近,使各系统之间能够快速共享数据,方便查询。主题词:数据仓储 信息域 数据泵出问题在提出随着油田信息化的不断深入,数据资源的累积越来越多,由于数据库的分散和不统一,使得一些互不联系的数据库访问查询时,系统查询速度特不缓慢,如此就阻碍了数据的共
2、享应用,阻碍了信息化进程的开展。而数据仓储概念在提出和应用,将油田各个专业的数据库集中到一个平台上共享应用。再结合油田正在应用在PCEDM数据模型和往常在用的数据库逻辑结构的特点,进行数据查询智能开发,使得油田各专业岗位业务人员能够依照不同的业务需要,在不了解数据库结构的情况下通过简单的鼠标拖动快速进行数据库查询、统计。什么是数据仓储数据仓储是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,数据仓储技术定义了能够使该数据更容易访问的策略。2.1 数据仓储在特点1)数据仓储是面向主题的;2)数据仓储是集成的,数据仓储的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出;3)
3、数据仓储是可更新的,数据仓储要紧是为决策分析提供数据,所涉及的操作要紧是数据的查询; 4)数据仓储是随时刻而变化的,传统的关系数据库系统比较适合处理格式化的数据;2.2 数据仓储实现方式数据仓储是一个过程而不是一个项目。 数据仓储系统是一个信息提供平台,他从业务处理系统获得数据,要紧以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中猎取信息和知识。 从功能结构化分,数据仓储系统至少应该包含数据猎取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分。 企业数据仓储的建设,是以现有业务系统和大量业务数据的积存为基础
4、。数据仓储不是静态的概念,只有把信息及时交给需要这些信息的使用者,供他们做出改善其业务经营的决策,信息才能发挥作用,信息才有意义。而把信息加以整理归纳和重组,并及时提供给相应的治理决策人员,是数据仓储的全然任务。因此,数据仓储建设是一个工程,是一个过程。 2.3 数据仓储与数据库的区不数据仓储的出现,并不是要取代数据库。目前,大部分数据仓储依旧用关系数据库治理系统来治理的。能够讲,数据库、数据仓储相辅相成、各有千秋。 数据库是面向事务的设计,数据仓储是面向主题设计的。 数据库一般存储在线交易数据,数据仓储存储的一般是历史数据。 数据库设计是尽量幸免冗余,一般采纳符合范式的规则来设计,数据仓储在
5、设计是有意引入冗余,采纳反范式的方式来设计。 数据库是为捕获数据而设计,数据仓储是为分析数据而设计,它的两个差不多的元素是维表和事实表。实现数据仓储之间关联3.1 石油信息共享数据源油田开发的数据来源多且不规范,同时各路的数据填写标准也不近相同,要对数据源进行整合,规范尽量向PCEDM模型靠近。3.2 建立信息域1) 结合用户专业需求创建用户信息域,将表中的各数据项按用户适应进行数据组合和数据关联。业务人员基于信息域构建查询和报表就不需要明白得数据库的结构和表关联;2) 能按用户适应,对数据库信息进行分类治理;3) 预建表关联(以后做查询、报表不必再建)依照PCEDM数据结构和油田开发业务特点
6、,建立了以well_id为主键的所有单井各类数据表之间的关联关系,并通过实体与well_id之间的隶属关,建立了各单井表与所有含矿、队、站、油田、区块等实体的表之间的关联关系。为油田开发技术人员创建一个简单直观的数据应用界面,用户只需要拖动数据项不需要关怀数据数据库内部结构;4) 将复杂统计表达式作为单个对象,象使用字段一样方便查询和做报表;5) 实现单点更新,修改一处,更新全部.6)代码转换PCEDM数据库在创建过程中大量用到随机码做主键同时也用到了专门多代码项这些用户专门难看明白,对所有代码进行转换,在系统中为最终用户展示的完全是转换后的信息。4 利用数据仓储实现智能查询及实例4.1 定时
7、数据泵出依照源数据更新时刻,定时将更新的数据泵到数据仓储中。4.2 数据注释按照油田的技术术语对关于200多个数据表中的几千个英文数据项都转译为汉字名称。创建油田开发语义层结合用户专业需求创建用户信息域,将表中的各数据项按用户适应进行数据组合和数据关联。业务人员基于信息域构建查询和报表就不需要明白得数据库的结构和表关联。4.3智能查询智能查询是指依照实际业务需要,定义查询对象并从数据库中检索出需要的数据的过程同时在查询过程中完成对数据的清洗过滤转换等,得到用户最终需要的数据1)可基于数据源、信息域、SQL语句、已生成的查询、文件、Excel和数据库存储多种方式进行查询,无需编程;2)一个查询能
8、同时跨多个数据源如Oracle、SQL、DB2、Informix、Progress、Sybase等RDBMS;(此功能一般来讲适合与IT或信息部有数据库使用权限的人员使用,业务人员通常是差不多信息域(或业务视图)做查询)3)在查询内支持脚本编写;4)可视化编辑查询条件,条件编辑过程使用自然语言;5)查询数据结果包括查找、过滤器、输入参数、升降排序等;6)查询结果的数据格式设置;7)查询结果界面可灵活设计其界面美工,用户可完全DIY8)设置查询参数功能,不同参数刷新不同数据,同时参数界面能够自定义设计,能满足所有查询参数界面的设计;9)具有强大的示警功能,能基于预定条件发出预警e-mail、wi
9、ndows message、启动其它系统等示警功能,10)设有独立打印机,查询结果导出打印时可不能变形;11)查询结果可输出为Microsoft Excel、Pdf、Html和Txt 等常用格式;12)能在Web界面中调用其它ActiveX 控件,例如WinFax、Windows Media Player等等,大大加强了展示和系统功能,已远超于一般查询的功能范围。13)减少查询交互,关于5000行数据的查询,将一次从服务器返回全部数据,减少前后端交互,近一步提升性能。4.4构建智能查询的方式基于智能查询构造器建立查询基于智能查询构造器建立查询是最常用的查询方式,操作方法简单,只要通过简单的鼠标拖拉方式即可完成各种简单或复杂的查询。结论建立数据仓储是为了填补现有数据存储形式差不多不能满足信息分析的需要。数据仓储给组织带来了巨大的变化。数据仓储的建立也给我们带来了一些新的工作流程,通过构造一种体系化的数据存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息。通过数据仓储
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度生鲜配送与冷链仓储管理承包合同3篇
- 2025年度体育场馆场地租赁及赛事运营管理服务协议2篇
- 2024皮鞋品牌代理权购销合同范本3篇
- 二零二五年度施工安全风险评估与管理合同3篇
- 2025年度高科技公司股东退股协议书3篇
- 2025年度房地产项目成本控制与合同管理协议3篇
- 二零二五年猫咪宠物保险代理合同2篇
- 2025年跨境电商项目监控与管理服务合同2篇
- 二零二五年度环保产业投资合作合同6篇
- 二零二四年医疗器械研发合同
- 山东省济南市2024-2025学年高一英语上学期学情检测期末试题
- 车险理赔全解析
- 微粒贷逾期还款协议书范本
- Unit10l'mten!(练)新概念英语青少版StarterA
- 产业园区开发全流程实操解析
- NBT 47013.4-2015 承压设备无损检测 第4部分:磁粉检测
- 羽毛球比赛对阵表模板
- 2024年上海市中考数学真题试卷及答案解析
- 2024年全国卷1高考理综试题及答案
- 初中语文现代文阅读训练及答案二十篇
- 农村开荒土地承包权转让协议书
评论
0/150
提交评论