利用数据仓储实现数据智能查询_第1页
利用数据仓储实现数据智能查询_第2页
利用数据仓储实现数据智能查询_第3页
利用数据仓储实现数据智能查询_第4页
利用数据仓储实现数据智能查询_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、利用数据仓储实实现数据智能能查询地质大队王瑞2010年9月月利用数据仓储实实现数据智能能查询王瑞(大庆油田第八八采油厂地质大大队)摘要:油田开发发的数据来源源多且不规范范,在一些互互不联系的系系统分析、设设计人员在分分散独立的开开发应用系统统时,由于数数据库的不统统一性,使得得不同的应用用部分之间的的信息共享很很难进行。这这样就影响了了数据的共享享应用。因此此要对数据源源进行整合,规规范尽量向PPCEDM模模型靠近,使使各系统之间间能够快速共共享数据,方方便查询。主题词:数据仓仓储 信息域域 数据泵出出问题在提出随着油田信息化化的不断深入入,数据资源源的累积越来来越多,由于于数据库的分分散和不

2、统一一,使得一些些互不联系的的数据库访问问查询时,系系统查询速度度非常缓慢,这样就影响了数据的共享应用,影响了信息化进程的开展。而数据仓储概念在提出和应用,将油田各个专业的数据库集中到一个平台上共享应用。再结合油田正在应用在PCEDM数据模型和以前在用的数据库逻辑结构的特点,进行数据查询智能开发,使得油田各专业岗位业务人员可以根据不同的业务需要,在不了解数据库结构的情况下通过简单的鼠标拖动快速进行数据库查询、统计。什么是数据仓储储数据仓储是一个个面向主题的的、集成的、相相对稳定的、反反映历史变化化的数据集合合,数据仓储储技术定义了了可以使该数数据更容易访访问的策略。2.1 数据仓仓储在特点1)

3、数据仓储是是面向主题的的;2)数据仓储是是集成的,数数据仓储的数据有有来自于分散散的操作型数数据,将所需需数据从原来来的数据中抽抽取出;3)数据仓储是是可更新的,数据仓储主要是为为决策分析提提供数据,所所涉及的操作作主要是数据据的查询; 4)数据仓储是是随时间而变变化的,传统统的关系数据据库系统比较较适合处理格格式化的数据据;2.2 数据仓仓储实现方式式数据仓储是一个个过程而不是是一个项目。 数据仓储系统是是一个信息提提供平台,他他从业务处理理系统获得数数据,主要以以星型模型和和雪花模型进进行数据组织织,并为用户户提供各种手手段从数据中中获取信息和和知识。 从功能结构化分分,数据仓储储系统至少

4、应应该包含数据据获取(Daata Accquisiition)、数数据存储(Datta Stoorage)、数数据访问(DData AAccesss)三个关键键部分。 企业数据仓储的的建设,是以以现有业务系系统和大量业业务数据的积积累为基础。数数据仓储不是是静态的概念念,只有把信信息及时交给给需要这些信信息的使用者者,供他们做做出改善其业业务经营的决决策,信息才才能发挥作用用,信息才有有意义。而把把信息加以整整理归纳和重重组,并及时时提供给相应应的管理决策策人员,是数数据仓储的根根本任务。因因此,数据仓仓储建设是一一个工程,是是一个过程。 2.3 数据仓仓储与数据库库的区别数据仓储的出现现,并

5、不是要要取代数据库库。目前,大大部分数据仓仓储还是用关关系数据库管管理系统来管管理的。可以以说,数据库库、数据仓储储相辅相成、各各有千秋。 数据库是面向事事务的设计,数数据仓储是面面向主题设计计的。 数据库一般存储储在线交易数数据,数据仓仓储存储的一一般是历史数数据。 数据库设计是尽尽量避免冗余余,一般采用用符合范式的的规则来设计计,数据仓储储在设计是有有意引入冗余余,采用反范范式的方式来来设计。 数数据库是为捕捕获数据而设设计,数据仓仓储是为分析析数据而设计计,它的两个个基本的元素素是维表和事事实表。实现数据仓储之之间关联3.1 石油信信息共享数据据源油田开发的数据据来源多且不不规范,并且且

6、各路的数据据填写标准也也不近相同,要要对数据源进进行整合,规规范尽量向PPCEDM模模型靠近。3.2 建立信信息域1) 结合用户户专业需求创创建用户信息息域,将表中中的各数据项项按用户习惯惯进行数据组组合和数据关关联。业务人人员基于信息息域构建查询询和报表就不不需要懂得数数据库的结构构和表关联;2) 能按用户户习惯,对数数据库信息进进行分类管理理;3) 预建表关关联(以后做做查询、报表表不必再建)根根据PCEDDM数据结构构和油田开发发业务特点,建建立了以weell_idd为主键的所所有单井各类类数据表之间间的关联关系系,并通过实实体与welll_id之之间的隶属关关,建立了各各单井表与所所有

7、含矿、队队、站、油田田、区块等实实体的表之间间的关联关系系。为油田开开发技术人员员创建一个简简单直观的数数据应用界面面,用户只需需要拖动数据据项不需要关关心数据数据据库内部结构构;4) 将复杂统统计表达式作作为单个对象象,象使用字字段一样方便便查询和做报报表;5) 实现单点点更新,修改改一处,更新新全部.6)代码转换PCEDM数据据库在创建过过程中大量用用到随机码做做主键同时也也用到了很多多代码项这些些用户很难看看懂,对所有有代码进行转转换,在系统统中为最终用用户展示的完完全是转换后后的信息。4 利用数据据仓储实现智智能查询及实实例4.1 定时数数据泵出根据源数据更新新时间,定时时将更新的数数

8、据泵到数据据仓储中。4.2 数据注注释按照油田的技术术术语对对于于200多个个数据表中的的几千个英文文数据项都转转译为汉字名名称。创建油田开发语语义层结合用户专业需需求创建用户户信息域,将将表中的各数数据项按用户户习惯进行数数据组合和数数据关联。业业务人员基于于信息域构建建查询和报表表就不需要懂懂得数据库的的结构和表关关联。4.3智能查询询智能查询是指根根据实际业务务需要,定义义查询对象并并从数据库中中检索出需要要的数据的过过程同时在在查询过程中中完成对数据据的清洗过滤滤转换等,得得到用户最终终需要的数据据1)可基于数据据源、信息域域、SQL语语句、已生成成的查询、文文件、Exccel和数据据

9、库存储多种种方式进行查查询,无需编编程;2)一个查询能能同时跨多个个数据源如OOraclee、SQL、DDB2、Innformiix、Proogresss、Sybaase等RDDBMS;(此此功能一般来来说适合与IIT或信息部部有数据库使使用权限的人人员使用,业业务人员通常常是基本信息息域(或业务务视图)做查查询)3)在查询内支支持脚本编写写;4)可视化编辑辑查询条件,条条件编辑过程程使用自然语语言;5)查询数据结结果包括查找找、过滤器、输输入参数、升升降排序等;6)查询结果的的数据格式设设置;7)查询结果界界面可灵活设设计其界面美美工,用户可可完全DIYY8)设置查询参参数功能,不不同参数刷

10、新新不同数据,同同时参数界面面可以自定义义设计,能满满足所有查询询参数界面的的设计;9)具有强大的的示警功能,能能基于预定条条件发出预警警e-maiil、winndows messaage、启动动其它系统等等示警功能,10)设有独立立打印机,查查询结果导出出打印时不会会变形;11)查询结果果可输出为MMicrossoft EExcel、PPdf、Httml和Txxt 等常用用格式;12)能在Weeb界面中调调用其它AcctiveXX 控件,例例如WinFFax、Wiindowss Mediia Plaayer等等等,大大加强强了展示和系系统功能,已已远超于一般般查询的功能能范围。13)减少查询

11、询交互,对于于50000行数据的查查询,将一次次从服务器返返回全部数据据,减少前后后端交互,近近一步提升性性能。4.4构建智能能查询的方式式基于智能查询构构造器建立查查询基于智能查询构构造器建立查查询是最常用用的查询方式式,操作方法法简单,只要要通过简单的的鼠标拖拉方方式即可完成成各种简单或或复杂的查询询。结论建立数据仓储是是为了填补现现有数据存储储形式已经不不能满足信息息分析的需要要。数据仓储储给组织带来来了巨大的变变化。数据仓仓储的建立也也给我们带来了一一些新的工作作流程,通过构造造一种体系化化的数据存贮贮环境,将分分析决策所需需的大量数据据从传统的操操作环境中分分离出来,使使分散的、不不一致的操作作数据转换成成集成的、统统一的信息。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论