版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据湖演进之路用户画像需要从数据仓库的角度来看,才能获得完整的视图。数据集成真正从大数据的角度来看,才能明白其中的挑战。一个运行了20多年的数据架构,必然有其合理性也正是因为年代久远,存量过多,才导致举步维艰在Cloud和5G时代,超密度网络集成和大数据洞察需求给保险行业带来新的挑战,从数据仓库到数据湖,不仅仅架构的变革,更是思维方式的升级。数据仓库历史沿革1970年,关系数据库的研究原型SystemR和INGRES开始出现,这两个系统的设计目标都是面向on-1inetransactionprocessing(OLTP)的应用关系数据库的真正可用产品直到1980年才出现,分别是DB2和INGRES。其他的数据库,包括Sybase,Oracle,和Informix都遵从了相同的数据库基本模型。关系数据库的特点是按照行存储关系表,使用B树或衍生的树结构作为索引和基于代价的优化器,提供ACID的属性保证到1990年,一个新的趋势开始出现:企业为了商业智能的目的,需要把多个操作数据库中数据收集到一个数据仓库中。尽管投资巨大且功能有限,投资数据仓库的企业还是获得了不错的投资回报率。从此,数据仓库开始支撑各大企业的商业决策过程。数据仓库的关键技术包括数据建模,ETL技术,OLAP技术和报表技术等。目前主要的数据仓库产品供应商包括Oracle、IBM、Microsoft、SAS、Teradata、Sybase、Businessobjects(已被SAP收购)等数据仓年概念数据仓库之父Bi1Inmon在1991年出版的“BuildingtheDataWarehouse”一书中所提出的定义被广泛接受——数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(NonVolati1e)、反映历史变化(Timnevariant)的数据集合,用于支持管理决策(DecisionMakingSupport)。这是一个偏向学术的定义,却非常准确的界定了数据仓库与其他数据库系统的本质区别。adatawarehouseisasubject-oriented,integratedtime-variant.andnonvolatilecollectionofdatainsupportofmanagement'sdecision-makingprocessW.H.Inmon要理解数据仓库的概念,需要从与数据库的系统的对比来看数据库是作为“所有处理的单一数据源”出现和定义的数据库的出现有两个驱动因素,第一是70年代以前大量应用程序和主文件的分散存放导致一片混乱和大量冗余数据。第二是直接存取存储设备的出现使得按记录寻址成为可能。基于DBMS的在线事务处理为商业发展开辟全新的视野。数据库系统的设计目标是事务处理。数据库系统是为记录更新和事务处理而设计,数据的访问的特点是基于主键,大量原子,隔离的小事务,并发和可恢复是关键属性,最大事务吞吐量是关键指标,因此数据库的设计都反映了这些需求。数据仓库的设计目标是决策支持。历史的,摘要的,聚合的数据比原始的记录重要的多。査询负载主要集中在即席查询和包含连接,聚合等操作的复杂查询。相对于数据库系统来说,査询吞吐量和响应时间比事务处理吞吐量重要的多数据仓库和数据库系统的区别,一言蔽之:OLAP和OLTP的区别。数据库支持是OLTP,数据仓库支持的是OLAP数据处理类型OLTPOLAPUserorientation业务开发人分析决策人员systemorientationstomer-orientedMarket-oriented功能实现日常辜务处理面向分析决第关系横型(ER、面向应用多维樸型(层型或雪花)、面向主题数据量几条或几十条记录百万千万条记录DatacontentsCurrentdataHistoricdata单个企业的当前数据多个企业的历史数括操作类型短井发事务:查认、更新、删除查询为主:只该操作、复杂查询对OLTP和OAP的区别还可以有一个维度,就是及时性需求。OLTP对事务的及时性需求较高,而OLAP则不然。数据仓库一般基于数据库实现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《子网掩码的计算》课件
- 第6单元 科技文化与社会生活(B卷·能力提升练)(解析版)
- 百货商店电器城保安工作总结
- 集装箱散货转化公路运输代理协议三篇
- 2023-2024年员工三级安全培训考试题附参考答案【典型题】
- 乘除法应用题课件
- 2023年-2024年企业主要负责人安全培训考试题附解析答案
- 教育资源整合研究报告
- 《督脉与腧穴》课件
- 云平台下的供应链协同-洞察分析
- 车辆驾驶考试培训委托书
- 开票税点自动计算器
- 2024亲戚借名买房协议书
- 小学二年级上册数学-数角的个数专项练习
- 期末核心素养测评卷2023-2024学年语文五年级上册+统编版
- 医疗器械质量安全风险会商管理制度
- 《我爱上班》朗诵稿
- 2024年石油石化技能考试-石油钻井工笔试参考题库含答案
- 2024年度带状疱疹课件
- 电桩采购安装充电桩调试验收方案
- 消防设施安全检查表
评论
0/150
提交评论