构建新一代企业大数据平台_第1页
构建新一代企业大数据平台_第2页
构建新一代企业大数据平台_第3页
构建新一代企业大数据平台_第4页
构建新一代企业大数据平台_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,建立在PAAS平台上的新一代数据平台解决方案,Agenda,企业新一代数据平台的技术需求创新的技术平台建设思路,面向大数据的分析,NowWhat?SoWhat?What?,大数据分析企业内、外部的结构化和非结构化数据数据量在TB级以上以数据挖掘、预测和实时分析为主,强调对业务驱动,传统BI分析企业内部的结构化数据,数据量在GBTB级以报表、查询和分析为主,反应当前业务现状,更丰富、更细致的客户管理,大数据分析在企业的应用,更准确、更及时的营销管理,更高效、更全面的风险管理,Customer360oSingleView,KeyLifeEvents&NextBestAction,StressTest&CreditAssessments,通用银行业大数据分析平台,管理分析类应用,数据交换平台,应用集市数据区,核心系统,总账系统,国结系统,网银系统,系统,企业内外部半结构化、非结构化数据,数据传输,数据稽核,数据处理,流程调度,监控告警,非结构化数据区,沙盘演练数据区,用户评价信息,移动互联信息,历史归档数据区HDS,客户主题,协议主题,产品主题,事件,沙盘演练应用,实时分析应用,POS增量,财务增量,库存增量,采购增量,增量,临时数据区,实时数据区,核心数据,总账数据,国结数据,数据,主题数据区,社交媒体信息,网银数据,客户管理,财务管理,风险管理,管理,客户管理,财务管理,风险管理,管理,运营管理,决策人员,管理人员,数据科学家,业务人员,客户汇总,账户汇总,机构汇总,产品汇总,企业大数据平台数据内容及实现技术,Page7,应用平台提交请求访问的数据,包括结构化和非结构化两类,在线存储周期超过数据生命周期规划的数据适合Hadoop分布式架构管理,无法用二维表结构来逻辑表达的无结构性的数据。例如文本、音频数据等。,方便用数据库的二维表结构来逻辑表达实现的数据,数据结构字段含义确定,清晰。例如:客户信息、用电记录等。是挖掘数据价值的主要对象。,支持分析型应用,时效性较低,支持前台交易系统查询需求,具有可靠性高、并发度大、采集频率短的特点,按数据格式类别划分,按数据格式类别划分,按数据采集频度划分,大数据平台,在线数据,归档数据,非结构化数据,结构化数据,准实时数据,非实时数据,面向贴源数据查询和主题数据整合。数据区,适合X86MPP数据库集群,范式化模型数据,面向分析类应用。对应ADW和CM数据区,适合MPP数据库集群,维度模型数据,按数据模型划分,Page8,企业大数据平台架构原则平台,8,技术-跨平台数据交换批量和实时数据采用不同的技术手段和工具,遵循统一的文件接口标准技术-平台内数据复制跨同构/异构数据库(物理系统),基于文本、数据库的数据抽取和加载,数据的形式不发生变化,不涉及数据转换。数据复制后产生的数据副本主要是为了便于数据引用,需要制定数据副本的生命周期管理策略以及保证数据副本的只读属性。数据-数据即服务业务人员通过逻辑数据对象组件访问数据,而不用关心数据的物理存储方式。通过全行指标口径和维度、度量信息,使业务人员可以较容易、较快地定位和了解数据的内容。数据-数据质量控制通过一系列的技术和业务手段实现数据集成平台数据质量控制,主要体现在数据正确性(技术)、完整性、一致性(业务)、有效性。,Page9,企业大数据平台架构原则平,9,数据-历史数据分级存储和访问近线数据存储形式保持源表源结构,主要以数据库形式存储,支持在线数据查询、访问和应用支持,响应时间秒级。归档数据以廉价大容量磁盘方式存储,存储形式会根据数据环境和未来应用的差异,采用不同于源结构的存储形式。同时,归档数据需要创建“被动索引”并具备恢复到主题数据区或者汇总数据区的能力。数据-非结构化数据管理对于交易和处理过程中形态尚不稳定的非结构化数据,可由各平台根据时效性、一致性控制和完整性控制等要求考虑自行处理安全-数据访问安全对于普通的查询访问应用,应该具备屏蔽敏感信息的展现的能力。面向行内用户的数据访问,应按照数据的属主进行访问隔离。运维-系统日常运行性能管理在数据量不断增加、访问用户数量的增长、用户数据使用成熟度的变化、数据ETL持续滚动开发等场景的不断变化下,需要围绕日常性能管理,不断调整系统设计和运行策略。,建设新一代数据平台的驱动力,完整的大规模数据的快速捕获流程多种类型数据的存储数据的实时共享与交换海量&剧增数据的支撑能力传统数据仓库技术和新技术的结合Hadoop技术的合理运用与性能,Agenda,企业新一代数据平台的技术需求创新的技术平台建设思路,CONSUMERGRADE,先行者:服务于海量客户的互联网巨头企业,Mainframe,Software-DefinedDatacenter,NewData-fabrics,新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流,Client-Server&Web,CONSUMERGRADE,先行者:服务于海量客户的互联网巨头企业,Mainframe,Software-DefinedDatacenter,NewData-fabrics,新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流,Client-Server&Web,存储并且在非常大量的数据上进行分析,CONSUMERGRADE,先行者:服务于海量客户的互联网巨头企业,Mainframe,Software-DefinedDatacenter,NewData-fabrics,新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流,Client-Server&Web,快速应用开发,存储并且在非常大量的数据上进行分析,CONSUMERGRADE,先行者:服务于海量客户的互联网巨头企业,Mainframe,Software-DefinedDatacenter,NewData-fabrics,新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流,Client-Server&Web,快速应用开发,存储并且在非常大量的数据上进行分析,大规模自动化运维,企业级的需求,快速应用开发,Mainframe,Client-Server&Web,CONSUMERGRADE,存储并且在非常大量的数据上进行分析,新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流,来自金融企业的独有需求,快速应用开发,Mainframe,Client-Server&Web,CONSUMERGRADE,存储并且在非常大量的数据上进行分析,新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流,收集数量庞大的事件数据的同时对特定交易事件进行实时反应,与传统应用和基础架构有机配合,来自金融企业的独有需求,快速应用开发,Mainframe,Client-Server&Web,CONSUMERGRADE,存储并且在非常大量的数据上进行分析,新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流,收集数量庞大的事件数据的同时对特定交易事件进行实时反应,与传统应用和基础架构有机配合,NewExperiencesNewBizModelspioneeredbynewConsumerInternetgiants,Internet-of-thingsPervasivetelemetry,Mainframe,Client-Server&Web,CONSUMERGRADE,OperateatScaleinahighlyautomatedway,新一代PaaS平台,快速应用开发,收集数量庞大的事件数据的同时对特定交易事件进行实时反应,存储并且在非常大量的数据上进行分析,与传统应用和基础架构有机配合,新一代Paas平台建设思路,Software-DefinedDatacenter,NewData-fabrics,NewExperiencesNewBizModelspioneeredbynewConsumerInternetgiants,Internet-of-thingsPervasivetelemetry,Mainframe,Client-Server&Web,CLOUDERA,OperateatScaleinahighlyautomatedway,AWS,VMW,.ETC,Pivotal:面向数据的企业级Paas平台,PivotalPlatform,FromVMware,FromEMC,存储并且在非常大量的数据上进行分析,在收集数量庞大的事件数据的同时对特定事件进行实时反应,快速应用开发,配合不同云计算平台实现高效运维和水平扩展,与传统应用和基础架构有机配合,Software-DefinedDatacenter,NewData-fabrics,NewExperiencesNewBizModelspioneeredbynewConsumerInternetgiants,Internet-of-thingsPervasivetelemetry,Mainframe,Client-Server&Web,CLOUDERA,OperateatScaleinahighlyautomatedway,AWS,VMW,.ETC,Pivotal:面向数据的企业级Paas平台,PivotalPlatform,FromVMware,FromEMC,CloudAbstraction&AppAutomation,.ETC,支持开放标准并与开源有效互动强调以数据为中心兼顾各种数据类型处理充分关注新一代开发人员和新一代企业级应用的需求为有效进行实时大容量信息处理而设计同时兼顾与传统应用的互操作性与传统技术的有效结合,PivotalOne:重新定义企业级PaaS,PivotalOne:来自EMC和VMW的技术体系整合,GemFire,PivotalDataScienceLabs,创新:以数据支撑为中心,CloudStorage,Virtualization,PivotalDataFabric,PivotalCloud&AppFabric,Data-DrivenApplicationDevelopment,PivotalDataScienceLabs,.ETC,完整的新一代企业的数据平台蓝图,分析形数据集市,实时的数据处理,Run-TimeApplications,企业级数据仓库,大规模数据存储,实时的数据捕获和共享,Pivotal数据支撑架构的解决之道,Greenplum数据库:极速分析平台,并行处理架构MPPshared-nothing架构,基于通用X86平台PB级以上海量存储,最大支持10000节点以上所有节点并发IO,实现超大IO吞吐,并行运行SQL自动化并行自动化并行计算,实现超大计算能力使用同传统DB一样,加载和运行SQL数据多节点分布及高可用性都由DB自身实现极佳的横向扩展性在线横向扩展容量、加载和SQL查询性能随节点线性增加专为BI及数据分析优化深度整合统计数学模块(SAS,SOLR,MADLIB,R)高性能并行SQL执行器,MPPshared-nothing架构,构建在X86开放平台上的并行处理架构,Greenplum数据库:行业最快的数据加载技术,SingleRackComparison,每个Rack(16节点),每小时16TB加载性能Scatter-GatherStreaming提供性能线性扩张支持大批量数据加载和持续化的数据加载Enablecomplexdatatransformations“in-flight”对GBK/UTF8/ISO8859字符集的原生支持,Greenplumloadratesscalelinearlywiththenumberofracks,othersdonot.Forexample,tworacks=32TB/H,Load,Greenplum数据库:高可用性,提供了全量备份和增量备份功能,保证系统级故障后的数据恢复对于任一设备的故障,系统数据不丢失、提供持续服务多个节点宕机后,系统性能只降低1/6,Greenplum数据库:Gartner的评价,Gartner公司每年发布关于数据仓库管理系统业界地位的魔法象限研究报告报告主要从个数据仓库厂商的执行力和远景两个方面评估评估对象包括传统的企业级数据仓库和新一代的MPP并行数据库厂商,支持各种规模、有大量并发用户、能管理混合工作负载的数据仓库具备较高的客户满意度和强有力的服务支持在数据仓库市场有长久的生命力风险最低、产品成熟度最高,Gartner对领导者象限的评价,采用前瞻性思维设计的数据仓库较小的市场领导者,缺乏全球性发展缺少较大的本地客户,因此不易证明其产品的功能和价值在产品技术领域,某些特性具备前瞻性,但综合能力需要完善,Gartner对远见者象限的评价,LoadBalancer,WebandAppServers,Web,Middware,DatabaseLay,WhatisGemFire,DataGridinMemory,PivotalHadoopHAWQ:性能测试结果对比,47X,19X,208X,476X,648X,9X,69X,25X,20X,21X,PivotalHD,PivotalHD,PivotalCloudandApplicationFabric,CloudStorage,Virt

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论