湖仓一体技术与产业研究报告_第1页
湖仓一体技术与产业研究报告_第2页
湖仓一体技术与产业研究报告_第3页
湖仓一体技术与产业研究报告_第4页
湖仓一体技术与产业研究报告_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

仓一体技术与产业CCSATC601大数据技术标准推进委员会023年6月版权声明本报告版权属于CCSATC601大数据技术标准推进委员会,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:CCSATC601大数据技编制说明支持和帮助,数科技有限公司。前言数据平台是能够为企业提供数据分析能力、支撑上层数据应用、仓库、数据湖三个阶段。活支持对于多种类型数据的高效取用,。。新型的技术受到了前所未有的关注,越来越多的企业视“湖仓一体”的参考。iuyanmeicaictaccn据平台发展的重要趋势 1(一)数据平台的发展历程 1(二)数据湖、数据仓库特性分析 3(三)湖+仓混合业务架构存在四大痛点 4(四)湖仓一体技术应运而生 6实践路径 10(一)湖上建仓 11(二)仓外挂湖 13用现状 14(一)湖仓一体主要厂商和代表产品 15(二)湖仓一体在互联网、电信、金融等信息化程度高的领域应用程度高 17 图目录 表目录 湖仓一体技术与产业研究报告(2023年)1一、湖仓一体是数据平台发展的重要趋势(一)数据平台的发展历程。湖仓一体技术与产业研究报告(2023年)2仓库是为解决单个关系型数据库架构无法支撑庞大数据量的数据存关系型数据库中。数据仓库多为MPP(MassivelyParallelProcessor)HadoopHDFS存储、开放的湖仓一体技术与产业研究报告(2023年)3各种类型数据的统一存储。数据分析则以读取型Schema(schemaon开源大数据平台EMR,华为云-FusionInsightMRS云原生数据湖、DataArtsStudio数据治理中心,腾讯云-数据湖计算服务DLC、数据(二)数据湖、数据仓库特性分析数据仓库主要用于解决单个关系型数据库架构无法支撑庞大数湖仓一体技术与产业研究报告(2023年)4据报表及低,使用运维成不够灵活、成本高数据,数据可按需(三)湖+仓混合业务架构存在四大痛点湖仓一体技术与产业研究报告(2023年)5构并存,其中数据湖和数据仓库通过ETL进行数据交换。数据湖和数据仓库是两套独立的体系,其中数据湖基于Hadoop技术生态、非结统数据仓库在海量数据下加载慢、p湖仓一体技术与产业研究报告(2023年)6本高。(四)湖仓一体技术应运而生并不是真正意义的湖仓一体平台。2020年Databricks提出“湖仓一融合,采用存算分离架构,1.湖仓一体概念湖仓一体技术与产业研究报告(2023年)7灵活性。2.湖仓一体基本能力大数据研究所依托中国通信标准化协会大数据技术标准推进委员会助大数据产品供应商及用户方评估湖仓一体数据平台的技术能力和湖仓一体技术与产业研究报告(2023年)8湖仓数据集成能力仓的数据管理对象进行数据和权限管理(升仓),同时支持数仓内价湖仓存储能力湖仓存储能力包括(1)具备数据存储和计算资源独立部署,以及动湖仓一体技术与产业研究报告(2023年)9式,且实现事务支持处理能力,支持模式(schema)在线调整。(4)数据缓存加速能力,支持配置多种缓存策略的存储加速能力。(5)湖仓湖仓计算能力资源弹性扩缩容,且能够对弹性资源的使用情况进行监控。(5)对湖湖仓数据治理能力、生命周期有清晰描述的统一湖仓血缘能力。(5)支持数据质量的规则设置、校验以及质量管理。(6)可在湖仓异构访问过程中对敏感数据湖仓一体技术与产业研究报告(2023年)湖仓其他能力r纷纷推出湖仓一体产品,如AWS智能湖仓、Databricks-Lakehouse云原生智能数据湖。限湖仓一体技术与产业研究报告(2023年)(Hadoop体系)ID性能提升兼性问题分离6.弹性伸缩(MPP体系)结构开放性查询引擎分离5.弹性伸缩(一)湖上建仓gDeltaLake等。湖仓一体技术与产业研究报告(2023年)引擎能力。性能瓶颈问题。储。HDFS实现存算湖仓一体技术与产业研究报告(2023年)计算资源。(二)仓外挂湖MPP数据库技术体系,从关系型数据库演进而来,对事务一致台之间透明流动。仓外挂湖路径目前主要是将对接外部存储如湖仓一体技术与产业研究报告(2023年)四是存算分离。仓外挂湖需进行存算分离架构改造,而传统的产品实现了根据业务负载自动弹性伸缩计算资源。三、湖仓一体产业及应用现状0029296%282%29.2%30.0%29.9%29.5%29.2%239%025CAGR0%0%0%0%0%%1820192020202120222023e2024e2025e市场规模(亿元)增长率(一)湖仓一体主要厂商和代表产品MaxCompute/Hologres湖仓一体FusionInsightMRS生数据湖ataLakehouseHC洲融合集成&数据运营平台企业级数据湖(BELAKE)ataaCloudousePlatformehouse72%72%湖仓一体技术与产业研究报告(2023年)(二)湖仓一体在互联网、电信、金融等信息化程度高的领域应用程度高存储等能力。%%20%%17.90%14.20%透率。需求及现状互联网企业不断产生各种新应用,数据来源多样,导致需要从海量数据中分析得到有价值的信息数据,进而辅助企业决策。湖仓一体平台可加快挖掘价值数据的速度,减少数据存湖仓一体技术与产业研究报告(2023年)储成本,支撑业务快速迭代发展。电信行业拥有庞大的个人位置数据,有精准营销、信用评估等应用诉求。目前采用的传统数据架构,存在数据质量不高、实时性不够、灵活性不足、存储应用相互制约等问题。湖仓一体平台实现了可规模化、低成本存储,同时可根据应用按需建模,推动了行业的垂直应用。金融金融行业数据资产化更为成熟,信息化建设起步早、资金投入巨大,数据标准化程度高,且技术实力强。目前依赖的传统数据基础设施无法处理金融机构目前收集的各种海量数据,而且个性化客户参与和降低风险的需求日益增长。湖仓一体平台实现了统一存储、大规模分析等能力,满足创新业务需求,提升用户体验。零售家细分和基于客户行为的实时体验需求不售渠道的涌现,线下门店、自有台等渠道也带来大量碎片化的数而实现智能化分析。政府在政策的驱动下,政府部门的信息化建设投入不断加大,基础设施建设已经趋于成熟。目前以智慧城市/政务为中心的信息化建设正在加速推进,需解决政务服务业务创新速度落后于社会需求的问题,推动数据与业务的融合,提升服务型政府供给侧能力。工业工业数据价值高,标准与治理痛点突出,处于数字化转型的关键时期,由于工业生产制造流程复杂且专业性强,而且目前数据基础设施建设薄弱,湖仓一体平台可帮助工业进行数据统一治理,未来在工业领域仍有较大的发展空间。通交通行业处于数字化转型的起步阶段,其业务特性决定了具有较高的智能化应用潜力。目前部分业务环境(如智能交通、智慧机场等)应用了数据平台,缓解交通拥堵、改善城湖仓一体技术与产业研究报告(2023年)市交通状况,提升交通智慧化水平和运营效率。医疗数据大多是非结构化数据,医生、医院、患者等各方面都极为重视医疗数据的安全存储能力,传统数据库已无法满足医疗行业临床业务的数据管理及存储需求。目前也在不断作数字化转型尝试,比如用于处方、诊断等医学信息的自动理解与提取,帮助医疗人员进行信息整合。能源行业信息化建设起步较晚,前期主要支撑各业务系统运行,随着企业对数据管理和应用的重视,其数字化进程也在不断加快。、湖仓一体技术与产业研究报告(2023年)蔽得更高效的支持,即可一站式满足企业实时分析、二是利用云原生概念实现湖仓一体无服务器化部署。Serverlesss湖仓一体技术与产业研究报告(2023年)(一)山东移动:湖仓一体大数据平台建设实践1.案例背景经营分析系统和大数据专题分析平台的建设将围绕经营决策工作数据量和业务量。2.拟解决的痛点、难点面:一致;e3.解决方案分大数据平台为基础提供统一元数据管理,实时/非实时统一入湖、湖仓一体技术与产业研究报告(2023年)高,。4.价值与效果源争抢等问题,通过引入基于存算分离的湖仓一体架构,实现融合(二)威海银行:传统数据仓库到湖仓一体建设实践1.案例背景据仓库),按需实现数据集中接入和应用系统数据供给,支撑全行共加快,2.拟解决的痛点、难点提升开发运维效率2)提高系统计算性能湖仓一体技术与产业研究报告(2023年)3)提升数据服务能力3.解决方案统一数据架构,试点支撑数字化转型项目数据服务需求。截至2022系统用数需求。湖仓一体技术与产业研究报告(2023年)4.价值与效果湖仓一体技术与产业研究报告(2023年)(三)阿里云:国内某互联网金融客户湖仓一体建设实践1.案例背景力金融科技创新实力公司”奖。从国外某厂商迁移到阿里云后,持续客户对数仓基础功能、安全、Serverless云原生能力都有较高要栈的多套业务系统,也有基于OSS存储,上面多套开源引擎共享数2.拟解决的痛点、难点板。2)客户认为湖的能力不满足数仓要求,于是引入云原生数仓MaxCompute构建数据中台,MC与原有开源体系异构,如果不能融一个组件,可能带来存储冗余、元数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论