版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1|2023
爱分析·数据智能厂商全景报告报告编委报告指导人张扬爱分析
联合创始人&首席分析师报告执笔人孟晨静爱分析
分析师1|2023
爱分析·数据智能厂商全景报告目录1.研究范围定义.........................................................................................................
42.市场洞察................................................................................................................
83.厂商全景地图.......................................................................................................
144.市场分析与厂商评估
............................................................................................
185.入选厂商列表.......................................................................................................
62关于厂商全景报告...................................................................................................
69关于爱分析
.............................................................................................................
70产品服务.................................................................................................................
71法律声明.................................................................................................................
722|2023
爱分析·数据智能厂商全景报告研究范围定义3|2023
爱分析·数据智能厂商全景报告1.研究范围定义研究范围利用多种数据智能技术实现数据驱动的分析与决策,已经成为当前企业数字化转型最重要的目标之一。随着数据来源日益丰富、数据体量快速增长,企业对数据的依赖和挖掘愈发深入,不仅带来数据应用场景、数据用户角色的复杂和多元,也使得企业对于数据应用的敏捷性和即时性的要求变得越来越高。传统的数据开发与管理、数据计算分析正面临着巨大的挑战。为满足日益增长的数据应用需求,爱分析观察到,企业在数据能力建设逻辑上正转向以业务为核心,市场在技术和解决方案的供给上,也正以特定业务价值实现为驱动,变得更分化和聚焦。数据能力建设核心逻辑转向实现业务价值。企业以往在构建数据能力时,通常是由技术部门或数据部门进行统一规划,并进行数据开发与管理,业务部门被动的使用企业的数据能力。然而,随着业务部门对数据价值的逐渐重视,以及对数据应用需求的快速增加,企业技术部门或数据部门已经不能满足业务部门的用数需求。为赋能业务部门更好的使用数据,企业数据智能基础设施的构建正逐渐转变为以业务部门为核心,如尝试通过
DataOps、指标中台等概念实现数据和业务部门之间的高效协作。面向业务场景价值实现,技术解决方案更细分、更聚焦。过去几年的实践表明,功能大而全的数据中台并不适合所有企业,根据企业内数据源、数据用途的差别,市场上分化出了多种针对特定场景的数据平台解决方案,如针对风控、营销场景的实时数据平台,针对工业、物联网场景的边云协同数据平台,为了加速多数据源联合分析的数据联邦分析平台,为了加速异构数据分析的异构数据即时分析平台等。4|2023
爱分析·数据智能厂商全景报告基于以上背景,爱分析将数据智能市场划分为数据基础设施和应用解决方案。数据基础设施覆盖数据生命周期的多个技术栈,应用解决方案覆盖多个垂直行业与通用智能解决方案,具体市场划分详见下图。图
1
数据智能市场全景地图5|2023
爱分析·数据智能厂商全景报告本次报告将数据智能市场划分为应用解决方案和数据基础设施两大部分,其中数据基础设施指利用云计算、人工智能、隐私计算等新兴信息技术构建的为企业赋能的平台类解决方案,主要包括数据的采集、存储、计算、管理等内容,进而为上层应用提供数据服务;应用解决方案是指通过数据智能解决方案在垂直行业或通用职能领域直接赋能业务价值提升的最佳实践。综合考虑企业关注度、行业落地进展等因素,爱分析在本次研究中选取了数据基础设施中的数据中台、DataOps、大数据平台、一站式数据开发与管理平台、数据分析平台,以及应用解决方案中的银行对公智能风控、银行对公智能营销共计
7
个特定市场进行重点研究。本报告面向企业决策层以及数据部门、业务部门负责人,通过对各场景的需求定义和代表厂商的能力评估,为企业的数据智能基础设施及应用规划、厂商选型提供参考。厂商入选标准本次入选报告的厂商需同时符合以下条件:厂商的产品服务满足各市场定义的厂商能力要求;2022
年厂商具备一定数量以上的付费客户(参考第
4
章各市场定义部分);2022
年厂商在特定市场的营业收入达到指标要求(参考第
4
章各市场定义部分)。6|2023
爱分析·数据智能厂商全景报告市场洞察7|2023
爱分析·数据智能厂商全景报告2.市场洞察数据能力建设和数据应用建设,是企业围绕数据的两大重点工作。数据能力建设是从企业长远业务发展需要和数据部门能力提升出发,数据应用建设则是针对管理层、业务部门、IT
部门等用户的具体需求,提供数据解决方案。数据能力建设和数据应用建设相辅相成。同时,数据应用的需求决定了数据能力建设的重点方向。2023-2024
年,企业在数据能力建设和数据应用建设方面,需要关注以下重要趋势。图
2
企业数据能力建设和数据应用建设示意图2.1数据资产入表加速数据要素价值释放,央国企需要率先落地随着国家数据局的正式成立,以及《关于构建数据基础制度更好发挥数据要素作用的意见》(数据二十条)、《企业数据资源相关会计处理暂行规定》、《“数据要素×”三年行动计划(2024—2026年)》行动计划等一系列重磅政策文件的发布,国家政策层面推动数据要素价值释放的蓝图布局已8|2023
爱分析·数据智能厂商全景报告经就绪。尤其是数据资产入表,真正让数据成为企业资产。图
3
北京、上海、重庆等市发布数据要素相关政策落地到企业端,应该如何着手开展相关工作?我们可以从北京、上海、重庆等各个地方版的“数据二十条”中,获得更加具体的重点工作指引。图
4
企业数据能力建设和数据应用建设举措9|2023
爱分析·数据智能厂商全景报告总结来看,各地方数据要素政策对于企业的要求重点在数据管理能力建设、数据资产运营体系、数据资产开发利用、参与数据要素市场化交易等方面。同时,央国企作为数字经济的排头兵,需要在数据要素流通、数据资产入表方面发挥示范引领作用,率先取得突破。具体而言,企业在数据能力建设和数据应用建设方面,可以重点考虑以下发力点。数据能力建设方面:建设和完善数据管理能力,实现数据管理能力贯标。数据管理是数据资产化的前提,企业应当对标数据管理能力成熟度评估模型(DCMM)国家标准进行能力诊断和提升。增强数据运营能力,进行数据资产盘点和估值,推动数据资产入表。组织层面,成立数据集团、数据公司或数据研究院,设立首席数据官等,为推进数据要素市场化提供良好的组织和人才保障。数据应用建设方面:•加快企业数据资产的开发利用,探索高价值数据应用场景。首先在企业内部持续挖掘数据应用场景,赋能业务降本提效增收。•加快数据开放,开展数据资产登记、挂牌和交易。在用数据赋能自身业务的同时,在安全合规的前提下推动数据对外开放,通过数交所等交易机制实现数据要素流通。•积极参与公共数据等数据开放应用,积极采购数据产品和服务。一方面,根据企业数据应用的实际需求,向外寻求合适的数据要素资源;另一方面,主动探索公共数据等外部数据与自身业务场景的结合点。10|2023
爱分析·数据智能厂商全景报告2.2大模型变革数据分析范式,推动企业敏捷用数作为一项变革性技术,大模型也对企业数据分析领域带来了诸多新价值。大模型基于其强大的生成、理解和推理能力,可以在
NL2SQL
自然语言交互取数、数据下钻分析与洞察、报告生成等场景发挥价值,变革数据分析范式。大模型增强的数据分析范式,最大的价值在于降低管理层和业务人员用户的取数、用数门槛,从而增加数据消费用户规模,放大数据价值,业务收益直观。同时,可以将数据团队从繁重的基础取数工作中解放出来,有机会创造更大的价值。从应用成熟度来看,大模型结合知识库、指标平台、图计算引擎、数据虚拟化引擎等技术方案,能够较好地解决大模型幻觉等问题,提升对话式
BI
的准确率。因此,建议企业在规划大模型应用场景以及数据应用建设时,优先考虑大模型与数据分析的结合。图
5
大模型降低管理层和业务人员用户的取数、用数门槛11|2023
爱分析·数据智能厂商全景报告3.3用数理念持续渗透,指标平台支撑企业数字化经营随着数字化转型的市场教育和实践深入推进,以及当前市场环境下企业自身对于高质量发展的诉求日益强烈,企业用数理念持续渗透,已经较为成熟。用数据驱动数字化经营,提高运营效率和创新能力,已经成为普遍共识。与此同时,企业用数需求日益增长与相对有限的数据服务供给能力之间的矛盾也日益增长。企业数字化经营以指标数据的分析和洞察为核心。指标平台通过对企业指标数据资产进行全生命周期的统一管理,实现指标口径对齐,并通过一系列技术和工具优化,实现指标的高效开发,面向指标应用提供灵活、高性能的服务。图
6
指标平台支撑企业数字化经营示意图2023
年,指标平台持续渗透,成为越来越多企业数据分析技术架构中的关键组成部分,并与大模型等新技术融合,对于提升数据服务效率和敏捷性效果明显。企业需要从指标体系设计和平台建设着手,进而通过数据运营不断拓展指标在数字化经营中的应用场景,让指标平台产生更大的价值,并牵引指标体系持续迭代和数据平台建设。12|2023
爱分析·数据智能厂商全景报告厂商全景地图13|2023
爱分析·数据智能厂商全景报告3.厂商全景地图14|2023
爱分析·数据智能厂商全景报告15|2023
爱分析·数据智能厂商全景报告16|2023
爱分析·数据智能厂商全景报告市场分析与厂商评估17|2023
爱分析·数据智能厂商全景报告4.市场分析与厂商评估4.1
数据中台市场定义:数据中台是在统一数据标准规范基础上,提供数据接入、数据开发、数据资产管理、数据分析、数据服务等能力的数据资产管理和服务平台,帮助企业实现数据集中管理和服务。甲方终端用户:企业数据工程师、数据分析师、业务分析师甲方核心需求:挖掘数据要素价值、用数据驱动经营决策已经成为企业共识。随着
AI、大数据、5G
等技术发展,企业数据体量快速增长,企业对数据的依赖越来越深,众多业务的快速迭代需要数据应用敏捷开发支持。但由于企业传统
IT
建设以业务为导向,业务系统间数据相互独立,企业在用数据的时候面临诸如数据质量差、数据管理难、数据开发重复等多种问题,数据“难”用正成为企业实现数字化的阻碍。数据中台通过对企业数据进行汇集、开
发、治理,并统一为业务提供数据服务,满足业务“用”数据的需求。数据中台正成为企业数字化转型的关键举措,企业对数据中台的需求主要体现在以下几个方面。建设统一数据底座,解决数据孤岛问题。许多大型企业的数据存储基础设施建设普遍以业务需求为导向分批次建设,如企业的
APP、官网、小程序、营
销
、财税和供应链中的数据都存储在各系统中、相互独立,形成数据孤岛。数据孤岛不仅使得企业用数需跨多个系统、经多个业务部门审批,同时还会面临因数据定义不一带来的各种数据质量问题,导致协作沟通成本增加、经营效率大幅降低。18|2023
爱分析·数据智能厂商全景报告提高数据开发效率、增强数据共享能力,推动数据应用快速开发。企业数据应用的场景愈加广泛,使用人员也转向一线业务人员,于是对数据应用开发的敏捷性、实时性提出更高要求。企业传统“烟囱”式开发模式,不仅效率低下,且存在大量的重复开发,带来计算资源和人力的浪费。企业需要提升数据开发效率、加速数据共享,通过支持数据应用的敏捷开发支撑业务快速迭代。形成高质量的统一数据资产。数据孤岛也带来诸多数据质量问题,如数据不一致、数据缺失、数据不及时、数据不准确等,难以有效支撑数据分析、经营决策,企业需要对各业务数据通过数据治理后形成高质量的统一的数据资产,以供业务人员或数据开发人员使用。保证数据安全。国家对数据安全、个人隐私信息保护等立法使得企业数据安全风险提升,企业正面临多种数据安全保护场景。例如在数据收集、存储、传输、使用以及共享过程中如何保护用户隐私信息,如何对重要、敏感的数据资产进行细粒度权限界定和管理,平衡数据使用和数据安全需求,如何在云办公场景下保护数据安全等等。企业需要在建设数据中台的同时,考虑合适的数据安全保护措施。基于规划咨询,建设适用于自身业务可持续发挥价值的数据中台。数据中台服务于业务价值,受业务需求、数据资产现状、数据安全现状以及现有数字化基础设施等条件影响,不同的企业数据中台的架构设计、采用的技术栈差异明显,企业需要开展咨询规划,结合业务战略选取合适的数据中台方案。而在数据中台建设完成后,也需在组织和文化层面上给予有力支持,采用科学的管理和使用方法,才能让中台发挥最大价值。厂商能力要求:支持多源异构数据接入和集成。针对数据集成,厂商应支持文件传输协议采集、数据采集、接口应用程序接入采集、流式采集、网络爬虫采集以及物联网网关数据采集等多种采集方式,提供分布式异构数据集成引擎,支持离线数据同步、实时数据同步。同时,厂商应考虑用户体验,为客户屏蔽19|2023
爱分析·数据智能厂商全景报告底层技术栈差异,提供零代码开发接入功能,如配置可实现多源异构数据一步接入。另外,在数据集成同步、数据集成监控方面也应提供可视化工具,降低数据开发人员的操作门槛。具备数据开发能力。一方面,在数据接入后,厂商应提供丰富的数据存储方式,满足数据模型、数据规模,数据生产方式、数据应用方式等带来的多样化的数据存储需求,如提供
OLTP
数据库、分布式文件系统、NoSQL
数据库、云数据库等
。另一方面,厂商应提供可视化的离线开发、实时开发、算法开发环境,降低数据开发人员的使用门槛,支撑实现批计算、流计算、在线查询、即席分析等数据计算能力。此外,厂商还应配合提供智能调度、智能运维、监控告警等系列工具,保证数据中台的计算性能和系统稳定性。提供完整的数据资产管理工具。厂商需要提供数据治理服务,帮助企业构建一套统一的、可执行的数据标准,同时对数据血缘、数据质量、元数据、数据生命周期进行管理和可视化展示,使企业数据资产可见、可用。同时,厂商也应对数据生命周期提供数据安全保障,如对数据进行分类分级、发现敏感数据以及对数据权限进行细粒度控制等,保护用户隐私、防止数据泄漏。支持构建数据服务,实现数据共享。数据中台的核心功能是为业务部门提供数据服务,因此厂商应支持向导模式或是
SQl
模式快速生成
API,同时应提供接口性能实时监控、权限管控、API
发布等功能,提高数据开放与共享效率。具备行业
Know-how
能力,提供企业数据中台建设咨询和定制化服务。企业需要具备较强的咨询服务能力,需为企业在数据架构涉及、数据资产梳理、数据团队规、数据运营等方面提供切实可行的方案,并通过培训等方式强化和落实。此外,不同行业、不同规模的企业其组织文化、业务场景和数字化水平差异巨大,因此数据中台的定制化程度较高,厂商需要基于对行业和业务场景的Know-how,结合企业数字战略,为企业提供个性化的数据中台解决方案。20|2023
爱分析·数据智能厂商全景报告入选标准说明:1.
符合数据中台全部厂商能力要求;2.
2022Q1
至
2022Q4
该市场付费客户数量≥10
个;3.
2022Q1
至
2022Q4
该市场合同收入≥1000
万元。代表厂商评估:微品致远厂商介绍:微品致远成立于
2014
年,是由中兴通讯孵化,深圳国资委、大型央企联合投资的智能化技术服务商,基于大数据、人工智能、5G
等技术,为通信、民航、工
业、政务、园区、金融等领域企业客户,提供数据中台、5G
专网、IOC
可视化平台、IOT
平台等系列产品和解决方案,帮助客户实现数字化和智能化转型。产品服务介绍:微品致远数据中台是企业级一站式数据中台
PaaS,具备完善的数据中台体系产品及工具,如大数据分布式计算平台、数据开发套件、数据质量管理工具、数据地图管理工具、数据模型管理工具、API管理工具等,覆盖数据采集、计算
、存储、服务和应用全链路,为客户提供轻量级、低代码、可落地的数据中台解决方案。同时,微品致远基于丰富的案例沉淀,已经形成完善的数据中台建设方法论和体系化的数据中台建设实施流程,为电信运营商、机场空管、工业企业、政府机构、地产、园区、21|2023
爱分析·数据智能厂商全景报告泛家居、时尚、新零售、金融机构等客户数据中台建设提供咨询、部署及实施全方位支持。图
7
微品致远数据中台产品架构图厂商评估:微品致远的数据中台
PaaS
产品,在功能的完善性、易用性等方面具有优势。基于在运营商、泛交通、地产园区、智慧乡村、时尚零售等领域智能应用开发积累,融合数据中台能力,微品致远能为客户提供一体化解决方案。此外,微品致远还集成数据中台、技术中台能力,为企业应用敏捷开发提供数字底座。微品致远具备完整的数据中台技术栈,能提供一站式数据中台PaaS产品。微品致远数据中台的技术架构由数据源、数据平台、数据管理平台、数据服务以及数据应用等构成,可覆盖数据采集、计算、存储、服务和应用全链路。其中,数据平台提供一站式大数据开发平台,兼容Python、SQL、Java
等多种异构语言,支持离线、在线数据开发环境。数据管理平台提供对数据源、元数据、数据质量、主数据、血缘关系、生命周期等管理功能,并提供敏感数据发22|2023
爱分析·数据智能厂商全景报告现、敏感策略配置、脱敏算法管理等数据安全功能,保证数据的可读性、可追溯以及安全性。数据应用基于统计报表、数据挖掘、高管驾驶仓等功能为客户提供销量、数据门户、智慧门店等智能应用。微品致远的数据中台产品具备较强的易用性,能显著降低中小企业的学习成本。如数据源侧,支持来自
RDBMS、Hadoop、文本、接口等多个数据来源的结构化、半结构化、非结构化等多种数据类型,以离线和流式数据的采集模式一步跨网接入,实现实时多源异构数据一站式上云。在数据开发环节,支持通过对数据计算元子拖拽组合,以低代码可视化的形式实现复杂的批量数据计算流程开发。在数据服务方面,有强大的
API
网关能力和
ESB
数据总线能力,包括整合外部数据、快速配置
API、审核内外
API、管理
API
消费权限,同时可零代码生成
API并发布。在数据应用方面,提供自助大数据分析
BI
工具,可帮客户轻松搭建报表管理平台,打通数据壁垒。基于数据中台能力和数据智能应用产品积累,微品致远能为运营商、地产园区、智慧乡村、时尚零售、营销等领域客户提供一体化解决方案。微品致远在园区、智慧乡村、零售、营销等领域积累了丰富的实践案例,不仅沉淀了丰富的领域
Know-how
和项目经验,也在各领域形成了丰富的数据应用体系,融合数据中台能力,为客户快速实现数据能力落地。以智慧乡村为例,微品致远基于与广西、贵州、浙江等多地政府单位的合作经验,已经开发形成覆盖交易、金融信贷、三资管理、农产品溯源、水务、教育、旅游等各个版块的智慧乡村应用,融合乡村大数据中台,可为客户提供全系统集成、全数据连接的智慧乡村解决方案,实现乡村数字化治理。此外,微品致远具备集成数据中台、技术中台的数字底座能力,支撑企业应用实现敏捷开发,显著降低业务运行成本。在数据中台能力基础上,微品致远具备六大技术中台能力,包括统一23|2023
爱分析·数据智能厂商全景报告身份认证、统一门户、能力开放平台、流程平台、低代码平台、DevOps
平台等。集成数据中台、技术中台能力,微品致远能以标准化服务的形式为企业各个应用提供所需的数据资源、基础功能、开发平台、开发组件等,实现业务应用敏捷开发,满足业务快速迭代创新需求。典型客户:长沙城发、顾家家居、谢瑞麟、云创设计、珠海机场24|2023
爱分析·数据智能厂商全景报告4.2
DataOps市场定义:DataOps
数据开发运营一体化是指通过流程自动化、可观测性、协作沟通、工具集成等方式实现敏捷开发、持续交付,满足敏稳双态数据消费需求的咨询、工具和服务。甲方终端用户:金融、制造、汽车、消费品零售、能源等行业的大数据部门负责人、IT
部门负责人甲方核心需求:企业的数据开发效率正面临严峻的挑战。一方面,企业数据体量和多样性在日益增长,以图像、视频、文本、时序等为代表的非结构化数据占比提升,使得传统的
ETL
工作量加重,数据开发效率更低、反应更缓慢。另一方面,激烈的竞争环境要求业务快速反应,不仅要求缩短数据开发周期,还要求实现实时分析、自助式分析。为适应业务部门的需求,企业需要通过
DataOps
理念实现敏捷数据开发。企业对
DataOps
的具体需求如下:提高数据开发和交付效能。1)提高数据开发流程自动化水平。企业在过往建设数据平台过程中
,由于缺少规划意识,采购的数据开发管理工具成为散点工具。企业在使用散点工具开发数据过程中操作繁琐、效率低下。以数据采集为例,传统
ETL
方案通过脚本实现,随着数据源的增多、数据类型的增长,企业增加大量手工适配任务。又如数据任务在开发环境、测试环境和生产环境中的导入、配置均需开手工实现,为开发人员带来繁琐工作量
2)建立灵活、敏捷的数据开发管道。企业传统的数据开发流程需依照需求分析、数据设计、编码、测试、部署等步骤,数据开发需进入测试阶段才能全面校验,难以及时发现问题,并且一旦业务需求改变,需要回到前期重新进行设计和规划,导致开发周期较长,常以周甚至月为单位,难以快速响应业务需求。企业需要建立可持续开发、持25|2023
爱分析·数据智能厂商全景报告续测试、持续交付的数据开发管道,快速发现开发问题,实现敏捷迭代。提升数据治理水平,提高数据可用性。企业传统数据治理与数据开发割裂,普遍是“先研发、后治理”,在数据开发完成后再以专项项目的方式推进数据治理,取得效果后过段时间又会出现数据质量问题,效果反复,对业务端用数造成困扰。企业希望提升数据治理水平,实现持续的数据治理、保证数据可靠可用。建立数据开发规范,提高跨部门跨域数据开发协作能力。1)针对业务提需求环节,需建立业务人员的取数、用数规范。如业务人员做全局数据分析时,对数据归属部门不了解、数据申请流程缺失、数据申请规范不清晰等问题极易造成业务人员取数困难。2)需求沟通环节,需建立业务人员与开发人员的协作规范。一方面,在业务人员与
IT
人员的沟通中,由于双方专业性差异、术语理解不一致、目标期望不同等原因带来沟通障碍,造成开发效率缓慢或是反复开发的情形。同时,双方在需求沟通过程中往往少正式的沟通渠道和沟通工具,信息传递受阻,也导致双方对需求理解不全面。3)数据开发中,需建立跨域、跨部门以及跨角色的开发规范。其中跨域开发协同问题以大型集团型企业为例,企业的各个子公司都有独立的数据开发团队。由于子公司间信息化水平和所选供应商存在较大差异,各子公司在数据格式、数据规范、数据模型、数据标准等方面都存在显著差异,这使得总部在与子公司进行数据同步时,需要二次数据治理,以确保数据有效性和准确性。而跨角色协同开发问题以机器学习建模场景为例,IT
人员、数据科学家、数据工程师等多种角色相互配合,数据流转过程中也需要制定数据规范提高流转效率。26|2023
爱分析·数据智能厂商全景报告图
8
建立数据开发全流程规范降低业务用数门槛,赋能业务场景应用。激烈的竞争环境下要求业务快速响应。企业一方面需要建立指标体系低业务人员用数门槛,另一方面也应支持业务人员开展自助式探索分析,如在
BI
平台中利用数据指标开展数据洞察,或是在机器学习平台中可自助完成销售预测分析等。厂商能力要求:支持敏捷数据工程和较高的自动化程度。在数据工程方面,厂商应支持企业内部将各业务系统的数据融合打通,提供数据采集、数据汇总、数据清洗、数据治理、数据服务等数据开发全链路工具协助企业建立数据资产。同时,厂商数据工程应支持从开发、测试到上线的持续集成和持续发布,并为不同角色人员提供便捷的开发环境。此外,厂商数据工程中应将数据采集、数据转换、数据治理、代码测试等重复的工作流程自动化,提高数据开发效率。支持数据开发治理一体化。厂商应将数据治理融合到数据开发过程中,如支持对多种元数据的主动采集,建立数据血缘关系,实现数据溯源;如支持数据标准自动落标,为数据建模、数据质量审计等环节提供规范参考,使数据开发成为企业可持续开展的任务。厂商需具备数据运营咨询规划能力。厂商能基于可复用的成功经验,针对客户的业务需求和内部建27|2023
爱分析·数据智能厂商全景报告设现状指导实施落地。一方面,厂商需具备规划能力,为客户规划数据开发运营的蓝图和实现路径;另一方面,厂商应为客户提供咨询能力,协助客户建立数据研发运营规范、调整组织架构、完善流程机制,如制定数据质量管理规范以及数据建模标准,梳理数据申请、数据使用流程等。为业务人员提供便捷的数据服务。厂商应支持业务人员轻松连接多个源数据,进行整合、清洗和分析,在规范的指标体系基础上,使业务人员便捷地开展自助式分析、智能分析。另外,厂商还应融合
AI
能力提供全局数据发现,业务人员可自助进行数据发现、探索。入选标准说明:1.
符合
DataOps
全部厂商能力要求;2.
2022Q1
至
2022Q4
该市场付费客户数量≥5
个;3.
2022Q1
至
2022Q4
该市场合同收入≥500
万元。代表厂商评估:科杰科技厂商介绍:科杰科技成立于
2019
年,是国内领先的大数据基础软件供应商,致力于自主可控的大数据底座产品研发与应用,推动企业全面实现数据驱动型组织转型升级。科杰科技自研的湖仓一体数据智能平台
KeenData
Lakehouse,具备云原生、低代码特点,可为组织提供数据管理、开发挖掘、运维一28|2023
爱分析·数据智能厂商全景报告体化的一站式全流程数据能力建设方案。产品服务介绍:科杰科技核心产品湖仓一体数据智能平台
Keen
Data
Lakehouse
是基于云原生技术自主研发的数据底座产品,内置数据开发管理平台
Keen
BDP、数据同步系统
Keen
Dsync、实时计算平台
KeenStream、数据标准产品
Keen
DSM、数据质量管理平台
Keen
DQM、主数据管理平台
Keen
MDM、数据资产目录
Keen
Asset、数据服务平台
Keen
DAAS、数据标签平台
Keen
TAG、数据同步系统Keen
Dsync、大数据基础平台
Keen
KDP、数据科学平台
Keen
DSP
等
12
大功能模块。Keen
Data
Lakehouse
数据底座分为三层,底层数据引擎提供存储计算引擎等基础设施支持,中层提供低代码开发、数据工程能力建设,上层则提供基于数据和数据资产的业务服务能力。厂商评估:科杰科技在协助企业构建数据工程能力、实现主动数据治理、提供数据运营咨询规划等方面具有明显优势,此外,科杰科技基于丰富的落地经验积累,提炼形成适用于大型集团型企业数据能力建设的最佳实践方法论,广泛应用于政府、金融、新零售、能源、工业互联网、汽车、通信等多个行业。科杰科技KeenData
Lakehouse数据底座产品可为企业构建数据工程能力,实现敏捷数据开发。KeenDataLakehouse
数据底座丰富的产品模块,将数据开发
IDE(集成)化、流程化、协作化和自动化,可为企业建立起一套兼具数据管理和软件工程能力的数据工程体系。其中,在数据管理方面,KeenDataLakehouse
覆盖数据获取、数据集成、数据准备、数据治理和分析与建模等数据管理全生命周期,提供全局统一的数据标准、数据质量、主数据管理、元数据管理。29|2023
爱分析·数据智能厂商全景报告软件工程方面,KeenDataLakehouse
覆盖研发管理、持续交付以及研发运维,为企业提供数据协作、数据开发、数据部署、编排以及测试与监控等功能。如针对协作开发,KeenDataLakehouse
支持同项目下多人协同开发、支持代码版本管理和代码回滚,实现灵活、高效的开发;针对开发运维,平台提供智能依赖任务推荐、智能调度、智能基线预警等功能,实现数据处理流程自动化。科杰数据工程能力可支持企业通过低代码、零代码的方式高效率开展数据开发、数据管理、数据运营工作,大幅提升业务运营和产品研发在数据使用层面的效率。如科杰科技为中金公司提供数据中台建设,实现多源数据汇集、多团队协同开发、数据资产的统一管理,有效提升各部门数据集市建设效率,支撑营销、投研业务分析及其他智能应用。科杰具备主动数据治理能力,为企业建立主动实时的数据自治理体系。科杰将访问控制、管道连接、数据合并、主动元数据探查等技术融入数据工程中,提供基于AI
增强的数据异常检测和数据血缘分析,加强对数据标准、主数据管理、数据治理、数据资产目录的管理,形成主动、实时的数据自治理系统。如科杰提供主动元数据探查,一旦数据源发生变化,系统将通知使用数据的算法或模型进行自动化调整;如科杰支持对数据质量可问题进行
AI
强化学习,优化对异常情况的灵敏处理。科杰具备数据运营咨询规划能力。科杰科技能够为客户提供前期的数字化咨询服务,在战略规划方面,科杰将根据企业现状给出问题诊断帮助企业内部的
IT
技术部门、数据部门和业务部门达成共识,明确目标和建设路径;在制度流程方面,为企业完善数据管理的相关标准和规范,梳理数据管理部门数据开发协作、业务部门与数据管理部门协作工作流程;在组织建设方面,协助企业完善企业组织和角色。30|2023
爱分析·数据智能厂商全景报告科杰积累丰富落地经验,形成适用于大型集团型企业数据能力建设的最佳实践方法论。科杰科技的核心研发团队具有互联网大厂背景和十多年大数据实战经验,曾经历大型企业的大数据部门组建、数据中台项目的建设,对大型企业跨部门的数据协同开发、数据管理流程等方面痛点了解深入。经过多年经验积累,科杰总结出一套复杂业务场景下数据能力构建的最佳实践方法论,包括数据工程能力、数据自治理能力、基于
DataFabric
理念的数据资产管理能力以及面向不同组织角色融合的
DataOps
全流程服务能力等,并已在金融、新零售、能源、工业互联网、汽车、通信等行业成功落地。此外,科杰科技作为
DataOps
理念的实践先行者,深度参信通院《DataOps
实践指南(1.0)》编写,并成为信通院首批
DataOps
产品创新实验室单位之一,也使得科杰对于DataOps
实践标准的熟悉程度、工具产品融合、DataOps
构建效果等方面备受行业认可。典型客户:中石化勘探院、中金公司、永旺集团、一汽集团31|2023
爱分析·数据智能厂商全景报告4.3
大数据平台市场定义:大数据平台是基于数据湖、湖仓一体架构的数据平台,提供数据存储计算、数据集成、数据开发、数据治理、运营管理、数据分析、数据共享和服务等一站式能力,支持对各类结构化和非结构化数据的处理,以及
BI、数据科学、AI/ML、实时分析等数据应用场景,从而帮助企业低成本地获得自助式、可按需使用的数据平台服务,并实现安全的跨组织数据共享和消费。甲方终端用户:企业数据部门、IT
部门甲方核心需求:随着企业数据类型和数据规模的增加,企业内部以数字化经营、精准营销、智能推荐、风险管理为代表的多模态数据实时分析场景逐渐增加。传统数据分析平台由于仅能提供结构化非实时数据的加工处理功能,不具备对结构化、半结构化和非结构化数据等多种数据类型进行实时计算的能力,使得企业数据资源的挖掘和利用受限,企业对大数据平台的需求具体体现在:整合多类型数据,实现统一管理和分析。企业采集的数据类型异常丰富,如
CRM
关系数据、日志数据、流量数据、广告投放等分散在多个系统中,包含大量的文本、音频、视频等半结构化与非结构化数据。非结构化数据与结构化数据在数据标准、数据语义等方面难以打通,这使得企业难以对全域数据进行关联分析,使得用户画像信息缺失、舆情判断不准确等问题。满足快速增长的海量多类型数据实时写入和分析需求。在车联网、证券、广告投放等场景中,快速给出分析结果是保证服务有效性、保障客户体验的前提。尤其车联网场景中,车企面临高密集上千32|2023
爱分析·数据智能厂商全景报告种实时信号数据的写入和及时的数据分析需求,企业迫切需要建设高效实时数据链路。降低海量数据存储和计算成本。企业数据规模快速增长,头部大型企业数据体量正从
TB
升至
PB
级,这使得数据汇总、数据聚合、模型训练等全量数据写入场景需要更高的数据存储和计算成本,企业需要针对海量数据的低成本存储和计算优化方案。提高数据开发效率。在传统的数据平台中,企业或是缺乏数据开发全流程工具,或是由多个数据开发工具构成,导致不同开发模块间链接不通畅,数据开发效率低,难以满足企业日益增长的数据应用需求。企业需要通过一站式数据开发工具打造敏捷开发流程,提高数据开发效率。满足政府单位、国央企和金融等领域的国产化要求。大数据平台底层对接存算引擎、数据库,应适配国产化,满足企业自主可控需求。厂商能力要求:具备多类型异构数据的统一存储和管理能力。厂商提供的大数据平台底层应基于数据湖、湖仓一体架构,支持结构化、时序、文档、图像等多模数据自动冷热分级存储,支持对多模数据通过统一存储为湖表格式或通过数据虚拟化的方式实现统一元数据管理、统一语义,支持全域数据统一分析。支持存算分离架构,可实现海量数据的低成本存储。支持存算分离,可按需分别对计算资源、存储资源进行弹性扩缩容。其中,资源调度系统应融合机器学习算法综合任务优先级、资源需求、系统健康状况等因素对资源分配进行智能决策,通过灵活任务调度提高资源利用率。提供一站式数据智能开发工具,帮客户建立敏捷开发流程。大数据平台应覆盖数据开发全流程,包括不限于提供丰富的数据处理组件,提供工作流调度、智能运维、数据质量管理、数据安全等功能支持,以及提供敏捷开发集成环境支持多人协作设计等。此外,厂商也应将
AI
融入数据开发流程中,如在数据标准、合规和质量等方面进行自动化检测、识别、校验、告警。33|2023
爱分析·数据智能厂商全景报告厂商应具备国产信创适配能力。符合信创标准,实现国产化替代。厂商需要能与国产主流软硬件兼容适配,包括不限于国产化芯片、服务器、操作系统、中间件等,满足企业国产化需求。入选标准说明:1.
符合大数据平台全部厂商能力要求;2.
2022Q1
至
2022Q4
该市场付费客户数量≥5
个;3.
2022Q1
至
2022Q4
该市场合同收入≥5000
万元。代表厂商评估:滴普科技厂商介绍:北京滴普科技有限公司成立于
2018
年,定位为数据智能基础设施提供商。以
Data+AI
为核心战略,滴普科技打造了实时智能湖仓平台
FastData、企业大模型
Deepexi、智能体平台
FastAGI、训推一体机
Fast5000E
等在内的数据智能产品体系,助力企业实现从数据驱动到智能驱动的升级。目前,滴普科技已成功服务
200
余家知名大中型企业,包括中国石油、兴业证券、百丽时尚、航天烽火、重庆机电、陕药集团、长安新能源、纳爱斯集团、广州城投、九洲电器等。34|2023
爱分析·数据智能厂商全景报告产品服务介绍:滴普科技实时智能湖仓平台
FastData
是基于湖仓架构,支持一站式数据采集、存储、开发、治理、分析的大数据平台,由底层云原生实时湖仓引擎
FastData
DLink(简称
DLink)和数据智能开发治理平台
DataFacts
构成。DLink
采用存算分离架构,支持
EB
级多模数据的存储与处理,支持流批数据处理、数据分析、数据科学等多工作负载,无缝连接大数据生态,提供一站式数据探索与数据开发能力。DataFacts
提供完善的数据开发套件、数据治理套件和数据分析套件,为用户提供可组合、可配置的现代数据栈,为数据应用与场景提供端到端组装以及全链路管理能力。厂商评估:滴普科技实时智能湖仓平台
FastData
在底层湖仓引擎的高效、易用以及实现敏捷开发和开发治理一体化等方面具有明显优势。同时具备较强的国产信创适配能力和全流程服务能力。FastData底层云原生实时湖仓引擎
DLink具备简单、高效、易用等特点,支持海量多源异构数据的统一存储和管理,可同时适应BI、即席分析、机器学习等多种应用场景。在数据集成上,DLink
存储层兼容
Iceberg
和
Hudi
两种主流数据湖格式,支持丰富的结构化、半结构化与非结构化数据类型以及主流
Oracle、MySQL、PostgreSQL、Hive、人大金仓等
30
多种数据源,以离线、实时和流批一体的方式统一入湖。在数据管理上,DLink
统一元数据管理功能支持用户以逻辑湖的形式连接数据孤岛、统一数据语义,实现数据的统一管理。DLink
可支持即席查询、AI、ML、实时推荐等复杂场景。如即席查询场景,DLink
高性能SQL
引擎支持
PB
级海量数据任意维度即席查询,MPP
分析引擎秒级查询延时。针对
AI、35|2023
爱分析·数据智能厂商全景报告ML
等高负载的应用场景,DLink
支持数据湖上非结构化数据处理与数据仓库中结构化数据处理任务无缝衔接,用户可通过统一的调度平台调度,快速完成
AI
与
ML
中的数据开发、模型训练等环节。FastData丰富的数据开发套件,能为客户建立敏捷开发流程。滴普科技提供覆盖数据采集、建模、离线及实时开发、运维监控、服务开发等丰富的敏捷开发集成环境和开发套件,操作界面直观、配置方式简单。如数据平台支持基于
WEB
SQL
的可视化离线/实时任务开发;批流采集任务中,开发人员一次配置后,程序可自动进行批和流的数据采集;在任务调度配置中支持多种任务
DAG
组织形式,以及跨项目、跨流程、定时、时间等触发方式,满足客户复杂调度场景。基于Data
Fabric
架构,FastData可帮客户实现数据开发治理一体化,充分释放数据价值。如平台可根据企业数据资产情况智能化进行标准关联或标准推荐,并将国家标准、行业标准、集团标准等多种数据标准自动化映射到表字段,开发人员可以将数据标准作为规范应用在数据建模、数据质量稽核以及运维中。又如平台支持对多种数据源元数据的自动化采集,建立基于元数据的全链条数据血缘,能帮助数据开发人员在模型设计和数据开发中理解数据的质量、可靠性以及构建数据流程,使开发人员在应用侧数据异常时快速洞察数据的生产过程,或是数据变动后快速分析影响范围。滴普科技具备较强的国产信创适配能力。自
2020
年起,滴普科技陆续与多个领域开展国家级测试,及云计算、能源、证券等重大行业测试,这也加速滴普科技产品对芯片、服务器、操作系统、存算引擎、国产化中间件等方面完成系列化适配认证。如
FastData
在底层存算引擎方面适配广泛,可支持十余种存算引擎的数仓建设,在芯片方面,也已完成鲲鹏、龙芯、海光等国产化芯片的适配。36|2023
爱分析·数据智能厂商全景报告滴普科技提供以数据为核心的业务价值创新咨询服务,具备从咨询规划、技术选型、建设交付到运维运营的全流程服务能力,满足客户项目落地过程中不同阶段需求。如在数据治理咨询中,滴普科技可提供数据成熟度评估及蓝图规划,数据治理体系设计、业务数据盘点及深化治理等咨询服务;在技术选型中,提供数据平台技术架构设计、数据开发和管理工具规划等服务;在建设交付过程中提供大数据组件技术支持;在数据运营中,可提供指标及标签体系设计、数据流向设计、数据关联角色与流程设计等服务。目前,滴普科技在先进制造、生物医药、能源出行、政务双碳、金融科技、消费流通等领域的持续深耕,服务客户数量超过
200家。典型客户:百丽时尚、昆仑数智、中核装备院、航天烽火、中国海诚37|2023
爱分析·数据智能厂商全景报告4.4
一站式数据开发与管理平台市场定义:一站式数据开发与管理平台,是指针对业务用户需求,建立涵盖数据集成、开发、存储、计算、服务、任务调度等在内完整的数据加工链路,并提供全域数据资产管理能力的数据平台。甲方终端用户:金融、制造、汽车、消费品零售、能源等行业的大数据部门负责人、IT
部门负责人甲方核心需求:随着业务部门对于数据分析的需求越来越广泛,甲方企业需要构建一套面向业务部门用数需求的数据开发与管理流程和机制,并提升相应的数据开发与管理能力。过往,甲方更多是将数据整合和管理作为企业的阶段性目标和项目来完成,对数据如何应用、如何在业务场景中发挥价值关注度不足。在实践过程中,投入大量资源和人力,完成数据整合之后,“取数难”、“用数难”、数据质量低等问题依然存在,甲方还是无法发挥数据的价值。因此,甲方真正需要具备的是一套面向业务的完整的数据开发与管理能力,其核心需求包括:搭建端到端具备完整功能的数据开发与管理平台。平台需要围绕数据开发与管理全链路的需求,提供完备的功能,并具备自动化开发能力。甲方需要能够在这一平台上完成各类结构化、非结构化和半结构化数据的开发和管理,覆盖数据加工全链路的集成、开发、存储、计
算、服务、任务调度等需求,具备对全域数据管理的能力。同时,为应对越来越多且时效性越来越强的开发任务,还需要利用自动化工具提升效率。平台需能够兼容现有数据基础设施,并支持二次开发。经过多年信息化和数字化建设,绝大多数甲38|2023
爱分析·数据智能厂商全景报告方已经具备一定数据基础,以
MPP、Hadoop
为代表的技术架构,以大数据平台为核心的数据开发和管理工具,因此,数据开发与管理平台需要兼容现有的数据基础设施。同时,随着业务的发展,未来产生越来越多的创新业务场景,平台需要有充分的扩展性,可以二次开发接入外部工具以应对多元的需求,从而支持各类型业务场景开展。建立统一的数据开发与管理流程和机制。在甲方现有流程中,应用开发和数据开发往往是分开进行,但考虑到越来越多数字化应用是基于数据驱动这一趋势下,企业需要考虑将二者融合。过去建设的数据中台尽管一定程度上能够支持报表、自助式分析等应用,但实质上仍未能满足支撑整个数据开发管理体系,无法满足越来越多基于数据驱动的应用需求,特别是以即席查询、机器学习为代表的探索式应用。因此,甲方需要将应用开发与数据开发融合,并建立统一的流程和机制。厂商能力要求:数据开发与管理平台产品具备完整的功能。能够覆盖数据开发与管理的全流程,包括数据集成、开发、存储、计算、服务等等各个方面,能够提供多人可协作的项目空间管理,具备持续集成和发布的能力。产品架构需要具备较强的可扩展性。需要具备解耦能力,采用模块化方式构建,能够单独拆分功能模块按需提供。在扩展性方面,需要能够适配企业内的其他生态,支持多种接口协议,已封测及对接多种软件或硬件接口调用等方式,能够快速满足企业未来的创新应用。针对业务场景的需求建立统一的数据开发与管理流程,提供咨询服务或将流程内化为产品标准。厂商需要具备对数据应用场景的深入理解,以及具备丰富的客户服务经验,构建满足甲方业务部门数据应用需求,实现高效的数据加工处理的开发管理流程,并为客户提供相应的咨询建议。针对一些行业共性的需求,厂商需结合其产品和技术能力,将开发与管理流通融入数据平台产品中,提供行业最佳实践。39|2023
爱分析·数据智能厂商全景报告入选标准说明:1.
符合一站式数据开发与管理平台全部厂商能力要求;2.
2022Q1
至
2022Q4
该市场付费客户数量≥5
个;3.
2022Q1
至
2022Q4
该市场合同收入≥1000
万元。代表厂商评估:炎凰数据厂商介绍:炎凰数据是一家致力于打造具备自主知识产权的大数据处理平台的公司,其核心产品炎凰数据平台,专注于提供对异构多源大数据的即时分析能力。公司核心团队来自前
Splunk
中国研发中心,具有深厚的大数据分析、架构设计和系统开发经验。产品服务介绍:炎凰数据平台是新一代的异构大数据即时分析平台。结合其一站式的数据开发与管理能力,以及独特的读时建模、搜索引擎等技术,用户可以对来自各类机器、物联网设备、移动终端、业务系统、数据库异构的原始数据进行即时分析。40|2023
爱分析·数据智能厂商全景报告炎凰数据平台的服务范围涵盖泛金融、互联网、新能源
、工业制造等多个行业领域,典型应用场景包括:数据安全
,AIOps,流程挖掘、时空数据分析、工业物联网等。服务过众安保险、上海电力、知识星球等标杆客户。炎凰数据平台的大数据搜索引擎、读时建模等核心技术均为自研,做到源代码可控,并达到国际先进水平,是国产替代的可靠选择。厂商评估:炎凰数据平台专为现代企业数据源广泛,数据格式多样且易变,以及带有一定时序特征的数据分析需求而设计,通过提供一站式的数据开发管理平台,为企业在异构数据的查询分析中带来灵活、即时、易用,以及快速部署的使用体验,具体如下:基于自研的读时建模存储和计算引擎,炎凰数据平台能够灵活支持多种场景下,企业对异构多源大数据的存储与查询分析。在数据存储方面,平台无需事先定义数据结构,而可以按数据原格式将来自企业各类生产管理系统中的非结构化、半结构化以及结构化数据统一存储在平台中,打破数据孤岛的同时保证了数据的完整性;在数据查询分析方面,平台的读时建模技术允许用户在读取数据时自定义规则,根据算法从原始数据中自动提取分析需要的字段,并支持用户根据业务需求动态地调整数据查询规则,从而避免繁重的传统
ETL
工作,提高异构数据处理的灵活度。同时,炎凰数据自研的搜索引擎提供类似
的关键字简易查询,以及交互式查询、事件上下文搜索等高阶查询,满足用户在不同场景中的数据查询需求。此外,平台也支持对结构化数据进行写时建模,提升对结构化数据进行分析的能力。炎凰数据平台在数据加工处理方式,平台架构等方面进行了多重优化,能够保障用户即时获得分析结果。针对读时建模以往固有的算力开销较大,影响查询速度的问题,炎凰数据在向量化计算、即时编
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论