数据库:信创助力百花齐放_第1页
数据库:信创助力百花齐放_第2页
数据库:信创助力百花齐放_第3页
数据库:信创助力百花齐放_第4页
数据库:信创助力百花齐放_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、目录 HYPERLINK l _TOC_250020 什么是数据库? 5 HYPERLINK l _TOC_250019 成长到繁荣,新兴数据库兴起 5 HYPERLINK l _TOC_250018 两大类型为主,新兴数据库种类渐多 6 HYPERLINK l _TOC_250017 对标海外:空间广阔,开源和云兴起 7 HYPERLINK l _TOC_250016 市场空间:全球数据库市场空间广阔 7 HYPERLINK l _TOC_250015 竞争格局:传统巨头占优,新兴厂商崛起 8 HYPERLINK l _TOC_250014 国内市场机会:国产替代、新兴崛起 11 HYPER

2、LINK l _TOC_250013 国产数据库市场持续快速增长 11 HYPERLINK l _TOC_250012 海外厂商占优,国产替代有望加速 12 HYPERLINK l _TOC_250011 新兴数据库趋势:多技术融合 14 HYPERLINK l _TOC_250010 百花齐放,国产数据库厂商迎来机遇 16 HYPERLINK l _TOC_250009 华为:国产数据库龙头,快速构建生态 16 HYPERLINK l _TOC_250008 阿里巴巴:国产替代先行者,云数据库国产厂商领先 17 HYPERLINK l _TOC_250007 腾讯:数据库产品不断迭代,重视新

3、兴技术 19 HYPERLINK l _TOC_250006 柏睿数据:新兴领军,分析型数据库代表企业 20 HYPERLINK l _TOC_250005 星环科技:分布式、分析型数据库新兴代表 22 HYPERLINK l _TOC_250004 南大通用:传统国产数据库领军 23 HYPERLINK l _TOC_250003 达梦:老牌国产数据库厂商,迎信创产业落地机遇 24 HYPERLINK l _TOC_250002 人大金仓:控股股东重视程度提升,电科体系助力成长 25 HYPERLINK l _TOC_250001 万里数据库:行业市场获得标杆客户认可 26 HYPERLIN

4、K l _TOC_250000 风险提示 27图表目录图 1:数据库历史一览图 6图 2:非关系型数据库细分 7图 3:非中国地区数据库市场成熟度结构图 8图 4:全球数据库市场规模增长预测图(单位:亿美元) 8图 5:数据库行业受欢迎程度排名 2020-08 9图 6:全球主要数据库产品市场份额占比图(数据时间为 2020 年 8 月) 9图 7:商业与开源数据库历年受欢迎程度变化图(单位:%) 10图 8:全球数据库行业不同种类数据库喜好对比 2020-08 10图 9:2015-2017 年国内数据库各领域应用规模(单位:亿元) 11图 10:2012-2018 年国内数据库市场规模(单

5、位:亿元) 12图 11:2019-2024 年国内数据库市场规模预测(单位:亿美元) 12图 12:2017 国内数据库市场全部厂商市场份额对比图 13图 13:2017 年国内数据库市场仅国产厂商市场份额对比图 13图 14:IOE 问题介绍与解决的可能方向一览 13图 15:国内数据库市场国产与国外厂商规模(单位:亿元) 14图 16:2016-2020 全球数据量预计(数据量单位:ZB) 15图 17:2019 年国内市场公有云数据库市场份额占比图 17图 18:阿里巴巴近年数据计算领域取得成就一览 18图 19:腾讯公司从事数据库产业经历的四个阶段 19图 20:腾讯云使用客户案例

6、20图 21:柏睿数据合作伙伴及客户 22图 22:星环科技使用客户案例 23图 23:南大通用使用客户案例 24图 24:武汉达梦前五大主要持股人信息 24图 25:武汉达梦近五年营收与净利润情况(单位:万元) 25图 26:万里数据库使用客户案例 27表 1:关系型数据库细分一览 6表 2:国内数据库市场“去 IOE 化”进程一览 14表 3:国产数据库新兴产品的技术趋势 15表 4:华为云官网已发布的数据库产品一览 16表 5:华为名下其他产品对其数据库产品的辅助作用 17表 6:阿里巴巴数据库产品一览 18表 7:腾讯云旗下产品一览 19表 8:柏睿数据库行业产品一览 21表 9:星环

7、科技数据库产品一览 22表 10:南大通用数据库产品一览 24表 11:武汉达梦产品一览 25表 12:人大金仓数据库产品一览 26表 13:万里数据库产品一览 26什么是数据库?参考 Gartner 对数据库的定义,数据库是一种用于存储和管理拥有固定格式和结构数据的仓库型数据管理系统。某种意义上,数据库会因为对于数据调度使用方式、基础格式之间的差异而被划分为不同的种类。在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。数据库技术是管理信息系统、办公自动化系统、决策支持系统等各类信息系统的核心部分,是进行科学研究和决策管理的重要技术手段。数据库与操作系统、中间

8、件同为三大基础软件之一。成长到繁荣,新兴数据库兴起数据库这一行业技术发源并兴起于美国,如今已经广泛应用于全世界各企业之中。这一产业从诞生到日趋成熟总共经历了三个发展阶段。萌芽期从卡片储存方式到网状、层次型数据库上世纪早期,数据收集与储存工作仍需借助机器制成的穿孔卡片,直到六十年代,磁带与硬盘技术应用普及才使得数据的读取和储存更为方便,世界上第一款网状数据库与商业层次型数据库也在这段时间出现。成长期关系型数据库的普及与发展1970 年,IBM 公司研究员埃德加科德提出了 “关系型数据库” 这一概念,他的理论有严密的逻辑且简单清晰,启发了 IBM 团队创建了关系型数据库的原型 R 系统与结构化查询

9、语言 SQL。 这一套成熟的系统和理论在之后被 IBM 与 Oracle 公司接纳并开发出了如 DB2、RDMBS 等关系型数据库。然而随着关系型数据库的普及,这一种数据库的局限性也日趋明显。八十年代,为进一步解决关系型数据库存在的问题,诸如面向对象型数据库、内存数据库的新概念不断被提出。由于这些针对关系型数据库的优化程式技术不断成熟,到了上世纪九十年代时,基于 RDBMS 类的数据库产品已经基本完成商业化,并通过可扩展标记语言(XML)运用到互联网产业当中。繁荣期非关系型(NoSQL)数据库的流行、数据云存储随着互联网的发展,数据库使用者往往需要建立复杂难控的模型去处理巨量且冗杂的流量数据。

10、2008 年,Facebook 公司发布了开源的 Hives 与 Cassandra 数据库,这一举动带动了数据库产业技术上的变动,非关系型数据库这一新型的数据库也逐渐普及。相比于传统的关系型数据库,这一新型数据库极大地增加了处理数据的总量,通过更为方便的模型大大地节省了开发与维护成本。同时,基于“云计算”技术的新型数据存储方式也逐步兴起,并广泛应用于数据库行业之中。截至 2016 年,全球数据仓库市场已经形成了较为成熟的底层由私有云、公有云计算存储技术构成,上层由关系型数据库与非关系型数据库管理的“数据上云”模式。 图 1:数据库历史一览图2015年Apache Spark内存数据库发布20

11、10年Hase列族数据库发布2009年NoSQL概念成熟,Hadoop/Cloudera、MongoDB发布2008年Facebook开发了Hives与Cassandra数据库,进一步推动NoSQL概念 2007年首个图形数据库Neo4j发布1998年首个一键多项型数据库KDB发布1996年面向对象型数据库UML发布1992年首个多维关系数据库Essbase系统发布1991年首个键值型数据库Berkeley DB系统发布 1989年内存数据库Kognitio系统发布1986年首个面向对象型数据库Gemstone系统发布1984年 天睿公司的Teradata数据库系统发布1985年首个可应用于P

12、C数据库发布1983年IBM根据R系统自主研发的DB2系统发布1981年IDEF1发布(若干年后改为IDEFIX1用于美国空军)1979年 Oracle 与Ingres合作发布首个关系型数据库RDBMS1974年IBM开发出R系统与SQL查询语言1970年埃德加科德提出“关系型数据库”概念1968年IBM发布首个层次型数据库IMS1964年通用公司开发首个网状数据库(IDS)1960年IBM开发数据库组织和维护处理器(DBOMP)201020001990198019701960资料来源:Graph Data Modelling for SQL and NoSQL,长江证券研究所两大类型为主,新

13、兴数据库种类渐多现有的数据库种类大致可以分为两大类,分别是较为传统的关系型数据库与刚刚兴起的非关系型数据库。表 1:关系型数据库细分一览关系型数据库关系型数据库的基层单位是由二维的行列分部组成的表格,一个关系型数据库往往可以涵盖多个行列分部表格。表格中每一行分布代表了一条独特的数据记录,而各列则代表了同一数据记录的不同特性。通过多种来源获取的数据最后会通过抽取、转化、加载后整合进一个数据仓库之中。关系型数据库根据其数据处理技术的不同又可以分为联机事务型数据库与联机分析型数据库。技术分类案例应用优势应用劣势联机事务型(OLTP)联机分析型(OLAP)PostgreSQL、MySQLAzure A

14、nalysis Services、SQL Server with ColumnStone Index联机事务处理采用数据标准化技术更为迅捷的处理商业的事务数据;该技术照顾到了事务数据的原子性、一致性;控制数据延迟,更灵活的使用于对数据延迟敏感的商业事务中联机分析处理采用语义数据建模技术,善于处理大量独立工作的流程;可以更快的完成复杂的分析与即席查询且不影响事务型数据库系统;更快的完成多个数据聚合且给出具有一致性的联机事务处理无法胜任对于大量数据的处理工作;当遇到高度标准化的数据时,需要执行的指令变得相对复杂;如果历史数据存储时间过长,指令的执行会变得缓慢相比事务处理系统中的数据刷新的更慢;相比

15、传统的格式更为复杂;联机分析处理系统中的模型多为多维式的;数据应用于面向对象型模型变得更加复杂 结果资料来源:Microsoft 官网,长江证券研究所非关系型数据库非关系型数据库是一个用于概括一切可供替代传统关系型数据库的开放式术语。虽然以 “非关系”这一名称命名,但这一类数据库同样也可以通过嵌套类的方式将互有关系的数据存储在同一结构当中。非关系型数据库采用了更为灵活的数据结构,并且可以横向到达多个处理器,这吸引了更多需要处理超过单一服务器数据流量的厂家。以功能划分,非关系型数据库可以分为文档型数据库、键值型数据库、列存储数据库、图形数据库四种。 图 2:非关系型数据库细分文档型数据库:以JS

16、ON、BSON或XML文件的形式储存数据。数据库中,文档可以被上一级嵌套,部分因素可以添加数 字索引。文档数据被存储和处理的方式与程式存储相近,节约了数据收集时的翻译时间因为灵活的性能与易控制的结构而经常应用于程序开发员的工作中因常用于横向扩展架构,其扩展性往往能清晰得提供数据流量与通信量的可扩展性。例子:MongoDB键值型数据库:最简单的非关系型数据库,数据库的所有元素仅是通过键值(Key)与键值项(Value)之间的配对关系而构成。非常类似于仅有两列的关系型数据库中的列值之间关系常被用于购物车数据、用户系统配置、用户个人档案文件之中。例子:Memcached非关系型数据库列存储数据库:此

17、类数据库通过以列存储的形式保存数据的方式进行数据的管理。使用时仅需读入少量数据,因而可以节省更多的内存。因为列与列之间格式相同,进行压缩与读取数据等操 作时效率更高,且可以在分析工作中进行迅速的运算。尽管列存储数据库的格式利于分析和读取,但是其独特的数据写入方式让数据保持一致性的难度更加高。例子:Cassandra图形数据库:图形数据库更为关注不同数据元素之间的关系。每一个元素都被视为一个节点,并以链接方式形成关系。其中节点之间的链接关系被视为最重要的元素并直接保存。相对于关系型数据库优化了数据元素之间的关系功能,节省了数据连接的成本。图形数据库本身往往不能独立支持商业数据库系统的运行,因此需

18、要结合传统的关系型数据库进行储存。常应用于诈骗侦查、社交网络、知识图谱之中。例子:Neo4j资料来源:MongoDB 官网,长江证券研究所对标海外:空间广阔,开源和云兴起市场空间:全球数据库市场空间广阔依据 Gartner 数据,全球数据库行业 2018 年市场规模为 460 亿美元,较 2017 年增长18.4%。其中非关系型数据库的市场规模约为 24.1 亿美元,远远少于关系型数据库的规模,但这一部分在未来几年有望保持 31.4%的年复合增长率。从地理分部维度来看,目前全球数据库市场中呈现着以北美与欧洲地区占多数,亚太地区与拉丁美洲作为新兴市场的整体地理分部趋势。海外市场中,尚未高度成熟的

19、国家与地区在未来仍然有潜在的较快的成长趋势。图 3:非中国地区数据库市场成熟度结构图资料来源:Beroeinc 市场调查,长江证券研究所根据美国 Expert Market Research 公司(EMR) 今年发布的市场调查,2019 年全球数据库行业市场规模已达到 584 亿美元。未来五年,全球数据库市场可以继续保持复合年增长率 13.81%的高速增长趋势, 2025 年市场规模将达到约 1269 亿美元。图 4:全球数据库市场规模增长预测图(单位:亿美元)1,4001,2001,0008006004002000201820192020E2021E2022E2023E2024E2025E资

20、料来源:Gartner, Expert Market Research,长江证券研究所可以看到,虽然不同数据源统计的行业数据有一定差异,但整体上 2018 年全球数据库市场空间在 400-600 亿美元之间,且保持 10%以上的快速增长。竞争格局:传统巨头占优,新兴厂商崛起国外权威的数据库评分网站 DB-Engines 排名显示,最受用户与开发人员欢迎的技术得分较为稳定,分别是甲骨文公司的 Oracle 系统、MySQL、Microsoft SQL Server 三项较传统的关系型数据库技术,而非关系型数据库则是 MongoDB 得分最多。图 5:数据库行业受欢迎程度排名 2020-08资料来

21、源:DB-Engine,长江证券研究所除这几款数据库技术之外,其余得分较低的数据库产品仅占行业较小份额。虽然行业市场已由 Microsoft、Oracle、SAP、IBM 通过多种不同产品占据了近六成的份额,但这四大龙头企业之间竞争依然激烈。例如,Microsoft 曾为争夺市场份额,对将数据从 Oracle数据库迁徙至微软数据库的用户提供免费的授权许可。 图 6:全球主要数据库产品市场份额占比图(数据时间为 2020 年 8 月)2.44%2.69%2.81%27.68%18.09%12.90%15.53%Microsoft SQL Server MySQLMicrosoft AccessO

22、racle Database(RDBMS)PostgreSQL NoSQLMongoDBMicrosoft SSAS Tabular IBM DB23.16%4.02%4.66%6.03%Sybase其他资料来源:Datanyze,长江证券研究所发展趋势:开源和云兴起数据库开源化开源数据库系统特指源码可供免费获取,并在符合特定授权模式的情况下可使用的数据库系统。截至 2020 年 8 月,全球共有 359 款不同的数据库产品,其中开源型数据库有182 种,约占一半的比例。参考 DB-Engine 的统计数据,开源数据库受欢迎程度持续提升。近年,数据库行业中商 业数据库的受欢迎程度已从 2013

23、 年年初的 64.47%逐步下降到了 2020 年八月的50.5%,而这一时段内开源数据库的受欢迎程度则从 35.53%上涨到 49.5%。图 7:商业与开源数据库历年受欢迎程度变化图(单位:%)70656055504540352013-012013-052013-092014-012014-052014-092015-012015-052015-092016-012016-052016-092017-012017-052017-092018-012018-052018-092019-012019-052019-092020-012020-0530商业数据库开源数据库资料来源:DB-Engin

24、e,长江证券研究所同时,目前数据库行业不同的数据库之间喜好的比例也不相同。相比于传统商业数据库的主要类型稳定,在开源数据库中新兴数据库类型更受欢迎。这一整体趋势说明全球数据库这一市场已经从传统的商业数据库为主的格局逐步转向商业与开源数据库混合的态势。图 8:全球数据库行业不同种类数据库喜好对比 2020-08100%90%80%70%60%50%40%30%20%10%RDFNativeXML0%时 列 文 键 搜 图间 存 件 值 索 形序 储 型 型 引 数列 型 数 数 擎 据型 数 据 据库数 据 库 库据库库关面多系向项型存对值数储象数据 数 型 据型 库 据 数 库数库 据据库库开

25、源数据库商业数据库资料来源:DB-Engine,长江证券研究所云数据库占比提升根据 Gartner 公司 2019 年发布的市场预测,随着数据库中数据分析和 SaaS 模式等趋势的带动,预计到 2022 年时,全球数据库市场中 75%的数据库将完成到云平台的迁徙,仅有 5%的数据保持在原本的本地模式当中。在 2017 年至 2018 年的全球数据库产业总营业额的 18.4%增长中,云数据库管理产品的营业额占到 68%,而 Microsoft 与亚马逊的 AWS 占到总增长的 75.5%。说明云数据平台的提供基础设施与云上服务已经逐渐发展成为了新型数据平台。未来,数据库产业将建立不同于以往本地模

26、式的基于云服务的新型生态系统。国内市场机会:国产替代、新兴崛起国产数据库市场持续快速增长中国数据库产业虽然较国际市场起步晚,但是经过三十多年的发展,也逐步成熟。中国国产数据库产业已经基本应用在了政府、军队、金融、交通、科技等多个领域。目前数据库软件的上游主要由计算机硬件设备组成,而该行业的下游需求市场主要体现在消费品、装备、政府采购领域。2017 年,相较上一年全数据库软件应用领域的平均增长达到 18.91%。 图 9:2015-2017 年国内数据库各领域应用规模(单位:亿元)2520151050政府采购装备消费品原材料能源金融交通教育医疗其他 2015年2016年2017年资料来源:智研咨

27、询,长江证券研究所参考智研咨询的数据,截止至 2018 年,中国数据库市场共有 155.59 亿元市场规模,其中 139.25 亿元为数据库软件市场,其余为数据库服务市场。 图 10:2012-2018 年国内数据库市场规模(单位:亿元)1801601401201008060402002012201320142015201620172018数据库软件市场数据库服务市场数据库市场资料来源:智研咨询,长江证券研究所中国数据库市场持续增长,云数据库占比将提升。根据 IDC 在 2019 年发布的市场预测,2019 年中国关系型数据库软件市场有望达到13.4 亿美元,传统本地模式为7.9 亿美元,公有

28、云模式 5.5 亿美元。预计到 2024 年,整体市场规模将达到 38.2 亿美元,5 年整体市场年复合增长率(CAGR)为 23.3%。其中公有云关系型数据库软件市场将保持 35.5%复合年增长率,到 2024 年中国公有云关系型数据库软件市场将达到 25.1 亿美元。 图 11:2019-2024 年国内数据库市场规模预测(单位:亿美元)4540353025201510502019E2020E2021E2022E2023E2024E资料来源:IDC 中国,长江证券研究所海外厂商占优,国产替代有望加速目前的数据库市场由于技术门槛较高,且长期被国外企业垄断大多数市场,因此国内厂商的市场份额较少

29、。以 2017 年市场数据来看,中国数据库市场主要由四家外国企业占据最多市场份额,分别为 Oracle、IBM、Microsoft、SAP,四家合计市场份额高达 64.8%。3%图 12:2017 国内数据库市场全部厂商市场份额对比图图 13:2017 年国内数据库市场仅国产厂商市场份额对比图Oracle0.3%28.7%IBMMicrosoft18%南大通用0.6%SAP达梦0.7%40.1%南大通用达梦13%山东瀚高爱可生0.5%人大金仓山东瀚高55%人大金仓1.9%爱可生5%神州通用2.5%5.4%8.3%11.0%神舟通用其他2%4%其他资料来源:智研咨询,长江证券研究所资料来源:智研

30、咨询,长江证券研究所随着数据系统市场的不断发展深化,用户需要处理的业务、用户数据的增加,传统的小型机服务器系统瓶颈日益突显,性能优化需求已是大势所趋。同时,对于国外系统在中国各领域的应用隐含的信息安全问题也加深了用户对自主、安全、可控的国产数据库产业的需求。此外,X86 服务器与储存性大幅提升,系统交互日益成熟。这三点因素进一步推动了各中国公司信息自主化、扶持自主信息产业替代国外商用数据库、实现安全可控为主要目的的“去 IOE”的进程。图 14:IOE 问题介绍与解决的可能方向一览资料来源:中国知网报告,长江证券研究所目前为止,替代占据主要市场的国外商用的进程总体上已经稳步推进。如阿里、华为等

31、厂商逐步开发了更安全、自主、可用的云平台产品用于数据迁移和更为节约成本的数据计算技术。从 2009 年国内“去 IOE”进程开始到 2017 年期间,国产数据库产品占国内数据库市场的份额正在飞速提升。尤其在 2016 年至 2017 年间,年增长率高达 36.33%,远超同期国外数据库产业在国内市场 15.98%的增速。预计未来,随着“去 IOE”进程的全面化,这一占比将继续提升。 图 15:国内数据库市场国产与国外厂商规模(单位:亿元)120100806040200200920102011201220132014201520162017国产数据库规模国外数据库规模资料来源:智研咨询,长江证券

32、研究所时间进程概要表 2:国内数据库市场“去 IOE 化”进程一览2009 年阿里巴巴因为传统的IOE 模式出现了技术瓶颈,提出“低成本,现行可控,分布式”的数据架构方案,用 PC 代替小型机,开源的MySQL 代替 Oracle 数据库2010 年阿里进一步提出以自主开发的 Ocean Base 与 MySQL 相组合的方案代替 Oracle 数据库2011 年中国移动率先开展 Unix 应用迁移的研究,在浙江地区分别完成去“I”、“E”的目标2012 年阿里旗下淘宝系整体完成“去IOE”的目标,并继续发展 Hadoop 机群与飞天平台的 ODPS,实现了真正的云计算技术 “棱镜门”事件展示

33、了 RSA 算法存在技术“后门”,凸显了 IOE 框架的安全隐患2013 年2014 年中国联通、电信在北京、重庆、浙江、黑龙江开展了“去IOE”行动中国银监会发布了关于应用安全可控信息技术加强银行业网络安全和信息化建设的指导意见一文,体现了政府部门对“去 IOE”进程的决心 中国移动开展第三代业务支撑系统进行去IOE邮储银行邮政储蓄系统与南天电子合作,以开源软件应用为基础实现分布式架构与原有集中式架构的并存2015 年腾讯旗下的微众银行搭建了完全自主可控的 IT 架构2017 年华为发布 Fusion Cloud Stack 解决方案,可在公有云网络中断情况下正常运作,给用户更安全、可靠的数

34、据组主权资料来源:中国知网报告,长江证券研究所新兴数据库趋势:多技术融合根据 Statista 统计报告,全球每年产生的数据量值近年来正呈现飞速增长态势。预计到 2020 年,全球每年产生的数量将达到 50.5ZB。自 2012 年以来,每年中国市场产生的数据量增长率都在 50%左右。这预示着未来数据库产业的产品将关注于进一步提升计算、处理、存储等方面的性能,才有可能有效利用如此大量的数据。 图 16:2016-2020 全球数据量预计(数据量单位:ZB)6050403020100201620172018E2019E2020E数据量(ZB)增速(右轴)50%45%40%35%30%25%20%

35、15%10%5%0%表 3:国产数据库新兴产品的技术趋势资料来源:IDC,Statista,长江证券研究所目前新兴国产数据库的底层框架已经日趋成熟,大数据技术已经成为了支柱型的基础设施。未来发展数据库产业发展的方向也逐渐转向提升效率、上层应用部分。当前,新兴国产数据库产品正逐渐体现了六种不同方向的技术融合的趋势,分别为硬件算力融合、流批处理融合、事务与分析型融合、一站式模块融合、云与数据融合、数据与智能融合。趋势名称产生背景趋势概括国产数据库软件应用案例硬件算力融合流批处理融合事务与分析型融合一站式模块融合云与数据融合数据与智能融合数据过多、复杂使得数据平台负载,CPU 为底层的计算模式遇到瓶

36、颈现代企业使用的数据价值会随时间流逝降低,须考虑实时计算空间与计算资源之间的平衡事务型处理与分析型处理在海量实时处理时建立了强关联关系,但因为技术原因造成数据重复储存、时效性不足的问题企业围绕工具与数据的生产链 条、管理、应用实现了能力集成全球范围内的数据向云上迁徙的模式已经成为大势所趋大数据与人工智能两种技术的普及,使得两者融合成为数据领域最受关注的趋势以 CPU 为调度核心,协调 GPU、FPGA、 ASIC 等加速单元,融合计算能力提高计算效率由一套引擎,结合流处理方式的思想与批处理方式的操作,有效完成实时计算1)以传统的行存关系型数据库实现事务特性,再引入计算引擎实现复杂查询; 2)在

37、行存数据库基础上加入列存功能,完成分析型的需求;3)基于列存为主的分析型数据库增加行存功能,完成事务型需求提高了数据获取的效率,打通了数据共享的渠道、提供了统一的数据开发能力更多大数据产品设计选择遵循云原生的概念开发,纷纷构建自己的云上数据产品智能平台方面,以智能化的手段分析数据时不再需要将数据进行平台搬移。另外,大数据平台除了支持机械学习也支持其他 AI 应用;数据治理方面,数据治理的结果可以作为人工智能的更高质量的输入数据,而人工智能可使治理过程进一步智能化。华为公司拟定推出的 Fusion Insight B160;腾讯云搭载Alveo U200 的 FPGA;腾讯云采用 NVIDIA

38、T4 的 GN7阿里、腾讯等企业使用的 Apache Flink平台对流批处理融合;蚂蚁金服使用AMPlab 开源的 Ray 框架进行金融级在线学习;柏睿数据大数据实时分析平台 RDP 依托完全自研的流数据库 StreamDB 对流批融合处理柏睿数据通过跨源异构连接技术实现事务与分析多元融合;PingCAP 公司的 TiDB 在其 4.0 版本通过计算与存储层的分离实现事务与分析型数据库融合的可能 阿里巴巴提出的“中台”华为公司提出的“数据基础设施”阿里云的 MaxCompute、PolarDB;腾讯云的弹性 MapReduce, Sparkling阿里巴巴基于 Flink 开源了机械学习算法

39、平台Alink柏睿数据库内人工智能并行算法库Rapids ParallelAI 实现库内机器学习和深度学习资料来源:中国信通院,长江证券研究所百花齐放,国产数据库厂商迎来机遇依据 IDC 的统计分析,近年来,国际数据库厂商在中国市场增长乏力,本土厂商份额上升。 国际数据库厂商的市场份额已经饱和,在企业新系统建设中,本土数据库品牌占据优势。国内数据库市场迎来蓬勃发展期,进入百花齐放时期。近年来,传统数据库厂商和公有 云数据库服务商都在加速产品迭代和推出新的产品。同时,新兴数据库厂商不断涌现,以及其他领域厂商向数据库跨界情况的增多,使中国关系型数据库市场更加繁荣和活跃。新兴厂商和跨界厂商的典型代表

40、有:巨杉数据库、PingCAP、柏睿数据、海量数据、华 为、中兴等。我们梳理国产数据库代表厂商发现,当前国产数据库典型厂商主要以三类为主:第一,以华为、阿里、腾讯为代表的 IT 巨头;第二,以柏睿数据、星环科技为代表的创新型数据库厂商;第三,达梦数据库和人大金仓等为代表的传统国产数据库厂商。表 4:华为云官网已发布的数据库产品一览华为:国产数据库龙头,快速构建生态华为公司在数据库产业上布局已久,早在 2007 年就已经战略上开展了对数据库行业的布局,到 2014 年就已经持续和工商银行、招行等客户建立合作联创,目前仅数据库研发人才就有 1000 多人,并有 100 多名布局全球七大区域的数据库

41、内核引擎、算法等方向的高级专家与技术人员, 同时也积极拥抱开源环境, 打造兼容包括 MySQL 、 PostgreSQL、MongoDB、Cassandra 等的数据库。产品名称产品特点GaussDB (for SQL)GaussDB (for Cassandra)GaussDB (for Mongo)超高性能:百万级 QPS,存储与计算分离,日志即数据结构,RDMA 网络,性能达到原生开源数据库的 7 倍;高扩展性:1 写 15 读节点模式,提升至原生开源数据库 5 倍;128TB 存储空间;高可靠性:跨AZ 部署,数据三副本,分钟级备份与复原 TB 级数据,最大保持 732 天内备份内容可

42、在期限内任意时点恢复;高兼容性:完全兼容 MySQL,无需分库分表,应用无需改造即可轻松迁徙上云安全可靠:支持跨三个可用区部署;快速备份与恢复;分布式架构,最高 N-1 节点故障容错;超强读写:相同成本下三倍于原生数据性能,支持 7*24 小时在线数据写入,高可用与读写负载均衡;弹性扩展:基于计算存储分离的分布式架构,可实现分钟级计算节点扩容和秒存储扩容,扩容不干扰线上业务;海量数据:单套实例最大支持 100TB 数据超高性能:相对原生开源系统三倍性能提升,支持 7*24 小时在线数据实时写入,高可用、高读写负载;稳定可靠:支持跨三个可用区部署,快速备份恢复;分布式架构,最高 N-1 节点故障

43、容忍;超强扩容:扩容性能相比 A3 提升 742 倍,性能平稳上升。扩容过程不干扰线上业务;可视化管理:可视化管理平台对实例创建删除、备份恢复、监控报警、节点扩缩容等实现一键式便捷操作资料来源:华为云官网,长江证券研究所2019 年 Q4,华为开始了 GaussDB(for SQL)、GaussDB(for Cassandra)、GaussDB(for Mongo)数据库的公测与试商用。2020 年 7 月 20 日,华为云数据库业务总裁苏光牛在 TechWave 技术峰会上正式发布了 GaussDB (for SQL) 与 GaussDB NoSQL 两款数据库产品。之后不到半个月,华为就宣

44、布了对整个 GaussDB 产品更新与战略升级。华为将自己旗下各种兼容不同开源系统的数据库产品统一以“GaussDB”这一名称命名,不仅表明了自己注重持续建设、开源运营 openGauss 社区的态度,也表明了之后将持续打造自主研发可控的数据库产业的立场。据华为提供的数据显示,2019 年华为数据库外部收入相比 2018 年已经实现了高达 400%的增长,并已经广泛运用到金融、泛政府、交通、医疗、能源等产业中。表 5:华为名下其他产品对其数据库产品的辅助作用产品名称功能对数据库的辅助作用弹性云服务器(ECS) 对象存储服务(OBS)可随时自助获取、弹性伸缩的云服务器,打造可靠、安全的应用环境,

45、确保服务稳定运行,提升运维效率稳定、安全、高效、易用的云存储服务,具有标准的 Restful API 接口,可存储任意数量与形式的非结构化数据用户可申请的隔离、私密的虚拟网络环境,用户可自由配置其与 Gauss(for SQL)内网连接降低响应时间,节约流量;为 Gauss NoSQL 提供可弹性申请计算资源、稳定运行环境存储 Gauss(for SQL)数据库实例的自动与手动备份数据;存储 Gauss NoSQL 数据,提高数据抗灾力并降低磁盘占用对用户的 Gauss(for SQL)进行网络隔离和访问限制;虚拟私有云(VPC) 中 IP 地址段、子网、安全组的业务,也可申请弹性带宽与 IP

46、搭建业务云监控(CES)为用户提供一个针对弹性云服务器、带宽等资源的立体化监控平台云审计(CTS)提供云账户下资源的操作记录并进行实现的安全分析、资源变更、合规审计、问题定位的场景资料来源:华为云官网,长江证券研究所结合网络安全组限制 IP 范围、VPC 运行数据可提升安全性可实时监测 Gauss(for SQL)资源动态,并提供多种预警方式为用户提供云服务资源的操作记录,以供查询、审计、回溯华为公司判断在未来的国内数据库市场中,超高性能、高可用性、扩展性、安全性、易用性的特点仍然是市场需求的趋势。华为会继续推进 AI 技术融入 GaussDB 数据库内核与算法的过程,逐步实现数据库自我调优、

47、诊断、运维能力,以求最终实现数据库智能化,并将继续围绕云上数据库建立以此为核心的云上数据生态。阿里巴巴:国产替代先行者,云数据库国产厂商领先早在 2009 年,阿里巴巴就已率先提出了“去 IOE 化”的口号,并且在之后十年之内一直坚持这一战略方向自主研发数据库产品。目前,其数据库市场已经初具规模。根据 IDC中国发布的资料显示,截至 2019 年,阿里巴巴在国内关系型数据库公有云领域占据市场份额达到 48.10%, 稳居该市场份额第一位,超过之后排名的五家公司该领域份额的总和。 图 17:2019 年国内市场公有云数据库市场份额占比图3.00%7.00%40%20.40%2.50%8.60%

48、48.10%10.阿里巴巴腾讯AWSOracle华为Microsoft其他资料来源:IDC 中国,长江证券研究所阿里巴巴自研数据库极低的计算成本依托于其不断创新、自主研发的强力云计算技术。2019 年时,阿里巴巴的 EMR 参加了大数据领域权威竞赛 TPC-DS,其结果打破了当时的世界纪录,成为 2006 年以来唯一一家上榜的国产关系型数据库厂商。2020 年 5 月,阿里巴巴自研数据库 AnalyticDB 又将计算速度提升了 2.2 倍以上,跑出 1489 万QphDS的高分,是 Spark、Transwarp 等同类产品的 3 倍以上。图 18:阿里巴巴近年数据计算领域取得成就一览资料来

49、源:快科技,长江证券研究所表 6:阿里巴巴数据库产品一览目前已经有多达 40 万以上的数据库实例迁移到了阿里云之上,阿里巴巴数据库已经全面应用到了政务、零售、金融、电信、制造、物流等各个领域的龙头企业。阿里巴巴拥有非常全面的数据库产品内容,其中包括关系型数据库 PolarDB、PolarDB- X、OceanBase 等,非关系型数据库 Lindorm,云原生数据仓库 AnalyticDB。这些数据库产品几乎涵盖了所有开源性质的不同数据库种类,并且有效兼容了 Oracle 等商用数据库的内容,为公司未来进一步带动数据库市场“去 IOE 化”打下了坚实的基础。产品名称功能优势PolarDBPol

50、arDB-XOceanBaseLindormAnalyticDB完全兼容 MySQL、PostgreSQL 数据库引擎,高度兼容 Oracle 语法,兼具开源灵活性与商用的高性能、安全性;支持最大容量 100TB,最多可扩展至 16 个节点,分布式存储可伸缩,仅根据用量收费,单节点最高 100 万 QPS; “一主多从”架构,同一实例所有读写、只读节点仅访问存储上同一脚本,实现主备切换零丢失和分钟级备份恢复融合 MySQL-DRDS 引擎与自研存储 X-DB,专注于海量数据存储、超高并发吞吐、大表瓶颈与复杂计算效率类难题;多种贴合 OLTP 业务的拆分方案,让操作聚焦少量效率,提升操作效率,利

51、用分布式特性、并行选项降低响应时间;峰值 TPS 每秒可达 8700 万次,支撑 55 万笔交易订单,极致水平扩展,承载 PB 级数据,支撑千万级业务并发;基于Paxos 一致性协议,数据副本跨可用区 RPO 为 0,确保数据一致零丢失6100 万次/秒峰值处理,支持业务快速扩容缩容,通过准内存处理架构实现高性能,单集群最大 3PB 数据量;同时兼容 MySQL 与 Oracle 两种模式,只需少量改动就可数据迁移至 Oceanbase;采用Paxos 协议,通过数据多副本,基于PC 服务器主备自动切换,数据零丢失,创造“三地五中心”容灾架构;阿里对该数据库产品拥有 100%核心产权,所有模块

52、都具备代码级的修复能力,完全自主可控通过链接线路,轻松实现与Spark、HBase、MySQL 等存储系统无缝对接,从而进行实时分析、可视化访问等操作;基于云原生态存储构建宽表、时序、搜索引擎,提供统一多模查询和独立开源接口,让开发更灵活,运行更高效;多种引擎共享统一的存储池,具备低成本、高可靠弹性伸缩额能力,并兼容 HDFS 标准接口,数据实现智能冷热分离;内置二级索引、倒排索引、时序索引等组织格式,满足海量数据的快速查询处理高易用性,完全兼容 MySQL,几乎不用额外学习就能马上上手;自由计算,无需预先建模,具有毫秒/秒级的针对海量数据进行即时多维分析和业务探索;多副本的高可用架构与公司钥

53、机制保证了用户信息安全;支持分析型SQL 高并发查询资料来源:阿里云官网,长江证券研究所阿里巴巴判断在未来的行业发展中,拥有云原生数据库与分布式架构的数据库产品,不仅能够提供更低的成本和弹性扩展能力,还能够有效降低成本,会成为未来公司市场所前进的方向。同时,公司也逐步将 AI 技术运用到研发的自治数据库服务当中,并在未来尽可能做到数据库运维的自动化与智能化。此外,阿里巴巴正在建设 LedgerDB,未来将尝试将区块链技术与数据库系统相集成,以确保蚂蚁金服的交易业务中用户数据的安全性。腾讯:数据库产品不断迭代,重视新兴技术作为大数据这一领域的前沿探索者,腾讯自 2009 年就以来不断变革其数据库

54、技术,从开源化数据库到重视实时演算,再到机器学习与自主研发数据库产品的这十多年,腾讯在数据库这一领域积累了相当多的经验。如今,腾讯已经成功开发了 20 多种数据库,并以每年 5 个大产品、50 种功能的高速继续在数据库相关产品研发道路上推进。图 19:腾讯公司从事数据库产业经历的四个阶段资料来源:腾讯科技,长江证券研究所表 7:腾讯云旗下产品一览如今,腾讯云已经掌握了核心的自主研发技术。2020 年 6 月 1 日,腾讯云正式发布分布式图形数据库产品腾讯云数图 TenCent Graph Database(TGDB),成功实现了万亿级关联性数据库的实时查询,并且成功打破了国外如 Neo4j 等

55、图形数据库厂商在图形数据库该领域上的技术天花板。除了图形数据库这一新型自主研发产品之外,腾讯已经拥有了 TenCent DB 中最受欢迎数据库云数据库 MySQL、分布式数据库 TDSQL、数据库一体机 TData、数据库生态工具智能管家 DBbrain 等一系列优秀产品。产品类型产品名称与功能一览关系型数据库云数据库 MySQL:高性能、高可靠、高扩展性的数据库托管服务,高 IO 吞吐能力;云数据库 CynosDB: 企业级云原生数据库,极速性能,海量存储,全面兼容开源数据库;云数据库 MariaDB:保证 MariaDB 永远开源,是企业级应用的最优选择,主要开源社区系统/软件的数据库系统

56、;云数据库 SQL Server:业界最常用的商用数据库之一, 完美支持Windows 架构应用程序,正版 SQL Server 许可授权;分布式数据库 TDSL:高度兼容 MySQL,支持水平拆分(分表)的高性能数据库,同时提供智能化 DBA、自动化运营、监控告警等配套设施;一体机 TData:融合高性能计算、热插拔闪存、InfiniBand 网络的数据库解决方案,适用于 OLAP、 OLTP 以及混合负载等非关系型数据库其他数据库各种应用场景下的极限性能需求,支持 Oracle、SQL Server、MySQL 和 PostgreSQL 等各种主要数据库云数据库 Redis:兼容 Redi

57、s 协议的缓存和存储服务,支持主从热备,提供自动容灾切换、数据备份、故障迁移等全套的数据库服务;云数据库 MongoDB: 100% 完全兼容 MongoDB 协议,支持跨文档事务,提供稳定的监控管理,弹性可扩展、自动容灾;云数据库 Memcached:腾讯自主研发的极高性能、内存级、持久化、分布式 Key-Value 存储服务,兼容 Memcached云数据库 CTSDB:高效、安全、易用的云上时序数据存储服务。特别适用于物联网、大数据和互联网监控等拥有海量时序 数据的场景数据库智能管家 DBbrain:用机器学习、大数据手段、专家经验引擎快速复制资深数据库管理员的成熟经验,将大量传统人工的

58、数据库运维工作智能化,服务于云上和云下企业资料来源:腾讯云官网,长江证券研究所腾讯公司判断未来在数据库产业布局和发力主要在云原生、自治、国产化替代、超融合 这四个层面。公司将继续坚持成为数据库产业生态的组织者,运用其 CynosDB、DBbrain、 TDSQL、TBase 等产品,在未来“百花齐放”的国内数据库市场中,争取更多的市场份额。图 20:腾讯云使用客户案例资料来源:腾讯云官网,长江证券研究所柏睿数据:新兴领军,分析型数据库代表企业柏睿公司成立于 2014 年,是完全自主可控数据库产品和数据智能平台提供商,是一家代表中国主导制定数据库国际标准的企业,是中国分析型数据库行业代表企业。公

59、司依托底层核心数据处理技术和人工智能算法融合,对标硅谷新兴数据库 Snowflake 及 DataBricks,推出面向不同行业领域的大数据智能分析平台,支撑智慧城市、数字政务、智慧能源、智能制造等数字化产业应用。利用数据科学,实现实时洞察、精准分析,为政务治理和企业经营提供决策支持。公司产品支持国产硬件鲲鹏、飞腾、兆芯、申威;支持国产操作系统深之度、UOS、银河麒麟等。公司在美国硅谷、澳洲悉尼、中国上海、广州、武汉、甘肃等地也设有多家研发中心和分支机构,业务辐射长三角、珠港澳、华中、西北等地。参考新京报,柏睿数据 2016 年销售额 3500 万元,2017 年预期实现合同金额 1 亿元,已

60、经具备一定规模体量。产品名称产品名称与功能一览表 8:柏睿数据库行业产品一览RapidsDB是由柏睿数据完全自主研发、基于领先的内存计算技术和分布式架构的分析型数据库软件系统,能够对海量(TB 级以上)、多维度的多源异构数据进行实时处理分析和加载加速。是柏睿数据自主研发,真正拥有完全自主核心技术,实现流处理并兼顾批处理的全内存分布式流数据库。主要应用对实时产Rapids StreamDB生的数据进行查询,鉴于技术全球领先性和前瞻性,以该产品技术参数为支撑,形成中国SQL9075 2018 流数据库国际标准。Rapids ParallelAI 数据库内人工智能并行算法库,提供了大量的算法库,包括

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论