版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、目录 HYPERLINK l _TOC_250012 公司概述:崛起的开源分布式/云数据库平台级公司 1 HYPERLINK l _TOC_250011 发展历程:开源极客攻坚全球数据库技术高地 1 HYPERLINK l _TOC_250010 产品体系:以 TiDB 开源分布式数据库及生态工具为核心 3 HYPERLINK l _TOC_250009 商业模式:商业开源订阅+DBaaS 助力开源商业进程加速 4 HYPERLINK l _TOC_250008 行业分析:HTAP 与云数据库引领全球第四代数据库变革浪潮 6 HYPERLINK l _TOC_250007 技术演进:关系型主导
2、,NewSQL 进化,HTAP 引领 7 HYPERLINK l _TOC_250006 部署模式:数通世界,云化未来 9 HYPERLINK l _TOC_250005 市场竞争:传统巨头转型,数据库新势力与云厂商角逐 10 HYPERLINK l _TOC_250004 公司分析:技术硬实力奠基,开源商业化升维 12 HYPERLINK l _TOC_250003 产品技术:Shared-Nothing+HTAP 精准解决行业痛点 12 HYPERLINK l _TOC_250002 开源生态:赋能产品迭代、人才高地与合作伙伴体系三大动力引擎 14 HYPERLINK l _TOC_250
3、001 云数据库:专业性、生态优势和中立性助力与云巨头竞争 20 HYPERLINK l _TOC_250000 海外对标:中国 Snowflake,全球 PingCAP 22风险因素 24插图目录图 1:公司发展历程 2图 2:TiDB 四大特性 4图 3:商业开源订阅是未来趋势 4图 3:TiDB 开源协议 5图 4:TiDB 社区组织架构图 5图 5:全球数据量及同比增速(单位:ZB,%) 7图 6:全球数据库市场规模及增速(单位:十亿美元,%) 7图 7:全球 OLTP 市场规模及增速(单位:亿美元,%) 7图 8:全球 OLAP 市场规模及增速(单位:亿美元,%) 7图 9:中国关系
4、型与非关系型市场规模及增速(单位:亿元,%) 8图 10:OldSQL、NoSQL、NewSQL 应用场景对比 8图 11:谷歌 HTAP 混合事务分析架构 9图 12:存储在公有云和传统数据中心的数据比例(单位:%) 10图 13:全球云/本地数据库市场规模及增速(单位:亿元,%) 10图 14:DBaaS 数据库即服务 10图 15:2016-2018 年全球前十大数据库厂商云数据库收入(单位:百万美元) 11图 16:2019 年中国数据库管理系统部分厂商销售额(单位:亿元) 12图 17:2019 年公有云模式下中国关系型数据库市场份额(单位:%) 12图 18:三种数据库架构对比图
5、12图 19:TiDB 整体架构示意图 13图 20:TiDB 存储层节点示意图 13图 21:开源数据库与商业数据库流行程度对比 15图 22:不同数据库类型中开源与商业流行程度对比 15图 23:截至 2020 年 6 月 TiDB 部分上线客户 17图 24:TiDB v4.0 VS v3.0 (TPC-H:OLAP 测试) 18图 25:TiDB v4.0 VS v3.0 (TPC-C:OLTP 测试) 18图 26:全球知名开源项目 Github 获星数量(单位:个) 19图 27:数据库选型决定者分布(单位:%) 19图 28:友邻合作伙伴体系 20图 29:三个等级的解决方案合作
6、伙伴对应不同要求和权益 20图 30:TiDB Cloud 架构图 20图 31:IDC 关于企业是否接受混合云的调研 21图 32:2020 年企业多云部署情况 21图 33:PayPay 引入 TiDB 后的架构图 22图 34:公司拥有众多海外客户 23表格目录表 1:公司高管团队介绍 1表 2:公司研发团队介绍 1表 3:公司融资经历 3表 4:核心产品 TiDB 迭代版本 3表 5:PingCAP 云产品定价(基于 AWS 公有云) 6表 6:TiDB 替代其他数据库软件案例 14表 7:全球知名开源项目 14表 8:中国最活跃开源项目 TOP 10 15表 9:社区版与商业版功能与
7、服务支持区别 16表 10:2020 年度 TUG MVA(Most Valuable Advocate) 18表 11:公司合作伙伴方案 19表 12:可比公司估值 24 公司概述:崛起的开源分布式/云数据库平台级公司发展历程:开源极客攻坚全球数据库技术高地PingCAP 成立于 2015 年 4 月,公司创始人为开源极客、知名开源项目 TiDB/TiKV/Codis 创作者刘奇、资深 IT 架构师黄东旭以及开源重度爱好者、IT 工程师崔秋。PingCAP 是一家开源的新兴分布式数据库公司,提供包括开源分布式数据库产品、解决方案与咨询、技术支持与培训认证服务,致力于为全球行业用户提供稳定高效
8、、安全可靠、开放兼容的新型数据基础设施,解放企业生产力,加速企业数字化转型升级。截至 2021年 1 月,团队超 350 人,研发人员占比超过 70%。2020 年 11 月,公司完成 D 轮融资,融资金额 2.7 亿美元,创造全球数据库历史新的里程碑。表 1:公司高管团队介绍姓名职务信息创建了 TiDB、TIKV、Codis 等知名开源项目。曾任京东、豌豆荚资深系统架构刘奇黄东旭崔秋PingCAP 创始人兼 CEOPingCAP 联合创始人兼 CTOPingCAP 联合创始人兼 CFO师,同时也是知名的 Go 语言和 Redis 专家。现从事开源的分布式 NewSQL 数据库 TiDB 的开
9、发。擅长高并发、大规模、分布式数据库系统架构设计。曾就职于微软亚洲研究院,网易有道及豌豆荚,PingCAP 联合创始人兼 CTO,资深基础软件工程师,架构师。擅长分布式系统以及数据库开发,在分布式存储领域有丰富的经验和独到的见解。狂热的开源爱好者以及开源软件作者,代表作品分布式 Redis 缓存方案 Codis,以及分布式关系型数据库 TiDB。曾任职于搜狗、豌豆荚,资深广告系统工程师,长期从事广告系统基础组件相关的研究,现主要从事开源 HTAP 数据库 TiDB/TiKV 相关的设计和研发工作。资料来源:PingCAP 官网,公司拥有极具专业性和全球性的研发团队。数据库管理系统 DBMS 属
10、于基础软件工程,属于美国对中国卡脖子清单之一,技术难度高于操作系统,因此对团队研发实力要求极高。公司拥有享誉国内乃至全球的数据库技术研发团队,成员包括 Rust 编程语言联合创始人、火狐浏览器内核 Servo 主要开发者 Brian Anderson,Rust 核心团队成员 Nick Carmeron,以及国内知名架构师、前金山软件架构团队核心成员刘聪、唐刘等技术大牛,为产品研发、迭代奠定了坚实的基础。表 2:公司研发团队介绍姓名信息Brian AndersonRust 编程语言联合创始人,前 Mozilla 研究员,Firefox 新一代内核 Servo 的主要开发者Nick Carmero
11、nRust 编程语言核心团队成员,前Mozilla 研究员Greg WeberHaskell 编程语言社区知名开发者YiWu前 Facebook 基础软件工程师,知名开源项目 RocksDB 官方维护者LiquanPei前 Pinterest Ad Infra Tech Leader, Confluent 早期成员刘聪前金山软件架构师,前金山快盘创始团队核心成员唐刘前金山软件架构师,WPS 云服务后台架构师王鹏飞ODPS 早期团队成员在 ODPS 负责过 Runtime、Optimizer 和流计算等资料来源:PingCAP 官网,开源项目启程,TiDB 产品高速迭代,TiFlash 成功实现
12、混合事务分析。2015 年创业以前,PingCAP 三位联合创始人刘奇、黄东旭和崔秋均在豌豆荚任职。在此期间,刘奇和黄东旭为解决 Redis 拓展性问题完成了开源的 Codis 项目,引发业界关注,也由此启发了三人对数据库领域的探索。与此同时,2012 年 Google 发表了 Spanner 和 F1 论文,这一学术界的突破进展给了三人指引了方向。2015 年,三人开始创业的进程,成功开发第一版TiDB 并在Github 上开源,此后 TiDB 保持每两年迭代三个版本的产品进化节奏。2016年 1 月,团队将 TiKV 作为TiDB 的底层存储引擎设计并开发,第一版于 2016 年 4 月开
13、源。随后 2018 年 8 月,世界知名开源软件基金会云原生基金会(CNCF)宣布接纳 TiKV 为沙箱项目。2019 年 5 月,TiKV 入选为云原生计算基金会孵化项目,并于 2020 年正式毕业,成为 CNCF 第 12 个毕业项目,同时也是继 Harbor 后第二个毕业的中国原创开源项目。这一进展标志着 TiKV 在产品成熟度、项目采用率以及社区持续性等方面取得一系列突破,可应用到各类行业、各种规模的生产环境。2020 年 9 月,CNCF 宣布云原生的混沌工程 Chaos Mesh 正式进入 CNCF 沙箱托管项目,凸显出公司在开源技术上的不断进步。图 1:公司发展历程资料来源:公司
14、官网,绘制公司获得资本不断加持,并保持接近每年一融的健康节奏。2015 年 4 月,公司创业,获得经纬中国领投的天使轮投资。随后 TiDB Alpha 版本发布,成为全球第一个基于 Google F1 论文的开源实现。在此之后,公司先后进行四轮融资:2016 年 8 月获得云启资本领投的 700 万美元A 轮融资;2017 年 6 月获得华创资本领投的 1500 万美元的 B 轮融资;2018 年 9 月获得复星、晨兴资本领投的 5000 万美元的 C 轮融资;2020 年 11月获得纪源资本、Access Technology Ventures、晨曦投资 、时代资本、五源资本(原晨兴资本)共
15、同领投的 2.7 亿美元的 D 轮融资,刷新了全球数据库历史。在此过程中,公司也由一个初创公司迅速成长为一个活跃于全球的知名开源分布式数据库厂商。表 3:公司融资经历融资轮次融资金额时间投资机构D 轮2.7 亿美元2020-11-17纪源资本、Access Technology Ventures、晨曦投资、时代资本、五源资本、贝塔斯曼亚洲投资基金、Coatue、天际资本、昆仑资本、挚信资本、经纬中国、云启资本C 轮5000 万美元2018-08-12五源资本、复星集团、华创资本、经纬中国、云启资本B 轮1500 万美元2017-06-13华创资本、经纬中国、峰瑞资本、险峰长青 K2VC、云启资
16、本A 轮700 万美元2016-09-04经纬中国、峰睿资本、初心资本、云启资本天使轮数百万人民币2015-12-09经纬中国、险峰长青 K2VC资料来源:公司官网,产品体系:以 TiDB 开源分布式数据库及生态工具为核心公司当前产品体系是以 TiDB 开源分布式数据库为核心(包括社区版和企业版),通过TiFlash 高性能列式分析引擎实现 HTAP,以及包括一体化数据同步平台 TiDB Data Migration、云原生混沌工程 Chaos Mesh 在内的生态工具。PingCAP 的核心产品为独立研发的开源分布式关系型数据库 TiDB,是一款同时支持在线事务处理与在线分析处理的融合型分布
17、式数据库产品,具备水平扩容或者缩容、金融级高可用、实时 HTAP、云原生分布式数据库、兼容 MySQL 5.7 协议和 MySQL 生态等重要特性。该项目当前在 GitHub 共计获得 26621 的标星,集合了 1232 位贡献者。表 4:核心产品 TiDB 迭代版本产品版本时间特点介绍对 MySQL 兼容性、SQL 优化器、系统稳定性、性能做了大量的工作,TiDB 1.02017 年 10 月 16 日TiDB 2.02018 年 4 月 27 日提升显著提升大规模集群的稳定性,降低用户运维成本,性能有明显提升,TiDB 3.02019 年 6 月 28 日增加了窗口函数、视图(实验特性)
18、、分区表、插件系统、悲观锁(实验特性)等新功能TiDB 3.12020 年 4 月 16 日兼容性有所提升,引入了众多新功能TiDB 2.12018 年 11 月 30 日优化了内部数据格式,提升了 MySQL 兼容性重构 SQL 优化器,对 MySQL 兼容性、系统稳定性、优化器和执行器做了众多改进,OLAP 性能大幅度提升对系统稳定性、性能、兼容性、易用性做了大量改进,性能再次大幅TiDB 4.02020 年 5 月 28 日TiDB5.02021 年 1 月 12 日RC优化了 TiDB 和 TiCDC 兼容性问题,修复了 TiKV 及 TiFlash 若干问题并引入了新功能专注于帮助企
19、业基于 TiDB 数据库快速构建应用程序,使企业在构建过程中无需担心数据库的性能、性能抖动、安全、高可用、容灾、SQL语句的性能问题排查等问题资料来源:公司官网,包括纯 OLTP 和 HTAP 在内的两个主打应用场景:(1)纯 OLTP:TiDB 的核心价值,承载企业关键业务的核心生产系统。OLTP 是 TiDB 的核心应用场景,在产品性能、成熟度、稳定性、可拓展性、灵活性等方面具备极强的竞争力。在面对业务快速增长、数据量 剧增或者并发量高且即将分库分表的企业客户时,TiDB 及生态组件可实现数据库平滑迁移,最大程度节省时间和成本,对业务逻辑频繁改动的项目非常友好。(2)HTAP=实时写入+
20、实时更新+实时分析。传统OLAP 通常基于数仓实现,但数仓 T+1 的特性无法满足企业对 数据实时分析的需求。针对有较大数据写入且需要实时分析的场景,TiDB 集群只需要构建 一个数据库平台、一套接口便可做到在增加少量存储成本的情况下,实现联机交易处理、实时数据分析,避免 ETL 过程。TiDB 集群的 HTAP 可支持高并发的数据写入和更新、轻中量级的查询、重量级的复杂分析,可覆盖企业绝大部分数据分析场景。图 2:TiDB 四大特性资料来源:公司官网,商业模式:商业开源订阅+DBaaS 助力开源商业进程加速公司采用商业开源订阅+DBaaS 的模式,即社区版免费+商业用户通过年订阅模式付费+云
21、数据库即服务。商业开源订阅是指开源项目的软件产品通过按用量及使用周期(一般以年为基本计算单位)提供给用户软件使用和获得商业支持服务。两个版本在核心功能上一致,但在安全、高可用性以及服务支持上体现差异:1)从产品功能上看,社区版和企业版在数据库基础核心功能严格保持一致;2)从服务上看,二者均具备用户社区支持,而企业订阅模式还包括远程技术支持、专家现场服务等增值权益。对于社区版用户,其需要承担使用 TiDB 社区版潜在故障事件给业务带来的影响和风险。图 3:商业开源订阅是未来趋势资料来源:Confluent 官网,公司采用商业化友好的开源协议 Apache Licence 2.0。在开源协议上,T
22、iDB 采用了 Apache Licence 2.0 协议,尊重原作者的著作权并允许代码修改。客户可以修改 TiDB 代码后将其作为开源或商业软件发布,但延伸的代码需要保留原先代码中的协议、商标、专利声明等内容。对于客户来说,可以根据对产品理解进行二次开发并发布发行版。对 PingCAP 而言,Apache 2.0 协议对原有代码商标、专利的保留也有效保证了自身的权益,有效处理了和竞争对手的关系。公司对待开源社区中其他公司基于开源项目修改并推出发行版本持开放态度,并欢迎合作伙伴一起把 TiDB 的生态做大。图 4:TiDB 开源协议资料来源:GithubTiDB 社区是由 TiDB 开发者、用
23、户、合作伙伴一起建立的分享与学习平台。在组织架构上,社区分为四个部分:1)项目管理委员会,为项目核心管理团队,参与 roadmap制定与社区相关的更大决议。2)TiDB 社区开发者组织,包含 Maintainer,Committer, Reviewer,Active Contributor,Contributor。每一个角色在社区中都承担相应的职责,是推动 TiDB 健壮发展的重要成员。3)TiDB 用户组(TiDB User Group,简称 TUG),由 TiDB 用户发起的独立用户社区,以线上的 AskTUG 问答社区和线下的 TUG 技术沙龙为大本营。用户在 TUG 社区可以学习前沿技
24、术知识,发表技术见解,结识圈内朋友,共同建设 TiDB 项目。TUG 核心成员由 Leader、Co-Leader、Ambassador 构成。4)项目组织委员会,负责执行、输出、推广技术内容,成员包括各地区用户组组长以及社区活动负责人。当前,国内社区用户主要集中在 TUG 社区,国外用户则集中在 Github 和 Slack 小组。图 5:TiDB 社区组织架构图资料来源:公司官网,绘制TiDB 采用企业版订阅+服务人天+云订阅的收费方式。1)用户首先可以订阅企业版,从而获取到公司的技术支持和商业服务。采用硬件部署+使用量的计价方式,根据集群规模 vCPU 用量计量收费。2)在订阅企业版的基
25、础上,用户可以进一步购买原厂现场专业服务,包含现场架构咨询、应用适配、知识传递、深度巡检、扩容变更支持、多方故障协查、故障根源分析等服务。3)PingCAP 还与公有云厂商进行合作,以 DBaaS 的方式提供云数据库服务,企业可以根据需要预先购买流量包或者按小时/月付费。根据节点类型、云服务器性能和使用时长有相应定价。类别节点CPU内存存储按时付费按月付费TiKV8vCPU61GiB1900 GiB ssd_nvme$1.56/时$1123.2/月H1.StandTiDB8vCPU16GiB-$0.85/时$612/月TiFlash8vCPU61GiB1900 GiB ssd_nvme$1.5
26、6/时$1123.2/月TiKV2vCPU2GiB50 GiB ssd_nvme$0.032/时$23.04/月TiDB2vCPU2GiB-$0.032/时$23.04/月TiKV8vCPU61GiB1900 GiB ssd_nvme$1.56/时$1123.2/月TiDB8vCPU16GiB-$0.85/时$612/月表 5:PingCAP 云产品定价(基于 AWS 公有云)T1.TinyT1.Standard资料来源:公司官网, 行业分析:HTAP 与云数据库引领全球第四代数据库变革浪潮宏观背景:全球互联网行业高速发展,数据爆发+复杂度提升驱动行业需求。随着互联网行业的发展,全球产生数据量
27、逐年攀升。根据 IDC 和 Ovum 数据,2020 年全球数据量高达 40ZB(相当于 429 亿块 1TB 容量的硬盘),同比增长 22.5%。同时,随着语音、图像、视频等非结构化数据不断产生,数据结构本身复杂度不断提升。未来 5G 的发展势必会带来数据量和复杂度的进一步上升。在此背景下,作为数字经济时代软件底座的数据库在企业信息化建设中地位将愈发重要,行业整体规模也将随之扩大。市场规模:全球数据库市场规模巨大,云数据库市场高速增长。2019 年全球 DBMS市场规模高达 493 亿美元,同比增长 18.2%。2020 年,全球 DBMS 市场规模小幅降至 487亿美元,主要原因是数据库市
28、场受到疫情冲击,本地部署的数据库项目被推迟,同比下滑 6.2%,但同时云数据库仍然保持 11.6%的增速。长期来看,数据量爆发叠加数据结构复杂度提升是长期驱动因素,预计云数据库将成为未来数据库部署方式。根据 IDC 预测,2024年全球数据库市场规模将稳步增长至 739 亿美元,2020-2024 年 CAGR 将达 8.7%。其中云数据库市场规模将达到 404 亿美元,占比提升至 55%,2020-2024 年 CAGR 达 27.3%。从细分市场角度,公司核心产品 TiDB 应用于纯 OLTP 和 HTAP 两大方向,覆盖企业强事务型数据处理和大数据实时分析场景,分别对应 332 亿/17
29、0 亿美元细分市场规模。图 6:全球数据量及同比增速(单位:ZB,%)图 7:全球数据库市场规模及增速(单位:十亿美元,%)140120100806040200中国数据量全球数据量中国YoY全球YoY2018 2019 2020 2021E 2022E 2023E 2024E60.0%50.0%40.0%30.0%20.0%10.0%0.0%公有云DBMS本地DBMS整体同比增长率8070605040302010020192020 2021E 2022E 2023E 2024E20.0%15.0%10.0%5.0%0.0%-5.0%资料来源:IDC(含预测),资料来源:IDC(含预测),图 8
30、:全球 OLTP 市场规模及增速(单位:亿美元,%)图 9:全球 OLAP 市场规模及增速(单位:亿美元,%)300250200150100500云OLTP本地OLTP云OLTP增速本地OLTP增速100.0%80.0%60.0%40.0%20.0%0.0%-20.0%200150100500云OLAP本地OLAP云OLAP增速本地OLAP增速100.0%80.0%60.0%40.0%20.0%0.0%-20.0%资料来源:IDC(含预测),资料来源:IDC(含预测),技术演进:关系型主导,NewSQL 进化,HTAP 引领关系型数据库占据绝大部分的市场份额,市场规模占比超过 80%,预计其仍
31、将在很长一段时间内占据主导地位。关系型数据库依靠表、字段等关系模型结合集合代数等数学方法,满足 ACID 规则,格式一致,支持 SQL,可用于一个表及多个表之间的复杂查询。非关系型数据库 NoSQL 诞生于 2005 年,基于 Hadoop 分布式架构的 NoSQL 数据库将昂贵的数据库一体机替换为大量廉价的硬件集群,在降低成本的同时实现性能的线性扩展,同时支持非结构化数据的处理。但 NoSQL 牺牲了数据的一致性因而对 OLTP 支撑不足,也不支持 SQL 查询。易用性相对欠缺。根据智研咨询数据,2020 年具有复杂表间结构关系模型的关系型数据库的中国市场规模为 160.4 亿元,占比仍然超
32、过 80%,且同比增速达到 17.6%。图 10:中国关系型与非关系型市场规模及增速(单位:亿元,%)500.0关系型数据库市场非关系型数据库市场关系型数据库市场YoY非关系型数据库市场YoY50.0%400.040.0%300.030.0%200.020.0%100.010.0%0.02012 2013 2014 2015 2016 2017 2018 2019 2020 2021E 2022E 2023E 2024E0.0%资料来源:智研咨询,预测NewSQL 兼具 NoSQL 扩展性和 ACID 特性的新型分布式数据库。随着传统关系型数据库(SQL)向分布式非关系型数据库(NoSQL)的
33、转变,数据库的可扩展性大大增强。然而由于 NoSQL 缺乏强一致性及事务支持,因此其使得业务代码负担较重,难以胜任部分工作场景。在 2012 年论文Spanner: Googles Globally-Distributed Database中, Google 创造性地引入原子钟解决传统分布式数据库数据一致性需要依赖中心节点而无法大规模扩展的问题,将事务型数据库的 ACID 保证与 NoSQL 的可扩展性和高性能相结合,标志着 NewSQL 时代到来。NewSQL 不仅具有 NoSQL 对海量数据的存储管理能力,保持 NoSQL 的高可扩展和高性能,还具备关系模型,满足传统数据库 ACID 特性
34、。因此, NewSQL 平衡了两种架构的优缺点,在某些应用场景具备独特优势。图 11:OldSQL、NoSQL、NewSQL 应用场景对比资料来源:CSDN,绘制第四代数据库革命浪潮:混合事务处理分析 HTAP 已成为热点方向,能够解决传统数仓无法满足企业实时数据分析的痛点。传统的数据架构中,企业 OLTP 数据需要经过复杂的 ETL 过程才能进入数仓,因此数仓对一般都是 T+1 的数据分析,对实时分析支持性较低。但随着 5G 网络迭代,催生更多数据密集型应用,数据量爆发、数据结构复杂度攀升,对大数据实时分析的需求变得更加迫切。随着技术原理上的突破,当前出现的 HTAP 混合事务分析打破了 O
35、LTP 和 PLAP 隔阂,既可以应用于操作性数据库场景,亦可应用于分析型数据库场景。通过改变整体架构,HTAP 可在数据产生之初进行分析,无需进行耗时且难以维护的 ETL 操作。2020 VLDB 发表了五篇关于 HTAP 的论文,分别来自 Google F1团队、IBM、阿里、Databricks 和 PingCAP,HTAP 已成为数据库技术研究热点方向。图 12:谷歌 HTAP 混合事务分析架构资料来源:F1 lightning: HTAP as a service. Proc. VLDB Endow. 13, 12 (August 2020), 33133325 (Google)部署
36、模式:数通世界,云化未来从性价比角度来看,云数据库具备明显优势。传统部署下的数据库需要用户自行管理,需要安排相关人员承担数据库的安装、升级、管理、测试、安全等任务。随着企业业务规模的扩大,数据爆发式增长,维护工作将越来越复杂。此外,受到硬件的制约,企业无法对数据库进行弹性扩充,一定程度上造成了部分资源的闲置和浪费。而云数据库则具备诸多优势:可扩展性: 通过计算存储分离可解决计算弹性伸缩、存储弹性扩缩容问题,将传统的分布式数据库十节点级扩展到千节点级。用户可以利用应用软件的快速部署条件来更为简单快捷的将自身所需的已有业务以及新业务进行扩展。成本相对较低:基于云计算的系统能够节约计算机、网络交换器
37、等硬件设备的购买和维护成本,为企业提供相对经济的应用软件服务。云数据库的资费远低于自建数据库,企业可按照自己的需求选择不同套餐,性价比较高。可靠性高:云数据库拥有完善的数据自动备份机制,能够实现云端完全托管各类管理任务(如硬件扩容、数据库设置、补丁升级和备份恢复),具备完善的监控、告警功能。用户可以专注于应用程序开发,远离数据库运维烦恼。从用户使用上看,云数据库具备强大的生态粘性。依托 IaaS 生态,云数据库厂商可为用户提供区别于传统数据库的生态体系。众多易于使用的生态组件大大扩充了云数据库的功能,提升了用户的使用体验。同时,广泛的用户基础为生态的构建提供了可能,进一步促进了生态体系的完善。
38、因此对于用户而言,云数据库具备更加强大的生态体系,因而具备更强的用户粘性。综合来看,行业云化趋势明显,DBaaS 云数据库未来将成为主流。结合云数据库优势来看,云数据库部署将会是未来的高确定性趋势。根据 IDC 数据,存储在公有云中数据占比将在 2020 年追平传统数据中心,且占比仍将不断提升。同时,国内云数据库市场规模也在 2020 年超过本地部署规模。由此可见,未来行业数据库云化趋势将十分明显。图 13:存储在公有云和传统数据中心的数据比例(单位:%)图 14:全球云/本地数据库市场规模及增速(单位:亿元,%)100.0%90.0%80.0%70.0%60.0%50.0%40.0%30.0
39、%20.0%10.0%0.0%公有云传统数据中心5004003002001000公有云数据库本地数据库云数据库YoY本地数据库YoY2019 2020 2021E 2022E 2023E 2024E40.0%30.0%20.0%10.0%0.0%-10.0%资料来源:IDC(含预测),资料来源:IDC,预测图 15:DBaaS 数据库即服务资料来源:William Blai,市场竞争:传统巨头转型,数据库新势力与云厂商角逐全球市场:传统巨头+云厂商+数据库厂商构成市场三类主要竞争者。从市场份额来看,数据库软件市场格局市场参与者众多,但份额较为集中。数据库乃至数据管理软件市场集中度较高。根据 I
40、DC 统计,2019 年全球数据管理市场中份额前五的厂商包括微软、Oracle、IBM、AWS 和 ,总计占比接近 80%。从竞争对手来看,传统巨头+云厂商+数据库厂商构成市场三类主要竞争者。传统巨头包括 Oracle、IBM、Microsoft 和 。云厂商包括亚马逊 AWS、Microsoft Azure 和谷歌。数据库厂商包括 Cloudera、Teradata、MongoDB、Snowflake等公司。传统巨头虽然占据着较大的市场份额,但云转型缓慢,受到公有云厂商的激烈竞争。从竞品对比来看,传统巨头产品出现较早,成熟度相对较高,多集中于关系型数据库,在传统关系型数据库市场中占据垄断地位
41、。而云服务和新兴厂商则主导着非关系型市场。云厂商产品涵盖关系型 OLTP 和非关系型 OLAP,而纯数据库厂商集中于非关系型 OLAP 领域。图 16:2016-2018 年全球前十大数据库厂商云数据库收入(单位:百万美元)2016201720187,0006,0005,0004,0003,0002,0001,000-资料来源:Garther,国内市场:海外巨头份额下滑,国产替代进展加速从市场份额来看,由于海外巨头先前在国内市场的积累,其仍然占据最大市场份额。但随着云趋势和国产化替代推进,传统海外巨头的份额不断缩小。根据智研咨询数据,中国市场国产数据库占比连年增长,国产替代效应明显。从竞争对手
42、看,国内市场主要参与者为公有云厂商(阿里云、腾讯云);设备商(华为、);传统四大数据库厂商(武汉达梦、人大金仓、南大通用、神州信息)以及新兴数据库厂商(巨杉大数据、PingCAP、万里开源等)。从竞品对比看,传统数据库厂商产品发展较早,多聚焦于关系型数据库产品;公有云厂商和设备商则具备更为完整的数据库产品线,各类产品均有所布局,且具备生态优势。新兴数据库公司产品多集中于某一特定场景,通过特定场景下的明显优势参与市场竞争。图 17:2019 年中国数据库管理系统部分厂商销售额(单位:亿元)63.0913.47 11.61 9.745.74 2.72 2.56 2.00 1.50 1.457060
43、504030图 18:2019 年公有云模式下中国关系型数据库市场份额(单位:%)阿里腾讯AWSOracle华为微软其他2.50%8.60%3%7%2010.40%10020.40%48.10%资料来源:赛迪顾问,资料来源:智研咨询, 公司分析:技术硬实力奠基,开源商业化升维产品技术:Shared-Nothing+HTAP 精准解决行业痛点TiDB 是真正的Shared-Nothing 分布式数据库,不需要随着数据量增大而分库分表。数据库架构包含 Shared-Memory、Shared-Disk 和 Shared-Nothing 三种类型。随着 CPU的增加,前两种架构都增加了对内存访问和网
44、络带宽的竞争,使得系统效率降低。对于传统的数据库,随着数据量的增大,其往往需要进行复杂的分库分表,大大提升了系统的运营成本。而 TiDB 则采用了 Shared-Nothing 架构。在这种分布式架构中,每一个节点都是独立、自给的,整个系统中没有单点竞争。通过简单地增加节点,数据库可以做到获取几乎无限的扩展。在 TiDB 存储计算分离的架构设计下,可按需对计算、存储分别进行在线扩容或者缩容,大大降低了运营成本。图 19:三种数据库架构对比图资料来源:CSDN,绘制TiDB 是存储层和计算层分离的纯分布式 HTAP 数据库。1)存储层,包含 TiKV 和 TiFlash 两类存储引擎,其中 Ti
45、KV 采用行式存储,TiFlash 采用列式存储。TiFlash 通过特定协议从 TiKV 中实时复制数据,确保 TiKV 和 TiFlash 之间的数据强一致问题;通过 TiDB的优化器选择,TiDB 能够实现事务类处理查询走 TiKV,分析类查询走 TiFlash,最大程度发挥 OLTP 和 OLAP 的优势。TiKV、TiFlash 可按需部署在不同的机器,解决 HTAP 资源隔离的问题。2)计算层,包含 TiDB 和 TiSpark,分别处理 MySQL 和 SparkSQL,负责分配 TSO 和数据定位;3)PD,TiDB 集群的智能大脑,主要负责存储集群元数据,系统调度和负载均衡以
46、及分配全局单调递增的数据时间戳。HTAP 解决了传统数据仓库弱支持实时数据分析的问题。传统的数据架构中,企业 OLTP 数据需要经过复杂的ETL 过程才能进入数仓,因此数仓对一般都是 T+1 的数据分析,对实时分析支持性较低。但随着 5G 网络迭代,催生更多数据密集型应用,数据量爆发、数据结构复杂度攀升,对大数据实时分析的需求变得更加迫切。针对有较大数据写入且需要实时分析的场景,TiDB 集群只需要构建一个数据库平台、一套接口便可做到在增加少量存储成本的情况下,实现联机交易处理、实时数据分析,避免 ETL 过程。TiDB 集群的 HTAP可支持高并发的数据写入和更新、轻中量级的查询、重量级的复
47、杂分析,可覆盖企业绝大部分分析场景。图 20:TiDB 整体架构示意图资料来源:PingCAP 官网,图 21:TiDB 存储层节点示意图资料来源:PingCAP,产品技术硬实力助力替换其他顶级数据库厂商。在 TiDB 的底层架构下,Sharding Nothing+HTAP 两大特点适合客户的众多场景,因而得到了很多用户的采用。同时,TiDB兼容 MySQL,也促进了众多使用 MySQL 的厂商能够顺利迁移到 TiDB 上。在此技术优势下,PingCAP 获得了中国平安、伴鱼、Shopee 和 PayPay 等一众海内外厂商的认可。表 6:TiDB 替代其他数据库软件案例客户替换对手替换原因
48、TiDB 优点中国平安Oracle伴鱼MongoDBAWSPayPayAuroraShopeeMySQL特定节日举办的营销活动带来数据量的暴涨,为支持活动需要扩充硬件,成本较高;数据量扩大需要拆分复杂的逻辑表,运营成本较高MongoDB 属于传统 OLTP 数据库,完成 OLAP 型工作负载过高,无法支持海量数据;并且 MongoDB 几乎没有数据约束,使得数据模式有可能失控Aurora 采用了单点写入的模式,当遇到大规模写入请求时,二进制日志复制将成为瓶颈,提交延迟增加。即使将硬件升级到最高硬件规格也无法应付该负载随着业务的不断增长,MySQL 需要压缩数据并进行服务器存储空间扩容,无法彻底
49、解决容量不足的问题NewSQL 数据库可以按需扩展,动态调整整个系统的性能以满足不确定的业务需求;海量结构化数据存储和查询效率更高,提升应用程序开发效率TiDB 支持水平扩展,无需考虑分片,分布式特性擅长处理海量数据;支持 ACID 事务,通过 Raft 共识算法实现数据一致性等特性支持水平扩展,可以处理比 Aurora 多三倍的 TPS,并且支付交易的延迟不到一秒钟;不必在程序级进行分片,不会侵入业务逻辑;PayPay 的云原生架构适合使用 TiDBTiDB 支持弹性水平可伸缩性、自动分区可确保强大的数据一致性、 与 MySQL 协议高度兼容、支持在线 DDL资料来源:公司官网,开源生态:赋
50、能产品迭代、人才高地与合作伙伴体系三大动力引擎开源是基础软件成功的最佳途径,开源数据库流行程度已超过商业数据库。开源基础软件曾诞生 Linux 和 Android 等对各个领域产生广泛而深刻影响的项目,也同样走出了如 RedHat 的云开发平台 OpenShift、分布式数据搜索和分析引擎 Elasticsearch、分布式流信息处理平台 Kafka 等在商业取得巨大成功的开源项目。开源数据库以 MySQL、 PostgreDB、MariaDB 和 MongoDB 为代表,具有灵活性、可见性、迭代快、生态资源多等优势。根据知名数据库统计网站 DB-Egines 数据显示,2021 年 1 月开
51、源数据库的流行程度已经超过商业数据库。在网站列示的所有数据库管理系统中,开源数据库数量(185)也超过商业数据库(176)。在占据市场主导的关系型数据库领域中,开源数据库流行程度超过商业型数据库。在代表未来趋势的多模型数据库中,开源数据库则占据绝对优势。因此,作为 NewSQL 代表的 TiDB 走在了开源这一条最正确的道路上。表 7:全球知名开源项目初版发行开发者公司产品类型基金会Stars融资情况时间人数RHEL开源Linux2000 年N/AN/AIPO 后被 IBM 收购,交易价值 340 亿RedHatOpenShift开源CNCF2014 年7000367美元Elastic Sta
52、ckElasticsearch开源Apache2010 年450001297IPO,市值 147 亿美元ClouderaHadoop开源Apache2006 年10000237IPO,市值 45 亿美元DtatabricksSpark开源Apache2014 年2400014456F 轮融资 4 亿美元,估值达 62 亿美元ConfluentKafka开源Apache2011 年14000594E 轮融资 2.5 亿美元,估值 45 亿美元GoogleKurbernetes开源CNCF2014 年600002350N/AMongoDB, IncMongoDB开源N/A2009 年1700039
53、3IPO,市值 222 亿美元Redis LabsRedis开源N/A2009 年40000319F 轮融资 1 亿美元,估值超 10 亿美元Cockroach LabsCockroachDB开源N/A2017 年17000263E 轮融资 1.6 亿美元,估值 20 亿美元PingCAPTiDB开源N/A2017 年26621350+D 轮融资 2.7 亿美元,估值超 10 亿美元资料来源:Wind,36kr 等,图 22:开源数据库与商业数据库流行程度对比资料来源:DB-Engines图 23:不同数据库类型中开源与商业流行程度对比100.0%90.0%80.0%70.0%60.0%50.
54、0%开源商业0.0%79.3%77.9% 76.5% 69.5% 65.5% 63.2% 48.7% 41.2% 32.4% 23.2% 10.0%6.8%8.8%4.5%7.6%6.8%0.5%92.1%40.0%30.0%20.0%10.0%0.0%20.7% 223.5% 33351.3% 567 资料来源:DB-Egines,TiDB 是中国开源领域最活跃的开源项目之一。2020 年,开源文化在中国迅速蔓延,中国开源开发者数量激增。Github 的中国开发者数量增长 37%,同比增速高居全球首位,绝对数量位居第二。中国的开源土壤也孕育出像 Kylin、Rocket、Vue、Caffe、
55、Linux Deepin等走向世界的顶级开源项目。根据开源社发布的2020 年中国开源年度报告,PingCAP囊括中国最活跃开源项目 TOP 50 中的 6 个,包括分布式数据库 TiDB、分布式事务 Key-Value 数据库 TiKV、文档项目 PingCAP/docs-cn 和 PingCAP/docs 等。其中 TiDB 的 issue-comment 数量为中国所有开源项目最高,达到惊人的 53550 个,比排名第二的蚂蚁集团 anti-design 高出 62.9%,体现出 TiDB 开源项目极高的活跃度。表 8:中国最活跃开源项目 TOP 10排名项目名称开发语言活跃度参与开发者
56、人数问题/评论数量1ant-design/ant-designTypeScript8090addlePaddle/PaddlePython5236.1960152263PingCAP/TiDBGo4339.4482535504NervJS/taroJavaScript3649.4162195955apache/shardingsphereJava2858.77869332排名项目名称开发语言活跃度参与开发者人数问题/评论数量ant-design/ant-design-proTypeScript2784.21362 6625alibaba/nacosJava2760.6
57、1204 7037apache/incubator-tvmPython2699.6355 8255ElemeFE/elementVue2507.71694 5016apache/incubator-echartsTypeScrip2307.41183 7622资料来源:2020 年中国开源年度报告(开源社),开源项目按照不同的商业模式可分为三类:开源项目源代码完全向社区公开,公司通过向客户提供运维、升级等服务获取收益,例如红帽 RedHat、OpenStack 和 Cloudera Hadoop;开源软件订阅模式,指软件基础版本免费,核心功能完全开源,但是额外功能或者升级版本以及支持服务需要通
58、过软件订阅或者授权获得,例如 Confluent Kafka和 Elasticsearch;DBaaS 模式,数据库即服务,将数据库软件部署在云端(或云原生)。客户向公有云厂商支付计算节点和存储费用,向数据库公司支付产品订阅费用,例如 AWS Aurora,Snowflake 和 MongoDB Atlas。公司采用商业开源订阅+DBaaS 的开源商业模式(Apache 2.0 协议):TiDB 的开源社区版本免费,但通过商业开源订阅模式提供商业保障及服务。两种模式在功能上保持一致:商业开源订阅包括如提供 Hotfix 紧急热修复、一对一远程支持、现场支持、数据库咨询规划等服务。对于一定规模和
59、特定领域的企业而言,安全、高可用性组件几乎是刚需。客户还可以选择云原生 TiBD Cloud,除所有商业版特性的外还可享受云化的灵活性、更高扩展性等优势。表 9:社区版与商业版功能与服务支持区别序号产品组件名称商业版社区版分布式 SQL 引擎1核心组件分布式存储引擎集群调度器TiSpark OLAP 分析引擎2分析引擎TiFlash 分布式列式分析引擎异地灾备(主从集群异步模式)3高可用多中心强一致多活(RaftBased)安全审计(仅日志)安全审计拓展模块4安全数据存储加密通信加密白名单控制自动化部署监控警告5运维管理全量数据备份/恢复增量数据备份/恢复序号产品组件名称商业版社区版快速备份恢
60、复全量数据逻辑加载6数据交换全量数据物理加载数据 CDC 迁移同步工具产品技术支持服务商业支持社区支持获取产品技术支持途径专业的商业支持团队(现场、电话、IM、邮件)TiDB 社区网站及 Github7产品支持服务标准 58,最高 724;1产品故障的响应级别无小时内响应商业专家协助规划、实施、专家顾问服务资料来源:PingCAP 官网, 主动式巡检、故障协查、无知识转移、重要时期保障公司通过社区版瞄准中国互联网企业的核心业务场景资源,不断迭代产品, 再通过企 业版本的差异化特性吸引其他垂直领域客户。传统国产数据库难以接触客户核心业务场景,产品迭代速度慢、成熟度低。但 TiDB 通过开源方式瞄
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年试题地理(人教版2019)第六章 第三节 防灾减灾
- ZTE-管理平面部署方案介绍
- 工程项目的周转材料管理办法
- 清单04整式的乘法与因式分解(五大考点梳理题型解读核心素养提升中考聚焦)
- 三年级上册《生命生态与安全》教案
- 火车站候车室装修合同范本
- FC条款服装批发运输协议
- 2024年生物技术公司技术服务合同
- 2024年工程安全生产责任协议书
- 个人劳务合同2024年
- 电大信息技术应用终结性作业
- 2022年电视广播播控技术电视广播播控技术考试卷模拟考试题
- 重庆建筑工程资料全套表格年
- GB/T 30059-2013热交换器用耐蚀合金无缝管
- GB/T 25748-2010压铸镁合金
- GA/T 766-2020人精液PSA检测金标试剂条法
- DB11-T 1832.10-2022建筑工程施工工艺规程 第10部分:装饰装修工程
- 2023年广州市法院书记员招聘笔试题库及答案解析
- 锂矿及碳酸锂的生产工艺基本知识课件
- 一、小柴胡汤课件
- 2022-2023学年浙科版(2019)选择必修三 5.2 我国禁止生殖性克隆人 课件(28张)
评论
0/150
提交评论