yashanDB 中国软件自强自立自信_第1页
yashanDB 中国软件自强自立自信_第2页
yashanDB 中国软件自强自立自信_第3页
yashanDB 中国软件自强自立自信_第4页
yashanDB 中国软件自强自立自信_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

YashanDB中国软件:自强、自立、自信软件行业现状中国上市软件公司的总体利润已连续3年下滑!2024年上半年同比下滑了91.62%!软件行业代表一个国家的软实力163.76439.488.68173.6482.31169.036.960040020002021年中报2021年年报2022年中报2022年年报2023年中报2023年年报2024年中报合计净利润(亿元)无底线的价格战,行业严重内卷!中美软件公司差异巨大软件是数字经济的重要组成美国软件行业类公司营收序号公司名市值2023年营收净利润1Oracle3891亿499.54亿85.03亿2Microsoft33219亿2199.15亿723.61亿3Amazon20110亿5747.85亿304.25亿美国传统行业类公司营收序号公司名行业市值2023年营收净利润1Saudi

Aramco(沙特阿美)石油17859亿4408.8亿1213亿2Toyota(丰田汽车)汽车2761.80亿 2741.66亿180.89亿3GENERALELECTRIC

通用电气) 电气1740.1亿679.55亿90.66亿4Walmart(沃尔玛)零售5446.28亿 6112.89亿116.8亿中国软件行业类公司营收序号公司名市值2023年营收净利润

1 金山办公 144.65亿 6.30亿 1.82亿 2科大讯飞136.62亿17.43亿0.78亿3宝信软件126.73亿17.85亿3.53亿几家软件巨头市值超万亿美元,远远超过G20国家中巴西、澳大利亚、土耳其、南非等国GDP软件行业头部科技公司已超越传统行业龙头,一跃成为全球最有价值的公司之一数据来源:金十数据/百度股市通/新浪财经,2024年6月30日(单位:美元)中美软件企业对比,四年差距拉大

30余倍中国软件陷于至暗时刻13200亿四年前= + + + ++龙头差额626亿美元5482亿 5087亿 749亿 622亿594亿四年后33219亿= + + +4461亿

1741亿

880亿+ + + + +395亿

1846亿

616亿303亿

229亿256亿+ + + +47亿 64亿528亿 505亿 145亿 137亿

127亿+ + + + ++ + + + +22亿 46亿+ + + +29亿+76亿+19亿+241亿 34亿+ +77亿++40亿71+18亿20亿34亿52亿13亿19亿39亿亿 29亿差额变大20060亿美元单位:美元;2020年4月27日、2024年6月30日数据软件产业两大根基:一是基础软件,一是专业服务亟待自强:创新,标准化,基础软件基础软件特征高成本(人员、时间、资金)高难度(根技术、大工程、跨专业)高风险(功能/性能、稳定/安全、生态/推广)高可控(强依赖、风险度降低)高价值(可复制、生产力提升、竞争力赋能)核心价值基础使能

vs.

项目应用;l

标准化供给

vs.

定制性交付;l

整体化开发

vs.

分片式外包;l

持续性迭代

vs.

一次性交付软件产业

Smiling

Curve附加值技术专利品牌、服务基础软件解决方案低端软件外包高端软件外包咨询服务产品模式上游代工/项目模式增值服务模式下游现在禁芯片;如果以后禁(开源)软件呢?0.810.210.070.0450.0450.0360.028美国欧洲日本韩国俄罗斯中国印度00.51基础软件业务收入(万亿美元)软件领域被欧美长期主导中国软件行业任重道远2020年全球基础软件领域市场份额美国基础软件业务收入占全球4/5数据来源:中国软协2023年数字经济占GDP比重数字经济成为国家经济发展的发动机,数据库是数据产业化的组成,也是产业数据化的基础中国信通院《中国数字经济发展研究报告(2024年)》数字经济42.8%数字产业化(软件、电信等)18.7%产业数字化81.3%国产数据库发展历程以往国产数据库系统:历经三代发展,没有能够真正替代Oracle的产品Oracle

代码负担无法及时应对的大数据分析挑战传统国产数据库适合信创的小规模应用第一代单机性能和可靠性较低与开源对比竞争力不强开源增强的分布式数据库适合互联网企业的新应用第二代核心引擎仅为Oracle单机性能的40%切换需大量人力自研的分布式数据库适合金融企业互联网场景第三代缺乏根技术,单机差距大适用场景有限,效率不高成本高2020年中国信通院:对国内分布式事务数据库产品进行了分析,发现:71.4%的产品是基于PostgreSQL或MySQL二次开发完成中国人有没有能力研发国际一流的基础软件开源底层机制存在缺陷开源差距较大,无法应对大压力挑战稳定可靠MySQL考虑性能采用半同步实现复制,因此在主机故障时,无法保证数据不丢。近期某银行遇到大压力下同步复制,主机拥塞问题。PG追加写机制,在高频更新下容易卡顿性能针对大并发访问,MySQL行级锁机制较为受限,表级锁容易形成热点。复杂查询所依赖于优化器能力,也是MySQL的短板。单机容量当前单机存储容量达到10

TB

级别已是常态。MySQL受限于底层Btree组织,单表数据量不宜超过千万级,无法满足业务扩展要求。设计图公开的金库安全风险明显大于未公开的:Oracle,SQL

server

和IBM

DB2都选择了闭源路线。Oracle源代码在其中国办公室无法访问。分布式路线的尝试分布式改造成本高,难维护分布式架构并非银弹分布式架构源于互联网,而银行与互联网的基础需求存在一定差异,理清银行基础需求再进行架构设计是新一代分布式核心的建设基石核心诉求互联网核心诉求:承载量银行核心诉求:稳定安全分布式改造引入大量适配工作,部分产品不支持存储过程等能力,改造费用远超数据库硬件采购单机性能无法对标,涉及的组件较多,相同负载需耗费机器资源较多13应用改造2日常维护未形成成熟的服务生态,

需要重新学习对应产品能力,

D

B

A

新增人力成本较高信创的挑战各行业核心替代任重道远2027年信创市场规模约为1.56万亿行业2021年人员数(万人)2022人员增速2023人员增速2024人员增速2021年信创渗透率2027年信创渗透率

党政 4000 3.00% 3.00% 2.50% 57.01% 90%

金融 567 4.00% 4.00% 3.00% 29.55% 80% 电信970.45%0.45%0.40%19.00%80%

电力 264 0.50% 0.50% 0.45% 15.00% 75% 石油1850.50%0.50%0.45%16.00%70%

交通 116 0.20% 0.20% 0.15% 18.00% 75%

航天航空 33 5.00% 5.00% 4.00% 12.00% 75% 教育18370.50%0.50%0.45%10.45%70%医疗4294.00%4.00%3.00%8.00%70%银行核心系统中,国产数据库的运用比例仅为

10%~20%行业自主化率应用场景金融银行

15%证券基金

20%金融核心业务系统、支付系统、交易系统能源不足

15%能源监管、调度、规划、运维医疗不足

5%电子病历、诊断、设备、数据挖掘制造不足

5%客户管理、生产处理、库存和供应链第一新声《2024年中国数据库市场研究报告》Oracle

50年历程:15年成为龙头、35年领跑世界Oracle的发展根基:基于原创理论自主可控技术政府引导市场技术变革的理论先机 技术领跑的系统研发政府引导市场IBM于1970年提出关系数据库新理论,却错失先机;Oracle率先发布关系数据库,技术优势日益显著(SQL、C/S分离架构、细粒度事务、可移植性)发布Oracle9i等,领跑数据库技术:支持共享集群Exadata一体机的分析性能与稳定性,超越了传统的分布式数据库第一批客户包括中情局和美国军方等;2020年Oracle公司在美国政府支持下接受TikTok业务2022年美国国防部“联合作战云能力”合同1987年成为最大的数据库公司(1989年进入中国市场,1997年成为中国电信产业最大的数据库供应商);主动拥抱AI,2024年10月市值超过4800多亿美元,达历史新高!AI对数据库系统带来的挑战自研才会自强、自立!追赶、平替、超越混合查询同时处理结构化和向量数据,关注查询效率和复杂性数据高维问题AI技术发展提高了向量数据维度,需应对存储效率和高性能相似度计算挑战计算可扩展性:应对向量数据增长的需求数据增长:向量数据快速增长,需维持稳定性和高性能性能维护:扩展系统时,确保查询效率不受影响资源利用:数据增加时,优化系统资源利用OpenAI

收购Rockset大模型通过重新训练实现更新知识成本巨大,且信息不可避免存在严重滞后:GPT-4每1次训练需2.5万张A100卡,耗时百日、花费6300万美元OpenAI需要将外部知识库中信息注入大模型,解决大模型高效实时更新问题基于语义连接实现多模态异构数据的跨模计算提供向量数据管理能力,并支持关系&向量混合查询探索数据尺度无关的确定性查询方法,兼顾查询性能和准确度面对挑战现有方法在效率与准确性之间难以实现平衡崖山的思考与答案自研向量数据库

构建统一向量数据管理能力开源和分布式方案存在不足

不能满足新需求分布式技术路线成本高

不可持续扩展性问题:分布式计算需要在不同节点间实现数据和状态同步,随计算效率随集群增长而下降,无法满足数据持续增长要求的算力增长成本高:计算和存储节点需求会随数据不断增长,硬件和维护成本不断膨胀大模型训练需要海量原始数据和向量数据增量:自2017年起,AI模型的规模每半年翻一番,用于模型训练的数据量持续增长,原始数据达到PB

级,

训练数据每月新增200

-300TB高维:大模型训练中使用的向量维度可能从几百到上万维不等。多模:DeepMind的Flamingo视觉语言模型采用20多亿图文对,270万视频-文本对,430万图文混合数据开源无法满足需求

基于开源只是临时方案当前开源向量数据库多采用开源组件“组装”“拼接”路,线难以完全融合适配,性能受开源组件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论