【中信建投】站在AI产业商业化加速的拐点_第1页
【中信建投】站在AI产业商业化加速的拐点_第2页
【中信建投】站在AI产业商业化加速的拐点_第3页
【中信建投】站在AI产业商业化加速的拐点_第4页
【中信建投】站在AI产业商业化加速的拐点_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本报告亦可能由中信建投(国际)证券有限证券研究报告·行业动态计算机计算机维持维持强于大市应瑛yingying@SAC编号:S1440521100010市场表现-7%-27%相关研究报告2025召开,发布新一代VeraRubin平台10期:GTC2025召开,AI产业链持续繁荣2025发布会【中信建投计算机】:周报25年第9及T-Box产业【中信建投计算机】:Manus带动AI+金融落地机会25.03.2325.03.2325.03.1725.03.1625.03.092024/4/82024/6/82024/8/82024/10/82024/12/8核心观点AI产业链正面临从性能拐点到份额拐点、从技术价值到商业化价值双重变化的转折点,当前AI产业链硬件和软件同频共振,均呈现加速趋势,建议关注AI产业持续变化:1)持续看多大厂资本开支持续下底层算力产业链发展。a)AIDC作为AI产业链底层基座需求持续;b)算力芯片自主可控势在必行;c)模型私有化需求增加,利好一体机、超融合和B端服务外包企业。2)利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。a)OA+ERP成为B端Agent入口的逻辑不变;b)关注B端通用、政府、金融、能源、工业、营销等垂直场景AI2024/4/82024/6/82024/8/82024/10/82024/12/8核心观点行业动态信息开源模型性能比肩闭源模型或标志AI产业份额拐点安卓与iOS操作系统均于2007年发布,近20年发展下构建了开源和闭源两种截然不同的手机操作系统生态模式。2011年安卓操作系统UI统一管理带来体验改善,份额首超iOS,反应当开源产品的体验或性能达到闭源水平,有望迎来市场份额超越的拐点。当前,DeepSeek为代表的开源模型性能比肩闭源模型,或将加速开源市场份额提升。效率优化下,可盈利AI商业模型已然跑通DeepSeek连续开源在训练和推理效率方面的多项技术,公布的成本利润率细节更是构建了可盈利的商业模型。我们对DeepSeek实际利润率进行测算,如果DeepSeek不准备冗余算力,仍能在API调用付费率20%,V3调用占比50%的假设下实现21%的成本利润率水平;如果API调用付费率进一步提升至50%,成本利润率水平将进一步提升至51%。硬件与软件共振,AI产业加速拐点已至AI产业链硬件和软件同频共振。硬件侧,大厂对25年资本开支DeepSeek带动私有化部署需求;RISC-V产业化亦加速AI端侧部署。软件侧,大厂接连接入DeepSeek促进用户量高增,Manus则进一步打开Agent发展趋势,大模型安全需求同步旺盛。硬件与软件共振下,AI产业有望迎来加速。计算机行业动态报告一、从性能拐点到份额拐点 11.1他山之石:2011年通过体验改善带动安卓份额超过iOS份额 11.2DeepSeek为代表的开源模型性能比肩闭源模型 2二、从技术价值到商业化价值 4三、硬件与软件共振,AI产业加速拐点已至 83.1硬件:大厂资本开支持续下算力大单频现,反应旺盛需求 83.2软件:应用及Agent生态逐步完善,大模型安全需求同步提升 四、投资建议 风险分析 计算机行业动态报告一、从性能拐点到份额拐点1.1他山之石:2011年通过体验改善带动安卓份额超过安卓与iOS操作系统均于2007年发布,近20年发展下构建了截然不同的手机操作系统生态模式:安卓:Android公司成立于2003年,2005年被Google收购,并在2007年正式推出了Android操作系统。生态上,安卓系统开源开放,允许众多手机厂商基于其底层架构进行定制化开发,使其市场份额从2008年的2.8%提升到2011年的48%,但同时也带来了专利诉讼、软件盗版和系统安全等一系列问题;2011年,Google推出Android4,从此安卓设备逐步正规化、标准化,直至2024年12月,安卓操作系统市场份额已经达到iOS:同样在安卓系统正式发布的2007年,苹果发布了搭载iOS系统的第一代iPhone,开启了智能手机的新时代。相较于安卓的开放,苹果iOS系统采用封闭式生态,严格把控软件审核环节,一定程度限制了系统的灵活性,但为用户提供了一致且高质量的使用体验。从市场份额看,近年来iOS系统的市占率相对稳定,2024年12月市场份额为26.04%,低于2009年1月iOS的市场份额35.56%。AndroidUI统一管理带来体验改善,2011年安卓操作系统份额首超iOS。Android4.0的推出,结束了三方厂商自定义各种UI界面的时代,同时保证安卓的系统更新可以第一时间推送到用户的手机,带来了更好的用户体验。也正是在2011年8月,安卓操作系统市场份额达到20.6%,首次超过同期iOS操作系统市场份额19.41%。至此,安卓操作系统市场份额持续提升,逐步到今天显著高于iOS市场份额。究其原因,当开源产品的体验或性能达到闭源水平,有望迎来市场份额超越的拐点。1计算机行业动态报告1.2DeepSeek为代表的开源模型性能比肩闭源模型开源与闭源模型较大概率会持续共存,性能提升有望促进开源模式市场大于闭源。类比手机操作系统领域,当前AI产业同样面临开源和闭源之争。其中开源模式能够吸引全球范围的开发者参与AI技术创新,后来者能够基于已有成果快速进行应用开发与产品迭代,从而推动AI应用的快速落地,推动AI产业加速发2计算机行业动态报告展。Meta、Google、Mistral等海外厂商,以及阿里、DeepSeek、MiniMax等国内厂商,均一直是AI开源生态的积极践行者,其推出的模型亦不断更新,性能逐步向SOTA看齐。表1:大厂部分开源模型模型发布时间参数规模性能在关键基准测试中明显超越了更大的模型如Ll心任务上超越了拥有4050亿巨量参数的Llam多项评测成绩超越了Qwen2.5-72B和LlamaClaude-3.5-Sonnet不在数学、代码、自然语言推理等任务上,性能比肩OpenAIDeepSeek为AI开源生态按下加速键。在美国对中国实施AI芯片封锁的背景下,DeepSeek以极低的成本成功训练出跻身全球第一梯队的推理模型R1。同时,DeepSeek完全开源了模型权重,所遵循的MITLicense开源协议极为宽松,允许其他开发者将模型用于商业用途并进行模型蒸馏,被Facebook首席人工智能科学家杨立昆誉为“开源模型对闭源模型的胜利”。受DeepSeek全球热度冲击影响,SamAltman承认在开源策略上“站在了历史错误的一边”,并表示正在讨论开源部分模型。除对模型开源外,DeepSeek于2025年2月24日至28日期推出“开源周”,连续五天开源五大核心代码库及相关技术文档,进一步加速AI开源生态。受DeepSeek促进,国内厂商同样积极拥抱开源生态。初创企业中,MiniMax一直是国内开源生态的重要玩家,已于1月15日开源了其最新一代基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01;2月18日,阶跃星辰和吉利汽车集团联合宣布,将向全球开发者开源Step-Video-T2V视频生成模型和Step-Audio语音模型;2月24日凌晨,Kimi宣布开源其最新技术报告和大模型Moonlight。而在大厂方面,2月14日,百度宣布未来几个月将陆续推出文心大模型4.5系列,并于6月30日起正式开源;2月25日和3月6日,阿里云分别开源视觉生成基座模型Wan2.1和推理模型QwQ-23B3计算机行业动态报告开源模型性能追平闭源模型,或将加速开源市场份额提升。DeepSeek-R1之所以会成为开源生态出圈爆火的里程碑,一方面系其作为完全开放权重的开源模型性能接近头部闭源模型o1,一定程度上已经反映了AI平权;另一方面其意味着国内的大模型水平与海外的差距正在加速缩小,民族自信放大了其市场价值。实际上,过去OpenAI的领先更多基于先发优势,当开源模型的性能实现对闭源模型的追赶,全球的团队的研发能力能够使开源模型的性能始终位于前列。参考安卓和iOS操作系统市场份额的变化,大模型的性能拐点或将成为市场份额拐点,大厂对开源的跟进亦将形成正反馈。二、从技术价值到商业化价值DeepSeek连续开源,提高训练和推理效率,构建可盈利的商业模型。DeepSeek于2月24日-2月28日连续开源,通过通信、矩阵运算、流水并行、负载均衡等算法大幅优化模型训练和推理过程,提高效率。第一天:针对HopperGPU优化的高效MLA解码内核,专门用于处理可变长度序列的服务FlashMLA。FlashMLA实现了基于64-block粒度的分页KV缓存,极大地缓解了内存访问瓶颈,网友实测KV压缩率达到93.3%。同时,它设计了双缓冲预加载机制,在计算当前块的时候,会异步加载下一个块到共享内存,让显存访问和计算过程同步进行,减小延迟开销。DeepSeek在项目中表示,通过FlashMLA,H800可以达到3000GB/s的内存带宽和580TFLOPS的计算性能,已接近H800内存带宽的极限(使用HBM3内存下3.35TB/s)。第二天:用于MoE模型训练和推理的开源EP通信库DeepEP。DeepEP是一套用于MoE模型中专家间信息传输的通信系统。针对高吞吐场景(训练和处理输入tokenDeepEP可以直接将数据从NVLink域转发4计算机行业动态报告到RDMA域,使得通信带宽最高可以达到153GB/s,无限接近NVLink最高带宽160GB/s;针对低延迟场景(输出tokenDeepEP只使用RDMA以最小化延迟,在各个专家并行的程度下均达到了微秒级,最高达到了第三天:FP8通用矩阵乘法(GEMM)库DeepGEMM。DeepGEMM针对Hopper架构GPU,仅使用约300行核心代码实现对矩阵乘法的优化。具体而言,DeepGEMM先用FP8进行大批量乘法,再每隔一段时间将乘法结果转成更精确的32位数累加,既提高了计算效率,又能够避免误差积累。在多种常见矩阵形状上,第四天:双向流水线并行算法DualPipe和用于MoE的负载均衡算法EPLB。DualPipe优化正向和反向传播阶段的计算与通信流程,使数据能够同时向前流动(处理输入)和向后流动(反馈更新尽管参数用量翻倍,但大幅节省了流水线空闲时间。EPLB则包括层级和全局负载均衡,能把专家任务均匀分到GPU上,平衡GPU之间的工作负载,减少跨节点通信开销。据DeepSeek同步开源的PyTorchProfiler性能分析数据库,DualPipe使训练速度提升30%,EPLB提升资源利用率20%以上。第五天:数据访问文件系统3FS及数据处理框架Smallpond。Fire-FlyerFileSystem(3FS)是一个为AI工作负载设计的高性能分布式文件系统,将固态硬盘的带宽性能利用到极致,180节点集群中的聚合读取吞吐量为6.6TiB/s;25节点集群中GraySort基准测试的吞吐量为3.66TiB/分钟;每个客户端节点的KVCache查找峰值吞吐量超过40GiB/s。Smallpond则是建立在3FS之上的轻量级数据处理框架,具有高性能、可扩展性和易用性特点,GraySort基准测试上平均吞吐量为3.66TiB/min。DeepSeek公布成本利润率细节,理论成本率高达545%,模型厂商盈利模式实现闭环。3月1日,Dee在知乎平台发表题为《DeepSeek-V3/R1推理系统概览》的首条文章,首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2美元/小时,总成本为87072美元/天;统计包括网页、App和API在内的所有负载,如果所有tokens全部按DeepSeekR1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。理论DeepSeek每日净赚474955美元。考虑DeepSeek-V3定价低于R1;网页端和应用程序免费,只有部分服务有收入;非高峰时段还有夜间折扣,实际收入低于理论收入值。结合DeepSeek创始人梁文锋不贴钱、不暴利的经营理念,DeepSeek或拥有较为可观的利润率,标志着模型厂商的盈利模式已实现闭环,或将推动模型带动模型产业环节进一步繁荣。5计算机行业动态报告根据DeepSeek公布的成本利润率细节,我们对其实际利润率进行测算:基本情况:满血DeepSeek-R1模型参数量671B,单Token预测激活参数量37B;据DeepSeek统计,24小时输入Token数为608B,输出Token数为168B,合计达到773B,则平均每秒Token调用量为0.09亿,则推理每秒所需理论算力为0.66亿(推理所需理论算力=2*模型参数量*每秒调用Token,NVIDIA、OpenAI按DeepSeek公布所需的1814张H800GPU,以及H800单卡580TFLOPS计算,DeepSeekH800单卡利用率高达0.63。情形1:DeepSeek不准备冗余算力,API调用付费率20%,V3调用占比50%,则DS利润率为21%。1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率20%,V3调用占比50%,则DeepSeek24小时API调用收入为76.8万元;2)24小时成本:按DeepSeek公布所需的1814张H800GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek24小时租赁成本为63.49万元;3)利润率:按上述收入成本测算,DeepSeek利润率为20.96%。情形2:DeepSeek准备1倍冗余算力,API调用付费率20%,V3调用占比50%,则DS利润率为-40%。1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率20%,V3调用占比50%,则DeepSeek24小时API调用收入为76.8万元;2)24小时成本:DeepSeek为峰值用户准备1倍GPU冗余,则需要3628张H800GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek24小时租赁成本为126.98万元;3)利润率:按上述收入成本测算,DeepSeek利润率为-39.52%。情形3:DeepSeek不准备冗余算力,API调用付费率50%,V3调用占比50%,则DS利润率为202%。1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率50%,V3调用占比50%,则DeepSeek24小时API调用收入为192万元;2)24小时成本:按DeepSeek公布所需的1814张H800GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek24小时租赁成本为63.49万元;3)利润率:按上述收入成本测算,DeepSeek利润率为202.41%。情形4:DeepSeek准备1倍冗余算力,API调用付费率50%,V3调用占比50%,则DS利润率为51%。1)24小时收入:不考虑夜间折扣,V3输入/V3输出/R1/输出/R1输出API费用分别为2/8/4/16元/百万Tokens,API调用付费率50%,V3调用占比50%,则DeepSeek24小时API调用收入为192万元;2)24小时成本:DeepSeek为峰值用户准备1倍GPU冗余,则需要3628张H800GPU计算,每小时租赁价格为2美元,约合人民币350元,则DeepSeek24小时租赁成本为126.98万元;3)利润率:按上述收入成本测算,DeepSeek利润率为51.20%。根据我们测算,虽然难以达到DeepSeek所公布的545%成本利润率,但如果DeepSeek不准备冗余算力,仍能在API调用付费率20%,V3调用占比50%的假设下实现21%的成本利润率水平;如果API调用付费率进一步提升至50%,成本利润率水平将进一步提升至51%。6计算机行业动态报告表2:DeepSeek利润率测算项目情形1情形2情形3情形4满血参数(亿)24小时输入Token(亿)24小时输出Token(亿)24小时总调用Token(亿)平均每秒Token调用量推理每秒所需理论算力(EFLOPS)H800单卡算力(TFLOPS)单卡利用率所需租赁卡数(张)V3输入单价(元/百万Tokens)2222V3输出单价(元/百万Tokens)8888R1输入单价(元/百万Tokens)4444R1输出单价(元/百万Tokens)API调用付费率V3调用占比DS利润率估计(%)阿里发布QwQ-32B,以更低参数实现强劲性能。2025年3月6日,通义千问发布推理模型QwQ-32B,在仅使用320亿参数的前提下性能媲美顶尖推理模型如DeepSeek-R1,远超o1-mini和经过R1蒸馏后的Qwen-32B模型。据通义千问公众号,QwQ-32B在冷启动基础上,针对数学和编程任务、通用能力分别进行了两轮大规模强化学习。前者随着训练轮次的推进,模型的性能均表现出持续的提升;后者则通过少量步骤实现通用能力提升,同时在数学和编程任务上的性能没有显着下降。此外,QwQ-32B模型还集成了与智能体Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。我们认为,DeepSeek公布的成本利润率细节已经验证模型厂商通过算力租赁提供模型API调用服务的商业化路径可行。而阿里QwQ-32B则进一步优化模型部署成本,加速AI普惠化,同时也为厂商打开更大的盈利空间。预计在DeepSeek、阿里等厂商持续开源的引领下,技术价值将逐步演变为商业化价值,推动产业链落地。7计算机行业动态报告图8:QwQ-32B性能表现三、硬件与软件共振,AI产业加速拐点已至近期,AI产业链硬件和软件同频共振。硬件侧,大厂对25年资本开支乐观,多家上市公司公布算力大单,单个项目合同金额超过30亿;DeepSeek带动私有化部署需求;RISC-V产业化亦加速AI端侧部署。软件侧,大厂接连接入DeepSeek促进用户量高增,Manus则进一步打开Agent发展趋势,大模型安全需求同步旺盛。3.1硬件:大厂资本开支持续下算力大单频现,反映旺盛需求阿里巴巴2月发布财报,并宣布“计划未来三年将投入至少3,800亿元人民币,用于建设云计算和AI的基础设施”,引发市场对AI资本开支的想象。近期腾讯、联通、移动相继公布业绩,均对AI战略做出部署:腾讯:AI战略进入重投入期,24Q4资本开支超过阿里。3月19日,腾讯控股正式发布2024年第四季度及全年业绩报告,2024年全年收入为6602.57亿人民币,同比增长8%,净利润为1940.73亿人民币,同比增长68%;第四季度收入为1724.46亿,同比增长11%,净利润为513.24亿人民币,同比增长90%。资本开支方面,腾讯24Q4资本开支为365.78亿元,环比增长114%,同比增长386%,超过阿里同期资本开支318亿元;2024年全年资本开支为767亿元,同比增长221%,创历史新高,同样超过阿里同期资本开支725亿元,其中AI相关研发投入为707亿元。年报媒体沟通会上,腾讯管理层计划在2025年进一步增加资本支出,预期资本支出占收入的比例为低两位数百分比(24年资本支出占收入比重约12%)。8计算机行业动态报告0中国联通:全面拥抱人工智能,算力投资预计同比增28%。3月18日,中国联通公告2024年报,实现营收3895.89亿元,同比增长4.6%;实现归母净利润90.29亿元,同比增长10.5%。中国联通2024年资本开支为613.7亿元,同比下降17%。其中,算力投资逆势同比上升19%。中国联通预计,2025年固定资产投资在550亿元左右,其中算力投资同比增长28%;此外,公司还为人工智能重点基础设施和重大工程专项作了特别预算中国移动:25年算力资本开支373亿元,推理算力投资不设上限。3月20日,中国移动公告2024年报,实现营收10408亿元,同比增长3.1%;实现归母净利润1384亿元,同比增长5.0%。2024年,中国移动智算规模达到29.2EFLOPS,净增19.1EFLOPS,呼和浩特、哈尔滨万卡级超大规模智算中心上线提供服务;公司计划2025年通算规模(FP32)累计达到8.9EFLOPS,智算规模(FP16)超34EFLOPS。而在当日举行的业绩说明会上,执行董事兼首席执行官何飚进一步介绍,2025年中国移动在算力领域的资本开支将为373亿元,占比将提升至25%,其中年报公布的超34EFLOPS智算计划主要以预训练资源为主,而对推理资源投资不设上限。算力大单频现,应用落地加速趋势下景气度持续。随着人工智能技术持续发展,尤其DeepSeek带动AI平权下,算力需求持续旺盛,近期相关大单频频落地。3月5日,海南华铁全资子公司华铁大黄蜂与杭州某公司签订了《算力服务协议》,服务期5年,预计合同总金额为36.9亿元(含税预计平均每年产生营业收入约7亿元;同日,蓝耘科技全资子公司算优科技与某公司签署《算力云服务协议》,合同总金额(含税)为37.07亿元,服务期为5年(注:3月7日公司公告称双方就该合同进行紧急磋商3月8日,协创数据公告,拟向多家供应商采购服务器,并签署相关采购合同,采购合同总金额预计不超过人民币30亿元。当前,国产开源大模型性能已达到第一梯队水平,预计B端及C端应用将呈现加速落地趋势,以正反馈的形式进一步拉升算力需求。9计算机行业动态报告项目名称预算金额(万元)采购内容-包含IDC机房建设,建筑面积为定制化数据中心IDC技术服务,交付总容量为40MW算系统、存储基础设施、网络基础设施、HPC软件平台运维系统和目源系统、10kV配电系统、变配电系统、UPS系统、动力配电算力服务,最高限价为不含税单价2948.11私有化部署供需匹配,一体机市场全面铺开。从供给侧看,DeepSeek发布以来国产芯片迅速完成适配,据智东西统计,截止2月14日已有24家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务,为DeepSeek等国产模型本地化部署提供了基础,对应至少有60家企业宣布发布DeepSeek一体机或完成其AI一体机对DeepSeek的适配;而从需求侧看,相较于C端用户更能接受调用第三方云厂商API,B端企业更倾向于将模型私有化部署至自有服务器,既彻底杜绝数据外流风险,又能基于业务数据进行领域微调,打造专属智能引擎,这种部署方式尤其在金融、医疗等高合规要求行业更为关键。私有化部署的供需匹配,有望促进一体机市场的全面铺开,促进G端及B端AI场景商业化发展。表4:支持DeepSeek模型的部分国内AI芯片企业动态表5:支持DeepSeek一体机的部分国内AI芯片企业动态企业日期官宣标题华为2月1日首发!硅基流动x华为云联合推出基于昇腾云的DeepSeekR1&V3推理服务!沐曦2月5日企业日期官宣标题华为2月1日首发!硅基流动x华为云联合推出基于昇腾云的DeepSeekR1&V3推理服务!沐曦2月5日DeepSeek-V3满血版在国产沐曦GPU首发体验上线 摩尔线程2月4日致敬DeepSeek:以国产GPU为基,燎原中国AI生态之火 海光信息2月4日DeepSeekV3和R1模型完成海光DCU适配并正式上线DeepSeekR1在壁仞国产AI算力平台发布,全系列模壁仞科技2月5日 型一站式赋能开发者创新燧原科技实现全国各地智算中心DeepSeek的全量推理燧原科技2月6日 服务部署国产Al卡Deepseek训练推理全版本适配、性能卓越,昆仑芯2月6日 一键部署等您来灵汐芯片快速实现DeepSeek适配,助力国产大模型与灵汐科技2月6日 类脑智能硬件融合开源的力量:希姆计算开源算力全面适配DeepSeek-R1希姆计算2月6日 开源模型奕斯伟计算|技术新突破!RISC-VAISoC成功适配奕斯伟计算2月14日 DeepSeek模型联想集团2月5日联想集团与沐曦股份联合发布基于DeepSeek大模型的一体机解决方案钉钉2月6日DeepSeek在钉钉AI一体机首发适配啦!浪潮云2月7日浪潮云率先发布671BDeepSeek大模型一体机解决方案紫光云2月8日紫鸾大模型一体机深度适配DeepSeek,保障AI高效、可控、安全落地中国长城2月8日长城擎天GF7280V5AI训推一体机已全面适配DeepSeekR1系列模型天翼云2月11日四大核心优势,多场景覆盖,息壤智算一体机-DeepSeek版强势来袭!移动云2月11日移动云智算一体机-DeepSeek版,让AI快人一步优刻得2月13日重磅上线!优刻得DeepSeek满血版大模型一体机来了联通云2月13日联通云DeepSeek一体机+GPU云服务器重磅发布!凝聚国芯+国模+国算+国盾四位一体华为2月13日昇腾一体机,满血版DeepSeekV3/R1大模型多用户并发数2倍业界计算机行业动态报告RISC-V产业化进程加速,玄铁C930发布助力AI端侧部署。RISC-V技术凭借开源优势,正成为AI时代全球加速布局的关键领域。其中,欧洲高性能计算(HPC)联合企业启动了一项2.4亿欧元的项目,用于开发AIRISC-V芯片和软件,以避免欧洲超级计算基础设施对非欧洲的硬件和软件解决方案的依赖;而国内更是已经成为RISC-V芯片的主要市场,智研数据显示2023年全球RISC-V芯片出货量超100亿颗,中国厂商占比超2025年2月28日,在第三届阿里达摩院玄铁RISC-V生态大会上,中科院软件所表示基于玄铁C920处理器的AIPC概念机已经跑通Llama、Qwen、DeepSeek等开源模型,打通硬件架构、操作系统、AI模型的“开源AI全链路”,单位计算能耗降低30%;同时,达摩院玄铁推出新一代旗舰服务器级处理器C930,将通用高性能算力与AI算力原生结合,将于3月陆续开启交付。随着技术优化打破大模型高算力路径依赖,CPU凭借通用性强、易于调度的特点有望大幅降低算力需求并发挥同构计算的优势,助力边缘和端侧设备单机部署高性能模型。而RISC-V处理器已完成DeepSeek-R1系列蒸馏模型的适配,有望推动数十亿物联网终端加速向AI化转变。此外,RISC-V还具备较强的灵活性和可扩展性,允许开发者根据具体需求定制指令集,更能支持各种应用场景。3.2软件:应用及Agent生态逐步完善,大模型安全需求同步提升大厂接入DeepSeek促进用户量高增,应用生态逐步完善。DeepSeek发布以来,国内大厂加速接入,其中百度于2月16日宣布在百度搜索中全面接入DeepSeek,同时文心智能体平台的开发者也能用DeepSeek模型创建调优智能体;腾讯同样“Allin”DeepSeek,元宝、微信、ima、腾讯文档、QQ浏览器等超十四款产品均适配DeepSeek-R1,甚至元宝还支持DeepSeek-R1本身缺失的读图功能;字节同样将旗下飞书、火山引擎、悟空浏览器、即梦、Coze等产品接入DeepSeek,完善产品AI能力。从新增用户看,据量子位智库统计,仅在AI智能助手赛道,豆包、DeepSeek、Kimi日新增用户即达到50万以上;腾讯元宝、文小言、智谱清言、AIMatePro等产品的新增日活超过5万;通义、讯飞星火、天工AI的新增日活也超过1万;从Web端月度流量看,2月各AI智能助手产品月活用户普遍增长,其中元宝增速超7倍,通义千问增速也接近6倍。我们认为,DeepSeek强化了大众对AI产品的认知,有望为AI产品普惠化赋能,从而加速完善AI应用生态。计算机行业动态报告文心一言通义千问豆包KimiAI技术持续迭代,Agent赋能千行百业。随着AI技术的深度融合与场景化创新,除企业端应用外,AIAgent亦逐步向政务、医疗、金融、能源、法律及教育等垂直领域加速渗透,推动行业效率与服务模式革新。例如,在政务领域,深圳福田区推出70名基于DeepSeek开发的AI数智员工,定制化开发了覆盖240个场景的个性化智能体,进一步驱动政务效能全面跃升;而在网安领域,启明星辰、安恒信息、亚信安全等企业均推出了安全智能体,实现对告警信息的自动化研判;在医疗领域,个人、医生及临床诊断助力均能带来智能化健康护理体验;金融与法律领域,财税AIAgent助力企业实现智能开票、风险检测等场景降本增效,百度法律智能体“法行宝”则依托知识图谱与大模型技术,降低专业法律援助门槛。表6:AIAgent落地千行百业厂商领域Agent布局推出面向党政机关及事业单位的智慧公文智能体,聚焦公文写作场景推出70名基于DeepSeek开发的A结合福田区各部门实际需求,定制化开发了覆盖240个场景的个公司发布AI智能体服务平台“白泽启元”、政务公文写作与协同平台“能体客服平台“白泽对话管理”以及智能体BI产品“白泽云图”等白断,进行智能威胁分析、研判,给出处置建议和自动星智能体的辅助下,大幅提升研判效率,将告警分析研判时间由同来源、不同类型安全告警中的关联关系,形成安全事件链,现已能够准确够通过个性化服务为患者构建闭环管理服务;健康智能体“小慧”作为个人AI健康助行业动态报告计算机行业动态报告统,通过多个智能体的协作,模拟临床环境中的各种决策情况,累,拥有过亿量级的结构化健康数据,能为⽤户的健康管理提供全天候与华为合作欣智悦财税大模型,结合公司财税产品和开放平台构建财税AIAgent智能体,为企业提供智能咨询、风险检测、智能开票、智能算税、智能经“信小达”是基于AI大模型打造的智能体,通过智能语义解析、多模态等能力为集团内型本地化部署,实现AI助手“信小达”在逻辑推理能力、用户面向保险客户提供新致新知2.0平台,提供智能客户助手、数据查询助手基于多Agents协作框架与强化学习functionc发布了电力行业首个类脑计算平台及智能体,并推出跨域异构融网络。其中,项目组跨北京、上海、浙江三地开展联合百度法律智能体法行宝基于文心大模型与法律知识图谱法律问题,提供专业的法律法规建议,并针对上百个细分领域提供通过AI迎新/招生/校友/智能问数务场景。此外,公司智慧校园智能体产品“小美同学”能提供在校理、教务工作、就业指导等多元场景提供个性化的AI学习路径推荐、业务咨Manus带来通用场景Agent想象空间。3月6日凌晨,Monica.im发布其首款AIAgentManus,在GAIA基准测试(评估通用AI助手解决真实世界问题的能力)中取得所有难度级别的SOTA表现,引发全网热议。具体而言,官方发布视频中演示了筛选简历、遴选房产、股票价格分析三个案例,Manus能根据用户需求,自主分解任务流程并分步完成,直接交付用户所需的结果。我们认为,Manus在演示视频中主要展现了以下特点,大幅提升了可用性:1)运行在独立虚拟机中,可以在虚拟环境编写代码、浏览网页、调用工具等,支持完全后台操作,用户甚至可以在下达任务后关闭电脑;2)具备记忆能力,能够根据用户反馈优化在类似任务的回答。3)自主对数据交叉验证,降低模型幻觉,大幅提升在B端场景的可用性。计算机行业动态报告Manus通过极致工程化大幅提升用户体验,OpenAI则推出开发套件供用户自主构建Agent。Manus发布后风评多次反转,一方面部分用户质疑Manus为多款AI工具套壳,缺乏技术含量,更多为营销炒作;另一方面Manus向海外博主开放邀请码,得到包括多位技术大拿在内的良好反馈。3月11日,Manus和阿里通义达成战略合作,更进一步实际证明了套壳类产品的应用价值。同时,3月12日凌晨OpenAI发布Agent工具包和API,降低Agent创建门槛,有望进一步推动Agent发展趋势。我们认为,Manus出圈的重要意义在于提高了大众对于AIAgent的认识,能够加速Agent从B端场景向C端应用的渗透。此外,Manus的爆火也凸显了用户体验的价值,预计工程化将成为后续AI产品迭代的关键。图15:Twitter创始人称赞Manus图16:OpenAI发布最新Agen国家安全中心通报Ollama风险,重视开源趋势下大模型安全需求。3月3日,国家网络安全通报中心通报大模型工具Ollama存在安全风险,攻击者可利用Ollama框架历史漏洞直接调用模型接口实施数据投毒、参数窃取、恶意文件上传及关键组件删除等操作,造成模型服务的核心数据、算法完整性和运行稳定性面临安全风险。实际上,大模型安全已经成为AI时代重要挑战之一,对外需要防范投毒、指令、窃取、对抗等多种攻击方式,对内需要避免大模型内容中可能存在的伦理、偏见等风险。随着AI产业链进一步景气,应用和用户数量将同步提升,尤其开源趋势下大模型和数据安全的重要性有望进一步凸显。计算机行业动态报告技术迭代下开源模型性能已逐步追平闭源模型,有望迎来份额拐点;同时,AI技术发展下应用成本进一步降低,商业化价值已然显现,建议关注AI产业持续变化:1)持续看多大厂资本开支持续下底层算力产业链发展。a)AIDC作为AI产业链底层基座需求持续;b)算力芯片自主可控势在必行,推荐国产芯片产业链海光信息;c)模型私有化需求增加,利好一体机、超融合和B端服务外包企业,推荐深信服、神州数码、软通动力等。2)利好行业Know-how及数据积累充分、客户充足、有具体应用场景的B端和C端软件企业。a)OA+ERP成为B端Agent入口的逻辑不变,持续看好金蝶国际、用友网络、鼎捷数智、赛意信息等;b)关注B端通用、政府、金融、能源、工业、营销等垂直场景AI落地,推荐多点数智、国能日新、新点软件、恒生电子、视源股份、创业慧

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论