计算机行业深度分析-三大要素齐发力AI应用步入全面加速期

上传人：策*** IP属地：山西上传时间：2025-03-18 格式：DOCX 页数：47 大小：1.02MB 积分：19.9 举报 版权申诉

已阅读5页，还剩42页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

本报告版权属于中原证券股份有限公司计算机tangyue@021-证券研究报告证券研究报告-行业深度分析强于大市(上调)——计算机沪深30051%40%29%19% 8%-3%-14%2024.032024.072024.112025.03-24%2024.032024.072024.112025.03《计算机行业月报：DeepSeek-R1带来AI技术突破，持续关注GPT-5的推出进程》2025-02-13《计算机行业深度分析：美国制裁密集出台，全面围堵对我国的AI算力供应能力》2025-01-24《计算机行业月报：AI模型成果密集发布，制裁或将全面升级》2025-01-10联系人：李智电话下降，开源阵营在性能上实现超越。至此，AI应用集齐全面落地的三大关键要素，这一阶段具有里程碑式意义。理能力的提升路径，DeepSeek首次公度训练框架、DualPipe算法、跨节点All-to-All通信内核等一系列追平了最先进的闭源模型的能力，同时在成生态的发展，弥补了中国企业上云（特别是公有云本报告版权属于中原证券股份有限公司 41.1.o1开启逻辑推理能力提升的新路径 41.2.DeepSeek首次公开验证了强化学习对于大模型推理能力提升的有效性 5 72.1.DeepSeek开启低成本路线 72.2.DeepSeek算力节省的关键点 82.3.两大模型训练路径 2.4.DeepSeek运营成本及相关数据测算 3.1.开源大模型阵营首次在先进性上超越了闭源阵营 3.2.DeepSeek开源条款更加开放，有利推动模型的推广和应用 3.3.DeepSeek将核心代码悉数开源，极大地促进了AI技术的发展 20 22 23 4 5 6 7 7 8 8 9 10 10 13 14 14 18 19 22 23 23 24 5 6 7 12 12本报告版权属于中原证券股份有限公司 16 18 20本报告版权属于中原证券股份有限公司注推理、AI应用和液冷需求》中提出了“o1的问世”“性能虽然超过了OpenAI现有的模型，但是面临了新训练数据要是一种交流的工具，而不是一种思考的工具》（Languageisprimarilyatoocommunicationratherthanthought），论文中证明了负责语言的神经和负债思破，已经表现得比较出色，但是在推理和逻辑能力方面的表现仍图1：人脑中负责语言和逻辑推理的神经网络本报告版权属于中原证券股份有限公司码、数学和类似领域的复杂问题。因而o1对于LLM实现AGI具有重要的意义，是OpenAI表1：OpenAI大模型产品-4K/16K-图2：推理模型与语言模型在数学、科学、编码方面的能力对比本报告版权属于中原证券股份有限公司训练方法的基础上加入了多阶段的训练，包括在强化学），新得到的DeepSeek-R1具有了图3：DeepSeek-R1的训练流程为了能够将推理能力迁移到不适合MoE架构的场景，DeepSeek还用DeepSeek表2：硅基流动上DeepSeek主要模型情况及调用价格428DeepSeek-R1-Zero的AIME精度的能力。与监督微调通过给模型大量人类标注数据进行学习我学习和获得奖励的方式，完成自主的学习。因而我们看到强化学习依赖于先验知识，模型自我学习的过程中或能涌现出超越人类思维上限的推理能力2）无需标注数据，监督微调需要的人工标注数据往往需要耗费较长的时间周期和较高的成本，还容易因为标记者喜好产生训练偏差。图4：DeepSeek-R1-Zero在训练中AIME精度提升情况图5：DeepSeek-R1-Zero在训练中的平均响应时长表3：DeepSeek的主要模型发布情况2024年12月发布的DeepSeek-V3在性能本报告版权属于中原证券股份有限公司请阅读最后一页各项声明本报告版权属于中原证券股份有限公司图6：DeepSeek-R1与o1在调用成本差距（美元/百万token）Cache）较大，DeepSeek通过将低秩近似方法引入键值缓存压缩中，图7：DeepSeek-V2中MLA对于降低KVCache和训练成本的作用）：），数据只选择激活其中一部分专家模型，因而可以减少计算量本报告版权属于中原证券股份有限公司图8：DeepSeek-V3整体架构架构上展现出了软硬协同优化能力，这成为了他们超越国内其他大模型团容易损失数据信息。为此，DeepSeek结合自身在GPU硬件架构和训练误差方面强大的整合行，而一些关键操作则保持了原有数据格式，兼顾了训练本报告版权属于中原证券股份有限公司图9：FP8混合精度训练框架示意图图10：DualPipe算法示意图（1）通过精细化模型和软硬件结合的训练构架的构建模型能力建设。DeepSeek在这个方向上展现出超强的能力和开创性，也很好契合我国本报告版权属于中原证券股份有限公司图11：DeepSeek-V3与Grok-3训练小时数对比（万GPU小时）图12：头部大模型的ChatbotArena成绩但可以预见的是，无论从经济性上来说，还是从能源消耗等因素来看，简单依靠大力出奇迹的发展路径的瓶颈都显而易见。而Dee型应用推广和能力进一步提升，都创造了更多发展本报告版权属于中原证券股份有限公司表4：OpenAI大模型产品竞品推出情况模型Anthropic腾讯Anthropic根据DeepSeek在3月1日发布的《De表5：DeepSeek运营数据及测算本报告版权属于中原证券股份有限公司342*1000*0.14+(608-342)*1000*0.55+168*资料来源：DeepSeek，中原证券研究所（图13：DeepSeek在不同时段用于推理服务的节点数按照理论测算，DeepSeek会有日均47.5万美元的利润，对应的毛利率高达84.5%，但实际利润会少于理论值，对比在理论收入测算中与实本报告版权属于中原证券股份有限公司预计从2023年到2028年，OpenAI将蒙受440亿美元的损失，其中2024年将损失50亿美元，到2026年年度损失可能高达140亿美元，到2029年OpenAI看，DeepSeek凭借强大的成本控制能力，已经可以实现M论毛利率，都是超出市场预期的。图14：2024年OpenAI支出预测服务接入后，在用餐时段或将产生更多的服务需求。图15：DeepSeek成本与理论收入测算本报告版权属于中原证券股份有限公司除此以外，Anthropic、腾讯、华为目前也都Grok-3达到一般可用性后开源。这意味着xAI的开源节奏将会在发布模型的开源，整体模型能力也将落后于目前主谷歌：作为AI领域的老牌厂商，谷歌在2024年2月和6月分别推出了开源模型亿等多个参数大小尺寸，且模型效果始终在开源届本报告版权属于中原证券股份有限公司表6：主流开源大模型亿以上商用需授权亿Apache2.0亿亿亿、570亿参数支持32K上下文支持8192上下文，同时发布了90亿和2亿允许商用，要标注版权，月本报告版权属于中原证券股份有限公司模型Apache2.0Qwen许可，亿支持128k上下文，激活370亿参数，训练亿Apache2.0Meta：其在2023年2月推出Llama-1的时候仅可用于研究，而不能进行商Meta进一步允许使用其模型的输出来改进其他），尼亚州法律管辖，加利福尼亚法院具司法管辖权，或影响受贸易制裁的企业的使用。遵守Apache2.0，其中规模最大的720亿参数模型为Qwen许可，30亿模型为QwenResearch许可。以Qwen许可为例，允许商用但需要标注通义千问的贡献，要求当产品拥有争议适用于中国法律，杭州法院具司法管辖权。阿里在R1后开源的QwQ-32B选择了定法律管辖相关条款。MIT与Apache同属于较宽松的开源协议，但是Apache要求在衍生作品中包含原始许可证、版权声明和贡献者声明等，MI本报告版权属于中原证券股份有限公司图16：常见开源协议对比通过以上对比来看，DeepSeek在开源协议上保持了更加开放的友好，对于全球被许可人来说，也可以避免受到国际政治及法律变化的影响。在Deep-R1和DeepSeek-V3发布以后并提供MaaS服务，省去了开发者买卡、装驱动、配加速了在大模型的应用落地，也可以很好地满足更多私有化的行业需求。表7：各大厂商接入DeepSeek的情况DeepSeek-R1模型可以在AmazonWebServices上使用经过硅基流动和华为云团队连日攻坚，现在，双方联合首发并上线基于华为云昇腾云服务的本报告版权属于中原证券股份有限公司百度智能云千帆平台已正式上架DeepSeek-R1和Dee南京智算中心与寒武纪、苏宁科技合作，成功上线全金山云中国移动通信集团青海有限公司基于寒武纪MLU590国产化算力资源池，已全面部署上线根据Canalys数据，从2024年全球智能手机出货量市场来看，安卓占据了约78%的市场份额，也极大地降低了手机厂商和应用厂商发展的门槛，促进了手机生态的成熟。因而，业界也对大模型开源生态的发展给与积极的响应。图17：2024年全球智能手机出货量市场份额在闭源生态发展的过程中，由于中国企业上云（特别是公有云）比例远低于海外，AI的本报告版权属于中原证券股份有限公司B端应用推广也因此受限。而随着最强大模型的开源传统软件开源的定义中，关注点在于源代码的公开可获取，来自全世界的开发者可以很容易地为软件提供贡献。而对于大模型来说，涉及到的核心要的代码、模型参数、用于训练的技术和方法、标记训练数据天的代码库开源活动就此展开。从芯片级优化到系统级设计，从算法到工程通过破译英伟达后台指令，并巧妙地使用，极致优化了算法性能。在此次活动中，DeepSeek将其在节省算力和高效运算方面的核心技术毫无保留地进行悉数开源，在全球范围内引起了广泛的关注和强烈的反响，其开源的诚意也赢得了全世界的赞表8：DeepSeek在“OpenSourceWeek”的开源情况核本报告版权属于中原证券股份有限公司请阅读最后一页各项声明本报告版权属于中原证券股份有限公司图18：英伟达DeepSeek-R1推理输出能力同时，考虑到DeepSeek可以通过低成本取得大厂闭源系统同等水平的大模型，那么DeepSeek也可以在前期实现更加纯粹的和具有可持续性的开源、开放，从而加庞大AI开源生态体系，也借助这样的开源实现群策群力，更快地走向AGI。也在考虑加大开源策略；连一向低调的火山引擎也开源了“大模型应用实验型的算力主要集中在预训练（Pre-training）阶段，而未来模型在后训练（Post-tra消耗的算力进一步加大，同时由于模型在推理阶段需要进行更长时间的思考过程应用爆发期，B端AI应用成为了企业应对科技变革冲击的重要手段，阿里、字节、小米等科技大厂也在加速AI投入，完成向下个时代的布局。机终端一类的应用落地形成日常调用，模型调用需求将在种类和频次上获得极大的提升。本报告版权属于中原证券股份有限公司在数据端的长期积累和庞大的工程师团队，在底层模型能力实现突破以后，我们在的发展目标，同时规划智算、超算等高性能论总算力、智算算力、智算占比目标都名列前茅，也意图将算力和人工智能作为新质生产力来带动河南的发展。图19：各地算力规划中关于总算力的相关目标（EFLOPS）图20：各地算力规划中关于智能算力的相关目标（EFLOPS）本报告版权属于中原证券股份有限公司图21：各地算力规划中关于智能比例的相关目标部署和推理服务，成为河南省第一个提供该服务的城市级算力中心，河南空本报告版权属于中原证券股份有限公司强于大市：未来6个月内行业指数相对沪深300涨幅10％以上；同步大市：未来6个月内行业指数相对沪深300涨幅－10％至10％之间；弱于大市：未来6个月内行业指数相对沪深300跌幅10％以上。买入：未来6个月内公司相对沪深300涨幅15％以上；增持：未来6个月内公司相对沪深300涨幅5％至15%;谨慎增持：未来6个月内公司相对沪深300涨幅－10％至5%;减持：未来6个月内公司相对沪深300涨幅－15％至－10%;卖出：未来6个月内公司相对沪深300跌幅15％以上。本报告署名分析师具有中国证券业协会授予的证券分析师执业资格，本人任职符合监管机构相关合规要求。本人基于认真审慎的职业态度、专业严谨的研究方法与分析逻辑，独立、客观的制作本报告。本报告准确的反映了本人的研究观点，本人对报告内容和观点负责，保证报告信息来源合法合规。中原证券股份有限公司具备证券投资咨询业务资格。本报告由中原证券股份有限公司（以下简称“本公司”）制作并仅向本公司客户发布，本公司不会因任何机构或个人接收到本报告而视其为本公司的当然客户。本报告中的信息均来源于已公开的资料，本公司对这些信息的准确性及完整性不作任何保证，也不保证所含的信息不会发生任何变更。本报告中的推测、

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计算机行业深度分析-三大要素齐发力AI应用步入全面加速期

文档简介

温馨提示

最新文档

评论

计算机行业深度分析-三大要素齐发力AI应用步入全面加速期

文档简介

温馨提示

最新文档

评论

相关文档