AI如何影响云计算产业?从北美云巨头说起_第1页
AI如何影响云计算产业?从北美云巨头说起_第2页
AI如何影响云计算产业?从北美云巨头说起_第3页
AI如何影响云计算产业?从北美云巨头说起_第4页
AI如何影响云计算产业?从北美云巨头说起_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

▍报告缘起:北美云计算巨头全面拥抱IChaGT在全球市场获得成功,以及由此引致的全球主要科技企业在I领域的军备竞赛正在推进全球I产业加速发展目前全球三大云计算巨(亚马逊谷歌微软下同)均已加入全球M以及生成式I的竞争当中。这一投入使得三大云厂商的生态正在发生快速变化微软谷歌依靠闭源模型全力打造闭环的I生态而WS则以相对开放的心态尝试从不同角度进行I与云计算的融合在本篇报告中我们将着重探讨三大云厂商在云基础设施、模型应用以及商业细分场景的布局思路,并尝试分析生成式I对各大云厂商的后续的业绩贡献情况。图:四大互网与件公布大模型各公司官网、官方微信公众号等,图:谷歌I蓝图谷云官网图:亚马逊成式I布局WS图:微软I全家桶资料来:微官网▍I算法能力:技术储备决定路线选择头部云计算大厂间对于如何将云与I相融合出现了分化的两种选择,而其背后是由厂商间的I模型技术差距所决定我们看到自3年3月开始微软谷歌在各自的云产品中加入了大量以I模型能力为底层的服务并提供从硬件到模型再到上游应用的闭I服务相比之下亚马逊eta在产品结构的改变上较为缓慢以单点为主仅提供了maonedrock(构建大语言模型过程中的便捷I服务)等产品,并将更多精力放在开源模型以及相关硬件开发中。从根本上来看,决定微软谷歌与亚马逊a在当前对待I能力的不同路线的是当前各家厂商间的大语言模型技术能力差异。图:Ae已经将底层件持到模调用一整生态入其云服中Ae官网微软谷歌:依靠其相对优势的技术能力,从开源走向闭源,全力打造围绕底层型能力的闭环I生态回顾本轮大语言模型的发展历史从7年谷歌ert开始到年G-3再到2年的ChaGT,人工智能技术的发展潮流始终由OpnI(微软、Deemnd(谷歌)这两家巨头主导,其他厂商根据先行者的开源资料以及相关论文进行模仿并创新。根据NeurIPS的统计,谷歌微软在2年发布了约%的大语言模型相关学术论文占据了技术领域中的绝对话语权ChaGT的成功证明了OpI单向自回归的rasfomer模型在商业化中的可行性,谷歌在这一技术分叉上虽然稍微落后于微软但也在1年开始转向仍大幅领先于其他云厂商这两家头部I厂商迫切希望将自身的技术优势构筑为商业化能力的核心壁垒,以延长后来者的追赶时间。从OpnAI发布G-3走向商业化盈利开始,谷歌也迅速效仿,不再公布T5模型及后续版本的细节。图:谷歌微软在2年发布约的大言模相关学论文0ISLMDASparwPMEGPT系列模型组织Gleind谷歌OLMDASparwPMEGPT系列模型组织Gleind谷歌OAI能否公访问否否否有限参数量0亿0亿0亿0亿及以上预训练语料库大小.T.T0亿kn GP3近0亿kn模态文字文字多模态 P4具备多模态训练硬件4块TP3基于P/4我们预计GP4使用千4块TP4余块英达A0产品化度BAD机器人Aicst5iltA icstAe(词数)icstBing资料来源:谷歌、微软、OpenAI官方技术博客,预计以底层模型为核心,持续扩充产品线。底层模型能力是当前微软谷歌的核心竞争优势因此我们也看到今年来这两家厂商围绕底层I模型来构建其云产品的尝试微软以其在3年3月最新发布的G-4模型为核心推出了namcs35Coiot等产品,将I模型能力融入到云应用中直接提供给用户在底层微软与OpnI持续尝试构建超算集群为G-4模型提供支持。谷歌在产品迭代中稍落后于微软,但也在4月与5月分别将其ard模型融入到Wkspce与ertexAI等产品,以对标微软的云产品扩充。殊途同归,这两家云巨头都在围绕其在底层模型上的性能优势,通过直接将模型服务融入到CoB产品中的模式扩充自身云产品线,寻求差异化优势。图:以T4为代表的语言型是今来微云新品的心座资料来:微云官网图:谷歌云绕其I模提供从硬件持到际模部署全服务资料来:谷云官网亚马逊等厂商:模型技术上落后于谷歌微软,更倾向于培养开源社区共同迭代型以缩小差距从最新公布的相关论文来看亚马逊与eta发布的tan与A等模型在技术指标上落后于G4模型-2年的时间直接应用到云应用中会看到较为明显的差距。因此在后续的技术路线上亚马逊与a等厂商大概率会选择开源路线,寄希望通过社区的力量加速迭代目前大语言模型开源社区的主要贡献者包括亚马逊NIDIA以及Hugnface等通过分享部分模型与大语言模型相关的知识培训逐渐培养起了一批开源开发者。a于023年3月发布了其新一代大语言模型LMA并将源代码开源给社区社区用户及企业可以免费使用公开的模型以及数据源但受证书限制不能用作商用途。表:当前主的开大语模项目及基础型名称基础模型训练方法数据集AlpcalaAAlpcatGGM自定义据集(T)llyGPTJBAlpcaBlleBlomAlpc自定数据()OtKitGPTEOOIFasttAsGPTK)tlllaAGPT.5生的k数据集Gitb图:ta开源的A模型果好于PT3但与大参量的PM差距明显A:OndfiietFotionels(oTon,Thitil,GtierIc等),taAI后续产品思路:助力开源社区构建,重视底层硬件研发,多角度尝试I与云融合的可能性在目前表现出的产品思路上因为本身模型能力的劣势亚马逊a都没有于尝试应用端与模型间的融合亚马逊于3年4月推出了erockI服务主推面向开发者的大语言模型I相关内容,赋能开源社区。此外,亚马逊将对于C2芯片的发列为了下一阶段I领域的重点相较于微软谷歌围绕底层模型能力扩充产品线亚马逊倾向于多点发散、扬长避短,一方面助力开源社区缩小与微软谷歌间的模型差距,另一方面积极尝试多种I与云融合的可能性。图:亚马逊云品较发散重心仍绕基设施试与I合 WS▍底层基础设施计算架构升级致力于系统效率最优云计算的基础设施主要是IaS层,包含了计算、存储、网络等基础的T服务。随着I时代的来临,我们会显著看到大型云计算公司在底层基础设施层面上正不断进行调整一方面我们看到随着I的引入海外三大云厂商等加速英伟达等厂商高算力GU产品的导入和更新;另一方面三大云厂商加速在自研I芯片领域的投入。我们认为,这与I本身高算力大数据吞吐、低延迟推理等方面的要求相关。而云厂商上述领域的投入,亦将深刻影响云厂商计算业务在本部分我们将围绕云基础设施,详细分析云厂商的动机以及带来的新增量机会。计算架构:从CU向GU进行系统迁移,加速云厂商计算实例的迭代。考虑到I对算力的需求,GU成为I计算的理想载体,而对云厂商而言,此前大量的基础设施由CU架构贡献,其计算实例产品(虚拟机、弹性计算等)通常由CU负载,并不适合前生成式I对计算的需求因此我们看到自ChaGT兴起以来北美三大云厂商加速了GU计算实例的升级速度,以微软为例,我们看到公司围绕N系列虚拟机,针对的不同场景深度结合英伟达不同系列芯片场景的融合产品线从0覆盖至M系列T系列此外为了满足数据吞吐并行计算的要求微软同步进行ureatchAureCceCoud等编排和管理高性能计算(HC)环境的配套软件环境与硬件链接。因此后续来看,我们认为云厂商会持续提升GU实例在其计算业务线的比例。表:微软N系列虚机型对比虚拟机型号 配置PU型号 主要场景基于A和OL的应用序以及拟I和深学习高能3 VIATslaV0CT43 VIATslaT48个IAA0TeseP,每个GPU

计算和I工作载。计算密集型PU加速的应用,特别对采用IATsla4GPU和ADPY2me处器的推工作荷。DA04 都配备0千兆位laxIfiniBd连接和0BPU内存。、V3 VIATsla0

纵向扩和横扩展度学训以及加的C应用程序。针对使框架如OGL和ct)的远程可化、式处、游戏、码和VI方案进了化和设。V4 ADnItictI5 VI和远可视化特别对需较少PU资源的工负荷。m

八个IAmpeA0BTesreGPU

高端深度学习训练以及紧密耦合的纵向扩展和横向扩展PC工作荷。微软Azure产品官网,自研芯片:用于特定场景的加速和降本。除英伟达等厂商的GU芯片绑定外,三大云厂商均有自身的芯片业务线,例如谷歌的TU、微软的FG、WS的训练和推理芯片等。毫无疑问,随着I算法向trafomerdcoer-oly路线LLM的持续收敛,自研芯片在性价比层面的确占据优势但从各家的实际情况看其自研芯片的成熟度贡献度存在较大差异。谷歌TU基于tansfomer框架是天然匹配生成式I的芯片由于谷歌云基础设施的投入晚于微软及W为满足I的大量训练与计算需求谷歌针对trasfomer的框架针对性开发了TU加速芯片从性能来看TU4的计算能力已经能够支撑谷歌0亿参数模型的训练(a-,训练使用了4片TU4芯片根据谷歌云的对比TU系列芯片相较0芯片其性能成本大幅优化,因此谷歌TU在其加速卡中的占比显著高于其他云厂商。表:谷歌PU型号芯片名称发布日期性能应用TPUm制程,频z深度学推理TP2 7 TFLs浮点运,GB

机器学训练推理可在Glecmtrine运行TP3 8TFLs浮点运,BBM 更广泛深度习训和推理EePU 8 高吞吐串流料企业级器学任务主为I推理TP2Pd每秒5千万亿次点运、TB9 深度学推理B、二维环网状络TP3Pd超过0千万亿浮点算、B9 深度学推理BMTP4PdTPU4是谷歌第四定制I片,1 推理与练均兼顾其算力上一本3的两倍谷歌云官网,图:谷歌PU与英伟达0芯片的比 谷云官网W:从云底座架构进行自研专注效率的提升经过早期探索WS底层采用了自研的Ntro系统架构将虚拟化功能从服务器卸载到maonNitro专用芯片上大大降低了物理性能的损耗并提升了安全机制优化了网络与输入输出机制使得WS的能力迅速提升芯片层面WS针对不同的业务需求推出了不同类型的自研芯片,如针对底层系统的Ntro芯片、针对服务器高性能计算的Graton以及人工智能业务的推理芯片Inferenta与训练芯片ranumWS通过在关键计算要素的自研定制化,实现系统效率的最优。WSranum是WS专门为深度学习训练打造的第二代机器学习(M)加速器。与同类maonC2实例相比,可节省高达5%的训练成本。ranum已针对训练自然语言处理、计算机视觉和推荐器模型进行了优化,这些模型用于语音识别、推荐、欺诈检测、图像识别和预测等各种应用程序。WSInferenta2以最低的成本为您的深度学习(DL)推理应用程序提供高性能加速器在性能和功能方面实现了重大飞跃与Infernta相比Iferenta2的吞吐量提高了4倍延迟低至前者的同时为满足不同模型之间的通用性WS提供WSNeuronDK支持Porch和eorFow原生集成。图:WS自研片线资料来源:AWS官网,图:WSTinim芯片数WS图:WSIfia2芯片参数WS微软“脑电波计划”尝试进行FGA替代“脑电波计划”是一套利用现场编程门阵列芯片(Fed-rogrammaeGaterra,FGA)技术来高效快速经济地执行计算任务的系统的流程微软试图依靠其庞大的软件与云生态以实现FGA的铺开以及生态建设。但从实际情况来看,GU芯片本身在大计算场景下优于FGIC芯片在固定场景下优于FG由于芯片本身的固定特点,使得微软上述计划的推进并不顺利后续来看我们认为微软有可能将继续自芯片的建设,并有望与其他芯片厂商合作。图:微软“脑波计”技示意图微官网超算集群匹配与满足大体量模型的训练与推理工作由于模型体量的持续膨胀一计算实例已经不能满足超大型模型的训练因此我们看到微软谷歌相继与英伟达合作,开发基于最新H0芯片的超算集群。例如微软正在预览的NDH100v5M谷歌正在预览的3GPU超级计算机,用于训练和推理ML模型。表:谷歌、软超计算服器参数。参数 谷歌03GPU 微软D05MGPU配置GPU间带

8个0P,采用IA的r架构,供3倍的算吞量通过IAVSith和Vink.,A3的8个GPU之有.Bs的向带宽

xVIIA0TesreU通过下一代Sitch和Vik.0进行连VSitch和Vik.0在每拟机的8个本地PU之间有.Bs双向带宽处理器 下一代四代特尔强可展理器 第四代特尔强可展处器通过0z5Is提供B主主机内存网络带宽主机到互连

机内存通过硬支的P专门服器间PU通信和L优化络带高0倍未提供体信息

6通道z5内存每个PU有0G/sIIAtm2C7IfiniB在阻塞树络中每虚拟机为.TbsPE第5代主机到PU互连,个GU宽为Gs谷歌、微软官网,综上所述我们预计新硬件的更新计算实例从CU到GU的迁移都将带来云商业绩的改善一方面,更具性价比的硬件升级将使得云厂商的成本持续优化并提升业务利润率另一方面计算架构从CU向GU的切换将使得计算产品的单价得以提升并拉动存储网络等领域产品的销售因此经过早期的投入后I将带动基础设施品的利润与收入的同步提升。▍商业模式:PI调用、模型定制、算力租用等在上一部分我们重点分析了I在云基础设施上对云厂商业绩的拉动但我们也看在底层设施之外与模型应用相关的场景亦是后续增长的重要驱动力模型层面,我们看到以微软O谷歌等为代表的具备封闭模型的厂商可以通过直接出售模型接口、模型调优的方式,提供最先进的闭源模型进行商业化。对于细分场景云厂商亦以提供软件进行商业化在本部分我们将着重探讨云厂商在I调用模型调优细分场景应用三个方面的尝试与探索。PI调用:提供闭源模型的使用权限。在三大云厂商中,微软与谷歌选择模型闭源,以出售模型I的形式获取收益目前微软以及OI模型的商业化已经开启根据路透社数据,OpnI在2年的收入预计只有约0万美元,根据研究机构tchok的数据OpnI今年有望产生2亿美元的收入且预计到4年OpnI收入可能达到0亿美元谷歌虽然亦以I的形式出售aM系列模型但从目前看产品仍处在预览阶段并未全面开启商业化但谷歌云亦提供了语音文字转换等场景的I能力时根据O大会的披露,公司预计未来数月内将提供模型的可用版本。对亚马逊而言,其推出了模型调用平maonerock,提供第三方模型的调用。表:PT系列模价格GP4lPmtmltionKctt$./Ktks$./KtksKctt$./Ktks$./Ktkstlset.to$./KtksItcGPTAFatt)$./KtksBe$./Ktksie$./Ktksinci(stfl)$./KtksOI官网,信券研究部图:亚马逊可用的型WS图:谷歌VtxAI提供的分AI接口资料来:谷云官网部署和微调根据模型训练时长或数据量进行商业化一个模型完整的生命周期包训练模型将模型部署到端点使用模型进行预(推理等云厂商产品包括谷歌、OpenI等。从商业模式看,谷歌提供按时长计价的模式,提供训练、部署、推理等功能,其中训练成本显著高于推理。而OpnI选择按照数据量计价,但针对不同程度训练,提供四档价位。我们认为,当前的定价仍源自较高的计算成本后续来看随着算成本以及基础设施的完善,定价将更为具体。表:谷歌txAI计价模式图片数据操作每节点价格分类)每节点价格对象测)训练.5.5训(Ee设备端模型).0.0部署和线预测.5.2批量预测.2.2视频数据操作每节点价格分类对象踪)每节点价格操作别)培训.4.0训(Ee设端模型)

.8 .0图片数据预测.2.0谷云官,中证研究部表:OI模型微价格FinuingodelslTinigseAa$./Ktks$./KtksBe$./Ktks$./Ktksie$./Ktks$./Ktksinci$./Ktks$./KtksmingmolslseAa$./KtksOI官网信券研究部细分场景:微软Copilo、谷歌DuetI等。Copot是微软生成式的I助手,此前已被应用在类似于Gthb等代码开发场景。根据微软在其技术文档中的表示,Cplot采用了OpnI推出的G-4模型并且进一步优化了输出内容的可靠性以及使用数据的隐私问题,为企业级的应用做好了准备。I功能被直接集成到Wor、xce、oweroin、Outook和ems等应用中,用户可以提出问题并提示I撰写草稿、制作演示文稿、编辑电子邮件、制作演示文稿、总结会议等。Coplot将以两种方式与Mcrosoft35客户合作:)嵌入到Wr、xe、oweront、Outok、ems等。)提供聊天功能。商务聊天功能覆盖、Mcrosoft35应用和客户的日历、电子邮件、聊天、文档、会议和联系人工作等通过自然语言提示(如“告诉我的团队我们如何更新产品策略,商务聊天将根据上午的会议、电子邮件和聊天线程生成状态更新。而谷歌亦依靠原有的Wksace业务,将生成式I引入Wkspce推出适用于GogeWokspce的DuetI让用户能够与I协作,进行邮件撰写、图文生成T、表格汇总等。图:icsftilt概要csftilt发会图:tI在谷歌表中的用资料来:谷云官网▍效益测算:预计中短期增厚云厂商数百亿美元收入在上文中,我们针对云基础设施模型调用与细分场景等维度进行了产品与技术层的探讨,但从具体业绩的增厚上来看考虑到用户实际需求的复杂度、模型的多样性以硬件层面的不同很难给出极为精确的测算结果。但我们将基于已有的公开数据从产结构、产品单价等方面进行尝试性测算,以期给出大致的测算结果以及思路。计算产品预计的负载切换将为三大云厂带来合计0亿美元的额外收入基于我们的分析,由于软件领域的产品尚未开启商业化因此短期内软件类产品对公司业绩的厚将相对有限。但对计算类产品来说,目前GU架构已经基本升级完成,而且对于软等产品的开发而言前期主要需求来自底层基础设施叠加基础设施产品的价格以及用占比亦存在公开数据因此对于计算类产品的测算是具备实际意义且可行的我们的测逻辑如下:产品价格:GU产品的计算价格是常规的5倍甚至更高。我们从三大云厂商计算产品来看,基于GU的加速计算产品价格基本是CU价格的5倍甚至高。我们参考了微软ure的价格,选取各类别的最高价格,GU类产品的价格显著高于其他领域最大幅度接近6倍考虑到后续H0产品的导入大概率将拉高整体单价,因此我们假定,GU类产品的价格是普通CPU产品的5倍。表:Ae产品价格计算属性该类别最高价(美元小时)常规用途.9计算优化.2GPU.6高性能算.6内存优化.4计算属性 该类别最高价(美元小时)存储优化 .4Ae官网产品结PU负载占不足根据家公财fe以及我们的算三大厂商务中PU及其他I芯片整个算业的负载例不足,即便虑TPU较多谷歌其P+U的合计占比亦只大约。我们为,着I的持续透,PU以及U等其他I芯片的计负载持续增。图:2年三大云商计务收入亿美) 图:2年三大云商计务GU及其他I芯片负占比0

S ze GP

.%.%.%.%.%.%.%.%.%

S ze GP各家公司财报、trendforce,测算 各家公司财报、trendforce,测算测算结果预计负载切换将为三大云厂带来合计可观收入基于上述我们对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论