通信AI系列之:人工智能之火点燃算力需求AI服务器迎投资机遇_第1页
通信AI系列之:人工智能之火点燃算力需求AI服务器迎投资机遇_第2页
通信AI系列之:人工智能之火点燃算力需求AI服务器迎投资机遇_第3页
通信AI系列之:人工智能之火点燃算力需求AI服务器迎投资机遇_第4页
通信AI系列之:人工智能之火点燃算力需求AI服务器迎投资机遇_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

行业报告|行业深度研究2023年05月01日通信机遇SACS10517030002S行业评级:强于大市(维持评级)后的信息披露和免责申明上次评级:强于大市后的信息披露和免责申明摘要ChatGPT带来服务器大变革们判断应用将增加。我们认为ChatGPT的训练和推理场景都将带来服务器市场增量需求,预计未来AI服务器快速增长期。ICT续布局赛道,争取市场份额。剧,价格和盈利能力下降的风险重点标的推荐票票资码称-27EE技据注:2022年中兴通讯、紫光股份的EPS和PE为实际值;润泽科技和奥飞数据为预测值。紫光股份(计算机团队联合覆盖)、润泽科技(机械团队联合覆盖)、奥飞数据(计算机团队联合覆盖)22文之后的信息披露和免责申明31、服务器构成及市场情况…………………页2、AIGC带来服务器变革…………………3、需求…………4、AI服务器市场迎来高速发展机遇…………5、AI服务器产业链解析…………………6、AI服务器竞争格局…………………7、…………………请务必阅读正文之后的信息披露和免责申明41服务器构成及市场情况安全性、可扩展性、可管理性等方面要求较高。资料来源:美科安防科技微信公众号、天风证券研究所请务必阅读正文之后的信息披露和免责申明5DC2023年我国服务器市场规模将增至308亿美元。中兴通讯进入前五。28.1%34.4%17.2%4.9%5.3%5.3%浪潮信息新华三超聚变中兴通讯联想其他资料来源:国际电子商情、中商产业研究院、同花顺财经、天风证券研究所6请务必阅读正文之后的信息披露和免责申明72AIGC带来服务器变革AIGC产业生态形成GPTAIGC,不断推出相关技术、AI了AIGC的大爆发。模型为基础搭建的AIGC技术基础设施层。②第二层为中间层,即垂直化、场景化、个性化的模型和应用工院《AIGC发展趋势报告(2023)》、天风证券研究所81750亿(175B)个参数。在GPT-3发布之前,最大的语言模型是微软的TuringNLG模型,大小为170于算力资源需求提升。99•异构计算(HeterogeneousComputing)是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式,目前主PU。AI来实现性能加速。资料来源:青云QingCloud微信公众号、阿里云官网、天风证券研究所10CPU将它数量相对较少的内核集中用于处理单个任务,并快速将其完成。这使它尤其适合用于处理从串行计算到数据库运行等类型的工作。GPU加速特定3D渲染任务的ASIC开发而成的。随着时间的推移,这些功能固定的引擎变得更加形处理和当下视觉效果越来越真实的顶级游戏仍是GPU的主要功能,但同时,它也已经演化为用途更普遍的并行处理器,能够处理越来越多的应用程序。维度核心数量数干个加速核心(双卡M40高达6144个加速核心)几十个核心产品特点1.高效众多的运算单元(ALU)支持并行处理2.多线程以到达超大并行吞吐量3.简单的逻辑控制1.复杂的逻辑控制单元2.强大的算数运算单元(ALU)3.简单的逻辑控制于并行的程序、串行运算的程序资料来源:昱唯官网、天风证券研究所11露和免责申明123训练&推理带来服务器增量需求◼在AI实现的过程中,训练(Training)和推理(Inference)是必不可少的,其中的区别在于:◼简单理解,我们学习知识的过程类似于训练,为了掌握大量的知识,必须读大量的书、专心听老师讲解,课后还要做习题巩固自己对知识的理解,并通过考试来验证学习的结果。分数不同就是学习效果的差别,如果考试没通过继续重新学习,不断提升对知识的掌握程度。而推理,则是应用所学的知识进行判断,比如诊断病人时候应用图:训练与推理差异资料来源:硬十AI微信公众号、天风证券研究所13经网络算出结果后,如果发现错误或未达到预期,这时这个错误会通过网络层反向传播回来,该网络需要尝试做出新的推测,在每一次尝试中,它都要调整大量的参数,还必须兼顾其它属性。再次做出推测后再次校验,通过一次又一次循环往返,直到其得到“最优”的权重配置,达成预期的正确答案。如今,神经网络复杂度越来越高,一个网络的参数可以达到百万级以上,因此每一次调整都需要进行大量的计算。吴恩达(曾在谷歌和百度任职)举例“训练一个百度的汉语语音识别模型不仅需要4TB的训练数据,而且在整个训练周期中还需要20exaflops(百亿亿次浮点运算)的算力”,训练是一个消耗巨量算力的怪兽。用新数据推理出各种结论,它是借助神经网络模型进行运算,利用输入的新数据“一次性”获得正确结论的过程,他不需要和训练一样需要循环往复的调整参数,因此对算力的需求也会低很多资料来源:硬十AI微信公众号、天风证券研究所14此外,训练和推理过程中,芯片的部署位置、准确度/精度要求、存◼训练和推理所应用的GPU/服务器也有不同。中包括高性能计算、深度学习训练和推理、机器学习、数据分析和图形学。引入革命性的TuringTensorCore技术,使用多精度计算TINT80GB可为每个节点提供高达1.3TB的统一显存,而且吞吐量比A10040GB多高达3倍。在BERT等先进的对话式AI模型上,ACPU9倍。hatGPT◼由于OpenAI暂未公开ChatGPT(基于大语言模型GPT-3.5)相关技术细节。估算基于GPT-3。算力估算。◼根据OpenAI在2020年发表的论文,训练阶段算力需求与模型参数数量、训练数据集规模等有关,且为两者乘积的。PFLOPSPFLOPS-day)。阶段需要服务器数量=训练阶段算力需求÷服务器AI算力性能=2.96×108台(同时工作1秒),即3423台服务器工参数量值参数量1750亿预训练数据量45TB算力需求3.15×108PFLOPS有效算力比率21.3%实际算力需求1.48×109PFLOPSA100服务器算力性能5PFLOPS工作1日所需服务器(台)3423hatGPT◼由于OpenAI暂未公开ChatGPT(基于大语言模型GPT-3.5)相关技术细节。估算基于GPT-3。库,训练阶段的算力估算。iaAI在数据中心级部署H100GPU可提供出色的性能,并使所有研究人员均能轻松使用新一代百亿亿次级(Exascale)HPC万亿参数的AI。◼H100还采用DPX指令,其性能比NVIDIAA100TensorCoreGPU高7倍,在动态编程算法(例如,用于DNA序列比对Smith-Waterman)上比仅使用传统双路CPU的服务器快40倍。要服务器数量=训练阶段算力需求÷服务器AI算力性能=4.625×107台(同时工作1秒),即535台服务器工作1日。算值参数量1750亿预训练数据量45TB算力需求3.15×108PFLOPS有效算力比率21.3%实际算力需求1.48×109PFLOPSH100服务器算力性能32PFLOPS工作1日所需服务器(台)535资料来源:英伟达官网、天翼智库微信公众号、天风证券研究所17训练敏感性分析A训练敏感性分析A100(台413693171173423332245645706114118919562445489048905136917123423389978122324454524565711380◼由于OpenAI暂未公开ChatGPT(基于大语言模型GPT-3.5)相关技术细节。估算基于GPT-3。敏感性分析。效算力比率21.3%来计算,训练阶段实际算力需求为1.48×109PFLOPS。◼对AI服务器训练阶段需求进行敏感性分析,两个变化参数:①同时并行训练的大模型数量、②单个模型要求训练完Ps◼此外,若后续GPT模型参数迭代向上提升(GPT-4参数量可能对比GPT-3倍数级增长),则我们测算所需AI服务A100训练侧敏感性分析A100训练侧敏感性分析训练敏感性分析H100(台4160521402674534953571389183229306382764021426753538253719240hatGPT◼由于OpenAI暂未公开ChatGPT(基于大语言模型GPT-3.5)相关技术细节。估算基于GPT-3。算力估算。tGPTOpenAI。◼假设每轮对话产生500tokens(约350个单词)则每轮对话产生推理算力需求:2×1.75×1011×500=0.175larwebOpenAI6亿次,换算成每日访问量约为每日5300万访问量,假设每次访问发生10轮对话,则我们测算每日对话产生推理算力需求为3.09×108PFLOPS。10kw,则我们测算需要服务器数量为=1.545×108台(同时工作1秒),即1789台服务器工作1日。图:OpenAI网站访问量表:不同模型有效算力比率有效算力比率模型名称推出时间有效算力比率2020年5月英伟达6.2%2022年4月谷歌TPUSimlarweb19hatGPT◼由于OpenAI暂未公开ChatGPT(基于大语言模型GPT-3.5)相关技术细节。估算基于GPT-3。敏感性分析。训练及规模。模型参数数量不变,每轮对话产生tokens数量的变化将影响推理阶段所需算力需求,随着未来智能语音、娱乐甚至ens此外,用户访问量预计将随着ChatGPT的持续火热和普及,访问数量持续增加。若后续ChatGPT普遍应用于日常假设有效算力比率按30%取定,应用搭载16片V100GPU的英伟达DGX2服务器进行训练推理,该服务器算力性能表:推理测敏感性分析推理敏感性分析每轮对话产生tokens数V100(台2000户访问量67500527010540516752513503675152551350310085675154库微信公众号、天风证券研究所请务必阅读正文之后的信息披露和免责申明214AI服务器市场有望迎来高速发展机遇0.00◼AI服务器作为算力基础设备有望受益于算力需求持续增长AI作为算力基础设备,其需求有望受益于AI时代下对于算力不断提升的需求而快速增长。◼根据TrendForce,截至2022年为止,预估搭载GPGPU(GeneralPurposeGPU)的AI服务器年出货量AI器,可以根据应用范围采用不同的组合方式,如CPU+GPU、CPU+TPU、CPU+75.031.7268.07.020192020202120222023E2024E2025E2026E百亿亿次浮点运算/秒(EFLOPS)同比增速.0%0%IDC◼用户快速增长+模型持续迭代+应用场景的不断扩张或将使AI服务器需求超预期ChatGPT用户数快速增加,上线仅5天,用户数便突破百万,上线两月后,ChatGPT月活用户数突破1亿,对话的产生,提升推理所需算力基础设施需求。ChatGPT的前身,最终形成的ChatGPT是优化版本的对话语言模型。预计GPT-4模型的参数量仍将进一步增长,根据天翼智库,给GPT-3喂料的长度每次不能超过大约2000个字,现在GPT-4的“消化能力”提升AI未来有望涌现更多应用场景。库微信公众号、黑马程序员、天风证券研究所AI◼用户快速增长+模型持续迭代+应用场景的不断扩张或将使AI服务器需求超预期gptdemocom站统计,目前基于ChatGPT推出的应用表现出高度活跃和极度丰富特性,截止2023年3月6日已有620个案例。从生成的内容格式来看可以把目前所有案例分为五大类,即文本生成、代码生成、图像生成、音频生成、和视频生成。其中文本生成是目前最主要的应用方向,有397个案例,占比达。拓展。目前ChatGPT的主要应用场景包括但不限于无代码编程、小说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟人、人工智能客服、机器翻译、芯片设计等。随着算法技术和算力技术的不断进步,ChatGPT也有望进一步走向更先进功能更强的版本,在越来越多的领域进行应ChatGPTChatGPT富众号、科普海南微信公众号、天风证券研究所24AI模预计将高速增长◼用户快速增长+模型持续迭代+应用场景的不断扩张或将使AI服务器需求超预期展成熟度、应用市场空间及应用提供方是否具有海量的业务数据基础和能力ChatGPT实现规模应用。流程化、低成本化,催生产业各方应用创新。目前一切还处于“高速创新”的前期,中长期发展很有可能重构娱乐、文学等模式,并赋能教育、金融、工业、医疗等实体。短期应用在搜索+客服,中期利好内容图:不同领域ChatGPT可能应用机会判断图:长期看好B端产业机会资料来源:天翼智库微信公众号、天风证券研究所25请务必阅读正文之后的信息披露和免责申明265AI服务器产业链解析8颗GPU8颗GPU◼AI服务器主要构成:◼以浪潮NF5688M6服务器为例,其采用NVSwitch实现图:NF5688M6产品特性GPUPP信互联。整机8颗NVIDIAGPUPPIntelXeon扩展处理器(IceLake),支持8块2.5英寸NVMeSSDorIexGPUGPU器4颗GPU◼目前按照GPU数量的不同,有4颗GPU(浪潮NF5448A6)、8颗GPU(NvidiaA100640GB)以及16颗GPU(NVIDIADGX-2)的AI服务器。资料来源:浪潮官网、天风证券研究所27SSDCPU主板/SSDCPU主板/集成商互联网厂商◼AI服务器核心组件包括GPU(图形处理器)、DRAM(动态随机存取存储器)、SSD(固态硬盘)和RAID卡、CPU(中央处理器)、网卡、PCB、高速互联芯片(板内)和散热模组等。CPUIntelGPU目前领先厂商为国际巨头英伟达,以及国内厂商如寒武纪、海光信息等。GPUg兆易创新等g兆易创新等散热gg波龙等光模块股份、金像电子、南电路、生益科技等股份、金像电子、南电路、生益科技等官网、天风证券研究所工业富联、英业达等服务器厂商等运营商政企客户政府、金融/医疗等行户具体内容10petaOPSINT8系统功耗5千瓦双路AMDRome7742、共128个核心、2.25GHz(基准频率)、3.4GHz(最大加速频率)系统尺寸最大482.3毫米大897.1毫米◼A100服务器系统功耗明显提升。以NVIDIA的DGXA100640GB为例,其配置了8片A100GPU,系统功耗达到最大6.5A0服务器的应用增多,我们认为或将显著提升数据中心机柜的功耗。低;液冷分为单相液冷和相变液冷。散热冷却系统所采用的冷却介质、冷却方式不同,移热速率差距大。传统风冷kW/r的机柜,对于30kW/r以上功率密度的机柜无法做到产热与移热速率匹配,会使机柜温度不断升高导致◼可以看到,采用A100后服务器功率大幅提升,参考上文若采用英伟达DGXA100640GB服务器,单机柜的功率或将超过IT触状态来区分。图图:不同制冷方式所对应适用机柜功率及传热系数免责申明306AI服务器竞争格局AI格局IDC第四季度中国服务器市场跟踪报告Prelim》。从报告可以看到,前两名浪潮与新华三p商中,浪潮、戴尔、联想均出现显著下滑,超聚变和中兴则取得明显增长。其中,浪潮份额从30.8%下降联想降幅最为明显,从7.5%下降至4.9%。Microsoft%为最,而中国近年来随着国产化力道加剧,AI建设浪潮随之增温,以ByteDanceAI。ChinaIT31AI格局◼服务器主要厂商包括:工业富联、浪潮信息、超聚变、紫光股份(新华三)、中兴通讯、中科曙光。百度AI服务器占比高达90%。GPU领先地位,有各种类型的GPU服务器满足各种AI场景应用。特别针对GPT场景而优化的GPU服务器已经完成开发,并取得31个世界领先的测试指标,该新一代系列GPU服务展较快,年初推出AI服务器G5服务器,此外在布局新一代AI加速芯片、模型轻量化技术,大幅降低大模型推理成本。表:各服务器厂商对比场份额AI务器占营业收入(亿元)归母净利润(亿元)23年PE(截至2023.4.18一致预期22Q4中国服务器市场份额2020A2021A2022A2020A2021A2022A浪潮信息630.38670.48695.254.6620.0320.8022.52紫光股份597.05676.38740.588.9521.4821.5834.25172%中兴通讯1014.511145.221229.5442.6068.1380.806.8253%超聚变101%中科曙光101.60112.00130.088.221.585.4434.96免责申明337ICT等众多信息通信网络环节,覆盖底层网络基础设施(5G基站和SPN、传输网各类设备、千兆宽带设备等),算力基础(服务器、存储等),垂直行业和消费侧的网络和终端(企业级网络设备、工业网关、手机、家庭终端等),应用产品(数据库、云视频、云平台等)。随着数字经济的持续深入发展,未来中兴通讯有望深度参与数字经济建设,在底层网络、算力和流量以及上中中兴通讯提供的产品和服务数字经济相关环节细分产业链产品和服务底层网络PON流量相关网传输网设备、交换机、路由器等应用相关库、云平台、云电脑、云视频等企业/园区网络企业级交换机、路由器、网关等物联网、工业互联网工业网关、系统解决方案费者终端智能手机、智能手表等智能uSmartInsight人工智能平台虚拟现实和增强现实plore媒体中心资料来源:中兴通讯官网、中兴通讯公告、天风证券研究所政企业务主要产品梳理产品类型具体产品应用领域储等有云以及政企机房等场景器、存储等设备数据通信交换机、路由器、网络安全、网络管理等网络安全等使用的设备以方案WLANAPAC等、工业等场景下的无线接制系统、储能电源、微模据中心等电源模块和系统接入和传输客户的专网、内网等需求及传输网络产品讯终端,大、融合调度等、公安等视频终端、平台数据库ldenDB业的分布式数据库◼公司在GPU服务器市场处于领先地位,有各种类型的GPU服务器满足各种AI景应用。特别针对GPT场景而优化的GPU服务器已经完成开发,并取界领先的测试指标,该新一代系列GPU服务器将在今年二季度全变动情况来看,戴尔出现颓势,市场份额出现较大下滑,而新华三/HPE图:紫光股份业务结构图:2021Q1服务器市场份额情况HPE/H321.40%t7.20%其他6.90%5.30%表:紫光股份各市场排名及份额情况21年排名18192021中国以太网交换机市场中国企业网路由器市场2%9%4%7%5%中国SDN(软件)市场--------◼公司积极规划新建数据中心,持续扩大自建自持规模。截至2021年10月31日,公司已累计投产机柜38,690个,累计上电机柜28,660个;公司积极布局自建数据中心,截止2021年10月在建/规划建设数据中心项目9个,建成后将大幅增加公司业务能力。且新建机房主要分布在长三角、大湾区枢纽以及成渝枢纽新片区。◼润泽科技数据中心项目布局均位于大数据中心国家枢纽节点,符合国家数心建设布局,依托廊坊的开发经验在全国复制推广,区域优势与规模◼自建电站、自建综合管廊,提供稳定强劲电力引擎。电力供应作为公司数据中心建设的三个必要条件之一,润泽科技已在全国布局项目电力供应保障。廊坊地区除了政府配套的多路市政供电,2021年公司已投产一座用户自用110KV变电站,2022年开始投建一座220KV变电站。图:润泽科技机柜布局规图:润泽科技机柜布局规划图:润泽科技机柜数量038,69040,0002228,66030,0000累计投产机柜(个)累计上电机柜(个)0/31图:润泽科技机房图示GPTChatGPT存在政府政策管控ChatGPT发展,规范化发展对整体推进节奏的影GPT预期,导致推理需求不及预期,减少服务器需求的风险利能力下降的风险:存在进入行业的厂商增加,价格竞争使得盈利能免责申明

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论