版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
证券研究报告|行业深度GPU到ASIC的迭代,从算力发展角一卡难求。经过一年发展,大家对于Transf品逐渐摸索出了以堆料矩阵乘法核构建“流水线”式处理流程的设计思路,在舍弃需求、算法的确定性,是ASIC放量的关效的连接“流水线”中的计算单元与存储,如何在无小核辅助的情况下整理进入计算核的数据,编译器的难度陡然提升。同时,如何在CUDA生态对第三方“兼容”本使得需求得以释放,繁荣的生态吸引更多用户与参与者,最终培育出新的、更强晶圆厂:台积电(TSMC)、英特尔(INTC););服务器龙头:工业富联、高新发展、中科曙光、紫行业走势32%16% 0%-16%-32%2023-032023-072023-11作者分析师黄瀚相关研究请仔细阅读本报告末页声明P.2请仔细阅读本报告末页声明1、投资要件 32、ASIC芯片概述 42.1什么是ASIC芯片 4 53、大模型ASIC的发展路线 63.1初步专用化:GPU亦是ASIC 6 83.3极致专用化:以Groq为例 3.4主要技术趋势总结:Wafer-Scaling+近存计算构建数据流水线 4、以矿机为鉴,英伟达与ASIC之争将走向何方? 4.1比特币矿机发展史,用何种速度取代CPU 4.2以太坊矿机发展史,为何一波三折? 4.3以史为鉴,“算法确定性”和“用户需求”决定ASIC渗透速度 5、软件将成为算力第三极 5.1推理时代,更加考验编译器的“流水线”构筑能力 5.2两年硬件,四年软件,编译器和生态将成为进入者最大门槛 6、我们的理解:需求决定一切,AISC与GPU螺旋上升 7、投资建议 8、风险提示 图表1:CPU、GPU、FPGA、ASIC对比 4图表2:GPU与CPU对比 6图表3:英伟达GPU架构迭代历程 7图表4:NVIDIAH100TensorCoreFP8 7图表5:英伟达A100架构图 8图表6:矩阵乘法公式 9图表7:TPUV1 图表8:TPUV1-V2 图表9:TPUV4 图表10:Groq推理效果对比图 图表11:Groq芯片工作流 图表12:TSPSuperlane流水线架构 图表13:嘉楠阿瓦隆1366I 图表14:NVIDIACmpHx专业挖矿专用GPU 图表15:CUDA扩大支持多种算法 图表16:TSPSuperlane位宽 图表17:Groq的研发历程 图表18:功能单元支持指令 图表19:ASIC与通用芯片带动AI螺旋上升 图表20:相关标的 P.3请仔细阅读本报告末页声明我们复盘矿机发展历史,算法较为简单且完全固定的比特币,在全网算力(矿工需求)的通用性芯片(显卡)一直保持了较高的市占率。因此,客户需求、算法稳定是ASIC放量的两大条件。起量的第一波需求。如今,经过两年发展,全球用芯片中的不必要部分去除,保留单纯用于处理矩阵乘法的计算核,同时再利用但与此同时,由于需要多个矩阵乘法核、存储之间的相互配合,同时少了对数据预处理的“小核”的帮助,该技术路线对于控制算核运算的“编译器”设计难度极高。从大火服务器龙头:工业富联、高新发展、中科曙光、紫光股份。P.4请仔细阅读本报告末页声明史上的第一大类“ASIC”芯片,通过大量部署并行计算核图表1:CPU、GPU、FPGA、ASIC对比CPUGPUFPGAASIC性能和效率可在各种任务中提供平衡的性能,串行处理架构限制了它们在可并行化的任务中的效率能够高效地执行可以分解为更小的并发操作的任务针对特定任务进行优化,与CPU和GPU相比,它可能为某些应用提供卓越的效率在特定应用中表现出色,性能明显优于其他灵活性和定制性灵活性较高,能够运行各种应用程序灵活性较高,能够运行各种应用程序可以在制造后重新编程,以执行不同的任务或适应新的要求需要定制设计,缺乏灵活性成本成本较低成本较低初始成本高于CPU和GPU初始开发和生产成本高,适用于大批量或高利润应用应用场景从运行操作系统到复杂数据处理的各种计算任务图形渲染、科学模拟和某些形式的数据分析信号处理和新技术原型设计高端消费电子产品和比特币挖矿资料来源:D-central官网,国盛证券研究所P.5请仔细阅读本报告末页声明片中的特定功能被分割出来,形成了新的芯片但天下芯片,通久必专,专久必通,当矩阵乘法这一固定运算占据了大部分的大模型运设计思路与演化方向。P.6请仔细阅读本报告末页声明图表2:GPU与CPU对比资料来源:英伟达官网,国盛证券研究所生出图像识别、光线追踪、机器视觉等等新功能和与之对应的以“卷积计算”为代表的P.7请仔细阅读本报告末页声明图表3:英伟达GPU架构迭代历程图表4:NVIDIAH100TensorCoreFP8资料来源:英伟达官网,国盛证券研究所P.8请仔细阅读本报告末页声明相对固定的算法,则是ASIC发展的最好土壤。而谷歌TPU,则是率先崭露头角的第一能力的基石。图表5:英伟达A100架构图资料来源:英伟达官网,国盛证券研究所P.9请仔细阅读本报告末页声明图表6:矩阵乘法公式但由于脉动阵列的一些特性,其在拥有优异的“取数能力”时,也不可避免的会出现一些劣势。第一,GPU遇到的数据往往不是连续P.10请仔细阅读本报告末页声明但随着谷歌对于TPU的不断更新,最新版本已经迭代到了TPUV5e,同时持续的软件投HBM,第二则是增加了多卡互联的模块,这一层级的架构,对应上述的原理,主要为了图表7:TPUV1资料来源:Jouppi,NormanP.,etal."In-datacenterperformanceanalysisofatensorprocessingunit.",国盛证券研究所P.11请仔细阅读本报告末页声明图表8:TPUV1-V2资料来源:ThomasNorrie,NishantPatil,DoeHyunYoon,etal."ThedesignprocessforGoogle'strainingchips:TPUv2andTPUv3.",国盛证券研究所TPUV2基本定型了后续的架构,V3、V4图表9:TPUV4资料来源:googlecloud,国盛证券研究所P.12请仔细阅读本报告末页声明图表10:Groq推理效果对比图资料来源:Groq,国盛证券研究所ASIC化的必然结果。我们从Groq芯片的架P.13请仔细阅读本报告末页声明图表11:Groq芯片工作流资料来源:Groq,国盛证券研究所图表12:TSPSuperlane流水线架构资料来源:Groq,国盛证券研究所访问一次先前的Token,降低了数据交互密度,使得无论是访存IO,亦或是网P.14请仔细阅读本报告末页声明也即是矩阵计算核心。这样单次运算能够处理的数据量就更大,是最简单和直接的升级P.15请仔细阅读本报告末页声明ASIC”战场——矿机市场进行复盘,来探寻当下和未来,在大模型向何方。供更加强大的算力。同时,由于币价的不断上涨,矿工开始第一次追求专用芯片挖矿,目前全球比特币计算几乎全部由ASIC提图表13:嘉楠阿瓦隆1366IP.16请仔细阅读本报告末页声明第一,以太坊虽然一开始采用了使用挖矿算力来维持网络稳定的P第三则是以太坊的挖矿算法设计之初,就已经有意识显存读取速度加速提升,英伟达看到了这一点后加速介入了以太坊挖矿市场,这也造就图表14:NVIDIACmpHx专业挖矿专用GPU资料来源:英伟达官网,国盛证券研究所升级始终如一把利剑悬挂在以太坊矿工之上,矿工担心自己的矿机会完全失效,而显卡P.17请仔细阅读本报告末页声明成对于通用芯片的渗透和替换,主要取决于两点,第一,也是最核心的一点,用户的需我们先来看第一点,比特币起步较早,币价涨幅较快,因此涌现海量的用户算力需求,上文提到,客户需求是芯片厂商的第一目标,因此比特币快速完成了对于通用芯片的淘我们再来看第二点,算法的确定性,这里要特别强调,算法的确定性,不是算法的难易度。因为一个算法即使再复杂再艰难,只要保持不变,就一定可以开发出专用的ASIC从而导致开发者、使用者承受极大的损失。是不是业界会更加激进的寻找下一代算法,亦或是老旧的卷积算法重出江湖?这一不确P.18请仔细阅读本报告末页声明个是决定了用户需求,一个是决定了开发成本。实现显卡运算单元和指令的契合是一件更加专业的事,以英伟达为例,英伟达的CUDA图表15:CUDA扩大支持多种算法资料来源:英伟达官网,国盛证券研究所5.1推理时代,更加考验编译器的“流水线”构筑能力构,跳过了小核心,直接将数据存入乘法器中进行运算,因此对于编译器的指令调度能算核和存储的配合,如何保证这些元器件同时稳定运行,保证计算的确定性,这就需要P.19请仔细阅读本报告末页声明图表16:TSPSuperlane位宽资料来源:Groq,国盛证券研究所图表17:Groq的研发历程年份事件2016年GoogleTPU架构师JonathanRoss和TPU团队的其他成员创立了Groq2020年1月发布《GROQROCKSNEURALNETWORKS》2020年7月发布《ThinkFast:ATensorStreamingProcessor(TSP)forAcceleratingDeepLearningWorkloads》2022年6月发布《ASoftware-definedTensorStreamingMultiprocessorforLarge-scaleMachineLearning》2023年8月发布《TheGroqSoftware-definedScale-outTensorStreamingMultiprocessor》2024年2月因为Mistral-MOE7*8B500tokens/s真正火起来资料来源:Groq,国盛证券研究所P.20请仔细阅读本报告末页声明图表18:功能单元支持指令资料来源:Groq,国盛证券研究所件底层通过转译软件将用户的“CUDA指令”转化为自身产品能理解的指令,帮助用户P.21请仔细阅读本报告末页声明算第三极。阅读至此,相信大家对于ASIC在大模型美满电子在近期的FY24Q4电话会议上表示,预计来自云优化芯片(cloudoptimized经开始投身ASIC芯片的星辰大海。同时海拥护这一稳定的格局,换取较为轻松的编程压力,从他们的主观感受上,日常使用的CUDA和英伟达帝国似乎是不可战胜。但是我们也应该看到,也有众多优秀的硬P.22请仔细阅读本报告末页声明图表19:ASIC与通用芯片带动AI螺旋上升资料来源:国盛证券研究所整理P.23请仔细阅读本报告末页声明本。晶圆厂的分配地位有望上升。机芯片的散热性能直接决定了矿机的性价比。矿机使用者目前是全球大规模液冷机房的推荐标的:英维克、中航光电、高澜股份。时,国内芯片有望通过ASIC公司加速形成可用大模型算力,从而带动国内推荐标的:工业富联、高新发展、中科曙光、紫光股份。P.24请仔细阅读本报告末页声明图表20:相关标的代码名称美元)2024年净利润预测(亿元或亿美元)ASIC设计龙头MRVL美满电子646.012.1353.3全球以太网交换机芯片、ASIC设计领先企业AVGO博通5,726.0228.3425.1全球半导体设计龙头企业晶圆厂TSM7,104.0313.7522.4全球半导体Fab龙头INTC英特尔全球最大PC零件及半导体芯片制造商688981中芯国际3,812.167.0256.0国内最大的集成电路制造企业散热厂商002837英维克201.25.2438.4散热系统集成商龙头002179中航光电769.242.32领先的散热系统商300499高澜股份43.724.8领先的散热系统商ASIC芯片公司CAN嘉楠科技3.10.873.6挖矿芯片设计商688256寒武纪812.5//国内算力芯片早期参与者688521芯原股份214.00.53403.8国产通用服务器、协处理器服务器龙头601138工业富联4,968.0259.42服务器代工龙头000628高新发展306.5//子公司华鲲振宇是华为鲲鹏生态合作伙伴603019中科曙光780.124.3932.0领先的服务器代工厂资料来源:Wind,彭博,美满电子官网,福布斯中国,BBCNEWS,昆山发布,中芯国际官网,英维克官网,深圳市电子商会,高澜股份官网,嘉楠科技官网,寒武纪官网,芯原股份官网,中证网,华鲲振宇官方公众号,中科曙光公众号,界面新闻,国盛证券研究所,数据截至2024年3月18日,注:美股市值、净利润单位均为亿美元,其余均为亿人民币;除英维克、嘉楠科技外,美股净利润预测(non-GAAP)均取自彭博一致预期,A股净利润预测均取自Wind归母净利润一致预期P.25请仔细阅读本报告末页声明(1)AI发展不及预期。相关公司业绩成长空间集中于AI相关的算力芯片,若AI发展不及预期,ASICP.26请仔细阅读本报告末页声明免责声明国盛证券有限责任公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。本报告的信息均来源于本公司认为可信的公开资料,但本公司及其研究人员对该等信息的准确性及完整性不作任何保证。本报告中的资料、意见及预测仅反映本公司于发布本报告当日的判断,可能会随时调整。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息及资料保持在最新状态,对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本公司力求报告内容客观、公正,但本报告所载的资料、工具、意见、信息及推测只提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,本公司不就报告中的内容对最终操作建议做出任何担保。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。投资者应注意,在法律许可的情况下,本公司及其本公司的关联机构可能会持有本报告中涉及的公司所发行的证券并进行交易,也可能为这些公司正在提供或争取提供投资银行、财务顾问
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版钢筋工程合同风险管理合同3篇
- 全国赛课一等奖人教版数学六年级上册《分数除法一个数除以分数》课件
- 八年级数学家长会课件
- 体育赛事承办合同协议书范本
- 2024版汽车零部件采购与销售合同2篇
- 资金监管的合同范本2024版
- 2024年度建筑工程渣土绿色运输合同3篇
- 基于2024年度的广告投放合同具体描述3篇
- 河北省劳动合同
- 实习合同范本
- 劳动人事争议典型案例 (第一批 2020)、(第二批 2021)
- 20K607 防排烟及暖通防火设计审查与安装
- 产品设计专业职业规划
- 中国天眼完整版本
- 2024年重庆高职分类考试《电工基础》备考试题库(浓缩300题)
- 生产现场5S管理培训
- 钢结构吊装施工安全控制
- 《股票投资基础》课件
- 郭小川·望星空
- 【海信家居筹资问题与优化策略(开题报告文献综述)5700字】
- 学前教育专业生涯发展报告
评论
0/150
提交评论