信息技术-AIGC行业深度报告(14):从英伟达到华为零部件迎来大机遇_第1页
信息技术-AIGC行业深度报告(14):从英伟达到华为零部件迎来大机遇_第2页
信息技术-AIGC行业深度报告(14):从英伟达到华为零部件迎来大机遇_第3页
信息技术-AIGC行业深度报告(14):从英伟达到华为零部件迎来大机遇_第4页
信息技术-AIGC行业深度报告(14):从英伟达到华为零部件迎来大机遇_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从英伟达到华为,零部件迎来大机遇点。过去英伟达平均两年架构升级,目的是维持在GPU霸主地位。如今,英伟达GPU架构疯狂加速,黄仁勋宣布下一代AI芯片为Robin架构,以一年为节奏更新产品,用统一架构覆盖整个数据中心产品线,具体来看,2024年,Blackwell芯片现已开始生产;2025年,将推出升,高功耗电源价值凸显,台达电为英伟达电源的供应商,年初至今涨幅超10%;GB200芯片模组功耗已超风冷极限,液冷已经从“选配”思昇腾AI芯片,构建算力的第二极,参数方面,我们认为昇腾910芯片单卡算力已经可以与英伟达A100相媲美。根据集成电路IC消息,华为昇腾910C芯片正处于紧张的测试阶段。910C预计在今年第四季度推出样机,而到2025年第一季度将实现量产。Atlas打开国产算力集群想象投资建议:英伟达打响算力架构升级战,零部件升级为最大亮点。此外,在AI+信创大背景下,华为已经推出国产算力集群Atlas解决方案,相关供应链国产化为大势所趋,同时看好910C带来的相关增量。受益标的为:全球算力产业链美股:英伟达、超微电脑、戴尔科技、惠普、安费诺、维谛技术等;全球算力产业链A股:工业富联、浪潮信息、紫光股份、沃尔核材、麦格米特、淳中科技等;国产服务器相关产业链:神州数码、拓维信息、中国长城、高新发展、大华股份等;国产连接器相关产业链:华丰科技等;国产电源相关产业链:泰嘉股份等;国产液冷模块产业链:飞荣达等;国产液冷解决方案产业链:英维克、申菱环境等;国产PCB产业链:景旺电子、胜宏科技等;其他:强瑞技术、恒u风险提示:核心技术水平升级不及预期的风201英伟达GB200零部件升级为最大亮点02华为910C敬请期待,Atlas打开国产算力想象空间03投资建议:梳理AIGC相关受益厂商04风险提示 美元的预期。创历史新高。原因是数据中心推动的快速成长,数据中心推动英伟达成长,该业务第一季度营收达226亿美元,强于分析为38.5亿美元,下一季度指引为51-55亿美元收入,原因是AI的强势需求。此外,公司在业绩会上透露,公司Blackwell架构已经全面投入生产,公司预计第二季度开始供货,第三季度加速,客户数据中心在第四季度建立。我们判断Blackwell出货时间超出市场预期。资料来源:Bloomberg,Wind,华西证券研究所间发布8款芯片架构,我们判断芯片架构的持续升级有望维护其在GPU市场的龙头e可用于内部培训和推理,还供苹果、Anthro们判断英伟达架构升级明显处于加速状态。资料来源:CSDN,财联社,SemiAnalysis,华西证券研究所一年节奏、技术限制、一个架构的路线,即坚持运用当时性能最强的半导体制程工艺,以一年为节奏更新产品,用统一架构覆盖整个数据中心产品线,具体来看,2024年,Blackwell芯片现已开始生产;2025年,将推出BlackwellUltra产品;2026年,将推出Rubin产资料来源:52RD,华西证券研究所CoWos产能持乐观态度,我们判断CoWos产能的乐观,为英伟达的产品的及这一领域也为台积电主要收入贡献来源。u台积电或将提高英伟达代工价格:根据电子技术应用消息的价格,我们判断其背后的本质在于英伟达Blackwell的生产与新高0资料来源:芯智讯,台积电官网,电子技术应用,华西证券研究所大会上,基于Blackwell的AI算力将以名为DGXGB200第五代NVLink连接成一台超级计算),其零部件价值量占比有望提升,其重点在于CPU、铜连接、液冷模组、电源板块。硬盘NAND0.17%uGraceCPU为下一代数据中心的引擎:NVIDIAGraGPU的龙头企业为英伟达,而如今芯片厂商已经逐步补强自身“短板”,其目的在于维持自身在应用场景中的龙头地身的GraceCPU,亦或者是Intel发布自身酷睿UltraAIPC处理器,此款处理器为集中式显卡,此显卡集成了CPU、G资料来源:21经济时代网,CSDN,华西证券研究所uGB200发布,铜互联为最大增量之一:根据GTC大会,GPU的系统中创建高速100G-400G链路的成本最低的方式。亮点在于成本、功耗、延迟都极低。其端口速度可达到400Gb/s。有源光缆(AOC)由两端带有光收发器的多模光纤电缆组成。它依回电信号。从广义上讲,AOC电缆主要用于连接位于数据中心内单独机架中的交换机、服务器和存储设备。由于AOC本身信号的转换,因此其成本和功耗显著大于DAC多uH100系列中铜互联方式较少:我们判断,由于H100没有机柜内互联,而实单独配置网络机负责链接机柜与机柜之间,而内部线缆连接方式呈现多样化。u安费诺为全球TOP2连接器制造商:公司成立于1造商,覆盖通讯、汽车、消费电子等多个板块,2的重要合作伙伴,我们能够为Blackwell加安费诺(AMPHENOL)23-0623-0723-0823-09资料来源:英伟达官网,华西证券研究所uAI芯片架构升级速度明显加快,高算力与高功耗相匹配:复架构英伟达Volta架构英伟达Turing架构英伟达Ampere架构型号V100V100sT4A100A800规格PCIeSXM2PCIePCIeSXMPCIePCIeSXM芯片架构NVIDIAVoltaNVIDIAVoltaNVIDIAVoltaNVIDIATuringNVIDIAAmpereNVIDIAAmpereNVIDIAAmpereNVIDIAAmpereNVIDIAAmpere显存32GB或16GBHBM232GB或16GBHBM232GBHBM216GBGDDR680GBHBM2e80GBHBM2e40GBHBM280GBHBM2e80GBHBM2e显存带宽900GB/s900GB/s1134GB/s320GB/S1935GB/s2039GB/s1555GB/s1935GB/s2039GB/sFP64算力7TFLOPS7.8TFLOPS8.2TFLOPS254.4GFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPSFP64TensorCore19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力14TFLOPS15.7TFLOPS16.4TFLOPS8.1TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力(Tensor)TensorFloat32(TF32)156TFLOPS156TFLOPS156TFLOPS156TFLOPS156TFLOPSTF32(TensorCore)312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSFP16算力(TensorCore)112TFLOPS125TFLOPS130TFLOPS65TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSBFLOAT16(TensorCore)312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSFP8(TensorCore)-----INT8算力(TensorCore)130TOPS624TOPS624TOPS624TOPS624TOPS624TOPSCUDA核心数量5120256069126912TensorCores核心数量640320432432功耗250瓦300瓦250瓦70瓦300瓦400瓦250瓦300瓦400瓦晶管数量(亿)211542542制成(nm)12nm12nm7nm7nm互联速度32GB/s300GB/s32GB/s32GB/SNVLink:600GB/sPCIe4.0:64GB/sNVLink:600GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/s资料来源:英伟达官网,华西证券研究所uAI芯片架构升级速度明显加快,高算力与高功耗相匹配:从)资料来源:FS社区,半导体行业研究,京东,华西证券研究所因此我们假设巅峰功耗系数=10200/(700u从英伟达GB200NVL72示意图所示,包含6个电源架:根据半导体行业观察资料,可以清晰的看到,GB20其中三个位于机架顶部,三个位于底部,其中上层电源组包含6个电源模块。根据已知资料,我们大致可以推算出每个电源模块的功耗,u高功率电源价值凸显:根据京东数据,浪潮服务器电源M63000W的价格为3899元,M55u台达电为全球提供电源管理与散热解决方案:公司成立与1971年者,深耕“电源及元器件”、“交通”、“自动化”与“基础设施”四大事业范畴。公司计算能力的普遍需求开启了加速性能的新时代。通过我们先进的冷却和电源系统,台达开发了创新的解决方案,Blackwell平台以峰值性能运行,同时保持能源和热效率。”台达电23-0623-0723-0823-0923-10资料来源:台达电子官网,Wind,华西证券研究所资料来源:英伟达官网,华西证券研究所uAI芯片架构升级速度明显加快,高算力与高功耗相匹配:复架构英伟达Volta架构英伟达Turing架构英伟达Ampere架构型号V100V100sT4A100A800规格PCIeSXM2PCIePCIeSXMPCIePCIeSXM芯片架构NVIDIAVoltaNVIDIAVoltaNVIDIAVoltaNVIDIATuringNVIDIAAmpereNVIDIAAmpereNVIDIAAmpereNVIDIAAmpereNVIDIAAmpere显存32GB或16GBHBM232GB或16GBHBM232GBHBM216GBGDDR680GBHBM2e80GBHBM2e40GBHBM280GBHBM2e80GBHBM2e显存带宽900GB/s900GB/s1134GB/s320GB/S1935GB/s2039GB/s1555GB/s1935GB/s2039GB/sFP64算力7TFLOPS7.8TFLOPS8.2TFLOPS254.4GFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPSFP64TensorCore19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力14TFLOPS15.7TFLOPS16.4TFLOPS8.1TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力(Tensor)TensorFloat32(TF32)156TFLOPS156TFLOPS156TFLOPS156TFLOPS156TFLOPSTF32(TensorCore)312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSFP16算力(TensorCore)112TFLOPS125TFLOPS130TFLOPS65TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSBFLOAT16(TensorCore)312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSFP8(TensorCore)-----INT8算力(TensorCore)130TOPS624TOPS624TOPS624TOPS624TOPS624TOPSCUDA核心数量5120256069126912TensorCores核心数量640320432432功耗250瓦300瓦250瓦70瓦300瓦400瓦250瓦300瓦400瓦晶管数量(亿)211542542制成(nm)12nm12nm7nm7nm互联速度32GB/s300GB/s32GB/s32GB/SNVLink:600GB/sPCIe4.0:64GB/sNVLink:600GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/s资料来源:英伟达官网,华西证券研究所)GB200NVL72只有液冷散热单一解决方案;如下图所示,根据鸿海科技官网消息,鸿海科技在GTC大会商柜,上面的冷板和分歧管为明显增量。同时,根据GTC大会上,英伟达展示的NVSwitc资料来源:企商在线,鸿海科技官网,COOL3C,华西证券研究所u单相液冷的核心在于冷却液没发生相态的变化:制冷过程:CDU的循环泵推动二次侧的冷却液从IT设备的底部进入,在流过竖直放置于浸个冷却过程。u两相液冷的核心在于二次侧冷却液在热量传递过程中发生相态转内循环,且浸没腔体内部形成了液态和气态两个区域:顶部为气态区,底部为液态区。当冷却液吸收了设备产生的热量后沸腾并转化为高温气态。这些气态冷却液的密度较低,会逐渐上升到浸没腔体的顶部,在那里与顶部的冷凝器进行热交换并冷凝成低温资料来源:中兴通讯,华西证券研究所负载不断增长,可靠的热管理对于处理密集型AI计算至关重要——我们一路与NVIDIA同行。”奇鋐科技散热方案示意图奇鋐科技华为910C敬请期待,资料来源:澎湃新闻,华西证券研究所2.1.1美国连续发动对我国高科技行业制裁受联邦奖励资金的企业,在中国扩建或新建先进半导体的新产能;同年10月,美国政府进一步紧缩半导体产品对华出口的政策,主要包括限制英伟达、AMD等公司向中国出售高算力人工智能芯片;限制应用材料、泛林、科磊等美国设备厂商向任何中国公司出售半导体设备;将31家中国公司、研究机构及其他团体列入所谓“未经核实的名单”(UVL清单限制它们获得某些受监管的美国半导体技术能力。口中国,目的是瞄准国内先进计算进行遏制,影响国内人工智能领域发展。美国商务部发布涉及人工智能和机器学习技术、先进计算技术、数“布拉格5G安全大会”召开:联合发布了“布拉格提案”,该美国商务部更新《出口管制条例》,将“用于自动分),成威胁的特定国家扩建或新建某些先进半导体的新产能,期限为10年,违美国两大芯片制造巨头英伟达(NVIDIA)与AMD同时发布公告,声称均已接到美国拜登政府下达的最新命令,要求停止向中国uu根据新浪新闻的消息,拜登政府计划阻止英伟达等出口高性能AI芯片:拜登政府2023年10月17日更新了针对人工智能(AI)芯片的出口管制规定,计划阻止英伟达等公司向中国出口先进的AI芯片。根据最新的规则,英伟达包括A800和这些限制还将影响AMD和英特尔等公司向中国销售的芯片,包括应用材料公司、泛林集团和KLA等芯片设备厂商也受牵连。这是由于新措施扩大了向中国以外的40多个国家出口先进芯片的许可要求,并对中国以外的21个国家提出了芯片制造工具的许可要求,扩大了禁止进入这些国家的设备清单。此外,新措施还旨在防止企业通过Chiplet的芯片堆叠技术绕过芯片限制。割版”的A800和H800就是为了符合规定。英特尔同样也针对中国市场,推出第二,根据21世纪经济网报道,第二个规则是关于扩大半导体制造设备的出口管控,包括强化对美国人才的限制,还增加了需要申请半导体制造设备许可证的国家数量,从中国扩大到美国能够长臂管辖到的21个国家。第三个规则是把更多公司列入到“实体清单”,增加了两家中国实体及其子公可。被新列入“实体清单”的13家中国企业名单如右图所示,主要包括壁仞科资料来源:21世纪经济网,新浪官网,华西证券研究所基于昇腾系列AI处理器和基础软件构建Atlas人工智能计算解决方案,包括Atlas系列模块、板卡、小站、服务器、集群等丰富的产品形NVIDIA安培GPU架构资料来源:昇腾官网,英伟达官网,英伟达安培架构白皮书,华为云公众号,华西证券研究所执行流水线,在系统软件的统一调度下互相配合达到优化的计算效率,AICore中的矩阵计算单元目算;向量计算单元目前可以支持FP16和FP32的计算。我们认为本质上讲昇腾芯片属于专为AI而生的特定域架构芯片。u存储转换单元(MTE)是达芬奇架构的特色:比如通用GPU要通过矩阵计算来实现卷积,首先要通过Im2Col的方法把输入的网络和特征单个AI处理器提供3条HCCS互连链路u我们认为AI大算力集群背景下,单张AI芯片无法完成训练任务,需要联合以实现卡间高速互联,相较于PCIE模式推出样机,而到2025年第一季度将实现量产。华为昇腾910C芯片作为新一代算力核心,其价值量接近前款昇腾910B芯片的1.5倍。在搭载昇腾910C芯片的服务器中,单台服务器的整体价值将得到大幅提升。此外,我们判断,在国产化大背景下,昇腾910C相关供应链u华为发布全新架构AI集群,支持超万亿参数大模型训练:在华为全联接大会网络即可实现2250节点(等效于1.8万张卡)超大规模无收敛集群组网。其优势显著,新集群同时使用了创新的超节点架构,大大了大模型训练能力实现算力的资源统一调度03投资建议:梳理国产AIGC相关受益厂商4.1投资建议:梳理国产AIGC的受益厂商AI+信创大背景下,华为已经推出国产算力集群Atlas解决方案,相关供应链国产化为大势所趋,同时看好910C带来的相关增量。受益标的为:全球算力产业链美股:英伟达、超微电脑、戴尔科技、惠普、安费诺、维谛技术等;全球算力产业链A股:工业富联、浪潮信息、紫光股份、沃尔核材、麦格米特、淳中科技等;国产服务器相关产业链:神州数码、拓维信息、中国长城、高新发展、大华股份等;国产连接器相关产业链:华丰科技等;国产电源相关产业链:泰嘉股份等;国产液冷模块产业链:飞荣达等;国产液冷解决方案产业链:英维克、申菱环境等;国产PCB产业链:景旺电子、胜宏科技等;其他:强瑞技术、恒为科技等;资料来源:WIND,华西证券研究所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论