版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分析师及联系人SAC:S0490517070012SAC:S0请阅读最后评级说明和重要声明2/37英伟达:软硬件大平台铸造核心壁垒,GPAI扬帆,巨龙展翅——英伟达踏上宏伟 2023/82023/122024/42024/8•《2024Q1半导设备及材料综述:收入端加速增长,景气度持续回暖》2024-05-20•《景气回暖+Chiplet加速应用,封测行业多重β演绎长期成长逻辑》2023-05-27•《AI重构生产力下的电子行业投资机遇分析》2023-03-27行业研究丨深度报告投资评级看好丨维持请阅读最后评级说明和重要声明 7 产品平台化构建竞争壁垒,应用扩张打造增 图1:AI能力出现拐点,从预测推断走向内容生成 7图2:内容创作模式的四个发展阶段 7图3:生成式AI技术的成熟应用进程时间表 7图4:人工智能三要素逐步成熟,推动行业进入爆发期 8图5:全球及我国人工智能市场收支规模及预测(亿美元) 8图6:大模型参数快速提升,对于训练、推理芯片的性能要求越来越高 9图7:B2C\B2B对算力的需求(QFLOPS) 9图8:ScalingLaw尚未见顶,MOE万亿参数大模型是新的热点 9图9:大模型算力需求6个月翻一番的趋势,预计至少持续到2030年 9图10:开发更高性能的AI大模型需要更强的算力平台 10图11:算力底座技术门槛提高,未来训练核心拼集群系统能力 10图12:训练&推理对算力均带来显著需求 10图13:AIGC产业的算力是工程化结果,是从芯片到资源服务的多层次构造 10图14:AI服务器将成为服务器的核心增长点(亿美元) 图15:相比传统服务器,AI服务器整体成本中计算芯片占比更高 图16:四类逻辑芯片特性比较 图17:主要AI芯片的功能特性比较 图18:1983年由TI推出的第一款GPU芯片,用于雅利达游戏机,显存仅为16kb,分辨率为256*192 12图19:目前最先进的游戏显卡英伟达RTX40系列显存达16GB,可实现光线追踪效果 12图20:GPU处理图形主要分为几何阶段和光栅化阶段 12图21:渲染着色需要大量shader串行完成数据处理 12图22:CPU与GPU的结构差异 13图23:核(ire)→线程组(Thread)→线程块(Block)→网格(Grid)的多层级复合堆积结构使得GPU更适合处理简单重复的并行运算 13图24:阿凡达中用光线追踪技术制作的镜头,GPU在图形渲染中的应用范围持续扩大 13图25:以GPU为计算核心的服务器集群已成为AI发展的关键基础 13请阅读最后评级说明和重要声明图26:全球GPU市场规模2027年有望达到1857.5亿美元 14图27:2023年全球GPU下游应用仍以移动设备、PC及工作站为主 14图28:服务器中的GPU市场规模快速扩大(亿美元) 14图29:英伟达在服务器GPU中占据核心份额 14图30:英伟达H100硬件架构示意图,大量CUDACore需要跟片上缓存、管口配合 15图31:2020年以来英伟达CUDA生态持续扩大(百万次) 16图32:英伟达目前仍为桌面级GPU市场的核心龙头,份额持续提升 16图33:英伟达在全球服务器GPU中的市场份额高达95.9% 16图34:英伟达增长趋势(单位:百万美元) 18图35:英伟达应用于AI运算的H100芯片组 19图36:英伟达应用于图形显示的RTX系列产品 19图37:英伟达围绕GPU硬件基础打造了CUDA生态系统 19图38:在CUDA生态系统至上进一步完善了各类场景应用 19图39:AI的核心驱动与英伟达的三重壁垒 20图40:TensorCore的4x4矩阵可大幅提升运算效率 21图41:相比无TensorCore的P100,V100训练效率大幅提升 21图42:Blackwell架构下的GB200GPU集成了2080亿个晶体管 22图43:GB200的整体运算效率远超英伟达前代产品 22图44:NVIDIABLUEFIELD-3DPU:可编程片上数据中心基础设施 23图45:DPU可大幅提升通信吞吐量 23图46:GraceCPU通过NVLink与GPU连接,大幅提升吞吐效率 24图47:使用NVIDIAScalableCoherencyFabric扩展内核和带宽 24图48:英伟达从硬件→软件→应用层的完整结构 25图49:DRAM内存寻址:可以在DRAM的任何区域进行数据读写 26图50:On-chip内存共享:提升数据读写速度 26图51:外部内存读取:线程可以通过不同范围的一组内存空间来访问设备的DRAM和片上存储器 26图52:线程批处理:任务分解 26图53:CUDA-XAI开发套件 27图54:CUDA-XHPC开发套件 27图55:DOCA的软硬件结构 28图56:英伟达AIEnterprise应用体系 28图57:英伟达Omniverse体系 29图58:英伟达整体收入及变化(亿美元) 30图59:英伟达归母净利润变化(亿美元) 30图60:英伟达数据中心收入变化(单位:亿美元) 30图61:英伟达数据中心收入占比变化 30图62:英伟达游戏收入变化(单位:亿美元) 31图63:英伟达游戏收入占比变化 31图64:英伟达专业可视化收入变化(单位:亿美元) 31图65:英伟达专业可视化收入占比变化 31图66:英伟达自动驾驶收入变化(单位:亿美元) 32图67:英伟达自动驾驶收入占比变化 32请阅读最后评级说明和重要声明图68:英伟达盈利能力 32图69:英伟达费用率 32图70:英伟达研发投入(亿美元) 33图71:英伟达存货(亿美元) 33表1:英伟达主要游戏显卡参数 21表2:英伟达主要数据中心显卡参数 22表3:CUDA主要工作模块及原理 25表4:CUDA核心优势 26请阅读最后评级说明和重要声明生成式AI引爆技术奇点,GPU行业迎高增机遇AIGC全称为AI-GeneratedConten资料来源:《迈向智能世界白皮书2023》华为,长江证券研究所资料来源:《AIGC发展趋势报告2023》腾讯研究院,长江证券研究所资料来源:《AIGC发展趋势报告2023》腾讯研究院,长江证券研究所请阅读最后评级说明和重要声明达24.5%,显示出强劲的产业化增长势头250020005000204210178508210216120212022E250020005000204210178508210216120212022E2025E全球中国!!数据AIGC算法算力资料来源:甲子光年,长江证券研究所资料来源:IDCGlobal,IDCChina,上海数字大脑研究院,长江证券研究所到千亿甚至万亿级别,这与应用级别的模型在参数规模上存在指数级的差异。自2022请阅读最后评级说明和重要声明资料来源:英伟达官网,长江证券研究所资料来源:McKinsey,长江证券研究所提升。在参数数量相同的情况下,更深的神经网络模型往往能够展现出更优越的性能。续至2030年。随着模型规模的不断扩大,对算力的需求也在急剧上升,这不仅推动了资料来源:《迈向智能世界白皮书2023》华为,长江证券研究所图9:大模型算力需求6个月翻一番的资料来源:《迈向智能世界白皮书2023》华为,长江证券研究所请阅读最后评级说明和重要声明资料来源:华为,长江证券研究所资料来源:华为,长江证券研究所指利用训练好的模型进行计算,利用输入的数据获得正确结论的过资料来源:甲子光年,长江证券研究所资料来源:甲子光年,长江证券研究所请阅读最后评级说明和重要声明计算芯片在AI服务器中占据了更高的成本比例。与传统服务器相比,AI服务器对计算能力的要求更高,因此对高性能计算芯片的需求也更为迫切。GPU由于其并行处理能力,在加速这些计算密集型任务中发挥着至关重要的作用,800600400200020202021202220232024E2025E2026E2027EAI服务器非AI服务器资料来源:IDC,长江证券研究所60%50%40%30%20%10%0%计算芯片网络芯片HDDSSD&NANDDRAMAI服务器非AI服务器资料来源:IDC,长江证券研究所性能功能效率灵活性延迟CPUGPU性能功能效率灵活性延迟CPUGPUFPGAASICGPUFPGAASIC定制化程度通用型半定制化定制化灵活性好好不好成本高较高低编程语言/架构CUDA、OpenCL等Verilog/VHDL等硬件描述语言,OpenCL、HLS/功耗大较大小主要优点峰值计算能力强、产品成熟平均性能较高、功耗较低、灵活性强平均性能很强,功耗很低、体积小主要缺点效率不高、不可编辑、功耗高量产单价高、峰值计算能力较强、编程语言难度大前期投入成本高、不可编辑、研发时间长、技术风险大主要应用场景云端训练、云端推断云端推理、终端推断云端训练、云端推断、终端推断代表企业芯片英伟达Tesla、高通Adreno等XilinxVersal、英特尔Arria等谷歌TPU、寒武纪Cambricon等资料来源:与非网,长江证券研究所资料来源:赛迪智库,长江证券研究所请阅读最后评级说明和重要声明GPU:并行运算效率领先,诞自游戏而盛于AI但随着计算需求的增加,GPU逐渐成为专门处理图形渲染的硬件。在作为图形显示芯资料来源:MSX,长江证券研究所资料来源:英伟达官网,长江证券研究所资料来源:CSDN,长江证券研究所资料来源:CSDN,长江证券研究所请阅读最后评级说明和重要声明资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所速图形渲染向电影、电视、医疗影像等领域扩扩展,人工智能、机器学习、科学计算、加密货币挖矿、数据中心和云计算、自动驾驶和机器人等领域也进入百花齐放的阶段,资料来源:Broadgeek,长江证券研究所资料来源:英伟达官网,长江证券研究所年进一步增长至584.1亿美元,这一上升趋势预计将持续至2027年,届时市场规模有请阅读最后评级说明和重要声明卓越的并行处理能力而成为这些应用的理想选择,服务器市2000800600400200035%35%34%34%33%33%32%32%31%31%30%202220232024E2025E2026E2027E全球GPU市场规模(亿美元)YoY(右轴)资料来源:Technavio,长江证券研究所n移动设备PCn移动设备PC及工作站游戏机w服务器w其他应用资料来源:MordorIntelligence,长江证券研究所中占据核心份额。凭借其强大的产品性能、广泛的软件生态系统以及持续的技术创新,900800700600500400300200020202021202220232024E2025E2026E2027E2028E服务器中的GPU市场规模资料来源:IDC,长江证券研究所402002020Q12020Q22020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q42022Q12022Q22022Q32022Q42023Q12023Q22023Q32023Q4英伟达AMD&Intel资料来源:IDC,长江证券研究所请阅读最后评级说明和重要声明半导体制造技术不易获得,需要与顶级的代工厂建立合作关系。这些壁垒共同维护了持并行处理和高吞吐量计算,这要求精细的工程设计来平衡性能和功耗。设计者必须精通复杂的计算图形学和并行计算理论,确保GPU能够有效地执行图形渲以适应从移动设备到超级计算机的不同应用场景。散热管理也是设计中的一个挑要不断创新以支持新兴技术,如光线追踪、AI资料来源:英伟达官网,长江证券研究所能够充分利用GPU硬件性能的开发环境。这需要提供强大的编程模型、丰富的必须支持多平台、多语言和多种计算框架。此外,构建一个充满活力的开发者社请阅读最后评级说明和重要声明6050403020020202023nCUDA下载量资料来源:英伟达官网,长江证券研究所英伟达的成功不仅源于其在GPU硬件架构上的技84%84%80%88%资料来源:JPR,长江证券研究所n英伟达英特尔AMD资料来源:IDC,长江证券研究所请阅读最后评级说明和重要声明AI扬帆,巨龙展翅——英伟达踏上宏伟航路请阅读最后评级说明和重要声明第一阶段16nm12nm716nm12nm7nm第二阶段4nm汽车芯片4nm汽车芯片Thor2000TOPS第三阶段3/2nm泛AI3/2nm28nm均以AI为内核数据中心元宇宙自动驾驶数字孪生70,00060,00050,00040,00030,00020,00010,0000汽车芯片Orin汽车芯片VoltaXavier30TOPSGraceCPU汽车芯片VoltaXavier30TOPSGraceCPUBlueField3DPUBlackwell计算卡B100/B200Hopper计算卡H10060TFLOPSVoltaAmpere计算卡A10019.5TFLOPSPascall计算卡P100HBM2RTX20系列推出光追技术PascallGTX10系列BlueField2BlueField3DPUBlackwell计算卡B100/B200Hopper计算卡H10060TFLOPSVoltaAmpere计算卡A10019.5TFLOPSPascall计算卡P100HBM2RTX20系列推出光追技术PascallGTX10系列BlueField2DPU汽车芯片Parker汽车芯片TegraX1计算卡V10016.4TFLOPSAdaLovelaceRTX40系列TurningAmpereRTX30系列MaxcellGTX900系列FY2014FY2015FY2016FYFY2014FY2015FY2016FY2017FY2018FY2019FY2020FY2021FY2022FY2023FY2024140%120%100%80%60%40%20%0%-20%数据中心游戏专业设计与可视化解决方案OEM&IP汽车总收入YoY(右轴)资料来源:Anandtech,英伟达官网,Thinkcomputers,快科技,长江证券研究所(注:算力大小均取系列产品中单精度计算性能的较大值)三重壁垒联动+螺旋提升打造AI全栈体系,系请阅读最后评级说明和重要声明资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所软件:在软件方面,英伟达提供了CUDA限,以推动自动驾驶汽车的发展。量子计算生态系统则与多家合作伙伴建立了合资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所动了人工智能、自动驾驶汽车、量子计算等多个领域的请阅读最后评级说明和重要声明视频流、社交媒体……数据持续高增,算力需求远超现存多芯配合算力迭代突破硬件摩尔定律限制数据三芯战略多芯互联瓶颈打开算力上限硬件层互联网络AI发展关键瓶颈算力、功耗、体积与成本以及如何发挥软硬件强耦合充分发挥硬件优势AI芯片应用软件软件层下沉应用层提供更完整解决方案行业应用软件从消费到数据基建再到AI完整领域视频流、社交媒体……数据持续高增,算力需求远超现存多芯配合算力迭代突破硬件摩尔定律限制数据三芯战略多芯互联瓶颈打开算力上限硬件层互联网络AI发展关键瓶颈算力、功耗、体积与成本以及如何发挥软硬件强耦合充分发挥硬件优势AI芯片应用软件软件层下沉应用层提供更完整解决方案行业应用软件从消费到数据基建再到AI完整领域GPUGPUDPUCPUDOCAOmniverseDOCAOmniverseNVlinkConnectXCUDAAIEnterprise游戏应用层数据中心自动驾驶算法经历超半世纪发展主流模型逐步成熟专业视觉游戏应用层数据中心自动驾驶算法经历超半世纪发展主流模型逐步成熟专业视觉生产力数字孪生数字孪生元宇宙元宇宙社会效益资料来源:长江证券研究所AI服务器的首选加速方案。超算中心的市场份额超过70%,AI加速卡的市场份额请阅读最后评级说明和重要声明推出时间202220202018Ampere------成---D-1标准显存配置资料来源:英伟达官网,Techhpowerup,长江证券研究所资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所请阅读最后评级说明和重要声明2022年,英伟达推出Hopper架构,其代表了NV运算而设计,能够显著提升深度学习训练和推理的性能;Hopper架构还实现了与推出时间20162017架构Pascal双精度(TFLOPS)5.37.8显存带宽(GB/s)732互联方式NVLink/PCIe3.0互联带宽最大功耗300W资料来源:英伟达官网,长江证券研究所Blackwell架构的优势在于其强大的并行处理能资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所请阅读最后评级说明和重要声明数据中心中网络、存储和安全等基础设施任务的高效处理。此外,DPU支持先进的RDMA技术,提供低延迟和高吞吐量的网络性能,并通过集成的AI和机器学习加速器资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所ARM是全球领先的半导体知识产权(IP)提供商,其架构广泛应用于移在能效和设计灵活性方面的优势,以及英伟达在GPU和AI技术上的领先地位,共同开发新一代计算平台。然而,这笔交易面临了全球反垄断监管机构的严格审延迟的计算性能。GraceCPU与英伟达的HopperGPU系列相结合,可以构成请阅读最后评级说明和重要声明模型,特别适合于需要处理大量并行任务的高性能计算资料来源:CSDN,长江证券研究所资料来源:CSDN,长江证券研究所英伟达的软件体系可以分为基础架构层和应用工具层,其中基础架构层主要是CU请阅读最后评级说明和重要声明资料来源:英伟达官网,长江证券研究所资料来源:CSDN,长江证券研究所请阅读最后评级说明和重要声明 优势CUDA能够显著提升计算性能,特别适用于需要大量数CUDA提供了类似于C语言的编程接口CUDA提供了包括性能分析工具、调试器以及样例代码资料来源:CSDN,长江证券研究所资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所的一种API)、满足不同领域开发者编请阅读最后评级说明和重要声明集(GDB、Nsight.Memcheck等)、第三方工具和软件库(和用资料来源:英伟达官网,长江证券研究所资料来源:英伟达官网,长江证券研究所能够满足企业对性能、安全性、可管理等越来越高的需求,英伟达DOCA是专为请阅读最后评级说明和重要声明资料来源:英伟达官网,长江证券研究所Enterprise是一套端到端的云开发时间从80周缩短到仅8周,并允许客户在VMwarevSphere上部署和管理高资料来源:英伟达官网,长江证券研究所请阅读最后评级说明和重要声明资料来源:英伟达官网,长江证券研究所英伟达2025财年第一季度实现了显著的增长,期间单季度收入达到了260.44亿美请阅读最后评级说明和重要声明300250200500Q4Q42015Q22016Q42016Q22017Q42017Q22018Q42018Q22019Q42019Q22020Q42020Q22021Q42021Q22022Q42022Q22023Q42023Q22024Q42024300%250%200%150%100%50%0%-50%主营业务收入YoY(右轴)QoQ(右轴)资料来源:Bloomberg,长江证券研究所80402001400%1200%1000%800%600%400%200%0%-200%-400%Q1Q12016Q32016Q12017Q32017Q12018Q32018Q12019Q32019Q12020Q32020Q12021Q32021Q12022Q32022Q12023Q32023Q12024Q32024Q12025GAAP净利润YoY(右轴)QoQ(右轴)资料来源:Bloomberg,长江证券研究所领域,英伟达的业务收入在2024财年达到了增长426.7%,显示出英伟达在数据中心领域的强劲动力和250200500450%400%350%300%250%200%150%100%50%0%-50%1Q151Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25数据中心YoY(右轴)资料来源:Bloomberg,长江证券研究所1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25100%90%80%70%1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25资料来源:Bloomberg,长江证券研究所请阅读最后评级说明和重要声明403530252050120%100%80%60%40%20%0%-20%-40%-60%1Q151Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25游戏YoY(右轴)资料来源:Bloomberg,长江证券研究所1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q2570%60%50%40%1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25资料来源:Bloomberg,长江证券研究所765432101Q153Q151Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25200%150%100%50%0%-50%-100%专业可视化YoY(右轴)资料来源:Bloomberg,长江证券研究所1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q2520%1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25资料来源:Bloomberg,长江证券研究所提供了强大的计算能力。根据英伟达2025财年第一季度的请阅读最后评级说明和重要声明3.5 2.5 1.5 0.501Q153Q151Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25150%100%50%0%-50%-100%mm自动驾驶oYoY(右轴)资料来源:Bloomberg,长江证券研究所1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q259%8%7%6%5%4%3%1Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q221Q233Q231Q243Q241Q25资料来源:Bloomberg,长江证券研究所季度环比增长1.99pct,这一显著的增长反映了公司在高利润的数据中心80.0%70.0%60.0%50.0%40.0%30.0%20.0%10.0%0.0%3Q153Q153Q163Q173Q183Q193Q203Q213Q223Q233Q24毛
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- VIP包厢接待服务流程
- 《公司治理结构》课件
- 奥尔夫音乐教师培训教案
- 《光学课件全集》课件
- 《电弧及电路》课件
- 小学三年级数学两位数乘两位数笔算同步练习试题
- 《组培应用》课件
- 《儿童重症感染》课件
- 福建省福州市连江第五中学2020-2021学年高一下学期第一次质量检测化学试题
- 学校防拐骗安全教育
- 学术交流英语(学术写作)智慧树知到期末考试答案章节答案2024年哈尔滨工程大学
- 中国移动社会渠道管理工作指导意见
- 关于低压电工安全培训课件
- 新译林版英语六年级上册适当形式填空
- 《河北省预防接种异常反应保险补偿工作方案(试行)》
- 温州医科大学眼视光医学专业五年制人才培养方案
- 2023-2024学年高一下学期期中考试家长会课件
- 集团公司工会换届选举大会上发言稿
- 高考物理实验:用双缝干涉测量光的波长试题经典
- 人力资源管理案例分析-蒙牛
- 甲醇制烯烃催化剂SAPO34分子筛的合成与改性
评论
0/150
提交评论