GPU行业深度报告:AI与自动驾驶打造GPU强力增长引擎_第1页
GPU行业深度报告:AI与自动驾驶打造GPU强力增长引擎_第2页
GPU行业深度报告:AI与自动驾驶打造GPU强力增长引擎_第3页
GPU行业深度报告:AI与自动驾驶打造GPU强力增长引擎_第4页
GPU行业深度报告:AI与自动驾驶打造GPU强力增长引擎_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正文目录TOC\o"1-2"\h\z\u一、 数字经济、AI、智能驾驶视角下看算力需求 5演变趋势:从通用计算到智能计算,从分散独立到云网边协同 5战略地位:算力属于基础设施建设,是智能时代发展的物理承载 6应用驱动:数字经济搭建整体框架,AI大模型、智能驾驶持续拉升 7优化路径:提升芯片性能及创新存算架构是研究主流 10二、 算力需求视角下看GPU发展的必然趋势 12性能:GPU技术发展迅速,高并发计算能力契合算力需求 12灵活性:GPU可编程优势明显,通用灵活性适配AI应用端拓展 15三、 GPU市场:供给推动市场,技术及产能是核心驱动力 18需求端:移动端兜底,自动驾驶及数据中心建设贡献增量 18供给端:英伟达独占鳌头,国内技术追赶空间广阔 24GPU产业链概况及国内重点公司介绍 31风险提示 35图表目录图1:算力建设已成为经济发展的重要竞争策略 5图2:各类高性能计算、智能计算可以通过云边端架构形成算力网络 6图3:人工智能三要素为算法、算力、数据 6图4:算力发展的核心要素、产品及应用 6图5:全球数据产生量高速增长 7图6:全球算力规模将高速增长 7图7:2017-2023年中国数字经济规模变化 8图8:我国在用数据中心机架规模保持增长 8图9:AI大模型尺寸快速增长 9图10:大模型时代的GPU算力快速增长 9图11:智能驾驶车辆的渗透率 10图12:L5智能驾驶算力需求超1000TOPS 10图13:我国智能驾驶市场算力需求测算 10图14:算力性能主要受处理器性能及数据传输制约 11图15:2016-2018年,CPU性能每年提升仅3.5 12图16:CPU架构 13图17:GPU架构拥有更多的逻辑核心 13图18:第一款以GPU命名的芯片GEFORCE256 14图19:GPU经典工作流程 14图20:V100混合精度运算速度提高了9倍 15图21:英伟达第四代FP8TENSORCORE 15图22:常用的主流计算平台灵活性及性能的比较 16图23:芯片研发成本 17图24:不同部署位置的AI芯片要求 17图25:英伟达CUDA-XAI生态支持多种框架、云计算服务、部署 18图26:GPU市场下游需求 19图27:PC市场处于下行周期(含平板) 19图28:PC端桌面显卡出销量及同比 19图29:全球移动游戏市场占比增加(十亿美元) 20图30:基于终端感知的混合AI 21图31:部分AI模型可从云端分流到终端 21图32:车载芯片的演变 21图33:中央计算平台须采用高算力芯片以进行整车功能、算力/存储等资源部署 22图34:2025年芯片平均算力将超2000TOPS 23图35:2025年全球高性能计算市场规模达199亿美元 23图36:TOP500超算中心56算力由GPU提供 23图37:AI服务器对于GPU需求更高 24图38:2025年全球AI服务器市场规模激增至1350亿美元 24图39:全球GPU市场格局变化 25图40:国内部分GPU厂商市场布局 25图41:英伟达游戏产品矩阵 25图42:英伟达游戏业务营收增长 26图43:2023Q2全球PC显卡市场份额 26图44:英伟达数据中心产品矩阵 27图45:英伟达第四代NVLINK能为H100提升1.5倍带宽 28图46:英伟达数据中心业务营收增长 29图47:高性能计算芯片下游需求 29图48:英伟达自动驾驶产品矩阵 30图49:英伟达THOR芯片计算性能提升 30图50:英伟达智能驾驶业务营收增长 31图51:2023年度H1中国市场乘用车自动驾驶计算方案市场份额 31图52:GPU产业中下游分别为芯片设计、制造、封装与测试 32图53:公司营收及同比增速 33图54:公司归母净利润及同比增速 33图55:公司营收及同比增速 34图56:公司归母净利润及同比增速 34表格1:我国出台多项算力建设政策支持数字经济发展 8表格2:不同语言模型的算力需求及参数数量 9表格3:英伟达GPU架构调整演进方向 14表格4:GPU、DSA、ASIC比较(以CPU为基准) 17表格5:SOC推动高性能GPU移动端应用 20表格6:目前主流的车规级芯片架构 23表格7:游戏产品增强技术 25表格8:国内厂商桌面级显卡产品参数对比 26表格9:英伟达H100产品技术 27表格10:国内厂商高性能计算GPU产品参数对比 28表格11:国内部分车型搭载芯片型号 30表格12:国内重点GPU公司及技术 32表格13:景嘉微定向增发拟建设项目 33表格14:相关公司可比估值 34一、数字经济、AI、智能驾驶视角下看算力需求演变趋势:从通用计算到智能计算,从分散独立到云网边协同1964年戈登CPU的竞争焦点。图1:算力建设已成为经济发展的重要竞争策略资料来源:数字电子技术,资源服务可以分为云计算、混合计算及算力网络。科学、工程计算。这类计算主要利用超级计算机实现并行计算,是一种算法优化和支持人工智能、智慧城市等新兴领域。AI领域模型训练WorldWide万维网任务的分解及高效调度。图2:各类高性能计算、智能计算可以通过云边端架构形成算力网络资料来源:华为官网,金融界,战略地位:算力属于基础设施建设,是智能时代发展的物理承载整体架构层面,算法、算力及数据是实现人工智能的三要素,其中算力是构筑智能时代的物理基础。人工智能离不开算力、算法及数据,其发展需要在建立在庞大的数据集、优秀的深度学习算法及强大的计算能力基础之上,而算力作为底层基础设施,是开启智能时代的关键因素,其核心于智能芯片的技术进步。图3:人工智能三要素为算法、算力、数据图4:算力发展的核心要素、产品及应用资料来源:中国科普网, 资料来源:中国电子商会,算力荒”IDC显示,2018201933ZB、41ZB2020年全球数据60ZB46%求宏观算力快速发展,NTCysd2021-202840%的速度增长,20287510EFlops。图5:全球数据产生量高速增长 图6:全球算力规模将高速增长0

全球数据量变化趋势(ZB,左轴同比增长(,右轴)2015201620172018201920202025E

100%80%60%40%20%0%

0

全球算力规模(Eflops,左轴同比增速(,右轴)2023E2024E2025E2026E2027E2028E

60%50%40%30%20%10%0%资料来源:IDC, 资料来源:NTCysd,应用驱动:数字经济搭建整体框架,AIAI率先落地,成为拉动算力需求的核心驱动力。全球正加快数字经济建设,算力发展成为主要战略竞争点之一。目前,全球正处于经济数字化转型阶段GDP的核心战略,具体数据来看,202047个国家数字经济增32.6GDP43.7%3%2022国数字经济规模已达50.2亿元,数字基础设施规模能级大幅提升,在用数据中心算例总规模超180EFlops,位居世界第二。图7:2017-2023年中国数字经济规模变化 图8:我国在用数据中心机架规模保持增长市场规模(万亿元,左轴同比增长(,右轴)60504030201002017201820192020202120222023E

20%16%12%8%4%0%

0

数量(万架,左轴)同比增长(,右轴201720182019202020212022

50%40%30%20%10%0%资料来源:中国信通院,国家网信办《数字中国发展报告(2022年)》,中商产业研究院,

资料来源:工信部,表格1:我国出台多项算力建设政策支持数字经济发展时间 文件 算力建设内容时间 文件 算力建设内容2021.05

新体系算力枢纽实施方案》

量供给、数据高效率流通的大数据发展高地。2021.072021.112021.122021.12

划(2021-2023)》规划》划》划》

3碳、算力规模与数字经济增长相适应的新型数据中心发展格局。2025(每秒百亿亿次浮点运算)300,27。推进云网协同和算网融合发展。加快构建算力、算法、数据、应用资源协同的全国一体化大数据中心体系。3。系统优化算力基础设施布局,促进东西部算力高效2023.02 《数字中国建设整体布局规划》资料来源:国务院,工信部,

能计算中心、边缘数据中心等合理梯次布局。AI大模型的快速扩张是算力需求的关键驱动力。AIAI膨胀,GPUOpenAI175B相比Small(Flops)1400倍;而据Semianalysis最1201.8万亿参175B10倍。图9:AI大模型尺寸快速增长 图10:大模型时代的GPU算力快速增长 资料来源:《ASurveyofLarge-ScaleDeepLearningServingSystemOptimization:ChallengesandOpportunities》,

资料来源:《ASurveyofLarge-ScaleDeepLearningServingSystemOptimization:ChallengesandOpportunities》,表格2:不同语言模型的算力需求及参数数量模型 总计算力(模型 总计算力(PFlops- 总计算力(Flops) 参数量(百万)day)Small2.08E+001.80E+2060Base7.64E+006.60E+20220T5 Large2.67E+012.31E+217703B1.04E+029.00E+21300011B3.82E+023.30E+2211000Base1.89E+001.64E+20109Large6.16E+005.33E+20355Base1.74E+011.50E+21125Large4.93E+014.26E+21355Small2.60E+002.25E+20125Medium7.42E+006.41E+20356GPT-3 Large1.58E+011.37E+21760XL2.75E+012.28E+211320175B3.64E+033.14E+23174600资料来源:OpenAI《LanguageModelsareFew-ShotLearners》,汽车智能化功能升级,智能驾驶将贡献算力需求的全新增量。L3L5级14%、1%203040%、12%。而L330-60TOPS、100TOPS,未来随着智能驾驶汽车渗透率的提升,将会持续带动智能驾驶市场整体算202520301.9万、19TOPS,2021-2025CAGR。图11:智能驾驶车辆的渗透率 图12:L5智能驾驶算力需求超1000TOPS

L3L4/L5L3L4/L5

0

400040003201000100L1 L2 L3 L4 L5资料来源:华经产业研究院, 资料来源:亿欧智库,地平线官网,图13:我国智能驾驶市场算力需求测算0

算力需求(万TOPS) 同比增长()2020 2021 2022E 2023E 2024E 2025E

350%300%250%200%150%100%50%0%资料来源:中汽协,华经产业研究院,亿欧智库,优化路径:提升芯片性能及创新存算架构是研究主流系统算力主要受处理器性能与数据传输能力影响,当数据处理能力与传输能力不匹配时,计算能力由两者中较低者决定。处理性能主要与指令复杂程度、频率、并行度有关,一般来说,指令越复杂、计算频率越高、并行程度越大,处理器性能就越好;而数据传输的能力与处理器内部存算架构有关,在计算机体系里,根据访问延迟及容量大小将存储结构分为寄存器、缓存、内存、外存与远程存储,而这种存算分离的架构形式,通常使得数据传输成为限制系统算力的因素。图14:算力性能主要受处理器性能及数据传输制约资料来源:SDNLAB,指令的复杂程度。指令系统是连接计算机软件和硬件的桥梁,一般来说,指令的复CPUGPUFPGADSACPU硬件加速平台,用于执行各类复杂指令。CPU数据传输能力。数据传输能力并不直接影响处理器性能,但复杂的存储分层结构会据传输能力的优化方向主要包括近存计算及存算一体化架构。二、算力需求视角下看GPU发展的必然趋势性能:GPU横向比较,GPUCPU而言,更符合深度学习算法的高度并行计算需求。一方面,CPU性能提升已达到瓶颈,与高速增长的算力需求脱节。CPU作为第一代高效计算平台,目前无论从不管是从架构/微架构设计、工艺、多核并行等各种角度出发,其性能都难以提升,2016年之后,CPU性能每年提升仅3.5%。随着数字经济、AI大模型、智能驾驶等算力需求的推动,CPU性能已无法满足上层软件算力需求。15:2016-2018CPU3.5资料来源:computerarchitecture:Aquantitativeapproach,CPUSIMD架CPUMIMD可以用来处理复杂的控制逻辑、预测分支、乱序执行、多级流水等,而GPU为数据级并行的SIMD架构,其核心多但性能弱,用于优化具有简单控制逻辑的数据并行任务。GPUGPU,不仅能够更快的完成数据的读取与写入,还能实行多条指令并行计算。图16:CPU架构 图17:GPU架构拥有更多的逻辑核心资料来源:Imagination官网, 资料来源:Imagination官网,纵向比较,GPU架构技术仍在演进,其高性能计算与智能计算能力不断优化GPUProcessingUnit),1999GeForce256图形处理芯片时首GPU的概念,GeForce256T&LCPU的依赖。GPU组成中通常包含一VRAM、一个显存速率以及一个显存位宽。图第一款以GPU命名的芯片GeForce256 图19:GPU经典工作流程资料来源:电动星球News, 资料来源:电子发烧友,GPUGPUGPUGPGPU。2008-202282010GPUFermi2017HopperGPUAI大模型训练与推理环节。表格3:英伟达GPU架构调整演进方向构架代号 时间 纳米制程 核心参数 特点 代表型号构架代号 时间 纳米制程 核心参数 特点 代表型号Fermi2010 完整GPU架构 Quadro700030亿晶体管 个Cuda内核Kepler28nm 15个SMFermi2010 完整GPU架构 Quadro700030亿晶体管 个Cuda内核Kepler28nm 15个SM,每个SM包括 支持GPUDirect技 K80201271亿晶体管 192个FP32和64个FP64 术 K40MMaxwell28nm 24个SM,每个SM包括 M50002014 -80亿晶体管 128个FP32与4个FP64 M4000PascalP10016nm 56个MM包括642016 NVlink一代 GTX1080152亿晶体管 个FP32与32个FP64P6000Volta80个M每个M包括32 推出Tenor内核,12nm V1002017 个FP64、64个INT32、64 满足深度学习与AI211亿晶体管个FP32、8个Tensor内核运算TiTanVTU10272SM,每个Turing 2018 SM64INT32、64个FP32、8个Tensor内核二代Tensor内核T42080TIRTX500012nm186亿晶体管Ampere 2020Hopper

7nm283亿晶体管4nm800亿晶体管

A100108SMSM32FP6464INT32、64FP32、4Tensor内核H100132SMSM64FP6464INT32、128FP32、4Tensor内核

Tensor结构稀疏性MIG1.04nm工艺Tensor内核结构稀疏性矩阵MIG2.0

A100A303090H100资料来源:英伟达官网历代架构白皮书,AI模型推理的关键张量核心。英伟达架构上推出,在后续推出的TuringAmpereHopperV100P1009核心其FP8性能较AmpereFP616倍,AIAmpere30倍。图20:V100混合精度运算速度提高了9倍图21:英伟达第四代FP8Tensorcore 资料来源:微型计算机杂志, 资料来源:英伟达官网,灵活性:GPUAIGPU拥有相对较优的性能及灵活性。CPU、FPGA、GPU、DSACPU为软件加速CPU平台的硬件实现与软件编程完全解耦,灵活性最高;ASIC图22:常用的主流计算平台灵活性及性能的比较资料来源:SDNLAB,ASICDSADSAASICASICASICASICDSAASICDSA的应用领域,与芯片高企的研发成本相矛盾。5ASICDSAAI应用领域,ASICDSAAI应用及算法迭代优化的速度。特点算力通用性()芯片图23:芯片研发成本 表格4:GPU、DSA、ASIC特点算力通用性()芯片600500

研发成本(百万美元)

CPU(基100 1 极度灵活的可编程能力准)0

65nm40nm28nm22nm16nm10nm7nm5nm

GPU 10DSA5(TPU)ASIC 1

>10倍>100倍>100倍

用广泛能力性能极致但无灵活性,应用拓展力不强资料来源:软硬件融合, 资料来源:腾讯云,ASICDSA芯片与算力融合的宏架构趋势相矛盾。数字经济的建DSAASIC芯片难以成为数字经济时代的整体解决方案。图24:不同部署位置的AI芯片要求资料来源:集微咨询,CUDA、OpenCLGPU赋能,GPU性能提升潜力大、应用拓展力强。GPUMXNet在内的所有深度学习框架;另一方面,随着深度学习算法和模型的收敛,GPU可以通过对算法进行手工优化实现CUDA10-20%的性能提升。图25:英伟达CUDA-XAI生态支持多种框架、云计算服务、部署资料来源:英伟达官网,三、GPU市场:供给推动市场,技术及产能是核心驱动力3.1需求端:移动端兜底,自动驾驶及数据中心建设贡献增量GPU下游目前主要应用于移动端、数据中心服务器以及车规级芯片。其中,移动端应PCGPUGPU,主要用于加速图形处理,以提高计算机游戏的图GPU度学习、计算机视觉和自然语言处理等人工智能应用;数据中心服务器又可以分为高GPU用于数据中心建设;在汽车领域,GPU主要应用于车端及其配套设施智能芯片,负责处理来自摄像头、普通雷达、激光雷达等传感器数据,实现智能驾驶。图26:GPU市场下游需求资料来源:英伟达官网,高通官网,中商产业研究院,观研报告,1)GPU移动端主要市场,智能手机及可穿戴设备有望渗透。GPU作为图尤其是个人电脑市场下滑的影响,PC端显卡需求处于下行区间,据JonPeddieResearch数据统计,2023PC630万块,同比下降52.9%。图27:PC市场处于下行周期(含平板) 图28:PC端桌面显卡出销量及同比0

出货量(百万台,左轴同比增速(,右轴)2017 2019 2021 2023E

20%15%10%5%0%-5%-10%-15%

销量(百万块,左轴同比增速(,右轴)60504030201002014 2016 2018 2020 2022

0-0.1-0.2-0.3-0.4-0.5-0.6资料来源:Canalys, 资料来源:JonPeddieResearch,AIGPUEZOO202103553%GPUGPU性能要求将逐渐增加,目前高通、AMDARM扩量。图29:全球移动游戏市场占比增加(十主要内容联合GPU品牌SoC厂商亿美元) 表格5:SoC推动高性能GPU主要内容联合GPU品牌SoC厂商250200150100

主机游戏 移动游数字版/盒装PC游戏 网页游

三星电子 Exynos AMD高通 骁龙 自研

级图形技术和解决方案。高通人工智能引擎,AdrenoGPU25,能效提升451047710477919302020 2021 2022 2023E

双方合作将NVIDIA图形联发科 天玑 英伟达解决方案引入安卓海思 麒麟 - -资料来源:NEWZOO, 资料来源:福布斯中国,中国日报网,AIAIAI技术的快速发展,以及计算需求的提升,AIAI架构可以根据模AIXR等便携设AIGPU需求的提升。图30:基于终端感知的混合AI 图31:部分AI模型可从云端分流到终端资料来源:高通《混合AI是AI的未来》, 资料来源:高通《混合AI是AI的未来》,GPU车载芯片的架构模式经历分布式架构向混CPUGPU来辅助计算;而中央计算架构图32:车载芯片的演变资料来源:博世官网,有驾官网,ECUECU构复杂,不利于汽车架构及功能扩展。ECU数量,根据汽车各部分功能进行划分,如博世将汽车控制(每个功能域设置域CANFD域由于要满足人机交互、机器视觉等需求,其算力要求较高,通常通过DPU(CPU+GPU+FPGA)架构来满足算力需求。ECU图33:中央计算平台须采用高算力芯片以进行整车功能、算力/存储等资源部署资料来源:汽车测试网,GPUGPU需V2XAIGPUORINCPU+GPU+ACCELGPUDLA提供。根据测算,预2023GPU24亿美元。图34:2025年芯片平均算力将超2000算力(TOPS)架构产品厂商算力(TOPS)架构产品厂商250020001500

市场加权平均算力(TOPS)

英伟达 ORIN CPU+GPU+ACCEL 254INT8地平线 征程5 CPU+BPU+DSP+ISP 1281000

芯擎科技 龙鹰一号 CPU+GPU+NPU -5000

2023E 2024E 2025E

Mobileye

EyeQULTRACPU+GPU+VPU+ISP 176(未量产)研究所

特斯拉 FSD CPU+GPU+NPU 144资料来源:有驾,自动驾驶与AI,地平线官网,GPUGPUHyperion研究显示,2025199亿美元,2022-2025CAGR5.5%top50050056%GPU2023年全球高性能计算中GUP21亿美元。图352025年全球高性能计算市场规模达199亿美元

图36:TOP500超算中心56算力由GPU提供0

HPC市场规模(亿美元,左轴同比增速(,右轴)2020 2021 20222023E2024E2025E

20%16%12%8%4%0%-4%资料来源:Hyperion, 资料来源:官网,不同于高性能计算中心,智算中心是利是用先进的人工智能算法和芯片进行智能算法模型训练和推理。总量方面,根据IDC及数据预测,2023年全球AI服务器市场规模将达到211亿美元,同比增长15%,而据AletheiaCapital最新报告分析,2025年AI服务器市场规模将激增至1350亿美元,2023-2025CAGR高达152%;价值方面,由于智能算法具有计算难度小、计算量大等特点,对于计算任务的高并发能力及吞吐量要求较高,因此对于GPU的需求更大,据统计,机器学习型AI服务器中,GPU成本占比约为72.8%。未来,随着智算中心建设有序推进,GPU有望迎来量价齐升,预计2023年AI服务器领域GUP市场空间约为187.8亿美元。37:AIGPU

图38:2025年全球AI服务器市场规模激增至1350亿美元

其他 网络 存储器 内存 GPU CPU73%25%73%25%27%基础型 推理型 高性能型 机器学型资料来源:IDC,ARK,华经情报网,乐晴智库,注:高性能及机器学习型服务器中存储器、网络合并为其他项

资料来源:AletheiaCapital3.2供给端:英伟达独占鳌头,国内技术追赶空间广阔英伟达市场份额独占鳌头,国际呈现三强格局,国内厂商加速布局。英伟达凭借技术及产能优势,在移动端、AI服务器、自动驾驶领域具有较大话语权。国际市场方面,根据JonPeddieResearch调查数据显示,2023年第一季度,全球桌面级显卡销量约为630万块,其中英伟达显卡销量约为529万张,以84%的市场份额占据领先地位,此外销量位居前三的GUP供应商还包括AMD及Intel,其销量分别为76万张、25万张;国内市场方面,我国厂商GPU市场份额较小,正处于技术追赶及自主研发环节,目前国产GPU在数据中心、人工智能以及通用计算型GPU领域均实现产品布局,未来随着国内数据中心、智能驾驶及终端侧GPU市场需求的提升,国产GPU市场份额有望实现渗透。图39:全球GPU市场格局变化 图40:国内部分GPU厂商市场布局Intel AMD NVIDIA75%86%75%86%84%80%60%40%20%0%22Q1

22Q4

23Q1资料来源:JonPeddieResearch, 资料来源:公司官网,GeForceGeForce2RTX40SMCoreAI增强图形渲染,多项技术业界领先。技术 功能图41:英伟达游戏产品矩阵 表格7:游戏产品增强技术技术 功能BatteryBoost 提升游戏时电脑续航时间DLSS 帮助玩家增强图形设置并提升分辨率GameWorks

游戏开发者带来视觉计算领域的顶尖技术G-SYNC 减少显示器卡顿现象和输入延迟GPUBoost GPUWhisperMode 智能调整游戏帧速率资料来源:英伟达官网, 资料来源:英伟达官网,12产品支持包括智能座舱、桌面办公、笔记本、服务器等应用在内的各个领域以及Linux、ows、Android等系统;而摩尔线程首款桌面级游戏显卡MTTS80,在1.8GHz的主频下,能够提供14.4TFLOPS的单精度浮点算力,根据PassMark的测试结果,MTTS80显卡的性能已达到英伟达中端显卡GeForceGTX750Ti的性能水平。表格8:国内厂商桌面级显卡产品参数对比摩尔线程资料来源:公司官网,站长之家,注:FP32(单精度浮点算力,单位:TFLOPS)、INT8(整型算力,单位:TOPS)202424.9亿美元,同比增长22%PC财年英伟达22.438%,随着疫情影响退出,游戏业务迎来回JonPeddieResearchGPU2023第二季度英伟达以68%PC图42:英伟达游戏业务营收增长 图43:2023Q2全球PC显卡市场份额0

游戏业务(亿美元,左轴)同比增长(,右轴)2021 2022 2023Q1

80%60%40%20%0%-20%-40%-60%

NVIDIA18%14%68%AMD18%14%68%Intel资料来源:英伟达官网, 资料来源:JonPeddieResearch,GUPGPUGPU2022H1004N工艺,集成最高184329216CUDA576核心,AIFP16TF32FP64A10032000TFLOPS、1000TFLOPS60TFLOPS。技术 功能图44:英伟达数据中心产品矩阵 表格9:英伟达H100产品技术技术 功能Transformer引擎 加速AI模型训练NVLinkSwitch系统

纵向扩展互联技术,跨服务器拓展GPUNVIDIA机密计算 保护使用中的数据和应用MIGDPX指令

GPU全独立的实例,并拥有自己的内存、缓存和计算核心速度资料来源:英伟达官网, 资料来源:英伟达官网,此外,英伟达还在软件及技术产品方面提供支持,通过其丰富的产品矩阵搭建数据中心一站式解决方案。AI及高性能计算市场计算需求的不断增长,GPU之NVLinkGPU系统配置高更的宽带及增强的可扩展能力,NVLinkSwitchNVLink的高级通信能力构建,可为计算密集型工作负载提供更高带宽和更低延迟,从而显著增强服务器内GPU通信能力。图45:英伟达第四代NVLink能为H100提升1.5倍带宽资料来源:英伟达官网,GPU布局者较多,产品性能逐渐向英伟达靠拢。以英伟达最新GPU为参考,H100SXM4N工艺,其单精度浮点算力已673958的AIHPC307倍;而目前国内算力较高的产品为壁仞科技推出的B10P7nm240TFLPS,1920TOPS,BR100A1003倍以上,向H100产品靠拢。表格10:国内厂商高性能计算GPU产品参数对比厂商 产品 算力 制程 显存 架构厂商 产品 算力 制程 显存 架构英伟达

H100SXMH100PCLe

FP32:67INT8:3958FP32:51INT8:3026

4nm 带宽:3.35TB/s Hopper4nm 带宽:2TB/s Hopper位宽:256位摩尔线程

MTTS3000 FP32:15.2 -FP32:10.6

带宽:448GB/s

MUSA(自研)MTTS2000

INT8:42.4

- 位宽:256位 MUSA(自研)瀚博半导体 载天VA10 INT8:400+ - - VUCA(自研)FP32:24寒武纪 MLU370-X8

INT8:256

7nm 带宽:614.4GB/s -壁仞科技 壁砺™100P

FP32:240INT8:1920

7nm

位宽:4096位带宽:1.64TB/s

BIRENSUPA(自研)壁砺™104P壁砺™104S

FP32:256INT8:1024FP32:170.5INT8:682

7nm7nm

位宽:2048位带宽:819GB/s位宽:2048位带宽:819GB/s

BIRENSUPA(自研)BIRENSUPA(自研)资料来源:英伟达、摩尔线程等公司官网,注:英伟达产品参数采用稀疏技术显示,在不采用稀疏技术的情况下,规格降低一半注:FP32(单精度浮点算力,单位:TFLOPS)、INT8(整型算力,单位:TOPS)盈利能力及产能方面,数据中心业务营收已超游戏业务,成为英伟达最高收入来源,但其产能受限于台积电工艺,短期供需缺口较大。据英伟达2024财年Q2报告,其数据中心营收已达到103.2亿美元,同比增长171%,约占总营收比例为76%;产能方面,英伟达H100均由台积电代工,其产能受到台积电工艺限制,据英伟达预计,H100芯片2023年全年全球范围出货量约为55万颗,但据GPUUtils数据统计,保守估计情况下,H100的供给缺口将达到43万颗。壁仞科技BR100P系列芯片同样由台积电代工,预计于2023年量产,若量产计划顺利推进,自主研发有望渗透。图46:英伟达数据中心业务营收增长 图47:高性能计算芯片下游需求0

数据中心(亿美元,左轴同比增长(,右轴)2021 2022 2023Q1

180%160%140%120%100%80%60%40%20%0%资料来源:英伟达官网, 资料来源:GPUUtils官网,公司官网,3)智能驾驶。Thor英20229Thor,ThorCPUGPU2000Orin8加固自动驾驶领域护城河。图48:英伟达自动驾驶产品矩阵 图49:英伟达Thor芯片计算性能提升算力2000250200025013020001500100050002018PARKER

2020XAVIER

2022ORIN

2024THOR资料来源:英伟达官网, 资料来源:英伟达官网,目前,国内大多数智能驾驶车型选用英伟达产品,地平线与华为自研市场份额正在逐步扩大。ORIN产品,比5MaxORIN芯片,除此之外华为在自动驾驶领域同样具有布局,华为610、MDC810已经量产,MDC610平200TOPSORIN产品差距较小。表格11:国内部分车型搭载芯片型号车企 车型搭载芯片车企 车型搭载芯片芯片制造商 备注G9ORIN英伟达 两组ORIN芯片G6ORIN英伟达P7Xavier新款P7升级为两组英伟达ORIN芯英伟达片L7MaxORIN英伟达L7PRO征程5地平线L8MaxORIN英伟达理想L8PRO征程5地平线L9MaxORIN英伟达L9PRO征程5地平线---ES6 ORIN

搭载四颗OrinX芯片,总算力高达1016TOPS蔚来ET7ORIN英伟达AQUILA自动驾驶系统ET5ORIN英伟达AQUILA自动驾驶系统威马M7ORIN英伟达-极狐 阿尔法S-华为HI MDC610 华

单组算力为200TOPS,综合算力为400TOPS吉利 极氪001 EyeQ5H Mobileye 单颗EyeQ5H的算力为24Tops资料来源:蔚来官网,汽车之家,20242季度营收较一季度出现下15%2.53亿美元。市场结构上,2023H1中国市场乘用车自动驾驶计算方案市场份额中,英伟达仍以52.57%的份额占据第一,地平线以30.71%的市场份额占据第二,华为海思则占据4.05%的市场份额。图50:英伟达智能驾驶业务营收增长

H1计算方案市场份额智能驾驶(亿美元,左轴同比增长(,右轴)1098765432102021 2022 2023Q1

120%100%80%60%40%20%0%

31%

52%

英伟达地平线德州仪器Mobileye华为海思资料来源:英伟达官网, 资料来源:高工智能汽车,GPUGPU4nm7nmCoWoS富微电及赛微电子等具有布局。202210.7%的6.5%图52:GPU产业中下游分别为芯片设计、制造、封装与测试资料来源:公司官网,超能网,集微网,公司主要GPU产品市值(亿元)技术背景主要应用领域景嘉微JM5/7/9/7200343.04完全自主知识产权航天军工、通用计算海光信息公司主要GPU产品市值(亿元)技术背景主要应用领域景嘉微JM5/7/9/7200343.04完全自主知识产权航天军工、通用计算海光信息海光81001349.98AMDx86授权服务器、通用计算壁仞科技BR100、BR104未上市 Imagination授权IP+ 服务器、信创自主研发凌久电子GP101、GP102未上市 完全自主知识产权 桌面、军工芯原股份VivanteGPUIP收购自美国图芯322.34 IP(Vivante)芯动科技风华1号/2号Imagination授权IP+未上市 服务器表格12:国内重点GPU公司及技术自主研发摩尔线程

MTTS80/60/30/10MTTS3000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论