计算机行业英伟达GTC大会跟踪:零部件升级是最大亮点_第1页
计算机行业英伟达GTC大会跟踪:零部件升级是最大亮点_第2页
计算机行业英伟达GTC大会跟踪:零部件升级是最大亮点_第3页
计算机行业英伟达GTC大会跟踪:零部件升级是最大亮点_第4页
计算机行业英伟达GTC大会跟踪:零部件升级是最大亮点_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正文目录英伟达GTC大会跟踪,全球加速计算持续升级 4英伟达引领全球计算架构持续升级 4英伟达发布多款软件服务,巩固其AI生态 8投资建议: 14风险提示 14图目录图表1左为GH100,右手为Blackwell 4图表2Blackwell架构示意图 5图表3GB200架构其中包含两个GPU和一个CPU 5图表4HGXB200和HGXB100参数一览 6图表5英伟达GB200NVL架构示意图 6图表6英伟达GB200NVL液冷图示 6图表7GB200NVL72实时LLM推理速度 7图表8英伟达GB200NVL大规模培训速度 7图表9GB200NVL72节能基础设施能耗 7图表10英伟达GB200NVL数据处理速度 7图表11HGXB200和HGXB100参数一览 8图表12英伟达AI微服务搭建AI框架示意图 9图表13英伟达AI微服务示意图 10图表14英伟达机器人示意图 10图表15DriveThor人工智能计算路线图的下一代产品 11图表16DriveThor多域计算示意图 12图表17英伟达发布地球气候数字孪生示意图 13图表18英伟达数字人示意图 14请仔细阅读在本报告尾部的重要法律声明GTCBlackwell319大会正式召开,在全球的科技公司争抢H100的背景下,新一代系列产品BlackwellAI大型语言模型的成本和能耗降低到此前的1/25。图表1左为GH100,右手为Blackwell资料来源:机器之心,研究所相较于上一代Hopper架构,其性能怪兽正式发布:1、制成情况:黄仁勋表示,Blackwell将成为世界上最强大的芯片。Blackwell架构的B200GPU拥有2080亿个晶体管,采用定制的、双reticle的台积电4NP(4N工艺的改进版本)制程工艺,两块小芯片之间的互联速度高达10TBps,可以大幅度提高处理能。2、带宽及存储情况:192GB速度为8Gbps的HBM3E内存,AI算20petaflops(FP4H1004petaflops。3、算力及能耗情况:H100TensorCoreGPU,GB2003025倍。4、算力精度情况:BlackwellGPUFP6FP8AIAI图表2Blackwell架构示意图资料来源:华尔街见闻,研究所具体来讲,此次的新产品系列分为两款:B200GB200HGXB100B200GPU208020petaflopsFP4GB200GPU900GB/B200GPU连接到1个GraceCPU上。图表3GB200架构其中包含两个GPU和一个CPU资料来源:极客公园,研究所然而从整机的解决方案来说,我们可以简单将英伟达的Blackwell产品分为三类:分别是英伟达HGXB100、HGXB200、DGXGB200HGXB100HGXB200B100GPUB200GPUB100700W,B2001000W。图表4HGXB200和HGXB100参数一览资料来源:英伟达官网,研究所DGXGB200Blackwell的AI算力将以名为DGXGB20036NVIDIAGraceCPU72块BlackwellGPUNVLink连接成一台超级GB200NVL7272H100GB200NVL72301/25。图表5英伟达GB200NVL72架构示意图 图表6英伟达GB200NVL液冷图示 资料来源:机器之心,研究所 资料来源:机器之心,研究所18个1UFP8性能为720petaflops,FP41440petaflops27AILLMGB200GraceBlackwellSuperchip,这些计算节点1.7TBHBM3E32TB/sMGX然而由于功耗过大,需要采用液冷。图表7GB200NVL72实时LLM推理速度 图表8英伟达GB200NVL大规模培训速度资料来源:英伟达官网,研究所 资料来源:英伟达官网,研究所图表9GB200NVL72节能基础设施能耗 图表10英伟达GB200NVL数据处理速度资料来源:英伟达官网,研究所 资料来源:英伟达官网,研究所值得关注的一点是,GB200NVL72根据腾讯网的消息,GB200NVL72NVSwitchGPUNVSwitch,外部则使用光互联形式(-I/O连接器。值得注意的是,其内部使用的电缆长度累计接近25000GTC大会上,黄仁勋对铜连接方案进行了特别讲解,并强调其在成本降低和性能展示上的优势。此外,从整机系统构造来说,英伟达发布全新的Blackwell架构DGXSuperPODAINVIDIA网络、NVIDIA全栈AIGraceBlackwell超级芯片的数量扩展至数万个,通过NVIDIANVLink可将多达576块BlackwellGPU连成一个NVIDIAAIDGXSuperPOD采用新型高效液冷机架级扩展架构,基于NVIDIADGX™GB200系统构建而成,在FP411.5exaflops的AI超级计算性能和240TB的快速显存,GB200NVL72288CPU、576GPU、240TB11.5exaflopsFP4GTC“DGXSuperpodAI图表11HGXB200和HGXB100参数一览资料来源:新浪财经,研究所

英伟达持续巩固其AI霸主地位,相关产业链公司也将提供各自解决方案:我们判断,英伟达通过发布Blackwell架构GPU,再次巩固了自身在人工智能市场的主导地位,开创了AI计算的新时代。根据新浪新闻消息,Dell、HPE、联想、Supermicro、Aivres、华擎、华硕、Eviden、技嘉、英业达、和硕、云达、纬创、Wiwynn和ZTSystems等OEM厂商也将在未来提供各自的解决方案。微服务英伟达推出生成式AI微服务,供开发者在CUDAGPU系统中创建部署生成AIGTCAINVIDIACUDA®平台上开发,其中包括NVIDIANIM™NVIDIA20多个热门AI模型进行推理优化。图表12英伟达AI微服务搭建AI框架示意图资料来源:36氪,研究所NIM的优势在于:1、大幅缩短部署时间:NIM微服务提供基于NVIDIA推理软件的预构建容器,包括Triton推理服务器™和TensorRT™-LLM,使开发者能够将部署时间从几周缩短至几分钟。2APIAI行业标准API,使开发者能够使用安全托管在自己的基础设施中的专有数据,来AINVIDIAAI提供灵活性和性能。3、赋能企业平台:NVIDIA生态系统中的数据、基础设施和计算平台提供商也在使用NVIDIA微服务,为企业带来生成式AI。包括Box、Cloudera、Cohesity、Datastax、Dropbox和NetApp在内的顶级数据平台提供商正在使用NVIDIA微服务,帮助客户优化RAG管道,并将专有数据集成到生成式AI应用中。Snowflake正在使用NeMoRetriever,充分利用企业数据来构建AI应用。图表13英伟达AI微服务示意图资料来源:英伟达官方公众号,研究所英伟达推出人形机器人项目,三大平台共同发力ProjectGROOTGR00TJstsonThorNVIDIAThorSoCJetsonThor,BlackwellGPU(此前英伟达也推出个针对汽车的DRIVEThor套件,带宽达到100GB/s,AI计算性能达到800TFLOPs;该芯片能够执行复杂的任务,并借助Transformer图表14英伟达机器人示意图资料来源:36氪,研究所

英伟达目前正在构建包括NVIDIAIAI、Omniverse、ISAAC三大平台,三大平台均与机器人产业高度关联。其中搭载DGX系列产品,用于模拟物理世界,OmniveseRTXOVX系列产品,用于驱动数字孪生的计算系统,AGXOmniverseISAACLabLabISAACMANIPULATOR,以及用于提升服务机器人感知能力的ISAACPERCEPTORBlackwellNVIDIADRIVEThorDRIVEThor有望取代DRIVEOrin:同样在GTC大会上,NVIDIA创始人兼首席执行官黄仁勋公布了一款令人惊艳的超级芯片——DRIVEThor。他在演讲透露,集高级辅助驾驶技术和车载信息娱乐于一体的NVIDIADRIVEThor将搭载为Transformer和生成式AI工作负载而打造的全新NVIDIABlackwell架构。这款车规级系统级芯片(SoC)基于最新CPU和GPU打造,可提供每秒2000万亿次浮点运算性能,在大幅度提升性能的同时降低整体系统的运行成本。DRIVE Thor将逐步接替DRIVEOrin,以最新的计算技术,加速智能汽车技术在行业内的部署,赋能汽车制造商的2025年车型。DRIVEThor汽车制造商可以在单个系统级芯片上高效整合数字仪表盘、信息娱乐、泊车、辅助驾驶等多种功能,从而极大地提高开发效率和软件更新迭代的速度。图表15DriveThor人工智能计算路线图的下一代产品资料来源:英伟达官网,研究所总而言之DriveThor的优势分为3点:1DRIVEThor(DNN)准确性方面也实现了惊人的飞跃。2DRIVEThor3、芯片互联技术助力数据高速共享:通过使用DriveThor芯片,用户可以单独使用DRIVEThor芯片,也可以通过最新的NVLink-C2C芯片互连技术同时连接两个Thor芯片,使两个芯片作为单一操作系统的统一平台。NVLink-C2C的优势在于它能够以最小的开销在超高速数据传输链路中共享、调度和分发任务。图表16DriveThor多域计算示意图资料来源:英伟达官网,研究所DriveThor正在扩大与NVIDIA的长期协作的规模,并通过DRIVEThor构建下一代电动车型。广汽埃安旗下的高端豪华品牌昊铂宣布,其将于2025L4DRIVEThor用作其下一代电“AIDRIVEThor构建其未来车辆的产品路线图。多家卡车、自动驾驶出租车和无人配送车也将支持DRIVEThor。Nuro选择DRIVEThor为其NuroDriver提供助力。Plus表示,其L4级解决方案SuperDrive的后续几代将依托DRIVEThor运行。Waabi正在利用DRIVEThorAIDRIVEThorL4级自动驾驶解决方案。1、气候方面:英伟达推出Earth-2API,其名为气候数字孪生云平台,其目的是应对极端天气。NVIDIADGXCloud™上的全新Earth-2云API能够支持所AICorrDiffNVIDIAAI模型。12.510003000CorrDiffAI图表17 英伟达发布地球气候数字孪生示意图资料来源:英伟达官网,研究所2、量子技术方面:英伟达量子云基于英伟达开源CUDA-Q量子计算平台。NVIDIA旨在帮助研究人员和开发人员在化学、生物学、材料科学等关键科学领域的量子计算研究中取得突破。根据英伟达的阐述,部署量子处理器(QPU)的公司有四分之三都在使用该平台。其作为一项微服务,首次支持用户在云端构建并测试新的量子算法和应用,包括支持量子-经典混合算法编程的功能强大的模拟器和工具等。量子云自身具有强大功能和集成第三方软件的能力能够加快科学探索。3、NVIDIAAI角色栩栩如生:NVIDIAJohnSpitzer表示:“NVIDIA为开发者提供世界级的AI驱动的技术,用于创建数字人。这些技术支持复杂的动画和语音对话,增强数字互动真实GTCACENeMoRTX。ACEAINPCConvai、CyberAgent、DataMonsters、DeloitteHippocraticAI、IGOODI、InworldAI、Media.Monks、米哈游、网易游戏、完美世界游戏、Openstream、掌趣科技、Quantiphi、RakutenSecurities、Slalom、SoftSe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论