版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
证券研究报告(优于大市,维持)服务器下ARM芯片的机遇2024年7月24日投资要点
1、众多企业入局Arm服务器市场,市场渗透率有望高增速。亚马逊云、甲骨文云、Azure和阿里云等巨头纷纷入局Arm服务器市场。IDC报告显示,2022年上半年全球服务器市场规模达到575.9亿美元,同比增长18.3%,中国服务器市场规模将达到134.8亿美元,同比增长18.4%。根据Trend
Force数据预测,随着云数据中心的采用逐渐增长,预计到2025年,ARM架构在数据中心服务器市场渗透率将达到22%。
2、Arm相较X86具有独特优势。通过“堆核”的方式,使得Arm架构处理器在性能快速提升下,也能保持较低的功耗。据半导体产业纵横援引Ampere数据,其CPU的性能超越传统x86处理器3倍,性能功耗比领先近4倍。与x86服务器CPU相比Ampere
Altra系列可用50%的能耗,提供200%的性能。
投资建议:我们认为在服务器侧ARM芯片有望快速提高其渗透率,关注国内厂商进展。
风险提示:行业竞争加剧;渗透率不及预期;研发进度不及预期。2概要1.服务器CPU架构简介1.1服务器CPU和民用CPU区别1.2CISC和RISC的区别2.Arm在服务器行业大有可为2.1Arm架构在服务器行业来势凶猛2.2Arm服务器端生态伙伴数量增多2.3Arm架构服务器相比X86能耗比有所提升2.4Arm架构从V8走向V91.3基于CISC的X86架构1.4基于
RISC的Arm架构1.5基于RISC的PowerPC架构1.6基于RISC的RISC-V架构1.7基于RISC的mips架构1.8CPU各个架构具体区别1.9CPU+GPU异构计算逐渐流行2.5NVIDIA入局Arm服务器芯片26AWS采用Arm架构性能有所提升2.7
Arm架构下的Graviton提升明显2.8富士通芯片
A64FX
&FUJITSU-MONAKA2.9阿里云的倚天710性能强劲2.10Google
Ampere
纷纷自研Arm芯片2.11未来Arm服务器架构的发展路径31.1服务器CPU和民用CPU区别服务器是通用计算产业的基石,是中国数字经济的底层算力支撑,在各行各业数智化转型的浪潮中将迎来需求爆发,特别是在“东数西算”加快推进的背景下。CPU处理器是服务器的核心部件,被誉为服务器的“大脑”,其功能主要是解释计算机指令以及处理计算机软件中的数据。服务器CPU同样也包括控制器、运算器,对计算机所有硬件资源进行控制调配。表:服务器CPU和民用CPU区别两者区别接口服务器CPU民用CPU接口搭配主板不同,服务器CPU主板没有显卡卡槽且CPU总线带宽更高稳定性要求一般服务器都是365天开机运行,对稳定性
按72个小时连续工作而设计的,稳定要求极高性要求低是否多路互联市场价格是否主流产品价格基本千元以上,甚至过万普通CPU价格都在百元到千元资料:CSDN
,证券研究所41.2CISC和RISC的区别将
服
务
器
按
照
指
令
集
架
构
分
类
,
可
以
将
服
务
器
分
成
两
类
:
一
类
是
CISC(Complex
Instruction
Set
Computer复杂指令集)架构服务器,即通常所用的PC服务器。这类服务器基于PC机体结构,采用英特尔或者与之兼容的其他处理器芯片,这一架构以小巧稳为特点。另一种则是RISC(ReducedInstructionSet
Computing精简指令集)架构服务器。这类服务所采用的CPU与日常所用CPU完全不同,此类服务器价格昂贵,但性能和数据处理能力强大。表:CISC和RISC区别CISCRISC指令系统复杂、庞大简单、精简指令数目一般大于200条不固定一般小于100条等长指令字长寻址方式一般大于4不加限制相差较大较少一般小于4可访存指令各种指令执行时间通用寄存器数量只有Load/Store指令绝大多数在一个周期内完成多资料:中关村在线,证券研究所51.3基于CISC的X86架构X86泛指一系列基于Intel
8086且向后兼容的中央处理器指令集架构。最早的8086处理器于1978年由Intel推出,为16位微处理器。该系列较早期的处理器名称是以数字来表示80x86。由于以“86”作为结尾,包括Intel
8086、80186、80286、80386以及80486,因此其架构被称为“x86”。图:X86架构服务器发展历史增强型平台至x64架构第三代至第六代第一代至第二代•
1985年第三代发布•
1989年第四代发布•
1993年第五代发布•
1995年第六代发布•
32位•
2000年至今x86架构过度到x86-64架构•
1978年第一代x86•
1982年第二代•
16位•
64位资料:维基百科,证券研究所61.4基于RISC的Arm架构Arm架构,过去称作高级精简指令集(Advanced
RISC),是一个精简指令集(RISC)处理器架构家族,其广泛地使用在许多嵌入式系统设计。由于节能的特点,其在其他领域上也有很多作为。ARM处理器非常适用于移动通信领域,符合其主要设计目标为低成本、高性能、低耗电的特性。同时,在服务器领域超算消耗大量电能,Arm同样被视作更高效的选择。表:Arm架构的特点ARM芯片使用精简指令集,即每条指令只完成一项简单的操作,从而提高指令的执行效率和处理器的性能。精简指令集ARM芯片使用负载,即只有专门的负载和存储指令可以访问内存,其他指令只能在寄存器之间进行操作。这样可以减少内存访问的次数和延迟,提高数据处理的速度。负载/存储架构统一寄存器文件条件执行ARM芯片使用统一寄存器文件,即所有的通用寄存器都可以用于任何目的,没有专门的数据寄存器或地址寄存器。ARM芯片支持条件执行,即每条指令都可以根据一个条件码来决定是否执行。这样可以减少分支指令的使用,提高代码密度和流水线效率。ARM芯片支持多种工作模式,例如用户模式、系统模式、管理模式、中断模式、异常模式等。多种工作模式资料:CSDN
,证券研究所71.5基于RISC的PowerPC架构PowerPC(Performance
Optimization
With
Enhanced
RISC
–
PerformanceComputing)是一种RISC架构的CPU,其基本的设计源自IBM的POWER。PowerPC
处理器有非常强的嵌入式表现,因为它具有优异的性能、较低的能量损耗以及较低的散热量。除了像串行和网控制器那样的集成
I/O,该嵌入式处理器与台式机CPU存在区别。图:Power
PC芯片分析图图:Power
PC芯片资料logodix
,:易特创芯援引中国电子顶级开发网,证券研究所81.6基于RISC的RISC-V架构RISC-V是一个基于RISC的开源指令集架构。与大多数指令集相比,RISC-V指令集可以自由地用于任何目的,允许任何人设计、制造和销售RISC-V芯片和软件。因为其设计使其适用于现代计算设备(如仓库规模云计算机、高端移动电话和微小嵌入式系统)。设计者考虑到了这些用途中的性能与功率效率。表:RISC-V架构的优势RISC-V指令集完全开源,采用宽松的
BSD协议,企业可以自由免费使用,并且可以添加自有指令集而无需开放共享,从而实现差异化发展。完全开源架构简单RISC-V架构简单,基础指令集只有
40多条,加上模块化扩展指令也只有几十条指令,文档也比较简洁,便于开发和移植新的操作系统和应用。RISC-V提供详细的特权级和用户级指令规范,使得开发者能够方便地将
Linux和
UNIX系统移植到
RISC-V平台上,保障操作系统的稳定性。易于移植RISC-V架构模块化设计,使其可以通过灵活组合不同模块,满足各种应用场景的需求,如嵌入式低功耗场景或高性能应用场景。模块化设计RISC-V社区提供了完整的工具链G,CC包、含QEMU
等主要工具,使得芯片完整的工具链设计公司可以专注于芯片设计,而无需担心工具链的问题。资料:芯语,证券研究所91.7基于RISC的mips架构MIPS(Microprocessor
without
Interlocked
Pipeline
Stages)是一种精简指令集(RISC)架构,由MIPS计算机系统公司开发。MIPS最早是32位,最新版本为64位,主要竞争对手是ARM和RISC-V。MIPS架构当前版本是MIPS32/64Release
6,并有多个扩展(如MIPS-3D、MDMX、MIPS16e、MIPS
MT)。MIPS架构在大学和技术学校的计算机架构课程中广泛教学,并影响了后来的精简指令集架构如Alpha。2021年3月,MIPS宣布停止开发,转向RISC-V。图:LSILR3000GC20
MIPS
CPU图:基于MIPS架构的龙芯3号资料:爱集微,cpushack,证券研究所101.8CPU各个架构具体区别CPU处理器架构指的是处理器的内部结构和功能,也就是处理器如何执行指令和数据的方式。不同的处理器架构有不同的指令集,也就是处理器能够理解和执行的基本操作。处理器架构对于处理器的性能、功耗、兼容性等方面有重要的影响。常见的架构有x86、ARM、RISC-V和MIPS。表:各个架构具体区别架构指令集类型
优势劣势代表芯片计算性能强,兼容性好,生态成熟功耗高,指令集封闭,授权限制Intel
Corei9,
AMDRyzen9X86CISCRISC计算性能弱,授权费用高,受美国制裁影响阿里倚天710、Ampere
Altra亚马逊Graviton功耗低,架构灵活,授权模式多样ARM生态不完善,技术不成熟,缺乏商业支持SiFive
FreedomU740,
AlibabaXuanTie
C910开源免费,架构模块化,自主研发空间大RISC-VMIPSRISCRISC简洁,优化方便,高拓展性市场份额小,竞争力不足,生态落后龙芯3A5000,Loongson
3A4000资料:CSDN、芯智迅,证券研究所111.9CPU
+GPU异构计算逐渐流行异构计算是指系统同时使用多种处理器或者核心,这些系统通过增加不同的协处理器提高整体的性能或者资源的利用率。这些协处理器可以负责处理系统中特定的任务,例如用来渲染图形的
GPU。CPU
虽然能够很好地处理通用的计算任务,但是因为核心数量限制在图形领域却远远不如GPU,复杂的图形渲染、全局光照等问题仍然需要
GPU
来解决,而大数据、机器学习和人工智能等技术的发展也推动着
GPU
的演进。表:CPU和GPU具体区别图:CPU和GPU架构图示擅长复杂、单线程任务,兼容性高;处理复杂逻辑和少量计算CPUGPU擅长大规模并行计算,适合处理大量简单任务;处理大量数据并行任务;多核架构提高计算效率;处理并行任务时延时较低比CPU更节能,降低运行成本和热处理需求;与CPU间数据传输速度快资料:CSDN
,证券研究所122.1ARM架构在服务器行业来势凶猛据TrendForce集邦咨询研究显示,近年企业对于人工智能、高效能运算等数字转型需求加速,带动云端采用比例增加,全球主要云端服务业者为提升服务弹性,陆续导入ARM架构服务器,预期至2025年ARM架构在数据中心服务器渗透率将达22%。图:X86和Arm服务器市场份额图图:
X86和Arm服务器市场份额预测图100%90%80%70%60%50%40%30%20%10%0%202020212022e2023fintelAMDArmOthers资料:digitimes,《Redefining
Computing:
Riseof
ARMfrom
consumer
to
Cloud
for
energy
efficiency》Tahmid
NoorRahman,
etc
,13证券研究所2.2Arm服务器端生态伙伴数量增多Arm服务器芯片在云计算市场迅速崛起,得益于Oracle、Amazon、、阿里等众多行业巨头的生态伙伴支持,推动了其软件生态和供应链的快速发展,展现了强大的增长势头和生态伙伴的日益增多。图:基于ARM服务器的生态伙伴增多2021年阿里平头哥发布倚天7102019年推出鲲鹏920芯片2018年Amazon发布Graviton芯片部署在AWS2017年Ampere成立专注于Arm服务器2018年2019年2021年2024年2017年资料:爱集微
,证券研究所142.3Arm架构服务器相比X86能耗比有所提升Arm架构因其在云计算中的高能效、成本效益和增强的安全性而受到青睐。与传统的x86架构相比,基于Arm的服务器在性能和功耗方面表现出了更优的每瓦特性能。Ampere
Altra等高性能Arm服务器处理器的推出,为云原生工作负载提供了强有力的支持。Arm架构在云托管领域的变革潜力主要体现在混合云解决方案、微型数据中心、定制资源分配以及对云原生生态系统的全面支持。图:Arm服务器相较于X86的优缺点资料:cloudpanel
,证券研究所152.4Arm架构从V8走向V9Armv9采用Arm机密计算架构(CCA),基于Armv8既往成功的基础,增添了针对矢量处理的DSP、机器学习和安全等这三个技术特性。目前64位上的Armv8架构中的所有功能均能在v9架构中得到支持,且v9架构将支持在32位v8的架构功能。同时Arm基于Armv9指令集架构推出了Neoverse
N2、NeoverseV2等平台,旨在为云端、超大规模和HPC提供新一代基础设施。图:Armv9迭代梯形图资料:linuxeden
,证券研究所162.5NVIDIA入局Arm服务器芯片NVIDIA
Grace专为处理海量数据产生智能并实现卓越能效的新型数据中心而设计。这些数据中心可运行各种工作负载,包括
AI、数据分析、超大规模云应用以及高性能计算
(HPC)。与当今的前沿服务器相比,NVIDIA
Grace
可提供每瓦两倍的性能、两倍的封装密度和超高内存带宽,以满足数据中心极为严苛的需求。图:Grace芯片图样图:Grace芯片数据对比资料:NVIDIA,证券研究所172.6AWS采用Arm架构性能有所提升Amazon
Graviton由
AWS使用
64
位
Arm
Neoverse内核定制而成,为在Amazon
EC2中运行的云工作负载提供更高的性价比。与第一代
Graviton处理器相比,Graviton2
处理器不管在性能还是功能上都实现了巨大的飞跃。它们可以提供高
7
倍的性能、多
4倍的计算核心、快
5倍内存和大
2倍缓存。表:Graviton三代参数对比处理器型号GravitonGraviton2Graviton
3Arm核Cortex-A72Neoverse
N1Neoverse
V1Arm架构核数Armv816Armv8.264Arm8.4647倍性能提升2倍单核性能提升25%的提升;2倍浮点性能提升;
3倍机比上一代性能提升无器学习性能提升工艺功耗16nm95W7nm---5nm100W;比Graviton
2减少60%的能耗资料
:软硬件结合微信公众号,证券研究所182.7
Arm架构下的Graviton提升明显Graviton3
处理器是
Graviton处理器系列中已经GA的最新产品。与
Graviton2处理器相比,它们的计算性能提高了
25%,浮点性能提高了
2倍,加密工作负载性能提高了
2倍。与
Graviton2
处理器相比,
Graviton3
处理器在机器学习工作负载方面的性能提高了
3倍,包括对
bfloat16
的支持。测试表明,MilvusonGraviton3
(m7g)
的总体性能比
Intel
XeonPlatinum
8375C
(m6i)
实现了更好的
QPS(13.7%)。图:Intel
和
Graviton3
实例之间的性能比较资料:亚马逊云科技,证券研究所192.8富士通芯片A64FX&FUJITSU-MONAKA2018年公开的A64FX不仅是首批用上7nm工艺的超算处理器,也是首个基于ArmV8.2A指令集加SVE的Arm处理器,单芯片峰值算力达到2.7TFLOPS。FUJITSU-MONAKA
是富士通下一代高性能/节能处理器,旨在提高数据中心的能源效率和数据处理速度。其基于富士通独特的技术,如K
Computer和Fugaku的微架构和低压技术、Armv9-A
架构、台积电的2nm工艺和
chiplet的3D
安装技术。包含约
150
个基于
Armv9-A
指令集架构的内核,具有可扩展向量扩展
2
(SVE2)。图:A64FX芯片示意图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 1R-α-Pinene-Standard-生命科学试剂-MCE
- 1-4-Butanediol-diacrylate-生命科学试剂-MCE
- 公差配合与测量技术 课件 项目四之任务3方向公差的解读与方向误差的检测
- 鲸园小学四年级暑假背诵古诗
- 急腹症影像表现课件
- 钉钉培训课件教学课件
- 13课教案教学课件教学课件教学
- 人教版音乐小学四年级上册第六单元《八音盒》教案
- 青蛙课件教学课件
- 供销社农资经营调查报告
- 风生水起博主的投资周记
- 部编三年级下册语文第八单元教材分析
- 公路工程监理工作流程图全套(共24页)
- 保运安全管理制度
- 风险矩阵(存货)
- 企业综合诊断预调访谈提纲
- 关于四大名著的英文presentation(课堂PPT)
- 自学日语教材(PPT课件).ppt
- 《军人购房工资收入证明模板 》
- 检验检测机构资质认定查验资料全
- 2、消防安全操作规程
评论
0/150
提交评论