半导体CPU行业研究_第1页
半导体CPU行业研究_第2页
半导体CPU行业研究_第3页
半导体CPU行业研究_第4页
半导体CPU行业研究_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

半导体CPU行业研究1.PC:先发性能优势+Wintel生态=Intel长青1.1Intel、微软、IBM三方合作开启时代IBM正式与Intel和微软合作,是IntelPC端腾飞关键第一步。20世纪70年代后期,苹果和IBM分别垄断小型计算机和大型计算机市场。PC市场苹果占据90%份额,IBM为尽快抢占市场,在DonEstridge的带领下放弃了一直以来“软硬自研”的策略,转而向外采购CPU和操作系统。1980年,IBM正式与Intel和微软合作。1981年8月,IBM推出搭载Intel8088芯片+微软MS-DOS操作系统的个人计算机PC-XT,在市场上大获成功。PC-XT的出现,大幅抢占了苹果的市场份额,苹果市占率也在此之后的十年内下降至了不足10%。1984年,IBM推出了第二代个人计算机PC-AT,搭载了Intel286处理器,是上一代PC计算速度的3倍,一年之内PC-AT占到所有PC销量的70%以上。当时,市场上除了Intel还有诸如齐洛格、摩托罗拉、德州仪器等多家厂商制造微处理器,且各家厂商都有自身的优势,而Intel抓住此次机会,装载到了这款现象级产品中,从而实现“一家独大”。从IBM拓展到康柏,“Wintel”实现了对PC的统治,是IntelPC端腾飞关键第二步。IBM由于内部决策原因,推迟发售搭载Intel386的PC,所以Intel转而在1986年与康柏推出了搭载MS-DOS的386计算机,成为行业标杆。与此同时,IBM的份额不断缩小,克隆机厂商大量进入市场,为了和此前IBM的PC实现兼容,这部分厂商大都选择了继续使用Intel的处理器和微软的操作系统,自此“Wintel”实现了对PC的统治。所以从Intel在1986年之前的这段发展历程来看,实现破局的逻辑是,在自身技术积累到一定程度后,通过合作推出了现象级产品,奠定了自身的行业地位,使市面上大多数PC都配备Wintel,而后续的PC产品为了实现向前兼容,在性价比没有巨大差距的情况下,自然惯性选择Wintel,这种选择又进一步促进了Wintel生态的发展,加深了护城河,开启了一个时代。1.2失败的冲击:性能落后/生态差距随着Intel与微软在PC端各自领域内实现绝对领先,Wintel生态不断强化,形成了生态壁垒,为了实现突破,IBM、苹果等厂商开始通过自研或联合开发,来实现对Wintel生态的攻击。对CPU替代的两次大规模冲击分别为:PowerPC微处理器、RISC阵营的挑战。AIM联盟PowerPC微处理器形成第一次冲击,由于性能失败。1991年,IBM、苹果、摩托罗拉也结成了联盟AIM,1994年便推出了第一台搭载PowerPC处理器的苹果电脑PowerMacintosh、PowerBook笔记本等。2005年,WWDC上,乔布斯正式宣布停用PowerPC芯片,而是转向Intel的X86架构芯片。2019年8月,IBM宣布正式将PowerPC架构和指令集开源,也标志着此次冲击未能实现预期目标。性能落后,无法满足产品要求,是Power芯片冲击失败主要原因。2003年,IBMPowerPC970处理器是64位芯片,其处理速度和效率远高于英特尔

32位芯片,但是其制程为130nm,最多只能达到1.8GHz,而苹果要求CPU运行速度要达到3GHz,就需要不成熟的90nm制造工艺。体现在产品上,PowerPC970由于散热和功耗的问题完全无法用于笔记本电脑。同时,Power生态上保持封闭,苹果没有将MacOS对外授权,IBM投入大量成本的PowerPC只能随着苹果销售,份额无法突破的情况下,对于IBM来说商业模式就不够成立,最终也是导致性能功耗与Intel产生较大差距,并且基于此的开发者较少,这种不具规模的生态,最终只能是走向衰落。微软在开发WindowsNT(WindowsOS内核)时,在对DOS进行战略分析时,担心RISC芯片如果取代Intel。1989年,微软决定除了将WindowsNT建立在英特尔

386芯片上之外,同时选择RISC阵营最具代表性的公司MIPS作为另一个支持的芯片进行同步开发。MIPS获得了微软的支持,但是并没有完成挑战,绝不是技术的原因,其根本是商业化进程缓慢,以及架构授权的模式错过了发展时机。MIPS开始对标Intel,面向中高端市场,功耗上相较于ARM没有优势,而其技术又不足以强大到撼动Intel的市场,同时,MIPS执着于高清盒子等小众产品,错过了最关键的发展时机。MIPS采用架构授权模式,作为后发的冲击者,具有价格高、推出速度慢、兼容性差等缺点,难以完善自身生态,结果既不能替代X86的份额,也不能像ARM一样逐步完善自身生态。值得一提的是,苹果PCARM方案已获得了初步成功。从2001到2016年,十五年间,苹果先后发布五个革命性消费电子产品:iPod、iPhone、iPad、AppleWatch、AirPods,均内嵌ARM芯片。更早之前,苹果曾为ARM公司重要股东,直至1997年乔布斯回归苹果后出售ARM股权。而在于2020年11月,苹果推出M1芯片(Mac),性能、能耗均表现出色。苹果2021春季发布会上,苹果CEO蒂姆·库克表示,搭载苹果自研芯片M1的Mac电脑销量已经超过了搭载英特尔处理器的Mac电脑。1.3成功的冲击:AMD厚积薄发AMD由于美国政策原因,拥有X86指令集的永久授权,与Intel不存在生态上的差距。1)2003年之前,AMD逆向工程主打性价比AMD在这段时间中主要依靠的是逆向工程,因此每一代CPU推出的时间点都会晚于Intel几年,因此在这么长时间以来,只能是通过性价比的商业策略,来占据市场15%左右的份额。2)2003-2005:AMD的X86-64架构实现第一次领先AMD率先设计出向下兼容原X86架构的64位X86-64指令集,并于2003年9月首次推出基于此的64位CPU——Athlon速龙系列,由此开启为期3年性能领先于英特尔的第一次成功时期。最早的64位架构是英特尔联合惠普设计的——IA-64架构,对应安腾处理器。但是IA-64和之前的X86架构完全不兼容,而AMD设计的X86-64是在X86架构基础上进行的拓展,向下兼容X86原有的操作指令,原有的16位、32位程序不需要重新编译即可运行,编译器更新也更加容易。由于IA-64在软件兼容性方面处于劣势,导致市场表现远远低于预期。2017年英特尔宣布停产安腾处理器,正式宣告了IA-64的失败。最终,英特尔只能选择和AMD交叉授权拿到AMD64的使用权。从2004H1开始,AMD推出的一系列速龙K8处理器,性能明显超越英特尔奔腾4和奔腾D,英特尔在X86-64架构上的迟疑使得AMD不断抢占英特尔桌面处理器的份额。2005年5月Intel发布了世界上第一款双核CPU奔腾D,但是英特尔是将2个奔腾4Prescott的核心封装在一起,通过前端总线(FSB)分别连接北桥,通过北桥来连接两个核心(所以速度肯定有瓶颈,而且挑主板),其实是“胶水双核”;几周后便被AMD速龙64X2超越,推出了一系列“原生双核”CPU。3)2006-2017:Intel性能再次实现领先2006年英特尔提出并开始执行Tick-Tock战略——每两年升级一次工艺,每两年升级一次架构。每年都有新一代处理器问世,从45nm的Penryn(Core架构第一代产品)一直持续到了14nm工艺的Broadwell。2006年7月英特尔具有革命意义的酷睿2上市,让AMD在桌面CPU市场优势全无,性能全面超越AMD。不久英特尔发布首个4核CPU酷睿2Q和QX;为了应战,AMD在2007年发布了首个4核CPU弈龙系列(X3/X4),但是性能仍然不如酷睿2,此后的弈龙K10架构也出现容易导致死机的严重漏洞。此后英特尔连续推出的酷睿i3/i5/i7性能完爆AMD,2009年上半年AMD发布的与英特尔酷睿同时期竞争的FX推土机(Bulldozer)架构进一步拉开了AMD落后于英特尔的差距。4)2017至今,AMD凭借单核性能大幅提升、先进制程优势全面反超Intel

英特尔从2016年开始陷入工艺制程的瓶颈与Tick-Tock战略脱节,被外界称为“挤牙膏”模式。2017年3月AMD发布锐龙架构让其正式开启一个在PC领域全面反超Intel的时代。2017年3月AMD推出第一代锐龙(Ryzen)架构CPU,第一代锐龙单核性能比英特尔弱,除了凭借更多核心在极个别多线程应用中表现优秀之外,大部分正式应用中其实不如同期英特尔的CPU。直至2018年4月AMD发布第二代锐龙,单核性能有了大幅提升,也解决了内存上的问题;再加上英特尔IDM模式工艺制程升级遇到瓶颈,AMD依靠台积电代工先英特尔一步进入7nm制程,AMD开始大幅抢夺英特尔份额。纵观AMD对Intel冲击的全过程,首先需要说明生态方面由于具备X86的完整授权,AMD不存在这方面的壁垒,那就需要关注技术在这个过程中的对比:第一阶段是自身技术限制而进行的逆向工程跟随阶段,通过15%左右的市场份额韬光养晦;第二阶段的领先,是由于其推出了64位向下兼容的架构,是在长期技术积累上,抓住对手的失误,从策略上先发制人,实现短期反超;第三阶段受制于体量差距和对手策略的调整,再次落于下风;

第四阶段,凭借单核性能的大幅提升,以及对手制程瓶颈,再次实现反超。AMD作为成功案例给后来者的启示,我们认为是:

1)需要在技术上长期积累,垄断型厂商难免“自大”犯错,抓住对手战略部署上的失误,实现短期的抢占市场;

2)后摩尔时代,领先者升级速度显著趋缓,制程瓶颈很可能成为常态,后来者可以抓住这段时间,逐步缩小制程上的差距,加速产品迭代升级,从而减小性能差距;

3)作为通用CPU,单核性能才是基础和关键,努力提升进程和工艺,提高单核性能才是赶超的正确途径。2.服务器:芯片随整机进化2.1服务器CPU竞争首先是服务器架构竞争服务器在万维网兴起以前,一般采用“主机—终端”模式来运行小型机、中型机、大型机,大都采用UNIX操作系统,通过终端登录对主机进行操作。类似于现在服务器的远程操作,这些在局域网里,通过终端进行操作的机器还不是现代的服务器,但在结构上与现代服务器非常类似。大型机——可靠的超高价值服务器。大型机是上世纪六十年代发展起来的计算机系统,其稳定性和安全性在所有计算机系统中是首屈一指的,但价格始终非常高。由于成本巨大,使用大型机系统的一般以政府、银行、保险公司和大型制造企业为主。世界上首个大型机产品为IBM360,当时,IBM这款System360的CPU中包含19套高速计算与内存组合,超过40种外部设备负责存储信息并以双向方式将数据与该计算机进行交互,内置通信功能使System360能够通过远程终端加以操控,完全无需考虑距离因素。在相关程序的支持下,System360能够自行完成活动调度、从而以一刻不停的方式处理计算任务,这就使得系统资源得到了充分利用。IDC对IBM大型主机的演进做了精要的概括:从孤立(siloed)到互联(connected),再到具有变革能力(transformative)。在这个正在演进的第三阶段,在主机平台上进行DevOps和敏捷开发日益普遍,越来越多的企业将主机平台作为一个私有云,与其他私有云及公有云交互。不少企业还在其主机上开发出重要的附加能力,比如利用微服务进行数据分析。也有创新者开始在大型机中构建物联网功能,运行机器学习(ML)和区块链应用程序……这样的主机将全面参与企业的数字化转型,成为其中不可或缺的一部分,因此被IDC称为“具有变革能力的主机“(transformativemainframe)。小型机——DEC和SUN的对决DEC是小型机的发明者,发明小型机之后,很长一段时间内是仅次于IBM的公司。1992年开发了RISC芯片Alpha21064,并基于这种芯片开发出了AXP服务器和工作站,DEC正式进入服务器领域。Alpha21064当时的性能非常强悍,浮点运算性能达到了每秒4亿多次,而中国1992年研制成功的银河二巨型机运行速度才10亿次每秒。DEC的致命劣势是基于高性能的高成本,在与SUN公司的服务器竞争中居于下风。SUN公司生产的SPARC架构服务器价格比DEC的Alpha小型机要便宜很多,DEC始终没有走廉价路线,长期在亏损边缘挣扎,最后于1998年被康柏电脑并购,而康柏电脑则在2001年被惠普并购。惠普对Alpha服务器的支持到2012年结束。2.2云化时代,X86领先优势明显服务器发展到云化阶段,对性能提出更高要求,主要的性能指标大致包括:

1)单颗处理器核心数一般在8核~64核,20核以上居多;

2)支持多路互连,两路、四路、八路等;

3)可靠性、稳定性要求高,常年无故障运行;

4)高端内存,支持ECC等可靠性要求;

5)功耗比较高,一般100W以上。根据服务器的性能指标,服务器端CPU技术特点大致包括:

1)微结构复杂、先进,制造工艺先进,核心数多,单核及多核性能皆优异;

2)指令集功能齐全;

3)片上集成缓存容量大;

4)内存通道数多;

5)I/O带宽高;

6)支持多处理器一致性互连;

7)可靠性高,RAS功能丰富;

8)TDP功耗较高。由于X86处理器起步较早,生态环境较其他处理器具有明显优势,应用X86处理器的服务器销售额占全部服务器销售额的比例约为91%,销售量占比超过97%,处于显著领先的地位。根据IDC全球服务器跟踪报告,2020年全年,全球X86服务器市场销售额为826.5亿美元,较2019年增长3.31%;全球X86服务器市场销售量为1180.2万台,较2019年增长1.82%。服务器企业尝试将ARM架构使用于服务器端,重现ARM在移动终端中的成功,但收效甚微。基于X86对于服务器芯片的长期绝对垄断,以及ARM在移动端的突出表现,部分服务器企业开始尝试推出ARM的服务器,比较突出的包括18年亚马逊推出的CPUGraviton和华为19年基于鲲鹏的泰山服务器。未来服务器市场,依然会是X86绝对领先,ARM只能作为少量补充。必须明确,ARM在移动端成功的核心是低功耗,这不是服务器的第一关注点。ARM处理器是低功耗、小体积的代表,很好地适应了移动端的应用场景,但服务器产品的核心还是性能和生态,上文中也提到了对CPU的高技术要求。复杂指令集的特点就是包含了大量的指令,因此在这种架构的CPU中进行程序设计更简单,每一条复杂或简单的任务都有对应的指令。具体看,X86因其长期耕耘,目前绝大多数服务器端的程序开发都是基于X86完成,为了云端部署的简单稳定,开发者惯性选择该架构的云端服务器。在迁移成本方面,云端部署过程中需要考虑操作系统内核、虚拟化技术、云存储、云安全等,各项分支都是由X86主导,若选用ARM架构的服务器,在运维到应用各方面都要进行ARM指令集的交叉编译,高成本且低效。因此,我们预计未来服务器市场还将延续X86绝对领先的局面,ARM主要作为一些边缘计算的补充。3.国产CPU孰能率先崛起国产CPU的“后发劣势”明显,在“十五”期间启动发展国产CPU的泰山计划,2006年正式启动的“核高基专项”才让国产CPU快速发展。在国家支持下,孵化出鲲鹏、飞腾、龙芯、兆芯、海光、申威等一批优质国产CPU公司。我们选取其中较为成熟的海光CPU为例,介绍CPU设计过程中的核心和关键,结合之前的回顾,以及对现有国产CPU的理解,回答以下三个问题:

国产CPU有哪些路线?国产CPU短板在何处?

国产CPU每条路应该怎么走?3.1CPU是如何设计的?基本构成:一般来讲,CPU根据不同的产品规格定义,需要在一块基板上封装1至4颗裸片。裸片的内部结构非常复杂,主要功能模块包括处理器核心(Core)、片上网络、各类接口控制器等;除硬件电路外,裸片中还集成了复杂的程序代码(“微码系统”)。以海光CPU为例,各部分功能如下:

1)处理器核心。每颗“裸片”具有8个处理器核心(含高速缓存),不同规格的海光CPU包含1至4颗裸片,进而具有数量不等的处理器核心。处理器核心是CPU的关键的控制、计算部件,决定了CPU最主要的技术特征。2)片上网络。片上网络是CPU内部数据传输的通道,包括控制网络和数据网络。片上网络的带宽、延时对多核处理器的性能影响较大。3)接口控制器。不同的接口控制器用于连接CPU所搭载、控制的不同外部设备。例如:内存控制器用于访问DDRSDRAM内存,PCIe控制器用于连接PCIe设备,USB控制器用于访问USB设备,SATA控制器用于读写SATA设备等。4)微码系统。微码系统由微码程序和对应的执行硬件组成。通过微码程序的运行,将复杂的X86指令翻译成相对简单、规整的微码指令。微码系统直接影响处理器的安全,包括变更安全算法(国密密钥)、利用微码系统修复些安全漏洞、扩展安全指令集等。5)HMI/xHMI多片互联控制器。HMI/xHMI具有高带宽、低延时特点,可以完成裸片间和处理器间的高速互联,从而实现MCM和Chiplet的片上封装,以及双路服务器架构设计。以海光CPU为例,需要经过以下设计步骤:

1)架构设计。处理器系统架构设计包括处理器功能逻辑设计和微结构设计,对处理器功能、性能和生态至关重要。在架构设计环节中,功能逻辑设计是指基于对产品预期和产品定义,规划出处理器产品的模块架构、功能逻辑,以及指令集、数据结构、接口协议等;微结构设计是规划出集成电路裸片的具体实现方式,包括流水线设计、逻辑单元设计、高速缓存结构、片上网络、接口控制器设计等。2)电路设计。电路设计是将处理器芯片各个功能模块用硬件语言设计出来,形成可供晶圆代工厂使用的电路版图。处理器核心的微结构精巧,流水线级数多,主频高,电路代码设计复杂。3)微码系统设计。微码系统设计包括微码软件编程、微码执行硬件研发。微码软件包括微码程序、微码编译器和微码补丁。微码系统设计贯穿处理器设计全过程,通过微码补丁形式还可以修复部分硬件设计缺陷。4)安全模块设计。安全模块设计包括处理器安全架构、专用硬件、软件、密钥管理等,贯穿处理器设计全过程,在处理器量产后仍需要为可能出现的安全漏洞提供及时、有效的修复方案。5)仿真模拟。仿真模拟是指利用专用软件、高性能仿真模拟器对处理器核心和电路设计进行模拟验证。海光高端处理器电路规模大,必须使用仿真加速专用硬件来提高仿真模拟的效率。6)产品设计。产品设计根据终端应用需求,规划公司具体产品配置及内部构成。产品设计过程还需要考虑基板开发、后端设计、工程样机系统设计、产品测试、测试板卡和工具软件开发等工作。7)流片工艺优化。晶圆代工厂基于公司提供的电路版图进一步设计出掩膜,然后经过复杂的雕刻过程生产出裸片。公司流片工艺团队需要和公司芯片设计、晶圆代工厂工程团队形成深度的技术互动,不断升级芯片雕刻工艺,验证流片工艺流程,提升晶圆制造良率。流片工艺优化环节可分为流片工艺升级、晶圆加工流程验证、晶圆级测试等环节。8)基板及封测工艺开发。公司将处理器封测工作委托给外部封测代工厂完成,但是基板开发、封装工艺流程验证、测试程序开发等仍需要公司完成。9)硅后验证。处理器完成封装以后,需要进行大量的测试工作,统称为硅后验证。硅后验证工作量较大,需要进行工程样机系统设计、产品测试、测试板卡和工具软件开发等大量支持产品市场应用的验证测试工作。3.2国产CPU各条路怎么样?目前国产CPU的服务器主要应用于电信运营商、金融、互联网等领域,例如,电信运营商云服务资源池系统支撑云业务应用,银行和证券公司查询、交易系统,互联网的搜索、计算服务、存储等应用;国产CPU的工作站主要应用场景为工业设计和应用、图形图像处理,例如VR、AR图形渲染场景,以及智能工厂数字孪生应用等。当前,国产CPU公司根据使用的架构走出三条不同的道路:1)X86架构:兆芯、海光。此种模式属于IP内核授权的模式,目前是仅内核层级的授权,优点是技术门槛低、性能起点高、没有生态壁垒,缺点是自主可控的程度低,且购买授权的成本较高。以这条路线发展,不存在生态壁垒,可以借鉴本文1.3中AMD崛起的路线和策略,在技术上通过不断迭代逐步缩小差距。但是这种购买授权的方式,没有从根本上解决自主可控的需求,在中美关系不明朗的背景下,确实面临授权中断的风险,市场上一些激进的声音甚至认为使用X86的不能称为“国产芯片”。2)ARM架构:飞腾、鲲鹏。此种模式为指令集架构授权,自主化程度相对较高,ARM主要有三种授权等级:其中指令集层级授权等级最高,企业可以对ARM指令集进行改造以实现自行设计处理器,此前海思、飞腾已经获得ARMV8永久授权,今年4月Arm确认Armv9架构不受约束,华为海思可获授权。以这条路线发展,存在较高的技术门槛,ARM架构目前在桌面和服务器端的生态远不如X86,但是指令集架构的永久授权,一定程度上满足了自主可控的需求,但是依然存在未来更新版本被断供的风险。3)MIPS等自主架构:龙芯、申威。此种模式是自主研制的指令集,高度自主可控,但是技术门槛高,生态构建极其困难。以这条路线发展,最大的困境是生态上的建设,如何在落后的情况下,建立起可靠可持续的生态,是重要课题。CPU的下游应用市场主要分为:政务及重点行业市场、企业级市场、消费级市场。其中,政务及重点行业市场对安全性以及自主可控要求最高,同时对生态的要求相对最低,是与国产CPU前期发展水平相匹配的,因此这部分市场是国产CPU成长的根基所在。未来,随着产品性能不断优化,生态逐步趋于完善,企业级市场将为国产CPU提供巨大市场空间。基于目前国产CPU替代市场的主要特征,我们认为,使用ARM架构的国产CPU,将在短期内受益于重点领域信创市场的快速增长;使用自主架构的国产CPU,生态建立需要一定的时间,中长期看,有望实现党政及特殊领域的大面积甚至全面替代;使用X86架构的产品,性能和生态显著较好,短期内可利用成本优势打开一部分企业市场,但长期看受外部影响较大,存在较大的不确定性。3.3国产CPU到底弱在哪?想要探讨国产CPU未来的走势,就必然要面对一个十分现实的问题:国产CPU到底弱在哪里?我们认为,国产CPU与全球领先水平的差距主要概括为:性能差距、生态差距。性能上,国产CPU存在明显劣势。1、单核性能不行还是核数不够多?目前国产CPU的关键问题还是在于单核的性能较弱。Intel还在做4核产品的时候,国内核高基计划就已经实现了8核产品的研制,但是整体性能完全劣后于Intel同期产品。2、工艺不行还是设计能力不行?目前国产CPU的主要差距在于设计能力上。以Intel和完全自主的龙芯对比,Intel在130nm工艺就做到了主频3.8G,而龙芯的3A1000在同等工艺和核数前提下,主频只有1G,如果将Intel产品降到1G,性能是龙芯的5倍。纵向对比看,同样以龙芯为例,其第二代产品3A2000在没有提升主频的前提下,通过设计能力的改进,性能提升了2.5倍;3A3000提升至28nm制程后,主频提升至1.5G,性能提升1.6倍;3A4000在原工艺基础上,通过设计提升性能2倍;3A5000提升至14nm制程,性能提升1.6倍;目前在研的3A6000,据龙芯介绍,其性能已经达到了Intel在14nm的性能水平。从纵向发展历程来看,相同工艺条件下,设计能力提升带来的产品性能提升十分显著,在fabless模式下,设计能力的差距显得尤为重要。3、产品性能完全决定用户体验?

产品性能是影响用户体验的重要因素,但是系统优化同样重要。例如,在2010年iPad就风靡全球,但当时的CPU性能只有Intel的1/2到1/3左右,但是用户体验和评价都很好,就是得益于苹果的系统优化。而国产CPU由于积累不够,即使在产品性能已经能满足某些重点领域信创的要求的情况下,用户体验依然比Intel差一些。性能差距只是外在表现,我们认为造成这种差距的内因,主要有以下几点:

1、微架构设计能力存在显著差距。所谓微架构,即在指令集架构体系之内的一种结构设计,是CPU内部晶体管的一种排列方式,属于指令集架构体系的框架之内,例如Intel的Icelacke、Broadwell。Intel和AMD不断更新微架构,实现性能的不断迭代提升,国产CPU的微架构在乱序执行、高速缓存、多核互联等技术上,由于起步较晚,都与先进水平有一定差距。2、定制化水平差导致精细度不足。Intel针对特定领域和客户,会采用高度定制化的设计,例如人工设计版图、采用锁存器Latch替换触发器flipflop、全定制设计关键单元等方案。定制化的实现需要多年的技术积累和人力投入,目前国产CPU很难实现,基本还是采用传统的EDA工具生成版图和做版图优化的方式,精细度远低于定制化产品。3、使用通用EDA工具缺乏协同。Intel等欧美大厂许多都有自研的EDA工具或拓展,以及成熟的flow,设计过程中出现的问题可以与EDA部门直接协同解决,显著提升了设计效率和设计能力,不断拓展边界,而国产CPU厂商目前普遍采用的是外购的EDA工具,缺少与设计工具的协同,且国产EDA工具竞争力较弱,这一环节也难以实现自主可控。4、与Foundry配合不够密切。在生产模式上,Intel是典型的IDM厂商,AMD虽然是Fabless厂商,但与之前分拆出去的GlobalFoundries保持密切联系,两者都能实现设计与制造环节的密切配合与协同。国产CPU由于起步晚、规模小以及国内芯片制造能力弱,都是Fabless模式,难以与Foundry实现密切配合,限制了产品技术发展的速度。落后的软硬件生态系统是制约国产CPU发展的另一瓶颈。X86是目前桌面和服务器领域的绝对主流架构,所以选用X86架构的受影响最小,可以直接使用Windows系统及软件,ARM架构的生态在全球范围内逐渐完善,而使用自主架构的面临巨大挑战。生态系统很重要的一点是能够吸引全球程序员共同参与的各类应用软件开发的盈利模式、知识产权分享机制等制度安排。以龙芯自主研制的LoongArch架构为例,需要耗费大量时间和人力开发编译器,芯片流片成功后,还需要移植Linux内核、Android系统等,后期系统的软件也涵盖了驱动层、中间层到应用层,还需要不断针对这种架构进行迭代优化。前期即使大量投入,如果软件上适配和推广不足,销量受限,软件开发者便会激励不足,用户更少,引起恶性循环,商业模式便会出现问题。3.4每条路线关键是什么?X86:专注技术,师夷长技,形成自身迭代能力对于使用X86架构的公司来说,基于良好的技术基础以及继承X86完整的生态,可以通过模仿先进产品及技术路线,率先实现非关键领域的国产替代,并在此基础上尽快吸收关键技术,形成自身的迭代能力。以海光信息为例,AMD仅提供技术授权以及针对技术授权的部分服务支持,不会提供后续更新技术,相关技术面临迭代风险。海光按照协议和AMD同时在该技术授权的基础上进行产品研发,在2016年推出的第一代典型CPU系海光7185,与AMD基于该技术的第一代产品AMDEPYC7551有少许差距,但差距较小,不存在代际差异;19年受到美国商务部影响后,海光推出海光二号,并为适应国内用户使用需求,增加了国密算法等安全增值功能,证明了公司已经完成了对AMD授权技术的消化吸收。海光三号成功流片、海光四号完成了电路设计和性能模拟,证明了公司全面掌握了高端处理器设计技术,具备了产品迭代研发能力。ARM:短期内抓住行业机会,发展已获授权指令集2021年苹果发布了M1芯片,与以往选用X86架构不同,M1芯片采用基于Arm-ISA的内部处理器和CPU微体系结构,是苹果首款针对Mac设计的SoC,根据苹果的的宣传材料,在10W的功耗限制下,M1芯片可提供传统X86笔记本处理器2倍以上的CPU性能。苹果M1一经上市受到广泛关注,其性能也被用户认可。但苹果M1的成功,不足够说明ARM在桌面和服务器端已经可以超越X86。苹果M1性能的高水平的表现主要是基于苹果微架构上的优势以及工艺上的领先。微架构方面,采用了“疯狂堆料”的方式,并采用了台积电的5nm工艺。这部分的优势显著,并且在能耗方面显著优于X86,至于类似视频剪辑等功能,可以直接交给解码、编码的硬件单元完成,使用体验更佳,但是这种方式的问题在于,成本过高,苹果可以用很高的整机利润去摊平这部分处理器成本,但是国产CPU显然难以复制。自主指令集:产品性能+生态融合,协调步伐除本身的性能要求需要符合用户基本需求外,生态融合也是需要同步跟进的关键点,否则只能面向一些软件需求极低的下游,市场空间局限性大。破局之计以龙芯为例,自研指令集LoongArch充分考虑了兼容需求,可以通过“指令系统创新+二进制翻译”的方式,运行其他平台上的二进制应用程序,从而达到生态融合的目的。为支持芯片销售及应用,龙芯还开发了基础版操作系统及浏览器、Java虚拟机、基础库等重要基础软件,并以两种方式免费提供给客户。4.国产CPU量价拐点已现4.1价:逐渐市场化CPU定价策略已经较为成熟:阶梯价格+项目特价。考虑到芯片行业的特点并参照国际同行业领先芯片企业的定价模式,CPU行业主要采用阶梯价格策略,接受针对项目的单独特价申请。阶梯价格主要适用于服务器厂商客户的日常采购(根据采购数量区间阶梯变动),特价一般用于战略级竞争项目(最主要)、产品适配导入项目、产品促销等。以海光芯片为例,CPU价格已经逐渐市场化。2018年,公司研发的首款海光一号产品刚刚面世,初期产量较小,研发适配工作量大,公司主要比照同行业领先厂商竞品价目表的价格进行定价,定价策略较为保守,产品平均单价较高。2019年下半年开始,公司形成了阶梯价格与特价相结合的定价机制,并稳定执行至今,产品销售均价较2018年整体下调。2020年以后,全球芯片行业供应链相对紧张,原材料价格呈现上涨趋势,公司对新代际产品较上一代产品定价有所上涨。4.2量:弹性极大CPU的下游应用市场主要分为:政务及重点行业市场、企业级市场、消费级市场。其中,政务及重点行业市场对安全性以及自主可控要求最高,同时对生态的要求相对最低,是与国产CPU前期发展水平相匹配的,因此这部分市场是国产CPU成长的根基所在。测算CPU市场规模,实际应该分为:测算整体市场规模(可参考历史静态数据)、可国产替代市场规模。从整机形态,可分为PC、服务器两个方向。整体静态市场,2021年,根据IDC数据,全球PC出货近3.5亿台,全球服务器出货超过1300万台。考虑国产CPU未来较长一段时间主要聚焦国内市场,国内出货量更有代表性。整体市场,PCCPU需求超过5000万颗/年,服务器CPU需求约800万颗/年。根据行业惯例,一台PC对应一颗CPU,2021年中国PC出货量超过5000万台,则整体PCCPU需求超过5000万颗。根据IDC数据,服务器市场超过85%的服务器为2路服务器,即一台服务器对应2颗CPU,则中国区整体服务器CPU需求约为800万颗。假设PCCPU价格为1000元/颗,服务器CPU为8000元/颗,则PCCPU市场规模超过500亿元,服务器CPU静态市场规模约640亿元。中短期看,确定性最高的是,可国产化市场规模。国产PCCPU年化市场规模约为200亿元。考虑PC采购不同机构性质,分为核心替代(公务员群体)、重点替代(事业编制群体)、逐步替代(国有企业群体)、可选替代

(一般企业工作人员),假设四类替代群体,稳定期后,国产PC采购比例分别为80%、60%、40%、10%。根据国际统计局数据,可得四类群体整体人员数量。假设单科PCCPU价格为1000元,则PCCPU整体规模为1020亿元。假设PC5年完成折旧,则国产PCCPU年化市场规模约为200亿元。国产服务器CPU静态市场规模约为139亿元。根据IDC服务器数据统计,可知党政、通信、金融等重点行业2021年服务器出货量,假设党政、通信、金融、其他行业国产服务器采购比例分别为80%/40%/30%/10%,参照服务器CPU市场价格,假设服务器CPU价格为8000元/颗,保守假设国产服务器全

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论