2024 AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第1页
2024 AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第2页
2024 AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第3页
2024 AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第4页
2024 AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

端侧AI爆发元年,软硬架构全面升级AIGC

行业深度报告(15)创智汇德整理,仅供学习参考

阅读在本报告尾部的重要法律声明华西证分股份有限公司HUAXI

SECURITIES

C0.,LTD.仅供机构投资者使用证券研究报告|行业深度研究报告◆

终端AI爆发元年,AI

的Iphone

时刻已到来:英特尔、AMD、

高通、英伟达相继或即将发布AIPC产品,端侧AI争夺战已打响,以“CPU+GPU*为主的芯片组竞争格局更加明确。整机端,联想、戴尔、惠普、华硕等全力支持AI电脑。手机端,苹果正式宣布人工智能计划,苹果智能有望引领端侧AI全面爆发,原因是AI赋能Siri,深度联接多个APP,

从而生成量身定做的生成式人工智能助手,类似于“钢铁侠”中的个人助理“贾维斯”。我们判断,AI的Iphone

时刻已到来,AI需求有望带动换机潮。◆

AI

促使软硬件架构全面升级,端云协同成为必选项:云端AI与终端A缺一不可,端云协同成为必选项,短期来看,端侧AI对硬件规格革新要求

较小。长期来看,端侧大模型的爆发有望呈现指数级别增长,相关零部件有望升级。原因是未来端侧AI算力升级的逻辑与英伟达架构升级的逻

辑相似,高算力与高功耗相匹配。AI

深度融入操作系统,已成产业趋势,例如安卓15携手Gemini、Copilot

融入ows11、AppleIntelligence深度集成于苹果操作系统中。◆

盘古+鸿蒙星河+麒麟+昇腾+鲲鹏打造国产最强生态:我们判断A端侧爆发为产业趋势,A

应用离落地更进一步,因此国产领域中华为拥有最

完整的生态,软件端,盘古可赋能干行百业,鸿蒙可实现万物互联,例如,智慧屏、穿戴设备、车机、音箱、手机等,硬件端,端侧,麒麟已

重回巅峰,鲲鹏+昇腾有望构筑全球算力体系的第二极,因此我们判断在终端爆发元年,华为有望凭借盘古+鸿蒙星河+麒麟+昇腾+鲲鹏最强

生态领衔演绎国产软硬件生态崛起。√

投资建议:受益标的为:零部件:飞荣达、芯海科技、泰嘉股份等;鸿蒙:软通动力、九联科技、润和软件、芯海科技、智微智能等;国产终

端厂商:华勤技术、软通动力、神州数码等;应用:金山办公、万兴科技、润达医疗等;技术开发:中科创达等。苹果产业链及相关零部件厂

商、全球终端厂商等。◆

风险提示:核心技术水平升级不及预期的风险、AI伦理风险、政策推进不及预期的风险、中美贸易摩擦升级的风险。创智汇德整理,仅供学习参考核心逻辑:2目录01终端AI爆发元年,Al的Iphone时刻已到来02

Al硬件升级趋势愈发明显03

Al重塑操作系统04软硬件全面自主可控,华为领衔演绎国产生态崛起

05投资建议:梳理AIGC

相关受益厂商06风险提示创智汇德整理,仅供学习参考

3创智汇德整理,仅供学习参考01

终端AI爆发元年,Al的Iphone时刻已到来推荐用于intelCORe英特尔°酷点"Ultra处理器intelCORe英特尔°酷营处理器(系列1)eCORe英特尔°酷占处理器(第14代)英特尔°处理器日常性能具备游戏功能人工智能计算发烧友游戏创智汇德整理,仅供学习参考◆

英特尔于2023正式推出A

IPC

处理器:继2023年10月19日宣布启动A

I

PC加速计划后,英特尔将奉上A硬件大戏:在2023年12月14日的“AIEverywhere”发布会上正式推出AIPC处理器——代号Meteor

Lake的酷睿Ultra处理器。据英特尔介绍,Meteor

Lake处理器

“代表着英特尔40年来最重大的架构转变,为未来10年的PC创新奠定基础”,旨在“为AIPC时代铺平道路”:该芯片采用分离式模

块架构,由计算模块、SoC模块、图形模块以及IO模块这4个独立模块组成,并通过Foveros

3D封装技术连接。◆

英特尔国酷睿M

UItra处理器为端侧AI而生:采用3D

性能混合架构,支持高级AI

功能

,A

功能包括办公、写作、创作等功能。英特尔因酷睿M

Ultra处理器都能利用三个专用引擎(CPU、GPU

和NPU)解

锁AI能量,创造沉浸式显卡体验,并保持高性能、低功耗

运行。英特尔Q

AI

Boost是专为低功耗

AI

加速和CPU/GPU

分载打造的集成式AI引擎,而英特尔B

Gaussian&NeuraAccelerator

可在处理AI

语音和音频应用的同时解放CPU

资源,以便保证系统整体的性能和响应速度。

1.1.1

AIPC芯片侧:英特尔发布酷睿Ultra

处理器英特尔AIPCUItra示意图英特尔UItra处理器与其他处理器对比资料来源:芯语,英特尔官网,华西证券5◆

2024年AMD

发布新一代处理器和芯片组产品:根据中关村在线消息,2024年中国台北电脑展上,AMD

发布了全新的锐龙9000系列

桌面级处理器、X870/X870E系列芯片组以及面向AIPC的RyzenAI300系列移动级处理器平台,这也标志着新一轮硬件“竞赛”正式

拉开帷幕。◆锐

龙AI

300系列为AI

PC赋予强劲AI

算力:基本规格方面,AMDRyzen

AI9

HX370处理器采用12核24线程设计,加速频率最高5.1GHz,

总缓存36MB,NPU

算力提升到了50TOPS,iGPU

升级到了Radeon890M,Ryzen

AI9365则是一颗10核20线程处理器,

加速频率最高为5GHz,

总缓存34MB,NPU

算力同样为50TOPS,iGPU

型号为Radeon

880M。◆

规格大升级,其目的是赋予强劲算力:全新的锐龙AI300系列两款首发型号的升级包含三个方面,首先,基于XDNA

2架构打造的全新

NPU,

其算力提升到了50TOPS,

而现役的8040系列算力仅为16TOPS,

同时在能效表现上更加出色。其次,基于Zen

5架构设计的CPU

核心数量最高达到了12核24线程,多线程性能进一步提升。其三,基于RDNA3.5架构打造的iGPU,

其计算单元提升到16个,图

形性能进一步增强。3rdGenAMD

Ryzen"AINext-gen

AI

PCexperiences

demand

the

best

of

NPU,CPU,and

GPU

architecturesAMDaXDNA

2Al

300

SeriesRyzen”A9365AMDaRDNA

3.5Next-GenGPUUpto

16compute

units

1.1.2

AIPC芯片侧:AMD

锐龙AI

300为AIPC赋予强劲算力World'sbestprocessorforCopilot+PCsRyzen”Al9HX370创智汇德整理,仅供学习参考AMD锐龙AI

300规格示意图

AMD锐龙AI

300架构示意图Next-Gen

NPU50

TOPSNext-GenCPUUp

to

12

Cores,24ThreadsAnnouncngatComputex2024:AMD

RyzenTMAMDARYZEN

Al6处理器高通Or

yon

CPU高通Ad

renoGPU高通He

gag

onNPU记忆核心总缓存最大多线程频率双核加速每秒万亿次浮点

运算N

PU排行榜内存类型传输速率骁龙X

EliteX1E-00-1DEX1E-84-100X1E-80-100X1E-78-100骁

龙X

PlusX1P-64-100124

2

兆3.8GHz4.3

GHz4.6四十五LPDDR5x8448兆吨秒124

2

兆3.8GHz4.2

GHz4.6四十五LPDDR5x8448兆吨/秒124

2

兆3.4GHz4.0

GHz3.8四十五LPDDR5x8448兆吨/秒124

2

兆3.4GHz没有任何3.8四十五LPDDR5x8448兆吨秒104

2

兆3.4GHz没有任何3.8四十五LPDDR5x8448兆吨/秒◆

2024年COMPUTEX

大会上,高通展示了其最新的AI

PC产品,标志着PC

产业正进入一个新的时代:高通的骁龙X系列平台是此次展会

的核心亮点,搭载这一平台的PC产品将具备强大的AI

功能,如实时翻译、智能助理和多模态交互等。这些功能展示了AIPC

在办公、创

作和生活中的广泛应用前景。◆

高通骁龙X及骁龙Xplus专为人工智能构建:SnapdragonXElite能够以极快的速度在设备上运行超过130亿个参数的生成式

AILLM

模型。它还包括超低功耗

Qualcomm

B

Sensing

Hub内部的更新双微型NPU,

以增强安全性、登录体验和隐私,包括在睡眠模式下

唤醒设备的能力。敏感数据可以保留在用户的笔记本电脑上,以通过边缘智能提高安全性。Qualcomm

AI

Engine

支持owsStudio

Effects和许多其他

AI

加速应用程序和体验。资料来源:芝能智芯公众号,高通官网,

创智汇德整理,仅供学习参考1.1.3

AIPC芯片侧:高通骁龙X

系列全面助力AIPC高通骁龙XElite及X

plus相关参数一览7◆

英伟达持续加码AI,为世界构筑算力基石:NVIDIA在CES2024发布3款全新GeForceRTX40SUPER系列显卡,其中包括GeForceRTX4080

SUPER、GeForceRTX4070TiSUPER、GeForceRTX4070SUPER,它们是AIPC的核心,为最新游戏提供超强动力,为用户带来全新升级和

体验。◆

英伟达计划推出Blackwell内核的AI

PC芯片:英伟达正在准备推出一款将下一代ARM

内核与其BlackwllGPU架构相结合的芯片,根据

C114消息,英伟达正在准备一款片上系统(SoC),将Arm的Cortex-X5核心设计与基于其最近推出的Blackwll架构的GPU相结合。◆

以“CPU+GPU

”为主的芯片组竞争格局更加明确:目前,芯片厂商的竞争格局不再割裂,过去,CPU

的龙头企业为AMD、Intel,GPU的龙

头企业为英伟达,而如今芯片厂商已经逐步补强自身“短板”,其目的在于维持自身在应用场景中的龙头地位,例如英伟达自身的GraceCPU,亦或者是Intel发布自身酷睿UltraAIPC处理器,此款处理器为集中式显卡,此显卡集成了CPU、GPU、NPU、Io芯片。RTX

2070RTX4070

SUPERRTX

3070Shader

CoresAda

Lovelace36

Shader

TFLOPSAmpere20Shader

TFLOPSTuring8

Shade

r

TFLOPSRT

Cores3rd

Gen82

RT

TFLOPS2nd

Gen40

RT

TFLOpGIst

Gen24

RT

TFLOPSTensor

Cores4th

Gen568

AI

TOPS3rd

Gen163

AI

TOPS2nd

Gen63

AI

TOPSDLSS322NV

EncodersAV1/H.264H.264H.264Frame

Buffer12GB

G6XBGB

G6BGB

G6Memory

Subsystem36MB

L2504

GB/sec4MB

L2448

GB/sec4MB

L2448

GB/sAverageGaming

Power200W215W177WVideoPlayback

Power16W20W18Wldle

Power11WW1OW号

·

西TGP220WW

公众搜狐号@智趣东西RTX

2080

SUPERRTX

40BD

SUPERRTX

3080TiShader

CoresAda

Lovelace52

Shader

TFLOPSAmpere34

Shader

TFLOPSTuring11

Shader

TFLOPSRT

Cores3rd

Gen121

RT

TFLOPS2nd

Gen67

RT

TFLOPS1st

Gen

34

RT

TFLOPSTensor

Cores4th

Gen836

AI

TOPS3rd

Gen273

AI

TOPS2nd

Gen89

AITOPSDLSs322NV

EncodersAV1/H.264H.264H.264Frame

Buffer16GB

G6X12GB

G6X8GB

G6Memory

Subsystem64MB

L2736

GB/sec6MB

L2912

GB/sec4MB

L2AverageGaming

Power246W352W227WVideoPlayback

Power22W27W17WIdle

Power15W13W10WTGP320W公众号

·

西搜狐号@智趣东创智汇德整理,仅供学习参考1.1.4

AIPC芯片侧:英伟达计划推出Blackwell内核的AI

PC芯片华西证分HUAXISECURITIES英伟达RTX4080SUPER架构参数一览英伟达RTX4080SUPER架构参数一览496

GB/s西8◆联想AIPC

具有五大特征:其中包括,自然语言交互的个人智能体、内嵌个人大模型、标配本地混合AI

算力、开放的AI

应用生态、设备

级个人数据&隐私安全保护。◆

今年世界通信大会上,联想已经推出四款A

IPC产品:根据腾讯网消息,2月27日,2024年世界移动通信大会(MWC2024)

上,联想集团

推出全新的

ThinkPad商务AIPC。

此次发布的最新一代ThinkPad

共有四款产品:ThinkPad

T14第

5

、ThinkPad

T14s第5代ThinkPadT16

3代以及ThinkPad

X12Detachable第2代。这些产品均配备了新一代英特尔酷睿

Ultra

处理器,内嵌AI软件工具。◆

联想创新科技大会,联想发布多款AIPC产

品:其中包括YogaBookAI元启版、YogaPro16sAI元启版、ThinkPadT14p

A元

版ThinkBook16pAI元启版、YogaAir14AI元启版、小新Pro

16AI元启版六款AIPC

新品。售价为5999元起步,AIPC

价格比普通PC略微昂

贵。ThinkBookPlusGen

5

Hybrid示意图联想Yoga

Book9i示意图创智汇德整理,仅供学习参考

1.2.1AIPC整机侧:联想正式推出AIPC产品,个人电脑进入全新时代资料来源:IDC、太平洋科技,腾讯网,9◆

戴尔已经发布多款A

IPC产品:2023年12月19日,全球PC巨头戴尔发布A

IPC新品灵越13Pro,搭载全新英特尔A

IPC处理器酷睿U

Itra,率

先开启AIPC时代。灵越13Pro能够本地流畅运行200亿大语言模型,支持StableDiffusion文生图图生图等功能。此外,5月21日,戴尔科

技公司在微软的年度会议上宣布推出五款全新增强型AI电脑,其全系列产品均搭载高通骁龙X系列芯片。◆

宏碁、华硕、惠普、联想和三星也都“全力支持”A

电脑:微软在年初发布新品发布会,微软CEOSatyaNadella宣布,微软将A

助手

Copilot全面融入ows

系统,发布了首批AI个人电脑(AIPC)。

新的AIPC被称为“Copilot+PC”,号称是“有史以来速度最快、最适

合AI的PC”。主要的OEM合作伙伴有宏碁、华硕、戴尔、惠普、联想和三星。◆

我们认为AIPC为大势所趋,AIPC争夺战已开启,AI应用落地的场景更加明确。

1.2.2

AIPC整机侧:戴尔、微软、惠普等全面加入AIPC

争夺战创智汇德整理,仅供学习参考图示仅供参考,请以实际收货为准。intelevO戴尔灵越13Pro产品示意图Copilot+PC

示意图10◆

苹果正式宣布人工智能计划—苹果智能:在2024

WWDC

大会上,苹果宣布了备受期待的人工智能计划-苹果智能。CEO

蒂姆库克强

调了隐私和个性化的必要性,目标是“超越人工智能”,进入“个人智能”的领域。苹果的克雷格·费德里吉表示,苹果智能背后的生

成模型将在iOS、iPadOS和macOS

上可用。苹果智能包括多种功能,从通知摘要到A生成的表情符号。它还将增强新版Siri,使苹果的

AI助手在自然语言处理方面更加功能强大和出色。◆

苹果宣布Siri在需要时可以利用OpenAI

的ChatGPT

:

苹果机器学习官网公布了AppleIntelligence的详细信息,AppleIntelligence

总体来说分成三个部分来实现:自研端侧模型、自研云端模型,再加上OpenAI的GPT

大模型这三套系统。◆

苹果智能包括五部分能力,AI能力强大:五大能力分别是大模型能力、直观的用户体验、深度集成、个性化上下文、隐私设计等等,AI

能力包括智能写作、图像生成、文本摘要、情感表达能力等等。AppleIntelligence由三部分组成苹果Apple

Intelligence

五大特点PowerfulIntuitiveIntegratedPersonalPrivateAppleIntelligence这三套系统资料来源:FoxData,

新浪科技,华西证

1.3.1手机侧+其他:苹果智能引领端侧AI全面爆发创智汇德整理,仅供学习参考自研云端模型自研

端侧模型11◆

通用模型厂商与终端厂商的合作大于竞争:我们判断通用大模型厂商,需要借助终端厂商的庞大设备生态,作为大模型落地的土壤,回

收基座模型的庞大投入。借助端侧的设备数据,更好地解决大模型的相关问题,推动模型进化。而终端厂商,需要通用大模型(尤其是

尖端版本的云端大模型)作为体验支撑,为用户提供最先进的AIGC应用和体验,避免在基座模型上投入太高的研发成本,也避免在AI

体验上被其他终端厂商拉大。◆

ChatGPT

已集成到Apple

各个平台:Apple

正在将ChatGPT

访问集成到iOS

18、iPadoS

18和macOS

Sequoia中的体验中,让

用户无需在工具之间切换即可访问其专业知识以及图像和文档理解功能。在需要帮助时,Siri可以利用ChatGPT

的专业知识。在将任

何问题以及任何文档或照片发送到ChatGPT之前,Siri都会询问用户,然后直接显示答案。此外,ChatGPT

还将在Apple的系统级

写作工具中提供,该工具可帮助用户生成他们所写内容。借助Compose,用户还可以访问ChatGPT

图像工具,以各种样式生成图像来补充客户所写的内容。Compose允许用户访问ChatGPT图像工具

Siri使用ChatGPT

示意图

1.3.2苹果与Open

AI合作,ChatGPT深度融合进苹果设备

创智汇德整理,仅供学习参考12◆

文本端,苹果文本可以实现理解和创造语言的新功能:重点在于邮件、通知、信息的优化和总结,重

点功能在于生成摘要、文本矫正、个性化重写等功

能。图像端,加入自主表达能力:在于文生图、图生图标定的更新,并在相册中添加AI回忆、搜图、消除

等功能,例如在备忘录中,用户可以通过ApplePencil

工具面板中的新Image

Wand访问

ImagePlayground,

让笔记更具视觉吸引力、给好友添

加个性化图片信息等。使用

Summarise,

生成图表表达形式ARCH201

Lecture

12RCH/TECTVRE/N

/NDIA15t—18上cnhuviegCHH

A

TR1Trpiclly

moornarenhhou0

Commple×

1.3.3苹果展示了应用+系统的AI功能,整体生态实现领先创智汇德整理,仅供学习参考8

用Teaching

Holistic

HealthBrainstormforfirst

in-classsessionTopic

idea:Mind-BodyConnectiongraders."Mind-BodyConnection"couldbeacoolangle.Lotsofdifferentways

to根据照片生成自主化电影示意图文本摘要,重点提示示意图个性化Genmoji示意图草图生精图示意图Notes3

Breathe

out13Siri进入新时代:1、

Siri融入丰富的语言能力理解,更加

自然化;2、Siri现在可以为用户提供设备支持、3、Siri现在可以在应用程序内和跨应用程序执行数百项新操作;4、Siri将能够提供针对用户及其设备上的信息量身定制的

智能。隐私安全问题无需担心:AppleIntelligence依赖于理解

深层个人背景,同时保护用户隐私,借助私有云计算,AppleIntelligence可以灵活调整和扩展其计算能力,并

利用更大的基于服务器的模型来处理更复杂的请求。这些

模型在搭载Apple

芯片的服务器上运行,为Apple确保

数据永远不会被保留或泄露奠定了基础。苹果智能的核心逻辑是,AI赋武能Siri,深度联接多个APP,从而生成量身定做的生成式人工智能助手:过去各个APP

之间独立运行,生态和数据互不连通,而现在,通过AI赋

能苹果系统,可以实现打通APP

之间的信息壁垒,通过对

个人的学习,从而为客户实现量身定做的生成式人工智能

助手,好比“钢铁侠”中的个人助力“贾维斯”,为AI

用提供更多可能。9:41about

books:lvanaHong

ThursdayIvana

Hong

4/12/24创智汇德整理,仅供学习参考1.3.3苹果与Open

AI合作,ChatGPT深度融合进苹果设备◆◆◆资料来源:苹果官网,华西证券研究所Siri

提供量身定做的智能示意图Siri跨应用程序操作示意图14◆

2008-2012Iphone销量势如破竹:苹果Iphone4

、4s

、分别于2010年、2011年推出,其卓越设计和超群性能引领手机浪潮,同时期

4g

网络开始正式推出,相较于3G

网络只能支持一般的网页浏览、语音聊天以及2D

网络游戏等,4G

网络的社交属性被明显提升,包括

视频聊天、3D

网络游戏等被大众广为接受,苹果4和4S以封闭生态系统、高质量的硬件和软件,以及简约而不简单的设计理念被广泛人

接受,至此引领了智能手机的浪潮,可以看到从2010年到2013年苹果手机销量从3999万部跨越到1.5亿部。◆

AI的Iphone时刻已到来,AI需求有望带动换机潮:受益于硬件算力条件等制约,端侧AI需配备较高算力需求,老版PC或手机并不支持

AI功能,比如,苹果表示,Apple

智能将在iPhone

15Pro系列、配备M1的iPad和Mac,

以及后续机型上提供。这是因为Apple智能需

要强大的端侧处理能力,必须要A17

Pro或M

系列全系SoC

才可以运行。因此,我们判断AI需求有望带动换机潮,AI的Iphone

时刻已到

来,同时,AI端侧应用落地场景更加明确。苹果2007年到2018年销量(百万)

苹果智能融入苹果产品效果示意图200720082009201020112012201320142015201620172018苹果销量(百万)

——同比增速资料来源:Statista,Ofweek,快科技,

创智汇德整理,仅供学习参考

15231.22211.8816.72617.72169.22150.26125.0572.2939.9911.630.731

.

4

侧AI

,AI

Iphone

来华西证券HUAXI

SECURITIES100501.390300%200%

100%

0%-100%800%700%

600%

500%

400%250200150创智汇德整理,仅供学习参考02

Al硬件升级趋势愈发明显16◆

AIPC

的大模型可以分成在线模式和离线模式:在线模式,即在移动端进行简单的预处理之后,然后上传用户数据(图片、文字、语音

视频等)至云端服务器,通过服务器强大的算力得到推理结果,随后将推理结果下发至端设备。离线模式,即服务器上训练好的模型经

过移动端深度学习框架(TensorFlowLite

、NCNN

、TNN

、MNN

、CoreML等)量化压缩、转化后,在移动端设备上进行预测。这种方

式在无网络连接的情况下即可实现,保证用户的隐私性。以苹果为例,AppleIntelligence可简单分为此两部分。◆

云端大模型注重功能强大,端侧大模型注重低延时:在线模式和离线模式的推理平台有所不同,离线模式(端侧模型注重低延时和实施

体验,而在线模式(云端模型)注重功能强大,具体差异如右图所示。在线模式和离线模式差异云端模型和端侧模型差异问题维度基于端设备推断基于云端服务器推断延迟性低延时,实时体验由于存在异步通信和传输带宽的影响,有一定的延迟资源能力cpu/gpu处理能力,设备的算力有限,存储空间受限云端服务器的算力强大,储存空间充足网络连接网络不佳的或者没有的情况下,可以离线运行需要网络连接才可以运行成本问题电池电量、下载模型所需要的时间数据传输带宽,公司云端服务器的运营和服务成本隐私问题不需要上传用户数据(图片、视频、语音、文字等)到云端服务器用户数据上传云端服务器,隐私性无法保障用户数据端设备(android/ios)推理结果在线模式

2.1

AIPC的大模型可以分成在线模式和离线模式创智汇德整理,仅供学习参考

17云端服务器的

算法模型推理结果离线模式资料来源:Statista,Ofweek,快科技,端设备的算法

模型用户数据◆

我们判断端云协同是必选项:终端A

算力相较于云端A算力需求较小,原因是1、终端A应用更偏向于推理;2、终端AI相较于云端AI

的模型更偏向于“压缩”。从目前来看,很流行的“手机拍照一键擦除背景人物”,仅靠端侧大模型的计算能力是无法实现的,需要端

云协同来完成。而终端AI更像是流量入口,好比智能手机、PC与之前的手机、PC

相比,此外,终端AI也是终端厂商的必选,原因有二,第一是自身产品力,可以提高自身的品牌力;第二是增加自身的技术优势,从而增强产品对消费者的产品力。◆

联想发布联想个人云端协同智能体“联想小天”:联想小天具备云端大模型的高性能、泛化能力和端侧大模型的低成本、数据隐私、高可靠可以相结合。在体验会现场的演示中,联想小天展现出了较为出众的自然语言交互功能,可以用拟人化的语音和语气进行对话,为

用户解决诸多问题,如日常对话、信息查找、设备操控、文件处理等多种需求。根据智东西消息,联想小天高智商的背后是abab6.5模

型,其为MoE架构,参数量达到了万亿级,上下文窗口为20万tokens。小天高情商的背后则是联想通过百亿条高质量对话数据训练其

情绪反馈。联想小天发布会示意图

2.1.2云端AI与终端AI缺一不可,端云协同成为必选项创智汇德整理,仅供学习参考联想小天自然交互声情并茂大模型声音合成清晰自然高智商abab6.5模型MoE架构万亿参数高情商百亿条高质量对话数据情绵反情资料来源:全球物联网观察,智东西,18创智汇德整理,仅供学习参考

19◆

Apple

Intelligence包括自研端侧模型、自研云端模型,再加上OpenAI

的GPT大模型这三套系统:此外,苹果的重大动作还包括Siri,

它将让您更好地控制您的应用程序,允许您要求语音助手在特定电子邮件中查找信息,甚至显示用户的朋友的照片。苹果依靠AI来帮助

Siri

更好地理解用户语义并跟踪后续请求和问题。苹果在iOS

18中为其应用程序推出了一系列新的AI功能,包括一种汇总电子邮件和

生成回复的方法。苹果还将人工智能引入照片应用,用户你能够使用自然语言搜索照片。◆

苹果端侧模型需硬件加持:设备上约30亿参数的语言模型,测试得分高于诸多70亿参数的开源模型(右图所示);根据官网这次的介

绍,苹果在模型框架上用到了“grouped-query-attention”(分组查询注意力)和LoRA

框架,可以压缩推理过程,有效降低内存占

用。这样需要在本地运行的端模型在硬件上的要求,需要iPhone15

Pro和iPhone15Pro

Max,以及配置M1芯片以上的平板和苹果电脑。苹果智能写作功能示意图苹果端侧AI大模型测试示意图

2.1.3苹果重磅升级,端云协同成为必需品产品概览英

T

M

i

9

器(

第1

4

)英特尔酷睿T

M

U

It

ra

9处理器185H英特尔Core

TM

U

It

ra

7处理器155UL处理器编号i9-14900K185H155UL客户建议价格$589.00-$599.00$640.00$426.00CPU总核心数241612CPU性能核心数1662发布时间23年Q423年Q423年Q2内存规格大小192GB96GB96GB处理器基本功率125W45W15W处理器最大功率253W115W57WGPU名称英特尔⑧超高清显卡770IntelO

ArcTM

graphicsIntelO

GraphicsGPU最大动态频率1.65

GHz2.35GHz1.95

GHzNPU名称IntelQ

AI

BoostI

ntelO

AI

BoostNPU最大频率1.4

GHz1.4

GHzNPU支持的人工智能软件框架OpenVINOTM,owsML,DirectML,ONNX

RTOpenVINOTM,owsML,DirectML,ONNX

RT◆

短期来看,端侧AI对硬件规格革新要求较小:AIPC

的增量在于TPU,

TPU

的本质是ASIC芯

,ASIC

芯片的优势在于体积更小、功耗更低、可靠性提高、性能提高、保密性增强、成本降低等优点,与传统GPU所需功耗相差甚远,因此,我们判断短期来看PC

由于AI增

量并对热管理的需求提升并不高,同时由于端侧AI模型参数量较小,目前对内存需求提升并不高。下图为同时期发布的英特尔⑥酷睿

Ultra

9处理器185H、英特尔⑧酷睿TMi9处理器14900K

与近期发布英特尔OCorelMUltra7处理器155UL的SOC

规格比对。资料来源:英特尔官网,华西证券研究所

创智汇德整理,仅供学习参考2.2.1短期来看,端侧A

对硬件规格革新要求较小英特尔三款S0C比对20A18

ProA17

ProA16

Bionic神经中枢处理器(NPU)Neural

EngineNeural

EngineNeural

EngineNPU理论性能35

TOPS17

TOPS架构2x

3.89

GHz

一4x

2.2

GHz

一2x

4x3.78

2.11GHzGHz-Everest-Sawtooth2x

3.46

GHz

-Everest4x

2.02

GHz

-Sawtooth核心数量666频率3890

MHz3780

MHz3200

MHz持续功率限制8w8wL1储存器256

KB257

KBL2储存器16

MB17

MB制作工艺/制程3nm(N3P)3nm(N3)4nm(N4P)架构Apple

Bionic

GPUApple

Bionic

GPUApple

Bionic

GPUG

P

U

率1450

MHz1398

MHz1398

MHz执行单元665着色器单元128128128总着色器768768640FLOPS2227.2

Gigaflops2147.2

Gigaflops1789.4

Gigaflops存储种类LPDDR5TLPDDR5LPDDR5存储频率4800

MHz3200

MHz3200

MHz内存总线4x

16

Bit4x

16

Bit4x

17

Bit最大带宽78.8

Gbit/s51.2

Gbit/s51.3

Gbit/s最大容量8GB8GB6GB◆

苹果A16

Bionic到A17Pro的升级主要在于NPU算力和存储的升级:根据nanoreview

的数据,苹果A16

Bionic的到A17Pro的NPU算

力分别为17TOPS和35TOPS,存储容量分别为6GB和8GB,我们判断这是苹果14Pro未能参与到此次AI核心的根本原因。然而短期来

看,苹果A18处理器并未对存储最大容量升级,我们判断原因是端侧AI的模型参数量较小。苹果A16到A18S0C比对创智汇德整理,仅供学习参考

2.2.2短期来看,端侧AI对硬件规格革新要求较小资料来源:nanoreview,华西证券研究所21◆

大模型参数呈现指数规模,引爆海量算力需求:根据财联社和OpenAI数

,ChatGPT

浪潮下算力缺口巨大,根据OpenAI数据,模型

计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距。运算规模的增长,带动了对AIi训练芯片单点算力提升的需求。根据智

东西数据,过去五年,大模型发展呈现指数级别,部分大模型已达万亿级别,因此对算力需求也随之攀升。我们判断,未来随着终端AI

需求的增多,模型参数量有望继续上升台阶,从而带动端侧AI的算力,进而带动零部件结构占比的结构变化。◆根据36氪的消息,我们可将AIPC分级:AIPCL1:

入门级,适用于基础的A任务,如语音助手、简单图像识别等,总算力达到15TOPS。AIPCL2:标准级,能处理较为复杂的AI应用,如高级图像和语音处理,适合多媒体内容创作,总算力至少为45TOPS。AIPC

L3:

高级,适合运行实时视频分析和复杂的机器学习模型,为专业图像处理和数据科学提供支持,总算力达到90TOPS

。AIPCL4:专

业级,专为大规模机器学习模型和高级深度学习应用设计,适用于AI

研究和大数据分析,总算力超过180TOPS。

我们判断,未来端

侧AI算力升级的逻辑与英伟达架构升级的逻辑相似,高算力与高功耗相匹配。Num.ParametersWu

Dac1T100BGPT-10BGP

T-218BE

RTGPph20222018

2019

2020创智汇德整理,仅供学习参考2.3.1长期来看,大模型的爆发呈现指数级别增长,相关零部件有望升级2018.062018.102019.022019.102020.062021.012021.042021.06参

数规模

-

8-

数据规模T5GPT-2BERTGPT盘古GPT-31000001000010001001010000010000100010010资料来源:新浪,智东西,可创办日报,大模型参数数量和训练数据规模快速增长近年大模型的参数规模增长趋势数据规模(GB)SwitchTransformer参

(

亿

)悟道2.022100M2023DA架构英伟达Volta架构英伟达Turing架构英伟达Ampere架构型号V100V100sT4A100A800规格PCleSXM2PClePCleSXMPClePCleSXM芯片架构NVIDIA

VoltaNVIDIA

VoltaNVIDIA

VoltaNVIDIA

TuringNVIDIA

AmpereNVIDIA

AmpereNVIDIAAmpereNVIDIAAmpereNVIDIA

Ampere显存32GB或16GB

HBM232GB或16GB

HBM232GB

HBM216GB

GDDR680GB

HBM2e80GB

HBM2e40GB

HBM280GB

HBM2e80GB

HBM2e显存带宽900GB/s900GB/s1134GB/s320

GB/S1935GB/s2039GB/s1555GB/s1935GB/s2039GB/sFP64算力7TFLOPS7.8TFLOPS8.2TFLOPS254.4GFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPSFP64

Tensor

Core19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力14TFLOPS15.7TFLOPS16.4TFLOPS8.1TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力(Tensor)Tensor

Float

32

(TF32)156

TFL0PS156

TFLOPS156

TFLOPS156

TFLOPS156

TFLOPSTF32(Tensor

Core)312

TFLOPS312

TFLOPS312

TFLOPS312

TFLOPS312

TFLOPSFP16算力(Tensor

Core)112TFLOPS125TFLOPS130TFLOPS65TFLOPS312

TFLOPS312

TFLOPS312

TFLOPS312

TFLOPS312

TFLOPSBFLOAT16(Tensor

Core)312

TFLOPS312

TFLOPS312

TFLOPS312

TFLOPS312

TFLOPSFP8(Tensor

Core)INT8算力(Tensor

Core)130

TOPS624

TOPS624

TOPS624

TOPS624

TOPS624

TOPSCUDA核心数量5120256069126912Tensor

Cores核心数量640320432432功耗250瓦300瓦250瓦70瓦300瓦400瓦250瓦300瓦400瓦晶管数量(亿)211136542542制成(nm)12nm12nm7nm7nm互联速度32GB/s300GB/s32GB/s32GB/SNVLink

:600GB/s

PCle4.0

:64GB/sNVLink

:600GB/s

PCle4.0

:64GB/sNVLink

:400GB/sPCle4.0

:64GB/sNVLink

:400GB/sPCle

4.0

:64GB/s资料来源:英伟达官网,华西证券研究所创智汇德整理,仅供学习参考0◆

AI芯片架构升级速度明显加快,高算力与高功耗相匹配:复盘英伟达数据中心芯片产品,其中明显可以看到其芯片算力和芯片的功耗成明显的正相关。2.3.2算力在大模型时代迎来爆发,高算力与高功耗相匹配AI芯片架构升级速度明显加快,高算力与高功耗相匹配L架构英伟达Hopper架构BlackwelI架构型号H100H800H200GH200B100B200GB200规格SXMPCleNVLSXMPCleSXM芯片架构NVIDIA

HopperNVIDIA

HopperNVIDIA

HopperNVIDIAHopperNVIDIA

HopperNVIDIA

HopperNVIDIAHopper+ARMNVDIA

BlakwellNVDIA

BlakwellNVDIA

Blakwe

ll显存80GB

HBM380GB

HBM2e188GB

HBM380

GB

HBM380

GB

HBM3141GB

HBM3e96GB|144GB

HBM3e192GB192GB384GB显存带宽3.35TB/s2TB/s7.8TB/s3.35TB/s2TB/s4.8TB/s512GB/s(CPU)8TB/s8TB/s16TB/sFP64算力34

TFLOPS26

TFLOPS68

TFLOPS1

TFLOP0.8

TFL

OP34

TFLOPS34TFLOPSFP64

Tensor

Core67

TFLOPS51

TFLOPS134

TFLOPS1

TFLOP0.8

TFLOP67

TFLOPS67TFLOPS30TFLOPS40TFLOPS90TFLOPSFP32算力67

TFLOPS51

TFLOPS134

TFLOPS67

TFLOPS51

TFLOPS67TFLOPS67TFLOPSFP32算力(Tensor)TensorFloat

32

(TF32)67

TFLOPSTF32(Tensor

Core)494.5

TFLOPS378

TFLOPS989.5

TFLOPS494.5

TFLOPS378

TFLOPS494.5

TFLOPS494

TFLOPS0.9

PFLOPS1.12PFLOPS2.5PFLOPSFP16算力(Tensor

Core)989.5

TFLOPS756.5TFLOPS1979

TFLOPS989.5

TFLOPS756.5TFLOPS989.5

TFLOPS990

TFLOPS1.8

PFLOPS2.25

PFLOPS5

PFLOPSBFLOAT16(Tensor

Core)989.5TFLOPS756.5TFLOPS1979

TFLOPS989.5TFLOPS756.5TFLOPS989.5TFLOPS990

TFLOPS1.8

PFLOPS2.25

PFLOPS5

PFLOPSFP8(Tensor

Core)1979

TFLOPS1513

TFLOPS3958

TFLOPS1979

TFLOPS1513

TFLOPS1,979

TFLOPS1,979

TFLOPS3.5

PFLOPS4.5

PFLOPS10

PFLOPSINT8算力(Tensor

Core)1979

TOPS1513

TOPS3958

TOPS1979

TOPS1513

TOPS1,979

TOPS1,979

TOPS3.5

PFLOPS4.5

PFLOPS10

PFLOPSCUDA核心数量168961689616896Tensor

Cores核心数量528528528功耗700瓦300-350瓦2x

350-400W高达700瓦300-350瓦700瓦1000瓦700W1000W2700W晶管数量(亿)800800800制成(nm)4nm4nm4nm4nm互联速度NVLink:900GB/s

PCleGen5:128GB/sNVLink:600GB/s

PCleGen5:128GB/sNVLink:600GB/s

PCleGen5:128GB/sNVLink:400GB/sPCle

5.0:128GB/sNVLink:400GB/sPCle

5.0:128GB/sNVIDIA

NVLink⑧:·900GB/S·PCle

Gen5:

128GB/s900

GB/s

bidirectionalNV

Link:1.8

TB/sNV

Link:1.8

TB/sNVLink:2x1.8

TB/S资料来源:英伟达官网,华西证券研究所

创智汇德整理,仅供学习参考◆AI芯片架构升级速度明显加快,高算力与高功耗相匹配:从下图可以看到,英伟达GB200单芯片组的功耗为2700W。2.3.2算力在大模型时代迎来爆发,高算力与高功耗相匹配AI芯片架构升级速度明显加快,高算力与高功耗相匹配24创智汇德整理,仅供学习参考03Al重塑操作系统25Gemini

1.5

FlashAlatthecoreSpeedandMultimodal

Longcontextefficiency

reasoning

window

创智汇德整理,仅供学习参考◆

AI

技术在移动端操作系统实质突破:谷歌/02024开发者大会揭示了Android15和Gemini1.5Pro大模型的革新,包括下一代移动操

作系统Android15、先进的Gemini

大模型,以及多项A驱区动的创新功能。谷歌宣布,Android15将深度融合谷歌的Gemini

大模型,

名称为GeminiNano,可为用户带来前所未有的智能体验。新系统将支持A

语音助理防诈骗、画圈图片搜索等前沿功能,并通过卫星

通信连接扩展平台支持,确保在偏远地区也能保持连接。◆

Gemini家族迎来是史诗级更新:Gemini1.5

Pro上下文窗口扩展支持200万token,号称“迄今为止所有基础模型中最长的上下文窗

口”,此次大会谷歌重磅宣布推出基于Gemini1.5Pro的GeminiAdvanced。同时,新成员包括Gemini

1.5Flash,擅长摘要、聊

天应用程序、图像和视频字幕、从长文档和表格中提取数据等,在应用场景上,它擅长总结、聊天、图像视频字幕、长文档数据提取等

任务。Gemini

1.5

Flash通过从1.5Pro模型中学习,继承了其核心能力。此外,谷歌同样展示新的多模态A项目ProjectAstra,是

歌人工智能助手的最新进展。Gemini1.5Flash示意图

谷歌将AI与安卓深度绑定示意图

3.1.1安卓15携手Gemini大模型,AI

创新引领未来26资料来源:

机器之心,中关村在线,36

创智汇德整理,仅供学习参考◆

微软AI

PC全面“亮剑”,Copilot

融入ows

11

:微软介绍Copilot+PC是迄今为止速度最快、最具智能体验的ows

PC凭借强大的新型芯片,能够实现40+

TOPSAI

算力、电池续航时间可达一整天。每台Copilot+PC

都配备了强大的

AI

Agent,只需在键盘上轻点新的Copilot

按键即可快速交互。未来,用户将获得包括来自OpenAI

GPT-4o在内的最新模型,进行更自然的语音对话。AI能力也完全嵌入了

ows

11

系统,例如控制面板里有Copilot修改设置的按钮,图片文件的菜单里出现了一键修图。◆

微软AIPC

功能强大:Copilot+PC

采用了强劲的处理器和多个最先进的AI模型,其中包含了Microsoft研发的顶尖小型语言模型,让

用户可以在装置上直接本地运行AI,

具备即时回想、图像创建和编辑功能、AI修图等功能。◆

下一代Winodws

操作系统有望更深度融入AI技术:根据中关村在线和36氪消息,下一代ows

操作系统有望将围绕AI功能进行重

构,作为系统底层的一部分,此时的AI将不会再受到系统安全的限制,可以直接调用系统的各个功能和应用。微软Copilot

示意图微软AIPC搭载高通骁龙X产品示意图

3.1.2微软AI

PC全面“亮剑”,Copilot融入ows

1127Aa8二用ARCH201

Lecture

12RCH/TECTVRE

/N

/NPIA15L—18t

anhuviegCH

H

A

TR1avi/iors,offe

Somahims

shsnoalooihChopic

mt-shapef

ilfd

hg8oflops

ofFircrexampAnnchona[Nmiouoftria/

Arniahpioe,0rnanenfohoLfo

hig9y

comple×associoted

with

Mugholarchitecture:the

chhajig,an11创智汇德整理,仅供学习参考28Sdo◆

Apple

Intelligence深度集成于iOS

18、iPadOS

18和

macOS

Sequoia:

如上文所述,AppleIntelligence总体来说分成三个部

分来实现:自研端侧模型、自研云端模型,再加上OpenAI

的GPT大模型这三套系统。AppleIntelligence深度集成于iOS

18、iPadOS

18和macOS

Sequoia中,充分运用Apple

芯片对语言和图像的理解与创作能力,可做出多种跨

app

操作,同时结合个人

场景,为用户简化和加快日常任务流程。◆

Apple

Intelligence功能强大:1、理解和创造语言的全新能力,系统可调用的新工具

Writing

Tools,让用户能在几乎任何场景下对文本进行改写、校对和摘要,包括邮件、备忘录、Pages文稿和各类第三方app;2

、ImagePlayground

为交流和自我表达增添乐趣,

可帮助用户用全新方式进行交流和表达自我。3、创建应景的

Genmoji,

用户现可创建原创Genmoji

来表达自我。4、添加照片等新功能,查找照片更加方便,添加会议功能等;5、Siri迈进新时代,AppleIntelligence与Siri结合更加紧密,Siri具备更深层次的语言理

解能力。Apple

Pencil

工具盘中的Image

Wand

工具示意图

Image

Playground示意图

文字与

Siri

会话,在文本和语音之间任意切换

3.1.3

Apple

Intelligence

深度集成于苹果操作系统中软硬件全面自主可控,华为领衔演绎国产生态崛起创智汇德整理,仅供学习参考0429◆海思是全球领先的Fabless半导体与器件设计公司。公司前身为华为集成电路设计中心,1991年启动集成电路设计及研发业务,为汇聚

行业人才、发挥产业集成优势,2004年华为将海思注册全资子公司,提供海思芯片对外销售及服务。海思产品覆盖智慧视觉、智慧IoT

智慧媒体、智慧出行、显示交互、手机终端、数据中心及光收发器等多个领域。◆

产品服务辐射全球,持续研发专利丰厚。海思在中国、新加坡、韩国、日本、欧洲等地设有12个办事处和研发中心,产品和服务遍布

全球100多个国家和地区。海思有着20余年的技术积累,目前拥有200+自主知识产权的芯片,8,000+专利。使能万物互联的智能终端海思产品服务九大领域创智汇德整理,仅供学习参考

4.1硬件侧:华为海思是国产芯片之光资料来源:

海思官网,华西证券研究所30◆

麒麟系列是华为在手机上搭载的CPU处理器芯片。2020年,麒麟系列更新到麒麟9000。麒麟9000是业界最高集成度5nm5G

SoC,采用全球顶级5nm工艺制程,集成153亿个晶体管的手机芯片。◆

麒麟9000——更快、更高、更强:刷新5G速度,麒麟9000通过支持5G

SA双载波聚合,使其在Sub-6G

下行理论峰值速率达4.6Gbps,

上行理论峰值速率达2.5Gbps,

带来更快的5G体

。AI+AR,AI

方面,麒麟9000解锁更多AI功能,例如让AI实时处理从照片走向视频;

AR

方面,基于SLAM

和实时语义理解,以及专属的AR

加速器硬化模块。◆

华为手机重回巅峰:根据C114

消息,2024年第一季度,中国大陆智能手机市场时隔两年首次回暖,出货量与去年同期持平,达6770万台。华为重夺中国大陆市场第一,凭借Mate及nova系列热烈的市场反响,出货量达1170万台,市场份额达17%,此外,根据搜狐消息,华为Mate70或将成为首款搭载纯血鸿蒙系统的手机。麒麟芯片发展历程

华为2024年Q1销量重回中国大陆首位

4.1.1端侧手机:从K3V1到麒麟9000,华为手机重回巅峰创智汇德整理,仅供学习参考唯坚持得突破资料来源:华为麒麟官方公众号,C114全球首款5nm5G

SoC麒麟9000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论