AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第1页
AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第2页
AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第3页
AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第4页
AIGC行业深度报告(15):端侧AI爆发元年软硬架构全面升级_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

端侧AI爆发元年,软硬架构全面升级01终端AI爆发元年,AI的Iphone时刻已到来02AI硬件升级趋势愈发明显03AI重塑操作系统04软硬件全面自主可控,华为领衔演绎国产生态崛起05投资建议:梳理AIGC相关受益厂商06风险提示401终端AI爆发元年,AI的Iphone时u英特尔于2023正式推出AIPC处理器:继2023年10月19日宣“代表着英特尔40年来最重大的架构转变,为未来10年的PC创新奠定基础”,旨在“为AIPC时代铺平道路”:该芯片采用分离式模u英特尔®酷睿™Ultra处理器为端侧AI而生:采用3D性能混合架构,支持高级AI功能,AI功能包括办公、写作、创作等功能。英特运行。英特尔®AIBoost是专为低功耗AI加速和CPU/GPU分载打造的集成式AI引擎,而英特尔®Gaussian&NeuralAccelerator可在处理AI语音和音频应用的同时解放CPU资资料来源:芯语,英特尔官网,华西证券研究所1.1.2AIPC芯片侧:AMD锐龙桌面级处理器、X870/X870E系列芯片组以及面向AIPC的RyzenAI300系列移动级处理器平台,这也标志着新一轮硬件“竞赛”正式u锐龙AI300系列为AIPC赋予强劲AI算力:基本规格方面,AMDRyzenAI9HX370处理器采用12核24线程设计,加速频率最高资料来源:中关村在线,华西证券研究所u2024年COMPUTEX大会上,高通展示了其最新的AIPC产的核心亮点,搭载这一平台的PC产品将具备强大的AI功能,如实时翻译、智能助理和多模态交互等唤醒设备的能力。敏感数据可以保留在用户的笔记本电脑上,以通过边缘智能提高安全性。QualcommAIEngin资料来源:芝能智芯公众号,高通官网,华西证券研究所头企业为英伟达,而如今芯片厂商已经逐步补强自身“短板”,其目的在于维持自身在应用场景中的龙头地位,例如英伟达自身的资料来源:搜狐,C114,华西证券研究所级个人数据&隐私安全保护。资料来源:IDC、太平洋科技,腾讯网,联想官网,华西证券研究所资料来源:华尔街见闻,戴尔官网,微软官网,华西证券研究所调了隐私和个性化的必要性,目标是“超越人工智能”,进入“个人智能”的领域。苹果的克雷格·费德里吉表示,苹果智能背后的生总体来说分成三个部分来实现:自研端侧模型、资料来源:FoxData,新浪科技,华西证券研究所u通用模型厂商与终端厂商的合作大于竞争:我们判断通用何问题以及任何文档或照片发送到ChatGPT之前,Siri都会询问用户,然后直接显示答案。此外,ChatGPT还将在Apple的系统级资料来源:苹果官网,华西证券研究所点功能在于生成摘要、文本矫正、个性化重写等功标定的更新,并在相册中添加AI回忆、搜图、消除使用Summarise,生成图表表达形式资料来源:苹果官网,华西证券研究所现在可以在应用程序内和跨应用程序执行数百项新操作;4、Siri将能够提供针对用户及其设备上的信息量身定制的深层个人背景,同时保护用户隐私,借助私有云计算,利用更大的基于服务器的模型来处理更复杂的请求。这些模型在搭载Apple芯片的服务器上运行,为Apple确保数据永远不会被保留或泄露奠定了基础。能苹果系统,可以实现打通APP之间的信息壁垒,通过对个人的学习,从而为客户实现量身定做的生成式人工智能助手,好比“钢铁侠”中的个人助力“贾维斯”,为AI应资料来源:苹果官网,华西证券研究所4g网络开始正式推出,相较于3G网络只能支持一般的网页浏览、语音聊天以及2D网络游戏等,4G网络的社交属性被明显提升,包括视频聊天、3D网络游戏等被大众广为接受,苹果4和4S以封闭生态系统、高质量的硬件和软件,以及简约接受,至此引领了智能手机的浪潮,可以看到从2010年到2013年苹果手机销量从3999万部跨越到1.5亿部。0资料来源:Statista,Ofweek,快科技,华西证券研究所资料来源:Statista,Ofweek,快科技,华西证券研究所视频等)至云端服务器,通过服务器强大的算力得到推理结果,随后将推理结果下发至端设备。离线模式,即服务器上训练好的模型经式在无网络连接的情况下即可实现,保证用在线模式和离线模式差异云端模型和端侧模型差异器2.1.2云端AI与终端AI缺一不可u联想发布联想个人云端协同智能体“联想小天”:联想小天具备云端可靠可以相结合。在体验会现场的演示中,联想小天展现出了较为出众的自然语言交互功能,可以用拟人化的语音和语气进行对话,为用户解决诸多问题,如日常对话、信息查找、设备操控、文件处理等多种需求。根据智东西消息,联想小天高智商的背后是abab6.5模型,其为MoE架构,参数量达到了万亿级,上下文窗口为20万tokens。小天高情商的背后则是联想通过百亿条高质量对话数据资料来源:全球物联网观察,智东西,华西证券研究所它将让您更好地控制您的应用程序,允许您要求语音助手在特定电子邮件中查找信息,甚至显示用户的朋友的照片。苹果依靠AI来帮助Siri更好地理解用户语义并跟踪后续请求和问题。苹果在iOS18中为其应用程序推出了一系列新的AI功能,包括一种汇总电子邮件和生成回复的方法。苹果还将人工智能引入照片应用,用户你能够使用自然语言搜索照片。资料来源:腾讯网,36氪,华西证券研究所资料来源:英特尔官网,华西证券研究所更低、可靠性提高、性能提高、保密性增强、成本降低等优点,与传统GPU所需功耗相差甚远,因此,我们判断短期来看PC由于AI增62OpenVINO™,WindowsML,DirectML,ONNXOpenVINO™,WindowsML,DirectML,ONNX资料来源:nanoreview,华西证券研究所u苹果A16Bionic到A17Pro的升级主要在于NPU算力和存储的升级:根据nanore核心数量6664nm(N4P)6652.3.1长期来看,大模型的爆发呈现指数级别增长u大模型参数呈现指数规模,引爆海量算力需求:根据财联社和OpenAI数据,C计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距。运算规模的增长,带动了对AI训练芯片单点算力提升的需求。根据智东西数据,过去五年,大模型发展呈现指数级别,部分大模型已达万亿级别,因此对算力需求也随之攀升。我们判断,未来随着终端AI业级,专为大规模机器学习模型和高级深度学习应用设计,适用于AI研究和大数据分析,总算力超过180TOPS。我们判断,侧AI算力升级的逻辑与英伟达架构升级的逻辑相似,高算力与高功耗相匹配。大模型参数数量和训练数据规模快速增长资料来源:新浪,智东西,可创办日报,36氪,华西证券研究所资料来源:英伟达官网,华西证券研究所架构英伟达Volta架构英伟达Turing架构英伟达Ampere架构型号V100V100sT4A100A800规格PCIeSXM2PCIePCIeSXMPCIePCIeSXM芯片架构NVIDIAVoltaNVIDIAVoltaNVIDIAVoltaNVIDIATuringNVIDIAAmpereNVIDIAAmpereNVIDIAAmpereNVIDIAAmpereNVIDIAAmpere显存32GB或16GBHBM232GB或16GBHBM232GBHBM216GBGDDR680GBHBM2e80GBHBM2e40GBHBM280GBHBM2e80GBHBM2e显存带宽900GB/s900GB/s1134GB/s320GB/S1935GB/s2039GB/s1555GB/s1935GB/s2039GB/sFP64算力7TFLOPS7.8TFLOPS8.2TFLOPS254.4GFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPS9.7TFLOPSFP64TensorCore19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力14TFLOPS15.7TFLOPS16.4TFLOPS8.1TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPS19.5TFLOPSFP32算力(Tensor)TensorFloat32(TF32)156TFLOPS156TFLOPS156TFLOPS156TFLOPS156TFLOPSTF32(TensorCore)312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSFP16算力(TensorCore)112TFLOPS125TFLOPS130TFLOPS65TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSBFLOAT16(TensorCore)312TFLOPS312TFLOPS312TFLOPS312TFLOPS312TFLOPSFP8(TensorCore)-----INT8算力(TensorCore)130TOPS624TOPS624TOPS624TOPS624TOPS624TOPSCUDA核心数量5120256069126912TensorCores核心数量640320432432功耗250瓦300瓦250瓦70瓦300瓦400瓦250瓦300瓦400瓦晶管数量(亿)211542542制成(nm)12nm12nm7nm7nm互联速度32GB/s300GB/s32GB/s32GB/SNVLink:600GB/sPCIe4.0:64GB/sNVLink:600GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/sNVLink:400GB/sPCIe4.0:64GB/s资料来源:英伟达官网,华西证券研究所)PCIe5.0:PCIe5.0:作系统Android15、先进的Gemini大模型,以及多项AI驱区天应用程序、图像和视频字幕、从长文档和表格中提取数据等,在应用场景上,它擅长总结、聊天、图像视频字幕、长文档数据提取等资料来源:格隆汇,InfoQ,华西证券研究所AI能力也完全嵌入了Windows11系统,例如控制面板里有Copilot修改设置的按钮,图片文件的菜单里出现了一键修图。u微软AIPC功能强大:Copilot+PC采用了强劲的处理器和多个最先进的Au下一代Winodws操作系统有望更深度融入AI技术:根据中关村在线和36氪消构,作为系统底层的一部分,此时的AI将不会再受到系统安全的限制,可以直接调用系统的各个功能和应用。资料来源:机器之心,中关村在线,36氪,微软官网,华西证券研究所 分来实现:自研端侧模型、自研云端模型,再加上OpenAI的GPT大模型这三套系统。AppleIntelligen场景,为用户简化和加快日常任务流程。功能,查找照片更加方便,添加会议功能等;5、Siri迈进新软硬件全面自主可控,4.1硬件侧:华为海思是国产芯片之光u海思是全球领先的Fabless半导体与器件设计公司。全球100多个国家和地区。海思有着20余年的技术积累,目前拥用全球顶级5nm工艺制程,集成153亿个晶体管的手机芯片。AR方面,基于SLAM和实时语义理解,以及华为Mate70或将成为首款搭载纯血鸿蒙系统的资料来源:华为麒麟官方公众号,C114网,华西证券研究所CPU分别为麒麟9000C、鲲鹏920泰山V130CPU架构,基于指令集,最多八核心,包性能则能接近苹果M2。发布时间,预测是9月份,可能力,它基于华为盘古L0基础大模型,在超千亿参数的中文预训练大模型基础上,融入大量场景数据,对模型进行精调,最终炼成的一个为用户提供概要能力地从音频内容中提取关键信息,可为客户提供三大简短的核心内容,一句话概要、关键词、全文摘要帮助客户更高效地掌握会议要点。AI概要不仅可以边视频文件的总结,当用户没有网络或者忘记带电脑,可以先用手机或者相机进行录音或者录像,回去再上NVIDIA安培GPU架构资料来源:昇腾官网,英伟达官网,英伟达安培架构白皮书,华为云公众号,华西证券研究所4.1.3云端算力:华为昇腾芯片,统一达芬奇架构助力AI计算引擎执行流水线,在系统软件的统一调度下互相配合达到优化的计算效率,AICore中的矩阵计算单元目算;向量计算单元目前可以支持FP16和FP32的计算。我们认为本质上讲昇腾芯片属于专为AI而生的特定域架构芯片。u存储转换单元(MTE)是达芬奇架构的特色:比如通用GPU要通过矩阵计算来实现卷积,首先要通过Im2Col的方法把输入的网络和特征4.1.3云端算力:华为HCCS互联技术,4.1.3云端算力:华为910C敬请期待,Atlas打开国产算力集群想象搭载昇腾910C芯片的服务器中,单台服务器的整体价值将得到大幅提升。此外,我们判断,在国产化大背景下,昇腾910C相关供应链网络即可实现2250节点(等效于1.8万张卡)超大规模无收敛集群组网。其优势显著,新集群同时使用了创新的超节点架构,大大了大模型训练能力实现算力的资源统一调度4.2鸿蒙OS——国产操作系统先进龙头,拥抱万物互联地联系在一起,将消费者在全场景生活中接触的多种智能终端,实现极速发现、极速连接、硬件互助、资源共享,用合适的设备提供场4.2.1鸿蒙操作系统市占率不断提升,HarmonyOSNEXT值得期待在中国市场的市占率正式超越了iOS。u鸿蒙+AI打开全新国产化生态:HarmonyOSNEXT作为华为操作系统家族的最新力作,被寄予厚望。该版本4.2.2鸿蒙Next版本正式发布,AI深度赋能操作系统u星河璀璨,加入鸿蒙正当时:在6月21日,在主题演讲中,华为进入全面冲刺阶段,5000多个常用应用已全部启动开发,其中超过1500家已完成上架。uHarmonyIntelligence正式发布:HarmonyOSNEXT首次将AI能力融操作,并在端云大模型协同和意图框架的加持下获得更好的场景感知、意图识别和用户理解能力,能够帮助用户更好地获取所需个性化服务。HarmonyOSNEXT也为鸿蒙生态带来了强大的AI能力,围绕图像智能、通话智能、文档4.2.3AI+OS时代已来临,全面打开想象空间子系统底座使得OS各个组件内部和彼此之间都能够灵活高出现,使得原生智能OS不仅仅是一个操作系统,更是能够深度理解用户、自主闭环用户任务的、智慧的、常驻的超级来更自然、更全面、更多维的人机交互方式,打破了传统单一独立I/O通道输入方式的限制,极大地丰富了人机交互的维度。多模态理解大模型可以让用户使用文本、图像、声音、视频、传感等多种数据类型与终端进行交流,大大拓展了用户同终端的交互形式。进入操作系统,随着AI+物联的设备数量增加,可以实现AI的有限感知到全面感知,从单场景应用到多场景多设备服户意图、多个设备联动任务的万物互联。4.2.4盘古5.0大模型正式发布,重塑千行万业成为企业通用大模型的底座;万亿级参数的4.3端侧AI革命进行时,盘古+鸿蒙星河+麒麟+昇腾+鲲鹏打造最强生态等系统、云端可配备英伟达、AMD等AI算卡、大模型侧拥有AppleIntelligence其中集成了ChatGPT。AIPC端,海外拥有Intel、端侧,麒麟已重回巅峰,鲲鹏+昇腾有望构筑全球算力体系的第二极,因此我们判断在终端爆发元年,华为有望凭借盘古+鸿蒙星河+麒麟+昇腾+鲲鹏最强生态领衔演绎国产软硬件生态崛起。器架端IDE务05投资建议:梳理AIGC相关受益厂商4.1投资建议:梳理AIGC的受益厂商零部件:飞荣达、芯海科技、泰嘉股份等;鸿蒙:软通动力、九联科技、润和软件、芯海科技、智微智能等;国产终端厂商:华勤技术、软通动力、神州数码等;应用:金山办公、万兴科技、润达医疗等;资料来源:WIND,华西证券研究所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论