电子行业专题研究:关注AI大模型在终端侧的轻量化应用_第1页
电子行业专题研究:关注AI大模型在终端侧的轻量化应用_第2页
电子行业专题研究:关注AI大模型在终端侧的轻量化应用_第3页
电子行业专题研究:关注AI大模型在终端侧的轻量化应用_第4页
电子行业专题研究:关注AI大模型在终端侧的轻量化应用_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1告华泰研究告华泰研究高通、华为实现AI大模型在终端的轻量化部署,关注边/端侧算力机会3月2日,高通在MWC2023大会发布全球首个运行在Android手机上的StableDiffusion终端侧演示,StableDiffusion模型参数超过10亿,高通利用其AI软件栈对模型进行量化、编译和硬件加速优化,使其成功在搭载第二代骁龙8移动平台的手机上运行。此外,华为新一代P60系列手机将于5月上线智慧搜图功能,该功能通过对模型进行小型化处理,实现其在端侧轻量化应用。我们认为模型压缩技术是实现AI大模型在边/端部署的核心技术。当前,谷歌、微软、腾讯等厂商在该领域均有布局,将加速AI技术与智能终端融合,国内SoC设计公司有望深度受益。模型压缩技术:有效降低推理算力需求,助力大模型的边/端侧部署腾讯、百度为代表的国内互联网厂商在模型压缩技术上也取得长足进展。2018年腾讯推出全球首款自动化深度学习模型压缩框架PocketFlow,2022年百度开源的文心ERNIE-Tiny在线蒸馏方案可得到参数规模仅为原模型0.02%且效果相当的轻量级模型。我们认为伴随模型压缩技术发展,AI将加速与终端设备融合应用,国内相关领域布局公司包括:晶晨股份(机顶盒/电视/音箱SoC),全志科技(国内音箱SoC龙头),瑞芯微(AIOTSoC芯片)、恒玄科技(可穿戴蓝牙音频SoC)、炬芯科技(智能音频SoC)、乐鑫科技(国内Wi-FiMCU龙头)、中科蓝讯(可穿戴蓝牙音频SoC)等。风险提示:中美贸易摩擦加剧风险;AI及技术落地不及预期;本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。关注AI大模型在终端侧的轻量化应用增持(维持)研究员SACNo.S0570521050001SFCNo.AUZ066研究员SACNo.S0570522020001研究员SACNo.S0570521070004SFCNo.BPH392联系人SACNo.S0570121120092leping.huang@+(852)36586000zhanghaoyi@+(86)2128972228chenxudong@+(86)2128972228chenyu019111@+(86)2128972228模型压缩技术可在保有大模型原有性能和精度基本不变前提下降低对推理模型压缩技术可在保有大模型原有性能和精度基本不变前提下降低对推理)网络剪枝:去除神经网络中冗余的通道、神经元节点等;3)知识蒸馏:将大模型作为教师模型,用其输出训练性能接近、结构更简的学生模型。以清华大学唐杰教在一台A100(40G*8)或V100(32G*8)服务器上进行推理,而将模型量化至INT4精度后,相较INT8精度其所需GPU内存降低50%,且可在一台4×RTX3090(24G)或8×RTX2080Ti(11G)服务器上进行推理。全球洞察:谷歌等已将模型压缩技术紧密结合移动端模型部署框架/工具子沪深子(%)8(1)(10)(19)上世纪学术界率先提出网络剪枝技术,并一直引领模型压缩技术的突破。业界的发展紧随其后,并进一步将模型压缩技术集成至移动端模型部署框架/工具,主要参与者包括:1)深度学习框架厂商:谷歌(ML上世纪学术界率先提出网络剪枝技术,并一直引领模型压缩技术的突破。业界的发展紧随其后,并进一步将模型压缩技术集成至移动端模型部署框架/工具,主要参与者包括:1)深度学习框架厂商:谷歌(MLorchorchMobile);2)硬件厂商:英伟达(TensorRT)、英特尔(NNCF)、高通(AIMET)等;以及3)云服务厂商:微软(ONNXRuntime)等。以谷歌2018年推出的MLKit为例,核心功能Learn2Compress模型压缩技术结合网络剪枝、量化以及知识蒸馏三项技术,可实现在CIFAR-10图像分类测试任务中生成较NASNet尺寸缩小94倍的轻量化模型,且仍保持90%以上精度。国内现状:互联网厂商引领发展,国内SoC设计企业有望受益资料来源:高通中国官网,华泰研究资料来源:高通官网,华泰研究资料来源:华为官网,华泰研究资料来源:华为云官网,华泰研究模型精度GLM-130BGPT-3FP16FPFP16INT8MMLU(acc,↑)44.7544.7144.8043.9LAMBADA(acc,↑)80.2180.2179.4776.2Pile(apart,BPB,↓)0.6340.6380.6410.74注:↑表示该基准测试得分越高模型性能越好,↓表示改基准测试得分越低模型性能越好资料来源:清华大学唐杰教授团队:《GLM-130B:ANOPENBILINGUALPRE-TRAINEDMODEL》(2022.10),华泰研究注:Perplexity(困惑度)是语言模型性能衡量指标,数值越低表明模型越好资料来源:EliasFrantar,DanAlistarh:《SparseGPT:MassiveLanguageModelsCanbeAccuratelyPrunedinOne-Shot》(2023.3.),华泰研究注:Perplexity(困惑度)是语言模型性能衡量指标,数值越低表明模型越好资料来源:EliasFrantar,DanAlistarh:《SparseGPT:MassiveLanguageModelsCanbeAccuratelyPrunedinOne-Shot》(2023.3.),华泰研究资料来源:百度飞浆官网,华泰研究资料来源:百度飞浆官网,华泰研究厂商模型压缩技技术/框架初始推出时间模型压缩效果英伟达TensorRT2017年2021年推出TensorRT8.2,可实现FP16和INT8优化,将推理速度提高6倍阿里巴巴PAI2017年包含多种量化压缩技术,其中离线量化相关策略支持随机稀疏压缩与训练后量化技术叠加使用,达到60%稀疏度时,叠加INT8量化,压缩比可达6.6倍左右谷歌MLKit(Learn2Compress模型压缩技术)2018年ImageNet任务方面,Learn2Compress的模型大小仅为Inceptionv3基准的1/22,MobileNetv1基准的1/4,准确度下降比例仅为4.6%-7%腾讯AILabPocketFlow框架2018年在CIFAR-10数据集上,PocketFlow以ResNet-56作为基准模型进行压缩优化,实现2.5倍加速下分类精度损失0.4%,3.3倍加速下精度损失0.7%METAPyTorchMobile框架2018年--微软ONNXRuntime2018年--华为TinyBERT轻量化技术2019年压缩模型TinyBERT,参数量仅为原始BERT模型的13%,推断加速达到9倍,在自然语言处理标准评测GLUE上获得原始BERT模型96%的效果英特尔NNCF2019年--百度文心大模型ERNIE-Tiny轻量化技术2019年2022年开源的文心ERNIE-Tiny在线蒸馏方案,模型参数压缩率可达99.98%,压缩版模型仅保留0.02%参数规模就能与原有模型效果相当高通高通AI软件栈(AIMET)2020年将MobilNetv2/ResNet50/DeepLabv3模型从FP32格式量化压缩至INT8格式,模型精度损耗均小于1%资料来源:各公司官网,华泰研究代码公司名称股价市值(百万元)2023E2024E2023E2024E2023E2024E2023E2024E股价变动688608CH恒玄科技169.1020,29287.7655.993.293.1311.028.5788.7%56.7%-9.8%17.3%48.3%603893CH瑞芯微95.8740,05175.5950.9411.729.9214.1110.4476.2%48.4%-5.9%6.5%39.3%688099CH晶晨股份91.7438,09635.2625.525.964.915.234.1047.0%38.2%0.2%688049CH炬芯科技44.325,40773.0746.212.942.779.036.9744.4%13.7%63.8%300458CH全志科技36.2022,83267.0652.796.776.1212.149.9258.8%27.0%32.6%77.8%688018CH乐鑫科技129.5910,43155.2038.805.134.576.064.6993.5%42.3%4.8%43.7%688332CH中科蓝讯74.908,98838.7425.982.362.166.424.8513.2%46.2%资料来源:Wind预期,华泰研究提示1)中美贸易摩擦风险:若中美贸易摩擦加剧,将导致我国AI行业上中下游厂商进出口受阻,中国上述厂商的发展将受到进一步的限制,导致相关公司业绩难以释放。2)AI及技术落地不及预期:虽然AI技术加速发展,但由于成本、落地效果等限制,相关技术落地节奏可能不及我们预期。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。分析师声明本人,黄乐平、张皓怡、陈旭东,兹证明本报告所表达的观点准确地反映了分析师对标的证券或发行人的个人意见;彼以往、现在或未来并无就其研究报告所提供的具体建议或所表迖的意见直接或间接收取任何报酬。一般声明及披露本报告由华泰证券股份有限公司(已具备中国证监会批准的证券投资咨询业务资格,以下简称“本公司”)制作。本报告所载资料是仅供接收人的严格保密资料。本报告仅供本公司及其客户和其关联机构使用。本公司不因接收人收到本报告而视其为客户。本报告基于本公司认为可靠的、已公开的信息编制,但本公司及其关联机构(以下统称为“华泰”)对该等信息的准确性及完整性不作任何保证。本报告所载的意见、评估及预测仅反映报告发布当日的观点和判断。在不同时期,华泰可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。以往表现并不能指引未来,未来回报并不能得到保证,并存在损失本金的可能。华泰不保证本报告所含信息保持在最新状态。华泰对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本公司不是FINRA的注册会员,其研究分析师亦没有注册为FINRA的研究分析师/不具有FINRA分析师的注册资华泰力求报告内容客观、公正,但本报告所载的观点、结论和建议仅供参考,不构成购买或出售所述证券的要约或招揽。该等观点、建议并未考虑到个别投资者的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。对依据或者使用本报告所造成的一切后果,华泰及作者均不承担任何法律责任。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。除非另行说明,本报告中所引用的关于业绩的数据代表过往表现,过往的业绩表现不应作为日后回报的预示。华泰不承诺也不保证任何预示的回报会得以实现,分析中所做的预测可能是基于相应的假设,任何假设的变化可能会显著影响所预测的回报。华泰及作者在自身所知情的范围内,与本报告所指的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,华泰可能会持有报告中提到的公司所发行的证券头寸并进行交易,为该公司提供投资银行、财务顾问或者金融产品等相关服务或向该公司招揽业务。华泰的销售人员、交易人员或其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。华泰没有将此意见及建议向报告所有接收者进行更新的义务。华泰的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。投资者应当考虑到华泰及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突。投资者请勿将本报告视为投资或其他决定的唯一信赖依据。有关该方面的具体披露请参照本报告尾部。本报告并非意图发送、发布给在当地法律或监管规则下不允许向其发送、发布的机构或人员,也并非意图发送、发布给因可得到、使用本报告的行为而使华泰违反或受制于当地法律或监管规则的机构或人员。本报告版权仅为本公司所有。未经本公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人(无论整份或部分)等任何形式侵犯本公司版权。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并需在使用前获取独立的法律意见,以确定该引用、刊发符合当地适用法规的要求,同时注明出处为“华泰证券研究所”,且不得对本报告进行任何有悖原意的引用、删节和修改。本公司保留追究相关责任的权利。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。中国香港本报告由华泰证券股份有限公司制作,在香港由华泰金融控股(香港)有限公司向符合《证券及期货条例》及其附属法律规定的机构投资者和专业投资者的客户进行分发。华泰金融控股(香港)有限公司受香港证券及期货事务监察委员会监管,是华泰国际金融控股有限公司的全资子公司,后者为华泰证券股份有限公司的全资子公司。在香港获得本报告的人员若有任何有关本报告的问题,请与华泰金融控股(香港)有限公司联系。香港-重要监管披露•华泰金融控股(香港)有限公司的雇员或其关联人士没有担任本报告中提及的公司或发行人的高级人员。•晶晨股份(688099CH):华泰金融控股(香港)有限公司、其子公司和/或其关联公司实益持有标的公司的市场资本值的1%或以上。•晶晨股份(688099CH):华泰金融控股(香港)有限公司、其子公司和/或其关联公司在本报告发布日担任标的公司证券做市商或者证券流动性提供者。•有关重要的披露信息,请参华泰金融控股(香港)有限公司的网页.hk/stock_disclosure其他信息请参见下方“美国-重要监管披露”。美国在美国本报告由华泰证券(美国)有限公司向符合美国监管规定的机构投资者进行发表与分发。华泰证券(美国)有限公司是美国注册经纪商和美国金融业监管局(FINRA)的注册会员。对于其在美国分发的研究报告,华泰证券(美国)有限公司根据《1934年证券交易法》(修订版)第15a-6条规定以及美国证券交易委员会人员解释,对本研究报告内容负责。华泰证券(美国)有限公司联营公司的分析师不具有美国金融监管(FINRA)分析师的注册资格,可能不属于华泰证券(美国)有限公司的关联人员,因此可能不受FINRA关于分析师与标的公司沟通、公开露面和所持交易证券的限制。华泰证券(美国)有限公司是华泰国际金融控股有限公司的全资子公司,后者为华泰证券股份有限公司的全资子公司。任何直接从华泰证券(美国)有限公司收到此报告并希望就本报告所述任何证券进行交易的人士,应通过华泰证券(美国)有限公司进行交易。美国-重要监管披露•分析师黄乐平、张皓怡、陈旭东本人及相关人士并不担任本报告所提及的标的证券或发行人的高级人员、董事或顾问。分析师及相关人士与本报告所提及的标的证券或发行人并无任何相关财务利益。本披露中所提及的“相关人士包括FINRA定义下分析师的家庭成员。分析师根据华泰证券的整体收入和盈利能力获得薪酬,包括源自公司投资银行业务的收入。•晶晨股份(688099CH):华泰证券股份有限公司、其子公司和/或其联营公司实益持有标的公司某一类普通股证券的比例达1%或以上。•晶晨股份(688099CH):华泰证券股份有限公司、其子公司和/或其联营公司在本报告发布日担任标的公司证券做市商或者证券流动性提供者。•华泰证券股份有限公司、其子公司和/或其联营公司,及/或不时会以自身或代理形式向客户出售及购买华泰证

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论