




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机行业市场分析
一、2023年回顾:坚守景气,行业反转
结束长期调整,迎反弹行情。申万计算机行业指数自2020年7月以
来持续向下调整,2022年以来受呈现先抑后扬趋势,前三季度受到
疫情、宏观经济承压等因素影响,继续深度调整,而10月以来随着
信创、安全等代表的板块边际变化,23年在AIGC和数字经济的带
动下,服务器、大模型、AI应用、数据安全端纷纷表现,市场预期
提升,板块反弹明显。截至4月28日,计算机板块2023年累计涨
幅达到27.22%,位于申万31个行业板块的3位。
图1:计算机(申万)与沪深300累计涨跌幅
公募持仓市值环比改善,但继续保持低配。从23年一季度公募持仓
数据看,计算机板块总持仓市值为1436亿元,总持仓占比4.48%,
环比小幅提升,位列6名,目前仍处于低配状态。前十大重仓股为金
山办公、海康威视、恒生电子、科大讯飞、广联达、深信服、同花顺、
宝信软件、中科创达、大华股份。
板块估值修复显著。2022年10月以来计算机板块估值从底部开始回
升,截至2023年4月28日收盘价,计算机板块PETTM为56.36X,
高于五年来均值水平(46x)o从细分行业看,安防设备板块估值仍
然低于历史均值,为34X,此外,其他计算机设备、IT服务III、垂
直应用软件和横向通用软件PETTM分别为48、49、73、161X。
白马龙头估值回归。个股估值层面,当前主要白马龙头公司估值有所
分化,前期信创、安全等产业热点催化叠加近期AI浪潮、数据要素
等驱动,金山办公、中望软件、用友网络、中国软件、海光信息等公
司估值(PETTM)回升显著,部分仍处于历史较低水平。
业绩表现待修复。疫情、经济压力加大,2022年前三季度计算机板
块业绩同比表现整体不佳,Q3开始后营收端看到边际改善,包括毛
利率亦明显回升。
图6:2023Q1计算机板块营收同比+5.00%
计算机
二、AI人工智能:拥抱科技,把握AI新时代
2.1拥抱AI核心资产
2.1.1GPU:GPT-4对算力需求更大,算力重要性凸显
近年来,由于其并行计算的特性,GPU也被应用于一些需要大量计
算的领域,如机器学习、深度学习、数据挖掘、科学计算等。在这些
领域中,GPU可以加速训练模型、处理海量数据等计算密集型任务,
显著提高了计算效率和速度。因此,GPU已成为现代计算机的重要
组成部分,被广泛应用于各种领域。GPU的工作原理和CPU类似,
都是通过执行指令来完成计算任务的。不同的是,CPU是通过串行
执行指令的方式来完成计算任务的,而GPU是通过并行执行指令的
方式来完成计算任务的。GPU的并行计算方式可以同时执行多个任
务,大大提高了计算效率和速度。
GPU采用了数量众多的计算单元和超长的流水线,但只有简单的控
制逻辑并省去了Cache;而CPU不仅被Cache占据了大量空间,而
且还有有复杂的控制逻辑和诸多优化电路:相比之下计算能力只是
CPU很小的一部分。CPU需要很强的通用性来处理各种不同的数据
类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这
些都使得CPU的内部结构异常复杂;而GPU面对的则是类型高度
统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。
GPU最初用在PC和移动端上运行绘图运算工作的微处理器,与
CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA于2007年
率先推出独立GPU(独显),使其作为“协处理器”在PC和服务器端
负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU
继续运行其余程序代码。作为独显的GPU由GPU核心芯片、显存
和接口电路构成。
AI芯片在智能摄像头、无人驾驶等领域应用广泛。数据、算力和算
法是AI三大要素,CPU配合加速芯片模式成为典型的AI部署方案,
CPU提供算力,加速芯片提升算力并助推算法的产生。常见的AI加
速芯片包括GPU、FPGA(FieldProgrammableGateArray)和ASIC
(ApplicationSpecificIntegratedCircuit)三种类型。
2021年1月,OpenAl发布了OpenAlCLIP,用于进行图像和文本
的识别分类;同时推出全新产品DALL-E,该模型可以根据文字描述
自动生成对应的图片,2022年更新的DALL-E2更是全方位改进了生
成图片的质量,获得了广泛好评。2022年12月,OpenAI推出基于
GPT-3.5的新型AI聊天机器人ChatGPT,在发布近两个月后拥有1
亿用户,成为史上用户增长最快的应用;美东时间2023年3月14
日,ChatGPT的开发机构OpenAl正式推出多模态大模型GPT-4。
GPT-4相较于ChatGPT实现能力大幅度提升。GPT-4是一个多模
态大模型(接受图像和文本输入,生成文本),相比上一代,GPT-4
可以更准确地解决难题,具有更广泛的常识和解决问题的能力:更具
创造性和协作性;能够处理超过25000个单词的文本,允许长文内
容创建、扩展对话以及文档搜索和分析等用例。
ffl11:GPT-4能坏处理收过25000个单词的文本
WordLimit
25.000wordsoftextaround8
数据、算力及模型是人工智能发展的三要素。以GPT系列为例:(1)
数据端:自OpenAI于2018年发布GPT-1,到2020年的GPT-3,
GPT模型参数数量和训练数据量实现指数型增长。参数数量从
GPT-1的1.17亿增长到GPT-3的1750亿,训练数据量从5GB增
长到的45TB;(2)模型端:ChatGPT在以往模型的基础上,在语
料库、计算能力、预训练、自我学习能力等方面有了明显提升,同时
Transformer架构突破了人工标注数据集的不足,实现与人类更顺畅
的交流;(3)算力端:根据OpenAI发布的(LanguageModelsare
Few-ShotLearners》,训练13亿参数的GPT-3XL模型训练一次消
耗的算力约为27.5PFIop/s-dav,训练1750亿参数的完整GPT-3模
型贝ll会消耗算力3640PFIop/s-dav(以一万亿次每秒速度计算,需要
3640天完成)。
GPT-4相对于3来讲训练需求的算力更大。以GPT-3模型为例,以
算力需求=2、参数数量x3x数据规模*训练轮数为计算模型,以Open
Al数据为基础,则训练1轮GPT-3需要的算力
=2x174.6x10A9x3x300x10A9x1=3.14x10A23flop,如果采用A100
芯片,则GPT-3需要的算力为
=3.14x10A23/(39x10A12x365x24x60x60=241A100-years(即一张
A100芯片需要训练241年),如果需要一个月训练完则需要2000
多张A100。可见,GPT-3对于算力的需求巨大,GPT-4相对于3来
讲,参数是其20倍左右,且增加了多模态,因此对于算力的需求更
大。全球算力规模将呈现高速增长态势。根据国家数据资源调查报告
数据,2021年全球数据总产量67ZB,近三年平均增速超过26%,
经中国信息通信研究院测算,2021年全球计算设备算力总规模达到
615EFIops,增速达44%。根据中国信通院援引的IDC数据,2025
年全球算力整体规模将达3300EFIops,2020-2025年的年均复合增
长率达到50.4%。结合华为GIV预测,2030年人类将迎来YB数据
时代,全球算力规模达至I」56ZFIops,2025・2030年复合增速达到
76.2%O
大模型核心是训练算力,Chat流量核心是推理算力。从训练侧来看,
我们了解到大模型训练需经过无监督学习出预训练模型、有监督学习
数据集,奖励学习,强化学习暴力计算四个阶段,训练过程一般在1
个月左右,超过2人月则不具备工程和商业落地价值。因此需要大规
模GPU服务器组网训练。从经验来看,GPT-3级别模型需要大约
1000张A100级别的训练卡才能确保在一个多月时间完成训练。如
果是GPT-4级别多模态训练,则需要在每个模态分别训练收敛,最
后在全局收敛,训练成本乂在GPT-3基础上大幅增长数倍乃至十数
倍、数十倍。当前国内大模型训练爆火,相关企业、团队不下10家,
垂类模型如同花顺(金融)、云从(多模态)等则更多,因此训练侧
需求爆棚,相关GPU、服务器、光模块乃至PCB、serdes.HBM等
需求将持续爆棚才能确保不打输当前的军备竞赛。但就openAl不支
持ChatGPT的Plus付费而言,更多的问题出在推理测。与训练侧
不同,当模型训练完成、应用场景固定,通过对模型进行裁剪、优化
参数网络存储、降低精度降低存储量和计算强度降低对显存、片间带
宽和算力的要求,可以降低对单张卡的算力要求。但推理直接服务用
户和应用,面对的是上亿(360)、数亿(淘宝)、十亿(微信、tiktok、
tw、fb、google)等海量流量的冲击,所需要的算力规模无比巨大,
从经验来看远大于训练侧的算力需求。
因此我们建议关注openAl不支持ChatGPT的Plus付费对训练、
推理两条线的影响:对训练侧,主要影响在于爆火刺激大模型研发相
关方积极投入为未来的AI红利抢占先机;对推理侧,。penAl当前用
A100支持推理侧直面海量用户的策略遭受巨大挑战,也预示着未来
推理侧算力的巨大红利尚待挖掘。商汤发布大模型,继续看好算力线。
商汤4月10日宣布推出大模型体系“日日新大模型”。用户高度关注
的语言问答和图片AI生成功能部分。1.中文语言大模型应用平台,
商汤将其命名为“商量”,希望AI能在商量的过程中帮助用户解决问题。
“商量”平台目前参数量为1800亿。实现多轮对话、基于人设的对话、
共情等出现类chatgpt"涌现'能力。2.文生图方面,“秒画”可理解为对
标Midjourney的AI绘图产品,并实现了部分CMtai(C站)功能,
尤其值得注意的是,“秒画”实现了2秒出图和自训练功能。商汤此次
发布大模型表示出国内大模型有能力达到GPT3.5的水平,看好大模
型军备竞赛,利好算力产业。
2.1.2大模型/垂类模型:随着数字经济、元宇审等概念的逐渐兴起,
大模型迅速发展
随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、
算力投资难度大、高水平人才稀缺的发展瓶颈。大模型作为解决上述
问题的最优路径之一,可极大降低企业的技术门槛和开发成本。IDC
定义下的AI大模型是基于海量多源数据打造的预训练模型,是对原
有算法模型的技术升级和产品选代,用户可通过开源或开放API/工具
等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、
决策、生成效果和更低成本的开发部署方案。大模型的核心作用是突
破数据标注的困境,通过学习海量无标注的数据来做预训练,拓展整
体模型前期学习的广度和深度,以此提升大模型的知识水平,从而低
成本,高适应性地赋能大模型在后续下游任务中的应用。在实践中,
预训练大模型在基于海量数据的自监督学习阶段完成了“通识”教育,
再借助“预训练+精调”等模式,在共享参数的情况下,根据具体应用
场景的特性,用少量数据进行相应微调,即可高水平完成任务。
ffl13:训练大模型“畏调练♦靖洞”模式
卢曼应用
I忖,郎械):量人]
[十处不用](督年向8][H标杪淘)
原子能力
任务相关少量做提
候调脩
通识做*
当量七标注做掘
文本知识用像……
从技术的角度来看,大模型发端于自然语言处理领域,以谷歌的
BERTOpenAl的GPT和百度文心大模型为代表,参数规模逐步提
升至千亿、万亿,同时用于训练的数据量级也显著提升,带来了模型
能力的提高。此外,继语言模态之后,如视觉大模型等其他模态的大
模型研究,也开始逐步受到重视。进一步地,单模态的大模型被统一
整合起来,模拟人脑多模态感知的大模型出现,推动了AI从感知到
认知的发展。国家政策对AI产业应用的关注与引导将推动预训练大
模型加速发展。在国家层面,各国都在强调人工智能在发展中的重要
性,并相继出台相关政策,希望在新一轮产业变革中占据上风。中国
在“十四五”期间,针对人工智能的未来发展陆续出台了相关指导方案
和激励支撑政策,对人工智能的整体发展方向和技术发展重点做出重
要规划,同时提出加强算法创新与应用、推动算力基础设施建设、完
善数据基础支撑体系等关键建议,倡导未来不断夯实产业发展新基础。
2021年中国人工智能软件及应用市场国模为51亿美元,预计2026
年将会达到211亿美元,各行业的需求正大力推进AI的发展,将推
动市场的持续增长。
随着数字经济、元宇审等概念的逐渐兴起,人工智能进入大规模落地
应用的关键时期,但其开发门松高、应用场景复杂多样、对场景标注
数据依赖等问题开始显露,阻碍了规模化落地。AI大模型凭借其优
越的泛化性、通用性、迁移性,为人工智能大规模落地带来新的希望。
2.1.3AI监管:AIGC高速发展,AI监管重要性凸显
4月11日,国家互联网信息办公室发布关于《生成式人工智能服务
管理办法(征求意见稿)》(以下简称“《管理办法》”)公开征求意
见的通知。《管理办法》明确提出,利用生成式人工智能生成的内容
应当真实准确,采取措施防止生成虚假信息。根据《管理办法》,提
供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公
德、公序良俗,符合以下要求:同时《管理办法》指出,利用生成式
人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人
(以下简称“提供者”),包括通过提供可编程接口等方式支持他人自
行生成文本、图像、声音等,承担该产品生成内容生产者的责任;涉
及个人信息的,承担个人信息处理者的法定责任,履行个人信息保护
义务。
此外,《管理办法》指出,利用生成式人工智能产品向公众提供服务
前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全
评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务
算法推荐管理规定》履行算法备案和变更、注销备案手续。同一时间,
美国商务部也就ChatGPT等AI工具监管措施公开征求意见。作为
潜在监管的第一步,美国商务部4月11日就相关问责措施正式公开
征求意见,包括新人工智能模型在发布前是否应经过认证程序,征求
意见期限为60天。此前一周,全球范围内已掀起了对ChatGPT潜
在风险的关注,意大利、德国等计划加强对ChatGPT的监管。
2.1.4核心应用:AI+办公为核心落地场景
在AIGC产业链的下游,可以将相关应用拓展到四个主要场景:文本
处理、音频处理、图像处理、视频处理。文本处理是AIGC相关技术
距离普通消费者最近的场景,也是技术较为成熟的场景,许多应用公
司都会从多个维度出发,辅助业务拓展与商业化过程中。一般说来文
本处理可以细分为营销型、销售型、续写型、知识型、通用型、辅助
型、交互型、代码型。目前的音频处理主要分为三类:音乐型、讲话
型、定制型,很多公司都专注于此。AI的应用将优化供给效率,改
善整体利润水平。图片的创作门槛比文字高,传递信息也更直观,所
以商业化的潜力自然也更高。随着AIGC应用的日益广泛,图片处理
也就从广告、设计、编辑等角度带来更大更多的机遇。图片处理可细
分为生成型、广告型、设计型、编辑型。
随着时代的发展,人们在视频上的投入逐渐超出了在图片上的,视频
也日益成为新时代最主流的内容消费形态。因此将AIGC引入视频将
是全新的赛道,也是技术难度最大的领域。视频处理可以细分为生成
型、编辑型、定制型、数字虚拟人视频。同花顺拥有大量的训练数据。
同花顺的主营业务是基十为个人投资者提供专业化的投资工具(软
件),从而向用户收取会员费、向证券公司收取开户导流费。据Quest
Mobile数据显示,2022年下半年,同花顺炒股票APP接近3000万
人次,当前全国自然人投资者数量约为2.1亿人,同花顺在同类产品
中市占率领先。同花顺深耕AI领域,初步具备一些应用能力。公司
的投顾问答场景应用了语言模型自然语言处理的技术。相对于目前较
为主流的“端到端”的绩效评估形式,较早的使用了语言模型来完成对
用户的问句结构化查询和时配的建模。目前用户向爱问财提问,它还
只能给出一个较为宽泛的一般性回答,未来需要做的就是将它推进到
较为精确的阶段,如提供一些结构化的图表。需要利用爱问财近10
年的自然语言工具与结构化查询数据的积累来训练语言模型,做到更
精确的自然语言理解和结构化匹配。
金山办公的WPS产品为国内AI+办公软件生态落地最佳场景,公司
主动拥抱生成式AI技术变革。金山办公拥有办公应用套件WPS
Office,为对标Microsoft365的AI+办公软件应用落地优质场景。自
2017年起,AI即上升至金山办公产品战略之一,公司AI业务已经历
技术研发、技术产品化两个阶段,进入当前的AI产品业务化阶段,
计划将AI产品沉淀转化为公司实际业务以推动公司业绩增长。面对
生成式Al技术变革,根据CEO章庆元采访,公司2023年将在AI
领域进一步重点发力,会侧重在内容生成、BI等表格应用、格式美
化等AIGC方面实现更多技术应用突破,主动拥抱AI技术变革。
公司积极探索AIGC技术,拟发行GDR推进全球化公司积极探索结
合AIGC、LLM技术的下一代人机交互体验,并在文档翻译、听读、
中英文校对、语音及音频转写、智能辅助写作及排版、表格数据智能
分析、PPT一键生成及美化等场景进行融合,为用户提供便捷优质
的智能化服务体验。2022年,金山办公利用AI能力帮助用户校对总
字数达3,340亿个,全年OCR处理图片数量达146亿份,智能美化
功能月活跃用户数量达237万。
2.2坚守边际优先资产
从海外模型角度看,GPT系列不断更新迭代,3月初,GPT成本降
低90%,以及GPT-40ffice全家桶Microsoft365Copilot发布,打
开ai应用想象空间,促进海外应用接入GPT,相对国内而言,海外
应用接入GPT-4更加容易和方便。从大模型本身看,自然语言处理
(NaturalLanguageProcessingNLP)是用计算机来模拟、延伸及
拓展人类语言能力的理论、技术及方法,是融合语言学、计算机科学、
数学等于一体的综合性学科。自然语言处理目前面临的关键问题是人
类语言的复杂性和多样性,例如同样的词汇在不同的语境之下意思不
完全一致、日常用语中的反识等反向情感表达,句式结构的多变和缺
失所引发的歧义以及方言和“行话”等语言个性化特点。计算机视觉
(ComputerVisionCV)是指使用计算机及相关设备来模拟生物视觉
的技术,即基于传统或深度学习算法,赋能计算机理解数字图像和视
频,并从各种模态的数据之中提取目标信息。其主要目标是开发'机
器之眼”,不仅让计算机具备视觉能力,更让计算机识别、理解“看”
到的多模态数据。
多模态大模型的发展从OpenAl的CLIP(文本图像匹配),以及Dall-E
(文生图)拉开帷幕,目前跨多个模态的数据融合问题开始变成行业
探究的重点。多模态是指多个模态感知与认知的融合。对于人类来说,
所有感知交互方式的融合形成了社会交流;对于计算机来说,是通过
对文本、图片、视频和音频等不同储存信息载体的认知和理解,结合
环境因素来模拟人与人之间的交互方式。多模态技术的重要性不言而
喻,让人工智能理解人类世界的最优办法就是让AI成功理解多模态
信息并能够对此类信息形成分析、推理的逻辑和生成新信息的能力。
近期Meta发布SAM,看好多模态解决方案产业链。Meta可以快速
识别照片/视频中的所有物体,并智能地将其分割成不同的形状和板
块。1)相较于普通的抠图软件来说,原本需要手动选择的目标,现
在只需要SAM的识别就可以快速分割画面中的物品,且精准度,效
率都要比个人操作高。2)此外,SAM的一大突破还在于,即使是在
训练过程中从未遇到过的物品和形状,人工智能也能将其准确识别并
分割出来。3)交互方面,SAM还支持用户使用各种交互性的方式来
分离出想要的物体。可以通过将鼠标悬浮在该物体之上,就能自动定
位出物体的轮廓。即使是颜色非常相近或者有连人眼都很难快速分辨
出的倒影的图片之中,SAM都能非常准确找出轮廓边线。也可以直
接通过输入文字查询,AI就可以找到并标记出这个图片中对应的文
字对象。4)视频方面,对于视频中的物体,SAM也能准确识别并且
还能快速标记出物品的种类、名字、大小,并自动用ID给这些物品
进行记录和分类。5)编辑方面,除了能把物品从图像中精准地分离
出来,SAM还能支持对这个物品的编辑。
SAM基于1100万张照片训练,模型和数据全部开源,看好多模态解
决方案产业链。1)SAM开创性地跟Prompt结合了起来。它可以接
受各种输入提示,例如点击、框选或指定想要分割的对象,这种输入
并不是一次性指令,你可以不停地对图像下达不同的指令达到最终的
编辑效果,这也意味着此前在自然语言处理的Prompt模式也开始被
应用在了计算机视觉领域;此外,SAM基于1100万张图像和11亿
个掩码的海量数据集上进行训练,这是迄今为止最大的分割数据集;
SAM在各种分割任务上具有很强的零样本性能。零样本意味着SAM
可以在不对特定任务或领域进行任何额外训练或微调的情况下分割
对象。2)我们看好多模态产业链,Meta此次推出SAM预示着大模
型在多模态发展方面更进一步,布局计算机视觉/视频的厂商有望在
Meta产品推出的背景下持续受益。
盘古大模型初露头角,成果显著。2021年4月份发布了盘古NLP大
模型和盘古机器视觉大模型,当年也发布了盘古科学计算大模型,在
2021年9月份,用于药物研发中小分子药物筛选发布了盘古药物分
子大模型;到2022年在行业中拓展应用,比如和能源集团合作发布
了盘古矿山大模型,到2022年11月份在华为HDC大会上发布了盘
古气象大模型;在2022年的HDC泰国上,发布了盘古海浪大模型、
盘古金融OCR大模型。
表8:盘古大模型相关产品
A*相美应用
系于含古Graph大根曳.隼为云为跋例臬⑷打透什他配煤坪决方案.标作人贯只常要△系统
中檎入M燎以次的原料取分相关比例.系统我能自动计算假决中的量.此煤仅*,♦1~2
长古Graph太模里
分及量fll测淮W隼达到95%.&碉偎佬及鹏董的树堤下,手均配爆成本下得收过5之.以今
产量200万色性发为例,会让可■书4**上千万元.
与中国"芋龙上渗药物马比所做合词蜂、依托平为云一站K区4纣或千台EIHealth的面向用
物缙发做成的AI大慑里.述大限量子习了17化个药物小分子的化学绐构,在行物生机方件.实
用物分子大横型
现了对小分子化合物的I*构怙息的;M度袅U、时把&釜白片的计算与匹配.以及时薪分子生化舄
姓的然潮.从而高效生成药物新分子:冬药物优化方面.突脱了H律选后的先导种遗忏定向优化.
姑合工人机电力什怆至位枝代.国同立庆生川供电公司将样本簿速效率发升的30停.H
逸力量提升约5倍.H金会土格式的自动It旗增广以及臭剂自适应代火房收优化*屯,一个根史
叁古CV大根型
可以替代东川原来的20多个小根T.极大通或少了根曳维护哎公.平均输度发升18.4%,模型
开•★成本降低90%.
金M8R大根史在金融机构企及异常疗为性滞&U中实花了90%以上的修涮巾父学
盘古生态逐步完善,有望将AI赋能众多行业。大模型是连接技术生
态和商业生态的桥梁,是未来AI生态的核心。盘古大模型可分为三
个层级。L0是基础通用模型,比如GPT3,但应用到行业中达不到
最好的效果。L1是行业大模型,在L0的基础上加入行业数据,通过
混合训练得到。L2是部署模型,将L1在具体下游、千行百业的细分
场景进行部署得到L2o尽快的降低生产成本、提高效率,由L1升级
到L2是关键。盘古大模型聚焦“Alforindustries”,凸显泛化能力优秀、
样本能力高效、使用门槛较低的特点,有望推动人工智能开发从“作
坊式”到“工业化”升级,应用领域将包括气象、医药、游戏、税务、工
业、机械、航天航空、土木、地质等多方面。
盘古大模型底层昇腾生态链完善,产能确定落地确定。以“一平台双
驱动”布局,昇腾牛态链逐渐完善。“一平台”:昇腾基础软硬件平台,
包括Al处理器、服务器硬件、芯片使能软件、MindSpore全场景
Al计算框架和应用使能平台MindX。“双生态”:(1)AI技术生态,
包括科研机构、高校、企业、合作伙伴的研究和开发人员。(2)AI
商业生态,包括ISV、IHV、整机伙伴、一体机合作伙伴等。昇腾计
算产品众多。其中,昇腾910芯片支持全场景人工智能应用,昇腾
310芯片主要用在边缘计算等低功耗的领域。华为已联合超100家头
部ISV基于昇腾孵化超过120个解决方案。为盘古大模型的发展提
供底层算力核心支持。
盘古大模型聚焦“Alforindustries”,凸显泛化能力优秀、样本能力高
效、使用门槛较低的特点,有望推动人工智能开发从“作坊式”到“工业
化”升级,应用领域将包括气象、医药、游戏、税务、工业、机械、
航天航空、土木、地质等多方面。
阿里通义大模型架构庞大。阿里通义大模型整体可分为三个层次,分
别为行业模型、通用模型与模型底座。(1)模型底座层:主要构建语
言和视觉的模态映射,通过统一学习范式与模块化设计来实现;(2)
通用模型层:主要包括多模态模型“通义・M6”;NLP模型“通义-Alice
Mind”和CV模型“通义・视觉”。每个模型下对应不同的功能模块。(3)
行业模型层:结合电商、设计、医疗、娱乐、设计、金融、工业、制
造业等行业的特点,对通义大模型进行功能完善和应用细分。
通义大模型厚积薄发。阿里在NLP、多模态模型领域技术实力雄厚。
2019年,阿里开发出了大规模预训练语言模型structBERT并登顶
全球NLP权威榜单GLUE;2021年,阿里开发出了国内首个超百亿
参数的多模态大模型M6。凭借多年的发展,2023年4月阿里开放
通义千问内测。
飞天智算平台为大模型提供强大算力。大模型竞赛本质上己延伸到算
力层面,云计算是支撑更聪明AI的基础。2022年8月,阿里云推出
全栈智能计算解决方案——匕大智算平台,为科研、公共服务和企业
机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,
AI训练效率提升11倍,推理效率提升6倍。阿里推出“魔塔”社区,
让模型应用更简单。2022年11月,阿里巴巴达摩院推出人工智能模
型开源社区“魔搭”(ModelScope),旨在打造下一代开源的模型即服
务共享平台,为泛AI开发者提供灵活・、易用、低成本的一站式模型
服务产品,让模型应用更简单。“魔搭”社区首批上架超300个模型,
其中中文模型超过100个,覆盖了视觉、语音、自然语言处理、多
模态等AI主要领域,推动AI应用发展。不到半年的时间里,“魔搭”
社区总用户量已超100万,模型总下载量超1600万次,成为国内规
模最大的AI模型社区。
表10:“魔塔”社区提供多料服务
Hi•介外
&XNLP、CV、Audio等多何城的具有文全力的SOTA模R.史有什*例光的5根
事方的长调惇SOTA惬鱼
专大模型,全部电费开放下公以及使冏.
汇臬行业加予未加”的公开做据臬.竟有阿工已已臬HJ货状的卡业依械做媚臬芬你来
手之开就的做弊臬
提供*于根笈的本地检理44口,以及城上楔欠找反依测霆寺.方便开发者快速心越与
一疗代马使用模幺按理能力
使用,
十仔代号怏速构比*4行十几疗代马实现时候词缘梗T的微河调缥(finetune).方便钎发者*于行*椒相11怏
业模型建构W*4疗皮根型.
一饨开启在找Notebook实调+台.臬成官方帔像2除环境安装国扰.舞扶海科云盛算
即开中用的在愎开)11十台
力,体会使技的文互KG包.
吴沿的模壁桃茶与与署方*二上渡AI机某.更好地实也幔里it移:多“惬型调练与《多部署方人.找侯史$白
K上可权的逸旭.
华富的歙芋内忘与找术责
极供友好的优魔的皱<1内忘与钎放的社区改图,耳助开发者学习羯
4
阿里智能家居业务蓬勃发展。根据36叙显示,2023年中国智能家居
市场规模将突破5000亿元。阿里在智能家居业务上多面出击,重兵
布局,主要和传统家电企业合作,构建开放式平台,形成了较为完整
的大家居战略。天猎精灵成为消费者购买智能音箱的首选品牌,2022
年市场份额为27%o
阿里智能家居主要通过阿里云LoT进行阿里智能家居生态的打造。
主要包括三方面:阿里云LoT平台产品、阿里云LoT基础产品和阿里
云LoT应用&服务。
(1)阿里云LoT平台产品
阿里云Link生活平台(生活物联网平台),阿里云Link城市平台(城
市物联网平台)和阿里云Link商业共享平台(商业共享平台)。
(2)阿里云LoT基础产品
阿里云LinkEdge(将计算扩展至边缘),阿里云LinkWAN(广域低功
耗物联通讯网络)和AliOSThings(嵌入式物联网实时操作系统)。
(3)阿里云LoT应用&服务
阿里云Unk测试&认证服务(软硬结合的测试&标准化认证服务)和
阿里云Link魔笔(自然书写笔迹数字化的云端产品)。
天猫精灵+GPT已进入内测。阿里云将推动AI进一步普及。阿里巴
巴所有产品未来将接入大模型。目前,钉钉、大猫精灵已经在测试接
入大模型。接入通义千问后,新天猫精灵变得更拟人更聪明,知识、
情感、个性、记忆能力大幅跃升。大语言模型“通义千问”正式推出。
4月11日的阿里云峰会上,阿里云正式宣布推出大语言模型“通义千
问”。通义千问是一个超大规模的语言模型,具备多轮对话、文案创
作、逻辑推理、多模态理解、多语言支持等功能。
三、数据要素:数字经济之基
3.1乘数字经济之风,数据要素市场快速发展
数据服务商在数据要素产业链处于核心位置,起到链接数据供应方和
需求方的作用。数据要素产业链上游主要是数据提供方,主要提供公
共数据、业务信息、个人信息的数据。中游主要是数据服务商、数据
交易所。下游是数据需求方,包括政府、金融、教育、医疗等行业客
户。
图21:数据要素产业fci
H钟机构
在数字社会,数据扮演基础性战略资源和关键性生产要素双重角色,
一方面,有价值的数据资源是生产力的重要组成部分,是催生和推动
众多数字经济新产业、新业态、新模式发展的基础;另一方面,数据
区别于以往生产要素的突出特点是对其他要素资源具有乘数作用,可
以放大劳动力、资本等要素在社会各行业价值链流转中产生的价值。
根据《中国数据要素市场发展报告》,数据要素对我国GDP增长的
贡献率和贡献度在2021年分别为14.7%和0.83个百分点。总体来
说,数据要素对当年GDP增长的贡献率呈现持续上升状态,表明数
据要素正发挥越来越大的促进作用。
数据要素包含七大模块,具备泛在赋能等特点。我国数据要素市场归
结为数据采集、数据存储、数据加工、数据流通、数据分析、数据应
用、生态保障七大模块,覆盖数据要素从产生到发生要素作用的全过
程。其中数据采集、数据存储、数据加工、数据流通、数据分析、生
态保障六大模块,主要是数据作为劳动对象,被挖掘出价值和使用价
值的阶段;而数据应用模块,主要是指数据作为劳动工具,发挥带动
作用的阶段。
数据要素流通环节亟待发展。数据要素市场涉及环节众多,包括数据
采集、数据分析、数据加工、数据确权、数据质量评估、数据定价、
数据交付、数据治理、数据安全等。经过数年乃至十数年的发展,行
业数字化取得了相当的进展,传统IT服务市场已较为成熟,但跨行
业、跨公司的数据要素流通仍有较大发展空间,新兴IT服务市场迎
发展机会。
图26:致据要素市均慨况
数据供给:当前中国数商行业企业数量为192万家,数据产品和服
务供给不足。根据国家工信安全发展研究中心,从市场规模来看,
2021年,数据供给环节(采集、存储、加工)的市场规模达到385
亿元。2021年中国数据要素市场规模约为815亿元(不含数据应用),
其中,数据供给环节占比47.2%。从数商企业数量来看,存在明显的
供需不匹配问题,缺少标准化和规划化产品。高质量数据产品的背后
是高质量数商。根据上海数据交易所官网,截至2022年11月,上
海数据交易所累计挂牌数商仅89个。根据《全国数商产业发展报告》,
截至2022年11月,中国数商行业企业数量达到192万家。其中,
中国数商产业主要集中在长三角、珠三角、京津翼、川渝地区,四大
区域合计占比达到56.8%。
数据流通:目前仍以场外交易为主,场内交易持续发力。从市场规模
来看,根据国家工信安全发展研究中心,2021年中国数据流通(交
易、分析、数据服务)市场规模约为380亿元,占中国数据要素市
场规模的46.6%。从市场占比来看,根据上海数据交易所研究院,
2022年,场外交易占全部交易的比重约为2%。预计到2025年,场
内交易占比将达到1/4~1/3。场外交易平台集中度低,场内交易以省
市级交易所为主。2014年1月,中关村数海大数据交易中心平台成
立,拉开了场内交易的序幕;2015年4月,全国首家大数据交易所
贵阳大数据交易所获批成立;2022年11月,深圳数据交易所正式揭
牌成立,至此,北上广深四大一线城市均开启了新的数据流通探索。
自2020年以来,国家陆续出台数据要素市场化改革的法规及政策文
件,总体围绕“以数据安全为前提,完善数据要素产权配置、完善数
字治理、细化市场领域”,由浅入深地建立健全数据要素市场的基础
制度。
搭乘数字经济的快车,我国数字要素市场整体处于高速发展阶段。“十
三五”期间,我国各个要素市场规模均实现稳定增长,以数据采集、
数据存储、数据加工、数据流通等环节为核心的数据要素市场增长尤
为迅速。据国家工信安全中心测算,2021年我国数据要素市场规模
为704亿元,预计到2025年我国数据要素市场规模将达到1749亿
元,2021年-2025年的年复合增长率超过25%。根据中国信通院数
据显不,仅有32%的企业数据价值会被激活,还有数据未被采集、
加工、流通和分析,我们可以预期未来数据要素市场将会在立法与技
术的双重培育下,保持高速增长。
3.2数据要素加速落地,医疗数据优势明显凸显
新政策带来新机遇,国家重视医疗健康领域的数据建设。2022年5
月20日,国务院办公厅发布《“十四五”国民健康规划》,提出促进
全民健康信息联通应用,构建权威统一、互联互通的全民健康信息平
台,完善全民健康信息核心数据库,推进各级各类医疗卫生机构统一
接入和数据共享。探索建立卫生健康、医疗保障、药监等部门信息共
享机制,通过全国一体化政务服务平台,实现跨地区、跨部门数据共
享。研究制定数据开放清单,开展政府医疗健康数据授权运营试点。
2023年3月23日,中共中央、国务院发布了《关于进一步完善医疗
卫生服务体系的意见》,提出发挥信息技术支撑作用,加强健康医疗
大数据共享交换与保障体系建设;建立跨部门、跨机构公共卫生数据
共享调度机制和智慧化预警多点触发机制;推进医疗联合体内信息系
统统一运营和互联互通,加强数字化管理。
在数据要素相关政策出台的推动下,医保数据应用有望加速。2021
年8月,国家医保局提出打造“保险+健康”服务生态闭环,依法依规
探索商业健康保险信息平台与全国统一的医疗保障信息平台信息共
享机制,强化医疗健康大数据应用,助推保险精算创新发展。2023
年1月12日,全国医疗保障工作会议提出“把大数据赋能作为医保改
革发展的重要借力点,最大程度发挥全国统一医保信息平台作用,更
安全史积极更有序地用好医保大数据。”数据要素相关政策的陆续出
台,医保数据应用的路径、场景逐渐清晰。
国家医保局成立后,我国医保信息化建设加速,全国统一医保信息平
含基本建成并投用,各地医保信息平台也在快速推进,医保信息化进
入建设高峰期。医保支付方式改革,如DRG/DIP等,为医保信息化
建设带来新机遇,需要医院和医保部门升级改造原有系统,提高信息
化水平。
图28:DRGs分组路径与应用价值
DRGs分HJS也即,点网价依
64月“f54“5%■”
Mtmw/nv,X三▼二令BL皮以30・柠♦“号
力公导.赵定今述鬻管理体4
>■龙2021隼4R*峰才效力
实咫埼用化送重管理
.“74K13•
,
WM*o•
ey<A<1♦
A“Ia«4<
人1
♦HO,
\JL收入增加A&KKAitM<U2
HaoTM”
A431n
jMCAA^.
医疗机构端信息化投入主动性将显著提升。过去医院信息化建设的目
的主要为:完善院端功能、提升运营效率和服务水平、通过大数据和
云计算等提高信息管理水平。由于信息化投入效益难以在短期体现,
过去外部资金支持较为短缺,信息部人力资源不足,医院管理层缺乏
资金投入动力。一方面,随着行业众多催化政策陆续落地,各项信息
化建设规划明确,国家卫健委等官方部门资金支持力度加大,多项信
息系统被纳入医院评级标准,各项外部因素驱动医院主动增加信息化
投入。另一方面,人口老龄化、新冠疫情等加重医疗服务与管理压力,
医院发展也逐步走向精细化阶段,信息化建设对医院综合实力的影响
逐步体现,信息化投入的内部主动性也将逐步提高。
医疗健康数据具有广泛应用场景。如疾病智能筛查诊断场景,通过融
合医院诊疗数据,促进如疾病自动筛查、埔助诊断(CDSS)、智能
医疗培训等医疗人工智能技术的加速发展以及规模化应用;普惠健康
险场景,通过融合保险数据、诊疗数据、医保数据、健康数据等,设
计普惠创新的医疗保险,提供更加精准的保险定价、投保核保、理赔
等服务;健康管理场景,通过融合医疗、健康管理(手环、手机健康
APP等)、消费等数据,对个人健康进行综合建模,形成慢病管理、
疾病预防、健康产品推送等综合应用。院端投入规模仍有较大提升空
间。根据国家卫健委发布的《全民健康信息化调查报告——区域卫生
信息化与医院信息化(2021)》数据显示,2020年各医疗机构年度
信息化建设资金投入占总收入比例在的医院占53.7%,比
例在1%~5%的医院占32.0%,比例超过5%的医院占7.4%,未投入
的医院占6.8%。据研究,发达国家医疗机构信息化建设资金投入占
总收入比例在3-5%,相比之下我国医疗机构的IT支出占收入比重
仍然偏低。
四、国产化/密码:国产替代提速
4.1国产化浪潮持续推进,拥抱自主可控
自中兴事件以来,中美贸易摩擦愈演愈烈,美国已经将数百家中国企
业、机构加入“实体清单”,限制美国技术产品对华输出。2022年10
月,美国工业和安全局(BIS)宣布新一轮的对华芯片出口管制措施,
新规旨在限制中国获得先进计算芯片、开发和维护超级计算机以及先
进工艺制造能力,给中国超算、芯片产业链带来震动。短中期内带来
代工风险,但是也进一步倒逼芯片制造向国产供应链切换,加速产业
成熟。
时代大背景下,需求端自主可控发展的迫切性日益凸显。国家政策导
向更加积极,敦促和引导信创产业发展;同时.,产业对于国产替代的
迫切性、主动性也在加强,以试点项目、实际业务使用反向催化国产
产品技术的成熟。2020年正式规模落地应用以来,信创产业已经开
始支撑党政办公系统、金融、电信等部分业务系统。
M30:信创进衽
JW1我(1”3年2007年)(2008-2016<)>wm(2017-20190>OMtt(2020年今)
•199W.•201%WXgR二就•202(*.
UNIX力由胸小即而第喇E尸化i电
*-COSlXl.O-.国网X目日物瞄.塔万
・2010t.民用-«mjnux-n-20MAFCMBW
发出位,^pcxeoooM.mxs•?020mamRM
W*fiWdff.《e皿.
•199次.aJW8SMP2000«・飞・»布IHWft。
2oi3«.utwmar♦KH晓BLKflttRV
化安”氯JWMKIWVhFT-20W4;
•200g.gnuxl航•刈僻.加个“♦nutMurajflx
・2001年.方舟IU傅口;1r-ftiWW;xa
•2006<.(WWrigf•20165.MXMd^(■Sfifl:
*3tnte(2006-2020)g再开血产化分公*•2021仪月,
3:
>BMWWKfcMWW!力.艮再皿下,"gft产程>眇自主化产品段也•开,产>tM电信电力.交看等・
sn.册系黑网相应日总率..豌aMH步鼾婀
比憾出主Iff的HML目B&股陋
EHUM前l&it.>梵皿钻制自主询目.>的辅稿都I的卅飘可
isin栋刖u.绚I侬.稿鼾AMRT1时如删倒8期I阿田期》挺哈;
了附加・《ML皿3,汕5I7S-WX
供给侧,国产产品不断优化。信创生态系统构建以CPU+OS为基础。
国产CPU主要参与者有海光信息、、海思半导体、龙芯中科、上海兆
芯、天津飞腾等,产品技术持续迭代提高可用性。服务器端,海光信
息具有明显的兼容X86生态优势,而华为积极构建产业生态,“鳏
鹏”ARM生态加速成熟,PC端,匕腾引领市场份额。操作系统领域,
主要由麒麟软件和统信参与。
随着信创产业的深入发展,国产基础软硬件厂商的业务规模高速发展,
并且持续升级优化产品技术,提供更可用、更好用的产品技术。2022
年以来金融为代表的行业信创推进持续超预期,相比党政办公系统替
换,行业信创以业务系统服务器需求为主,带动服务器CPU核心厂
商海光信息业务在2022年继续提速高增,表现尤其突出。
行业信创已经推进至右侧阶段,党政市场替代节奏待观望。金融、电
信行业已经推进三年时间,通过业务系统测试不断打磨国产软硬件产
品可用性,为后续更多行业的国产替代打下坚实基础,进入22年下
半年,信创与各行业信息化、安全发展需求形成强共振,目前教育、
医疗:能源、交通等行业均在有序加速替代之中。同时,党政替换第
一阶段基本完成,后续推进节奏仍待观察,但未来下沉市场、外网政
务系统替换仍有数倍空间。千亿信创基础软硬件市场可期。我们在此
前海光信息、神州数码首次覆盖报告中对党政、信创的服务器市场空
间进行了梳理,替代空间过千亿。若以现有政府、重要行业的终端和
服务器数量为基础,对国产OS替换空间进行测算,我们测算国产
OS市场可替换空间超过300亿,年化替代市场约为63.81亿元。
服务器数量,根据IDC数据,2020年我国服务器出货量约为350万
台,重要行业占其中40%左右,政府为16%,我们估算2020-2022
年已经替换的服务器量约为84万台,另外按照电子设备3年一更新
计算存量。终端数量,参考两方面口径,我们假设可替代终端总量约
为5355万,根据匕腾、金山办公、麒麟软件等企业2020—2022年的
销售额数据,我们估算党政市场已有约600万台的替换;a)服务器与
PC的经验配比,不同行业约1:10〜20;b)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 关于公司买房合同样本
- 万科认购合同样本
- simtrade销货合同标准文本
- 个人代理租房合同标准文本
- 兼职 聘用 合同标准文本
- 买卖集体老石器合同标准文本
- 使用合同标准文本坏处
- 公司货款担保合同样本
- 公司租房出售合同标准文本
- 企业设备制作合作合同样本
- 2025年皖西卫生职业学院高职单招职业适应性测试近5年常考版参考题库含答案解析
- 《中国传统绘画艺术》课件
- 2025医保政策培训
- 中医药在口腔科疾病治疗中的应用
- 2024年正德职业技术学院高职单招职业技能测验历年参考题库(频考版)含答案解析
- 学生心理韧性对教学策略的影响研究
- 2025年度智慧医疗his系统采购合同模板3篇
- 企业对外宣传培训体系
- 巨量云图(中级)认证考试题库(附答案)
- 《可拆装低层装配式钢结构建筑技术标准》
- (英文版)ISO 14040-2006 环境管理生命周期评估原则和框架
评论
0/150
提交评论