2023年计算机行业中期策略坚守AI、拥抱数据、看好信创_第1页
2023年计算机行业中期策略坚守AI、拥抱数据、看好信创_第2页
2023年计算机行业中期策略坚守AI、拥抱数据、看好信创_第3页
2023年计算机行业中期策略坚守AI、拥抱数据、看好信创_第4页
2023年计算机行业中期策略坚守AI、拥抱数据、看好信创_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023年计算机行业中期策略坚守AI、拥抱数据、看好信创(报告出品方/作者:西部证券,邢开允、赵宇阳)一、2023年回顾:坚守景气,行业反转结束长期调整,迎反弹行情。申万计算机行业指数自2020年7月以来持续向下调整,2022年以来受呈现先抑后扬趋势,前三季度受到疫情、宏观经济承压等因素影响,继续深度调整,而10月以来随着信创、安全等代表的板块边际变化,23年在AIGC和数字经济的带动下,服务器、大模型、AI应用、数据安全端纷纷表现,市场预期提升,板块反弹明显。截至4月28日,计算机板块2023年累计涨幅达到27.22%,位于申万31个行业板块的3位。公募持仓市值环比改善,但继续保持低配。从23年一季度公募持仓数据看,计算机板块总持仓市值为1436亿元,总持仓占比4.48%,环比小幅提升,位列6名,目前仍处于低配状态。前十大重仓股为金山办公、海康威视、恒生电子、科大讯飞、广联达、深信服、同花顺、宝信软件、中科创达、大华股份。板块估值修复显著。2022年10月以来计算机板块估值从底部开始回升,截至2023年4月28日收盘价,计算机板块PETTM为56.36X,高于五年来均值水平(46x)。从细分行业看,安防设备板块估值仍然低于历史均值,为34X,此外,其他计算机设备、IT服务III、垂直应用软件和横向通用软件PETTM分别为48、49、73、161X。白马龙头估值回归。个股估值层面,当前主要白马龙头公司估值有所分化,前期信创、安全等产业热点催化叠加近期AI浪潮、数据要素等驱动,金山办公、中望软件、用友网络、中国软件、海光信息等公司估值(PETTM)回升显著,部分仍处于历史较低水平。业绩表现待修复。疫情、经济压力加大,2022年前三季度计算机板块业绩同比表现整体不佳,Q3开始后营收端看到边际改善,包括毛利率亦明显回升。二、AI人工智能:拥抱科技,把握AI新时代2.1拥抱AI核心资产2.1.1GPU:GPT-4对算力需求更大,算力重要性凸显近年来,由于其并行计算的特性,GPU也被应用于一些需要大量计算的领域,如机器学习、深度学习、数据挖掘、科学计算等。在这些领域中,GPU可以加速训练模型、处理海量数据等计算密集型任务,显著提高了计算效率和速度。因此,GPU已成为现代计算机的重要组成部分,被广泛应用于各种领域。GPU的工作原理和CPU类似,都是通过执行指令来完成计算任务的。不同的是,CPU是通过串行执行指令的方式来完成计算任务的,而GPU是通过并行执行指令的方式来完成计算任务的。GPU的并行计算方式可以同时执行多个任务,大大提高了计算效率和速度。GPU采用了数量众多的计算单元和超长的流水线,但只有简单的控制逻辑并省去了Cache;而CPU不仅被Cache占据了大量空间,而且还有有复杂的控制逻辑和诸多优化电路,相比之下计算能力只是CPU很小的一部分。CPU需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复杂;而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。GPU最初用在PC和移动端上运行绘图运算工作的微处理器,与CPU集成以集成显卡(核显)的形态发挥功能。NVIDIA于2007年率先推出独立GPU(独显),使其作为“协处理器”在PC和服务器端负责加速计算,承接CPU计算密集部分的工作负载,同时由CPU继续运行其余程序代码。作为独显的GPU由GPU核心芯片、显存和接口电路构成。AI芯片在智能摄像头、无人驾驶等领域应用广泛。数据、算力和算法是AI三大要素,CPU配合加速芯片模式成为典型的AI部署方案,CPU提供算力,加速芯片提升算力并助推算法的产生。常见的AI加速芯片包括GPU、FPGA(FieldProgrammableGateArray)和ASIC(ApplicationSpecificIntegratedCircuit)三种类型。2021年1月,OpenAI发布了OpenAICLIP,用于进行图像和文本的识别分类;同时推出全新产品DALL-E,该模型可以根据文字描述自动生成对应的图片,2022年更新的DALL-E2更是全方位改进了生成图片的质量,获得了广泛好评。2022年12月,OpenAI推出基于GPT-3.5的新型AI聊天机器人ChatGPT,在发布近两个月后拥有1亿用户,成为史上用户增长最快的应用;美东时间2023年3月14日,ChatGPT的开发机构OpenAI正式推出多模态大模型GPT-4。GPT-4相较于ChatGPT实现能力大幅度提升。GPT-4是一个多模态大模型(接受图像和文本输入,生成文本),相比上一代,GPT-4可以更准确地解决难题,具有更广泛的常识和解决问题的能力:更具创造性和协作性;能够处理超过25000个单词的文本,允许长文内容创建、扩展对话以及文档搜索和分析等用例。数据、算力及模型是人工智能发展的三要素。以GPT系列为例:(1)数据端:自OpenAI于2018年发布GPT-1,到2020年的GPT-3,GPT模型参数数量和训练数据量实现指数型增长。参数数量从GPT-1的1.17亿增长到GPT-3的1750亿,训练数据量从5GB增长到的45TB;(2)模型端:ChatGPT在以往模型的基础上,在语料库、计算能力、预训练、自我学习能力等方面有了明显提升,同时Transformer架构突破了人工标注数据集的不足,实现与人类更顺畅的交流;(3)算力端:根据OpenAl发布的《LanguageModelsareFew-ShotLearners》,训练13亿参数的GPT-3XL模型训练一次消耗的算力约为27.5PFlop/s-dav,训练1750亿参数的完整GPT-3模型则会消耗算力3640PFlop/s-dav(以一万亿次每秒速度计算,需要3640天完成)。GPT-4相对于3来讲训练需求的算力更大。以GPT-3模型为例,以算力需求=2参数数量3数据规模训练轮数为计算模型,以OpenAI数据为基础,则训练1轮GPT-3需要的算力=2174.610^9330010^91=3.1410^23flop,如果采用A100芯片,则GPT-3需要的算力为=3.1410^23/(3910^12365246060=241A100−years(即一张A100芯片需要训练241年),如果需要一个月训练完则需要2000多张A100。可见,GPT-3对于算力的需求巨大,GPT-4相对于3来讲,参数是其20倍左右,且增加了多模态,因此对于算力的需求更大。全球算力规模将呈现高速增长态势。根据国家数据资源调查报告数据,2021年全球数据总产量67ZB,近三年平均增速超过26%,经中国信息通信研究院测算,2021年全球计算设备算力总规模达到615EFlops,增速达44%。根据中国信通院援引的IDC数据,2025年全球算力整体规模将达3300EFlops,2020-2025年的年均复合增长率达到50.4%。结合华为GIV预测,2030年人类将迎来YB数据时代,全球算力规模达到56ZFlops,2025-2030年复合增速达到76.2%。大模型核心是训练算力,Chat流量核心是推理算力。从训练侧来看,我们了解到大模型训练需经过无监督学习出预训练模型、有监督学习数据集,奖励学习,强化学习暴力计算四个阶段,训练过程一般在1个月左右,超过2个月则不具备工程和商业落地价值。因此需要大规模GPU服务器组网训练。从经验来看,GPT-3级别模型需要大约1000张A100级别的训练卡才能确保在一个多月时间完成训练。如果是GPT-4级别多模态训练,则需要在每个模态分别训练收敛,最后在全局收敛,训练成本又在GPT-3基础上大幅增长数倍乃至十数倍、数十倍。当前国内大模型训练爆火,相关企业、团队不下10家,垂类模型如同花顺(金融)、云从(多模态)等则更多,因此训练侧需求爆棚,相关GPU、服务器、光模块乃至PCB、serdes、HBM等需求将持续爆棚才能确保不打输当前的军备竞赛。但就openAI不支持ChatGPT的Plus付费而言,更多的问题出在推理测。与训练侧不同,当模型训练完成、应用场景固定,通过对模型进行裁剪、优化参数网络存储、降低精度降低存储量和计算强度降低对显存、片间带宽和算力的要求,可以降低对单张卡的算力要求。但推理直接服务用户和应用,面对的是上亿(360)、数亿(淘宝)、十亿(微信、tiktok、tw、fb、google)等海量流量的冲击,所需要的算力规模无比巨大,从经验来看远大于训练侧的算力需求。因此我们建议关注openAI不支持ChatGPT的Plus付费对训练、推理两条线的影响:对训练侧,主要影响在于爆火刺激大模型研发相关方积极投入为未来的AI红利抢占先机;对推理侧,openAI当前用A100支持推理侧直面海量用户的策略遭受巨大挑战,也预示着未来推理侧算力的巨大红利尚待挖掘。商汤发布大模型,继续看好算力线。商汤4月10日宣布推出大模型体系“日日新大模型”。用户高度关注的语言问答和图片AI生成功能部分。1.中文语言大模型应用平台,商汤将其命名为“商量”,希望AI能在商量的过程中帮助用户解决问题。“商量”平台目前参数量为1800亿。实现多轮对话、基于人设的对话、共情等出现类chatgpt“涌现”能力。2.文生图方面,“秒画”可理解为对标Midjourney的AI绘图产品,并实现了部分Civitai(C站)功能,尤其值得注意的是,“秒画”实现了2秒出图和自训练功能。商汤此次发布大模型表示出国内大模型有能力达到GPT3.5的水平,看好大模型军备竞赛,利好算力产业。2.1.2大模型/垂类模型:随着数字经济、元宇审等概念的逐渐兴起,大模型迅速发展随着人工智能赋能实体经济进入深水区,企业通常面临数据资源有限、算力投资难度大、高水平人才稀缺的发展瓶颈。大模型作为解决上述问题的最优路径之一,可极大降低企业的技术门槛和开发成本。IDC定义下的AI大模型是基于海量多源数据打造的预训练模型,是对原有算法模型的技术升级和产品选代,用户可通过开源或开放API/工具等形式进行模型零样本/小样本数据学习,以实现更优的识别、理解、决策、生成效果和更低成本的开发部署方案。大模型的核心作用是突破数据标注的困境,通过学习海量无标注的数据来做预训练,拓展整体模型前期学习的广度和深度,以此提升大模型的知识水平,从而低成本,高适应性地赋能大模型在后续下游任务中的应用。在实践中,预训练大模型在基于海量数据的自监督学习阶段完成了“通识”教育,再借助“预训练+精调”等模式,在共享参数的情况下,根据具体应用场景的特性,用少量数据进行相应微调,即可高水平完成任务。从技术的角度来看,大模型发端于自然语言处理领域,以谷歌的BERTOpenAI的GPT和百度文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升,带来了模型能力的提高。此外,继语言模态之后,如视觉大模型等其他模态的大模型研究,也开始逐步受到重视。进一步地,单模态的大模型被统一整合起来,模拟人脑多模态感知的大模型出现,推动了AI从感知到认知的发展。国家政策对AI产业应用的关注与引导将推动预训练大模型加速发展。在国家层面,各国都在强调人工智能在发展中的重要性,并相继出台相关政策,希望在新一轮产业变革中占据上风。中国在“十四五”期间,针对人工智能的未来发展陆续出台了相关指导方案和激励支撑政策,对人工智能的整体发展方向和技术发展重点做出重要规划,同时提出加强算法创新与应用、推动算力基础设施建设、完善数据基础支撑体系等关键建议,倡导未来不断夯实产业发展新基础。2021年中国人工智能软件及应用市场国模为51亿美元,预计2026年将会达到211亿美元,各行业的需求正大力推进AI的发展,将推动市场的持续增长。随着数字经济、元宇审等概念的逐渐兴起,人工智能进入大规模落地应用的关键时期,但其开发门松高、应用场景复杂多样、对场景标注数据依赖等问题开始显露,阻碍了规模化落地。AI大模型凭借其优越的泛化性、通用性、迁移性,为人工智能大规模落地带来新的希望。2.1.3AI监管:AIGC高速发展,AI监管重要性凸显4月11日,国家互联网信息办公室发布关于《生成式人工智能服务管理办法(征求意见稿)》(以下简称“《管理办法》”)公开征求意见的通知。《管理办法》明确提出,利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。根据《管理办法》,提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,符合以下要求:同时《管理办法》指出,利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人(以下简称“提供者”),包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等,承担该产品生成内容生产者的责任;涉及个人信息的,承担个人信息处理者的法定责任,履行个人信息保护义务。此外,《管理办法》指出,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。同一时间,美国商务部也就ChatGPT等AI工具监管措施公开征求意见。作为潜在监管的第一步,美国商务部4月11日就相关问责措施正式公开征求意见,包括新人工智能模型在发布前是否应经过认证程序,征求意见期限为60天。此前一周,全球范围内已掀起了对ChatGPT潜在风险的关注,意大利、德国等计划加强对ChatGPT的监管。2.1.4核心应用:AI+办公为核心落地场景在AIGC产业链的下游,可以将相关应用拓展到四个主要场景:文本处理、音频处理、图像处理、视频处理。文本处理是AIGC相关技术距离普通消费者最近的场景,也是技术较为成熟的场景,许多应用公司都会从多个维度出发,辅助业务拓展与商业化过程中。一般说来文本处理可以细分为营销型、销售型、续写型、知识型、通用型、辅助型、交互型、代码型。目前的音频处理主要分为三类:音乐型、讲话型、定制型,很多公司都专注于此。AI的应用将优化供给效率,改善整体利润水平。图片的创作门槛比文字高,传递信息也更直观,所以商业化的潜力自然也更高。随着AIGC应用的日益广泛,图片处理也就从广告、设计、编辑等角度带来更大更多的机遇。图片处理可细分为生成型、广告型、设计型、编辑型。随着时代的发展,人们在视频上的投入逐渐超出了在图片上的,视频也日益成为新时代最主流的内容消费形态。因此将AIGC引入视频将是全新的赛道,也是技术难度最大的领域。视频处理可以细分为生成型、编辑型、定制型、数字虚拟人视频。同花顺拥有大量的训练数据。同花顺的主营业务是基于为个人投资者提供专业化的投资工具(软件),从而向用户收取会员费、向证券公司收取开户导流费。据QuestMobile数据显示,2022年下半年,同花顺炒股票APP接近3000万人次,当前全国自然人投资者数量约为2.1亿人,同花顺在同类产品中市占率领先。同花顺深耕AI领域,初步具备一些应用能力。公司的投顾问答场景应用了语言模型自然语言处理的技术。相对于目前较为主流的“端到端”的绩效评估形式,较早的使用了语言模型来完成对用户的问句结构化查询和匹配的建模。目前用户向爱问财提问,它还只能给出一个较为宽泛的一般性回答,未来需要做的就是将它推进到较为精确的阶段,如提供一些结构化的图表。需要利用爱问财近10年的自然语言工具与结构化查询数据的积累来训练语言模型,做到更精确的自然语言理解和结构化匹配。金山办公的WPS产品为国内AI+办公软件生态落地最佳场景,公司主动拥抱生成式AI技术变革。金山办公拥有办公应用套件WPSOffice,为对标Microsoft365的AI+办公软件应用落地优质场景。自2017年起,AI即上升至金山办公产品战略之一,公司AI业务已经历技术研发、技术产品化两个阶段,进入当前的AI产品业务化阶段,计划将AI产品沉淀转化为公司实际业务以推动公司业绩增长。面对生成式AI技术变革,根据CEO章庆元采访,公司2023年将在AI领域进一步重点发力,会侧重在内容生成、BI等表格应用、格式美化等AIGC方面实现更多技术应用突破,主动拥抱AI技术变革。公司积极探索AIGC技术,拟发行GDR推进全球化公司积极探索结合AIGC、LLM技术的下一代人机交互体验,并在文档翻译、听读、中英文校对、语音及音频转写、智能辅助写作及排版、表格数据智能分析、PPT一键生成及美化等场景进行融合,为用户提供便捷优质的智能化服务体验。2022年,金山办公利用AI能力帮助用户校对总字数达3,340亿个,全年OCR处理图片数量达146亿份,智能美化功能月活跃用户数量达237万。2.2坚守边际优先资产从海外模型角度看,GPT系列不断更新迭代,3月初,GPT成本降低90%,以及GPT-4Office全家桶Microsoft365Copilot发布,打开ai应用想象空间,促进海外应用接入GPT,相对国内而言,海外应用接入GPT-4更加容易和方便。从大模型本身看,自然语言处理(NaturalLanguageProcessingNLP)是用计算机来模拟、延伸及拓展人类语言能力的理论、技术及方法,是融合语言学、计算机科学、数学等于一体的综合性学科。自然语言处理目前面临的关键问题是人类语言的复杂性和多样性,例如同样的词汇在不同的语境之下意思不完全一致、日常用语中的反识等反向情感表达,句式结构的多变和缺失所引发的歧义以及方言和“行话”等语言个性化特点。计算机视觉(ComputerVisionCV)是指使用计算机及相关设备来模拟生物视觉的技术,即基于传统或深度学习算法,赋能计算机理解数字图像和视频,并从各种模态的数据之中提取目标信息。其主要目标是开发“机器之眼”,不仅让计算机具备视觉能力,更让计算机识别、理解“看”到的多模态数据。多模态大模型的发展从OpenAl的CLIP(文本图像匹配),以及DallE(文生图)拉开帷幕,目前跨多个模态的数据融合问题开始变成行业探究的重点。多模态是指多个模态感知与认知的融合。对于人类来说,所有感知交互方式的融合形成了社会交流;对于计算机来说,是通过对文本、图片、视频和音频等不同储存信息载体的认知和理解,结合环境因素来模拟人与人之间的交互方式。多模态技术的重要性不言而喻,让人工智能理解人类世界的最优办法就是让AI成功理解多模态信息并能够对此类信息形成分析、推理的逻辑和生成新信息的能力。近期Meta发布SAM,看好多模态解决方案产业链。Meta可以快速识别照片/视频中的所有物体,并智能地将其分割成不同的形状和板块。1)相较于普通的抠图软件来说,原本需要手动选择的目标,现在只需要SAM的识别就可以快速分割画面中的物品,且精准度,效率都要比个人操作高。2)此外,SAM的一大突破还在于,即使是在训练过程中从未遇到过的物品和形状,人工智能也能将其准确识别并分割出来。3)交互方面,SAM还支持用户使用各种交互性的方式来分离出想要的物体。可以通过将鼠标悬浮在该物体之上,就能自动定位出物体的轮廓。即使是颜色非常相近或者有连人眼都很难快速分辨出的倒影的图片之中,SAM都能非常准确找出轮廓边线。也可以直接通过输入文字查询,AI就可以找到并标记出这个图片中对应的文字对象。4)视频方面,对于视频中的物体,SAM也能准确识别并且还能快速标记出物品的种类、名字、大小,并自动用ID给这些物品进行记录和分类。5)编辑方面,除了能把物品从图像中精准地分离出来,SAM还能支持对这个物品的编辑。SAM基于1100万张照片训练,模型和数据全部开源,看好多模态解决方案产业链。1)SAM开创性地跟Prompt结合了起来。它可以接受各种输入提示,例如点击、框选或指定想要分割的对象,这种输入并不是一次性指令,你可以不停地对图像下达不同的指令达到最终的编辑效果,这也意味着此前在自然语言处理的Prompt模式也开始被应用在了计算机视觉领域;此外,SAM基于1100万张图像和11亿个掩码的海量数据集上进行训练,这是迄今为止最大的分割数据集;SAM在各种分割任务上具有很强的零样本性能。零样本意味着SAM可以在不对特定任务或领域进行任何额外训练或微调的情况下分割对象。2)我们看好多模态产业链,Meta此次推出SAM预示着大模型在多模态发展方面更进一步,布局计算机视觉/视频的厂商有望在Meta产品推出的背景下持续受益。盘古大模型初露头角,成果显著。2021年4月份发布了盘古NLP大模型和盘古机器视觉大模型,当年也发布了盘古科学计算大模型,在2021年9月份,用于药物研发中小分子药物筛选发布了盘古药物分子大模型;到2022年在行业中拓展应用,比如和能源集团合作发布了盘古矿山大模型,到2022年11月份在华为HDC大会上发布了盘古气象大模型;在2022年的HDC泰国上,发布了盘古海浪大模型、盘古金融OCR大模型。盘古生态逐步完善,有望将AI赋能众多行业。大模型是连接技术生态和商业生态的桥梁,是未来AI生态的核心。盘古大模型可分为三个层级。L0是基础通用模型,比如GPT3,但应用到行业中达不到最好的效果。L1是行业大模型,在L0的基础上加入行业数据,通过混合训练得到。L2是部署模型,将L1在具体下游、千行百业的细分场景进行部署得到L2。尽快的降低生产成本、提高效率,由L1升级到L2是关键。盘古大模型聚焦“AIforindustries”,凸显泛化能力优秀、样本能力高效、使用门槛较低的特点,有望推动人工智能开发从“作坊式”到“工业化”升级,应用领域将包括气象、医药、游戏、税务、工业、机械、航天航空、土木、地质等多方面。盘古大模型底层昇腾生态链完善,产能确定落地确定。以“一平台双驱动”布局,昇腾生态链逐渐完善。“一平台”:昇腾基础软硬件平台,包括AI处理器、服务器硬件、芯片使能软件、MindSpore全场景AI计算框架和应用使能平台MindX。“双生态”:(1)AI技术生态,包括科研机构、高校、企业、合作伙伴的研究和开发人员。(2)AI商业生态,包括ISV、IHV、整机伙伴、一体机合作伙伴等。昇腾计算产品众多。其中,昇腾910芯片支持全场景人工智能应用,昇腾310芯片主要用在边缘计算等低功耗的领域。华为已联合超100家头部ISV基于昇腾孵化超过120个解决方案。为盘古大模型的发展提供底层算力核心支持。盘古大模型聚焦“AIforindustries”,凸显泛化能力优秀、样本能力高效、使用门槛较低的特点,有望推动人工智能开发从“作坊式”到“工业化”升级,应用领域将包括气象、医药、游戏、税务、工业、机械、航天航空、土木、地质等多方面。阿里通义大模型架构庞大。阿里通义大模型整体可分为三个层次,分别为行业模型、通用模型与模型底座。(1)模型底座层:主要构建语言和视觉的模态映射,通过统一学习范式与模块化设计来实现;(2)通用模型层:主要包括多模态模型“通义-M6”;NLP模型“通义-AliceMind”和CV模型“通义-视觉”。每个模型下对应不同的功能模块。(3)行业模型层:结合电商、设计、医疗、娱乐、设计、金融、工业、制造业等行业的特点,对通义大模型进行功能完善和应用细分。通义大模型厚积薄发。阿里在NLP、多模态模型领域技术实力雄厚。2019年,阿里开发出了大规模预训练语言模型structBERT并登顶全球NLP权威榜单GLUE;2021年,阿里开发出了国内首个超百亿参数的多模态大模型M6。凭借多年的发展,2023年4月阿里开放通义千问内测。飞天智算平台为大模型提供强大算力。大模型竞赛本质上已延伸到算力层面,云计算是支撑更聪明AI的基础。2022年8月,阿里云推出全栈智能计算解决方案——飞天智算平台,为科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。阿里推出“魔塔”社区,让模型应用更简单。2022年11月,阿里巴巴达摩院推出人工智能模型开源社区“魔搭”(ModelScope),旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单。“魔搭”社区首批上架超300个模型,其中中文模型超过100个,覆盖了视觉、语音、自然语言处理、多模态等AI主要领域,推动Al应用发展。不到半年的时间里,“魔搭”社区总用户量已超100万,模型总下载量超1600万次,成为国内规模最大的AI模型社区。阿里智能家居业务蓬勃发展。根据36氪显示,2023年中国智能家居市场规模将突破5000亿元。阿里在智能家居业务上多面出击,重兵布局,主要和传统家电企业合作,构建开放式平台,形成了较为完整的大家居战略。天猫精灵成为消费者购买智能音箱的首选品牌,2022年市场份额为27%。阿里智能家居主要通过阿里云LoT进行阿里智能家居生态的打造。主要包括三方面:阿里云LoT平台产品、阿里云LoT基础产品和阿里云LoT应用&服务。(1)阿里云LoT平台产品阿里云Link生活平台(生活物联网平台),阿里云Link城市平台(城市物联网平台)和阿里云Link商业共享平台(商业共享平台)。(2)阿里云LoT基础产品阿里云LinkEdge(将计算扩展至边缘),阿里云LinkWAN(广域低功耗物联通讯网络)和AliOSThings(嵌入式物联网实时操作系统)。(3)阿里云LoT应用&服务阿里云Link测试&认证服务(软硬结合的测试&标准化认证服务)和阿里云Link魔笔(自然书写笔迹数字化的云端产品)。天猫精灵+GPT已进入内测。阿里云将推动AI进一步普及。阿里巴巴所有产品未来将接入大模型。目前,钉钉、天猫精灵已经在测试接入大模型。接入通义千问后,新天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力大幅跃升。大语言模型“通义千问”正式推出。4月11日的阿里云峰会上,阿里云正式宣布推出大语言模型“通义千问”。通义千问是一个超大规模的语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。三、数据要素:数字经济之基3.1乘数字经济之风,数据要素市场快速发展数据服务商在数据要素产业链处于核心位置,起到链接数据供应方和需求方的作用。数据要素产业链上游主要是数据提供方,主要提供公共数据、业务信息、个人信息的数据。中游主要是数据服务商、数据交易所。下游是数据需求方,包括政府、金融、教育、医疗等行业客户。在数字社会,数据扮演基础性战略资源和关键性生产要素双重角色,一方面,有价值的数据资源是生产力的重要组成部分,是催生和推动众多数字经济新产业、新业态、新模式发展的基础;另一方面,数据区别于以往生产要素的突出特点是对其他要素资源具有乘数作用,可以放大劳动力、资本等要素在社会各行业价值链流转中产生的价值。根据《中国数据要素市场发展报告》,数据要素对我国GDP增长的贡献率和贡献度在2021年分别为14.7%和0.83个百分点。总体来说,数据要素对当年GDP增长的贡献率呈现持续上升状态,表明数据要素正发挥越来越大的促进作用。数据要素包含七大模块,具备泛在赋能等特点。我国数据要素市场归结为数据采集、数据存储、数据加工、数据流通、数据分析、数据应用、生态保障七大模块,覆盖数据要素从产生到发生要素作用的全过程。其中数据采集、数据存储、数据加工、数据流通、数据分析、生态保障六大模块,主要是数据作为劳动对象,被挖掘出价值和使用价值的阶段;而数据应用模块,主要是指数据作为劳动工具,发挥带动作用的阶段。数据要素流通环节亟待发展。数据要素市场涉及环节众多,包括数据采集、数据分析、数据加工、数据确权、数据质量评估、数据定价、数据交付、数据治理、数据安全等。经过数年乃至十数年的发展,行业数字化取得了相当的进展,传统IT服务市场已较为成熟,但跨行业、跨公司的数据要素流通仍有较大发展空间,新兴IT服务市场迎发展机会。数据供给:当前中国数商行业企业数量为192万家,数据产品和服务供给不足。根据国家工信安全发展研究中心,从市场规模来看,2021年,数据供给环节(采集、存储、加工)的市场规模达到385亿元。2021年中国数据要素市场规模约为815亿元(不含数据应用),其中,数据供给环节占比47.2%。从数商企业数量来看,存在明显的供需不匹配问题,缺少标准化和规划化产品。高质量数据产品的背后是高质量数商。根据上海数据交易所官网,截至2022年11月,上海数据交易所累计挂牌数商仅89个。根据《全国数商产业发展报告》,截至2022年11月,中国数商行业企业数量达到192万家。其中,中国数商产业主要集中在长三角、珠三角、京津翼、川渝地区,四大区域合计占比达到56.8%。数据流通:目前仍以场外交易为主,场内交易持续发力。从市场规模来看,根据国家工信安全发展研究中心,2021年中国数据流通(交易、分析、数据服务)市场规模约为380亿元,占中国数据要素市场规模的46.6%。从市场占比来看,根据上海数据交易所研究院,2022年,场外交易占全部交易的比重约为2%。预计到2025年,场内交易占比将达到1/4~1/3。场外交易平台集中度低,场内交易以省市级交易所为主。2014年1月,中关村数海大数据交易中心平台成立,拉开了场内交易的序幕;2015年4月,全国首家大数据交易所贵阳大数据交易所获批成立;2022年11月,深圳数据交易所正式揭牌成立,至此,北上广深四大一线城市均开启了新的数据流通探索。自2020年以来,国家陆续出台数据要素市场化改革的法规及政策文件,总体围绕“以数据安全为前提,完善数据要素产权配置、完善数字治理、细化市场领域”,由浅入深地建立健全数据要素市场的基础制度。搭乘数字经济的快车,我国数字要素市场整体处于高速发展阶段。“十三五”期间,我国各个要素市场规模均实现稳定增长,以数据采集、数据存储、数据加工、数据流通等环节为核心的数据要素市场增长尤为迅速。据国家工信安全中心测算,2021年我国数据要素市场规模为704亿元,预计到2025年我国数据要素市场规模将达到1749亿元,2021年-2025年的年复合增长率超过25%。根据中国信通院数据显示,仅有32%的企业数据价值会被激活,还有数据未被采集、加工、流通和分析,我们可以预期未来数据要素市场将会在立法与技术的双重培育下,保持高速增长。3.2数据要素加速落地,医疗数据优势明显凸显新政策带来新机遇,国家重视医疗健康领域的数据建设。2022年5月20日,国务院办公厅发布《“十四五”国民健康规划》,提出促进全民健康信息联通应用,构建权威统一、互联互通的全民健康信息平台,完善全民健康信息核心数据库,推进各级各类医疗卫生机构统一接入和数据共享。探索建立卫生健康、医疗保障、药监等部门信息共享机制,通过全国一体化政务服务平台,实现跨地区、跨部门数据共享。研究制定数据开放清单,开展政府医疗健康数据授权运营试点。2023年3月23日,中共中央、国务院发布了《关于进一步完善医疗卫生服务体系的意见》,提出发挥信息技术支撑作用,加强健康医疗大数据共享交换与保障体系建设;建立跨部门、跨机构公共卫生数据共享调度机制和智慧化预警多点触发机制;推进医疗联合体内信息系统统一运营和互联互通,加强数字化管理。在数据要素相关政策出台的推动下,医保数据应用有望加速。2021年8月,国家医保局提出打造“保险+健康”服务生态闭环,依法依规探索商业健康保险信息平台与全国统一的医疗保障信息平台信息共享机制,强化医疗健康大数据应用,助推保险精算创新发展。2023年1月12日,全国医疗保障工作会议提出“把大数据赋能作为医保改革发展的重要借力点,最大程度发挥全国统一医保信息平台作用,更安全更积极更有序地用好医保大数据。”数据要素相关政策的陆续出台,医保数据应用的路径、场景逐渐清晰。国家医保局成立后,我国医保信息化建设加速,全国统一医保信息平台基本建成并投用,各地医保信息平台也在快速推进,医保信息化进入建设高峰期。医保支付方式改革,如DRG/DIP等,为医保信息化建设带来新机遇,需要医院和医保部门升级改造原有系统,提高信息化水平。医疗机构端信息化投入主动性将显著提升。过去医院信息化建设的目的主要为:完善院端功能、提升运营效率和服务水平、通过大数据和云计算等提高信息管理水平。由于信息化投入效益难以在短期体现,过去外部资金支持较为短缺,信息部人力资源不足,医院管理层缺乏资金投入动力。一方面,随着行业众多催化政策陆续落地,各项信息化建设规划明确,国家卫健委等官方部门资金支持力度加大,多项信息系统被纳入医院评级标准,各项外部因素驱动医院主动增加信息化投入。另一方面,人口老龄化、新冠疫情等加重医疗服务与管理压力,医院发展也逐步走向精细化阶段,信息化建设对医院综合实力的影响逐步体现,信息化投入的内部主动性也将逐步提高。医疗健康数据具有广泛应用场景。如疾病智能筛查诊断场景,通过融合医院诊疗数据,促进如疾病自动筛查、辅助诊断(CDSS)、智能医疗培训等医疗人工智能技术的加速发展以及规模化应用;普惠健康险场景,通过融合保险数据、诊疗数据、医保数据、健康数据等,设计普惠创新的医疗保险,提供更加精准的保险定价、投保核保、理赔等服务;健康管理场景,通过融合医疗、健康管理(手环、手机健康APP等)、消费等数据,对个人健康进行综合建模,形成慢病管理、疾病预防、健康产品推送等综合应用。院端投入规模仍有较大提升空间。根据国家卫健委发布的《全民健康信息化调查报告——区域卫生信息化与医院信息化(2021)》数据显示,2020年各医疗机构年度信息化建设资金投入占总收入比例在0.1%~1%的医院占53.7%,比例在1%~5%的医院占32.0%,比例超过5%的医院占7.4%,未投入的医院占6.8%。据前瞻产业研究院,发达国家医疗机构信息化建设资金投入占总收入比例在3~5%,相比之下我国医疗机构的IT支出占收入比重仍然偏低。四、国产化/密码:提速4.1国产化浪潮持续推进,拥抱自主可控自中兴事件以来,中美贸易摩擦愈演愈烈,美国已经将数百家中国企业、机构加入“实体清单”,限制美国技术产品对华输出。2022年10月,美国工业和安全局(BIS)宣布新一轮的对华芯片出口管制措施,新规旨在限制中国获得先进计算芯片、开发和维护超级计算机以及先进工艺制造能力,给中国超算、芯片产业链带来震动。短中期内带来代工风险,但是也进一步倒逼芯片制造向国产供应链切换,加速产业成熟。时代大背景下,需求端自主可控发展的迫切性日益凸显。国家政策导向更加积极,敦促和引导信创产业发展;同时,产业对于的迫切性、主动性也在加强,以试点项目、实际业务使用反向催化国产产品技术的成熟。2020年正式规模落地应用以来,信创产业已经开始支撑党政办公系统、金融、电信等部分业务系统。供给侧,国产产品不断优化。信创生态系统构建以CPU+OS为基础。国产CPU主要参与者有海光信息、海思半导体、龙芯中科、上海兆芯、天津飞腾等,产品技术持续迭代提高可用性。服务器端,海光信息具有明显的兼容X86生态优势,而华为积极构建产业生态,“鲲鹏”ARM生态加速成熟,PC端,飞腾引领市场份额。操作系统领域,主要由麒麟软件和统信参与。随着信创产业的深入发展,国产基础软硬件厂商的业务规模高速发展,并且持续升级优化产品技术,提供更可用、更好用的产品技术。2022年以来金融为代表的行业信创推进持续超预期,相比党政办公系统替换,行业信创以业务系统服务器需求为主,带动服务器CPU核心厂商海光信息业务在2022年继续提速高增,表现尤其突出。行业信创已经推进至右侧阶段,党政市场替代节奏待观望。金融、电信行业已经推进三年时间,通过业务系统测试不断打磨国产软硬件产品可用性,为后续更多行业的国产替代打下坚实基础,进入22年下半年,信创与各行业信息化、安全发展需求形成强共振,目前教育、医疗、能源、交通等行业均在有序加速替代之中。同时,党政替换第一阶段基本完成,后续推进节奏仍待观察,但未来下沉市场、外网政务系统替换仍有数倍空间。千亿信创基础软硬件市场可期。我们在此前海光信息、神州数码首次覆盖报告中对党政、信创的服务器市场空间进行了梳理,替代空间过千亿。若以现有政府、重要行业的终端和服务器数量为基础,对国产OS替换空间进行测算,我们测算国产OS市场可替换空间超过300亿,年化替代市场约为63.81亿元。服务器数量,根据IDC数据,2020年我国服务器出货量约为350万台,重要行业占其中40%左右,政府为16%,我们估算2020-2022年已经替换的服务器量约为84万台,另外按照电子设备3年一更新计算存量。终端数量,参考两方面口径,我们假设可替代终端总量约为5355万,根据飞腾、金山办公、麒麟软件等企业2020-2022年的销售额数据,我们估算党政市场已有约600万台的替换;a)服务器与PC的经验配比,不同行业约1:10~20;b)政府及金融、电信、能源、教育等重要行业的从业人员数量:我国金融行业从业人数已突破800万人;三家基础电信合计员工数量110万左右;教育行业从业人员超过2000万,教师超过1700万;电力、热力、燃气及水生产和供应业从业人员466万;全国卫生人员总数1398.3万人。另外,还需要考虑能源、医疗、教育等部分行业从业人员并不需要配备PC。终端PCOS价格,假设为300元/套,服务器OS价格假设为3500元/套;替换节奏,我们假设2023年-2027年五年期为主要替换时间;4.2密评和国产化双催化,商密产业高速发展近年来随着国内外网络安全事故的频发,我国政府不断提高对网络安全的重视。2013年先后设立了重要国家安全委员会、中央网络安全和信息化委员会。2017年6月1日,《网络安全法》正式发布,等级保护制度随之上升到法律层面;2019年5月,公安部正式发布《信息安全技术网络安全等级保护基本要求》,开启等保2.0时代。与等保1.0相比,等保2.0延续了五个级别的划分。同时,将可信验证列入各级别和各环节的主要功能要求,要求在通讯传输过程中采用密码技术保证敏感信息字段或整个报文的保密性,同时强调采用密码技术保证重要数据在存储过程中的保密性。新版商用密码法发布在即。商业密码行业产业链为:芯片-板卡-加密机服务器。目前市场中从事芯片业务的公司主要为卫士通、三未信安、国芯科技(上市)、北京宏思、恩智浦;从事从事密码板卡的公司主要为卫士通、三未信安、渔翁信息;从事加密机服务器的主要为卫士通、格尔软件、吉大正元、信安世纪、数字认证。当前,商密应用领域基本实现全覆盖,初步实现了商用密码产品与行业场景特点的融合应用。其中,根据全景财经数据,商用密码在金融领域应用占比24.05%,在政务领域应用占比19.31%,在通信领域占比15.38%,在电力领域占比12.31%,在交通领域占比9.47%,在税务、医疗、电子商务等其他领域占比共计19.48%。近年来我国商用密码行业规模不断扩大,产业规模整体呈上升趋势。2020年在新冠疫情流行的客观环境下,我国商用密码产业仍取得高速发展,总体规模达到466亿元,较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论