前瞻研究全球人工智能AI行业系列报告6:人工智能AI将如何影响软件行业_第1页
前瞻研究全球人工智能AI行业系列报告6:人工智能AI将如何影响软件行业_第2页
前瞻研究全球人工智能AI行业系列报告6:人工智能AI将如何影响软件行业_第3页
前瞻研究全球人工智能AI行业系列报告6:人工智能AI将如何影响软件行业_第4页
前瞻研究全球人工智能AI行业系列报告6:人工智能AI将如何影响软件行业_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

证券研究报告请务必阅读正文之后第35页起的免责条款和声明AI+软件的快速融合,AI+软件的快速融合,正在给全球软件产业带来长周期、深远的影响。针对底层算法模型,第三方软件服务商需要结合自身专有数据集积累、技术&资金能力、产品形态等,在闭源方案、开源生态之间做出抉择,彼此优劣势亦十分明显。LLM带来内容生成、自然语言交互、信息检索效率的大幅改善,将使得偏平台型、垂类应用软件显著受益,但也将大概率导致部分业务逻辑简单、偏中间态的单点软件产品方案明显受损,同时借助人机交互效率的大幅改善,用户对基础软件的使用门槛料显著降低,利好数据管理、信息安全、运维等基础软件板块。我们判断,LMaaS(大语言模型即服务)、插件(链接外部知识、工具)、关联落地(Grounding,优化用户提示、输出结果等)等将构成后续软陈俊云核心观点中信证券研究部前瞻研究首席分析师S080001许英博科技产业首席分析师S120041刘锐前瞻研究分析师贾凯方前瞻研究分析师S0001件产业的核心关键词,不断驱动软件产业平台化、模块化发展,并最终带来更加紧密、复杂的软件产业分工协作体系。我们看好当下美股软件板块,市场最悲观时候已基本过去,建议不断聚焦应用层的平台型、垂类软件厂商,以及基础层的数据管理、信息安全、运维、软件开发等厂商,建议持续关注:微软、Salesforce、ServiceNow、Adobe、Snowflake、Datadog、MongoDB、Confluent、PaloAlto、Crowdstrike等。▍报告缘起:从ChatGPT到微软Co-pilot,近半年内AI产业的突破式进展将重构软件行业生态。在短短半年里,AI产业取得了显著进展,以ChatGPT为例,自2022年11月推出后,2个月内活跃用户突破1亿,创下全球消费者应用的增长纪录。全球科技巨头争相投身AI市场,如微软将ChatGPT整合到Azure、Office等产品,谷歌推出类似产品Bard,百度在国内推出文心一言。这些举措加速了AI产业化进程,亦在推动AI+软件的快速融合。这场以底层技术为基础的AI升级换代,对软件行业的产品形态、交互模式、产业价值分配将产生长周期、深远的影响。本报告将重点关注人工智能技术将如何重构软件行业生态。▍算法模型:AI巨头从开源走向闭源,软件厂商需要有所选择。过去五年,前期高额资金投入和原始数据稀缺导致资本向头部AI技术提供商集中,头部AI厂商如OpenAI和谷歌占据了绝对话语权并转向商业盈利导向。这些领先厂商选择闭源模式,迫使软件服务商与其合作。相较之下,追赶者如Meta、Amazon和NVIDIA更倾向于培养开源社区,共同迭代模型以缩小差距。由于底层大语言模型的高门槛以及资源的稀缺性,大多数软件服务商没有能力从底层开始研发自有的大语言模型,因此需在与闭源头部厂商合作或选择免费开源方案之间做出抉择。相较于开源方案,闭源方案的技术更为领先、开发效率更高,但较高的调用次数可能带来高昂的成本,亦存在用户隐私&数据安全等顾虑;而相较于闭源方案,基于开源方案自建使得资金投入更加灵活和可控、可最大限制的保护用户隐私&数据安全,但开源方案也存在社区不成熟、模型迭代速度慢、技术能力落后等问题。总结而言,对于拥有海量经授权的垂类数据、充裕现金流以及直接落地场景的软件大厂适合基于开源模型进行AI能力的构建,对于不满足以上三项条件的厂商,直接接入闭源模型应为理论上最优的解决方案。▍软件产业:AI驱动产品形态、市场格局重构。回顾移动互联网时代,移动互联网的快速渗透使得一批新兴玩家陆续涌现,但多数PC互联网时代原有的参与者亦通过移动互联网的产品,进一步提升了客户覆盖和业务变现能力,当然也有部分厂商因布局迟缓、战略失当而黯然离场。我们认为这一逻辑在AI时代亦不例外,未来市场会逐步出现所谓AI原生的新生力量,而软件市场原有的参与者也将迎来产业链价值的再分配,或受益或受损。应用软件层面,我们主要从产品体系、客户结构、数据沉淀、生态构建等维度来衡量应用软件领域的受益&受损逻辑。在这一判断体系下,我们认为品类全面、份额领先、生态完善、数据持续积请务必阅读正文之后的免责条款和声明2累的平台型厂商,以及格局优异、具备独特数据集和直接落地场景的垂类软件有望率先受益;同时,对于部分功能相对单一、格局尚不明朗的点解决方案厂商,则有可能在新一轮的AI浪潮中受到冲击。基础软件层面,大语言模型的能力并不涉及高性能&高可靠&高可用的数据处理、IT基础设施的性能监控&告警,亦无法满足恶意攻击的防御需求。与此同时,大模型的训练、部署以及稳定&安全运行仍然需要数据管理、性能监控、信息安全等系列产品的配合和支持。不过,在软件开发环节,大语言模型的确有望凭借对代码的生成和理解能力实现产品和产业链价值的重构;在其他的基础软件环节,大模型也有望通过简化处理方式、降低信息复杂度等维度降低从业人员门槛,拓宽产品覆盖面和变现方式。▍产业生态:更加紧密、复杂的软件分工协作体系。我们认为在软件服务商积极尝试融入AI能力后,以LMaaS(大语言模型即服务)为核心的新商业模式将成为主流。LMaaS将重新整合软件产业生态,使企业分工更加明确。在这一模式下,AI巨头专注于提供泛用性模型和ToC需求服务,而中小公司则切入特定垂直行业,根据需求微调优化模型。这种格局有助于发挥各自优势,降低成本,提高性能和覆盖范围,同时推动行业生态的繁荣。LMaaS通过云服务封装复杂的技术问题,简化了用户的本地部署与调试过程,并统一了面向应用的入口,让用户体验更加友好。插件功能和关联落地技术使得LMaaS连接不同的外部API变成可能,极大程度上扩展了大语言模型的上层软件生态,也提供给了更多中小型企业进行创新的土壤。通过这一商业模式,中小企业可以专注于解决特定领域问题,利用大型AI公司提供的基础模型资源降低创业门槛和技术难度,从而反哺整个行业。▍风险因素:AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;私有数据相关的政策监管风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;AI潜在伦理、道德、用户隐私风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。▍投资策略:AI+软件的快速融合,以及美股软件巨头的示范效应,正在给全球软件LLM的大幅改善,将使得偏平台型、垂类应用软件显著受益,但也将大概率导致部分业务逻辑简单、偏中间态的单点软件产品方案明显受损,同时借助人机交互效率的大幅改善,用户对基础软件的使用门槛料将显著降低,利好数据管理、信息安全、运e重点公司盈利预测、估值及投资评级(亿美元)方法估值(自然年)2AEEEFTO98AdobeADBE.OforceCRM.NiceNow.7keGO.1tCFLT.OOtrikeCRWD.O.8请务必阅读正文之后的免责条款和声明3 AI态、市场格局重构 16应用软件:平台型、垂类软件等有望显著受益,单点解决方案或将受损 16基础软件:AI显著降低产品使用门槛,数据管理最为受益,安全、运维等亦将受益 21紧密、复杂的软件分工协作体系 29 请务必阅读正文之后的免责条款和声明4插图目录T AICopilotMicrosoft套件进行升级 6图3:从2017年开始,人工智能的底层研究从小模型转为了大模型 7 图5:目前成功的人工智能独角兽都离不开互联网大厂的资金支持 8图6:谷歌+微软在2022年发布了约60%的大语言模型相关学术论文 8图7:OpenAI在文档中明确声明只会与合作方分享模型具体的实现细节 9图8:人工智能重构软件产业中间层:从小作坊式发展走向工业化道路 11图9:Meta开源的LLaMA模型效果好于GPT-3但与更大参数量的PaLM差距明显....11图10:闭源大厂会提供标准化的APIkey以便用户接入 12图11:对于大型企业客户,OpenAI根据规模(Scale)收费 12图12:4月初,意大利出于对ChatGPT数据隐私相关的担忧宣布禁用ChatGPT 14图13:Huggingface是大语言模型最大的开源项目之一,但也只拥有1万用户 14 5:MicrosoftCopilot产品逻辑 15I PilotAI利用生成式AI从销售通话中提取信息 17 图20:全球CRM市场份额(2022) 18图21:全球ERP市场份额(2022) 18图22:Salesforce上层应用相关的关系型、非关系数据都将在底层数据层持续沉淀....19图23:Adobe提供的实时客户数据平台(CDP) 19图24:SalesforceEinsteinGPTforDevelopers 20图25:全球低代码/无代码/智能开发工具市场规模及增速 20图26:全球低代码/无代码/智能开发工具市场份额 21 图29:2020年全球数据流量比例(按应用类型) 22 分析型数据管理和集成市场规模及增速 23 24 图35:全球应用程序保护&可用性市场规模及增速 25 图38:全球数据丢失保护市场规模及增速 26 图40:敏捷软件开发:短的开发“冲刺” 27 图42:全球软件开发管理市场规模及增速 28图43:全球软件开发管理市场份额(2021) 28请务必阅读正文之后的免责条款和声明5 图45:基于NLP的大语言模型拥有优秀的泛用性,将成为各类任务的底座 29图46:OpenAI的六大类模型,其中Chat是面向用户的核心入口 30 图48:Grounding本质上是对用户指令优化并让大语言模型更精准理解 32图49:微调的存在让大语言模型可以满足不同垂直领域的需求 33表格目录 表2:当前主流的开源大语言模型项目及其基础模型 10 表4:根据企业自有数据量的不同灵活选择需要的硬件数量 13PT 表7:IT监控软件市场主要领域及主要玩家 23 请务必阅读正文之后的免责条款和声明6在过去的半年里,我们见证了70年以来AI产业最为快速的发展,据SimilarWeb的数据显示,2022年11月在美国推出的ChatGPT,仅在短短2个月内活跃用户规模便突破1亿大关,成为全球历史上用户增长最快的消费者应用。在下游应用领域,微软宣布将ChatGPT导入到Azure、Office、Bing搜索等产品线中,谷歌亦宣布基于自身的语言大模ChatGPTBard并将AI能力导入旗下的办公产品workspace中,AI和软件产业正在快速融合。Tok信witter010203040506070web融入各类软件服务中。这场以底层技术为基础的AI升级换代,对当前软件行业的服务模式料将产生显著影响。我们分析认为,人工智能技术、软件服务之间存在天然的相关性。本篇报告将以美股软件巨头在AI领域的产品布局为起点,系统性地探讨AI和软件的可能的融合方式,以及中长期维度,AI将如何影响、乃至改变软件产业。请务必阅读正文之后的免责条款和声明7所选择少数科技巨头正在引领AI基础模型的发展。回顾近十年的人工智能模型发展,我们发现AI技术提供商数量稀少且进入门槛不断提高。这主要是因为从2017年起,人工智能研究从小模型转向大语言模型,导致模型体量成倍增加,需要更多GPU算力和配套设施投入,大量的前期资本投入以及过长的回报周期阻碍了许多新进入者。型究部绘制大模型时代,模型体积几何式增长导致前期投入过高,成功者往往依赖科技巨头的资金、数据等支持。在过去五年内,我们看到成功的人工智能独角兽都在寻找互联网科技大厂作为其背后的依靠,主要因为:1)能够得到充足而短时间内不求产出的资金支持;2)依靠互联网大厂的公有云等相关资源进一步降低成本;3)获取互联网大厂长期以来所积累的优质数据源。LESSWRONG券研究部请务必阅读正文之后的免责条款和声明8LESSWRONG券研究部大模型研发的高门槛让头部少数AI厂商占据主导权,并开始从技术研发向商业化落谷歌等少数几家巨头主导,其他厂商根据先行者的开源资料以及相关论文进行模仿并创新。但从OpenAI发布GPT-3走向商业化盈利开始,谷歌也迅速效仿,不再公布T5模型及后续版本的细节。头部的AI厂商希望将自身的技术优势构筑为商业化能力的核心壁垒,以延长后来者的追赶时间。00NeurIPS究部请务必阅读正文之后的免责条款和声明9row否否否亿大小(词数)T化进度ftCopilotBingAI人工智能头部厂商从开源走向闭源,利用其综合优势来保持持续的领先。谷歌与OpenAI作为行业内的技术领先者已经明确选择了闭源模式:本次OpenAI推出GPT-4的形式与以往模型的发布都有所不同,OpenAI既没有公开发布GPT-4的相关论文,也没有提供详细的框架说明,仅仅提供了一份98页的技术文档(主要描述模型能力以及相关评测的得分,几乎没有任何技术细节)。通过这一方式,OpenAI阻断了所有借鉴者参考的直接途径(模型大小、数据集构建、训练方法等),将闭源的路线坚持到底。通过这一方式,OpenAI迫使想要融入GPT-4能力的软件服务商与其合作,OpenAI提供对应的API接口以及部署指导。penAIGPT相较于头部AI厂商,追赶者更倾向于通过培养开源社区,共同迭代模型以缩小和头NVIDIA等)可能会选择开源路线,寄希望通过社区的力量加速迭代。目前大语言模型开源社区的主要贡献者包括Meta、NVIDIA以及Huggingface等,通过分享部分模型与大语言模型相关的知识培训逐渐培养起了一批开源开发者。Meta于2023年3月发布了其新一代大语言模型LLaMA并将源代码开源给社区。社区用户及企业可以免费使用公开的模型以及数据源,但受证书限制不能用作商业用途。请务必阅读正文之后的免责条款和声明10型型法/数据集AlpacaAlpaca自定义数据集(1T)JBAlpacaAlpaca+自定义数据(2M)tKitOMshareGPTK)ll面对当下情形,软件服务商需在与闭源头部厂商合作或选择免费开源方案之间做出抉择。在见证了ChatGPT的成功后,拥抱AI能力成为了软件服务商的普遍共识。Gartner预计到2025年,生成式人工智能将占所有生成数据的10%。由于底层大语言模型的高门槛,只有部分科技巨头有能力完全自研底层模型。而绝大多数软件服务商需要在成为闭源头部厂商的合作伙伴与使用自有数据在开源项目的基础上开发之间做二选一的抉择。力图像生成-市场、设计、生产Artbreeder可选择主体的年龄、性别换DALL-E、编辑图像,并提供商业权利来创造内容fe有不同风格和分辨率选项的艺术图yai创建具有不同风格、长宽比等选项的艺术品,并对制作的内容拥有完全mind要,允许根据电影场景、艺术品或其他图像创建调色板算法来创建真正的调色板草图创建移动应用程序、网站或登陆页面的设计视频生成-市场为客户制作个性化的头像板,以创建基于演示文稿或在线会议记录的视频esia务Veed.io网,中信证券研究部请务必阅读正文之后的免责条款和声明111)软件提供商选择闭源厂商方案的优缺点分析:与开源方案相比,闭源大厂技术更为领先:目前开源项目的准确度仍不及2021年发布的前代模型GPT-3.5与PaLM。软件提供商与闭源大厂成为合作伙伴会得到更加可靠的模型支持。对于数据存量较大且存储种类较为复杂的行业来说,闭源厂商的模型更能保证在大规模应用场景下的稳定性。以2023年3月Meta开源的LLaMA为例,最大参数量65B的LLaMA模型在准确率上与2021年谷歌闭源发布的PaLM模型差距明显。闭源大厂为软件服务商封装中间技术细节,简化训练、部署等环节,降低软件厂商技术难度,并提升接入、开发效率。与闭源大厂合作大幅简化了软件服务商部署大语言模型的难度。由于大型AI模型通常需要强大的计算能力和资源,大多数企业和个人难以承担部署和运维成本。与此同时,模型的推理环节可以通过汇编语言对底层CUDA加速框架进行优化以降低推理成本,而大部分企业不具备这请务必阅读正文之后的免责条款和声明12一层面的能力和经验。针对上述问题,闭源大厂可以通过云服务平台将复杂的技术问题进行封装,使软件服务商无需关注底层实现,直接使用AI模型并根据自身业务对模型进行微调。此外,闭源模型会直接提供一步到位的API端口,软件服务商直接将API接入到软件中就可以使用。penAI与闭源大厂合作的潜在顾虑:昂贵的成本、用户隐私&数据安全等。在与软件服务商的合作方案上,OpenAI按照使用量来收费。对于数据密集型行业来说,每1GB数据的处理需要花费超过8000美元。此外,另一个顾虑在于数据源并不掌握在企业自身手中,对于数据隐私程度较高的场景,目前相关的数据隐私与安全监管仍然不完善。图11:对于大型企业客户,OpenAI根据规模(Scale)收费penAI请务必阅读正文之后的免责条款和声明132)基于开源方案自建大语言模型的优缺点分析:基于开源方案自建大语言模型使资金投入更加灵活与可控。目前开源社区中基于LLaMA、Alpaca、Bloom等的开源项目都是免费提供。尽管限制商业化用途,但企业可以通过提取权重的方式进行规避。根据自身的数据规模以及相关业务对于准确度的要求,企业可以灵活控制对硬件采购的投入以及相关训练成本的支出。与此同时,市场也出现了诸如Colossal-AI等开源解决方案,致力于优化底层推理和训练的效率。量(亿)小模型-hievedteraFlOP/sper值114%.4214%96416%80813%8824%845%887%184080.208az信证券研究部开源方案可将数据留在本地,最大限度地保护用户隐私和数据安全。对于数据安全至关重要的行业,确保数据隐私是选择基于开源方案自建的最大理由。2023年4月,意大利就因为担忧数据隐私与保护监管的制度不完善禁止企业使用ChatGPT,三星亦因担心内部资料泄露问题限制了部分部门对ChatGPT的访问。尽管目前相关限制并未涉及API和模型实例的使用,但基于数据隐私的考虑,基于开源方案自建是企业的最优选择。请务必阅读正文之后的免责条款和声明14开源方案的潜在问题:社区不成熟,模型迭代速度慢,与闭源模型技术能力存在明显差距。目前大语言模型开源社区主要的推动者包括Meta、Huggingface、NVIDIA等,但如Meta只开源了部分模型以及语料数据。且受限于大语言模型的高门槛,开源社区的活跃用户无法与其他小模型相比。在这种情况下,短时间内我们很难看到开源模型通过社区迭代发生能力上的飞跃。开源社区仍然需要头部大厂花费更多精力与资源对开发者进行培训与课程教育。ehub小结:总结而言,对于拥有海量经授权的垂类数据、充裕现金流以及直接落地场景的软件大厂适合基于开源模型进行AI能力的构建,比如Bloomberg基于BLOOM(GPT-3变种)的纯解码器因果语言模型构建了BloombergGPT,其训练数据集为超过7000亿个标签数据的大型训练语料库,金融数据集包含3630亿个标签,占据54.2%的训练集。海量的垂类经授权语料(网页、新闻、公告、新闻、彭博自有数据),在情绪分析、风险管请务必阅读正文之后的免责条款和声明15理、知识图谱、配置建议等方向的直接落地场景,以及相关人才、资源的稳定支持使得Bloomberg基于开源模型训练AI能力具有充分的价值。类似的,我们认为生命科学CRM&研发管理领域的Veeva亦有能力基于经授权的垂类语料赋能医疗CRM、药物研发流程管理环节。当然,对于不满足以上三项条件的厂商,直接接入闭源模型应为理论上最优的解决方案。值得一提的是,对于Salesforce、Workday等平台型应用软件厂商而言,尽管具备充裕的资源和落地场景,但其平台上的数据集多为用户私有数据,无法投入模型训练。因此,参照MicrosoftCopilot产品实现逻辑,通过用户私有数据增强prompt后,导入微调闭源模型进行推理,进而实现内容生成、流程&命令自动化等效果应为这类厂商实现AI能力的主要方式。请务必阅读正文之后的免责条款和声明16:AI驱动产品形态、市场格局重构回顾移动互联网时代,移动互联网的快速渗透使得一批新兴玩家陆续涌现,但多数PC互联网时代原有的参与者亦通过移动互联网的产品,进一步提升了客户覆盖和业务变现能力,当然也有部分厂商因布局迟缓、战略失当而黯然离场。我们认为这一逻辑在AI时代亦不例外,未来市场会逐步出现所谓AI原生的新生力量,而软件市场原有的参与者也将迎来产业链价值的再分配,或受益或受损。当然,基于所处产业环节、竞争格局、产品体系、客户结构等诸多因素,不同参与者的受益&受损逻辑和程度亦有所区别,以下我们将分别从应用软件、基础软件两个层面进行展开分析。我们主要从产品体系、客户结构、数据沉淀、生态构建等维度来衡量应用软件领域的受益&受损逻辑。在这一判断体系下,我们认为品类全面、份额领先、生态完善、数据持续积累的平台型厂商,以及格局优异、具备独特数据集和直接落地场景的垂类软件有望率先受益;同时,对于部分功能相对单一、格局尚不明朗的点解决方案厂商,则有可能在新一轮的AI浪潮中受到冲击。产品体系:我们认为,大语言模型对于应用软件的强化一方面在于单点功能的增强,比如在销售环节自动进行线索整理、生成销售策略,在营销环节自动生成营销文本、个性化广告投放,在客服环节自动生成或扩展客户问题回复等;另一方面在于增强各项功能的协同效果,使得交互界面进一步上移,比如用户可以通过一条指令实现销售线索归集整理、营销内容生成及个性化投放的全流程,而这在过去需要在不同的产品页面中完成。就单点能力的强化而言,我们认为客户会率先向更容易落地、实现ROI转化的领域进行预算投放,包括客服、营销、辅助内容创意等领域。而就各项功能的协同而言,显然产品体系更为全面、丰富的平台型厂商相对更容易实现这一效果,而单纯单点功能的强化将具有较强的同质性 (AI带来的产业价值增值部分很难被软件厂商所获取),因此相较于单点产品,平台型厂商的优势有望在大语言模型的赋能下进一步增强。研究部绘制请务必阅读正文之后的免责条款和声明17alesforceGPTforService1)自动邀请客户进入其他协作渠道;2)自动生成个性化的客服聊天回复;3)在客户对话期间自动生成摘要,提高录入案例的准确性和完成度;4)根据以往客户的聊天对话创建知识库文章,可以向其他客服开放以解决客户问题GPTforSales的联系人;4)自动邀请客户进入其他协作渠道PTforMarketing客户GPTforCommerce1)将客户数据转化为可操作的销售见解;2)个性化的顾客体验,一对一的产品推荐;3)使用客户数据有针对性的产品分类GPTforDevelops模型提高开发人员的工作效率PTforSlackSalesforce究部ilotAI请务必阅读正文之后的免责条款和声明18客户结构:在过去的应用软件市场,面向大型企业客户的产品和面向SMB客户的产品往往是割裂的。原因在于大型企业客户的需求往往更为复杂,而功能的复杂度往往意味着易用性层面的妥协,SMB客户更为倾向于接受功能相对简单但使用门槛较低的方案。但伴随着大语言模型的渗透,复杂的功能和配置项可以依赖自然语言的交互进行实现。人机交互界面的简化,意味着原本为大型企业客户设计的产品有机会向SMB客户下沉,而此前针对SMB用户的产品则有可能遭受降维打击。当然,不同客群适用的营销策略、渠道手段、功能定义均有所区别,但不可否认的是大语言模型的融入的确增加了企业级产品客群下沉的可能性。eevaeNow orkday Salesforce ics t omInfo mShopify00信证券研究部MSalesforceiQorAdobeOracleSAPGenesysHubSpotZendesk其他Gartner究部SAPWorkdayOracleUKGSageVismaCornerstone其他Gartner究部数据沉淀:正如我们此前论述的观点,拥有海量经授权的垂类数据、充裕现金流以及直接落地场景的软件大厂适合基于开源模型进行AI能力的构建,通过模型本身构建独特的竞争壁垒。但对于大部分厂商而言,调用第三方闭源模型仍为理论上最优的解决方案。在底层模型同质化的背景下,数据的独特性显然是厂商实请务必阅读正文之后的免责条款和声明19现差异化的核心手段。考虑到客户数据的隐私性和安全性至关重要,直接调用客户数据进行训练并不现实。因此,在100%的数据访问透明性和客户数据完整性MicrosoftCopilot强prompt后,导入微调闭源模型进行推理,进而实现内容生成、流程&命令自动化等效果应为这类厂商实现AI能力的主要方式。与此同时,厂商可以通过各个客户的用户反馈数据持续训练个性化小模型,进一步优化大模型的生成效果,降低“幻觉”问题的出现概率,不断优化用户的使用体验。在这一逻辑下,预计拥有海量数据&流程沉淀的平台型软件厂商亦将充分受益,而仅在工具层面实现浅层次整合的厂商将不具备显著产品壁垒。alesforce图23:Adobe提供的实时客户数据平台(CDP)dobe请务必阅读正文之后的免责条款和声明20生态构建:我们这里提到的生态构建分为了两个层面,其一是降低了ISV(独立软件开发商)和SI(系统集成商)的开发和部署难度,比如Salesforce的EinsteinGPTforDevelopers提供了自动生成Apex语言(一种专为Salesforce开发的面向对象编程语言)的能力,微软、ServiceNow等厂商亦将提供自然语言转代码、工作流、低代码开发等层面的能力;其二是在进一步丰富平台应用的同时大幅降低了应用调用门槛,大语言模型在降低开发门槛的同时也使得各类应用的调用更加便捷,而调用率和调用覆盖面的提升将进一步激发ISV的开发热情,从而形成自我强化的飞轮效应,提升应用平台的粘性。就以上能力的强化而言,显然具备成熟的底层应用开发平台和较为完善的开发者生态的平台型厂商更为受益。alesforce能开发工具市场规模及增速(百万美元,%)ocodetelligentdevelopertechnologiesYoY % .0% 0.0%25,000.020,000.0000.0E2023E2024E2025E6EIDC证券研究部请务必阅读正文之后的免责条款和声明21图26:全球低代码/无代码/智能开发工具市场份额(2021)SalesforceAdobeServiceNowPegasystemsSiemensOutSystemsShopifyWixQuickbaseOtherIDC证券研究部交付、可重复使用的预构建的功能组件消除了复杂性以及重新构建的需要开发业开发人员构建的功能,从而实现更快、更敏捷的开发过程者能够快速构建端到端的简单或复杂的企业应用IT管程序的增长,并限制数据重复、不一致和不安全批准应用程序开发活动的标准,并监督预算和资源分配准发必须始终如一地创造积极的用户体验,这促进了生产力的提高方案可缩短实现价值的时间只有在它可以产生安全的应用程序时才有效Gartner究部考虑到大语言模型核心在于自然语言的理解和生成能力,这种能力能够实现内容创作、内容整理,能够基于对用户指令的理解嵌入业务流程的生成和自动化,亦能够基于上下文和外部信息的补充实现持续的迭代和推理。但大语言模型的能力并不涉及高性能&高可靠&高可用的数据处理、IT基础设施的性能监控&告警,亦无法满足恶意攻击的防御需求。与此同时,大模型的训练、部署以及稳定&安全运行仍然需要数据管理、性能监控、信息安全等系列产品的配合和支持。不过,在软件开发环节,大语言模型的确有望凭借对代码的生成和理解能力实现产品和产业链价值的重构;在其他的基础软件环节,大模型也有望通过简化处理方式、降低信息复杂度等维度降低从业人员门槛,拓宽产品覆盖面和变现方式。以下,我们将对数据管理、性能监控、信息安全、软件开发等细分市场展开具体分析:请务必阅读正文之后的免责条款和声明22社交短视频订阅模式的流媒体广社交短视频订阅模式的流媒体广告模式的流媒体游戏音乐VR社交媒体通信数据管理:模型预训练阶段需要大规模、多类别、高质量的训练数据,在模型调优阶段,垂类小数据集、提示词工程同样重要。过去由于存储技术、资源和数据库技术的限制,非结构化的数据无法有效保存和调用。但随着存储技术和云计算的不断发展,企业可以拥有充足的、可扩展的存储资源和存储方法。机器学习、自然语言处理、图像识别等人工智能技术也增加了对海量非结构化数据的需求。由此,能够实现海量数据存储、管理、治理的数据湖,实现批量数据的清洗、预处理、特征工程的Nosql数据库&数据仓库,实现实时数据的集成、高并发查询&处理的流数据引擎等数据管理市场都将受益于AI的高速发展。与此同时,大语言模型能够较好的实现自然语言向Sql等专业的数据库操作语言的转化,降低数据分析、机器学习等领域的进入门槛。Medium信证券研究部绘制um3.9%3.9%2.1%.3%%其他数据IDC券研究部%)半结构化与非结构化数据结构化数据IDC券研究部请务必阅读正文之后的免责条款和声明23集成市场规模及增速(十亿美元,%) YoY.0%%201720182019202020212022E2023E2024E2025E2026EIDC研究部性能监控:与其他应用类似,大模型在运行过程中仍然需要对于性能指标进行实GPU网络带宽和延迟、模型训练和推理速度,以及模型的异常情况和错误信息等,这依然需要ITIM、NPM、日志管理工具的配合。但与此同时,考虑到大模型本身的特殊性,在训练和部署环节同样需要专用的工具完成相关指标的监控、调整和可视化,其中包括:1)实验管理:在训练环节对于学习率、正则强度、批量大小、迭代次数等超参数空间的系统性搜索,选择最优超参数组合,并记录和可视化训练、评估过程;2)性能监控:在推理环节对于损失函数、准确率、F1值等各类模型性能指标的监控和可视化,横向&纵向比较模型的性能变化。在大模型推出的开源工具MLflow等均有相应产品,其中Weights&Biases和MLflow在产品完整度和用户覆盖面上更为领先。企业和资源利用率。通过跟踪组件的利用率(如风扇速度、CPU温度和使用率、内存利用率),基础结构监视工具可以提供indsAPM监视和优化应用程序的性能和运行状况,不同于其他监视工mics日志是在事件发生时自动生成并加盖时间戳的文件,日志管理包括用于收集、管理和分析由应用程序和基础设施生成的大量日志数据。将日志数据与其他事件关联的实时能力也使和威胁管理,以及识别操作性能问题机问题并优化网络性能Gartner究部请务必阅读正文之后的免责条款和声明24.000.000.000.000.0 OnpremisesPubliccloudYoY20212022E2023E2024E2025E2026E.0%IDC研究部Anyscale信息安全:对于大模型厂商而言,由于大模型在部署上线之后即允许B端&C端客户公开访问,因此其安全防护的逻辑和其他应用程序并无本质区别。因此,我们看到ChatGPT采用Cloudflare的方案防范DDOS攻击、执行访客流量验证策略;此前因Redis开源库漏洞导致的ChatGPT故障、数据泄露问题亦表明漏洞扫描、云端工作负载安全、安全态势管理等产品在大模型时代同样具有用武之地。对于大模型用户而言,一方面需要对于用户使用权限、数据上传权限进行严格限制,在这一方面安全网关产品(CASB、SWG)和数据丢失保护产品(DLP)将发挥显著作用,网关产品将配合身份认证工具对用户访问权限予以细粒度控制,而DLP产品将阻止敏感数据的上传;另一方面亦需要针对黑客利用ChatGPT批量生产的钓鱼信息予以针对性防护,这就需要通过对邮件来源、正文、附件、URL链接等进行情绪分析、结构分析等进行相应识别,比如Cloudflare近期就针对AI生成的钓鱼邮件推出了专门的邮件安全方案。当然,对于安全运营团队(SOC)而言,大语言模型的引入能够显著提升安全信息的可读性,并辅助生成易于理解的安全事件解决方案,降低安全运营的门槛。请务必阅读正文之后的免责条款和声明25loudflare%)APIsecurityBotmanagementDDoSmitigationWebapplicationfirewallYoY000202120222023202420252026究部绘制请务必阅读正文之后的免责条款和声明26及增速(百万美元,%)0CASBSWGYoY20202021E2022E2023E2024E2025E%IDC研究部AmericasEMEAAsia/PacificYoY2018201920202021E2022E2023E2024E2025E.0%IDC研究部图39:全球消息安全市场规模及增速(百万美元,%)0OnpremisesPubliccloudYoY20212022E2023E2024E2025E2026E.0%IDC研究部请务必阅读正文之后的免责条款和声明27能力制点支持对终端、网络、云和工作负载的安全防护和控制能力,获取更大范围的安全把各种安全日志、告警等数据进行汇总,以便于进一步的威胁分析;联动不同层作。处理和机器学习比单个安全产品提供更加强大的威胁检测能力。海量安全数据的处理需要具备大需要依赖机器学习等人工智能算法增强对高级威胁的分析、攻击杀伤链的理解和还原;让安全人员可以聚焦处理数量有限、真正需要企业安全人员手动操作的频率和人为操作出错的概率,提高安全运营效率;XDR支持安全响应任务的编排能力,让用户对文件、权限、主机和网络执行经过预先设计编排过的手动和自动的补救措施,提高。能力增强了企业用户的安全可见性,提升威胁检测时Gartner全,中信证券研究部软件开发:对于软件开发者而言,新特性的设计和开发是具有价值的,但编写完成的代码由存储库转移到实时生产环境中仍需要经历集成、测试、发布、运维等多个流程,这些流程对于客户而言并没有附加价值。因此,企业开发者团队需要借助Devops工具自动化低价值的流程,以更快实现新功能的发布。正是由于软件开发流程有价值的环节体现在项目管理&协作和代码编写&托管两个节点,因此这两个节点上的头部参与者具备整合软件开发全链条的较大潜力。根据IDC的统计,2021年全球软件开发市场Top2的玩家分别为Atlassian和微软,恰好对应项目管理&协作、代码编写&托管两个节点的龙头。根据IDC,在大语言模型普及之前,Atlassian的份额以及份额获取速度持续领先于微软。但大语言模型普及之后,GitHubCoPilot能力的强化大幅提升了开发效率,开发链条的核心有可能由项目管理向代码编写&托管转移,这在一定程度上可能削弱Atlassian的竞争优势和平台化潜力,而更为利好微软的全链条整合。当然,与GitHub在同一环节竞争的GitLab更有可能受到直接冲击。冲刺”来源:Pivotal.io请务必阅读正文之后的免责条款和声明28研究部8,000.06,000.04,000.02,000.0OnpremisesPubliccloudYoY20212022E2023E2024E2025E2026E%%IDC证券研究部额(2021)AtlassianBroadcomGitLabJFrogMicroFocus请务必阅读正文之后的免责条款和声明29HubCoPilot▍产业生态:更加紧密、复杂的软件分工协作体系人工智能浪潮带来的另一个变化是科技巨头构建以人工智能服务为核心的新商业模式,使软件产业分工更加明确。LMaaS(大语言模型即服务)将成为AI服务提供商的主要商业模式,以泛用的大语言模型为基础统一过去公有云中的繁杂PaaS层,并更好地融入软件层。大语言模型以语言为出发点,相较于过去的小型模型具备更好的泛用性。如ChatGPT等大语言模型拥有广泛知识和技能,能应对不同领域问题。基于大语言模型的公有云服务能提供比原先更优的PaaS+SaaS层体验,用户通过单一模型可对接多种外部API并更好地理解用户意图。e目前以OpenAI&微软为代表的厂商已经构建起以LMaaS为核心的商业模式,围绕GPT逐步向上下游拓展生态。目前OpenAI的主要模型包括GPT-4、GPT-3.5、Dalle2、请务必阅读正文之后的免责条款和声明30Whisper、Embedding等,包含了泛用大模型、图片、语音、微调等多个维度,其中最为泛用的GPT类模型将作为一个接口根据用户需求调用不同的模型。penAI定价方面,OpenAI的LMaaS模型提供了订阅以及按量收费两种模式。订阅模式主要开放给个人用户,用户根据使用需求支付周期性费用,享受一定时期内的模型服务。API按量收费模式主要开放给使用较少的个人用户与体量较大的企业用户,用户根据实际调用API的数据量或是席位数支付费用,这样用户可以根据业务量灵活调整支出。tionntextntextgpt-turboAda(Fastest)tpowerfulgmodelsiningAdadelsAdaOpenAI研究部请务必阅读正文之后的免责条款和声明31插件功能(Plugins)使LMaaS能够连接不同的外部API,极大地扩展了大语言模型的上层软件生态。OpenAI于2023年3月在ChatGPT中推出插件接口,旨在接入小公司的微调成果。第三方厂商可将自有数据源和部分算法作为ChatGPT上的插件,使ChatGPT能调用插件中的外部API接口获取信息。插件提供者使用OpenAPI标准编写API,此API将被编译成一个提示,告知ChatGPT如何使用API增强其答案。用户选择对应插件后,如ChatGPT需从API获取信息,它将发出请求并在回应前将信息添加到上下文中。插件接口简化了小公司微调大语言模型的难度,并丰富了基于大语言模型的生态环境。第三方厂商无需接触部署大语言模型,降低了微调实施的难度。GPT关联落地(Grounding)是LMaaS模式中协调外部软件API与大语言模型生成内容可靠性的关键步骤。微软的Copilot大量使用关联落地技术,确保大语言模型为办公软件输出稳定结果。根据微软技术文档,Copilot通过Grounding提高接收提示质量,确保模型准确执行用户指令。如用户要求Word根据数据创建文档,Copilot会将提示发送至MicrosoftGraph以检索上下文和数据,修改并优化用户提示(例如加入用户真实业务场景数据示例以提高准确性),然后将其发送到GPT-4大语言模型。响应结果被发送到MicrosoftGraph进行额外的Grounding、安全性和合规性检查,最后将响应和命令发送回Microsoft365应用程序。通过Grounding,Copilot将人类语言表述根据实际数据更换成大语言模型更易理解的提示,完成多模态转换并提升指令准确性。请务必阅读正文之后的免责条款和声明32oogleAIBlog对于用户而言,LMaaS体验优于原先的公有云服务,简化了本地部署与调试过程。LMaaS通过云服务封装复杂技术问题,使用户无需关注底层实现。尽管小公司无力研发底层大语言模型,但可通过微调形式服务垂直领域需求。LMaaS平台可根据用户需求,对通用AI模型进行特定任务微调,提高模型在特定领域表现。用户通过上传训练数据,实现模型个性化定制,进一步提升AI模型在业务场景中的实用性和准确性。请务必阅读正文之后的免责条款和声明33enAI在LMaaS商业模式下,我们认为行业最终将形成AI巨头提供泛用性模型以及服务主要通用需求,中小公司切入特定垂直行业并根据需求微调优化模型的格局。这有利于发挥各自优势,使大型AI企业专注于提供稳定、高效基础模型,降低成本,提高性能和覆盖范围。同时,中小型公司充分发挥行业专长和敏捷性,为特定行业客户提供定制化、高度针对性解决方案。他们可以与AI巨头合作,利用泛用性模型为基础,进行微调优化,满足垂直行业的具体需求。这将为行业带来更多创新、快速响应和精细化的服务,有助于进一步提升AI技术在各行各业的落地应用效果。此外,这种格局还将推动行业生态的繁荣,鼓励更多创新型中小企业和创业团队投入到AI领域。他们可以专注于解决特定领域问题,利用大型AI公司提供的基础模型资源降低创业门槛和技术难度,从而反哺整个行业。在这种格局下,企业之间的合作将变得更加紧密,形成一个互补的生态系统。AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;私有数据相关的政策监管风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论