AI-生成式AI:海内外公司布局梳理_第1页
AI-生成式AI:海内外公司布局梳理_第2页
AI-生成式AI:海内外公司布局梳理_第3页
AI-生成式AI:海内外公司布局梳理_第4页
AI-生成式AI:海内外公司布局梳理_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

证券研究报告行业深度报告生成式生成式AI:海内外公司布局梳理则wuchaoze@SACS090003BEM莉ilicsccomcnSACS19060002BQI芳博gbocsccomcnSACS030001研究助理:杨晓玮xiaoweicsccomcn本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供,由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。核心观点在上篇百页生成式AI报告中,我们详细介绍了生成式AI的技术发展、应用领域与未来展望。1、海外:弯道超车的微软(MSFT.O)与蓄势待发的谷歌(GOOGL.O)1)微软:老牌PC软件&云业务厂商,19年来不断加深与OpenAI投资、合作,近期通过ChatGPT出圈一定程度实现弯道超车,OpenAI也有望发布GPT4;2)谷歌:搜索引擎龙AIDeepmind并始终保持投入,也曾诞生AlphaGO等出圈成果,232、国内:关注百度(9888.HK)类ChatGPT产品布局情况、科大讯飞(002230.SZ)、拓尔思(300229.SZ)、海天瑞声(688787.SH);也关注视觉中国(000681.SZ)、昆维(300418.SZ)等。1第一章第二章第一章第二章第三章海外标的:微软弯道超车,谷歌蓄势待发标的:百度、科大讯飞、拓尔思、海天瑞声等风险提示21.1微软(1)老牌PC软件巨头,近年以云业务为核心,Azure市占率不断提升Office365商业版业版当前微软的核心业务包括智能云(Azure、WindowsServer、GitHub等)、生产力与企业流程Office365商业版业版Dynamics365)与个人计算业务(Windows、搜索广告、游戏、设备)。其中云业务是近年来公司的核心,22财年收入为752亿美元,收入占比近40%。云计算平台服务器系统GitHub英 Window系统搜索与广告游戏Window系统搜索与广告3计-3104235712838464FY15FY16FY17FY18FY19FY20FY21FY2234%34%32%30%34%36%38%25%27%32%32%32%38%36%29%31%32%33%1%%46%44%28%28%FY15FY16FY17FY18FY19FY20FY21FY221.1微软(2)19年起布局AI领域,5年内不断加深对OpenAI的投资、合作-2000年以来微软发展大致经历3个阶段:1)2000s:错失移动互联网发展时机,股价大幅下挫;2)-推出Azure云服务快速提振业绩;3)2019年以来:布局人工智能领域,包括先后投资人工智能公司OpenAI、Nuance,2023年宣布追加对OpenAI的投资,且双方的合作进入到第三阶段。009年:错失移动互联网红利微软股价(美元/股)200819年至今:布局人工智能领域2022197亿美元收购对话式人工智对OpenAI200819年至今:布局人工智能领域2022197亿美元收购对话式人工智对OpenAI投 20152021 20232019••2016战略:“云优先”2000-20012000-2001nXP20072007预期4资料来源:OpenAI,华尔街日报,TheInformation,similarWeb,ARKInvest,中信建投5布未来数十阶段T天用DAU超10亿元创立布未来数十阶段T天用DAU超10亿元创立ym化(PPO)注资10美金OpenAlLP数再度追亿美元20152017201820192016202123年初2020除22年收购苹果“Siri”背后的对话式人工智能公司Nuance外,微软在生成式AI领域最核心的布局就是对OpenAI的投资与合作。OpenAI是一家大型人工智能研究公司,15年成立之初为非营利机构。OpenAI在2015年由马斯克等人出资10亿美元创立,研发人员包括世界著名AI专家,AI开发水平处于第一梯队;2022年6月,量子计算专家、ACM计算奖得主ScottAaronson宣布将加盟公司,公司以实现安全的通用人工智能(AGI)为核心宗旨。19年、21年微软进行投资,一线风投也积极入局。19年、21年OpenAI分别接受微软10亿美元投资,由非营利机构转为以盈利为目标的公司。除微软外,投资者还包括红杉资本、老虎全球管理公司、BedrockCapital等一线风投机构。据TheInformation,OpenAI21年估值已达200亿美元,我们预计OpenAI当前估值或接近300亿美元。23年初微软表示将在未来继续对OpenAI投资数十亿美元,并进入第三阶段合作。数量API1.1微软(3)投资OpenAI:底层算法平台,AI应用开发的“安卓系统”当前各类生成式AI创业公司中,OpenAI估值最高:通用型底层算法平台,类似人工智能应用开发的“安卓系统”目前,专注底层系统的公司估值更高。虽然相较应用研发商,基础设施研发商的商业模式尚未成熟,多数还在探索阶段,但因其应用场景更广,且掌握核心技术能力,在未能实现稳定盈利的情况下,估值相对更高。但同样可见,海外除底层算法开发公司以外,初创公司基于开源技术,仍可开发应用并开展ToC业务,具有一定商业化潜力,因此我们预计,国内尽管头部互联网公司已积极布局,但中小型公司仍有业务开展余地。司额司额开开发内容通用型算法平台AIGC内容文本、图片(2021)-估值200-300亿美元StabilityAIMidjourneyJasperCopy.aiCopysmith图片、音频图片文本文本文本fusion(模型)(应用)(应用)--4500万美元240万美元-----10亿美元-15亿美元--1.1微软(4)投资OpenAI:技术迭代,产品出圈,23年GPT4有望发布OpenAI发布多款底层算法,并推出相关应用API:GPT-3(语义)在NLP任务中实现重大突破,能够完成绝大多数NLP任务,入选《麻省理工科技评论》21年“十大突破性技术”,目前GPT-3已开源,注册人数超100万,基于该算法已经出现Jasper、Copy.ai和Copysmith等。GPT-3.5(升级)GPT-3.5是一系列模型,21年Q4混合使用文本和代码进行训练。近期出圈的ChatGPT则是GPT-3.5的微调版本。CLIP(跨模态)与微软合作发布,能够将图像映射到文本描述的类别中,跨越了文字语义与图像语义的鸿沟,目前已开源,DiscoDiffusion、MidJourney均基于CLIP架构及生成算法实现。Codex(文字→代码)具有将自然语言输入变成代码、代码自动补全等功能,是GithubCopilot的底层支持。DALL-E2(文字→图片)基于CLIP和Diffusion,实现了有文本生成高质量图片,两个半月注册人数突破100万,公司今年7月正式开始出售DALL-E2的图像生成软件许可,目前用户超过150万,每天生成200多万张图片。GPT-4可能于23年发布:据theverge报道,外界预期GPT-4会在23年第一季度或上半年问世。1.1微软(4)投资OpenAI:技术迭代,产品出圈,23年GPT4有望发布ChatGPT能力强大&用户友好,发布短期DAU破千万,引起更大层面关注。ChatGPT不仅在对话、检索、创作、代码等领域展现出强大的能力,还支持直接通过网站试用该文本对话模型,而不是需要专业编程技能试用,且用户界面友好,大大降低了用户门槛,推动了其在全球范围的广泛传播,发布5天用户便突破了100万,发布40天内用户数即超过了1000万。计划推出无限制、性能更高的专业付费版本。1月11日,OpenAI总裁兼联合创始人GregBrockman在Twitter上发布ChatGPT专业版问卷链接,目前已有早期获得访问权限用户分享专业付费版本截图,暂定价为42美元/月。据路透社报道,OpenAI预计今年的收入将达到2亿美元,到2024年将达到10亿美元。ChatGPT的专业付费版可能是其增收的尝试之一。81.1微软(5)小结:通过OpenAI弯道超车,微软旗下各产品有望“智能升级”底层代码训练生成智能化ubAI娱乐交互体验升级底层代码训练生成智能化ubAI娱乐交互体验升级投资与合作,一定程度上实现了弯道超车。通过与OpenAI更加深度的绑定,我们展望微软旗下各产品体验均有望“智能升级”1)企业级云计算领域:或将帮助企业级客户更加自主、安全、方便地开发AI应用2)个人生产效率方面:此前微软提到计划将ChatGPT整合进旗下搜索引擎必应(Bing,同时Chat-GPT功能引入Office,用于部分文本的生成和问答等,这些都将提升个人用户的生产效率;3)娱乐交互领域:此前微软计划收购动视暴雪,叠加在云游戏的布局,若能引入生成式AI模型,有望在游戏的生产、分发与最终体验方面进一步升级。企业云计企业云计算平台智能化Chat-GTP整合ceChat-GTP整合ChatGTP整合个个人生产效率提升提升与智能化91.2谷歌(1)搜索引擎龙头,广告为核心,AI布局更早、更深2500.02000.01500.010002500.02000.01500.01000.0500.00.0谷歌是全球搜索引擎龙头,以搜索广告为主要收入来源,同时也较早在AI领域布局大规模投资1)广告为核心收入:据statcounter,2022年12月,谷歌在全球搜索引擎市占率绝对领先,为92.6%,远高于第二名的微软搜索引擎必应Bing,后者仅3.0%。凭借高效的算法及海量的用户触达,谷歌搜索为公司贡献高额广告收入,2021年达1490亿美元,近5年收入占比基本在60%左右。2)在AI方面的投入较早、较大:谷歌从14年就开始系统性布局人工智能。据23年1月投资者商业周刊引用美国银行的已超1200亿美元,涵盖互联网广告/搜索、云计算、医疗、服装设计、无人驾驶等领域。3.03%GoogleBingYahoo!YANDEXBaiduDuckDuckGo搜索广告Youtube广告3000.0谷歌网络成员网站广告谷歌其他3000.011489.5853.0981.21040.6677.2803.1698.1201720182019202020211H211H22图:广告收入(含搜索+Youtube)占谷歌总收入比重约70%100%80%60%40%20%0%Youtube广告谷歌Network会员的财产1%57%58%58%58%63%62%61%0%1%1%8%9%7%201720182019202020211H211H221.2谷歌(2)AI布局最早追溯至06年,14年收购Deepmind是重要节点AlphaGo击败韩国围军李世石AI领域成立AI部门推出人脑模拟AlphaStar测试ApprenticeBard等类tGPTAlphaGo击败韩国围军李世石AI领域成立AI部门推出人脑模拟AlphaStar测试ApprenticeBard等类tGPT2年驾驶的尝试,2011年成立AI部门并推出可自我学习的人脑模拟软件谷歌大脑,2015年即将AI运用到搜索中2014年谷歌收购关键的AI研发机构Deepmind,从此谷歌的AI布局加速。在2016宣布将发展战略由MobileFirst转向AIFirst,同年AlphaGo击败韩国围棋冠军李世石,2018年推出蛋白质结构预测AI模型AlphaFold,2022年发布人工智能聊天机器人Sparrow,23年初测试ApprenticeBard等类ChatGPT产品。Deepmind发布Deepmind发布haFold机器学习利器推出人工智能聊天人SparrowAlphaFold2算法进公开第一代深测试无人驾驶将AI运用到搜索1.2谷歌(3)DeepMind:有底层模型Gopher/Chinchilla,也有AlphaGo等应用DeepMind为谷歌关键的AI研发机构。Deepmind是一家英国的人工智能企业,由人工智能程序师兼神经科学家戴密斯·哈萨比斯(DemisHassabis)等人于2010年联合创立,在2014年被Google收购。与OpenAI代表性的GPT-3/GPT3.5类似,Deepmind也有底层的大语言模型Gopher和Chinchilla。DeepMind建立高性能算法,延伸到模拟、生物科研、游戏操作、聊天等领域。其代表算法产品如打败围棋世界冠军的AlphaGo,实现精准预测蛋白质结构的AlphaFold,战胜电竞职业玩家的AlphaStar,智能聊天机器人Sparrow等。1.2谷歌(4)ChatGPT来势汹汹,谷歌或蓄势待发我们认为ChatGPT已经引起了谷歌的较高重视,基于此前谷歌在生成式AI领域的巨大投入,有望蓄势待发:1)谷歌搜索业务或受影响:凭借较强的内容生成能力,23年1月中旬据ARK风险投资公司,ChatGPT在上线不到两个月内实现日活超1200万。据澎湃新闻,微软正考虑将ChatGPT引入搜索引擎必应(Bing)中,或对谷歌搜索业务产生冲击。据纽约时报,近期桑达尔邀请了谷歌创始人拉里佩奇和谢尔盖布林参会,会议标题为“一个聪明的人工智能产品,可能是几十年来对谷歌搜索业务的第一个显著威胁”。2)谷歌核心广告收入或受影响:前谷歌广告团队负责人SridharRamaswamy表示,ChatGPT一定程度上阻止了用户点击谷歌中带有广告的链接。据MORKETINGGlobal统计,美国前十大互联网公司中,谷歌广告收入在2Q21/2Q22均排第一,在十家公司中占比约45%,为微软的约3-4倍谷歌内部已迅速反应反馈:据CNBC,谷歌首席执行官桑达尔皮查伊在22年底参加了多次围绕谷歌人工智能战略的会议,并指示公司的许多团队重新集中精力,着力解决ChatGPT对其搜索引擎业务构成的威胁。谷歌已于23年1月底开始测试ApprenticeBard等类ChatGPT产品。 GoogleMetaMicrosoftAmazonSnapchatPinterestewitter44.51%5.84%1.2谷歌(5)生成式AI产品矩阵丰富,其中Sparrow等有望对标ChatGPT2222222222211720142019(测试中)018212223文字转文字转音乐文字转高清视频参赛股票预测参赛剧本写作语言处理代码生成文字转语音生成式AI产品矩阵丰富,Sparrow、ApprenticeBard等或有望对标ChatGPT。目前谷歌在生成式AI领域已经2222222222211720142019(测试中)018212223文字转文字转音乐文字转高清视频参赛股票预测参赛剧本写作语言处理代码生成文字转语音出多款产品,涵盖基于文字生成图片、视频、音乐等内容的AIGC产品,用于智能聊天的Sparrow,用于生物科研的AlphaFold,以及AlphaGo、AlphaStar等产品。据《纽约时报》,谷歌内部会议表示,谷歌今年计划推出20多款新产品,并展示一款具有聊天机器人功能的搜索引擎。而Sparrow、ApprenticeBard等作为类似ChatGPT的智能聊天机器人模型,或将用于与搜索引擎结合,从而与ChatGPT抗衡。谷歌谷歌生成式AIAIGC23AlphAlphaFoldsicLMPhenakiAlphaendeoDramAlphAlphaFoldsicLMPhenakiAlphaendeoDramAlphaWordcraftento文字转有剧情视频1.2谷歌(6)Sparrow:智能聊天机器人,23年有望推出测试 谷歌搜Sparrow:类似于ChatGPT,Sparrow是DeepMind于22年9月提出的智能聊天机器人模型,或会在23年晚些时候 谷歌搜进入测试阶段。其也采取了基于人类反馈的强化学习框架,为用户的提问给出合理、有用、符合语境、合规的解答,并利用谷歌搜索出的相关信息作为支撑证据。据纽约时报,谷歌计划在今年进行的聊天机器人搜索演示中表示,正确掌握事实、确保安全和消除错误信息是首要任务,而目前,Sparrow已有一套规则模型,来训练其避免回答违反规则的问题。ow初始问题1.2谷歌(6)SparrowVsChatGPT:参数更少,但训练集更大,垂类内准确度有望更高dels运作原理:基于数据和参数生成结果。Sparrow是基于谷歌自有的大型语言模型Chinchilla进行训练的聊天机器人,通过学习众多的数据让模型的参数更加确定、模型更加成熟。模型成型后,用户输入的数据与参数结合,则将生成相应的回答。1)在较多语音任务中回答结果更准确:根据新智元,在几乎所有的语音任务中,Sparrow基于的Chinchilla模型所得到的结果,在准确性上优于GPT-3以及Gopher等模型,得到的结果与期望得到的结果更接近,性能更高。1.2谷歌(6)SparrowVsChatGPT:参数更少,但训练集更大,垂类内准确度有望更高dels2)参数量更小,所需算力小:模型的参数越多,消耗算力越大,输出结果所消耗的资源和时间更多。相比其他大型语言模型,Chinchilla使用的参数有700亿个,明显少于GPT-3、Gopher等模型,能降低推理成本,并促进模型在较小硬件上的下游使用。3)训练数据更多:训练数据越多,有助于提升模型的性能、输出结果的质量。根据DeepMind,Chinchilla的训练数据量为1.4万亿,远多于其他模型。1.2谷歌(6)ApprenticeBardVSChatGPT:时效性或更强ApprenticeBard或较ChatGPT有更强时效性。据CNBC1月31日消息,谷歌还在开发另一款类ChatGPT产品ApprenticeBard,是基于谷歌人工智能语言模型LaMDA的对话机器人。用户向其提问后,该产品可反馈详细的回答,用户可进一步反馈。ApprenticeBard的回答包含了近期发生的事件,相比ChatGPT或有更强的时效性,例如在回答“谷歌是否近期会有新一轮裁员”时,ApprenticeBard的回答引用了于23年1月谷歌开展的解雇12000名员工的事件。其他类ChatGPT产品也在推进中。除了ApprenticeBard,据CNBC,谷歌还在测试项目,例如云计算部门下开展名为Atlas的项目以应对ChatGPT,以及一个可能使用问答形式的备用搜索页面。1.2谷歌(7)AlphaGo与AlphaStar:在围棋、游戏比赛中可战胜人类选手1)AlphaGo:2014年发布,为DeepMind开发的人工智能围棋机器人,借助神经网络、深度学习、蒙特卡洛树搜索法,实现对围棋棋盘局面、定位的智能处理和推演。2016年3月,AlphaGo以4比1的总比分击败职业九段棋手李世石,2017年5月以3比0的总比分击败排名世界第一的世界围棋冠军柯洁。2)AlphaStar:2019年发布,为DeepMind开发的利用强化学习技术设计的一款AI代理程序,通过自我学习策略,掌握了即时战略游戏《星际争霸2》的玩法,实现了在游戏中采用多种制胜策略、基于不完善的信息进行战略规划等。据人民日报,2019年1月,AlphaStar以5:0战胜了两位《星际争霸2》职业选手,且在游戏中,AlphaStar展现的每分钟操作的次数(APM)与人类职业选手相近。tar1.2谷歌(8)AlphaFold:实现蛋白质结构三维模型的预测Deepmind在2018年发布蛋白质结构预测AI模型AlphaFold,并在2020年迭代至第二代。通过在数据库中搜寻目标氨基酸的相关序列,提取学习相邻“共进化”氨基酸的信息,从而在三维空间对蛋白质结构进行预测,相较传统预测方法节约了大量时间和资金。Deepmind2022年7月28日发布的最新版本数据库扩展到了2亿多个蛋白质结构,包括科学界已知的几乎所有蛋白质。AlphaFold团队因此获得了2023年生命科学突破奖(BreakthroughPrizeinLifeSciences),这是迄今科研领域里奖金最高的生物学及医学奖项。201.2谷歌(9)Gato(通才)——集成百种指令响应2022年由DeepMind推出的“通才”AI模型,能够根据指令完成注释图像、交互式聊天、玩小游戏、关节力矩控制、在现实中使用机械臂堆叠积木、在模拟3D环境中导航等数百种任务。相较于AdobeSensei,Gato不仅集成了生成式AI,而是具备了未来集成通用人工智能的虚拟人的内核。211.2谷歌(10)AIGC产品:生成文本、音乐、图片、视频等Text-to-Speech:文字转语音。2017年基于DeepMind的语音合成专业技术打造的文字转语音模型,支持40多种语言、220多种语音和参数调整,并且支持用户上传自己录制的音频来训练自定义语音模型。221.2谷歌(10)AIGC产品:生成文本、音乐、图片、视频等AlphaCode:高效代码生成。发布于2022年,根据DeepMind官方的描述,AlphaCode定位主要是软件开发者的助手,尤其是帮助无编程基础的用户写代码。用户将代码要求以注释形式输入后,AlphaCode能够将其识别并完成代码的编写、筛选和输出。据机器之心pro,AlphaCode针对10项编程挑战进行了测试,总体排名位于前54.3%,击败了46%的人类参赛者,且首次通过率达66%。231.2谷歌(10)AIGC产品:生成文本、音乐、图片、视频等Dramatron:剧本辅助编写。发布于2022年,是一个交互式的剧本辅助编写工具,基于大型语言模型生成长而连贯的文本,能够从一句话表述的戏剧冲突中生成剧本标题、角色、场景、对话等,主要用于合著剧本的创作场景,可以为创作者的编译与修改提供支持。据DeepMind发表的一项定量研究显示,超过65%的体验者认为Dramatron创作的剧本出人意料、有趣且独特,超过75%的体验者认为Dramatron使用体验良好,能够帮助创作者传达创造性想法,可以在创作过程中发挥重要作用。hLanguageModelsAnEvaluationbyIndustryProfessionals,中信建投241.2谷歌(10)AIGC产品:生成文本、音乐、图片、视频等Wordcraft:故事生成。2021年由谷歌推出,作者和AI以对话的形式共同编辑故事,支持续写、扩写、改写、生成大纲等功能,能够极大提升写作效率,激发创作者灵感。MusicLM:音乐生成。谷歌于23年1月发布了基于文本生成音乐的AI模型MusicLM,用户输入描述曲风、播放时长、使用乐器等的文本,或图片和标题的组合,将生成对应风格的音乐。251.2谷歌(10)AIGC产品:生成文本、音乐、图片、视频等Imagen:图片生成。谷歌于2022年五月推出了由文本生成高清图像的模型Imagen,并在11月谷歌AI@年度会议上宣布首次开放测试,其官网宣称Imagen生成的图像已经全线超越了OpenAI的同类模型DALL-E2。Imagen已开放提供城市梦想家和Wobble两个功能。1)城市梦想家:用户可以用文字命令创建样本建筑和地块(城市广场、公寓楼、机场等),从而建造不同主题2)Wobble:用户可以创造一个小怪物,并设计其材质(粘土、毛毡、橡胶等)、衣服,并让小怪物“跳舞”。261.2谷歌(11)小结:前期投入与成果较多,面对微软布局,期待蓄势待发1、微软通过投资与合作OpenAI,近期在生成式AI领域获得突破性进展。2、而谷歌早在14年即收购AI实验室Deepmind,近年始终保持较大的投入力度,Deepmind同样拥有大语言底层算法模型,也曾诞生AlphaGO与AlphaFold等出圈的人工智能成果。3、谷歌内部认为Chat-GTP或对公司搜索业务与广告收入造成潜在影响,谷歌23年有望推出对标27第一章第二章第一章第二章第三章海外标的:微软弯道超车,谷歌蓄势待发标的:百度、科大讯飞、拓尔思、海天瑞声等风险提示282.1百度(1)广告收入增长趋缓,AI成业务增长新驱动核心广告业务增长乏力。百度是国内搜索及AI领域头部公司,业务收入主要来自搜索广告带来的在线市场服务,自2018年以来收入规模基本在700亿元,增长较为乏力。新业务均以AI作为重要技术底座。除了百度及爱奇艺的广告收入,公司其他服务包括云服务、智能设备及服务、智能驾驶等,与人工智能技术有较强关联,是当前公司重点发力投入的第二、第三曲线业务,2021年收入达到438亿元,2017-2021年复合增长率为39%。图表:百度收入(亿元)00739663201720182019202020211H211H22100.0%90.0%80.0%70.0%60.0%50.0%40.0%30.0%20.0%10.0%0.0%在线市场服务其他服务13.8%13.8%19.9%31.9%35.2%34.6%39.4%86.2%80.1%68.0%64.8%65.4%60.6%72.7%27.3%201720182019202020211H211H22292.1百度(1)广告收入增长趋缓,AI成业务增长新驱动成立深度学习实验室(IDL)成立硅谷人工智能实验室(SVAIL)Apolloddle“云+AI”规模化落地金融业台MaaS国家工程研究中心富积累与积极投入。2017年AllinAI,AI生态逐步建立。据中国基金报,百度目前已投入了数十亿美元研究AI,多年来一直努力从网络营销向更深层次的技术转型。当前,百度的AI生态集成为“百度大脑”,包含汽车及自动驾驶领域的开放人工智能平台百度Apollo平台,对话式的人工智能解决方案DuerOS,以及集合人工智能、大数据与云计算的服务方案百度智能云等。到2017年7月,公司总裁陆琪在百度世界大会上正式宣布allinAI。此后,公司又推出开源平台PaddlePaddle、大规模机器学习模型文心Ernie系统等。302.1百度(2)近期提出计划推出类ChatGPT服务文字生成文字生成视频数字人智能聊天AI视频制作助理百度智能云曦灵3.0Zeus文心一格对于生成式AI,百度也表达了密切的关注,并已有较多产品布局。百度CEO李彦宏表示,类似ChatGPT的技术文字生成文字生成视频数字人智能聊天AI视频制作助理百度智能云曦灵3.0Zeus文心一格很火,如何用在搜索场景上并帮助用户提升效率,2023年百度在这方面会“非常有机会。”于23年1月举办的2022“人机共创大会”百度Create大会,也多次借助AIGC创造、搭建数字化演讲场景。百度在AIGC领域已有较多布局,涵盖虚拟人、剧本创作、图片视频生成等。类ChatGPT产品或有望提振百度流量及搜索广告收入。据科创板日报,百度或计划推出与ChatGPT类似的人工智能聊天机器人服务,具体推出时间尚不确定。据财联社,百度CEO李彦宏对该项目的定位是“引领搜索体验的代际变革”;据澎湃新闻,百度搜索杰出架构师辜斯缪在23年1月初表示,百度搜索今年在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统。我们认为,若百度推出类ChatGPT产品,则或与百度搜索引擎结合,进而优化搜索体验,若结合后产生较好的使用效果,则有望提振百度的流量乃至广告收入。百百度生成式AI文字生成诗歌、剧本、小说类ChatGPT产品(?)312.1百度(3)类ChatGPT产品:或受益于文心Ernie系统积累或以文心Ernie系统为底层模型。据36氪,百度或推出的类ChatGPT产品,以大规模机器学习模型文心Ernie系统为基础,已经过多年的数据训练,会让用户获得对话式的搜索结果。我们认为,文心Ernie系统或在训练数据、AIGC运用经验上,为可能推出的类ChatGPT产品提供支持。1)用于训练的数据丰富,优化搜索结果:文心Ernie系统自2019年发布以来,在语言理解、文本生成、跨模态语义理解等领域取得了多项技术突破,已吸引超6万开发者,运用在能源、金融、传媒、社科等众多领域。据中国日报、新华网等,其在公开权威语义评测中斩获了超十项世界冠军,2020年荣获世界人工智能大会WAIC最高奖项SAIL奖。我们认为,凭借众多产业内的数据积累,文心Ernie系统或可帮助百度的类ChatGPT产品提供充分的用于训练的数据,从而优化搜索结果。322.1百度(3)类ChatGPT产品:或受益于文心Ernie系统积累2)已拥有3个AIGC模型,可生成文本、图片、视频内容:文心ERNIE3.0Zeus模型可生成诗歌、剧本、小说等多类型文本创作;基于文心ERNIE-ViLG2.0的AI绘画应用百度文心一格,通过一段描述文本所生成的图片,将更加关注文本和图像中核心语义元素,让图片更贴近用户需求;视频内容生成与编辑技术,能基于一个视觉画面或者一段描述文本,生成高清、流畅的视频内容。332.1百度(3)类ChatGPT产品:或受益于文心Ernie系统积累基于文心Ernie的数字人具备相近内容生成能力。据百度AI,2022年6月,基于文心Ernie的百度AI数字人度晓晓,也已具备写作、绘画、歌曲等内容的智能生成能力,包括全国高考作文写作48分(60满分)、作画参加西安美术学院毕业展、联合龚俊数字人推出国内首个虚拟偶像AIGC创作歌曲、两会新闻播报等。随着模型的进一步成熟,百度或推出的类ChatGPT产品有望提供较好的搜索反馈。342.1百度(4)AI驱动数字人:优化数字人的制作、交互流程以AI驱动虚拟人,参与内容创作输出。百度也将AIGC运用到数字人领域,自2020年9月15日百度推出首个虚拟偶像度晓晓以来,百度已推出4位基于AI的自有数字人形象,并可完成作画、作曲、聊天互动、参加综艺等活动。1)首个实现AIGC的数字虚拟偶像希加加。百度在22年2月推出希加加,其形象包括名字、发型、妆容等均由AI生成,且可以完成AI思维创作、AI剪辑、AI作画、AI作曲。2)百度输入法推出国内首款情感陪伴型虚拟博主林开开和叶悠悠。22年8月,两位博主上线百度输入法的AI侃侃功能,为用户提供24小时在线陪伴对话,可支持文字、语音、表情包聊天互动。3)百度的数字人家族入驻快手。22年11月,4个百度数字人,即希加加、度晓晓、林开开、叶悠悠在快手账号发布入驻快手短视频。未来数字人家族将参与一系列活动,包括加入爱奇艺出品的闯关游戏真人秀《元音大冒险》,数字人的实时驱动、虚拟表演秀、动捕游戏均由百度智能云曦灵技术支持,也在快手进行24小时AI直播等。4)百度的数字人家族演绎AIGC歌曲。23年1月,2022百度Create大会上,百度数字人家族共同演绎了歌曲《技术有答案》,这首歌的词、曲、MV都是由百度AIGC生成。352.1百度(4)AI驱动数字人:优化数字人的制作、交互流程以百度为例,AIGC或是解决数字人发展痛点的有效工具。百度于21年12月推出“百度智能云曦灵”数字人平台,为AIGC平台,可提供数字人生成、内容生产、业务配置服务,帮助广电、互娱、金融、政务、运营商、零售等行业开展一站式的虚拟数字人的创建与运营服务。该平台运用了四大引擎,可分别解决数字人的部分问题:1)人像驱动:解决表情动作问题,缩短生成时间。借助4D扫描、智能绑定等AI技术,该引擎可驱动数字人的唇形、肢体、表情等,让数字人表情、动作更生动,将可被AI驱动的高精3D数字人生成时间,由3个月缩短为一周。2)智能对话:解决语言理解力问题。拥有AI技术支持的智能对话平台UNIT,开发者能为数字人快速定制对话能力,满足各类应用场景需求,加数字人的自然语言理解能力。362.1百度(4)AI驱动数字人:优化数字人的制作、交互流程3)语音交互:提高交互效率。据东西互娱,该引擎可让数字人自然畅通交流,音画同步准确度高,逐字口型准确率大于98.5%;也能让数字人根据输入的文本/语音信息,来生成表情丰富逼真的人像动画。例如百度智能云曦灵为央视网打造的虚拟主持人小C,已于21年3月与全国人大代表梁倩娟进行了独家实时对话。4)智能推荐:赋予面向用户的场景服务能力。借助百度的大规模机器学习、个性化推荐技术和丰富的素材库,让数字人在不同应用场景内,具备对客户进行内容、产品的智能服务能力。例如通过识别2D动画的舞蹈动作,让3D数字人学会跳舞。据IDC预计,到2026年国内AI数字人市场规模将达到102.4亿元。我们认为,随着百度等在AI领域布局的深入,AIGC有望持续提升数字人的服务、交互能力,通过拓宽应用场景,来实现市场规模的增长。图表:国内AI数字人市场规模预测(亿元)372.2科大讯飞:AI语音行业领导者科大讯飞在预训练模型方面技术积累深厚。科大讯飞面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,开源3年模型库月均调用量超1000万,成为业界最广泛流行的中文预训练模型之一,在Github平台的中文预训练模型的星标数达13346位列第一。2022年科大讯飞进一步发布了面向多模态领域的两个轻量级预训练模型,在参数量远小于业界公开模型(参数量小20倍以上)的情况下识别效果提升了20~30%,同时也获得全球多模态阅读理解评测冠军等优异成绩。公司预训练模型在教育、医疗等领域已深度结合,积累了大量数据,并构建较好的垂直领域客户关系,潜在商业价值机会空间大。公司的技术模型已经应用到教育、医疗、城市、零售、文旅、政法等各行各业,公司通过20多年的发展,积累了大量数据,并在垂直领域有足够的专业性和客户粘性,新的技术突破有望打开潜在市场空间。171x/70x/44x。382.3拓尔思:NLP行业龙头公司是国内最早从事自然语言处理(NLP)技术研发的企业。NLP是语义智能的核心技术,自2000年起,公司开始从事自然语言和文本挖掘方面的研究,并在国内推出最早的商业化文本挖掘软件TRSCKM被国内外数以千计的用户采用。公司推出智能问答云服务系统----TRS小思智能问答机器人,通过语法语义分析、知识推理等技术,实现问题解答与人机交互,目前已被广泛应用于政府智能问答,企业智能客服,行业知识问答等各个领域。在全国两会及北京冬奥会播报、智能风控报告及新闻写作、银行消保审核及客服清分服等方面公司有实际落地应用。公司也正在积极推进与其他营销、电商企业的合作,主要依托拓尔思公司的智能写作以及语义识别能力,助力带货虚拟人在剧本设计、带货视频生成、直播间接入等方面的场景进化落地,还包括合作运营面向分众群体的智能问答虚拟人。公司受益云和数据服务业务的快速发展推动公司整体业务的加速。预计22-24年公司归母净利润2.4/3.2/4.2亿元,同比变动-2.4%/33.3%/31.2%,1月31日收盘价对应PE为49x/37x/28x。39392.4海天瑞声:属于AIGC上游厂商,提供基础训练数据集ChatGPT是在海量数据训练中不断完善的。从GPT-1到GPT-3参数量从1.17亿到了1750亿,预训练数据量也从5GB到45TB。GPT-1到GPT-3的算法本质上提升并不明显,最主要是参数量越来越大,神经元的层数越来越多,训练的数据量越来越大。可以看出,有效且覆盖全面的数据集是训练出一个优秀模型的核心。海天瑞声主要提供AI训练数据的研发设计、生产及销售业务,公司通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。截止2022年6月,公司客户累计达740家,涵盖了覆盖了科技互联网、社交、IoT、智能驾驶、智慧金融等领域的主流企业,教育科研机构以及部分政企机构,公司产品主要个人助手、智能音箱、语音导航等产品相关的算法模型训练过程。公司自有知识产权的训练数据产品储备超过1,050个,全面覆盖智能语音、计算机视觉、自然语言、智能驾驶等业务线,公司已向下游客户提供了累计超4,500次/个定制或标准化训练数据集。根据wind一致预期,预计22-24年,公司归母净利润0.3/0.5/1.0亿元,同比变动-8.3%/66.7%/91.3%,1月31日收盘价对应PE为137x/76x/40x。储备量(截止2021年末)储备量(截止2022年6月30日)语音输入、智能家居、智能客服、机器慧金融等慧金融、智慧交答、信息提取、情感分析等402.5商汤:国内最大计算机视觉提供商商汤是计算机视觉行业龙头。公司以SenseCoreAI大模型为基座,涵盖智慧商业、智慧城市、智慧生活、智能汽车四块领域业务,其中商业与城市是大头,合计营收占比超8成。公司持续引领国内AI商业规模化落地。公司推出SenseMARS火星混合现实平台,为元宇宙业务发展提供技术支持;公司提出生成式渲染器,能够在无监督条件下的2D生成网络结合人脸模型的3D信息生成高质量渲染图像。2022年年初,商汤打造的虚拟IP数字人“小宁”上线宁波银行上海分行,化身大堂经理为客户提供各类业务咨询和服务办理。在大模型方面,公司大模型已经达到百亿级参数,公司与之配合的视觉算法训练框架训练单个大模型时可以在一千块GPU上取得超过90%的加速效率。商汤AIDC目前和谷歌、微软已经一起排到了全球的前三,相比于传统的人工智能的标准可以提高600倍。根据wind一致预期,预计22-24年,公司归母净利润-39.1/-27.0/-13.8亿元,同比变动77.2%/31.1%/48.8%,1月31日收盘价对应PE为-20x/-29x/-58x。412.6云从科技:起源人脸识别,积极布局虚拟人技术云从科技拥有世界领先、自主可控的核心技术,在人脸识别、3D结构光、跨镜追踪ReID、3D人体重建、语音识别、OCR文字识别等领域领先,具备从智能感知到认知决策的技术闭环3D结构光人脸识别技术、3D人体重建技术、人脸识别、跨镜追踪Re-ID等技术,其中人脸识别市场公司份额居全球首位。公司依靠在3D人体建模、语音识别等领域的领先AI技术,公司正着力打造AI驱动的虚拟数字人,随着未来虚拟直播、动画游戏、虚拟客服等场景的爆发,将给虚拟人带来较大的商业机会;此外,在内容创作方面,公司依靠在大数据、NLP等方面的能力,对演讲视频内容进行提炼与再创作。预计22-24年,公司归母净利润-8.6/-5.2/-0.4亿元,同比变动-36.1%/39.5%/92.3%,1月31日收盘价对应PE为-18x/-30x/-389x。422.7格灵深瞳:发布“大宇宙”产品,探索AI+元宇宙的新业态格灵深瞳主营产品包括智源智能前端产品、灵犀数据智能平台及深瞳行业应用平台,其中智源智能前端产品包括皓目行为分析仪、边缘计算设备等;灵犀数据智能平台为计算机视觉软件产品,可以实现视频图像解析、以图搜图等功能;行业应用平台主要负责应用层功能实现。公司把元宇宙从形态上分为小宇宙和大宇宙,小宇宙为传统的基于可穿戴式设备的形态,大宇宙则是基于环境显示材料和线下沉浸式交互的元宇宙形态。大宇宙的核心技术为公司自主研发的大规模沉浸式人机交互系统,该系统可提供在大场景中的人体动作姿态感知、六自由度游戏装备感知等能力。公司当前在中国农业银行放量边缘智能站产品,助力银行提升合规管控与服务效率,未来有望在建行等其他银行持续拓展;同时公司发布“大宇宙”产品,积极探索AI+元宇宙新业态,加码元宇宙产业,公司业绩有望提升。根据wind一致预期,预计22-24年,公司归母净利润0.3/0.5/0.8亿元,22年实现扭亏为盈,23-24年增速分别为66.7%/60.0%,1月31日收盘价对应PE为200x/120x/75x。432.8视觉中国:AI生成图片、NFT实现多场景变现目前,公司拥有基于AI生成的图片、NFT等数字内容。据公司公告,公司AI生成内容的业务是依托公司海量数据、AI技术,由公司旗下社区的摄影师、设计师和AI协同完成。图片方面,旗下自有摄影师社区500px已推出近20副AI生成作品,累计浏览量超38万次;NFT方面,截止11月16日,元视觉平台累计发售5份由AI生成的数字藏品,累计交易额超23万元,同样基于500px摄影师的作品。据公司公告,AIGC相关业务尚处于初期阶段,预计短期内不会对公司财务产生较大影响,但我们认为,公司在产品供给及需求侧均具备优势,有望受益于产业发展。供给侧:创作者可借助AIGC及丰富素材提供更多内容。据公司公告,截止今年上半年,在创作者端,公司通过500px、设计师社区爱视觉拥有全球签约创作者超过50万名;素材端,公司可提供4亿张图片。丰富的素材可为AIGC提供学习的数据,创作者则可借助AIGC生成更多内容并做调优,丰富客户的选项。需求侧:众多客户有助于开拓AIGC丰富应用、变现场景。公司拥有图文编辑、设计师、视频制作等众多专业KA客户,其中截止2022年6月底直接签约客户数超1.4万家,同比增长6%,在政府教育、党政媒体、传媒出版、广告营销、影视制作、互联网平台等领域均有版权素材使用需求。AIGC提供的内容,有望通过丰富场景实现变现。根据wind一致预期,预计22-24年,公司归母净利润1.0/2.3/2.8亿元,同比变动-33.3%/+125.5%/+23.5%,1月31日收盘价对应PE为105.0x/46.6x/37.7x。44442.9昆仑万维:StarXMusicXLab,聚焦AI作曲上下游产业链合作:唱片公司、音乐流媒体:1)上游素材:StarMaker与索尼、华纳和环球建立了合作,获得伴奏库,基于较大的曲库,StarXMusicXLab音乐实验室切入AIGC领域;2)下游平台:StarXMusicXLab音乐实验室已经在Spotify、SoundCloud、QQ音乐和网易云音乐等渠道发布了首批五首由AI作曲的作品,后续还有其他歌曲陆续发出。行业合作:游戏、车企等。目前也与音乐、汽车、游戏等多个行业的头部达成AIGC范畴的协作;比如昆仑万维每款游戏的音乐成本在50万元至100万元之间,通过AIGC,音乐成本能够降至0。根据wind一致预期,预计22-24年,公司归母净利润10.5/13.0/14.8亿元,同比变动32.1%/+17.4%/+14.4%,1月PEx5.0x/13.1x。452.10万兴科技:AI绘画工具提升内容创作效率(1)④生成图片公司是数字创意服务商,为创作者提供视频创意、绘图创意、文档创意、实用工具类软件产品与服务。在11月初④生成图片的2022全球元宇宙大会上,公司宣布首款AIGC产品万兴AI绘画将开启公测,为图片内容生产过程降本增效。产品模式:低门槛、快捷的图片生成工具。产品以微信小程序、网页版或H5形式提供给用户。基于用户输入的文本关键词及选择的图片比例、风格等属性,万兴AI绘画可在1分钟内快速生成无版权图片。 入关键词选择图片比例 ③点击开始创作商业模式:基于次数收费,应用于图片创意领域。登陆用户每天享有5次免费创作机会,此外万兴AI绘画将提供5元10次、12元30次、20元100次的收费套餐。用户生成的图片,版权归用户所有,可作为设计师、游戏工作者、462.10万兴科技:AI绘画工具提升内容创作效率(2)完善创作者工具矩阵,提高创作效率。目前公司已经具备万兴喵影、万兴优转等视频创意软件,亿图图示、亿图DF已经覆盖200多个国家和地区,全球累计用户超15亿,月活超过1亿。万兴AI绘画的推出,将进一步完善公司的产品矩阵,提升内容生产效率。根据wind一致预期,预计22-24年,公司归母净利润1.2/1.8/2.3亿元,同比变动+327.4%/+50.4%/+29.6%,1月31日收盘价对应PE为39.4x/26.2x/20.2x。意软件视频、照片、音频个性化编辑、分享软件格式转换工具屏与视频编辑一体的演示视频创作软件频制作和音乐编辑软件fie产品跨平台的综合办公绘图软件工具产设研在线一体化协作平台件DF线PDF阅读、编辑产品件件文件传输工具、照片和视频损坏修复工具472.11中文在线:AI文字辅助创作效率提升公司已上线AI文字辅助创作功能。该功能已向公司旗下17K文学平台全部作者开放,有助于提升文学作者写作效。产品模式:作者通过输入关键词和辅助短语,即可针对古风、都市等特定风格作品,生成对应的文

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论