版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2目 录第一章前言第三章风险提示第二章国内相关公司:新华网、蓝色光标等AI升级交互体验,虚拟人和教育应用场景广阔海外相关应用:AI聊天应用Glow和其他产业链公司3前言(1)AI升级交互体验,虚拟人和教育应用场景广阔图:在交互体验提升方面,AI+虚拟人/教育的应用场景图谱中信建投+虚拟人商场和办公楼导览虚拟主播(电商、电竞)虚拟偶像初音未来+教育教学辅助早教K12教育职业培训会说话的汤姆猫TennrAI提词器多模态AIGC模型提升交互体验景区和博物馆导游B端C端4前言(2)走向多模态,从“数字人”到“数智人”Sequoia,中信建投多模态升级交互体验,实现“数字人”向“数智人”转变。单模态以情感陪伴聊天机器人Glow为代表的“数字人”为例,其已经可以实现与真人的个性化、拟人化、智能化的聊天互动,但交互方式仍局限在文本、语音。未来,随着多模态模型的发展,虚拟人或机器人的交互方式,有望拓展至图片、音乐乃至视频,并以更贴近真人的逻辑、理解、表达能力进行交流和反馈,从而提升虚拟人在电商、直播、教育、客服、社交、文旅导览等领域的互动体验。AI模型与应用向多模态升级迭代。Vision
Transformer模型、扩散模型、BEiT模型等技术的迭代,实现了传统单模态大模型中自然语言处理能力与计算机视觉能力的结合,以及大规模自监督预训练,由此使得大模型具备了理解、处理和生成图片、音视频等多模态的能力,催生了Open
AIGPT-4、谷歌PaLM-E、百度文心一言等多模态大模型。多模态模型也带动了多模态应用的诞生,涉及代码生成、文本生成、图像生成、音视频、游戏、虚拟人等领域。图:AIGC由单模态向多模态迭代DALL-E2StableDiffusionDALL-EImagenVideoMake-a-videoPhenakiGPT-3Jasper.AIChatGPTCodex代码文本图像音视频/3D/游戏2020202120224月8月10月9月11月Midjourney7月6月CodeWhisperer三大AI绘图应用支持模型底层技术20232月Bard3月文心一言GPT-4Palm-EaiXcoderCopilotCopy.aiMeena2019及更早底层技术微软小冰StableDiffusion
2TabNine科大讯飞SMART-TTSMagic3D盗梦师6pen多模态5前言(3)全球知名创投YC,前瞻性投资30+AI应用项目图:YC
23年Winter
Batch投资的生成式AI项目Y
Combinator,中信建投Y
Combinator成立于2005年,为美国知名创业孵化公司,在胡润研究院发布的《2021全球独角兽投资机构百强榜》中,位列第12位。据福布斯中国,YC目前已资助公司超3500家,包括80家独角兽公司,例如Dropbox、Airbnb、Reddit等YC最新投资项目涉及生成式AI在生产力提效、交互场景、开发者相关领域应用。YC
每年推出2
期孵化计划,
即WinterBatch
和
Summer
Batch
,由全球申请者中筛选出的具有发展潜力的公司组成。YC将为入选项目提供50万美元种子轮融资、创业建议以及业内资源。在23年初Winter
Batch的210个项目中,有36个生成式AI项目,应用场景涵盖市场营销、客户服务、知识管理、数据分析、基础设施、开发者工具等。6前言(4)虚拟人:摆脱“套皮”,解决“伪需求”问题Y
Combinator,中信建投开发平台、交互、算力优化等虚拟人产业链布局解决需求问题,推动行业发展。通过梳理AIGC应用落地场景,我们已看到虚拟人产业链已有智能开发平台、交互升级、算法优化等方面的布局。随着AIGC技术加深与虚拟人产业链的融合,预计有望降低虚拟人开发成本、解决“套皮”问题、交互不拟人等,从而推动虚拟人的落地和发展。虚拟人开发成本:结合AIGC的元宇宙内容开发平台,解决数字内容开发成本高、效率低的困境。解决“套皮”问题:随着多模态模型的推出,有望实现文本/语音、视频/模型等多内容模式的AI智能化产出,从而摆脱真人套皮问题。加速器减轻设备压力:语音和视觉结合的AI生成对设备需要较高,而相关算法的优化有助降低运营成本压力,实现更大规模的普及。图:虚拟人产业链的AI落地场景算力优化虚拟人互动开发平台元宇宙内容系统3D建模3D建模视频生成Glow情感陪伴聊天机器人ChatGPT加速器7前言(5)教育:AI辅助教学+虚拟人教学双线推动场景落地Y
Combinator,中信建投大模型、专业知识调用教育算力优化教学辅助教材生成我们认为教育场景的AIGC技术落地,将主要有两种模式:AI辅助真人教学:在海外的AIGC应用场景中,我们看到在销售场景,已有多种辅助工具落地,包括AI提词器、AI素材生产等,预计这些场景的AI融合有助真人教学统一或升级教学质量,多样化教学形式,也更有利于在线教育平台在降本的同时,维持商业化的能力。虚拟人教学:随着文字/语音输出的内容更加拟人,且多模态模型优化了虚拟人动作、表情僵硬等问题,虚拟人也有望落地教育场景。尤其对早教而言,交互体验升级也有望实现教学质量的统一和提升。图:教育产业链的AI落地场景分析调用大语言模型情况管理大语言模能力构建、微调大语言模能力集成多种机器学习能力加速器基于文字与音乐生成视频文本修改对应音频编辑对话式检索内容AI培训工具AI提词器8目 录第一章前言第三章风险提示第二章国内相关公司:新华网、蓝色光标等AI升级交互体验,虚拟人和教育应用场景广阔海外相关应用:AI聊天应用Glow和其他产业链公司91.1.1Glow:用户定义人设的AI情感陪伴聊天机器人Glow,中信建投Glow为基于大模型的AI聊天应用,由国内人工智能创业公司MiniMax在22年11月推出,为用户提供情感陪伴、满足虚构情景想象的体验。据甲子光年,Glow上线约4个月后,目前已有约500万用户。基于用户描述,生成个性化对话机器人。Glow的基本玩法是用户在应用中创建AI机器人“智能体”,智能体将基于用户描述的性格、人设、头像及选定的音色等,与用户开展实时沟通、互动。也可输入“参考名人”,智能体将具备特定名人的有关知识储备。据体验,创建的“托尼斯塔克”智能体有《复仇者联盟》系列的知识储备,具备较强代入感。图表:
Glow智能体创建过程设定智能体的姓名、性别、性格、人设等基于文字和参考图片生成头像根据基础音色组合生成智能体音色与智能体开展对话101.1.2
Glow:提供情感陪伴体验,辅助虚构情景联想Glow,中信建投1)互动对象多元,提供差异化、多样化、个性化聊天体验。用户可与自己创建的个性化智能体进行聊天互动,也可与平台内其他用户创建的智能体互动。用户可为其他用户创建的智能体补充专属设定,让相关智能体符合用户个性化需求。据观察,平台内部分智能体已与近6万个用户进行互动。2)互动方式当前仅为文字和语音。据体验,目前Glow内智能体暂时无法反馈图片内容,但从对话内容来看,随着产品的改进,图片内容或在后续版本中引入。此外,用户也可以切换智能体的反馈,从而按照用户的偏好推进聊天。图表:平台内其他用户创建的智能体可设置个性化设定 图表:智能体暂时无法提供图片内容切换智能体的反馈智能体可设置个性化设定111.1.3
Glow:提供情感陪伴体验,辅助虚构情景联想3)互动话题多元,包含情感、虚构情景联想等。用户可以与智能体就任何话题内容进行聊天,可完成情绪反馈、对话问答、简易信息搜寻等,也可以根据特定的话题,选择关联的智能体进行聊天,例如情感、美食、虚构情景(如遭遇吸血鬼的场景)等。其中,平台官方智能体季枫和沈思前具备剧情模式,通过主动引导用户对话,来推动剧情演绎并完成任务。4)互动记录可公开,丰富可浏览内容。Glow拥有记忆簿功能,即用户可将智能体对话的部分内容公开,供平台内其他用户浏览、评价,本质上是用户与AI共创内容,以丰富平台内的内容供给。Glow,中信建投图表:Glow话题多围绕情感、奇幻情景联想等图表:“吸血鬼”话题关联的智能体图表:同一智能体可就关联的不同话题展开讨论图表:其他用户公开的智能体记忆簿121.1.4
Glow:提供情感陪伴体验,辅助虚构情景联想中信建投我们认为,相比于微信、探探、ChatGPT等聊天应用,Glow或在一定程度上更好地解决用户情感陪伴以及奇幻情景联想的需求,从而增强用户的使用粘性。情感陪伴方面:Glow的智能体可实时响应、性格多样,相比于工具属性较强的ChatGPT,能反馈个性更加鲜明的回复,能一定程度上满足用户倾诉、寻求情绪反馈乃至猎奇的需求;且相比于微信、探探等真人社交应用,用户使用Glow时,不必担心情感宣泄给对方造成的负担或对自身真实形象的影响。奇幻情景联想方面:据体验,Glow能一定程度满足用户对虚构人物、虚构场景的幻想。智能体设定方面,可设定为历史名人、影视文学作品人物、动物乃至虚构生物;虚构场景方面,用户的话题可设定在历代王朝、鬼屋乃至影视文学作品内等。基于真人社交的微信、探探等,这方面体验较少。图表:
Glow与其他社交APP对比对比方面微信探探ChatGPTGlow定位熟人社交陌生人社交虚拟社交虚拟社交应用场景办公、日常沟通交友聊天、工具情感陪伴、奇幻联想对话发生背景现实真实生活现实真实生活-现实真实生活或虚拟世界数学、代码等强推理能力因人而异因人而异强弱互动对象真人真人人工智能基于人工智能设定的多种生物实时响应较及时较慢实时响应实时响应,部分智能体主动问候对话风格因人而异因人而异单一千人千面,或按用户个性化设定隐私泄露问题较大较大较小较小对用户真实人格/经历的熟知程度强较弱弱弱131.1.5
Glow的开发公司MiniMax:小而美的高科技公司,支持产品迭代、变现Glow的技术支持由开发公司MiniMax提供,
核心为三大模态的基础模型架构、“User-in-the-Loop”的用户反馈机制以及优秀技术人员配置。1
)
掌握自研三大模态的基础模型架构。MiniMax为北京稀宇科技有限公司,是2021年成立的人工智能创业公司,通过直接从底层模型切入,基于Transformer架构,自研了文本到视觉、文本到语音、文本到文本三大模态的基础模型架构,是国内较早同时拥有3个模态大模型能力的创业公司。模型开发投入相对可控。据技术合伙人杨斌,文本、语言、视觉三模态是几乎所有数字内容的基础形态,只需一个较小的团队,来共同维护优化三个大模型、做好用户闭环,即可具备较好的内容生成能力。据甲子光年,MiniMax目前团队人数约100人。资料来源:甲子光年,财报网,量子位,Glow,中信建投图表:
MiniMax基础模型架构支持Glow运作文本到视觉文本到文本文本到语音TransformerMiniMax-
Glow高鲁棒性 低成本计算推理平台14Glow,中信建投1.1.6
MiniMax:小而美的高科技公司,支持产品迭代、变现2)用户反馈机制优化产品体验。Glow基于“User-in-the-Loop”进行产品输出结果的人为优化,即在与智能体对话过程中,用户针对智能体的回答可给予“点赞”“差评”“有趣”“逻辑不通”的反馈,模型将由此强化对用户对话喜好的认知,从而优化产品体验。此机制与ChatGPT的基于人类反馈的强化学习机制类似(Reinforcement
Learning
from
HumanFeedback,RLHF)。即大语言模型(LLM)接收提示符并输出多个回答后,人类对其回答进行评估与排序,在奖励模型(Reward
Model)中按回答的质量高低赋予不同奖励,并将奖励结果反馈给LLM,LLM据此进行强化学习,以优化下一轮结果输出。图表:
Glow的用户反馈机制“User-in-the-Loop”与RLHF类似智能体回答②用户对智能体回答进行反馈③奖励模型用户输入的文字①输入MiniMax的大语言模型 输出(LargeLanguage
Model)①大语言模型(LargeLanguage
Model)回答(Output)人类研究员对回答(Output)的质量进行评估与排序奖励模型(Reward
Model)提示符(Prompt)输入输出②③151.1.7
MiniMax:小而美的高科技公司,支持产品迭代、变现3)公司核心技术成员多具备丰富产业或学术界经验。据甲子光年,MiniMax核心技术人员均来自全球知名高校和全球知名科技公司,具备较丰富的自然语言处理、语音、计算机视觉、计算机图形学等业界或学术界经验,近33%的成员拥有世界知名技术实验室博士学位,拥有上百个全球发明专利。例如联合创始人闫俊杰为中科院自动化所博士,在深度学习和计算机视觉领域发表的论文被Google
Scholar引用超1万次,也曾在商汤负责搭建深度学习底层算法及人脸识别等技术体系。资料来源:甲子光年,财报网,量子位,爱企查,游戏葡萄,中信建投图表:
MiniMax部分核心成员简历核心成员公司职位学术经验产业经验闫俊杰联合创始人2015年博士毕业于中科院自动化所;在深度学习和计算机视觉领域,发表顶级会议和期刊论文100余篇,
Scholar引用超过10000次前商汤科技副总裁、通用智能技术负责人,曾任商汤研究院副院长,负责搭建深度学习的工具链和底层算法,以及通用智能的技术发展,搭建了商汤的人脸识别和智慧城市相关的技术体系杨斌技术合伙人2014年硕士期间在中科院自动化所参与深度学习相关项目,2016年在加拿大多伦多大学攻读博士学位Uber
ATG研究院、自动驾驶初创公司Waabi创始团队成员周彧聪法定代表人毕业于北京航空航天大学,曾获得世界大学生超级计算机竞赛ASC15总决赛和国际超级计算机大会ISC17第一;面向轻量级人脸识别的挑战赛AI视觉顶会ICCV
2019
LFR
挑战赛中,周彧聪所在团队获得爱奇艺视频人脸识别大型识别模型iQIYI-Large
赛道的冠军商汤科技早期员工之一,曾在商汤科技研究院带领算法团队161.1.8
MiniMax:小而美的高科技公司,支持产品迭代、变现资料来源:甲子光年,财报网,量子位,中信建投OpenAI
GPT-3开放API商业模式:MiniMax与OpenAI具有相似的商业模式规划,均发掘C端和B端变现场景。OpenAI:
在完成GPT-3
模型的前期测试后进行了C端和B端的商业化。C端为聊天机器人应用ChatGPT,试点付费订阅版本“ChatGPT
Plus”,可在高峰时段获得更快的回答响应,每月收取20美元。B端则面向付费用户与企业开放API模型GPT-3.5-turbo,每1k个token价格为0.002美元,比现有的GPT-3.5模型节省成本90%,海外已有Shopify、Snap、Quizlet等平台率先接入ChatGPT
API。MiniMax:基于三个基础模型的调优测试,公司推出了C端聊天机器人Glow,目前暂未开放收费。B端方面,据甲子光年,MiniMax从2023年起会逐步开放API,让更多的个人用户和企业用户基于多种模态的大模型构建自己的应用。鉴于ChatGPT的收费模式,我们预计当Glow用户数突破一定数量时,也会采用付费订阅模式,优先保障付费会员的流畅使用体验,或类似ChatGPT接入微软Teams,接入国内其他公司的应用生态,从而实现变现。图表:MiniMax与OpenA具有相似的商业模式规划ChatGPT C端B端三大自研基础模型GlowMiniMax开放APIC端B端171.1.9
MiniMax:小而美的高科技公司,支持产品迭代、变现Glow,游戏葡萄,中信建投或将获得米哈游投资,估值10亿美元。2022年上半年,高科技风投明势资本领投MiniMax的天使轮融资,明势资本已投资理想汽车、小牛电动、赤子城等。此外,据游戏葡萄了解,米哈游已经对去对MiniMax的两轮投资,近期正考虑与红杉资本共同开展新一轮投资,MiniMax估值或达10亿美元。新一轮投资有望为MiniMax的产品研发和推广提供支持。2月开启现金激励用户推广Glow。2月,Glow官方开启代言人招募计划,用户通过在抖音、小红书、B站发布Glow相关的视频或文字内容,相关内容浏览量、点赞量达到一定数额即可获得10元现金奖励,后续发布内容最高单篇奖励2250元。关注后续破圈效果。图表:Glow开启代言人招募计划181.2
虚拟人生成:Runway—GEN-2发布,视频制作门槛再降低Runway,中信建投3月20日人工智能初创公司Runway开放了新一代视频生成模型GEN-2的试用申请,能够基于文本、图片、视频等内容,为艺术家、设计师、电影制作人员提供了多样的、低门槛的生成视频方式。新增功能:第一代视频生成模型GEN-1,具备视频生成视频的能力,具体包括视频+图片生成视频、实体模型或渲染动画转为视频、修改视频中特定物体外形等;GEN-2模型新增了纯文本生成视频、文本+图片生成视频、图片生成视频的能力。图表:GEN-1和GEN-2对比191.3
虚拟人生成:Iliad—游戏模型和图片素材生成工具Iliad:主要服务于游戏开发公司的AI模型和图片素材生成工具。产品主要将文字生成图片、2D图片转3D图片等AIGC形式应用于游戏场景中。Iliad可以帮助游戏公司的美术人员生成效果图、3D模型和模型肌理等内容,也可以实现2D转3D的模型生成。图表:Iliad中的文字生成图片功能YCombinatorWinter2023Batch,lliad,中信建投①绘制简单图形②对目标模型进行详细描述③快速生成模型④可回溯生成进度进行再修改⑤继续生成得到最终模型1.4
虚拟人生成&教材编辑:Decoherence—基于文字与音乐生成视频Decoherence:基于文字与音乐生成视频。
Decoherence基于用户输入的关键词,以及时长、FPS、动画效果、背景音乐等参数设置,生成动画短视频。
Decoherence能将音频信号识别为运动效果,并将图像拼接在一起以制作完整的视频。Decoherence降低了用户编辑视频的门槛,但生成的视频分辨率及时长有限、帧率不高、声音选择较少,难以满足部分高要求用户。用户需付费使用Decoherence,月度套餐为每月30美元,可生成超过100个视频。图表:Decoherence的视频参数操作界面①选取视频风格 ①选取视频时长及FPS ③插入背景音乐文件④设置动画随音乐的运动效果⑤设置文字描述20视频实现由“女性”向“车”的过渡YCombinatorWinter
2023Batch
,Decoherence,中信建投211.5
教材编辑:Descript—文本修改对应音频编辑Descript:文本修改对应音频编辑。Descript可以将音频内容转录成对应的文本,用户编辑转录后的文稿时,将对应修改原始音频,包括删词、改词、补词,其中对于新添加的文本,Descript
可在自动转录时生成原始音频的声音,以避免补录,并支持自动识别和分离不同的说话人。定价方面,Descript根据团队用户数和每月转录时长提供不同订阅版本。其中免费版每月有1小时转录时长;每月
10小时、30小时的版本分别对应定价每月12美元、24
美元。图表:Descript通过编辑音频转录生成的文本,来编辑音频YCombinatorWinter2023Batch,36氪,中信建投②通过编辑转录文档以删除或补录对应音频内容①上传用户声音的音频文件221.6
教学辅助:Meru—对话方式提取文件中信息Meru:对话式提取文件中数据。Meru的作用相当于为部分文件内嵌对话机器人,通过调用API将特定的文档、文件、网址等文件的信息进行提取,从而像人类一样,通过对话方式,反馈给用户个性化的相关答案,免去了用户主动搜索数据信息的过程。Meru也允许直接调用存储在Dropbox、Box、GoogleDrive内的文档。Meru已开放多种付费套餐。用户可以免费使用Meru,更高价格的付费版本将对应更多的询问次数、可调用的文件存储服务及其他增值服务等,价位在99美元/599元每月,也可定制需求。长文档YCombinatorWinter2023Batch,
Meru
,中信建投图表:
用户使用Meru,从美国税务局文件中,快速提取关于报税的电话上传文档至Meru的云服务平台Meru根据文档内容回答用户提问231.7
教学辅助的替代场景:Fabius—AI销售培训工具Fabius:AI销售培训工具。Fabius利用Gong/Chorus等软件的录音,分析销售人员在产品定位和向客户推销的做法,并提供个性化和实用的改进建议,也可以为客户对话匹配相关的销售培训课程,帮助销售团队提高销售效率和质量。销售主管也可以改进Fabius的预测,纠正其中缺少的关键步骤。图表:
Fabius为销售人员提供的反馈意见YCombinatorWinter2023Batch,中信建投图表:
Fabius可为销售主管提高销售流程的可见性241.8
教学辅助的替代场景:Tennr—辅助销售人员的AI提词器Tennr:辅助销售人员的AI提词器。Tennr本质为提词器,通过使用AI技术,可为销售人员和经理提供每次电话销售前的准备工作,提高交易达成的几率。例如,Tennr可根据买家关心的方面,调取销售人员过去赢得的类似交易,从而向销售人员展示业务中使用的话术,或提供与过去类似交易相关的最佳解决方案;也可以分析销售通话,提取关键信息,如买家的需求、痛点、预算和时间表PersanaAI
,Tennr,中信建投图表:
Tennr为销售人员可能面临的提问给予参考Tennr内部业务文件(通话录音、CRM数据、营销文档)交易室(用户正在交谈的每家公司的相关内容)为销售人员提供参考外部数据(第三方来源)图表:
Tennr工作原理251.9
专业知识学习:Anarchy—为第三方应用构建可调用特定API的对话机器人Anarchy:为第三方应用构建可调用特定API的对话机器人。Anarchy本质是帮开发者客户集成外部API以及大语言模型,让客户为自己的产品增加对话机器人的功能。Anarchy可以调用任何外部API,例如可调用谷歌地图
API
,回答用户关于两地之间旅程距离的问题;或者调用股票应用了解股票股价APIYCombinatorWinter2023Batch,Anarchy
AI,中信建投用户提问“苹果股价”Anarchy应用程序Open
AI应用的数据信息回答用户问题调用大语言模型图:Anarchy原理示意图。Anarchy的原理在于:开发者用户提供自身应用的API接口,以及对接OpenAI大语言模型的秘钥,Anarchy则提供大语言模型端点,即网页界面形式的聊天机器人,此机器人将使用API的数据信息,借助OpenAI的能力,来回答终端用户的问题。开发者用户由此可专注于自身应用的优化,省去了寻找合适的调取大语言模型指令的工作。终端用户查看到的机器人名称“Stock”Open
AI秘钥应用的API功能描述机器人反馈结果图:Anarchy调用API解答苹果股价信息261.10
算力优化:Texel—AI模型和视频处理的加速器YCombinatorWinter2023Batch,中信建投Texel:AI模型和视频处理的加速器。Texel能提高媒体上使用AI运算推理的效率,例如AI生成图像、视频等应用。Texel为用户提供一个可控的API,允许用户控制要激活的功能,从而加速相应的推理过程。推理过程的用时将被缩短,所需GPU内存的减少也能节约成本。据官网,Texel将使得运行速度比标准解决方案提高10倍,同时降低90%的成本。图表:使用Vanilla
PyTorch运行Stable
Diffusion(左),比Texel
生成图片(右)的速度慢27目 录第一章前言第三章风险提示第二章国内相关公司:新华网、蓝色光标等AI升级交互体验,虚拟人和教育应用场景广阔海外相关应用:AI聊天应用Glow和其他产业链公司2.1
新华网:子公司布局AIGC+虚拟人,发布元宇宙系统“元卯”28资料来源:新华智云官网,海报新闻,江西新闻,新华网,媒体大脑,中信建投智媒体融合平台媒体大脑·MAGIC剪贝文旅智能传播平台云上新闻中心智能金融MCNDATA数芯AI赋能媒体全流程短视频智能生产平台移动版MAGIC游客短视频互动体系会展赛智能传播和数据服务中心金融内容视频解决方案短视频数据服务商媒体数据中台新华智云是由新华网和阿里巴巴成立的合资公司。新华智云科技有限公司主要布局媒体人工智能领域,核心产品包括17年12月发布的媒体人工智能平台“媒体大脑”,开始在媒体领域实践机器生产内容(MGC),18年6月发布的短视频智能生产平台“媒体大脑·MAGIC”,进一步推动人工智能技术在媒体、文旅、金融等领域集成化、产品化、商业化的应用。落地案例包括在18年两会期间用15秒发布关于会议的MGC视频新闻,在俄罗斯世界杯期间制作赛事播报视频。关注AIGC驱动的元宇宙系统“元卯”表现。3月22日,公司发布全国首个AIGC驱动的元宇宙系统“元卯”,结合AIGC模型和此前已多年实践的机器生产内容(MGC),帮助媒体、文旅、金融等企业实现元宇宙数字人、数字内容、数字场景的智能化生产,解决元宇宙内容生产成本高、效率低的问题。图:新华智云推出的虚拟主播的部分应用案例 图:新华智云已发布多个机器生成内容(MGC)产品和解决方案产品及解决方案 介绍媒体大脑 中国第一个媒体人工智能平台29虚拟人“苏小妹”等将接入百度文心一言。据投资者互动易,蓝色光标旗下元宇宙营销场景解决方案公司蓝色宇宙,将接入百度生成式对话模型文心一言,将智能对话技术应用在AIGC营销场景,包括以“苏小妹”为代表的虚拟人驱动与实时对话能力升级,及其他商业化解决方案,例如蓝标智播、分身有术、MEME等产品的生产创造。将与OpenAI开展技术产品合作。据蓝色光标官方公众号及投资者互动易,成为中国区官方代理商后,公司将与微软开展基于OpenAI的技术产品合作,让出海客户与海外消费者更好地互动。据蓝色光标官方公众号,公司提出了与GPT-4可能的合作方式,包括驱动虚拟人的多模态个性化交互、生成NFT、打造用于营销或社交的虚拟空间。2.2
蓝色光标:虚拟人将接入文心一言,涉及与OpenAI合作资料来源:红星新闻,wind图表:虚拟IP“苏小妹”是眉山数字代言人302.3
捷成股份:参股公司世优科技旗下数字人已接入ChatGPT,具备众多应用场景资料来源:公司公众号,wind类型虚拟人所属企业虚拟IP秋月华优酷动漫虚拟IP品牌形象海尔兄弟海尔集团品牌形象IP品牌形象白老头、金老太脑白金品牌形象IP虚拟偶像小缪MUSINESS孵化音乐数字人虚拟数字人女娲世优科技&北京女娲数字人科技虚拟IP阿央央视网虚拟IP/AI助手度晓晓百度虚拟AI助手数字员工AIYA百信银行虚拟数字员工虚拟主播幕兰Mulan世优科技&OST传媒&颐姬娱乐数字员工小观川观新闻虚拟数字员工数字人已接入ChatGPT,可应用在线下展厅、直播、电商等场景。据投资者互动易,公司参股世优科技的数字人,已经接入ChatGPT,通过数字人自身的人设背景等相关数据,对其进行训练,并基于OpenAI来训练数字人专有大脑,形成个性化模型,未来拟应用于线下展厅的AI讲解介绍数字人、线上AI主播、AIGC快速短视频系统、智能客服、电商等多个场景。已为众多头部客户打造数字人。世优科技已经为百度、央视网、海尔集团、脑白金等头部客户定制数字人,用于品牌形象IP、智能助手等场景。其中,数字人“阿央”已经接入世优正在开发的ChatGPT微信小程序——世优数字人元宇宙。该程序可以展示排行靠前的热门问题,并通过接入ChatGPT后的世优科技数字人进行实时的内容解答。图表:世优科技与央视网合作的数字人“阿央” 图表:世优科技部分虚拟人案例31旗下“MetaSurfing-元享智能云平台”接入ChatGPT,并已引入TikTok直播场景。公司旗下的虚拟人制作SaaS平台“MetaSurfing-元享智能云平台”,主要是为实现元宇宙人货场的“批量化、短周期、低成本”制作,已应用在Tik
Tok跨境电商直播、虚拟主播直播互动等场景。1)形象制作:客户通过关键词与描述,即可实时生成符合直播与内容生成的虚拟形象。2)直播交互:该平台已经接入ChatGPT等智能机器模型,输入商品的关键词描述,就可在选定的对应的直播平台,使用选定语种,一键完成7×24小时的无人值守直播。将接入文心一言,提升虚拟人交互等能力。据公司公众号,MetaSurfing-元享智能云平台也将接入百度文心一言,将智能对话技术应用在元宇宙智能生产,及公司旗下的天妤等全体虚拟数字人,提升公司在虚拟人交互体验、数字内容制作效率、元宇宙创意空间等方面的生产能力。2.4天娱数科:将借助ChatGPT及文心一言,提升直播交互能力资料来源:公司公众号,同花顺财经,中信建投图表:公司利用AIGC技术融合虚拟人直播场景图表:
MetaSurfing-元享智能云平台制作虚拟人32与新华社发布“云游中国”,探索数字人+虚拟文旅。23年1月,天下秀与新华社共同发布文旅数字化云平台“云游中国”,用户可定义自身虚拟数字人形象、购买数字藏品装扮、剧情化游览虚拟景点等。天下秀将提供AI交互及数字孪生、区块链、虚拟现实、3D引擎等技术。我们认为,新华智云AIGC驱动的元宇宙系统“元卯”发布,也有望为“云游中国”平台提供数字人、数字内容、数字场景的智能化生产,从而进一步提升用户的虚拟文旅体验。有望改善“虹宇宙”内虚拟社交体验。天下秀于21年12月内测元宇宙社交应用虹宇宙,据公司公告,截至22年6月底累计用户已超50万,用户可通过自定义虚拟形象,在平台内社交互动、收藏数字藏品等。后续AIGC的引入,有望丰富虹宇宙内的虚拟内容供给、让NPC与用户的互动更智能化,从而改善社交体验。2.5
天下秀:AIGC有望改善虚拟文旅、社交领域的交互体验图表:云游中国资料来源:齐鲁壹点,和讯网,虹宇宙,中信建投图表:虹宇宙332.6
其他虚拟人相关公司资料来源:投资者互动易,中信建投遥望科技:虚拟人与AIGC运用在直播领域。据投资者互动易,公司旗下数字虚拟人孔襄已较为成熟,在NFT和广告代言方面已经开展了商业化变现。公司规划在2023年发力虚拟人直播等业务,计划利用公司过往积淀的技术优势,实现高效率低成本的AIGC内容生成。公司关于利用GPT技术框架做直播带货的AIGC生成,目前正处于研究阶段。风雨筑:将接入ChatGPT与文心一言,提升虚拟人在展馆等场景的交互体验。据投资者互动易,公司已探索AI在虚拟展厅、虚拟数字人、虚拟场景及数字艺术创作领域的应用。虚拟数字人方面,1)公司目前正尝试将打造的数字人接入ChatGPT,以强化数字虚拟人的场景识别和更新能力;2)也将把接入“文心一言”,支撑AI驱动数字人多模态交互识别感知和分析决策功能,为线上元宇宙空间里的数字人导览以及线下沉浸式场景中的VR/AR内容、对话交互等环节提供AI能力支撑,打造更有趣的互动交互体验。凡拓数创:将接入文心一言,驱动虚拟人及展馆交互体验。与风语筑类似,凡拓数创也接入“文心一言”,以AI驱动数字人多模态交互识别感知和分析决策功能,让虚拟人实现能听、能答、能学习。此外,文心一言也可运用在公司的数智展馆,打造更沉浸场景、更智能交互的VR/AR导览新体验。34核心IP在家庭娱乐和亲子互动领域具备高知名度。汤姆猫以亲子品牌会说话的汤姆猫家族IP为核心,打造了《会说话的汤姆猫》等超20款线上休闲益智移动应用,具备模仿人类说话、对用户的触摸/拍打做出即时反应、打电话与玩家互动等玩法。据投资者问答,截至23年3月,汤姆猫系列移动应用产品累计下载量超200亿人次,全球月活数超4亿,其中超80的活跃用户来自海外。筹集资金,加大AI教育相关产品、模型等投入。公司在23年2月发布公告,计划通过非公开发行股票筹集资金,用于投向通用人工智能交互终端产品研发、预训练语言模型的自建与接入、IDC算力基础设施建设。其中预训练语言模型将围绕公司擅长的情感陪伴、教育类等垂直领域,并接入公司研发的人工智能交互终端产品及第三方机构的通识大模型。2.7
汤姆猫:核心“汤姆猫”IP与GPT能力结合,开发亲子互动产品图表:会聊天的汤姆猫测试效果资料来源:IT之家,wind“汤姆猫”接入GPT模型,提升产品交互体验。据投资者问答,公司已尝试应用GPT-3.5模型进行AI语音互动产品功能原型测试,并已将汤姆猫IP形象植入产品功能原型,加入语音识别、语音合成、性格设定、内容过滤等功能。公司也已接入ChatGPT
API进行测试,获得了更快的响应速度和更丰富语句表达,当前正着手开发正式产品。据IT之家,基于ChatGPT的《会聊天的汤姆猫》,已开启安
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村住宅交易协议模版
- 集中采购合同的跨国运输管理
- 摄影与设计服务合同样本
- 商家承诺天猫保证书
- 解除劳动合同协议书模板
- 房屋买卖合同担保人权益如何维护
- 物业保洁协议格式
- 建筑基坑挖掘分包合同范本
- 教师与学校之间的聘用协议
- 云端服务终止方案合同
- 税务会计岗位招聘面试题与参考回答(某世界500强集团)2024年
- 2024年中国反病毒邮件网关市场调查研究报告
- 部编版道德与法治三年级上册第8课《安全记心上》精美课件
- 2024安徽省劳动合同书
- 2025年高考物理复习策略
- 哮喘中医分型
- 《数字媒体技术导论》全套教学课件
- 海南乐东黎族自治县事业单位定向公开招聘驻县部队随军家属工作人员5人(第1号)(高频重点复习提升训练)共500题附带答案详解
- 行政执法证专业法律知识考试题库含答案(公路路政)
- 2024-2030年中国语言服务行业发展规划与未来前景展望研究报告
- 2024-2030年白玉蜗牛养殖行业市场发展现状及发展前景与投资机会研究报告
评论
0/150
提交评论