互联网行业人工智能应用专题分析报告:国内AI大模型趋势互联网大厂AI进程_第1页
互联网行业人工智能应用专题分析报告:国内AI大模型趋势互联网大厂AI进程_第2页
互联网行业人工智能应用专题分析报告:国内AI大模型趋势互联网大厂AI进程_第3页
互联网行业人工智能应用专题分析报告:国内AI大模型趋势互联网大厂AI进程_第4页
互联网行业人工智能应用专题分析报告:国内AI大模型趋势互联网大厂AI进程_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

证券研究报告|2024年01月02日人工智能应用专题(4):国内AI大模型趋势探讨,互联网大厂AI进程梳理行业研究

·

行业专题摘要•

大模型技术本质上

于科研创新与技术积累,我国大模型厂商根据自身特点演绎出不同的发展方向。大模型诞生与技术的积累与不断创新,伴随海外技术进步与大模型开源,我国大模型企业也在不断追赶,包括根据其技术路径自研或在其开源框架上优化调整。•

有效数据集有限,优质数据集仍旧稀缺,关注具备高质量内容的平台。大模型的未来发展依赖于训练数据集的质量,而非仅仅是数量。AI技术把原先难以利用的非结构数据带入分析领域,内容创作者所聚集的平台成为高质量数据的重要

。•

大模型后续竞争格局B端与C端分化:C端更易于产生通用底座以及大一统的入口,通过丰富的插件、定制化功能、AIAgent满足用户的高度定制化和长尾需求。B端定制化模型或垂类模型性价比更高,不同B端行业可能用各自模型来满足企业场景、业务流程、模型大小和性能的差异化需求。•

AIAgent框架带来全链路、定制化的信息处理能力,成为生产环节的重要辅助,助力智能硬件“All

inOne”抢占终端流量入口。AIAgent需要标准定义和模型能力进化,同时GenerativeUI可能带来人机交互方式的革新。•

月之暗面、清华GLM、百川智能:作为独立的第三方模型厂商,创始人技术背景强,模型迭代速度快,产品布局AIGC等各个领域。•

互联网大厂腾讯、字节、百度、阿里:结合自身业务场景进行模型和AI应用的开发,同时布局算力、平台、大模型与应用全环节,关注AI生态建设。Ø

投资建议:国内模型能力有望快速提升,带动应用百花齐放。建议积极布局大模型相关厂商和产业链机会。Ø

风险提示:宏观经济波动风险,下游需求不及预期风险,AI伦理风险,核心技术水平升级不及预期的风险等。2目录大模型的竞争格局演绎的关键因素独立的模型团队—月之暗面、清华GLM、百川智能互联网大厂的模型和应用进展—腾讯、字节、百度、阿里风险提示010203043大模型技术本质上

于科研创新与技术积累•

海外大厂核心大模型的能力迁移是国内AI发展的重要考量。考察是否有海外大厂核心大模型研发的技术积累和知识迁移到国内,以及这些技术在本土的应用情况和调整,对理解国内外AI技术的差异和互动具有重要意义。•

国内企业大模型技术路线有两类:①自研效果复现类:参考GPT论文自研复现效果,前期耗时、后续Finetuning对于数据数量质量也有一定要求,能力天花板高;②基于开源迭代类:训练更顺畅但天花板低,依赖开源社区,且开源模型如Llama2比较GPT3.5还是有差距。•

国内企业大模型团队发展路径有两类:①从搜广推背景转向大模型研发,如百度和百川;②成立之初主要基于大模型研究路线和学术背景,如月之暗面的杨植麟团队和清华的智谱团队。图1:不同公司/组织/院校近三年top-100AI发文数图2:海外SuperGlue模型榜单排名(截至2023年12月)ꢀꢀ资料

:SergiCastella

i

Sapé,《Mustread:the100mostcitedAIpapersin2022》,ZetaAlpha,2023年3月2日,国信证券经济研究所整理资料

:SuperGlue,参考文献:Z

Du、Y

Qian等,《GLM:GeneralLanguageModelPretrainingwithAutoregressiveBlankInfilling

》,ComputationandLanguage(cs.CL),2022,arXiv:2103.10360,国信证券经济研究所整理4基于开源大模型框架进行优化调整、应用创新较易落地•

OpenAI的核心能力主要体现在三个方面:1)数据收集和处理的能力,包括数据

,清洗方式,数据结构等;2)模型结构,包括注意力、隐藏层等设计;3)训练方法,包括各类超参数,学习率等。海外大模型开源后,我国大模型企业可在其框架上进行优化调整,以百川智能为例:Ø

基于开源模型提升性能:据GitHub,百川智能通过对LLaMA框架进行修改以提升训练时的吞吐。此外,在LLaMA较为薄弱的中文语料方面,百川智能采用2000万条以中英为主的多语言语料训练分词模型,显著提高中文的压缩率。Ø

大模型+搜索增强解决方案服务B端场景:百川智能通过借助搜索增强,解决大模型在幻觉和时效性问题,提升了模型的可用性,并拓展了应用领域,如金融、政务、司法、教育等行业的智能客服、知识问答、合规风控、营销顾问等。图3:Baichuan-7B对LLaMA框架进行优化后的性能提升图4:在LLaMA上进行的研究工作的演化图ꢀ资料

:GitHubBaiChuan主页,国信证券经济研究所整理资料

:WayneXinZhao、Kun

Zhou等,

《A

SurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,国信证券经济研究所整理5高质量训练数据促进大模型技术的提升,但优质数据集稀缺•

有效数据集有限,优质数据集仍旧稀缺。当前开源榜单公开训练数量级,现有常见的大模型训练数据集往往在几十到几百B的量级,优质的数据集可能就只有300-500Btoken,进化到多模态数据量有所增加,但总量也不多。有的模型会用万亿级别的数据token训练,但很多数据其实是无效的。•

大模型的未来发展依赖于训练数据集的质量,而非仅仅是数量。根据ScalingLaw,Transformer架构的语言模型性能在很大程度上取决于模型大小、数据集大小和训练计算量,性能与这三个因素之间存在幂律关系,且趋势跨越多个数量级,而对其他架构细节(如网络深度或宽度)的依赖相对较小。未来的大模型可能会经历增长飞轮效应,但关键在于训练数据集的质量。这强调了选择和使用高质量数据的重要性,而不仅仅是追求数量。单纯的用户数据上不一定会产生飞轮效应,比如某些用户数据目前只具备统计学的能力,能够发现逻辑、数学的问题还需要找逻辑、数学数据集去优化。图5:各大模型训练数据集对比图6:ScalingLaw模型性能与模型参数、数据集和训练计算量成幂律关系ꢀꢀ资料

:WayneꢀXinꢀZhao、KunꢀZhou等,ꢀ《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,国信证券经济研究所整理资料

:OpenAI官网,国信证券经济研究所整理6AI技术将更大范围的数据带入分析领域,关注稀缺内容平台•

AI技术把原先难以利用的非结构数据(占比80%)带入分析领域。AI浪潮下数据资产的重要性凸显,Snowflake在财报会提到AI技术把原来客户无法利用的非结构化数据带入分析领域构成新的增量。一系列数据公司与产品受益,包括云数据仓库领域(Snowflake)、非结构化/向量数据库(MangoDB、Pinecone)、云数据监控(DataDog)和ML/AIOps

领域(Databricks、AWSBedrock、Weights&Biases)。•

内容创作者所聚集的平台,如字节和腾讯视频号成为高质量数据的重要

随着内容创作者转向音视频平台,这些平台成为了聚集高质量数据的热点,如字节跳动和腾讯视频号等平台。部分观点类数据可能具有一定时效性,如百度问答和知乎等平台上的数据。图7:各大模型训练数据集对比图8:AI技术下数据分析各领域的增量ꢀ公司模型参数量10T数据规模阿里巴巴智源研究院腾讯M6ꢀ1.9ꢀTB图像和ꢀ292GBꢀ文本悟道2.0混元1.75T4.9T1T2T百度文心260B45TB中科院自动化所智谱华章百川智能紫东·太初ChatGLM3百川100B1.42TB中文1.5B、3B和6B2B/7B/13B7B/20B2.6T上海人工智能实验

书生室2.3T(InternLM-20B)科大讯飞商汤科技星火170B1,04B7B数十亿的语言数据集1.6ꢀ万亿ꢀtokenꢀ1300亿InternLM春田知韵(抖音)

豆包阿里云

通义千问盘古7B3万亿tokens200B40TB中文文本、3B图像ꢀ资料

:各公司官网、国信证券经济研究所整理资料

:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,国信证券经济研究所整理7大模型的竞争格局猜想—C端集中,B端差异化竞争•

C端:通用的大模型技术底座不会太多,可能只会有一个大一统的入口,通过丰富的插件、定制化功能、AI

Agent满足用户的高度定制化和长尾需求。从大模型的迭代发展,我们看到底层技术基于Transformer架构的统一化。随着模型能力的增强,与硬件终端协同可能加剧流量入口的集成和统一。•

B端:不同行业具有各自垂类模型,不同大小的模型适用于不同场景。由于企业场景、业务流程差异化,不同的领域模型功能、数据集、模型大小和性能都有较大差别,定制化模型厂商或小模型性价比更高。目前出现很多竞争厂商在B端发力,比如Cohere、或者在Huggingface上用开源模型改造。图9:近年来现有(大于10B)大语言模型的时间轴图10:北美各大企业的AI应用行业分布ꢀꢀ资料

:Wayne

XinZhao、Kun

Zhou等,

《ASurveyofLargeLanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,国信证券经济研究所整理资料

:KarlKeirstead等,《AISurveyofEnterpriseExecs–ShapingtheAINarrativeInto2024》,U.S.Software,2023,国信证券经济研究所整理8OpenAI商业模式:大模型技术领先,积极尝试构建生态壁垒•

通过先进的闭源实现商业化,通过开源前代模型构建生态:OpenAI的GPT技术路线是当前模型自研商家优先选择并跟随的技术方向,而OpenAI凭借大模型的领先优势,后续更新到GPT5后,有可能将前代GPT3.5开源,通过更新一代、开源一代来实现自身战略。领先模型闭源、服务B端客户实现商业化,落后模型开源繁荣GPT生态与应用建设。•

通过AIAgent的形态去构建流量入口:OpenAI在AIAgent与流量入口领域有许多尝试,比如插件生态、GPTs。GPTs出现打破过去的软件孤岛、复杂、不能满足长尾需求的缺点,创建过程工具化标准化而且创建成果产品化。但是AIAgent必须要对个人有全链路的信息处理能力,当前GPTs实际上对个人信息的创建和积累是分裂的,比如单人创建不同的GPTs,其实它们之间互不相连,导致可能会产生训练和数据的浪费。图11:OpenAI模型演进图图12:OpenAI

GPTs应用ꢀDELL-E12021.01DELL-E22022.07DELL-E12023.09ꢀ资料:OpenAI官网,参考文献:Wayne

XinZhao、Kun

Zhou等,

《ASurveyofLarge资料

:Gptshunter官网,国信证券经济研究所整理LanguageModels》,ComputationandLanguage,2023,arXiv:2303.18223,国信证券经济研究所整理9AI

Agent:成为生产环节的定制化辅助,带来人机交互的革新•

AI

Agent框架为大模型提供结构化思考方法,成为生产环节的重要辅助:大模型作为理解推理能力不断增强,软件生产进入低门槛、高定制化时代,面向用户的长尾、个性化需求,Agent框架可以打造每个知识工作者的AI助理。•

AIAgent需要标准定义和模型能力进化,同时GenerativeUI可能带来人机交互方式的革新:当前大模型对连续的复杂推理问题包括对多模态信息的交叉处理仍有不足,需要用更复杂、结构化、多维度的数据来进一步学习。另一方面,Agent应用对当前的人机交互方式带来改变,演进成为同时适用于人类和AI操作的形式。•

案例:Agent以类人的方式与智能手机应用进行交互,使用点击和滑动等底层操作来操作图形用户界面(GUI)。利用大型语言模型的视觉能力以类似人类的方式操作智能手机应用程序。在探索阶段,智能体与智能手机应用程序交互并从结果中学习,以创建一个全面的参考文档。在部署阶段,智能体利用这个文档汇编的信息来有效操作和导航应用程序。图13:用于操作智能手机应用程序的多模态智能体框架概述图14:多模态智能体框架在智能手机App操作中的多种应用ꢀ资料:ChiZhang,ZhaoYang等,《AppAgent:

MultimodalAgentsasSmartphone

Users》,ꢀ

资料:ChiZhang,ZhaoYang等,《AppAgent:

MultimodalAgentsasSmartphoneUsers》,ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,国信证券经ComputerVisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,国信证券经济研究所整理10济研究所整理智能硬件“All

inOne”终端流量入口的抢占之路•

AIGC将带来无限的内容生产与供给,进而颠覆当前的信息分发方式:a16z曾说过“芯片将计算的边际成本降到了零,互联网将分发的边际成本降到了零,现在AIGC实际上将创作的边际成本降到零”。每个人都有机会获得无限的娱乐内容供给,互联网常见的信息分发方式未来可能都面临重组。人会从主动生产和管理信息,进化到与AI共同生产以及与AI辅助管控共存。•

智能终端充当人类和AI认知世界的延伸,依托大模型同时满足生产力、社交娱乐等全面需求。相比软件产品智能硬件终端更容易演化到allinone的形态,从而抢占终端的流量入口。从苹果生态来看,智能终端的壁垒同时取决于生态业务场景的广度和深度,而AI大模型的技术同时带来两个维度的革新。图15:苹果MR眼镜图16:谷歌Pixel

AI手机图17:AI

Pin资料

:公司官网、国信证券经济研究所整理资料理:公司官网、国信证券经济研究所整

资料

:公司官网、国信证券经济研究所整理11目录大模型的竞争格局演绎的关键因素独立的模型团队—月之暗面、清华GLM、百川智能互联网大厂的模型和应用进展—腾讯、字节、百度、阿里风险提示0102030412独立的模型团队—月之暗面、清华GLM、百川智能13月之暗面:清华系新星杨植麟领衔,团队核心人员多为清华同门•

月之暗面(MoonshotAI)创始人杨植麟自2020年起便坚信“大模型是未来”,2020年下半年为

的盘古大模型做核心技术研发,2021年参与智源研究院的悟道大模型研发。2022年底杨植麟前往美国进行为期2个月的考察,美国民众对于GPT的狂热让他更坚信此时正是成立大模型公司的合适时机,于是他在接下来的1个月内完成首轮融资,拿到来自红杉等头部机构6000万美元的启动资金,并于3个月内组建起了大约40人的技术研发团队。•

MoonshotAI于2023年3月成立,成立前其团队主要通过与其他公司合作,以团队提供技术、合作方提供算力的形式来完成大模型相关工作。创始团队核心成员参与了

GoogleGemini、GoogleBard、盘古NLP、悟道等多个大模型的研发,多项核心技术被GooglePaLM、MetaLLaMa、StableDiffusion等主流产品采用。表1:MoonshotAI创始人团队背景介绍姓名持股比例职位简介本科毕业于清华大学计算机科学与技术系,博士毕业于CMU计算机系,师从苹果AI研究负责人RuslanSalakhutdinov和谷歌首席科学家WilliamCohen;博士期间,先后以一作身份,发表Transformer-XL和XLNet两项工作,谷歌学术被引次数近2万;据GitHub个人资料,杨植麟曾效力于Google和MetaPlatforms人工智能实验室,曾任循环智能联合创始人。MoonshotAI创始人,CEO杨植麟78.97%本硕博均毕业于清华大学计算机系,师从清华大学计算机系副系主任、数据挖掘顶级专家唐杰教授,研究方向是异构数据融合和知识图谱构建;曾作为核心开发者研发了全球知名的科技大数据分析平台AMiner,产品服务于BATH等科技巨头及国家科技部等政府科研管理机构。MoonshotAI联合创始人,CTO张宇韬周昕宇5%与杨植麟一同毕业于清华大学计算机系,毕业后加入,从事算法量产工作,旨在提升算法生产效率;就职期间,他和10%MoonshotAI联合创始人研究院基础科研负责人张祥雨一同研究移动端模型,以共同一作的身份撰写ShuffleNet论文,中标CVPR,这项工作为包括苹果3D人脸解锁在内的各种手机毫秒级人脸解锁技术的发展提供了关键支持。与杨植麟背景类似,先后毕业于清华大学与CMU,研究方向为计算机视觉中的检测和识别问题;曾就职于MetaFAIR,和队员吴育昕资料5.96%MoonshotAI联合创始人

何恺明共同提出组归一化(GroupNormalization)的方法,吴育昕创建的detectron2,成为Meta受欢迎的AI项目之一;谷歌学术被引次数超过1.9万次。14:天眼查、国信证券经济研究所整理2023年首次发布大模型产品Kimi

Chat,长文本能力为核心能力•

基于千亿大模型的智能助手Kimi

Chat,核心能力为长文本能力(LongContext):2023年10月9日,MoonshotAI推出首款产品,拥有长达20万汉字的上下文处理能力,据MoonshotAI官方,这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度。此外,KimiChat还可处理多种文档格式(如PDF、Excel等),具备较强的多语言能力,以及调用搜索引擎获取信息,旨在为用户提供强大、智能的对话伙伴,并为其工作、学习、生活提供助力。表2:MoonshotAI推出的大模型产品Kimi

Chat简介核心优势应用实例底层技术处理长文本:依靠长文本技术,KimiChat拥有长达20万汉字的上下文处理能力,这意味着其能够覆盖更多应用场景,且可直接基于全文理解进行问答和信息处理,从而极大程度上解决大模型的“幻觉”问题。•

KimiChat根据提供的文章链接,快速总结分析公众号长文;•

KimiChat根据提供的上市公司财报,快速总结要点;支持多语言:相比当前市面上以英文为基础训练的大模型服务,KimiChat在中文上具备显著优势,实际使用效果能够支持约•

可阅读长篇中文小说(如《三体》),并梳理内容概要、角20万汉字的上下文,2.5倍于Claude-100k(实测约8万字),

色介绍等8倍于GPT-4-32k(实测约2.5万字)。大语言模型、长文本处理技术、注意力机制长程注意力机制:KimiChat通过创新的网络结构和工程优化,可在千亿参数下实现无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的方案。•

可基于长篇小说、游戏设定进行角色扮演,不会在多次对话后脱离设定•

可一次接收多篇上市公司财报并进行市场分析;•

可一次接收多份出差发票并整理相关信息可处理多种文档格式:KimiChat可处理多种文档格式(包括PDF、Excel、CSV等)•

可一次接收多份求职简历并根据用户需求筛选排序出Top5求职者资料

:MoonshotAI官网、国信证券经济研究所整理15模型版本经历两次更新,在多个场景下持续优化模型效果•

KimiChat更新历程:Ø

2023年11月15日,KimiChatV1.1

面向全社会开放版本,模型版本更新至moonshot-v1-20231115,主要更新内容包括(1)大幅解决模型在复杂场景下输出重复的问题;(2)关闭页面不再导致模型回复停止,同一对话下,各终端同步输出内容;Ø

2023年12月25日,KimiChat模型版本更新至moonshot-v1-20231225,主要更新包括(1)内容生成长度提升(2)优化首字回复速度(3)实现从扫描件(文档、合同、白板等)提取文字的功能,目前已支持扫描文件以PDF格式上传解析(4)微信小程序端上线“Kimi智能助手”图18:Kimi

Chat最新版本可从扫描件提取手写文字并解析图19:Kimi

Chat上线微信小程序“Kimi智能助手”ꢀꢀꢀ资料

:MoonshotꢀAI官网,国信证券经济研究所整理资料

:MoonshotꢀAI官方公众号,国信证券经济研究所整理16智谱:清华KEG孵化而来,团队核心成员多有清华背景•智谱AI由清华大学计算机系教授唐杰领衔的清华KEG(知识工程实验室)孵化而来,其团队核心成员多有清华系背景。Ø

2019年成立以来,智谱AI始终坚持投身大模型技术研发,愿景是“未来让机器像人一样思考”,并希望能对标OpenAI;Ø

2020年6月,GPT-3发布,智谱AI意识到GPT模型已实现越级提升;Ø

2022年8月,智谱AI推出自研大模型GLM-130B,结合了GPT的单向向后预测模型框架与BERT的双向预测的模型框架;公司专注于ToB和ToG服务,客户主要是企业和政府机构。Ø

2023年,智谱AI获融资25亿,估值超百亿人民币。•目前智谱的合作案例包括:1)G端,跟北京政府合作提供智能客服能产品;跟北京中医院合作中医药在线问诊模型构建等;2)B端,跟中石油合作ERP改造企业工作流;跟美团合作对话、广告、搜索等功能;3)C端,提供ChatGLM通用大模型入口。图20:智谱股权图表3:智谱AI创始人团队背景介绍姓名

职位简介毕业于清华大学计算机系,博士研究方向为知识图谱。曾在KDD、ICML等国际顶会和期刊上发表多篇学术论文,荣获2013年中国电子学会科学技术三等奖、2012年北京市科学技术三等奖及2009年王选新闻科学技术奖二等奖等多项重要奖项。张鹏

CEO刘德

董事长、

师从高文院士,曾任清华数据科学研究院科技大数据研究中心副兵经理主任王绍兰总裁清华创新领军博士ꢀꢀ资料:天眼查,国信证券经济研究所整理资料:天眼查、国信证券经济研究所整理17模型迭代历程:创新动力充足,多个模型持续迭代GLM:•

2021.9设计GLM算法,发布拥有自主知识产权的开源百亿大模型GLM-10B;•

2022.8发布高精度千亿大模型GLM-130B并开源,效果对标GPT-3175B,收到70余个国家、1000余个研究机构的使用需求;•

2022.10发布开源的100+语言预训练模型mGLM-1BChatGLM:•

2023.3发布千亿基座的对话模型ChatGLM及其单卡开源版本ChatGLM-6B,全球下载量超过800万;为实现从GLM到ChatGLM的迭代,智谱AI加入了代码训练、进行SFT(Supervised

FineTuning,有监督微调)、加入RLHF(Reinforcement

LearningwithHumanFeedback,基于人类反馈的强化学习);•

2023.6发布全面升级的ChatGLM2模型矩阵,据GitHub,主要更新包括(1)升级基座模型以提升模型在MMLU(+23%)、CEval(+33%)、GSM8K(+571%)、BBH(+60%)等数据集的性能表现(2)上下文长度从2k扩展至32k(3)推理速度提升42%;•

2023.8搭载ChatGLM2模型的AI生成式助手“智谱清言”上线;•

2023.10发布全面升级的ChatGLM3模型及相关系列产品,主要更新包括(1)升级基座模型以提升模型在MMLU(+36%)、CEval(+33%)、GSM8K(+179%)、BBH(+126%)等数据集的性能表现(2)在多模态理解、代码增强、网络搜索等功能上进行迭代更新(3)集成自研AgentTuning技术,激活模型智能体能力(4)推出可手机部署的端测模型,支持包括Vivo、小米、三星在内的多种手机以及车载平台(5)推理速度提升2-3倍,以上更新同样作用于智谱清言;CodeGeeX:•

2022.9发布代码生成模型CodeGeeX;•

2023.7发布新一代代码生成模型CodeGeeX2,主要更新包括(1)代码能力大幅提升,据GitHub,六种编程语言能力均大幅提升

(Python+57%,C+++71%,Java+54%,JavaScript+83%,Go+56%,Rust+321%);(2)支持编程语言数量大幅提升,达到100余种;18大模型产品涵盖AI开放平台、智谱清言及一系列AIGC产品•

智谱AI合作研发大模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B,并推出AI提效助手智谱清言(ChatGLM)。AIGC模型及其产品矩阵包括高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等;建立大模型MaaS开放平台,致力于AI生态建设。表4:智谱AI的大模型产品矩阵产品功能介绍应用实例底层模型-为开发者提供开放平台,使其通过API调用,实现基于ChatGLM系列模型(ChatGLM-130B、ChatGLM-6B、GLM-130B)、CodeGeeX代码大模型、多模态大模型(CogView、CogVideo)快速搭建AI应用。电子签约SaaS提供商上上签集成GLM-130B大模型与行业数据,推出签约智能产品Hubble哈勃。AI开放平台基于ChatGLM2开发的千亿参数对话模型,支持多轮对话,具备内容创作、信息归纳总结、代码生成等能力。ChatGLM3:具问答和对话功能的千亿中英语言模型,不同于BERT、GPT-3以及T5的架构,是一个包含多目标函数的自回归预训练模型。ChatGLM(智谱清言)代码生成能力:支持100余种编程语言,帮助用户快速准确生成代码。CodeGeeX:千亿级参数的多编程语言代码生成大模型,在超过20种编程语言的大型代码语料库上进行预训练。基于CodeGeeX代码大模型的全能的智能编程助手,

可实现代码的生成与补全、自动添加注释、支持主流编程语言,并适配多种主流IDE。

代码翻译以及智能问答等功能。CodeGeeX免费智能写作工具,可生成AI原创内容创意以及完成各种文本任务,如文章、报告、新闻稿、营销文案等。GLM(GeneralLanguageModel):通用语言模型,通过自回归空白填充目标进行预训练,并可在各种自然语言理解和生成任务上进行微调。可根据不同创作模板完成不同类型的文案创作,如“元旦祝福”、“文章润色”等。写作蛙基于GLM模型的智能对话机器人,可根据用户定义

可创造多种不同人设,如“林妹妹”、的人设切换对话风格、进行有情感地流畅表达。

“带货主播”等。小呆对话GLM•

CogView:全球首个中文的全领域文到图生成模型,40亿级参数;•

CogVideo:是全球首个开源的大规模文本到视频生成模型,90亿级参数。CogView/Cog

基于CogView/CogViedeo大模型的文(中文)生图

可根据用户输入的中文文字描述生成相关图片/视频。Video工具19资料:智谱AI官网、智谱官方公众号、GitHub、国信证券经济研究所整理百川智能:前搜狗CEO王小川带领,团队核心成员多为知名科技公司AI顶尖人才•百川智能由前搜狗公司CEO王小川联合前搜狗公司COO茹立云于2023年4月10日创立,团队核心成员多为来自搜狗、百度、、微软、字节、腾讯等知名科技公司的AI顶尖人才,截至2023年10月,团队规模170余人,其中硕士及以上学历员工占比近70%,研发人员占比超80%。融资方面,启动资金5000万美元来自创始人王小川及其业内好友个人支持,2023年10月完成A1轮战略融资,获阿里、腾讯等科技巨头及顶级投资机构的3亿美元融资金额,创下国内大模型初创企业最快晋升独角兽的记录。•目前已有超过200家企业申请百川大模型开源和商业授权,并已将百川模型投入实际生产场景。企业涵盖互联网、软件和信息技术、金融、法律、教育、制造业、企业服务等众多领域,客户包括阿里云、腾讯、火山引擎、京东科技、顺丰科技、浪潮、中国农业银行、蔚来汽车等。表5:百川智能创始人团队背景介绍姓名持股比例

职位简介毕业于清华大学计算机科学与技术专业,拥有学士、硕士及EMBA学位;曾任搜狗CEO,搜狐高级副百川智能创始人,

总裁兼CTO;先后发明了有5亿多用户在使用的搜狗输入法、搜狗搜索等互联网标志性产品;曾带王小川

76.43%CEO领搜狗公司发展语音、图像、翻译等AI技术并率先实用化,带领搜狗公司成长为国内用户规模第四大互联网公司,并赴美上市中国人工智能第一股。毕业于清华大学计算机系,获学士、硕士、博士学位及长江商学院EMBA学位;曾任搜狗COO,葡萄百川智能联合创始

智学创始人;曾带领搜狗搜索在多个搜索领域取得不俗成绩,如率先发布分类搜索、推出全新的茹立云

0.77%人知识库搜索引擎知立方、搜狗语音助手等产品,并成为唯一一家能够提供“通用搜索”、“微信公众平台搜索”及微信内容差异化阅读服务的搜索引擎。资料:天眼查、国信证券经济研究所整理20成立8个月内发布8款自研大模型,速度与性能俱佳模型研发方面,自成立以来,百川智能先后发布Baichuan-7B/13B,Baichuan2-7B/13B四款开源模型和Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo四款闭源模型,并与国家级科研机构鹏城实验室共同发布基于国产算力训练的最长上下文窗口大模型“鹏城-百川·脑海33B”。表6:百川智能大模型基本信息及测评表现模型基本信息发布时间是否开源

测评表现基于Transformer结构,在大约1.2万亿tokens上训练而成,参数量70亿,支持中英双语,上下文窗口长度为4096。国内首个开源可商用模型,国内外多榜单排名第一,在中文榜大幅度领先,英文榜首超LlaMA。Baichuan-7B2023.6.15是在Baichuan-7B的基础上提升参数量到130亿,在高质量语料上训练1.4万亿tokens(同等级别开源模型中训练数据最多,超LLaMA-13B40%);同时开源预训练模型(Baichuan-13B-Base)和对齐模型(Baichuan-13B-Chat),服务于开发者与普通用户。Baichuan-13B同等级开源模型中效果最好的可商用大语言模型,中文榜大幅领先LlaMA-13B,英文榜超越所有同等级开源模型。2023.7.11是得益于团队的搜索引擎背景,Baichuan-53B采用高质量知识数据进行预训练,并通过搜索增强(融合指令意图理解、智能搜索和结果增强等关键组件)减少模型幻觉;此外,进行对齐调整以使模型同人类价值观对齐,从而生成“更令人满意”的回复内容。Baichuan-53B2023.8.82023.9.62023.9.25否是否-Baichuan2-7B/13B包括Baichuan2-7B、Baichuan2-13B,基于2.6万亿高质量多语言数据训练而成,在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。在MMLU、CMMLU、GSM8K等几大权威评估基准中,以绝对优势领先LLaMA2,性能大幅度优于LLaMA2等同等级模型竞品。对Baichuan-53B各项能力进行提升(逻辑推理+100%,数学+31%,语言理解+29%,文本创作+18%,知识问答+9%),重点升级逻辑推理与数学能力;通过高质量数据体系和搜索增强极大降低模型幻觉;开放API接口,以方便企业与开发者将其集成至自己的应用程序或服务中。在FacTool测评(查核大模型生成内容的事实准确性)中,Baichuan2-53B的综合得分为140.5,在主流基础大模型中仅排在GPT-4之后,处于国内领先水平。Baichuan2-53B上下文窗口长度高达192K,在长窗口文本生成质量、长上下文理解以及长文本问答、摘要等方面全面领先Claude2;通过算法和工程优化,实现窗口长度

2023.10.30和模型性能之间的平衡;以API调用和私有化部署的方式提供给企业用户。Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答、摘要的评测集上表现优异,有7项取得SOTA,显著超过其他长窗口模型。否否Baichuan2-Turbo融合长上下文窗口和搜索增强,链接大模型与领域知识、全网知识;支持多种文档(PDF、Word)上传及网址输入;开放API。2023.12.19-21资料:百川智能官网、百川大模型官方公众号、GitHub、国信证券经济研究所整理目录大模型的竞争格局演绎的关键因素独立的模型团队—月之暗面、清华GLM、百川智能互联网大厂的模型和应用进展—腾讯、字节、百度、阿里风险提示0102030422腾讯:混元大模型+应用解析23腾讯-基础大模型:混元大模型•

混元大模型是腾讯自研的通用大语言模型。具有超千亿的参数规模、超2万亿tokens的预训练语料。9月,腾讯混元大模型正式通过腾讯云对外开放。用户可以直接调用API接口,或者将腾讯混元作为基底模型,在公有云上进行精调。Ø

10月,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能。根据公司介绍,升级后的腾讯混元中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。Ø

11月世界互联网大会乌镇峰会,腾讯集团副总裁蒋杰还展示了腾讯混元大模型的“文生视频”能力。•

混元助手是基于腾讯混元大模型的多模态对话Bot产品。随着9月腾讯混元大模型首批通过备案,混元助手以微信小程序的形式陆续面向公众开放。在场景的AI聊天页面之外,还在“灵感发现”页面提供了多个场景化的应用。除文生文外,混元助手已经支持文生图功能,尚不支持文生视频和读图功能。图21:腾讯混元助手小程序图22:腾讯混元文生图功能ꢀꢀ24资料

:腾讯云AI官网,国信证券经济研究所整理资料

:腾讯混元官网,国信证券经济研究所整理腾讯-MaaS:腾讯云TI平台,打造行业大模型精选商店•

MaaS云服务:腾讯于今年6月首次公布腾讯云行业大模型方案,依托腾讯云TI平台,打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务。•

中国银联:在单据识别录入场景,腾讯云TI-OCR训练平台整合OCR大模型,支持银联快速自定义证件、票据、文本识别,实现业务流程自动化,提升效率并节约成本。•

上海仁济医院:运用腾讯云医疗行业大模型,以互联网医院适老化服务为重点,打造了高度拟人化的虚拟数字形象“小威护士”,有效提升患者就医体验。•

8月起,腾讯云TI平台全面接入Llama2、Falcon、Dolly、Vicuna、Bloom、Alpaca等20多个主流模型。图23:腾讯云MaaS全景图ꢀꢀꢀ资料:腾讯云智能官网,国信证券经济研究所整理25腾讯-AI基建:自研紫霄芯片+HCC算力集群+向量数据库•

腾讯自研芯片已经量产,包括用于AI推理的紫霄芯片:采用自研存算架构和自研加速模块,可以提供高达3倍的计算加速性能和超过45%的整体成本节省。目前在腾讯会议实时字幕上已实现全量上线,单卡紫霄机器负载可达到T4的4倍,并将超时率从0.005%降低至0。•

腾讯云在4月发布新一代HCC高性能计算集群:采用最新一代星星海自研服务器,搭载NVIDIAH800TensorCoreGPU,性能较前代提升3倍。通过对单机算力、网络架构和存储性能进行协同优化,能够为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。•

腾讯云在7月发布AI原生的向量数据库:之后经过多次迭代升级,在优化版的IVF索引支持下,从最初支持的十亿向量规模到现在的千亿规模和500万QPS峰值能力。目前,腾讯云向量数据库已经在内部服务于腾讯视频、QQ浏览器、QQ音乐等40多个业务,日请求量达1600亿次,服务了包括博世、销售易、搜狐、好未来、链家等在内的超过1000家外部客户。图24:腾讯云新一代HCC集群图25:紫霄芯片算力参数跟其他常见芯片的对比图26:腾讯云向量数据库资料

:腾讯云官网,国信证券经济研究所整理资料

:腾讯云官网,国信证券经济研究所整理资料

:腾讯云数据库官网,国信证券经济研究所整理26腾讯-SaaS产品:AI提供了生成式新功能和潜在销售机会•

根据“腾讯混元”官方公众号的10月推文,超过180个腾讯内部业务已接入腾讯混元,包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。我们认为,SaaS产品在接入混元大模型后,不仅带来了更丰富的AI功能,也提供了新的销售机会,有望带动SaaS产品用户数和客单价的提升。•

腾讯会议:AI小助手,已经上线部分功能。提供会前日程协调、会中问答、会后智能纪要、会议待办项等新功能。其中,“智能录制不限次(包括智能纪要)”已经加入付费版本专属权益,有望带动腾讯会议付费率的提升。•

腾讯文档:智能助手。支持数十种文本创作场景,提供文档创作、文本润色、文本校阅、表格公式及图表生成等能力,提高创作效率,提升创作体验。目前智能助手已经率先嵌入智能文档中,需要申请后参与试用;未来还将嵌入智能表格、PPT、思维导图等文档类型。参照NotionAI,智能助手有望带动腾讯文档付费率和客单价的提升。•

此外,腾讯企点、企业微信、AI代码助手等SaaS产品同样在AI加持下增添了更多新功能,提升了潜在销售机会。图27:腾讯会议AI小助手图28:腾讯文档智能助手ꢀꢀ资料

:腾讯云AI官网,国信证券经济研究所整理资料

:腾讯云AI官网,国信证券经济研究所整理27腾讯-广告平台:AI一方面增强广告定向和归因,另一方面通过AIGC提升广告创作效率和效果•增强广告定向和归因的准确性:2022年6月,腾讯广告对外公布了借助大模型降本增效的进展:首先以混元AI大模型助力系统深刻理解广告内容,其次以精排大模型提升广告和用户的匹配准确率。腾讯连续4个季度在业绩公告中提及机器学习平台升级和广告AI模型。•AI智能化创作广告素材:腾讯广告以腾讯混元大模型为基础,结合广告应用场景,实现含文生图及文生视频在内的多种智能化广告素材创作能力,满足千人千面。目前,腾讯广告“AI创意工作台”已覆盖电商、文旅、阅读资讯、游戏等多个行业场景,针对阅读行业还在持续打磨古言、都市、玄幻等小说人物形象模型,已从9月份开始陆续为广告主提供“素材创作”、“二次编辑&一键投放”、“商品生成”等核心能力。图29:腾讯广告AI创意工作台图30:使用AIGC素材的生成效率与效果更优ꢀ资料:腾讯云AI官网,国信证券经济研究所整理资料:腾讯云官网,国信证券经济研究所整理28腾讯-微信Agent:以微信为入口的Agents具备很强的想象空间•

腾讯Q3业绩会议上提及过“智能代理”(smartagent)的概念,目前还非常早期,但想象空间很大。•

AIAgents,是一种能够自主感知环境、进行规划和决策、使用外部工具的人工智能体。相比于Copilot,AIAgents具备更强的自主性,在复杂任务中参与度更深。目前完全意义上的Agents尚不成熟,市面上工具更多是Copilot。•

假设后期技术能够实现AIAgents,以微信为入口的Agents具备很强的想象空间:1.微信+小程序提供流量入口和基础设施,有机会将微信的流量进一步货币化;2.增强微信的基础性APP地位;3.派生更多新的商业模式。图31:LLM-basedAgent概念框架图32:多模态智能体框架在智能手机App操作中的多种应用ꢀꢀ资料

:复旦大学NLP团队,国信证券经济研究所整理参考文献:XiZ,ChenW,GuoX,etal.Theriseandpotentialoflargelanguagemodelbasedagents:Asurvey[J].arXivpreprintarXiv:2309.07864,2023.资料

:Chi

Zhang,ZhaoYang等,《AppAgent:

MultimodalAgents

asSmartphoneUsers》,Computer

VisionandPatternRecognition(cs.CV),2023,arXiv:2312.13771,国信证券经济研究所整理29百度:文心大模型+应用解析30百度-基础大模型:文心大模型4.0•文心大模型4.0具备强大的理解、生成、逻辑和记忆的能力。根据百度官方公众号,文心一言于8月31日向全社会开放,至今已有超7000万用户。10月17日,在百度世界2023大会上,文心大模型4.0版本正式发布。文心4.0实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,其中逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。根据三季度业绩会议,与3月的文心一言相比,当前版本的推理成本降低了98%,同等算力条件下QPS提升了50倍。图33:文心产业级知识增强大模型ꢀꢀꢀ资料:百度文心一言官网,国信证券经济研究所整理31百度-核心广告:预计在四季度贡献数亿增量收入•

核心广告:文心大模型重构广告系统,预计在四季度贡献数亿增量收入。•

1)9月7日,百度营销发布全球首个AINative营销平台“轻舸”。根据业绩会议,百度通过文心大模型重构广告系统,提升广告素材创作效率和定向能力,“轻舸”可以自然语言和表达、高效推送、随时调度AI能力,大大提升投放效率,便利用户投放。至今已有数千名广告客户采用新广告系统,采用这些新功能的广告客户在三季度实现了平均高个位数的转化率提升。在四季度,AI相关举措有望为百度广告贡献数亿增量收入。•

2)公司正在测试采用新的对话形式替代原有的落地页,不仅有望提升广告转化率,还将使公司有机会从CPC模式向CPS模式转变。图34:百度营销平台-轻舸ꢀꢀꢀ资料:百度轻舸官网,国信证券经济研究所整理32百度-智能云:贡献API调用收入、大模型解决方案收入••智能云:伴随着文心大模型4.0的发布,公司相信客户对AI大模型的需求有望打开云业务新的增长空间。根据业绩会议,目前来自生成式AI和LLM的收入还比较少,但增速快。大模型的2B收入贡献分为几个层面:1)API调用收入:文心4.0已开放面向企业客户的API,目前文心大模型API的调用量呈指数级增长。2)大模型解决方案收入:百度具备完善的芯片、框架、模型、应用四层技术栈,支持企业客户基于文心大模型构建企业级大模型和行业应用,也支持企业客户基于文心千帆平台训练自己的大模型,无论客户选择何种方式,都将为百度带来新的创收机会。目前大模型可应用于电商、短视频、教育、游戏、医疗、金融等六大行业:1)电商行业:通过使用大模型,可以帮助电商平台提升用户体验、增加销售额同时大大降低运营成本;2)短视频行业:可以实现内容创作文本的输出,提高短视频内容创作者的效率;3)教育行业:可以帮助提升教育教学效果、个性化教育水平、辅助教育决策能力;4)游戏行业:在研发端,可以提升游戏设计、游戏代码开发的工作效率;在体验端,可以辅助开发者提供游戏优化方案,提升游戏体验;5)医疗行业:为医生提供更加准确和全面的诊断和治疗建议,以及帮助医生进行疾病检测和预测;6)金融行业:帮助银行和金融机构进行风险评估、市场预测和欺诈检测等任务。图35:百度智能云发布基于文心一言的“超级助理”图36:百度千帆平台架构ꢀꢀ资料:百度智能云官网,国信证券经济研究所整理资料:百度智能云官网,国信证券经济研究所整理33百度-AI重构旗下应用,如百度文库、地图、网盘等••运用文心大模型的能力重构旗下应用,为用户带来全新AI原生体验。百度目前已经基于文心大模型重构了百度文库、地图、网盘、如流等原有应用,也推出了新的AI原生应用百度GBI和Comate代码助手。重构后的AI原生应用,在用户量、活跃度等数据指标方面实现显著增长。例如,百度文库AI新功能累计使用用户达3000万,付费率明显提升;百度网盘个人助理“云一朵”用户累计突破2000万。各应用AI功能:“云一朵”可以帮助用户答疑解惑、总结文档和视频、提供创作灵感;AI向导可以提供预估行程、沿途规划、安排聚会地点等服务;百度文库AI助理可以进行内容总结、创作、PPT编辑等。图37:百度文库AI重构图38:百度网盘AI重构-云一朵、百度地图AI向导-悠悠ꢀꢀ资料:百度官方公众号,国信证券经济研究所整理资料:百度网盘官网、百度地图官网,国信证券经济研究所整理34阿里巴巴:通义大模型+应用解析35阿里—AI组织架构:云智能团队主导,全链条布局AI•阿里云战略为“AI驱动,公共云优先”,达摩院和基础设施事业部负责AI底层基础设施及芯片研发;集团层面,阿里巴巴成立了基础设施委员会,由CEO吴泳铭直接统筹负责,协调全集团底层技术基础设施的规划与建设,助力AI更好地在集团其他业务落地应用。•根据IDC统计,2022年中国AI公有云服务市场还是呈现出80.6%的正增长,整体市场规模达79.7亿元人民币。2022年中国AI公有云服务市场份额,百度智能云占比28.9%,阿里云占比27.4%,云占比18.7%,腾讯云占比18.7%,其他云厂商占比6.4%。图39:阿里AI组织架构情况图40:2022年中国AI公有云服务市场份额资料:雷锋网,国信证券经济研究所整理资料:IDC,国信证券经济研究所整理36阿里—AI基础设施:自研AI芯片+通义大模型,支持外部AI•芯片:平头哥半导体(2018年9月成立),目前已有镇岳、含光、倚天、羽阵等多款芯片产品,其中含光为AI芯片,均已在阿里云、淘宝电商等场景投入应用。•通义大模型:包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。•AI应用情况:自2023年4月通义大模型重磅发布以来,阿里集团董事会主席蔡崇信再2023云栖大会表示,全国80%的科技企业和超过一半的AI大模型公司跑在阿里云上;据公司管理层在FY24Q2业绩会议披露,AI在公有云收入占比达到2%。表7:百度阿里腾讯自研芯片情况图41:阿里巴巴通义大模型系列发布公司自研芯片昆仑芯类别AI芯片百度鸿鹄语音交互芯片RISC-V处理器芯片AI芯片玄铁系列含光800多模态AI处理器SoC原型曳影1520阿里倚天710羽阵600羽阵611镇岳510沧海Arm服务器芯片RFID芯片RFID芯片SSD主控芯片视频处理加速AI芯片腾讯资料紫霄玄灵智能网卡芯片:平头哥半导体官网、昆仑芯科技官网、百度AI开放平台、资料:阿里云开发者社区,国信证券经济研究所整理37腾讯数字生态大会、国信证券经济研究所整理阿里C端应用—淘宝问问:三大基本模式支撑四大应用场景•

淘宝问问是淘宝App推出的ToCAI应用,可以根据用户输入信息,通过深度合成算法解答用户问题,提供内容建议及相关商品推荐,目前淘宝问问仅向C端使用者开放,底层模型为通义千问。Ø

自9月上线测试版以来,累计使用人次超500万;淘宝问问处理的需求中25%是非购物类场景需求,未来有望开拓购物之外的更多使用场景,向泛生活消费类平台转型;Ø

未来有望以接口方式向B端商家开放,助力其将品牌内容、商品优势更高效传达给消费者,同时了解消费者更长尾的购物需求。表8:淘宝问问的交互方式、基本模式及应用场景交互方式基本模式应用场景购物场景:用户已有购物需求,问问提供购买建议,如商品比对Copilot指令模式:通过场景推荐弹幕、选择指定AI角色的交互方式,自动补全用户需求,提供轻量级、伴随式的搜索体验关键词搜索消费场景:问问主动刺激用户潜在购物需求,如场景导购方案场景推荐弹幕Q&A问答模式:生成式AI叠加对话式交互,满足消费者更长尾、个性化的需求生活场景:基于日常生活,同时提供生活技巧及购物建议,如婚礼策划、烹饪指导选择指定AI角色双11大促模式:叠加大促营销权益,形成精准购物建议陪伴场景:通过关键词搜索的交互方式,问问作为用户的交谈对象,可满足诸如“给我讲一个笑话”的需求资料

:淘宝APP、国信证券经济研究所整理38阿里B端应用—企业沟通软件:钉钉全面走向智能化,已开启商业化•

钉钉开放智能化底座AIPaaS给企业客户,AIPaaS包含模型调度平台、模型训练平台和插件开发平台三个部分,降低企业开发运维的门槛,帮助企业数据与大模型建立联系。目前钉钉软件的订阅服务客户已经超过了10万家,付费DAU达到2300万。•

AI商业化情况:钉钉专业版年费9800元基础上,增加10000元即可获得20万次大模型调用额度;在专属钉钉年费基础上,增加20000元即可获得45万次大模型调用额度,相当于一次调用平均只需不到5分钱。•

与钉钉对比,飞书智能伙伴是开放的AI服务框架,没有固定的底层模型,更初阶更灵活,支持内容创作、内容总结、数据分析、场景构建等功能,目前开放试用,尚未商业化。图42:钉钉AIPaaS平台/飞书智能伙伴概览资料

:钉钉官网,飞书公众号,国信证券经济研究所整理39阿里B端应用:万相台无界版&阿里妈妈百灵,多种营销场景智能化•万相台无界版和阿里妈妈百灵是阿里妈妈推出的两大ToB一站式智能营销投放产品,其中万相台无界版以GMV为导向,侧重站内投放;阿里妈妈百灵整合站内外媒体资源,侧重品牌营销。二者依托阿里妈妈专属AI大模型,将消费者触达、营销推广等多种经营场景智能化,助力商家降本增效。•具体案例:日系洗护类品牌Claynal就转变了以品类词为核心的投放方式,利用万相台无界版7大场景能力找到了全新爆款群,收藏加购成本降低了12%,ROI提升了近24%•据阿里2023年9月季度财报,淘天广告收入增速快于GMV增速,主要由于万相台无界和阿里妈妈百灵提升商家投放效率与投放意愿。图43:万相台无界版覆盖六大智能经营场景图44:阿里妈妈百灵包含三大智能化营销场景ꢀꢀꢀꢀ资料:阿里妈妈官网,国信证券经济研究所整理资料:阿里妈妈官网,国信证券经济研究所整理40阿里AIGC应用—妙鸭相机:AI在影视行业的应用探索的小荷尖•妙鸭相机是一款基于AI技术的写真生成工具,由阿里大文娱的张月光带队开发。2023年6月,妙鸭相机内测;7月中旬小程序正式上线;7月底妙鸭相机APP上线;上线即爆火,高峰期有4000-5000人排队,需等待十几个小时才能出片,后因用户等待时长过长、数据收集条款侵犯用户隐私等争议热度很快下降。•AI商业化情况:上线伊始,用户需支付9.9元并上传20张照片即可生成数字分身并开始生成AI写真;9月,妙鸭相机宣布推出免费版本,与仍为9.9元的专家模式相比,免费版本等待生成时间较长且模板使用受限。专家模式下会赠送用户10颗钻石,后续如需体验更多模板或下载高清原图需付费购买更多钻石。•在妙鸭相机之外,阿里大文娱已经在多个影视工业化垂直赛道进行AI布局。近期阿里大文娱团队通过自研大模型生成了超写实数字人厘里,通过真人替身加后期光场制作的方式呈现在剧集《异人之下》之中。传统特效技术通常需要至少一个月才能完成,使用数字人参演叠加后期制作只需要一周,对于影视行业带来直接的降本增效。图45:妙鸭相机区分体验模式与专家模式图46:妙鸭相机微信指数趋势变化ꢀꢀꢀꢀ资料:妙鸭相机小程序,国信证券经济研究所整理资料:微信指数,国信证券经济研究所整理41字节跳动:云雀大模型+应用解析42字节AI—产品与发展时间线:新AI部门Flow同时发力技术与产品2023年2月2023年4月18日2023年6月布局语言和图像两个方向的大模型。其中语言大模型由字节跳动搜索部门牵头,团队规模在十数人左右,图片大模型团队则由该公司产品研发与工程架构部下属的智能创作团队牵头,整体由朱文佳负责。火山引擎在其举办的春季FORCE原动力“原动力大会”上发布了包括自研DPU在内的一系列新云产品,并推出了升级版的机器学习平台。内部测试一款AI对话类产品“Grace”,也就是豆包的前身,但彼时这一内部项目团队隶属字节跳动技术中台,还没有组建单独的产品部门。同月,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,可为开发者和企业提供模型训练、推理、评测、精调等全方位的平台服务(MaaS,即Model-as-a-Service)。2023年8月17日开始对外测试其AI对话产品“豆包”。豆包是字节推出的大模型产品,可以通过网页直接访问,包括豆包本身以及其他多功能小助手,如聊天小宁、写作助手、智能体创建助手、AI图片生成、AI漫画生成、英语学习助手、MUSE音乐电台等。2023年8月Cici

在海外多个市场上线。2023年8月31日字节云雀大模型成为首批通过《生成式人工智能服务管理暂行办法》备案的大模型,可正式上线面向公众提供服务。2023年9月11日“悟空搜索”的应用程序更名为“小悟空”,其主要特色是提供“无广告搜索”体验。小悟空应用内集成了一系列基于大语言模型的AI工具,这些工具支持智能对话和辅助推荐功能。2023年11月22日2023年11月底飞书在北京举办发布会,正式推出了“飞书智能伙伴”和其他系列

AI

产品。成立了一个专注于

AI

创新业务的新部门

Flow。该部门的技术负责人是字节跳动的副总裁洪定坤,业务负责人是大模型团队朱文佳,整体团队规模近150人。Flow将主要聚焦在AI应用层、押注AI大模型方向,后续技术层面更大的模型、端到端的原生多模态,业务层面关注豆包、CiCi等AI原生应用的用户拓展、DAU增长。资料:公司官网、国信证券经济研究所整理43字节产品线与AI功能一览表9:字节产品线传统功能与AI功能产品名称通用信息平台短视频分享应用创建、编辑和共享短视频PUGC视频平台一站式汽车信息与服务真实专业的汽车内容和选车服务PUGC内容互动社区企业协作与管理平台面向网文热爱者的免费阅读平台•••推荐引擎搜索引擎关注订阅和内容运营•••提供优质内容多样化创作•••短视频内容社交服务••••即时沟通传统功能音视频会议在线文档云盘、工作台等••海量正版小说免费阅读体验•浏览其他用户上传的视频内容•为汽车厂商提供高效解决方案AI功能利用AI技术根据用户的兴趣和偏好,为其个性化推荐新闻内容•••智能推荐AI视频剪辑AI实时特效•••个性化推荐用户行为分析AI视频压缩••••智能语音助手智能推荐智能车辆识别AI咨询与服务••••智能视频剪辑视频语音识别智能配乐和配音人像美化••智能语音识别和翻译智能机器人助手,处理咨询、问题••精准推荐智能分类•AI会议议程生成产品名称巨量引擎小荷健康综合的数字化营销服务平台健康知识及服务平台相机自拍相机•视频剪辑云上数据产品•传统功能••智能投放、智能优化数据统计、预算管理•••特色案例、医疗科普在线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论