2024年AI大模型专题报告：落地条件初具-搜索与情感陪伴赛道崛起

上传人：小*** IP属地：重庆上传时间：2024-05-31 格式：DOCX 页数：20 大小：434.33KB 积分：28 举报 版权申诉

已阅读5页，还剩15页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2024年AI大模型专题报告：落地条件初具_搜索与情感陪伴赛道崛起1.投资分析持续看好国产大模型落地趋势中的应用场景投资机会。进入2024年，海外有GPT-4o将产品性价比大幅提升，Llama、Gemini等优质开源模型也为全球大模型发展提供了重要推动，国内方面大模型厂商迎头赶上，成本端的降低和体验的提升已经开始，AI落地场景有望逐步丰富化。后续可期待GPT-4o大幅提升语音交互效果，以及AI视频领域sora及国内优质视频AI大模型的上线。2.政策端：进展迅速，近150个大模型通过报备自2023年8月31日首批大模型（生成式人工智能服务模型）报备以来，截至2024年5月22日各地报备大模型至少147个，根据时间间隔来看可以划分为6个批次（与上次发布间隔超过2周算作下一批次）。从单批次的报备通过数量来看，每次数量相近，基本每两个月至少会发放20-30个，市场的报备需求能够比较好的满足和反馈。从报备归属地来看，基本集中北京、上海、广东、浙江，其中北京市71个，占比达到49%，上海市和广东省分别为32个和19个，浙江省7个，其余有10个省/直辖市报备共15个，另有1个（中国移动）报备属地为国资委。3.大模型：能力接近海外头部，价格竞争开始3.1.大模型能力追赶中，国产大模型多已接近GPT-4水平进入2024年，国产大模型能力持续提升，整体接近GPT-4。国产大模型综合能力提升显著，从语言、知识、推理、数学、代码、智能体6项指标的得分均值来看，国内的诸多大模型已经接近海外头部的GPT-4-Turbo和Claude3-Opus，显著高于GPT-3.5-Turbo。其中均分前几位的国产大模型依次为智谱华章的GLM-4（2024年1月）、MiniMax的abab6.5（2024年4月）、阿里巴巴的Qwen1.5-110B-Chat（2024年4月）、幻方的DeepSeek-V2-Chat（2024年5月）。国产大模型在语言、知识、推理等单一维度甚至已经超过GPT-4-Trubo。目前国产大模型在语言和知识维度已经明显赶上GPT-4-Turbo，如阿里巴巴Qwen1.5-110B-Chat、智谱清言GLM-4、百度ERNIE-4.0均已在语言和知识两个维度超过GPT-4-Turbo，月之暗面Moonshot-v1-8k也在知识维度略微高于GPT-4-Turbo；推理维度，科大讯飞的讯飞星火V3.5在推理方面得到48.8分，小幅超过GPT-4-Turbo的48.2分，MiniMax的abab6.5更是达到50.1分；阿里巴巴Qwen1.5-110B-Chat在数学维度达到53.6分，与GPT-4-Turbo持平；DeepSeek-V2-Chat代码得分67.3分，小幅超过GPT-4-Turbo的67.2分；智能体维度上，各大模型距离GPT-4-Turbo仍有差距。3.2.“高性价比”，诸多国产大模型采用MOE架构MoE是由专家模型和门控模型组成稀疏门控制的深度学习技术。MoE使用门控网络决定每个数据应被哪个模型训练，实现任务或训练数据在不同专家模型间的分配，让每个模型专注处理其最擅长的任务，从而实现稀疏状态，即输入数据后只有少数专家模型被激活成者使用，大部分专家模型处于未被激活状态。MoE的特点在于可通过指令微调技术大幅提升语言模型性能。MoE可在不增加推理成本的情况下，为大型语言模型（LLM）增加可学习的参数，能够解决模型规模扩展导致训练成本显著增加的问题，结合指令调优后，MoE模型（Flan-MoE）在多个任务上的表现超越了更大的密集模型，同时MoE模型的计算成本只是密集模型的三分之一。2023年12月，MistralAI发布了首个开源MoE大模型Mistral8x7B，其包含47B参数，在每个时间步长内只有2个专家处于活跃状态，对每个输入token只使用了13B参数，因此比普通的非MoE47B参数模型要高效得多，性能达到Llama270B和GPT-3.5的水平。国内众多厂商更新产品采用MoE架构。2024年1月，MiniMax发布了国内首个基于MoE架构的abab6，3月开始更多新发布或者更新的模型公开其采用了MoE架构，至少有包括阶跃星辰、通义千问(Qwen1.5-MoEA2.7B)、面壁智能（MiniCPM-MoE-8x2B、商汤科技（“日日新SenseNova5.0”）、DeepSeek-V2等，而这些模型在能力水平上也接近或者超过GPT4，但在参数量和成本上并未达到很高的水平。以通义千问Qwen1.5-MoE-A2.7B为例，采用MoE后大幅降低训练成本，提升推理速度。该模型发布于2024年3月28日。其总参数量为143亿，拥有2.7B个激活参数，相比Qwen1.5-7B，Qwen1.5-MoE-A2.7B的训练成本降低了75%，推理速度提升了1.74倍。3.3.国内大模型已进入落地价格竞争阶段3.3.1.开源模型成本大幅下降，推动行业竞争启动国内外持续有强力开源模型推出。海外方面，谷歌Gemini、Meta的Llama3等开源模型的推出，开发者可通过公开的大模型自行部署，大模型的获取成本越发降低。国内方面，幻方量化发布的大模型DeepSeek-V2、智谱AI入门级大模型GLM-3-Turbo(128K上下文)均实现了成本的显著压缩。以DeepSeek-V2为例，其相对一代模型参数更多、能力更强。2024年5月6日，DeepSeek宣布开源第二代MoE模型DeepSeek-V2，该模型采用了MLA（Multi-headLatentAttention）和DeepSeekMoE架构，大幅减少计算量和推理显存。DeepSeek-V2具备236B总参数、21B激活参数，支持128k上下文长度，大致达到70B~110BDense结构的模型能力。具体而言，其中文综合能力（AlignBench）在开源模型中最强，与GPT-4-Turbo、文心4.0等闭源模型在评测中处于同一梯队；英文综合能力（MTBench）与LLaMA3-70B同处第一梯队，超过最强MoE开源模型Mixtral8x22B；知识、数学、推理、编程等榜单结果也位居前列。DeepSeek-V2成本更低，API定价仅为GPT-4-Turbo的近百分之一。DeepSeek-V2消耗的显存只有同级别Dense模型的1/5~1/100，每token成本大幅降低。DeepSeek-V2API的定价为：每百万tokens输入1元、输出2元（32K上下文），价格仅为GPT-4-Turbo的近百分之一。3.3.2.GPT4o提升性能降低定价，应对开源竞争闭源AI龙头OpenAI方面也在持续提升其产品性价比，最新GPT-4o相比GPT-4提升显著。自从GPT-4推出后，OpenAI就持续在强化性能、降低价格，从而提升其对于使用者的性价比，据微软CEO纳德拉，过去一年GPT-4性能提升了6倍，但成本降低到了之前的1/12。5月14日，OpenAI推出可实时进行音频、视觉和文本推理的全新旗舰AI模型GPT4o，在文本测试、M3Exam等测试中，该模型超越了包括GPT-4在内的市面诸多头部大模型，相比GPT-4-Turbo，其速度提升两倍，速率限制提高了5倍，最高可达每分钟1000万token。虽然能力和效果大幅度提升，但是在定价方面GPT-4o相比GPT-4-Turbo降幅达50%。根据OpenAI官网，GPT-4o输入和输出每百万tokens的价格分别为5美元和15美元，而同期GPT-4-Turbo定价为10美元和30美元，此次降幅达50%。3.3.3.国内同样开启降价模式，或可推动AI更多场景落地字节跳动开启国内大模型价格竞争，头部厂商纷纷跟进。2024年5月15日，字节跳动宣布旗下豆包大模型降价，豆包通用模型pro-32k版模型推理输入价格仅为0.0008元/千Tokens，比行业低99.3%。随后，国内大模型纷纷加入“价格战”。5月21日，阿里云宣布将旗下通义千问的多款商业化及开源模型进行大幅降价，其中，对标GPT-4的商业化模型Qwen-Long的API输入价格降至0.0005元/千tokens，直降97%；输出价格降至0.002元/千tokens，直降90%。同日，百度智能云也发布公告，百度文心大模型的两款主力模型ENIRESpeed、ENIRELite将全面免费，并即刻生效。5月22日，腾讯也宣布全面下调大模型价格，并立即生效。4.搜索赛道：落地加速，流量争夺初始4.1.海外：perplexity发掘独立赛道前OpenAI科学家创立，最新估值超10亿美元。Perplexity成立于2022年8月，由前OpenAI研究科学家AravindSrinivas与前Meta研究科学家DenisYarats（PerplexityCTO）等合伙人共同创办。同年9月，Perplexity获得310万美元种子轮融资，2022年12月，公司产品PerplexityAI上线。2024年4月23日的最新一轮融资中，Perplexity筹集了约6300万美元资金，估值超过10亿美元。PerplexityAI的特点在于可以对网络信息提炼总结作答。PerplexityAI定位为AI答案引擎，与其他产品存在运行逻辑上的差别：1）相对传统搜索引擎，用户提问后其不止给出网页列表，还会直接提炼总结给出答案；2）相比ChatGPT等聊天类AI，PerplexityAI会基于网络资料而非模型训练资料来生成答案，并在回答后附上类似参考文献的信息来源以方便用户检验和微调；3）回答完毕后，PerplexityAI将给出一系列延申问题，帮助用户发散。PerplexityAI还有三大创新功能，满足用户定制化和细节化要求：1）资料来源编辑（SourceEdit），允许用户删除参考资料并重新搜索，以此通过人工方式修正答案。2）专注搜索（FocusSearch），用户可在开启新搜索前，指定学术、Youtube视频及Reddit论坛搜索等搜索范围，实现更加精准的搜索。3）搜索助手（CopilotSearch），增加了结果的深入程度与个性化。对于同样问题的搜索，搜索助手功能通常参考更多资料来源，回答结果篇幅更长、更具结构化。同时，该功能将对用户问题进行延伸，一次用户搜索的过程实则进行了多次不同关键词搜索。此外，搜索助手功能还可根据用户情况提供定制化内容，如用户询问餐厅推荐时，该功能会自动要求用户补充地址及偏好菜系等问题。用户规模领先同类产品，月活跃用户破千万。自推出以来，PerplexityAI用户规模持续增长，截至2024年5月中旬，产品日度用户访问量达到300万，相比一年前增长5倍以上。横向同类对比来看，据a16z，截至2024年1月，PerplexityAI月访问量前排名生成式AI产品第七名。推出最新功能PerplexityPages，为AI驱动的文本编辑器。2024年5月，Perplexity宣布测试“PerplexityPages”的新功能。用户首先输入指令并选择文本目标受众级别（所有人/新手/专家），PerplexityAI将基于此执行搜索，并生成文章草稿。随后，用户可以选择及添加图像，或通过后续的问题对文本进行修改。成稿后，内容即可在PerplexityAI上发布并共享。4.2.国内：“AI+搜索”赛道火热，新老搜索玩家相继入场4.2.1.今年以来赛道关注度提升，四款产品在竞争中心国内早在23年8月开始就有类似产品推出。长期有搜索引擎业务积累的公司尝试采用AI改造其产品，如23年8月昆仑万维率先推出天工AI搜索产品，360AI搜索也于2024年1月正式推出APP；创业公司方面，月之暗面在2023年10月推出KimiChat，主打长文本处理能力，到了2024年3月将长文本能力进一步扩展到200万字上下文，一举奠定其独特定位，同样是创业公司的秘塔也是在2024年3月推出秘塔AI，进入“AI+搜索”赛道。国内AI搜索产品用户访问量持续攀升。2024年2月起，国内AI搜索产品访问量均呈现上升趋势，Kimi智能助手3月18日功能更新后访问量大幅提升，2024年4月每周访问量均破400万次，秘塔搜索2024年4月每周访问量均突破200万次，天工AI周度访问量也在100万次以上。天工AI上线一年表现稳定，Kimi智能助手数次登上免费榜首。Kimi智能助手于2024年1月12日推出APP端，3月18日支持200万字超长无损上下文后，登顶iOS免费榜效率品类榜首，目前居于iOS免费榜效率品类前20位。天工AI智能助手APP于2023年7月5日上线，上线以来排名小幅提升，目前稳定在iOS免费榜效率品类前20位。4.2.2.流量竞争加剧，各产品尝试不同定位AI应用获客竞争升级。据汇量科技数据研究中心，从买量侧来看，AI相关应用的在投产品数量在一年间迎来爆发，2024年2月比2023年2月暴涨154%，AI应用获客竞争加剧，典型的如Kimi、豆包，其投放素材数量从3月开始大幅增加，高峰日投放分别达到1500个和2500个；从投放金额来看，AI应用保持较高投放强度，4月1日到5月14日期间，AI应用投放前10名中，Kimi、豆包投放金额预计在1500万到1750万之间。Kimi智能助手：主打200万字超长无损上下文，Kimi+功能提供个性化AI服务。Kimi智能助手于2023年10月上线，2024年3月18日，月之暗面公司宣布Kimi智能助手已支持200万字超长无损上下文。5月6日，Kimi+功能上线，为用户提供涵盖官方推荐、办公提效、辅助写作、社交娱乐、生活实用的五大类目24项功能。秘塔AI搜索：无广告直达搜索结果，具备学术搜索功能。秘塔AI搜索是基于大模型的新一代智能搜索引擎。它能够提供无广告、高质量的搜索结果,让用户快速直达所需信息，具有语义理解能力强、支持多轮对话式搜索、支持语音输入等优点。同时，具备学术搜索功能，可帮助用户快速找到相关论文。其背后的秘塔科技创立于2018年4月，CEO闵可锐曾是猎豹移动首席科学家，也是玻森数据CTO和联合创始人，技术专家唐悦曾获全国青少年信息学奥林匹克总决赛（NOI2023）银牌，COO王益为拥有十年红圈所工作经验。天工AI搜索：国内AI搜索鼻祖，实现搜索“信息”到呈现“知识”。2023年8月，昆仑万维官宣发布“天工AI搜索”，成为国内首个融入大模型技术能力的AI搜索产品。“天工AI搜索”深度融合天工大模型能力，并引入了检索增强生成（RAG）技术，将信息检索与语言生成相结合，可以更好地理解用户查询的问题，提供准确的响应。相比同类产品，其具有更强的语义理解能力、多模态搜索能力，能够实现个性化和自适应搜索、跨语言和跨文化搜索，实现从搜索“信息”到呈现“知识”的转变。360AI搜索：大模型+应用场景，重塑搜索体验。2024年1月，大模型搜索产品“360AI搜索”正式上线安卓应用商店。相比传统搜索与大模型，360AI搜索具备四大特点：1）针对模糊问题，可通过反问和几轮交互理解问题，给出答案。如用户输入“我想去迪士尼”，360AI搜索将反问“您想去哪个迪士尼”，并根据具体信息提供攻略；2）可搜索全网上万条相关内容，深度阅读20+网页；3）对比大模型产品特别是聊天机器人，回答更具时效性；4）通过主动追问帮助用户延展学习，了解更多周边信息。自发布以来，360AI搜索热度急剧攀升，据AIwatch.ai发布的全球AI产品4月最新榜单，360AI搜索以1300%的增速排名全球增速榜首位。4.2.3.测评：天工内容相对丰富，Kimi、秘塔资料来源更多对于四款产品，统一使用“2023年私募基金发展情况及原因”这一问题进行测试，发现Kimi智能助手与秘塔AI搜索引用文献数量较多，但Kimi智能助手参考文献中有存在重复内容情况。深度模式下，秘塔AI搜索增列事件、组织、人物指标。天工AI助手参考文献较少，答案篇幅偏长，增强模式下将列示图片、音频作为答案。360AI搜索参考文献数量最多，实现了将问题拆解并分别作答。1）Kimi使用约27秒，引用12篇资料，但有多篇重复内容。半数来自专业的或研究型的网站或报告。生成772字内容，列示了2023年私募基金的10点变化特征，且有2023年的数据支撑。2）秘塔AI搜索简洁模式下，使用约6秒，引用10篇资料，基本来自于专业的网站或报告，生成411字文字、大纲和脑图，列示了两个方面，有数据支持。深入模式下，使用约11秒，引用18篇资料，约3/4来自专业的网站或报告，生成522字文字、大纲和脑图，列示了四方面，内容较简介模式更为丰富。同时，深入模式增列了相关事件、组织、人物。3）天工AI简洁模式下，使用约18秒，引用4篇资料，全部来自专业网站，但其中有两篇为相同内容。最终生成737字的内容，列示了三点发展原因。增强模式下，使用约40秒，参考3个网站资料、4张图片及1个音频。最终生成涵盖四大点、13小点共1221字的内容，图片和音频直接列示在内容中。4）360AI搜索使用约19秒，引用30篇资料，其中有部分资料重复，参考资料来自专业研究网站或报告的有半数以上。最终生成731字的纯文字答案，回答将问题拆解为发展情况与原因分析两部分，分别给出了三点及四点对应内容。同时，在答案末端增列了追问、脑图、相关内容及延伸阅读。4.3.Perplexity订阅制收费，国内变现仍在探索中一般而言，信息类产品能够提升用户效率，也能够影响用户的判断和决策，变现思路多采用：1）面向广告主收费的广告变现模式，2）面向用户的订阅增值服务模式，二者各有利弊，如广告变现可能影响产品公信力，而订阅增值服务模式要向用户，变现效率较低。国内产品暂未开启大面积，海外标杆产品使用订阅制模式变现。国内产品方面，目前Kimi智能助手、秘塔AI搜索、天工AI及360AI搜索均可免费使用。海外产品方面，Perplexity和ChatGPT均采用订阅制模式变现。如Perplexity用户每月支付20美元可使用专业版，能够多次使用Copilot功能及其他高级功能，截至2023年10月公司ARR达300万美元。ChatGPT分为针对个人及团队各有两种定价版本，由于ChatGPT等产品的强劲增长，预计OpenAl年收入将突破16亿美元。Kimi开始尝试“打赏”变现，或代表未来方向。AI搜索产品本质特点就是应对传统搜索引擎效率低下、信息展示存在偏颇的问题，因此作为效率工具采用订阅模式对其长期发展或许更为合适，如Kimi就已经开始尝试这一思路，在使用高峰期需要排队时，Kimi会弹出打赏页面，邀请用户“送一朵花”、“请吃顿饭”等方式，获得高峰期优先使用权，通过相对柔性的“打赏”思路，让用户出于认同，能够降低用户的抵触心理，这也代表着其坚持了产品优先的定位。目前一共有6种方案，价格在5.2元到399元之间，日均价格整体随着单次额提升而降低。5.情感陪伴：用户需求稳定，语音技术或促进发展5.1.赛道由来已久，AI助力体验大幅度提升赛道早有起步，近两年融资频频，体现市场预期乐观。早在2017年，Replika就开始尝试情感陪伴机器人产品，这一赛道也吸引了众多名校背景、有丰富从业经验的创新人才加入，过去7年新品迭出，而最近两年融资动作频繁，市场对AI情感产品赛道预期乐观。AI情感陪伴产品通过个性化定制虚拟人物，基于AI技术满足用户社交聊天需求，增强用户情感体验。目前AI情感陪伴赛道受到海内外普遍关注，重点产品约13款，均以APP或网页形式存在，市场表现有明显差距，网页端来看，表现较好的代表产品有CharacterAI、Janitor.AI和Pi等。情感陪伴应用以各类NPC为核心，用户可与自定义或他人设计的NPC交互，AI的加入增加了代入感。情感陪伴应用结合AI后，可以更好、更自然的回应用户输入的信息，用户能够体会到近似于真人互动的效果，从而形成情感联结。用户可以选择官方或其他用户制作的NPC，也可以通过简单的操作定制自己的NPC，如Talkie只需要用户提供基本图片（用于形成人物形象）和设定信息的文字，通过简单勾选就能够快速生成自己想要的角色。具体玩法可以进一步多元化，如ChracterAI可以让NPC与用户直接语音通话、Talkie可以将NPC的回复以语音形式播放，形成“语音条”的效果，Talkie还设计了卡片集换的玩法，用户与NPC交流中可以触发事件，获得卡片，用户可以在应用内的市场上架自己的卡片销售或购买其他用户的卡片。当前方案还并不突出，如characterAI提供每月9.99美元的提供

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2024年AI大模型专题报告：落地条件初具-搜索与情感陪伴赛道崛起

文档简介

温馨提示

最新文档

评论

2024年AI大模型专题报告：落地条件初具-搜索与情感陪伴赛道崛起

文档简介

温馨提示

最新文档

评论

相关文档