




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容目录TOC\o"1-2"\h\z\uKimi实现破圈,引领国产大模型新方向 4月之暗面成为国产大模型新星 4Kimi主打长文本能力,产品能力优异 5长文本能力成为产业共识,Kimi取得领先并成为破局关键 7应用体验得到广泛认可,B、C两端均有突破 8Kimi火爆再次拉动算力需求增长 10阶跃星辰发布大模型,多模态能力领先 12阶跃星辰多款大模型问世,参战国内大模型市场 12应用和算力积极布局,AI生态逐步构建 13Pixverse引领全球AI视频,国内开启测试 15投资建议 18风险提示 18图表目录图月之暗面发展历程 4图Kimi智能助手自3月以来访问量持续增长 5图长上下文能解决部分大模型的问题 5图LongContext实现功能案例 6图LongContext解决了模型定制的90问题 6图Kimi阅读8篇指定论文并进行文献综述 6图Kimi用指定语言复现学术论文代码 6图Kimi“大海捞针”实验表现 7图GPT-4Turbo“大海捞针”实验表现 8图Claude2.1“大海捞针”实验表现 8图Kimi尝试解决实时性和幻觉焦虑 9图Kimi小程序 9图接入MoonshotAI开放平台内测的应用 9图阶跃星辰股权穿透图(截至2024年3月27日) 13图阶跃星辰AGI发展路径 13图上海智能算力科技有限公司股权结构(截至2024年3月27日) 14图Step-1V多个测试集表现领先 15图Step-1V大模型具备数学和推理能力 15图爱诗科技发展历程 16图Pixverse日访问量 17图Pixverse视频生成界面 17表月之暗面融资情况一览 4表全球玩家不断提升上下文窗口大小 7表MoonshotAI的API定价 10表芯片利用率情况 11表Kimi训练算力测算 11表Kimi推理算力测算 12表阶跃星辰大模型及产品介绍 12表阶跃星辰合作项目 14表跃问、冒泡鸭差异化产品定位 15表爱诗科技融资历程 16Kimi实现破圈,引领国产大模型新方向月之暗面成为国产大模型新星愿景宏大,Kimi。月之暗面科技有限公司成立于2023311(AGI)202310Kimi2020242MoonshotAI243200KimiAI图1:月之暗面发展历程资料来源:公司官网,AI。2023624202024210A25AI表1:月之暗面融资情况一览轮次时间金额投资方天使轮2023年6月超过2亿美元红杉中国、真格基金、砺思资本A轮2023年10月2024年2月近20亿元人民币超10亿美元红杉中国、今日资本、砺思资本等阿里巴巴、红杉中国、小红书、美团等资料来源:澎湃新闻,企查查,KimiKimi243200SimilarWeb320Kimi/桌面端的访问量同比分别高增332/987pctAI2Kimi图2:Kimi智能助手自3月以来访问量持续增长资料来源:SimilarWeb,Kimi主打长文本能力,产品能力优异上下文长度不足为传统大模型应用带来定制化和迭代问题。传统大模型应用中,由于较短的上下文,会出现分割输入(同一单词分段输入后,出现语义理解的歧义)、快速遗忘(角色扮演时,多轮对话后遗忘早期设定)、长度受限(AgentContextfine-tunefine-tuneContext图3:长上下文能解决部分大模型的问题资料来源:MoonshotAI,长上下文可以解决90的定制问题。通过LongContext,上下文中可以承载足够KimiChat20万字的上下文处理能力,能满足大多数场景应用,例如角色定制、客服交流、简历筛选等,在输入大多数客户要求的内容后(角色要求、产品手册、筛选标准),LongContextLongContextfine-tune5fine-tunetoken的成本也更高。公司选择用LongContext方式来解决90的问题,更好向前向后兼容,也成为公司最高优先级的技术突破方向。图Context实现功能案例 图Context解决了模型定制的90问题资料来源:MoonshotAI, 资料来源:MoonshotAI,KimiChat。我们对其进行测试,发送了83020KimiPython、R图阅读8篇指定论文并进行文献综述 图用指定语言复现学术论文代码资料来源:Kimi智能助手, 资料来源:Kimi智能助手,长文本能力成为产业共识,Kimi取得领先并成为破局关键提升长文本能力是全球大模型技术趋势。目前,海内外的主要大模型玩家正在积极扩展上下文窗口,以进一步强化模型处理复杂信息、理解并生成有逻辑的长文Kimi2001000200-500360500表2:全球玩家不断提升上下文窗口大小公司模型名称发布时间上下文长度(token数)OpenAlGPT-4Turbo2023年11月128kGoogleGemini1.5Pro2024年2月1M(内测版本10M)AnthropicClaude32024年3月200k(内侧版本1M)华为PanGu-Σ2023年4月32k百川智能Baichuan22023年10月192k(约35万汉字)百度文心一言2023年10月2.8万汉字零一万物Yi-34B2023年11月200k科大讯飞星火3.52024年1月8k月之暗面Kimi2024年3月200万汉字阿里巴巴Qwen-72B2024年3月32k资料来源:各公司官网、新浪科技、KimiPrompt202312KimiChat(支持20128K2.1(200K上下文窗口ChatGPT-4TurboClaude2.1。图8:Kimi“大海捞针”实验表现资料来源:MoonshotAI,KimiKimiKimi图Turbo“大海捞针”实验表现 图2.1“大海捞针”实验表现资料来源:MoonshotAI, 资料来源:MoonshotAI,应用体验得到广泛认可,B、C两端均有突破CAI(AGI)CAPPCKimiKimiKimiAI-NativeLongContextCAI互联网打法快速占领用户心智,已经过多次扩容。在产品和运营领域,公司也配DAUAPP端之外,公司也推出了小程序;配合市场导流,公司小程序凭借极其便捷的交互243KimiAPP图尝试解决实时性和幻觉焦虑 图小程序资料来源:KimiChat, 资料来源:KimiChat,BMoonshotAI开放平台,APIOpenAI20242MoonshotAIKimi型,MoonshotAI开放平台的APIOpenAIMoonshotAIBKimiCommits、做企业法律问题尽调的案牍AutoDocs、高效阅读CoolPapers1tokensGPT3.5MoonshotAI,但用户反馈依然很好。MoonshotAI。图MoonshotAI开放平台内测的应用资料来源:MoonshotAI,MoonshotAIOpenAI,长文本场景是应用落地方向。目前公司提供三个moonshot-v1-8k/32k/128ktoken12、24、60GPT-4Turbotoken1030AI价格优势明显。结合公司最大优势在于“超长文本”的上下文,MoonshotAIAI表3:MoonshotAI的API定价模型计费单位价格(人民币)moonshot-v1-8k1Mtokens12.00moonshot-v1-32k1Mtokens24.00moonshot-v1-128k1Mtokens60.00资料来源:MoonshotAI,国信证券经济研究所整理Kimi火爆再次拉动算力需求增长训练算力测算:训练过程:前向传播(ForwardPass)和反向传播(BackwardPass)。1)前向传播:输入数据(例如图像、文本等)通过神经网络的各层进行传递,以得到输出结果,包含输入数据与权重矩阵相乘、应用激活函数等操作,目的为将计算网络预测输出,并将其与实际目标值比较,计算损失函数(LossFunction)的值。反向传播(同时,在计算出所有权重的梯度后,使用优化算法更新权重,达到减小损失函数计算次数(计算梯度+权重更新3(2)Token、每个模型参数,需要2×3Flops6训练算力计算假设及结果:模型参数量1750kimi2000训练数据量GPT-3即175045TB),但考虑到公司对海外数据的可获30TB30TBToken4.9Tokens训练算力需求AI6*Kimi*=6*(200*(4.9万亿)=5.94Flos=5.9万亿TFlops。所需训练卡数及时间:考虑到国内英伟达H100/H800算力卡相对紧缺,我们假设KimiA100/A800A100/A800TF32156假设芯片利用率为30.2则5.9万亿TFLOPs/(156TFLOPs×30.2×3600s×24h/天×90天)=1.38万张A100/三个月,即使用A100/A80031.38表4:芯片利用率情况Model#ofParameters(inbillions)AcceleratorChipsModelFLOPSUtilizationGPT-3175BV10021.3Gopher280B4096TPUv332.5Megatron-TuringNLG530B2240A10030.2PaLM540B6144TPUv446.2资料来源:AakankshaChowdhery等著-《PaLM:ScalingLanguageModelingwithPathways》-arXiv(2022)-P9,和预测表5:Kimi训练算力测算Kimi模型参数量(亿)2000Kimi训练数据量(TB)Kimi训练数据量(kb)英文字母/字节(Unicode规则)英文字母数量(个)平均word长度 30 375809638402 1.88E+135.1对应word数量(个)word/tokens比例对应Tokens数量(个)36844082196080.75 4912544292810 对应训练需求测算(Flops)训练算力需求(TFlops)5.90E+245895053151373训练算力卡需求 A100TF32精度下算力(TFlops) 芯片利用率(假设采用英伟达A100芯片) 156 30.23个月内完成一轮训练所需卡数(张) 13793 资料来源:英伟达,测算Kimi大模型推理算力测算:推理过程(PositionalEncoding)TransformerSoftmaxTransfomertoken21Flops2(TokensTokens)2。推理算力计算假设及结果:模型参数量kimi2000推理单次Token1000TokenToken1000。推理算力需求AIKimi2*Kimi*(TokensTokens)2*(2000*(100)=8.04Flos=800TFop。假设Kimi日活为10Kimi30Kimi3002.49TFlp。所需推理卡数及时间:考虑英伟达A10卡目前国内储备量较大、成本较低,假设A10KimiA10FP16125TFlops,假设芯片利用率为30,同时考虑白天高并发因素(即夜间用户并不会使用Kimi),所以假设Kimi推理算力需求会集中在一天12个小时内,则2.49TFlops/(125TFLOPs×30×3600s×12h/天)=1481张A10,即满足10万1481A10Kimi模型参数量(亿)单日推理算力需求(TFlops)30030Kimi模型参数量(亿)单日推理算力需求(TFlops)3003010单日活用户每天调用Kimi频率(次)Kimi单日推理调用总次数(万次)Kimi(万)1000推理单次调用Token量推理单次调用Token量2000240000000024000000003030125芯片利用率A10FP16(TFlops)推理算力卡需求(假设采用英伟达A10芯片)资料来源:英伟达,测算
(假设Kimi用户使用集中在一天12小时以内)阶跃星辰发布大模型,多模态能力领先阶跃星辰多款大模型问世,参战国内大模型市场阶跃星辰是通用大模型新势力,当前密集发布各类模型和产品。阶跃星辰自20234人的可能”为宗旨,自主研发人工智能通用(AGI)大模型。202433StepStep-1Step-1VStep-2MoEStep-1、Step-1VC表7:阶跃星辰大模型及产品介绍名字 类别 图例 定位Step-1Step-1大模型Step-1V大模型千亿参数语言大模型文本的多模态任务。Step-2(预览版大模型MoE扩大,进一步提升语言理解和生成能力。跃问ToCStep旨在提高用户专业领域的工作和学习效率。冒泡鸭ToCStepAI台,AI验。资料来源:公司官网,CEONLP2024年3月27日,公司创始人兼实际控制人姜大昕直接持有99的股份,股权高度集中。此外,公司系统负责人朱亦博作为公司联合创始人持有1的股份。B(参股财跃星辰)、算力等方面已经开始积极布局。图14:阶跃星辰股权穿透图(截至2024年3月27日)资料来源:企查查,AGIAGISystem2(复杂任务的规划能力和抽象概念AGI图15:阶跃星辰AGI发展路径资料来源:阶跃星辰,应用和算力积极布局,AI生态逐步构建应用、算力等多维度持续布局。公司在算力、系统、数据和算法四项工程上持续MFU(有效算力输出)达57;数据方面,公司对全球互联网高质量语料的分布有深入了解,并建立强大的数据处理和知识图谱流MoE其中阶跃星辰云赛智联持股分别持股1011拥有丰富的算力建设经验背书,该平台或将成为上海算力供给重要输出来源。图16:上海智能算力科技有限公司股权结构(截至2024年3月27日)资料来源:企查查,B数据是大模型训练的关键要素,其质量和规模直接影响大模型的语义理解与泛化能力,多样化的数据集则是对各种输入有出色鲁棒性和适应性的保障。公司创始人及骨干团队曾就职于必应搜索引擎,有多年的互联网语料分析经验,深谙如何利用全球互联网上高质量的语料来弥补中文语B表8:阶跃星辰合作项目领域 合作对象 内容联合创办财跃星辰,围绕财经资讯、智能投研、智能投顾等领域金融 界面财联
推进大模型的应用落地,发布国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”。网络文学 中文在线 探索大模型在灵感激发、内容创作等网络文学创作领域的应用。知识服务 中国知网、中文在线 围绕大众知识服务等场景研究和推进大模型的应用。资料来源:财联社,公司多模态大模型领先。OpenCompassStep-1VChatGPT-4Qwen-VL200KB图多个测试集表现领先 图大模型具备数学和推理能力资料来源:OpenCompass, 资料来源:公司官网,C。在此基础上,CAIAIAI表9:跃问、冒泡鸭差异化产品定位产品 界面 产品定位 目标用户群体 主要功能提供丰富的AI角色和场提供丰富的AI角色和场AIAI冒泡鸭为用户提供沉浸式AI的AI交互体验 丰富自己娱乐体验的游界等互动支持用户自定义戏玩家和内容创作者 角色和场景满足个性化的创造需求提供强大的信息检索和知基于大模型的效率跃问工作和学习效率 高效学习的学生群体 持任务管理日程安排等功管
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 自主创业档案模板
- 2024年特许金融分析师考试回顾试题及答案
- 2024年特许金融分析师考试考试心得试题及答案
- 高速收费站现场安全培训
- 2024年特许金融分析师学习心得试题及答案
- 湖北省武汉市江夏区、蔡甸、黄陂、新洲四区2024-2025学年九年级(上)期末历史试卷
- 教导主任个人工作总结11
- 金融理论与CFA考试的融合试题及答案
- 泌尿系感染的预防和护理
- 食管癌放疗病人的护理查房
- 2025年中国票据融资行业发展现状、市场运行态势及发展前景预测报告
- 生物-九师联盟2025届高三2月质量检测巩固卷(G)(九师一模)试题和答案
- 2025年仲裁法考试试题及答案
- 2024年成都市新津区卫健系统招聘笔试真题
- 2025年电梯修理作业证理论考试练习题(100题)含答案
- 2025年公务车辆租赁合同范本
- 2025年生物制药市场分析:生物制药行业规模以上企业数量超过1148家
- 2025年包头钢铁职业技术学院单招综合素质考试题库带答案
- T-ZJWL 001-2024 大宗商品供应链金融动产质押监管仓储服务规范
- 2025年河南对外经济贸易职业学院单招职业技能测试题库附答案
- 非遗文化之漆扇介绍课件
评论
0/150
提交评论