计算机行业2024年3月国产大模型Kimi带动产业链革新_第1页
计算机行业2024年3月国产大模型Kimi带动产业链革新_第2页
计算机行业2024年3月国产大模型Kimi带动产业链革新_第3页
计算机行业2024年3月国产大模型Kimi带动产业链革新_第4页
计算机行业2024年3月国产大模型Kimi带动产业链革新_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容目录TOC\o"1-2"\h\z\u国产大模型曙光Kimi带动产业链革新 4月之暗面发布Kimi,成为国产大模型曙光 4Kimi突破AI应用现状,保持环比高速增长 5Kimi打破竞争格局,带动产业链发展 8Sora开创AI视频生成新纪元 9OpenAI发布Sora大模型,革新文生视频技术 9Sora或可对影视制作及传媒游戏等行业产生深远影响 11附:近期AI事件 12投资建议 14风险提示 14图表目录图1:Kimi可以阅读英文论文并 4图Kimi可以根据提示词生成宣传文本 4图近期海外AI应用增长疲软,大部分应用日活、月活增速仅有个位数 5图Kimi保持环比高增,并有望超越文心一言、通义千问 6图AI开发者通过精细化的提示库来指引用户以更高效、更精准的方式与AI进行交流 7图目前市场上各种AI大模型在处理长文本方面的能力还存在限制 7图Kimi可以两分钟读完500份简历,筛选员工 7图Kimi可以读取英伟达报告,并分析财报历史 7图Sora根据提示词生成视频 9图Sora根据提示词生成视频 9图将视频数据转换为patches 10图将Scalingtransformers用于视频生成 10表期12国产大模型曙光Kimi带动产业链革新月之暗面发布Kimi,成为国产大模型曙光2023年10月,清华大学杨植麟及其AI团队“月之暗面”发布了Kimi,是国产大模型的代表作之一,拥有优秀的长文本处理能力,可处理20万汉字输入,得到业界高度关注。依赖于优秀的长文本处理能力,用户可在Kimi上传各种资料并进行,包括word、pdf、txt以及图片;此外,Kimi也支持访问互联网链接,读取文本信息并归纳总结。2024年3月18日,Kim公布了支持200万文字输入的内测邀请,测试者可使用Kimi获得200万字长度的无损阅读能力。Kimi20图1:Kimi可以阅读英文论文并 图2:Kimi可以根据提示词生成宣传文本资料来源:Kimi, 资料来源:Kimi,KimiAIscalingScaling:KimiAIscalingScalingCBKimiKimi突破AI应用现状,保持环比高速增长AI1AIAIChatGPT16亿环比增长了1.08;Bing月访问量下降了7.87至13.4亿日活Goole的Gemii3.262月份谷歌将BardGeminiGeminiAdvancedGeminiApp国内月份总体访问量环比下降约20主要是受到春节假期的影响用户的互联网使用习惯可能发生了变化,导致访问量暂时下降。此外,这也说明了当前大AI图3:近期海外AI应用增长疲软,大部分应用日活、月活增速仅有个位数资料来源:SimilarWeb,KimiAIKimi1010300图4:Kimi保持环比高增,并有望超越文心一言、通义千问资料来源:,AI长文本能力是实现人类与AIAI图5:长文本建模是自然语言处理(NLP)领域的一项重要技术资料来源:ASurveyonLongTextModelingwithTransformers,Claude3PromptlibraryAIAIAIAIClaude图AI

图7:目前市场上各种AI大模型在处理长文本方面的能力还存在限制资料来源:Kimi, 资料来源:Kimi,Kimi1)解决复杂问题:长文本模型通过处理大量信息,特别适合执行如企业知识库整合等需要广泛AI2)AI忠诚度与指令遵循:长文本模型必须准确保留原文意义(忠诚度)并能根据任务指令执行操作(指令遵循能力用户体验优化和数图可以两分钟读完500份简历,筛选员工 图可以读取英伟达报告,并分析财报历史资料来源:Kimi, 资料来源:Kimi,Kimi打破竞争格局,带动产业链发展联合技术壁垒和服务壁垒,Kimi有望重塑竞争格局AIAIKimiKimi通过以下几个核心策略实现了区别于市场的独特定位和快速增长。用户体验中心化:Kimi数据驱动的优化:利用用户行为数据,KimiAIKimi为多个行业带来了潜在发展机遇Kimi优秀的性能可以带动多个产业的发展。如:游戏行业的互动升级:Kimi此外,KimiAIAIAIKimiAISora开创AI视频生成新纪元OpenAI发布Sora大模型,革新文生视频技术2024216OpenAISora1Sora图根据提示词生成视频 图根据提示词生成视频资料来源:OpenAI, 资料来源:OpenAI,SoraAIGCAISoraGPTSora模型:通过Patches和ScalingTransformers革新视频生成技术PatchesPatchestokenPatchesPatchesOpenAISoraOpenAIPatchesPatches成了TransformerSoraOpenAIPatches,从而有效控制生成视频的大小和形状。这一策略同样适用于图像处理,因为可以将图像看作是静态的单帧视频。图12:将视频数据转换为patches资料来源:OpenAI,SoraScalingTransformer提升模型效率:OpenAIScalingTransformersScalingTransformersTransformer(种子和输入数据进行视频样本的训练过程中,OpenAI图13:将Scalingtransformers用于视频生成资料来源:OpenAI,Sora核心优势:强大的语言理解能力和一致性强大的语言理解:SoraDALL·E3(re-captioning)GPTpromptSoraSoraOpenAI2DALL·E3Sora灵活的视频扩展技术:SoraTransformerSora出色的适应能力:Sora率和屏幕比例的需求。无论是宽屏格式(1920x1080像素)还是竖屏格式(1080x1920),SoraSora场景和物体的一致性和连续性:SoraSoraSora或可对影视制作及传媒游戏等行业产生深远影响SoraSoraSora4)快速原型和迭代:SoraSoraSora3D动生产力的进一步提升。SoraOpenAI(CTO)穆拉蒂最SoraSora20720PSoraOpenAISoraOpenAI2024OpenAISora附:近期AI事件表1:近期AI事件汇总事件 日期 地区 领域 简述事件 日期 地区 领域 简述GPTS子上线

2.1 国内 文本生成

字节跳动正式推出「CozeAIBotCozeAIMeta第二代自研AI芯片正式投产 Meta第二代自研AI芯片正式投产 2.2国外Meta计划今年在数据中心部署第二代ArtemisAI芯片,主要性其他 能集中在推理领域,将与Meta购买的现成的英伟达GPU协同以增强AI算力,共同夯实该公司的AI基础设施能力。阿里通义千问Qwen1.5发布 2.6国内Qwen1.5是通义千问系列的最新迭代版本。QWen1.5提供从0.5文本生成 亿参数到720亿参数不等的六个模型尺寸。性能评测结果显示,尤其是小模型在某些任务上的表现优于同类产品。谷歌Bard更名为 2.8国外BardGemini,参数较低的版本将继续免费供用(19.99Gemini文本生成 Ultra其性能与GPT-4接近同时GeminiPro上线移动端Gemini GoogleAppGPT-4,GeminiUltraGoogleMeta发布MetaVoice-1B英伟达发布GPURTX2000AdaOpenAI发布文生视

2.9 国外 音频生成2.12 国外 其他

MetaVoice-1BMetaVoice1.2B(12参1030s英伟达最低端专业显卡,AdaLovelaceRTX4060AD107CUDA281688Tensor核心、22RT12.0TFlops,RT27.7TFlops,Tensor191.9TFlops,号称对AmpereRTX2000VR3625Sora60频模型Sora 2.16 国外 视频生

理世界,能生成具有多个角色、包含特定运动的复杂场景。继承DALL-E3谷歌发布Gemini1.5Pro2.16国外文本生成Gemini1.5ProGemini100tokens(GPT-4Turbo12.8支持跨模态理解、分析和推理,即支持对图片和视频的分析。StabilityAI2.21国外图像生成OpenAISoraDiffusionTransformerSD3800m8B35StableDiffusion3DALLE3Midjourneyv6Ideogramv1谷歌发布Gemma系列模型2.21国外文本生成Gemma2b7bGoogleGeminiGemma2b,它的参数量相对较小,因手机等移动设备。目前各个主流推理框架或工具都已适配完成手机等移动设备。目前各个主流推理框架或工具都已适配完成llama.cpp,mlc字节跳动发布SDXL-Lightning2.23国内图像生成SDXL-LightningSDXL4-81024分辨率的高质量图像,计算成本为基础模型的十分之一。SDXL-Lightning可以作为增速插件无缝集成到SDXL模型中,目前主流的SDXL都开始适配。JuggernautXL-V9-Lighting发布2.26国外图像生成JuggernautXLAISDXLLighting4TurboLCMLighting生成的图像质量更好,速度更快。Phind70B2.23国外文本生成Phind-70B在HumanEval上得分为83,超越GPT-4,成为最GPT-4,Phind-70B80+token,远高于GPT-420+tokenPhind-70BCodeLlama-70B500Token32KMistralAI发布旗舰模型MistralLarge2.26国外文本生成81.2,MistralLargeGPT-4MistralLargeAzureAIStudio。微软提出BitNet1.582.27国外文本生成1-bitBitNetb1.583Bllama2.71GPUllamaPlayground2.5发布2.28国外图像生成gnd是基于L51000+个用户的人工评测,PlaygroundV2.5是目前最符合人类偏好的文生图模型。阿里巴巴发表视频生成模型EMO2.28国内视频生成EMOEMO拟角色动画制作提供了新工具。苹果取消造车,加码生成AI2.28国外其他詹南德里亚库克AIGCAdobeAIProjectMusicGenAIControl2.29国外音频生成无需专业的音乐知识,只需利用文本提示就可以生成和编辑音AdobeAI2美元3.1国外其他2.21FY24Q426576512.06和苹果的华尔街第三大价值公司。Anthropic发布Claude-33.4国外文本生成Claude-3GPT4,在推理、数学、编码、多语言理解和视觉方面树立行业新基准。ClOpus20/月。从官方发布的测试结果来看Claude3OpusGPT-4,数学能力和逻辑图表、文档等非结构化数据,由AI模型进行分析和回答。谷歌发布最新「读屏」AI3.4国外音频生成ScreenAIQAUIPaLM2-S训练模型回答关屏幕信息、屏幕导航和屏幕内容摘要的问题。政府工作报告首提(人工智能+)3.5国内其他基础设施,加快形成全国一体化算力体系。零一万物发布Yi-9B3.6国内文本生成Yi90,,,、员提供了前所未有的便利性和强大功能。马斯克xAI开源大模型Grok3.11国外文本生成Grokx.AI(包括两个月的训练上下文长度为8192,Grok-1GPT-3.5GrokxAIxAI可以选择开放源代码或保留专有权。OpenAI开源TransformerDebugger3.12国外文本生成OpenAI机器学习研究员JanLeike宣布,OpenAI要开源内部一直使用的大杀器——Transformer调试器,TransformerDebugger是OpenAI对齐团队(Superalignment)开发的一种工具,旨在支持对小体量语言模型的特定行为进行检查,该工具把自动可解释性技术与稀

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论