DeepSeek驱动高质量模型平价化_第1页
DeepSeek驱动高质量模型平价化_第2页
DeepSeek驱动高质量模型平价化_第3页
DeepSeek驱动高质量模型平价化_第4页
DeepSeek驱动高质量模型平价化_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

请阅读最后评级说明和重要声明报告日期:2025年02月报告日期:2025年02月14日投资评级:看好投资评级:看好分析师:吴起涤执业登记编号:A0190523020001密集,发布了参数众多且性能提升的V3、支持思维链输出和模型训练的Rl,以及深耕图像领域的视觉和多模态模型。2024年12月底到2025年1月底,全球用户数从34.7万激增至1.19亿。与chatGPT相比,Deepseek仅用一年多就达到chatGP执业登记编号:A0190523020001人工智能AIETF与沪深300指数走势对比类模型大幅下降。Deepseek-Rl在继承了v3的创新架构的基础上,在后训练阶段大规模使用了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算资源浪费,并在仅有极少标AIME2024测评中上获得79.8%的pass@l得分,略微超过openAl-ol;在MATH-500上,获40%30%20%10% 人工智能AIETF与沪深300指数走势对比类模型大幅下降。Deepseek-Rl在继承了v3的创新架构的基础上,在后训练阶段大规模使用了强化学习技术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算资源浪费,并在仅有极少标AIME2024测评中上获得79.8%的pass@l得分,略微超过openAl-ol;在MATH-500上,获40%30%20%10% 限,Al应用开发提速升级。建议关注:B端:鼎捷数智、用友网络;C端:金山办公。3)小模型能力提升促进了端侧模型部署,我们看好Al终端作为新一代计算平台爆发可能。建议关注:科大讯飞、立讯精密、歌尔股份。Al产业商业化落地不及预期的风险市场竞争加剧风险政策不确定性风险。2一、"低成本、高性能、强推理"三位一体 3 32.低成本:DeepSeek位于模型性 43.高性能&强推理:Deepseek算法能力突出 7 9 9 图表目录图1:Deepseek:全球增速最快的Al应用 4图2:Deepseek:增长1亿用户所用时间最短的AI应用 4图3:Deepseek-v3模型架构 5图4:Deepseekv3Dualpipe调度策略 5图5:Deepseek-v3混合精度框架 6图6:Deepseek-v3位于模型性能性价比最优范围 7图7:ol类推理模型输入输出价格 7图8:Deepseek模型性能优异 8图9:蒸馏技术原理 8图10:Deepseek蒸馏小模型超越openAlol-mini 9图11:Deepseek显著提升了算力利用效率 图12:Deepseek面临服务器资源不足的问题 图13:Al智能体"数字化"走向"具身化"示意 图14:2025年全球AIPC出货量能占到PC出货量的35% 图15:Al智能交互眼镜构成及功能 表1:Deepseek持续迭代升级 3表2:不同大模型API服务定价对比 6表3:国内外云厂商接入Deepseek模型 表4:科技厂商Al眼睛布局 表5:相关公司万得一致盈利预测 3—、低成本,用户数将持续高速增长底,更新尤为密集,发布了参数众多且性能提升的V3、支持思维链输出和模型训练的R1,通用语言模型自然语言处理领域的初步探索。数学专用模型专注于数学问题解决能力,提升逻辑推理和复杂数学任务处理性能。多模态模型引入视觉语言融合技术,支持图像与文本的联合理解,拓展多模态应用场景。语言生成模型优化语言生成流畅度与准确性,显著提升文本输出的自然度和逻辑性。代码生成侈模强化代码生成能力与多模态交互功能,支持编程态模型任务和跨模态内容生成。多语言跨领域模型支持多语言处理与跨领域任务,增强模型的泛化能力。综合性能优化模型提升模型综合性能,优化训练策略与架构设计,为后续版本奠定基础。推理优化模型采用混合专家(MOE)架构,动态路由技术使推理成本仅为GPT-4Turbo的17%,在多个基准pro多模态专业模型高级版本多模态模型,优化训练策略与数据规模,击败DALL和stableDiffusion,支持文本到图像的稳定生成。4全球用户数从34.7万激增至1.19亿。2月8日,国内APP端日活3494万,海外3685万,全球web端4800万。与chatGPT相比,Deepseek仅用一年多就达到chatGPT两年的用户规模,在国内1月跃居月均活跃用户数榜首,chatGPT-O1;技术路径巧妙,推理成本仅为GPT-4Turbo的17%;开源与闭源双轨战略,资料来源:Al产品榜,源达信息证券研究所资料来源:Al产品榜,源达信息证券研究所2.低成本:Deepseek位于模型性价比最优范围,较openAl等同类模型大幅下降1)从算法创新层面来看,Deepseek-v3采用了自主研发的MOE架构,总参数量达671B,并引入冗余专家部署策略,实现推理阶段MOE不同专家间的负载均衡,还提出无辅助损失和计算效率展开,通过创新底层软件架构,引入数学变换减少kvcache内存占用,缓解5transformer推理时的显存和带宽瓶颈,优化注意力计算方式,进一步提高效率。同时,采用创新训练目标MTP,让模型训练时一次性预测多个未来令牌,扩展预测范围,增强对上下文的理解能力,优化训练信号密度,将推理速度提升1.8倍。2)在工程优化方面,一系列的创新与优化,使得Deepseek-v3训练成本仅为557万美H800GPU集群上仅需3.7天。加上266.4万GPU小时预训练、119万GPU小时上下文长时。假设H800GPU的租赁价格为GPU6存未命中),每百万输出tokens8元。此外,V3模型设置长达45天的优惠价格体验期:2025年2月8日前,V3的API服务价格仍保持每百万输入tokens0.1元(缓存命中)/1定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16表2:不同大模型API服务定价对比Deepseek-v3:每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元Deepseek-R1:每百万输入tokensl元(缓存命中)/4元(缓存未命中),每百万输出tokens16元(2月9日前优惠期减半)chatGPTGPT4Turbo:输入每百万tokens约元o3-mini:价格较前代降低63%通义千问文本模型:qwen2-72b-instruct:输入价格为0.005元/l,000tokens,输出价格为0.0l元/1,000tokensqwenl.5-110b-chat:输入价格为0.007元/1,000tokens,输出价格为0.014元/qwen-72b-chat:输入和输出价格均为0.02元/1,000tokens视觉理解模型:Qwen-VL-plus:输入价格为0.0015元/千tokensQwen-VL-Max:输入价格为0.003元/千tokens文心一言7输出0.002元/千Tokens,模型推理的综合价格为0.001元/千Tokens豆包格为0.0046元/千Tokens开放平台多模态图片理解模型:kimimoonshot-v1l-32k-vision-preview:每1Mtokens价格24元moonshot-v1l1-128k-vis上下文缓存:kimicache创建费用:24元/Mtokencache存储费用:5元/Mtoken/分钟cache调用费用:0.02元/次资料来源:源达信息证券研究所图6:Deepseek-vv3位于模型性能性价比最优范围图7:o1类推理模型输入输出价格列术,自动选择有价值的数据进行标注和训练,减少数据标注量和计算资源浪费,并在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,在MATH-500上,获得了97.3%的得分,与openAl-O1性能相当,并且显著优于其他模型。8发布了从15亿到700亿参数的R1蒸馏版本。这些模型基于Qwen和Llama等架构,表明R1生成的合成推理数据对这些较小的模型进行微调,从而在降低计算成本的同时保持高性能。让规模更大的模型先学到高水平推理模式,再把这些成果移植给更小的模包。图9:蒸馏技术原理资料来源:CSDN,源达信息证券研究所9和端侧的投资机会学家威廉·斯坦利·杰文斯于1865年提出。当时,英国面临煤炭资源可能耗尽的担忧,人们认为提高煤炭使用效率能缓解资源短缺。但杰文斯却指出,技术进步带来的效率提升,反而会导致资源消耗的增加。例如,当煤炭动力技术效率提高,能量,这会促使更多依赖煤炭能源的产业兴起,如工厂、火车、轮船等,进而刺激煤炭需求大幅增长,加速煤炭资源的消耗。求呈现出几何级增长趋势。Al技术的进步,就像曾经煤炭动力技术的提升,虽然模型效率提高了,但不断增长的用户和应用数量,却对算力资源提出了更高要求,消耗也随之剧增。显示"当前服务器资源紧张,为避免对您造成业务影响,我们已暂停API服务充值。存量充务器繁忙,请稍后再试"。资料来源:甲子光年智库,源达信息证券研究所建议关注以国产算力和Al推理需求为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配套产业,推荐海光信息、浪潮信息。许可协议下支持免费商用、任意修改和衍生开发的优势,迅速成为了海内外各大云厂商的宠如腾讯云将Rl大模型一键部署至高性能应用服务HAI上,开发者仅需3分钟就能接入接拉高了模型能力下限。以往一些受限于基础模型能力不足而难以实现的复杂功能,在集成应用时,从模型搭建到功能实现的周期大幅缩短,开发效率显著提升,实现了Al应用开发理服务腾讯云动和配置阿里云模型百度智能云格方案及限时免费服务火山引擎京东云混私有化实例部署两种模式天翼云微软Azure亚马逊AWS英伟达完整版Deepseek-R1671B的处理速度可达每秒3872Token资料来源:源达信息证券研究所场规模达到了554亿元,预计到2028年,这一数字将攀升至8520亿元,年均复合增长内人士预测,垂直领域的Al代理市场规模有望达到saas的十倍,甚至可能催生出超过知识管理,为企业的数字化转型提供了有力支持。2)c端场景:作为生成式Al的重要商场发展,大模型更广泛地接入硬件产品,做好软硬件协同发展是未来竞争的关键。图13:Al智能体"数字化"走向"具身化"示意lAIPC通过在本地运行大模型,以更具定制性、高效性和安全性的方式,满升,其应用范围也在不断拓展。联想、华为等知名品牌厂商敏锐捕捉到这一技术优势,纷纷图14:2025年全球AIPC出货量能占到PC出货量的35%lAl眼镜眼镜成端侧Al落地绝佳载体,贴合现代生活应用场景广泛。眼镜是人类穿戴设备中最靠近嘴巴、耳朵和眼睛这三大感官的物体,技术进步使其成为端侧Al落地绝佳载体:Al眼镜集的多模态输入输出,完美契合Al复杂功能使用条件。图15:Al智能交互眼镜构成及功能资料来源:艾瑞咨询,源达信息证券研究所款创新产品的可行性,科技企业们纷纷布局,刺激整个产业蓬勃发展,据VR陀螺,目前已有超40家国内外厂商入局Al眼镜,其中包括互联网大厂、手机巨头、AR明星企业,涉及产品数量预计超过50款。表4:科技厂商Al眼睛布局华为visionGlass2024年1349元起轻巧舒适,等效4米前120英寸巨幕,3D模式下可呈现超200英寸巨幕,支持多种3D片源华为华为智能眼镜22024年1399元起搭载鸿蒙系统,支持多种智能交互功能华为华为XGENTLEMONSTER2024年889元起时尚设计与智能功能结合小米小米Al眼镜预计2025年4月暂未公布搭载Al功能、音频耳机模块、摄像头模块,全面对标Ray-BanMetaRokidGlasses2024年112499元搭载高通骁龙AR1平台,1200万像素摄像头,支持高清摄影摄像2025年11799元骁龙AR1旗舰级芯片预计2025暂未公布MetaRay-BanMeta2023年9月299美元起内置定向扬声器、麦克风、摄像头等组件,可用于FPV拍摄/视频录制、通话、听音乐等三星Al智能眼镜预计2025年9月暂未公布搭载AR1、支持Gemini模型苹果苹果Al眼镜预计2025年暂未公布据报道正在研发,可能具备AR功能李未可科技李未可MetaLenschat预计2024年Q4或2025年Ql暂未公布与博士眼镜达成战略合作,进驻博士眼镜全国线下门店蜂巢科技界环Al音频眼镜2024年9月600-800元提供8框14色,快拆结构设计,重量约30克,续航1l小时闪极科技闪极Al"拍拍2024年12999元起球首款Al记忆系统LoomoosXREALXREALone2024年3299元起智能AR眼镜,具备高清显示和智能交互功能INMOINMOGO22024年113999元起一体式Al+AR智能眼镜,具备实时同声翻译、便携提词等功能看见科技LooktechAlGlasses2024年暂未公布具备Al拍照、识别等功能星辰科技Al眼镜2024年暂未公布搭载星辰科技的Al技术,具备智能交互功能资料来源:源达信息证券研究所三、投资建议等算力配套产业,推荐海光信息、浪潮信息。3)小模型能力提升促进了端侧模型部署,我们看好Al终端作为新一代计算平台爆发可能。建议关注:科大讯飞、立讯精密、歌尔股份。表5:相关公司万得一致盈利预测688041.SH15.919.528.739.0162.3110.281SZ4.923.028.734.340.532.527.2931鼎捷数智300378.SZ5.61.82.22.766.153.543.1118用友网络600588.SH7.23.26.2-1553.2194.3100.4625金山办公68811l.SH16.615.219.124.2116.593.073.51776科大讯飞002230.SZ7.76.09.613.3211.0130.91262立讯精密002475.SZ4.9135.9171.8209.123.218.33151歌尔股份002241.SZ3.027.336.445.335.626.7972资料来源:wind,源达信息证券研究所四、风险提示Al产业商业化落地不及预期的风险。目前如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响。市场

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论