2025深度解读DeepSeek：原理与效应-天津大学

上传人：策*** IP属地：山西上传时间：2025-02-15 格式：DOCX 页数：86 大小：3.51MB 积分：19.9 举报 版权申诉

已阅读5页，还剩81页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

TheTheNaturalLanguageProcessingLaboratoryatTianjinUniversity深度解读DeepSeek：原理与效应伏羲传语01大语言模型发展路线图ENIAC图灵测试达特茅斯会议ELIZAAI寒冬I专家系统oScalingLaws：数据学习、生成的扩展法则ENIAC图灵测试达特茅斯会议ELIZAAI寒冬I专家系统oScalingLaws：数据学习、生成的扩展法则ENIAC图灵测试达特茅斯会议ELIZAAI寒冬I专家系统oScalingLaws：数据学习、生成的扩展法则ENIAC图灵测试达特茅斯会议ELIZAAI寒冬I专家系统oScalingLaws：数据学习、生成的扩展法则ENIAC图灵测试达特茅斯会议ELIZAAI寒冬I专家系统oScalingLaws：数据学习、生成的扩展法则自然语言处理：人类语言的智能化处理与分析，使计算机具备听、说、读、写、译等人所具备的语言能力语言模型：自然语言统计建模，简单说，就是预测句子中的下一个单词是什么Application通用模型行业模型SpecializedModel行业数据领领域微调训练行业对齐数据领领域对齐训练行行业模型部署行行业模型评测General-purposeModel预训练对齐训练SFTBest预训练对齐训练SFTBestofNsamplingRLHRLHF动态批处理模型蒸馏模型剪枝模型量化性能监控算子优化DataParallelExpertParallelDataParallelExpertParallelZeROPipelineParallelFlashAttentionTensorParallelSequenceSequenceParallelDataProcessingandManagement网页论文处理流程质质量筛选PromptResponsesA>C>B>D知识能力价值对齐知识能力价值对齐安全可信安全可信专业领专业领域百科语语言检测数据去重数据去重内容内容过滤领领域分类版本控制版本控制书籍代码ComComputingManagement资源分配任务调度性能监控容错机制弹性扩展负载均衡A100大语言模型：生命周期与范式数据处理后训练应用部署预训练数据处理后训练应用部署预训练数据治理数据要素知识源头基座模型能力涌现对齐模型微调&强化安全可信红队测试模型压缩扩展法则大语言模型：后训练范式过程奖励模型PRM01大语言模型发展路线图o模型架构：大部分企业采用已验证架构（试错成本高昂）【不敢】o推理模型：大部分实验室仍在苦苦猜测摸索Q*/o1（OpenAI保密）【不知】大模型架构技术探索成本{大模型架构技术探索成本DeepSeekV2-V3及R1在模这些技术并不是所有都是原始创新，但是能够进行如此多大模型架构底层创新的实下，尽可能通过算法挖掘和提升硬件训练和解码o推理模型训练技术框架：4步法，有效解决了R1-为什么MCTS+PRM是“误区”模型不能生成停止符使用标记<think></think><answer></answer>oDeepSeek-R1不是唯一的推理模型框架，2025年将出现更多新的框架o要复现上述框架，需要DeepSeek开源相关DeepSeek：技术创新——推理模型|推理能力蒸馏推理模型蒸馏到小模型o大模型蒸馏到小模型优于小模型直接通过大规模RL训练了美国的“AIDominance”01大语言模型发展路线图算力价格战开源vs闭源认知误区创新&人才&Vision产品：性价比永远是王道技术也是如此数百亿美元构建的前沿技术护城河一夜间被攻破GPT-3选择闭源之后，大模型开源vs闭源之争、之战一直存在美国AI第一梯队企业的前沿技术封闭被打破开源vs闭源不仅涉及技术的公开性，也关乎AI安全治理o美国人对中国AI水平的认知：长久以来，美国认为中国在技术型人才：大模型顶大模型顶尖人才o第一类人才自我驱动性很强，技术只需要给定方向，最大限度激发创o突破：通常要打破学科思维定势，或者是本学科还没有形成思维定势考，具备远大梦想《关于Sora、国内大模型及通用人工智能趋势》《认识大模型》（载于学习时DeepSeekV3和R1的创新，从技术上看，是在探明方更创新，笔者将其定义为探明技术方向上的0-1创新（独术框架或者开辟了新的方向。探明方向上的0-1创新，如果有足够多的第一类人才，加上足够多的算技术方向已经被探明了的“追赶”相对容易，难的是在前面面向未知开路，即在未探明方向、未有概念上进行0到1创新、或者进行概念形成和验证，这方面的创新是要更多胆量、更多vision、更多不计成本投入才能做到的，同时需要第二类人才与第一类人才紧密合作，形成双反馈；来实现AGI可能还需要3-5个在未探明方向上进行0-1的创新突破；我国如果要在2030年实现“人工智能理论、技术与应用总体达到世界领先水平”，需要更多企业、高校、研究机构开展探明方向和未探明方向上的0-1创新；01大语言模型发展路线图未来…人类所有职业实现AI自动化需要30年第三个重大突破技术，处于0-1的概念织、自管理、自推进，为人类或团体安排事项、管理科学、社会等重要领第1范式：经验科学观察现象经验1600年理论模型牛顿定律、电

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2025深度解读DeepSeek：原理与效应-天津大学

文档简介

温馨提示

最新文档

评论

2025深度解读DeepSeek：原理与效应-天津大学

文档简介

温馨提示

最新文档

评论

相关文档