




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ArchSummit全球架构师峰会深圳2023|07|21李维NLP科学家出门问问VP“李维NLP老司机、劳碌命,前讯飞AI研究院副院长,出门问问VP。Netbase前首席科学家10年,指挥研发18种语言的社会媒体舆情系统,成为美国NLP产业应用的经典成功案例。Cymfony前研发副总,获第一届问答系统第一名,赢得17个SBIR小企业创新研究项目大模型风暴01大模型之炼0203大模型与AIGC巴别塔建成日:公元2022年11月30日比native还native理解能力输入能听LLM“劳碌命”输出会说生成能力自学习、预训练、生成式AIThebestthingaboutAIisitsabilityto(自回归GPT系列)ThebestthingaboutAIisitsabilitytounderstandThebestthingaboutAIisitsabilitytounderstandworldsThebestthingaboutAIisitsabilitytounderstandworldsthat“大号”的N-gram模型ThebestthingaboutAIisitsabilitytounderstandworldsthatareThebestthingaboutAIisitsabilitytounderstandworldsthatarebothThebestthingaboutAIisitsabilitytounderstandworldsthatarebothexciting…………给定上文,预测下一词:nexttokenpredictionRaw文字序列LLM
多维向量corpora自学习生成式AI(自回归GPT系列)WaymoreOpen-endedCF:Web-1age11年前的第一次AI深度神经革命,聚焦感知,靠的是带标大数据有监督训练。5年多前的二次AI深度革命,NLP大模型(LLM)为旗帜,AI从感知到认知,靠的是自监督预训练。半年前通天塔的三次AI革命,搞定了自然语言交互,以ChatGPT为里程碑。FewShotsZeroshotZeroshot/零样本:不依赖标注大数据,克服知识瓶颈机器迁就人,而不是人迁就机器海量样本标注少样本标零样本标注人类知识客户调查部分人类知识用户粘性、增长性语言知识利用已有测试:NLP测试集,高考,各资格考试Zeroshot开放类任务理论上没有测试集,无法定量数据质量(QA)码农贵族、产品经理/CXO、数据分析员、用户群体:底线拉平,LLM听得懂所有人的指示为“万众创业”创造了条件新突破导向新生态ChatGPT建成语言通天塔洗礼后的新生态建设••语言大模型搞定人类语言标志感知智能走向认知智能:语言+知识••机器迁就人,而不是人迁就机器LLMCoPilot落地,AIGC前景广阔••实体交互方式的革命:不仅仅是人机用户接口:交互克服人工智障••语言模型蕴含了知识模型,虽然并不完备LLMAgent研究值得关注模型痛点、领域挑战••幻觉问题谁调用谁:插件与外挂••稳定性问题领域数据库、业务逻辑、私有数据••知识欠缺问题自主AI研究:Agent••多模态问题与现有领域Legacy系统的关系架构师/工程师焦虑:youarenotalone!••一夜醒来,专业没了工作被取代?••有说:半年前的专业经验是负资产艺术被颠覆?••AI系统的涌现,资源的爆发知识更新跑不赢知识增长•百花齐放,AI日新月异是幻觉与想象力是同义词•
•“一正胡八”:说谎不“脸红”,真假莫辨,极度误导没有“幻觉”,如何讲“故事”(cf《人类简史》)•
•有利于艺术创造任务,却是领域落地的命门写小说,不是报道新闻:记者成不了小说家•
•加大模型可以减少幻觉,不能根治幻觉长尾细节=噪音,抗噪=遗忘细节•
•强化学习可能医治“一本正经”,不能根治“胡说八道”模型不是数据库:源于数据,高于数据•
•领域场景解决方案:外挂数据库张冠李戴是顺畅生成的必然•
•人来把关和核实:可以先假设细节都是不真实的知道自己不知道?一切都是概率•是遗忘,不是“说谎”:没学会人类的语气词是不稳定与创造性是同义词预训练的feature,notabug对于部分落地场景的挑战••不稳定,才有创造性、多样性容易做demo,不容易独立落地••生成式LLM的本性:概率模型有利于艺术创造任务,却也是领域落地的命门••不稳定=随机采样,太稳定=枯燥重复加大模型可以缓解不稳定,不能根治不稳定••模型不是数据库:是条件预测,不是检索多次生成:majorityvote••不稳定带来惊喜或惊恐人来把关和挑选:副驾驶模式,亦可使多次生成是LLM不是数据库序列数据预训练的边界•
•容易做demo,不容易独立落地加大模型可以增加知识,不能穷尽知识•
•知识渊博,尤其是百科知识和多数常识业务逻辑•
•领域知识欠缺提示工程:in-contextlearning,shortmemory•
•模型不是数据库:是条件预测,不是检索传统领域数据库、知识库、术语词典、知识图谱向量数据库很火解决背景信息不足longmemory加强领域内功的副驾驶CoPilotLLMin-&-out:既用其语言天才,“坐台”建设负仅预设专家流既是服务员也也用其知识技能责离线的调教程化在线介入是大厨副驾驶逼近主LLM赋能的自Optional专家把生产力驾驶:主式研究:关或人类反馈大爆发参照特斯拉主驾驶FSD之路2大模型预训练及其微调机制完全基于注意力机制,完全不用递归和卷积特别擅长对序列数据中的长距离依赖进行建模,非常适合自然语言处理任务我有一只猫Ihaveacat(input)(output)Transformerseq2seqdecoder里面的结构,用来解码生成下一个目标语言单词的概率分布编码信息,一般最常见的是重复6次左右encoder里面的结构,主要是向量与矩阵计算FeedForwad计算出每个单词与其他单attention前馈神经网络词的相关性,然后使用这些相关性加权求和得到每个单词的表示向量。SelfAttention自注意力机制大语言模型,本质上是一个包含了大量参数的神经网络。这个神经网络可以看作是一个复杂的函数,它接收输入(如一段文本),然后生成输出(如下一个词)。神经网络的每一层都可以看作是一个函数,它接收上一层的输出(或者输入数据,如果它是第一层),然后生成自己的输出。每个层都包含许多的神经元。每个神经元都有一个权重,这就是大语言模型的参数。这些权重在训练过程中被调整,以使模型能够更好地预测输出。AI大模型就是FoundationModel(基础模型),指通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型。GPT-3训练数据来自于互联网上的大量文本,包括维基百科、新闻文章、网页、论坛、社交媒体等。模型先进行预训练,即在未标记的文本上进行多次迭代的自监督学习,以学习语言的结构和规律。25“预训练+微调”技术,可用一套技术解决不同语言、不同场景、不同NLP任务,有效地提升了开发效率。针对不同任务进行微调行业数据微调超大规模预训练海量文本数据超大规模算力行业、场景应用语言模型未知领域微调更多微调场景...26大模型底座更通用,顶层更垂直,fine-tune是在不改动预训练模型的基础上,在模型「顶层」使模型能够更贴合实际使用场景。来源StandfordAlpaca:AStrong,来源:《followinstructionswithhumanReplicableInstruction-FollowingModelfeedback》RLHFSELF-INSTRUCT基于人类反馈的指令微调强化学习大模型底座通过人工标注对模型输出结果打分建立奖励模型,然后通过奖励模型继续循环迭代,OpenAI获得了更真实、更无害,并且更好地遵循用户意图的语言模型InstructGPT。步骤1:搜集说明数据,训练监督策略步骤2:搜集比较数据,训练一个奖励模型步骤3:搜集说明数据,使用增强学习优化模型有监督微调(SFT)奖励模型(RM)训练通过PPO根据奖励模型进行强化学习。搜集说明数据(基于对这个prompt训练的数新的prompt从数据集中prompt训练方式的数据据集和若干模型的结果抽样集),训练监督策略进行抽样借助模型生成输出Labeler(标注人员)从最Labeler(标注人员)揭示优到最差将输出结果进期望的输出行为行排序反馈模型为输出计算一个反馈结果这个数据用来训练反馈数据用来联合监督学习模型反馈结果用来优化策略,对GPT-3进行微调28“序列猴子”大模型及其AIGC产品矩阵3三位一体的独特商业模式飞轮效应凸显每个人/企业都应该有专属的“ChatGPT”高智商的大脑动听的声音好看的外表智能硬件载体知识只要给予无限时间,一只猴子几乎必然能够打出任何文字,比逻辑对话如莎士比亚的《哈姆雷特》语言推理如果喂给机器猴子海量的文本序列,通过大规模算力去训练它,数学就能练就有智能的“序列猴子”规划大模型的能力体系序列猴子:面向创作者的应用出门问问研发了多款面向创作者的AIGC产品及应用,为万千创作者构建一站式CoPilot产品矩阵,打通内容创作全流程。超超注册会员付费会员像做PPT一样制作数字人视频和直播多元化高清数字人3种形态
200+数字形象形象克隆3D捏脸海量资产IP激活
1000+音色2000+声音丰富语音风格40国语言立体面部4K高清逼真效果超长序列本视频由出门问问AIGC应用“奇妙元”通过一张照片生成声音由“魔音工坊”生成。25年前的yourstruly本视频由出门问问AIGC应用“奇妙元”通过一张照片生成声音由“魔音工坊”生成。如今的“我”:劳碌命本视频由出门问问AIGC应用“奇妙元”通过形象克隆生成声音由“魔音工坊”生成。大模型与语音助手结合,实现更强、更智能的功能。魔法小问:“Siri”+“ChatGPT”大模型大脑数字人形象好看的外表好听的声音语音助手个人信息记忆文档分析图片生成序列猴子大模型,开放生态赋能各行各业…AIoT律所教育医疗金融车企出门问问为企业客户提供专属的大模型定制化开发服务,确保服务全流程打通与高质量交付。企业专有数据模型定制数据处理模型训练私有化部署参数调优根据客户的需求和场景帮助客户在使用大模型使用企业的数据对模型针对特定行业或企业内帮助客户在训练好的大,为客户量身定制一个之前,对其数据进行清进行训练,并进行模型部业务场景定制的大模模型上进行参数调试,适合其业务和数据的大洗、预处理、转换和规评估。型,在企业内部进行部模型。包含API接口定范化等,以确保数据的帮助客户在其自身数据署和应用,以满足客户以获得更好的性能和准制、数据定制、模型架质量和一致性,并使其上训练大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海市上戏附中2025届高一下化学期末教学质量检测模拟试题含解析
- 农机中心制度管理办法
- 合肥建设行业管理办法
- 殡葬服务租赁管理办法
- 超高压挤包直流电缆绝缘系统技术难点及解决方案研究
- 华为薪资待遇管理办法
- 数据安全策略-第2篇-洞察及研究
- 脚手架施工方案:高空作业安全
- 厨房管理办法实施细则
- 分级保护测评工具:评估儿童发展与保护需求
- 一维伺服移动工作台设计说明书电子精密机械设计课程设计
- 职工代表选举方案及选票模版(2篇)
- 血透室护理安全管理及防范
- 广东发布智慧公路标准体系(2024版)
- 电商直播平台主播操作手册
- ASTM-D3359-(附著力测试标准)-中文版
- 石嘴山市直机关遴选公务员笔试真题2022
- 吉林省吉林市亚桥中学2023-2024学年七年级下学期期末考试数学试卷
- 贵州省贵阳市南明区2023-2024学年四年级下学期期末数学质量监测
- DL-T5706-2014火力发电工程施工组织设计导则
- 2024-2030年殷瓦钢行业市场现状供需分析及重点企业投资评估规划分析研究报告
评论
0/150
提交评论