腾讯云教育行业大模型产品方案手册_第1页
腾讯云教育行业大模型产品方案手册_第2页
腾讯云教育行业大模型产品方案手册_第3页
腾讯云教育行业大模型产品方案手册_第4页
腾讯云教育行业大模型产品方案手册_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

腾讯云教育⾏业⼤模型⼤模型发展历程⼤模型发展历程回到热点,ChatGPT演进过程发布Gym强化学习平台r发布Gym强化学习平台r半监督语言模型效果验证2020数超大模型2022年初微调后用来改提升性能,人第一阶段:模型规模增大,融合的任务更多第二阶段:利用人工标注引导生成2021年底-至今演进动力:从人类反馈中学习2021年底-至今演进动力:从人类反馈中学习演进动力:训练语料&模型容量更大3亿参数6500万参数ChatGPT的关键技术点1:千亿参数大模型以及对应的海量训练数据从“量变”到“质变”,AI进入“大模型”时代智能问答语音助手、企业客服、呼叫中心、专家咨询、智能助教、智能导诊、销售助手、培训辅导……营销文案、模版写作、剧本创作、编曲填词、访谈提纲、论文综述、课程设计、广告创意……推荐系统商品推荐、广告投放、搜索引擎、商户运营、用户运营、内容运营、视频标签、服务匹配……风控模型信用评估、欺诈检测、订单评估、账号安全、支付风险、内容审核、工业质检、舆情分析……应应用场景感知智能计算智能认知智能感知智能计算智能“涌现”“涌现”能力表示、计算、存储与人机输入、输出prompt大模型prompt大模型Ref.《清华大学:人工智能发展报告2020》图片生成文案创作视频生成聊天对话图片生成文案创作视频生成聊天对话营销方案购物推荐营销方案购物推荐广告营销商业客服旅行攻略购物推荐广告营销商业客服旅行攻略购物推荐更多更多场景文字识别文档摘要文本翻译文字识别文档摘要文本翻译我国10亿参数规模以上的大模型已发布79个产业落地实效成大模型价值重要评估维度金融金融客户服务风险管理分析决策工业工业研发设计生产制造管理服务交通交通智能调度运行监测模拟预测政务政务流程管理决策支持社会保障传媒传媒媒资管理内容生产媒体传播能源自动监测报警诊断运维管理能力更“强”能力更“强”场景更“广”应用更“深”国内AI政策⼤爆发5/30,北京市政府发布《北京市加快建设具有全球影响力的人工智5/30,北京市政府发布《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025年)》、《北京市促进通用人工智能创新发展的若干措施》。国产人工智能芯片和深度学习框架等基础软硬件产品市场占比显著提升,算力芯片等基本实现自主可控。国产硬6/5,成都市公布《成都市关于进一步促进人工智能产业高质量发展的若干政策措施(征求意支持企业、科研机构开展核心算法与专业算法研发,布局大规模语义模型、行业模型等,对取得国家科技重大专项(含科技创新2030-到2025年,人工智能核心产业规模达到400亿元,带动相关产业规模4000亿元。以自动驾驶、智能制造、生成式人工智能为主攻方向,加快人工智能关键技术转化强化建设人工智能平台。强化智能芯片、基础软件、深度学习、AI模型、智能算法等人工智能关推动以国产化CPU、GPU等硬件,算力平台和大模型的自主研发,对于参数量超过百亿、典型应用场景超过5个的大模型,根产品概述产品概述教育⾏业⼤模型,助⼒教学、科研和管理服务⽣产效能和体验升级家长终端科研创新AIforEducation自由对话角色扮演教案润色生成课本/教学材料文献摘要文献问答AIforService专业咨询培养计划选课咨询成绩查询奖助学金后勤事务AIforScience教育行业大模型金融行业大模型交通行业大模型医疗行业大模型口语评测任务对话教学视频模型层开源大模型教育行业大模型混元大模型知识管理应⽤配置运营调优模型管理AI能层教育⾏业⼤模型:依托知识引擎平台对外提供•知识引擎产品定义2.0:基于大语言模型的知识应用构建平台,提供知识问答、知识总结等应用类型及原子能力服务•知识引擎和教育⾏业⼤模型:教育行业大模型依托知识引擎对外输出;教育行业大模型在知识引擎模型层,作为可选的模型之一应⽤共创汽车虚拟助汽车应⽤共创汽车虚拟助汽车服务安灯乐享腾讯内部知识引擎核⼼功能知识引擎核⼼功能开放对接层模型层知识摘要知识库问答知识摘要知识库问答知识问知识总结类知识问知识总结类标签分类标签分类应⽤评测知识库管理应⽤配置运营调优应⽤评测知识库管理应⽤配置运营调优混元⼤模型精调知识⼤模型精调知识⼤模型应⽤场景应⽤场景口语对话评测对话记录跟读模式单词记录词汇建议翻译字幕腾讯自研大模型智聆口语评测数智人核心能力口语对话评测对话记录跟读模式单词记录词汇建议翻译字幕腾讯自研大模型智聆口语评测数智人核心能力子跟读训练,并实时给出用户发音评测结果,辅助英语口语中文口语主题对话练习多轮对话发音纠正对话提示评测报告语法纠正设定场景对话时长单词数量评测分数方案场景方案能力数据接口底层能力数智人对话数智人对话任意主题对话任意主题对话语音输入语音输入 教案撰写耗时调查表明,20%的精力用于钻研教材、了解学情,80%的精力用于书写教案。教师每周工作中54%时间用于备课教案、汇报材料撰写等教学活动枯燥2023年8月,教育部发布《职业教育专业教学资源库建设指南》鼓励合理运用视频类、动画类、虚拟仿真类等资源,传统教案面临着形式枯燥、多媒体素材缺失挑战教学案例老旧新课改背景下,《职业教育专业教学资源库建设指南》明确,高职教学资源库每年更新比例不低于10%,知识更新周期缩短。教学案例更新的时效性要求相应提升课件复制照搬一线教师课件更新频率低、教学精力不足,制作课件就等于下载或组合课件,学校的集体备课就相当于分工搜索下载,到置课件内容质量低、创新性不足痛点场景示例给定教材、课时,生成教案一键生成教案给定教材、课时,生成教案一键生成教案声情并茂润色声情并茂润色请生成一张人教版语文五年级《威尼斯小艇》的课程请生成一张人教版语文五年级《威尼斯小艇》的课程片多模态素材生成然特征与农业》的课件PPT大纲然特征与农业》的课件PPT大纲:课件辅助生成课件辅助生成智能生成课件配图智能生成课件大纲场景三:校园⾏政问答助⼿高校职能部门教务部门学生工作部门后勤部门科研部门党委组织部门国际交流部门科研部门面向对象高校职能部门教务部门学生工作部门后勤部门科研部门党委组织部门国际交流部门科研部门痛点效率低下沟通成本高效率低下沟通成本高服务质量不高举例,从《2023中国大学生满意度调查报告》中可知,目前中国2000多所高校学生仅有23.1%的学生对学校总体满意度为非常满意。接咨询压力大甚至整个学校的师生对接。在5*8以外的场景示例流程咨询流程咨询业务办理业务办理今年在广东省录取人数为123人。其中通过高考统招计划招中,普通批物理类录取97人,务时间:9:00-17:00间:9:00-17:00.场景四:科研⽂献助⼿面向对象 高校/高职院校教育部将高职高校的理、科研项目等指标纳入考核大模型帮助高校建设科研文献平台,提高科研效率,助力科研成果转化高校科研院所科研文献大模型帮助研究人员提高科研效高校科研院所科研文献大模型帮助研究人员提高科研效率、捕捉前沿观点,促进科研转化痛点文献阅读耗时文献阅读耗时分钟,至少需要14个小时文献术语晦涩检索定位费力大量文献,但短期内融合全库跨专业背景的知识,形成学术观点并标注观点溯润色翻译费力学术专业表达、跨语种翻译有严格要求场景示例一键概括综述文献大意概括一键概括综述文献大意概括问答深度理解问答深度理解预置问题模版、支持自主提问、多轮对话、深度答疑智能纠错润色智能纠错润色智能增删、文本替换润色精准检索定位精准检索定位精准定位答案溯源处场景五:招⽣咨询助⼿面向对象 高校招生办2023年高考报名数达到1291万,净增长近100万。普通本科校均规模16793人,高职校均规模高考志愿填报高峰时段最多8000通电话/天。大模型承接咨询需求,提高咨询响应率,数智人还原校高校信息化中心教育信息化明确将招生就业、教学科研等信息服务应用纳入考核体系大模型招生咨询助手打造高校信息化亮点,提升高校信息化水平,巩固高校长期影响力痛点咨询问题复杂家长咨询需求旺盛,问题复杂、要求繁多沟通响应缓慢痛点咨询问题复杂家长咨询需求旺盛,问题复杂、要求繁多沟通响应缓慢难以承接日均8000+的并发咨询,问题重复度高、整体招生咨询响应率低审核核对频繁专业、准确的回复。频繁核对最新政策和信息、耗费大量时间精力问答重复机械号线上咨询通常采用预置模板和回应话术,问答对话过程僵硬机械场景示例“新鲜的皮囊”——校友、校长、历史名人数智人“有趣的灵魂”——搭载了角色扮演能力的大模型场景六:⼤模型+医学科研探索腾讯医学⼤模型腾讯医学⼤模型通⽤数据通⽤数据8000+50+60000+知名专家×互联⽹数据互联⽹线上诊疗、智慧问答、智能导诊、智能预患者全周期健康管理产⽣的数据,包括物联⽹设以业务流程为驱动的信息化→以知识、模型、算法为驱动的诊疗新范式场景六:⼤模型+⾦融科研探索自--------研报摘要与⽣成自--------研报摘要与⽣成投资顾问投资顾问宏观研究行业研究宏观研究行业研究投资策略查询投资策略查询投资产品查询…金融行业大模型场景七-智能图像创作-智能⽂⽣图&智能图⽣图智能⽂⽣图智能图⽣图⽔彩画⽂⽣图标准版核⼼能⼒介绍核⼼能⼒介绍教育⾏业⼤模型核⼼能⼒口语陪练口语陪练能力一:英语口语陪练大模型扮演口语老师的角色,牵引学生等英语学习者围绕特定主题或课文内容,进行英语的对话练习。为学生提供低成本易获取的英语口语练习学伴,提升英文表达能力教案生成能力二:教案生成教案生成智能生成符合教学设计语言描述和章节要求的教案内容。支持遵循指令生成章节篇章要求,生成内容丰富、结构严谨的教案内容,有效提升教师备课效率能力三:行政知识问答行政类文档素材的知识问答。支持导入私域行政类文档素材(如政策约束条件、事务处理流程、平台/软件操作指引等),大模型理解用户实际意图,结合知识库内容回答相应问题。提高行政知识解答咨询的效率,减轻人力压力核⼼能⼒⼀:英语⼝语陪练核⼼能⼒⼀:英语⼝语陪练功能项输入讨论的主题和角色说明,大模型牵引用户围绕特定主题进行英语对话练习,在对话过程中,根据对话历史和最近一句模型从语法正确性和内容合理性等方面对用户的回复进行评价难度的设置与调节按照指定的学段的难度要求设定模型输出的预计难度,并支持在保持相同语义的情况下,增对于模型与用户完成一段对话后,对于会话过程中用户的语言组织、语法、用词等方面进行分析核⼼能⼒⼀:英语⼝语陪练达低核⼼能⼒⼆:教案⽣成-能⼒展⽰核⼼能⼒⼆:教案⽣成-功能列表功能项支持根据教学要求,针对学情信息和地域特色等因素对教案全篇或部分章节内容进行润核⼼能⼒⼆:教案⽣成能⼒-当前版本亮点表现在初中阶段我们已经学会了两个重要的能量转化:①把机械能转化为电中照明用电、家用电器等都是由发电厂提供的,同学们有没有去过电厂呢?一个典型的火力发蒸汽推动汽轮机旋转,最后带动发电机发电。现在,随着科技的发展,越来越多的新能源被人并加以开发利用,发电的方式越来越多样化了。各种各样的发电方式和家用电器给人们解:①若要了解夏热镇居民日平均用水量,只对个别居民进行调查或对所有居民进行调查都是的;对于②,对所有运动员进行调查也是不合理的核⼼能⼒⼆:教案⽣成能⼒-当前版本亮点表现性仔细观察后你们发现什么了吗?这些汽车大多都装了玻璃瓶吗?同混合物有很多种类如:悬浊液、乳浊液、溶液等。除了这两种不均一的混合物以外,还有【活动二】分别取厨房里的食盐、蔗糖、食用油加入水中充分振荡。实验[学生讨论]学生回答后教师播放实验视频:氯化钠、硝酸钾、硫酸铜在):家想想玻璃仪器洗净的标准是什么呢?是不是能继续溶解洗涤剂呢?类似这样通过不断加入溶剂量、溶解、装瓶存放3.生活中处处充满化学,下列各组化学知识的总结完全正确的一组是3.⽰范实验:教师示范如何进行判核⼼能⼒⼆:教案⽣成-算法迭代规划持题目生成等细节内容力度领先核⼼能⼒三:⾏政知识问答核⼼能⼒三:⾏政知识问答应⽤配置测试及发布体验知识管理应⽤配置测试及发布体验知识管理核⼼能⼒三:⾏政知识问答功能项知识库管理知识解析知识问答知识围栏对于超出知识库范围的内容,大模型按照指产品优势说明产品优势说明从通⽤模型,到聚焦业务细分场景理解的⾏业⼤模型⾏业⼤模型的特点•加入大量行业的无监督/有监督的数据,降低落•融入大量从应用场景积累而来的领域知识,提升执行行业任务的能力⽆监督:近百B数据应⽤层⽆监督:近百B数据应⽤层层Maas⽆监督:数百B数据层Maas⽆监督:数百B数据通⽤⼤模型通⽤⼤模型通⽤⼤模型通⽤⼤模型⾏业⼤模型与混元的定位差异混元⼤模型定位在基础大模型的基础上面向特定行业的能力需求优化模型优势:腾讯云教育⾏业⼤语⾔模型研发流程腾讯云教育⾏业⼤语⾔模型:全流程数据驱动的模型训练强化学习增强的教育行业对话模型使用客户反馈的问题以及教育专家的建议,针对性迭代优化模型模型能更贴近真实使用场景,强化学习增强的教育行业对话模型使用客户反馈的问题以及教育专家的建议,针对性迭代优化模型模型能更贴近真实使用场景,回答更加专业强化学习教育行业对话模型教育教学问答,教案生成等近百万条有监督数据教育行业对话模型教育教学问答,教案生成等近百万条有监督数据模型具备教育领域模型具备教育领域专业能力教育行业预训练模型中小学及高校教材、期刊论文、课标等,100B+教育行业预训练模型中小学及高校教材、期刊论文、课标等,100B+Token无监督数据模型具备完善的教育领域专业知识体系教育数据增训基础预训练模型不同应用场景下海量高质量无监督数据集基础预训练模型不同应用场景下海量高质量无监督数据集模型具备深厚的通识知识基础预训练模型模型具备深厚的通识知识基础模型优势:腾讯云教育⾏业领域数据沉淀教育⾏业⼤模型从模型的预训练、精调和强化学习阶段加⼊了教育⾏业的数据,从基础知识到领域知识全⽅位优化提升模型在教育领域任务表现,数据范围覆盖以下内容•⽆监督数据:教育领域的海量的⽂本内容•课程标准:义务教育课程标准、普通高中课程标准等•教材:中小学教材、高校教材等•学术文章:学术论文、期刊等•有监督精调:教育⾏业领域数据•教案:小学、初中、高中教案•对话:英文对话,教材的英文对话•题目:初中、高中的各学科题目、编程题目模型优势:从数据构建到模型训练全周期细粒度、体系化的数据构建流程细粒度无监督数据收集和清洗针对特定任务的数据构建方案修改模型结构的增量预训练冻结基础模型的参数,只训练增量参数全参数有监督精调基于DPO的强化学习对齐RAG能⼒优势:基于LLM+RAG框架,做深做透全链路能⼒11知识解析22知识切分112知识检索3知识检索3模型名最大长度测试集准确率腾讯云智能友商Z模型名最大长度测试集准确率腾讯云智能友商Z52.0070.54友商A友商W2.使用向量关键词混合检索策

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论