下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
锚定中国版ChatGPT-百度底气何来锚定中国版ChatGPT,百度底气何来锚定中国版ChatGPT-百度底气何来全文共4页,当前为第1页。过去两个多月,“狂飙”,是ChatGPT的常态。
这个诞生于美国AI研究机构OpenAI的人工智能(AI)聊天机器人,不仅持续霸榜科技头条,更一举成为互联网史上用户增速最快的消费级应用:仅2个月,“日活”破亿。
国内各界持续展开了一场围绕ChatGPT的“话题地震”,关于中国版ChatGPT何时到来的讨论也甚嚣尘上。
在数十家宣称进ChatGPT的企业中,大多数都对打造类ChatGPT产品的表述语焉不详,但有一家例外——2月7日,百度官宣即将上线大模型新项目,并定名为“文心一言”(英文名:ERNIEBot)。
约定了近期、取好了名字,再加上此前在AI底层技术领域的积累,百度因此也被认为最有希望率先推出中国领先大语言模型的企业。
新项目之约就在目下,不日即可见分晓。在如此短时间内站出来,百度底气何来?
IDC:百度文心大模型处在第一梯队
业界共识是,ChatGPT的能力和表现,离不开大模型的支持。
在此前的相关采访中,中科院自动化研究所研究员王金桥告诉《中国科学报》,ChatGPT背后主要基于三大技术突破,首要得益于大规模预训练语言模型GPT3.5的支持,其后才依次是多任务实现统一编码、人类反馈的强化学习(RLHF)。
也就是说,大模型是生成式AI产品的底座,其上才是基于技术和工程的高效实现。更直白一点,假如没有OpenAI对大模型的长期投入,就不会诞生ChatGPT这样的应用。
百度“恰好”拥有深厚的大模型积淀。近日,国际权威咨询机构IDC发布《2022中国大模型发展白皮书》,提出了行业首个大模型评估框架。该框架基于模型能力、工具平台能力等6个维度的11项指标,评估各厂商大模型的水平。
IDC评估结果显示,百度旗下文心大模型在市场格局中处于第一梯队,产品能力、生态能力、应用能力等悉数领先,并具有产业级、知识增强两大特色。
IDC指出,文心大模型呈现出较强技术实力和平台积累,并认为“文心大模型+深度学习平台”的组合创造了AI研发应用新范式,能满足市场大规模落地需求;同时,背靠海量知识和丰富应用场景,百度目前已构建起一套“大模型+工具平台+产品与社区”的三层体系,形成了支撑大模型产业落地的关键路径。
IDC中国副总裁兼首席分析师武连峰认为,目前的文心大模型,能为百度即将发布的大语言模型“文心一言”提供强大的技术支持。
做大语言模型,百度并非从零开始
罗马不是一天建成的。百度对大模型的投入,要追溯到2019年。
2019年3月,百度率先发布中国首个正式开放的预训练模型ERNIE1.0,开启了中国大模型的修炼进化之门;2020年,百度开始将文心大模型应用到搜索业务;此后两年两次升级,到2021年7月,百度百亿参数规模的知识增强型预训练模型ERNIE3.0问世,这是当时业界首次在百亿级预训练模型中引入大规模知识图谱;当年12月,百度联合鹏城实验室打造了参数规模达2600亿的“鹏城-百度·文心”,成为全球首个知识增强千亿大模型,也是当时全球最大中文的单体模型。
如果说这之前的积累都在高高在上技术端,那随后的2022年,百度开始寻求让大模型“接地气”。
2022年,百度在业内首次提出行业大模型的思路,力图帮千行百业化繁为简地享受AI带来的技术红利,推动大模型向“产业级”进化。
通过与多家企业、机构联手,百度在2022年研发了多款融合行业数据、知识以及专家经验的行业大模型。如百度联合CCTV-电影频道,发布了业内首个影视行业“智感超清大模型”——电影频道-百度•文心,它每天可修复28.5万帧“老镜头”,一举解决了绝大部分画面的修复问题。即便是需要人工进一步精修,修复速度也能提升3~4倍。
诸如“智感超清大模型”这样的行业大模型,截至2022年11月,百度已累计发布了11个,涵盖工业、能源、金融、航天等领域。
从这组数据也可以看出,国内并非没有“能打”的大模型,只是在发展路径上选择了不锚定中国版ChatGPT-百度底气何来全文共4页,当前为第2页。同的道路。特别是,百度不仅具备大模型所需的算力、数据和算法,还构建了自下而上的“芯片—框架—模型—应用”四层技术栈,围绕AI技术落地应用夯基打桩。
这也正是百度打造大语言模型“文心一言”的底气。归根结底,ChatGPT也只是基于自然语言理解的维度提供生成式AI文本,这对于拥有技术和工具平台的百度而言,是一个“如何作为”的问题。换句话说,经过多年技术积累和发展,百度已形成能培育大语言模型产品的肥沃土壤。
中小参与者该如何“上车”?
最新信息显示,在资本的疯狂追逐下,诞生了ChatGPT的OpenAI目前估值已达290亿美元,成为全球目前估值最高的独角兽。
尽管还未形成清晰的商业模式,ChatGPT的爆火仍然明白无误地提示,生成式AI(AIGC)所勾画的产业机会充满想象力。
但也应该看到,ChatGPT的成功,来源于背后十几年的积累——从大规模预训练语言模型GPT2开始,OpenAI就开始集中攻关生成式模型,再加上海量的互联网数据以及40多个团队长年对模型进行反馈的强化学习,才诞生了ChatGPT。
这看似“简单”的积累,成本令人咋舌。有研究估测,训练1750亿参数语言大模型GPT-3,需要上万个CPU/GPU24小时不间断输入数据,所需能耗相当于开车往返地球和月球,一次运算就要花费450万美元。
这反映了一个冰冷的事实:大模型的技术特点决定了其高昂的研发门槛、持续的资金消耗和复杂的AI基座建构,这对于中小型企事业实体而言并不友好。换言之,大模型天然是科技巨头押注的竞技场。
事实也正如此,时下的主流大模型多是由科技巨头以及少数研究机构掌握。
面对时代热潮,中小参与者该如何“上车”?
开放“云上共享”可能是个好消息。在最近关于大语言模型“文心一言”的官方发布中,百度集团执行副总裁、百度智能云事业群总裁沈抖表示:“文心一言的能力将通过百度智能云率先在内容和信息相关的行业和场景落地。”
锚定中国版ChatGPT-百度底气何来全文共4页,当前为第3页。连日来,文心一言已经受到诸多知名企业关注,据了解,目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的近300家头部企业宣布加入百度“文心一言”生态。百度也称,在文心一言发布后,将宣布“生态伙伴计划”,全面支持生态上下游共同加快类ChatGPT走向千百行业的脚步。
在《2022中国大模型发展白皮书》中,IDC也表示,大模型在推进产业智能化升级中已表现出巨大潜力,企业应该尽早关注。
“各行业技术买家都应该尽早拥抱大模型。”IDC建议,行业用户与头部供应厂商进行联合,不论是在品牌效应还是技术发展上都可能会
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度关于解除企业合规审查律师代理协议书2篇
- 二零二五年度高科技温室大棚出租服务协议3篇
- 2025年度文化公司股份转让协议书范本3篇
- 二零二五年度租赁合同租赁物租赁期满续租条件协议范本
- 二零二五年度2025年商业地产租赁管理服务合同3篇
- 2025年度员工股权激励与公司员工福利待遇提升的专项合同3篇
- 二零二五年度太阳能光伏系统定期检修与维修合同3篇
- 2025年度养殖场地承包与农业废弃物资源化利用合作协议3篇
- 二零二五年度竞业禁止协议期限及竞业限制解除程序3篇
- 二零二五年度回迁房更名与教育资源共享合同3篇
- 教师工作职责培训课件建立良好的教师与学生关系
- 品管部年度工作总结
- 胃肠外科病人围手术期营养管理专家共识护理课件
- 2024届高考语文复习:小说叙述特色专题复习 课件
- 四川省普通高中2024届高三上学期学业水平考试数学试题(解析版)
- 石油钻井机械设备故障预防与维护保养范本
- 浙江省温州市2023-2024学年七年级上学期期末数学试卷(含答案)
- 【全国最火爆的团建项目】旱地冰壶(拓展训练服务综合供应平台)
- 北京市西城区2023-2024学年五年级上学期期末数学试卷
- 工程结算课件
- CNAS-CL02-A001:2023 医学实验室质量和能力认可准则的应用要求
评论
0/150
提交评论