版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ChatGPT之后,对抗信息熵增ChatGPT的出现不仅引起互联网用户的热切关注,不少企业、创业者们,也在这一概念上倾注了许多心力。那么,ChatGPT会给应用带来哪些可能性?其出现又会带来哪些风险和问题?一起来看看作者的分析与解读。ChatGPT点燃了全球对未来的想象,还让沉寂已久的退休大佬决定重出江湖。是的,就是这两天被刷屏的王慧文。这位曾经美团的核心人物,在社交媒体公开发表宣言。从最初的「必须参与」,到5000万美元带资入组,不在意岗位、薪资和title,求组队。第三天干脆宣布创建一个「全新生命体」,发出AI英雄榜,招募顶级人才。这是ChatGPT传入中国后,最高调的起步公司。它面临的对手是那些国内外科技巨头。微软推出基于ChatGPT的NewBing一天后,谷歌匆忙搬出Bard应战。虽然发布会的演示尴尬出错,市值一夜蒸发超过7000亿元,但微软和谷歌被认为是最有可能将ChatGPT大放光彩的公司。国内公司也纷纷表态,百度、阿里、腾讯等大厂均表示自己在相关方向上有所布局。百度三月即将上线「文心一言」,并接入百度搜索;阿里达摩院正在研发对话机器人,并计划与钉钉等生产力工具深度结合;腾讯虽未透露出具体的应用计划,但也底气十足地表示,自己在大模型(LLM)、机器学习(ML)和自然语言处理(NLP)等领域有着技术储备,进行应用探索。总之,全网都是ChatGPT,被讨论,被神话,被人穷尽溢美之词,被视为是新一轮工业革命。但也有人发出警醒,ChatGPT也在被误解。一、大力出奇迹「我相信大厂声称自己正在布局ChatGPT,除了有保住股价的考虑,肯定也有了解这些前沿技术的团队。但是懂得大致的技术框架,和真正做出来跟ChatGPT效果一样好的东西,是两件事情。」一位AI公司的技术合伙人说。OpenAI对外发布了许多ChatGPT相关的研究性论文,讲述大致的思路,但不会透露技术细节。上述合伙人提醒,「其他公司想要复刻,还是需要自己摸索。而一旦涉及到技术细节的摸索,就要有特别大的投入。」他认为,OpenAI的伟大之处在于,在结果未知的情况下,就敢于下注。「一般公司为了活下去,不得不去考虑投入产出比。」模型的参数越多,意味着训练、调试时间的成倍增加。时间的翻倍,意味着硬件成本、人力成本的翻倍。据《财富》杂志报道,2022年,OpenAI公司的收入预计不足3000万美元,净亏损5.45亿美元。而随着ChatGPT的火爆,可能进一步增加亏损,因为用户每一次调用,就会让OpenAI付出更多的计算资源和带宽成本。本质上,ChatGPT是一个表现令人惊艳的统计语言模型。它的原理是,不断将前文的文本片段作为条件,预测下一个词语出现的概率,选中概率较高的单词,从而生成通顺的语句和段落。ChatGPT的技术——GPT3.5,是由Transformer的技术线发展而来的。而Transformer的第一篇研究文章,其实是由谷歌发布的。2017年6月,谷歌发布论文《Attentionisallyouneed》,推出能调用6500万参数的Transformer模型,并首次将其用于理解人类语言;2018年,谷歌又推出了3亿参数的BERT模型。只不过谷歌走得并不坚定,精力远比OpenAI分散。OpenAI在扩大模型的道路上一路狂奔。GPT-3模型有1750亿个参数,训练的数据量高达5000亿个token(约合3000亿个词)。谷歌则在多种技术路线间摇摆不定,万亿参数的SwitchTransformer并没有得到持续投入;Flan-T5模型一度有着胜过GPT-3的表现,但由于优化进度缓慢,还是由OpenAI先做出了ChatGPT这款产品,将大语言模型的神奇能力展现在我们面前。北京智源人工智能研究院理事张宏江进一步解释,1750亿参数量,约有700G大小,一次训练成本大致花1200万美金。所以,大模型的发展不光是算法上的进步,在数据、算力上的要求也非常巨大。这是一个「大力出奇迹」的故事。AI模型的训练,并不是「一份耕耘,一份收获」的线性逻辑。学术界有一个术语,叫做「涌现」(emergence),参数到了一定的程度,模型效果会迎来质的飞跃。但这个程度,究竟是10亿、100亿、1000亿,在实践之前都无从得知。对于GPT来说,「参数越多,效果越好」只是个「后验性」的结论。OpenAI的孤注一掷,等来了它的「涌现」;而谷歌的多线并行,却也是当时的「局部最优解」。在大语言模型的训练上,「没有人比其他人领先超过两到六个月。」谷歌在相关研究领域硕果累累,并未落后于OpenAI半个身位,但精力分散拖累了它将学术成果落实为具体应用的步伐。二、应用会更容易吗?尽管ChatGPT技术内核的突破有非常高的门槛,但是OpenAI的大模型对产业的影响是绝对深远的。张宏江将其形容为,是从小农经济到大规模生产的一个很重要的变化,就像当初电网的变革一样,此前自己发电,而今天要用AI,不需要再做模型,而是用已有的大模型,以一种服务方式提供给用户。ChatGPT超过Tiktok,成为迄今为止用户最快破亿的应用。积累1亿用户,ChatGPT用了两个月,Tiktok用了九个月,而Instagram则用了两年多。OpenAI的首席执行官SamAltman曾在推特上表示,用户与ChatGPT每次交互的计算成本为「个位数美分」。随着用户破亿,其每月计算成本高达数百万美元。基于此,OpenAI开启了新一轮融资,也在探索如何直接用ChatGPT变现。2月1日,OpenAI正式官宣ChatGPTPlus——ChatGPT的个人付费订阅服务。用户支付20$/月的费用,即可享受高峰时段的优先访问、更快的响应时间,还能优先尝鲜新功能。OpenAI官宣ChatGPTPlustoC的付费制还在试点和探索阶段,toB的付费API调用则是OpenAI现阶段的主要收入来源。2021年底,OpenAI对公众开放了GPT-3的API接口,开发者和相关公司可付费调用,实现自然语言理解和生成的任务。除此之外,OpenAI还开放了Codex、DALL·E的API接口,分别完成自然语言转代码、自然语言转图像的任务。路透社的数据显示,OpenAI2022年收入达数千万美元,2023与2024的预计年收入分别为2亿美元和10亿美元。OpenAIAPI调用价格一个大模型,即使像ChatGPT一般有惊艳的表现、足够的通用性,也无法用来解决所有问题。从新技术的诞生,到可用的行业产品,再到后续的运营和用户服务,还需要很多下游应用企业结合行业场景来进行微调和开发,形成「整体产品」方案。Jasper就是这样一家基于GPT-3API的生成式AI公司,提供电商、广告、博客等场景下营销文案、种草文案的自动生成服务,以及后续的搜索引擎优化工具。2022年,Jasper募资1.25亿美元,估值达15亿美元。再比如Notion,接入GPT-3API后,在文档工具中实现了自动续写、翻译、语法检查等功能。即便是基于垂直行业的语料库对模型进行微调,也需要不小的研发成本:GPT-3的每一次升级和迭代,这些下游企业也要跟进调整,需要一定的财力支撑。国内关于ChatGPT概念的不少公司也拿到投资,而且类似文本生成、图像生成、音频生成、视频生成、虚拟人、元宇宙等场景在中国的落地能力,也许会跟海外同步,甚至更快。不过,目前的大模型,更多偏向于单点式的应用,优化生产环节中的某一个小问题,并未带动整个工作流的革新。第一次工业革命,蒸汽机实现了机器替代人工;第二次工业革命,电力技术驱动了规模化生产。之所以能够被称之为「工业革命」,都是因为技术为生产力带来了质的提升。目前来看,AI原生产品还没有能够大范围囊括某一领域的工作流,并且提供完整解决方案。三、冲击会抵达哪里?如同过去所有新的生产力工具一样,ChatGPT问世以来,关于它会冲击哪些行业的讨论不绝于耳。作为当今最为先进「统计语言模型」,ChatGPT在问答和对话上的表现出色。它能够模仿人类的交互方式,提供和整合信息,从而辅助创意和决策。ChatGPT有效缩短了「信息→决策」的路径,受到其影响最大的,是与「满足信息需求」有关的生意,尤其是帮助「人找信息」的生意。其中无法回避的,首当其冲就是搜索引擎。因为很多人认定,基于ChatGPT有可能诞生出比Google更出色的搜索引擎。ChatGPT已经明确回答,它不会替代搜索引擎。实际上,比起功能替代,未来的信息搜索应当是两者的结合。ChatGPT的优势在于,它可以综合生成更为完整、拿来即用的答案,还可以通过多轮对话回答后续问题,但我们无法忽视它的硬伤——真实性和逻辑性问题。首先,ChatGPT生成的答案中难以避免地出现事实性错误。按照既定的语言模型和规则,ChatGPT可以生成相应的文本,却无法自查自纠;且生成的序列越长,出现错误引用的概率也会随之增加。这也就是为什么谷歌Bard言之凿凿地说詹姆斯·韦布空间望远镜拍摄了太阳系以外的行星的第一批照片(实际并非如此),微软NewBing进行GAP的财报分析时引用了许多错误数据。其次,ChatGPT虽然很少在语法上犯错,但它在推理(reasoning)任务上的表现不够令人满意,颇有种「数学是语文老师教的」感觉。至少在目前,我们无法指望它能够通晓逻辑、厘清事实。而它通过对话喂给我们的唯一答案,也限制了我们从多处来源交叉验证信息的能力。朱啸虎就提出警醒,ChatGPT最大的风险是在网上创造出巨量的似是而非的内容,那以后就不仅仅是「物理学不存在了」,如何判断信息的真实性越来越难,熵爆炸式增长。实际上,较为理想的产品形态是,由ChatGPT精选优质信源,拼接为完整答案,并给出引用来源供我们核实。或者在搜索结果页面的基础上,由ChatGPT来总结要点。除了微软Bing外,初创公司Perplexity也尝试结合ChatGPT和搜索引擎,做出更智能的信息搜索工具。Perplexity的结果展示,包括三个部分:Perplexity(生成的直接答案)、Sources(引用来源)、Related(相关问题)。你还可以在前文的基础上进行追问,获得更聚焦的信息增量。Perplexity产品界面此类信息搜索产品,若想提供好的使用体验,也需要ChatGPT在未来能够做到「知之为知之,不知为不知」。否则,甄别错误信息
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 延安大学西安创新学院《大学计算机基础》2021-2022学年第一学期期末试卷
- 烟台理工学院《中国古代文学史》2023-2024学年第一学期期末试卷
- 许昌学院《移动游戏开发实验》2023-2024学年第一学期期末试卷
- 许昌学院《大学物理》2021-2022学年第一学期期末试卷
- 知识产权与创新教育计划
- 信阳师范大学《网站前台技术实验》2021-2022学年第一学期期末试卷
- 信阳师范大学《数据结构》2021-2022学年第一学期期末试卷
- 信阳师范大学《电动力学》2021-2022学年第一学期期末试卷
- 徐州工程学院《近代物理实验》2023-2024学年第一学期期末试卷
- 年度财务审计筹备计划
- 医院护理培训课件:《护理科研》
- 中石化《炼油工艺防腐蚀管理规定》实施细则(第二版)
- 江西玉山红岭矿区饰面用花岗岩详查
- 隔离基本知识
- 中兽医-诊法课件
- 中建钢-混凝土组合简支梁施工方案
- 小学校长年终工作总结汇报
- 2022年北京市公务员考试申论真题及参考答案
- 互动墙施工方案
- 国际经济与贸易-我国五金制品出口贸易现状、问题及对策
- ASME B16.5-16.47法兰尺寸对照表
评论
0/150
提交评论