架构师特刊:天工开物AIGC_第1页
架构师特刊:天工开物AIGC_第2页
架构师特刊:天工开物AIGC_第3页
架构师特刊:天工开物AIGC_第4页
架构师特刊:天工开物AIGC_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CONTENTS/

目录热点

|Hot用AIGC写2023高考语文作文,结果如何?程序员越“老”就越看不上AI辅助编程工具?Stack

Overflow

2023开发者调查AI特别报告ChatGPT正式进入车载系统:奔驰首测AI语音助手,可进行复杂对话谷歌警告自家员工:不要使用Bard生成的代码微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4训练,实力碾压当前最强开源模型AIGC领域最大收购:Databricks花费13亿美元买下只有15名研发的小公司!专题访谈

|Interview实访用人单位:Prompt工程师真是低门槛“香饽饽”?神器还是垃圾?那些用AIGC编程的人,实践得怎么样了AI大模型竞争白热化,算力优化才是“超车点”?AIGC重构智能客服,能否淘到大模型时代的第一桶金?要想用好GPT,我们必须跑得比“黑客”更快探索大模型智能:众安保险基于AIGC的应用实践推荐文章

|ArticleGitHub

Copilot:做出一个划时代的产品,只需要6个人大语言模型进化之谜:涌现现象的挑战与争议编程已死,AI当立?教授公开“唱反调”:AI还帮不了程序员LangChain:2023年最潮大语言模型Web开发框架视频推荐

|Video本月,这些视频值得一看!架构师特刊:天工开物AIGC2023

07

月刊本期主编

蔡芳芳流程编辑

丁晓昀发行人

霍泰稳反馈

feedback@商务合作

hezuo@内容合作

editors@InfoQ架构师特刊:天工开物AIGC卷首语史学家把十六、十七世纪的中国称为“天崩地解”的时代,社会经济关系、工农业内部结构发生变化,科学技术快速发展,因此,民间诞生了《天工开物》、《本草纲目》这样的奇书。三百余年过去了,我们再一次来到了科学技术重构社会经济关系的拐点——AIGC,这个最有想象力的词正在以巨大的影响力,渗透到各行各业。在这样的背景下,为了给大家带来经得住“拷问”的高质量内容,InfoQ发起了《天工开物AIGC》架构师特刊。在内容设计方面,我们决定从“水面上”、“水面下”两个维度着手。在“水面上”的部分,我们整理AIGC领域近期的热点新闻和测评,比如ChatGPT进入车载系统的消息、Google等大厂对AIGC辅助开发的态度,希望借此最大限度地保证你的知情权。或许当下所处的行业、所任职的岗位并未受到AIGC太猛烈的冲击,但中立的、实时的内容报道,可以保证你时刻观测AIGC的最新行业进展,在变革到来之际早做准备。在“水面下”的部分,我们更注重弥合信息差,击破信息墙。近期有很多企业家在组织企业团队做调研,也有技术专家、产品专家远赴硅谷走近OpenAI,建立了对AIGC更加深度的认知。我们借Prompt工程师的发展前景、AIGC辅助编程实践、AIGC大模型算力优化、AIGC重构智能客服等几个维度,联系相关企业、负责人,做了深度访谈,希望有条理地、尽可能地把行业第一手信息同步给更多的读者。从实际访谈、调查结果来看,各行业对AIGC的理解和实践是超乎想象的,从去年12月,InfoQ于国内第一次报道ChatGPT爆火至今,短短七个月,很多研发团队已经积累了成熟的Prompt方法论,在在线设计、在线文档、金融等领域做出了诸多产品研发尝试,甚至研发团队已经非常习惯Copilot的辅助。与过往的元宇宙、Web3相比,AIGC的影响更1卷首语为深远,变革更为迅速。动作最为迅速的企业,其AIGC应用已经发布上线;Prompt工程师岗位已经完成JD设计,并面向社会开始招聘。此外,我们特别发起了四期直播,针对以上话题,邀请了行业十余位有实操经验的技术高管、骨干圆桌讨论,超过三十万人在InfoQ视频号观看了这些直播。直播的回放我们一并附在本期架构师特刊中,以飨读者。这期特刊包含的内容很多,但我们不想给大家制造焦虑。信息的透明与同步,带来的应该是真正的平和。我们希望在这个信息爆炸的时代,去伪存真,通过经过调查的内容,给你带来足够的信息增量,有足够的参考价值。帮助你更便捷地享受这一波科技红利,更大程度地促成技术普惠。2InfoQ架构师特刊:天工开物AIGC用AIGC写2023高考语文作文,结果如何?作者

王一鹏一年一度高考时间,令众人关注的语文考试作文题已经公开。那么,如果命令AIGC来完成今年的作文考试,AI大概能得多少分呢?为了完成这个测试,我们选择了文心一言、讯飞星火认知大模型、通义千问、ChatGPT来分别应对,作文题选用2023全国甲卷作文题,题目:阅读下面的材料,根据要求写作。人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。这句话引发了你怎样的联想与思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。3热点

|

Hot为此我们特别邀请了一位教龄35年以上的资深高中语文教师聂文革老师,来给各篇作文打分,每篇作文的评分放在文章下方,老师的总结性评语放在文末。需要特别指出的是,作文评分本来就有主观因素,且高考作文的评判标准与寻常文章又有不同,本次“作文大赛”并非正式评测,评测结果也不能代表各大模型本身的能力素质,仅供大家参考。下面开始。作文一:时间的主人及其悖论作者:文心一言时间,是宇宙中最为普遍的公平,无差别地赋予每一个人以生命,使之在有限的尺度内创造与体验。然而,人们对于时间的理解和运用却千差万别,有人视时间为宝库,有人视其为仆人。对此,我深感思考的必要,欲探讨我们应如何对待时间这一最珍贵的礼物。在技术的照耀下,我们得以更深入地解读时间。古人云“光阴似箭,日月如梭”,时间的流逝在技术的辅助下,变得清晰可见。曾经,人们通过日晷、沙漏来感知时间,如今,我们借助卫星导航、原子钟等技术精确到秒的毫厘之间。技术的发展使我们更能丈量时间,从而更好地管理我们的生活。然而,技术并未完全使我们的生活摆脱时间的束缚,反而使人在某种程度上成为其奴隶。古人云“逝者如斯夫,不舍昼夜”,时间的无情在技术的洪流中似乎得到了强化。我们陷入了一种时间的悖论,一方面,我们通过技术得以更深入地理解时间,另一方面,我们也因技术而更加受制于时间。对此,我想说的是:我们不应让技术成为时间的帮凶,而应成为我们驾驭时间的利器。我们不能让时间的洪流冲垮我们,反而应利用它来发展我们的能力。诸如司马迁、贝多芬等伟大的人物,他们并未因时间的无情而退缩,反而因时间的磨砺而更加坚韧。他们用时间来锻造自我,使自己成为时间的胜者。此外,我们还应学会欣赏时间的美。正如诗人徐志摩所说:“你来或者不来,花都4InfoQ架构师特刊:天工开物AIGC会为你开放。”我们应该像花那样,静静地绽放,欣赏时间的赠礼。我们应在时间的赛道上奔跑,同时欣赏沿途的风景,体会生活的韵味。不应让时间的紧迫性遮蔽了我们对生活的热爱和对时间的敬畏。在此,我提倡一种“慢生活”,即在不忽视时间流逝的前提下,放慢生活的节奏,去体验生活的每一个瞬间。正如卡夫卡所言:“我们应该感恩我们在地球上的每一秒。”每一秒都是生命的一部分,都值得我们去珍视和体验。然而,慢生活并不意味着对时间的浪费或者对生活的消极态度。相反,它是一种对生活的深度参与和积极体验。它让人能够在繁忙的生活中找到片刻的宁静,去思考人生的意义和价值。在这个快速发展的世界中,这样的片刻宁静也许更能让我们找回内心的自我和方向。总的来说,我们应当成为时间的主人,而非仆人。我们应当利用技术来更好地理解时间,但不应被时间所驱使。我们应该在快节奏的生活中找到时间留下的美好瞬间,去享受生活而不是被生活所驱使。只有这样,我们才能真正地掌控时间,而不是被时间所控制。老师评分(60分制):50分作文二:掌控时间,做自己的主人作者:讯飞星火认知大模型随着时代的发展,科技的进步,人们的生活水平不断提高,但与此同时,一些新的问题也随之而来。比如:现在的学生因为要完成老师布置的大量作业而熬夜,导致第二天上课时无精打采;上班族因工作繁忙,经常加班加点,没有充足的睡眠而导致身体抵抗力下降,甚至生病......这些都是由于我们没有掌控好自己的时间。我们应该掌控好自己的时间,做自己的主人。“一寸光阴一寸金,寸金难买寸光阴。”这句话说得一点也没错。时间是非常珍贵的,就像沙漏里的沙子一样,稍不留神就会流走。鲁迅先生说过:“时间就像海绵里的水,只要愿挤总还是有的。”是啊!只要我们愿意去挤,时间总是会有的。可是有的人5热点

|

Hot却把时间当作金钱来浪费,他们整天无所事事,不知道该做些什么,最后只会落得个一事无成、白白浪费掉自己宝贵的时间的下场。那么我们应该怎样才能更好地掌控我们的时间呢?首先,我们要学会合理地安排和规划自己的时间。每天早上起来后,先列出今天要完成的任务,然后再根据任务的轻重缓急来确定每件事情所需要的时间。在做事情的时候,要一心一意地把这件事情做好,不要一会儿做这件事,一会儿又做那件事,最后什么也没有做好。其次,我们还要学会珍惜时间。不要以为时间很长,其实它是很短暂的。如果我们把每一天都过得充实有意义的话,那么一年的时间就会很快过去。所以我们要珍惜时间,不要虚度年华。最后,也是最重要的一点就是要有计划、有目的地去学习知识、掌握技能。只有不断地学习和积累才能使我们更加聪明、更加有能力。当然了,要想做到掌控好自己的时间并不是一件容易的事情。它需要我们付出很大的努力和汗水,需要我们克服各种各样的困难和挑战。但是只要我们坚持下去,相信我们一定能够做到的!让我们一起掌控好自己的时间吧!让我们成为时间的主人!让我们用我们的勤奋和智慧去创造一个更加美好的未来!老师评分(60分制):48分作文三:被技术控制的时间作者:通义千问技术的发展让人们可以更加精准地掌控时间,这原本是一件令人欣喜的事情,但是,有些人却因此成为了时间的奴隶。在现代社会中,人们越来越依赖各种智能设备来帮助自己管理时间,如智能手表、智能手环、时间管理软件等等。这些设备可以帮助人们监测自己的运动量、睡眠质量、饮食健康等各个方面,同时也可以提供诸如提醒、计时、日程安排等多种功能,让人们可以更加高效地利用时间。然而,这种便利的技术也会带来一些负面的影响。很多人开始沉迷于各种智能设备,6InfoQ架构师特刊:天工开物AIGC甚至成为了它们的奴隶。他们不断地查看手表、手环上的时间,生怕错过了任何一个重要的事情,甚至连睡觉都要把手机放在身边,生怕错过了任何一个电话或者短信。这样的生活方式不仅让人感到疲惫不堪,而且也会严重地影响个人的健康和心理健康。更重要的是,这种依赖智能设备的行为也会让人变得越来越懒惰。人们开始变得不愿意去思考、不愿意去行动,而是完全依赖于设备的提醒和帮助。这样一来,人们就失去了自我管理的能力,也失去了对时间的掌控力。因此,我们必须认识到技术发展所带来的负面影响,并且努力避免成为时间的奴隶。我们需要学会自我管理和自我控制,合理地利用各种技术工具来帮助自己提高效率,而不是完全被它们所控制。同时,我们也需要保持独立思考和行动的能力,不断探索和追求自己的梦想和目标,而不是成为时间的奴隶。老师评分(60分制):52分作文四:时间的掌控与被掌控作者:ChatGPT时间是伟大的创造者,也是无情的裁判。随着科技的不断发展,人们对时间的掌控力越来越强,但也有人在这个过程中成了时间的仆人。本文将从时间的掌控与被掌控两个方面展开探讨,旨在引发读者对时间的思考。一、时间的掌控人类历史上,时间的掌控一直是人类追求的目标之一。古代的日晷、水钟,现代的钟表、手机等工具,都为人们提供了更加精准的时间信息。在这个信息爆炸的时代,时间管理也成为了人们追求高效、优质生活的必备技能之一。人们通过各种时间管理方法,如番茄工作法、GTD等,来更好地利用时间,实现自己的目标。在现代社会,时间的掌控不仅仅是个人的需要,也是企业、组织的需要。时间不仅是金钱,更是效率。企业通过时间管理,提高生产效率,降低成本,增加利润。组织通过时间管理,提高员工的工作效率和生产力,实现自己的战略目标。在这个过程中,时间成为了人们的朋友,帮助人们更好地实现自己的目标。7热点

|

Hot二、时间的被掌控然而,随着科技的发展,人们的生活越来越被时间所掌控。社交网络、即时通讯工具等,让人们无时不刻地处于“在线”状态,随时随地接受信息和任务,人们的自由时间越来越少。特别是在全球化的时代,人们需要面对不同时区、不同文化的人们,需要不断地调整自己的生活节奏,这使得人们的生活更加被动。此外,一些新兴行业也让人们更加被时间所掌控。比如网约车司机、外卖配送员等,他们需要随时待命,承担着不确定的工作量和工作时间。在他们看来,时间不再是自己的,而是被工作所占据。这些人们的工作,虽然带来了一定的经济收益,但同时也剥夺了他们自由支配时间的权利。三、时间的启示时间的掌控与被掌控,是人们面临的一个共同问题。我们需要更好地掌控时间,实现自己的目标,但同时也需要注意不被时间所掌控。我们应该把握好自己的时间,不断提高自己的效率和生产力,实现自己的价值。但是,我们也应该学会放松自己,享受生活,让时间成为我们的伙伴,而不是我们的敌人。在现代社会,人们需要更好地认识时间的价值,明确时间的重要性。我们应该尊重时间,珍惜时间,因为时间是不可逆转的。我们应该用时间去实现自己的梦想和目标,去创造属于自己的价值。总之,时间是人类追求的目标之一,也是人类必须面对的问题。我们需要掌控时间,实现自己的目标,但同时也需要注意不被时间所掌控。只有在这个过程中,我们才能实现自己的梦想和目标,创造属于自己的价值。老师评分(60分制):45分老师整体评语:这四篇作文,均能紧扣材料核心,以时间·科技·人类为话题,结合现实生活的现象,发挥辩证性思维,符合高考作文趋势。第一篇亮点:在时间快与慢的节奏变化中体验生活之美;第二篇亮点:重点提出了一些具体措施,文章实用性强;第三篇8InfoQ架构师特刊:天工开物AIGC针对性极强,有社会意义,作文为时而作,有助于解疑释惑。第四篇结构清晰,思维明确,综合评分为50分,48分,52分,45分。此外,如果从高考应试作文角度考虑,四篇作文的题目中第二篇文章的题目符合要求,其他三篇文题应作修改。当然,关于AIGC,极客邦科技也在努力为大家提供更多的AIGC相关内容,满足大家对于精品资讯、资料、课程的需求。在3月中旬,极客时间一次性发布四门AIGC公开课,其中包括句子互动公司创始人兼CEO李佳芮的《ChatGPT从0到1》、新加坡科研局高级研究员黄佳的《ChatGPT和预训练模型实战课》、优频科技有限公司CTO孙其瑞的《Stable

Diffusion:零基础学会AI绘画》以及NebulaGraph软件工程师古思为的《GitHubCopilot实践课》与此同时,bothub创始人、布奇托网络科技创始人兼CTO徐文浩,在极客时间开设了课程《AI大模型之美》,是「极客时间AIGC未来教育系列课程」之一,聚焦于让大家充分认识、使用OpenAI、Stable

Diffusion等开发工具,实现自主可用的AIGC应用,现已有1.8w人加入学习。珠海太乙人工智能技术合伙人尹会生,则在极客时间开办了《21天AIGC行动营》。都说AIGC会淘汰掉某些岗位,但有许多同学已经在这里率先成为AIGC时代的高效工作者,AIGC变成了他们手中的效率提升工具。6月还将有重磅的AIGC主题训练营与大家见面,聚焦AIGC与企业私域数据结合,开发为企业特别定制的AIGC服务,相信也契合了很多研发小伙伴的实际工作。其他往期InfoQ关于AIGC的部分报道:1.

AIGC,下一个即将爆发的万亿级AI技术风口_技术洞察_技术趋势_大厂实践_InfoQ精选专题2.

极客圆桌派:狂飙的ChatGPT

|

InfoQ《极客有约》_AI_InfoQ中文站_InfoQ精选视频3.

极客圆桌派:ChatGPT点燃AI狂潮

|

InfoQ《极客有约》_AI_InfoQ中文站_InfoQ精选视频4.

我们是如何探索把ChatGPT推到企业级应用的?

|

InfoQ《极客有约》_AI_InfoQ中文站_InfoQ精选视频9热点

|

Hot程序员越“老”就越看不上AI辅助编程工具?StackOverflow2023开发者调查AI特别报告作者

Tina今天,Stack

Overflow正式发布了一年一度的开发者调查结果。今年Stack

Overflow收到了来自185个国家的90,000份回复,这次他们十分关注AI的使用情况。今年AI大火,Stack

Overflow希望了解AI对开发人员的工作方式是否产生了真正的影响,因此对AI的深入调查,是今年特有的。Stack

Overflow产品营销副总裁Joy

Liuzzo表示,该公司将使用开发者的这些回复来塑造自己的AI产品。Stack

Overflow曾公开表示AI是该网站的“大机遇”,“我们现在正在投资AI,我们需要了解开发人员如何看待这项技术,并根据回应情况将其纳入开发人员的工作流程中,”Liuzzo说道。10InfoQ架构师特刊:天工开物AIGC这次调查关于AI使用的亮点有:•

相对于学习编程的人来说,专业人士对AI工具的采用更为缓慢。30%的专业开发人员表示没有采用AI辅助编程工具的计划。•

ChatGPT是最受欢迎的AI搜索工具,被83%的受访者使用,其次是Bing

AI(20%)、WolframAlpha(13%)和GoogleBardAI(10%)。•

GitHub

Copilot是最受欢迎的开发者搜索工具,被55%的受访者使用,其次是Tab-nine(13%)和AWS

CodeWhisperer(5%)。•

与美国、英国和德国的开发人员相比,印度、巴西和波兰的受访者更有可能接受AI工具。专业开发人员信任AI吗?Stack

Overflow发现,很多开发人员已经在使用AI。其中44%的开发人员现在就在他们的开发过程中使用AI工具,26%的人计划很快开始使用。学习编程的人采用人数更多,达到55%,这些早期采用者一旦进入专业开发人员职位,将成为技能娴熟的AI用户。尽管越来越多的开发人员在使用AI工具,但他们使用的种类并不多。Stack

Overflow询问开发人员他们正在使用哪些工具,在今年列出的21个选项中,绝大多数只是使用了两个热门产品:ChatGPT(83%)和GitHubCopilot(56%)。Stack

Overflow还发现,随着经验的增加,开发人员对将AI工具表现得更为冷淡。近40%的拥有超过21年经验的开发人员表示他们不打算使用这些工具或计划使用这些工具。毕竟更有经验的开发人员通常从事更复杂的项目和/或代码结构,AI工具目前无法帮助解决这些问题。11热点

|

Hot而且这些较新的AI技术,现在还处于炒作周期的早期阶段。Stack

Overflow预计,在更广泛地应用之前,开发人员可能还需要更多的时间调整现有的工作流程来适应这些工具。导致AI工具在开发过程中采用速度较慢的另一个因素是专业开发人员对AI工具的准确性不太信任。在使用或计划使用AI工具的人中,只有3%非常信任它们的准确性,而有两倍多的人(6%)非常不信任。虽然多数人(39%)对AI工具有些信任,但这个回应告诉我们AI工具仍需要证明它们的有用性。对于新工具的采用,“信任但要核实”可能是最佳方法。今年一个非常受欢迎的问题是“为什么ChatGPT在数学上不准确?”这个问题涉及到AI工具(特别是那些基于大型12InfoQ架构师特刊:天工开物AIGC语言模型训练的工具)无法理解复杂问题的问题。但实际上,人们在这类问题上也经常出错。另外,在什么地方工作也会对结果造成影响。来自印度、巴西和波兰的专业开发人员最有可能使用或计划在其开发流程中使用AI工具,这些国家的回应率达到70%甚至更高。而英国、法国、美国和德国的开发人员更有可能表示他们不计划使用AI工具(回应率达到36%)。印度和巴西是许多“新”技术人才的来源地,这一趋势可从过去的开发者调查中看出,因此在这些地区更广泛地使用AI工具是有道理的。而欧盟国家和美国的情况比较特殊,因为可以通过最近的新闻推断出GDPR法规对AI进行监管的可能性在增大。法国已经开始调查针对ChatGPT的投诉。在美国,虽然目前还没有相关法规,但一些公司已经开始公布禁止在工作中使用ChatGPT的政策,同时Stack

Overflow和Reddit也公开表示他们将开始收费以限制访问社区数据。无论是准确性问题还是法律规定或工作场所规定,这些因素都使开发人员不敢迅速采用这些AI工具。AI辅助工具的好处Stack

Overflow表示,无论现在的采用情况如何,开发人员对这些AI工具的可能性都持积极态度。调查发现,77%

的受访者对在他们的工作流程中使用AI感到满意,70%的受访者今年已经在使用或计划使用AI编码工具。在实际使用中,与专业开发人员相比,学习编程的人员主要是用AI工具进行调试和获得帮助(68%),并了解代码库(50%)。而专业开发人员最感兴趣的是使用AI工具测试代码(65%)、提交和审查代码(64%),以及使用它们进行部署和监控(61%),以及记录代码或了解代码库(58%)。整体来说,AI工具给开发者带来的好处,主要还是体现在提高生产力和加快学习速度上。13热点

|

Hot根据调查结果来看,在对AI工具有好感的所有开发人员角色中,高级管理人员(63%)与数据科学家和区块链开发人员一起位居榜首。嵌入式应用程序开发人员、桌面/企业开发人员和硬件工程师不太可能使用这些工具,并且将来也不太愿意使用它们。Stack

Overflow希望硬件工程师暂时不要使用人工智能,因为这些工具的准确性方面让人信心不足。Stack

Overflow也在调查中询问了开发人员,明年在工作流程中使用AI工具,是否会跟今年有所不同,72%的人表示或许在编写代码流程中会有所不同,78%的人对使用AI调试代码持相同看法。14InfoQ架构师特刊:天工开物AIGC参考资料https://survey.stackoverflow.co/2023/#aihttps://stackoverflow.co/labs/developer-sentiment-ai-ml/https://stackoverflow.blog/2023/06/13/hype-or-not-developers-have-something-to-say-about-ai//2023/6/13/23759101/stack-overflow-developers-survey-ai-cod-ing-tools-moderators-strike15热点

|

HotChatGPT正式进入车载系统:奔驰首测AI语音助手,可进行复杂对话作者

凌敏AI浪潮下,千行百业实现了新一轮智能化转型。此前,ChatGPT已经开始接入各种各样的企业级应用中,颠覆原有的使用体验。近日,有消息称,ChatGPT正式进入车载系统,为汽车带来进一步智能升级。据外媒报道,6月15日,梅赛德斯-奔驰和微软共同宣布,两家公司正在合作扩大人工智能的使用,计划将ChatGPT整合到车辆的语音控制系统中。据介绍,测试版计划为期三个月,根据从中发现的问题以及车主反馈,梅赛德斯-奔驰公司将会考虑在更深的层次上整合ChatGPT。微软公司发言人介绍称,这也是ChatGPT产品第一次应用在汽车环境中。16InfoQ架构师特刊:天工开物AIGC据悉,这项合作将通过微软的Azure

OpenAI服务为车主带来聊天机器人ChatGPT的体验。梅赛德斯-奔驰表示,从6月16日开始,在美90万辆配备MBUX信息娱乐系统的车辆都可参与测试,使用ChatGPT驱动的语音助手。车主可以通过登录官方应用程序“Mercedes

me”,或在车内使用语音命令“嘿梅赛德斯,我想加入测试计划”,自愿注册参与测试。注册完成后,车主便可以通过车载语音助手访问ChatGPT。对于此次合作,微软指出,车载ChatGPT能支持更动态的对话——不仅可以理解车主的语音命令,还可以进行交互式对话,对话范围可以涵盖地点信息、菜谱、甚至是一些更加复杂的问题,进而让驾驶员的眼睛更专注于路况。与普通的语音助手不同,车载ChatGPT可以处理完整的对话,例如追问,并且能保持对前后文的理解。驾驶员可以提出复杂的问题或进行多轮对话,从语音助手那里收到详细的回复。微软还在与梅赛德斯-奔驰探索ChatGPT的插件生态系统,为第三方服务集成开辟可能性。驾驶员未来有望通过车载系统,就能完成预订餐厅、预定电影票等任务,进一步提高便利性和生产力。17热点

|

Hot谷歌警告自家员工:不要使用Bard生成的代码作者

褚杏娟根据路透社消息,谷歌警告员工不要泄露机密信息或使用其AI聊天机器人生成的代码,包括自己正在全球推广的Bard。知情人士称,谷歌母公司Alphabet已建议员工不要将机密材料输入人工智能聊天机器人,该公司援引了长期保护信息政策。研究人员发现AI可以重现它在训练期间吸收的数据,从而造成泄漏风险。还有知情人士透露,Alphabet提醒其工程师避免直接使用聊天机器人生成的计算机代码。该公司表示Bard会提出不受欢迎的代码建议。问题是可能导致错误程序或复杂、臃肿的软件。与根本不使用AI进行编码相比,开发人员将花费更多时间来修复这些问题。据Insider报道,到2月,谷歌告诉测试Bard的工作人员在发布前不要向Bard提供内部18InfoQ架构师特刊:天工开物AIGC信息。现在谷歌将Bard推广到180多个国家和40种语言。如今,告诫自己的员工不要直接使用Bard生成的代码一事,打破了谷歌声称其聊天机器人可以帮助开发人员提高工作效率的说法。创建者自己由于隐私和安全风险都不使用的话,其他人该怎么相信并使用呢?前不久,谷歌准备在欧盟地区推出Bard,但是由于欧盟隐私数据监管机构提出质疑,谷歌被迫将发布日期向后推迟。爱尔兰数据保护委员会近日指出,谷歌并没有明确说明Bard服务将如何遵守欧盟地区的隐私数据保护规定。参考链接/technology/google-one-ais-biggest-backers-warns-own-staff-about-chatbots-2023-06-15/19热点

|

Hot微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4训练,实力碾压当前最强开源模型作者

核子可乐

褚杏娟Chatbot

Arena等排行榜已经反复证明,数十亿美元支撑起来的ChatGPT仍然是聊天机器人领域无可争辩的王者。而人们只能调用其API,无法私有化部署,无法自己训练调整。因此,大家现在热衷于用开源大模型来构建AI聊天机器人,希望能在性能层面达到甚至超越ChatGPT等专有模型的水平。近期,微软出人意料地发布了一个只有13亿参数但具有大模型推理能力的开源小模型Orca,它使用创新的训练方法,成为首位敢于同专有模型叫板的挑战者。而且,Orca20InfoQ架构师特刊:天工开物AIGC的规模仅是其竞争对手的几十分之一(甚至可能只相当于GPT-4的几百分之一)。令人难以置信的是,Orca在某些场景下甚至表现更好,而且完全碾压迄今为止所谓最强开源模型Vicuna。论文地址:/pdf/2306.02707.pdf那么,Orca究竟是怎么做到的?新的训练方式:巧劲胜于蛮力在说起AI模型训练时,资金投入基本已经成为首要前提。具体来讲,谈到模型中的几十亿参数,这背后的涵义包括:•

光是收集训练数据就要花上几百万美元;•

基础模型的训练还要再花上几百万美元;•

模型的微调也可能花费几十万美元;21热点

|

Hot•

不要说人类反馈强化学习(RLHF)。如果公司单季度收入达不到数十亿美元的量级,这个环节最好碰都别碰。所以说起“大语言模型”的竞逐,其实全世界有资格参与进来的也不过四、五家公司。因此,为了在性能层面跟ChatGPT等大体量专有模型相对抗,研究人员别无选择,只能选择以巧劲破解对方的财力。而在生成式AI领域,所谓的“巧劲”正是“蒸馏”(distillation)。简单来说,蒸馏就是选位优秀的同志,再把它的响应能力作为小模型的学习素材。为什么要这么干?非常简单:ChatGPT虽然拥有数十亿个参数,但只有“少数”参数真正重要。从原理层面来讲:•

我们必须先让模型拥有足够多的参数,才能保证其掌握现实世界中的种种复杂表征。•

这样做的结果就是,大部分模型中的大部分参数始终处于未使用状态。研究人员意识到这个现实问题后,得出了以下结论:假设GPT-4这样的先进模型未来仍须以体量增长作为必要条件,那在拥有了训练得到的大模型之后,能不能再用一个比其小得多的模型简单重现大模型的部分或者全部特性?换句话说,在引导AI模型学习现实情境时,能不能先用大语言模型完成其中最繁重的“模式提取”任务,再让它们作为“老师”指导那些体量较小的模型?答案是可以。蒸馏的过程就是这样一种AI学习方法,以大体量模型为模板训练小体量模型。所以开源社区的最佳AI聊天机器人开发流程基本可以概括为:•

对大语言模型(教师)进行采样,以构建{用户指令,输出}的查询数据集。这里常见的选项当然是ChatGPT。•

接下来,选择一个较小的模型(参数量大约在5亿到150亿之间)作为“学生”。•

学生的任务就是尽量减少自身输出与教师输出间的差异,学习它、模仿它。•

这样,小体量模型就能够掌握教师的风格并输出类似结果,并把训练和运行成本控制在更低的水平。22InfoQ架构师特刊:天工开物AIGC这样新的先进模型就此诞生,且成本仅为大模型的百分之一。听起来不错,但现实世界显然没那么美好。虽然这些模型能够有效学习教师的风格和语言连续性(例如Vicuna或Alpaca),但却往往无法掌握对方的强大推理能力。也就是说,在对复杂任务做出评估时,其表现会远逊于自己的老师。没错,是“远远”逊于。Orca碾压开源模型,赶超ChatGPT现在,大多数开源模型的性能其实被故意夸大了。Vicuna、Alpaca等开源模型的出色性能,可能是研究人员精心挑选的结果。直到现在,它们在推理基准测试上的表现仍一言难尽。例如,虽然Vicuna在衡量复杂任务的基准测试中,已经能在风格和语言连续性方面达到GPT-4的89%左右,可一旦面对七步逻辑推演等挑战,双方的差距就会扩大到令人尴尬的5400%。换句话说,这时GPT-4的性能达到Vicuna的55倍。Orca的研究人员意识到了这个问题,并努力做出了改进。在Big-Bench

Hard上使用零样本提示的性能测试中,括号内的2900%代表Orca相对Vicuna的改进程度。23热点

|

HotOrca在所有任务上的综合表现略好于ChatGPT,但明显落后于GPT-4,比Vicuna高出113%。与AGIEval的结果类似,Vicuna在此基准测试的复杂推理任务上表现不佳。Orca虽然明显优于Vicuna且略优于ChatGPT,但平均性能为49.7%,落后于GPT-4

26%。测试中,Orca在时间序列(时间推理)、导航(遵循导航指令)、彩色物品(识别给定上下文的对象颜色)方面分别优于ChatGPT

102%、3.6%和1.7%。Orca在因果判断任务上表现出色,性能与GPT-4相当,同时超过ChatGPT

4.7%。在检测翻译错误上,Orca和ChatGPT水平差不多。Orca在需要各种知识的任务(例如体育、艺术家、幽默等)方面表现不如ChatGPT,但在电影推荐方面表现更好。在Web

of

Lies测试中,Orca甚至把GPT-4也斩落马下,性能比这套体量百倍于自身的明星模型还高出3%。Vicuna自然也不在话下,但Orca的得分比其高出24.3%。来源:Microsoft(Webofliesexample)令人印象深刻的是,在以上所有任务中,Orca的平均性能已经超越GPT-3.5。这不仅是开源模型的一个新里程碑,同时也稳定将性能保持在Vicuna的两倍以上。虽然在大多数情况下,Orca仍落后于无可争议的王者GPT-4,但这种以小搏大、碾压其他开源同侪并偶尔超越老大哥的表现,究竟是怎么实现的?Orca研究人员做了什么当前小模型通过指令微调来模仿大模型的方式主要存在以下问题:•

指令简单且缺乏多样性。•

收集的数据规模小,任务缺乏多样性。•

模仿信号有限,只能通过老师模型生成的<query、response>进行模仿学习。•

评估标准较弱。用大模型对小模型进行指令调优后的结果一般依靠GPT-4进行自动评估,例如使用GPT-4响应的结果进行指令调优后的模型倾向于生成更长的文本,同时GPT-4在候选响应的顺序上有偏差。24InfoQ架构师特刊:天工开物AIGCOrca的研究人员主要采取了以下两项重要创新举措:1.

解释性训练在Orca之前,Vicuna和Alpaca等模型只能从GPT-4等模型中采样简单的{用户指令,回答}查询来进行蒸馏,借此训练新模型模仿自己的老师:但在Orca这边,研发思路发生了巨大转变。研究人员没有像之前那样简单提取查询,而是引入了第三项约束条件,即系统指令。也就是说,除了用户指令和模型答案之外,微软研究人员又额外添加了一系列指令,旨在对学生模型的行为和思考过程进行建模,如下图所示:这并不难理解:学生不仅需要模仿GPT-4的输出质量,还需要模仿老师的思维过程,从而掌握类似的推理能力。25热点

|

Hot2.

通过中间教学实现渐进式学习截至目前,大多数开源模型只使用一对{学生,教师}素材。但在Orca却有两个老师。首先自然是ChatGPT。作为第一位老师,它负责指导学生模型解决那些不太复杂的查询。之后再经由GPT-4提供更复杂的查询指引,让学生根据之前掌握的知识做进一步学习。这个过程跟人类的学习方式非常相似。我们在学习乘除法之前,先得掌握加减法的诀窍,循序渐进突破一道道难关。而且与单纯使用GPT-4的训练方法比较,渐进式学习的效果确实更胜一筹。结束语目前越来越大、耗能越来越高的发展模式是否将很快走向终点,还有待验证,但如今每周几乎都会出现突破现有游戏规则和技术边界的新成果,大家都在效率方面做了很多努力。从Orca凭借一点小技巧就能碾压众多开源模型来看,我们对于AI技术只能说还知之甚少。而作为已经凭借ChatGPT在市场上占据绝对优势的王者,微软率先出手,再将开源模型升级到新的维度。开源模型或将开启属于自己的新时代。参考链接/@ignacio.de.gregorio.noblejas/orca-microsoft-7c78ca03c80326InfoQ架构师特刊:天工开物AIGCAIGC领域最大收购:Databricks花费13亿美元买下只有15名研发的小公司!作者

Tina核子可乐智能湖仓开发商Databricks正着手以13亿美元收购生成式AI初创公司MosaicML,希望帮助自家客户在数据之上构建和部署AI模型。值得注意的是,Databricks本身也是一家初创公司,成立于2013年,通过多轮融资筹得36亿美元。此次的收购成本当中,包含挽留MosaicML员工的相应支出。大语言模型(LLM)正在AI领域掀起新一波浪潮,它能够理解查询、分析多个数据源并用自然语言给出回应和答案,甚至能够输出编程语言。当然,这些模型也可能产生错误或虚构的答案,而且需要大量GPU资源才能运行。MosaicML的主要业务就是帮助客户在小规模系统上运行模型,并使用自己的数据和非公开数据对模型进行训练和微调。27热点

|

HotDatabricks公司CEO

Ali

Ghodsi表示,“每个组织都应该从AI革命当中受益,并更好地控制数据的使用方式。”今年4月,Databricks公布了其更新之后的开源Dolly大语言模型,标志着公司的AI设施已可用于商业应用,且无需大量GPU资源或者昂贵的API。这款聊天机器人能够响应客户查询,根据Databricks智能湖仓内的数据给出答案。MosaicML的来历MosaicML则创立于2021年,联合创始人分别为担任CEO的Naveen

Rao(前英特尔副总裁兼AI产品事业部总经理)和CTO

Hanling

Tang(前英特尔AI实验室高级总监),员工仅62人,其中研究人员(researchers)约为15名,“与Brain或DeepMind的庞大研究人员队伍相比,我们规模很小”。MosaicML公司目前只公开披露过一轮融资,为6400万美元,其开源大语言模型基于MPT-7B架构,即拥有70亿参数且上下文窗口为6.4万token。NaveenRao与Hanlin

TangMPT-7B和最近发布的MPT-30B目前下载量已经超过330万次。MPT-30B要比MPT-7B更加强大,且性能已经超越初版GPT-3。MosaicML表示,MPT-30B的大小是精心选择的结果,能够轻松部署在单个GPU上——可以在16位精度对应1块A100-80

GB,也可以在8位精度对应1块A100-40

GB。MosaicML公司指出,其他类似的大语言模型(例如Falcon-40B)往往拥有更多参数,因此无法在单个数据中心GPU上提供服务。而一旦需要的GPU超过2个,28InfoQ架构师特刊:天工开物AIGC就会增加推理系统的最低实现成本。MosaicML还特别提到MPT-30B在编程方面表现优异,“这归功于包括大量代码的预训练数据。我们希望这种文本和编程功能的结合使MPT-30B模型成为社区的流行选择。”MosaicML是一家美国公司,在旧金山、纽约、帕洛阿尔托和圣迭戈设有办事处。其客户则包括AI2(艾伦AI研究所)、Generally

Intelligence、Hippocratic

AI、Replit和ScatterLabs。Databricks表示,MosaicML的技术将为客户提供一种简单快速的方式,能够在保留对自身数据的控制、安全保护和所有权的前提下,享受到成本低廉的语言模型服务。29热点

|

Hot与标准方案相比,MosaicML的优化成果将模型训练速度提升了2到7倍,而且能够线性扩展。该公司声称,其数十亿参数的模型在几小时内即可完成训练,远低于一般模型长达数天的训练周期。Naveen

Rao解释道,“我们之所以创办MosaicML,就是希望解决困难的工程和研究问题,帮助每个人更轻松地进行大规模训练。随着近期掀起的生成式AI浪潮,这项工作也成为关注的焦点。我们将与Databricks一道,推动天平向着更有利于大多数人的方向倾斜——我们是志同道合的伙伴,同样肩负让研究人员转型为企业家的使命。”收购意欲何为?根据Naveen

Rao的说法,MosaicML一直致力于降低生成式AI的使用成本,从数千万美元降至数十万美元。生物制药服务公司Syneos

Health的首席信息和数字官Larry

Pickett表示,目前根据专业健康数据训练模型的成本估计为100万至200万美元。分析师表示,这类“特定领域”模型对公司来说可能比ChatGPT更有用,因为它们拥有更多的行业术语和专业知识。但Pickett预计,Syneos

Health通过使用较小的预训练模型,“而不是在OpenAI拥有的整个数据集之上构建”,花费会大大减少。他说,其中一些模型已经在开源库中可用,例如机器学习初创公司HuggingFace提供的库。“并不是每个人、每个应用程序都需要GPT-4,”Krishna说,他指的是OpenAI的大型语言模型。他说,大型语言模型正在针对非常具体的应用进行微调,“到那时,它就会变得非常小,可以嵌入到任何手机中。”但Databricks收购MosaicML的目的却仍然让很多人感到迷惑,Hacker

News上不少网友一致认为Databricks是在炒作,表示通过新闻稿看不明白Databricks要将LLM整合来做什么。虽然现在Databricks称公司的主要技术方向为Lakehouse,但实际上它是由ApacheSpark创建者创立,因此有人认为其护城河和核心价值主张是云中的Apache

Spark,主要是用Spark来处理大规模集群上的数据,其中包括机器学习训练和推理管道,在这种情况下,Databricks整合LLM的价值主张是不够明确的。甚至还有人认为,Databricks不过是在30InfoQ架构师特刊:天工开物AIGC借当前大模型热度进行炒作,MosaicML迟早会被注销掉。另外不得不提的是,Databricks本身成立也仅十年,去年公布年收入刚超过10亿美元。Mosaic上一轮融资的估值为1.36亿美元,无论是以股权还是现金收购,13亿美元的交易价格对Mosaic来说都是一个巨大的飞跃。该交易预计将在第二季度期间完成(截至7月31日)。在

MosaicML

Databricks

,MosaicML的平台将得到支持、扩展和集成。根据Databricks的说法,客户将获得一套统一平台,可以在该平台之上构建、拥有和保护自己的生成式AI模型,并使用自有数据做进一步模型训练。拟议的这项收购案须满足成交惯例,包括遵循相关监管许可。目前可能还有其他生成式AI初创公司在与Databricks的竞争对手们洽谈收购方案。参考链接/blog/mpt-30b/mosaicml?lang=en/articles/databricks-strikes-1-3-billion-deal-for-generative-ai-startup-mo-saicml-fdcefc06/item?id=36478734https://www.latent.space/p/mosaic-mpt-7b#detai31专题访谈

|

Interview实访用人单位:Prompt工程师真是低门槛“香饽饽”?作者

王一鹏15-50k的月薪,另外还有年终奖和其他福利,你所要做的,就是研究、分析、设计在用汉语或英语做输入的情况下,更准确地描述业务想要做的事情,听起来是不是很难以置信?然而这就是真实出现在BOSS直聘上的招聘启事,其岗位名称叫做“Prompt工程师”或“Prompt

Engineer”,于2023年上半年在国内快速兴起,目前已有30家左右的公司在各大平台公开招聘该岗位。在国外,Prompt

Engineer的热度似乎更高,不仅岗位数量更多,而且年薪最高达到了七位数,在全球经济皆不景气的当下,显得独树一帜。可是,由供需主导的人才市场,似乎不太可能出现“头脑发热”症状。在经过一系32InfoQ架构师特刊:天工开物AIGC列研究调查,并与相关招聘单位、企业高管进行深度访谈后,我们发现,以为“Prompt工程师”的入行门槛低,只是一种错觉。当前企业招聘的“Prompt工程师”岗位,实际上不但对应聘者的要求很高,而且极度务实。换句话说,如果你真的成功转型成了一名全职Prompt工程师,那么15k-50k的月薪,不但不浮夸,而且恰如其分。“魔幻”的背后是高门槛与极度务实Prompt工程师的主要工作,是通过带参或不带参的自然语言输入,对预训练大语言模型进行操作,并对输出结果进行调优。可以说,Prompt工程师就是企业或组织,为了将大模型的能力带入生产环境,而特别创造的岗位职能。这一岗位的兴起,与大模型技术本身的成熟直接相关。创客贴是国内头部的平面设计在线平台,目前正在招聘Prompt工程师,其岗位职责和技能要求如下:职责:1.

基于语言模型,设计、开发和完善各种应用程序的AI生成文本提示。2.

监控和分析提示性能,确定改进的领域。3.

负责用于训练垂直领域模型的数据收集方案。4.

优化AI提示生成过程,参与提示词工具开发。5.

协助内容和产品团队了解提示工程。要求和技能:1.

熟悉开源和闭源语言模型。2.

熟练生成高质量提示词的工程技术。3.

具备优秀的需求理解能力和拆解复杂任务的能力。4.

具备一定的计算机知识,如编程语言,机器学习。5.

具备中英文写作能力,有出色的口头和书面沟通能力。6.

有良好的工作习惯,善于归纳和记录工作内容。7.

能够有效与跨职能团队合作。创客贴CTO李晋松这样描述招聘原因:“大模型能力的成熟,就像突然之间,我们手中拥有了一架强大的机器。但机器上的按钮很多,且没有说明书,需要一个同学来探33专题访谈

|

Interview索、归纳、总结其使用方法。”当然,这里只是针对Prompt工程师的招聘需求而谈的,要对大模型的输出结果进行微调,方法并不只有Prompt一种,其完整的概括应该是:1.

全部微调:使用新的数据集对整个模型进行微调,包括预训练的部分和新加的任务特定层。这种方法通常需要大量的数据和计算资源,并且需要更长的训练时间,但能够获得最好的性能。2.

部分微调:只对特定的层或几个层进行微调,通常是模型的最后几层或添加的任务特定层。这种方法通常需要较少的数据和计算资源,训练时间也较短,但性能可能不如全局微调。3.

冻结部分层:将预训练模型的前几层(如BERT的前若干层)冻结,只对后面的层进行微调。这种方法可以减少微调的参数量和计算量,但可能会影响性能。4.

动态掩码微调:对于需要进行序列标注任务的预训练模型,可以使用动态掩码微调的方法,即只对标注序列的位置进行微调,对其他位置的参数进行冻结。这种方法可以减少微调的参数量,提高计算效率。5.

半监督微调:使用少量的标注数据和大量的无标注数据对模型进行微调,以提高性能。这种方法需要使用半监督学习的技术,如自监督学习或基于对抗学习的方法。6.

Prompt工程:更偏向应用与业务,通过修改输入给大模型的提示词,调优输出结果。但前面五种,都需要一定的操作成本,且一般由算法工程师或所谓AIGC工程师来完成,最后一种是在解决大模型从生产到应用的“最后一公里”问题,目前是必备的,当下一般由算法工程师或其他技术角色兼任,或是企业招聘专人负责。大众对Prompt工程师一职印象的分裂,也多半来源于此:从表面看来,Prompt工程师是所有IT行业的工程师角色里,唯一写自然语言的工种,且所负责的事项,也无非是把一项任务表述得更清楚,似乎任何语言表达能力不错的人都可以做到。事实真是如此吗?李晋松向InfoQ举了一个形象的例子:如果有人手动搭建了一个复杂的艺术模型,你能否通过提示词的猜测和微调,在AIGC工具里100%还原该作品?无疑相当困难。34InfoQ架构师特刊:天工开物AIGC这就是Prompt工程师入门的第一个难点:自然语言先天的模糊性。自然语言为了承载文明,兼顾社会价值、历史价值、文化价值……其表意通常是模糊的、泛化的,“词义消岐”常年来就是NLP领域的一个固定科目。而已经习惯了自然语言表述逻辑的我们,要使用自然语言做精确的工程性描述,也比较困难。第二个难点是任何一个场景都有大量的专用术语,普通人用白话很难精确代换。比如在平面设计行业,你至少需要知道伦布朗光、径向、层次等级、Ascender、Descender、互补色……才能较为精确的描述需求,修改Prompt。这导致所谓的Prompt工程师至少应该成为某个领域的业务专家。针对以上两个难点的考察,李晋松在采访中提到,目前招聘企业都非常务实,基本上需要面试者实机演示Prompt输入和输出结果,并对微调过程进行考察。InfoQ同时也采访了珠海太乙人工智能技术合伙人&项目总监、极客时间21天AIGC行动营讲师尹会生,他从另一个角度聊到这个问题:“IT领域大部分岗位的入门难度是逐渐上升的。比如运维工程师,早期是研发工程师兼职转任,熟悉资源、环境就好了,慢慢地,运维工程师要开始会编程语言、脚本语言,比如Shell、Python,门槛开始升高。到了今天,运维工程师的门槛已经相当高,需要了解容器、监控技术等。所以相对来说,现在的Prompt工程师入门门槛,可能是历史最低值,是入行的好时机。”两个角度相结合,我们或许可以得出一个复合结论:Prompt工程师并非一个“麻瓜”可以随便上手的工作,且未来可能越来越难。尹会生同时谈到另外一个思考:当下的Prompt工程师最好来自于技术行业,是某一领域的技术人员。因为Prompt工程师很可能是AI技术专家身旁的“副驾”或合作者,与之协作的都是资深技术人员。如果Prompt工程师本身不懂技术,那么也就无法顺畅协作。Prompt工程师还应该与时俱进,根据InfoQ写作社区的一位算法工程师小伙伴汀的分享:Prompt工程师目前也要关注和解决与大模型相关的风险和安全问题,因此需要了解对

Prompt

Prompt

Active-Prompt

、GraphPrompts、MultimodalCoTPrompting等,其背后是大量的学术论文支撑。35专题访谈

|

Interview图Active-Prompt示意图此外,站在企业的角度,所有受访嘉宾一致同意,Prompt工程师的一大价值,应该是能归纳总结Prompt的相关经验、实践、思路,把项目做成产品、平台和能力,赋能企业。而针对大部分企业的普通工程师而言,这算作是一项进阶能力,明显更为合理。于是,当我们将以上所有要求汇总,得出的岗位画像是这样的:Prompt工程师最好是一个AI领域研发出身,有充足的Prompt实践经验和理论知识,十分了解公司业务和所在行业、能持续学习大模型相关前沿技术,并将其沉淀为团队能力乃至平台、产品的复合型人才。根据极客邦科技双数研究院在2021年对数字化转型进程中的“业务架构师”的研究表明,既懂技术又懂业务并能将二者合二为一的人,往往是行业内最稀缺的人才。岗位变迁:注定流行,但难说长青这一岗位的发展前景,也是广大开发者所关注的问题——甚至比工作难度大、面试通过率低,更令人担心。道理很简单,“Prompt工程师”的发展存在一个悖论:AI的发展,本质上是以劳动力替代为目标的,也就是将越来越多的工作交给机器,以达成企业降本提效的诉求。而Prompt工程师本身是大模型技术在某一发展阶段的特定36InfoQ架构师特刊:天工开物AIGC产物,因受交互方式限制,所以不得不专人专岗,理论上也是AI的替代目标之一。况且对于企业而言,先裁撤数名业务人员,再引入数名Prompt工程师,考虑到薪资水平的差异,人力成本未必会降低。最近技术圈的新闻似乎也在印证这一点:6月13日,阿里云机器学习PAI团队在InfoQ写作社区发文称,推出自研Prompt美化器BeautifulPrompt,服务Stable

Diffusion。其原理是当用户输入了一个极其简单的Prompt,该工具可以将其扩写成一个经过语言模型优化过的、细节描述详细的Prompt,再吐给StableDiffusion。BeautifulPrompt整体架构虽然工具效果还未受到行业内的广泛检验,但可以看出,围绕“Prompt工程师”开展的优化动作早就已经开始了。随着类似工具的不断完善,行业专有大模型的不断推出,“Prompt工程师”未来可能会变成一个纯粹的“蓝领”岗位。当然这并不意味着这一岗位的寿命已经进入倒计时,“开始优化”和“优化成功”,到底还是两个概念。一旦技术的发展对市场产生了结构性影响,那么相关人力岗位的迭代往往是漫长的。以“云计算工程师”为例,该职位伴随着云计算的崛起而出现,高光时期曾登上人37专题访谈

|

Interview社部新兴岗位名单。尽管云计算产业秉持着“云服务应该像自来水一样,让客户对基础设施完全无感”的理念,十数年间持续优化产品体验。可在今日的招聘平台,我们依然能见到“云计算工程师”的招聘启事。另外一个例证来自“数据分析师”。让大数据的能力普惠各行各业,让只有数据科学家才能使用的产品退出舞台,多年来都是众多大数据从业者努力的方向。但经过了二十年的大数据基建和产品研发,“数据分析师”仍然是一个庞大的从业群体。李晋松和尹会生两位专家都赞同“Prompt工程师”会成为AI行业接下来一段时间的常见岗位,相关热度会越来越高。未来,会不会有新技术代替人类优化提示词,人类与AI大模型的交互方式会不会发生改变,还是个未知数。李晋松提到:“技术发展的每一个阶段,都有特定的岗位设计。早期人们甚至需要打字员,现在则不需要。AIGC现阶段的主要交互方式就是Prompt,企业应该大胆地开始招聘,不要因为未来某一天的变化而放弃当下的发展机遇。”两位专家同时默契地指出,即便未来大模型不再需要人工调优Prompt,也只是该岗位的消亡,并不代表对应的工程师会失业。李晋松作为实际的企业招聘者,对此已有规划和安排:“我们更倾向于选择一些在AI技术、产品维度有一定知识储备的同学,假设真的有一天,技术把Prompt工程师这一岗位取缔了,他还可以转型成为AI产品经理或AI研发工程师。”尹会生则简洁地告诉InfoQ:“我认为,真正取代碳基生物的,永远是另一个碳基生物。”要不要转行做Prompt工程师?关于“要不要转行做Prompt工程师”这一问题,尹会生的回答是:“我举双手双脚赞成”,他说:“当下是入行最好的时间,后面的门槛会越来越高。而且未来被淘汰的人,一定是拒绝了解、学习使用AI这种先进工具的人。”唯一要注意的是,当下行业还属于懵懂期,各家企业基本都对Prompt工程师的绩效设定、量化考核没有太明确、成型的想法。这就导致一旦企业增长放缓,高层考虑降低人力成本,说不清自身价值的Prompt工程师就可能会被优先裁撤。38InfoQ架构师特刊:天工开物AIGC所以积累Prompt实践经验,优先谋求内部转岗或兼任尝试,可能是更稳妥的选择。当然,如果对自身的能力有信心,和用人单位也充分对齐了期望、达成了共识,快人一步,全职转型Prompt工程师,也未尝不可。尚在迷雾中的新兴岗位“Prompt工程师”,正在一步步走向台前。本文受访嘉宾1.

李晋松,创客贴CTO,互联网创业者和资深技术专家,创业经历有老虎地图、拉勾网,曾任职搜狗、360

AI研究院、核桃编程、作业帮、创客贴等历任资深技术专家、技术总监、技术负责人、副总经理等职务。2.

尹会生,珠海太乙人工智能技术合伙人&项目总监,前游戏公司技术总监,前新浪网技术经理。已经在极客时间开设了两门视频课程《零基础学Python》《Linux实战技能100讲》,一门专栏课程《Python自动化办公实战课》,一个行动营《21天AIGC行动营》,累计学习人数达到18万余人。文中关于Prompt工程未来技术趋势的参考:Prompt工程师指南[高阶篇]:对抗性Prompting、主动prompt、ReAct、GraphPrompts、MultimodalCoTPrompting等_人工智能_汀丶人工智能_InfoQ写作社区作者:汀,一名算法工程师,主要在自然语言处理,强化学习以及机器学习领域耕深推理。欢迎大家关注id汀丶人工智能一起AI学习。39专题访谈

|

Interview神器还是垃圾?那些用AIGC编程的人,实践得怎么样了作者

褚杏娟“大部分脚本,它写的都能运行,而且比我写的还要好。”这是刘立在小试ChatGPT之后的感受。现在,网上已经不乏对以ChatGPT为代表的代码生成工具的称赞,还有大量五花八门的使用教程。程序员是好奇心比较强的那批人,也愿意去先吃螃蟹。2020年GPT-3发布后,他们开始摸索用大模型或AI来辅助编程。GPT-3在当时虽被认为是“巅峰之作”,但还不能与人对话,并未引起全民高潮。对于绝大部分程序员来说,2021年发布的Copilot可能是用大模型辅助编程的启蒙。Copilot由GPT-3修改后的生产版本OpenAI

Codex提供支持、接受了一系列公共GitHub储存40InfoQ架构师特刊:天工开物AIGC库和其他公开可用原始码训练的辅助编程工具。Copilot迅速引起了开发者们的注意,并得到了很多程序员的认可。“程序员比较喜欢的一种工作方式是,我讲清楚需求是什么,你能直接给我回答。”WasmEdge创始人、核心开发者MichaelYuan说道。当时的Copilot做到了这一点,只要给出比较准确的描述,它就可以自动生成一段代码,使用起来很方便。“在此之前的产品,大家更多视为玩具,很有意思但不会真正使用,更不会真正花钱。Copilot做到了让我们付费使用。”Michael表示,这对一直将GitHub视为免费工具的团队来说,选择付费并不是容易的事。但在当时,Michael公司内部的开发者对Copilot态度是两个极端:一部分程序员非常喜欢它,甚至到了离不开的程度,而另一部分程序员认为它非常“脑残”,甚至看不起用它的程序员。这种态度分化,可能至今仍然存在。AIGC为程序员带来了什么?就像Copilot创建者之一Alex

Graveley说的,“代码推理具有明确的线性,而AI模型比较适应这种一件事做下去、前一件事对后一件事产生影响的应用场景。”从GPT-3发布至今,大模型在生成代码上表现得比生成自然语言要先进一些,因为代码只有是或不是、不容乱说。到了GPT-3.5,大模型的编程能力和逻辑能力有了非常大的提高,不仅可以生成代码、添加注释,还可以跟程序员对话,进一步解释这段代码。而经过两年的验证,GitHub证明了AIGC工具在写代码和Review代码这两个场景的可用性。写代码,实习生水平?“我从刚开始的天天用它生成代码,到现在摸清楚了,基本上不用。”给出描述、生成相应的代码,看似很酷炫的功能,但现在开发者还不能完全依赖这些AI工具生成的代码。以ChatGPT为例,ChatGPT给出的很多答案其实谷歌+StackOverflow就可以查到,但是很多新手不会用这套组合,ChatGPT只是降低了这个门槛,给出了各种质量参差不齐41专题访谈

|

Interview的答案。ChatGPT通常很难一次就给到正确的代码,需要开发者反复调教。另外,有开发者评价ChatGPT生成的代码很难实际使用,越深层的东西越没用。“稍微进阶一点的代码,生成得又慢又难用,不调整根本用不了。”南达科他州立大学生物信息学家Xijin

Ge曾建议:把AI当作暑期实习生,一些开发者也认为其更很适合新手或者作为辅助工具。不过,还是有开发者表示,虽然是复制粘贴的水平,但能理解代码已经很不错了。在Michael看来,代码产生问题的可能性是最低的,因为生成的代码可以立刻用起来进行检测。很多人吐槽ChatGPT总会先给错误代码,再让它检查一遍后就会给出正确答案,这是因为答案的给出是一个概率事件,它只是给出了其中一个答案。要提高正确率、不让它“胡说八道”就要给更详细、准确的提示词,让它能够更好地反馈出所知道的内容。“泛泛的提问,初次会有惊艳的感觉,但问多了会有错觉:不过如此,那是因为不会提问。”刘立也表示。“当你告诉它回答要有事实根据后,它的准确率就会提高很多。”这种需求也催生了“Prompt工程师”这一岗位的大热,他们通过自然语言对预训练大语言模型进行操作,并对输出结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论