




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2024年人工智能全景报告【译者按】今年10月,英国风投公司AirStreetCapital发布第七版《人工智能全景报告》。人工智能正迅速成为全球经济发展的关键驱动力,系统评估人工智能行业现状和未来趋势尤为重要。报告全面审视了人工智能在研究、产业、政治和安全四方面的最新进展,揭示了包括多模态基础模型突破学科局限、龙头企业与初创企业并行加速发展、人工智能监管立法持续提速、企业关注点从安全主义转向加速发展等重大趋势。同时,报告对未来12个月全球人工智能发展作出了前瞻性预测。赛迪智库未来产业研究中心对该报告进行了编译,期望对我国有关部门有所帮助。【关词】人工智能 研究 产业 政治 安全 预测研究:技术突破及其能力。产业:人工智能的商业应用领域及其商业影响。政治:人工智能的监管、经济影响以及不断演变的人工智能地缘政治。安全:确定并减轻未来高性能人工智能系统可能带来的灾难性风险。预测:未来12个月可能会发生的事。一、概述(一)研究前沿实验室的表现趋于一致,但因为规划和推理已成为主要OpenAIo1大型语言模型后仍保持领先优势。随着多模态研究深入到数学、生物学、基因组学、物理科学和神经科学领域,基础模型展现出了突破语言局限的能力。美国的制裁未能阻止中国的大型语言模型在社会各界排行榜上的飙升。(二)产业英伟达(NVIDIA)仍是全球最具实力的公司,跻身市值3万亿美元企业之列。监管机构正在对生成式人工智能领域的权力集中问题展开调查。更为成熟的生成式人工智能企业已实现数十亿美元的营收,初创企业也开始在视频和音频生成等领域崭露头角。尽管这些企业的发展已开始从模型研发迈向产品落地,但有关定价和可持续性的长期问题仍未解决。在公共市场牛市的推动9万亿美元,同时私营企业的投资也在健康增长。(三)政治在全球治理停滞不前背景下,国家和地区层级的人工智能监管却在不断推进,美国和欧盟都通过了相关立法,但这些立法颇具争议。计算需求的实际情况迫使大型科技企业不得不考虑在规模扩张方面面临的现实物理限制以及它们自身的排放目标。与此同时,各国政府在能力建设方面的尝试仍然滞后。人工智能对选举、就业以及一系列其他敏感领域可能产生的影响目前还尚未显现。(四)安全企业的关注点正在从安全向加速发展转变,之前还在警告人类即将灭绝的企业,现在却在大力提高销售额,推广消费类应用程序。世界各国政府纷纷效仿英国,构建提升人工智能安全的国家能力,成立相关机构,研究关键国家基础设施在人工智能方面存在的潜在漏洞。每一项人工智能发起的攻击都以失败告终,但让研究人员更加担忧的却是更为复杂、长期的攻击。二、研究(一OpenAI草莓(Strawberry)的问世,将在扩展推理计算方面加倍发力这一年的大部分时间,各项基准测试和社会各界排行榜都显GPT-4与“其他最优模型”3.5Sonnet、Gemini1.5Grok2等模型几乎消除了这一差距,如今OpenAI团队显然很早就察觉到了推理计算的潜力,在其他实验室发表有关该技术的论文几周后,OpenAI的o1就问世了。(二)尽管屡受制裁,中国的大型语言模型仍榜上有名深度求索、零一万物、智谱和阿里巴巴所研发的模型在大型模型系统机构排行榜上取得了优异名次,尤其在数学和编程方面展现出了令人瞩目的成果。例如,深度求索率先采用多头潜在注意力11多头潜在注意力(Multi-headLatentAttention,MLA)是一种在自然语言处理和其他序列数据处理任务中使用的注意力机制。它是多头注意力(Multi-headAttention,MHA)的一种变体,通过低秩压缩键(Key)和值(Value)来减少KV缓存的大小,从而提高推理效率。力于构建强大的中文数据集,以弥补其在常用数据存储库中相关数据相对匮乏的不足。(三)中国的开源项目赢得了全球粉丝为推动国际上的采用和评估,中国的实验室已成为热情的开源贡献者。有几款模型已在个别子领域中崭露头角,成为强有力Deepseek-Coder-V2已成为编程任务中最受欢迎的工具之一,具有速度、轻便、准确等优点。阿里Qwen-2系列芯片,其出色的视觉识别技术震撼业界,任务中展现出非凡实力,还能深度解析纷繁精妙的艺术作品。(四)人工智能亦可获得诺贝尔奖瑞典皇家科学院将诺贝尔奖授予深度学习领域的先驱者,表明人工智能作为一门学科以及加速科学发展的工具,已经发展成熟。(五DeepMind和同构实验室发布了AlphaFold3模型,它是2增强型混合专家(MoE)是一种深度学习模型,它通过将多个专业化的子模型(即专家”)组合起来,形成一个“专家”“专家”“络”的机制。AlphaFold2以及抗体与蛋白质靶点的相互作用机制。(六)AlphaProteo:DeepMind公司展示了新的实验生物学能力DeepMind公司的神秘蛋白质设计团队终于凭借其首个模型AlphaProteo“走出幕后”。这是一个生成式模型,能够设计出亲和力提高3到300倍的亚纳摩尔级蛋白质结合剂。(七)学习设计人类基因组编辑器的语言模型之前介绍了如何使用在大量多样的天然蛋白质序列数据集上预先训练的大型语言模型(ProGen2)来设计与天然蛋白质序列完全不同的功能蛋白质。现在,ProfluentCRISPR-Cas图谱ProGen2器,且这些编辑器首次被证明可在体外对人类细胞的DNA编辑。(八)人工智能基础模型:通过功能性磁共振成像了解大脑活动深度学习最初受到神经科学的启发,如今正应用于对大脑本“大脑语言模型6700小时人类大脑活动记录构建的基础模型,这些记录是通过功能性磁共振成像生成的,该技术可检测血氧含量的变化。该模型学会了重建被掩盖的时空大脑活动序列,且能够泛化到未见过的数据分布。可通过微调该模型来预测临床变量,例如年龄、神经质程度、创(九)各科学领域的基础模型:大气领域传统的大气模拟方法,如数值天气预报,成本高昂,且无法利用各种稀缺的大气数据模态。但基础模型在这些方面的表现却Aurora,能够针对诸多大气预报问题进行预测,比如全球空气污染和高分辨率中期天气模式等问题。它还能通过利用通用的已习得大气动力学表征来适应新任务。(十)心智的基础模型:重建看到的事物MindEye2映射到丰富的对比语言-图像预训练(CLIP)空间,然后利用经StableDiffusionXL模型从该空间重建个体所看到的图像。该模型在自然场景数据集上进行训练,这是一个基于8名受试者构建的功能性磁共振成像数据集,在这些受试者观看来自COCO(每次3秒3040小时的捕捉。(十一)程序搜索在数学领域获得新发现趣味搜索利用大型语言模型生成和修改程序,并能通过对求解质量打分实现功能进化。趣味搜索通过搜索程序而非直接的解决方案,发现复杂对象或策略的简洁且可解释的表述形式。肖莱认为,这种形式的程序搜索是最有可能解决抽象和推理挑战的途径之一。谷歌DeepMind团队将其应用于极值组合学中的帽集问题以及在线装箱问题。在这两个案例中,趣味搜索都发现了超越人类设计方法的新颖解决方案。(十二)基础模型能否让大规模训练强化学习智能体变得更容易?训练强化学习智能体的一大瓶颈是训练数据的短缺。诸如转换已有环境或手动构建环境这类标准方法都需要耗费大量人力,且无法实现规模化。帝国理工学院和英属哥伦比亚大学的OMNI-EPIC项目利用大型语言模型创建了理论上无穷无尽的强化学习任务和环境流,以帮助智能体基于先前学到的技能进一步Python(十三)人工智能研究领域的全球力量平衡并未改变,但学术界有所获益人工智能出版物数量的同比变化随着人工智能成为新竞争战场,大型科技企业开始对研发工作的更多细节秘而不宣。自本报告开始发布以来,前沿实验室首次大幅削减成果发表数量,而学术界也参与其中(见图1)。人工智能出版物数量的同比变化加利福尼亚大学伯克利分校牛津大学清华大学米迪亚研究麻省理工学院华为谷歌腾讯阿里巴巴微软元宇宙IBM图1加利福尼亚大学伯克利分校牛津大学清华大学米迪亚研究麻省理工学院华为谷歌腾讯阿里巴巴微软元宇宙IBM三、产业(一)英伟达成为全球最具实力的公司,不断提出更具雄心的目标随着用于支持对算力要求极高的生成式人工智能工作负载的硬件需求不断增长,各大实验室都需要依靠英伟达提供的硬件。63万亿美元,成为继微软和苹果之后第三家达到这一里程碑的美国公司。其第二季度财报业绩依然亮眼,地位Blackwell系列图形处理器上获得了大量预订单,并且正在积极争取政府方面的订单。(二)老牌竞争对手未能缩小差距超威半导体和英特尔已经开始投资建设软件生态系统,超威半导体公司已经利用ROCm们尚未开发出能与英伟达网络解决方案产品组合相媲美的有竞49亿美元收购服务器制造ZT系统公司(ZTSystems)的计划能改变这一局面。与此同时,英特尔的硬件销售额出现了下滑。除非出现监管干预、研究范式转变或供应受限等情况,否则英伟达的地位似乎坚不可摧。(三)购买英伟达的股票要比投资那些与英伟达竞争的初创企业好得多201660亿美元进行分析和设想,如果投资者当时按当日股价购入等值的英伟达股票,情况会怎样?答案是:若买入英伟达股票,那60亿1200亿美元(20倍),而投入初创企业如今的价值仅310亿美元(仅涨5倍)。(四)并非所有人都认为英伟达只会越来越好有一小部分直言不讳的分析师和评论员并不信服。他们指出图形处理器稀缺状况已有所缓解,目前只有少数几家公司能从人工智能产品中获得可靠营收,而且大型科技企业的基础设施建设规模也不太可能大到足以支撑英伟达目前的估值。市场目前对这·安德森的观点,即英伟达在十年内市值可能达到“数万亿美元”。(五)但初创企业的收入在哪里?利润又在哪里?许多从事生成式人工智能的热门初创企业正在以创纪录的、通常是三位数的营收倍数进行融资。虽然这可能表明投资者对未来回报有信心,但这也设定了一个很高的门槛,因为这些企业中的很多目前还没有明确的盈利途径。然而,并非所有的企业都是OpenAI有望在一年内实现营收增长两倍,但训练、推理及人员成本意味着亏损仍在持续增加。他们并非唯一一家在寻求实现良性经济运作的领军企业。(六)或许收入和利润两者都不重要:要恢复股价只需要一种氛围元宇宙公司通过放弃在元宇宙领域的大量投资,凭借“羊驼”模型大力转向开源人工智能领域,在公共市场引发了令人难以置·扎克伯格实际上已成为开源人工智能救世主,与OpenAI、Anthropic和谷歌DeepMind形成对抗之势。(七OpenAIo1随着模型种类日益丰富,开发者们正在根据工作需求(以及自身预算)选择合适工具。(八)模型费用持续下降下降60倍下降下降60倍下降100倍2:OpenAI和Anthropic(九)谷歌Gemini推出了一个强大的模型系列,定价极具竞争力Gemini1.5Pro和1.5Flash的价格在推出几个月后就下降了64%至86%,但性能依然强劲,例如Flash-8B比1.5Flash便宜50%,但在许多基准测试中的表现却不相上下。(十)人工智能实验室从构建模型转向设计产品像苹果、谷歌或抖音等成功的科技公司都是以产品为先,而API。随着基础模型性能趋于接近,OpenAIAnthropic和元宇宙公司显然都在更深入地思考其“产品”应该呈现出怎样的外观和使用体验,不管是Anthropic公司“Claude”的相关成果、OpenAI的硬件合作项目以及对口型工具。仅构建出优秀的模型是不够的。(十一)监管机构对关键的生成式人工智能参与者之间的关系进行详尽审查,导致伪收购作为一种退出策略兴起鉴于高昂的计算成本,模型构建者越来越依赖与老牌大型科技企业合作。反垄断监管机构担心这会让现有企业的地位更加不可动摇。监管行动在塑造市场方面作用有限,经济因素更具决定性。鉴于众多“其他企业”的性能趋于相近,且这些企业高昂的资本性支出需求,整合也就不足为奇了。鉴于存在监管障碍,伪收购开始兴起,即大型科技企业:聘用初创企业的创始人和大部分团队成员;该初创企业退出模型构建领域,转而专注于其企业服务业务;通过许可协议向投资者支付款项。监管机构已经发现了这一问题,大西洋两岸的监管机构都已在这方面开始详尽审查。(十二)文本转语音正在蓬勃发展文本转语音领域市场领导者ElevenLabs在今年年初达到独角兽级别,估值达11亿美元。由于各大实验室对该领域涉足有限,因此ElevenLabs得以独占鳌头。(十三)语音识别在商业领域站稳了脚跟虽然文本转语音因“效果惊艳”而备受关注,但语音识别却可能被用于实现日常任务的自动化规模处理。投资者开始看到语音识别在规模化发展方面的潜力。(十四)视频生成领域的竞争正趋于白热化RunwayPikaLumaOpenAI等众多参与者正在大规模扩大其数据收集和模型训练实验的规模,以期在文本到视频生成方面提高生成质量和稳定性,此外还致力于生成更长的视频片段。(十五)人工智能投资在各个地区都大幅增长xAIOpenAI(60亿美元融资)等通用人工智能巨额融资的推动下,美国私募市场继续保持领先地位,对人工智能企业1000亿美元(3)。欧盟欧盟27国+挪威、瑞士 英国 美国 中国 图3:人工智能投资情况(十六)在上市公司的推动下,人工智能企业的市值达到近9万亿美元虽然私营公司的估值一直在稳步攀升,但少数几家上市公司却像Atlas一样撑起了整个市场。仅上市公司目前的价值就超过了2023年的整个市场价值(见图4)。私私公司 上公司 图4:上市公司和私营公司市值四、政治(一)美国通过行政命令引入有限的前沿模型规则,各州则推行各自更具争议性的规则在2023年7月获得大型实验室自愿遵守相关模型发展规定的承诺之后,白宫决定将之前这些实验室自愿表示要遵守的内容变10月,拜登签署了一项关于前沿模型监管的行政命令。由于在更广泛的联邦人工智能监管方面达成两党共识的可能性微乎其微,各州都在推行各自的人工智能法规,其中最引人注目的是加利福尼亚州的SB1047。(二)经过最后一刻的疯狂游说,欧盟《人工智能法案》最终正式成为法律今年3月,在法国和德国开展了一场集中的影响活动以弱化某些条款之后,欧洲议会通过了《人工智能法案》。然而,关于该法案的实施问题仍未得到解释。(三)英国正缓慢朝着制定前沿模型相关立法的方向推进英国新工党政府已发出信号,表示打算摒弃其前任仅通过现有立法来监管人工智能的做法,不过这种转变较为微妙。(四)中国的人工智能监管进入执法时代中国是首个开始制定生成式人工智能监管措施的国家,从2022年起就出台了全面的(最初是相关企业自愿遵循的)指导方针。如今,中国的审查机构也开始介入。(五)日本对人工智能的态度很热衷吗?出于政治和文化等多种原因,从历史上看,日本对于风险投资和人工智能初创企业一直是一个不温不火的市场。而如今,日本政府突然热衷于在这方面分得一杯羹。(六)公共计算方面的努力与私人计算方面的努力相比相形见绌英国、美国和欧盟都开始加大其公共计算服务的力度,为研究人员和初创企业提供补贴,使其能够使用昂贵的硬件设备。但相关举措仍处于试验性阶段。(七)不断增长的计算能耗危及大型科技企业的净零排放承诺,能源基础设施也开始不堪重负大型科技企业已签署了一系列到2030年的气候承诺,微软甚至承诺实现碳负排放。但人工智能的能耗却意味着他们目前正朝着错误的方向发展。人工智能面临的环境挑战与一个在规模化过程中常常被遗忘的阻碍因素密切相关,那就是现实世界的物理制约。(八以人工智能为先的国防领域竞争对手实现了规模扩张,是例外吗?自去年的报告发布以来,已经开始有一些重大合同被授予国防领域的挑战企业,但由于中标数量仍然较少,现在就说一个新的生态系统正在形成为时尚早。(九)关于人工智能经济影响的争论更加激烈2023(十)虚假信息研究发展迅速,但有关人工智能有效性的证据依然匮乏由于今日俄罗斯电视台与西方受众直接沟通的能力受到限制,被发现通过一款名Meliorator1000个虚假X账号组成的网络。另外也有迹象表明,与俄罗斯政府有关联的人员在以色列-五、安全(一)从安全主义到加速主义:一种重大的氛围转变已经发生从美国国会举行听证会以及为推动(关乎人类存亡的)人工智能安全议程而进行全球巡回宣传的时期开始,领先的前沿模型企业正在加速向消费者推广人工智能产品。(二)英国创建了世界上首家人工智能安全研究所,美国随即效仿在“布莱切利峰会”召开之际,英国宣布其前沿人工智能特别工作组将由人工智能安全研究所(AISI)取代,这是世界上首家人工智能安全研究所。美国、日本和加拿大也纷纷跟进,但工作力度有限。(三)各国政府急于填补关键国家基础设施中的漏洞除内部加深对模型能力的理解外,英国也正在成为增强防御5900万英镑研发一种“把关系统用其内部测试平台来评估人工智能可能对关键基础
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论