人工智能通用大模型（ChatGPT）的进展、风险与应对分析报告

上传人：a*** IP属地：广西上传时间：2023-10-19 格式：PPTX 页数：52 大小：8.01MB 积分：35 举报 版权申诉

已阅读5页，还剩47页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

目录01通用大模型的近期进展02各国通用大模型的能力比较03通用大模型的治理风险评估04通用大模型的风险应对策略01通用大模型的近期进展1通用大模型的近期进展大模型的内涵与特征运行机制大模型的发展历程大模型的发展趋势预训练模型的发展历程多模态预训练模型“大模型”和“小模型”协进三大特征通用化与专用化并行平台化与简易化并进4454/551通用大模型的近期进展大模型的内涵与特征1.1•

大模型是指容量较大，用于深度学习任务的模型，通常具有海量的参数和复杂的架构。•

大模型具有更好的通用性、精度和效率，可以通过预训练或其他方式在大型数据集上进行学习，再通过微调高效地处理计算机视觉、自然语言处理等复杂任务。Transformer（主要

）

、

GAN

、CNN

以

及

RNN等架构微调以应用不同场景（专家）通过海量数据进解决各种复杂任务行预训练（通才）预训练模型的运行机制5/555554大模型的内涵与特征1.1涌现性扩展性复合性强化技术的融合解决传统AI的问题增强AI的能力有效集成自然语言处理等多个人工智能核心研究领域的多项技术，实现1+1>2的融合式涌现。大模型能够有效支撑智能终端、平台、系统等产品应用落地，解决壁垒多、部署难等问题。在海量通用数据上预训练以具备多种基础能力，摆脱传统人工智能能力碎片化、作坊式开发的局限。1通用大模型的近期进展6/565654大模型的发展历程1.2单语言预训练模型多语言预训练模型多模态预训练模型具备多样化的基础语言能力，开始分别处理多种自然语言任务，如机器翻译、问答系统、情感分析等。以多语言训练模型为核心，进行文字、图片、视频的同步转化，实现处理多任务的目标。能够处理自然语言，源于早期的词嵌入（wordembedding）的工作。1通用大模型的近期进展7/5757541.2

大模型的发展历程•

多模态预训练模型：人工智能如何理解世界？应用领域进展······深度多任务学习能够应用于医学影像分析中医疗金融工业同一海量数据的多任务处理理解式任务生成式任务Multi-Task经典模型结构；全空间多任务模型ESMM多模态预训练模型处理多任务多模态与多任务教育预训练模型的结合应用1通用大模型的近期进展8/55发展趋势：“大模型”和“小模型”协进1.3模型1.算力要求过高2.显存占用过大量化增强模型抗攻击性减少信息泄露风险降低运行碳排放量模型剪枝1.推理增速有限2.训练时长增加知识蒸馏参数共享1.经济成本激增2.能源消耗剧增低秩分解大模型的限度模型压缩技术小模型的好处9/551通用大模型的近期进展发展趋势：“大模型”和“小模型”协进1.3作为样本价值判断模型，小模型可以帮助大模型快速学习如何利用小模型作为

Teacher，可以帮助大模型快速收敛实现大模型和小模小模型型大模型的联动和互借助知识蒸馏等技术，大模型的能力可以传给小模型改进知识蒸馏等技术，大模型一次可以产出多个小模型助1通用大模型的近期进展10/55发展趋势：通用化与专用化并行1.3表征学习多任务处理多模态编码单模态多模态统一模型框架迁移学习1.从算法只能处理一种模态到可以处理多种模态2.从算法仅能基于一种模态学习并只能应用于该模态到可以学习并应用于多种模态1通用大模型的近期进展11/55发展趋势：通用化与专用化并行1.3专用领域预训练业务场景应用通用预训练应用需求反哺技术技术落地●

统一架构：使用统一的模型架构，并采用相同的学习模式基础框架●

统一模态：构建可以适用于多种模态的通用词表●

统一任务：将所有任务统一成序列到序列任务1通用大模型的近期进展12/55发展趋势：平台化与简易化并进1.3模型开发场景适配推理部署数据增强和清洗能力并行计算能力大模型和小模型无缝联动能力自适应分布式推理能力自动化压缩能力开发工具微调工具部署工具便捷微调能力存储优化能力自适应分布式训练能力弹性容错训练能力低参数调优能力加密部署能力全能、简易开发服务平台1通用大模型的近期进展13/5502各国通用大模型的能力比较2各国通用大模型的能力比较美国目前通用大模型的发展现状为何中美之间会存在如此差距？中国对大模型相关领域的布局情况原创能力技术配套制度环境引言：各国通用大模型的技术进展其他国家大模型技术的发展情况发展差距2各国通用大模型的能力比较15/552

引言：各国通用大模型的技术进展•

ChatGPT（GPT，Generative

Pre-trainedTransformer,

生成预训练转换器）的出现反映出了人工智能发展的新趋势，即AI正在从感知智能向认知智能快速发展。•

美国作为人工智能发展领域的前沿国家，其拥有一系列具备充足技术和资金资源的公司和实验室，如谷歌、微软、OpenAI等。•

中国作为人工智能领域发展的重要参与者，中国正在加快其在通用大模型领域的投资与研究。例如，百度、腾讯、阿里、科大讯飞等大型科技公司正在加速开发该领域的技术。2各国通用大模型的能力比较16/552.1

美国目前通用大模型的发展现状•

美国目前的科技巨头公司，如谷歌、微软、亚马逊、Meta等都在通用大模型上进行了进一步的布局与投资。•

Stability

AI等AI初创公司同样表示将积极布局AIGC、ChatGPT等相关技术和产业。模型名称

开发公司技术支持参数量耗费算力主要特点应用范围局限性GenerativePre-trainedTransformer3.53640PetaFLOPsperday支持连续对话、可质疑、文本编辑、无法进行网ChatGPTOpenAI千亿级主动承认错误、加入RLHF

编程、翻译、

页搜索、黑训练范式算术箱问题最大化积极影响、避免提供有害建议、自主选择、加入RLAIF训练范式较ChatGPT较ChatGPTClaudeconstitution-alAIAnthropic520亿—文本编辑更

代码推理更（封测）长且自然弱将加入ChromeOS为搜索引擎Bard较ChatGPT算

可以根据最新事件进行对力需求更低

话、更负责任犯事实性错误谷歌LaMDA1370亿（内测）2各国通用大模型的能力比较17/552.1

美国目前通用大模型的发展现状模型名称开发公司技术支持参数量耗费算力主要特点应用范围局限性具备指令微调，可以

生成创意文本

、OpenPre-trained改善其对未见任务的

解决基本数学问

全部访问权零样本和少样本泛化

题、回答阅读理

限受限制BlenderBot3Meta1750

亿—Transformer能力解问题Megatron-Turing微软Transformer高质量的自然语言训

阅读理解、常识

被

ChatGPT练语料库

推理、词义消歧

反超5300亿—英伟达语言模型•

在人工智能大模型领域，美国各巨头科技公司均有相关的技术资源。•

整体而言，目前ChatGPT的表现最为优异。即便是谷歌的Bard在实际表现上似乎也逊于ChatGPT。2各国通用大模型的能力比较18/552.2

中国对大模型相关领域的布局情况•

继OpenAI发布ChatGPT大模型之后，中国的各科技公司纷纷加入了大模型开发和应用的队伍。例如、腾讯、阿里、百度、科大讯飞等科技巨头公司均有跟进大模型的研发与应用。•

对目前国内大模型发展而言，我们与国外的差距重点不在模型，而在算力。模型名称

开发公司技术支持参数量

耗费算力主要特点应用范围局限性较Chat2600亿

GPT算力需求低文心一言基于百度知识增强生成式搜索、跨模

文本生成、将加入百

生成文本百度阿里（内测）大模型

ERNIE3.0态理解与交互度搜索引擎较短Transformer国内首个

统一底座、借鉴人脑的模块化设计图像描述、视觉定位、用户使用通义M6Encoder-Decoder，

10万亿能耗低文生图、视觉蕴含量较少ResNetBlocks计算机视觉、自然语言处理、多模态内容理解、文案生成基于MoE模型的成本较低、多模态理解、跨模态理解用户使用量较少混元腾讯万亿能耗较低Transformer

Block2各国通用大模型的能力比较19/552.2

中国对大模型相关领域的布局情况模型名称开发公司技术支持参数量耗费算力主要特点应用范围局限性全球首个视觉-文本-语音

跨模态检测、三模态预训练模型，同时

视觉问答、语具备跨模态理解与跨模态

义描述、视频中国科学院自动化研究所基于昇思MindSpore框架项目落地难紫东太初千亿—生成能力理解与生成跨模态检索、跨模态生成、内容生成等盘古Encoder-模型具备极佳泛化能力

，效率高千亿—模块化（未上线）Decoder架构•

在人工智能大模型领域，中国公司的科技实力与国外公司存在一定差距。•

中国企业目前正在努力将之前的发展重点（单一模型对应单一任务的专用大模型）调整为通用大模型。例如，百度2023年3月即将推出“文心一言”通用大模型。、阿里和腾讯也表示将加快通用大模型的落地。2各国通用大模型的能力比较20/552.3

其他国家大模型技术的发展情况模型名称

开发公司技术支持参数量

耗费算力主要特点应用范围局限性GenerativePre-trainedTransformer采用Apache

2.0授权，俄罗斯处于行业中下游YaLM1000亿

能耗较高

同时允许研究及商生成和处理文本Yandex业免费使用英国Transformer阅读理解、事实核查、有害语言识别Gopher2800亿

能耗较低超大型的语言模型提升韩语模型性能应用范围较窄DeepMind语言模型Hyper韩国在韩语领域的文本生成多模态任务滞后暂无公开820亿—CLOVANaverMRKL模块化推理、知识和语言系统尚未对输出的潜在有害内容进行过滤Jurassic-1Jumbo以色列兼顾神经模型和符号推理能力转述、从文本中提取数字1780亿

能耗较高A21

Labs2各国通用大模型的能力比较21/552.4

发展差距：为何中美之间会存在如此差距？•

通用大模型的研发已经成为各国新一轮技术竞争的核心领域。•

中国企业在原创能力、技术配套、制度环境三个方面，存在一系列亟待解决的问题。•

这些问题制约了中国通用大模型的进一步发展，并导致中国与美国存在一定的技术差距。原创能力2各国通用大模型的能力比较22/552.4

发展差距：原创能力核心类型具体表现缺乏冒险精神缺少创新的社会文化试错空间小形成原因在风险技术的投入上倾向于复制和追随学生缺乏独立思考和批判性思考原创能力过快的竞争和成果产出节奏压缩企业的创新时间具有丰富经验的前沿人才不足人才不足2各国通用大模型的能力比较23/552.4

发展差距：技术配套核心类型具体表现形成原因关键技术缺乏进一步突破硬件基础设施不足数据质量不足在关键的人工智能算法上（算法透明度、鲁棒性等）存在痛点外部制裁限制了中国高性能芯片的研发和生产中文语言的学习难度较大；外部数据的获取难度大算法模型与中文语境之间的匹配有待调试和完善技术配套内容生成的多样性不足2各国通用大模型的能力比较24/552.4

发展差距：制度环境核心类型具体表现形成原因知识产权保护不足国际合作不足对既有权利人和AI生成物的知识产权保护不完善不确定的地缘政治格局限制了中国科学家的对外合作对AI生成内容的审核缺乏统一标准制度环境内容审查能力不足研发商业化程度不足市场的不确定弱化了外界的投资信心2各国通用大模型的能力比较25/5503通用大模型的治理风险评估3

通用大模型的治理风险评估政治风险技术风险社会风险经济风险政治决策舆论引导鲁棒性不足数字鸿沟侵犯个人隐私诱发犯罪寡头垄断颠覆性变革可解释性低算法偏见传统岗位替代世界分工重组监管失能冲击教育体系国际关系动荡3通用大模型的治理风险评估27/553.1

技术风险：鲁棒性不足系统在面对黑天鹅事鲁棒性不足体现件和对抗性威胁时表现出的能力缺失原因影响训练数据偏差产生错误预测大模型具有涌现性解决错误推理方法助长算法偏见对抗样本干扰语言多样性缺失在具体应用场景中考虑更细粒度的安全问题上下文理解3通用大模型的治理风险评估28/553.1

技术风险：可解释性低可信度降低安全问题现有问题可控性较弱的原因解释效果不理想缺乏统一的标准人类难以理解模型的决策过程◆

数据投毒◆

后门、木马攻击◆

常见词汇偏差◆

伪相关问题方法多结果少可解释性的AI应用少研究的局限3通用大模型的治理风险评估29/553.1

技术风险：算法偏见原因表现◆

数据偏见◆

种族偏见◆

性别偏见◆

年龄偏见◆

语言偏见◆

职业偏见◆

地理偏见⚫

语料库缺乏代表性算法偏见⚫机器学习习得人类偏见⚫

数据不均◆

人物形象偏见3通用大模型的治理风险评估30/553.2

社会风险：数字鸿沟社会在信息层面所形成的不公平现象数字鸿沟（技术拥有者和技术缺乏者之间的差距）技术鸿沟表现：危害：◆

不公正决策各阶段数据技术行为主体出于自身利益技术主体之间◆

减少少数族裔或弱势群体的参与◆

加剧社会不公平◆

损害信任考虑，对其他行为主体产生戒备，数据交流共享难以畅通。大模型使用者，也即大模型技术的作用对象，是作为数据生产者的普通大众。他们面临的数字风险较高，而收益甚微。技术主体与使用者之间◆

降低模型可靠性3通用大模型的治理风险评估31/553.2

社会风险：侵犯个人隐私模型设计推理能力数据恶意滥用产生的原因三角互证与多重验证过程“长尾效应”监测与跟踪数据方面大模型方

面3通用大模型的治理风险评估32/553.2

社会风险：诱发犯罪产生原因诱发犯罪的类型•

语言模型辅助的内容生成技术以更加低廉的价格更加有效地生成虚假信息信息欺诈仇恨言论网络诈骗•

大模型拥有创建高度逼真的合成文本或语音的能力•

虚假信息识别难度提高侵犯知识产权3通用大模型的治理风险评估33/553.2

社会风险：冲击教育体系产生原因缺乏相关应对措施准备技术因素：1.

术快速迭代与检测技术滞后之间的矛盾◼

高度逼真的合成文本能力◼

各类资料高度开源增加大模型应答准确性2.限时开卷考试等传统测试手段已基本无解3.尚缺乏对大模型学术不端的准确界定标准社会因素：◼

现有教育体系缺乏应对准备◼

学生缺乏数字素养◼

就业压力和学业竞争加剧4.监管责任主体缺失呃呃呃呃呃呃呃3通用大模型的治理风险评估34/553.3

经济风险：寡头垄断存储数据模型的显卡至少价值200万元模型迭代需长期、大量人力投入作为当前AI领域的前沿技术，在理论上，大模型拥有广阔的应用空间。巨头垄断趋势明显所需数据量仅有巨头企业能满足得体的交互应对背后是聚沙成塔式的细节更新能耗=126个丹麦家庭的年能耗之和二氧化碳排放=行驶70万公里为何大模型落地难？高昂的训练和能源成本训练消耗的总算力为3640PF-days，即每秒运算1千万亿次，需要运行3640天但当我们思考实际落地的诸方面时才发现：通用大模型远非真正的“通用”工具，是只有巨头才可以拥有的独享“权杖”。承担简单工作则入不敷出高不成低不就创造性岗位则难以胜任3通用大模型的治理风险评估35/553.3

经济风险：颠覆性变革优颠覆变革化•

结合大模型的Bing搜索能实时抓取信息，对搜索涉及的事物进行自动关联，实现对制定旅行计划等开放性需求的回应。影响•

用户可以通过打字或语音交互直接输入自己的需求。•

软硬件需要联合执行用户的指令，以自然语言协议为基础的物联网通用协议将可能达成。搜索功能整合构建通用协议产业重塑•

搜索引擎将整合搜素、浏览、甚至决策的功能。3通用大模型的治理风险评估36/553.3

经济风险：传统岗位替代经济风险：哪些岗位会被取代?为什么•

成熟的大模型计算能力更强，在文字处理和内容生成领域效率更高。内容生成型技术密集型数据预测型•

技术密集型工作的本质是一套操作流程，经过训练的专用模型可律广稿码设会市数财以轻松掌握。师告件农计计场据务助制采程师师分分顾•

目前在根据已有复杂数据做出判断和预测方面，大模型的能力不会比人类弱。理作编序析析问员师师3通用大模型的治理风险评估37/553.3

经济风险：世界分工重组•

美国在算力、算法、芯片等关键领域•

其他国家，尤其是广大发展中国家在通用模型的研发领域与美国差距甚大。综合实力最强的中国在模型迭代方面也有较大上升空间。中心边缘结构固化科技保都有较大优势，有能力创造出先进生世界分工重组产力的“精英+AI”模式。•

美国与中国、乃至全世界脱钩的成本

护主大大降低，“小院高墙”足以自给自足。这将加剧技术保护主义思潮和逆全球化趋势。义兴起•

基于自身先发优势，美国有能力构建一个新的、更固化的中心-外围结构。3通用大模型的治理风险评估38/553.4

政治风险：政治决策政治决策机制重塑危险•

大模型将可能替代部分人力进行政策建议甚至政治决策。•

政治决策者依赖大模型，导致政治治理能力下降及政策创新力匮乏。政策决策忽视偏好问题政治决策信任度危机•

人工智能无法完全理解和回应政治决策对象的情感诉求。•

大模型类人化程度极高，决策者和决策对象之间以此为媒介的沟通很难确认真实性。•

政治决策者与诉求表达者之间出现双向信任危机。政治决策风险•

大模型依据统计做出的政策建议或决策很可能回应性不足。13通用大模型的治理风险评估39/553.4

政治风险：舆论引导潜移默化引导公众舆论•

大模型的算法和数据的鲁棒性、透明度和可解释性弱。•

真实性存疑的输出结果持续影响公众政治判断和选择，隐蔽塑造公众舆论和观念。国家阐释权的趋弱意识形态武器化趋向舆论引导风险•

大模型的高度拟人化和使用便利性将强化公众对它的依赖，同时增强它对重大概念和事件的解释权。•

技术霸权国针对他国公众心理弱点，利用大模型输出意识形态偏好。•

针对目标国进行潜移默化的意识形态渗透和制度破坏，干涉他国内政。•

和国家的阐释权形成竞争，侵蚀国家权威性。13通用大模型的治理风险评估40/553.4

政治风险：监管失能优监管垄断化监管需求能力差距垄断监管失能风险•

大模型出现的虚假和错误难以识别和监管。侵

•

大模型必须的高投入导致科蚀技巨头寡头化趋势。•

巨头垄断将侵蚀国家治理能力。国家能力•

智能水军等造成巨大的监管压力。3通用大模型的治理风险评估41/553.4

政治风险：国际关系动荡优极化联盟化•

大模型的高昂投入和先发优势导致少数优势大国的垄断趋势。国际关系动荡风险强化科技政治对抗助推价值观联盟•

大模型加剧广大弱势国家对少数优势国家的技术依赖。•

大模型强化了西方价值观隐蔽的支配地位，大模型成为推动价值观联盟形成的工具。•

围绕大模型的激烈竞争加剧优势国家的技术保护主义，弱势国家被迫选边站队，科技政治极化对抗风险激增。3通用大模型的治理风险评估42/5504通用大模型的风险应对策略4通用大模型的风险应对策略构建法律之治防范失业风险增强竞争能力加强市场应用消除政治风险推动教育改革4通用大模型的风险应对策略44/554.1

构建法律之治：基本原则风险法治原则积极责任原则•

坚持以法治原则应对大模型技术的潜在风险。•

大模型服务提供者采取积极的、与技术水平相适应的风险控制措施。•

在迭代中不断优化大模型系统的价值敏感设计。•

引导大模型技术的应用与发展尊重和依循人类社会的良善伦理与价值。基本原则创新激励原则场景公正原则•

充分考虑到保障社会创新活力的价值向度，切合技术发展实际和社会现实作出可执行的规制决定。•

在现实个案、具体风险源或法益损害场景中寻求公正与平衡的解决方案。•

充分利用既有制度展开法律推理，避免形式主义和超越性的立法。•

合理限度的责任豁免规则和试验主义的监管方式或许是可探索的方向。4通用大模型的应对策略45/554.1

构建法律之治：制度建构明确大模型服务提供者的积极责任建设大模型服务备案制度•

明确大模型服务提供者需承担积极采取与技术发展水平相适应的风险预防与控制措施的责任。•

经营者向公众提供大模型服务时，需向主管部门进行备案。•

对于备案的经营者，政府可提供有限的责任豁免、监管沙箱、避风港规则等政策予以激励。•

及时响应和处理监管要求和权利主体提出的正式侵权通知。制度建构探索大模型服务避风港规则在场景公正中作出法律推理•

对于大模型系统中可能存在的对个体权益侵权（如知识产权、人格权、数据权），探索适用通知-移除规则；•

追究大模型恶意利用者的责任；•

追究大模型服务商怠于履责的责任；•

做好大模型相关的专项反垄断研判并细化取证流程。•

设计大模型风险控制基金、保险等工具进行转移和补偿个体权益的损害。4通用大模型的应对策略46/554.2

增强竞争能力：构设整体性创新机制•

应对科技竞争风险的关键在于整体性创新机制的构设。整体性创新机制包括企业创新、制度配套和联盟学习。政府提供相关配套措施的大力支持，包括硬件基础设施建设、知识产权保护、专业投资预算和产业政策引导。政府、企业和科研机构都应该建设学习交流机制，通过吸收先进地区的经验来降低试错成本、加快技术研发。头部企业发挥冒险精神，承担社会责任，以技术变革的魄力引领产业整体水平的提升。企

业

创

新制

度

配

套联

盟

学

习4通用大模型的应对策略47/554.2

增强竞争能力：培育持续性创新基础•

应对科技竞争风险必须要在持续性创新基础之上推进。•

中国在创新基础上的独特优势：不仅具备庞大的人口基数和海量数据，而且拥有强大的社会动员能力。算法原始创新高质量数据库数据是训练通用大模型所需的重要资源，中国需要在数据量和数据多样性上发挥独有优势。重点在于构建原创性的奠基式架构，而非在现有底层模型的基础上一味扩大模型规模。公共算力基础由政府牵头设立的“算力池”能够为大模型开发提供公共算力。4通用大模型的应对策略48/554.3

加强市场应用：两个面向•

通用大模型作为前沿技术，在提升产业流程效率、引领产业智能化等领域都具有创造性作用。•

在实际应用环节，大模型依然面临重重阻碍。•

为应对大模型应用落地难的问题，我们提出了“一个核心、两个面向”的有效解决策略。面向面向核心•

1.链接技术与应用，拓展多重应用场景，降低市场准入门槛。•

1.发挥社会

人人文库> 全部分类> 专业文献 > 金融证券

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能通用大模型（ChatGPT）的进展、风险与应对分析报告

文档简介

温馨提示

最新文档

评论

人工智能通用大模型（ChatGPT）的进展、风险与应对分析报告

文档简介

温馨提示

最新文档

评论

相关文档