CIC灼识咨询-大模型与AIGC蓝皮书-2023_第1页
CIC灼识咨询-大模型与AIGC蓝皮书-2023_第2页
CIC灼识咨询-大模型与AIGC蓝皮书-2023_第3页
CIC灼识咨询-大模型与AIGC蓝皮书-2023_第4页
CIC灼识咨询-大模型与AIGC蓝皮书-2023_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CIC灼识咨询

大模型与AIGC蓝皮书

©2023ChinaInsightsConsultancy.Allrightsreserved.Thisdocumentcontainshighlyconfidentialinformationandissolelyfortheuseofourclient.

Nopartofitmaybecirculated,quoted,copiedorotherwisereproducedwithoutthewrittenconsentofChinaInsightsConsultancy.1

灼识咨询是一家知名咨询公司。其服务包括IPO行业咨询、商业尽职调查、战略咨询、专家网络

服务等。其咨询团队长期追踪物流、互联网、消费品、大数据、高科技、能源电力、供应链、

人工智能、金融服务、医疗、教育、文娱、环境和楼宇科技、化工、工业、制造业、农业等方

面最新的市场趋势,并拥有上述行业最相关且有见地的市场信息。

灼识咨询通过运用各种资源进行一手研究和二手研究。一手研究包括访谈行业专家和业内人士。

二手研究包括分析各种公开发布的数据资源,数据来源包括中华人民共和国国家统计局、上市

公司公告等。灼识咨询使用内部数据分析模型对所收集的信息和数据进行分析,通过对使用各

类研究方法收集的数据进行参考比对,以确保分析的准确性。

所有统计数据真实可靠,并是基于截至本报告发布日的可用信息。

若您希望获取CIC灼识咨询的详细资料、与灼识建立媒体/市场合作,或加入灼识行业交流群,

欢迎扫码、致致函marketing@。

2

目录

I.大模型如今已展现出卓越的能力,随着其不断演进和完善,

必将引领AI的未来道路,开创智能时代的新纪元

II.受益于大模型技术的日益成熟,AIGC有望掀起新一轮产业革

命,开启人类发展的智能新时代

III.GPGPU高度并行的计算资源为大型模型的训练和推理提供了

不可或缺的支持,推动了大模型与AI领域的不断进步和创新

IV.彩蛋:生成式AI如何提升工作效率

3

AI应用现状

全球AI市场预计将于2030年达到1万亿美元,并且全球超过15%的GDP将由AI驱动;AI在各垂直领域的应用渗

透率也将继续提升。

AI在垂直领域中的应用强/主要的弱/次要的

数据及AI基础设施建设中国AI应用情况

行业占支出比例AI应用的挑战

中国AI支出占AI市场AIITAI支出CAGR,

数据量数据质量IT系统成熟度

比例,

202220222027E22-27E

•不同机构之间的数据孤岛

金融12.1%11.8%19.8%28.1%

•数据系统安全及隐私

•传统零售商获取结构化/高度可用的数据

零售5.7%3.7%5.7%26.6%

•供应链机器学习算法优化

•专注单点技术突破,但无法跨场景规模化应用

制造业8.6%1.8%4.4%43.6%•数据整合程度低,管理欠佳

•AI解决方案供应商分散

能源2.6%5.1%9.8%41.4%•AI应用/转型进度较慢

•数据分散在各医院/管理机构

医疗5.6%5.5%8.2%27.6%

•数据系统安全及隐私

汽车12.3%19.5%25.5%21.0%•自动驾驶数据融合难度高

•不同机构之间的数据孤岛

政府27.1%21.6%28.3%18.7%

•数据系统安全及隐私

资料来源:灼识咨询4

大模型的定义

大模型是基于海量多源数据打造的模型,其是实现通用人工智能(AGI)的重要路径。大模型可以整合多种不

同类型的数据和信息,实现多模态处理和分析,从而更全面地理解和解决复杂问题,其具备通用性、涌现性等

诸多特点。

定义

•AI可分为ANI(ArtificialNarrowIntelligence)、AGI(ArtificialGeneralIntelligence)和ASI(ArtificialSuperIntelligence)。ANI是专注于执行某一领域任务的经过训练的人工智能,是目前大多数的AI

形式;AGI是通用人工智能,是指一种具有与人类相当的认知能力的智能系统,能够理解、学习、计划和解决问题;ASI是超级人工智能,指在几乎所有领域都超过最优秀的人类所具备的智能、知

识、创造力、智慧和社交能力的智能系统。目前,ANI已经广泛应用,AGI处于研发阶段,而大模型是实现AGI的重要路径。

AI的三种类型比较大模型是实现AGI的重要路径,其具有诸多特点

擅长领域具备能力发展成熟度

⚫通用性⚫高投入

大模型可以快速并大模型具有重投入、

大规模地与云计算、长周期的特点,如每

互联网等其他技术次测试需要海量的算

某一特定领域具备执行能力已应用广泛结合,广泛地应用力资源,训练一次成

专用人工智能

(ANI)在经济的各个领域。本高达千万美元。

四大特点

拥有能够与人类相媲美

大部分领域处于研发阶段⚫工程化

通用人工智能(AGI)的智慧⚫涌现性

大模型对数据、算法、

大模型参数超过百

算力要求极高,需要

亿级时,模型性能

工程化的经营思路。

会呈现出指数级增

需要严格把控数据清

长,同时能够对未

洗,把控用于关键性

经专门训练的问题

训练的数据,和构建

所有领域全知全能尚处早期举一反三。

超级人工智能(ASI)大规模高质量训练的

算力。

资料来源:灼识咨询5

大模型产业图谱

大模型产业涵盖了行业应用、产品服务、模型工具和基础设施四个关键层面,广泛应用于各行业与垂直场景,

前景广阔。

大模型相关产业图谱

金融教育艺术设计游戏医药文化娱乐其他

文本图像音频视频虚拟空间代码

算法模型

工工具平台模型托管/交易

基数据芯片云平台

资料来源:中国信通院,灼识咨询6

大模型的演变

大模型的演变经历3个阶段:基础大模型具备大量知识储备,能理解并生成内容,质量差强人意;精调大模型能

按照人类偏好及普世价值取向、并保证一定安全性的前提下,生成高度可用的内容;而出现能力涌现的大模型

所生成的内容接近人类水平。

大模型演变概览高/强低/弱

1基础大模型2精调大模型3能力涌现的大模型

模型示意图,以GPT-3模型为例指令精调示意图能力涌现示意图

取余数国际音单词解谜修辞手法

学习输出模板运算标转写

每层

…千个人工对大量问题的回答形成模板供模型学习准准准

确准确确

性确性性

节点性

每层

…千个建立评分机制

模节点人工对模型的数个输出进行排序,建立奖励模型真实场景映射多任务自然语境理解

型并为后续结果进行打分问答语言理解

变每层

准准准准

化…千个确确确确

根据结果重复优化过程性性性性

节点

…模型根据打分结果调整后续输出,并不断重复上

述过程以优化模型

共128层

模型规模

•GPT-3采用了96层的多头Transformer,参数量达•指令精调在于确保模型输出结果的准确性及安全性,•随着模型参数的指数级增长,大模型能力呈现明显

到1,750亿,并使用45TB数据进行训练。在该阶段需要使用较多的人工标注介入。在此基础上,的爆发增长,呈现能力涌现的情况。

引入奖励模型,让模型脱落人工指引,实现自优化。

特•具备大量知识储备,能理解并生成语言,质量差强•能按照人类偏好及普世价值取向,并保证一定安全•具备逻辑推理能力及上下文理解能力,更接近人类

征人意。性的前提下生成高度可用的内容。水平。

资料来源:“AreEmergentAbilitiesofLargeLanguageModelsaMirage?”,灼识咨询7

大模型的终端用户

大模型的终端用户包括C端、B端和企业自用三类。C端用户一般使用标准化的模型产品,B端用户更倾向于选择

能满足行业或企业特定需求的个性化解决方案,而企业自用的模型则旨在降低运营成本、提高运营效率、优化

产品的用户体验。

大模型的终端用户分类

主要特点主要变现模式应用案例

•主要用于个人娱乐、学习和创作

•标准化程度高,普适性强•C端用户订阅

C端

•强调用户友好性与互动性

•针对企业和机构,提供针对性解决方案的大

模型

•通常基于基础大模型,根据不同企业、行业

•B端企业用户订阅或购买非

的需求进行一定程度的定制,模型较为异质

定制化行业模型

B端化、用途多样

•强调模型在不同领域的专业能力,以及客户

的数据隐私和安全

•主要用于内部业务优化

•无直接变现,主要作用在于

企业自用•个性化定制,解决企业独特的问题和需求

降低企业自身运营成本并提

•数据保密性至关重要,强调内部控制和数据升效率

安全

资料来源:灼识咨询8

大模型的表现

大模型在多领域表现卓越,在自然语言理解、学习能力、视觉听觉识别等领域可以媲美甚至超越人类。提高大

模型的创造能力、减少对数据的依赖性、加强隐私保护等将会是大模型迭代的重点。

大模型在不同场景中与人类表现对比

MNISTMNIST(handwriting(手写识别)recognition)SwitchboardSwitchboard(speech(语音识别)recognition)

ImageNetImageNet(image(图像识别)recognition)SQuADSQuAD1.11.1(reading(综合阅读)comprehension)

听觉识别

直觉视觉SQuADSQuAD2.02.0(reading(综合阅读)comprehension)2GLUEGLUE(language(语言理解)understanding)

识别

0.2

创造性思维

抽象思维

伦理是非人类表现

学习能力判断

自然语言0

理解

艺术表现

情感判断

大模型尚不具备-0.2

大模型具备但仍需改进

大模型具备且可与人类媲美

-0.4

•视觉/听觉识别:基本达到甚至一定程度上超越人类,准确率较高

•学习能力:具备自动学习能力,在特定任务和数据集上可以超越

人类

-0.6

•自然语言理解:熟练掌握多种人类语言,基本达到甚至一定程度

上超越人类,存在一定语言不够自然(机械化)的问题

•创造性思维:能够生成创造性内容,但通常是在已知样本的基础

上进行创作或是需要人类指导/二次修改

•抽象思维:相对有限,依赖于数据与模型参数-0.8

•艺术表现:可以生成艺术作品,但通常缺乏情感和创新

•情感判断:能够进行情感分析,但不具备真实情感体验

•伦理是非判断:不具备,可能引发错误或数据隐私等安全问题

•直觉:不具备-1

19982003200820132018

资料来源:“ComputersaceIQtestsbutstillmakedumbmistakes.Candifferenttestshelp?”,灼识咨询9

大模型的发展现状

随着大模型的不断演进,它们的参数规模也呈现出指数级增长的趋势;与此同时,它们的复杂性和功能愈发提

升,使得大模型能够在各领域担任更加多样和复杂的任务。

大模型的发展及参数量

参数数量

WuDao2.0

3.2e+12Megatron-GPT-4(1.8T)

TuringNLG

530BPaLM(540B)

GPT-3175BMinerva(540B)

BLOOM

HyperClovaGopherErnieBot(260B)

(davinci)PanGu-uOPT-175B

3.2e+11日日新

Jurassic-1-GLM-130B(180B)

JumboChinchillaSparrow(70B)

Claude(52B)

3.2e+10TuringNLG

T5-11BDALL-ECodexGPT-NeoX-20B

Megatron-LM通义千问(7B)

GPT-J-6BERNIE3.0

(Original,8.3B)Jurassic-XChatGL

T5-3BM-6B

CogViewDALL·E2

3.2e+9MeenaGPT-Neo

WuDao-WenStableDiffusion

Yuan(LDM-KL-8-G)

GPT-2Grover-Mega

ERNIE-GEN

3.2e+8(large)

20192020202120222023时间

分析

•在大模型出现之前,机器学习算法的参数量以平均每5-6年翻一个数量级的速度快速增长,而大模型的出现使模型参数量的增长速度大幅提升。

•举例而言,大模型及多模态模型的鼻祖之一GPT-2发布于2019年,参数量为15亿;GPT-3发布于2020年,参数量即达到了1,750亿,相比GPT-2增长了100多倍。粗略计算,在大模型兴起的前几年,

大模型的参数量每年即可增长1-2个数量级。

•在目前已公开参数量的大模型中,参数量最多的达到了1.75万亿。

资料来源:HAI,灼识咨询10

大模型的应用

大模型正在各应用场景崭露头角,其应用场景广泛且多样化。从自然语言处理到图像生成,从音频处理到视频、

3D场景创建,大模型能够应对多领域的挑战。未来,大模型有望为更多应用场景带来更多机会和创新。

大模型的应用场景

应用场景主要用途相关大模型描述

GPTCohere•模型比较擅长通用的短/中篇幅写作,通常用于初稿

及更新稿撰写

•营销(内容)•通用写作GopherAnthropic

文本•模型能够理解上下文,生成更自然的文本,准确性

•销售(邮件)•记笔记

OPTAI2逐渐接近人类水平,广泛应用于智能客服、文本摘

要、内容生成等领域

BloomYandex

•代码生成可能在短期内对开发人员的生产力带来重

•代码生成•文本到SQLGPT

编程大影响

•代码文档化•网页应用构建Stability.ai

Tabnine•能降低非开发人员编程的门槛

•在图像识别、分割、风格转换等领域有广泛应用,

•图像生成•媒体/广告Dall-E2

图像能够处理复杂的视觉任务

•消费者/社交应用•设计Craiyon

StableDiffusion•不同风格的图像模型以及编辑和修改生成图像技术

•对声音和语音的理解能力逐渐提高,生成的音频逐

音频•语音合成

OpenAI渐自然、不机械,且接近人类水平

•用于自动剪辑、特效创作、噪音修复、虚拟场景制

视频•视频编辑/生成

X-CLIPMake-A-Video作等,大大提升了编辑效率

DreamFusion•在游戏、电影、虚拟现实、建筑和实体产品设计等

3D•3D模型/场景搭建

MDM(MotionDiffusionModel)大型创意市场极具潜力

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论