【智顶科技】2024年全球AIGC产业全景报告_第1页
【智顶科技】2024年全球AIGC产业全景报告_第2页
【智顶科技】2024年全球AIGC产业全景报告_第3页
【智顶科技】2024年全球AIGC产业全景报告_第4页
【智顶科技】2024年全球AIGC产业全景报告_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

年全球AIGC

产业全景报告2024Global

AIGC

Industry

Report报告背景2024年,生成式AI已全面进入应用规模化推广,探索新场景和商业模式的新发展阶段

伴随AI大模型的普及程度不断加深

AIGC产业发展重点从去年关注度最高的模型层向场景应用层转变

AIGC为营销、

传媒、

金融、

医疗、教育、

娱乐、

办公、

制造、

科学发现等多个领域带来前所未有的变革。搭载大模型的AI

PC、AI手机、

智能汽车相继推出,为用户带来更加便捷的使用体验。此外,具身智能也成为今年关注度颇高的领域,未来AI模型与人形机器人将密切融合,产生更多应用场景与商业机会。在此背景下,天津市人工智能学会、

至顶科技、

至顶智库联合发布《2024年全球AIGC产业全景报告》

,报告从人类语言和机

器语言的发展历程出发,全面展现全球AIGC产业的发展历程

,对AIGC典型技术及产品成熟度进行研判

,对AIGC产业投融资情况进

行梳理,具体展现AIGC各细分场景的应用情况,最后报告提出全球AIGC产业的八大前沿趋势。

为政府部门、

行业从业者、

教育工

作者以及社会公众更好了解2024年AIGC的发展进程提供参考。天津市人工智能学会、至顶科技、至顶智库2024年11月©2024.11ZD

Insights

2报告目录1.

产业概况篇2.

基础设施篇3.

场景应用篇4.

用户调研篇5.

前沿趋势篇开篇:伴随人类语言的发展,机器语言演进到自然语言阶段语言发展历程分为三大阶段。语言1.0时代:

从人类语言诞生到公元前16世纪殷商时期甲骨文的出现,文字成为人类交流的重要方式;语言2.0时代:

从蔡伦发明造纸术到世界第一台电子计算机诞生,语言开始通过各类机器实现传播;语言3.0时代:

伴随NLP及生成式AI等技术的快速发展与应用落地,机器生成和创造语言的方式成为了可能。机器语言发展历经五大阶段,从二进制代码发展到自然语言时代,新的“机器语言”交互方式诞生。公元前16世纪:甲骨文公元前2900年:古埃及象形文字公元前3200-2600年:

楔形文字新石器时代中期以

后:中国象形文字公元前10万年-公元前16世纪1946年:第一台电子计算机1876年:贝尔发明第一部电话1837年:美国人摩尔斯和两个英

国工程师库克

怀斯顿

同时发明电报公元1041-1048年间:

昇发明活字印刷术自然语言伴随人工智能技术的发展

,使

用自然语言替代原有机器语言

编程的方式成为可能,开发者

可以使用自然语言编写指令,

然后由大型语言模型将其转换

为计算机可以执行的代码

来将使更多人无需学习复杂的

编程语法也能轻松创建程序。解释型高级编程语言解释型高级编程语言如

Python

Ruby

,不

需要预编译,可以在运

行时解释执行,加快了

开发速度

通常具有丰

富的库和框架,使得开

发者能够更容易地实现

各种功能。2001年:Bengio等人提出前馈神经网络1969年:互联网出现1950年:©2024.11ZD

Insights

2017年:Transformer架构提出2022年:OpenAI发布ChatGPT人类语言3.0时代人类语言1.0时代人类语言2.0时代机器语言5.0时代机器语言1.0时代机器语言3.0时代机器语言4.0时代机器语言2.0时代自然语言公元105年-20世纪40年代公元105年:汉朝蔡伦发明造纸术资料来源:至顶智库结合公开资料整理绘制。1972年高级编程语言公元前10万年:人类原始语言诞生1940年代二进制代码20世纪50年代至今1950年代助记符号艾伦·图灵提出图灵测试1990年代XCHANL2022年DECCLR4AIG

C

成熟度曲线AIG

C

领域最新进展AIG

C

产业投融资情况产业概况篇AIG

C

产业全景图谱AIG

C

发展路线图AIG

C

产业政策环境1.1

2024年全球AIGC产业全景图谱天津市人工智能学会、

至顶科技、

至顶智库联合发布2024年全球AIGC产业全景图谱。图谱主要分为基础设施层(AI服务器

AI计算集群

、AI芯片

MaaS平台

、AI数据服务)

;模型层

(通用大模型、行业大模型);场景应用层(智能助手、金融、

医疗、

办公、教育、

奥运、

智能汽车、

营销、

影视、

法律、政务)

图谱中涉及各领域全球代表性企业和相关机构,为读者提供更为详实的

参考信息。相比去年,基础设施层新增MaaS平台和AI数据服务;模型层新增通用大模型和行业大模型的类别划

分;场景应用层按细分场景进行划分。2024年全球AIGC产业全景图谱所涉及的企业数量分布24

17

15

14

14

6

7

7

10

8

5通用大模型行业大模型4151基础设施层AI服务器AI计算集群AI芯片MaaS平台AI数据服务6912

12

10

资料来源:至顶智库整理绘制。

6场景应用层模型层©2024.11ZD

Insights

智能助手金融医疗办公教育奥运智能汽车营销影视法律政务社会关注度4.39亿数字人图表说明:萌芽阶段:

技术/产品处于早期,推出时间短,应用

场景少,普及度不高。爬升阶段:

技术/产品持续迭代,有相关应用场景,

有一定普及度。成熟阶段:

技术/产品成熟稳定,应用场景多,普及

度高。AI手机/PC/智能汽车:

特指搭载AI大模型的各类终端AIGC应用的成熟度。社会关注度:选取2024年微信指数最高点数值,体现

社会对于某项技术/产品的关注程度。图中圆圈大小

反映社会关注度高低。统计数据截至2024年11月。AIGC技术产品萌芽阶段AIGC技术产品爬升阶段AIGC技术产品成熟阶段

图表来源:至顶智库结合公开资料及专家调研整理绘制。©2024.11ZD

Insights

1.2

至顶AIGC成熟度曲线(2024)社会关注度6.69亿社会关注度

3亿c

视频生成

模型端侧模型社会关注度

7200万RAG

提示工程

微调•社会关注度

7446万人形机器人智能汽车AI手机社会关注度

9.6万社会关注度

11万社会关注度

761万社会关注度

33万社会关注度

120万社会关注度

630万社会关注度

43万社会关注度

1020万图像生成

模型社会关注度

7322万.AI

Agent大语言模型合成数据AI

PC71.3规模定律(ScalingLaw)将持续推动AIGC产业发展规模定律是指随着训练数据

模型大小和计算资源的增加,大语言模型的性能会有所提升的规律

2020年由OpenAI提出;2022年,GoogleDeepMind研究固定成本下最优的模型参数量和训练数据量,得出训练数据量应当和参数量同等提升,并训练出Chinchilla模型。伴随OpenAI

o1模型的发布,ScalingLaw从模型训练扩展演进到推理扩展阶段。MMLU评分

全球主流大模型性能表现符合规模定律

Falcon

180B

U-PaLM

540B

1800亿参数

3.5万亿token

,3.76e24

Flops

©2024.11ZD

Insights

Gopher

0.4B

70亿参数

2万亿token

,8.4e22

Flops

10090807060504030201002800亿参数

,3000亿token,6.31e23

Flops700亿参数

,1.4万亿token,5.76e23

Flops400亿参数

,1万亿token,2.4e23

FlopsLLaMA

2

34B●

Falcon

40B

LLaMA

33B110100100010000资料来源:

MMLU,Epoch

AI,至顶智库整理绘制。Mistral

7BQwen

7B●BLOOM

176BRoBERTa-base

125M●ChinchillaGeminiUltra~1760BGLM

130B●Gopher

280BQwen1.5

72BLLaMA

65BLLaMA

2

13BLLaMA

2

7B参数量8Google企业名称企业LOGO总部

所在

地生成式AI产业主要细分领域AI芯片AI计算集群MaaS平台AI大模型AI场景应用/解决方案闭源开源轻量智能助手办公金融医疗汽车教育营销商汤

中国

o

o

oo

o

ooo

资料来源:至顶智库结合公开资料整理绘制。

9©2024.11ZD

Insights

1.4全球科技领军企业在AIGC产业的布局韩国企业韩国√腾讯

Tencent腾讯

阿里云

C-〕阿里云火山引擎京东华为科大讯飞C

Metaintel.Qual

cowwMetaOpenAI苹果英伟达英特尔高通美国

美国

美国美国

美国

美国

美国

美国中国中国

中国

中国

中国

中国亚马逊云科技

微软●●√●√

√√●●

●√√√

√●中国√美国企业中国企业谷歌美国三星百度√√√√√√2017年,伴随Transformer的出现,AI大模型在全球掀起开发浪潮

2022年11月,ChatGPT的正式发布

,加速了各类科技企业开发大模型的进度,以谷歌、

Meta、

OpenAI

、Anthropic、百度、

阿里、腾讯、

科大讯飞、

智谱等国内外领军科技企业,推出语言、

图像、视觉、

多模态等各种类型的AI大模型,主流模型具有生成各类文案、

图像、视频等能力。

此外

,适用于

金融、

医疗、教育、

营销、客服等领域的行业大模型也层出不穷

,不断推动商业化落地进程。1.5全球AIGC产业发展路线图(2015-2024)

资料来源:至顶智库结合公开资料整理绘制。

10©2024.11ZD

Insights

Transformer

BERT

Ernie

1.02020.5发布GPT-32020.6

Gshard

CodeGeeX

OPT-175B发布GPT-2发布GPT-1

2020.102020.112022.112015.122017.62018.10

Ernie2.0

Ernie

3.02022.8Make-a-Video

视频生成模型DALL·E图像生成模型DALL·E2图像生成模型2022201720212019202020182015

RoBERTa2021.5

2021.1发布ChatGPT2022.9

OpenAI成立GLM-130B2021.12WebGLMGLM-10B2022.42018.62021.72022.52021.92019.22019.72019.3LaMDAGLaMGLMmT5文心大模型4.0工具版Gemma

2

i-

i

视频

Mistral

Large

Mixtral

8x22BGrok-1.5

GLM-4

2024.2

Grok-2

豆包大模型

Grok-1.5V

Llama

3

Claude

3

Opus

Gemini

1.5Grok-2

mini

r

2

GPT-4o

ia1.5

ProGemmGeminMogeeaNLstrastraMM生成模型Sora发布型min型侧量端Ph轻4

0Turbo文心大模图像生成模型

文心大模型4.0AndesGPT

端侧模型OPPO2023.6

2023.71.5全球AIGC产业发展路线图(2015-2024)

Claude3

Haiku

Claude3

Sonnet2024.42024.62024.3©2024.11ZD

Insights

Gemini

Live图像智能语音助手

Pixel

Studio生成应用谷歌AI手机搭载Gemini模型

TensorG4AI手机芯片Gemini

1.0UltraGemini

1.0ProGemini

1.0Nano轻量模型/端侧模型Phi-3图像生成模型Veo视频生成模型Gemini

1.5

Flash

轻量模型Llama3.2视觉模型

(11B和90B)文本生成模型1B和3B)日日新SenseNova5.5大模型体系日日新

5.5Lite端侧模型OpenAI与FinancialTimes达成合作,提升ChatGPT体验OpenAI与Apple达成合作,未来苹果产品将搭载ChatGPTQwen2.5开源通义万相发布视频

生成模型CodeGeeX4

代码生成模型

CogVideoX视频生成模型2023.82023.52023.92023.10Qwen-72BQwen-1.8BQwen-Audio

(音频大模型)资料来源:至顶智库结合公开资料整理绘制。讯飞星火V3.5

星火语音大模型

星火开源-13BAI芯片MTIAv1PaLM2ChatGPT

Enterprise

企业级产品推出Claude2.1长文本200KToken日日新SenseNova

大模型体系2023.3ChatGPT

Plus订

阅服务推出CogVLM

ChatGLM3

智谱清言Ernie

3.5

端侧模型2024.92024.8蔚来NOMI

GPT

端侧模型CM3leon

文生图模型

Llama2日日新SenseNova4.0大模型体系日日新SenseNova5.0大模型体系理想Mind

GPT

端侧模型豆包·视频生成

模型蓝心大模型1B

端侧模型Emu视频生成模型Qwen-VL视觉语言模型20232024Microsoft

Copilot智能助理GPT-4o

mini

SearchGPTChatGLM2

智谱清言OpenAIo1

推理模型ERNIE

Bot

文心一言发布GPT

StoreClaudePro

Mistral

7BMetaAI

智能助理Phi-3.5轻量模型腾讯混元大模型讯飞星火V1.5讯飞星火V2.0讯飞星火V1.0讯飞星火V4.0讯飞星火V3.0通义千问2.5通义千问2.0通义千问1.0小米MiLMMixtral

8x7BImagen3VisualGLMClaude3.52023.122023.11ERNIE4.0Llama3.1ChatGLMDALL-E32024.72024.12024.52023.42023.2PaLM-ELlama

1SonnetClaudeClaudeGPT-4112024年10月Ministral

3B/8B包括Ministral3B和Ministral8B两种

轻量级模型,均支持128k上下文且

性能媲美Gemma

2、Llama

3.1开源模

型。Ministral8B具有特殊的交错滑

动窗口注意力机制(SWA),可实现更

快和内存高效的推理。2024年7月Mistral

Large

21230亿参数的大小使其能够在单

个节点上以大吞吐量运行

。Mistral

Large2拥有128k上下文窗口,支持

英语、法语、

中文等数十种语言及80多种编程语言,在代码和推理、指令遵循、

多轮对话等方面表现突

出。Mistral

Large

2允许用于研究和非商业用途的使用和修改。2024年4月Mixtral

8x22BMixtral8x22B是一个稀疏专家混合

(SMoE)

模型,仅使用

1410亿激活参

数中的390亿,具有高成本效率

Mixtral8x22B精通英语

法语

大利语

、德语和西班牙语

,具有很

强的数学和编码能力

,64K

token上

下文窗口允许从大型文档中精确调

用信息。2024年6月多模态模型

Claude

3.5

SonnetClaude

3.5Sonnet

的运行速度是Claude

3

Opus

的两倍,且推理、

读理解、数学、科学和编码能力更

强,也是Anthropic迄今最强的视觉

模型;Claude.ai

新增了Artifacts

能。

Artifacts

用户

Claude

交互方式的新功能。用户可

以实时查看

编辑和构建Claude的创作,并将生成的内容无缝集成

到项目和工作流程中。2024年3月多模态模型Claude

3Claude3Opus是最智能的模型

,在

高度复杂的任务上具有市场最佳的

性能;

Claude3Sonnet在智能和速

度之间实现理想的平衡;

Claude3

Haiku是最快、最紧凑的模型。2024年9月推理模型

OpenAIo1OpenAI

o1在处理物理学、化学和生物学领域的复杂问题时展现出

了接近博士的专业能力。在国际

奥林匹克数学竞赛中,展现出

83%的准确率水平

其编程能力

还在Codeforces竞赛中表现超过

89%的人类选手。2024年5月多模态模型GPT-4oGPT-4o采用更自然的人机交互

,接受文本、音频、

图像和视频的任意组合作为输入

,并生成文本、音频和图像的任意组合输出。2024年2月视频生成模型Sora视频生成模型Sora能够生成时长一

分钟的高保真视频

。OpenAI在可变

持续时间、分辨率和宽高比的视频

和图像上联合训练文本调节扩散模

型,能在时间上向前或向后扩展视

频;可修改输入视频的风格和环境;

可连接两个输入视频,在不同主题

和场景构成的视频之间无缝过渡。2024年8月Gemma

2轻量级轻量级Gemma

2

2B

拥有20亿参数,具有内置的安全改进以及性能和

效率的强大平衡。

可在各种硬件上高效运行,从边缘设备和笔记本

电脑到使用

VertexAI

和Google

KubernetesEngine

(GKE)

的强大云

部署。

可根据商业友好的Gemma条款进行研究和商业应用。2024年6月视觉语言模型PaliGemma及开源模型Gemma

2PaliGemma是开放式视觉语言模型,可在广泛的视觉语言任务中实现卓越的微调性能,包括为图片和短视频描述生成、视觉问答、理解图像中的文本、对象检测和对象分割;Gemma

2开源9B和27B版本,其中Gemma

2

27B性能与

Llama

3

70B相媲

美,大小不到Llama

3

70B

的一半。2024年5月多模态

Gemini

1.5Flash1.5Flash是通过API提供的速度最快

的Gemini模型,比

1.5

Pro

更轻量级

但具有强大的多模态推理能力,在

总结摘要、聊天应用、

图像和视频字幕生成以及从长文档和表格中提取数据等方面表现出色。,2024年5月视频生成模型VeoVeo

可生成时间超过一分钟的1080p

分辨率视频。包括生成查询网络

(GQN)、

DVD-GAN

Imagen-Video

Phenaki

WALT

VideoPoet和Lumiere

,提高质量和输出分辨率。2024年5月图像生成模型Imagen

3Imagen

3是Google最高质量的文本到

图像模型,可生成高细节水平、逼真的图像,与之前的模型相比,分

散注意力的视觉干扰更少。2024年2月开源模型

GemmaGemma更加轻量,拥有2B和7B版本模型权重也一并开源,且允许商用。

采用与Gemini模型相同技术构建。2024年2月Gemini

1.5Gemini

1.5采用新的专家混合(MoE)

架构

,使训练和服务更加高效

其中

Gemini1.5Pro是中型多模态模型,配备了标准的

128k

token上下文窗口。2024年9月开源模型Llama

3.2包括视觉模型(11B和90B)和文本

模型(1B和3B)

,提供预训练与对

齐版本

,可通过torchtune进行微调

也可使用torchchat在本地部署

,还

可通过Meta

AI进行使用。2024年7月开源模型Llama

3.1Llama3.1405B使用15万亿token在超

过16000个H100GPU上训练

,上下文长度扩展到128K。2024年4月开源模型Llama

3具有80亿和700亿参数

,预训练数

据集达到15万亿token进行训练,

训练数据来源于30余种语言。1.62024年全球领军科技企业在AIGC领域的最新进展2024年4月小尺寸模型Phi-3

mini可用于手机上运行的小尺寸模型

其中Phi-3mini拥有38亿参数,经

3.3

万亿token训练。Phi-3-mini有两种上下文长度变体

:4K和

128K

token。©2024.11ZD

Insights

资料来源:至顶智库结合公开资料整理绘制。你open

AlO

MetaGoogleGoogleAN

THRO

P\C122024年10月讯飞星火4.0Turbo文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、

多模态能力均超过GPT-4

Turbo,数

学和代码能力超越GPT-4o,效率相

对提升50%,国内外中英文14项主

流测试集中实现9项第一。2024年6月讯飞星火大模型V4.0实现对标GPT4-Turbo

,在文本生成、

语言理解、知识问答、逻辑推理、数学能力等方面实现超越。2024年1月讯飞星火大模型V3.5模型在语言理解、文本生成、知识问答、逻辑推理,数学能力、

代码能力和多模态能力七个方面进行全面升级,其中语言理解、

数学能力超过GPT-4Turbo。代码

达到GPT-4Turbo

96%,多模态理

解达到GPT-4V

91%。2024年1月星火语音大模型在中文、英语、法语、俄语等首批37个主流透种的语音识剧效果

超过OpenAl

WhisperV3。在多语种

语音合成方面,星火语音大模型

的首批40个语种平均MOS分绝对提

升0.25,拟人度超83%。2024年9月开源模型Qwen2.5通义大模型家族已全面涵盖语言

图像、视频、音频等

Qwen2.5全系列模型都在18T

token数

据上进行预训练

,Qwen2.5-72B模型

在MMLU-rudex

基准

MBPP基准和

MATH

基准的得分高达86.8

88.2

83.1。通义万相发布视频生成模型文生视频中,支持多语言输入和多种比例生成

,并可以通过灵感

扩写功能丰富视频内容表现力;图生视频中,支持将上传图片按

照比例转化为动态视频

,并能通

过提示词控制视频运动。2024年5月通义千问2.5通义千问2.5版本的理解能力、逻辑推理、指令遵循、代码能力分

别提升9%、

16%、

19%,10%。2024年4月开源模型Qwen1.5-32BQwen1.5-32B在MMLU、GSM8K、HumanEval以及BBH等多种任务上展

现出颇具竞争力的表现,优于其他

30B级别模型。2024年3月开源模型Qwen1.5开源

0.5B

、1.8B、

4B

、7B

、14B

72B共计6个不同规模的Base和Chat模型。2024年7月飞桨框架3.0飞桨框架3.0

是面向大模型

异构多芯进行专属设计,向下适配异构多芯,充分释放硬件潜能;

向上一体化支撑大模型的训练、推理。

同时具有动静统一自动并行、编译器

自动优化、大模型训推一体、

大模型多硬件适配四大能力

,全面地提升了服务产业的能力。2024年6月文心大模型4.0Turbo网页版、APP、API

陆续开放,通过数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强等核心技术的持续创新

,速度更快,效果更好。2024年4月文心大模型4.0工具版在工具版上,可以通过自然语言交互,进行文档问答、数据分析、代

码执行。提供基于大模型来开发各种应用的工具

,包括智能体开发工具AgentBuilder

,AI原生应用开发

工具AppBuilder,以及各种尺寸的

模型定制工具ModelBuilder。2024年4月智舱大模型2.0智舱大模型2.0采用全新MoE架构,可支持本地化部署

,并配套专属开发工具链,支持车企高效定制品牌特色,基于智舱体验打造差异化竞争力。2024年10月基座大模型GLM-4-PlusGLM-4-Plus

在各大语言文本能力

数据集上获得与

GPT-4o

及405B

Llama3.1

相当的水平,在语言理

解、逻辑推理、指令遵循、长文

本输出方面都有较大突破。2024年7月视频生成模型CogVideoX智谱发布AI

视频模型「清影」

,30秒将任意文图生成视频

,并开源与「清影」

同源的视频生成模型CogVideoX。2024年7月代码生成模型CodeGeeX4开源CodeGeeX4-ALL-9B

,集代码补

全和生成、代码问答、代码解释器、

工具调用、联网搜索、项目级代码问答等能力于一体的代码大模型。2024年1月GLM-4GLM-4

,整体性能相比GLM3全面提

升60%

,支持更长上下文

更强的多模态,支持更快推理速度,更多

并发,降低推理成本。GLM-4实现自主根据用户意图,

自动理解、规

划复杂指令,

自由调用网页浏览器、

Code

Interpreter代码解释器和多模

态文生图大模型,以完成复杂任务。2024年9月豆包·视频生成模型遵从复杂prompt

,解锁时序性多拍

动作指令与多个主体间的交互能力。

具备多镜头语言能力,并能完成在一个prompt内实现多个镜头切换。支持多种视频风格

,还包含六种不同比例的视频。2024年5月豆包大模型发布9款豆包系列大模型

,包括豆包通用模型Pro/Lite

角色扮演模

型、语音合成模型、声音复刻模型、

语音识别模型、文生图

模型

、Functioncall模型

、向量化模型

其中豆包通用模型pro支持128k长文

本,全系列可精调

,具备更强的理解、

生成、逻辑等综合能力。2024年9月腾讯混元Turbo相比于前一代混元Turbo模型,新一代的训练效率提升108%,推理效

率提升100%,推理成本则降低为前

一代的一半。在多个基准的测试上

已能够对标GPT-4o。2024年5月AI助手元宝基于腾讯混元大模型

,具备看

、说等多模态能力

,在知识学

生活百科

职场办公

、趣味

创作等多个领域提高效率。1.62024年中国领军科技企业在AIGC领域的最新进展2024年5月Baichuan

4发布最新一代基座大模型

Baichuan4

同时推出首款AI助手“百小应”。

Baichuan4

相较Baichuan

3在各项能力上均有极大提升

,其中

通用能力提升超过10%,数学和代

码能力分别提升14%和9%。2024年7月日日新SenseNova

5.5日日新5.5具有6000亿参数,综合

性能较「

日日新5.0

」提升30%。

交互效果和多项核心指标实现对

标GPT-4o

;「

日日新

5o」,流式多模态交互,带来全新AI交互模

式;端侧模型升级,发布日日新

5.5

Lite。2024年10月Yi-LightningYi-Lightning在ChatbotArena榜单中

以1287的竞技场分数位列大语言模型性能的世界第6

,在数学模块位

列世界第3,超越GPT-4o以及Claude

3.5Sonnet等行业内顶尖模型。©2024.11ZD

Insights

资料来源:至顶智库结合公开资料整理绘制。C-〕阿里云Tencent腾讯131.7测试集成为评判AI模型性能的重要手段大模型测试集是评估和提升人工智能模型性能的重要工具

,为开发者提供标准化平台,用于量化和比较不同模型的性能,有助于加速模型的迭代

和优化。

相关测试集通常涵盖多个领域和任务,

以确保全面评估模型的通用性和专业性。

按类别来看,全球AI大模型测试集分为综合考试类、

理解推理类、

数学科学类、代码类。其中,综合考试类的MMLU(Massive

Multitask

Language

Understanding)测试集使用较为广泛,

由加州大学

伯克利分校于2020年9月发布,涵盖57个学科,从人文到社科到理工多个大类的综合知识能力。具体如下表所示。全球主流AI大模型测试集理解&推理HellaSwag英文艾伦人工智能研究所BBH英文GoogleWinoGrande英文华盛顿大学/艾伦人工智能研究所RACE-H英文卡内基梅隆大学数学&科学GSM8K英文OpenAIMATH英文加州大学伯克利分校GPQA英文纽约大学、Cohere、Anthropic代码HumanEval英文

OpenAI

资料来源:至顶智库结合公开资料整理绘制。

14©2024.11ZD

Insights

加州大学伯克利分校上海交通大学/微软亚洲研究院/墨尔本大学艾伦人工智能研究所清华大学/爱丁堡大学/上海交通大学MMLUCMMLU

ARC-C

C-Eval英文中文

英文

中文发布单位综合考试测试集语种类别发布时间政策名称发布机构政策内容美国2024年4月Futureof

ArtificialIntelligenceInnovation

Actof2024《2024年人工智能创新法案》美国国会成立美国人工智能安全研究所,

旨在制定确保国家安全、

公共安全和个人权利的人工智能

标准。

创建人工智能测试计划,帮助发现人工智能生态系统中的漏洞

组建人工智能创新

和标准联盟,鼓励人工智能创新合作,协调各国人工智能标准

。由美国国家科学基金会指

导启动双边和多边人工智能研究合作

,这一发展将推动协调创新和安全人工智能发展。2024年1月The

California

ArtificialIntelligenceTransparency

Act《加州人工智能透明度法案》美国加州议会旨在赋予消费者识别AI生成产品的能力,

以降低AI生成内容可能被滥用的风险

要求大型AI生成内容提供商对其生成的图像、

视频、

音频等媒体内容添加水印,并为消费者提供相

应的查询平台和查询服务,确保消费者拥有对产品必要信息的知情权

该法案标志着美国

加州在为人工智能生成产品制定明确准则方面迈出了重要一步。2023年5月National

ArtificialIntelligence

ResearchandDevelopment

Strategic

Plan《国家人工智能开发战略计划》美国白宫旨在确保人工智能技术的发展符合国家的价值观、

保护公民权利、

促进经济增长并保护国

家安全。

该计划提出培养联邦机器学习方法

,提高模型通信和从多个设备更新到共享的全

局模型的效率。

研究可扩展通用人工智能系统,不断创新推出基础模型在语言和图像任务

上的应用,解决在数据库上训练模型的隐私问题,提升大模型的有效性、

可靠性、

安全性。欧盟2024年9月Councilof

Europe

Framework

ConventiononArtificialIntelligenceand

HumanRights,Democracy

andthe

Ruleof

Law《人工智能与人权、民主及法治框架公约》欧盟委员会旨在确保人工智能活动符合人权、民主和法治。

公约促进成员国间以及全球范围内的合作

以强化共同价值观;关切人工智能发展可能导致的歧视和经济

社会不平等;强调人工智

能系统的透明度和负责创新的重要性;国家需采取措施

,保障人工智能活动中对隐私和个

人数据的保护;

各成员国需通过法律和行政手段,确保人工智能系统不危害民主进程和法

律的尊重;指定开展国际合作和机制监督,

以确保其条款的有效实施。2024年7月EU

ArtificialIntelligence

Act《欧盟人工智能法案》欧盟委员会该法案根据风险将人工智能分类为四个等级:不可接受风险的AI(如社会评分系统和操控

性AI)

被禁止;

高风险AI系统受到严格监管;

有限风险AI系统则面临较轻的透明度义务;最小风险AI(如大多数现有应用)

不受监管

高风险AI系统的主要责任在于提供者(开发

者)

,无论其是否在欧盟内,服务提供者承担相关义务。

通用AI模型的提供者需提供技术

文档和使用说明,并遵守版权指令,存在系统性风险的模型还需进行评估和网络安全保护。日本2024年4月《商业人工智能指南1.0》日本总务省、日本经济产业省旨在应对生成式人工智能技术变化,并提供统一的人工智能治理指导原则

该指南草案建

议人工智能开发人员收集和处理合理的数据以用于模型的学习;定期评估AI模型的输入和

输出,

以监测任何生成的偏见;还应当向利益相关方披露用于训练AI的数据收集方法以及AI模型的训练方法;确保AI商业参与者之间的合作,从价值链和风险链的角度出发。

资料来源:至顶智库结合公开资料整理绘制。

15

©2024.11ZD

Insights

1.8全球AIGC产业发展的政策环境2023年以来全球发布的AIGC相关政策发布时间政策名称发布机构政策内容国家层面2024年6月《国家人工智能产业综合标准化体系建设指南(2024版)

》工业和信息化部、中央网信办、国家

发改委、国家标准化管理委员会指南提出机器学习、

知识图谱、

大模型、

自然语言处理、

计算机视觉等关键技术的标准,

其中大模型标准包括大模型通用技术要求、

评测指标与方法、

服务能力成熟度评估、

生成

内容评价等。

政策还对包括基础安全,数据、

算法和模型安全,

网络、

技术和系统安全等

与人工智能模型相关的安全标准进行规范。2023年7月《生成式人工智能服务管理暂行办法》国家网信办、国家发改委、教育部、

科技部、工业和信息化部、公安部、国家广电总局鼓励生成式人工智能技术在各行业、

各领域的创新应用,生成积极健康、向上向善的优质

内容,探索优化应用场景,构建应用生态体系。

生成式人工智能服务提供者应当依法开展

预训练、

优化训练等训练数据处理活动,应遵守:

使用具有合法来源的数据和基础模型;

不得侵害他人依法享有的知识产权;采取有效措施提高训练数据质量。地方层面北京2024年7月《北京市推动“人工智能+”行动计划

(2024-2025年)

》北京市发展和改革委员会、北京市经济和信息化局、北京市科学技术委员会、中关村科技园区管理委员会到2025年,力争形成3-5个先进可用、

自主可控的基础大模型产品、

100个优秀的行业大模

型产品和1000个行业成功案例。围绕机器人、

教育、医疗、

金融、

文化、

交通等领域组织

实施一批综合型、

标杆性重大工程,建立各行业大模型平台,促进大模型核心理论与技术

突破,增强人工智能工程化能力。2024年3月《北京经济技术开发区关于加快打造AI原生

产业创新高地的若干政策》北京经济技术开发区管理委员会到2026年,集聚人工智能产业链企业100家,建成人工智能算力

10000PFlops

加快推进算

力基础设施建设,鼓励打造国产算力底座。

支持头部企业围绕多模态通用模型基础架构、多模态学习算法

对齐调优等领域开展大模型关键技术攻关

大力开展

“大模型+”行动

推动“大模型+自动驾驶”

“大模型+机器人”

“大模型+工业制造”等场景应用。2023年5月《北京市促进通用人工智能创新发展的

若干措施》北京市人民政府办公厅建设北京人工智能公共算力中心,形成规模化先进算力供给能力。围绕模型构建、

训练、

调优对齐、

推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术

和认知推理、

指令学习、

人类意图对齐等调优方法,研发支持百亿参数模型推理的高效压

缩和端侧部署技术,形成完整高效的技术体系,鼓励开源技术生态建设。

资料来源:至顶智库结合公开资料整理绘制。

©2024.11ZD

Insights

1.9

中国AIGC产业发展的政策环境2023年以来中国发布的AIGC相关政策16发布时间政策名称发布机构政策内容地方层面上海2024年3月《上海市智能算力基础设施高质量发展

“算

力浦江”智算行动实施方案(2024-2025年)》上海市通信管理局、上海网信办、上

海市发改委、上海市数据局、上海市

教委、上海市科委、上海市卫健委、

上海市市场监管局、上海市国资委、

上海市交通委、中国人民银行上海总部到2025年,智能算力规模超过30EFlops,

占比达到总算力的50%以上,算力网络节点间单向

网络时延控制在1毫秒以内

鼓励基础电信企业跨地区提供智算服务,推动智算芯片全面

兼容国产训练框架,推动大模型多维并行训练优化、

模型快速适配、

模型异构推理部署等

技术和工具研发,推动打造智能算力与工业、

城市治理、

教育科研等应用场景的创新融合。2023年10月《上海市推动人工智能大模型创新发展若干

措施(2023-2025年)

》上海市经济和信息化委员会、上海市

发展和改革委员会、上海市科学技术

委员会、上海网信办、上海市财政局支持引进高水平创新企业,支持本市创新主体打造具有国际竞争力的大模型

,鼓励形成数

据飞轮,加速模型迭代。

应用层面,重点支持在智能制造、

生物医药、

集成电路、

智能化

教育教学、

科技金融、

设计创意、

自动驾驶、

机器人、

数字政府等领域构建示范应用场景

打造标杆性大模型产品和服务。深圳2024年9月《深圳市前海深港现代服务业合作区管理局

关于支持人工智能高质量发展高水平应用的若干措施》深圳市前海深港现代服务业合作区

管理局鼓励企业建设智能算力中心和智能算力调度平台,支持企业基于国产人工智能软件底座打

造共性技术服务平台,鼓励开展人工智能语音识别、图像识别、自然语言理解等领域通用

关键技术开发

。围绕制造、

金融、

物流、

商务等重点领域支持

“大模型+产业”应用创新。2024年7月《深圳市加快打造人工智能先锋城市

行动方案》深圳市工业和信息化局鼓励开展大模型架构、

大模型超级智能、

超级对齐等技术创新,打造全链路自研大模型技

术体系。

研发多模态具身智能大模型,开发具身智能机器人

“大脑”,推动具身智能大模

型与机器人本体深度结合,鼓励打造具有商业价值的整机产品。

在数字政府、

教育、

医疗、

气象、

智慧城市、

环卫、

科研、

制造、

金融、

低空经济、

智能网联汽车、

现代时尚、

游戏

动漫、

文旅、网络安全等领域,鼓励企业联合研发行业大模型。2023年5月《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)

》中共深圳市委、深圳市人民政府聚焦通用大模型、

智能算力芯片、

智能传感器、

智能机器人、

智能网联汽车等领域,重点

支持打造基于国内外芯片和算法的开源通用大模型;支持重点企业持续研发和迭代商用通

用大模型;开展通用型具身智能机器人的研发和应用。

资料来源:至顶智库结合公开资料整理绘制。

17

©2024.11ZD

Insights

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论