标准解读

《GB/T 45288.3-2025 人工智能 大模型 第3部分:服务能力成熟度评估》是一项国家标准,旨在为评估人工智能大模型的服务能力提供一套系统化的框架。该标准适用于各类基于大规模数据训练的人工智能模型,包括但不限于自然语言处理、计算机视觉等领域的大规模预训练模型。

标准首先定义了“服务能力”的概念,指出其不仅涵盖模型的准确性、稳定性等技术性能指标,还包括用户友好性、可访问性等非技术因素。接着,提出了一个五级的能力成熟度模型,从低到高分别为初始级、基础级、进阶级、高级和卓越级。每一级别都详细描述了相应的特征与要求,帮助企业或机构定位自身所处阶段,并明确提升方向。

对于如何进行评估,《GB/T 45288.3-2025》提出了一套完整的流程指南,包括准备阶段(确定目标、组建团队)、实施阶段(选择方法论、收集证据)以及报告阶段(分析结果、编写报告)。此外,还特别强调了在整个过程中应遵循的原则,如客观公正、持续改进等。

在具体指标方面,该标准列出了多个维度来衡量大模型的服务能力,比如功能完整性、响应速度、安全性保障、隐私保护措施等。每个维度下又细分出若干子项,确保评估过程全面而细致。同时,也鼓励采用定量与定性相结合的方式来进行综合评价,以获得更准确的结果。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 2025-01-24 颁布
  • 2025-01-24 实施
©正版授权
GB/T 45288.3-2025人工智能大模型第3部分:服务能力成熟度评估_第1页
GB/T 45288.3-2025人工智能大模型第3部分:服务能力成熟度评估_第2页
GB/T 45288.3-2025人工智能大模型第3部分:服务能力成熟度评估_第3页
GB/T 45288.3-2025人工智能大模型第3部分:服务能力成熟度评估_第4页
GB/T 45288.3-2025人工智能大模型第3部分:服务能力成熟度评估_第5页
免费预览已结束,剩余19页可下载查看

下载本文档

GB/T 45288.3-2025人工智能大模型第3部分:服务能力成熟度评估-免费下载试读页

文档简介

ICS35240

CCSL.70

中华人民共和国国家标准

GB/T452883—2025

.

人工智能大模型

第3部分服务能力成熟度评估

:

Artificialintelligence—Large-scalemodel—

Part3Servicecaabilitmaturitassessment

:pyy

2025-01-24发布2025-01-24实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T452883—2025

.

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

缩略语

4……………………1

概述

5………………………2

大模型服务类型

5.1……………………2

服务能力框架

5.2………………………2

评估指标

6…………………3

大模型平台

6.1…………………………3

大模型开发定制

6.2……………………7

大模型推理及运营

6.3…………………9

成熟度分级规则

7…………………………11

成熟度等级

7.1…………………………11

能力要求

7.2……………12

成熟度评估方法

8…………………………13

评分方法

8.1……………13

评估域权重

8.2…………………………13

计算方法

8.3……………13

成熟度等级判定

8.4……………………14

GB/T452883—2025

.

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

本文件是人工智能大模型的第部分已经发布了以下部分

GB/T45288《》3,GB/T45288:

第部分通用要求

———1:;

第部分评测指标与方法

———2:;

第部分服务能力成熟度评估

———3:。

请注意本文件的某些内容可能涉及专利本文件的发布机构不承担识别专利的责任

。。

本文件由全国信息技术标准化技术委员会提出并归口

(SAC/TC28)。

本文件起草单位中国电子技术标准化研究院华为技术有限公司浪潮云信息技术股份公司清华

:、、、

大学华为云计算技术有限公司中国科学院自动化研究所北京百度网讯科技有限公司深圳市腾讯计

、、、、

算机系统有限公司菲特天津检测技术有限公司北京奇虎科技有限公司北京航空航天大学国能信

、()、、、

息技术有限公司麒麟合盛网络技术股份有限公司上海市人工智能行业协会上海燧原科技股份有限

、、、

公司阿里云计算有限公司平头哥上海半导体技术有限公司上海计算机软件技术开发中心浙江大

、、()、、

华技术股份有限公司青岛海信电子技术服务有限公司上海人工智能研究院有限公司南方电网人工

、、、

智能科技有限公司航天信息股份有限公司广东电网有限责任公司北京大学长沙计算与数字经济研

、、、

究院北京大学中国科学院软件研究所蚂蚁科技集团股份有限公司中国移动通信集团有限公司

、、、、、

马上消费金融股份有限公司深圳云天励飞技术股份有限公司深圳思谋信息科技有限公司北京格灵

、、、

深瞳信息技术股份有限公司中国南方电网有限责任公司超高压输电公司北京软件产品质量检测检验

、、

中心有限公司中国电力科学研究院有限公司上海文鳐信息科技有限公司浪潮软件科技有限公司

、、、、

浪潮电子信息产业股份有限公司浪潮软件集团有限公司中电科大数据研究院有限公司上海商汤智

、、、

能科技有限公司中国电信集团有限公司科大讯飞股份有限公司中国电信股份有限公司北京研究院

、、、、

中移苏州软件技术有限公司中国科学院新疆理化技术研究所杭州海康威视数字技术股份有限公

()、、

司上海文鳐信息科技有限公司西北工业大学云知声智能科技股份有限公司北京工业大学北京智

、、、、、

芯微电子科技有限公司

本文件主要起草人徐洋马珊珊于超王莞尔董建陶建华曹晓琦鲍薇黄现翠马骋昊

:、、、、、、、、、、

郑佳佳郑子木朱贵波王金桥刘静汪群博杨旭马同森靳伟刘海涛曹彬张向征任海峰

、、、、、、、、、、、、、

刘祥龙刘艾杉张旭陈曦赵春昊蒋燕梅敬青彭骏涛张艺伯陈敏刚孔维生刘微刘常昱

、、、、、、、、、、、、、

宋海涛任正国邵彦宁刘佳宁周昊杨超孟令中孙曦金镝李宽王志芳吕江波胡全一王宁

、、、、、、、、、、、、、、

王志刚孔昊莫文昊仲凯韬王珂琛刘璐张天霖蒋慧刘敬谦刘威辰高建清孟建舒珏淋

、、、、、、、、、、、、、

商兴宇李旭东杨雅婷钟凯伦仲凯韬张涛梁家恩刘峥郑哲武姗姗

、、、、、、、、、。

GB/T452883—2025

.

引言

大模型已成为人工智能发展的重要技术手段在引领产业变革中发挥重要作用国内外人工智能相

,,

关机构相继研究开发百余种大模型产品和评测榜单导致用户难以有效评价人工智能产品的技术水平

,

和服务能力旨在规定通用大模型的技术要求评测指标和服务能力拟由五个部分

。GB/T45288、,

构成

第部分通用要求目的在于确立大模型的参考架构规定通用技术要求

———1:。,。

第部分评测指标与方法目的在于确立大模型的评测指标描述评测方法

———2:。,。

第部分服务能力成熟度评估目的在于给出大模型服务能力成熟度等级及评估方法

———3:。。

第部分计算机视觉大模型目的在于定义计算机视觉大模型的概念和功能规定技术要求

———4:。,

和测试方法

第部分多模态大模型目的在于定义多模态大模型的概念和功能规定技术要求和测试

———5:。,

方法

GB/T452883—2025

.

人工智能大模型

第3部分服务能力成熟度评估

:

1范围

本文件给出了大模型服务能力框架和评估指标描述了大模型服务能力成熟度等级划分及评估

,

方法

本文件适用于服务提供方和需求方对大模型平台模型定制及推理运营服务的能力进行全面评估

、,

也适用于指导大模型服务能力的规划设计和实现

、。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款其中注日期的引用文

。,

件仅该日期对应的版本适用于本文件不注日期的引用文件其最新版本包括所有的修改单适用于

,;,()

本文件

信息技术人工智能平台计算资源规范

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论