标准解读

《GB/T 42382.1-2023 信息技术 神经网络表示与模型压缩 第1部分:卷积神经网络》是中国国家标准体系中针对信息技术领域,特别是关于神经网络及其优化技术的一个重要标准。该标准专注于卷积神经网络(CNNs),这类网络因其在图像识别、视频分析等视觉任务中的高效表现而广受欢迎。

标准首先定义了卷积神经网络的基本架构和术语,包括但不限于卷积层、池化层、激活函数以及全连接层等核心组件。通过明确这些基本概念,为后续讨论提供了统一的语言基础。接着,它介绍了如何使用标准化的方法来描述卷积神经网络结构,这对于促进不同平台之间模型的互操作性至关重要。

此外,《GB/T 42382.1-2023》还深入探讨了模型压缩技术的应用于卷积神经网络上,目的是为了减少模型大小而不显著降低其性能。这部分内容涵盖了多种压缩策略,如参数剪枝、量化、知识蒸馏等,并给出了每种方法的具体实施指南。通过应用这些技术,可以在保持或接近原始模型准确率的同时大幅度减小模型体积,这对于资源受限环境下的部署尤为关键。

此标准不仅适用于研究人员和技术开发者,对于希望利用卷积神经网络进行创新的企业和个人也具有指导意义。它提供了一个框架,帮助理解和实现更高效的神经网络解决方案,从而推动人工智能技术的发展与应用。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 2023-03-17 颁布
  • 2023-10-01 实施
©正版授权
GB/T 42382.1-2023信息技术神经网络表示与模型压缩第1部分:卷积神经网络_第1页
GB/T 42382.1-2023信息技术神经网络表示与模型压缩第1部分:卷积神经网络_第2页
GB/T 42382.1-2023信息技术神经网络表示与模型压缩第1部分:卷积神经网络_第3页
GB/T 42382.1-2023信息技术神经网络表示与模型压缩第1部分:卷积神经网络_第4页
GB/T 42382.1-2023信息技术神经网络表示与模型压缩第1部分:卷积神经网络_第5页
已阅读5页,还剩251页未读 继续免费阅读

下载本文档

GB/T 42382.1-2023信息技术神经网络表示与模型压缩第1部分:卷积神经网络-免费下载试读页

文档简介

ICS35040

CCSL.71

中华人民共和国国家标准

GB/T423821—2023

.

信息技术神经网络表示与模型压缩

第1部分卷积神经网络

:

Informationtechnology—Neuralnetworkrepresentationandmodelcompression—

Part1Convolutionalneuralnetwork

:

2023-03-17发布2023-10-01实施

国家市场监督管理总局发布

国家标准化管理委员会

GB/T423821—2023

.

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范围

1………………………1

规范性引用文件

2…………………………1

术语和定义

3………………1

缩略语

4……………………4

约定

5………………………4

规则

5.1…………………4

算术运算符

5.2…………………………4

逻辑运算符

5.3…………………………5

关系运算符

5.4…………………………5

位运算符

5.5……………5

赋值

5.6…………………5

数学函数

5.7……………6

结构关系符

5.8…………………………7

解析过程和解码过程的描述方法

5.9…………………7

神经网络模型的语法和语义

6……………7

数据结构

6.1……………7

语法描述

6.2……………9

语义描述

6.3……………15

压缩过程

7…………………75

多模型

7.1………………75

量化

7.2…………………80

剪枝

7.3………………102

结构化矩阵

7.4………………………105

解压过程解码表示

8()…………………112

多模型

8.1……………112

反量化

8.2……………118

反稀疏化反剪枝操作

8.3/……………128

结构化矩阵

8.4………………………131

数据生成方法

9…………………………138

定义

9.1………………138

训练数据生成方法

9.2………………139

多模型

9.3……………145

量化

9.4………………150

剪枝

9.5………………169

GB/T423821—2023

.

结构化矩阵

9.6………………………176

编解码表示

10……………184

神经网络模型权重压缩位流的语法和语义

10.1……………………184

权重压缩位流的语法描述

10.2………………………189

权重压缩位流的语义描述

10.3………………………212

权重压缩位流解析过程

10.4…………222

权重压缩位流解码

10.5………………233

模型保护

11………………241

模型保护定义

11.1……………………241

模型加密过程

11.2……………………242

模型解密过程

11.3……………………243

密文模型数据结构定义

11.4…………245

附录资料性专利列表

A()……………246

参考文献

……………………247

GB/T423821—2023

.

前言

本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定

GB/T1.1—2020《1:》

起草

本文件是信息技术神经网络表示与模型压缩的第部分已经发

GB/T42382《》1。GB/T42382

布了以下部分

:

第部分卷积神经网络

———1:。

本文件由全国信息技术标准化技术委员会提出并归口

(SAC/TC28)。

本文件起草单位北京大学鹏城实验室深圳市海思半导体有限公司赛灵思电子科技北京有限

:、、、()

公司杭州海康威视数字技术股份有限公司北京百度网讯科技有限公司深圳市腾讯计算机系统有限

、、、

公司华为技术有限公司厦门大学中国电子技术标准化研究院中国科学院自动化研究所浙江大学

、、、、、、

中国科学技术大学上海交通大学清华大学中关村视听产业技术创新联盟

、、、。

本文件主要起草人田永鸿杨帆纪荣嵘单弈陈光耀燕肇一郑侠武浦世亮谭文明李哲暘

:、、、、、、、、、、

彭博钟刚赵恒锐段文鸿胡浩基李翔骆阳王炜许奕星李慧霞林绍辉王培松赵依胡晓光

、、、、、、、、、、、、、、

郑辉煌蒋佳军马金成程健江帆朱文武汪小娟高文黄铁军赵海英马珊珊

、、、、、、、、、、。

GB/T423821—2023

.

引言

神经网络的表示和模型压缩是人工智能技术体系的重要组成部分是国民经济各行业应用人工智

,

能的前提然而多源算法平台不能协同工作模型不可以相互转换制约了人工智能技术的传播和应

。,,,

用为了保证人工智能技术的跨平台可操作性提升模型复用效果本标准将对神经网络的表示和模型

。,,

压缩进行规范带动人工智能产业的健康快速发展旨在确立适用于卷积神经网络大

,、。GB/T42382、

规模预训练网络及图神经网络的神经网络表示与模型压缩的规范拟由三个部分组成

,:

第部分卷积神经网络目的在于确立适用于卷积神经网络的表示与模型压缩标准

———1:。。

第部分大规模预训练模型目的在于确立适用于大规模预训练网络的模型表示模型压缩

———2:。、

及模型传输标准

第部分图神经网络目的在于确立图数据和图神经网络表示确定图神经网络模型的编码

———3:。,

格式标准

本文件的发布机构提请注意声明符合本文件时可能涉及到与神经网络表示标

,,6、7、8、9、10、11《

准框架结构专利号与基于神经网络差分的量化方法及系统

》(:201810575097.7);7.1.4、8.1.3、9.3.2《》

专利号与一种基于参数范数的神经网络量化方法专利号

(:201910478617.7);7.2、8.2、9.4《》(:

与一种神经网络计算方法和装置专利号

201810387893.8);7.4.2、8.4.2、9.6.2《》(:PCT/CN2018/

与一种神经网络模型数据处理方法及处理装置专利号

101598);7.1.3、8.1.2、9.3.1《、》(:PCT/CN2019/

一种神经网络模型数据处理方法及处理装置专利号

085885)、《、》(:201810464380.2);、、8.

2.3.3、、、《NeuralNetworkQuantizationMethodusingMultipleRefinedQuan-

专利号与图像

tizedKernelsforConstrainedHardwareDeployment》(:PCT/EP2019/053161);9.2.2《

生成方法神经网络的压缩方法及相关装置设备专利号

、、》(:201910254752.3);、、

与模型训练方法装置存储介质和程序产品专利号与神经网络

《、、》(:PCT/CN2019/129265);7.2、8.2《

模型和训练方法和装置专利号神经网络模型的量化方法和装置专利号

》(:CN202010144315.9)、《》(:

神经网络模型的量化方法和装置专利号神经网络模

CN202010143782.X)、《》(:CN202010144339.4)、《

型压缩方法以及装置专利号与

》(:CN201610943049.X);6.2、6.3《DEEPLEARNINGPROCESSING

专利号

APPARATUSANDMETHOD,DEVICEANDSTORAGEMEDIUM》(:US17/017,600);7.

4、8.4《NEURALNETWORKDATAPROCESSINGAPPARATUS,METHODANDELEC-

专利号与基于多比特神经网络非线性量化的深度

TRONICDEVICE》(:US16/893,044);7.2、8.2、9.4《

神经网络压缩方法专利号与一种基于结构化剪枝的高效图像分类

》(:201910722230.1);7.3、8.3、9.5《

方法专利号与一种基于增量正则化的神经网络结构化稀疏方法

》(:201910701012.X);7.3、8.3、9.5《》

专利号与一种模型数据的处理方法装置及设备专利号

(:201910448309.X);11《、》(:201911230340.2);

与一种应用有界线性整流单元的全整数神经网络系统专利号

、、《》(:

与基于张量分解的深度卷积神经网络的加速与压缩方法专利号

2019104537988);7.4、8.4、9.6《》(:

相关专利的使用

201610387878.4)。

本文件的发布机构对于该专利的真实性有效性和范围无任何立场

、。

该专利持有人已向本文件的发布机构承诺他愿意同任何申请人在合理且无歧视的条款和条件下

,,

就专利授权许可进行谈判该专利持有人的声明已在本文件的发布机构备案相关信息可以通过以下

。,

联系方式获得

:

专利持有人北京大学华为技术有限公司北京百度网讯科技有限公司厦门大学浙江大学赵恒

:、、、、、

锐中科院自动化研究所

GB/T423821—2023

.

地址北京市海淀区颐和园路号理科号楼室邮编北京市上地信息路号华为

:522604:100871;3

大厦邮编北京市海淀区上地十街号百度大厦邮编福建省厦门市思明区厦门大学

:100085;10:100085;

信息学院邮编浙江省杭州市西湖区浙大路号浙江大学玉泉校区邮编安徽省合肥

:361005;38:310000;

市蜀山区中国科学技术大学西区邮编北京市海淀区中关村东路号邮编

:230027;95:100190

联系人黄铁军

:

通讯地址北京大学理科号楼室

:22641

电子邮件

:tjhuang@

电话

:+8610-62756172

请注意除上述专利外本文件的某些内容仍可能涉及专利本文件的发布机构不承担识别专利的

,。

责任

GB/T423821—2023

.

信息技术神经网络表示与模型压缩

第1部分卷积神经网络

:

1范围

本文件规定了卷积神经网络离线模型的表示与压缩过程

本文件适用于各种卷积神经网络模型的研制开发测试评估过程以及在端云领域的高效应用

、、,。

注对于本文件规定的表示与模型压缩方法不要求机器学习框架原生支持可以通过转换工具包等形式支持

:

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论