标准解读
《GB/T 42382.1-2023 信息技术 神经网络表示与模型压缩 第1部分:卷积神经网络》是中国国家标准体系中针对信息技术领域,特别是关于神经网络及其优化技术的一个重要标准。该标准专注于卷积神经网络(CNNs),这类网络因其在图像识别、视频分析等视觉任务中的高效表现而广受欢迎。
标准首先定义了卷积神经网络的基本架构和术语,包括但不限于卷积层、池化层、激活函数以及全连接层等核心组件。通过明确这些基本概念,为后续讨论提供了统一的语言基础。接着,它介绍了如何使用标准化的方法来描述卷积神经网络结构,这对于促进不同平台之间模型的互操作性至关重要。
此外,《GB/T 42382.1-2023》还深入探讨了模型压缩技术的应用于卷积神经网络上,目的是为了减少模型大小而不显著降低其性能。这部分内容涵盖了多种压缩策略,如参数剪枝、量化、知识蒸馏等,并给出了每种方法的具体实施指南。通过应用这些技术,可以在保持或接近原始模型准确率的同时大幅度减小模型体积,这对于资源受限环境下的部署尤为关键。
此标准不仅适用于研究人员和技术开发者,对于希望利用卷积神经网络进行创新的企业和个人也具有指导意义。它提供了一个框架,帮助理解和实现更高效的神经网络解决方案,从而推动人工智能技术的发展与应用。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
- 现行
- 正在执行有效
- 2023-03-17 颁布
- 2023-10-01 实施
文档简介
ICS35040
CCSL.71
中华人民共和国国家标准
GB/T423821—2023
.
信息技术神经网络表示与模型压缩
第1部分卷积神经网络
:
Informationtechnology—Neuralnetworkrepresentationandmodelcompression—
Part1Convolutionalneuralnetwork
:
2023-03-17发布2023-10-01实施
国家市场监督管理总局发布
国家标准化管理委员会
GB/T423821—2023
.
目次
前言
…………………………Ⅲ
引言
…………………………Ⅳ
范围
1………………………1
规范性引用文件
2…………………………1
术语和定义
3………………1
缩略语
4……………………4
约定
5………………………4
规则
5.1…………………4
算术运算符
5.2…………………………4
逻辑运算符
5.3…………………………5
关系运算符
5.4…………………………5
位运算符
5.5……………5
赋值
5.6…………………5
数学函数
5.7……………6
结构关系符
5.8…………………………7
解析过程和解码过程的描述方法
5.9…………………7
神经网络模型的语法和语义
6……………7
数据结构
6.1……………7
语法描述
6.2……………9
语义描述
6.3……………15
压缩过程
7…………………75
多模型
7.1………………75
量化
7.2…………………80
剪枝
7.3………………102
结构化矩阵
7.4………………………105
解压过程解码表示
8()…………………112
多模型
8.1……………112
反量化
8.2……………118
反稀疏化反剪枝操作
8.3/……………128
结构化矩阵
8.4………………………131
数据生成方法
9…………………………138
定义
9.1………………138
训练数据生成方法
9.2………………139
多模型
9.3……………145
量化
9.4………………150
剪枝
9.5………………169
Ⅰ
GB/T423821—2023
.
结构化矩阵
9.6………………………176
编解码表示
10……………184
神经网络模型权重压缩位流的语法和语义
10.1……………………184
权重压缩位流的语法描述
10.2………………………189
权重压缩位流的语义描述
10.3………………………212
权重压缩位流解析过程
10.4…………222
权重压缩位流解码
10.5………………233
模型保护
11………………241
模型保护定义
11.1……………………241
模型加密过程
11.2……………………242
模型解密过程
11.3……………………243
密文模型数据结构定义
11.4…………245
附录资料性专利列表
A()……………246
参考文献
……………………247
Ⅱ
GB/T423821—2023
.
前言
本文件按照标准化工作导则第部分标准化文件的结构和起草规则的规定
GB/T1.1—2020《1:》
起草
。
本文件是信息技术神经网络表示与模型压缩的第部分已经发
GB/T42382《》1。GB/T42382
布了以下部分
:
第部分卷积神经网络
———1:。
本文件由全国信息技术标准化技术委员会提出并归口
(SAC/TC28)。
本文件起草单位北京大学鹏城实验室深圳市海思半导体有限公司赛灵思电子科技北京有限
:、、、()
公司杭州海康威视数字技术股份有限公司北京百度网讯科技有限公司深圳市腾讯计算机系统有限
、、、
公司华为技术有限公司厦门大学中国电子技术标准化研究院中国科学院自动化研究所浙江大学
、、、、、、
中国科学技术大学上海交通大学清华大学中关村视听产业技术创新联盟
、、、。
本文件主要起草人田永鸿杨帆纪荣嵘单弈陈光耀燕肇一郑侠武浦世亮谭文明李哲暘
:、、、、、、、、、、
彭博钟刚赵恒锐段文鸿胡浩基李翔骆阳王炜许奕星李慧霞林绍辉王培松赵依胡晓光
、、、、、、、、、、、、、、
郑辉煌蒋佳军马金成程健江帆朱文武汪小娟高文黄铁军赵海英马珊珊
、、、、、、、、、、。
Ⅲ
GB/T423821—2023
.
引言
神经网络的表示和模型压缩是人工智能技术体系的重要组成部分是国民经济各行业应用人工智
,
能的前提然而多源算法平台不能协同工作模型不可以相互转换制约了人工智能技术的传播和应
。,,,
用为了保证人工智能技术的跨平台可操作性提升模型复用效果本标准将对神经网络的表示和模型
。,,
压缩进行规范带动人工智能产业的健康快速发展旨在确立适用于卷积神经网络大
,、。GB/T42382、
规模预训练网络及图神经网络的神经网络表示与模型压缩的规范拟由三个部分组成
,:
第部分卷积神经网络目的在于确立适用于卷积神经网络的表示与模型压缩标准
———1:。。
第部分大规模预训练模型目的在于确立适用于大规模预训练网络的模型表示模型压缩
———2:。、
及模型传输标准
。
第部分图神经网络目的在于确立图数据和图神经网络表示确定图神经网络模型的编码
———3:。,
格式标准
。
本文件的发布机构提请注意声明符合本文件时可能涉及到与神经网络表示标
,,6、7、8、9、10、11《
准框架结构专利号与基于神经网络差分的量化方法及系统
》(:201810575097.7);7.1.4、8.1.3、9.3.2《》
专利号与一种基于参数范数的神经网络量化方法专利号
(:201910478617.7);7.2、8.2、9.4《》(:
与一种神经网络计算方法和装置专利号
201810387893.8);7.4.2、8.4.2、9.6.2《》(:PCT/CN2018/
与一种神经网络模型数据处理方法及处理装置专利号
101598);7.1.3、8.1.2、9.3.1《、》(:PCT/CN2019/
一种神经网络模型数据处理方法及处理装置专利号
085885)、《、》(:201810464380.2);、、8.
与
2.3.3、、、《NeuralNetworkQuantizationMethodusingMultipleRefinedQuan-
专利号与图像
tizedKernelsforConstrainedHardwareDeployment》(:PCT/EP2019/053161);9.2.2《
生成方法神经网络的压缩方法及相关装置设备专利号
、、》(:201910254752.3);、、
与模型训练方法装置存储介质和程序产品专利号与神经网络
《、、》(:PCT/CN2019/129265);7.2、8.2《
模型和训练方法和装置专利号神经网络模型的量化方法和装置专利号
》(:CN202010144315.9)、《》(:
神经网络模型的量化方法和装置专利号神经网络模
CN202010143782.X)、《》(:CN202010144339.4)、《
型压缩方法以及装置专利号与
》(:CN201610943049.X);6.2、6.3《DEEPLEARNINGPROCESSING
专利号
APPARATUSANDMETHOD,DEVICEANDSTORAGEMEDIUM》(:US17/017,600);7.
与
4、8.4《NEURALNETWORKDATAPROCESSINGAPPARATUS,METHODANDELEC-
专利号与基于多比特神经网络非线性量化的深度
TRONICDEVICE》(:US16/893,044);7.2、8.2、9.4《
神经网络压缩方法专利号与一种基于结构化剪枝的高效图像分类
》(:201910722230.1);7.3、8.3、9.5《
方法专利号与一种基于增量正则化的神经网络结构化稀疏方法
》(:201910701012.X);7.3、8.3、9.5《》
专利号与一种模型数据的处理方法装置及设备专利号
(:201910448309.X);11《、》(:201911230340.2);
与一种应用有界线性整流单元的全整数神经网络系统专利号
、、《》(:
与基于张量分解的深度卷积神经网络的加速与压缩方法专利号
2019104537988);7.4、8.4、9.6《》(:
相关专利的使用
201610387878.4)。
本文件的发布机构对于该专利的真实性有效性和范围无任何立场
、。
该专利持有人已向本文件的发布机构承诺他愿意同任何申请人在合理且无歧视的条款和条件下
,,
就专利授权许可进行谈判该专利持有人的声明已在本文件的发布机构备案相关信息可以通过以下
。,
联系方式获得
:
专利持有人北京大学华为技术有限公司北京百度网讯科技有限公司厦门大学浙江大学赵恒
:、、、、、
锐中科院自动化研究所
、
Ⅳ
GB/T423821—2023
.
地址北京市海淀区颐和园路号理科号楼室邮编北京市上地信息路号华为
:522604:100871;3
大厦邮编北京市海淀区上地十街号百度大厦邮编福建省厦门市思明区厦门大学
:100085;10:100085;
信息学院邮编浙江省杭州市西湖区浙大路号浙江大学玉泉校区邮编安徽省合肥
:361005;38:310000;
市蜀山区中国科学技术大学西区邮编北京市海淀区中关村东路号邮编
:230027;95:100190
联系人黄铁军
:
通讯地址北京大学理科号楼室
:22641
电子邮件
:tjhuang@
电话
:+8610-62756172
请注意除上述专利外本文件的某些内容仍可能涉及专利本文件的发布机构不承担识别专利的
,。
责任
。
Ⅴ
GB/T423821—2023
.
信息技术神经网络表示与模型压缩
第1部分卷积神经网络
:
1范围
本文件规定了卷积神经网络离线模型的表示与压缩过程
。
本文件适用于各种卷积神经网络模型的研制开发测试评估过程以及在端云领域的高效应用
、、,。
注对于本文件规定的表示与模型压缩方法不要求机器学习框架原生支持可以通过转换工具包等形式支持
:
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 合同审批及归档流程及图表
- 统编人教版六年级语文上册第13课《桥》精美课件
- 转让宅基地协议书
- 人工挖孔桩民工劳务合同范本
- 发电机培训课件
- 煤炭购销居间标准合同范本
- 教师实习合同协议范文
- 基于云计算的2024年度企业资源规划(ERP)系统实施合同
- 猪场入股协议书范本大全
- 干货股份代持协议超简约版
- 人教版(2024)七年级上册英语Unit 5 Fun Clubs 单元整体教学设计
- 2024年无子女离婚协议书范本
- 人教版数学四年级上册-第五单元-平行四边形和梯形-单元测试卷(含答案)
- 国开(河北)2024年秋《现代产权法律制度专题》形考作业1-4答案
- 2024世界糖尿病日糖尿病与幸福感糖尿病健康教育课件
- 民用无人机操控员执照(CAAC)考试复习重点题库500题(含答案)
- (2024年)师德师风学习内容教师师德师风培训内容通用多篇
- EPC项目投标人承包人工程经济的合理性分析、评价
- 国家开放大学行为表现答案
- 籍贯对照表完整版
- EN779-2012一般通风过滤器——过滤性能测定(中文版)
评论
0/150
提交评论