标准解读

GB/T 20090.1-2012是一项由中国国家标准化管理委员会颁布的信息技术标准,专注于先进音视频编码领域。此标准的第一部分主要阐述了系统的总体框架和要求,旨在为音视频数据的高效压缩、传输及解码提供统一规范,以适应数字媒体时代对高质量音视频内容日益增长的需求。

标准范围

该标准定义了一套先进的音视频编码系统,包括编码器(将原始音视频信号转换为压缩数据流的设备或软件)和解码器(将压缩数据流还原为可播放音视频信号的设备或软件)的工作原理、接口以及互操作性要求。它适用于多种应用场景,如网络流媒体、高清电视广播、移动通信及视频存储等,旨在保证不同厂家的设备和服务之间能够兼容与互换。

关键技术特点

  1. 高压缩效率:通过采用先进的视频编码算法,如基于块的运动估计与补偿、自适应量化、熵编码等技术,实现对音视频数据的高度压缩,同时保持视觉和听觉质量。

  2. 灵活性与扩展性:标准支持多种分辨率、帧率、位深度的音视频内容编码,便于适应不同的网络条件和终端设备能力,且为未来技术发展预留了扩展空间。

  3. 错误恢复与抗丢包机制:针对网络传输中的数据包丢失或错误,标准引入了相应的恢复机制,确保在不稳定网络环境下也能提供相对稳定的音视频体验。

  4. 交互性和多视点编码支持:为满足互动媒体应用需求,标准还涵盖了对多视点视频编码的支持,使得用户能从多个角度观看同一场景,提升沉浸式体验。

  5. 兼容性与标准化:确保新编码标准与现有国际标准(如H.264/AVC)之间的基线兼容性,同时推动全球范围内音视频技术的标准化进程,促进产业健康发展。

应用指导

遵循GB/T 20090.1-2012标准,开发者和制造商可以设计并实现符合国家标准的音视频编码产品和服务,不仅提高了国内音视频产业的技术水平,还促进了国内外市场的交流与合作。对于用户而言,这意味着能享受到更加丰富、高质量、且跨平台兼容的音视频内容服务。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 现行
  • 正在执行有效
  • 2012-12-31 颁布
  • 2013-06-01 实施
©正版授权
GB/T 20090.1-2012信息技术先进音视频编码第1部分:系统_第1页
GB/T 20090.1-2012信息技术先进音视频编码第1部分:系统_第2页
GB/T 20090.1-2012信息技术先进音视频编码第1部分:系统_第3页
GB/T 20090.1-2012信息技术先进音视频编码第1部分:系统_第4页
GB/T 20090.1-2012信息技术先进音视频编码第1部分:系统_第5页
已阅读5页,还剩147页未读 继续免费阅读

下载本文档

免费下载试读页

文档简介

ICS35040

L71.

中华人民共和国国家标准

GB/T200901—2012

.

信息技术先进音视频编码

第1部分系统

:

Informationtechnology—Advancedcodingofaudioandvideo—

Part1Sstem

:y

2012-12-31发布2013-06-01实施

中华人民共和国国家质量监督检验检疫总局发布

中国国家标准化管理委员会

GB/T200901—2012

.

目次

前言…………………………

引言…………………………

范围………………………

11

规范性引用文件…………………………

21

术语和定义………………

32

符号和缩略语……………

47

位流语法的描述方式……………………

59

传输流位流要求…………………………

610

节目流位流的要求………………………

756

节目和节目元素描述子…………………

870

对多路复用流语义的约束………………

985

与的兼容性……………

10GB/T1797588

附录资料性附录系统时间信息时钟恢复模型及应用指南………

A()89

附录资料性附录系统符合性………………………

B()98

附录资料性附录引入抖动的网络与解码器的接口………

C()AVS99

附录资料性附录语法的图形表示………………

D()102

附录资料性附录通用信息………………………

E()106

附录资料性附录拼接传输流……………………

F()107

附录资料性附录数据传输应用…………………

G()110

附录资料性附录数字存储媒体命令与控制………

H()(DSM-CC)111

附录规范性附录解码器模型………………

I()CRC121

附录资料性附录系统解复用过程…………………

J()122

附录资料性附录系统复用过程…………………

K()125

附录资料性附录节目特定信息…………………

L()129

附录资料性附录私有数据………………………

M()138

GB/T200901—2012

.

前言

信息技术先进音视频编码分为以下个部分

GB/T20090《》9:

第部分系统

———1:;

第部分视频

———2:;

第部分音频

———3:;

第部分符合性测试

———4:;

第部分参考软件

———5:;

第部分数字版权管理

———6:;

第部分移动视频

———7:;

第部分在网络上传输

———8:IPAVS;

第部分文件格式

———9:AVS。

本部分为的第部分

GB/T200901。

本部分按照给出的规则起草

GB/T1.1—2009。

本部分由中华人民共和国工业和信息化部提出

本部分由全国信息技术标准化技术委员会归口

(SAC/TC28)。

本部分起草单位中国科学院计算技术研究所清华大学北京算通科技发展有限公司中国电子技

:、、、

术标准化研究院北京大学华中科技大学北京邮电大学联合信源数字音视频技术北京有限公司

、、、、()、

展讯通信上海有限公司

()。

本部分主要起草人陈熙霖杨士强高鹏飞霍龙社高麟鹏丁亚强杨志杰林福辉牟伦田

:、、、、、、、、、

王啸朱光喜林永兵贺玉文喻莉王雷冯博张桢睿杨昭辉杨洁汪恒晶高文黄铁军卢汉清

、、、、、、、、、、、、、。

GB/T200901—2012

.

引言

01综述

.

的本部分论述了如何将一路或多路音频视频位流或其他基本数据流合成单路或多

GB/T20090、

路复用流用于存储和传送系统编码遵循本部分指定的语法和语义规则并提供了使解码器缓冲区能

,。,

在一定范围的补偿和接收条件下进行同步解码的信息

系统编码包含两种形式传输流和节目流分别针对不同的应用加以优化本部分中定义的传输流

:,。

和节目流提供了编码语法该语法对于同步解码及展现音频视频信息是充分且必要的同时保证了解

,、,

码器中数据缓冲区不发生上溢和下溢该语法中应至少包含以下两种信息之一

。:

有关展现编码的音频和视频数据的相对时间戳以及有关数据流本身传送的比特率信息

a),;

有关解码和展现编码的音频和视频数据的时间戳以及有关数据流本身传送的时间戳信息

b),。

传输流和节目流都是面向分组包的多路复用流

单一音频和视频基本流的多路复用过程见图视频和音频数据可按包括和

1。GB/T20090.2

等部分进行编码之后压缩数据被打包以形成分组包在形成分组包的过

GB/T20090.3,,PES。PES

程中当独立使用传输流或节目流的分组包时可能会加入所需的描述信息而分组包需要进

,PES;PES

一步与系统层信息结合形成传输流或节目流时不包含这一信息本部分覆盖了图中竖直虚线右边

,。1

所示的处理过程

图1多路复用过程简图

本部分定义的节目流是由具有共同时间基准的一个或多个分组包合并而成的单一流有些

PES。

应用中要求包含单个节目的基本流是未多路复用的分离流对这些应用基本流也可作为分离的节目

。,

流编码每一基本流含一个节目流且具有共同时间基准在这种情况下不同流中字段的编码值

。。,SCR

应一致

所有的基本流和单一节目流都可被同步解码

节目流被设计用于相对无差错环境中且适用于诸如交互式多媒体等应用节目流分组包长度

,。

可变

传输流是由一个或多个节目组成的单一流且这些节目可包含一个或多个不同时钟基准由同一

,。

个节目中的多个基本流所组成的多个分组包共享一个时钟基准传输流是为用于可能出现差错

PES。

GB/T200901—2012

.

的有损或有噪媒体中的存储或传输环境而设计的传输流分组包长度为字节

。188。

节目流和传输流是为不同应用设计的它们的定义并不严格遵守分层模型彼此之间可相互转换

,,,

但并不互为子集或超集可以从一个传输流中抽取一个节目的内容并创建一个有效的节目流该转换

。。

可利用分组包的公共互换格式完成但并非节目流需要的所有字段都包含在传输流中有一些需

PES,,

要导出而在分层模型中传输流可能横跨多个层并易于在宽带应用中实现

。,,。

本部分描述的语法规则和语义规则的范围是不同的语法规则仅用于系统层编码并不延伸到

:,

和中所描述的压缩层编码而语义规则适用于复用流

GB/T20090.2GB/T20090.3,。

本部分未规定编码器或解码器的体系结构或实现方法也未对多路复用器或解复用器作相应的规

,

定然而位流的性质对编码器解码器多路复用器和解复用器提出了功能和性能上的要求如编码器

。,、、,

应满足最小的时钟容差要求但这些要求并不妨碍编码器解码器多路复用器和解复用器的设计与实

,、、

现的灵活性

02传输流

.

传输流是针对在那些可能会出现显著错误往往表现为位差错或分组包丢失的环境中进行节目传

()

送和存储而定义的一种流这些节目包含按照和等部分定义的编码数

。GB/T20090.2GB/T20090.3

据以及其他数据

传输流的速率可以是恒定或可变的在任何情况下所包含的基本流的速率也可以是恒定或可变

。,

的在每一种情况下流的语法或语义限制是相同的传输流速率由传输率字段的值

。,,(transport_rate)

定义这些传输率字段嵌入在每个流中

,。

一个包含多个具有独立时间基准的节目传输流会造成总体比特率可变这会给构造和传送这样的

,

位流带来一定困难见

,6.2.2。

只要能够生成一个有效的流包含一个或多个节目的传输流可以从基本编码数据流节目流或其他

,、

可能包含一个或多个节目的传输流构造生成

传输流是按照在最小开销的情况下能对传输流执行某些操作的原则而设计的这些操作包括

。:

从传输流的一个节目中获得编码数据解码并展现如图所示

a)、,2;

从传输流的一个节目中抽取传输流分组包并生成一个仅包含该节目的新的传输流作为输出

b),

如图所示

3;

从一个或多个传输流中抽取一个或多个节目的传输流分组包并生成一个新的传输流

c);

从传输流中抽取一个节目内容并生成包含该节目的一个节目流如图所示

d),4;

把一个节目流转化为传输流并在有损环境中传输然后再重建一个有效的在某些情况下完

e),。、

全相同的节目流

图和图描述了以一个传输流作为输入的解复用及解码系统原型图说明了第一种情况即

23。2,

一个传输流被直接解复用和解码传输流构造分为两层系统层和压缩层

。:。

传输流解码器的输入流由一个包含压缩层的系统层组成音频解码器及视频解码器的输入流只包

含压缩层

接收传输流的解码器原型的操作既适用于整个传输流复用流操作也适用于单个基本流特定流

(),(

操作传输流系统层被分为两个子层一个用于复用流操作传输流分组包另一个用于特定流操作

)。,(),

分组包层

(PES)。

图也给出了一个包括视频和音频的传输流解码器原型以说明解码器的功能其结构并不是唯一

2,

的但该图有助于理解解码器时间控制等系统解码器功能可能被等价地实现在基本流解码器或信道

,。

特定解码器中类似地信道专用解码器测出的错误也可以用多种途径通知独立的音频和视频解码器

。,。

这些通信途径并未显示在图中该解码器原型的设计并不意味着对传输流解码器的设计作出任何必达

,

GB/T200901—2012

.

的要求实际上非音视频数据也是允许的但并未在图中画出

。,,2。

图2传输流解复用和解码原型示例

图说明了另一种情况即一个包含多个节目的传输流被转变为一个只含单个节目的传输流这种

3,,

情况下的再复用操作可能需要纠正值以补偿位流中传输率的变化

transport_rate。

图3传输多路复用原型示例

图说明了一个多节目传输流先被解复用再转变为节目流的情况

4。

图4传输流到节目流转换原型示例

图和图指出不同类型不同构造的传输流之间的转换是可能且合理的在传输流和节目流的

34,、。

语法中都定义了一些特定字段以方便上述转换过程但并不要求解复用器或解码器的具体实现要包含

,

以上所有功能

03节目流

.

节目流是针对在那些出错率很低且系统编码的处理过程作为主要考虑因素的环境中进行一个节

,

目的传送和存储而定义的一种流该节目流包含编码数据和其他数据

,。

节目流的速率可以是恒定的或可变的在任何情况下所包含的基本流的速率也是恒定或可变的

。,。

在每一种情况下节目流的语法或语义限制是相同的节目流速率是由系统时钟参考字段与

,。(SCR)

字段的值和位置所决定的

mux_rate。

图描述了一个音视频节目流解码系统原型该图用于帮助理解其结构并不是唯一的包括

5。,———

解码器时间控制在内的系统解码器功能可能被等价地实现在基本流解码器或信道特定解码器中该解

码器原型的设计并不意味着对节目流解码器的设计作出任何必达的要求实际上非音视频数据也是

。,

GB/T200901—2012

.

允许的

图所示的节目流解码器原型是由系统视频和音频解码器三部分组成它们分别符合

5、,

和在该解码器中单路或多路音视频位流的复用编码

GB/T20090.1、GB/T20090.2GB/T20090.3。,

表示假定以某种特定信道格式在特定信道中存储或传输特定信道格式本部分不作规定特定信道解

。,

码也不是本解码器原型的一部分

图5节目流解码器原型

上述原型解码器接受节目流作为输入并依靠节目流解码器从流中提取信息节目流解码器分离

,。

复用流并将由此产生的基本流作为音频和视频解码器的输入音频和视频解码器的输出是已解码的

,。

音频和视频信号节目流解码器音频和视频解码器以及信道专用解码器之间的定时信息流应包含在

。、

设计中但并未在图中画出利用定时信息音频和视频解码器相互之间及与信道之间可以实现

,5。,

同步

节目流构造分为两层系统层和压缩层节目流解码器的输入流由一个包含压缩层的系统层组成

:。。

音频解码器及视频解码器的输入流只包含压缩层

解码器原型的操作既适用于整个节目流复用流操作也适用于单个基本流特定流操作节目

(),()。

流系统层被分为两个子层一个用于复用流操作节目流分组包层另一个用于特定流操作分组

,(),(PES

包层

)。

04传输流与节目流的转换

.

利用分组包传输流与节目流之间的转换是可能且合理的这是由包含在本部分的和

PES,,6.17.1

中的传输流和节目流规范得出的在某些限制下分组包可能直接从一个复用位流的有效数据对

。,PES

应到另一个复用位流的有效数据如果在所有分组包中都有

。PESprogram_packet_sequence_counter,

就可能标识出分组包的正确次序以帮助实现这一功能

PES。

在这两种流中有关转换所需的其他信息包括基本流之间的关系以表和包头的形式出现在任何

,。

流中这些数据如果出现转换前后都应是正确的

,。

05PES流

.

正如中的语法定义所指出传输流和节目流是从分组包中逻辑地建立的分组包

6.3.6,PES。PES

被用于传输流与节目流之间的转换在有些场合进行这种转换时无需变动分组包分组包

。,PES。PES

的长度可能比传输流分组包的长度大得多

包含相同和基本流的一系列连续的分组包构成一个流当流分组包用

stream_idPESPES。PES

于形成流时应在中所定义的限制下带有基本流时钟参考字段和基本流速率

PES,6.3.8,(ESCR)(ES_

GB/T200901—2012

.

字段流数据应是来自基本流且保持原次序的连续字节流中不包含某些出现在节目

Rate)。PES。PES

流和传输流中的系统信息包括在包头系统头节目流映射节目流目录节目映射表中出现的信息以

,、、、、

及在传输流分组包语法中定义的元素

本部分的流未定义用于相互交换和交互操作单个基本流也可打包成传输流或节目流但应

PES。,

包含必要的系统信息具有单个基本流的多个传输流或节目流可被构造成具有相同的时间基准以传送

一个完整的音视频节目

06定时模型

.

系统视频和音频都有一个定时模型其中从编码器的信号输入到解码器的信号输出之间的端到端

、,

延迟是恒定的该延迟是编码编码器缓冲多路复用传送或存储解复用解码器缓冲和展现过程中所

,、、、、、

有延迟的总和作为该定时模型的一部分所有视频图像和音频采样仅展现一次除非经过特殊编码

。,(),

且解码器中的视频帧率和音频采样速率与在编码器中保持一致系统流编码包括了定时信息以用于

。,

实现端到端延迟恒定的系统实现不严格遵守该模型的解码器也是可能的但此时的解码器需要负责

。。

以一种可接受方式完成以上要求

所有定时是由一个公共时钟来定义的这个公共时钟被称为系统时钟在节目流中该时钟与视频

,。,

或音频采样时钟之间可以有确定的比值也可以有一个与比值略有偏差的工作频率但仍提供精确的端

,,

到端定时和时钟补偿

在传输流中为了简化解码器中的采样速率恢复系统时钟被限制为在任何时刻均与音频和视频采

,,

样时钟保持确定比值

07条件接收

.

本部分未规定条件接收机制但位流支持对节目流和传输流中的节目进行条件接收

,AVS。

08复用流操作

.

复用流操作包括协调信道数据的获取时钟的调整以及缓冲区的管理这些操作是紧密相连的

、。。

当信道数据传输速率是可控时可通过调节数据传输速率使解码缓冲区不发生上溢或下溢否则基本

,。,

流解码器的定时应服从信道中接收的数据以避免上溢或下溢

,。

节目流由节目流分组包组成其包头有助于以上任务的完成包头指定了从信道中送来的每一字

,。

节进入节目流解码器的预定时间这个预定到达时刻表作为时钟校正和缓冲区管理的参考当解码器

,。

不能严格遵守该时刻表时应对有关偏差作出相应补偿

,。

类似地传输流由传输流分组包构成分组包头指定从信道中送来的每一字节进入传输流解码器

,。

的预定时间该时刻表提供了与上述节目流中完全相同的功能

。。

另一个复用流操作是确定解码器解码传输流或节目流时所需的资源每个节目流的第一个包均包

含一些参数来协助解码器完成此功能其中包括流的最大数据速率以及同步视频信道的最大数目传

,,。

输流也包含类似的全局适用的信息

每个传输流和节目流都包含一些信息以标识组成一个节目的各基本流的相关特征以及基本流之

,

间的相互关系这些信息可包括声道中所使用的语言以及在实现多层视频编码时各层之间的关系

。,。

GB/T200901—2012

.

09单个流操作PES分组包层

.()

基本的流的操作为

PES:

解复用

a);

多个基本流的同步回放

b)。

091解复用

..

编码时节目流由基本流复用而成而传输流则由基本流节目流或其他传输流的内容复用而成

,,、。

基本流除了音频和视频位流外还可包括私有保留和补充位流基本流被临时性地分割为分组

,、。PES

包分组包被串行化一个分组包仅包含来自一个基本流的编码字节

,。PES。

节目流中的分组包长度可以是固定的或可变的但分组包长度应遵守

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论