信源编码标准_第1页
信源编码标准_第2页
信源编码标准_第3页
信源编码标准_第4页
信源编码标准_第5页
已阅读5页,还剩180页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信源编码标准第一页,共一百八十五页,编辑于2023年,星期五第五章信源编码的标准

5.1数字音视频编码标准概述5.2MPEG-1音频编码标准5.3杜比AC-3音频编码算法5.4MPEG-2音频编码标准5.6MPEG-1和MPEG-2视频编码标准5.7MPEG-4视频编码标准5.8H.264/AVC视频编码标准5.9AVS视频编码标准2023/5/24第二页,共一百八十五页,编辑于2023年,星期五视频编码国际标准的制定

2023/5/24第三页,共一百八十五页,编辑于2023年,星期五5.1数字音视频编码标准概述

国际上数字音视频编码标准主要有两大系列:(1)国际标准化组织(ISO)和国际电工委员会(IEC)●ISO/IEC:JPEG,JPEG2000,MPEG-x

(2)国际电信联盟电信标准部(ITU-T)●ITU-T:H.26x2023/5/24第四页,共一百八十五页,编辑于2023年,星期五第五页,共一百八十五页,编辑于2023年,星期五1.JPEG标准JPEG

(JointPhotographicExpertsGroup)是联合图片专家组的英文缩写。ISO的JPEG主要针对静止图像的存储领域,制定了JPEG系列标准。●JPEG标准:静止图像存储压缩标准。●

JPEG-2000标准:面向静止图像的压缩标准。比JPEG标准压缩效率高2倍以上,性能也更好。●

MJPEG标准:面向视频序列,将各帧分别编码成JPEG图像,成为JPEG图像序列,但它们均为帧内编码帧,不进行帧间预测编码。2023/5/24第六页,共一百八十五页,编辑于2023年,星期五2.H.26×标准

ITU-T的视频编码专家组(VCEG)制定了H.26×标准系列,主要针对实时视频通信领域的应用,如可视电话、会议电视等。

(1)H.261标准:“速率为p×64kbit/s(p=1,2,…,30)视听业务的视频编解码”,简称为p×64kbit/s标准。

(2)H.262:同MPEG-2的视频部分(ISO/IEC13818-2)(3)H.263:低码率图像压缩标准。支持<64kbit/s。(4)H.264:等同MPEG-4AVC(ISO/IEC14496-10)

2023/5/24第七页,共一百八十五页,编辑于2023年,星期五

H.26×-----------MPEG在标准体系构造上,H.26×系列标准更具有针对性。其仅仅涉及数字视频压缩编码环节,而未涉及其他系统层、及音频层的内容。所以H.26×系列标准仅是多媒体通信系统中的一个功能模块。

MPEG系列标准则更系统化,其MPEG系列标准涵盖了整个多媒体系统的系统层、视频、音频等各个子系统,形成了一个完整的体系。也可以这么说,H.26×标准只相当于MPEG标准中的视频编码部分。2023/5/24第八页,共一百八十五页,编辑于2023年,星期五H.261

H.261是ITU-T为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的,速率为64kb/s的整数倍。H.261只对CIF(352x288像素,会议电视)和QCIF(176x144像素,可视电话)两种图像格式进行处理,每帧图像分成图像层、宏块组(GOB)层、宏块(MB)层、块(Block)层来处理。

H.261是最早的运动图像压缩标准,它详细制定了视频编码的各个部分,包括运动补偿的帧间预测、DCT变换、量化、熵编码,以及与固定速率的信道相适配的速率控制等部分。

由于在帧间压缩算法中只预测到后1帧,所以在延续时间上比较有优势,但图像质量难以做到很高的清晰度,无法实现大压缩比和变速率录像等。

2023/5/24第九页,共一百八十五页,编辑于2023年,星期五H.263

H.263是最早用于低码率视频编码的ITU-T标准,是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。它是在H.261基础上发展起来的,其标准输入图像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。

H.263与H.261相比采用了半象素的运动补偿,并增加了4种有效的压缩编码模式。随后出现的第二版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。

H.263还吸取了MPEG的双向运动预测等措施,进一步提高帧间编码的预测精度,一般说,在低码率时,采用H.263只要一半的速率可获得和H.261相当的图像质量。2023/5/24第十页,共一百八十五页,编辑于2023年,星期五H.264

H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。1996年制定H.263标准后,ITU-T的视频编码专家组(VCEG)开始了两个方面的研究:一个是短期研究计划,在H.263基础上增加选项(之后产生了H.263+与H.263++);另一个是长期研究计划,制定一种新标准以支持低码率的视频通信。长期研究计划产生了H.26L标准草案,其目标是研制出新的压缩标准,与以前的任何标准相比,效率要提高一倍,同时具有简单、直观的视频编码技术,网络友好的视频描述,适合交互和非交互式应用(广播、存储、流煤体)。

2023/5/24第十一页,共一百八十五页,编辑于2023年,星期五H.264标准

H.264具有压缩效率高、算法先进、抗误码能力强、网络亲和性好等技术优势,因而极有可能会成为广播电视、通信及存储媒体领域的统一编码标准,而且会成为宽带交互新媒体的国际标准。

H.264能够适应现有以及未来网络的发展要求,并能在网络及广播信道中传输与接收。在数字电视领域,H.264已成为数字高清晰度电视(HDTV)的编码方案,因而对数字电视与高清晰度电视的普及与发展具有非常重要的意义。2023/5/24第十二页,共一百八十五页,编辑于2023年,星期五

2001年,ISO的MPEG组织认识到H.26L潜在的优势,随后ISO与ITU开始组建包括来自ISO/IECMPEG与ITU-TVCEG的联合视频组(JVT),JVT的主要任务就是将H.26L草案发展为一个国际性标准。于是,在ISO/IEC中该标准命名为AVC(AdvancedVideoCoding),作为MPEG-4标准的第10个选项;在ITU-T中正式命名为H.264标准。该标准在2003年3月正式获得批准。

2023/5/24第十三页,共一百八十五页,编辑于2023年,星期五3.MPEG标准

MPEG(MovingPictureExpertsGroup)是运动图片专家组的英文缩写。这个专家组开发的标准通常称为MPEG标准。●MPEG-1:针对1.5Mbit/s以下数码率数字存储媒体应用的运动图像及其伴音编码,标准号ISO/IEC11172。●

MPEG-2:运动图像及其伴音信息的通用编码,标准号

ISO/IEC13818。●

MPEG-4:音视对象编码,标准号ISO/IEC14496。●

MPEG-7:多媒体内容描述接口,标准号ISO/IEC15938。●

MPEG-21:多媒体框架,标准号ISO/IEC21000。2023/5/24第十四页,共一百八十五页,编辑于2023年,星期五

MPEG是压缩运动图像及其伴音的视音频编码标准,它采用了帧间压缩,仅存储连续帧之间有差别的地方

,从而达到较大的压缩比。

MPEG现有MPEG—1、MPEG—2和MPEG—4三个版本,以适应于不同带宽和图像质量的要求。

①、MPEG—1的视频压缩算法依赖于两个基本技术,一是基于16*16(像素*行)块的运动补偿,二是基于变换域的压缩技术来减少空域冗余度,压缩比相比M-JPEG要高,对运动不激烈的视频信号可获得较好的图像质量,但当运动激烈时,图像会产生马赛克现象。2023/5/24第十五页,共一百八十五页,编辑于2023年,星期五

MPEG-1以1.5Mbps的数据率传输视音频信号,MPEG-1在视频图像质量方面相当于VHS录像机的图像质量,视频录像的清晰度的彩色模式≥240TVL,两路立体声伴音的质量接近CD的声音质。

MPEG-1是前后帧多帧预测的压缩算法,具有很大的压缩灵活性,能变速率压缩视频,可视不同的录像环境,设置不同的压缩质量,从每小时80MB至400MB不等,但数据量和带宽还是比较大。

2023/5/24第十六页,共一百八十五页,编辑于2023年,星期五②、MPEG-2它是获得更高分辨率(720*572)提供广播级的视音频编码标准。MPEG-2作为MPEG-1的兼容扩展,它支持隔行扫描的视频格式和许多高级性能包括支持多层次的可调视频编码,适合多种质量如多种速率和多种分辨率的场合。它适用于运动变化较大,要求图像质量很高的实时图像。对每秒30帧、720*572分辨率的视频信号进行压缩,数据率可达3-10Mbps。由于数据量太大,不适合长时间连续录像的需求。

2023/5/24第十七页,共一百八十五页,编辑于2023年,星期五

③MPEG-4是为移动通信设备在Internet网实时传输视音频信号而制定的低速率、高压缩比的视音频编码标准。

MPEG-4标准是面向对象的压缩方式,不是像MPEG-1和MPEG-2那样简单地将图像分为一些像块,而是根据图像的内容,其中的对象(物体、人物、背景)分离出来,分别进行帧内、帧间编码,并允许在不同的对象之间灵活分配码率,对重要的对象分配较多的字节,对次要的对象分配较少的字节,从而大大提高了压缩比,在较低的码率下获得较好的效果,

MPEG-4支持MPEG-1、MPEG-2中大多数功能,提供不同的视频标准源格式、码率、帧频下矩形图形图像的有效编码。

2023/5/24第十八页,共一百八十五页,编辑于2023年,星期五总之,MPEG-4有三个方面的优势:

①、具有很好的兼容性;

②、MPEG-4比其他算法提供更好的压缩比,最高达200:1

③、MPEG-4在提供高压缩比的同时,对数据的损失很小。所以,MPEG-4的应用能大幅度的降低录像存储容量,获得较高的录像清晰度,特别适用于长时间实时录像的需求,同时具备在低带宽上优良的网络传输能力。2023/5/24第十九页,共一百八十五页,编辑于2023年,星期五4.AVS标准

AVS视频标准(GB/T20090.2-2006)——我国具备自主知识产权的第二代信源编码标准,主要面向高清晰度和高质量数字电视广播、网络电视、高密度激光数字存储媒体等。(1)性能高,编码效率是MPEG-2的2倍以上,与H.264的编码效率处于同一水平;(2)复杂度低,算法复杂度比H.264明显低,软硬件实现成本都低于H.264;(3)我国掌握主要知识产权,专利授权模式简单,费用低。2023/5/24第二十页,共一百八十五页,编辑于2023年,星期五AVS标准

AVS(AudioVideoCodingStandard)的正式名称为“信息技术-先进音视频编码”,包括系统、视频、音频、数字版权管理(DRM)等主要技术标准及一致性测试等支撑标准,主要面向HDTV、HD-DVD和宽带流媒体等视频应用。2023/5/24第二十一页,共一百八十五页,编辑于2023年,星期五5.2MPEG-1音频编码标准5.2.1MPEG-1音频编码标准简介MPEG-1音频压缩标准是世界上第一个高保真音频编码标准。MPEG-1音频压缩标准的主要性能:输入信号为线性PCM信号,采样率为32,44.1或48kHz,输出为32kb/s~384kb/s压缩后码流支持单声道或双声道,共有4种模式。2023/5/24第二十二页,共一百八十五页,编辑于2023年,星期五5.2MPEG-1音频编码标准(3)MPEG-1音频压缩标准提供三个独立的压缩层次①层1的编码器最为简单,编码器的输出数据率为384kb/s,主要用于小型数字盒式磁带(digitalcompactcassette,DCC)②层2的编码器的复杂程度属中等,编码器的输出数据率为256kb/s~192kb/s,其应用包括数字广播声音(DAB)、数字音乐、CD-I(compactdisc-interactive)和VCD(videocompactdisc)等③层3的编码器最为复杂,编码器的输出数据率为64kb/s,主要应用于网络音乐2023/5/24第二十三页,共一百八十五页,编辑于2023年,星期五5.2MPEG-1音频编码标准5.2.2MPEG-1音频编码原理

MPEG音频压缩的的主要依据是人耳朵的听觉特性,使用“心理声学模型(psychoacousticmodel)”来达到压缩声音数据的目的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此就可以把这部分信号去掉听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。大多数人的听觉系统对2kHz~5kHz之间的声音最敏感。一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值2023/5/24第二十四页,共一百八十五页,编辑于2023年,星期五5.2MPEG-1音频编码标准3.听觉系统存在掩蔽特性,听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的音频而发生变化例如,同时有两种频率的音频存在,一种是1000Hz的音频,另一种是1100Hz的音频,但它的强度比前者低18分贝,在这种情况下,1100Hz的音频就听不到4.数字音频压缩编码主要原理:是编码过程中保留有用信息的而丢掉被掩蔽的信号,其结果是编解码后重构的信号和原始音频信号不完全相同,利用人耳的听觉特性,将声音中与听觉无关的“不相关”部分去除。对于人耳来说很难感觉出他们之间的差异。2023/5/24第二十五页,共一百八十五页,编辑于2023年,星期五MPEG-1音频压缩定义了3个层次,每个层次针对不同的应用,它们的基本模型是相同的层1是最基础的,层2和层3都在层1的基础上有所提高。每个后继的层次都有更高的压缩比,但需要更复杂的编码解码器MPEG-1的音频数据分成帧(frame),层1每帧包含384个样本的数据,每帧由32个子带分别输出的12个样本组成。层2和层3每帧为1152个样本2023/5/24第二十六页,共一百八十五页,编辑于2023年,星期五MPEG-1音频码流构成的帧格式层1、2和层3的子带样本层1帧:384样本层2和层3:1152样本2023/5/24第二十七页,共一百八十五页,编辑于2023年,星期五5.2MPEG-1音频编码标准MPEG-1层1音频压缩技术子带编码滤波器组的划分

MPEG-1音频编码器把输入信号变换到32个频域子带中去。子带的划分方法有两种,一种是线性划分,另一种是非线性划分。2023/5/24第二十八页,共一百八十五页,编辑于2023年,星期五MPEG-1层1压缩编码器原理框图2023/5/24第二十九页,共一百八十五页,编辑于2023年,星期五(1)多通道滤波器(2)心理声学模型MPEG音频心理声学模型主要实现步骤如下:(a)用快速傅立叶变换FFT将音频样值转换到频域。(b)将得到的频率组成临界频带。(c)在临界频带的谱值中,将单音(似正弦)和非单音(似噪声)分开。(d)在临界频带决定噪声掩蔽阈值之间,模型在不同的临界频带给信号应用适当的掩蔽函数。(e)计算由临界频带引起的每个子带的掩蔽值。(f)计算每个子带的SMR(信号掩蔽比)。2023/5/24第三十页,共一百八十五页,编辑于2023年,星期五(3)比特分配比特分配过程决定分配给各个子带的编码比特数,分配的依据是心理声学模型的信息。LayerⅠ和LayerⅡ的比特分配过程是从计算掩蔽噪声比开始的。MNR=SNR-SMR2023/5/24第三十一页,共一百八十五页,编辑于2023年,星期五(4)比例因子按输入信号的大小来增减量化步长,输入信号小用较小的量化步长,输入信号大用较大的量化步长。2023/5/24第三十二页,共一百八十五页,编辑于2023年,星期五(5)码流格式化——帧形成

MPEG-1音频数据是分成帧(frame)传送的,LayerⅠ每帧由32个子带,每个子带12个样值,共384个样值的数据组成。LayerⅠ的帧结构如图所示。2023/5/24第三十三页,共一百八十五页,编辑于2023年,星期五

MPEG-1层1音频编码帧结构1个子带32个子带2023/5/24第三十四页,共一百八十五页,编辑于2023年,星期五LayerⅡ的特点LayerⅡ和LayerⅠ编码原理类似,不同之处有以下几点:LayerⅡ的每个子带不是均匀带宽;LayerⅡ使用的FFT精度高一些;LayerⅡ的帧长度码流是LayerⅠ的3倍;2023/5/24第三十五页,共一百八十五页,编辑于2023年,星期五

LayerⅡ和LayerⅠ帧结构的不同之处在于描述比特分配的比特位数是不一样的。

LayerⅡ的帧包含1152个PCM的样值,如果取样频率为48kHz,一帧相当于1152/48k=24ms的声音样值,这样LayerⅡ的精确度为24ms,而对于LayerⅠ来言,精确度为8ms,如果用于编辑的话,LayerⅠ更精确。2023/5/24第三十六页,共一百八十五页,编辑于2023年,星期五Layer2音频编码方框图2023/5/24第三十七页,共一百八十五页,编辑于2023年,星期五LayerⅡ码流结构图2023/5/24第三十八页,共一百八十五页,编辑于2023年,星期五Layer3音频编码

LayerⅢ(也即MP3)采用了LayerⅠ和LayerⅡ未用到的技术。不等宽子带;MDCT----改进DCT;

哈夫曼编码----无损编码----提高压缩比20%10:12023/5/24第三十九页,共一百八十五页,编辑于2023年,星期五LayerIII音频编码方框图2023/5/24第四十页,共一百八十五页,编辑于2023年,星期五LayerIII音频解码方框图2023/5/24第四十一页,共一百八十五页,编辑于2023年,星期五5.3杜比AC-3音频编码算法

美国高级电视制式委员会(ATSC)规定电视伴音压缩标准是杜比(Dolby)实验室开发的AC-3系统。该系统的音响效果为高保真立体环绕声。AC是英语“音频感觉编码系统”的缩写词。目前市场流行的称为“家庭影院”的音响系统多数采用此标准。

杜比AC-3规定的取样频率为48kHz,它锁定于27MHz的系统时钟。每个音频节目最多可有6个音频信道。2023/5/24第四十二页,共一百八十五页,编辑于2023年,星期五杜比AC-3环绕声系统AC(AudioCoding)-3是一种播放高音质和效果的环绕声系统杜比AC-3系统利用心理声学原理对音频信号进行压缩编码其取样频率有32KHz、44.1KHz、48KHz对音频声道采用独立方式编码,将每个声道的频率范围扩展到20Hz~20kHz全频域杜比AC-3的基本声道有5个,即前方左、右、中声道,后方环绕左和环绕右声道,另外还有一个超重低音声道,共有6个声道。其中超重低音声道的最高频率为120Hz,不能算一个完整的声道,因此又称为0.1声道,这样加起来便称为5.1声道

2023/5/24第四十三页,共一百八十五页,编辑于2023年,星期五图5-4五声道立体声扬声器的安排C屏幕收听区LRRsLs2023/5/24第四十四页,共一百八十五页,编辑于2023年,星期五其特点有:

(1)全音频声道。AC-3系统播放的音质清晰,声场动态范围广,声象重现逼真,具有真实现场感(2)立体环绕声。AC-3系统具有左和右后方环绕声道,其环绕包围感很强,烘托现场气氛逼真,可使视听者进入出神入化的境界(3)声道之间分离度高

2023/5/24第四十五页,共一百八十五页,编辑于2023年,星期五从家庭影院的应用和发展来看,杜比AC-3环绕声系统将可能成为主流(1)美国已确定杜比AC-3环绕声系统为HDTV(高清晰度电视)音频信号的编码和解码标准(2)数字视盘机(DVD)的音频也采用AC-3音频标准(3)美国几乎所有著名的电影公司制作的影片都按照AC-3系统录制(4)目前世界著名的电子公司生产出的DVD机,A/V放大器都带有AC-3解码器2023/5/24第四十六页,共一百八十五页,编辑于2023年,星期五⑴AC-3编码原理概述AC-3编码系统采用了全音域杜比噪声衰减系统,在没有音频信号掩蔽时,集中力量降低或消除噪声,在其它时间根据人的听觉频率选择性把每个声道的音频频谱分割成不同带宽的子频带,结果使噪声处在距音频信号频率分量很近的频率上,就很容易被音频信号所遮盖。除了降低噪声以保证音质外,杜比AC-3系统为降低数码率,对各频带采用不同的取样率,根据频谱或节目的动态特性来分配各频带的比特数。2023/5/24第四十七页,共一百八十五页,编辑于2023年,星期五杜比公司除运用上述声学原理外,还运用了它拥有的杜比降噪技术,开发出数码化的“自适应编码”系统。这是一种极具选择性和抑制噪声能力的自适应编码体系。

AC-3将多声道作为一个整体进行编码,比单声道编码效率高,同时对各个声道和每个声音内的各频带信号用不同的取样率进行量化、对噪声进行衰减或掩蔽,结果AC-3系统的数码率降低而音质损害很小。2023/5/24第四十八页,共一百八十五页,编辑于2023年,星期五

AC-3至少可以处理20bit动态范围的数字音频信号,频率范围从20Hz~20kHz(0.5dB),3Hz和20.3kHz处为-3dB。重低音声道频率范围为20~120Hz(0.5dB),3Hz和12Hz处为-3dB。且支持32kHz,44.1kHz,48kHz的取样频率。AC-3的数字音频数据经加误码纠错后数码率仅为384kb/s,因此ITU-R在1992年正式接受AC-3的5.1声道格式。AC-3含有MPEG系统的时间印记(timestamp),故可与MPEG视频同步。2023/5/24第四十九页,共一百八十五页,编辑于2023年,星期五⑵AC-3系统的方框图AC-3编码器接受声音PCM数据,最后产生压缩数据流。AC-3算法通过对声音信号频域表示的粗略量化,可以达到很高的编码增益。图5-8AC-3编码器原理方框图分析滤波器组6声道PCM数据耦合预处理尾数量化窗处理频谱包络编码核心比特分配AC-3数据帧格式AC-3码流比特分配2023/5/24第五十页,共一百八十五页,编辑于2023年,星期五

第一步把时间域内的PCM数据值变换为频域内成块的一系列变换系数。

AC-3解码器输入信号是一组频谱信号,它是由时域信号PCM数据经过时-频变换而得到。该频谱数据流分为指数部和尾数部两部分,指数部分采用差分方式进行编码,编码后的指数代表了整个信号的频谱,可作为频谱包络的参数。其尾数部分按照比特分配的结果进行量化。于是,量化尾数和频谱包络形成了AC-3码流的主要信息,连同其它辅助信号(例如比特分配等)构成了AC-3比特流。

2023/5/24第五十一页,共一百八十五页,编辑于2023年,星期五

AC-3数据帧一个AC-3串行编码的音频数据流是由一个同步帧的序列所组成音频样本块(AB)其中每个代表256个新的音频样本,AB0~AB5的每一块代表一个编码通道,可以被分别独立解码,块的大小可以调整,但总数据量不变同步信息(SI)数码流信息(BSI),包含描述编码数据流业务的各种参数辅助数据(AUX)误码检测(CRC)2023/5/24第五十二页,共一百八十五页,编辑于2023年,星期五AC-3解码器首先必须与编码数据流同步,经误码纠错后再从码流中分离出各种类型的数据,如控制参数、系数配置参数、编码后的频谱包络和量化后的尾数等。然后根据声音的频谱包络产生比特分配信息,对尾数部分进行反量化,恢复变换系数的指标和尾数,再经过合成滤波器组由频域表示变换到时域表示,最后输出重建的PCM数据值信号。

图5-10AC-3解码器原理方框图AC-3帧同步、纠错、解帧格频谱包络解码比特分配比特分配信息尾数反量化合成滤波器组PCM码流AC-3码流2023/5/24第五十三页,共一百八十五页,编辑于2023年,星期五5.4MPEG-2音频编码标准MPEG-2音频压缩MPEG-2声音编码标准是MPEG为多声道声音开发的低码率编码方案,它是在MPEG-1声音标准基础上发展而来的。和MPEG-1相比,MPEG-2声音主要增加了三个方面的内容支持5.1路环绕声。它能提供5个全带宽声道(左、右、中和两个环绕声道),外加一个低频效果增强声道,统称为5.1声道支持多达8种语言或解说增加了低取样和低码率。在保持MPEG-1声音的单声道和立体声的原有取样率的情况下,MPEG-2又增加了三种取样率,即把MPEG-1的取样率降低了一半,(16kHz,22.05kHz,24kHz)以便提高码率低于64kbit/s时的每个声道的声音质量2023/5/24第五十四页,共一百八十五页,编辑于2023年,星期五2.MPEG-2的两种音频数据压缩格式MPEG-2Audio,或者称为MPEG-2多通道(Multichannel)音频,与MPEG-1Audio兼容,所以又称为MPEG-2BC(BackwardCompatible)MPEG-2AAC(AdvancedAudioCoding),与MPEG-1声音格式不兼容,因此通常称为非后向兼容MPEG-2NBC(Non-Backward-Compatible)标准

2023/5/24第五十五页,共一百八十五页,编辑于2023年,星期五MPEG-2AudioMPEG-2Audio(ISO/IEC13818-3)和MPEG-1Audio(ISO/IEC1117-3)标准都使用相同种类的编译码器,LayerⅠ,LayerⅡ和LayerⅢ的结构也相同MPEG-2音频标准与MPEG-1标准相比,MPEG-2做了如下扩充:增加了16kHz,22.05kHz和24kHz采样频率扩展了编码器的输出速率范围,由32~384kbit/s扩展到8~640kbit/s增加了声道数,支持5.1声道和7.1声道的环绕声。此外MPEG-2还支持LinearPCM(线性PCM)和DolbyAC-3(AudioCodeNumber3)编码

2023/5/24第五十六页,共一百八十五页,编辑于2023年,星期五MPEG-2中的AAC编码AAC:AdvancedAudioCoding先进音频编码,不向下兼容MPEG-2AAC是声音感知编码标准,MPEG-2AAC主要使用听觉系统的掩蔽特性来减少声音的数据量,并且通过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。AAC支持的采样频率可从8kHz到96kHzAAC编码器的音源可以是单声道的、立体声的和多声道的声音。AAC标准可支持48个主声道、16个低频音效加强通道LFE(lowfrequencyeffects)、16个配音声道(overdubchannel)或者叫做多语言声道(multilingualchannel)和16个数据流2023/5/24第五十七页,共一百八十五页,编辑于2023年,星期五5.MPEG-2AAC压缩比为11:1,即每个声道的数据率为(44.1×16)/11=64kbit/s,而5个声道的总数据率为320kbit/s的情况下,很难区分还原后的声音与原始声音之间的差别6.

与MPEG的LayerⅡ相比,MPEG-2AAC的压缩率可提高1倍,而且质量更高,与MPEG的LayerⅢ相比,在质量相同的条件下数据率是它的70%。2023/5/24第五十八页,共一百八十五页,编辑于2023年,星期五(a)AAC采用了改进的余弦变换MDCT滤波器组。

(b)采用了新的时间/频率编码方案,即瞬时噪声定形(TemporalNoiseShaping,TNS)。(c)因为音频信号有较强的相关性,在AAC系统中采用了预测技术,有效地提高了编码效率。(d)能细致地控制量化步长大小,使得比特利用更为有效。(e)在AAC系统中采用了霍夫曼熵编码,并配合灵活的码流结构,进一步提高了编码效率。

AAC增加的新编码工具2023/5/24第五十九页,共一百八十五页,编辑于2023年,星期五MPEG-2AAC的配置开发MPEG-2AAC标准采用的方法与开发MPEGAudio标准采用的方法不同。后者采用的方法是对整个系统进行标准化,而前者采用的方法是模块化的方法,把整个AAC系统分解成一系列模块,用标准化的AAC工具(advancedaudiocodingtools)对模块进行定义AAC标准定义了三种配置:基本类(MainProfile);----最好声音质量低复杂度类(LowComplexityProfile);--声音质量中可分级取样率类(ScalableSamplingRateProfile)--差2023/5/24第六十页,共一百八十五页,编辑于2023年,星期五

MPEG-2声音多声道扩展部分的数据结构 MPEG-2多声道声音编码标准和现有的MPEG-1声音标准保持后向兼容。在对原有的MPEG-1两声道增加独立的环绕声道时,MPEG-2尽量保特和MPEG-1声音语法的兼容性,MPEG-2中的主声道(左、右)仍然保持后向兼容,而环饶声道采用新的编码方法和语法

2023/5/24第六十一页,共一百八十五页,编辑于2023年,星期五MPEG-1、MPEG-2音频参数的比较2023/5/24第六十二页,共一百八十五页,编辑于2023年,星期五5.5AVS音频编码标准

我国的数字音视频标准工作组(AVS)完成了具有自主知识产权的面向数字电视、高密度激光存储、网络流媒体等重大音频应用的新一代音频编码压缩技术标准—AVS音频编码标准,其编码性能和压缩效率已经达到了国际上先进的MPEGAAC音频编码标准,优于MP3等音频编码技术,并且还支持可分级编码。2023/5/24第六十三页,共一百八十五页,编辑于2023年,星期五

AVS音频采用通用的感知音频编码框架,支持采样率8kHz~96kHz的多声道PCM信号输入。它最多支持32个主声道、8个低频增强声道,输出码率为每声道为16kbps~96kbps,同时支持精细可分级编码,可分级的编解码步长为1kbps。

由于采用通用的感知音频编码框架,采用了最新的数字信号处理技术和编码压缩技术,在64kbps的编码码率下达到了感知透明的编码质量,其编码压缩效率已达到1/10~1/16。2023/5/24第六十四页,共一百八十五页,编辑于2023年,星期五心理声学摸型长短窗判决IntMDCTSPSC立体声编码量化CBC熵编码比特流格式化输入PCM数据AVS音频编码流AVS音频立体声编码原理框图2023/5/24第六十五页,共一百八十五页,编辑于2023年,星期五窗信息IntIMDCTSPSC立体声解码逆量化CBC解码比特流去格式化AVS音频编码流解码输出PCMAVS音频立体声解码原理框图上下文比特平面编码方极坐标立体声2023/5/24第六十六页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准MPEG-1是MPEG-2的一个子集,即MPEG-2能兼容MPEG-1MPEG-1目标MPEG-1标准的设计思想是在1Mbit/s到1.5Mbit/s的低带宽条件下,提供尽可能高的图像质量(包括音频,以下所指图像均包括音频)。针对CD-ROM、光盘的视频存储和放像所制定的数字电视标准VCD使用MPEG-1标准,图像尺寸为352×288,标准速率为1.2Mbit/s2023/5/24第六十七页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准1.MPEG-1标准的内容ISO/IEC11172包括三大部分:ISO/IEC11172-1第一部分系统ISO/IEC11172-2第二部分视频ISO/IEC11172-3第三部分音频MPEG-l标准可以处理各种类型的活动图像,其基本算法对于压缩水平方向352个像素、竖直方向288个像素的空间分辨力,每秒24/25/30幅画面的运动图像有很好的效果在MPEG-l标准中的一帧图像的概念不同于电视中帧的概念,前者一定是逐行扫描的图像,如果待处理信号是隔行扫描的图像,则编码前必须将其转换成逐行扫描的格式2023/5/24第六十八页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准MPEG-1标准采用了一系列技术以获得高压缩比对色差信号进行亚采样,减少数据量采用运动补偿技术减少帧间冗余度做二维DCT变换去除空间相关性对DCT系数进行量化,舍去不重要的信息,将量化后的DCT系数按照频率重新排序将DCT系数进行变字长熵保持编码对每数据块的直流分量(DC)进行预测差分编码2023/5/24第六十九页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准在MPEG-l标准中,考虑到压缩比和随机存取这对矛盾,一共定义了四种图像类型:I帧图像:帧内帧图像,采用帧内编码,不参照其他图像P帧图像:预测帧图像,参照前一幅I帧或P帧图像做运动补偿编码B帧图像:双向预测帧图像,参照前一幅和后一幅I帧或P帧图像做双向运动补偿编码D类图像:直流(DC)图像,这类图像中只含直流分量,是为快放功能而设计的2023/5/24第七十页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准I帧、P帧、B帧示意图2023/5/24第七十一页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准帧内图像I的压缩编码算法框图2023/5/24第七十二页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准预测图像P的压缩编码算法框图2023/5/24第七十三页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准双向预测图像B的压缩编码算法框图2023/5/24第七十四页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准I帧、P帧和B帧图像的依赖关系2023/5/24第七十五页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准图像的显示顺序和编码顺序显示顺序:编码顺序:2023/5/24第七十六页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准I帧、P帧、B帧的数据字节和压缩比2023/5/24第七十七页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准编解码延时问题由于编码顺序和显示顺序之间的差异,带来编、解码总延时达0.8~1秒时间这种延时对广播性质的图像传输不会带来任何影响,因为用户并不能发现发射端与接收端信号起始时间的差异对于交互性质的图像传输,例如,数字会议电视则带来十分不便。因为甲方图像传至乙方经编码、解码要延时0.8~1秒时间;乙方图像传至甲方经编码、解码也要延时0.8~1秒时间,这样,如果甲对乙提一个问题,则1.8~2秒以后才能得到回答2023/5/24第七十八页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准解决编解码延时过长问题减少B帧使两个I帧之间的帧数减少,则编、解码总延时下降,甚至可以把B帧、P帧全部取消,这样,可以得到0延时。这种方式也称M-JPEG(Motion-JPEG)方式。但此时的压缩比降到了5:1~7:1延时与压缩倍数是互相矛盾的2023/5/24第七十九页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准5.6.2.MPEG-1视频流数据结构视频流数据由以下6部分组成:1.视频序列2.图像组3.图像4.片(条)5.宏块6.块2023/5/24第八十页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准MPEG-1视频流结构2023/5/24第八十一页,共一百八十五页,编辑于2023年,星期五1.编码原理

MPEG-2与MPEG-1视频编解码原理框图基本相同。利用运动补偿帧间预测编码----消除时间冗余;利用DCT----消除空间冗余;对DCT系数进行熵编码----消除符号统计冗余;

---------达到进一步压缩数码率的目的。

5.6.3MPEG-1与MPEG-2视频编解码原理2023/5/24第八十二页,共一百八十五页,编辑于2023年,星期五5.6.3MPEG-1与MPEG-2视频编解码原理2.编码过程

(1)帧重排

(2)当输入的第一帧作为I帧图像进入图4-8所示的编码器中时,开关K1,K2和K4在上方,K3在左方。

(3)当P4作为P帧进入编码器时,开关K1,K2和K4切换到下方,K3还在左方(4)当B2作为B帧进入编码器时,开关K1

在下方,K2

在上方,K3

在右方,K4

在中间。2023/5/24第八十三页,共一百八十五页,编辑于2023年,星期五MPEG-2压缩编码原理框图2023/5/24第八十四页,共一百八十五页,编辑于2023年,星期五3.图像组(GroupofPictures,GOP)

在图示的图像序列中,每12帧中包含1个I帧、3个P帧和8个B帧,称为一个图像组(GOP)。

2023/5/24第八十五页,共一百八十五页,编辑于2023年,星期五图像序列原始顺序2023/5/24第八十六页,共一百八十五页,编辑于2023年,星期五经过编码器编码后,6个视频层次构成的编码视频码流称为视频基本码流(ES)。

(1)在视频序列层中,一个编码的视频序列由一个序列信头开始,后面跟随一个图像组头,然后是由许多图像(I,P和B)组成的一系列GOP,视频序列结束于一个序列终止码。

(2)在图像组层中,GOP头中给出了时间码和紧跟在I幀后面的B图像的预测特性等信息。2023/5/24第八十七页,共一百八十五页,编辑于2023年,星期五(3)在图像层中,图像头中给出了时间参考信息、图像编码类型和VBV(视频缓存校验器)延时等信息。(4)在像条层中,像条头中给出了像条垂直位置、量化因子码等信息。(5)在宏块层中,其中的宏块类型码中给出了宏块属性、运动矢量。(6)最后一层是块层,给出了其DCT系数。2023/5/24第八十八页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准视频基本码流结构2023/5/24第八十九页,共一百八十五页,编辑于2023年,星期五MPEG-2解码

MPEG-2解码是MPEG-2编码处理的逆过程,从编码比特流中重建图像帧。MPEG-2解码框图2023/5/24第九十页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准5.6.4MPEG-2功能扩展

1.MPEG-2有“按帧编码”和“按场编码”两种模式

MPEG-1只支持逐行扫描,不支持隔行扫描;

MPEG-2允许逐行扫描和隔行扫描,基于“帧”和“场”编码,显著提高编码效率;

2023/5/24第九十一页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准5.6.4MPEG-2功能扩展

2.MPEG-2增加了可分级编码模式视频编码的可分级性----指视频码流数码率的可调整性,即视频数据只能压缩一次,却能以多种不同的帧频、空间分辨率(清晰度)或视频质量进行解码,从而支持多种用户的不同需求。2023/5/24第九十二页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准考虑到要适应不同数据速率设备的应用,MPEG专家组定义了三种质量不同的编码方式:信噪比可分级性SNR(Signal-to-Noisescalability)是指图像质量的折中,对于基本层码流使用较粗糙的量化比得到比较低的信噪比,而增强层码流使用提高量化精度后的额外信息得到比较高的信噪比空间分辨率可分级性(Spatialscalability)是指图像的空间分辨率的折中,对于基本层码流使用比较低的图像分辨率,而对于增强层码流使用比较高的图像分辨率时间分辨率可分级性(TemporalScalability)是指图像在时间方向上分辨率的折中,帧频随分层级数而变化

三者可组合成多层混合可分级编码2023/5/24第九十三页,共一百八十五页,编辑于2023年,星期五2023/5/24第九十四页,共一百八十五页,编辑于2023年,星期五2023/5/24第九十五页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准5.6.4MPEG-2功能扩展

3.MPEG-2定义了“类”和“级”的概念为了使MPEG-2能适应图像质量从低到高的各种应用领域,MPEG-2标准定义了“类”(Profile,又称为档次)和“等级”(Level)。“类”是整个比特流构成所定义的语法子集,即每种类对应了一套新的压缩处理算法,类共有5种。“等级”是对比特流参数的一组定义了的限制,即每一个等级指定了一套参数范围(如图像大小、帧速率和位速率)。按图像分辨率共有4种等级。同一类中的不同级,遵循共同的语法,只是参数不同而已。2023/5/24第九十六页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准2023/5/24第九十七页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准等级:Lowlovel类似于ITU-TRes.H.261的CIF或MPEG-1的SIFMainlevel相应于普通电视High-1440level略相应于每行1440个抽样的HDTVHighlevel略相应于每行1920个抽样的HDTV2023/5/24第九十八页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准MPEG-2标准所容许的11个组合2023/5/24第九十九页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准MPEG-2容许的帧速率2023/5/24第一百页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准亮、色度格式和图像编码类型2023/5/24第一百零一页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准

MPEG-2的上限比特率(上限速率)2023/5/24第一百零二页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准5.6.4图像格式MPEG-2的图像格式(VideoFormat)分为4级低级图像格式主级图像格式高级窄屏幕图像格式高级宽屏幕图像格式2023/5/24第一百零三页,共一百八十五页,编辑于2023年,星期五5.6MPEG-1和MPEG-2视频编码标准2023/5/24第一百零四页,共一百八十五页,编辑于2023年,星期五2023/5/24第一百零五页,共一百八十五页,编辑于2023年,星期五2023/5/24第一百零六页,共一百八十五页,编辑于2023年,星期五2023/5/24第一百零七页,共一百八十五页,编辑于2023年,星期五2023/5/24第一百零八页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准MPEG-4的目标是要在音视对象的形态下能够高度可靠地完成视音频压缩数据通信,在超低带宽(10Kbit/s到1Mbit/s)的条件下提供尽可能好的图像质量并且具有很强的交互功能MPEG-4提供了一种暂新的交互方式----基于内容的交互,对每一个音视对象(AV)进行交互和操控。用户可以改变场景中对象的位置、大小、视角、形状等,甚至清除该对象。从1994年开始工作,1999年12月ISO/IEC制订了MPEG-4标准,在互联网及移动通信中有较好的应用2023/5/24第一百零九页,共一百八十五页,编辑于2023年,星期五2023/5/24第一百一十页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准5.7.1MPEG-4标准概述MPEG-4标准支持7个新的功能。可粗略划分为3类:基于内容的交互性、高压缩率和灵活多样的存取模式1.基于内容的交互性(Content-basedInteractivity)基于内容的操作与比特流编辑:支持无须编码就可进行基于内容的操作与比特流编辑自然与合成数据混合编码:提供将自然视频图像同合成数据(如文本、图形等)有效结合的方式,同时支持交互性操作增强的时间域随机存取:MPEG-4将提供有效的随机存取方式:在有限的时间间隔内,可按帧或任意形状的对象,对一音、视频序列进行随机存取2023/5/24第一百一十一页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准2.高压缩率(Compression)提高编码效率:与现有的或正在制定的标准相比,在可比拟速率上,MPEG-4标准将提供更好的主观视觉质量的图像。一般地说,MPEG-4的压缩倍数高达100倍。这一功能可望在迅速发展的移动通信网中获得应用,但值得注意的是:提高编码效率不是MPEG-4的唯一的主要目标。对多个并发数据流的编码:MPEG-4将提供对一景物的有效多视角编码,加上多伴音声道编码及有效的视听同步。2023/5/24第一百一十二页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准3.灵活多样的存取

(UniversalAccess)错误易发环境中的抗错性(Robustness):“灵活多样”是指允许采用各种有线、无线网和各种存储媒体,MPEG-4将提高抗错误能力,尤其是在易发生严重错误的环境下的低比特应用中(移动通信链路)基于内容的尺度可变性(Content-basedScalability):内容尺度可变性意味着给图像中的各个对象分配优先级。其中,比较重要的对象用较高的空间和/或时间分辨率表示。基于内容的尺度可变性是MPEG-4的核心。2023/5/24第一百一十三页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准MPEG-4可视信息编码MPEG-4可视信息的码率范围可从5kbit/s~64Kbit/s(CIF以下的分辨率和15Hz以下的帧频)直至64kbit/s~4Mbit/s(ITU-R601的各种图像分辨率),并支持MPEG-1和MPEG-2已经提供的大多数功能。2023/5/24第一百一十四页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准传统图像编码方法VSMPEG-4的基于对象的图像编码方法传统图像编码方法依据信源编码理论的框架,将图像作为随机信号,利用其随机特性来达到压缩的目的。这种方法本身未能考虑信息获取者的主观意义与主观特性,未能考虑事件本身的特性如具体含义、重要性以及后果等等MPEG-4的图像编码的目标在于采用现代图像编码方法,利用人眼视觉特性,抓住图像信息传输的本质,从轮廓、纹理的思路出发,支持基于视觉内容的交互功能,从而获得更高的压缩比和图像质量2023/5/24第一百一十五页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准5.7.2MPEG-4视频编码

MPEG-4使用视频对象(VO,VideoObject)来描述图像视频对象的属性:形状(Shape) 外形,透明等运动(Motion) 位置,位移等纹理(Texture) 颜色,灰度等图像(序列)是由视频对象(包括背景)构成的VOVOMV2023/5/24第一百一十六页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准针对视频对象VO,进行如下编码形状编码:描述视频对象的形状二值形状编码1:表示VOP中像素属于视频对象0:表示VOP中像素不属于视频对象灰度形状编码用0~255表示VOP的透明度,0表示完全透明,255表示完全不透明VOP:VideoObjectPlane,视频对象面,表示视频对象形成的画面,其形状可以是任意的,当VOP是矩形时,则图像编码还原成传统图像编码2023/5/24第一百一十七页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准运动信息编码采用运动预测和运动补偿技术去除图像的帧间冗余度将VOP分为三类:I-VOP:帧内VOP,采用帧内编码技术P-VOP:前向VOP,采用前向预测编码技术B-VOP:双向VOP,采用双向预测编码技术P-VOPB-VOPI-VOP2023/5/24第一百一十八页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准纹理编码采用8×8DCT变换消除VOP的帧内冗余度VOP宏块VOP窗口8×8DCT8×8分级编码:

视频编码的可分级性(scalability)是指码率的可调整性,即视频数据只压缩一次,却能以多个帧率、空间分辨率或视频质量进行解码,从而可支持多种类型用户的各种不同应用要求。

----实现空间域、时间域多分辨率功能需求。2023/5/24第一百一十九页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准5.7.2MPEG-4基于VOP的视频编码基于VOP的视频编码方法示意图2023/5/24第一百二十页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准VOP编码原理图对象分割2023/5/24第一百二十一页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准

MPEG-4编码器基本框图2023/5/24第一百二十二页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准MPEG-4视频编码举例Sprite编码举例背景图镶嵌图拼接重构图2023/5/24第一百二十三页,共一百八十五页,编辑于2023年,星期五

MPEG-4通过视频对象层(VideoObjectLayer)的数据结构来实现分级编码。

MPEG-4提供了两种基本分级工具,即时域分级(TemporalScalability)和空域分级(SpatialScalability),此外还支持时域和空域的混合分级。每一种分级编码都至少有两层VOL,低层称为基本层,高层称为增强层。基本层提供了视频序列的基本信息,增强层提供了视频序列更高的分辨率和细节。

-------网络带宽和视频效果具有很好的适应性5.7.3MPEG-4可分级视频编码2023/5/24第一百二十四页,共一百八十五页,编辑于2023年,星期五5.7.4MPEG-4容错视频编码MPEG-4视频编码标准

----应用于网络传输时----误码、丢包、时延…-----要求:压缩效率/音视同步/容错掩错1.再同步----等间隔比特位周期性设置同步标记;失去同步----码流中任何差错都可能会导致失去同步解决方法:插入同步码字(起始码)能够限制差错传递到下一个同步码字同步码字应该和其它码字区别开同步码字可以插入到图像,条带的起始位置2023/5/24第一百二十五页,共一百八十五页,编辑于2023年,星期五2.可逆的变长编码RVLC----具备后向解码能力,恢复部分丢失数据;VLC只能前向解码。传统的VLC仅仅从前向唯一的解码----当一个VLC码字出错,则从当前解码码字开始到下一个同步码字之间的码字不能解码都要丢掉

RVLC既可以前向解码,也可以后向解码----如果一个RVLC码字出错,跳到下一个同步码字前,从后向解码,部分恢复数据2023/5/24第一百二十六页,共一百八十五页,编辑于2023年,星期五3.数据分割(DataPartitioning)将数据分成重要数据和一般数据分别放在码流的不同位置重要的数据紧跟着放在同步字的后边重要数据:编码模式,MV,DC系数一般数据放在重要数据的后边一般数据:AC系数

重要数据先于一般数据解码

2023/5/24第一百二十七页,共一百八十五页,编辑于2023年,星期五5.7MPEG-4标准典型节目码流解码器

2023/5/24第一百二十八页,共一百八十五页,编辑于2023年,星期五

ITU-T的H.264标准(ITU-TRec.H.264/ISO/IEC11496-10AVC)的工作由ISO/IEC下属的运动图像专家组MPEG和ITU下属的视频编码专家组VCEG(VideoCodingExpertsGroup)共同成立的联合视频小组JVT(JointVideoTeam)负责完成。由于H.264采用了许多不同于以往标准中使用的先进技术,所以相对于以往的标准,在相同的数码率下用H.264标准编码能够获得更高的图像质量。5.8H.264/AVC视频编码标准2023/5/24第一百二十九页,共一百八十五页,编辑于2023年,星期五ITU-TRec.H.263H.26LISO/IEC11496-10(MPEG-4AVC)MPEG(MovingPictureExpertsGroup)

+

VCEG(VideoCodingExpertsGroup)JVT(JointVideoTeam)H.264概述国际标准草案H.264/AVC2023/5/24第一百三十页,共一百八十五页,编辑于2023年,星期五

H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。H.264的特点:(1)更高的编码效率和简洁的表现形式。(2)对信道时延的适应性较强,既能用于低时延的实时业务(会议电视),又可用于无时延限制的场合(视频存储)。(3)提高网络适应性,采用“网络友好”的结构和语法,加强对误码和丢包的处理,提高解码器的差错恢复能力。(4)在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的应用。2023/5/24第一百三十一页,共一百八十五页,编辑于2023年,星期五H.264标准同以往标准的区别

H.264标准中诸如预测、变换、量化、熵编码等基本功能模块与前几个标准(MPEG-1,MPEG-2,MPEG-4,H.261,H.263)并无太大区别,变化主要体现在功能模块的具体细节上。2023/5/24第一百三十二页,共一百八十五页,编辑于2023年,星期五5.8.1H.264/AVC视频编码器的分层结构分层设计在网络传输环境中,视频编码主要由视频编码层VCL和支持视频在不同网络之间传输的网络抽象层NAL。2023/5/24第一百三十三页,共一百八十五页,编辑于2023年,星期五

VCL实现视频数据的编解码;

NAL定义了数据封装格式,为VCL提供与网络无关的统一接口;视频编码层(VCL)----数据压缩编码的核心+差错恢复工具参数集(记录图像序列相关信息,用以检错)灵活的宏块排序(错误隐藏)冗余片网络抽象层(NAL)----网络适配网络抽象层单元(NALU)的封装、分割、合并将头部信息+数据---映射到传输协议

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论