第七章 数据压缩编码技术_第1页
第七章 数据压缩编码技术_第2页
第七章 数据压缩编码技术_第3页
第七章 数据压缩编码技术_第4页
第七章 数据压缩编码技术_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章数据压缩编码技术1第七章数据压缩编码技术本章主要内容7.1数据压缩技术概述7.2数据压缩技术原理7.3JPEG静止图像压缩标准7.4运动图像压缩标准MPEG7.5H.26视听通信编/解码标准系列2第七章数据压缩编码技术7.1数据压缩技术概述7.1.1数据压缩的概念采样数据不仅仅是所代表的原始信息本身,还包含着其它一些没必要保留的(确定的、可推知的)信息,即存在着数据冗余。

M=D-∆d

其中M表示实际媒体信息,D表示数字化后的采样数据,∆d表示数据冗余量。

数据压缩就是从采样数据中去除冗余,即保留原始信息中变化的、特征性信息,去除重复的、确定的或可推知的信息,在实现更接近实际媒体信息描述的前提下,尽可能的减少描述用的信息量。

3第七章数据压缩编码技术7.1.2多媒体数据的冗余一般而言,多媒体数据中存在的数据冗余情况主要有以下几种(P193):信息熵冗余空间冗余时间冗余结构冗余知识冗余视觉冗余听觉冗余纹理的统计冗余4第七章数据压缩编码技术练习:图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是()。

(A)空间冗余(B)时间冗余(C)信息熵冗余(D)视觉冗余5第七章数据压缩编码技术下列哪一种说法是正确的:信息量等于数据量与冗余量之和信息量等于信息熵与数据量之差信息量等于数据量与冗余量之差信息量等于信息熵与冗余量之和6第七章数据压缩编码技术7.1.3数据压缩技术的发展过程

20世纪40年代,人们开始系统地研究数据压缩技术;主要表现在数据压缩算法方面:

首先是ClaudeShannon与R.M.Fano的Shannon-Fano编码方法;

1952年,D.A.Huffman提出了Huffman编码方法;

1968年,P.Elias

发展了Shannon-Fano编码,构造出更为完美的Shannon-Fano-Elias编码。

1976年,J.Rissanen

提出了一种可以成功地逼近信息熵极限的编码方法——算术编码。

1982年,Rissanen

和G.G.Langdon

一起改进了算术编码。

1977年,JacobZiv和AbrahamLempel提出了LZ77编码算法,78年又作了改进,被称为LZ78编码算法。

1984年,TerryWelch提出了LZ78算法的变种算法——LZW。

LZ77、LZ78、LZW三种压缩技术就是目前无损压缩领域中最为流行的、被称为“字典式编码”的压缩技术。

7第七章数据压缩编码技术7.1.3数据压缩技术的发展过程(续)

数据压缩标准逐渐形成,有损压缩算法快速出现。

1986年开始制定静态图像压缩标准,1994年后成为国际标准,称为JPEG标准。

ITU制定的电视会议系列标准(H.261、H.262、H.263、H.264等)以及由ISO制定的视频系列标准(MPEG-1、MPEG-2、MPEG-4)中,均采用了有损压缩原理作为其核心压缩算法。其中的MPEG-4标准(相当于ITU的H.263和H.263+标准)是为了适应网络视频的需求特点而制定的,具有更高的压缩比、支持并发数据流编码、基于内容的交互操作、增强的时间域随机存取、容错、基于内容的尺度可变性等新特性。8第七章数据压缩编码技术7.1.4数据压缩的分类1、按照压缩内容分为音频数据压缩、静态图像数据压缩、视频数据压缩和其他数据文件压缩等四种类型。2、按照压缩方式分为对称压缩和非对称压缩两种类型。

3、按照压缩效果分为有损压缩与无损压缩两种类型。普通数据文件,一般采用无损压缩,对于冗余度较小的图像,需要采用有损压缩。9第七章数据压缩编码技术4、按照算法思想

分为信息熵编码、预测编码、变换编码、混合编码以及其他编码等五种,每种类型包含了一些具体算法,如下图。10第七章数据压缩编码技术7.1.5数据压缩的主要指标

衡量不同压缩方法优劣的技术指标是相同的,主要包括以下几个方面。

1)压缩比:指压缩前后的数据量之比,它反映了施加某压缩算法之后,数据量减少的比例;

2)恢复效果:指经解压缩算法对压缩数据进行处理后所得到的数据与其表示的原信息的相似程度;

3)算法简单、速度快:主要指实现算法的复杂度。11第七章数据压缩编码技术7.2数据压缩技术原理7.2.1信息熵与编码1、信息熵的概念信息论中,编码数据量与所表示的信息量以及冗余信息之间的关系为:数据量=信息量+冗余量信息是对所表现的事件中不确定性的描述,信息量多少与不确定性的程度有关。通常,可以用概率来描述不确定性的大小。某信息描述的事件状态的出现概率越小,其不确定性越大,其表达的信息量就越多,冗余量就越少。

12第七章数据压缩编码技术信息熵信息熵用来度量信息量的大小。对于单个事件(如字符)来说,其信息熵定义为:

H(i)=-log2(Pi)(bit)(1)公式(1)表示发生概率为Pi的事件i所具有的信息熵为H(i),单位为bit(比特)。

13第七章数据压缩编码技术对于一个消息队列(如字符串)的信息熵定义为:

H(X)=-∑Pi×log2(Pi)=∑Pi×H(i)(2)

其中,Pi表示某一事件i发生的概率。例如:有一字符串“babbdcaacb”包含a、b、c、d四种字符,其长度为10,字符a、b、c、d分别出现了3、4、2、1次,则a、b、c、d在信息中出现的概率分别为0.3、0.4、0.2、0.1,它们的熵分别为:

H(a)=-log2(0.3)≈1.737(bit)

H(b)=-log2(0.4)≈1.322(bit)

H(c)=-log2(0.2)≈2.322(bit)

H(d)=-log2(0.1)≈3.322(bit)14第七章数据压缩编码技术

每种字符的信息熵就是该字符编码所用的理想位数(二进制)。整条信息的熵就是表达整个字符串需要的位数(这里用字符出现的次数代替概率):H(X)=-∑Pi×log2(Pi)=H(a)×3+H(b)×4+H(c)×2+H(d)×1=18.465(bit)若用ASCII编码,需要多少bit?15第七章数据压缩编码技术2、编码编码实质上是对要处理的源数据或源文件按一定的规则进行变换(映射),力图用尽可能少的符号代码来表示较多、较长的源符号信息。编码方法中的码字(代码)有固定长度和可变长度两种。3、压缩模型

模型是规则和数据的集合,即:压缩算法=模型+编码

16第七章数据压缩编码技术4、压缩、还原压缩是指设法去掉部分或全部冗余,从而减少文件或数据所占的存储空间;还原(解压缩)则是指利用相反的算法使文件或数据恢复原状。17第七章数据压缩编码技术7.2.2无损压缩编码1、Shannon-Fano编码简称为S-F编码,是一种变长编码,其基本思想是按信源符号出现的概率大小进行排序,出现概率大的分配短码,反之则分配长码。具体编码过程如下:

(1)信源符号按概率递减顺序排列。(2)把符号序列分成上下两部分,使上下两部分的概率和相等或接近相等。(3)对上部分子序列编码为“0”,相当于左子树,对下部分子序列编码为“1”,相当于右子树。(4)重复上述步骤,直到每个子序列只包含一个符号为止。

18第七章数据压缩编码技术举例:有信源字符序列S为:aaabbceeehddabafffbdddgghhabccedabdgghha

其长度为40个字符,由a、b、c、d、e、f、g、h共8种字符构成。假设在编码之前,每种字符出现的概率已由某种模型统计出来,用<字符>-<出现次数>来表示,具体值分别为:

a-8,b-6,c-3,d-7,e-4,f-3,g-4,h-519第七章数据压缩编码技术a-8d-7b-6h-5e-4g-4c-3f-3a-8d-7b-6———h-5e-4g-4c-3f-3(a)第一步(b)第二步解:首先将信源符号按概率递减顺序排列,形成图(a)所示结果,然后,再把符号序列分成上下两部分,使上下两部分的概率和相等或接近相等,形成图(b)所示结果。其中上部分符号序列概率和为21,编码为0;下部分为19,编码为1。20第七章数据压缩编码技术最后再重复第二步,不断对子符号序列进行划分,最后得到一棵二叉树,如图(c)所示。21第七章数据压缩编码技术最终得到的符号编码分别为:

a-00,b-011,c-1110,d-010,

e-101,f-1111,g-110,h-100。

信源字符序列S的编码总位数L等于每种字符编码位数与字符出现次数乘积的和,即:

L=2×8+3×6+4×3+3×7+3×4+4×3+3×4+3×5

=118(位)如果直接用ASCII码,则要用40×8=320位。因此,S-F编码实现了数据压缩。

22第七章数据压缩编码技术2、Huffman编码其编码思想与Shannon-Fano编码方法基本一致,但构造二叉树的方法则相反,不是自上而下,而是自下而上、从树叶到树根生成二叉树。具体编码过程如下:(l)将信源符号按概率递减顺序排列;(2)把两个最小的概率加起来,作为新符号的概率;(3)重复步骤(1)和(2),直到概率达到“1”为止;(4)在每次合并消息时,将被合并的消息赋于“1”和“0”或“0”和“l”;(5)寻找从每一信源符号到概率为“1”处的路径,记录下路径上的“l”和“0”;(6)对每一符号写出从码树的根到终结点的“l”、“0”序列。23第七章数据压缩编码技术例如,对于信源其编码过程如下:

x1x2x3x4x5x6X=

0.250.250.200.150.100.05最后得到的编码为:x1–01,x2–10,x3-11,x4–000,x5-0010,x6-0011。其中x1、x2、x3的码长为2,x4的码长为3,x5、x6的码长为4,平均码长为2.45。0.050.150.450.5524第七章数据压缩编码技术信源符号及其概率如下:求其Huffman编码,信息熵及平均码长。aa1a2a3a4a5P(a)0.50.250.1250.06250.062525第七章数据压缩编码技术Huffman编码的基本原理是什么?26第七章数据压缩编码技术Huffman编码体现了统计编码的思想。Huffman编码的基本原理是按信源符号出现的概率大小进行排序,出现概率大的分配短码,出现概率小的则分配长码。27第七章数据压缩编码技术3、算术编码

算术编码也是一种信息熵编码方法,它用0到1之间的一个实数对输入的信息进行编码。用到两个基本的参数,一是信源符号的概率,二是信源符号对应的编码区间。一般的信源符号集x可表示为:

对于一个给定的信源符号输入序列S=x1x2x3……xm,其中xi属于信源符号集X中的任意符号,可按以下过程进行编码:28第七章数据压缩编码技术1)定义初始区间[0,1),表示一个0到1之间的半开区间,并规定初始概率p0=0;2)根据信源中各符号的概率值,把[0,1)区间划分成N个子区间Q1,Q2,……,Qn,其中:Qi=[Li,Ri),Li=,Ri=Li+Pi

,i=1,2,……,N(3)3)设置输入序号i的初值,i=1表示开始输入第一个信源符号。29第七章数据压缩编码技术4)当输入符号为xi(xi

对应信源符号集X中的第k个符号),可按以下公式定义新的子区间Ii,并计算区间长度di。

Ii=[li,ri)(4)

li=li-1+di-1×(5)

ri=li-1+di-1×(6)

di=ri-li

(7)5)i=i+1,如果还有信源符号未输入完毕,则转第4)步继续输入下一个信源符号。如果全部输入完毕,则当前区间Ii=[li,ri)中的任意数就是所需的编码。30第七章数据压缩编码技术例:有四个符号a1、a2、a3、a4的信源,其对应概率分别为0.5、0.25、0.125、0.125。如果输入序列为S=a2a1a3a2a4……。根据以上编码过程,得如下结果:31第七章数据压缩编码技术从以上的编码过程可以看出以下几个问题:

1)算术编码器对整个消息只产生一个码字,这个码字是在间隔[0,1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。2)运算中出现溢出是一个明显的问题,但多数机器都有16位、32位或者64位的精度,因此该问题可使用比例缩放方法解决。

3)算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。32第七章数据压缩编码技术4、行程编码

行程编码(RLE)通过统计信源符号中的重复个数,并以<重复个数><重复符号>格式来编码。适用于压缩包含大量重复信息的信源。其基本思想是:按行存储一个颜色值和相同色值的像素个数。如下图。(a)图像示例(16×8像素)00000000000000000011111111111000001000000000000000100000000000000010000000000000001111111111100000000000000000000000000000000000(b)示例图像的像素值(16×8像素)图7-9连续相同色块图像与像素值示例16020111302011130201113020111302011130160160(c)RLE编码33第七章数据压缩编码技术说明:

RLE压缩编码尤其适用于计算机生成的图像,对减少图像文件的存储空间非常有效。然而,RLE对颜色丰富的自然图像就显得力不从心,如果使用RLE编码方法,不仅不能压缩图像数据,反而可能使原来的图像数据变得更大。34第七章数据压缩编码技术5、词典编码

词典编码主要是利用编码数据本身存在字符串重复特性来实现数据压缩的。算法的核心就是如何动态地形成词典,以及如何选择输出格式以减小冗余。词典编码又可分为两类:第一类词典编码的思想是:查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串替代重复的部分,并将指向重复字符串的指针作为输出编码。指针P指向了重复字符串“abc”,所以,当再次出现相同字符串时,则输出指针P。35第七章数据压缩编码技术

第二类词典编码的思想是:从输入的数据中创建一个由短语组成的“编码词典”,编码数据过程中当遇到已经在词典中出现的“短语”时,编码器就输出这个词典中短语的“索引号”,而不是短语本身,如下图。36第七章数据压缩编码技术7.2.3有损压缩编码介绍有损数据压缩编码方法通常用于对静态图像、音频以及视频等多媒体信息的编码压缩,这些多媒体信息大多数是通过对模拟信息的数字化(采样与量化)而得到的。1、预测编码

1)预测编码的基本概念预测编码是数据压缩的重要技术原理之一,它是根据离散信号之间的空间或时间相关性,利用前面的一个或多个信号对下一信号进行预测,然后对实际值和预测值的差进行编码。常用的预测编码方法有DPCM(差分脉冲编码调制)和ADPCM(自适应差分脉冲编码调制)等。37第七章数据压缩编码技术2)DPCM——差分脉冲编码DPCM

:DifferentialPulseCodeModulation,差分脉冲编码调制,用采样量化后的样本值与预测值之间的差值来编码。原理如下图所示。

s(k)是PCM样本值,se(k-1)是s(k)的预测值,d(k)是差分信号,即d(k)=s(k)-se(k-1)。I(k)是差分信号d(k)的量化值,st(k)是重构信号,是由逆量化器产生的量化差分信号与对过去样本信号的估算值se(k-1)求和得到,以作为预测器确定下一个信号估算值的输入信号。原理P20538第七章数据压缩编码技术3)ADPCM——自适应差分脉冲编码

ADPCM是自适应量化和自适应预测方法的总称,是对DPCM方法的进一步改进,通过调整量化步长,对不同频段设置不同的量化字长,使数据得到进一步的压缩。

自适应量化就是使量化间隔大小的变化自动地去适应输入信号大小的变化。根据信号分布不均匀的特点,使系统具有随输入信号的变化而改变量化区间的大小,以保持输入量化器的信号基本均匀的能力。39第七章数据压缩编码技术图7-13给出了反馈自适应的基本原理。40第七章数据压缩编码技术2、变换编码

先对信号进行域变换,以寻求更大的信号独立性,减少相关性。然后再对变换后的信号进行采样和量化编码。数据编码过程分为三步,即变换、变换域采样和量化编码。如下图所示。

常用的变换有KLT、DCT、WHT以及WLT。41第七章数据压缩编码技术1)KLT

KLT(Karhunen-LoeveTransform)通常称为K-L变换,亦称主要成分变换,是一个离散变换。用一组不相关的系数来表示连续信号,实现正交变换。是失真最小的一种变换,故称作最佳变换。2)DCT

DCT(DiscreteCosineTransform)是离散余弦变换的简称。对于图像编码来说,DCT先将整体图像分成若干个NxN的像素块,然后每个NxN像素块逐一进行DCT变换。

42第七章数据压缩编码技术DCT变换公式如下:其中:

N为所划分图像方阵的行列数,一般N=8;

x、y:原图像方阵内某个数据的坐标位置,取值为0~N-1;

f(x,y)代表原图像数据方阵内的某个数值;

u、v:DCT后矩阵内某个数值的坐标位置,取值为0~N-1;

C(u,v)代表DCT变换后矩阵内的某个数值;当u=0且v=0时,E(u)=E(v)=1/1.414;当u>0或V>0时,E(u)=E(v)=l。DCT逆变换公式:43第七章数据压缩编码技术3)WHT

WHT(Walsh-HadamardTransform)又称哈达玛特变换,这是一种有效地去除噪波的方法。基本思想为:对于图像压缩,首先将输入值按4x2分成小块,分别进行实时快速哈达玛特变换。图像经变换后,转换成相应成分的系数,这些系数分别代表直流分量、水平方向细节和色度分量、垂直方向细节、斜方向细节及色度分量等,而噪波变换后均匀散在各系数中。这样就能更有效地区分出信号和噪波,从而达到更有效地进行自适应降噪的目的。

44第七章数据压缩编码技术4)WLT

WLT(WaveLetTransform)又称小波变换,是近年来新兴的一种变换方法,解决了较好地解决突变信号与非平稳信号的问题。是空间(时间)和频率的局部变换。小波变换的基本思想是将信号展开成一族基函数的加权和,即用一族函数来表示或逼近信号(或函数),这一族函数是通过基本函数的平移和伸缩构成的。45第七章数据压缩编码技术3、混合编码

混合编码不是一类原理性编码方案,是两种或两种以上相关编码方法优点与特长的混合应用。比如在MPEG和JPEG标准中,都混合应用了不同的编码方法,从而实现较为理想的编码压缩效果。46第七章数据压缩编码技术4、其它编码主要包括分形编码、矢量量化编码、子带编码等独具特色编码方法。1)分形编码分形的概念:分形指某种形状(或结构)的一个局部或片断,它可以有许多种大小、尺寸的相似形。分形编码是一种以分形几何学为理论基础的编码方法,它利用分形几何中自相似的原理来实现数据压缩的。首先对把一幅数字图像,通过一些图像处理技术,然后在分形集中寻找各子图像之间的相似性,其压缩比超出经典编码方法近3个数量级。47第七章数据压缩编码技术2)矢量量化编码矢量量化编码利用相邻图像数据间的高度相关性,将输入图像数据序列分组,每一组由n个数据构成一个N维矢量,一起进行编码,即一次量化多个点。

3)子带编码

子带编码技术是一种高质量、高压缩比的图像编码方法。其基本思想是,依据语音和图像信号可以划分为不同的频域段,而人眼对不同频域段的敏感程度不同的特性,将要压缩的信息分离成高低不同的两个频带(子带),再根据频带的特性分别进行量化和编码,完成对信息的编码压缩。48第七章数据压缩编码技术练习数据压缩可分为两种类型:一种叫做(),另一种叫做()。49第七章数据压缩编码技术在数据压缩方法中,有损压缩具有()的特点:A.压缩比大,不可逆B.压缩比小,不可逆C.压缩比大,可逆D.压缩比小,可逆50第七章数据压缩编码技术什么是数据冗余?多媒体数据有哪些数据冗余?51第七章数据压缩编码技术衡量数据压缩技术性能好坏的重要指标是()。(1)压缩比(2)标准化(3)恢复效果(4)算法复杂度

A.(1)(3)B.(1)(2)(3)C.(1)(3)(4)D.全部52第七章数据压缩编码技术下列哪一种说法是不正确的:预测编码是一种只能针对空间冗余进行压缩的方法预测编码是根据某一种模型进行的预测编码需将预测的误差进行存储或传输预测编码中典型的压缩方法有DPCM、ADPCM53第七章数据压缩编码技术简述预测编码的基本原理54第七章数据压缩编码技术练习:ADPCM的非均匀量化是指:A.其实就是对大的输入信号采用大的量化间距,小的信号采用小的量化间距;

B.用可变的采用频率对输入信号进行采样;

C.其实就是μ律压扩;

D.其实就是A律压扩。55第七章数据压缩编码技术下面哪一种压缩算法为无损数据压缩算法?A.PCM B.波形编码C.子带编码 D.霍夫曼编码56第七章数据压缩编码技术下列哪种编码属于变换编码?A.DCT B.PCMC.RLE D.D/A57第七章数据压缩编码技术7.3JPEG静止图像压缩标准7.3.1JPEG概述

JPEG是一个适用于彩色和单色、多级灰度、连续色调的静止数字图像的压缩标准,它定义了两种基本的压缩算法:一种是基于DPCM(差分脉冲编码调制)及Huffman编码(或算术编码)的无失真压缩算法。压缩此较小;另一种是基于DCT(离散余弦变换)的有失真压缩算法,压缩比可以很大,这种压缩算法又可分为基本和增强两种系统。58第七章数据压缩编码技术7.3.2无失真压缩为了实现无失真压缩,JPEG选择了一个简单的空间线性预测算法——DPCM,具体编码处理过程如图7-16所示。59第七章数据压缩编码技术7.3.3有失真压缩

JPEG的有失真压缩算法是基于DCT变换和Huffman编码的,具体压缩过程如图7-18所示。也就是说,有失真压缩经①颜色模式转换及采样,②DCT变换,③量化,④编码等4步实现。60第七章数据压缩编码技术1、颜色模式转换及采样

JPEG采用的是YCbCr色彩系统。先把RGB颜色模式图像数据转换为YCbCr颜色模式的数据。Y代表亮度,Cb和Cr则代表色度、饱和度。通过下列计算公式可完成数据转换。

Y=0.2990R+0.5870G+0.1140B

Cb=-0.1687R-0.3313G+0.5000B+128Cr=0.5000R-0.4187G-0.0813B+12861第七章数据压缩编码技术2、DCT变换

利用DCT变换可将一组光强数据转换成频率数据,以便得知强度变化的情形。根据DCT变换的要求,先将原始图像数据分成若干个NxN数据单元矩阵,例如,8x8矩阵。此时,具体的DCT变换公式可具体化为:相应地,解码时所用的逆变换公式为:注:各参数的意义参见前面的DCT变换。62第七章数据压缩编码技术3、量化

量化是多对一映射,其作用是在保持一定质量前提下,丢弃图像中对视觉效果影响不大的信息。量化是造成DCT编码信息损失的根源。

JPEG标准中采用线性均匀量化器,量化过程为对64个DCT系数C(μ,ν)除以量化步长并四舍五入取整。量化步长由量化表决定,量化表元素因DCT系数位置和彩色分量的不同而取不同值。具体量化公式可表示为:

Cq(μ,ν)=Integer[C(μ,ν)/Q(μ,ν)]

其中,Q(μ,ν)表示量化表中的某一元素;

Cq(μ,ν)表示量化后的DCT系数。63第七章数据压缩编码技术

JPEG标准给出了推荐的量化表(如下所示),与DCT变换系数一一对应,用作编码器的一个输入。量化表中元素为1到255之间的任意整数,其值规定了其所对应DCT系数的量化步长。亮度量化表Q色度量化表Q64第七章数据压缩编码技术4、编码包括DC系数编码、AC系数编码和熵编码三部分。1)DC系数编码经过DCT变换后,低频分量集中在左上角,其中C(0,0)(即频率矩阵的第一行第一列元素)代表了DC系数,即8x8子块的平均值。由于图像中相邻块之间有很强的相关性,JPEG标准对DC系数采用DPCM编码方法,即对相邻的8x8像素块之间的DC系数的差值进行编码。也就是:DC码=DCi-DCi-1,i代表图像块的编号。65第七章数据压缩编码技术2)AC系数编码

DCT系数矩阵中有63个元素是交流(AC)系数,为了保证低频分量先出现,高频分量后出现,对这63个元素采用如右图的“Z”字形(Zig-Zag)顺序排列,并采用行程编码进行压缩。

图7-2266第七章数据压缩编码技术

63个AC系数行程编码的码字用两个字节表示,其中第一个字节的高四位记录两个非0值之间连续0的个数(最多可记录16个),第二个字节记录下一个非0系数的实际值。如图7-23所示。最后的编码结果称之为AC码。图7-2367第七章数据压缩编码技术3)熵编码为了进一步压缩数据,需要对DC码和AC码再做基于统计特性的熵编码。熵编码方法有:Huffman编码和自适应二进制算术编码。68第七章数据压缩编码技术7.4MPEG运动图像压缩标准

7.4.1MPEG概述

MPEG是ISO指定的专门用于运动图像压缩的一个系列标准,其中包括MPEG-1、MPEG-2、MPEG-4、MPEG-7以及MPEG-21等具体标准。其中MPEG-1是视音频压缩的基础标准,包括MPEG-1视频、MPEG-1音频和MPEG-1系统三大部分。69第七章数据压缩编码技术7.4.2MPEG-1视频1、MPEG-1的编码技术①对亮度与色差信号进行采样,减少数据量;②采用运动补偿技术,减少帧间冗余度;③采用二维DCT变换,去除空间相关性;④对DCT分量进行量化,舍去不重要的信息,将量化后DCT分量按照频率重新排序;⑤将DCT分量进行变字长编码;⑥对每数据块的直流分量(DC)进行预测差分编码。70第七章数据压缩编码技术

具体编码过程如图7-24所示。输入的视频序列先进行预处理(插入、滤波),然后用运动估计来帮助建立当前图像和已传送图像的预测器。

图7-2471第七章数据压缩编码技术

解码器完成对变长编码的解码功能,通过逆量化和逆DCT变换,实现对编码数据的重构,再与图像预测器结合形成当前图像(也为以后接收到的图像作预测),经过后处理(插入和滤波)得到结果图像,实现视频输出。图7-25给出了MPEG-1解码过程示意。图7-2572第七章数据压缩编码技术2、MPEG-1的帧类型

MPEG-1将帧率为30fps或25fps的帧序列图像以三种类型的图像格式表示,如图7-26所示。其中:

I表示帧内图,其信息由自身画面决定;

P为预测图,它是由帧内图I或预测图P由前向预测方法产生,对其预测误差有条件地传送;

B为插补图,它可根据前面和后面的双向预测产生,增加B图的数目会减少参考图I与参考图P之间的相关。对提高压缩比有益而对图像质量有损失。

图7-2673第七章数据压缩编码技术

I帧图像采用帧内编码方式(JPEG),主要用于接收机的初始化和信道的获取以及节目的切换和插入,周期性出现在图像序列中的,出现频率可由编码器选择。

P帧和B帧图像采用帧间编码方式,P帧图像中可以包含帧内编码的部分,也可以是帧内编码。B帧图像采用双向时间预测,大大提高压缩倍数。从压缩的程度来看,I帧的压缩率最小;P帧得到了较大的压缩;而B帧的压缩率是最大的,这也是使得B帧不能作为预测基准的原因。74第七章数据压缩编码技术3、运动补偿

运动补偿是一种帧间编码的方法,其原理是利用帧间的空间相关性,减小空间冗余度。实现帧间编码的方法是运动估计和运动补偿。图7-27图示了这一过程。图7-2775第七章数据压缩编码技术

实际上,在做运动估计和运动补偿时,是以16x16的块(也称为宏块)逐个进行的,如图7-28所示,这是将当前帧划分为16x16的块,各块在X和Y方向上的宽度分别记为wx和wy

。对每一块在过去帧中大小为(N+2wy)x(N+2wx)的范围内进行搜索,以求得最优匹配,从而得到运动矢量的估值(dx,dy)。如图7-29所示。76第七章数据压缩编码技术7.4.3MPEG-1音频1.编、解码思想下面给出的是MPEG-1音频编码系统的结构示意图,其中图(a)为编码器示意,图(b)为解码器示意。77第七章数据压缩编码技术2.心理声学模型

MPEG-1音频编码过程中用到了“心理声学模型”,这是为了使编码符合人的听觉系统特点。人的听觉系统对不同频率音频信号的敏感度、不同频率处的噪声容忍度有着很大的差异。通常把“一个音频信号可使人的听觉系统感觉不到另一个音频信号的存在”的现象称为音频信号的掩蔽特性。心理声学模型是为计算掩蔽特性而设计的,MPEG-1标准中,推荐了模型Ⅰ和模型Ⅱ两个心理声学模型。心理声学模型Ⅰ通对频率的分析,得到声音信号和噪声的成分,并且求得掩蔽阈值,最后得到子带的信号掩蔽比;声音心理学模型Ⅱ从能量入手,运用卷积等工具,也可得到信号的掩蔽比。

78第七章数据压缩编码技术3.三层编码结构

MPEG-1音频编码标准构造了一个通用的编码系统,分为三层:1层(Layer1)、2层(Layer2)和3层(Layer3),层次越高,其性能和复杂度也越高。1)层1是MUSICAM(MaskingpatternadaptedUniversalSubbandIntegratedCodingAndMultiplexing,自适应掩蔽模式的通用子带综合编码和复用)编码方案的简化版本,编码器最简单,压缩比较小,编码器的输出数据率为384Kbps。是适合于家庭数字磁带录音、本地硬盘、磁光盘等不要求很低码率的应用。79第七章数据压缩编码技术2)层2编码器的复杂程度属中等,使用了更精确的量化,编码器的输出数据率为256Kbps~192Kbps,主要用于数字声音广播、电视、录音、多媒体、通信等民用或音频专业领域。3)层3(通常称为MP3)是ASPEC(AdaptiveSpectralPerceptualEntropy

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论