第二章多媒体数据压缩编码技术_第1页
第二章多媒体数据压缩编码技术_第2页
第二章多媒体数据压缩编码技术_第3页
第二章多媒体数据压缩编码技术_第4页
第二章多媒体数据压缩编码技术_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章多媒体数据压缩编码技术多媒体数据压缩编码的重要性和分类压缩编码基础静态图像压缩标准JPEG运动图像压缩标准MPEG2.1多媒体数据

数据压缩是通过减少计算机中所存储数据或者通信传播中数据的冗余度,达到增大数据密度,最终使数据的存储空间减少的技术。压缩编码的重要性和分类2.1.1数据压缩编码的必要性

多媒体数据,其惊人的数据量为媒体的存储、传输及处理带来了巨大的压力。为解决这一问题,单纯用扩大存储容量、增加传输线路带宽的办法是不现实的。因此,在多媒体的应用系统中,一定要对声音、图像等多媒体信号进行压缩。2.1.2数据压缩的可能性

多媒体数据表示中存在着大量的冗余,以图像数据压缩为例,图像信息冗余通常有以下几种情况:

(1)空间冗余。在很多图像数据中,像素间在行、列方向上都有很大的相关性,相邻像素的值比较接近,或者完全相同,这种数据冗余叫做空间冗余。(2)时间冗余。在视频图像序列中,相邻两帧图像数据有许多共同的地方,这种共同性称为时间冗余,可采用运动补偿算法来去掉冗余信息.2.1.2数据压缩的可能性

(3)视觉冗余。视觉冗余度是相对于人眼的视觉特性而言的,人类视觉系统对图像的敏感性是非均匀和非线性的,并不是图像中的所有变化人眼都能观察到。(4)信息熵冗余。信息熵是指一组数据所携带的信息量,信息熵冗余指数据所携带的信息量少于数据本身而反映出来的数据冗余。(5)结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。(6)知识冗余。有许多图像的理解与某些先验知识有相当大的相关性。这类规律性的结构可由先验知识和背景知识得到,称此类冗余为知识冗余。2.1.3数据压缩方法的分类图2-1常用压缩编码方法的分类2.2多媒体数据压缩编码基础

数据压缩是通过消除输入数据序列(原始数据序列)中的冗余性,将它变换成较短的输出数据序列(压缩数据序列)的技术。如果将压缩数据序列与原始数据序列长度之比定义为压缩比,尽量减小数据压缩的压缩比则是进行数据压缩的根本目的。2.2.1

量化

量化操作实质上是将连续的模拟信号采样得到的瞬时幅度值映射成离散的数字信号,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示。2.2.1

量化1.量化位数

量化位数是每个采样点能够表示的数据范围,常用的有8位、12位和16位。量化过程是,先将整个幅值划分为有限个小幅度(量化阶距)的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值,如图2-2所示,其中虚线箭头表示采样值量化后的电平值。2.2.1量化图2-2模拟信号的采样和量化2.2.1

量化2.均匀量化

采用相等的量化间隔对采样得到的信号做量化就是均匀量化,也称为线性量化。量化后的样本值Y和实际值X的差E=Y-X称为量化误差或量化噪声。2.2.1

量化3.非均匀量化

非均匀量化的基本思想是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数来表示。声音数据还原时,采用相同的规则。

2.2.2莫尔斯码

莫尔斯码即电报码,它采用“·”和“-”来表示26个英文字母。采用常出现的字母用短码表示(如E用“·”表示,T用“-”表示),不常出现的字母用长码表示(如Q用“--·-”表示,X用“-··-”表示)的变长编码方式以减少码率。

2.2.3哈夫曼编码

该算法基于一种称为编码树的技术,其步骤如下:(1)将待编码的N个信源符号按照出现的概率由大到小排列,给排在最后的两个符号各分配一位二进制码元,对其中概率大的符号分配0,概率小的符号分配1(反之亦可)。(2)把概率最小的两个符号概率相加,求出的和作为一个新符号的概率,将新的概率值与剩下的N-2个概率值一起重新进行排序,再重复步骤(1)的编码过程。(3)重复步骤(2)直到只剩一个概率值为止,其值为1。(4)分配码字,对于各种信源符号,基于步骤(1)分配的数字,从编码树的根部开始回溯读出,并将它作为该符号对应分配的码字。2.2.3哈夫曼编码

例设有离散无记忆信源,符号a1、a2、a3、a4、a5、a6的出现概率分别为0.12、0.08、0.4、0.1、0.25、0.05,其哈夫曼编码过程如下:

2.2.3哈夫曼编码平均码长为:

信源熵为:

编码效率为:2.2.3哈夫曼编码采用哈夫曼编码时有两个问题值得注意:(1)哈夫曼编码没有错误保护功能。在译码时,如果某些位出现错误,会引起一连串的错误,造成错误传播(ErrorPropagation)。计算机对这种错误也无能为力,说不出错在哪里,更谈不上去纠正它。(2)哈夫曼编码是可变长度码,因此很难随意查找或调用压缩文件中的内容,然后再译码,这就需要在存储代码之前加以考虑。尽管如此,哈夫曼编码还是得到了广泛的应用。2.2.4行程长度编码

行程长度编码(Run-LengthEncoding,RLE)也称游程编码,是一种非常简单的数据压缩编码形式。它基于简单的编码数据原则,即重复的数据值序列(或称为流)用一个重复次数和单个数据值来代替。这里,重复的次数称为“游程”。控制符重复次数被重复字符图2-33字节码字格式2.2.5预测编码1.差值脉冲编码调制(DPCM)

设二维图像上空间坐标为(i,j)的像素的实际样本值为f(i,j),f’(i,j)是根据已传输的相邻像素的样本值对该像素估算得到的预测值。实际值和预测值之间的差值即预测误差,用下式来表示:e(i,j)=f(i,j)-f’(i,j)由于图像像素之间有极强的相关性,所以这个预测误差是很小的。编码时,是对预测误差e(i,j)进行量化、编码、发送,由此而得名为差值脉冲编码调制法(DPCM)。2.2.5预测编码图2-4DPCM编、解码原理图2.2.5预测编码2.自适应差值脉冲编码调制(ADPCM)

其基本思想是:利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。其简化的编码框图如图2-5所示。2.2.5预测编码图2-5ADPCM简化的编码框图2.2.5预测编码3.帧间预测编码

采用预测编码方法消除序列图像在时间上的相关性,传送前后两帧的对应像素之间的差值,这称为帧间预测。

图2-6具有运动补偿的帧间预测2.2.6矢量量化

在矢量量化编码中,是把输入数据几个一组地分成许多组,成组地量化编码,即将这些数看成一个k维矢量,然后以矢量为单位逐个矢量进行量化。矢量量化一般是限失真编码。输入矢量X是一个待编码的k维矢量,该矢量原则上既可以是原始图像,也可以是图像的预测误差或变换矩阵系数的分块(或称分组)。码本C是一个具有N个k维矢量的集合,C={Yi},i=1,2,…N,2.2.6矢量量化

矢量编码的过程就是在码本C中搜索一个与输入矢量最接近的码字Yi的过程。在码本中寻找到与输入矢量完全一致的码字的概率很小,但只要二者之间误差最小时,便可用该码字Yi代表输入矢量。传输时并不传送码字Yi本身,只传送其下标“i”。当码本长度为N,,为传送下标所需要的比特数为log2N。传送一个像素所需要的平均比特数为log2N。2.2.6矢量量化图2-7矢量量化编码解码框图2.2.7变换编码

变换编码也是去除冗余的一种最基本的编码方法。不同的是变换编码首先要把压缩的数据变换到某个变换域中(如频域),然后再进行编码。变化域中表现为能量集中在某个区域,可以利用这一特点在不同区域间有效地分配量化比特数,或者去掉那些能量很小的区域,从而达到数据压缩的目的。例如声音信号,从时域变换到频域以后,可以清楚的看到能量集中在哪些频率范围内,从而根据频率范围分布有效地分配不同的量化位数。2.3静态图像压缩标准JPEG

JPEG(JointPhotographicExpertsGroup)是联合图像专家小组的英文缩写,这个专家组是由国际电报电话咨询委员会(CCITI)和国际标准化协会(ISO)于1986年联合组成负责制定静态的数字图像数据压缩编码方法,这个专家组开发的算法称为JPEG算法,并于1991年正式成为国际标准,编号为ISO/IEC10918,现常称为JPEG标准。JPEG是一个使用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。2.3.1JPEG压缩算法简介JPEG的目的是为了给出一个连续色调图像的压缩方法使之满足以下要求:(1)压缩比可控:能覆盖一个较宽的图像质量等级范围,能达到“很好”到“极好”的评估,与原始图像相比,人的视觉难以区分。(2)不受限制:适用于所有的连续色调图像,不应对图像的尺寸、彩色空间和像素纵横比等特性进行限制,也不应对图像的场景内容(如复杂性、彩色范围或统计特性)有任何限制。(3)适中的计算复杂性:压缩算法既可用软件实现,也可用硬件实现,并具有较好的性能。(4)具有顺序编码、累进编码、无失真编码和层次编码4种操作模式。2.3.2JPEG压缩基本处理算法1.分块采样

JPEG压缩首先要对连续彩色图像的每一帧中的亮度信号(Y)和色差(CR、CB)信号进行单独采样。采样时,首先将图像分割成许多16×16个采样点构成的宏区块,将宏区块再分成4部分,每一部分为8×8个采样点组成的像块,像块是基于DCT压缩编码处理的最小单位,DCT变换就是以像块为单位的。2.3.2JPEG压缩基本处理算法2.3.2JPEG压缩基本处理算法2.DCT变换

DCT是英文DiscreteCosineTransform的缩写,意思是离散余弦变换。它是一种傅立叶变换,任何连续的实对称函数采用傅立叶变换后,只含余弦项。在空间域中的样值矩阵,经DCT变换后,成了频率域中8×8DCT系数矩阵。频域中的右下角对应高频部分,而在左上角对应低频部分,其中左上角(0,0)位置的系数反映图像子块的平均样本值,对应直流分量,称为DC系数。其他63个对应交流分量的系数,称为AC系数。2.3.2JPEG压缩基本处理算法DCT变换公式为:正变换:逆变换:其中:DC系数:2.3.2JPEG压缩基本处理算法3.DCT系数量化

经过DCT变换后,DCT系数间的相关性已经显现出来,即左上角的系数值大,而右下角的系数值小,为数据压缩创造了必要条件。但这种相关性还不是十分明显,要最终实现数据压缩,还需要进一步降低非零系数的幅值,增加零值系数的数量,从而进一步提高F矩阵的相关性。为此还要对变换后的DCT系数进行量化,来减少表示每个DCT系数所使用的位数,另外可以增加零值系数,提高压缩比。2.3.2JPEG压缩基本处理算法表2-1亮度量化表表2-2色度量化表2.3.2JPEG压缩基本处理算法

对DCT系数的量化是基于限失真编码理论进行的,量化是造成图像质量下降的最主要的原因。其作用是在一定的主观保真度图像质量的前提下,丢掉那些对视觉效果影响不大的信息,失真度在人的视觉所能接受的容限之内。2.3.2JPEG压缩基本处理算法4.DC系数差值编码和AC系数的行程编码

量化后的64个DCT系数仍然是二维系数矩阵,坐标(0,0)处的系数是直流分量,相邻两个8×8像块之间的DC系数有强相关性,JPEG中对DC系数采用DPCM编码,即对相邻块之间的DC系数差值DIFF=DCi-DCi-1进行编码。其余63个交流系数采用行程编码,使用Z字形扫描方式可以增加连续零系数的个数,也就是增加零值的游程长度。图2-9为Z字形扫描轨迹图。从左上方AC01开始,沿对角线方向,直到AC77扫描结束。63个AC系数行程编码的码字,可用2个字节来表示,如图2-10所示。2.3.2JPEG压缩基本处理算法图2-9Z字形扫描2.3.2JPEG压缩基本处理算法图2-10AC系数行程编码的码字2.3.2JPEG压缩基本处理算法5.熵编码

为了进一步压缩数据,对DPCM编码后的直流系数DC和RLE编码后的交流系数AC采用熵编码。在JPEG有损压缩算法中,使用哈夫曼编码器的理由是可以使用很简单的查表方法进行编码。压缩数据符号时,哈夫曼编码器对出现频率比较高的符号分配比较短的代码,而对出现频率低的符号分配比较长的代码。这种可变长度的哈夫曼编码表可以事先进行定义。为了实现正确解码,发送端和接收端必须采用相同的哈夫曼编码表。2.4运动图像压缩标准MPEG

MPEG(MovingPictureExpertGroup,活动图像专家组)是在1988年由ISO(InternationalOrganizationforStandardization,国际标准化组织)和IEC(InternationalElectrotechnicalCommission,国际电工委员会)联合成立的专家组,其任务是负责制订适用于数字存储媒介、电视广播和通信等应用场合的视频和音频数据的压缩编码标准。这个专家组开发的标准称为MPEG标准。

2.4.1运动图图像压缩编码的基本方法

MPEG运动图像压缩编码算法基于运动补偿和DCT算法。其基本思想和方法可以归纳为两点:①在空间方向上,图像数据压缩采用JPEG压缩算法来去掉冗余信息。②在时间方向上,图像数据压缩采用运动补偿算法来去掉冗余信息。2.4.1运动图图像压缩编码的基本方法

为了保证图像质量基本不降低而又能够获得高的压缩比,在MPEG中将图像分为3种类型:帧内图像I(IntraPicture)、预测图像P(PredictedPicture)和双向预测图像B(BidirectionalPicture)。2.4.1运动图图像压缩编码的基本方法

帧内图像I不参考任何过去的或者是将来的其他图像帧,压缩编码采用类似JPEG压缩算法。I帧图像的压缩比相对较低。I帧图像提供了随机存取的插入点,另外I帧图像可作为B帧和P帧图像的预测参考帧。I帧图像是周期性出现在视频序列中的,出现频率可由编码器选择。2.4.1运动图图像压缩编码的基本方法

预测图像P利用相邻帧的一般统计信息进行预测。也就是说,它考虑运动特性,提供帧间编码。P帧预测当前帧与前面最近的I帧或P帧的差别,在预测中使用了运动补偿算法,所以P帧图像的压缩比相对较高。2.4.1运动图图像压缩编码的基本方法

图像B是双向预测内插帧,它既用已传输的在视频序列中处于该帧前的I帧或P帧作预测参考帧,进行前向运动补偿预测;又用后面的P帧作预测参考帧,进行后向运动补偿预测。但B帧不能用来作为对其他帧进行运动补偿预测的参考帧。2.4.1运动图图像压缩编码的基本方法一个典型的MPEG图像排列如图2-11所示。图2-11典型的MPEG图像帧排列2.4.2MPEG系列标准1.MPEG-1标准MPEG-1的标准名称为“信息技术——用于数据速率高达大约1.5

Mbit/s的数字存储媒体的电视图像和伴音编码”,由如下五个部分组成:(1)MPEG-1系统(2)MPEG-1视频

(3)MPEG-1声音

(4)MPEG-1一致性测试(5)MPEG-1软件模拟2.4.2MPEG系列标准2.MPEG-2数字电视标准

MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,标准的正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论