多媒体技术应用(2)_第1页
多媒体技术应用(2)_第2页
多媒体技术应用(2)_第3页
多媒体技术应用(2)_第4页
多媒体技术应用(2)_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本章要点本章要点1 多媒体数据压缩技术概述多媒体数据压缩技术概述 2 常用编码方法常用编码方法第第2章章 多媒体数据压缩技术多媒体数据压缩技术 在多媒体信息时代,计算机已不再局限于数值计算、在多媒体信息时代,计算机已不再局限于数值计算、文字处理的范畴,而成为处理图形、图像、视频、文文字处理的范畴,而成为处理图形、图像、视频、文字、声音等多种信息的工具。但数字化后的声音、图字、声音等多种信息的工具。但数字化后的声音、图像、视频等多媒体信息的数据量是非常大的像、视频等多媒体信息的数据量是非常大的 。 对于如此巨大的数字图像数据量,如果不经过压缩,对于如此巨大的数字图像数据量,如果不经过压缩,不仅超

2、出了计算机的存储和处理能力,而且在现有的不仅超出了计算机的存储和处理能力,而且在现有的通信信道的传输速率下,是无法完成大量多媒体信息通信信道的传输速率下,是无法完成大量多媒体信息实时传输的。因此,为了存储、处理和传输这些数据,实时传输的。因此,为了存储、处理和传输这些数据,必须进行压缩。必须进行压缩。 多媒体数据之所以能够进行压缩是因为原始数据是多媒体数据之所以能够进行压缩是因为原始数据是高度相关的,存在很大的数据冗余。高度相关的,存在很大的数据冗余。 21 多媒体数据压缩技术概述多媒体数据压缩技术概述 空间冗余:这是图像数据中经常存在的一种冗余。在同一幅空间冗余:这是图像数据中经常存在的一种

3、冗余。在同一幅图像中图像中,规则物体和规则背景的表面物理特性具有相关性规则物体和规则背景的表面物理特性具有相关性,这些这些相关性的光成像结构在数字化图像中就表现为数据冗余。相关性的光成像结构在数字化图像中就表现为数据冗余。时间冗余:视频图像序列中的不同帧之间的相关性所造成的时间冗余:视频图像序列中的不同帧之间的相关性所造成的冗余。在语言中,由于人在说话时发音的音频是一连续的渐冗余。在语言中,由于人在说话时发音的音频是一连续的渐变过程,而不是一个完全的在时间上独立的过程,因而存在变过程,而不是一个完全的在时间上独立的过程,因而存在时间冗余。时间冗余。多媒体数据包含的冗余信息:多媒体数据包含的冗余

4、信息:信息熵冗余:也称编码冗余,如果图像中平均每个像素使用信息熵冗余:也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。余称为信息熵冗余。结构冗余:在有些图像的纹理区,图像的像素值存在着明显结构冗余:在有些图像的纹理区,图像的像素值存在着明显的分布模式,我们称此为结构冗余。已知分布模式,可以通的分布模式,我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像,例如布纹图像和草席图像。结构冗余过某一过程生成图像,例如布纹图像和草席图像。结构冗余也称纹理冗余。也称纹理冗余。 多媒体数

5、据包含的冗余信息:多媒体数据包含的冗余信息:视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。例如,利用人眼对蓝光不敏感的视觉特性,在对彩色图像编例如,利用人眼对蓝光不敏感的视觉特性,在对彩色图像编码时,就可以用较低的精度对蓝色分量进行编码。码时,就可以用较低的精度对蓝色分量进行编码。听觉冗余:人耳对不同频率的声音敏感性不同,对某些频率听觉冗余:人耳对不同频率的声音敏感性不同,对某些频率的声音无法感知,存在着听觉冗余。的声音无法感知,存在着听觉冗余。知识冗余:是指在有些图像或文字数据还包含与某些先验知知识冗余:是指在有些图像或文字数据还包含

6、与某些先验知识有关的信息。识有关的信息。其他冗余其他冗余多媒体数据包含的冗余信息:多媒体数据包含的冗余信息:(1)从信息论角度出发可分为两大类:)从信息论角度出发可分为两大类: 冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。 信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。211多媒体数据压缩方法的分类多媒体数据压缩方法的分类 冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具体讲就是解码数据和压缩编码前的数据严格相同,

7、没有失真,体讲就是解码数据和压缩编码前的数据严格相同,没有失真,从数学上讲是一种可逆运算。利用多媒体数据包含的冗余信息从数学上讲是一种可逆运算。利用多媒体数据包含的冗余信息的特点,去掉或减少冗余值。的特点,去掉或减少冗余值。 常见的主要是一些基于统计编码方案的一些方法,如常见的主要是一些基于统计编码方案的一些方法,如LZW编码、哈夫曼(编码、哈夫曼(Huffman)编码、算术编码、行程编码等。压)编码、算术编码、行程编码等。压缩比较低,一般在缩比较低,一般在2:1 5:1之间,常用于文本和数据的压缩。之间,常用于文本和数据的压缩。从信息论角度出发分类从信息论角度出发分类 信息量压缩方法,也称有

8、损压缩,失真度编码或熵压缩编码。信息量压缩方法,也称有损压缩,失真度编码或熵压缩编码。也就是讲解码数据和原始数据是有差别的,允许有一定的失真。也就是讲解码数据和原始数据是有差别的,允许有一定的失真。利用多媒体数据包含的冗余信息的特点,去掉或减少冗余值,利用多媒体数据包含的冗余信息的特点,去掉或减少冗余值,以及一些人眼或人耳不易感知的信息。以及一些人眼或人耳不易感知的信息。 常见的有脉冲编码调制(常见的有脉冲编码调制(PCM)、预测编码、变换编码)、预测编码、变换编码(主要是离散余弦变换方法)、插值和外推法、子带编码、小(主要是离散余弦变换方法)、插值和外推法、子带编码、小波编码等。由于允许一定

9、程度的失真,可以达到很高的压缩比,波编码等。由于允许一定程度的失真,可以达到很高的压缩比,如几十分之一甚至几百分之一。如几十分之一甚至几百分之一。 从信息论角度出发分类从信息论角度出发分类(2)按压缩算法分类)按压缩算法分类 根据压缩算法的不同,现有多媒体数据的压缩编码方根据压缩算法的不同,现有多媒体数据的压缩编码方案可分为统计编码、预测编码、脉冲编码调制(案可分为统计编码、预测编码、脉冲编码调制(PCM)、)、变换编码、子带编码、分形编码、小波编码等。变换编码、子带编码、分形编码、小波编码等。211多媒体数据压缩方法的分类多媒体数据压缩方法的分类 统计编码,即信息熵编码统计编码,即信息熵编码

10、 根据信源符号出现概率的分布特性而进行的压缩编码。根据信源符号出现概率的分布特性而进行的压缩编码。统计编码的基本思想是:在信源符号和码字之间,建立统计编码的基本思想是:在信源符号和码字之间,建立明确的一一对应关系,以便在恢复时能准确地再现原信明确的一一对应关系,以便在恢复时能准确地再现原信号,同时要使平均码长或码率尽量小。统计编码包括哈号,同时要使平均码长或码率尽量小。统计编码包括哈夫曼(夫曼(Huffman)编码、算术编码、行程编码、)编码、算术编码、行程编码、LZW编编码等。码等。 按压缩算法分类按压缩算法分类 预测编码预测编码( Prediction Coding ) 是数据压缩理论的重

11、要分支之一,可以减少数据时间和空是数据压缩理论的重要分支之一,可以减少数据时间和空间的相关性。预测编码是利用原始的离散信号之间存在着一间的相关性。预测编码是利用原始的离散信号之间存在着一定的相关性的特点,建立一个预测模型,根据这个模型及原定的相关性的特点,建立一个预测模型,根据这个模型及原有的样本值,对新样本进行预测,得到新样本的预测值。然有的样本值,对新样本进行预测,得到新样本的预测值。然后取新样本的实际数值,与预测值进行比较,二者相减得到后取新样本的实际数值,与预测值进行比较,二者相减得到预测误差,再对这个误差进行编码。译码时通过通过相同的预测误差,再对这个误差进行编码。译码时通过通过相同

12、的预测算法得到预测值,再加上差值信号来重建原信号。如果预测算法得到预测值,再加上差值信号来重建原信号。如果模型足够好,且样本序列的时间相关性较强,那么误差信号模型足够好,且样本序列的时间相关性较强,那么误差信号的幅度将远小于原始信号。因为只需对其差值量化,所以在的幅度将远小于原始信号。因为只需对其差值量化,所以在同等精度要求条件下,就可以用较少的码位,得到较好的压同等精度要求条件下,就可以用较少的码位,得到较好的压缩效果。预测编码常用的是差分脉冲编码调制(缩效果。预测编码常用的是差分脉冲编码调制(DPCM)和自)和自适应的差分脉冲编码调制(适应的差分脉冲编码调制(ADPCM),它们比较适合用于

13、声),它们比较适合用于声音和图像数据的压缩。音和图像数据的压缩。按压缩算法分类按压缩算法分类 变换编码变换编码 将通常在空间域描写的图像信号,变换到另外一些正将通常在空间域描写的图像信号,变换到另外一些正交矢量空间(即变换域)中进行描写,而且通过选择合交矢量空间(即变换域)中进行描写,而且通过选择合适的变换关系使变换域中描写的各信号分量之间相关性适的变换关系使变换域中描写的各信号分量之间相关性很小或者互不相关,从而达到数据压缩的目的。很小或者互不相关,从而达到数据压缩的目的。按压缩算法分类按压缩算法分类 子带编码子带编码(Sub-Band Coding,SBC) 将原始信号由时间域转变为频率域

14、,然后将其分将原始信号由时间域转变为频率域,然后将其分割为若干个子频带,并对其分别进行数字编码的技割为若干个子频带,并对其分别进行数字编码的技术。它是利用带通滤波器术。它是利用带通滤波器(BPF)组把原始信号分割为组把原始信号分割为若干若干(例如例如m个个)子频带子频带(简称子带简称子带)。将各子带通过等。将各子带通过等效于单边带调幅的调制特性,将各子带搬移到零频效于单边带调幅的调制特性,将各子带搬移到零频率附近,分别经过率附近,分别经过BPF(共共m个个)之后,再以规定的速之后,再以规定的速率率(奈奎斯特速率奈奎斯特速率)对各子带输出信号进行取样,并对各子带输出信号进行取样,并对取样数值进行

15、通常的数字编码,其设置对取样数值进行通常的数字编码,其设置m路数字路数字编码器。将各路数字编码信号送到多路复用器,最编码器。将各路数字编码信号送到多路复用器,最后输出子带编码数据流。后输出子带编码数据流。按压缩算法分类按压缩算法分类 分形编码分形编码 是一种模型编码,适用于图像压缩。它利用模型的方是一种模型编码,适用于图像压缩。它利用模型的方法,对需要传输的图像进行参数估测。分形是一个过程,法,对需要传输的图像进行参数估测。分形是一个过程,是事物从整体向局部转化,认识从宏观向微观深化的过是事物从整体向局部转化,认识从宏观向微观深化的过程。程。按压缩算法分类按压缩算法分类 压缩比压缩比 即压缩过

16、程中输入数据量和输出数据量之比,希望该值尽可能大。即压缩过程中输入数据量和输出数据量之比,希望该值尽可能大。例如,一幅例如,一幅1024768像素点组成的黑白图像,每像素用像素点组成的黑白图像,每像素用8bit,经数,经数据压缩后平均每像素仅用据压缩后平均每像素仅用0.5bit,则压缩比为,则压缩比为16 :1。 压缩质量(失真度)压缩质量(失真度) 希望数据恢复效果要好,要尽可能地完全恢复原始数据。这与压希望数据恢复效果要好,要尽可能地完全恢复原始数据。这与压缩的类型有关。压缩方法可分为无损压缩和有损压缩,无损压缩指缩的类型有关。压缩方法可分为无损压缩和有损压缩,无损压缩指压缩和解压缩过程中

17、没有损失原始数据,所以对无损压缩来说不必压缩和解压缩过程中没有损失原始数据,所以对无损压缩来说不必担心解压缩后数据质量。有损压缩则要对原始数据作一些改变,这担心解压缩后数据质量。有损压缩则要对原始数据作一些改变,这样解压缩后的数据与原始数据有些差别,可是人的感官却难以察觉。样解压缩后的数据与原始数据有些差别,可是人的感官却难以察觉。 压缩与解压的速度压缩与解压的速度 希望是压缩和解压的速度尽可能地快。在静态图像中,压缩的速希望是压缩和解压的速度尽可能地快。在静态图像中,压缩的速度没有解压的速度要求严格,只要在用户可以忍受的时间内就可以度没有解压的速度要求严格,只要在用户可以忍受的时间内就可以了

18、。而对动态视频的压缩和解压来说,速度就至关重要了。动态视了。而对动态视频的压缩和解压来说,速度就至关重要了。动态视频为保证帧间动作变化的连贯要求,必须要有足够高的速度,每秒频为保证帧间动作变化的连贯要求,必须要有足够高的速度,每秒要至少要至少15帧,甚至帧,甚至30帧。帧。212评价多媒体数据压缩方法的指标评价多媒体数据压缩方法的指标 多媒体系统中常用的编码方法有哈夫曼编码、算术编多媒体系统中常用的编码方法有哈夫曼编码、算术编码、行程编码、码、行程编码、LZW编码、编码、PCM编码、编码、DPCM编码、编码、ADPCM编码、变换编码、子带编码、分形编码、小波变编码、变换编码、子带编码、分形编码

19、、小波变换等。它们大多数往往既可以应用在图像压缩中,也可换等。它们大多数往往既可以应用在图像压缩中,也可用于其他场合,如语音、视频等的压缩。用于其他场合,如语音、视频等的压缩。22常用编码方法常用编码方法 哈夫曼定理哈夫曼定理 在变长编码中,对出现概率大的信源符号赋于短在变长编码中,对出现概率大的信源符号赋于短码字,而对于出现概率小的信源符号赋于长码字。码字,而对于出现概率小的信源符号赋于长码字。如果码字长度严格按照所对应符号出现概率大小逆如果码字长度严格按照所对应符号出现概率大小逆序排列,则编码结果平均码字长度一定小于任何其序排列,则编码结果平均码字长度一定小于任何其它排列方式。它排列方式。

20、221哈夫曼编码哈夫曼编码哈夫曼编码步骤哈夫曼编码步骤 将信源符号按概率递减顺序排列;将信源符号按概率递减顺序排列; 把两个最小概率相加作为新符号的概率,并按把两个最小概率相加作为新符号的概率,并按(1) 重排;重排; 重复重复(1)、(2),直到概率为,直到概率为1; 在每次合并信源时,将合并的信源分别赋在每次合并信源时,将合并的信源分别赋“0”和和“1”(如概率大的赋如概率大的赋“0”,概率小的赋概率小的赋“1”); 寻找从每一信源符号到概率为寻找从每一信源符号到概率为1处的路径,记录下处的路径,记录下路径上的路径上的“1”和和“0”; 写出每一符号的写出每一符号的“1”、“0”序列序列(

21、从树根到信源符号从树根到信源符号节点节点),得到哈夫曼编码。,得到哈夫曼编码。221哈夫曼编码哈夫曼编码221哈夫曼编码哈夫曼编码 例例1:信源符号的概率如下,请画出:信源符号的概率如下,请画出Huffman编编码的编码树,求其码的编码树,求其Huffman 编码,并求出平均编码,并求出平均码字长度。码字长度。X XX1X1X2X2X3X3X4X4X5X5X6X6P P(X X)0.300.300.260.260.250.250.100.100.060.060.030.03 基本原理基本原理 将编码的信息表示成实数将编码的信息表示成实数0和和1之间的一个间隔,之间的一个间隔,信息越长,编码表示

22、它的间隔就越小,表示这一间信息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。隔所需的二进制位就越多。 222算术编码算术编码222算术编码算术编码例例2 输入数据为输入数据为A、B、C、D、E,其出现的概率和,其出现的概率和设定的取值范围如下,求字符串设定的取值范围如下,求字符串BAC的算术编码。的算术编码。字符:ABCDE概率:0.20.30.10.20.2范围:0,0.20.2,0.50.5,0.60.6,0.80.8,1.02 22 22 2算术编码算术编码222算术编码算术编码 算术编码的特点算术编码的特点 对整个消息只产生一个码字;对整个消息只产生一个码字; 小数的

23、精度不可能无限长,在运算中存在溢出的问题需要小数的精度不可能无限长,在运算中存在溢出的问题需要解决;解决; 对错误非常敏感;对错误非常敏感; 算术编码可分静态模型和自适应模型;算术编码可分静态模型和自适应模型; 在静态模型中,信源符号概率固定;在静态模型中,信源符号概率固定; 在自适应模型中,符号概率根据符号的出现频度动态修改。在自适应模型中,符号概率根据符号的出现频度动态修改。 行程编码(行程编码(RLE,Run-Length Encoding),又称),又称“运行长度运行长度编码编码”或或“游程编码游程编码” ,是一种统计编码,该编码属于无损,是一种统计编码,该编码属于无损压缩编码。压缩编

24、码。 基本原理基本原理 用一个符号值或串长代替数据流中出现的行程(由连续的用一个符号值或串长代替数据流中出现的行程(由连续的重复符号串构成的一段连续的字符串称为重复符号串构成的一段连续的字符串称为“行程行程”,行程编,行程编码因此而得名),使符号长度少于原始数据的长度。码因此而得名),使符号长度少于原始数据的长度。223行程编码行程编码例例3 有如下一串数字,求其行程编码。有如下一串数字,求其行程编码。223行程编码行程编码行程编码分为:行程编码分为: 定长行程编码定长行程编码 编码位数固定,当行程长度超过能表达的编码位数后,用编码位数固定,当行程长度超过能表达的编码位数后,用下一个行程对超出

25、部分进行编码。下一个行程对超出部分进行编码。 不定长行程编码不定长行程编码 位数由行程长短确定,是不固定的。位数由行程长短确定,是不固定的。223行程编码行程编码 Window中的位图支持行程编码压缩方式,通常位图的象素中的位图支持行程编码压缩方式,通常位图的象素使用使用4比特或者比特或者8比特来表示,即比特来表示,即BITMAPINFOHEADER结构中结构中biCompression的的BI_RLE8和和BI_RLE4。223行程编码行程编码 LZW(Lempel Ziv Welch)编码是一种先进的数据压缩技编码是一种先进的数据压缩技术,属于无损压缩编码,该编码主要用于图像数据的压缩。术

26、,属于无损压缩编码,该编码主要用于图像数据的压缩。对于简单图像和平滑且噪声小的信号源具有较高的压缩比,对于简单图像和平滑且噪声小的信号源具有较高的压缩比,并且有较高的压缩和解压缩速度。并且有较高的压缩和解压缩速度。LZW编码基于转换串表编码基于转换串表(字典)(字典)T,使用可变长编码,最大代码长度为使用可变长编码,最大代码长度为12位。位。224 LZW编码编码 把数据流中复杂的数据用简单的代码来表示,并把代码把数据流中复杂的数据用简单的代码来表示,并把代码和数据的对应关系建立一个转换表,又叫和数据的对应关系建立一个转换表,又叫“字符串表字符串表”。转。转换表是在压缩或解压缩过程中动态生成的

27、表,该表只在进行换表是在压缩或解压缩过程中动态生成的表,该表只在进行压缩或解压缩过程中需要,一旦压缩和解压缩结束,该表将压缩或解压缩过程中需要,一旦压缩和解压缩结束,该表将不再起任何作用。不再起任何作用。 LZW编码的基本原理编码的基本原理1)1)先初始化,扫描、统计出独立的先初始化,扫描、统计出独立的ASCII字符,并将所有字符,并将所有单个字符串放入串表并分别赋予代码值。单个字符串放入串表并分别赋予代码值。2)2)扫描编码方法:扫描编码方法: 读第一个输入的字符作为前缀串读第一个输入的字符作为前缀串W。 读下一个输入字符读下一个输入字符K(如果没有字符如果没有字符K表示输入已完)表示输入已

28、完) 如果如果WK已存在表中(即已定义,给定码值),则已存在表中(即已定义,给定码值),则WK作为前缀串作为前缀串W。 重复重复ii、iii两步,如果两步,如果WK不在表中(尚未定义),不在表中(尚未定义),则输出则输出W的码值加的码值加K,并把并把K作为前缀串作为前缀串W。 重复、步直到字符输完为止。重复、步直到字符输完为止。 LZW编码的步骤编码的步骤 例例4 输入字符串输入字符串XYYYXXZZXXZZZZZ,求求LZW编码的编码的字符串表。字符串表。 LZW编码编码 LZW压缩技术对于可预测性不大的数据具有较好压缩技术对于可预测性不大的数据具有较好的处理效果,常用于的处理效果,常用于G

29、IF格式的图像压缩,其平均格式的图像压缩,其平均压缩比在压缩比在2:1以上,最高压缩比可达到以上,最高压缩比可达到3:1。 对于数据流中连续重复出现的字节和字串,对于数据流中连续重复出现的字节和字串,LZW压缩技术具有很高的压缩比。压缩技术具有很高的压缩比。 除了用于图像数据处理以外,除了用于图像数据处理以外,LZW压缩技术还被压缩技术还被用于文本程序等数据压缩领域。用于文本程序等数据压缩领域。 LZW压缩技术有很多变体,例如常见的压缩技术有很多变体,例如常见的ARC、RKARC、PKZIP高效压缩程序。高效压缩程序。 对机器硬件条件要求不高,在对机器硬件条件要求不高,在 Intel 8038

30、6的计算的计算机上即可进行压缩和解压缩。机上即可进行压缩和解压缩。 LZW编码的特点编码的特点 PCM,即脉冲编码调制(即脉冲编码调制(Pulse Code Modulation),),是一种是一种模拟信号数字化的技术,特别是对于音频信号。模拟信号数字化的技术,特别是对于音频信号。 脉冲编码调制(脉冲编码调制(PCM)最大的特点是把连续输入的模拟信号最大的特点是把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输。式传输。 PCMPCM通过采样、量化、编码三个步骤将连续变化的模拟信号通过采样、量化、编码三个步骤将连续

31、变化的模拟信号转换为数字编码。转换为数字编码。 225 PCM编码编码 抗干扰能力强;失真小;传输特性稳定,尤其是抗干扰能力强;失真小;传输特性稳定,尤其是远距离信号再生中继时噪声不累积,而且可以采用远距离信号再生中继时噪声不累积,而且可以采用压缩编码、纠错编码和保密编码等来提高系统的有压缩编码、纠错编码和保密编码等来提高系统的有效性、可靠性和保密性。另外,效性、可靠性和保密性。另外,PCM还可以在一个还可以在一个信道上将多路信号进行时分复用传输。信道上将多路信号进行时分复用传输。 PCM的主要优点的主要优点 DPCM(Differential Pulse Code Modulation),)

32、,意为意为差分脉冲编码调制,主要用于图像压缩。差分脉冲编码调制,主要用于图像压缩。DPCM编码编码是基本的编码方法之一,在大量的压缩算法中被采是基本的编码方法之一,在大量的压缩算法中被采用,比如用,比如JPEG的的DC分量就是采用分量就是采用DPCM编码的。编码的。 226 DPCM编码编码 DPCM的基本工作原理:的基本工作原理: 不对每个样值都进行量化,而是预测下一个样不对每个样值都进行量化,而是预测下一个样值,并且量化实际值和预测值之间的差,达到压缩值,并且量化实际值和预测值之间的差,达到压缩的目的。解压时也是使用同样的预测器,并将这个的目的。解压时也是使用同样的预测器,并将这个预测值和

33、存储的已量化差值相加,产生近似的原始预测值和存储的已量化差值相加,产生近似的原始信号。信号。 226 DPCM编码编码 ADPCM编码(自适应预测编码)具有自适应特性,编码(自适应预测编码)具有自适应特性,该编码包括自适应量化和自适应预测两种形式,主该编码包括自适应量化和自适应预测两种形式,主要用于对中等质量的音频信号进行高效率压缩,例要用于对中等质量的音频信号进行高效率压缩,例如语音信号的压缩、调幅广播音质的信号压缩等。如语音信号的压缩、调幅广播音质的信号压缩等。 227 ADPCM编码编码 ADPCM原理:原理: 定期地重新计算协方差矩阵和相应的加权因子,充分定期地重新计算协方差矩阵和相应

34、的加权因子,充分利用其统计特性调整预测参数,使预测器随着输入数据的利用其统计特性调整预测参数,使预测器随着输入数据的变化而变化。也就是使预测器和量化器的参数根据所要记变化而变化。也就是使预测器和量化器的参数根据所要记录的数据内容如图像的不同部位的具体特点进行自行调整,录的数据内容如图像的不同部位的具体特点进行自行调整,以便匹配图像的局部变化,使其具有更大的灵活性,从而以便匹配图像的局部变化,使其具有更大的灵活性,从而获得较高的压缩比和较好的图像质量。获得较高的压缩比和较好的图像质量。 227 ADPCM编码编码 变换编码基本原理:变换编码基本原理: 不是直接对信号进行编码,而是在数据压缩前先不

35、是直接对信号进行编码,而是在数据压缩前先对原始输入数据作某种正交变换,把图像信号映射变对原始输入数据作某种正交变换,把图像信号映射变换到另外一个正交向量空间,产生一批变换系数,然换到另外一个正交向量空间,产生一批变换系数,然后再对这些变换系数进行量化压缩。以图像为例,首后再对这些变换系数进行量化压缩。以图像为例,首先在发送端将原始图像分割成先在发送端将原始图像分割成n个子图像块,每个子个子图像块,每个子图像块经过正交变换、滤波、量化和编码后送信道传图像块经过正交变换、滤波、量化和编码后送信道传输到达接收端,接收端作解码、逆变换、综合拼接,输到达接收端,接收端作解码、逆变换、综合拼接,恢复出空域

36、图像。恢复出空域图像。 228变换编码变换编码 228变换编码变换编码 228变换编码变换编码 正交变换实现数据压缩的实质:正交变换实现数据压缩的实质: 经过坐标系适当的旋转和变换,能够经过坐标系适当的旋转和变换,能够把散布在各个坐标轴上的原始数据,在新把散布在各个坐标轴上的原始数据,在新的、适当的坐标系中集中在少数坐标轴上,的、适当的坐标系中集中在少数坐标轴上,因此可用较少的编码位数来表示一组信号因此可用较少的编码位数来表示一组信号样本,实现高效率的压缩编码。样本,实现高效率的压缩编码。 2 28变换编码变换编码 K-L变换(变换(Karhunen-Loeve)亦称主分量变换,它从亦称主分量

37、变换,它从图像统计特性出发用一组不相关的系数来表示连续图像统计特性出发用一组不相关的系数来表示连续信号,实现正交变换。信号,实现正交变换。 K-L变换能使变换后协方差矩阵为对角阵,并且有最变换能使变换后协方差矩阵为对角阵,并且有最小均方误差,向量信号的各个分量互不相关,因而小均方误差,向量信号的各个分量互不相关,因而它是失真最小的一种变换,故称为最佳变换。由于它是失真最小的一种变换,故称为最佳变换。由于它的它的“最佳最佳”特性,所以常常作为对其他变换技术特性,所以常常作为对其他变换技术性能的评价标准。性能的评价标准。 K-L变换的压缩性能是:对语音而言,用变换的压缩性能是:对语音而言,用K-L

38、变换在变换在13.5 Kbit/s下得到的语音质量可与下得到的语音质量可与56 Kbit/s的的PCM编编码相拟:对图像来讲,码相拟:对图像来讲,2 bit/pixel的质量可与的质量可与7 bit/pixel的的PCM编码相当。编码相当。 2 28变换编码(变换编码(K-L变换变换) 离散余弦变换(离散余弦变换(Discrete Cosine Transform,DCT)是傅立叶变换的一种特殊情况。在傅立叶级数展开是傅立叶变换的一种特殊情况。在傅立叶级数展开式中,如果被展开的函数是实偶函数,那么,其傅式中,如果被展开的函数是实偶函数,那么,其傅立叶级数中只包含余弦项,再将其离散化由此可导立叶

39、级数中只包含余弦项,再将其离散化由此可导出余弦变换。出余弦变换。 DCTDCT是一种正交变换,它将信号从空间域变换到频是一种正交变换,它将信号从空间域变换到频率域。在频率域中,大部分的能量集中在少数几个率域。在频率域中,大部分的能量集中在少数几个低频系数上,而且代表不同空间频率分量的系数的低频系数上,而且代表不同空间频率分量的系数的相关性大为减弱,仅利用几个能量较大的低频系数相关性大为减弱,仅利用几个能量较大的低频系数就可以很好地恢复原始图像,对于其余的那些低能就可以很好地恢复原始图像,对于其余的那些低能量系数,可给予较大的失真,甚至将其置为量系数,可给予较大的失真,甚至将其置为0 0。 22

40、8变换编码(变换编码(离散余弦变换离散余弦变换) 子带编码(子带编码(Sub-Band Coding,SBC),),是将原始是将原始信号由时间域转变为频率域,然后将其分割为若干个信号由时间域转变为频率域,然后将其分割为若干个子频带,并对其分别进行数字编码的技术。它是利用子频带,并对其分别进行数字编码的技术。它是利用带通滤波器(带通滤波器(BPF)组把原始信号分割为若干(例如组把原始信号分割为若干(例如m个)子频带(简称子带)。将各子带通过等效于单边个)子频带(简称子带)。将各子带通过等效于单边带调幅的调制特性,将各子带搬移到零频率附近,分带调幅的调制特性,将各子带搬移到零频率附近,分别经过别经

41、过BPF(共共m个)之后,再以规定的速率(奈奎斯个)之后,再以规定的速率(奈奎斯特速率)对各子带输出信号进行取样,并对取样数值特速率)对各子带输出信号进行取样,并对取样数值进行通常的数字编码,其设置进行通常的数字编码,其设置m路数字编码器。将各路数字编码器。将各路数字编码信号送到多路复用器,最后输出子带编码路数字编码信号送到多路复用器,最后输出子带编码数据流。数据流。 229子带编码子带编码 在接收端实现发送端的逆过程。输入子带编码在接收端实现发送端的逆过程。输入子带编码数据流,将各子带信号分别送到相应的数字解码电数据流,将各子带信号分别送到相应的数字解码电路路(共共m个个)进行数字解调,经过

42、诸路低通滤波器(进行数字解调,经过诸路低通滤波器(m路),并重新解调,可把各子带频域恢复为当初原路),并重新解调,可把各子带频域恢复为当初原始信号的分布状态。最后,将各路子带输出信号送始信号的分布状态。最后,将各路子带输出信号送到同步相加器,经过相加恢复为原始信号,该恢复到同步相加器,经过相加恢复为原始信号,该恢复的信号与原始信号十分相似。的信号与原始信号十分相似。 229子带编码子带编码 分形(分形(Fractal)的概念是由数学家的概念是由数学家B.Mandelbrot于于1975年提出的。他把分形定义为年提出的。他把分形定义为“一一种由许多个与整体有某种相似性的局部所构成的形种由许多个与

43、整体有某种相似性的局部所构成的形体体”,即指一类无规则、混乱、复杂、但其局部与,即指一类无规则、混乱、复杂、但其局部与整体具有相似性的体系。整体具有相似性的体系。 2210分形编码分形编码 分形图案分形图案分形图案分形图案分形图案分形图案分形图案分形图案 分形编码是一种模型编码,适用于图像压缩。它利用模型分形编码是一种模型编码,适用于图像压缩。它利用模型的方法,对需要传输的图像进行参数估测。分形是一个过程,的方法,对需要传输的图像进行参数估测。分形是一个过程,是事物从整体向局部转化,认识从宏观向微观深化的过程。是事物从整体向局部转化,认识从宏观向微观深化的过程。 以图像为例,分形编码把原始图像分割成若干个子图像,以图像为例,分形编码把原始图像分割成若干个子图像,然后在分形集中查找这些子图像,分形集并不是存储所有可然后在分形集中查找这些子图像,分形集并不是存储所有可能的子图像,而是存储迭代函数,当需要恢复时,通过迭

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论