版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、内容:多媒体数据压缩技术的发展和分类,常用数内容:多媒体数据压缩技术的发展和分类,常用数 据压缩算法的原理,数据压缩标准;据压缩算法的原理,数据压缩标准;重点:重点: Huffman 编码和编码和JPEG编码编码 的编码过程,的编码过程,MPEG标准标准多媒体数据压缩多媒体数据压缩2.1 2.1 数据压缩的基本原理和方法数据压缩的基本原理和方法2.2 2.2 音频的压缩音频的压缩2.3 2.3 图像和视频的压缩图像和视频的压缩2.1 数据压缩的基本原理和方法数据压缩技术的性能指标数据冗余的类型与压缩方法分类常用数据压缩方法的基本原理多媒体数据压缩数据压缩技术的性能指标 压缩的必要性压缩的必要性
2、 音频、视频的数据量很大,如果不进音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行行处理,计算机系统几乎无法对它进行存取和交换。例如:存取和交换。例如: 基本原理和方法一幅中等分辨率(640480)的真彩色图像(24b/像素),它的数据量约为0.9MB/帧,若要达到每秒25帧的全动态显示要求,每秒所需的数据量约为22MB。对于声音也是如此,CD音质的声音每秒将有约为172KB的数据量。 视频、图像、声音有很大的压缩潜力视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于信源信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。的实际熵,该信源中一定存
3、在冗余度。 原始信源的数据存在着很多冗余度:空原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余等。间冗余、时间冗余、视觉冗余、听觉冗余等。基本原理和方法数据压缩技术的性能指标冗余的基本概念冗余的基本概念 指信息存在的各种性质的多余度指信息存在的各种性质的多余度举例:举例:(1 1)广播员读文稿时每分钟约读)广播员读文稿时每分钟约读180180字,一个字,一个汉字占两个汉字占两个字节;文本数据量为字节;文本数据量为360B360B;(2 2)如果对语音录音,由于人说话的音频范围)如果对语音录音,由于人说话的音频范围为为20Hz20Hz到到4kHz4kHz,即语音的带宽为,即
4、语音的带宽为4kHz4kHz,若设量化位数为,若设量化位数为8bit,8bit,则一秒钟则一秒钟的数据量为:的数据量为: 4 42 28=64kbit/s= 8KB/s8=64kbit/s= 8KB/s则一分钟的数据是则一分钟的数据是480KB480KB。 数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类基本原理和方法360B 480KB360B 480KB数据冗余的类别空间冗余时间冗余统计冗余信息熵冗余结构冗余知识冗余视觉冗余听觉冗余数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类基本原理和方法数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类规则物体和规则背景的表面物
5、理特性都具有相关性,规则物体和规则背景的表面物理特性都具有相关性,数字化后表现为数据冗余。数字化后表现为数据冗余。序列图像(如电视图像和运动图像)和语音数据的前序列图像(如电视图像和运动图像)和语音数据的前后有着很强的相关性,经常包含着冗余。在播出该序后有着很强的相关性,经常包含着冗余。在播出该序列图像时,时间发生了推移,但若干幅画面的同一部列图像时,时间发生了推移,但若干幅画面的同一部位没有变化,变化的只是其中某些地方,这就形成了位没有变化,变化的只是其中某些地方,这就形成了时间冗余。时间冗余。基本原理和方法 空间冗余和时间冗余是把图像信号看作概率信号时反应出的统计特性,因此,这两种冗余也被
6、称为统计冗余。数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类信息熵实际情况又称编码冗余。信息熵是指一组数所信息熵实际情况又称编码冗余。信息熵是指一组数所携带的信息量。携带的信息量。数字化图像中的物体表面纹理等结构往往存在着冗余数字化图像中的物体表面纹理等结构往往存在着冗余基本原理和方法 人类的视觉系统对于图像场的注意在非均匀和非线性的,视觉系统并不是对图像的任何变化都能感知。 人耳对不同频率的声音的敏感性是不同的,并不能察觉人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。听觉冗余
7、。数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类基本原理和方法 从哪些方面评价一个压缩系统?从哪些方面评价一个压缩系统?数据压缩技术的性能指标基本原理和方法压缩比压缩比图像质量图像质量压缩解压速度压缩解压速度硬件和软件硬件和软件 压缩比压缩比 输入数据和输出数据比输入数据和输出数据比 例如:图像例如:图像 512 512480480, 24 24位位 输入输入(512(51248048024)/8=737280B 24)/8=737280B 输出输出15000B15000B 压缩比压缩比737280150004949数据压缩技术的性能指标基本原理和方法 图像
8、质量图像质量 压缩方法:压缩方法: 无损压缩无损压缩 有损压缩有损压缩 有损压缩:失真情况很难量化,只能对测有损压缩:失真情况很难量化,只能对测试的图像进行估计。试的图像进行估计。数据压缩技术的性能指标基本原理和方法对于图像质量的客观尺度通常有以下几种:1.相似性指标:相关系数、均方根误差、均方根百分误差等等2.误差指标:峰值误差、幅度误差、距离误差、时间误差等等3.压缩效率指标:压缩比、平均码率、熵率 压缩解压速度压缩解压速度 在许多应用中,压缩和解压可能不同在许多应用中,压缩和解压可能不同时用,在不同的位置不同的系统中。所以,时用,在不同的位置不同的系统中。所以,压缩、解压速度分别估计。压
9、缩、解压速度分别估计。 静态图像中,压缩速度没有解压速度静态图像中,压缩速度没有解压速度严格;动态图像中,压缩、解压速度都有要严格;动态图像中,压缩、解压速度都有要求,因为需实时地从摄像机或其他设备中抓求,因为需实时地从摄像机或其他设备中抓取动态视频。取动态视频。数据压缩技术的性能指标基本原理和方法 硬软件系统硬软件系统 有些压缩解压工作可用软件实现。设计有些压缩解压工作可用软件实现。设计系统时必须充分考虑:系统时必须充分考虑: 算法复杂算法复杂 压缩解压过程长压缩解压过程长 算法简单算法简单 压缩效果差压缩效果差 目前有些特殊硬件可用于加速压缩目前有些特殊硬件可用于加速压缩/ /解压。解压。
10、 硬接线系统速度快,但各种选择在初始设计时硬接线系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压已确定,一般不能更改。因此在设计硬接线压缩缩/ /解压系统时必须先将算法标准化。解压系统时必须先将算法标准化。数据压缩技术的性能指标基本原理和方法n数据压缩的好处n时间域压缩迅速传输媒体信源n频率域压缩并行开通更多业务n空间域压缩降低存储费用n能量域压缩降低发射功率数据压缩技术的性能指标基本原理和方法数据压缩技术分类数据压缩技术分类 指使压缩后的数据进行重构指使压缩后的数据进行重构( (或者叫做还原,解压缩或者叫做还原,解压缩) ),重构后的数据与原来的数据完全相同;无损压
11、缩用于要重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。求重构的信号与原始信号完全一致的场合。 典型的算法有:典型的算法有:HuffmanHuffman编码,算术编码,行程编码等。编码,算术编码,行程编码等。特点:压缩比较低,为特点:压缩比较低,为2:1-5:12:1-5:1, 一般用来压缩文本,数据。一般用来压缩文本,数据。数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类无损压缩无损压缩基本原理和方法 是指使用压缩后的数据进行重构,重构后的数据与是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达原来的数据有所
12、不同,但不影响人对原始资料表达的信息造成误解。的信息造成误解。 典型的算法有:典型的算法有:混合编码的混合编码的JPEGJPEG标准,预测编码,变换编码等。标准,预测编码,变换编码等。特点:压缩比高,为几十到几百倍特点:压缩比高,为几十到几百倍 一般用于图像,声音,视频压缩。一般用于图像,声音,视频压缩。数据冗余的类型与压缩方法分类数据冗余的类型与压缩方法分类有损压缩有损压缩基本原理和方法数据压缩的方法数据压缩的方法 统计编码统计编码 预测编码预测编码 变换编码变换编码 混合编码混合编码 分析合成编码分析合成编码常用数据压缩方法的基本原理常用数据压缩方法的基本原理基本原理和方法 根据消息出现概
13、率的分布特性而进根据消息出现概率的分布特性而进行的压缩编码。行的压缩编码。 Huffman Huffman编码编码 行程编码行程编码 LZW LZW编码编码 算术编码算术编码常用数据压缩方法的基本原理常用数据压缩方法的基本原理基本原理和方法统计编码统计编码HuffmanHuffman编码编码它是统计独立信源能达到最小平均码长的它是统计独立信源能达到最小平均码长的编码方法。编码效率高编码方法。编码效率高, ,但依赖于信源的统但依赖于信源的统计特性计特性, ,比较实用比较实用. .在经验基础上预先提供在经验基础上预先提供HuffmanHuffman码表码表, ,性能不高性能不高, ,缺乏构造性。缺
14、乏构造性。如果消息数目很多如果消息数目很多, ,那么所需存储的码表也那么所需存储的码表也很大很大, ,这将影响系统的存储量及编、译码速这将影响系统的存储量及编、译码速度。度。统计编码统计编码基本原理和方法a1 0.20a2 0.19a3 0.18a4 0.17a5 0.15a6 0.10a7 0.01010.11 010.260.35 10.611101000.391.00码字 码长01 200 2 3 3 3 4 4平均码长: 2.72HuffmanHuffman编码过程编码过程0Huffman编码的局限性利用霍夫曼编码,每个符号的编码长度只能为整利用霍夫曼编码,每个符号的编码长度只能为整数
15、,所以如果源符号集的概率分布不是数,所以如果源符号集的概率分布不是2 2负负n n次方次方的形式,则无法达到熵极限。的形式,则无法达到熵极限。输入符号数受限于可实现的码表尺寸输入符号数受限于可实现的码表尺寸译码复杂译码复杂需要实现知道输入符号集的概率分布需要实现知道输入符号集的概率分布没有错误保护功能没有错误保护功能统计编码统计编码基本原理和方法行程编码行程编码 是最简单、最古老的压缩技术之一,主要技术是最简单、最古老的压缩技术之一,主要技术是检测重复的比特或字符序列,并用它们的出是检测重复的比特或字符序列,并用它们的出现次数取而代之。该方法有两大模式:一是消现次数取而代之。该方法有两大模式:
16、一是消零零( (消空白消空白) ),二是行,二是行( (游游) )程程(run length)(run length)编码。编码。 消零消零( (或消空白或消空白) )法法 将数字中连续的将数字中连续的“0”“0”或文本中连续的空白或文本中连续的空白用一个标识符用一个标识符( (或特殊字符或特殊字符) )后跟数字后跟数字N(N(连续连续“0”“0”的个数的个数) )来代替。来代替。 如数字序列:如数字序列: 000055000055 编码为:编码为: 7423Z1855 7423Z1855统计编码统计编码基本原理和方法行程编码行程编码行程编码法行程编码法 任何重复的字符序列可被一个短格式取任何
17、重复的字符序列可被一个短格式取代。该算法适合于任何重复的字符。代。该算法适合于任何重复的字符。 一组一组n n个连续的字符个连续的字符c c将被将被c c和一个特殊的和一个特殊的字符取代。当然,若给定字符仅重复两次就不字符取代。当然,若给定字符仅重复两次就不要用此方法。任何重复要用此方法。任何重复4 4次或次或4 4次以上的字符由次以上的字符由“该字符记号该字符记号(M)(M)重复次数重复次数”代替。代替。 例如数字序列:例如数字序列: Name: . . . . . . . . . . CRName: . . . . . . . . . . CR 编码为:编码为: Name: . M10 C
18、R Name: . M10 CR 统计编码统计编码基本原理和方法LZW编码编码LZW算法常用在压缩文本和程序数据。它的压算法常用在压缩文本和程序数据。它的压缩率高,压缩处理所化费的时间比其它方式要缩率高,压缩处理所化费的时间比其它方式要少。少。LZW编码时,首先将原始的数据分成多个条纹,编码时,首先将原始的数据分成多个条纹,每个条纹都单独进行压缩。每个条纹都单独进行压缩。LZW算法基于一个转换表或字串表,它将输入算法基于一个转换表或字串表,它将输入字符映象到编码中,使用可变长代码,最大代字符映象到编码中,使用可变长代码,最大代码长度为码长度为12位。位。统计编码统计编码基本原理和方法LZW编码
19、编码LZW算法中的字串表对于每个条纹都不同,并且不必算法中的字串表对于每个条纹都不同,并且不必保留给解压缩程序,因为解压缩过程中能自动建立完保留给解压缩程序,因为解压缩过程中能自动建立完全相同的字串表。实际上,它是通过查找冗余字符串全相同的字串表。实际上,它是通过查找冗余字符串并将此字符串用较短的符号标记替代的压缩技术。并将此字符串用较短的符号标记替代的压缩技术。LZW算法得到普遍采用,它的速度比较快,因为它不算法得到普遍采用,它的速度比较快,因为它不需要执行较多的缀需要执行较多的缀-符串比较操作。对符串比较操作。对LZW算法进一算法进一步的改进是增加可变的码字长度,以及在词典中删除步的改进是
20、增加可变的码字长度,以及在词典中删除老的缀老的缀-符串。在符串。在GIF图像格式和图像格式和UNIX的压缩程序中的压缩程序中已经采用了这些改进措施之后的已经采用了这些改进措施之后的LZW算法算法统计编码统计编码基本原理和方法算术编码算术编码算术编码把一个信源集合表示为实数线上的算术编码把一个信源集合表示为实数线上的0 0到到1 1之间的一个区间。这个集合中的每个元素都要之间的一个区间。这个集合中的每个元素都要用来缩短这个区间。信源集合的元素越多,所用来缩短这个区间。信源集合的元素越多,所得到的区间就越小,当区间变小时,就需要一得到的区间就越小,当区间变小时,就需要一些更多的数位来表示这个区间,
21、这就是区间作些更多的数位来表示这个区间,这就是区间作为代码的原理。算术编码首先假设一个信源的为代码的原理。算术编码首先假设一个信源的概率模型,然后用这些概率来缩小表示信源集概率模型,然后用这些概率来缩小表示信源集的区间。的区间。统计编码统计编码基本原理和方法算术编码算术编码基本思想:算术编码不是将单个信源符号映射基本思想:算术编码不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上成一个码字,而是把整个信源表示为实数线上的的0 0到到1 1之间的一个区间,其长度等于该序列的之间的一个区间,其长度等于该序列的概率,再在该区间内选择一个代表性的小数,概率,再在该区间内选择一个代表性的小数
22、,转化为二进制作为实际的编码输出。消息序列转化为二进制作为实际的编码输出。消息序列中的每个元素都要用来缩短这个区间。消息序中的每个元素都要用来缩短这个区间。消息序列中元素越多,所得到的区间就越小,当区间列中元素越多,所得到的区间就越小,当区间变小时,就需要更多的数位来表示这个区间。变小时,就需要更多的数位来表示这个区间。采用算术编码每个符号的平均编码长度可以为采用算术编码每个符号的平均编码长度可以为小数。小数。统计编码统计编码基本原理和方法u 在算术编码中需要注意的几个问题:在算术编码中需要注意的几个问题:u由于实际的计算机的精度不可能无限长,由于实际的计算机的精度不可能无限长,运算中出现溢出
23、是一个明显的问题,但多运算中出现溢出是一个明显的问题,但多数机器都有数机器都有1616位、位、3232位或者位或者6464位的精度,位的精度,因此这个问题可使用比例缩放方法解决。因此这个问题可使用比例缩放方法解决。 u算术编码器对整个消息只产生一个码字,算术编码器对整个消息只产生一个码字,这个码字是在间隔这个码字是在间隔0, 1)0, 1)中的一个实数,中的一个实数,因此译码器在接受到表示这个实数的所有因此译码器在接受到表示这个实数的所有位之前不能进行译码。位之前不能进行译码。 u算术编码也是一种对错误很敏感的编码方算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消法,如
24、果有一位发生错误就会导致整个消息译错。息译错。统计编码统计编码基本原理和方法u预测编码是数据压缩理论的一个重要分支。它根预测编码是数据压缩理论的一个重要分支。它根据离散信号之间存在一定相关性的特点,利用前据离散信号之间存在一定相关性的特点,利用前面的一个或多个信号对下一个信号进行预测,然面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差(预测误差)进行编码。后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,那么误差信号就会很小,就如果预测比较准确,那么误差信号就会很小,就可以用较少的码位进行编码,以达到数据压缩的可以用较少的码位进行编码,以达到数据压缩的目的。目的。u
25、参与预测的符号越多,预测就越准确,该信源的参与预测的符号越多,预测就越准确,该信源的不确定性就越小,误码率就可以降低。不确定性就越小,误码率就可以降低。u编码是有损型还是无损型关键看对预测误差如何编码是有损型还是无损型关键看对预测误差如何编码。编码。预测编码基本原理和方法利用相关性,利用前面的一个或多个信号对下一利用相关性,利用前面的一个或多个信号对下一信号进行预测。信号进行预测。然后对实际值和预测值的差然后对实际值和预测值的差( (预测误差预测误差) )进行编码。进行编码。如果预测比较准确,误差信号就会很小;这样,如果预测比较准确,误差信号就会很小;这样,在同等精度要求下,就可以用比较少的数
26、码进行在同等精度要求下,就可以用比较少的数码进行编码,达到压缩数据的目的。编码,达到压缩数据的目的。预测编码基本原理和方法如何预测? 使用预测器,预测下一个样值,允许有误差。 预测编码中典型的方法: DPCM(差分脉冲编码调制) ADPCM (自适应差分脉冲编码调制)适于声音、图像数据的压缩。预测编码基本原理和方法差分脉码调制(DPCM) 先对原始模拟信号作脉冲取样,把实际样值与预测样值之间的差进行量化。解压时,也用同样的预测器,把预测出的值与已存储的量化后差值相加,产生近似的原始信号。例如:X(n) 0 1 2 1 1 2 3 3 4 4 .X(n) 0 0 1 2 1 1 2 3 3 4
27、.d(n) 0 1 1 -1 0 1 1 0 1 0 .预测编码基本原理和方法 采样采样+量化量化压缩后数据压缩后数据+预测器预测器X(n)+_X(n)X(n)d(n)X(t)压缩后数据压缩后数据+预测器预测器d(n)X(n)X(n)d(n)=X(n)-X(n)预测编码基本原理和方法自适应差分脉码调制(ADPCM)自适应差分脉码调制自适应差分脉码调制(ADPCM) 对对DPCM采用自适应量化改善量化性能或采用采用自适应量化改善量化性能或采用自适应预测改善压缩率的方法都叫自适应预测改善压缩率的方法都叫ADPCM。自适应量化自适应量化 实际信号分布不均匀,例如语音,低电平信号的实际信号分布不均匀,
28、例如语音,低电平信号的概率大,可在一定量化级数下减小量化误差,使量概率大,可在一定量化级数下减小量化误差,使量化器的输入信号基本均匀。化器的输入信号基本均匀。预测编码图像信号的预测编码一副数字图像可以看成一个空间点阵,图像信号不仅在水平方向是相关的,在垂直方向也是相关的。根据已知样值与待预测样值间的位置关系,可以分为: (1)一维预测(行内预测):利用同一行上相邻的样值进行预测。 (2)二维预测(帧内预测):利用同一行和前面几行的数据进行预测。 (3)三维预测(帧间预测):利用相邻几帧(或不同波段)上的取样值进行预测预测编码基本原理和方法活动图像的帧间预测编码视频信号的冗余度主要体现在空间相关
29、性(帧内)、时间相关性(帧间)和色度空间表示上的相关性。对于每秒25帧(30)的电视信号,其相继帧之间存在极强的相关性。据统计256级灰度的黑白图像序列,帧间差值超过3的象素数不超过4。所以在活动图像序列中可以利用前面的帧来预测后面的帧,以实现数据压缩。帧间预测编码技术被广泛应用到H.261、H.263、MPEG-1和MPEG-2等视频压缩标准之中。预测编码基本原理和方法原理 变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间)。再对变换后的信号进行编码。例如: 将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中信号的能量较集中,再进行采样,可以压
30、缩数据。变换编码变换编码基本原理和方法典型的变换编码系统框图:典型的变换编码系统框图:信源信源序列序列变换变换变 换 域变 换 域采采 样样量化量化编码编码存 储 或存 储 或传传 输输译码译码填零填零反反 变变换换再现再现序列序列变换编码系统压缩数据的三个步骤变换编码系统压缩数据的三个步骤变换编码变换编码基本原理和方法 (1) (1) 最佳变换(最佳变换(K KL L变换)变换) 数据压缩主要是去除信源的相关性。若考虑到信数据压缩主要是去除信源的相关性。若考虑到信号存在于无限区间上,而变换区域又是有限的,那么号存在于无限区间上,而变换区域又是有限的,那么表征相关性的统计特性就是协方差矩阵。表
31、征相关性的统计特性就是协方差矩阵。 当协方差矩阵中除对角线上元素之外的各元素都当协方差矩阵中除对角线上元素之外的各元素都为零时,就等效于相关性为零。所以,为了有效地进为零时,就等效于相关性为零。所以,为了有效地进行数据压缩,常常希望变换后的协方差矩阵为一对角行数据压缩,常常希望变换后的协方差矩阵为一对角矩阵,同时也希望主对角线上各元素随,的增加矩阵,同时也希望主对角线上各元素随,的增加很快衰减。因此,变换编码的关键在于:在已知的很快衰减。因此,变换编码的关键在于:在已知的条件下,根据它的协方差矩阵去寻找一种正交变换条件下,根据它的协方差矩阵去寻找一种正交变换,使变换后的协方差矩阵满足或接近为一
32、对角矩阵。,使变换后的协方差矩阵满足或接近为一对角矩阵。变换编码变换编码基本原理和方法 当经过正交变换后的协方差矩阵为一对当经过正交变换后的协方差矩阵为一对角矩阵,且具有最小均方误差时,该变换称角矩阵,且具有最小均方误差时,该变换称最佳变换,也称最佳变换,也称Karhunen-LoeveKarhunen-Loeve变换。可以变换。可以证明,以矢量信号的协方差矩阵的归一化正证明,以矢量信号的协方差矩阵的归一化正交特征向量所构成的正交矩阵,对该矢量信交特征向量所构成的正交矩阵,对该矢量信号所作的正交变换能使变换后的协方差矩阵号所作的正交变换能使变换后的协方差矩阵达到对角矩阵。达到对角矩阵。变换编码
33、变换编码(1) (1) 最佳变换(最佳变换(K KL L变换)变换)(2) (2) 离散余弦变换(离散余弦变换(DCTDCT变换)变换) 如果变换后的协方差矩阵接近对角矩阵如果变换后的协方差矩阵接近对角矩阵,该类变换称准最佳变换,典型的有,该类变换称准最佳变换,典型的有DCTDCT、DFTDFT、WHTWHT、HrTHrT等。其中,最常用的变换是等。其中,最常用的变换是离散余弦变换离散余弦变换DCTDCT。 DCT DCT是从是从DFTDFT引出的。引出的。DFTDFT可以得到近似可以得到近似于最佳变换的性能,但于最佳变换的性能,但DFTDFT的运算次数太多的运算次数太多,且需要复数运算。,且
34、需要复数运算。DCTDCT从从DFTDFT中取实部,并中取实部,并可用快速余弦变换算法,因此大大加快了运可用快速余弦变换算法,因此大大加快了运算。同时其压缩性能十分逼近最佳变换的压算。同时其压缩性能十分逼近最佳变换的压缩性能。所以,缩性能。所以,DCTDCT在图像压缩中得到了广在图像压缩中得到了广泛的应用。泛的应用。变换编码变换编码 原理原理 使用两种或两种以上的编码方法混合进行使用两种或两种以上的编码方法混合进行编码编码 称为混合编码。称为混合编码。 能提高数据压缩的效率能提高数据压缩的效率。 例如:例如: 多媒体图像压缩标准中都采用混合编码多媒体图像压缩标准中都采用混合编码;如;如JPEG
35、, MPEGJPEG, MPEG等。等。基本原理和方法混合编码混合编码 通过对原始数据的分析,将其分解为一系通过对原始数据的分析,将其分解为一系列更适合于表示的基元或者从中提取出更有列更适合于表示的基元或者从中提取出更有本质意义的参数,编码仅对这些基本单元或本质意义的参数,编码仅对这些基本单元或者特征参数进行,而解码时则借助于一定的者特征参数进行,而解码时则借助于一定的规则或者模型,按照一定的算法将这些基元规则或者模型,按照一定的算法将这些基元或者参数再综合成原始数据的一个逼近。或者参数再综合成原始数据的一个逼近。 量化编码量化编码 小波变换编码小波变换编码 分形编码分形编码 子带编码子带编码
36、分析合成编码分析合成编码基本原理和方法 量化编码量化编码 量化编码按照一次量化的码元个数,可分为标量量化编码按照一次量化的码元个数,可分为标量量化和矢量量化两种。量化和矢量量化两种。 标量量化标量量化 对数字化后的数据或对数字化后的数据或PCM数据(样本值)一个一个数据(样本值)一个一个地进行量化。地进行量化。 矢量量化矢量量化 将这些数据分组,每组将这些数据分组,每组K个数构成个数构成K维矢量,再以矢维矢量,再以矢量为单元逐个进行量化。矢量量化是标量量化的多量为单元逐个进行量化。矢量量化是标量量化的多维扩展。维扩展。 分析合成编码分析合成编码 标量量化中可在随机变量标量量化中可在随机变量X
37、X出现概率比较高的出现概率比较高的间隔内,选择较小的判决间隔,而在其他区域内间隔内,选择较小的判决间隔,而在其他区域内选择较大的间隔,这样可以以较小的量化均方误选择较大的间隔,这样可以以较小的量化均方误差进行量化。差进行量化。 矢量量化基于语义编码,其基本思想是采用矢量量化基于语义编码,其基本思想是采用非线性量化器,即对空间频率及能量分布较大的非线性量化器,即对空间频率及能量分布较大的系数分配较多比特数;反之分配较少的比特数,系数分配较多比特数;反之分配较少的比特数,从而达到压缩的目的。从而达到压缩的目的。 分析合成编码分析合成编码 小波变换编码小波变换编码 小波变换是一个线性变换,能够将一小
38、波变换是一个线性变换,能够将一个信号分解成对空间和时间、频率的独立贡个信号分解成对空间和时间、频率的独立贡献,同时又不失原信号所包含的信息。经过献,同时又不失原信号所包含的信息。经过小波变换后的图像能量很集中,便于对不同小波变换后的图像能量很集中,便于对不同的分量作不同的处理,达到较高的压缩比。的分量作不同的处理,达到较高的压缩比。 分析合成编码分析合成编码 分形编码分形编码 分形编码是一种模型编码,它利用模型分形编码是一种模型编码,它利用模型的方法,对需要传输的图像进行参数估测。的方法,对需要传输的图像进行参数估测。 分形的方法是把一幅数字图像,通过一分形的方法是把一幅数字图像,通过一些图像
39、处理技术,如颜色分割、边缘检测、频些图像处理技术,如颜色分割、边缘检测、频谱分析、纹理变化分析等等,将原始图像分成谱分析、纹理变化分析等等,将原始图像分成一些子图像。一些子图像。 然后在分形集中查找这样的子图像。分然后在分形集中查找这样的子图像。分形集实际上并不是存储所有可能的子图像,而形集实际上并不是存储所有可能的子图像,而是存储许多迭代函数,通过迭代函数的反复迭是存储许多迭代函数,通过迭代函数的反复迭代,恢复出原来的子图像。表示这样的迭代函代,恢复出原来的子图像。表示这样的迭代函数一般只需几个数据即可,这就达到了很高的数一般只需几个数据即可,这就达到了很高的压缩比。压缩比。 分析合成编码分
40、析合成编码 子带编码子带编码 利用带通滤波器组把信号频带分割利用带通滤波器组把信号频带分割成若干子频带,然后分别处理。通过等效成若干子频带,然后分别处理。通过等效于单边带调幅的调制过程,将各子带搬移于单边带调幅的调制过程,将各子带搬移到零频率附近以得到低通表示后,再以奈到零频率附近以得到低通表示后,再以奈奎斯特速率对各子带输出取样,并对取样奎斯特速率对各子带输出取样,并对取样值进行通常的数字编码。恢复时,将各子值进行通常的数字编码。恢复时,将各子带信号解码并重新调制回其原始位置,再带信号解码并重新调制回其原始位置,再将所有子带输出相加就可得到接近于原始将所有子带输出相加就可得到接近于原始信号的
41、恢复波形。它的复杂度与变换编码信号的恢复波形。它的复杂度与变换编码差不多,但客观质量高、主观效果好。差不多,但客观质量高、主观效果好。 分析合成编码分析合成编码音频压缩编码的基本方法音频压缩编码的基本方法电话质量的语音压缩标准电话质量的语音压缩标准调幅广播质量的音频压缩标准调幅广播质量的音频压缩标准高保真立体声音频压缩标准高保真立体声音频压缩标准2.2 2.2 音频的压缩音频的压缩多媒体数据压缩超声波超声波女性语音女性语音电话语音电话语音调幅广播调幅广播(AM)调频广播调频广播(FM)高级音响高级音响男性语音男性语音音频压缩编码的基本方法无失真压缩无失真压缩音频压缩方法音频压缩方法有失真压缩有
42、失真压缩HuffmanHuffman编码编码行程编码行程编码波形编码波形编码参数编码参数编码混合编码混合编码全频带编码全频带编码PCMPCMDPCMDPCMADPCMADPCM子带编码子带编码 自适应变换编码自适应变换编码ATCATC 心理学模型心理学模型矢量量化矢量量化线性预测线性预测LPCLPC矢量和激励线矢量和激励线性预测性预测VSELPVSELP多脉冲线性多脉冲线性预测预测MP-LPCMP-LPC码本激励线码本激励线性预测性预测CELPCELP电话质量的语音压缩标准ITUTSITUTS建议的语音压缩的标准建议的语音压缩的标准调幅广播质量的音频压缩标准 调幅广播质量:调幅广播质量:50H
43、z50Hz7kHz7kHz,称,称“7kHz“7kHz音频信音频信号号”。 G.722 G.722:G.722G.722基于子带基于子带 ADPCM ADPCM技术技术 (SB (SBADPCM) ADPCM) ,它是将现有的带宽分成两个独立的子带,它是将现有的带宽分成两个独立的子带信道分别采用差分脉码调制算法。信道分别采用差分脉码调制算法。 G.722 G.722压缩信压缩信号的带宽范围为号的带宽范围为50Hz50Hz到到7kHz7kHz,在标准模式下,采,在标准模式下,采样频率是样频率是16KHz16KHz,量化位数为,量化位数为1414比特。比特。G.722G.722标准(子带编码)标准
44、(子带编码)分分接接器器复复接接器器Xn+X r(n)BPF1BPF2BPFN编码器编码器编码器编码器编码器编码器译码器译码器译码器译码器译码器译码器BPF1BPF2BPFN编码编码信道信道译码译码高保真立体声音频压缩标准 高质量的声音信号频率范围:高质量的声音信号频率范围: 20Hz20kHz 目前国际上比较成熟的高质量声音压缩标准为目前国际上比较成熟的高质量声音压缩标准为MPEG音频。音频。MPEGl的音频信号在的音频信号在ISO 111723文档中的描述。文档中的描述。 MPEG音频不是单个一种压缩算法,而是音频不是单个一种压缩算法,而是3种音种音频编码和压缩方案的一个系列。频编码和压缩
45、方案的一个系列。 MPEG 声音编码分声音编码分为:层为:层l、层、层2、层、层3。随着层数的增加算法的。随着层数的增加算法的复杂度也增大。复杂度也增大。高保真立体声音频压缩标准 所有所有3 3层都分级兼容。最复杂的译码器层都分级兼容。最复杂的译码器( (即在层即在层3 3作的译码器作的译码器) )也可对层也可对层2 2或层或层l l的码流进行译码。的码流进行译码。 所有所有3 3层都运用同一原理:变换编码和子带编码。层都运用同一原理:变换编码和子带编码。 频谱被分为频谱被分为3232个子带。个子带。 应用快速博里叶变换来表示高频域中的信号。应用快速博里叶变换来表示高频域中的信号。 应用心理声
46、学模式来变换信号以估计刚能引起注意应用心理声学模式来变换信号以估计刚能引起注意的噪音级。的噪音级。 层层 l l、2 2 和和 3 3主要在最后一个阶段主要在最后一个阶段-即量化阶段的即量化阶段的方式上有所区别,但不是唯一的差别。方式上有所区别,但不是唯一的差别。IP电话关键技术IPIP电话的基本原理电话的基本原理 由专门设备或软件将呼叫方的话音由专门设备或软件将呼叫方的话音/ /传真信号传真信号采样并数据化、压缩打包,经过采样并数据化、压缩打包,经过IPIP网络传输到网络传输到对方,对方的专门设备或软件接收到话音包后,对方,对方的专门设备或软件接收到话音包后,进行解压缩,还原成模拟信号送给电
47、话听筒或进行解压缩,还原成模拟信号送给电话听筒或传真机。传真机。IP电话的关键技术音频压缩技术音频压缩技术IPIP电话的传输延时技术电话的传输延时技术分组语音技术分组语音技术静噪抑止技术静噪抑止技术回生消除技术回生消除技术话音抖动处理技术话音抖动处理技术话音优先技术话音优先技术2.3 2.3 图像和视频的压缩图像和视频的压缩图像和视频压缩编码的基本方法图像和视频压缩编码的基本方法静止图像压缩标准静止图像压缩标准视频压缩标准视频压缩标准多媒体数据压缩图像和视频压缩编码的基本方法图像和视频压缩编码的基本方法图像和视频压缩方法图像和视频压缩方法无失真压缩无失真压缩有失真压缩有失真压缩HuffmanH
48、uffman编码编码行程编码行程编码算术编码算术编码LZWLZW编码编码预测编码预测编码运动补偿运动补偿变换编码变换编码DCTDCT变换变换小波变换小波变换子带编码子带编码模型编码模型编码分形编码分形编码基于重要性基于重要性滤波滤波子采样子采样矢量量化矢量量化混合编码混合编码JPEGJPEGMPEGMPEGH.261H.261图像和视频的压缩图像信号数字化图像信号数字化n取样:图像在空间上的离散化取样:图像在空间上的离散化n 点阵取样点阵取样n 正交系数取样正交系数取样n量化:对取样点灰度级值的离散化过程量化:对取样点灰度级值的离散化过程n 均匀量化均匀量化n 非均匀量化非均匀量化图像和视频的
49、压缩静止图像压缩标准静止图像压缩标准 静止图像压缩,已有多个国际标准:静止图像压缩,已有多个国际标准: JPEG JPEG标准(标准(Joint Photographic Experts Joint Photographic Experts GroupGroup) JBIG JBIG标准(标准(Joint Bilevel Image GroupJoint Bilevel Image Group) ITU ITUT T的的G3G3、G4G4标准等标准等 图像和视频的压缩静止图像压缩标准静止图像压缩标准1. JPEG压缩标准压缩标准 压缩比高,图像质量保真程度好;压缩比高,图像质量保真程度好; 算
50、法能适应不同的数字图像参数、大小、图像内容、算法能适应不同的数字图像参数、大小、图像内容、彩色空间、统计特性等,但不包括二值图像;彩色空间、统计特性等,但不包括二值图像; 用户可以对压缩比、质量效果进行选择;用户可以对压缩比、质量效果进行选择; 应该满足硬软件实现的计算需求;应该满足硬软件实现的计算需求; 支持多种操作方式。支持多种操作方式。DC系数表Size Amplitude0 0 -1,1 -3,-2,2,3 -7-4,47 -15-8,815 -31-16,1631 -63-32,3263 -127-64,64127 -255-128,128255 -511-256,256511 -1023-512,5121023 -2047-1024,10242047AC系数表Size Amplitude -1,1 -3,-2,2,3 -7-4,47 -15-8,815 -31-16,1631 -63-32,3263 -127-64,64127 -255-128,128255 -511-256,256511 -1023-512,5121023
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年纸箱包装设计与定制购销合同范本3篇
- 2024年销售人员薪资调整与市场反馈合同3篇
- 2024年版汽车短租服务协议样本版B版
- 2024挖机机械租赁合同书
- 2024施工工人劳动权益保护劳动合同范本3篇
- 2024年物业管理信息系统合同3篇
- 2024年纺织品市场推广协议3篇
- 2024年生态旅游区土木工程总承包服务合同3篇
- 2023-2024学年山东省枣庄市薛城区高一(上)期末语文试卷
- 2024年贷款居间服务具体协议
- ISO 56001-2024《创新管理体系-要求》专业解读与应用实践指导材料之15:“6策划-6.4创新组合”(雷泽佳编制-2025B0)
- 广东省广州市天河区2022-2023学年七年级上学期期末语文试题(含答案)
- DB32/T 4700-2024 蓄热式焚烧炉系统安全技术要求
- 国有企业普法培训课件
- 小学数学自制教具学具的研究及探讨
- 广东省幼儿园一日活动指引(试行)
- 光学材料-光学加工流程
- 奔驰卡车产品分析(课堂PPT)
- 反循环钻孔灌注桩施工方案
- 新能源小客车购车充电条件确认书
- 发明专利专利答辩模板
评论
0/150
提交评论