第2章 多媒体信息压缩_第1页
第2章 多媒体信息压缩_第2页
第2章 多媒体信息压缩_第3页
第2章 多媒体信息压缩_第4页
第2章 多媒体信息压缩_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章多媒体数据压缩技术概述:

本章主要讲述了多媒体数据的压缩技术。

1、数据压缩的基本原理和方法;

2、统计编码

3、图像压缩编码

4、数字音频压缩编码

5、数字视频压缩编码2.1数据压缩的基本原理和方法

为什么要进行数据压缩?多媒体信息包括了文本、数据、声音、动画、图形、图像以及视频等多种媒体信息。虽然经过数字化处理后其数据量是非常大的,如果不进行数据压缩处理,计算机系统就无法对它进行存储和交换。另一个原因是图像、音频和视频这些媒体具有很大的压缩潜力。因为在多媒体数据中,存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。它们为数据压缩技术的应用提供了可能的条件。空间冗余:相邻区域时间冗余:相邻时间结构冗余:相邻位置知识冗余:知识推理视觉冗余:边缘区域相似性冗余:多个区域相似听觉冗余:较弱的声音2.1数据压缩的基本原理和方法

数据压缩技术的分类(1)根据质量有无损失可分为有损失编码和无损失编码。(2)根据数据压缩算法,可以将数据压缩技术分为统计编码、预测编码、变换编码、分析-合成编码和其他编码。

统计编码:根据出现的概率分布预测编码:原始信号取样,量化存储差值PCM编码:对连续语音进行采样量化与向量化编码:将模拟量转化数字频段划分编码:基于频段划分处理变换编码:对信号进行函数变换知识编码:规则库混合编码:两种以上编码冗余压缩法(无损压缩法)该方法在压缩时去掉部分冗余信息,而这些被丢失信息经过解压后可以完整的被恢复到压缩前的状态,是一个可逆的过程。因此,冗余压缩法不会产生数据失真,一般用于文本、数据的压缩,以保证完全的恢复原始数据。但这种方法的压缩比较小,一般在2:1~5:1之间。2.1数据压缩的基本原理和方法

熵压缩法(有损压缩法)该方法压缩时会丢失部分冗余信息,且这些被丢失信息不能被恢复,是一个不可逆的过程。解压后的数据存在一定程度的失真。这种压缩方法的压缩比可达几十到上百,常用于图像、声音、动态视频等数据的压缩。2.1数据压缩的基本原理和方法

2.1数据压缩的基本原理和方法数据压缩技术的性能指标

(1)压缩比:压缩比例(2)压缩、解压缩速度(3)压缩质量

:感知效果2.2统计编码

统计编码属于无损压缩编码,是根据信源符号出现概率的分布特性而进行的压缩编码。其目的是在信源符号和码字之间建立明确的一一对应关系,以便在恢复时能准确地再现原信号,同时要使平均码长或码率尽量小。

2.2统计编码

相关概念信息:信息是用不确定性的量度定义的。信息量:是指从N个相等可能事件中选出一个事件所需要的信息度量或含量,也就是在辩识N个事件中特定的一个事件的过程中所需要提问“是或否”的最少次数2.2统计编码

相关概念(3)熵:如果将信源所有可能事件的信息量进行平均,就得到了信息熵(entropy)。熵就是平均信息量。2.2统计编码如果用0和1组成的二进制数码为含有n个符号的某条信息编码,假设符号Fn在整条信息中重复出现的概率为Pn,则该符号的熵也即表示该符号所需的位数为:En=-log2(Pn)整条信息的熵,即表示整条信息所需的位数为:E=∑En2.2统计编码例如:对下面这条只出现了a、b、c三个字符的字符串:aabbaccbaa,字符串长度为10,字符a、b、c分别出现了5、3、2次,则a、b、c在信息中出现的概率分别为0.5、0.3、0.2,他们的熵分别为:Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322E=Ea*5+Eb*3+Ec*2=14.855位2.2统计编码

最佳编码定理在变字长码中,对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码,如果码字长度严格按照符号概率的大小的相反顺序排列,则平均码字长度一定小于按任何其它符号顺序排列方式得到的码字长度。2.2统计编码Huffman编码步骤:(1)概率统计,得到n个不同概率的信息符号;(2)将n个信源信息符号的n个概率,按概率大小排序;(3)将n个概率中,最后两个小概率相加,这时概率个数减为n-1个;(4)将n-1个概率,按大小重新排序;(5)重复(3),将新排序后的最后两个小概率相加,相加和与其余概率再排序;(6)如此反复重复n-2次,得到只剩两个概率序列;(7)以二进制码元(0,1)赋值,构成哈夫曼码字,编码结束。010.39010.35010.611000.261010.11a1a2a3a4a5a6a70.200.190.180.170.150.100.01101100000101001100111信源符号概率Huffman码编码过程Huffman编码过程x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.200.200.400.350.250.600.40信源符号概率编码过程第一步第二步第五步第四步第三步输入输入Huffman编码步骤图4.8Huffman码字的构成x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.200.200.400.350.250.600.40第一步第二步第五步第四步第三步码长输入哈夫曼码2233344001001001111011101111

0010010011110111

001011010011

00011011

1000101

x1x2x3x4x5x6x70.350.200.150.100.100.060.04码长哈夫曼码2233344001001001111011101111

信源符号概率编码过程010.25010.60010.4001010.20010.10码字的平均码长N按下式计算:Pj:信源符号Xj出现的概率Lj:编码长度0.350.200.150.100.100.060.04码长2233344001001001111011101111

概率哈夫曼码2.2统计编码行程编码行程编码的基本原理是:用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”),使符号长度少于原始数据的长度。

例如:5555557777733322221111111,其行程编码为:(5,6)(7,5)(3,3)(2,4)(l,7)。

2.2统计编码算术编码算术编码从全序列出发,采用递推形式的连续编码。它不是将单个信源符号映射成一个码字,而是将整个输入符号序列映射为实数轴上的[0,1]区间内的一个间隔,其长度就等于该序列的概率,并在该间隔内选择一个代表性的二进制小数,作为实际的编码输出,使其平均码长逼近信源的熵,从而达到高效编码的目的

2.2统计编码LZW编码LZW压缩技术把数据流中复杂的数据用简单的代码来表示,并把代码和数据的对应关系建立一个转换表,又叫“字符串表”。转换表是在压缩或解压缩过程中动态生成的表,该表只在进行压缩或解压缩过程中需要,一旦压缩和解压缩结束,该表将不再起任何作用。2.3图像压缩编码及标准

图像压缩的基本方法预测编码预测编码是根据某一模型利用以往的样本值对于新样本进行预测,然后将样本的实际值与预测值相减得到一个误差值,对这一误差值进行编码。DPCM它是利用图像信号的相关性找出可反映信号变化特性的一个差值编码。是对模拟信号幅度抽样的差值进行量化编码的调制方式。这种方式是用已经过去的抽样值来预测当前的抽样值,对它们的差值进行编码。差值编码可以提高编码频率,这种技术已应用于模拟信号的数字通信之中。ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。优点:算法复杂度低,压缩比大、编解码延时最短缺点:还原质量一般2.3图像压缩编码及标准

图像压缩的基本方法变换编码变换编码不是直接对原图像信号压缩编码,而是首先将图像信号进行某种函数变换,从一种信号映射到另一个域中,产生一组变换系数,然后对这些系数量化、编码、传输。在空间上具有强相关性的信号,反映在频域上是某些特定的区域内能量常常被集中在一起,或是变换系数矩阵的分布具有规律性。可利用这些规律,在不同的频域上分配不同的量化比特数,从而达到压缩数据的目的。离散余弦变化压缩离散傅里叶变换需要进行复数运算,尽管有FFT可以提高运算速度,但在图像编码、特别是在实时处理中非常不便。离散傅里叶变换在实际的图像通信系统中很少使用,但它具有理论的指导意义。根据离散傅里叶变换的性质,使偶函数的傅里叶变换只含实的余弦项,因此构造了一种实数域的变换——离散余弦变换(DCT)。通过研究发现,DCT除了具有一般的正交变换性质外,其变换阵的基向量很近似于Toeplitz矩阵的特征向量,后者体现了人类的语言、图像信号的相关特性。因此,在对语音、图像信号变换的确定的变换矩阵正交变换中,DCT变换被认为是一种准最佳变换。在近年颁布的一系列视频压缩编码的国际标准建议中,都把DCT作为其中的一个基本处理模块。K-L变换以矢量信号X的协方差矩阵Ф的归一化正交特征矢量q所构成的正交矩阵Q,来对该矢量信号X做正交变换Y=QX,则称此变换为K-L变换(K-LT或KLT),K-LT是Karhunen-LoèveTransform的简称,在模式识别和图像处理中一个主要的问题就是降维,在实际模式识别问题中,我们选择的特征经常彼此相关,在识别这些特征时,数量很多,大部分都是无用的。如果我们能减少特征的数量,即减少特征空间的维数,那么我们将以更少的存储和计算复杂度获得更高的准确性。

KL变换是一种常用的特征提取方法,在消除模式特征之间的相关性、突出差异性方面有最优的效果。小波变换小波变换是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的“时间-频率”窗口,是进行信号时频分析和处理的理想工具。它的主要特点是通过变换能够充分突出问题某些方面的特征,能对时间(空间)频率的局部化分析,通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,图像压缩的基本方法分形编码分形图像编码是目前较有发展前途的图像编码方法之一,也是目前研究较为广泛的编码方法之一。对其研究已有近十年的历史,其间,人们发现了它所具有的许多优点:比如,它突破以往熵压缩编码的界限,在编码过程中,采用了类似描述的方法,而解码是通过迭代完成的,且具有分辨率无关的解码特性等。分形图像编码的思想最早由Barnsley和Sloan引入,将原始图像表示为图像空间中一系列压缩映射的吸引子。在此基础上,Jacquin设计了第一个实用的基于方块分割的分形图像编码器,他首先将原始图像分割为值域子块和定义域子块,对于每一个值域子块,寻找一个定义域子块和仿射变换(包括几何变换、对比度放缩和亮度平移),使变换后的定义域子块最佳逼近值域子块。随后Fisher等提出了四象限树编码方案,采用有效的分类技术,极大的提高了编码性能。随着几十种新算法和改进方案的问世,分形图像编码目前已形成了三个主要发展方向:加快分形的编解码速

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论