版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多媒体数据压缩技术已成为当今数字通信、广播、存储和多媒体娱乐中的一项关键的共性技术。
4.1多媒体数据压缩概述
4.2数据压缩的技术基础
4.3常用的无损数据压缩方法
4.4常用的有损数据压缩方法
4.5数据压缩国际标准4.1多媒体数据压缩概述4.1.1多媒体数据压缩的必要性⑴原始采样的媒体数据量巨大⑵有效利用存储器存储容量⑶提高通信线路的传输效率⑷消除计算机系统处理视频I/O瓶颈4.1.2多媒体数据压缩的可能性常见的图像数据冗余种类:⑴空间冗余:静态图像中存在的最主要的一种数据冗余。⑵时间冗余:运动图像中经常包含的冗余。⑶结构冗余:在某些场景中,存在着明显的图像分布模式,称作结构。图像中重复出现或相近的纹理结构,结构可以通过特定的过程来生成。⑷知识冗余:这类规律性的结构可以由经验知识和背景知识得到。⑸视觉冗余:人眼对亮度变化敏感,对色度的变化相对不敏感;在高亮度区,人眼对亮度变化敏感度下降;对物体边缘敏感,内部区域相对不敏感;对整体结构敏感,而对内部细节相对不敏感。⑹图像区域的相同性冗余:图像中的两个或者多个区域所对应的所有像素值相同或者相近,从而产生数据重复性存储。⑺纹理的统计冗余:有些图像纹理尽管不严格服从某个分布规律,但是在统计意义上服从这种规律。利用这种性质可以减少表示图像的数据量,所以被称为纹理的统计冗余。4.1.3多媒体数据压缩的原理1.图像压缩系统的组成由三部分组成:变换器、量化器和编码器。2.图像压缩说明视频压缩与语音相比,语音的数据量较小,且基本压缩方法已经成熟,目前的数据压缩研究主要集中于图像和视频信号的压缩方面。压缩处理过程有两个过程,编码过程是将原始数据经过编码进行压缩,以便存储与传输;解码过程是对编码数据进行解码,还原为可以使用的数据。3.与压缩相关的指标衡量一种数据压缩技术的好坏有四个重要的指标:⑴压缩比大:即压缩前后所需要的信息存储量之比要大。⑵算法简单:实现压缩的算法简单,压缩、解压速度快,尽可能地做到实时压缩解压。⑶恢复效果好:恢复效果好,要尽可能地恢复原始数据。⑷压缩能否用硬件实现。4.1.4数据压缩方法的分类⑴冗余压缩法也称无损压缩法,是指使用压缩后的数据可以解压缩,且解压之后的数据与原来的数据完全相同。它利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到数据统计冗余度的理论限制,一般为2:1到5:1。⑵熵压缩法也称有损压缩法,有失真压缩,是指使用压缩后的数据进行解压缩,解压之后的数据与原来的数据有所不同,但不会让人对原始资料表达的信息造成误解。⑶熵压缩法与冗余压缩法的比较在图像压缩系统组成中,变换和编码是无损耗的,而量化是有损耗的。无损压缩方法仅利用了统计冗余,而没有利用量化器。有损压缩方法既利用了统计冗余又采用了量化器,利用了心理视觉冗余。根据压缩方法的原理,可将其具体划分为以下几种:⑴量化与向量量化编码⑵预测编码⑶变换编码⑷信息熵编码⑸混合编码4.2数据压缩的技术基础4.2.1熵的概念表示一条信息中真正需要编码的信息量,即数据压缩的理论极限。对于任何一种无损数据压缩,最终的数据量一定大于信息熵,数据量越接近于熵值,说明其压缩效果越好。信息熵如何计算:在计算机内部是用二进制来表示数据的,现在要用0和1组成的二进制数码来为含有n个符号的某条信息编码,假设符号Fn在整条信息中重复出现的概率为Pn,则该符号的熵En也即表示该符号所需的位数为:En=log2(1/Pn)=-log2(Pn)整条信息的熵E也即表示整条信息所需的位数为:E=∑En4.2.2数据压缩模型——主要有:静态统计模型:预先扫描文件中的所有字符,统计出每个字符出现的概率。自适应模型;在信息被输入之前对信息内容一无所知并假定每个字符的出现概率均等,随着字符不断被输入和编码,统计并纪录已经出现过的字符的概率并将这些概率应用于对后续字符的编码。字典模型:4.2.3数据压缩编码压缩=模型+编码4.3常用的无损数据压缩方法4.3.1香农-范诺与哈夫曼编码1.香农-范诺编码——算法步骤:⑴将待编码的符号按符号出现概率从大到小进行排序。⑵将排好序的符号分成两组,使这两组符号概率和相等或尽可能的相近。⑶将第一组赋值为0,第二组赋值为1。⑷对每一组,只要不是一个符号,就重复步骤2的操作,否则操作完毕。例4-1有一串由6个字母组成的长度为50的字符串,字母分别A、B、C、D、E和F,其中A出现3次,B出现5次,C出现15次,D出现11次,E出现12次,F出现4次,请使用香农-范诺对其进行编码。解题步骤:⑴使用下表列出字母在字符串中的概率统计⑵首先对符号按出现次数的多少进行排序,得下表所示。⑶然后对符号进行分组,将其分为概率和最接近的两组即为(C、E)和(D、B、F、A),其中(C、E)赋值为0,(D、B、F、A)赋值为1,依次递归下去。使用二叉树左支为0,右支为1来进行编码,其最终实现如图所示。⑷使用香农-范诺编码算法得到的编码表,如下表所示。⑸总共需要4×3+3×5+2×15+2×11+2×12+4×4=119位,而如果用ASCII来进行表示的话,至少要用到50×8=400位;如果用等长码3位二进制来表示六个字母的话,这样需用到50×3=150位,从这两方面都实现数据压缩。⑹再来看一看压缩效果如何,这时就需来计算数据压缩的极限—熵的值:2.Huffman编码——算法步骤:⑴初始化,根据符号出现的次数按由大到小顺序对符号进行排序。⑵把概率最小的两个符号组成一个节点,节点为两符号次数之和,去掉已取出的两个节点,加入这两节点之和,重新排序,直至只有一个数据且该数据的值所有符号出现的总次数相同为止,跳向(4)步骤。⑶重复步骤2,得到新节点,形成一棵“树”。⑷从根节点开始到相应于每个符号的“树叶”,从上到下标上“0”或“1”。通常左支标为0,右支标为1。⑸从根节点开始顺着树枝到每个叶子分别写出每个符号的代码。例4-2就上面关于Shannon-Fano编码的例子,现对其使用Huffman进行编码。解题步骤:⑴首先按照符号出现的概率有大到小排序,如表下所示。⑵然后选择其中最小的两个符号,组成一个节点,如图所示。⑶去掉刚才的两个符号,加入它们的和,重新排序如下表所示。⑷继续选择其中最小的两个符号,组成一个新节点,如图所示。⑸依次类推,进行递归,排序如下表所示。生成的二叉树如图所示。⑹依次类推,进行递归,排序如下表所示。生成的二叉树如图所示。⑺依次类推,进行递归,排序如下表所示。生成的二叉树如图所示。⑻对其进行编码,左为0,右为1,如图所示。⑼使用Huffman编码算法得到的编码表,如下表所示。⑽总共需要4×3+3×5+2×15+2×11+2×12+4×4=119位,与香农-范诺编码算法得到的最后数据相同,也同样实现了压缩,但通常情况下哈夫曼编码比香农-范诺编码的效率要高一些。3.香农-范诺编码和huffman编码⑴平均码长>=熵,但都是接近熵,而且越接近熵,说明压缩效率越高。⑵保证解码的唯一性,短字码不构成长字码的前缀。⑶在接收端需要一个与发送端相同的代码表。4.3.2算术编码算术编码的基本原理是将编码的消息表示成实数0和1之间的一个间隔,取间隔中的一个数来进行表示消息,消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。1.自适应统计模型的算术编码与解码例7-3假设某条信息中可能出现的字符只有a、b、c三种,要压缩保存的信息为abba。解题步骤:2.静态统计模型的算术编码与解码例4-4:假设信源符号为{a,b,c,d},这些符号的概率分别为{0.1,0.4,0.2,0.3},根据这些概率可把间隔[0,1]分成4个子间隔:[0,0.1],[0.1,0.5],[0.5,0.7],[0.7,1],其中[x,y]表示半开放间隔,即包含x不包含y。上面的信息表示在下表中统计了每个符号的概率和初始编码间隔。如果二进制消息序列的输入为:cadacdb。编码时首先输入的符号是c,找到它的编码范围是[0.5,0.7]。由于消息中第二个符号a的编码范围是[0,0.1],因此它的间隔就取[0.5,0.7]的第一个十分之一作为新间隔[0.5,0.52]。依此类推,编码第3个符号d时取新间隔为[0.514,0.52],…。消息的编码输出可以是最后一个间隔中的任意数。整个编码过程如图所示。这个例子的编码过程表示在下表中。这个例子的译码过程表示在下表中。3.算术编码的特点算术编码的模式选择直接影响编码效率,有固定模式,也有自适应模式。算术编码的自适应模式无需先定义概率模型,对无法进行概率统计的信源合适,在这点上优越于哈夫曼编码。在信源符号概率接近时,算术编码比哈夫曼编码效率高。算术编码的硬件实现比哈夫曼编码要复杂些。算术编码在JPEG的扩展系统中被推荐代替哈夫曼编码。4.在算术编码中有几个问题需要注意由于实际的计算机精度不可能无限长,运算中出现溢出是一个明显的问题,可使用比例缩放方法解决。
算术编码器对整个消息只产生一个码字,这个码字是在间隔[0,1]中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。4.3.3行程RLE编码行程编码是一种统计编码,该编码属于无损压缩编码。对于二值图有效。它的基本原理是:用一个符号值或串长代替具有相同值的连续符号,使符号长度少于原始数据的长度。行程编码可以分为定长和变长行程编码两种方式。行程编码一般不直接用于多灰度图像(彩色图像)中,比较适用于二值图像的编码,如传真图像的编码。4.3.4词典编码LZW是词典编码的一种。基本原理是首先建立一个字符串表,把每一个第一次出现的字符串放入串表中,并用一个数字来表示,这个数字与此字符串在串表中的位置有关,将这个数字存入压缩文件中,如果这个字符串再次出现时,即可用表示它的数字来代替,并将这个数字存入文件中。压缩完成后将串表丢弃。4.4常用的有损数据压缩方法4.4.1预测编码预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差(预测误差)进行编码。1.脉冲编码调制PCM均匀量化:采用相等的量化间隔处理采样得到的信号值。非均匀量化:对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数来表示。2.差分脉冲编码调制DPCM不对每一样值都进行量化,而是预测下一样值,并量化实际值与预测值之间的差值进行压缩的方法。优点是算法简单,容易硬件实现,缺点是对信道噪声很敏感,会产生误差扩散。3.自适应脉冲编码调制ADPCM核心想法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值,②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。4.4.2变换编码一种间接编码方法,它将原始信号经过数学上的正交变换后,得到一系列的变换系数,再对这些系数进行量化、编码、传输。变换编码原理框图变换编码系统方框图变换编、解码过程示意图变换编码技术技术上比较成熟,理论也比较完备,广泛用于各种图像数据压缩,诸如单色图像、彩色图像、运动图像、静止图像以及多媒体计算机技术中的电视帧内图像压缩和帧间图像压缩等。正交变换的种类有很多种,例如傅立叶变换、沃尔什哈达玛变换、正弦变换、余弦变换以及K-L变换等。4.5数据压缩国际标准4.5.1JPEG-静止图像压缩标准一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。它包括Huffman编码的无损压缩算法和基于DPCM(差分脉冲编码调制)、DCT(离散余弦变换)的有损压缩算法两个部分。JPEG标准有三个范畴:⑴基本顺序过程:实现有损图像压缩,重建图像质量达到人眼难以观察出来的要求。⑵基于DCT的扩展过程:基于DCT的扩展过程使用累进工作方式,采用自适应算术编码过程。⑶无失真过程:采用预测编码及Huffman编码(或算术编码),可保证重建图像数据与原始图像数据完全相同。JPEG算法操作可分成以下几个步骤:⑴通过离散余弦变换(DCT)去除数据冗余;⑵使用量化表对以DCT系数进行量化;⑶对量化后的DCT系数进行编码使其熵达到最小,熵编码采用Huffman可变字长编码。⑷熵编码⑸组成位数据流
4.5.2一个JPEG的例子原始图图像分块、计算DCT系数以及系数量化系数编码4.5.3MPEG-运动图像压缩标准1.MPEG的标准化MPEG-1、2、4标准已经正式发布,MPEG-7也已完成,在2001年底成为正式标准,MPEG-21在2002年形成。其中MPEG-1和2已经得到广泛应用。例如,CD-交互系统,在网络上的数字声音广播、数字电视广播和视频点播等。2.MPEG压缩算法思想MPEG标准有三个组成部分:MPEG视频;MPEG音频;视频与音频的同步。MPEG视频是MPEG标准的核心。MPEG视频压缩算法中包含两种基本技术:一种是基于l6×16子块的运动补偿技术,用来减少帧序列的时域冗余;另一种是基于DCT
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国石油大学(北京)《网络及信息安全技术》2023-2024学年第一学期期末试卷
- 长春光华学院《数据仓库理论与实践实验》2023-2024学年第一学期期末试卷
- 食品加工机械卫生级润滑产品
- 餐饮业前瞻与策略模板
- 财务团队商务礼仪模板
- 专业基础知识(给排水)-(给水排水)《专业基础知识》模拟试卷1
- 生物地理学探究模板
- 商务礼仪讲解模板
- 青少年健身指南模板
- 诚信考试-国旗下讲话发言稿
- 老年人的安全保护及预防措施课件
- ICU镇痛镇静治疗知情同意书
- 政治表现及具体事例三条经典优秀范文三篇
- 高考诗歌鉴赏专题复习:题画抒怀诗、干谒言志诗
- 2023年辽宁省交通高等专科学校高职单招(英语)试题库含答案解析
- GB/T 304.3-2002关节轴承配合
- 漆画漆艺 第三章
- CB/T 615-1995船底吸入格栅
- 光伏逆变器一课件
- 货物供应、运输、包装说明方案
- (完整版)英语高频词汇800词
评论
0/150
提交评论