多媒体数据压缩编码技术_第1页
多媒体数据压缩编码技术_第2页
多媒体数据压缩编码技术_第3页
多媒体数据压缩编码技术_第4页
多媒体数据压缩编码技术_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多媒体数据压缩编码技术 概述: 本章主要讲述了图像和视频图像的处理技术。 大致可分为四个部分: 1、数据压缩编码的重要性和可能性; 2、数据压缩方法的介绍 3、静态图像压缩编码的国际标准(JPEG); 4、运动图像压缩编码的国际标准(MPEG)。 本章为本书的重点之一本章为本书的重点之一 多媒体数据压缩编码技术 本章要重点掌握的知识点: 多媒体数据压缩的必要性和可能性,数 据压缩方法分类,常用的压缩编码和算 法(统计编码、预测编码、变换编码) 数据压缩编码的国际标准JPEG、MPEG 等。 哈夫曼编码、 JPEG 多媒体数据压缩编码技术 (1) 为什么要进行数据压缩 多媒体信息多媒体信息包括了

2、文本、数据、声音、动画、图形、 图像以及视频等多种媒体信息。虽然经过数字化处理 后其数据量是非常大的,如果不进行数据压缩处理,数据量是非常大的,如果不进行数据压缩处理, 计算机系统就无法对它进行存储和交换。计算机系统就无法对它进行存储和交换。另一个原因 是图像、音频和视频这些媒体具有很大的压缩潜力。媒体具有很大的压缩潜力。 因为在多媒体数据中,存在着空间冗余、时间冗余、 结构冗余、知识冗余、视觉冗余、图像区域的相同性 冗余、纹理的统计冗余等。它们为数据压缩技术的应 用提供了可能的条件。因此在多媒体系统中必须采用 数据压缩技术,它是多媒体技术中一项十分关键的技 术。 多媒体数据压缩编码技术 数据

3、压缩方法的分类数据压缩方法的分类 (1)根据质量有无损失可分为有损失编)根据质量有无损失可分为有损失编 码和无损失编码。码和无损失编码。 (2)按照其作用域在空间域或频率域上分)按照其作用域在空间域或频率域上分 为:空间方法、变换方法和混合方法。为:空间方法、变换方法和混合方法。 (3)根据是否自适应分为自适应性编码和)根据是否自适应分为自适应性编码和 非适应性编码。非适应性编码。 多媒体数据压缩编码技术 数据压缩方法的分类数据压缩方法的分类 依据压缩算法分类:依据压缩算法分类: (1)脉冲编码调制)脉冲编码调制 (2)预测编码)预测编码 (3)变换编码)变换编码 (4)统计编码)统计编码 (

4、5)混合编码)混合编码 多媒体数据压缩编码技术 (1)脉冲编码调制)脉冲编码调制 脉冲编码调制实际上是连续模拟信号的 数字采样表示。脉冲编码调制(PCM) 编码器和解码器位于一个图像编码系统 的起点和终点。下面几种编码方法都是 在多媒体数据模拟信号经过PCM编码后 再进行的压缩编码方法。 多媒体数据压缩编码技术 (2)预测编码)预测编码 编码器记录与传输的不是样本的真实值, 而是它与预测值的差。这一方法称为差 值脉冲编码调制(DPCM)方法。 多媒体数据压缩编码技术 (3)变换编码)变换编码 变换编码的主要思想是利用图像块像素值之间变换编码的主要思想是利用图像块像素值之间 的相关性,把图像变换

5、到一组新的基上,使得的相关性,把图像变换到一组新的基上,使得 能量集中到少数几个变换系数上,通过存储这能量集中到少数几个变换系数上,通过存储这 些系数而达到压缩的目的。些系数而达到压缩的目的。 在变换编码中,由于对整幅图像进行变换的计在变换编码中,由于对整幅图像进行变换的计 算量太大,所以一般把原始图像分成许多个矩算量太大,所以一般把原始图像分成许多个矩 形区域子图像独立进行变换。形区域子图像独立进行变换。 常用的有离散余弦变换(DCT) 多媒体数据压缩编码技术 (4)统计编码)统计编码 最常用的统计编码是最常用的统计编码是Huffman编码。它编码。它 对于出现频率大的符号用较少的位数来对于

6、出现频率大的符号用较少的位数来 表示,而对出现频率较小的符号用较多表示,而对出现频率较小的符号用较多 的位数来表示。其编码效率主要取决于的位数来表示。其编码效率主要取决于 需编码的符号出现的概率分布,越集中需编码的符号出现的概率分布,越集中 则压缩比越高。则压缩比越高。 另外还有算术编码、游程编码。另外还有算术编码、游程编码。 多媒体数据压缩编码技术 (5)混合编码)混合编码 混合编码是指合并变换和预测技术的编 码,通常有两种编码形式。 多媒体数据压缩编码技术 量化的基本原理 量化的作用是在图像质量或声音质量达 到一定保真度的前提下,舍弃那些对视 觉或听觉影响不大的信息。量化的过程 是模拟信号

7、到数字信号的映射。模拟量 是连续量,而数字量是离散量,因此量 化操作实质上是用有限的离散量代替无 限的连续模拟量的多对一的映射操作。 多媒体数据压缩编码技术 量化的基本原理 量化概念主要来自于从模拟量到数字量的转换, 即A/D转换,也就是通过采样把连续的模拟量 离散化。量化过程预先设置一组判决电平和一 组重建电平,各个判决电平覆盖一定的区间, 所有判决电平将覆盖整个有效取值区间。量化 时将模拟量的取样值同这些电平比较,若采样 值幅度落在覆盖区间之上,则取这个量化级的 代表值,称为码字。一个量化器只能取有限多 个量化级,因此量化过程不可避免地存在量化 误差。 多媒体数据压缩编码技术 量化器的设计

8、要求量化器的设计要求 通常设计量化器有下述两种情况:通常设计量化器有下述两种情况: (1)给定量化分层级数,满足量化误差)给定量化分层级数,满足量化误差 最小。最小。 (2)限定量化误差,确定分层级数,满)限定量化误差,确定分层级数,满 足以尽量小的平均比特数,表示量化输足以尽量小的平均比特数,表示量化输 出。出。 多媒体数据压缩编码技术 信息、信息量、信息熵信息、信息量、信息熵 (1)信息:)信息: 信息是用不确定性的量度定义的。信息是用不确定性的量度定义的。 一个消息的可能性愈小,其信息愈多;一个消息的可能性愈小,其信息愈多; 而消息的可能性愈大,则其信息愈少。而消息的可能性愈大,则其信息

9、愈少。 多媒体数据压缩编码技术 信息、信息量、信息熵信息、信息量、信息熵 (2)信息量:)信息量: 所谓信息量是指从所谓信息量是指从N个相等可能事个相等可能事 件中选出一个事件所需要的信息度量或件中选出一个事件所需要的信息度量或 含量,也就是在辩识含量,也就是在辩识N个事件中特定的一个事件中特定的一 个事件的过程中所需要提问个事件的过程中所需要提问“是或否是或否” 的最少次数的最少次数 多媒体数据压缩编码技术 信息、信息量、信息熵信息、信息量、信息熵 (3)熵:)熵: 如果将信源所有可能事件的信息如果将信源所有可能事件的信息 量进行平均,就得到了信息熵量进行平均,就得到了信息熵(entropy

10、)。 熵就是平均信息量。熵就是平均信息量。 多媒体数据压缩编码技术 最佳编码定理最佳编码定理 在变字长码中,对于出现概率大的信息在变字长码中,对于出现概率大的信息 符号编以短字长的码,对于出现概率小符号编以短字长的码,对于出现概率小 的信息符号编以长字长的码,如果码字的信息符号编以长字长的码,如果码字 长度严格按照符号概率的大小的相反顺长度严格按照符号概率的大小的相反顺 序排列,则平均码字长度一定小于按任序排列,则平均码字长度一定小于按任 何其它符号顺序排列方式得到的码字长何其它符号顺序排列方式得到的码字长 度。度。 多媒体数据压缩编码技术 Huffman 编码编码 Huffman 编码的步骤

11、:编码的步骤: (1)概率统计,得到)概率统计,得到n个不同概率的信息符号;个不同概率的信息符号; (2)将)将n个信源信息符号的个信源信息符号的n个概率,按概率大小排序;个概率,按概率大小排序; (3)将)将n个概率中,最后两个小概率相加,这时概率个个概率中,最后两个小概率相加,这时概率个 数减为数减为n-1个;个; (4)将)将n-1个概率,按大小重新排序;个概率,按大小重新排序; (5)重复()重复(3),将新排序后的最后两个小概率相加,),将新排序后的最后两个小概率相加, 相加和与其余概率再排序;相加和与其余概率再排序; (6)如此反复重复)如此反复重复n-2次,得到只剩两个概率序列;

12、次,得到只剩两个概率序列; (7)以二进制码元()以二进制码元(0,1)赋值,构成哈夫曼码字,编)赋值,构成哈夫曼码字,编 码结束。码结束。 多媒体数据压缩编码技术 0 1 0.39 0 1 0.35 0 1 0.61 1 0 0 0.26 1 0 1 0.11 a1 a2 a3 a4 a5 a6 a7 0.20 0.19 0.18 0.17 0.15 0.10 0.01 10 11 000 001 010 0110 0111 信源符号信源符号概率概率HuffmanHuffman码码编码过程编码过程 HuffmanHuffman编码过程编码过程 多媒体数据压缩编码技术 x1 x2 x3 x4

13、x5 x6 x7 0.35 0.20 0.15 0.10 0.10 0.06 0.04 0.35 0.20 0.15 0.10 0.10 0.10 0.35 0.20 0.20 0.15 0.10 0.35 0.25 0.20 0.20 0.40 0.35 0.25 0.60 0.40 信源符号信源符号 概率概率 编码过程编码过程 第一步第一步第二步第二步第五步第五步第四步第四步第三步第三步 输入输入输入输入 HuffmanHuffman编码步骤编码步骤 多媒体数据压缩编码技术 图图4.8 Huffman4.8 Huffman码字的构成码字的构成 x1 x2 x3 x4 x5 x6 x7 0.

14、35 0.20 0.15 0.10 0.10 0.06 0.04 0.35 0.20 0.15 0.10 0.10 0.10 0.35 0.20 0.20 0.15 0.10 0.35 0.25 0.20 0.20 0.40 0.35 0.25 0.60 0.40 第一步第一步第二步第二步第五步第五步第四步第四步第三步第三步码长码长 输入输入 哈夫曼码哈夫曼码 2 2 3 3 3 4 4 00 10 010 011 110 00 10 010 011 110 111 00 10 11 010 011 00 01 10 11 1 00 01 0 1 多媒体数据压缩编码技术 x1 x2 x3 x4

15、 x5 x6 x7 0.35 0.20 0.15 0.10 0.10 0.06 0.04 码长码长哈夫曼码哈夫曼码 2 2 3 3 3 4 4 00 10 010 011 110 信源符号信源符号概率概率编码过程编码过程 0 1 0.25 0 1 0.60 0 1 0.40 0 1 0 1 0.20 0 1 0.10 多媒体数据压缩编码技术 pelbits LPLPN j j jj n j j /55. 2 4)04. 006. 0( 3)10. 010. 015. 0(2)20. 035. 0( )( 7 11 码字的平均码长码字的平均码长N按下式计算:按下式计算: Pj:信源符号:信源符号

16、Xj出现的概率出现的概率 Lj:编码长度:编码长度 0.35 0.20 0.15 0.10 0.10 0.06 0.04 码长码长 2 2 3 3 3 4 4 00 10 010 011 110 概率概率哈夫曼码哈夫曼码 多媒体数据压缩编码技术 pelbits xPxP xPxPH j j j j n j j /13. 2 04. 0log04. 006. 0log06. 02)10. 0log10. 0( 15. 0log15. 020. 0log20. 035. 0log35. 0 )(log)( )(log)( 222 222 2 7 1 1 2 熵:熵: 对数的换底公式:对数的换底公式

17、: 8 .0.30102999 5.2.40823996 2log 256log log log log log 256 2 a b b a 多媒体数据压缩编码技术 预测编码概念(预测编码概念(P114) 预测编码是根据某一模型利用以往的样预测编码是根据某一模型利用以往的样 本值对于新样本进行预测,然后将样本本值对于新样本进行预测,然后将样本 的实际值与预测值相减得到一个误差值,的实际值与预测值相减得到一个误差值, 对这一误差值进行编码。对这一误差值进行编码。 多媒体数据压缩编码技术 帧间预测编码(帧间预测编码(P119) 帧间预测编码技术的对象是序列图象。帧间预测编码技术的对象是序列图象。

18、随着大规模集成电路技术的发展,已有随着大规模集成电路技术的发展,已有 可能把几帧的图象存起来作实时处理,可能把几帧的图象存起来作实时处理, 利用帧间的时间相关性进一步消除图象利用帧间的时间相关性进一步消除图象 信号的冗余度,提高压缩比。帧间编码信号的冗余度,提高压缩比。帧间编码 的技术基础是预测技术。的技术基础是预测技术。 多媒体数据压缩编码技术 JPEG标准(标准(P135) JPEG算法被确定为算法被确定为JPEG国际标准,它是国际国际标准,它是国际 上彩色、灰度、静止图像的第一个国际标准。上彩色、灰度、静止图像的第一个国际标准。 JPEG标准是一个适合范围广泛的通用标准。标准是一个适合范

19、围广泛的通用标准。 它不仅适于静图像的压缩,电视图像序列的帧它不仅适于静图像的压缩,电视图像序列的帧 内图像的压缩编码也常采用内图像的压缩编码也常采用JPEG压缩标准。压缩标准。 JPEG的目的是为了给出一个适用于连续色调的目的是为了给出一个适用于连续色调 图象的压缩算法。图象的压缩算法。 多媒体数据压缩编码技术 JPEG算法具有四种操作方式(算法具有四种操作方式(P135) (1)顺序编码;)顺序编码; (2)累进编码;)累进编码; (3)无失真编码;)无失真编码; (4)分层编码。)分层编码。 多媒体数据压缩编码技术 运动图像压缩编码标准MPEG MPEGMPEG标准是针对全活动视频的压缩

20、标准。标准是针对全活动视频的压缩标准。 该标准包括:该标准包括:MPEGMPEG系统、系统、MPEGMPEG视频、视频、MPEGMPEG 音频、音频、MPEGMPEG测试和验证四大部分。测试和验证四大部分。 (P159)(P159) 多媒体数据压缩编码技术 MPEG将图像分成三种类型(将图像分成三种类型(P152) I图像(图像(Intra Picture 帧内图)帧内图) P图像(图像(Predicted Picture预测图)预测图) B图像(图像(Bidirectional Picture双向预测双向预测 图)。图)。 多媒体数据压缩编码技术 MPEG视频压缩技术(视频压缩技术(P152

21、) MPEG视频压缩技术是针对运动图象的视频压缩技术是针对运动图象的 数据压缩技术。为了提高压缩比,帧内数据压缩技术。为了提高压缩比,帧内 图象数据压缩和帧间图象数据压缩技术图象数据压缩和帧间图象数据压缩技术 必须同时使用。必须同时使用。 多媒体数据压缩编码技术 第四章第四章 习题解答习题解答 在在MPEGMPEG中为了提高数据压缩比,采用了哪些中为了提高数据压缩比,采用了哪些 方法:方法: (A A)运动补偿与运行估计)运动补偿与运行估计 (B B)减少时域冗余与空间冗余)减少时域冗余与空间冗余 (C C)帧内图象数据与帧间图象数据压缩)帧内图象数据与帧间图象数据压缩 (D D)向前预测与向

22、后预测)向前预测与向后预测 多媒体数据压缩编码技术 第四章第四章 习题解答习题解答 在在JPEGJPEG中使用了哪两种熵编码方法:中使用了哪两种熵编码方法: (A A)统计编码和算术编码)统计编码和算术编码 (B B)PCMPCM编码和编码和DPCMDPCM编码编码 (C C)预测编码和变换编码)预测编码和变换编码 (D D)哈夫曼编码和自适应二进制算术编码)哈夫曼编码和自适应二进制算术编码 多媒体数据压缩编码技术 第四章第四章 习题解答习题解答 简述MPEG和JPEG的主要差别。 答:MPEG视频压缩技术是针对运动图象的数据压缩技术。 为了提高压缩比,帧内图象数据和帧间图象数据压缩技术必 须同时使用。 MPEG通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论