数字媒体压缩技术

上传人：能*** IP属地：广东上传时间：2022-08-27 格式：PPT 页数：61 大小：553.50KB 积分：15 举报 版权申诉

已阅读5页，还剩56页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、数字媒体根底数字媒体紧缩技术教学目的：1了解数字媒体数据紧缩的缘由。2了解数字媒体数据紧缩技术的不同分类。3掌握通用的数据紧缩编码算法。4了解各种数字媒体数据紧缩的规范。学习内容：1 数据紧缩及分类2 通用的数据紧缩技术3 数字媒体紧缩规范1.1 紧缩的能够性与信息冗余经过数字化处置后的图形、图像、视频和音频等媒体信息的数据量非常大，假设不进展数据紧缩，计算机系统就无法对它进展存储、交换和传输。1数字图像2数字视频3数字音频数据量的计算1 数据紧缩及分类1.1 紧缩的能够性与信息冗余数据可以被紧缩的主要缘由在于媒体数据中存在数据的信息冗余。信息量包含在数据之中，普通的数据冗余主要表达在：

2、1空间冗余 2构造冗余 3时间冗余 4视觉冗余 5知识冗余 6信息熵冗余 1 数据紧缩及分类1.2 数据紧缩分类按信息紧缩前后比较能否有损失进展划分：无损紧缩指运用紧缩后的数据进展重构复原或解紧缩，重构后的数据与原来的数据完全一样。常用的无损紧缩算法有霍夫曼(Huffman)算法和LZW算法。也称为可逆编码。有损紧缩指运用紧缩后的数据进展重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息呵斥误解。也称为不可逆编码。按数据紧缩编码的原理和方法进展划分：统计编码：主要针对无记忆信源，根据信息码字出现概率的分布特征而进展紧缩编码，寻觅概率与码字长度间的最优匹配。预测编码：

3、是利用空间中相邻数据的相关性来进展紧缩数据的。变换编码：是将图像时域信号转换为频域信号进展处置。分析合成编码：是指经过对源数据的分析，将其分解成一系列更适宜于表示的“基元或从中提取假设干更为本质意义的参数，编码仅对这些根本单元或特征参数进展。无记忆信源【无记忆信源】1存在一个或多个根本符号集；2将多个根本符号集做笛卡儿积，构成一定长度的结合概率空间；3运用外力的功电动势将单个符号或一定长度的符号序列从随机事件转化成必然事件，或者说，将一个随机系统转化成一个必然系统；并且回退到原始空间中来，该原始空间的概率分布不由于事件的发生而改动。【有记忆信源】1存在一个或多个根本符号集；2将多个根本

4、符号集做笛卡儿积，构成一定长度的结合概率空间；3运用外力的功电动势将单个符号或一定长度的符号序列从随机事件转化成必然事件，或者说，将一个随机系统转化成一个必然系统；不能回退到原始空间中来，即原始空间的概率分布由于事件的发生而改动。按照媒体的类型进展紧缩划分：图像紧缩规范：JPEG等声音紧缩规范：MP3运动图像紧缩规范：MPEG、H.26x系列、AVS目录2 通用的数据紧缩技术行程编码字典编码熵编码等PCMDMDPCM 通用的紧缩方法具有紧缩比低、通用性强等特点无损紧缩技术有损紧缩技术目录2.1 编码的实际根底数据紧缩技术的实际根底是信息论。根据信息论的原理，可以找到最正确数据紧缩编码方法，

5、数据紧缩的实际极限是信息熵。熵是信息量的度量方法，它表示某一事件出现的音讯越多，事件发生的能够性就越小，数学上就是概率越小。信息与信息量信息量是指信源中某种事件的信息度量或含量。一个事件出现的能够性愈小，其信息量愈多，反之亦然。假设pi为第i个事件的概率为0 pi 1，那么该事件的信息量为一个信源包括的一切数据叫数据量，而数据量中包含有冗余信息。信息量 = 数据量-冗余量信息熵信息熵就是将信源一切能够事件的信息量的平均。设从N个数中选定任一个数xj的概率为p(xj)，假定选定恣意一个数的概率都相等，即p(xj) 1/N，那么 I(xj)log2N-log2 1/N -log2p(xj

6、)=Ip(xj) 上式中，p(xj)是信源X发出xj的概率。I(xj)的含义是信源X发出xj这个音讯随机事件后，接纳端收到信息量的量度。信息熵(续)信源X 发出的xj(j=1,2,n)共n 个随机事件的信息量的统计平均，即H(X )=EI(xj )= H(X )称为信源X 的“熵，即信源X发出恣意一个随机变量的平均信息量。其中，等概率事件的熵最大，假设有N个事件，此时熵为： H(X ) 信息熵(续)当P(x1)1时，P(x2)P(x3)P(xj)0，此时熵为 H(X) P(x1) 0由上可得熵的范围为： 0 H(X) 信息熵(续)在编码中用熵值来衡量能否为最正确编码。假设以Lc表示编码器输出

7、码字的平均码长，其计算公式为： Lc j=1,2,n 其中：P(xj ) 是信源X发出xj 的概率，L(xj)为xj的编码长。信息熵(续)平均码长与信息熵之间的关系为：LcH(X) 有冗余，不是最正确。Lc H(X )不能够。Lc H(X )最正确编码 Lc稍大于H(X ) 熵值为平均码长Lc的下限。2.2 霍夫曼编码霍夫曼编码Huffman是运用信息熵原理的一种无损编码方法，这种编码方法根据源数据各信号发生的概率进展编码。在源数据中出现概率大的信号，分配的码字越短；出现概率越小的信号，其码字越长，从而到达用尽能够少的码表示源数据。霍夫曼编码的算法：初始化，根据符号概率的大小顺序对符号进

8、展排序。把概率最小的两个符号组成一个新符号(节点)，即新符号的概率等于这两个符号概率之和。反复第2步，直到构成一个符号为止树，其概率和等于1。分配码字。码字分配从最后一步开场反向进展，即从最后两个概率开场逐渐向前进展编码，对于每次相加的两个概率，给概率大的赋“0，概率小的赋“1也可以全部相反，假设两个概率相等，那么从中任选一个赋“0，另一个赋“1。霍夫曼编码构造出来的编码值不是独一的。对不同信号源的编码效率不同。由于编码长度可变，因此译码时间较长；编码长度的不一致，也使得硬件实现有难度。霍夫曼编码的特点：2.3 行程编码行程编码又称行程长度编码Run Length Encoding，RLE

9、，是一种熵编码。这种编码方法广泛地运用于各种图像格式的数据紧缩处置中。行程编码的原理是在给定的图像数据中寻觅延续反复的数值，然后用两个字符取代这些延续值。即将具有一样值的延续串用其串长和一个代表值来替代，该延续串就称为行程，串长称为行程长度。2.3 行程编码假定一幅灰度图像，第n行的像素值为：用RLE编码方法得到的代码为：4160841140。代码斜黑体表示的数字是行程长度，黑体字后面的数字代表像素的颜色值。行程编码分类：定长编码定长编码是指编码的行程长度所用的二进制位数固定不定长编码变长行程编码是指对不同范围的行程长度运用不同位数的二进制位数进展编码。运用变长行程编码需求添加标志位来阐明

10、所运用的二进制位数。 2.4 词典编码词典编码dictionary encoding技术属于无损紧缩技术，主要是利用数据本身包含许多反复的字符串的特性。可以用一些简单的代号替代这些字符串，就可以实现紧缩，实践上就是利用了信源符号之间的相关性。字符串与代号的对应表就是词典。词典编码的种类：第一种方法的思想是查找目前正在紧缩的字符序列在以前输入的数据中能否出现过，然后用出现过的字符串替代反复的部分，它的输出仅仅是指向早期出现过的字符串“指针。这里所指的词典是指用以前处置过的数据表示编码过程中遇到的反复部分。这类编码的一切算法都是以LZ77算法为根底的。词典编码的种类：第二种算法的思想是从输入的

11、数据中创建一个“短语词典，这类短语不一定有详细的含义，可以是恣意字符的组合。在编码过程中遇到在“短语词典中出现的短语是，编码器就输出这个词典中的短语“索引号，而不是短语本身。2.4.1 LZ77算法LZ77是以以色列计算机专家Abraham Lempel和Jakob Ziv在1977年开发和发表的。此算法的一个改良算法是由Storer和Szymanski在1982年开发的，称为LZSS算法。LZ77 算法在某种意义上又可以称为“滑动窗口紧缩，该算法将一个虚拟的、可以跟随紧缩进程滑动的窗口作为词典，要紧缩的字符串假设在该窗口中出现，那么输出其出现位置和长度。LZ77算法中涉及的概念输入字符流(

12、input stream)：要被紧缩的字符序列。字符(character)：输入数据流中的根本单元。编码位置(coding position)：输入数据流中当前要编码的字符位置，指前向缓冲存储器中的开场字符。前向缓冲存储器(Lookahead buffer)：存放从编码位置到输入数据流终了的字符序列的存储器。窗口(window)：指包含W个字符的窗口，字符是从编码位置开场向后数也就是最后处置的字符数。指针(pointer)：指向窗口中的匹配串且含长度的指针。LZ77算法详细步骤1把编码位置设置到输入数据流的开场位置。2找窗口中最长的匹配串3以“(Pointer, Length) Ch

13、aracters的格式输出，其中Pointer是指向窗口中匹配串的指针，Length表示匹配字符的长度，Characters是前向缓冲存储器中的不匹配的第1个符。 4假设前向缓冲存储器不是空的，那么把编码位置和窗口向前移(Length+1)个字符，然后前往到步骤2。2.4.2 LZW算法LZW紧缩算法是一种新颖的紧缩方法，它采用了一种先进的串表紧缩，将每个第一次出现的串放在一个串表中，用一个数字来表示串，紧缩文件只存贮数字，那么不存贮串，从而使图像文件的紧缩效率得到较大的提高。LZW编码是围绕称为词典的转换表来完成的。LZW算法中的术语和符号前缀(Prefix)：在一个字符之前的字符序列。

14、缀-符串(String)：前缀字符。码字(Code word)：码字流(Codestream)：词典(Dictionary)：缀-符串表。当前前缀(Current prefix)：当前字符(Current character)：当前码字(Current code word)： LZW编码算法执行步骤开场时的词典包含一切能够的根(Root)，而当前前缀P是空的；当前字符(C) ：=字符流中的下一个字符；判别缀-符串P+C能否在词典中1假设“是：P ：= P+C / (用C扩展P) ；2假设“否：把代表当前前缀P的码字输出到码字流；把缀-符串P+C添加到词典；令P ：= C /(如

15、今的P仅包含一个字符C)；判别字符流中能否还有字符要编码1假设“是，就前往到步骤2；2假设“否：把代表当前前缀P的码字输出到码字流；终了。2.5 脉冲编码调制脉冲编码调制 (PCM)就是将模拟调制信号的采样值变换为脉冲码组。 PCM编码包括如下三个过程：采样，将模拟信号转换为时间离散的样本脉冲序列。量化，将离散时间延续幅度的抽样信号转换成为离散时间离散幅度的数字信号。编码，用一定位数的脉冲码组表示量化采样值。PCM系统原理图 PCM编码的优点有很强的抗干扰性能方便的利用计算机编程，实现各种智能化设计。2.6 增量调制DM增量调制也称调制(DM)，它是一种预测编码技术，是PCM编码的一种

16、变形。DM是对实践的采样信号与预测的采样信号之差的极性进展编码，将极性变成“0和“1这两种能够的取值之一。假照实践的采样信号与预测的采样信号之差的极性为“正，那么用“1表示；相反那么用“0表示，或者相反。DM波形编码的原理在开场阶段增量调制器的输出不能坚持跟踪输入信号的快速变化，这种景象就称为增量调制器的“斜率过载。在输入信号缓慢变化部分，即输入信号与预测信号的差值接近零的区域，增量调制器的输出出现随机交变的“0和“1。这种景象称为增量调制器的粒状噪声。 2.7 差分脉冲编码调制差分脉冲编码调制DPCM是利用样本与样本之间存在的信息冗余度来进展编码的一种数据紧缩技术。差值脉冲编码调制是利用

17、信号的相关性找出可以反映信号变化特征的一个差值量进展编码。DPCM的根本任务原理根据过去的样本去估算estimate下一个样本信号的幅度大小，这个值称为预测值，然后对实践信号值与预测值之差进展量化编码，从而就减少了表示每个样本信号的位数。它与脉冲编码调制PCM不同处在于，PCM是直接对采样信号进展量化编码，而DPCM是对实践信号值与预测值之差进展量化编码。DPCM的原理图量化器S(k) +逆量化器预测器d(k)I(k)Se(k-1)8比特PCM样本kPCM样本k-1Se(k-1)dq(k)Sr(k)+-目录3 数字媒体紧缩规范3.1 声音紧缩规范 MP3是MPEG-1的规范草案中音频编码的L

18、ayer 3。 MP3 最大特点是能以较小的比特率、较大紧缩比到达近乎完美的CD音质，制造简单，交流方便。 MP3紧缩编码是一个国际性全开放的编码方案,其编码算法流程大致分为时频映射、心思声学模型、量化编码三大功能模块，这三个功能模块是实现MP3 编码的关键。 MP3编码框图MP4MP4是MPEG-2 AAC(ISO/IEC 18-7)技术(Advanced Audio Coding)。MP4的特点是音质更加完美而紧缩比更大。它添加了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪等MP3没有的特性，使得在音频紧缩后仍能完美的再现CD的音质。 3.2 图像紧缩规范JPEG是国际规范组

19、织(ISO)和国际电工委员会IEC制定出的第一套国际静态图像紧缩规范：ISO/IEC 109181号规范 “多灰度延续颜色静态图像紧缩编码俗称为JPEG，以其优良的性能，该规范不断到当前仍被因特网、数码相机等很多领域广泛运用。JPEG包含两种根本的紧缩算法：无损紧缩算法基于差分脉冲调制和有损紧缩算法基于离散余弦变换。可到达1520的紧缩比。 JPEG算法框图 JPEG算法紧缩编码步骤1运用正向离散余弦变换FDCT把信息从空间域变换成频率域的数据，并利用数据的频率特性进展处置；2运用加权函数对DCT系数进展量化，这个加权函数对于人的视觉系统是最正确的；3运用霍夫曼可变字长熵编码器对量化系数

20、进展编码。JPEG紧缩编码算法的主要计算步骤1正向离散余弦变换(FDCT)。 2量化(quantization)。 3Z字形编码(zigzag scan)。 4运用差分脉冲编码调制DPCM对直流系数DC进展编码。 5运用行程长度编码RLE对交流系数(AC)进展编码。 6熵编码(entropy coding)。JPEG 2000 JPEG 2000 弥补了传统JPEG紧缩技术缺陷，有以下优点：高紧缩率支持无损紧缩和有损紧缩渐进传输对感兴趣区域紧缩 3.3 运动图像紧缩规范1、MPEG规范运动图像专家组MPEG是由国际规范化组织ISO和国际电工委员会IEC结合成立的，担任开发电视图像数据和

21、声音数据的编码、解码和它们的同步规范。这个专家组开发的规范称为MPEG规范。 MPEG-1 规范 MPEG-1 规范于1993年公布，用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。该规范包括五个部分，分别为：系统、电视图像、音频、一致性测试和软件模拟。MPEG-1的数据流包含：图像流、伴音流和系统流三种成分。MPEG-1 译码器方框图图像流包含画面信息，伴音流包含声音信息，系统流实现图像和伴音的同步，一切播放MPEG图像和伴音数据所需的时钟信息都包含在系统流中。 MPEG-2 规范 MPEG-2规范包括了系统、电视图像、音频、一致性测试、软件模拟、数字存储媒体命令和控制

22、扩展协议、先进声音编码、编码器实时接口扩展规范、DSM-CC一致性扩展测试等。MPEG-2的主要特点是：1MPEG-2解码器兼容MPEG-1和MPEG-2规范。2其视频数据速率为3 Mb/s15Mb/s，根本分辨率为720576像素，每秒可播放30帧画面。3可以301或更低的紧缩比提供具有广播级质量的视频图像。4允许在画面质量、存储容量和带宽之间选择，在一定范围内改动紧缩比。MPEG-2的系统模型MPEG-4 规范 MPEG-4规范于1998年11月公布，是各种音频/视频对象的编码，包括了系统、电视图像、音频、一致性测试和参考软件、传输多媒体集成框架等。MPEG-4为多媒体数据紧缩编码提供的是

23、一种格式、一种框架，而不是详细算法，以建立一种更自在的通讯与开发环境。MPEG-4的目的是支持多种多媒体的运用，特别是多媒体信息基于内容的检索和访问，可以根据不同的运用需求现场配置解码器。其编码系统也是开放的，可以随时参与新的有效的算法模块。 MPEG-4 系统表示图MPEG-7 规范MPEG-7规范于2001年公布，称为多媒体内容描画接口，包括系统、描画定义言语、电视图像、音频、多媒体描画框架、参考软件以及一致性测试七个部分。MPEG-7规范的目的是产生一个描画多媒体内容的规范，支持对多媒体信息在不同程度层面上的解释和了解，从而使其可以根据用户的需求进展传送和存取。MPEG-7注重的是提供视听信息内容的描画方案，并不包括针对不同运用的特征提取方法和搜索引擎。MPEG-21 规范 MPEG-21基于两个根本概念：分布和处置根本单元Digital

人人文库> 全部分类> 行业资料 > 信息产业

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

数字媒体压缩技术

文档简介

温馨提示

最新文档

评论

数字媒体压缩技术

文档简介

温馨提示

最新文档

评论

相关文档