多媒体技术 多媒体数据压缩编码技术 全文-大学课件-文档在线_第1页
多媒体技术 多媒体数据压缩编码技术 全文-大学课件-文档在线_第2页
多媒体技术 多媒体数据压缩编码技术 全文-大学课件-文档在线_第3页
多媒体技术 多媒体数据压缩编码技术 全文-大学课件-文档在线_第4页
多媒体技术 多媒体数据压缩编码技术 全文-大学课件-文档在线_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章、多媒体数据压缩编码技术本章要点多媒体数据压缩编码的重要性和分类。量化的基本原理和量化器的设计思想。常用压缩编码算法的基本原理及实现技术、预测编码、变换编码、统计编码(Huffman编码、算术编码)。静态图像压缩编码的国际标准(JPEG)原理、实现技术,以及动态图像压缩编码国际标准(MPRG)的基本原理。4.1

多媒体数据压缩编码的重要性和分类多媒体数据压缩编码的重要性多媒体数据压缩的可能性多媒体数据压缩方法的分类根据多媒体数据的特点,从目前的应用状况来看,数据压缩技术是多媒体技术中最重要的关键技术之一。多媒体技术应用和发展,得益于多媒体数据压缩技术的突破性进展。从如下两方面说明数据压缩的必要性:音频和图像4.1.1数据压缩编码的重要性21世纪的人类社会将是信息化社会,数字化后的信息具有数据海量性。从目前的应用状况来看,数据压缩技术是多媒体技术中最重要的关键技术之一。多媒体技术应用和发展,得益于多媒体数据压缩技术的突破性进展。从如下两方面说明数据压缩的重要性:声音图像(静态图像和动态视频)数据压缩的重要性⑴声音具有CD音乐激光唱盘音质波形声音的典型参数:①采样频率44.1KHz②量化位数:16位③立体声声道数:2④数据量:约0.17MB/秒注:数据量=(采样频率×量化位数×声道数)/8根据上面公式可以计算出以上数据量所需的存取时间:在650MB的光盘中存放时间约1小时。数据压缩的重要性(2)图像①静态图像:一幅中等分辨率的位图图像(640×480,256色),典型参数为:a.图像分辨率:640×480b.图像颜色数:256(=28)c.颜色深度(位):8d.数据量为:约0.3MB注:数据量=(垂直分辨率×水平分辨率×颜色深度)/8对于以上数据量,在1.44MB的软盘中能存放约5幅静态图像。若用速率(2400bps)的电话线传输,一幅静②动态视频:一幅中等分辨率24位真彩色的位图图像(640×480,24位/像素),典型参数为:a.图像分辨率:640×480b.图像颜色数:16,777,216(=224)c.颜色深度(位):24d.数据量为:约0.9MB对于以上数据量,若用NTSC制式(30帧/秒)播放动态视频,需要约27MB/秒的视频传输速度,在

650MB的光盘中存放时间约24秒。综上所述:在不经过数据压缩情况下,CD唱机和CD视频播放机根本无法达到实用目的。目前一张

650MB的CD激光唱盘可以连续播放约2小时的立体声音乐,而一张650MB的CD激光视盘可以连续播放约75分钟的视频电影。说明压缩的余地相当大。同样,传输中也存在同样的困难。网络带宽受限。信息量与数据量的关系I

=

D

-

du■■■I—信息量D—数据量du—冗余量压缩冗余例如1988年Barnsley采用分形(Fractor)的迭代函数系统IFS和递归迭代函数系统RIFS方法,对几幅图像进行压缩编码,获得了高达10000:1的压缩比。以压缩形式存储和传输信息,既节省了空间,又提高了通信干线的传输率,同时也便于计算机实时处理视频和音频,高质量播放视频和音频节目成为可能。冗余举例冗余在平时说话时是大量存在的。中文广播员一分钟读180个汉字,一个汉字两个字节,

360个Byte

采样1分钟,8K

60=480

K

Byte/分480

K

byte/360

byte=1000倍的冗余中文百科全书扫描进入计算机冗余更大。200万字X2=4000000=4MByteB5扫描(185X255

300dpi

)一页为6.61M

Byte200万字1000页为6.61G图像信息、视频信息的冗余就更大了。4.1.2

多媒体数据压缩的可能性信息之所以能进行压缩,是因为信息本身通常存在很大的冗余量。1.空间冗余例:图像中的“A”是一个规则物体。光的亮度、饱和度及颜色都一样,因此,数据A有很大的冗余。A2.时间冗余例:序列图像。AF2AF13.结构冗余图像有非常强的纹理结构,图像的象素值存在着明显的分布模式。4.知识冗余图像的理解与某些基础知识有关。例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上……知识冗余是模型编码主要利用的特性。5.视觉冗余人的视觉系统对图像场的敏感性是非均匀、非线性的。对图像亮度和色差的敏感性相差很大Y:U:V=8:4:4或者Y:U:V=8:2:2随着亮度增加,视觉系统对量化误差的敏感度降低。人的视觉系统把图像边缘和非边缘区域分开处理。6.图像区域的相同性冗余图像区域的相同性冗余是指在图像中

的两个或多个区域对应的所有象素值相同或相近。那么只记录一个区域中各象素的颜色值,其他相

同或相近区域就不需再记录了。7.信息熵冗余信息量:指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。例如:从64个数中选出某一个数。可先问“是否大于32?”消除半数的可能,这样只要6次就可选出某数。如果要选择的数是35,则过程如下:1.大于/小于

32?

大2.大于/小于32+16=48?小3.大于/小于48-8=40?小4.大于/小于40-4=36?小5.大于/小于36-2=34?大6.大于/小于34+1=35等■如果要选择的数是63,则其过程如下:1.大于/小于32?大2.大于/小于32+16=48?大3.大于/小于48+8=56?大4.大于/小于56+4=60?大5.大于/小于60+2=62?大6.大于/小于62+1=63等这是因为每提问一次都会得到1比特的信息量。因此,在64个数中选定某一数所需的信息量是log264=6(bits)信息量: 指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。设从N个数中选任意一个数X的概率为P(x),假定选定任意一个数的概率都相等,P(x)=

1/N,因此定义信息量I(x)

=log2N=

-log2(1/N)=

-log2P(x)=I[P(x)]信息量:指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。信息熵:指一团数据所带的信息量,平均信息量就是信息熵(entropy)。如果将信源所有可能事件的信息量进行平均,就得到了信息熵(entropy)。熵就是平均信息量。4.1.3多媒体数据压缩方法的分类按压缩方法分:有失真压缩无失真压缩1、数据压缩方法分类一般说来,数据可分为两大类,一类是将模拟信号数字化后得来的多媒体数据,另一类是与文字和字符有关的文本数据,两类数据所采用的数据压缩方法相应不同。文本数据压缩和多媒体数据压缩在算法上的区别主要表现在两个方面:其一,是否允许有误差;其二,算法有没有高级模型可以利用。从信息论的角度,根据数据压缩的基本原理,数据压缩方法可分成如下两类:无损压缩法有损压缩法(1)无损压缩法无损压缩法也称冗余压缩法。当信源编码的熵大于实际熵时,通过编码,消除冗余熵,达到数据压缩目的。因为这类方法在编码时仅消

除冗余熵,而没有损失有用信息,解压时这些冗

余可以重新插入到数据中,保证解压后能无失真

地恢复数据,可实现无损压缩,压缩过程可逆。

压缩比2:1至5:1。典型的冗余压缩法(即无损压缩法)有如下种:哈夫曼(Huffman)编码香农-弗诺(Shannon-Fano)编码c.算术编码d.游程(Run-Length)编码,又称行程编码以上编码均可归类为统计编码,其编码原理是基于信源符号之间存在分布不等概性。(2)有损压缩法有损压缩法也称熵压缩法。这类方法在允许一定程度失真的前提下进行压缩编码,通过压缩少量有用的熵,达到增大压缩比的目的。从而造成部分有用信息的损失,解压时无法完全恢复原有数据,是有损压缩,压缩过程不可逆。压缩比10:1(静态)至200:1(动态)。2、数据压缩编码方法(1)预测编码根据离散信号之间存在一定关联性的特点,利用前面一个或多个信号对下一个信号进行预测。其中典型的压缩算法有DPCM、ADPCM等,它们较适合于音频数据的压缩。下面分别介绍如下。a.DPCM(差分脉码调制)DPCM系统由压缩、解压缩两部分组成。压缩时,原始的模拟信号先经过时间采样,然后对每一样值都进行量化,作为数据信号传输。解压缩时,将预测值与存储的已量化的差值相加,产生近似的原始信号,基本恢复原始数据。DPCM系统框图如下图所示。x(n)为采样的图像或声音数据;x~(n)是x(n)的预测值;d(n)=x(n)-x~(n)是实际值和预测值的差值;d^(n)是d(n)的量化值;x^(n)是接收端恢复的数据。DPCM系统框图(1)预测编码(续)b.ADPCM(自适应差分脉码调制)采用自适应差分脉码调制技术可以减少倾斜过载产生的误差。实现自适应差分脉码调制最常用的方法是根据信号分布不均匀的特点,自适应地改变量化器输出动态范围及量化器判决电平(量化器步长)。若想利用差分脉码调制或自适应脉码调制达到2:1以上的压缩比时,倾斜过载或边缘量化现象会显得非常突出,这是一个致命的弱点。(2)变换编码变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间),然后再对变换后的信号进行编码。变换编码系统中压缩数据有三个步骤:变换、变换域采样和量化。变换本身并不进行数据压缩,它只把信号映射到另一个域,使得信号在变换域时容易进行压缩。变换编码系统组成如下图所示。变换编码系统框图(3)统计编码统计编码是根据消息出现概率的分布特性而进行的压缩编码。这种编码的宗旨在于,在消息和码字之间找到明确的一一对应关系,以便于在恢复时能准确无误地再现出来,或者至少是极相似地找到相当的对应关系,并把这种失真或不对应概率限制到可容忍的范围内。最常用的统计编码是Huffman编码,是对出现频率大的符号用较少的位数来表示,而对出现频率小的符号用较多的位数来表示。(4)混合编码混合编码指的是对信源数据同时使用两种或两种以上编码方法进行组合的编码方法,

可根据多媒体数据源中各类数据的不同特点,综

合运用多种编码方法进行数据压缩,取长补短,

使综合效果达到最佳,大大提高数据压缩的效率。4.2

量化量化原理标量量化器的设计矢量量化4.2.1

量化原理量化处理是使数据比特率下降的一个强有力的措施。量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处理中有信息丢失。数据压缩编码中的量化处理,不是

指A/D变换后的量化,而是指经正交变换、差分、或预测处理后,熵编码之前,对

正交变换系数、差值或预测误差的量化

处理。4.2.2

标量量化器的设计量化器的设计要求通常设计量化器有下述两种情况:给定量化分层级数,满足量化误差最小。限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。量化方法有标量量化和矢量量化之分,标量量化又可分为,均匀量化、非均匀量化和自适应量化。(1)均匀量化设△为量化阶距,量化器的最大范如果量化值是均匀分布的,我们称之为均匀量化。围是X

max

,则:D

=2

X2

Bmax21

1对于小于

(i+

)D

,而大于

(i-

)D

的样值,2均规定为相同的量化值iD

。抽样值xˆ

(nT

)与未量化样值x(nT

)的关系是:xˆ(nT

)

=

x(nT

)+

e(n)e(n)是量化误差(量化噪声)步长为八阶的均匀量化器(2)非均匀量化均匀量化的优点是简单,而今天非均匀量化器也很容易实现了,许多信号和参数都更适合用非均匀

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论