


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章多媒体数据压缩编码技术学习要点:1、多媒体数据要所编码的重要性和分类。2、常用压缩编码算法的基本原理及实现技术,预测编码、交换编码(K-L变换、DCT变换)、统汁编码 (II u f man编码、算术编码)。3、疑化的基本原理和疑化器的设计思想。4、静态图象压缩编码的国际标准(J PEG)原理、实现技术,以及动态图像压缩编码国际标准(MP EG)的基本原理。一、多媒体数据压缩编码的重要性和分类1、多媒体数据压缩的重要性多媒体技术最大难题是海量数据存储与传送电视信号数字化后的数据呈:。2、多媒体数据压缩的可能性(1) 空间冗余例:图象中的“A”是一个规则物体。光的亮度、饱和度及颜色都一样,
2、因此,数据A有很大的冗余。(2) 时间冗余(3) 信息爛冗余信息量:指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。信息爛:指一团数据所带的信息量,平均信息量就是信息爛(entro p y)。例:从64个数中选出某一个数,可先问“是否大于32?”消除半数的可能,这样只要6次就可选出某 数。这是因为每提问一次都会得到1比特的信息屋。因此,在64个数中选左某一数所需的信息量是Io g2 64=6 (bits)。设从N个数中选任意一个数X的概率( x ),假泄选左任意一个数的槪率都相等,P (x)= 1/N, 因此左义信息§1 (x)=log 2N= -Iog2(l/N)= -
3、log2P(x) =1 P (x),如果将信源所有可能事件的信 息量进行平均,就得到了信息熾(ent ropy)。爛就是平均信息量。信息源的符号集为Xj (j=l, 2,3.N)设X出现的概率为P(xj),则信息源X的嬌为(4) 结构冗余图彖有非常强的纹理结构。如草席图结构上存在冗余。(5) 知识冗余 图像的理解与某些基础知识有关。例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上(6) 视觉冗余视觉冗余是非均匀、非线性的。例:人类视觉分辨率为2,但常用2就是数据冗余。(7) 其他冗余:空白的非泄长性3、多媒体数据压缩方法的分类按压缩方法分:有失真压缩、无失真压缩按编码算
4、法原理分:(1) 预测编码(2) 变换编码(3) 量化与向量咼化编码(4) 信息爛编码(5) 子带编码(6) 结构编码(7) 基于知识的编码二、量化1、量化原理呈:化处理是使数据比特率下降的一个强有力的措施。脉冲编码调制(PCM)的量化处理是采样之后进 行,从理论分析的角度,图像灰度值是连续的数值,而我们通常看到的是以(0255)的整数表示图像灰度, 这是经A/D变换后的以256级灰度分层量化处理了的离散数值,这样可以用log 2 256=8比特表示一个图 像像素的灰度值,或色差信号值。数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指以PCM码作为输入,经正交变换、差 分、或预测处理
5、后,爛编码之前,对正交变换系数、差值或预测误差的量化处理。量化输入值的动态范用 很大,需要以多的比特数表示一个数值,量化输出只能取有限个整数,称作量化级,希望量化后的数值用 较少的比特数便可表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。量化处理总 是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处 理中有信息丢失,或者说,会引起量化误差(量化噪声)。2、标量量化器的设计通常设计量化器有下述两种情况:给泄虽:化分层级数,满足量化误差最小。限定量化误差,确泄分层级数,满足以尽量小的平均比特数,表示量化输出。量化方法有标量量化和矢量疑化之
6、分,标量量化又可分为,均匀量化、非均匀量化和自适应量化。3、矢量量化矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种新型量化编码方法。矢疑量化编码 方法一般是有失真编码方法。矢量量化的名字是相对于标量量化而提岀的。对于PCH数据,一个数一个数 地进行量化叫标量量化。若对这些数据分组,每组K个数构成一个K维矢量,然后以矢量为单元,逐个矢 量进行量化,称矢疑量化。三、统计编码1、统计编码原理一一信息量和信息埔图像的概率分布、信息量和信息爛之间有什么关系?在图像编码压缩理论研究中,为什么要引入信息 论中"燔”值的概念,有什么重要意义?这是我们下而需要说明的问题。概念:(1) 信息
7、:是用不确泄性的量度左义的。(2) 信息量:从N个相等可能事件中选出一个事件所需要的信息度量或含量。(3 )爛:如果将信源所有可能事件信息量进行平均就得到信息的炳(燔就是平均信息量)。传输包括:(1) 传输所需要的信息。(2) 以任意小的失真或零失真接收这些信息。已经证明:只要符号速率不超过信道容量C符号可以以任意小的差错概率向该信道中传输。期外几种 典型的方法是:Fans, Huffman,编码方法左理,变字长编码最佳编码逹理。在变字长编码中,对于岀现槪率大的信息符号,编以短字长的码,对于出现概率小的信息符号编以长字 长的码,如果码字长度严格按照符号概率的大小的相反顺序排列,则平均码字长一立
8、小于按任何其他符号 顺序排列方式得到的码字长度。(1)爛、炳编码原理、变字长编码最佳编码泄理(2) Huffman就是利用了这个泄理进行编码。2、哈夫曼编码Huffman编码就是利用变字长最佳编码实现信源符号按概率大小顺序排列。信源符号按概率大小顺序排列:(1) 岀现概率最小的两个符号概率相加合成一个概率。(2) 将合成概率看成一个新组合符号概率,重复上述做法,直到最后只剩下两个符号概率为止。(3) 反过来逐步向前编码,每一步有两个分支各赋予一个二进制码,可以对概率大的赋编码为“0”, 概率小的赋编码为“1”。(反之,也可以大的赋"1 ”,小的赋“ 0 ”)特点:Huf f man编
9、码字长参差不齐。Huffma n编码在信源编码概率分布不均匀时效率髙,所以效率比较均匀时,不用Huffman编码。H uffman编码表省缺。好处:解决对称性,降低了编码时间。槪率统计和Huffman编码一般不对称。3、算术编码2 0世纪60年代初,Elias提岀了算术编码概念。1976年,Bis s anen和Pasco首次介绍了它的实 用技术。算术编码在图像数据压缩标准(如J PEG, J B IG)中扮演了重要的角色。在算术编码中,消息用0 到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率 决泄压缩编码的效率,也决怎编码过程中信源符号的间隔,而
10、这些间隔包含在0到1之间。编码过程中的 间隔决怎了符号压缩后的输出。基本思路:用一个浮点输出数值代替一个流的输入符号;把要压缩的整段数据映射到一段实数半开区间0, 1)内的某一区段,然后构造出小于1且大于或等于 0的一个数值,这个数值就是对该输入流进行压缩编码后的输岀代码。例如:可将输入字符流“e a i”映 射到区间0. 23, 0. 2 3 6),然后取该区间的任一个数,如0.23,作为该输入字符流的编码。基本原理:将编码的信息表示成实数0和1之间的一个间隔,信息越长,编码表示它的间隔就越小,表示这一间隔 所需的二进制位就越多。是一种二元码的编码方法。在不考虑信源统讣的情况下,只要监视一小
11、段时间内码岀现的频率,不 管统讣是平稳的或非平稳的,编码的码率总能趋近于信源爛值,每次迭代时的编码算法只处理一个数据符 号,并且只有算术运算。设编码初始化子区间为0, 1), Qe从0算起,则Pe二l-Qr随着被编码数据流符 号的输入,子区间逐渐缩小。新子区间的起始位豊=前子区间的起始位置+当前符号的区间左端X前子区间长度;新子区间的长度二前子区间的长度X当前符号的概率(等价于范11习长度):最后得到的子区间的长度决左了表示该区域内的某一个数所需的位数。算术编码在编、译码的过程中,子区间的起始位置和长度值的小数点后的位数越来越长,实际中无法 实现。因此较实用的改进算法是限制小数点后的位数。在算
12、术编码中需要注意的几个问题:(1) 由于实际计算机精度不可能无限长,运算中溢出是明显的问题,但多数机器都有16位、3 2位或 者64位的精度,因此可使用比例缩放法解决。(2 ) 算术编码器对消息只产生一个码字,这个码字是在0, 1中的一个实数,因此译码器在接受到 表示这个实数的所有位之前不能进行译码。(3) 算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。算术编码可以是静态的或者自适应的。在静态算术编码中,信源符号的概率是固宦的。在自适应算 术编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改,在编码期间估算信源符号概 率的过程叫做建模。需要开开发
13、态算术编码的原因是因为事先知逍精确的信源概率是很难的,而且是不切 实际的。当压缩消息时,我们不能期待一个算术编码器获得最大的效率,所能做的最有效的方法是在编码 过程中估算概率。因此动态建模就成为确定编码器压缩效率的关键。特点: 不必预先定义概率模型,自适应模式具有独特的优点; 信源符号概率接近时,建议使用算术编码,这种情况下其效率高于Huffman编码。 算术编码实现方法复杂一些,但JPEG成员对多幅图像的测试结果表明,算术编码比Huffman 编码提高了 5 %左右的效率,因此在J PEG扩展系统中用算术编码取代Huffma n编码。四、预测编码1、预测编码方法基本原理从相邻数据之间由强的相
14、关性特点考虑,可以利用前而已经岀现的数值,进行预测(估计),得到一 个预测值,将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法即成为预测编码方法。不带量化器的DPCM线性预测编码,属于无失頁编码系统;带有量化器的DPCM线性预测编码,属于有 失真编码系统。最佳量化器的设讣,可利用人眼的视觉可见度阈值和视觉掩蔽效应等生理特征,来确定量化器的级数 和步距,使量化误差总处于人眼难以觉察的范囤内,达到主观评左准则的要求。自适应预测编码A DPCM:自适应技术的概念是:预测器的预测系数和量化器的量化参数,能够根拯图像的局部区域分布特点自 动调整。实践证明,ADPCM编、解码系统DPCM编
15、、解码系统相比,不仅能改善恢复图像的评测质虽:和视觉 效果,同时还能进一步压缩数摇。ADPCM系统包括自适应预测,即预测系数的自适应调整和自适应量化,即量化器参数的自适应调整两 部分内容。五、变换编码1、变换编码的基本原理利用图像块像素值之间的相关性,把图像变换到一组新的基上,使得能量集中到少数几个变换系数 上,通过存储这些系数达到压缩的目的。本方法采用对整幅的原始图像分成许多个矩形区域子图像独立进行变换。常用变换有:卡亨南一洛维变换(KLT)离散余弦变换(DCT)沅尔什一哈达玛变换(WHT)离散傅里叶变换(DFT)0六、多媒体数据压缩编码的国际标准由国际标准化协会ISO、国际电信协会IEC和
16、国际点心协会IT U领导下,制左的三个有关视频图像 压缩编码的国家标准:JPEG标准,H26 1标准,MPEG标准。1、静态图像压缩编码的国际标准(JPEG)JPEG联合图像专家小组标准,一种对静态图像压缩的编码算法。联合”:国际电报电话咨询委员会CCITT和国际标准化协会ISO联合组成的图像专家小组。JPEG给出了一个使用于连续色调图像的压缩方法。JPEG要求图像应达到目的的基本要求:达到或接近当前压缩比与图像保真度的技术水平,能覆盖一个较宽的图像质量等级范围,能达到“很 好”到“极好”的评估,与原始图像相比,人的视觉难以分辨:能适用于任何种类的连续色调的图像,且长宽比都不受限制,同时也不受
17、限于景物内容、图像的复杂 程度和统计特性等。计算的复杂性是可控制的,苴软件可在各种CPU上完成,算法也可用硬件实现。JPEG算法,具有四种操作方式:顺序编码一一每一个图像分量按从左到右,从上到下扫描,一次扫描完成编码;累进编码一一图像编码在多次扫描中完成。累进编码传输时间长,接收端收到的图像是图像是多次扫 描由粗糙到淸晰的累进过程:无失真编码一一保证解码后,完全精确地恢复源图像采样值,其压缩比低于有失真压缩编码方法;分层编码一一图像在多个空间分辨率进行编码。在信道传送速率慢,接收端显示器分辨率也不髙的情 况下,只需做低分辨率图像解码。基于DCT编码的关键步骤为:第一步:分割子块第二步:对子块进
18、行正向离散余弦变换FDCT:第三步:对获得的DCT系数进行量化处理;第四步:DC系数差分编码、AC系数行程编码;第五步:爛编码。燔编码可分成两步进行,先把DC码和行程码转换为中间符号序列,然后给这些符号赋以变长码字。J PEG建议的爛编码是Hu f fman编码和自适应二进制算术编码。使用爛编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损圧缩算法中,使用霍夫曼编码器来减少炳"使用霍夫曼编码器的理由是可以使用很简 单的查表(lo okup ta b le)方法进行编码。压缩数据符号时,霍夫曼编码器对出现频度比较髙的符号分 配比较短的代码
19、,而对岀现频度较低的符号分配比较长的代码。这种可变长度的霍夫曼码表可以事先进行 定义。2、MPEGMPEG的全称是运动图像专家组Mo v ing P ict u r e Expe r ts Gro u p是专门制立多媒体领域内的国际标准的一个组织,该组织成立于1 98 8年,由全世界大约300名多 媒体技术专家组成。MPEG标准简介MPEG标准是而向运动图像压缩的一个系列标准。最初MPEG专家组的工作项目是3个,即在1. 5Mbp s ,10Mb p s , 40Mb p s传输速率下对图像编码, 分別命名为MPEG-1 , M PEG-2, HPEG-3。1 9 9 2年,MPEG-2适用范
20、围扩大到HDTV,能支持MPEG-3 的所有功能,因而MFEG-3被取消MPEG-1 标准:MPEG-1即“用于数字存储媒体运动图像及其伴音速率为1. 5Mbps的压缩编码”。MPEG-1的任务主要是,将视频信号及英伴音以可接收的重建质量压缩到约1.5Mb ps的码率,并复合成一个单一的M PEG位流,同时保证视频和音频的同步。MPEG-1标准分4个部分:©MPEG系统:泄义音频、视频及有关数据的同步; MPEG视频:左义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为3 6 0X240,色度信 号分辨率为1 80X 1 2 0; M PEG音频淀义音频数据的编码和解码; 一
21、致性测试。HP EG- 1标准没有规怎编码器和解码器的体系结构或实现方法,但提岀了功能和性能上的要求。此外,MPEG算法编码过程和解码过程是一种非镜像对称算法,也就是说运动图像的压缩编码过程 与还原解码过程是不对称算法,解码过程要比编码过程相对简单。实际上,MPEG-1和MPEG-2只规左 了解码的方案,重点将解码算法标准化。因而用硬件实现MPEG算法时,人们首先实现MPEG的解码器,如 CC u be公司CL4 5 0解码器系列。MPEG音频:MPEG音频压缩算法是第一个髙保真音频数据压缩国际标准,它同时可完全独立应用MPEG音频标准具有如下特点:(1) 音频信号采样率可以是32 kHz,4
22、4 . 1 kHz或4 8 kHz;(2) 压缩后的比特流可以按4种模式之一支持单声逍或双声道;(3) 压缩后的比特流具有预定义的比特率之一;(4) MPEG音频标准提供3个独立的压缩层次:(5 )编码后的比特流支持循环冗余校验CRC:(6) MPEG音频标准支持在比特流中载带附加信息MPEG数据压缩过程中存在的主要问题是:(1) 仅使用帧内编码方法无法达到很髙的压缩比;(2 )用单一的静止帧内编码方法能最好地满足随机存取的要求。具体实现中采用了一个折中解决方案,在MPEG算法中采用两种基本技术:(1 )基于块的运动补偿技术,目的是减少时间上冗余性:(2) 基于DCT变换的ADCT技术,以减少
23、空间上冗余性。(3) 基于块的运动补偿技术一一MPEG视频数据流的结构MPEG将运动图像类型分为3种:I图像P图像B图像(1) 1图像利用图像自身的相关性压缩,提供压缩数据流中的随机存取的点,采用基于ADCT的编码技术,压缩 后,每个像素为2比特。I图像也称帧内图,类似与JPEG中的帧内编码。(2) P图像用最近的前一个I图像(或P图像)预测编码得到(前向预测),也可以作为下一次预测的参照图像,也称为预测图。(3) B图像B图橡在预测时,既可使用前一个图像作参照,也可使用下一个图像作参照或同时使用前后两个图像作 为参照图像(双向预测),也称双图。其预测方法采用4种技术:(1)帧内编码;(2)前
24、向预测:(3 )后向预测:(4) 双向预测基于块的运动补偿技术:运动补偿技术主要用于消除P图像和B图像在时间上的冗余性,提髙压缩效率。在MPEG方案中,运动补偿技术在宏块一级工作。所谓基于块的运动补偿技术即:(1) 在参照帧中寻找符合一泄条件限制、当前被预测块的最佳匹配块:(2) 肖找到匹配块后,在恢复被预测块时,采用两种处理方法:直接用匹配块代替;用匹配块加上预测误差(预测误差采用ADCT编码)。每个包含运动信息的16X16宏块,相对于前面相邻块的运动信息作差分偏码,得到运动差值:然后对 运动差值,使用变长码编码方法,进一步压缩数拯。注意:MPEG标准只说明了怎样表示运动信息,并没有说明运动
25、矢量如何计算。MPEG-2 标准:MPEG-2标准从1 99 0年开始研究,1993年I S 0汉城会议正式通过。它是一个直接与数字电视广播 有关的髙质量图像和声音编码标准小4 PEG-2可以说是MPEG-1的扩充,因为它们的基本编码算法都相同。 但MPEG-2增加了许多MPEG-1所没有的功能,例如增加了隔行扫描电视的编码,提供了位速率的可变 性能(scalability)功能。MPEG-2要达到的最基本目标是:位速率为49 Mbit/s,最高达15 Mb it /so MPEG-2的标准号为ISO/IEC 1 3 8 1 &标准需称为“信息技术一电视图像和伴音信息的通用编码 MP
26、EG-2标准的主要内容如下:(1) MPEG-2视频利用网络提供的更髙的带宽(1. 5Mb p s以上),来支持具有更髙分辨率图像的压缩 和更高的图像质量;(2) 为了适应不同应用的要求,保证数据的可交换性,定义了不同的功能档次,每个档次又分为几个等 级(3) 编码器的设讣有较大的自由度(4) MPEG-2义了 11种规范,以保证与MPEG-1向下兼容及广播、通信、计算机、家用视听设备的 需求;(5) N4PEG-2音频向后与MPEG-1音频兼容。MPEG-2的编码方法和MPEG-1的区别主要是在隔行扫描制式下,DCT变换是在场内还是在帧内进行 由用户自行选择,亦可自适应选择。一般情况下,对细盯多、运动部分少的图像在帧内进行DCT;而细石 少、运动分量多的图像在场内进行DCT。MPEG-2采用可调型和非可调型两种编码结构,且采用两层等级编码方式。N4PEG2视频体系要求必须保证与MPEG 1向下兼容,并同时力求满足数字存储媒体、会议电视/可视 电话、数字电视、高淸晰度电视(HDTV)、广播、通信、网络等应用领域对多媒体视频、音频通用编码方 法日益增长的新需求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒吧七夕节活动方案7篇
- 农村大棚建设合同范本
- 资金投资合同范本
- 虫杀手粉剂行业深度研究报告
- 中介贷款佣金合同范本
- 眩晕护理查房流程
- 淘宝女装店创业计划书
- 儿童摄影服务合同范本
- 乡镇别墅租房合同范本
- 电子商务物流配送体系优化策略报告
- 宁波2025年浙江宁波市鄞州区卫健系统其他事业单位招聘事业编制46人笔试历年参考题库附带答案详解
- 2025江苏太仓市城市建设投资集团限公司招聘易考易错模拟试题(共500题)试卷后附参考答案
- 小学二年级数学上册口算题
- 2025年个体户合伙投资协议(三篇)
- 14磁极与方向(教学设计)-二年级科学下册(教科版)
- 2025年山西经贸职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 广东省佛山市禅城区2024-2025学年八年级上学期期末考试语文试题(含答案)
- 第04课 输入输出与计算(说课稿)2024-2025学年六年级上册信息技术人教版
- 部编五下语文教学多元评价方案
- 《榜样9》观后感心得体会二
- 重庆市2024-205学年秋高二(上)期末考试历史试卷(含答案)康德卷
评论
0/150
提交评论