




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、图像压缩基本概念图像压缩模型信息论基础无损压缩有损压缩图像压缩标准视频压缩标准8.5 有损压缩概述牺牲图像复原的准确度以换取压缩能力的增加如果产生的失真可以容忍,则压缩能力的增加是有效的压缩率较大压缩率较大有损预测编码有损预测编码变换编码变换编码8.5.1 有损预测编码有损预测编码在各类编码方法中,预测编码是比较易于实现的,如在各类编码方法中,预测编码是比较易于实现的,如微分(差分)微分(差分)脉冲编码调制(脉冲编码调制(DPCM)方法)方法。在这种方法中。在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称
2、为预测误差,出他们的差值,此差值称为预测误差,。接收端再将此差值与预测值相加,重建原始图像。接收端再将此差值与预测值相加,重建原始图像象素信号。由于量化和传送的仅是误差信号,根据一般扫描象素信号。由于量化和传送的仅是误差信号,根据一般扫描图像信号在空间及时间邻域内个象素的相关性,预测误差分图像信号在空间及时间邻域内个象素的相关性,预测误差分布更加集中,即熵值比原来图象小,可用较少的单位象素比布更加集中,即熵值比原来图象小,可用较少的单位象素比特率进行编码,使得图象数据得以压缩。特率进行编码,使得图象数据得以压缩。有损预测编码有损预测编码:直接对像素在图像空间进行操作:直接对像素在图像空间进行操
3、作, ,称为空域方法称为空域方法8.5.1 有损预测编码有损预测编码量化器将预测误差映射成有限范围内的输出量化器将预测误差映射成有限范围内的输出 ,确定了与有损预测,确定了与有损预测编码相联系的压缩和失真的量。编码相联系的压缩和失真的量。 ne nnneff+ -符号符号编码编码压缩图像输入图像enfn fn量化器量化器预测器预测器预测编码器ne 符号符号编码编码压缩图像+ -en输入图像fn量化器量化器预测器预测器 fn+ +u修正后的预测编码器修正后的预测编码器ne nfnnnfef + +符号符号解码解码预测器预测器解压缩图像压缩图像 fnu预测解码器预测解码器ne nfniifa f
4、3.预测编码预测编码/解码步骤:解码步骤: 编码步骤编码步骤 第一步:压缩头处理第一步:压缩头处理 第二步:对每一个符号:第二步:对每一个符号:f(x,y),由前面的值,通过预测器,求,由前面的值,通过预测器,求出预测值出预测值 第三步:求出预测误差第三步:求出预测误差 e(x,y) = f(x,y) - 第四步:对误差第四步:对误差e(x,y)编码,作为压缩值。编码,作为压缩值。 重复二、三、四步重复二、三、四步 解码步骤解码步骤 第一步:对头解压缩第一步:对头解压缩 第二步:对每一个预测误差的编码解码,得到预测误差第二步:对每一个预测误差的编码解码,得到预测误差 e(x,y)。 第三步:由
5、前面的值,得到预测值第三步:由前面的值,得到预测值 。 第四步:误差第四步:误差e(x,y),与预测值,与预测值 相加,得到解码相加,得到解码f(x,y)。 重复二、三、四步重复二、三、四步),(yxf),(yxf),(yxf),(yxfDelta调制调制1nnff预测器预测器量化器量化器0nnee其它1,6.5这里:这里:颗粒噪声颗粒噪声:斜率过载斜率过载缓变区缓变区快变区快变区预测器预测器 预测器基本思想:预测器基本思想: 选择选择作为预测的最佳准则作为预测的最佳准则 miininnnnnnnnnfafffefeftsffEeE122)2)1.min最优准则是最小化均方预测误差,设量化误差
6、可以忽略( e n e n ),并用m个先前像素的线性组合进行预测上述限制并不是必需的,但它们都极大地简化了分析,也减少了预测器的计算复杂性.基于上述条件的预测编码方法称为(DPCM)i最优预测器(续)最优预测器(续)假设用假设用1个个4阶线性预测器:阶线性预测器:f x, y 1 f x, y 1 2 f x 1, y 1 3 f x 1, y 4 f x 1, y 1 来预测来预测通常,预测系数的和要小于或等于通常,预测系数的和要小于或等于1。即。即上述限制是确保预测器的输出能够落到灰度级的允许范上述限制是确保预测器的输出能够落到灰度级的允许范围内减少传输噪声的影响围内减少传输噪声的影响.
7、 .减小减小DPCMDPCM解码器对输入噪声的敏感性是很重要的,因为单解码器对输入噪声的敏感性是很重要的,因为单个差错会传播到所有以后的输出。这样,解码器的输出会个差错会传播到所有以后的输出。这样,解码器的输出会变得不稳定变得不稳定im i 1 1例:预测技术的对比例:预测技术的对比0.97( ,1)( , )0.97(1, )f x yhvf x yf xy 其它(1, )(1,1)( ,1)(1,1)hf xyf xyvf x yf xy ( , )0.97( ,1)f x yf x y( , )0.5 ( ,1)0.5 (1, )f x yf x yf xy( , )0.75 ( ,1)
8、0.75 (1, )0.5 (1,1)f x yf x yf xyf xy预测器预测器1:预测器预测器3:预测器预测器4:预测器预测器2:最佳预测器:最佳预测器:选择最小化均方预测误差为最佳准则选择最小化均方预测误差为最佳准则水平梯度水平梯度垂直梯度垂直梯度考虑对单色图像进行考虑对单色图像进行DPCM编码产生的预测误差编码产生的预测误差 假设量化误差为假设量化误差为0,即,即 en en定义下列定义下列4个线性预测器,并使用其中个线性预测器,并使用其中1个:个:例:预测技术的对比1阶3阶结论:随着预测器阶数的增加误差减少了2阶4阶 量化器基本思想:量化器基本思想: 减少数据量的最简单的办法是将
9、图像减少数据量的最简单的办法是将图像,通过减少图像的灰度级来实现图像的压缩。通过减少图像的灰度级来实现图像的压缩。 这种量化是这种量化是,因而解码时图像有损失。,因而解码时图像有损失。量化器量化器t=q(st=q(s) )是是s s的的断点定义了函数的断点定义了函数的不连续性,被称为量不连续性,被称为量化器的判决和重构级化器的判决和重构级阶梯量化函数E s ti 最优量化最优量化量化器的设计就是要在给定优化准则和输入概率密度函数量化器的设计就是要在给定优化准则和输入概率密度函数p(sp(s) )的条件的条件下选择最优的下选择最优的s si i和和t ti i。 优化准则可以是统计的或心理视觉的
10、准则优化准则可以是统计的或心理视觉的准则如果用最小均方量化误差如果用最小均方量化误差2 作作为准则,且为准则,且p(sp(s) )是个偶函数,是个偶函数,那么最小误差条件为那么最小误差条件为s i s i 1 s t i p s ds 0其中其中对于任意的对于任意的L,满足上列公式的,满足上列公式的si和和ti在均方误差意义下是最佳的;在均方误差意义下是最佳的;相应的量化器称为相应的量化器称为L层的层的Lloyd-Max量化器量化器 LLi 0 si ti ti 1 / 2 si si判定层在重构层之间的一半处判定层在重构层之间的一半处i 0i 1,2,3., 12q是一个奇函数的结果是一个奇
11、函数的结果2ti tiLloyd_Max量化器定义量化器定义1)要达到最小误差的条件有两个:)要达到最小误差的条件有两个:a)每个决策级)每个决策级si正好落在两个相邻重构级正好落在两个相邻重构级ti 、ti+1的中点。的中点。 0 i = 0si = (ti + ti+1) / 2 i = 1,2,.,L/2 1 i = L/2且且si = si t-i = ti (q为奇函数)为奇函数)inputs1s2=6S(L/2)-1outputstt1t2=4t(L/2)-t(L/2)S-(L/2)-1t = q(s)t3 =8b b)每个重构级)每个重构级 t ti i 落在两个相落在两个相继决
12、策级继决策级s si i区间的区间的 p(sp(s) )(概率(概率密度函数)的质心上。密度函数)的质心上。2, 2 , 10)()(1Lidssptsiissi 2 2)以上两个条件构成一个方程组,必须通过迭代才能求解决策级)以上两个条件构成一个方程组,必须通过迭代才能求解决策级s si i和重构级和重构级t ti i。3 3)对于任何满足两个最小误差条件有的)对于任何满足两个最小误差条件有的L L、s si i和和t ti i,在均方误差意义,在均方误差意义上是最优的,相应的量化器被称为:上是最优的,相应的量化器被称为:L L级级 Lloyd_MaxLloyd_Max量化器量化器4 4)由
13、于对于多数由于对于多数p(sp(s) ),得到一个符合最优量化两个条件的解是困难,得到一个符合最优量化两个条件的解是困难的的,因此这些解可通过数字来产生。,因此这些解可通过数字来产生。单位方差的拉普拉斯概率密度函数的劳埃德单位方差的拉普拉斯概率密度函数的劳埃德-马克斯量化器马克斯量化器最优量化总结总结实际应用表明,实际应用表明,2 2级量化器(例如:级量化器(例如:deltadelta调制)所产生的由于调制)所产生的由于斜率过载而造成的解码图中边缘模糊的程度比斜率过载而造成的解码图中边缘模糊的程度比4 4级和级和8 8级量化器的程级量化器的程度要高度要高 具有步长具有步长的最优均匀量化器在具有
14、相同输出可靠性的条件下的最优均匀量化器在具有相同输出可靠性的条件下能提供比固定长度编码的能提供比固定长度编码的Lloyd-MaxLloyd-Max量化器更低的码率量化器更低的码率Lloyd-MaxLloyd-Max量化器和最优均匀量化器都不是自适应的,但如果量化器和最优均匀量化器都不是自适应的,但如果根据图像局部性质调解量化值也能提供效率根据图像局部性质调解量化值也能提供效率可以较可以较缓慢变化区域而较缓慢变化区域而较快速变化区域。这可同快速变化区域。这可同时减少颗粒噪声和斜率过载,且码率增加很少。这也会增加量化器时减少颗粒噪声和斜率过载,且码率增加很少。这也会增加量化器的复杂性的复杂性量化和
15、复原例子:DPCM结果图像使用3阶预测器 f x, y 0.75f x, y10.75f x1, y0.5f x1, y12层Lloyd-Max量化器自适应量化方法:在4个可能的量化器中选择最好的一个4层Lloyd-Max量化器8层Lloyd-Max量化器 a),c),e):2级,级,4级,级,8级劳埃德量化级劳埃德量化 b),d),f):2级,级,4级,级,8级自适应量化级自适应量化量化和复原例子:标定过的DPCM结果图像量化和复原例子:标定过的DPCM结果图像图a图b图c图d图e图f图图a a到到f f中差异图像的中差异图像的rmsrms误差误差注明了不同的预测器和量化器注明了不同的预测器
16、和量化器2 2层自适应量化器的均方误差与层自适应量化器的均方误差与4 4层层Lloyd-MaxLloyd-Max量化器相近量化器相近4 4层自适应量化器的均方误差小于层自适应量化器的均方误差小于8 8层层Lloyd-MaxLloyd-Max量化器量化器有损有损DPCM均方根误差均方根误差8.5.2 变换编码变换编码图像变换会使图象信号能量在空间重新分布,其中图像变换会使图象信号能量在空间重新分布,其中低频成分占据能量的绝大部分,而高频成分所占比低频成分占据能量的绝大部分,而高频成分所占比重很小,根据统计编码的原理,重很小,根据统计编码的原理,能量分布集中,熵能量分布集中,熵值最小,可实现平均码
17、长最短值最小,可实现平均码长最短。变换编码的基本原理是将原来在空域描述的图像信变换编码的基本原理是将原来在空域描述的图像信号,变换到另外一些号,变换到另外一些中去,中去,并对变换系数进行编码。一般来说并对变换系数进行编码。一般来说在变换域里描述要比在空域简单,因为图像的相关在变换域里描述要比在空域简单,因为图像的相关性明显下降。尽管性明显下降。尽管变换本身并不带来数据压缩变换本身并不带来数据压缩,但,但由于变换由于变换采用量化和熵编码则可以有效地压缩图像采用量化和熵编码则可以有效地压缩图像的编码比特率。的编码比特率。 有损压缩有损压缩 8.5.2 变换编码变换编码基于基于图像变换图像变换的编码
18、方法。称为频域方法的编码方法。称为频域方法用可逆的线性变换(如傅里叶变换)将图像用可逆的线性变换(如傅里叶变换)将图像映射成映射成1组变换系数,然后组变换系数,然后大多数图像变换得到的系数值都很小,这些大多数图像变换得到的系数值都很小,这些系数可以较粗地量化,或忽略不计系数可以较粗地量化,或忽略不计虽然失真很小,信息仍然不能完全复原,所虽然失真很小,信息仍然不能完全复原,所以还是有损压缩以还是有损压缩子图分解子图分解图像变换图像变换量化量化编码编码变换编码系统变换编码系统对每子图像的象素进行对每子图像的象素进行解相关解相关或或用少量用少量的系数包含尽量多的信的系数包含尽量多的信息息原则:原则:
19、粗量化粗量化包含包含少量信息的系数少量信息的系数通常使用通常使用变长编码变长编码图像变换图像变换 将空域中的信号变换到另外一个域,即使用该域中的一组将空域中的信号变换到另外一个域,即使用该域中的一组基函数的线性组合来合成任意函数基函数的线性组合来合成任意函数 单位正交基函数(相同基函数内积为单位正交基函数(相同基函数内积为1,不同基函数的内,不同基函数的内积为积为0) 使用这组基函数的线性组合得到任意函数使用这组基函数的线性组合得到任意函数f(x,y),每个基函,每个基函数的系数就是数的系数就是f(x,y)与该基函数的内积与该基函数的内积图像变换图像变换 图像变换的图像变换的在于:在于:1.
20、1. 使图像处理问题简化;使图像处理问题简化;2.2.有利于图像特征提取;有利于图像特征提取;3. 3. 有助于从概念上增强对图像信息的理解有助于从概念上增强对图像信息的理解 图像变换通常是一种图像变换通常是一种。一般。一般: 1. 1. 正交变换必须是可逆的;正交变换必须是可逆的; 2. 2. 正变换和反变换的算法不能太复杂;正变换和反变换的算法不能太复杂; 3. 3. 是在变换域中图像能量将集中分布在低频率成分上,是在变换域中图像能量将集中分布在低频率成分上,边缘、线状信息反映在高频率成分上,有利于图像处理边缘、线状信息反映在高频率成分上,有利于图像处理 因此正交变换广泛因此正交变换广泛在
21、图像增强、图像恢复、特征提取、在图像增强、图像恢复、特征提取、图像压缩编码和形状分析等方面图像压缩编码和形状分析等方面变换选择变换选择常用的变换编码所使用的常用的变换编码所使用的正交变换正交变换有有,在量化和编码时,在量化和编码时,结合人类视觉心理因素等,采用结合人类视觉心理因素等,采用“区域取样区域取样”或或“阈值取样阈值取样”等方法,等方法,进行量化编码,而大多数幅值小,进行量化编码,而大多数幅值小或某些特定区域的变换系数将全部当作零处理。或某些特定区域的变换系数将全部当作零处理。 变换选择变换选择考虑大小为考虑大小为NN的图像的图像f(x,y),该图像的正向,该图像的正向离散变换离散变换
22、T(u,v)表示为表示为N 1 N 1T u, v f x, y g x, y, u, v x 0 y 0u,v=0,1,2,N-1。给定。给定T(u,v),f(x,y)可用离可用离散反变换得到散反变换得到N 1 N 1f x, y T u, v h x, y, u, v u 0 v 0 x,y=0,1,2,N-1g(x,y,u,vg(x,y,u,v) )和和h(x,y,u,vh(x,y,u,v) ):正向和逆向变换核函数:正向和逆向变换核函数T(u,vT(u,v):):变换系数变换系数 变换选择变换选择如果下列等式成立,正向核函数如果下列等式成立,正向核函数g(x,y,u,v)称为称为是可分
23、离的是可分离的g x, y, u, v g1 x, u g2 ( y, v)如果如果g1在函数上等于在函数上等于g2,则,则g x, y, u, v g1 x, u g1 ( y, v)如果上述等式对逆向核函数如果上述等式对逆向核函数h(x,y,u,v)成立,成立,则则h(x,y,u,v)也具有上述结论也具有上述结论 1 j 2 ux vy / NN bi x pi u bi y pi v 1核函数:核函数:DFT变换(离散傅里叶变换的简化版本(变换(离散傅里叶变换的简化版本(M=N)g x, y, u, v 2 eh x, y, u, v e j 2 ux vy / N WHT变换变换g x
24、, y, u, v h x, y, u, v 1 i 0Nm-1m-1 DCT变换变换 NvyNuxvuvuyxhvuyxg2)12(cos2)12(cos)()(),(),( 1, 2 , 1021)( NuuNNu N=4时时Walsh-Hadamard基函数基函数WHTWHT的重要意义:的重要意义:,实现上简单,实现上简单N=4N=4时的核,每个块包括时的核,每个块包括4 44 41616个子方块个子方块白色表示白色表示1 1,而黑色表示,而黑色表示1 1左上角的块:左上角的块:u=v=0,x,y=0,1,2,3u=v=0,x,y=0,1,2,3时时g(x,y,0,0)g(x,y,0,0
25、)的值:的值:1 1左上第二块:左上第二块:u=0,v=1,x,y=0,1,2,3u=0,v=1,x,y=0,1,2,3时时g(x,y,0,1)g(x,y,0,1)的值的值N=4时时DCT基函数基函数g g的值不是整数的值不是整数0 0为黑,为黑,1 1为白,较大的为白,较大的g g值,值,对应较浅的灰度级对应较浅的灰度级三种变换举例 例8.19说明:说明:512512大小的单色图像大小的单色图像先将原图分割为先将原图分割为88大小的子图像,然后用大小的子图像,然后用DFT,WHT和和DCT的一种,表示每一个子图像的一种,表示每一个子图像将得到所有系数的将得到所有系数的50%去掉,即丢掉去掉,
26、即丢掉32个系数个系数对截取的系数阵列进行逆变换,保留对截取的系数阵列进行逆变换,保留32个系数个系数丢掉的丢掉的32个系数,对复原图像质量的视觉影响很小个系数,对复原图像质量的视觉影响很小产生的均方误差产生的均方误差rmsDFTrmsWHTrmsDCT三种变换举例DFT还原图像WHT还原图像DCT还原图像rmsDFT=1.28rmsWHT=0.86rmsDCT=0.68均方误差近似等于被丢弃的变换系数的方差之和!均方误差近似等于被丢弃的变换系数的方差之和! 三种变换举例三种变换举例 结论结论DCT的信息压缩能力比的信息压缩能力比DFT和和WHT的能力要强的能力要强WHTWHT是最容易实现的是
27、最容易实现的DCT在信息压缩能力和计算复杂性之间提供了很好的在信息压缩能力和计算复杂性之间提供了很好的平衡,因此,许多变换编码系统都是以平衡,因此,许多变换编码系统都是以DCT变换为基变换为基础的础的对比其它方法,对比其它方法,DCTDCT变换具有使用单一的集成电路就可变换具有使用单一的集成电路就可以实现,可以将最多的信息包装在最少的系数之中以实现,可以将最多的信息包装在最少的系数之中可使可使“分块噪声分块噪声”的块效应最小,这些分块噪声是由子图的块效应最小,这些分块噪声是由子图像之间的可见边界造成像之间的可见边界造成 三种变换举例三种变换举例结论(续)结论(续)DFTDFT的的n n点周期性
28、造成边界中断,当点周期性造成边界中断,当DFTDFT系数被截尾或量系数被截尾或量化时,边界值以分块噪声的形式出现,即相邻子图像之化时,边界值以分块噪声的形式出现,即相邻子图像之间的边界变得可见。而间的边界变得可见。而DCTDCT变换不会产生固有的边界中断变换不会产生固有的边界中断DFTDCT 变换编码变换编码子图像尺寸选择子图像尺寸选择子图像尺寸是影响变换编码误差和计算复杂度子图像尺寸是影响变换编码误差和计算复杂度的一个重要因素的一个重要因素一般满足下列一般满足下列2个条件个条件相邻子图像之间的相关(冗余)减少到可接受相邻子图像之间的相关(冗余)减少到可接受子图像的长和宽都是子图像的长和宽都是
29、2的整数次幂。这主要是为了简的整数次幂。这主要是为了简化对子图像变换的计算化对子图像变换的计算最常用的子图像尺寸是最常用的子图像尺寸是88和和1616把图像分割为把图像分割为n nn n的子图像的子图像(n=2,4,8,16(n=2,4,8,16和和32)32)计算每幅子图像的变换,截取计算每幅子图像的变换,截取7575的系数,对截取后的阵列进行反变换得到的系数,对截取后的阵列进行反变换得到当图像尺寸大于当图像尺寸大于8 88 8,WHTWHT和和DCTDCT曲线变得比较平缓,而曲线变得比较平缓,而DFTDFT曲线下降得较曲线下降得较快。对更大的快。对更大的n n值,值,DFTDFT将穿过将穿
30、过WHTWHT并逼近并逼近DCTDCT当图像尺寸为当图像尺寸为2 22 2时,时,3 3条条曲线交于同曲线交于同1 1点。此时各变点。此时各变换都只保留了换都只保留了4 4个系数中的个系数中的1 1个(个(2525),即直流分量),即直流分量子图像尺寸选择子图像尺寸选择一个试验例子:一个试验例子:(1)子图像尺寸的选择)子图像尺寸的选择a)8*8大小子图像压缩结果大小子图像压缩结果b)误差图像误差图像c)放大的局部图像放大的局部图像d)2*2子图像子图像e)4*4子图像子图像f)8*8子图像子图像(2)比特分配)比特分配截断误差和截断误差和2 2个因素有关个因素有关:截除的变换系数的数量和相截
31、除的变换系数的数量和相对重要性对重要性用来表示所保留系数的精度用来表示所保留系数的精度在大多数变换编码系统中,保在大多数变换编码系统中,保留的系数是根据最大值方差进留的系数是根据最大值方差进行选择,称为行选择,称为区域编码区域编码,或根,或根据系数从大到小选择,称为据系数从大到小选择,称为门门限编码限编码。对变换后的系数进行。对变换后的系数进行截取、量化和编码的整个过程截取、量化和编码的整个过程通常称为通常称为比特分配比特分配。使用使用8*8DCT系数的系数的12.5%对源图像对源图像进行近似的结果进行近似的结果a),c),e) 门限编码结果门限编码结果(误差小)(误差小)b),d),f) 区
32、域编码结果区域编码结果具有最大方差的变换系数携带着图像大部分信息并在编码处理的具有最大方差的变换系数携带着图像大部分信息并在编码处理的过程中应该保留下来。过程中应该保留下来。区域取样的目的是区域取样的目的是“选择要保留的系数选择要保留的系数”。处理可看成每个。处理可看成每个T(u,v)与与相应的区域模板中的元素相乘。相应的区域模板中的元素相乘。对区域取样过程中保留的对区域取样过程中保留的系数必须进行量化和编系数必须进行量化和编码。因此,码。因此,。两种分配。两种分配方案:方案:(1) 给系数分配相同的比特给系数分配相同的比特数数(2) 给系数不均匀地分配几给系数不均匀地分配几个固定数目的比特数
33、个固定数目的比特数(a)(b)区域编码区域编码)38.5 .8(H),(),(F1010uvnunvvuTvu 对任何子图像对任何子图像,最大量级的变换系数对重构子图像的品质具最大量级的变换系数对重构子图像的品质具有最大的影响有最大的影响.因为不同子图像的最大系数的位置是变化的因为不同子图像的最大系数的位置是变化的,所以通常将所以通常将 (u,v)T(u,v) 的元素重新排列成一个一维行程编码的元素重新排列成一个一维行程编码.门限编码门限编码有有3 3种基本途径对一幅变换后的子图像进行门限处理种基本途径对一幅变换后的子图像进行门限处理( (即生成子图像门限模板函数即生成子图像门限模板函数) )
34、 对所有的子图像使用单一的全局门限对所有的子图像使用单一的全局门限; ; 对不同图像的压缩等级不同对不同图像的压缩等级不同. . 对每幅图像使用不同的门限对每幅图像使用不同的门限; ; 对每幅子图像丢弃相同数目的系数对每幅子图像丢弃相同数目的系数, ,编码率恒定编码率恒定. . 门限随子图像中每个系数的位置函数的变化而变化门限随子图像中每个系数的位置函数的变化而变化. . 编码率变化编码率变化, ,但是可以将门限处理和量化过程结但是可以将门限处理和量化过程结合起来合起来. .门限编码门限编码)40. 5 . 8(),(),(),( vuZvuTroundvuT),(vuT),(vuT)41.
35、5 . 8()1, 1()1 , 1()0 , 1()1, 1()1 , 1()0 , 1()1, 0()1 , 0()0 , 0(Z nnZnZnZnZZZnZZZ(2)门限编码量化)门限编码量化对对Z(u,v)赋予某个常数赋予某个常数c (2)门限编码量化)门限编码量化门限编码结果比较门限编码结果比较a)采用采用JPEG标准模板标准模板Z(u,v) 压缩率压缩率34:1 rms :3.42像素像素b)标准模板标准模板Z(u,v) *4 压缩率压缩率67:1 rms :6.33像素像素 变换编码变换编码其它编码方法其它编码方法子带子带(subband)编码编码 小波编码小波编码分形(分形(f
36、ractal)编码)编码矢量量化矢量量化(vector quantization,VQ)编码编码统计编码统计编码/熵编码熵编码 8.6 图像压缩标准图像压缩标准相关的国际组织相关的国际组织 ISO(International StandardizationOrganization,国际标准化组织)国际标准化组织)ITU(International Telecommunication Union,国国际电信联盟),前身是际电信联盟),前身是CCITT(国际电话电报咨询委员(国际电话电报咨询委员会)会) 相关工作相关工作覆盖了从二值到灰度(彩色)值的静止和运动图像覆盖了从二值到灰度(彩色)值的静止
37、和运动图像采用的大部分基本技术前面已经介绍,主要包括预测采用的大部分基本技术前面已经介绍,主要包括预测和变换编码技术和变换编码技术 制定图像标准的国际组织制定图像标准的国际组织: ISO(国际标准化组织)(国际标准化组织) CCITT(国际电报电话咨询委员会)(国际电报电话咨询委员会)联合组织下进行制定的联合组织下进行制定的 标准的类型(三类):标准的类型(三类): (1) 二值图像压缩标准:面向传真而设计二值图像压缩标准:面向传真而设计 连续调图像压缩标准:连续调图像压缩标准:(2) 静止帧黑白、彩色压缩:面向静止的单幅图像静止帧黑白、彩色压缩:面向静止的单幅图像(3) 连续帧黑白、彩色压缩
38、:面向连续的视频影像连续帧黑白、彩色压缩:面向连续的视频影像图像压缩标准图像压缩标准压缩标准压缩标准 G3和和G4 这两个标准是由这两个标准是由CCITT的两个小组负责制定的,最初是的两个小组负责制定的,最初是CCITT为传真应用而设计的。为传真应用而设计的。G3采用了非自适应、采用了非自适应、1-D,对每组,对每组N行扫描线中的后行扫描线中的后N-1行也可使用行也可使用2-D行程编码。行程编码。G4是是G3的一种简化版,其中只使用的一种简化版,其中只使用2-D行程编码。行程编码。 G3的压缩率一般为的压缩率一般为15:1 G4的压缩率一般比的压缩率一般比G3高高1倍倍 JBIG 这个标准由上
39、述这个标准由上述2合组织的二值图联合组合组织的二值图联合组(joint bilevel imaging group,JBIG)于)于1991年制定的。因为年制定的。因为G3和和G4是基于非自适应是基于非自适应技术的,所以对半色调灰度图像编码时常产生扩展,技术的,所以对半色调灰度图像编码时常产生扩展,JBIG的目标的目标就是采用一种自适应技术解决这个问题。就是采用一种自适应技术解决这个问题。 编码效率提高了,对于打印字符的扫描图像,压缩比可提高编码效率提高了,对于打印字符的扫描图像,压缩比可提高1.1-1.5倍,对计算机生成的打印字符图像,压缩比可提高倍,对计算机生成的打印字符图像,压缩比可提高
40、5倍。对抖倍。对抖动或半色调图像,压缩比可提高动或半色调图像,压缩比可提高2-30倍。倍。压缩标准压缩标准 压缩标准压缩标准JPEG(Joint Picture Expert Group)由由ISO和和CCITT联合成立的专家组负责制定静联合成立的专家组负责制定静态图像(彩色与灰度图像)的压缩算法态图像(彩色与灰度图像)的压缩算法定义了定义了3种编码系统种编码系统基于基于DCT的有损编码基本系统,可用于绝大多数的有损编码基本系统,可用于绝大多数压缩应用场合压缩应用场合用于高压缩比、高精确度或渐进重建应用的扩展用于高压缩比、高精确度或渐进重建应用的扩展编码系统编码系统用于无失真应用场合的无损系统
41、用于无失真应用场合的无损系统JPEG对录像机质量的静止图像的压缩率一般可达到对录像机质量的静止图像的压缩率一般可达到25:1 JPEG基本系统编码器框图基本系统编码器框图源图像源图像DCT正变换正变换量化器量化器熵编码器熵编码器压缩图像压缩图像表说明表说明表说明表说明 压缩过程压缩过程 DCT计算计算量化量化变长码赋值变长码赋值 具体压缩过程具体压缩过程先把整个图像分解成多个先把整个图像分解成多个8 88 8的图像块;的图像块;88的图像块经过的图像块经过DCT变换后,低频分量都集中在左上角,高频分变换后,低频分量都集中在左上角,高频分量则分布在右下角(量则分布在右下角(DCT变换类似于低通滤
42、波器),因为低频分量包变换类似于低通滤波器),因为低频分量包含了图像的主要信息,所以可以忽略高频分量,达到压缩的目的;含了图像的主要信息,所以可以忽略高频分量,达到压缩的目的;使用量化操作去掉高频分量,使用量化操作去掉高频分量,就是将某一个值除以量化就是将某一个值除以量化表中的对应值。由于量化表中左上角的值较小,而右下角的值较大,表中的对应值。由于量化表中左上角的值较小,而右下角的值较大,这样达到保持低频分量,抑制高频分量的目的;这样达到保持低频分量,抑制高频分量的目的;在左上角的低频分量中在左上角的低频分量中,F(0,0),F(0,0)代表了直流代表了直流(DC)(DC)系数,即系数,即8
43、88 8子块子块的平均值。由于两个相邻图像块的的平均值。由于两个相邻图像块的DCDC系数相差很小,所以采用差分系数相差很小,所以采用差分编码编码DPCM,DPCM,其它其它6363个元素是交流(个元素是交流(ACAC)系数,采用之字型()系数,采用之字型(zig-zagzig-zag)顺序进行行程编码,使系数为顺序进行行程编码,使系数为0 0的值更集中;的值更集中; 在得到在得到DCDC码字和码字和ACAC行程码字后,为了进一步提高压缩比,再进行熵编行程码字后,为了进一步提高压缩比,再进行熵编码,采用了码,采用了HuffmanHuffman编码编码 静止图像压缩标准静止图像压缩标准 JPEG(
44、jointJPEG(joint picture expert group) picture expert group) 图像应用系统要想与图像应用系统要想与JPEGJPEG兼容,必须要支持其基本系统。在视觉效兼容,必须要支持其基本系统。在视觉效果不受到严重损失的前提下,对灰度图像压缩算法可以达到果不受到严重损失的前提下,对灰度图像压缩算法可以达到1515到到2020的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到4040:1 1或或更高的压缩比。更高的压缩比。 如果处理的是彩色图像,如果处理的是彩色图像,JPEGJPEG算法首先将算法首先
45、将RGBRGB分量转化成亮度分量和分量转化成亮度分量和色差分量,同时丢失一半的色彩信息色差分量,同时丢失一半的色彩信息( (空间分辨率减半空间分辨率减半) )。然后,用。然后,用离散余弦变换来进行变换编码,舍弃高频的系数,并对余下的系数离散余弦变换来进行变换编码,舍弃高频的系数,并对余下的系数进行量化,以进一步减小数据量。最后,使用行程长度编码和进行量化,以进一步减小数据量。最后,使用行程长度编码和HuffmanHuffman编码来完成压缩任务。编码来完成压缩任务。JPEGJPEG解压缩过程就是解压缩过程就是JPEGJPEG压缩过程的压缩过程的逆过程,这使得算法具有对称性。逆过程,这使得算法具
46、有对称性。 JPEG2000 相对于原始相对于原始JPEG标准,在对连续色调静止图像的压缩标准,在对连续色调静止图像的压缩方面以及对压缩数据的访问方面提供了更大的灵活性。方面以及对压缩数据的访问方面提供了更大的灵活性。该标准是以小波编码技术为基础的。该标准是以小波编码技术为基础的。 该标准在该标准在1997年开始征集提案,年开始征集提案,1999年形成草案,年形成草案,2000年开始使用。年开始使用。静止图像压缩标准静止图像压缩标准 8.6.3视频压缩标准视频压缩标准视频压缩标准视频压缩标准 基本概念基本概念电视会议标准电视会议标准H.261、H.263MPEG标准标准MPEG-1、MPEG-
47、2、MPEG-4、MPEG-7和和MPEG-21 连续帧图像的定义连续帧图像的定义 连续帧图像压缩的基本思想连续帧图像压缩的基本思想 帧间运动补偿预测编码技术帧间运动补偿预测编码技术 H.261标准标准 MPEG1/2/4/7标准标准运动图像压缩标准运动图像压缩标准1. 连续帧图像的定义连续帧图像的定义 由多幅尺寸相同的静止图像组成的图像序列,被称为由多幅尺寸相同的静止图像组成的图像序列,被称为连续帧图像连续帧图像。 与静止帧图像相比,与静止帧图像相比,连续帧图像连续帧图像多了一个时间轴,成多了一个时间轴,成为三维信号,因此为三维信号,因此也被称为也被称为运动图像压缩标准运动图像压缩标准 2.
48、 连续帧图像压缩的基本思想连续帧图像压缩的基本思想 基于如下基本假设:基于如下基本假设: 在各连续帧之间存在简单的相关性平移运动。在各连续帧之间存在简单的相关性平移运动。 一个特定画面上的像素量值:一个特定画面上的像素量值:1 1)可以根据)可以根据同帧同帧附近像素来加以预测,被称为:附近像素来加以预测,被称为:帧内帧内编码技术编码技术2 2)可以根据)可以根据附近帧附近帧中的像素来加以预测,被称为:中的像素来加以预测,被称为:帧间帧间编码技术编码技术运动图像压缩标准运动图像压缩标准 压缩的基本思想压缩的基本思想 通过减少通过减少帧间图像数据冗余帧间图像数据冗余,来达到减少数据量、压缩连续帧图
49、像体积的目的,来达到减少数据量、压缩连续帧图像体积的目的 将连续帧图像序列,分为将连续帧图像序列,分为参考帧参考帧和和预测帧预测帧,参考帧用静止图像压缩方法进行压,参考帧用静止图像压缩方法进行压缩,预测帧用于对缩,预测帧用于对帧差图像帧差图像进行压缩进行压缩 由于由于帧差图像帧差图像的数据量大大小于的数据量大大小于参考帧参考帧的数据量,从而可以达到很高的压缩比的数据量,从而可以达到很高的压缩比 3. 帧间运动补偿预测编码技术帧间运动补偿预测编码技术 帧间预测编码帧间预测编码压缩图像块压缩图像块输入图像块输入图像块e en nf fn n f fn n运动补偿预测运动补偿预测帧间误差图像帧间误差
50、图像运动补偿预测图像运动补偿预测图像运动图像压缩标准运动图像压缩标准 向前预测向前预测 双向预测双向预测前一帧前一帧当前帧当前帧前一帧前一帧当前帧当前帧下一帧下一帧 I 帧帧(Intra-picture) : 不进行预测、进行帧内编码的编码帧(参考不进行预测、进行帧内编码的编码帧(参考帧)帧); P帧帧(Predicted-picture):通过向前预测得到的误差编码帧通过向前预测得到的误差编码帧; B帧帧(Bidirectional-picture):通过双向预测得到的误差编码帧通过双向预测得到的误差编码帧.因因图像序列存放在存储器中,可以使用下一帧图像序列存放在存储器中,可以使用下一帧.运
51、动图像压缩标准运动图像压缩标准编码中的运动补偿编码中的运动补偿 运动补偿概念运动补偿概念 以对帧间运动的估算为基础的,若物体均在空间上有以对帧间运动的估算为基础的,若物体均在空间上有一位移,那么一位移,那么,如,如: :对于像素的平移运动,可用运动矢量来描述。对于像素的平移运动,可用运动矢量来描述。 一个来自前一编码帧的运动补偿预测像素,就能给出一个当前像一个来自前一编码帧的运动补偿预测像素,就能给出一个当前像素的最佳预测。预测误差和运动矢量一同参与编码。素的最佳预测。预测误差和运动矢量一同参与编码。 由于一些运动矢量之间的空间相关性通常较高,因此,由于一些运动矢量之间的空间相关性通常较高,因
52、此,一个像素一个像素的运动矢量,可以代表一个相邻像素块的运动。的运动矢量,可以代表一个相邻像素块的运动。 实现中,画面一般划分成一些不连接的像素块实现中,画面一般划分成一些不连接的像素块( (在在MPEGlMPEGl和和MPEG2MPEG2标准中一个像素块为标准中一个像素块为16161616像素像素) ),对于每一个这样的像素块,对于每一个这样的像素块,只估算一个运动矢量。只估算一个运动矢量。运动图像压缩标准运动图像压缩标准运动图像压缩标准运动图像压缩标准MPEG帧的分类帧的分类MPEG 的画面组(GOP)MPEG帧的分类帧的分类由于画面内容有连贯由于画面内容有连贯性性,因此当前画面的内因此当
53、前画面的内容可以看作是前面画容可以看作是前面画面内容的位移面内容的位移(运动运动)。运动矢量运动矢量画面各处相应的位移画面各处相应的位移量量(幅度、方向幅度、方向)各有各有不同,因此画面应细不同,因此画面应细分成块分成块(宏块宏块),以宏,以宏块为单位,找出两帧块为单位,找出两帧画面中相应宏块之间画面中相应宏块之间的位移量的位移量-画面的重新排序GOP(Group of Pictures)例0B1B2I3B4B5P6B7B8P9B10I画面的显示顺序是:画面的编码顺序是:B B I B B P B B P B I0 1 2 3 4 5 6 7 8 9 10I B B P B B P B B I
54、 B2 0 1 5 3 4 8 6 7 10 9因此因此,每一个每一个GOP中的画面在编码前和解码后都必须重排序中的画面在编码前和解码后都必须重排序 电视会议标准电视会议标准 H.261标准标准 应用范围:电视会议应用范围:电视会议 主要编码技术:主要编码技术: DCT变换变换向前运动补偿预测向前运动补偿预测Zig-zag排序排序霍夫曼编码霍夫曼编码IPPPPPPIPPP. 电视会议标准电视会议标准 H.263标准标准应用范围:可视电话应用范围:可视电话主要编码技术:主要编码技术: DCT变换变换双向运动补偿预测双向运动补偿预测Zig-zag排序排序霍夫曼编码霍夫曼编码IBBPBBPBBIBB
55、P . . . . 多媒体压缩标准多媒体压缩标准MPEG系列标准系列标准(Moving Picture ExpertGroup)ISO/IEC/JTC1/SC29的一个工作组的一个工作组WG11, 1988年年成立成立, 目前有目前有25个国家个国家(团体团体)的的200多个公司多个公司300多名成员分多名成员分10个组工作个组工作JPEG的目标是专门集中于静止图像压缩,的目标是专门集中于静止图像压缩,MPEG的目标是针对运动图像的数据压缩,但是的目标是针对运动图像的数据压缩,但是JPEG和和MPEG有密切联系有密切联系MPEG专家小组,不仅限制于数字视频压缩,音专家小组,不仅限制于数字视频压
56、缩,音频及音频和视频的同步问题都不能脱离视频压缩频及音频和视频的同步问题都不能脱离视频压缩独立进行独立进行 MPEG-1标准标准MPEG-1标准标准(ISO/IEC11172). 1992年发布。年发布。用于用于1.5Mbps数据传输率的运动图像及其伴音的数据传输率的运动图像及其伴音的编码。主要应用于编码。主要应用于 VCD,MP3音乐等音乐等MPEG-1在在JPEG和和H.261等优秀标准的基础上等优秀标准的基础上, 对对参加竞争的参加竞争的14个方案个方案,通过反复协调而得到统一通过反复协调而得到统一,从而成为先进、合理、质量高、成本低的优秀从而成为先进、合理、质量高、成本低的优秀标准标准MPEG-1促进了大规模集成电路专用芯片的发展促进了大规模集成电路专用芯片的发展,为多媒体技术和产品的繁荣立下了功劳为多媒体技术和产品的繁荣立下了功
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乐趣初二语文作文
- 滚动轴承加工工艺学考核试卷
- 上海高三语文二模作文青浦
- 弹射玩具企业生产工艺改进与创新考核试卷
- 稀土金属压延加工质量控制流程优化实践考核试卷
- 刨花板行业绿色采购与原材料供应链管理考核试卷
- 入院护理宣教 2
- 4-3钟控电位触发器
- 山东省滕州市实验高级中学2024−2025学年高一下学期第一次调研考试 数学试题(含解析)
- 四川省自贡市高新区六校2025届初三第三次联考(浙江版)生物试题试卷含解析
- 试剂售后承诺书
- 小学校本课程-生活中的陌生人教学课件设计
- 榆阳区可可盖煤矿矿山地质环境保护与土地复垦方案
- 沪教版三年级下册数学第二单元 用两位数乘除 测试卷及参考答案【培优a卷】
- 中小型病理技术团队岗位设置及绩效分配现状分析
- 防护棚验收表
- 磁粉检测试题库
- 教科版-四年级下-第一单元-快乐读书屋一:皎皎空中孤月轮 名师获奖
- 2022-2023学年天津市部分区高二(下)期中数学试卷及答案解析
- 医院侵害未成年人案件强制报告制度培训课件
- 内蒙古曹四夭钼矿床原生晕特征及深部找矿预测
评论
0/150
提交评论