图像压缩讲稿_第1页
图像压缩讲稿_第2页
图像压缩讲稿_第3页
图像压缩讲稿_第4页
图像压缩讲稿_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于图像压缩第一张,PPT共七十七页,创作于2022年6月8.5 有损压缩概述牺牲图像复原的准确度以换取压缩能力的增加如果产生的失真可以容忍,则压缩能力的增加是有效的压缩率较大有损预测编码变换编码第二张,PPT共七十七页,创作于2022年6月8.5.1 有损预测编码在各类编码方法中,预测编码是比较易于实现的,如微分(差分)脉冲编码调制(DPCM)方法。在这种方法中,每一个象素灰度值,用先前扫描过的象素灰度值去减,求出他们的差值,此差值称为预测误差,预测误差被量化和编码与传送。接收端再将此差值与预测值相加,重建原始图像象素信号。由于量化和传送的仅是误差信号,根据一般扫描图像信号在空间及时间邻域内

2、个象素的相关性,预测误差分布更加集中,即熵值比原来图象小,可用较少的单位象素比特率进行编码,使得图象数据得以压缩。 有损预测编码:直接对像素在图像空间进行操作,称为空域方法第三张,PPT共七十七页,创作于2022年6月8.5.1 有损预测编码量化器将预测误差映射成有限范围内的输出 ,确定了与有损预测编码相联系的压缩和失真的量。 +-符号编码压缩图像输入图像enfn fn量化器预测器预测编码器第四张,PPT共七十七页,创作于2022年6月符号编码压缩图像+-en输入图像fn量化器预测器 fn+修正后的预测编码器+ +符号解码预测器解压缩图像压缩图像 fn预测解码器第五张,PPT共七十七页,创作于

3、2022年6月3.预测编码/解码步骤:编码步骤第一步:压缩头处理第二步:对每一个符号:f(x,y),由前面的值,通过预测器,求出预测值第三步:求出预测误差 e(x,y) = f(x,y) -第四步:对误差e(x,y)编码,作为压缩值。重复二、三、四步解码步骤第一步:对头解压缩第二步:对每一个预测误差的编码解码,得到预测误差 e(x,y)。第三步:由前面的值,得到预测值 。第四步:误差e(x,y),与预测值 相加,得到解码f(x,y)。重复二、三、四步第六张,PPT共七十七页,创作于2022年6月Delta调制预测器量化器这里:颗粒噪声:斜率过载缓变区快变区第七张,PPT共七十七页,创作于202

4、2年6月预测器预测器基本思想:选择最小化均方预测误差作为预测的最佳准则最优准则是最小化均方预测误差,设量化误差可以忽略( e n e n ),并用m个先前像素的线性组合进行预测上述限制并不是必需的,但它们都极大地简化了分析,也减少了预测器的计算复杂性.基于上述条件的预测编码方法称为差值脉冲码调制法(DPCM)第八张,PPT共七十七页,创作于2022年6月i最优预测器(续)假设用1个4阶线性预测器:f x, y 1 f x, y 1 2 f x 1, y 1 3 f x 1, y 4 f x 1, y 1来预测通常,预测系数的和要小于或等于1。即上述限制是确保预测器的输出能够落到灰度级的允许范围

5、内减少传输噪声的影响.减小DPCM解码器对输入噪声的敏感性是很重要的,因为单个差错会传播到所有以后的输出。这样,解码器的输出会变得不稳定imi 1 1第九张,PPT共七十七页,创作于2022年6月例:预测技术的对比预测器1:预测器3:预测器4:预测器2:最佳预测器:选择最小化均方预测误差为最佳准则水平梯度垂直梯度考虑对单色图像进行DPCM编码产生的预测误差假设量化误差为0,即 en en定义下列4个线性预测器,并使用其中1个:第十张,PPT共七十七页,创作于2022年6月例:预测技术的对比1阶3阶结论:随着预测器阶数的增加误差减少了2阶4阶第十一张,PPT共七十七页,创作于2022年6月量化器

6、基本思想:减少数据量的最简单的办法是将图像量化成较少的灰度级,通过减少图像的灰度级来实现图像的压缩。这种量化是不可逆的,因而解码时图像有损失。量化器t=q(s)是s的奇函数断点定义了函数的不连续性,被称为量化器的判决和重构级阶梯量化函数第十二张,PPT共七十七页,创作于2022年6月Es ti 最优量化量化器的设计就是要在给定优化准则和输入概率密度函数p(s)的条件下选择最优的si和ti。 优化准则可以是统计的或心理视觉的准则如果用最小均方量化误差2 作为准则,且p(s)是个偶函数,那么最小误差条件为s is i 1 s t i p s ds 0其中对于任意的L,满足上列公式的si和ti在均方

7、误差意义下是最佳的;相应的量化器称为L层的Lloyd-Max量化器LLi 0si ti ti 1 / 2si si判定层在重构层之间的一半处i 0i 1,2,3., 12q是一个奇函数的结果2ti ti第十三张,PPT共七十七页,创作于2022年6月Lloyd_Max量化器定义1)要达到最小误差的条件有两个:a)每个决策级si正好落在两个相邻重构级ti 、ti+1的中点。 0 i = 0si = (ti + ti+1) / 2 i = 1,2,.,L/2 1 i = L/2且si = si t-i = ti (q为奇函数)inputs1s2=6S(L/2)-1outputstt1t2=4t(L

8、/2)-t(L/2)S-(L/2)-1t = q(s)t3 =8b)每个重构级 ti 落在两个相继决策级si区间的 p(s)(概率密度函数)的质心上。第十四张,PPT共七十七页,创作于2022年6月2)以上两个条件构成一个方程组,必须通过迭代才能求解决策级si和重构级ti。3)对于任何满足两个最小误差条件有的L、si和ti,在均方误差意义上是最优的,相应的量化器被称为:L级 Lloyd_Max量化器4)由于对于多数p(s),得到一个符合最优量化两个条件的解是困难的,因此这些解可通过数字来产生。单位方差的拉普拉斯概率密度函数的劳埃德-马克斯量化器第十五张,PPT共七十七页,创作于2022年6月最

9、优量化总结实际应用表明,2级量化器(例如:delta调制)所产生的由于斜率过载而造成的解码图中边缘模糊的程度比4级和8级量化器的程度要高 具有步长的最优均匀量化器在具有相同输出可靠性的条件下能提供比固定长度编码的Lloyd-Max量化器更低的码率Lloyd-Max量化器和最优均匀量化器都不是自适应的,但如果根据图像局部性质调解量化值也能提供效率可以较细量化缓慢变化区域而较粗量化快速变化区域。这可同时减少颗粒噪声和斜率过载,且码率增加很少。这也会增加量化器的复杂性第十六张,PPT共七十七页,创作于2022年6月量化和复原例子:DPCM结果图像使用3阶预测器 f x, y 0.75f x, y10

10、.75f x1, y0.5f x1, y12层Lloyd-Max量化器自适应量化方法:在4个可能的量化器中选择最好的一个4层Lloyd-Max量化器8层Lloyd-Max量化器 a),c),e):2级,4级,8级劳埃德量化 b),d),f):2级,4级,8级自适应量化第十七张,PPT共七十七页,创作于2022年6月量化和复原例子:标定过的DPCM结果图像第十八张,PPT共七十七页,创作于2022年6月量化和复原例子:标定过的DPCM结果图像图a图b图c图d图e图f图a到f中差异图像的rms误差注明了不同的预测器和量化器2层自适应量化器的均方误差与4层Lloyd-Max量化器相近4层自适应量化器

11、的均方误差小于8层Lloyd-Max量化器有损DPCM均方根误差第十九张,PPT共七十七页,创作于2022年6月8.5.2 变换编码图像变换会使图象信号能量在空间重新分布,其中低频成分占据能量的绝大部分,而高频成分所占比重很小,根据统计编码的原理,能量分布集中,熵值最小,可实现平均码长最短。变换编码的基本原理是将原来在空域描述的图像信号,变换到另外一些正交空间中去,用变换系数来表示原始图像,并对变换系数进行编码。一般来说在变换域里描述要比在空域简单,因为图像的相关性明显下降。尽管变换本身并不带来数据压缩,但由于变换图像的能量大部分只集中于少数几个变换系数上,采用量化和熵编码则可以有效地压缩图像

12、的编码比特率。第二十张,PPT共七十七页,创作于2022年6月有损压缩8.5.2 变换编码基于图像变换的编码方法。称为频域方法用可逆的线性变换(如傅里叶变换)将图像映射成1组变换系数,然后将这些系数量化和编码大多数图像变换得到的系数值都很小,这些系数可以较粗地量化,或忽略不计虽然失真很小,信息仍然不能完全复原,所以还是有损压缩第二十一张,PPT共七十七页,创作于2022年6月子图分解图像变换量化编码变换编码系统对每子图像的象素进行解相关或用少量的系数包含尽量多的信息原则:粗量化包含少量信息的系数通常使用变长编码第二十二张,PPT共七十七页,创作于2022年6月图像变换将空域中的信号变换到另外一

13、个域,即使用该域中的一组基函数的线性组合来合成任意函数单位正交基函数(相同基函数内积为1,不同基函数的内积为0)使用这组基函数的线性组合得到任意函数f(x,y),每个基函数的系数就是f(x,y)与该基函数的内积第二十三张,PPT共七十七页,创作于2022年6月图像变换图像变换的目的在于:1. 使图像处理问题简化;2.有利于图像特征提取;3. 有助于从概念上增强对图像信息的理解图像变换通常是一种二维正交变换。一般要求: 1. 正交变换必须是可逆的; 2. 正变换和反变换的算法不能太复杂; 3. 正交变换的特点是在变换域中图像能量将集中分布在低频率成分上,边缘、线状信息反映在高频率成分上,有利于图

14、像处理因此正交变换广泛应用在图像增强、图像恢复、特征提取、图像压缩编码和形状分析等方面第二十四张,PPT共七十七页,创作于2022年6月变换选择常用的变换编码所使用的正交变换有离散傅立叶变换(DFT)、离散余弦变换(DCT)和沃尔什-哈达马变换(WHT)。变换后图象能量更加集中,在量化和编码时,结合人类视觉心理因素等,采用“区域取样”或“阈值取样”等方法,保留变换系数中幅值较大的元素,进行量化编码,而大多数幅值小或某些特定区域的变换系数将全部当作零处理。第二十五张,PPT共七十七页,创作于2022年6月变换选择考虑大小为NN的图像f(x,y),该图像的正向离散变换T(u,v)表示为N 1 N

15、1T u, v f x, ygx, y, u, vx0 y 0u,v=0,1,2,N-1。给定T(u,v),f(x,y)可用离散反变换得到N 1 N 1f x, y T u, vhx, y, u, vu 0 v0 x,y=0,1,2,N-1g(x,y,u,v)和h(x,y,u,v):正向和逆向变换核函数T(u,v):变换系数第二十六张,PPT共七十七页,创作于2022年6月变换选择如果下列等式成立,正向核函数g(x,y,u,v)称为是可分离的gx, y, u, v g1 x, ug2 ( y, v)如果g1在函数上等于g2,则核函数是对称的gx, y, u, v g1 x, u g1 ( y,

16、 v)如果上述等式对逆向核函数h(x,y,u,v)成立,则h(x,y,u,v)也具有上述结论第二十七张,PPT共七十七页,创作于2022年6月1 j 2 uxvy / NNbi x pi u bi y pi v 1核函数:DFT变换(离散傅里叶变换的简化版本(M=N)gx, y, u, v 2 ehx, y, u, v e j 2 uxvy / NWHT变换gx, y, u, v hx, y, u, v 1i0Nm-1DCT变换第二十八张,PPT共七十七页,创作于2022年6月N=4时Walsh-Hadamard基函数WHT的重要意义:所有核的值均为+1或-1,实现上简单N=4时的核,每个块包

17、括4416个子方块白色表示1,而黑色表示1左上角的块:u=v=0,x,y=0,1,2,3时g(x,y,0,0)的值:1左上第二块:u=0,v=1,x,y=0,1,2,3时g(x,y,0,1)的值第二十九张,PPT共七十七页,创作于2022年6月N=4时DCT基函数g的值不是整数0为黑,1为白,较大的g值,对应较浅的灰度级第三十张,PPT共七十七页,创作于2022年6月三种变换举例 例8.19说明:512512大小的单色图像先将原图分割为88大小的子图像,然后用DFT,WHT和DCT的一种,表示每一个子图像将得到所有系数的50%去掉,即丢掉32个系数对截取的系数阵列进行逆变换,保留32个系数丢掉

18、的32个系数,对复原图像质量的视觉影响很小产生的均方误差rmsDFTrmsWHTrmsDCT第三十一张,PPT共七十七页,创作于2022年6月三种变换举例DFT还原图像WHT还原图像DCT还原图像rmsDFT=1.28rmsWHT=0.86rmsDCT=0.68均方误差近似等于被丢弃的变换系数的方差之和!第三十二张,PPT共七十七页,创作于2022年6月三种变换举例 结论DCT的信息压缩能力比DFT和WHT的能力要强WHT是最容易实现的DCT在信息压缩能力和计算复杂性之间提供了很好的平衡,因此,许多变换编码系统都是以DCT变换为基础的对比其它方法,DCT变换具有使用单一的集成电路就可以实现,可

19、以将最多的信息包装在最少的系数之中可使“分块噪声”的块效应最小,这些分块噪声是由子图像之间的可见边界造成第三十三张,PPT共七十七页,创作于2022年6月三种变换举例结论(续)DFT的n点周期性造成边界中断,当DFT系数被截尾或量化时,边界值以分块噪声的形式出现,即相邻子图像之间的边界变得可见。而DCT变换不会产生固有的边界中断DFTDCT第三十四张,PPT共七十七页,创作于2022年6月变换编码子图像尺寸选择子图像尺寸是影响变换编码误差和计算复杂度的一个重要因素一般满足下列2个条件相邻子图像之间的相关(冗余)减少到可接受子图像的长和宽都是2的整数次幂。这主要是为了简化对子图像变换的计算最常用

20、的子图像尺寸是88和1616第三十五张,PPT共七十七页,创作于2022年6月把图像分割为nn的子图像(n=2,4,8,16和32)计算每幅子图像的变换,截取75的系数,对截取后的阵列进行反变换得到当图像尺寸大于88,WHT和DCT曲线变得比较平缓,而DFT曲线下降得较快。对更大的n值,DFT将穿过WHT并逼近DCT当图像尺寸为22时,3条曲线交于同1点。此时各变换都只保留了4个系数中的1个(25),即直流分量子图像尺寸选择一个试验例子:子图像的大小影响变换编码误差和计算复杂性。大多数应用中,图像被进一步分割以便将相邻子图像之间的相关性减少到可接受程度。子图像增大,压缩水平增加,但计算复杂性增

21、加。一般8*8,16*16第三十六张,PPT共七十七页,创作于2022年6月(1)子图像尺寸的选择a)8*8大小子图像压缩结果b)误差图像c)放大的局部图像d)2*2子图像e)4*4子图像f)8*8子图像第三十七张,PPT共七十七页,创作于2022年6月(2)比特分配截断误差和2个因素有关:截除的变换系数的数量和相对重要性用来表示所保留系数的精度在大多数变换编码系统中,保留的系数是根据最大值方差进行选择,称为区域编码,或根据系数从大到小选择,称为门限编码。对变换后的系数进行截取、量化和编码的整个过程通常称为比特分配。使用8*8DCT系数的12.5%对源图像进行近似的结果a),c),e) 门限编

22、码结果(误差小)b),d),f) 区域编码结果第三十八张,PPT共七十七页,创作于2022年6月典型的区域模板 具有最大方差的变换系数携带着图像大部分信息并在编码处理的过程中应该保留下来。区域取样的目的是“选择要保留的系数”。处理可看成每个T(u,v)与相应的区域模板中的元素相乘。对区域取样过程中保留的系数必须进行量化和编码。因此,区域模板有时表示成对每个系数编码的比特数。两种分配方案:给系数分配相同的比特数给系数不均匀地分配几个固定数目的比特数(a)(b)区域编码最大方差的系数通常被定位在图像变换的原点周围。第三十九张,PPT共七十七页,创作于2022年6月典型的阈值模板 和 系数排序序列对

23、任何子图像,最大量级的变换系数对重构子图像的品质具有最大的影响.因为不同子图像的最大系数的位置是变化的,所以通常将 (u,v)T(u,v) 的元素重新排列成一个一维行程编码.门限编码第四十张,PPT共七十七页,创作于2022年6月有3种基本途径对一幅变换后的子图像进行门限处理(即生成子图像门限模板函数) 对所有的子图像使用单一的全局门限; 对不同图像的压缩等级不同. 对每幅图像使用不同的门限; 对每幅子图像丢弃相同数目的系数,编码率恒定. 门限随子图像中每个系数的位置函数的变化而变化. 编码率变化,但是可以将门限处理和量化过程结合起来.门限编码第四十一张,PPT共七十七页,创作于2022年6月

24、是 取阈值和量化近似,Z是变换的归一化矩阵 使用下式代替(u,v)T(u,v), 将取阈值和量化结合起来(2)门限编码量化第四十二张,PPT共七十七页,创作于2022年6月(a)一条门限编码量化曲线对Z(u,v)赋予某个常数c(b) JPEG编码标准中的DCT量化步长矩阵Z (2)门限编码量化第四十三张,PPT共七十七页,创作于2022年6月门限编码结果比较a)采用JPEG标准模板Z(u,v) 压缩率34:1 rms :3.42像素b)标准模板Z(u,v) *4 压缩率67:1 rms :6.33像素第四十四张,PPT共七十七页,创作于2022年6月变换编码其它编码方法子带(subband)编

25、码小波编码分形(fractal)编码矢量量化(vector quantization,VQ)编码统计编码/熵编码第四十五张,PPT共七十七页,创作于2022年6月8.6 图像压缩标准相关的国际组织 ISO(International StandardizationOrganization,国际标准化组织)ITU(International Telecommunication Union,国际电信联盟),前身是CCITT(国际电话电报咨询委员会)相关工作覆盖了从二值到灰度(彩色)值的静止和运动图像采用的大部分基本技术前面已经介绍,主要包括预测和变换编码技术第四十六张,PPT共七十七页,创作于20

26、22年6月制定图像标准的国际组织: ISO(国际标准化组织)CCITT(国际电报电话咨询委员会)联合组织下进行制定的标准的类型(三类): (1) 二值图像压缩标准:面向传真而设计连续调图像压缩标准:(2) 静止帧黑白、彩色压缩:面向静止的单幅图像(3) 连续帧黑白、彩色压缩:面向连续的视频影像图像压缩标准第四十七张,PPT共七十七页,创作于2022年6月二值图像压缩标准G3和G4这两个标准是由CCITT的两个小组负责制定的,最初是CCITT为传真应用而设计的。G3采用了非自适应、1-D行程编码技术,对每组N行扫描线中的后N-1行也可使用2-D行程编码。G4是G3的一种简化版,其中只使用2-D行

27、程编码。G3的压缩率一般为15:1G4的压缩率一般比G3高1倍第四十八张,PPT共七十七页,创作于2022年6月JBIG这个标准由上述2合组织的二值图联合组(joint bilevel imaging group,JBIG)于1991年制定的。因为G3和G4是基于非自适应技术的,所以对半色调灰度图像编码时常产生扩展,JBIG的目标就是采用一种自适应技术解决这个问题。编码效率提高了,对于打印字符的扫描图像,压缩比可提高1.1-1.5倍,对计算机生成的打印字符图像,压缩比可提高5倍。对抖动或半色调图像,压缩比可提高2-30倍。二值图像压缩标准第四十九张,PPT共七十七页,创作于2022年6月静止图

28、像压缩标准JPEG(Joint Picture Expert Group)由ISO和CCITT联合成立的专家组负责制定静态图像(彩色与灰度图像)的压缩算法定义了3种编码系统基于DCT的有损编码基本系统,可用于绝大多数压缩应用场合用于高压缩比、高精确度或渐进重建应用的扩展编码系统用于无失真应用场合的无损系统JPEG对录像机质量的静止图像的压缩率一般可达到25:1第五十张,PPT共七十七页,创作于2022年6月JPEG基本系统编码器框图源图像DCT正变换量化器熵编码器压缩图像表说明表说明压缩过程DCT计算量化变长码赋值第五十一张,PPT共七十七页,创作于2022年6月具体压缩过程先把整个图像分解成

29、多个88的图像块;88的图像块经过DCT变换后,低频分量都集中在左上角,高频分量则分布在右下角(DCT变换类似于低通滤波器),因为低频分量包含了图像的主要信息,所以可以忽略高频分量,达到压缩的目的;使用量化操作去掉高频分量,量化操作就是将某一个值除以量化表中的对应值。由于量化表中左上角的值较小,而右下角的值较大,这样达到保持低频分量,抑制高频分量的目的;在左上角的低频分量中,F(0,0)代表了直流(DC)系数,即88子块的平均值。由于两个相邻图像块的DC系数相差很小,所以采用差分编码DPCM,其它63个元素是交流(AC)系数,采用之字型(zig-zag)顺序进行行程编码,使系数为0的值更集中;

30、 在得到DC码字和AC行程码字后,为了进一步提高压缩比,再进行熵编码,采用了Huffman编码第五十二张,PPT共七十七页,创作于2022年6月静止图像压缩标准JPEG(joint picture expert group)图像应用系统要想与JPEG兼容,必须要支持其基本系统。在视觉效果不受到严重损失的前提下,对灰度图像压缩算法可以达到15到20的压缩比。如果在图像质量上稍微牺牲一点的话,可以达到40:1或更高的压缩比。如果处理的是彩色图像,JPEG算法首先将RGB分量转化成亮度分量和色差分量,同时丢失一半的色彩信息(空间分辨率减半)。然后,用离散余弦变换来进行变换编码,舍弃高频的系数,并对余

31、下的系数进行量化,以进一步减小数据量。最后,使用行程长度编码和Huffman编码来完成压缩任务。JPEG解压缩过程就是JPEG压缩过程的逆过程,这使得算法具有对称性。第五十三张,PPT共七十七页,创作于2022年6月JPEG2000相对于原始JPEG标准,在对连续色调静止图像的压缩方面以及对压缩数据的访问方面提供了更大的灵活性。该标准是以小波编码技术为基础的。该标准在1997年开始征集提案,1999年形成草案,2000年开始使用。静止图像压缩标准第五十四张,PPT共七十七页,创作于2022年6月8.6.3视频压缩标准视频压缩标准基本概念电视会议标准H.261、H.263MPEG标准MPEG-1

32、、MPEG-2、MPEG-4、MPEG-7和MPEG-21第五十五张,PPT共七十七页,创作于2022年6月连续帧图像的定义连续帧图像压缩的基本思想帧间运动补偿预测编码技术H.261标准MPEG1/2/4/7标准运动图像压缩标准第五十六张,PPT共七十七页,创作于2022年6月1. 连续帧图像的定义由多幅尺寸相同的静止图像组成的图像序列,被称为连续帧图像。与静止帧图像相比,连续帧图像多了一个时间轴,成为三维信号,因此连续帧图像也被称为三维图像。运动图像压缩标准第五十七张,PPT共七十七页,创作于2022年6月2. 连续帧图像压缩的基本思想基于如下基本假设:在各连续帧之间存在简单的相关性平移运动

33、。一个特定画面上的像素量值:1)可以根据同帧附近像素来加以预测,被称为:帧内编码技术2)可以根据附近帧中的像素来加以预测,被称为:帧间编码技术运动图像压缩标准 压缩的基本思想通过减少帧间图像数据冗余,来达到减少数据量、压缩连续帧图像体积的目的将连续帧图像序列,分为参考帧和预测帧,参考帧用静止图像压缩方法进行压缩,预测帧用于对帧差图像进行压缩由于帧差图像的数据量大大小于参考帧的数据量,从而可以达到很高的压缩比第五十八张,PPT共七十七页,创作于2022年6月3. 帧间运动补偿预测编码技术帧间预测编码+-熵编码帧间预测器运动补偿压缩图像块输入图像块enfnfn运动补偿预测帧间误差图像运动补偿预测图

34、像运动图像压缩标准第五十九张,PPT共七十七页,创作于2022年6月向前预测双向预测前一帧当前帧前一帧当前帧下一帧I 帧(Intra-picture) : 不进行预测、进行帧内编码的编码帧(参考帧);P帧(Predicted-picture):通过向前预测得到的误差编码帧;B帧(Bidirectional-picture):通过双向预测得到的误差编码帧.因图像序列存放在存储器中,可以使用下一帧.运动图像压缩标准第六十张,PPT共七十七页,创作于2022年6月编码中的运动补偿运动补偿概念 以对帧间运动的估算为基础的,若物体均在空间上有一位移,那么用有限的运动参数来对帧间的运动加以描述,如:对于像

35、素的平移运动,可用运动矢量来描述。一个来自前一编码帧的运动补偿预测像素,就能给出一个当前像素的最佳预测。预测误差和运动矢量一同参与编码。由于一些运动矢量之间的空间相关性通常较高,因此,一个像素的运动矢量,可以代表一个相邻像素块的运动。实现中,画面一般划分成一些不连接的像素块(在MPEGl和MPEG2标准中一个像素块为1616像素),对于每一个这样的像素块,只估算一个运动矢量。运动图像压缩标准第六十一张,PPT共七十七页,创作于2022年6月运动图像压缩标准一种基于运动补偿视频压缩的DPCM/DCT编码器第六十二张,PPT共七十七页,创作于2022年6月MPEG帧的分类MPEG 的画面组(GOP

36、)第六十三张,PPT共七十七页,创作于2022年6月MPEG帧的分类由于画面内容有连贯性,因此当前画面的内容可以看作是前面画面内容的位移(运动)。运动矢量画面各处相应的位移量(幅度、方向)各有不同,因此画面应细分成块(宏块),以宏块为单位,找出两帧画面中相应宏块之间的位移量-运动矢量第六十四张,PPT共七十七页,创作于2022年6月画面的重新排序GOP(Group of Pictures)例0B1B2I3B4B5P6B7B8P9B10I画面的显示顺序是:画面的编码顺序是:B B I B B P B B P B I0 1 2 3 4 5 6 7 8 9 10I B B P B B P B B I

37、 B2 0 1 5 3 4 8 6 7 10 9因此,每一个GOP中的画面在编码前和解码后都必须重排序第六十五张,PPT共七十七页,创作于2022年6月电视会议标准H.261标准 应用范围:电视会议 主要编码技术:DCT变换向前运动补偿预测Zig-zag排序霍夫曼编码IPPPPPPIPPP.第六十六张,PPT共七十七页,创作于2022年6月电视会议标准H.263标准应用范围:可视电话主要编码技术:DCT变换双向运动补偿预测Zig-zag排序霍夫曼编码IBBPBBPBBIBBP . . . .第六十七张,PPT共七十七页,创作于2022年6月多媒体压缩标准MPEG系列标准(Moving Pict

38、ure ExpertGroup)ISO/IEC/JTC1/SC29的一个工作组WG11, 1988年成立, 目前有25个国家(团体)的200多个公司300多名成员分10个组工作JPEG的目标是专门集中于静止图像压缩,MPEG的目标是针对运动图像的数据压缩,但是JPEG和MPEG有密切联系MPEG专家小组,不仅限制于数字视频压缩,音频及音频和视频的同步问题都不能脱离视频压缩独立进行第六十八张,PPT共七十七页,创作于2022年6月MPEG-1标准MPEG-1标准(ISO/IEC11172). 1992年发布。用于1.5Mbps数据传输率的运动图像及其伴音的编码。主要应用于 VCD,MP3音乐等MPEG-1在JPEG和H.261等优秀标准的基础上, 对参加竞争的14个方案,通过反复协调而得到统一,从而成为先进、合理、质量高、成本低的优秀标准MPEG-1促进了大规模集成电路专用芯片的发展,为多媒体技术和产品的繁荣立下了功劳第六十九张,PPT共七十七页,创作于2022年6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论