DIP-Lecture7图像编码1-静止图像压缩中文数字图像处理课件-002_第1页
DIP-Lecture7图像编码1-静止图像压缩中文数字图像处理课件-002_第2页
DIP-Lecture7图像编码1-静止图像压缩中文数字图像处理课件-002_第3页
DIP-Lecture7图像编码1-静止图像压缩中文数字图像处理课件-002_第4页
DIP-Lecture7图像编码1-静止图像压缩中文数字图像处理课件-002_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章

图像编码7/23/20231

8.1图像压缩编码概述一、图像编码的目的和应用:目的:在可能的情况下尽量减少图像数据的尺寸,以便于传输、存储、管理、处理和应用。图像通信系统模型:信源编码信道编码调制信道译码信源译码原始图像信源传输信道恢复的图像噪声解调减少信息量,压缩处理找合适码型,抗信道噪声7/23/20232

8.1图像压缩编码概述一、图像编码的目的和应用:图像数据量举例:视频图像:512×512×8×25bits/s≈150Mbit/s≈19MByte/s≈70,000MB/hr VCD:650M,74Min,约需要压缩100倍!传输带宽:CableATMMobilcommunication1.5~10Mbs播放速度:Upto34Mbs10Kbs~1Mbs7/23/20233医学图像:图像种类图像特征图像数/检查数据量/检查核医学128×128×1230~601~2MBMRI256×256×12608MB超声512×521×820~2305~60MB数字减影血管造影DSA512×512×815~404~10MBCT512×512×124020MB计算机放射成像2048×2048×12216MB数字化X线摄影2048×2048×12216MB数字化X线乳腺摄影4096×4096×124128MB7/23/20234二、压缩的可能性

1.图像中的数据冗余冗余空间冗余(空间相关性,如图象的背景的相似性)时间冗余(时间相关性,如序列图象的相邻帧)结构冗余(如图象中相似的纹理)知识冗余视觉冗余信息熵冗余(编码冗余)其它冗余7/23/20235保真度编码信息保持编码平均信息方法变换方法三、分类1.从图像信息角度对编码分类特征抽取2.从图像编码方法对编码分类预测方法其它利用图像的统计特征分配码字长度,达到压缩目的,如Huffman,S-F

等△M增量调制,1D-DPCM,2D-DPCM,帧间预测,自适应编码等频带编码,阈值编码,多维技术,自适应方法像素编码行程编码,等值线编码,位平面编码等混合编码,二值/图形编码,彩色图像编码,矢量量化,金字塔编码,基于知识的编码等7/23/202361.等长码与不等长码四、图像编码的一般过程五、常用编码类型与举例映射变换量化器编码器解码器反映射原始图像信源码字恢复的图像等长码的码位长度都相等,即每一个码字均有相同的比特数,而不等长码则相反2.瞬时可译码与非瞬时可译码瞬时可译码:接收到一个码位即可译码非瞬时可译码:接收到下一码位才能译码一般用正交变换引入失真的原因7/23/202373.唯一可译码非唯一可译码4.常用编码举例例如,某种代码,c1=0,c2=1,c3=01,c4=10,则序列0011具有多意性:0011c1c3c2c1c1c2c2输入数据W0W1W2W3W4W5W6W7自然码000001010011100101110111格雷码000001011010110111101100B1码c0c1c0c0c0c1c1c0c1c1c0c0c0c0c0c1B2码c00c01c10c11c00c00c00c01c00c10c00c11S2码000110110011011110111100111101不等长码B码中的c位称为延续位,实际传输时用0或1代替B1码和B2码为非瞬时可译码选用等长码或不等长码的原则:输入数据等概率分布时用等长码,否则,出现概率大的用短码,出现概率小的用长码说明:7/23/202381.图像的熵(Entropy)(教材:page24)设数字图像像素的灰度集合为{w1,w2,……,wM},其对应的概率分别为p1,p2,……,pM,按信息论中信源熵的定义,可以定义图像的熵H

为:(bit)由上述定义可以看到,图像的熵H是表示其各个灰度级比特数的统计平均值,例如:设随机序列M由8个变量组成,等概率出现,即p1=p2=……,=p8=1/8,则:(bit)设随机序列M由8个变量组成,p1=1,p2=……,=p8=0,则:(bit) 因此,当M

等于8时,H

的范围从0到3,即H=0~log2M,其中H=3说明信号的随机程度最大。

8.4统计编码7/23/202392.图像的平均码字长度设bk

为数字图像第k

个码字ck的长度(二进制数的位数),其对应出现的概率为pk,则该数字图像的码字平均长度R定义为:(bit)3.图像的编码效率:定义数字图像编码的效率为: 在R>=H

情况下总可以设计出某种无失真编码方法,若R接近于H,则说明码编的较好,称为最佳编码。若要求编码结果R<H,则必然要丢失信息而引起图像失真。同时定义图像编码的冗余度为:7/23/2023104.图像的变长最佳编码定理定理:在变长编码中,若对出现概率大的信息赋予短码字,而对于出现概率小的信息赋予长码字,如果码字长度严格按照所对应符号出现的概率大小而逆序排列,则此种编码结果的平均码字长度一定小于其它任何排列形式得到的编码。例如:图像的熵(bit)采用等长编码:平均码长R=2(bit),编码效率h=87.5%,Rd=12.5%输入数据W1W2W3W4概率1/21/41/81/8W1W2W3W400011011W1W2W3W4010110111采用不等长编码:

(Huffman)平均码长R=7/4(bit),编码效率h=

100%,Rd=0%7/23/202311

8.4.2常用的统计编码方法1.Huffman编码(Huffman

,1952)

Huffman编码是根据可变长度最佳编码定理,应用Huffman编码算法而产生的一种编码方法。它的平均码字长度在系统的输入概率集合下,比其它唯一可译码都小。因此也称为紧凑码。Huffman编码的原则是概率大的信息用短码,而概率小的信息用长码,即:若:p1(w1)>p2(w2)>……>pM(wM)则取:b1(c1)<b2(c2)<……<bM(cM)Huffman编码的编码步骤:(1)将信源符号按概率由大到小排列,概率相同的可以任意放(2)将两个最小概率相加,形成新的概率集合,并按(1)的原则重新排队(3)重复(2)的过程,直到仅剩下两个概率为止(4)分配码字进行编码,原则是从后到前,上0下1(或上1下0)7/23/202312Huffman编码举例:第一次重排编码结果输入数据对应概率W10.4W20.3W30.1W40.1W50.06W60.040.40.30.10.10.10.40.30.20.10.40.30.30.60.4第二次重排第三次重排第四次重排01111110001000000000100110110100010101000101001011010110101001101101007/23/202313熵计算编码效率:编码效率:h=2.14/2.2=97.3%为在接收端对上述编码进行解码,可以采用树形解码方法唯一地解码,每输入一位即可确定分支情况,并自动确定码字的起止位。为此需要建立右图的解码树。平均码长:R=0.4+0.3×2+0.1×3+0.1×4+0.06×5+0.04×5=2.2bit说明:wi1011110000w1w3w6w2w4w5在解码时将输入的数码按树去分配,得到码字的切分和代码符号,例如,输入序列1011100010101从上述解码过程可以看到,虽然Huffman码不是等长码,但解码中能自动确定起止位。解码结果是唯一的。7/23/2023142.Shannon-Fano

编码编码步骤:1).将信源符号按概率由大到小排列,概率相同的可以任意放2).将概率分为近似相等的两部分3).进行编码,上半部分赋予0,下半部分赋予14).重复2).-3).直至编码完成S-F编码举例:编码结果输入数据对应概率W10.4W20.3W30.1W40.1W50.06W60.0401101111011111001101111011111111111011011100100编码效率:h=

97.3%平均码长:R=2.2bit7/23/2023153.采用B1

编码B类编码适用于灰度级概率按指数规律分布的图像,如打字图像。而S码适用于具有单调减少概率的输入信号。为说明B码的使用方法,对上述例题采用B1编码:编码结果输入数据对应概率W10.4W20.3W30.1W40.1W50.06W60.04C0C1C0C0C0C1C1C0C1C1编码效率:h=

82.3%平均码长:R=2.6bit而采用等长码时R=3,h=71.3%解码问题:编码中的C称为延续位,在传输时用1或0代替,并交替进行。例如发送了三个符号W2W5W6,传输时为:0111100101 在解码时可以逐位判断是否应截断,在隔位比特变化时应截断,而连续比特不变则延续。因此B码不是瞬时可译码。7/23/202316例:有图像f(x,y),如右图所示,灰阶为3bit,即0~7,比较几种不同编码的效果4.通过映射变换达到压缩编码0011111122333333444444445555555566667777777777777777777777777777<1>.直接将图像传输:<2>.采用S2码输入数据对应概率728/6458/6448/6436/6416/6464/6422/6402/64编码结果000110110011011110111100111101总码长为176bit平均码长为R=176/64=2.75bit编码效率:h

=89.8%图像的熵:H=2.47bit总码长为3×64=192bit平均码长为R=3bit编码效率:h

=82.3%7/23/202317<3>.采用Huffman

编码编码灰度概率重排1重排2重排3重排4重排5重排6728/6428282828283658/64881216202848/64888121636/64688816/6466864/644622/64302/6410010100000000101100111001111总码长为160bit平均码长:R=160/64=2.5bit编码效率:h

=98.8%7/23/202318<3>.先用差分映射进行变换,再用Huffman

编码差分映射:差分映射可以按行或按列进行,按行映射公式为:

y0=x0 y1=x0-x1 y2=x1-x2 ……

yi=xi-1-xi00-10000020-10000040000000500000006000-1000700000007000000070000000映射得到的差分图像如右上图所示输入数据对应概率054/6473/64-13/6461/6451/6441/6421/64差分图像的灰度概率如右下表所示差分图像的熵:H=0.99577/23/202319编码灰度概率重排1重排2重排3重排4重排5054/64545454545473/64334610-13/64333461/6422351/641241/64121/64对差分图像采用Huffman

编码的结果如下:01001011110111111001101总码长为88bit平均码长:R=88/64=1.375bit(对比:原图像无差分映射前,Huffman编码的长度:R=160/64=2.5bit)可见,经过差分映射后再进行编码,可以有效压缩编码数据。7/23/2023201.RLE编码的效率5.

行程编码(RunLengthEncoding,RLE)

适用于有较多灰度相同对象的图像,例如海洋、湖泊的卫星图像,医学图像中的细胞,染色体,材料的显微图像等。计算机中的PCX和BMP格式的图像都采用行程编码进行压缩。RLE的原理相当简单,计算效率高。

RLE编码采用整数对进行编码,例如右侧图像可以编码为(4,4)(4,1)(5,3)(4,1)(5,1)(7,2)(5,4)4444455545775555下面具体讨论RLE编码的效率和实现中的具体问题。设图像的灰度级为M,一行的长度为N,则对每一行来说,行程数最少为1,最大为N。若将数对表示为(gk,lk)的序列,用普通二进制码存放(gk,lk)序列,并设一行中的行程数为m,则描述一行像素需要的码字长度为:m(log2M+log2N)bit而直接存储原图像一行所需的位数为:Nlog2Mbit显然,只有当m<<N时,RLE的描述才是可取的。7/23/2023212.码的截断-换行问题方法1:预先存储行的长度,通过长度控制截断,缺点是长度不允许有误码例:BMP图像文件的编码BMP:文件头 位图信息 位图阵列方法2:将行的结束作为一个码对排入码流,其缺点是加长了序列长度,降低了效率。

Windows的BMP格式中支持BI-RLE8和BI-RLE4两种压缩类型的存储格式。由于使用了颜色索引表,因此可以用4位/像素存储16色的图像,用8位/像素存储256色的图像。下面介绍BI-RLE8的压缩格式:

BI-RLE8的压缩格式由两字节的数据对序列组成,第一个字节给出对应画出的连续像素的数目,而所用的颜色索引在第二字节中。如果第1个字节为0,则第个字节的含意如下:7/23/2023220: 行结束例如下面的序列:0304050600031234560002780002030202780000061E0001解压缩为:行结束图像结束04040406060606061234567878------------78781E1E1E1E1E1E1: 图像结束2: 转义后面的两个字节,用这两个字节分别表示下一像素从当前位置水平和垂直位移的距离。n(0x03<n<0xff):转义后面的n个字节,其后的n

个像素分别由这n

个字节所指定的颜色画出。必须保证这种截断是4的整数倍,不足的位数补07/23/2023233.对于二值图像,由于只有两个可能的灰度取值,在一行中相邻两个行程的值一定交替出现,因此只需要在第一个行程中标出灰度值,于是一行的行程编码为:g1l1l2……lm其中g1只有两个值,只需要1bit存储,因此描述一行的行程编码的长度为:1+m•log2Nbit而用直接编码表示则需要Nbit4.为压缩图像,可以根据各种行程长度在图像中出现的概率,用不同长度的码字表示其编码,以提高图像数据的压缩率。7/23/202324§8.5预测方法编码一、预测方法编码的类型二、DPCM的基本原理三、DPCM方法中最佳系数的确定四、DPCM方法中图像降质的类型和原因要点7/23/202325预测编码的基本原理

预测编码是根据图像数学模型利用以往的样本值对于新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差值,对这一误差值进行编码。如果模型足够好且样本序列在时间上相关性较强,那么误差信号的幅度将远远小于原始信号,从而可以用较少的电平类对其差值量化得到较大的数据压缩效果。如果能精确地预测数据源输出,那就不存在关于数据源的不确定性,因而也就不存在要传输的信息。然而没有一个实际的系统能找到其完整的数学模型,我们能找到的最好预测器是以某种最小化的误差对下一个采样进行预测的预测器。通常预测器的设计不是利用数据源的实际数学模型,因为数据源的实际数学模型是非常复杂,而且是时变的。实验结果表明以最小均方预测误差设计的预测器不但能获得最小均方预测误差,同时在视觉效果上也是比较好的7/23/202326DPCM工作原理uij为输入信号,

为根据ui-1,j、ui,j-1、ui-1,j-1对uij所作的预测值,eij为差值信号,e*ij量化后的输出信号,a1,a2,a3为预测系数7/23/202327预测方程为

量化器的输入为重建方程为预测模型的复杂程度取决于线性预测中使用以前样本的数目,样本点越多,预测器就越复杂。预测器的好坏取决于预测系数7/23/202328采用自适应系数预测编码后的重构图像a1=0.340,a2=0.664,a3=-0.005根据输入图像来确定预测系数

另外一种采用的是固定的预测系数是采用固定系数预测编码后的结果a1=0.5,a2=0.5,a3=-0.5直接采用均匀标量量化后的结果在实验中采用几种不同的预测系数

7/23/202329采用不同的预测系数的预测编码的结果

7/23/202330 上述编码均在图像空间进行操作,称为空域方法。而基于图像变换的方法称频域方法。§5.6变换方法压缩编码频域方法的基础:频域方法一般为非信息保持编码!频域方法的处理流程:构造子图像正变换重新量化符号编码合并子图像符号解码反变换输入图像压缩图像压缩图像解压图像通过可逆的线性变换将图像映射为一组变换系数,达到能量集中的目的,从而舍弃能量很小的系数,达到压缩的目的。频域方法的优点:压缩比高,视觉效果好7/23/2023311.子图像尺寸的选择原则变换编码中的主要问题:子图像尺寸的选择变换方法的选择比特分配方法子图像尺寸的选择影响到编码误差和计算的复杂度,实际中应考虑1.相邻子图像之间的相关性(冗余)降低到可接受的水平2.子图像的长和宽均为2的整数次幂一般情况下,压缩量和计算复杂度随子图像尺寸增加而增加,常用的尺寸为8×8和16×16。分块的好处:计算速度快;误差扩散小分块的问题:Gibbs现象7/23/2023327/23/202333对变换系数的重新量化,要通过保留较大系数,舍弃较小的系数而达到压缩目的,因此其截断误差与两个因素有关:

舍弃的变换系数的数量和相对重要性2.变换方法的选择3.比特分配方法(变换系数截断、量化与符号编码方法的选择)压缩并不是在变换步骤取得的,而是在量化变换的系数时取得的。因此变换的能量集中特性影响了压缩效果。单就信息集中能力而言,K-L变换最强,但计算复杂,与输入图像相关。DCT在信息集中与计算复杂度方面具有较好的综合性能,得到广泛应用。一些新的处理方法,如小波变换+零树编码;子带(subband)编码;分形(fractal);矢量量化(VQ)等具有较好的性能,正处于发展之中。

所保留系数的表示精度为确定那些系数需要保留,可以选择采用下面的准则:准则1:分区编码方法准则2:阈值编码方法7/23/202334例:直接DCT变换编码的压缩效果7/23/202335

实际使用的压缩编码方法,都是综合了各种方法而达到最高的效率。再计算机图像压缩编码方面,已经有一批标准,并在不断发展。

8.7图像压缩编码标准与JPEG压缩编码方法介绍MPEG-1标准,1992MPEG-2标准,1993H.261标准

(CCITT,1990)H.263标准MPEG-4标准,1999第1版,2000第2版MPEG-7标准,1996-1998,2001年底二值图像压缩标准静止图像压缩标准序列图像压缩标准G3G4JBIGCCITTGroup3&Group4JointBilevelImagingGroup,1992JPEGJointPictureExpertGroup,1991标准化组织:ISOITUCCITTJPEG20007/23/202336JPEG压缩编码方法介绍

JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。JPEG既适用于灰度图像也适用于彩色图像。JPEG算法与彩色空间无关,因此“RGB到YUV变换”和“YUV到RGB变换”不包含在JPEG算法中。JPEG算法处理的彩色图像是单独的彩色分量图像,因此它可以压缩来自不同彩色空间的数据,如RGB,YCbCr

和CMYK。7/23/202337

JPEG有几种模式,其中最常用的是基于DCT变换的顺序式模式,又称为基本系统。JPEG的压缩编码大致分成三个步骤:使用正向离散余弦变换(forwarddiscretecosinetransform,FDCT)把空间域表示的图变换成频率域表示的图。使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。使用霍夫曼可变字长编码器对量化系数进行编码。7/23/202338JPEG基本系统的算法框图:7/23/202339具体讲:JPEG压缩编码算法的主要计算步骤如下:正向离散余弦变换(FDCT)。量化(quantization)。Z字形编码(zig-zagscan)。使用差分脉冲编码调制(differentialpulsecodemodulation,DPCM)对直流系数(DC)进行编码。使用行程长度编码(run-lengthencoding,RLE)对交流系数(AC)进行编码。熵编码(entropycoding)。7/23/202340一、正向离散余弦变换(FDCT)的算法与特性:(1)对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。f(i,j)F(u,v)DCT7/23/202341(2)DCT变换公式:C(u),C(v)=1/

, 当u,v=0;

C(u),C(v)=1, 其他。

f(i,j)经DCT变换之后,F(0,0)是直流系数,其他为交流系数。(3)在计算中,可将两维的DCT变换变成一维的DCT变换:7/23/202342(4)DCT变换后,F(0,0)是直流系数,其它为交流系数F(u,v)F(0,0)

考虑到整幅图像中各个子图像的平均亮度接近,因此将各子图像的直流系数取出单独组合编码。而将交流系数按Z字形顺序排列,组成符号流。DC7/23/202343二、量化问题:

量化是对DCT变换后的频率系数重新进行量化,以减少非零系数的数目。量化是图像降质的主要原因。

对于有损压缩算法,JPEG算法使用均匀量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。由于人眼对低频分量的图像比对高频分量的图像更敏感,因此变换图像中左上角的量化步距要比右下角的量化步距小。7/23/202344二、量化问题:

考虑人眼对亮度信号比对色差信号更敏感,以及亮度和色差的能量集中情况不同,分别使用了两种量化表:亮度量化表色差量化表9910310011298959272101120121103877864499211310481645535247710310968563722186280875129221714566957402416131455605826191412126151402416101116

两种量化表都考虑了人眼的视觉特性。999999999999999999999999999999999999999999999999999999999999999999999999999966479999999999562624999999996626211899999999472418177/23/202345三、Z字形编排:

量化后的系数要分成两组,各子块的直流系数重新组合,而子块内的交流系数重新编排,以增加连续的“0”系数的个数,即“0”系数的游程长度,方法是按照Z字形的式样编排。将8×8的矩阵变成1×64的矢量,频率较低的系数放在矢量的顶部。6362585749483635615956504737342160555146383322205452453932231910534440312418119434130251712834229261613742282715146510编排顺序7/23/202346四、直流系数的编码方法:8×8图像块经过DCT变换之后得到的直流系数有两个特点:根据这些特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码,

Delta=DC(0,0)k-DC(0,0)k-1系数的数值比较大相邻8×8图像块的DC系数值变化不大7/23/202347重新量化的AC系数的特点是1×63矢量中包含有许多“0”系数,并且许多“0”是连续的,因此使用非常简单和直观的游程长度编码(RLE)对它们进行编码。五、交流系数的编码方法

JPEG使用了1个字节的高4位来表示连续“0”的个数,而使用它的低4位来表示编码下一个非“0”系数所需要的位数,跟在它后面的是量化非零AC系数的数值。从而节省比特数。7/23/202348六、熵编码:

JPEG使用熵编码对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。

编码中采用分组查表方式进行,将DC系数用两个字节的中间格式表示,将63个AC系数行程编码的码字也用两个字节表示:7/23/202349六、熵编码:

为了进一步提高压缩比,对得到的DC码字和AC行程码字,再进行熵编码,选用Huffman

编码,分成两步:将上述码字用熵编码的中间格式表示进行熵编码7/23/202350AC系数用两个符号表示:符号1(8Bit):行程和尺寸,即上面的(RunLength,Size)。(1)将码字用熵编码的中间格式表示符号2(8Bit):幅度值(Amplitude)。特殊的情况:(0,0)表示块结束标志(EOB)(15,0)表示ZRL当行程长度超过15时,用增加ZRL的个数来解决,所以最多可能有三个连续ZRL(3*16+15=63)。DC系数也用两个符号表示:符号1:尺寸(Size);符号2:幅度值(Amplitude)。7/23/202351例如:SizeAmplitude码字长度0001-1,112-3,-2,2,323-7~-4,4~734–15~-8,8~1545–31~-16,16~3156–63~-32,32~6367–127~-64,64~12778–255~-128,128~25589–511~-256,256~511910–1023~512,512~10231011–2047~-1024,1024~204711150-100000-2-1000000-1-1000000000000000000000000000000000000000000000012………假设前一个8×8子块DC系数的量化值为12,则本块DC系数与它的差为3

查表得Size=2,Amplitude=3,所以DC中间格式为(2)(3)AC系数接着被编码,遇到的第一个非零系数为-2,此前遇到零的个数(即RunLength)为1。查表得Size=2。所以RunLength=1,Size=2,Amplitude=-2。

AC中间格式为:(1,2)(-2)。7/23/202352

JPEG使用很简单的查表(lookuptable,page256)方法进行熵编码。编码器根据上述表格对每个符号分配代码。由于表格是事先确定的,因此译码无任何困难。可以求得这个8×8子块熵编码的中间格式为(2)(3),(1,2)(-2),(0,1)(-1),(0,1)(-1),(0,1)(-1),(2,1)(-1),EOB进行熵编码对以上子图编码为:上述8×8子块亮度信息压缩后的数据流为11011,1101101,000,000,000,111000,1010。总共31Bit,其压缩比是

64×8/31=16.5,大约每个像素用半个比特。由ZIGZAG扫描和前一子块的DC系数预测后该子图的DCT系数排列如下:

3,0,-2,-1,-1,-1,0,0,-1,EOB;7/23/202353

JPEG压缩中,首先使用了变换编码DCT,然后对DC系数使用了预测编码DPCM,AC系数使用了行程编码RLE,对二者编码结果都进一步使用了熵编码Huffman,可见几乎所有传统的压缩方法在这里都用到了。这几种方法的结合正是产生JPEG高压缩比的原因。讨论:压缩效率(bits/pixel)图象质量0.25~0.50中~好,可满足某些应用0.50~0.75好~很好,满足多数应用0.75~1.5极好,满足大多数应用1.5~2.0与原始图象几乎一样压缩效率与图象质量之间的大致关系:7/23/202354JPEG图例:原图压缩9.2倍7/23/202355JPEG图例:压缩18.4倍原图7/23/202356JPEG图例:压缩27.6倍原图7/23/202357JPEG图例:压缩55.2倍原图7/23/202358序列图像压缩编码标准介绍MPEG-1标准,1992MPEG-2标准,1993H.261标准

(CCITT,1990)H.263标准MPEG-4标准,1999第1版,2000第2版MPEG-7标准,1996-1998,2001年底序列图像压缩标准7/23/202359序列图像压缩编码标准介绍H.261标准:H.261是用于视频会议和可视电话业务的以p×64kbps,p=1,…,30的速率在综合业务数字网(ISDN)上传送视频信号的压缩标准。例如:64kbps(p=1)

用于低端的可视电话业务,其中视频信号传输占用48kbps的带宽,剩下的16kbps用于音频信号;384kbps(p=6)或更高的速率用于高端的视频会议业务。在ISDN信道上最高传输率为19.2Mbps(p=30),足以传送VHS质量的视频信号。H.261颁布于1990年,主要用于双向视频通信,允许的最大编码延迟为150ms。它的输入图象格式为通用(同时适用于625线和525线的视频标准)中间格式CIF(352x288),低端可用其四分之一大小的QCIF(176x144)格式,帧率为30,15,10,7.5四种,隔行(interlaced)视频,宽高比4:3。7/23/202360

H.261的编码方案是基于DCT和DPCM的预测编码算法,运动每桢图象分成8x8的子块,再组成宏块、块组,宏块由4个8×8的亮度块和2个8×8的色度块组成,每个块组由3×11个宏块组成。每幅QCIF图象有3个块组,每幅CIF图象有12个块组,形成一个多层次的块结构。

H.263是在H.261的基础上针对低码率(低于64kbp)视频压缩提出的标准,与H.261不同的是采用半象素精度运动补偿算法和变长编码,并引进了16种可协商的编码选项用于提高压缩性能和支持新增加的功能。7/23/202361

MPEG-1算法与H.261算法相似,另外有一些自己的特点。它在1.2Mbps(视频信号)速率下压缩和解压缩CIF格式的视频质量与VHS记录的模拟视频质量相当。它是一种通用标准,在这个标准中,规定了编码位流的表示语法和解码方法,提供的支持操作包括运动估计、运动补偿预测、DCT、量化和变长编码等。与JPEG不同的是其中没有定义产生合法数据流所需的详细算法,为编码器设计提供了大量的灵活性。

MPEG-1的特点有:(1)随机存取,(2)支持快速双向搜索,(3)允许大约1秒的编码/解码延迟,比H.261的150ms的严格限制松得多。MPEG序列图像压缩编码原理MPEG(MotionPictureExpertGroup)7/23/202362MPEG的原理框图SSDCT量化器变长编码缓冲存储反量化IDCT滤波器运动补偿帧存储器运动估值图像输入编码输出帧间预测值量化后的帧间预测误差帧间预测误差量化间隔值运动矢量重建图像数据7/23/202363

l基本思想:帧内变换采用DCTJPEG,帧间采用运动补偿

(Motioncompensation)。lMPEGI码流分为I帧、P帧、

B帧三种,并规定1秒内至少两个I帧,以便能有效随机存取。MPEGI常用方式:(1)IPP..IPP...PIPP...Pl

帧内编码:JPEG(I帧)l

运动补偿:88小块的DCT系数在前帧找最相似块l

帧间编码(P帧) (1)运动系数(p,q) (2)差值Dk=Bk-Bk-1(p,q)

l

MPEG-I是1992年通过的视频压缩标准,用于CIF格式的视频在速率约1.5Mbps的各种数字存储介质(如CD-ROM,DAT,硬盘及光驱等)上的编码表示,主要应用在交互式多媒体系统中。7/23/202364(2)IBBPBBPBBP

前后双向预测,质量更好。

MPEG-II

是1993年通过的视频压缩标准,用于高清晰度视频和音频的编码,也包含用于可视电话中的超低码率(8-32kbps)的压缩编码。MPEG-II是MPEG-I的兼容扩展,广泛应用于各种速率(2-20Mbps)和各种分辨率情况下的场合。MPEG-II采用多尺度(多分辨率)以适应不同的使用需求l

Baselayer低采样l

Enhancementlayer增加细节。7/23/202365ProductionSMPTE240标准4×601,消费类HDTVCCIR601,StudioTVCIF,消费类影像设备用途80Mb/s62.70M1920×1080×30High60Mb/s47.00M1440×1152×30High144015Mb/s10.40M720×480×30Mean4Mb/s3.05M352×240×30Low最大带宽象素/秒分辨率和帧频尺度(Level)MPEGII各级别的分辨率7/23/202366当前序列图像编码压缩研究的热点:l

Mobilecommunication,narrowtelecomchannels<64kbits/sl

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论