第五章图像编码与压缩_第1页
第五章图像编码与压缩_第2页
第五章图像编码与压缩_第3页
第五章图像编码与压缩_第4页
第五章图像编码与压缩_第5页
已阅读5页,还剩245页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字图像处理DigitalImageProcessing河北大学数学与计算机学院马颍丽MaYingliCMCHBU第五章图像编码与压缩5.1概述5.2统计编码5.3预测编码5.4变换编码5.5二值图像编码5.6新型的图像压缩编码方法5.7图像压缩编码标准MaYingliCMCHBU知识要点信息论中的有关概念信息,信息量,信息熵,冗余度编码方法统计编码预测编码变换编码混合编码静态图像压缩标准JPEG、JBIG、JPEG2000等MaYingliCMCHBU5.1概述数据编码的目的各异信息保密信息的压缩存储与传输等数码相机—图像编码与压缩技术成功的范例。本章主要介绍静态图像压缩编码的原理、应用及有关的国际标准。MaYingliCMCHBUMaYingliCMCHBU5.1.1数据压缩的基本概念数据压缩以较少的数据量表示信源以原始形式所代表的信息目的在于节省存储空间、传输时间、信号频带或发送能量等。MaYingliCMCHBU信源编码的基本概念

图像数据压缩的目的是在满足一定图像质量条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。MaYingliCMCHBUMaYingliCMCHBU图5.1数据压缩系统组成图

MaYingliCMCHBU数字通信系统模型信源信源编码信道编码调制传输信道噪声解调信道解码信源解码信宿MaYingliCMCHBU压缩检、纠错MaYingliCMCHBU熵(Entropy)代表信源所含的平均信息量。若信源编码的熵大于信源的实际熵,则信源中的数据一定存在冗余度。冗余数据的去除不会减少信息量。信息量与数据量的关系可由下式表示

I

D

du

(5.1)MaYingliCMCHBU5.1.2图像编码压缩的必要性图像信号的数据量V(volume)(byte,B)

:

V

w·h·d/8

(5.2)w、h、d分别表示图像数据量(字节,byte,B)、图像宽度width(像素数,pel)、图像高度height(像素数,pel)、图像深度depth(位,bit)。图像的尺寸为:w·h。MaYingliCMCHBUMaYingliCMCHBU典型图像的数据量

图像种类图像参数数据量二值传真图像A4(210297mm)大小、172823762色分辨率501KB灰度图像512512,8bit灰度等级256KBVGA图像640480256色300KBCIF视频图像352288256色,亮度取样率为3MHz,亮度和两色差按4∶1∶1取样,亮色量化位数共12bit,帧频29.97,按1s计算4.3MBHDTV亮度信号1280720,量化位数为8bit,帧频30Hz,按1s计算52.7MBMaYingliCMCHBU5.1.3图像编码压缩的可能性一般图像中存在着以下数据冗余因素:

编码冗余像素间的相关性形成的冗余视觉特性和显示设备引起的冗余MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.1.4图像编码压缩的技术指标常用的图像压缩技术指标:

图像熵与平均码长(Entropyandaveragecodelenthgh)图像冗余度与编码效率(Codingefficiency)压缩比(Compressionratio)客观评价SNR

主观评价MaYingliCMCHBU

1、

熵:信源的平均信息量

设图像像素灰度级表为s={s1,s2,…,sq},其概率分布为P(s)={p(s1),p(s2),…,p(sq)},则信源的熵为MaYingliCMCHBUs作为灰度,共q级,出现概率均等时,p(si)=1/q,

当灰度只有两级时,即si=0,1,且0出现概率为p1,1出现概率为p2=1-p1,其熵MaYingliCMCHBU

当p1=1/2,p2=1-p1=1/2时,H(s)=1为最大值。如图所示。MaYingliCMCHBU熵的性质:(1)熵是一个非负数,即总有H(s)≥0。(2)当其中一个符号sj的出现概率p(sj)=1时,其余符号si(i≠j)的出现概率p(si)=0,H(s)=0。(3)当各个si出现的概率相同时,则有最大平均信息量为log2q。(4)熵值总有H(s)≤log2q。MaYingliCMCHBU2、平均码长:码字长度的数学期望3、冗余度定义为:MaYingliCMCHBU4、编码效率定义为:

冗余度接近于0,或编码效率接近于1的编码称为高效码。MaYingliCMCHBU5、压缩比:若原始图象的平均比特率为n,编码后的平均比特率为nd,则压缩比C定义为:MaYingliCMCHBU

6、客观评价—信噪比SNR定义为:MaYingliCMCHBU表5.1图像质量的主观评价等级Score评价Notes5优秀图像质量非常好4良好图像质量高,有很小的干扰但不影响观看3中等图像质量可接受,但有一些干扰,对观看稍有妨碍2差图像质量差,对观看有妨碍1很差,劣图像质量很差,无法观看7、主观评价:MaYingliCMCHBU图像编码主、客观评价的内在关系图像类型高分辨率广播电视普通数字广播电视数据库图像会议电视传输数码率客观评价SNR主观评价74Mb/s≧48dB≧4.5分34Mb/s≧43dB≧4.0分识别图像≧36dB≧3.0分64kb/s≧30dB≧2.5分压缩后图像MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.1.5数据压缩方法的分类1.无损压缩(LosslessCompression):Huffman编码Shannon编码游程编码算术编码轮廓编码MaYingliCMCHBU2、有损压缩(LossyCompression)预测编码变换编码混合编码现代压缩编码方法:分形编码模型基(Model-based)编码MaYingliCMCHBU图像编码/压缩主要分无损图像压缩和有损图像压缩两大块,按其发展历程可分为:第一代压缩编码

八十年代以前,主要是根据传统的信源编码方法。第二代压缩编码

八十年代以后,突破信源编码理论,结合分形、模型基、神经网络、小波变换等数学工具,充分利用视觉系统生理心理特性和图像信源的各种特性。图像压缩方法的分类MaYingliCMCHBU像素编码变换编码预测编码位平面编码增量调制熵编码算术编码DCT变换DPCM调制第一代压缩编码其他编码行程编码MaYingliCMCHBU子带编码模型编码分层编码分型编码第二代压缩编码MaYingliCMCHBU预测编码混合编码变换编码……DFT、DCT变换ADPCMDPCM调制……KLT、WHT、SLT、WT变换数据压缩其他编码增量调制无损压缩有损压缩统计编码Huffman、Shannon编码算术编码行程编码轮廓编码MaYingliCMCHBU5.2统计编码统计编码根据信源的概率分布特性,分配具有惟一可译性的可变长码字,降低平均码字长度,以提高信息的传输速度,节省存储空间。基本原理在信号概率分布情况已知的基础上,概率大的信号对应的码字短,概率小的信号对应的码字长,这样就降低了平均码字长度。MaYingliCMCHBU可变码长最佳编码定理在变长编码中,如果码字长度严格按照信号中符号出现概率大小的相反顺序排列,则平均码字长度一定小于其他符号顺序排列方式的平均码字长度。MaYingliCMCHBU英文字母出现相对频率字母ABCDEFGHIJKLM百分比8.21.52.84.312.72.22.06.17.00.20.84.02.4字母NOPQRSTUVWXYZ百分比6.77.51.90.16.06.39.12.81.02.40.22.00.1MaYingliCMCHBU英文字母出现相对频率MaYingliCMCHBU国际莫尔斯电码符号SymbolABCDEFGHIJKLMCode.--…-.-.-.....-.--.…....----.-.-..--SymbolNOPQRSTUVWXYZCode-.---.--.--.-.-.…-..-…-.---..--.----..Symbol0123456789Code-----.----..---…--….-…..-….--...---..----.Symbol.,?:;-/“Code.-.-.---..--..--..---…-.-.-.-…--..-..-..-.MaYingliCMCHBU5.2.1Huffman编码1.前缀码(PrefixCode)一组唯一可译码的任一个码字都只与一种信号存在对应关系。为保证唯一可译码,任一码字都不能是其他码字的前缀。例:f(i)={0,10,110,111}MaYingliCMCHBU5.2.1Huffman编码1.前缀码(PrefixCode)4层树形结构的编码情况MaYingliCMCHBUf(i)={0,10,110,111}为其子树。MaYingliCMCHBU2.Huffman编码算法:①将图像的灰度等级按概率大小进行升/降序排序。②在灰度级集合中取两个最小概率相加,合成一个概率。③新合成的概率与其他的概率成员组成新的概率集合。④在新的概率集合中,仍然按照步骤②~③的规则,直至新的概率集合中只有一个概率为1的成员。这样的归并过程可以用二叉树描述。⑤从根节点按前缀码的编码规则进行二进制编码。MaYingliCMCHBUMaYingliCMCHBU

信号源s={s1,s2,s3,s4,s5,s6},其概率分布为p1=0.4p2=0.3p3=0.1p4=0.1p5=0.06p6=0.04,求最佳Huffman码。例方法:将信源符号按出现概率从大到小排成一列,然后把最末两个符号的概率相加,合成一个概率。MaYingliCMCHBU把这个符号的概率与其余符号的概率按从大到小排列,然后再把最末两个符号的概率加起来,合成一个概率。重复上述做法,直到最后剩下两个概率为止。从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码,如对概率大的赋予码元0,对概率小的赋予码元1。MaYingliCMCHBUHuffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04MaYingliCMCHBUHuffman编码例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.4Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=1Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S2=00Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=011Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=0100Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=01010Huffman编码MaYingliCMCHBU例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=01011Huffman编码MaYingliCMCHBU编码结果例输入S1S2S3S4S5S6输入概率0.40.30.10.10.060.04代码10001101000101001011码长123455MaYingliCMCHBU1001S1S2111000S5S4S3S6编码效率:MaYingliCMCHBU【例5.1】第1行和第2行列举了一个信源的统计特性结果如第三行所示符号集{xi}x1

x2

x3

x4

x5

x6

概率分布{pi}0.400.200.120.110.090.08Huffman编码101000000101100111MaYingliCMCHBUHuffman编码示意图上图所示为建立码的过程下图所示为从根开始,经各中间节点到叶节点的路径采用二进制编码的情况MaYingliCMCHBU【例】MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU3.Huffman编码的性能优点:实现Huffman编码的基础是统计源数据集中各信号的概率分布。Huffman编码在无失真的编码方法中效率优于其他编码方法,是一种最佳变长码,其平均码长接近于熵值。缺点:当信源数据成分复杂时,庞大的信源集致使Huffman码表较大,码表生成的计算量增加,编译码速度相应变慢不等长编码致使硬件译码电路实现困难。上述原因致使Huffman编码的实际应用受到限制。MaYingliCMCHBU4.图像的Huffman编译码系统MaYingliCMCHBUClaudeElwoodShannon

(1916–2001)ClaudeElwoodShannon(April30,1916–February24,2001)wasanAmerican

mathematician,electronicengineer,andcryptographerknownas"ThefatherofInformationTheory".MaYingliCMCHBU5.2.2Shannon编码与Fano编码5.2.2Shannon编码与Fano编码1.Shannon提出了将信源符号依其概率降序排列,用符号序列累积概率的二进制表示作为对信源的唯一可译编码。其应用于图像编码的步骤如下:(1)将N个灰度级xi按其概率递减进行排列。(2)求概率分布pi的第i个灰度级的二进制位数ni。

(5.10)

(3)计算与pi相对应的累积概率Pi,把与Pi相对应的二进码和接下去与pk(k>i)相应的码相比较,前面的ni位至少有一位以上的数字是不同的。MaYingliCMCHBU【例5.2】由表5.3计算该信源的Shannon编码平均码字长度为2.92,较Huffman编码为长。MaYingliCMCHBU2.Fano编码步骤(1)将图像灰度级xi其概率大小按递减顺序进行排序。(2)将xi分成两组,使每组的概率和尽量接近。给第一组灰度级分配代码“0”,第二组分配代码“1”。(3)若每组还是由两个或以上的灰度级组成,重复上述步骤,直至每组只有一个灰度级为止。MaYingliCMCHBU【例5.3】图5.6以表5.3的信源为例说明Fano编码。MaYingliCMCHBU5.2.3算术编码MaYingliCMCHBUMaYingliCMCHBU5.2.3算术编码在信源各符号概率接近的条件下,算术编码是一种优于Huffman编码的方法。【例】根据信源的概率分布进行算术编码。已知信源的概率分布为求二进制序列01011的编码。MaYingliCMCHBU解:步骤如下:(1)二进制信源只有x1=0和x2=1两种符号,相应的概率为pc=2/5,pe=1-pc=3/5(2)设s为区域左端起始位置,e为区域右端终止位置,l为子区的长度,则符号“0”的子区为[0,2/5),子区长度为2/5;符号“1”的子区为[2/5,1],子区长度为3/5。举例2MaYingliCMCHBU(3)随着序列符号的出现,子区按下列公式减少长度:新子区左端=前子区左端+当前子区左端×前子区长度新子区长度=前子区长度×当前子区长度设初始子区为[0,1],步序为step,则编码过程参见实例。可见,最后子区左端起始位置MaYingliCMCHBU最后子区长度最后子区右端终止位置编码结果为子区起始位置与终止位置之中点

=0.0011。所以,二进序列的算术编码为0011。MaYingliCMCHBU算术编码算法的计算步骤实例stepx

s

l

1002/5210+(2/5)×(2/5)=4/25(2/5)×(3/5)=6/25302/5+0×6/25=4/25(6/25)×(2/5)=12/125414/25+(2/5)×(12/125)=124/625(12/125)×(3/5)=36/62551124/625+(2/5)×(36/625)=692/3125(36/625)×(3/5)=108/625MaYingliCMCHBU举例2MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU算术编码的过程:MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU算术编码与Huffman编码的比较:MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.3预测编码预测编码的基本思想:在某种模型的指导下,根据过去的样本序列推测当前的信号样本值,然后用实际值与预测值之间的误差值进行编码。如果模型与实际情况符合得比较好且信号序列的相关性较强,则误差信号的幅度将远远小于样本信号。MaYingliCMCHBUMaYingliCMCHBU图像差值幅度的概率分布MaYingliCMCHBU5.3.1预测编码基本原理对实际值与预测值之间的误差值进行编码差分脉冲编码调制DifferentialPulseCodeModulationDPCMMaYingliCMCHBU图5.8DPCM系统的组成

MaYingliCMCHBU5.3.2线性自适应预测编码假设经扫描后的图像信号x(t)是一个均值为零、方差为的平稳随机过程。线性预测就是选择ai(i

1,2,…,N

1)使预测值

并且使差值en的均方值为最小。预测信号的均方误差(MSE)定义为

E{en}=E{(xn

-x′n)2} MaYingliCMCHBU设计最佳预测的系数ai,采用MMSE最小均方误差准则。可以令定义xi和xj的自相关函数

R(i,j)=E{xi,xj}写成矩阵形式为Yule-Walker方程组

若R(i)已知,该方程组可以用递推算法来求解ai。MaYingliCMCHBU通过分析可以得出以下结论:图像的相关性越强,压缩效果越好。当某个阶数已使E{eN,eN1}0时,即使再增加预测点数,压缩效果也不可能继续提高。若{xi}是平稳m阶Markov过程序列,则m阶线性预测器就是在MMSE意义下的最佳预测器。MaYingliCMCHBU图5.9当前像素与邻近像素的位置关系MaYingliCMCHBU常用预测器方案前值预测:用x0同一行的最近邻近像素来预测

=x0一维预测:如上图中的x1、x5。二维预测:如上图中的x1、x2、x3、x4、x5、x6、x7等。三维预测MaYingliCMCHBU5.3.3自适应预测编码自适应预测预测参数根据信号的统计特性来确定,以达到最佳预测预测编码的优点直观快捷、便于实现预测编码的缺点压缩比不够高MaYingliCMCHBU5.4变换编码5.4.1变换编码的基本原理

通过数学变换可以改变信号能量的分布,从而压缩信息量。以傅里叶变换的概念说明合理的变换可以改变信号能量分布的基本原理。MaYingliCMCHBU变换可以改变信号能量的分布(MaYingliCMCHBU5.4.2变换编码的系统结构图5.10变换编码系统正交变换量化编码传输/储存解码反交换图像输入图像输出MaYingliCMCHBU5.4.3变换编码的实现在变换编码中有以下几个问题值得注意:图像变换方法的选取子图像大小的选取常用的图像编码方法区域编码阈值编码混合编码MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU变换编码MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU帧内混合编码原理图变换编码变换编码变换编码预测编码信道传输/存储预测编码反变换

f(1,n)F(1,n)e(1,n)e‘(1,n)f(2,n)F(2,n)e(2,n)e‘(2,n)f(M,n)F(M,n)e(M,n)e‘(M,n)f‘(1,n)f‘(2,n)f‘(M,n)…….……..……………………….MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUDCT变换:正变换:逆变换:其中:MaYingliCMCHBUMaYingliCMCHBUHuffman:42bits;

编码效率32.8%Huffman:16bits;编码效率:12.5%例:原图像为:DCT变换除以量化系数,取整MaYingliCMCHBUMaYingliCMCHBUDCT变换编码实例原图解压图MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.4.4整数小波变换与图像压缩量化器的设计是决定图像保真度的关键环节,而传统的DCT和经典小波变换在图像变换后会产生浮点数,因而必须对变换后的数据进行量化处理,这样就产生不同程度的失真。新一代的整数小波变换(又叫第二代小波变换)采用提升方法能够实现整数变换,因而能够实现图像的无损压缩,显然它是一种很适合于医学等图像的压缩方法。

新的静态图像压缩标准JPEG2000中采用了基于提升方法的整数小波变换。MaYingliCMCHBU提升方法构造小波分为分裂、预测和更新3个步骤。1.分裂(split)将一原始信号序列sj按偶数和奇数序号分成两个较小的、互不相交的小波子集sj-1和dj-1:2.预测(predict)由于数据间存在相关性,因而可以定义一个预测算子P,用P(sj-1)来预测

dj-1.。这样可用相邻的偶数序列来预测奇数序列。用dj-1与P(sj-1)的差值代替dj-1,则数据量要比原始dj-1要小得多。3.更新(update)上述两个过程一般不能保持原图像中的某些整体性质(如亮度),为此我们要构造一个U算子去更新s,使之保持原有数据集的某些特性。MaYingliCMCHBU5.5二值图像编码只有“白”(用“0”表示)和“黑”(用“1”表示)两个灰度级称之为二值图像(binaryimage)。二值图像通常是由人为产生的,如由文字组成的文档文件、表格、工程图纸、地图等。一幅二维图像按位平面进行分解可以得到若干个二值图像,因而二值图像的编码方法为逐进编码模式奠定了基础。MaYingliCMCHBU5.5.1跳跃空白编码(skipblankcoding)将图像的每一条扫描线分成若干等长的段,每段有m个像素,一般m=8~12。这些扫描线段的组成可能出现二类情况:(1)全是“0”像素。这种线段称为“空白块(blank)”,常表示二值图像的背景成分。编码时“空白块”用码字“0”表示。(2)全是“1”像素或由“0”、“1”像素混合而成。编码时,这种线段用“1”加直接编码表示。MaYingliCMCHBU上述方法很容易推广的在二维情形中。将图像划分为若干个子图像。当子图像像素全为0时,编码为“0”;否则,子图像的编码首位为“1”,其余码位(codeposition)采用像素的直接编码表示。MaYingliCMCHBU5.5.2游程长度编码RLC(RunLengthCoding)一种简单的无损编码技术,它改变连续出现相同字符的表达方式,以降低码长。传真的二值图像中,连“0”或连“1”总是成串出现,称为“白游程”和“黑游程”。非二值的相同连续数据串,同样简化为两个符号:一个符号代表数据,第二个代表串长。游程长度编码一般不直接单独使用,通常配合其他编码方式使用来提高压缩效果。MaYingliCMCHBU二维行程编码要解决的核心问题是:

将二维排列的像素,采用某种方式转化成一维排列的方式。之后按照一维行程编码方式进行编码。(a)(b)两种典型的二维行程编码的排列方式MaYingliCMCHBU如果按照行扫描的顺序排列的话,数据分布为:行程编码为:(3,130),(1,129),(1,134),(1,133),(1,129),(4,130),(1,129),(1,134),(1,133),(5,130),(1,129),(2,132),(2,130),(1,129),(2,130),(1,129),(2,130),(2,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,129),(1,131),(1,130),(1,127),(1,128),(1,127),(1,128),(1,127),(1,128),(2,132),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,127),(1,125),(2,128),(1,126),(1,130),(2,131)数据量为:46*(3+8)=506(bit)(98.83%)数据量:64*8=512(bit)【例】MaYingliCMCHBU如果按照列扫描的顺序排列的话,数据分布为:行程编码为:数据量为:42*(3+8)=462(bit)(92.03%)(3,130),(1,129),(2,127),(1,125),(1,127),(4,130),(2,128),(1,126),(1,125),(4,130),(2,127),(1,129),(1,128),(5,129),(1,128),(1,129),(1,128),(2,134),(1,132),(1,130),(1,131),(2,127),(1,126),(2,133),(1,132),(1,130),(1,129),(1,128),(1,129),(1,130),(1,129),(2,130),(1,129),(1,131),(1,132),(1,133),(1,131),(3,130),(1,129),(1,130),(2,132),(1,131)MaYingliCMCHBU如果按照方式(a)扫描的顺序排列的话,数据分布为:行程编码为:数据量为:43*(3+8)=473(bit)(94.22%)(7,130),(2,130),(4,129),(2,130),(1,129);(1,127),(1,128),(1,127),(1,129),(1,131),(1,130),(1,132),(2,134),(2,133),(1,132),(1,130),(1,129),(1,128),(1,127),(1,128),(1,127),(1,128),(1,127),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,131),(1,129),(2,130),(1,129),(3,130),(1,129),(1,130),(2,132),(2,131),(1,130),(1,126),(2,128),(2,127)MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU该压缩算法常用于二值图像编码中,如位平面编码(bit-planecoding)MaYingliCMCHBUMaYingliCMCHBU5.6新型的图像压缩编码方法经典的编码方法利用去除图像数据的相关性等方法对图像进行压缩,其压缩效果受到一定的限制。模型编码利用对图像建模的方法对图像参数进行估计。由于参数的数据量远远少于图像的数据量,因而用模型编码对压缩数据量极其有效。常见的模型编码有:分形编码(fractalcoding)自适应网格编码(self-adaptivemeshcoding)MaYingliCMCHBU5.6.1分形(fractal)的基本概念与经典的编码方法相比,分形编码在思路上有新的突破,其压缩比高出一般编码方法2~3个数量级。压缩过程时间长但解压缩速度快的特点将使其在大数据量、高质量的多媒体应用、高速网络等场合中发挥重要的角色。分形的基本思想来源于数学上对客观世界一些现象的自相似性描述。分形是一种由许多与全局相似的局部所构成的形体。对于集合A,如果描述其中的点需要d个坐标,则称该集合A是d维的,即dim(A)=d

(5.37)在分形几何学中,d可以扩展为分数,这时d称为分维。MaYingliCMCHBU5.6.2分形压缩的基本方法分形压缩将图像分解成若干子图像,利用图像的仿射变换可以寻找出子图像间的自相似性。仿射变换是指对子图像进行旋转、伸缩、位移变换。仿射变换的特性有:(1)仿射变换的逆变换也是仿射变换。(2)仿射变换是线性变换。(3)两平行线经过仿射变换后仍然是平行线,所以平行四边形经仿射变换后变成另外一个平行四边形。(4)可以通过变换参数求解变换后平面图形的面积与原平面图形面积的比值。(5)选择合适的参数,仿射变换为相似变换。MaYingliCMCHBU通过用数据量极小的系数代替数据量较大的实际像素值而将图像表示成压缩形式。目前采用全自动的分形压缩,对灰度图像一般可以达到4:1~100:1,对彩色图像压缩比还可以更高些。压缩时间较慢,而解压缩时间极快。用户常常关心的是解压缩时间,因而分形压缩的这种不对称性对使用数据的用户是很有用的。如果采用这种技术制作VCD、DVD将使其具有广泛的市场前景。分形压缩的另一个特点是压缩特性与分辨率无关利用分形压缩的图像可以按不同分辨率实现无级缩放而计算量相同。MaYingliCMCHBUMaYingliCMCHBU5.7图像压缩编码标准在静态图像压缩编码标准中,比较著名的有JPEG、JBIG等标准。视频可看成是一幅幅不同但相关的静态图像的时间序列。静态图像的压缩技术和标准可以直接应用于视频的单帧图像。介绍:适用于静态图像的JPEG标准和JBIG标准新的JPEG2000压缩国际标准MaYingliCMCHBU5.7.1彩色与灰度图像压缩标准JPEG1.JPEG算法与系统JPEG基本系统JPEG扩展系统信息保持压缩系统MaYingliCMCHBU2.JPEG基本系统每个单独的彩色图像分量的编码算法:①将量化精度为8位的待压缩图像分成若干个88样值子块,做基于88子块的DCT。②根据最佳视觉特性构造量化表,设计自适应量化器并对DCT的频率系数进行量化。③为了增加连续的0系数的个数,对量化后的系数进行Z字形重排。④用Huffman码作变字长熵编码器对量化系数进行编码,进一步压缩数据量。MaYingliCMCHBUJPEG编/解码器算法框图MaYingliCMCHBU上述算法的几点说明(1)彩色空间转换问题(2)量化

—最佳的亮度量化表和色度量化表。(3)Z字形重排(4)DCT系数的编码(5)JPEG位数据流MaYingliCMCHBU亮度量化表1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399MaYingliCMCHBU色度量化表17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999MaYingliCMCHBUDCT系数的Z字形排列MaYingliCMCHBU3.JPEG的视频应用与硬件实现尽管JPEG标准是基于彩色静止图像压缩而提出的,但对于压缩视频的帧内图像也十分有效。每秒可处理2700万个像素的单片JPEG编/解码器芯片,已能实时处理常规电视图像。M-JPEG(Motion-JPEG)技术即运动静止图像压缩技术。这种技术广泛应用于可精确到帧编辑和多层图像处理的非线性编辑领域。M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现。MaYingliCMCHBU5.7.2二值图像压缩标准JBIG1980年CCITTT.4建议文件传真三类机(G3)的一维编码标准MH,作为二维编码标准的改进相对元地址指定编码(MR)。1994年CCITTT.6建议的作为四类传真机(G4)标准编码方案:二次改进Huffman编码(MMR)。二值图像通过MH,MR和MMR等典型的编码方法已在传真机等图像通信中得到广泛应用。将一幅二维图像按位平面进行分解可以得到若干个二值图像。一幅灰度为256级的图像可以被分解为8幅二值图像。支持分层图像传送的编码方法的基本思路是:首先传送过去一幅分辨率较低的概要图像,然后随传送数据的不断到来所得到图像质量逐步提高。MaYingliCMCHBU支持分层图像传送的编码方法的基本思路MaYingliCMCHBU必须满足的条件和对之进行评价的项目(1)无损编码。(2)即使接受端不具有帧存储器,系统也能在顺序传送模式下正常工作。(3)编码和解码操作是实时的。(4)压缩和恢复两个功能在时间和复杂性方面是对称的。(5)具有比MMR更高的压缩能力。(6)利用同一个数据库可以同时支持顺序和逐层两种压缩传送模式。(7)不允许使用全帧预扫描(单路执行算法)。(8)在64Kbps传输速率下能够做到解码。(9)鲁棒性。MaYingliCMCHBU5.7.3JPEG2000静态图像压缩标准1.JPEG2000标准制定的目的JPEG2000标准的目标是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗图像、电子图书馆、传真、Internet网上服务和保安等方面的应用。JPEG2000还将彩色静态画面采用的JPEG编码方式与2值图像采用的JBIG编码方式统一起来,成为对应各种图像的通用编码方式。由于JPEG2000它的特性及功能显著,且支持旧版本的标准,因此在需要有较好的图像质量、较低的比特率或者是一些特殊特性的要求(渐进传输和感兴趣区域编码等)时,JPEG2000将是最好的选择。MaYingliCMCHBUJPEG2000的应用领域可大致分成两个方面:一方面面向传统的JPEG市场如打印、扫描、数字摄像、遥感等另一方面面向一些新兴的应用领域如网路传输、彩色传真、无线通讯,医疗影像、电子商务等。MaYingliCMCHBU2.JPEG2000标准提供的主要特征

JPEG2000标准提供了一套新特征这些特征对于一些新产品(如数码相机)和应用(如互联网)是非常重要的。它把JPEG的顺序模式、渐进模式、无损模式和分层模式四种模式集成在一个标准之中。JPEG2000放弃了以DCT为主的区块编码方式采用以小波转换为主的多解析编码方式。JPEG2000标准中无损压缩和有损压缩所采用的小波分别是基于提升方案的(5,3)整数小波和Daubechies(9,7)整数小波。编码端以最大的压缩质量和最大的图像分辨率压缩图像在解码端可以从码流中以任意的图像质量和分辨率解压图像,最大可达到编码时的图像质量和分辨率。MaYingliCMCHBUJPEG2000的最主要的特征(1)高压缩率。(2)无损压缩和有损压缩。(3)渐进传输。(4)感兴趣区域压缩。(5)码流的随机访问和处理。(6)容错性。(7)开放的框架结构。(8)基于内容的描述。MaYingliCMCHBU3.JPEG2000的基本框架和实现(1)对原始图像数据进行离散小波变换(DWT)(2)对变换后的小波系数进行量化(3)对量化后的数据熵编码(4)最后形成输出码流。解码器是编码器的逆过程。MaYingliCMCHBU本章小结理解和掌握

数字图像编码与压缩的理论基础是本章的重点。熟知各种国际标准的特点、应用领域。了解各种编/解码器的原理和软件和硬件实现。注意数字图像编码与压缩技术的最新发展和应用前景。MaYingliCMCHBU(1)数据压缩的基本概念编码冗余使图像编码压缩成为可能。像素间的相关性形成的冗余视觉特性和显示设备引起的冗余MaYingliCMCHBU(2)数据压缩方法无损压缩有Huffman编码Shannon编码游程编码算术编码和轮廓编码等。有损压缩有预测编码变换编码。混合编码是将预测编码与变换编码相结合现代压缩编码方法有分形编码模型基编码等。MaYingliCMCHBU(3)预测编码基本原理是利用当前像素与邻近像素的位置关系计算预测信号,系统所传递的是误差信号,这种差值的概率分布集中在小数值上,大差值的概率极小,有利于用可变码长编码以减少传送的信息量。按利用的邻近像素的不同,可以是前值预测一维预测二维预测三维预测等。MaYingliCMCHBU(4)变换编码基本原理是利用坐标变换,如果选择的变换坐标与图像特征相匹配就可以大大压缩二维数据。重要的变换编码方法是离散余弦变换DCT,它有快速算法,二维变换可以转化为二次一维变换。DCT变换后的系数相对集中,还可以进一步进行量化,从而更大幅度地压缩图像的数据量。MaYingliCMCHBU(5)无损压缩降低编码的冗余,在不减少传送信息量的条件下减少了码率。主要类型有Huffman编码算术编码游程编码MaYingliCMCHBU(6)JPEG标准适用于静止图像。它将图像分解为8×8的样值子块用DCT进行变换、量化、Z字形重排用霍夫曼码对量化系数进行编码,进一步压缩数据量。新的发展JPEG2000标准MaYingliCMCHBUEndofChapter5MaYingliCMCHBUThankYouMaYingliCMCHBU5.8混合编码设计思想:每一种编码方式都有其擅长的一点,以及局限的一点,混合编码的思想就是将两种以上的编码方式的优点进行综合,达到提高编码效率的目的。MaYingliCMCHBU混合编码实现的可能性及有效性分析回顾一下讲过的几个内容的特点:1)行程编码:擅长于重复数字的压缩。2)Huffman编码:擅长于像素个数分布不均匀情况下的编码。3)DCT变换:擅长分离视觉敏感与不敏感的部分。MaYingliCMCHBU例:

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157

行程编码:4a3b2c1d5e7f

(共6*(8+3)=66Bits)17666MaYingliCMCHBU

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157Huffman编码:

f=01e=11a=10b=001c=0001d=0000

1010101010001001001000100010000111111111101010101010101

(共7*2+5*2+4*2+3*3+2*4+1*4=53bits)

1766653MaYingliCMCHBU

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157Hufman与行程编码混合:

41030012000110000511701

(共:3+2+3+3+3+4+3+4+3+2+3+2=35bits)176665335

100%37.5%30.1%

9.9%MaYingliCMCHBU图像压缩的实例1一次小波变换DCT变换.行程编码Huffman编码一次小波变换Huffman编码变字长行程编码2差值编码MaYingliCMCHBUMaYingliCMCHBU复原图原图算法1信噪比:66.02压缩比:11.83:1MaYingliCMCHBU复原图原图信噪比:64.55压缩比:26.50:1算法2现代压缩编码示例原图JPEG100:1混合编码400:1混合编码600:1MaYingliCMCHBU5.9图像压缩标准二值图像压缩标准静止图像压缩标准视频和运动图像压缩标准MaYingliCMCHBU5.8.1二值图像压缩标准MaYingliCMCHBU5.8.2静止图像压缩标准1.JPEG

联合图像专家组(JointPhotographicExpertsGroup),为单帧彩色图像压缩编码制定静止图像压缩标准JPEG。图像尺寸可在1~65535行/帧、1~65535像素/行的范围内。它在较低的计算复杂度下能提供较高的压缩比与保真度。它采用四种编解码模式串行(Sequential)DCT(DiscreteCosineTransform)方式、逐渐浮现式(progressive)DCT方式、无失真(Lossless)方式和分层(Hierarchical)方式。该系统的核心属于变换编码编码过程,分为图像分割二维DCT变换、量化、熵编码等几个阶段。由于JPEG优良的品质,网站上百分之八十的影像都采用JPEG标准。随多媒体应用领域的急增,传统JPEG压缩技术已无法满足人们对多媒体影像资料的要求,更高压缩率以及更多新功能的新一代静态影像压缩技术JPEG-2000就诞生了。MaYingliCMCHBU2.JPEG2000JPEG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论