数字图像处理 第05章 图像编码与压缩_第1页
数字图像处理 第05章 图像编码与压缩_第2页
数字图像处理 第05章 图像编码与压缩_第3页
数字图像处理 第05章 图像编码与压缩_第4页
数字图像处理 第05章 图像编码与压缩_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章图像编码与压缩IMAGECODINGCOPRESSION知识要点●信息论中的有关概念信息,信息量,信息熵,冗余度●编码方法统计编码预测编码变换编码混合编码●静态图像压缩标准JPEG、JBIG、JPEG2000等5.1

概述数据编码的目的各异信息保密信息的压缩存储与传输等数码相机图像编码与压缩技术成功的范例。本章主要介绍静态图像压缩编码的原理、应用及有关的国际标准。5.1.1数据压缩的基本概念数据压缩以较少的数据量表示信源以原始形式所代表的信息目的在于节省存储空间、传输时间、信号频带或发送能量等。数据压缩系统组成图

数字通信系统模型信源信源编码信道编码调制传输信道噪声解调信道解码信源解码信宿熵(Entropy)代表信源所含的平均信息量。若信源编码的熵大于信源的实际熵,则信源中的数据一定存在冗余度。冗余数据的去除不会减少信息量。信息量与数据量的关系可由下式表示

I

D

du

(5.1)5.1.2图像编码压缩的必要性图像信号的数据量V(volume)(byte,B):

V

w·h·d/8

(5.2)w、h、d分别表示width(pel)、height(pel)、depth(bit)。ImageSizeisw·h。典型图像的数据量

图像种类图像参数数据量二值传真图像A4(210

297mm)大小、1728

2376

2色分辨率501KB灰度图像512

512,8bit灰度等级256KBVGA图像640

480

256色300KBCIF视频图像352

288

256色,亮度取样率为3MHz,亮度和两色差按4∶1∶1取样,亮色量化位数共12bit,帧频29.97,按1s计算4.3MBHDTV亮度信号1280

720,量化位数为8bit,帧频30Hz,按1s计算52.7MB5.1.3图像编码压缩的可能性一般图像中存在着以下数据冗余因素:

编码冗余像素间的相关性形成的冗余视觉特性和显示设备引起的冗余5.1.4图像编码压缩的技术指标常用的图像压缩技术指标:

图像熵与平均码长(Entropyandaveragecodelenthgh

)图像冗余度与编码效率(Codingefficiency)

CompressionratioSNR

主观评价图像质量的主观评价等级

Score评价Notes5优秀图像质量非常好4良好图像质量高,有很小的干扰但不影响观看3中等图像质量可接受,但有一些干扰,对观看稍有妨碍2差图像质量差,对观看有妨碍1很差,劣图像质量很差,无法观看图像编码主、客观评价的内在关系

图像类型高分辨率广播电视普通数字广播电视数据库图像会议电视传输数码率客观评价SNR主观评价74Mb/s≧48dB≧4.5分34Mb/s≧43dB≧4.0分识别图像≧36dB≧3.0分64kb/s≧30dB≧2.5分压缩后图像5.1.5数据压缩方法的分类1.无损压缩(LosslessCompression):Huffman编码Shannon编码游程编码算术编码轮廓编码有损压缩(LossyCompression)预测编码变换编码混合编码现代压缩编码方法:分形编码模型基(Model-based)编码表图象高效编码法图象高效编码法常规编码法标准法自适应法标准法行程编码轮廓编码亚取样编码法自适应法自适应法标准法5.2统计编码统计编码根据信源的概率分布特性,分配具有惟一可译性的可变长码字,降低平均码字长度,以提高信息的传输速度,节省存储空间。基本原理在信号概率分布情况已知的基础上,概率大的信号对应的码字短,概率小的信号对应的码字长,这样就降低了平均码字长度。5.2.1Huffman编码1.前缀码(PrefixCode)4层树形结构的编码情况2.Huffman编码算法:①将图像的灰度等级按概率大小进行升序排序。②在灰度级集合中取两个最小概率相加,合成一个概率。③新合成的概率与其他的概率成员组成新的概率集合。④在新的概率集合中,仍然按照步骤②~③的规则,直至新的概率集合中只有一个概率为1的成员。这样的归并过程可以用二叉树描述。⑤从根节点按前缀码的编码规则进行二进制编码。Huffman编码示意图左图所示为建立码的过程右图所示为从根开始,经各中间节点到叶节点的路径采用二进制编码的情况编码过程举例第1行和第2行列举了一个信源的统计特性结果如第三行所示符号集{xi}x1

x2

x3

x4

x5

x6

概率分布{pi}0.400.200.120.110.090.08Huffman编码1010000001011001113.Huffman编码的性能优点:实现Huffman编码的基础是统计源数据集中各信号的概率分布。Huffman编码在无失真的编码方法中效率优于其他编码方法,是一种最佳变长码,其平均码长接近于熵值。缺点:当信源数据成分复杂时,庞大的信源集致使Huffman码表较大,码表生成的计算量增加,编译码速度相应变慢不等长编码致使硬件译码电路实现困难。上述原因致使Huffman编码的实际应用受到限制。4.图像的Huffman编译码系统5.2.2Shannon编码与Pano编码1.Shannon提出了将信源符号依其概率降序排列,用符号序列累积概率的二进制表示作为对信源的唯一可译编码。其应用于图像编码的步骤如下:(1)将N个灰度级xi按其概率递减进行排列。(2)求概率分布pi的第i个灰度级的二进制位数ni。(5.10)(3)计算与pi相对应的累积概率Pi,把与Pi相对应的二进码和接下去与pk(k>i)相应的码相比较,前面的ni位至少有一位以上的数字是不同的。【例5.2】由表5.3计算该信源的Shannon编码平均码字长度为2.92,较Huffman编码为长。2.Fano编码步骤(1)将图像灰度级xi其概率大小按递减顺序进行排序。(2)将xi分成两组,使每组的概率和尽量接近。给第一组灰度级分配代码“0”,第二组分配代码“1”。(3)若每组还是由两个或以上的灰度级组成,重复上述步骤,直至每组只有一个灰度级为止。【例5.3】图5.6以表5.3的信源为例说明Fano编码。5.2.3算术编码在信源各符号概率接近的条件下,算术编码是一种优于Huffman编码的方法。【例6-1】根据信源的概率分布进行算术编码。已知信源的概率分布为求二进制序列01011的编码。举例解:步骤如下:(1)二进制信源只有x1=0和x2=1两种符号,相应的概率为pc=2/5,pe=1-pc=3/5(2)设s为区域左端起始位置,e为区域右端终止位置,l为子区的长度,则符号“0”的子区为[0,2/5),子区长度为2/5;符号“1”的子区为[2/5,1],子区长度为3/5。(3)随着序列符号的出现,子区按下列公式减少长度:新子区左端=前子区左端+当前子区左端×前子区长度新子区长度=前子区长度×当前子区长度设初始子区为[0,1],步序为step,则编码过程参见实例。可见,最后子区左端起始位置最后子区长度最后子区右端终止位置编码结果为子区起始位置与终止位置之中点=0.0011。所以,二进序列的算术编码为0011。算术编码算法的计算步骤实例stepx

s

l

1002/5210+(2/5)×(2/5)=4/25(2/5)×(3/5)=6/25302/5+0×6/25=4/25(6/25)×(2/5)=12/125414/25+(2/5)×(12/125)=124/625(12/125)×(3/5)=36/62551124/625+(2/5)×(36/625)=692/3125(36/625)×(3/5)=108/6255.3预测编码预测编码的基本思想:在某种模型的指导下,根据过去的样本序列推测当前的信号样本值,然后用实际值与预测值之间的误差值进行编码。如果模型与实际情况符合得比较好且信号序列的相关性较强,则误差信号的幅度将远远小于样本信号。图像差值幅度的概率分布(PDF)5.3.1预测编码基本原理对实际值与预测值之间的误差值进行编码差分脉冲编码调制DifferentialPulseCodeModulationDPCMDPCM系统的组成

5.3.2线性自适应预测编码假设经扫描后的图像信号x(t)是一个均值为零、方差为的平稳随机过程。线性预测就是选择ai(i

1,2,…,N

1)使预测值

并且使差值en的均方值为最小。预测信号的均方误差(MSE)定义为E{en}=E{(xn

-x′n)2} 设计最佳预测的系数ai,采用MMSE最小均方误差准则。可以令定义xi和xj的自相关函数R(i,j)=E{xi,xj}写成矩阵形式为Yule-Walker方程组

若R(i)已知,该方程组可以用递推算法来求解ai。通过分析可以得出以下结论:图像的相关性越强,压缩效果越好。当某个阶数已使E{eN,eN

1}

0时,即使再增加预测点数,压缩效果也不可能继续提高。若{xi}是平稳m阶Markov过程序列,则m阶线性预测器就是在MMSE意义下的最佳预测器。当前像素与邻近像素的位置关系常用预测器方案前值预测:用x0同一行的最近邻近像素来预测=x0一维预测:如上图中的x1、x5。二维预测:如上图中的x1、x2、x3、x4、x5、x6、x7等。三维预测5.3.3自适应预测编码自适应预测预测参数根据信号的统计特性来确定,以达到最佳预测预测编码的优点直观快捷、便于实现预测编码的缺点压缩比不够高5.4变换编码5.4.1变换编码的基本原理

通过数学变换可以改变信号能量的分布,从而压缩信息量。以傅里叶变换的概念说明合理的变换可以改变信号能量分布的基本原理。变换可以改变信号能量的分布(5.4.2变换编码的系统结构多变样率变换编码系统图像输入二维变换交换域采样量化编码传输/储存解码补零内插反交换输出

5.4.3变换编码的实现在变换编码中有以下几个问题值得注意:图像变换方法的选取子图像大小的选取常用的图像编码方法区域编码阈值编码混合编码帧内混合编码原理图变换编码变换编码变换编码预测编码信道传输预测解码/反变换

f(1,n)F(1,n)e(1,n)e‘(1,n)f(2,n)F(2,n)e(2,n)e‘(2,n)f(M,n)F(M,n)e(M,n)e‘(M,n)f‘(1,n)f‘(2,n)f‘(M,n)…….……..……………………….5.4.4整数小波变换与图像压缩量化器的设计是决定图像保真度的关键环节,而传统的DCT和经典小波变换在图像变换后会产生浮点数,因而必须对变换后的数据进行量化处理,这样就产生不同程度的失真。新一代的整数小波变换(又叫第二代小波变换)采用提升方法能够实现整数变换,因而能够实现图像的无损压缩,显然它是一种很适合于医学等图像的压缩方法。

新的静态图像压缩标准JPEG2000中采用了基于提升方法的整数小波变换。提升方法构造小波分为分裂、预测和更新3个步骤。1.分裂(split)将一原始信号序列sj按偶数和奇数序号分成两个较小的、互不相交的小波子集sj-1和dj-1:2.预测(predict)由于数据间存在相关性,因而可以定义一个预测算子P,用P(sj-1)来预测dj-1.。这样可用相邻的偶数序列来预测奇数序列。用dj-1与P(sj-1)的差值代替dj-1,则数据量要比原始dj-1要小得多。3.更新(update)上述两个过程一般不能保持原图像中的某些整体性质(如亮度),为此我们要构造一个U算子去更新s,使之保持原有数据集的某些特性。5.5二值图像编码只有“白”(用“0”表示)和“黑”(用“1”表示)两个灰度级称之为二值图像(binaryimage)。二值图像通常是由人为产生的,如由文字组成的文档文件、表格、工程图纸、地图等。一幅二维图像按位平面进行分解可以得到若干个二值图像,因而二值图像的编码方法为逐进编码模式奠定了基础。5.5.1跳跃空白编码(skipblankcoding)跳跃空白编码将图像的每一条扫描线分成若干等长的段,每段有m个像素,一般m=8~12。这些扫描线段的组成可能出现二类情况:(1)全是“0”像素。这种线段称为“空白块(blank)”,常表示二值图像的背景成分。编码时“空白块”用码字“0”表示。“空白块”(2)全是“1”像素或由“0”、“1”像素混合而成。编码时,这种线段用“1”加直接编码表示。上述方法很容易推广的在二维情形中。将图像划分为若干个子图像。当子图像像素全为0时,编码为“0”;否则,子图像的编码首位为“1”,其余码位(codeposition)采用像素的直接编码表示。5.5.2游程长度编码RLC(RunLengthCoding)

一种简单的无损编码技术,它改变连续出现相同字符的表达方式,以降低码长。传真的二值图像中,连“0”或连“1”总是成串出现,称为“白游程”和“黑游程”。非二值的相同连续数据串,同样简化为两个符号:一个符号代表数据,第二个代表串长。游程长度编码一般不直接单独使用,通常配合其他编码方式使用来提高压缩效果。5.6新型的图像压缩编码方法经典的编码方法利用去除图像数据的相关性等方法对图像进行压缩,其压缩效果受到一定的限制。模型编码利用对图像建模的方法对图像参数进行估计。由于参数的数据量远远少于图像的数据量,因而用模型编码对压缩数据量极其有效。常见的模型编码有:分形编码(fractalcoding)自适应网格编码(self-adaptivemeshcoding)5.6.1分形(fractal)

的基本概念与经典的编码方法相比,分形编码在思路上有新的突破,其压缩比高出一般编码方法2~3个数量级。压缩过程时间长但解压缩速度快的特点将使其在大数据量、高质量的多媒体应用、高速网络等场合中发挥重要的角色。分形的基本思想来源于数学上对客观世界一些现象的自相似性描述。分形是一种由许多与全局相似的局部所构成的形体。对于集合A,如果描述其中的点需要d个坐标,则称该集合A是d维的,即dim(A)=d(5.37)在分形几何学中,d可以扩展为分数,这时d称为分维。5.6.2分形压缩的基本方法分形压缩将图像分解成若干子图像,利用图像的仿射变换可以寻找出子图像间的自相似性。仿射变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论