图像压缩方法的论述及分析_第1页
图像压缩方法的论述及分析_第2页
图像压缩方法的论述及分析_第3页
图像压缩方法的论述及分析_第4页
图像压缩方法的论述及分析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像压缩方法的论述及分析图像压缩方法的论述及分析图像压缩方法的论述及分析图像压缩方法的论述及分析编制仅供参考审核批准生效日期地址:电话:传真:邮编:图像压缩方法的论述及分析*******摘要:在信息化时代,为实现图像的有效处理、存储和传输,图像的压缩是必不可少的。本文全面的论述了图像压缩的原理、图像压缩方法的分类以及常用图像压缩方法,最后从图像压缩的无损压缩和有损压缩的角度,对一些常用的图像压缩方法进行了简要的比较。关键词:图像压缩、压缩原理、图像压缩方法、无损压缩、有损压缩0前言在信息环境中,大量的信息是以数字化的方式表示、存储和传输的,而这些数字化信息中图像信息又占了绝大部分。但是数字化后,图像具有信息量大、带宽宽等特点,为了对图像实行有效的处理、存储和传输,必须做到:1)需要增加信道,但这很有限,因为信道的增加永远赶不上信息的爆炸式增长,况且还要受到环境的限制:2)必须减少表示图像的数据量,以达到压缩图像数据的目的。故在如今这样一个发展日新月异的信息化时代,图像数据压缩具有相当的必要。1图像压缩的原理由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人Shannon提出把数据看作是信息和冗余度(redundancy)的组合。所谓冗余度,是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余压缩数据的目的。图像冗余[1]图像的冗余包括以下几种:1)空间冗余:像素点之间的相关性。2)时间冗余:活动图像的两个连续帧间的冗余。3)信息熵冗余:单位信息量大于其熵。4)结构冗余:图像的区域上存在非常强的纹理结构。5)知识冗余:有固定的结构,如人的头像。6)视觉冗余:某些图像失真是人眼不易觉察的。压缩原理对数字图像进行压缩通常利用两个基本原理:1)数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。2)人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。典型的图像压缩系统主要由三部分组成:变换部分(Transformer)、量化部分(Quantize)、和编码部分(Coder)[2]。

变换部分它体现了输入原始图像和经过变换的图像的一一对应关系。变换也称为去除相关,它减少了图像中的冗余信息,与输入原始图像数据相比,变换后的图像数据提供了一种更易于压缩的图像数据表示形式。

量化部分量化部分把经过变换的图像数据作为输入进行处理后,会得到有限数目的一些符号。一般而言,这一步会带来信息的损失,而这也恰是有损压缩方法和无损压缩方法之间主要的区别。在无损压缩方法中,这一步骤并不存在,这是一个不可逆的过程,原因就在于这是多到一映射,存在有两种量化类型:标量量化与矢量量化,前者是在一个像素、一个像素的基础上量化,而后者对像素向量进行量化。

编码部分这是压缩过程中最后一个步骤。这个部分将经过变换的系数(量化或未量化)编码为二进制位流,这个部分可以采用固定长编码,或变动长度编码。2图像压缩方法图像压缩,也称数字图像压缩,有时又称为图像压缩编码或图像编码。图像压缩编码包括图像数据的压缩和编码表示,也就是将图像数据转化为尽可能不相关的数据集合。数据编码,就是用某种方式对信息的符号进行表示。数据压缩中所指的数据编码是通过选用有效的表示方法,减少表示信息的数据量,从而达到数据压缩的目的。图像压缩方法分类[3]图像压缩方法有许多种,从不同的角度出发有不同的分类方法,比如:1)按照压缩前及解压后的信息保持程度分成以下三类:(1)信息保持型压缩、解压中无信息损失,主要用于图像存档,其特点是信息无失真,但压缩比有限,也称无失真/无损/可逆型编码。(2)信息损失型牺牲部分信息,来获取高压缩比,数字电视、图像传输和多媒体等应用场合常用这类压缩,其特点是通过忽略人的视觉不敏感的次要信息来提高压缩比,也称有损压缩。(3)特征抽取型仅对于实际需要的特征信息进行编码,而丢掉其它非特征信息,属于信息损失型。第三类是针对特殊的应用场合,因此,一般就将图像压缩编码分成无损压缩和有损压缩两大类。2)按照图像压缩的方法原理可分成四类:(1)像素编码编码时只对每个像素单独处理。如脉冲编码调制、熵编码、行程编码等。(2)预测编码通过去除相邻像素之间的相关性和冗余性,只对新的信息进行编码。常用的有差分脉冲编码调制。(3)变换编码对给定图像采用某种变换,使得大量的信息能用较少的数来表示。通常采用的变换包括:离散傅立叶变换(DFT),离散余弦变换(DCT)和离散小波变换(DWT)。(4)其它方法早期的编码,如混合编码、矢量量化、LZW算法。近些年来也出现了很多新的压缩编码方法,如使用人工神经元网络的压缩编码算法、分形编码算法、小波变换压缩方法、基于对象的压缩编码算法、基于模型的压缩编码算法等。3)按照压缩对象上来看,可分为静止图像压缩和运动图像压缩。针对静止图像和运动图像的压缩,它们所采用的图像压缩编码标准是不一样的,如静止图像压缩标准为JPEG、JPEG2000,动态图像压缩标准为、、、MPEG-1、MPEG-2、MPEG-4、MPEG-7等等。常用图像压缩方法[4,5]图像压缩研究始于1948年,至今已提出或产生了多种的图像压缩方法。自1988年以来,各种图像压缩编码标准的相继产生,图像压缩研究也取得了重要的进展。在此,把1988年以前主要研究的压缩编码方法通常称为“经典方法”或“传统方法”,其后提出的具有重要发展前景的方法称为“现代方法”。经典方法1)行程长度编码(RLE)行程长度编码(run-lengthencoding)是压缩一个文件最简单的方法之一。它的做法是把一系列的重复值(如图像像素的灰度值)用一个单独的值再加上一个计数值来取代。比如有这样一个字母序列aabbbccccccccdddddd,它的行程长度编码就是2a3b8c6d。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。例如对于有大面积的连续阴影或者颜色相同的图像,使用这种方法压缩效果很好。很多位图文件格式都用行程长度编码,例如TIFF,PCX,GEM等。2)LZW编码LZW编码原理是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每个字符对设定一个代码。当同样的一个字符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个字符配对。LZW编码原理的一个重要特征是,代码不仅仅能取代一串同值的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的数据经常重复出现,也能找到一个代号来取代这些数据串。在此方面,LZW压缩原理是优于RLE的。3)霍夫曼编码(Huffman)霍夫曼编码是一种基于统计的压缩编码方法。它是通过用不固定长度的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现频率越低的值,其对应的编码长度越长。例如:假设信源符号为(a、b、c、d、e、f、g),其出现的概率相应的为(、、、、、、),共7个字符。对其进行Huffman编码,算法为:按照每个字符出现的频率大小从左到右排列:、、、、、、。选出最小的两个值作为叶子节点构成一棵二叉树,值较大的叶子节点在左,两个叶子节点对应的频率之和作为根节点。把原排列中最小的两个节点删除,新的根节点插入排列保持大小从左到右的排列顺序不变;重复执行,直到最后得到值为1的根节点。得到一棵Huffman树,如图1所示。图1Huffman编码示意图4)预测及内插编码一般在图像中局部区域的象素是高度相关的,因此可以用先前的象素的有关灰度知识来对当前象素的灰度进行预计,这就是预测。而所谓内插就是根据先前的和后来的象素的灰度知识来推断当前象素的灰度情况。如果预测和内插是正确的,则不必对每一个象素的灰度都进行压缩,而是把预测值与实际象素值之间的差值经过熵编码后发送到接收端。在接收端通过预测值加差值信号来重建原象素。5)矢量量化编码矢量量化编码利用相邻图像数据间的高度相关性,将输入图像数据序列分组,每一组m个数据构成一个m维矢量,一起进行编码,即一次量化多个点。根据仙农率失真理论,对于无记忆信源,矢量量化编码总是优于标量量化编码。编码前,先通过大量样本的训练或学习或自组织特征映射神经网络方法,得到一系列的标准图像模式,每一个图像模式就称为码字或码矢,这些码字或码矢合在一起称为码书,码书实际上就是数据库。输入图像块按照一定的方式形成一个输入矢量。编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码字,即找到最佳匹配图像块。输出其索引(地址)作为编码结果。现代方法1)小波变换压缩方法小波变换把图像分解成逼近图像和细节图像之和,它们分别代表图像的不同结构,然后采用快速算法(Mallat)进行压缩,可以获得很高的压缩比。基于小波变换的图像压缩算法首先使用某种小波基函数将图像作小波变换,再根据4个通道的不同情况,分别量化编码,比如对低频频段(LL)采用较多的量化级别,而对中间频段(LH,RH)采用较少量化级别,对高频频段(HH)采用很少几个量化级别,这样根据重构时对复原信号的重要程度分别对待的方式可以有效地提高压缩比而又不产生明显的失真。小波变换在静态图像压缩中的作用已经得到公认,为JPEG2000标准所采纳。小波变换应用于图像压缩时,本质上是对原始图像的小波系数进行重组处理,然后用处理后的小波系数恢复图像,在实际的信号压缩标准中(如JPEG2000),一般采用支集长度为9和7的双正交小波,该方法容错性比较好,因此更适合实际的应用。2)离散余弦变换压缩法离散余弦变换(DCT)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换(DFT),但是只使用实数。由于离散余弦变换具有很强的”能量集中”特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程的统计特性时,离散余弦变换的去相关性接近于K-L变换(具有最优的去相关性)的性能。故离散余弦变换用于对图像(包括静止图像和运动图像)进行有损压缩。离散余弦变换公式为:其中公式表明:DCT对一个N×N的方阵P进行处理,得到一个N×N的频率系数方阵F。3)分形编码法分形法是基于物质的自相似性,在编码时将信号分解为若干分形子图,提取其迭代函数系统代码(IFS代码)。恢复时则由该代码按规律迭代重构各子图。基于IFS的分形法编码压缩过程应包括以下步骤:(1)将原图预分割成若干分形子图,使每一子图具有一定的分形结构。目前这一步需要采用图像处理、计算机视觉和模式识别的技术,经过反复试凑才能完成。(2)对每一子图提取IFS代码。即将子图置于计算机屏幕上,采用伸缩、平移、旋转或仿射手段,对子图进行压缩获得一组仿射变换参量,便可得到该子图的IFS代码。(3)对IFS代码采用经典的编码方法进行编码。(4)译码形成IFS代码。(5)由IFS代码,利用随机迭代法获取相应的重构子图。(6)把各重构子图拼成恢复图像。对于一定的整体与局部存在明显相似性或仿射性的分形图像类,这种方法可以取得很高的压缩比。复合压缩方法各种压缩方法适用的场合不同,达到的效果也不同,为了充分利用各自的优点,克服缺点,相应产生了多种复合方法:如①基于小波变换的分形图像压缩;②基于DCT的分形图像压缩;③基于非均匀分割和基础表的图像压缩;④基于小波变换和矢量量化的图像压缩;⑤基于二值图像压缩编码的前处理等等。3讨论与比较图像压缩方法主要分为两大类:有损压缩和无损压缩。它们间的主要区别在于压缩前和解压后的图像是否失真。有损压缩又称失真度编码,是不可逆的,压缩比较大,一般在50:1左右,而无损压缩称信息保持编码或熵编码,压缩前后没有失真,从数学上讲是一种可逆运算,压缩比一般不大,在2:1至3:1之间。就目前图像压缩方法来看,有损压缩包括:预测编码、离散余弦变换压缩法、统计分块编码、子带编码、比特分配及矢量量化等,其中这些压缩方法采取的方法又不一样,如离散余弦变换压缩法和子带编码是基于频率域方法;统计分块编码是基于空间域方法;分形编码是根据模型方法构造分形块;而比特分配和矢量量化是基于图像信息的重要性的。无损压缩包括:Huffman编码、算术编码、行程编码(RLE)和LZW编码等,其中Huffman编码在无失真编码方法中,是一种较有效的编码方法。Huffman编码是一种长度不均匀的,平均码率可以接近信息熵值的一种编码,其最高压缩效率可达到8∶1。行程编码是相对简单的一种编码,对于仅包含很少几个灰度级的图像,特别是二值图像,比较有效。相对行程编码而言,LZW编码不仅能取代一串同值的数据,也能够代替一串不同值的数据,故LZW压缩原理是优于RLE的。通常,无损压缩编码法是将数字图像资料一丝不漏地送去压缩,还原回来的资料和原始资料分毫无差,但压缩率不佳。而小波编码是先将数字图像资料转

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论