数字图像的压缩_第1页
数字图像的压缩_第2页
数字图像的压缩_第3页
数字图像的压缩_第4页
数字图像的压缩_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字图像的压缩数字图像的压缩1CONTENTS目录12342第一部分数据压缩的数据压缩的基本概念基本概念Chapter 131.1 1.1 数据冗余数据冗余 数据冗余的概念数据冗余的概念数据是用来表示信息的。如果不同的方法为表示给定量的信息使用了不同的数数据是用来表示信息的。如果不同的方法为表示给定量的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然是代表了无用的信息,或据量,那么使用较多数据量的方法中,有些数据必然是代表了无用的信息,或者是重复地表示了其它数据已表示的信息,这就是数据冗余的概念。者是重复地表示了其它数据已表示的信息,这就是数据冗余的概念。 三种基本的数据冗余三

2、种基本的数据冗余编码冗余编码冗余 像素间冗余像素间冗余心理视觉冗余心理视觉冗余如果能减少或消除上述三种冗余的一种或多种冗余,就能取得数据压缩的效果。如果能减少或消除上述三种冗余的一种或多种冗余,就能取得数据压缩的效果。41.1.1 1.1.1 编码冗余编码冗余 什么是编码冗余?什么是编码冗余? 如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。包含了编码冗余。 如果用如果用8 8位表示该图像的像素,我位表示该图像的像素,我们就说该图像存在编码冗余,因为该图们就说该图像存在编码冗余,因为该图像的像素

3、只有两个灰度,用像的像素只有两个灰度,用1 1位即可表示。位即可表示。例:例:黑白二值图像编码黑白二值图像编码5假设区间0,1内的一个离散随机变量rk表示图像的灰度级,并且每个rk出现的概率为pr(rk),则有:k=0,1,2.L-1k=0,1,2.L-1 这里L是灰度级数,nk是第k个灰度级在图像中出现的次数,n是图像中的像素总数,如果用于表示每个rk值的比特数为l(rk),则表达每个像素所需的平均比特数为: 通常来说,如果图像的灰度级在编码时用的编码符号数多于表示每个灰度级实际所用的符号数,也就是说这个编码无法使Lavg得到最小值,那么用那个这种编码图像得到的图像包含编码冗余。nnrpkk

4、r)()()(10krLkkavgrprlL6编码冗余的例子:编码冗余的例子:71.1.2 1.1.2 像素间冗余像素间冗余 什么是像素间冗余?什么是像素间冗余? 反映图像中像素之间的相互关系。反映图像中像素之间的相互关系。 因为任何给定像素的值可以根据与这个像素相邻的像素进行预测,所因为任何给定像素的值可以根据与这个像素相邻的像素进行预测,所以单个像素携带的信息相对较少。以单个像素携带的信息相对较少。 例如:例如:原图像数据:原图像数据:234 223 231 238 235234 223 231 238 235 压缩后数据:压缩后数据:234 -11 8 7 -3234 -11 8 7 -

5、381 1.1.3 .1.3 视觉心理冗余视觉心理冗余 什么是视觉心理冗余?什么是视觉心理冗余? 这是由于眼睛对所有视觉信息感受的灵敏度不同。这是由于眼睛对所有视觉信息感受的灵敏度不同。 有些信息在通常的视有些信息在通常的视觉觉过程中与另外一些信息相比并不那么重要,这些信息被认为是视觉心理冗余的,过程中与另外一些信息相比并不那么重要,这些信息被认为是视觉心理冗余的,去除这些信息并不会明显降低图像质量。去除这些信息并不会明显降低图像质量。 图像在色彩,亮度,空间频率等方面超出了人眼的接收范围和可区分程度。图像在色彩,亮度,空间频率等方面超出了人眼的接收范围和可区分程度。 图像中某些目标或区域的信

6、息不太容易引起人眼的注意。图像中某些目标或区域的信息不太容易引起人眼的注意。 某些视觉信息对于视觉系统而言是无法区分的。某些视觉信息对于视觉系统而言是无法区分的。35k22k91.2 1.2 保真度准则保真度准则评价压缩算法的准则评价压缩算法的准则 保真度准则保真度准则 图像压缩可能会导致信息损失,如去除心理视觉冗余数据。图像压缩可能会导致信息损失,如去除心理视觉冗余数据。需要评价信息损失的测度以描述解码图像相对于原始图像的偏离程度,这些测度称为保需要评价信息损失的测度以描述解码图像相对于原始图像的偏离程度,这些测度称为保真度准则。真度准则。 常用的图像压缩技术指标常用的图像压缩技术指标: :

7、 图像冗余度与编码效率图像冗余度与编码效率 压缩比压缩比 客观评价客观评价SNRSNR 主观评价主观评价10 图像质量的主观评价等级图像质量的主观评价等级11第二部分无误差压缩无误差压缩Chapter 2122.1 2.1 无误差压缩的必要性无误差压缩的必要性在医疗或商业文件的归档,有损压缩因为法律原因而被禁止。卫星成像的收集,考虑数据使用和所花费用,不希望有任何数据损失。X光拍片,信息的丢失会导致诊断的正确性 无误差压缩技术无误差压缩技术减少像素间冗余减少编码冗余132.2 2.2 变长编码变长编码 一些基本概念一些基本概念1. 图像熵和平均码字长度1) 图像熵(Entropy)设数字图像像

8、素灰度级集合为(X1,X2,.,Xk,.,XM),其对应的概率分别为P1,P2,.,Pk,.,PM。按信息论中信源信息熵定义,数字图像的熵H为:k2M1kkPlogPH熵表示每个像素提供的平均信息量为多少比特,对图像进行无损编码时所需的平均位数不得低于H,熵是编码所需比特数的下限。142) 平均码字长度 设k为数字图像第k个码字Ck的长度。其相应出现的概率为Pk ,则该数字图像所赋予的码字平均长度为:3) 编码效率 在一般情况下,编码效率往往用下列简单公式表示: kmkkPN1NH152. 变长最佳编码定理在变长码中,对出现概率大的信息符号赋予短码字,而对于出现概率小的信息符号赋予长码字。如果

9、码字长度严格按照所对应符号出现概率大小顺序排列,则编码结果平均码字长度一定小于任何其它排列方式。变长编码是统计编码中最为主要的一种方法。 2.2.1 Huffman2.2.1 Huffman编码编码Huffman编码是根据最佳编码定理,应用Huffman算法而产生的一种编码方法。它的平均码字长度在具有相同输入概率集合的前提下,比其它任何一种单义码都小。因此也常称其为紧凑码。通过减少编码冗余来达到压缩的目的。16 HuffmanHuffman编码方法编码方法Huffman编码基本思想1) 统计所有符号的出现概率2) 建立一个概率统计表 将最常出现的符号用最短的编码 将最少出现的符号用最长的编码元

10、素 xi x1 x2 x3 x4 x5 x6概率 P(xi) 0.4 0.3 0.1 0.1 0.06 0.04编码 wi 1 00 011 0100 01010 01011例如:例如:171.把信源X中的消息按出现的概率从大到小的顺序排列。2.把最后两个出现概率最小的消息合并成一个消息,从而使信源的消息数减少一个,并同时再次将信源中的消息概率从大到小排列一次。3.重复上述步骤,直到信息源最后为两个信息源为止。4.对最后的信息源赋予1和0或0和1,并逐步向前编码。通过上述步骤就可以构成Huffman码(最优变长码)。 HuffmanHuffman编码过程:编码过程:182.2.2 Shanno

11、n2.2.2 Shannon编码编码Shannon编码与Huffman编码相反,采用从上到下的方法。Shannon编码算法步骤: (1)按照符号出现的概率减少的顺序将待编码的符号排成序列。 (2)将符号分成两组,使这两组符号概率和相等或几乎相等。 (3)将第一组赋值为0,第二组赋值为1。 (4)对每一组,重复步骤2的操作。 192.2.3 2.2.3 算数编码算数编码算术编码:是一种非模块式的编码方法,它是对信源的符号串直接进行编码;而非对信源的每一个符号赋予固定的码字再根据符号串进行排列。基本思想:根据一个固定长度的符号串可能出现的概率,将该符号串映射到开区域0 ,1)中的一个子区域,计算该

12、子区域的过程采用了条件概率的理念。理论上平均码长能够无限逼近最小平均码长,但由于实际的计算机精度不可能无限长,运算中会出现溢出情况。算术编码器对整个消息只产生一个码字,因此译码器必须在接受到这个实数后才能统一进行译码,无法即时译码。算术编码对错误比较敏感。20第三部分有损压缩有损压缩Chapter 3213.1 3.1 有损压缩的必要性有损压缩的必要性举一个很简单的有损压缩的例子:压缩前:原产于在秘鲁和墨西哥,最初被称为“狼桃”的,全体生粘质腺毛,小叶极不规则的,大小不等,卵形或矩圆形的,边缘有不规则锯齿或裂片的水果或蔬菜反射全谱可见光后主要的波长和人类的血类似。压缩后:西红柿是红的。22 图

13、像中存在很大的冗余度。 用户通常允许图像失真。 有损压缩的可能性有损压缩的可能性 常用的有损压缩技术常用的有损压缩技术 有损预测编码 变换编码 基于模型编码 分形编码 其他编码 233.2 3.2 有损预测编码有损预测编码有损预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。 有损预测编码中典型压缩方法有脉冲编码调制(PCM Pulse Code Modulation)、差分脉冲编码调制(DPCM,Di

14、fferential Pulse Code Modulation)、自适应差分脉冲编码调制(ADPCM,Adaptive Differential Pulse Code Modulation)等,它们较适合于声音、图像数据的压缩,因为这些数据由采样得到,相邻样值之间的差相差不会很大,可以用较少位来表示。 243.3 3.3 变换编码变换编码变换编码是指先对信号进行某种函数变换,从一种信号变换到另一种,然后再对信号进行编码。如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中信号的能量较集中,再进行采样、编码,那么可以肯定能够压缩数据。 变换编码系统中压缩数据有变换、变换域采样

15、和量化三个步骤。变换本身并不进行数据压缩,它只把信号映射到另一个域,使信号在变换域里容易进行压缩,变换后的样值更独立和有序。这样,量化操作通过比特分配可以有效地压缩数据。 在变换编码系统中,用于量化一组变换样值的比特总数是固定的,它总是小于对所有变换样值用固定长度均匀量化进行编码所需的总数,所以量化使数据得到压缩,是变换编码中不可缺少的一步。在对量化后的变换样值进行比特分配时,要考虑使整个量化失真最小。 25输入输入图像图像构建构建n n* *n n子图像子图像 正变换正变换 符号编符号编辑器辑器压缩压缩图像图像 量化器量化器压缩压缩图像图像 符号解码符号解码器器 反变换反变换 解压缩图解压缩

16、图像像合并合并n n* *n n子子图像图像1.1.图像的压缩:图像的压缩:2.2.图像的解压缩:图像的解压缩:变换编码的压缩过程:变换编码的压缩过程:26对变换方法的评价:对变换方法的评价:DCT由于其算法简单,计算量小以及在封装能力和块效应方面较好的性能成为压缩编码首选的变换方式,已经得到国际上的公认。27离散余弦变换(离散余弦变换(DCTDCT)离散余弦变换(Discrete Cosine Tranform,简称DCT)是一种与傅立叶变换紧密相关的数学运算。在傅立叶级数展开式中,如果被展开的函数式是偶函数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之为离散余弦变换

17、。时间域中信号需要许多数据点表示;在x轴表示时间,在y轴表示幅度。信号一旦用傅立叶变换转换到频率域,就只需要几点就可以表示这个相同的信号。如我们已经看到的那样,原因就是信号只含有少量的频率成分。这允许在频率域中只用几个数据点就可以表示信号,而在时间域中表示则需要大量数据点。在JPEG各类图像压缩算法中,基于离散余弦变换的图像压缩编码过程称为基本顺序过程,它应用于绝大多数图像压缩场合, 并且它能在图像的压缩操作中获得较高的压缩比。彩色图像有像素组成,这些像素具有RGB彩色值。每个像素都带有x,y坐标,对每种原色使用8*8或者16*16矩阵。在灰度图像中像素具有灰度值,它的x,y坐标由灰色的幅度组

18、成。为了在JPEG中压缩灰度图像,每个像素被翻译为亮度或灰度值。28采用8*8的图像块原因是由于计算量和像素之间关系的数量,许多研究表明,在15或20个像素之后,像素间的相关性开始下降。就是说,一列相似的像素通常会持续15到20个像素那么长,在此之后,像素就会改变幅度水平或反向。模拟图像经采样后成为离散化的亮度值然后分成一个个宏块,而一个宏块有分成8*8大小的块,可以用一个矩阵来表示这个块。通过以下的公式对其做二维DCT变换即可:其中:p=0,1.N-1 q=0,1.N-1) 1, 1(.) 1 , 1()0 , 1(.) 1, 1 (.) 1 , 1 ()0 , 1 () 1, 0(.) 1

19、 , 0()0 , 0(NNfNfNfNfffNffff2) 12(cos2) 12(cos),(1010,NyqNxpyxfBNxNyqpqp29第四部分图像压缩标准图像压缩标准Chapter 4304.1 4.1 常见的图像压缩编码标准常见的图像压缩编码标准在静态图像压缩编码标准中,比较著名的有JPEG、JBIG等标准。视频可看成是一幅幅不同但相关的静态图像的时间序列。静态图像的压缩技术和标准可以直接应用于视频的单帧图像。介绍: 适用于静态图像的JPEG标准和JBIG标准 新的JPEG2000压缩国际标准制定图像标准的国际组织ISO和CCITT联合组织下进行制定的标准的类型(三类):二值图

20、像压缩标准:面向传真而设计静止帧黑白、彩色压缩:面向静止的单幅图像(JPEG)连续帧黑白、彩色压缩:面向连续的视频影像(MPEG)314.2 4.2 彩色与灰度图像压缩标准彩色与灰度图像压缩标准JPEGJPEG JPEGJPEG算法与系统算法与系统 JPEG基本系统每个单独的彩色图像分量的编码算法: 将量化精度为8位的待压缩图像分成若干个8*8样值子块,做基于8*8子块的DCT。 根据最佳视觉特性构造量化表,设计自适应量化器并对DCT的频率系数进行量化。 为了增加连续的0系数的个数,对量化后的系数进行Z字形重排。 用Huffman码作变字长熵编码器对量化系数进行编码,进一步压缩数据量。32量化:量化:对于有损压缩算法,JPEG算法使用均匀量化器进行量化,量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表。亮度量化表亮度量化表色度量化表色度量化表33Z Z字形排列字形排列: :量化后的系数要重新编排,目的是为了增加连续的“0”系数的个数,就是“0”的游程长度,方法是按照Z字形的式样编排。这样就把一个88的矩阵变成一个164的矢量,频率较低的系数放在矢量的顶部。3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论