图象数据压缩编码课件_第1页
图象数据压缩编码课件_第2页
图象数据压缩编码课件_第3页
图象数据压缩编码课件_第4页
图象数据压缩编码课件_第5页
已阅读5页,还剩179页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章图象数据压缩编码图像压缩基础

无损压缩有损压缩静止图像压缩编码的技术标准JPEG基本内容第六章图象数据压缩编码图像压缩基础基本内容1数字图象通常有很大的比特数,这给图象的传输和存储带来相当大的困难。数据的压缩是必不可少的。图象压缩的必要性thetotalbytenumberis:

460×520×3=700kB数字图象通常有很大的比特数,这给图象的传输和存储带来相当大的2一部90分钟的彩色电影,每秒放映24帧。把它数字化,每帧512×512象素,每象素的R、G、B三分量分别占1byte,总比特数为

90×60×24×3×512×512=101922MB若用一张可存600兆字节数据的CD光盘存储这部电影,光图象(还有声音)就需要170张CD光盘。图象压缩的必要性一部90分钟的彩色电影,每秒放映24帧。把它数字化,每帧513对图象数据进行压缩显得非常必要

本章讨论的问题:在满足一定条件下,能否减小图象比特数,以及用什么样的编码方法使之减少。图象压缩的必要性对图象数据进行压缩显得非常必要图象压缩的必要性4图象压缩是可能的

一般原始图象中存在很大的冗余度图象压缩是可能的一般原始图象中存在很大的冗余度5

用户通常允许图象失真当信道的分辨率不及原始图象的分辨率时,降低输入的原始图象的分辨率对输出图象分辨率影响不大。用户所关心的图像区域有限,可对其余部分图像采用空间和灰级上的粗化。根据人的视觉特性对不敏感区进行降分辨率编码(视觉冗余)。用户通常允许图象失真6图象压缩是可能的图象压缩是可能的7原始图象越有规则,各象素之间的相关性越强,它可能压缩的数据就越多。值得指出的是:当前采用的编码方法得到的结果,离可能压缩的极限还相差很远,这说明图象数据压缩的潜力是很大的,直到目前为止,它还是个正在继续研究的领域。图象压缩是可能的原始图象越有规则,各象素之间的相关性越强,它可能压缩的数据就86.1图像压缩基础图像压缩所解决的问题是尽量减少表示数字图像时需要的数据量。减少数据量的基本原理是除去其中多余的数据。以数学的观点看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。6.1图像压缩基础图像压缩所解决9图像熵

图像像素灰度级集合为{d1,d2,…,dm},对应概率为p(d1),

p(d2),…,p(dm),则图像熵定义为

H表示对输入灰度级集合进行编码时所需要的平均位数的下限。di出现的概率相等时,熵最大。图像编码压缩名词术语图像熵图像像素灰度级集合为{d1,d2,…,10平均码长

l为灰度级rk所对应的码字长度。平均码长l为灰度级rk所对应的码字长度。11

编码效率

图像熵与平均码长之比编码效率12香农无干扰编码定理在无干扰条件下,存在一种无失真的编码方法,使编码的平均码长和信源的熵任意接近。香农无干扰编码定理在无干扰条件下,存在13压缩比Ls为源代码长度,Ld为压缩后代码长度压缩比14

保真度标准保真度标准——评价压缩算法的标准(1)客观保真度标准(2)主观保真度标准保真度标准保真度标准——评价压缩算法的标准15

a)输入图和输出图之间的均方根(rms)误差b)输入图和输出图的均方根信噪比(1)客观保真度标准a)输入图和输出图之间的均方根(rms)误差b)输入16(2)主观保真度标准

通过视觉比较两个图像,给出一个定性的评价,如很粗、粗、稍粗、相同、稍好、较好、很好,这种评价被称为主观保真度标准。(2)主观保真度标准17

冗余在数字图像压缩中的三种基本的数据冗余:编码冗余像素间冗余心理视觉冗余冗余在数字图像压缩中的三种基本的数据冗余:18编码冗余通过图像灰度级直方图可以深入了解编码结构,从而减少表达图像所需的数据量。例:编码冗余通过图像灰度级直方图可以深入了解编码结构,从而减少19由于任何给定的像素值,原理上都可以通过它的邻居预测到,所以单个像素携带的信息相对是小的。

为减少图像中的像素间冗余,二维像素阵列必须变换为更有效的形式。

像素间冗余

空间冗余

几何冗余

帧间冗余例:原图像数据:234223231238235压缩后数据:23411-8-73由于任何给定的像素值,原理上都可以通过它的邻居预测到,所以单20心理视觉冗余在正常的视觉处理过程中各种信息的相对重要程度不同,那些不重要的信息称做心理视觉冗余心理视觉冗余在正常的视觉处理过程中各种信息的相对重要程度不21无损压缩与有损压缩无损压缩基于统计模型,减少源数据流中的冗余,同时保持信息不变。又称为冗余压缩。典型代表有Huffman编码,算术编码、游程长度编码等。有损压缩以牺牲部分信息量为代价而换取缩短平均码长的编码压缩方法。在压缩中丢失了部分信息,又称为熵压缩。典型代表有离散余弦变换编码、有损预测编码等。一般地,有损压缩的压缩效率高于无损压缩。无损压缩与有损压缩无损压缩基于统计模型,减少源数据流中的冗余22实验二图像增强下周二做,地点不变(交邮政编码分割程序)No.13实验二图像增强No.13236.2无损压缩在很多应用中,如医疗和商业文档的归档、卫星成像的处理、数字X光照相术,无损压缩时唯一可以接受的数据压缩方式。

无损压缩常由两种彼此独立的操作组成:(1)为减少像素间冗余建立一种可替代的图像表达方式;(2)对这种表达方式进行编码以便消除编码冗余。6.2无损压缩在很多应用中,如医疗和商业文档的归档、卫星成24一、基本原理通过减少编码冗余来达到压缩的目的。将在图像中出现次数多的像素值给一个短的编码,将出现次数少的像数值给一个长的编码。二、霍夫曼编码是即时码:

是唯一可译码,其中任意一个码字都只能与一种信号存在对应关系,而且任意一个码字都不能是其他码字的前缀。6.2.1霍夫曼编码(属于统计编码)一、基本原理6.2.1霍夫曼编码(属于统计25

信号源a={a1,a2,a3,a4,a5,a6},其概率分布为p1=0.1p2=0.4p3=0.06p4=0.1p5=0.04p6=0.3,求最佳Huffman码。方法:将信源符号按出现概率从大到小排成一列,然后把最末两个符号的概率相加,合成一个概率。二、Huffman编码举例信号源a={a1,a2,a3,a4,a5,26Huffman编码方法:把这个符号的概率与其余符号的概率按从大到小排列,然后再把最末两个符号的概率加起来,合成一个概率。重复上述做法,直到最后剩下两个概率为止。从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码,如对概率大的赋予码元0,对概率小的赋予码元1。Huffman编码方法:27建立概率统计表和编码树 符号概率1 23 4 a20.40.40.40.40.6 a6 0.30.30.30.30.4 a10.10.10.20.3 a4 0.10.10.1 a30.060.1 a5 0.04 霍夫曼编码举例霍夫曼编码举例28编码过程:符号概率编码1 234a2 0.41 0.410.410.410.60a6 0.3000.3000.3000.3

00

0.41a10.10110.10110.2

0100.3

01a4 0.101000.1

0100

0.1

011

a3 0.06

010100.1

0101

a5 0.04

01011霍夫曼编码举例编码过程:霍夫曼编码举例29霍夫曼编码例子:将010100111100解码解码过程:010100111100a3a1a2a2a6a2a6a1a4a3a5

10001101000101001011

霍夫曼编码例子:将010100111100解码a2a30

信号源a={a1,a2,a3,a4,a5,a6},其概率分布为p1=0.1p2=0.4p3=0.06p4=0.1p5=0.04p6=0.3,求最佳Huffman码。a2a6a1a4a3a5

10001101000101001011

编码的平均长度:其信源的熵为2.14bits/symbol,霍夫曼编码编码效率为0.937信号源a={a1,a2,a3,a4,a5,31霍夫曼编码静态编码在压缩之前就建立好一个概率统计表和编码树。算法速度快,但压缩效果不是最好动态编码对每一个图像,临时建立概率统计表和编码树。算法速度慢,但压缩效果最好霍夫曼编码32霍夫曼编码的特点编码值不唯一当图像灰度值分布很不均匀时,霍夫曼编码效率高。编码过程要经过N-2次合并(有N个灰度级),N较大时,计算量大.改进:用亚最优变长码:截断霍夫曼编码,霍夫曼平移编码霍夫曼编码的特点编码值不唯一336.2.2算术编码(属于统计编码)(自学)假设某个字符的出现概率为80%,该字符事实上只需要-log2(0.8)=0.322个二进制位进行编码难道真的能只输出0.322个0或0.322个1吗?算术编码的输出是:一个小数算术编码对整条信息(无论信息有多么长),其输出仅仅是一个数,而且是一个介于0和1之间的二进制小数。例如算术编码对某条信息的输出为1010001111,那么它表示小数0.1010001111,也即十进制数0.646.2.2算术编码(属于统计编码)(自学)假设某个字符的34

从整个符号序列出发,采用递推形式连续编码在算术编码中源符号和码字间的一一对应关系并不存在。1个算术码字要赋给整个信源符号序列而码字本身确定0和1之间的1个实数区间随着符号序列中的符号数量增加,用来代表它的区间减小,而表达区间的信息单位数量变大算术编码的特点

从整个符号序列出发,采用递推形式连续编码算术编码的特点35例:来自一个4-符号信源{a,b,c,d}的由5个符号组成的符号序列:abccd.已P(a)=0.2,P(b)=0.2,P(c)=0.4,P(d)=0.2.可用0.068来表示整个符号序列例:来自一个4-符号信源{a,b,c,d}的由5个符号组成的366.2.3行程编码RLE(属于统计编码)

行程:具有相同灰度值的像素序列。是一种熵编码,广泛应用于各种图象格式的数据压缩处理中,如BMP,TIFF,JPEG。编码思想:用行程的灰度和行程的长度代替行程本身。例:设重复次数为iC,重复像素值为iP编码为:iCiPiCiPiCiP编码前:aaaaaaabbbbbbcccccccc编码后:7a6b8c6.2.3行程编码RLE(属于统计编码)行程:具有37RLE比较适合于二值图像的编码RLE比较适合于二值图像的编码38(1)一维行程编码

对图象进行行扫描时,行内各象素的灰度级可组成一个整数序列x1,x2,…,xN。在行程编码中,我们将这个序列映射成整数对(gk,lk),其中gk表示灰度级,lk表示行程。行程编码(1)一维行程编码行程编码39(2)二维行程编码

一维行程编码只考虑消除每行内象素的相关性,未考虑行间象素的相关性。二维行程编码的基本原理是跟踪各个黑色和白色游程的起始和终结点。(2)二维行程编码

一维行程编码只考虑消除每行内象40原图象文件:277560字节行程编码文件:279860字节压缩比:0.992原图象文件:行程编码文件:压缩比:41原图象文件:66616字节行程编码文件:9272字节压缩比:7.185原图象文件:行程编码文件:压缩比:42行程编码

如果图像是由很多块颜色或灰度相同的大面积区域组成的,特别是二值图象,采用行程编码可以达到很高的压缩比。如果图像中的数据非常分散,则行程编码不但不能压缩数据,反而会增加图像文件的大小。为了达到较好的压缩效果,一般不单独采用行程编码,而是和其他编码方法结合使用。分析:行程编码

如果图像是由很多块颜色或灰度相同的大面积区域组成的436.3有损压缩有损压缩是以牺牲图像重构的准确度为代价换取压缩能力增加的概念为基础的。如果产生的失真是可以容忍的,则压缩能力上的增加就是有效的。6.3有损压缩有损压缩是以牺牲图像重构的准确度为代价换取压44有损预测编码:直接对像素在图像空间进行操作,称为空域方法。邻近的M个值预测当前值,当前值与预测值之差量化编码,(一维、二维预测等)变换编码:基于图像变换的编码方法,称为频域方法。

有损预测编码:直接对像素在图像空间进行操作,称为空域方法45预测编码的基本原理

利用已有样本对新样本进行预测,将样本的实际值与其预测值相减得到误差值,再对误差值进行编码。通常误差值比样本值小得多,从而达到数据压缩的效果。6.3.1有损预测编码预测编码的基本原理6.3.1有损预测编码46

预测器可以是固定的,也可以是自适应的;可以是线性的,也可以是非线性的。预测器设计得越好,对输入的数据压缩就越多。有损预测编码预测器可以是固定的,也可以是自适应的;可以是47有损预测编码–DPCM(差分脉冲编码调制)系统量化器编码器预测器压缩图像解码器预测器压缩图像解压图像输入图像有损预测编码–DPCM(差分脉冲编码调制)系统量化器编码器预48德尔塔调制最优量化器最佳线性预测器线性自适应预测编码有损预测编码德尔塔调制有损预测编码49一维线性预测

有损预测编码一维线性预测

有损预测编码50最佳线性预测

采用均方误差(MSE)为极小值的准则来获得DPCM,称为最佳线性预测,亦即此时预测误差最小。对于图像来说,最佳线性预测的关键就是求出各个预测系数,使得预测误差最小,从而使得接收图像和原图像差别最小。

有损预测编码最佳线性预测有损预测编码51量化器编码器预测器压缩图像输入图像为简化分析,设:量化器编码器预测器压缩图像输入图像为简化分析,设:52最佳线性预测

选ak使E{e2n}最小。在假fn具有零均值和方差为σ2的条件下解出联立方程的解集:最佳线性预测

在假fn具有零均值和方差为σ2的条件下解出联立53R-1是m×m自相关矩阵的逆矩阵R-1是m×m自相关矩阵的逆矩阵54方程的解a1,a2,…,am

便是一组最佳的预测系数。压缩效果可用方差σ2e(n)来衡量:原始序列相关性越强,R(i)越大,σ2e(n)越小,压缩效果越显著;原始序列互不相关,即R(i)=0,i≠0,则,σ2e(n)=σ2一点也不能压缩。最佳线性预测方程的解a1,a2,…,am便是一组最佳的556.3.2变换编码变换编码通常是指将某种正交变换作为映射变换,用变换系数来表示原始图象,对变换系数进行编码。对一个N×

N的图像f(x,y):正变换逆变换6.3.2变换编码变换编码通常是指将某种正交变换作为映射变56变换编码若输入是广义平稳序列,则存在一种最佳的正交变换—K-L变换。所谓最佳:1.变换系数互不相关;2.数值较大的方差出现在少数系数中,即能量高度集中。这样,可在允许的总的均方误差一定的条件下,将数据减到最少。变换编码若输入是广义平稳序列,则存在一种最佳的正交变换—K-57变换编码由于卡洛变换(KLT)的基向量是原始图象协方差矩阵的特征向量,对于不同的图象,有着不同的最佳基向量。基向量不是固定的,所以一般没有快速算法,因此只宜于作理论分析和试验用。实用上用得较多的是离散傅立叶变换(DFT)、离散余弦变换(DCT)、离散小波变换(DWT)和沃尔什—哈达玛变换(WHT)。它们的基向量是固定的,有比较成熟的快速算法。变换编码由于卡洛变换(KLT)的基向量是原始图象协方差矩阵的58变换编码压缩框图???各框图实现了何种冗余压缩?变换编码压缩框图???各框图实现了何种冗余压缩?59

基于DCT的图像压缩编码

离散余弦变换是图像压缩中最常用的一种变换。DCT变换在信息压缩能力和计算复杂性之间提供了平衡。基于DCT的图像压缩编码离散余弦变换是图像压缩中最常用60MATLAB函数g=dct2(f);反变换f=idct2(g);MATLAB函数g=dct261讨论1:子图像的选择保留25%的系数来重构图像计算复杂度子图像的尺寸对变换编码重构误差的影响8x8足够了DCT最好讨论1:子图像的选择保留25%的系数来重构图像计算复62子图像的选择放大的原图使用25%的DCT系数、8x8子图恢复图像DCT系数子图:8x8pixels子图:2x2pixels子图:4x4pixels子图像的选择放大的原图使用25%的DCT系数、8x8子图63讨论2:量化处理:比特分配表示变换系数时,可根据每个系数的重要程度分配不同比特数:-较重要的系数

分配大比特数

-不太重要的系数分配小比特数或不分配两种常用的比特分配方法-区域编码

:基于最大方差分配比特,对所有子图使用单一固定的模板进行编码-门限编码

:基于最大量级的变换系数分配比特讨论2:量化处理:比特分配表示变换系数时,可根据每个系数64区域编码举例区域编码举例65门限编码举例门限模板门限系数排序序列门限编码举例门限模板门限系数排序序列66讨论3:DCT量化矩阵图像质量和量化程度的矛盾:大的量化步长会产生大的图像失真;小的又会导致低压缩率

如何有效地量化DCT系数?由于人眼对高频不敏感,低频信号就比高频信号更重要。

如,JPEG对高频系数用了大的量化步长,图像并没有出现明显的失真。讨论3:DCT量化矩阵图像质量和量化程度的矛盾:大的量化67变换编码举例原图512x512pixelsFourierHadamardDCTError子图像:

8x8pixels量化时截取50%系数(只保留32个最大系数)RMSError=1.28RMSError=0.86RMSError=0.68变换编码举例原图512x512pixelsFourierH68制定图像标准的国际组织:

ISO(国际标准化组织)CCITT(国际电报电话咨询委员会)联合组织下进行制定的连续色调图像压缩标准静止帧黑白、彩色压缩(JPEG标准)连续帧单色、彩色压缩(MPEG标准)6.4静止图像压缩编码的技术标准JPEG制定图像标准的国际组织:连续色调图像压缩标准6.4静止图像69静止帧黑白、彩色压缩(JPEG)JPEG标准简述JPEG压缩流程JPEG压缩算法的实现

颜色变换 零偏置转换频域变换 系数量化符号编码JPEG压缩举例静止帧黑白、彩色压缩(JPEG)70有三种压缩系统:(1)基线编码系统:面向大多数有损压缩的应用,采用DCT变换压缩。(2)扩展编码系统:面向递进式应用,从低分辨率到高分辨率逐步递进传递的应用。(3)独立编码系统:面向无损压缩的应用,采用无损预测压缩,符号编码采用霍夫曼或算术编码。一个产品或系统必须包括对基线系统的支持1.JPEG标准简述1.JPEG标准简述712.JPEG压缩流程DCT逆向变换量化器DCT正向变换构造8x8的子图输入图像NxN符号编码器压缩图像符号解码器压缩的图像合成8x8的子图解压图像颜色空间转换零偏置转换颜色空间转换零偏置转换2.JPEG压缩流程DCT量化器DCT构造8x8输入图像72(2)颜色空间转换

人眼对亮度更敏感,提取亮度特征,将RGB转换为YCbCr模型,编码时对亮度采用特殊编码:

Y=0.299R+0.5870G+0.1140B(亮度) Cb=–0.1787R–0.3313G+0.5000B+128(色度) Cr=0.5000R–0.4187G–0.0813B+128(色度)颜色解码:

R=Y+1.40200(Cr–128) G=Y–0.34414(Cb–128)–0.71414(Cr–128) B=Y+1.77200(Cb–128)(1)构造子图像

(子图像尺寸:8x8)JPEG(2)颜色空间转换颜色解码:(1)构造子图像(子图像尺73(3)零偏置转换对于灰度级是2n的像素,通过减去2n-1,替换像素本身对于n=8,即将0~255的值域,通过减去128,转换为值域在-128~127之间的值目的:使像素的绝对值出现3位10进制的概率大大减少JPEG(3)零偏置转换JPEG74例:用8x8的JEPG基线标准,压缩并重构下列子图52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68 65 76 78 94JPEG例:用8x8的JEPG基线标准,压缩并重构下列子图JPEG750偏置转换后-76 -73 -67 -62 -58 -67 -64 -55-65 -69 -62 -38 -19 -43 -59 -56-66 -69 -60 -15 16 -24 -62 -55-65 -70 -57 -6 26 -22 -58 -59-61 -67 -60 -24 -2 -40 -60 -58-49 -63 -68 -58 -51 -65 -70 -53-43 -57 -64 -69 -73 -67 -63 -45-41 -49 -59 -60 -63 -52 -50 -34JPEG0偏置转换后JPEG76(4)频域变换(DCT变换)频域变换产生64个系数第一个系数称为直流系数(DC系数)其余的63个系数称为交流系数(AC系数)JPEG(4)频域变换(DCT变换)JPEG77正向DCT变换(N=8)后变成-415 -29 -62 25 55 -20 -1 37 -21 -62 9 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 311 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1 -1 0 -1JPEG正向DCT变换(N=8)后变成JPEG78(5)系数量化对于亮度和度色使用不同的量化阈值模板,并取整

亮度的量化模板系数1611 10 16 24 40 51 6112 12 14 19 26 58 60 5514 13 16 24 40 57 69 5614 17 22 29 51 87 80 6218 22 37 56 68 109 103 7724 35 55 64 81 104 113 9249 64 78 87 103 121 120 10172 92 95 98 112 100 103 99JPEG(5)系数量化亮度的量化模79

色度的量化模板系数1718 24 47 99 99 99 9918 21 26 66 99 99 99 9924 26 56 99 99 99 99 9947 66 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 9999 99 99 99 99 99 99 99量化是JPEG算法中损失图像精度的根源JPEG色度的量化模板系数量化是J80量化变换后的数组(取整采用四舍五入方式)经正向DCT变换后量化变换后的数组经正向DCT变换后81(6)符号编码将量化后的系数,按之字形重新排序成矢量,全零结尾用特殊符号EOBZig-Zag编码[-26-31-3-2-62-41-41150200-1200000-1-1EOB](6)符号编码Zig-Zag编码[-26-31-382符号编码:[-26

-31-3-2-62-41-41150200-1200000-1-1EOB]区间号编码(SSSS)+

系数预测误差本身编码(VVVV)

DC的编码方式(预测+统计):编码由两部分组成:DC和AC系数用不同的方式分别编码JPEG符号编码:区间号编码(SSSS)+系数预测误差本身83DC的编码方式(预测+统计)第一步:求DPCM(差分脉冲调制码),用当前的DC,减去前一个子图的DC

VVVV: DIFF=DC–PRE_DC第二步:根据DIFF求出区间号:SSSS通过DIFF查区间编号表得出区间号SSSS根据SSSS查哈夫曼编码表得出SSSS的哈夫曼编码第三步:对VVVV编码,正数是自己,负数用补码(求反)JPEGDC的编码方式(预测+统计)JPEG84

用-9查区间表得:SSSS=4

用4查哈夫曼编码表得:101

VVVV=-9

二进制编码为:1001

求反: 1001=0110

最后的编码为:101+0110=1010110PreDC-17DC-26DC的编码方式(预测+统计)例子:DC=-26 PRE_DC=-17 DIFF=-26-(-17)=-9JPEGPreDCDCDC的编码方式(预测+统计)JPEG85AC系数的编码方式编码由两部分组成:区间号编码(RRRR/SSSS)+系数本身(VVVV)第一部分:

SSSS:区间号(查AC区间表)

RRRR:该系数前值为0的系数的个数(行程数)。RRRR/SSSS的编码:查区间编码表第二部分:

VVVV:系数本身编码[-26-31-3-2-62-41-41150200-1200000-1-1EOB]JPEGAC系数的编码方式[-26-31-3-2-6286符号编码结果举例

完成后的编码数组(重排的)是:10101100100001010001011000010110100011001100011001001100101

1101110

1110000110111101000001010完成编码的重排数组的总位数是92,不压缩需要8x8x8=512位。结果的压缩率是5.6:1。[-26-31-3-2-62-41-41150200-1200000-1-1EOB]JPEG符号编码结果举例[-26-31-3-2-62-87JPEG2000vs.JPEGlowbit-rateperformanceJPEG2000vs.JPEGlowbit-rate88作业:

已知信源a,b,c,d,e,f,g,h出现的概率分别为0.20,

0.09,

0.11,

0.13,

0.07,

0.12,

0.08,

0.20。试将该信源编为霍夫曼编码,要求写出编码过程,并计算霍夫曼编码的平均码长及编码效率.作业:已知信源a,b,c,d,e,f,g,h出现的概率89区间DC哈夫曼编码表区间 编码区间 编码

000611101010711110201181111103100911111104101A111111105110B111111110返区间 编码区间 编码返90区间表

范围 DC差区间AC区间

0 0 N/A -1,1 1 1 -3,-2,2,322-7,…,-4,4,…,7 33-15,…,-8,8,…,1544-31,…,-16,16,…,31 55-63,…,-32,32,…,63 66ACDC 范围 DC差区间AC区91区间AC哈夫曼编码表行程/区间编码行程/区间编码

0/010100/711110000/1000/811111101100/2010/9111111111000000/31000/A111111111000000/410111/111000/5110101/2110110/61110001/31111001………..BJPEG区间AC哈夫曼编码表行程/区间编码行程/区间92第六章图象数据压缩编码图像压缩基础

无损压缩有损压缩静止图像压缩编码的技术标准JPEG基本内容第六章图象数据压缩编码图像压缩基础基本内容93数字图象通常有很大的比特数,这给图象的传输和存储带来相当大的困难。数据的压缩是必不可少的。图象压缩的必要性thetotalbytenumberis:

460×520×3=700kB数字图象通常有很大的比特数,这给图象的传输和存储带来相当大的94一部90分钟的彩色电影,每秒放映24帧。把它数字化,每帧512×512象素,每象素的R、G、B三分量分别占1byte,总比特数为

90×60×24×3×512×512=101922MB若用一张可存600兆字节数据的CD光盘存储这部电影,光图象(还有声音)就需要170张CD光盘。图象压缩的必要性一部90分钟的彩色电影,每秒放映24帧。把它数字化,每帧5195对图象数据进行压缩显得非常必要

本章讨论的问题:在满足一定条件下,能否减小图象比特数,以及用什么样的编码方法使之减少。图象压缩的必要性对图象数据进行压缩显得非常必要图象压缩的必要性96图象压缩是可能的

一般原始图象中存在很大的冗余度图象压缩是可能的一般原始图象中存在很大的冗余度97

用户通常允许图象失真当信道的分辨率不及原始图象的分辨率时,降低输入的原始图象的分辨率对输出图象分辨率影响不大。用户所关心的图像区域有限,可对其余部分图像采用空间和灰级上的粗化。根据人的视觉特性对不敏感区进行降分辨率编码(视觉冗余)。用户通常允许图象失真98图象压缩是可能的图象压缩是可能的99原始图象越有规则,各象素之间的相关性越强,它可能压缩的数据就越多。值得指出的是:当前采用的编码方法得到的结果,离可能压缩的极限还相差很远,这说明图象数据压缩的潜力是很大的,直到目前为止,它还是个正在继续研究的领域。图象压缩是可能的原始图象越有规则,各象素之间的相关性越强,它可能压缩的数据就1006.1图像压缩基础图像压缩所解决的问题是尽量减少表示数字图像时需要的数据量。减少数据量的基本原理是除去其中多余的数据。以数学的观点看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。6.1图像压缩基础图像压缩所解决101图像熵

图像像素灰度级集合为{d1,d2,…,dm},对应概率为p(d1),

p(d2),…,p(dm),则图像熵定义为

H表示对输入灰度级集合进行编码时所需要的平均位数的下限。di出现的概率相等时,熵最大。图像编码压缩名词术语图像熵图像像素灰度级集合为{d1,d2,…,102平均码长

l为灰度级rk所对应的码字长度。平均码长l为灰度级rk所对应的码字长度。103

编码效率

图像熵与平均码长之比编码效率104香农无干扰编码定理在无干扰条件下,存在一种无失真的编码方法,使编码的平均码长和信源的熵任意接近。香农无干扰编码定理在无干扰条件下,存在105压缩比Ls为源代码长度,Ld为压缩后代码长度压缩比106

保真度标准保真度标准——评价压缩算法的标准(1)客观保真度标准(2)主观保真度标准保真度标准保真度标准——评价压缩算法的标准107

a)输入图和输出图之间的均方根(rms)误差b)输入图和输出图的均方根信噪比(1)客观保真度标准a)输入图和输出图之间的均方根(rms)误差b)输入108(2)主观保真度标准

通过视觉比较两个图像,给出一个定性的评价,如很粗、粗、稍粗、相同、稍好、较好、很好,这种评价被称为主观保真度标准。(2)主观保真度标准109

冗余在数字图像压缩中的三种基本的数据冗余:编码冗余像素间冗余心理视觉冗余冗余在数字图像压缩中的三种基本的数据冗余:110编码冗余通过图像灰度级直方图可以深入了解编码结构,从而减少表达图像所需的数据量。例:编码冗余通过图像灰度级直方图可以深入了解编码结构,从而减少111由于任何给定的像素值,原理上都可以通过它的邻居预测到,所以单个像素携带的信息相对是小的。

为减少图像中的像素间冗余,二维像素阵列必须变换为更有效的形式。

像素间冗余

空间冗余

几何冗余

帧间冗余例:原图像数据:234223231238235压缩后数据:23411-8-73由于任何给定的像素值,原理上都可以通过它的邻居预测到,所以单112心理视觉冗余在正常的视觉处理过程中各种信息的相对重要程度不同,那些不重要的信息称做心理视觉冗余心理视觉冗余在正常的视觉处理过程中各种信息的相对重要程度不113无损压缩与有损压缩无损压缩基于统计模型,减少源数据流中的冗余,同时保持信息不变。又称为冗余压缩。典型代表有Huffman编码,算术编码、游程长度编码等。有损压缩以牺牲部分信息量为代价而换取缩短平均码长的编码压缩方法。在压缩中丢失了部分信息,又称为熵压缩。典型代表有离散余弦变换编码、有损预测编码等。一般地,有损压缩的压缩效率高于无损压缩。无损压缩与有损压缩无损压缩基于统计模型,减少源数据流中的冗余114实验二图像增强下周二做,地点不变(交邮政编码分割程序)No.13实验二图像增强No.131156.2无损压缩在很多应用中,如医疗和商业文档的归档、卫星成像的处理、数字X光照相术,无损压缩时唯一可以接受的数据压缩方式。

无损压缩常由两种彼此独立的操作组成:(1)为减少像素间冗余建立一种可替代的图像表达方式;(2)对这种表达方式进行编码以便消除编码冗余。6.2无损压缩在很多应用中,如医疗和商业文档的归档、卫星成116一、基本原理通过减少编码冗余来达到压缩的目的。将在图像中出现次数多的像素值给一个短的编码,将出现次数少的像数值给一个长的编码。二、霍夫曼编码是即时码:

是唯一可译码,其中任意一个码字都只能与一种信号存在对应关系,而且任意一个码字都不能是其他码字的前缀。6.2.1霍夫曼编码(属于统计编码)一、基本原理6.2.1霍夫曼编码(属于统计117

信号源a={a1,a2,a3,a4,a5,a6},其概率分布为p1=0.1p2=0.4p3=0.06p4=0.1p5=0.04p6=0.3,求最佳Huffman码。方法:将信源符号按出现概率从大到小排成一列,然后把最末两个符号的概率相加,合成一个概率。二、Huffman编码举例信号源a={a1,a2,a3,a4,a5,118Huffman编码方法:把这个符号的概率与其余符号的概率按从大到小排列,然后再把最末两个符号的概率加起来,合成一个概率。重复上述做法,直到最后剩下两个概率为止。从最后一步剩下的两个概率开始逐步向前进行编码。每步只需对两个分支各赋予一个二进制码,如对概率大的赋予码元0,对概率小的赋予码元1。Huffman编码方法:119建立概率统计表和编码树 符号概率1 23 4 a20.40.40.40.40.6 a6 0.30.30.30.30.4 a10.10.10.20.3 a4 0.10.10.1 a30.060.1 a5 0.04 霍夫曼编码举例霍夫曼编码举例120编码过程:符号概率编码1 234a2 0.41 0.410.410.410.60a6 0.3000.3000.3000.3

00

0.41a10.10110.10110.2

0100.3

01a4 0.101000.1

0100

0.1

011

a3 0.06

010100.1

0101

a5 0.04

01011霍夫曼编码举例编码过程:霍夫曼编码举例121霍夫曼编码例子:将010100111100解码解码过程:010100111100a3a1a2a2a6a2a6a1a4a3a5

10001101000101001011

霍夫曼编码例子:将010100111100解码a2a122

信号源a={a1,a2,a3,a4,a5,a6},其概率分布为p1=0.1p2=0.4p3=0.06p4=0.1p5=0.04p6=0.3,求最佳Huffman码。a2a6a1a4a3a5

10001101000101001011

编码的平均长度:其信源的熵为2.14bits/symbol,霍夫曼编码编码效率为0.937信号源a={a1,a2,a3,a4,a5,123霍夫曼编码静态编码在压缩之前就建立好一个概率统计表和编码树。算法速度快,但压缩效果不是最好动态编码对每一个图像,临时建立概率统计表和编码树。算法速度慢,但压缩效果最好霍夫曼编码124霍夫曼编码的特点编码值不唯一当图像灰度值分布很不均匀时,霍夫曼编码效率高。编码过程要经过N-2次合并(有N个灰度级),N较大时,计算量大.改进:用亚最优变长码:截断霍夫曼编码,霍夫曼平移编码霍夫曼编码的特点编码值不唯一1256.2.2算术编码(属于统计编码)(自学)假设某个字符的出现概率为80%,该字符事实上只需要-log2(0.8)=0.322个二进制位进行编码难道真的能只输出0.322个0或0.322个1吗?算术编码的输出是:一个小数算术编码对整条信息(无论信息有多么长),其输出仅仅是一个数,而且是一个介于0和1之间的二进制小数。例如算术编码对某条信息的输出为1010001111,那么它表示小数0.1010001111,也即十进制数0.646.2.2算术编码(属于统计编码)(自学)假设某个字符的126

从整个符号序列出发,采用递推形式连续编码在算术编码中源符号和码字间的一一对应关系并不存在。1个算术码字要赋给整个信源符号序列而码字本身确定0和1之间的1个实数区间随着符号序列中的符号数量增加,用来代表它的区间减小,而表达区间的信息单位数量变大算术编码的特点

从整个符号序列出发,采用递推形式连续编码算术编码的特点127例:来自一个4-符号信源{a,b,c,d}的由5个符号组成的符号序列:abccd.已P(a)=0.2,P(b)=0.2,P(c)=0.4,P(d)=0.2.可用0.068来表示整个符号序列例:来自一个4-符号信源{a,b,c,d}的由5个符号组成的1286.2.3行程编码RLE(属于统计编码)

行程:具有相同灰度值的像素序列。是一种熵编码,广泛应用于各种图象格式的数据压缩处理中,如BMP,TIFF,JPEG。编码思想:用行程的灰度和行程的长度代替行程本身。例:设重复次数为iC,重复像素值为iP编码为:iCiPiCiPiCiP编码前:aaaaaaabbbbbbcccccccc编码后:7a6b8c6.2.3行程编码RLE(属于统计编码)行程:具有129RLE比较适合于二值图像的编码RLE比较适合于二值图像的编码130(1)一维行程编码

对图象进行行扫描时,行内各象素的灰度级可组成一个整数序列x1,x2,…,xN。在行程编码中,我们将这个序列映射成整数对(gk,lk),其中gk表示灰度级,lk表示行程。行程编码(1)一维行程编码行程编码131(2)二维行程编码

一维行程编码只考虑消除每行内象素的相关性,未考虑行间象素的相关性。二维行程编码的基本原理是跟踪各个黑色和白色游程的起始和终结点。(2)二维行程编码

一维行程编码只考虑消除每行内象132原图象文件:277560字节行程编码文件:279860字节压缩比:0.992原图象文件:行程编码文件:压缩比:133原图象文件:66616字节行程编码文件:9272字节压缩比:7.185原图象文件:行程编码文件:压缩比:134行程编码

如果图像是由很多块颜色或灰度相同的大面积区域组成的,特别是二值图象,采用行程编码可以达到很高的压缩比。如果图像中的数据非常分散,则行程编码不但不能压缩数据,反而会增加图像文件的大小。为了达到较好的压缩效果,一般不单独采用行程编码,而是和其他编码方法结合使用。分析:行程编码

如果图像是由很多块颜色或灰度相同的大面积区域组成的1356.3有损压缩有损压缩是以牺牲图像重构的准确度为代价换取压缩能力增加的概念为基础的。如果产生的失真是可以容忍的,则压缩能力上的增加就是有效的。6.3有损压缩有损压缩是以牺牲图像重构的准确度为代价换取压136有损预测编码:直接对像素在图像空间进行操作,称为空域方法。邻近的M个值预测当前值,当前值与预测值之差量化编码,(一维、二维预测等)变换编码:基于图像变换的编码方法,称为频域方法。

有损预测编码:直接对像素在图像空间进行操作,称为空域方法137预测编码的基本原理

利用已有样本对新样本进行预测,将样本的实际值与其预测值相减得到误差值,再对误差值进行编码。通常误差值比样本值小得多,从而达到数据压缩的效果。6.3.1有损预测编码预测编码的基本原理6.3.1有损预测编码138

预测器可以是固定的,也可以是自适应的;可以是线性的,也可以是非线性的。预测器设计得越好,对输入的数据压缩就越多。有损预测编码预测器可以是固定的,也可以是自适应的;可以是139有损预测编码–DPCM(差分脉冲编码调制)系统量化器编码器预测器压缩图像解码器预测器压缩图像解压图像输入图像有损预测编码–DPCM(差分脉冲编码调制)系统量化器编码器预140德尔塔调制最优量化器最佳线性预测器线性自适应预测编码有损预测编码德尔塔调制有损预测编码141一维线性预测

有损预测编码一维线性预测

有损预测编码142最佳线性预测

采用均方误差(MSE)为极小值的准则来获得DPCM,称为最佳线性预测,亦即此时预测误差最小。对于图像来说,最佳线性预测的关键就是求出各个预测系数,使得预测误差最小,从而使得接收图像和原图像差别最小。

有损预测编码最佳线性预测有损预测编码143量化器编码器预测器压缩图像输入图像为简化分析,设:量化器编码器预测器压缩图像输入图像为简化分析,设:144最佳线性预测

选ak使E{e2n}最小。在假fn具有零均值和方差为σ2的条件下解出联立方程的解集:最佳线性预测

在假fn具有零均值和方差为σ2的条件下解出联立145R-1是m×m自相关矩阵的逆矩阵R-1是m×m自相关矩阵的逆矩阵146方程的解a1,a2,…,am

便是一组最佳的预测系数。压缩效果可用方差σ2e(n)来衡量:原始序列相关性越强,R(i)越大,σ2e(n)越小,压缩效果越显著;原始序列互不相关,即R(i)=0,i≠0,则,σ2e(n)=σ2一点也不能压缩。最佳线性预测方程的解a1,a2,…,am便是一组最佳的1476.3.2变换编码变换编码通常是指将某种正交变换作为映射变换,用变换系数来表示原始图象,对变换系数进行编码。对一个N×

N的图像f(x,y):正变换逆变换6.3.2变换编码变换编码通常是指将某种正交变换作为映射变148变换编码若输入是广义平稳序列,则存在一种最佳的正交变换—K-L变换。所谓最佳:1.变换系数互不相关;2.数值较大的方差出现在少数系数中,即能量高度集中。这样,可在允许的总的均方误差一定的条件下,将数据减到最少。变换编码若输入是广义平稳序列,则存在一种最佳的正交变换—K-149变换编码由于卡洛变换(KLT)的基向量是原始图象协方差矩阵的特征向量,对于不同的图象,有着不同的最佳基向量。基向量不是固定的,所以一般没有快速算法,因此只宜于作理论分析和试验用。实用上用得较多的是离散傅立叶变换(DFT)、离散余弦变换(DCT)、离散小波变换(DWT)和沃尔什—哈达玛变换(WHT)。它们的基向量是固定的,有比较成熟的快速算法。变换编码由于卡洛变换(KLT)的基向量是原始图象协方差矩阵的150变换编码压缩框图???各框图实现了何种冗余压缩?变换编码压缩框图???各框图实现了何种冗余压缩?151

基于DCT的图像压缩编码

离散余弦变换是图像压缩中最常用的一种变换。DCT变换在信息压缩能力和计算复杂性之间提供了平衡。基于DCT的图像压缩编码离散余弦变换是图像压缩中最常用152MATLAB函数g=dct2(f);反变换f=idct2(g);MATLAB函数g=dct2153讨论1:子图像的选择保留25%的系数来重构图像计算复杂度子图像的尺寸对变换编码重构误差的影响8x8足够了DCT最好讨论1:子图像的选择保留25%的系数来重构图像计算复154子图像的选择放大的原图使用25%的DCT系数、8x8子图恢复图像DCT系数子图:8x8pixels子图:2x2pixels子图:4x4pixels子图像的选择放大的原图使用25%的DCT系数、8x8子图155讨论2:量化处理:比特分配表示变换系数时,可根据每个系数的重要程度分配不同比特数:-较重要的系数

分配大比特数

-不太重要的系数分配小比特数或不分配两种常用的比特分配方法-区域编码

:基于最大方差分配比特,对所有子图使用单一固定的模板进行编码-门限编码

:基于最大量级的变换系数分配比特讨论2:量化处理:比特分配表示变换系数时,可根据每个系数156区域编码举例区域编码举例157门限编码举例门限模板门限系数排序序列门限编码举例门限模板门限系数排序序列158讨论3:DCT量化矩阵图像质量和量化程度的矛盾:大的量化步长会产生大的图像失真;小的又会导致低压缩率

如何有效地量化DCT系数?由于人眼对高频不敏感,低频信号就比高频信号更重要。

如,JPEG对高频系数用了大的量化步长,图像并没有出现明显的失真。讨论3:DCT量化矩阵图像质量和量化程度的矛盾:大的量化159变换编码举例原图512x512pixelsFourierHadamardDCTError子图像:

8x8pixels量化时截取50%系数(只保留32个最大系数)RMSError=1.28RMSError=0.86RMSError=0.68变换编码举例原图512x512pixelsFourierH160制定图像标准的国际组织:

ISO(国际标准化组织)CCITT(国际电报电话咨询委员会)联合组织下进行制定的连续色调图像压缩标准静止帧黑白、彩色压缩(JPEG标准)连续帧单色、彩色压缩(MPEG标准)6.4静止图像压缩编码的技术标准JPEG制定图像标准的国际组织:连续色调图像压缩标准6.4静止图像161静止帧黑白、彩色压缩(JPEG)JPEG标准简述JPEG压缩流程JPEG压缩算法的实现

颜色变换 零偏置转换频域变换 系数量化符号编码JPEG压缩举例静止帧黑白、彩色压缩(JPEG)162有三种压缩系统:(1)基线编码系统:面向大多数有损压缩的应用,采用DCT变换压缩。(2)扩展编码系统:面向递进式应用,从低分辨率到高分辨率逐步递进传递的应用。(3)独立编码系统:面向无损压缩的应用,采用无损预测压缩,符号编码采用霍夫曼或算术编码。一个产品或系统必须包括对基线系统的支持1.JPEG标准简述1.JPEG标准简述1632.JPEG压缩流程DCT逆向变换量化器DCT正向变换构造8x8的子图输入图像NxN符号编码器压缩图像符号解码器压缩的图像合成8x8的子图解压图像颜色空间转换零偏置转换颜色空间转换零偏置转换2.JPEG压缩流程DCT量化器DCT构造8x8输入图像164(2)颜色空间转换

人眼对亮度更敏感,提取亮度特征,将RGB转换为YCbCr模型,编码时对亮度采用特殊编码:

Y=0.299R+0.5870G+0.1140B(亮度) Cb=–0.1787R–0.3313G+0.5000B+128(色度) Cr=0.5000R–0.4187G–0.0813B+128(色度)颜色解码:

R=Y+1.40200(Cr–128) G=Y–0.34414(Cb–128)–0.71414(Cr–128) B=Y+1.77200(Cb–128)(1)构造子图像

(子图像尺寸:8x8)JPEG(2)颜色空间转换颜色解码:(1)构造子图像(子图像尺165(3)零偏置转换对于灰度级是2n的像素,通过减去2n-1,替换像素本身对于n=8,即将0~255的值域,通过减去128,转换为值域在-128~127之间的值目的:使像素的绝对值出现3位10进制的概率大大减少JPEG(3)零偏置转换JPEG166例:用8x8的JEPG基线标准,压缩并重构下列子图52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71 64 59 55 61 65 8387 79 69 68 65 76 78 94JPEG例:用8x8的JEPG基线标准,压缩并重构下列子图JPEG1670偏置转换后-76 -73 -67 -62 -58 -67 -64 -55-65 -69 -62 -38 -19 -43 -59 -56-66 -69 -60 -15 16 -24 -62 -55-65 -70 -57 -6 26 -22 -58 -59-61 -67 -60 -24 -2 -40 -60 -58-49 -63 -68 -58 -51 -65 -70 -53-43 -57 -64 -69 -73 -67 -63 -45-41 -49 -59 -60 -63 -52 -50 -34JPEG0偏置转换后JPEG168(4)频域变换(DCT变换)频域变换产生64个系数第一个系数称为直流系数(DC系数)其余的63个系数称为交流系数(AC系数)JPEG(4)频域变换(DCT变换)JPEG169正向DCT变换(N=8)后变成-415 -29 -62 25 55 -20 -1 37 -21 -62 9 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 311 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1 -1 0 -1JPEG正向DCT变换(N=8)后变成JPEG170(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论