![第3章图像处理技术-3_第1页](http://file4.renrendoc.com/view/0d74e41b9d58099f958f18e57c95081f/0d74e41b9d58099f958f18e57c95081f1.gif)
![第3章图像处理技术-3_第2页](http://file4.renrendoc.com/view/0d74e41b9d58099f958f18e57c95081f/0d74e41b9d58099f958f18e57c95081f2.gif)
![第3章图像处理技术-3_第3页](http://file4.renrendoc.com/view/0d74e41b9d58099f958f18e57c95081f/0d74e41b9d58099f958f18e57c95081f3.gif)
![第3章图像处理技术-3_第4页](http://file4.renrendoc.com/view/0d74e41b9d58099f958f18e57c95081f/0d74e41b9d58099f958f18e57c95081f4.gif)
![第3章图像处理技术-3_第5页](http://file4.renrendoc.com/view/0d74e41b9d58099f958f18e57c95081f/0d74e41b9d58099f958f18e57c95081f5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章图像处理技术-3第一页,共62页。1词典编码
词典编码,又称LZW压缩算法,是一种新颖的压缩方法,由Lemple-Ziv-Welch三人共同创造,用他们的名字命名。基本原理就是首先建立一个字典(字符串表),把每一个第一次出现的字符串放入字典中,并用一个数字来表示,该数字与此字符串在字典中的位置有关。如果这个字符串再次出现时,即可用表示它的数字代替该字符串,并将这个数字写入编码结果中。如“abc”字符串,如果在压缩时用3表示,只要再次出现,均用3表示,并将“abc”字符串存入字典中,在图像解码时遇到数字3,即可从词典中查出3所代表的字符串“abc”,在解压缩时,字典可以根据压缩数据重新生成。第二页,共62页。LZW编码算法的具体执行如下:BEGINs=当前要输入字符;whilenotEOF{c=下一个要输入字符;Ifs+c存在于字典中;s=s+c;Else{输出对于s的编码;添加字符串s+c到字典中,并用新的编码符号标记;s=c;}}输出对于s的编码;END第三页,共62页。举例:
假设初始字典中包含3个字符,其对应编码符号如下表所示。编码字符1A2B3C假设输入字符串为ABABBABCBABBA第四页,共62页。LZW压缩算法编码过程当前字符下一个字符输出编码字典中数字字典中字符串
1A
2B
3CAB14ABBA25BAAB
ABB46ABBBA
BAB57BAB第五页,共62页。当前字符下一个字符输出编码字典中数字字典中字符串BC28BCCA39CAAB
ABA410ABAAB
ABB
ABBA611ABBAAEOF1
第六页,共62页。最后的输出编码是124523461。相当于原来的14个字符,经过压缩编码后只需要9个字符就可以存储原来的信息,压缩率是14/9=1.56。第七页,共62页。LZW的简单解码算法如下:BEGINs=NIL;whilenotEOF{k=下一输入编码;entry=字典中对应于k的条目;输出entry;if(s!=NIL)添加s+entry[0]到字典中,并用新的编码标记;s=entry;}END
第八页,共62页。LZW压缩算法解码部分前一个解码串输入解码结果字典中数字字典中字符串
1A
2B
3CNIL1A
A2B4ABB4AB5BAAB5BA6ABBBA2B7BABB3C8BCC4AB9CAAB6ABB10ABAABB1A11ABBAAEOF
第九页,共62页。2无损预测编码预测编码的基本思想是通过仅对每个像素的真实值与预测值的差值进行编码来消除像素间的冗余。因为图像的相邻像素间有相关性,所以才使预测成为可能。预测编码可以分为无损预测和有损预测两类。第十页,共62页。
下面的图是一个无损预测编码系统的基本组成部分。该系统包含一个编码器和一个解码器,编码器和解码器具有一个相同的预测器。输入图像的每一个连续像素标记为fn,经过编码器时,预测器会根据该像素之前输入的像素信息产生预测值。预测器输出值标记为,然后形成预测误差:第十一页,共62页。无损预测编码模型图第十二页,共62页。预测误差通过符号编码器进行编码以产生压缩图像数据流。解码器可根据接收到的数据流重建预测误差en,利用下面的公式得到输入图像的像素值,实现解码。
第十三页,共62页。由于相邻像素的相关性,在预测比较准确时,预测误差的动态范围会远小于原始图像序列的动态范围,所以对预测误差的编码所需的比特数会大大减少,这是预测编码进行数据压缩的基本原理。第十四页,共62页。静止图像的二维预测编码
cb
ax
三邻域预测法预测类型预测值X’0非预测1a2b3c4a+b-c5a+(b-c)/26b+(a-c)/27(a+b)/2第十五页,共62页。无损JPEG预测采用三邻域采样值法,由a、b、c预测X,以X’表示X的预测值,从X中减去X’得到一个差值,再对差值进行无失真的熵编码(算术编码或霍夫曼编码)。上页表中1、2、3为一维编码,4、5、6、7为二维编码。假设表中a=10,b=10,c=12,x=10,利用第5中预测方案,得到X的预测值X’=10+(10-12)/2=9,则误差en=X-X’=10-9=1。由于编码en(=1)比编码x(=10)所需要的编码位数要少,从而实现了压缩。第十六页,共62页。在解码x时,a、b、c的值是已知的,由于解码器中的预测器与编码器中的相同,故可求出X’=10+(10-12)/2=9,从而得到x=X’+en=9+1=10从而实现了无损压缩。第十七页,共62页。3常用的有损压缩方法虽然人们总是期望无损压缩,但无损压缩的压缩率比较小,对于冗余度很少的信息对象用无损压缩技术并不能得到令人满意的结果。而有损压缩方法虽然会造成一些信息的损失,但对于音频、图像和视频等数据压缩后的结果并不要求与原始数据完全一致,所以有损压缩在多媒体领域得到了更广泛的应用。第十八页,共62页。3-1量化量化在一定程度上是任何有损压缩算法的核心。如果没有量化,许多有损压缩算法几乎不会有任何信息的损失。但人们所感兴趣的压缩信息源可能包括大量的不同输出值,为了高效的表示这些信息源,必须通过量化来减少不同输出值的数量。第十九页,共62页。量化标量量化(应用于数值)矢量量化均匀量化非均匀量化第二十页,共62页。1)均匀标量量化
如果采用相等的量化间隔处理采样得到的信号值,那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化。如下图所示。量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声。图均匀量化的基本结构第二十一页,共62页。均匀标量量化器有两种类型:midrise和midtread,如下图所示。Midrise量化器包含一个0值的分割间隔,而midtread量化器把0作为一个输出值。Midrise量化器有偶数个输出等级,而midtread量化器有奇数个输出等级。当信息源数据包含从较小正数到较小负数波动之间的0值时,midtread量化器是一个很好的应用。在这种情况下运用midtread量化器,可以准确稳定的表示0值。两种均匀量化器第二十二页,共62页。2)非均匀标量量化如果输入数据不是均匀分布的,则均匀量化器的效率可能会降低。因为用均匀量化方法量化输入信号时,无论对大的输入信号还是小的输入信号一律都采用相同的量化间隔。为了适应幅度大的输入信号,同时又要满足精度要求,在信息源分布密度高的区域增加量化等级的数量,可以有效地降低失真。而且,对于有些信号(例如话音信号),大信号出现的机会并不多,如果采用均匀量化,则增加的量化等级就没有充分利用。为了克服均匀量化的不足,就出现了非均匀量化的方法,这种方法也叫做非线性量化。
第二十三页,共62页。非均匀量化的基本思想是:对输入信号进行量化时,变化比较小的输入信号采用大的量化间隔,变化比较大的输入信号采用小的量化间隔,如下图所示,这样就可以在满足精度要求的情况下用较少的位数来表示。量化数据还原时采用相同的规则。图非均匀量化第二十四页,共62页。4变换编码变换编码是指先对信号进行某种函数变换,从一种域(空间)变换到另一种域(空间),再对变换后的信号进行编码处理。以声音、图像为例,由于声音、图像大部分信号都是低频信号,在频率域中信号的能量较集中,变换后的大多数系数都很小,这些系数可较粗地量化或完全忽略掉而只产生很少的失真,故将空间域信号变换到频率域,再对其进行采样、编码,便可以达到压缩数据的目的。第二十五页,共62页。图典型的变换编码系统框图4变换编码第二十六页,共62页。构造子图像。构造子图像是将一幅分辨率为N×N的图像分解成(N/n)2个分辨率为n×n的子图像。变换。对子图像应用某种函数进行变换,对子图像进行变换的目的是解除每个图像内部像素之间的相关性或将尽可能多的信息集中到较少的变换系数上。量化。量化步骤有选择地消除或较粗糙地量化携带信息最少的系数,因为这些系数对重建子图像质量的影响最小。符号编码。一般使用熵编码方法对量化后的系数进行编码。4变换编码第二十七页,共62页。解码过程是编码过程的逆过程。因为量化过程是不可逆的,所以解码部分可以没有与其对应的模块。注:变换编码中对图像数据的压缩并不是在变换步骤取得的,而是在量化变换后的系数时取得的。4变换编码第二十八页,共62页。
将图像从色彩域转换到频率域,常用的变换方法有:4变换编码-离散余弦变换(例)傅氏变换Walsh-Hadamard沃尔什哈达玛变换正弦变换余弦变换--应用最广斜变换哈尔变换K-L变换第二十九页,共62页。DCT变换的公式为:4变换编码-离散余弦变换(例)f(i,j)经DCT变换之后,F(0,0)是直流系数,其他为交流系数。第三十页,共62页。8×8的原始图像为:推移128后,使其范围变为-128~127:4变换编码-离散余弦变换(例)第三十一页,共62页。使用离散余弦变换,并四舍五入取最接近的整数:4变换编码-离散余弦变换(例)第三十二页,共62页。DCT将原始图像信息块转换成代表不同频率分量的系数集,这有两个优点:①信号常将其能量的大部分集中于频率域的一个小范围内,这样一来,描述不重要的分量,只需要很少的比特数;②频率域分解映射了人类视觉系统的处理过程,并允许后继的量化过程满足其灵敏度的要求。4变换编码-离散余弦变换(例)第三十三页,共62页。当u,v=0时,离散余弦正变换(DCT)后的系数为F(0,0)=1,则离散余弦反变换(IDCT)后的重现函数f(x,y)=1/8,是个常数值,所以将F(0,0)称为直流(DC)系数;当u,v≠0时,正变换后的系数为F(u,v)=0,则反变换后的重现函数f(x,y)不是常数,此时,正变换后的系数F(u,v)为交流(AC)系数。4变换编码-离散余弦变换(例)第三十四页,共62页。DCT后的64个DCT频率系数与DCT前的64个像素块相对应,DCT过程的前后都是64个点,说明这个过程只是一个没有压缩作用的无损变换过程。单独一个图像的全部DCT系数块的频谱几乎都在最左上角的系数块中。4变换编码-离散余弦变换(例)第三十五页,共62页。DCT输出的频率系数矩阵最左上角的直流(DC)系数幅度最大,图中为-415;以DC系数为出发点向下、向右的其他DCT系数,离DC分量越远,频率越高,图中最右下角为2,即图像信息的大部分集中于直流系数及其附近的低频频谱上,离DC系数越来越远的高频频谱几乎不含图像信息,甚至于只含杂波。DCT本身虽然没有压缩作用,却为以后压缩时的“取”“舍”奠定了必不可少的基础。4变换编码-离散余弦变换(例)第三十六页,共62页。量化量化过程实际上就是对DCT系数的一个优化过程。它是利用人眼对高频部分不敏感的特性来实现数据的大幅简化。量化过程实际上是简单地把频率领域上每个成份,除以一个对于该成份的常数,且接着四舍五入取最接近的整数。这是整个过程中的主要有损运算。4变换编码-离散余弦变换(例)第三十七页,共62页。
整个量化的目的是减少非“0”系数的幅度以及增加“0”值系数的数目。量化时图像质量下降的最主要原因。因为人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表:亮度量化值和色差量化值。4变换编码-离散余弦变换(例)第三十八页,共62页。JPEG亮度量化表JPEG色亮度量化表4变换编码-离散余弦变换(例)第三十九页,共62页。
使用这个量化矩阵与前面所得到的DCT系数矩阵,如使用-415且四舍五入得到最近的整数
4变换编码-离散余弦变换(例)第四十页,共62页。总体上说,DCT变换实际是空间域的低通滤波器。对Y分量采用细量化,对UV采用粗量化。量化表是控制JPEG压缩比的关键,这个步骤除掉了一些高频量;另一个重要原因是所有图片的点与点之间会有一个色彩过渡的过程,大量的图像信息被包含在低频率中,经过量化处理后,在高频率段,将出现大量连续的零。4变换编码-离散余弦变换(例)第四十一页,共62页。“Z”字形编排量化后的数据,有一个很大的特点,就是直流分量相对于交流分量来说要大,而且交流分量中含有大量的“0”。这样,对这个量化后的数据如何来进行简化,从而再更大程度地进行压缩呢。这就出现了“Z”字形编排:4变换编码-离散余弦变换(例)第四十二页,共62页。“Z”字形编排结果为:-26,3,0,-3,-2,-6,2,-4,1,-4,1,1,5,1,2,-1,1,-1,2,0,0,0,0,0,-1,-1,38个04变换编码-离散余弦变换(例)第四十三页,共62页。这样做的特点是会连续出现多个0,这样很有利于使用简单而直观的行程编码对他们进行编码。8×8图像块经过DCT变换之后得到的DC直流系数有两个特点:一是系数的数值比较大,二是相邻8×8图像块的DC系数值变化不大。根据这个特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值进行编码。即充分利用相邻两图像块的特性,来再次简化数据。上面的DC分量-26,需要单独处理。其他63个元素采用“Z”字形行程编码,以增加行程中连续0的个数。4变换编码-离散余弦变换(例)第四十四页,共62页。图像压缩标准1986年,国际电报电话咨询委员会(CCITT)和国际标准化组织(ISO)共同成立了JPEG专家组。该联合专家组于1991年提出了“多灰度静止图像的数字压缩编码标准”的建议草案,即后来的“JPEG”高质量静止图像压缩编码标准,简称”JPEG标准”。第四十五页,共62页。JPEG标准JPEG是适用于连续色调(包括灰度和彩色)静止图像压缩算法的国际标准。JPEG标准中采用了DCT变换编码方法,这主要是由于下面几个原因:⑴整个图像中相邻区域图像内容变化相对缓慢,也就是说,在很小的领域内(8×8的图像块)图像强度值变换不大。⑵实验表明,人类更有可能注意到图像低频部分的损失,而不是高频部分。⑶人眼对亮度比对颜色信息更敏感,也就是说人们对图像的灰度信息比颜色信息更敏感。第四十六页,共62页。
JPEG适用于彩色和灰度图像。灰度图像中只有一个亮度分量,而彩色图像有一个亮度分量和两个色度分量,对于彩色图像,编码时可以按照对灰度图像的编码方法对每一个分量进行编码。如果源图像是不同的图像格式,编码器会完成色彩空间的转换,把其转换到YIQ或YUV。JPEG标准第四十七页,共62页。JPEG解码器和编码器JPEG标准第四十八页,共62页。JPEG标准的解码过程与编码过程相反,所以JPEG也称为对称型算法,JPEG对图像的压缩有很大的伸缩性,图像质量与比特率的关系如下:⑴1.5~2.0比特/像素:与原始图像基本没有区别。⑵0.75~1.5比特/像素:极好,满足大多数应用。⑶0.5~0.75比特/像素:好至很好,满足多数应用。⑷0.25~0.5比特/像素:中至好,满足某些应用。JPEG标准第四十九页,共62页。JPEG-2000标准虽然JPEG标准凭借高压缩比和较好的图像质量得到了广泛的应用,取得了较大的成功,但为了满足下一代图像应用的需求,JPEG委员会提出了一个新的图像压缩标准:JPEG-2000。与传统JPEG标准最大的不同,在于JPEG-2000放弃了JPEG所采用的以DCT变换为主的分块编码方式,而改用以小波变换为主的多分辨率编码方法。第五十页,共62页。JPEG-2000标准具有的优点和特点如下:⑴JPEG-2000能实现无损压缩。在实际应用中,有些重要的图像,如卫星遥感图像、医学图像、文物照片等,通常需要进行无损压缩。⑵JPEG-2000能实现渐进传输,这是JPEG-2000的一个极其重要的特征。它可以先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,以满足用户的需要,这在网络传输中具有非常重大的意义。使用JPEG-2000下载一个图片,用户可先看到这个图片的轮廓或缩影,然后再决定是否下载它。JPEG-2000标准第五十一页,共62页。⑶JPEG-2000具有感兴趣区特性。用户在处理的图像中可以指定感兴趣区,对这些区域进行压缩时可以指定特定的压缩质量,或在恢复时指定解压缩要求,这给人们带来了极大的方便。⑷JPEG-2000的误码鲁棒性好。因此使用JPEG-2000的系统稳定性好,运行平稳、抗干扰性好、易于操作。⑸JPEG-2000标准还充分考虑了人眼视觉特性,增加了视觉权重和掩膜,这样在不损害视觉效果的情况下,可以大大提高压缩效率。JPEG-2000标准第五十二页,共62页。JPEG-LS标准通常,在非常重要的图像中应用无损压缩,例如医疗中使用的人脑部图像、不易获得或者非常昂贵的图像等。与JPEG-2000提供的无损压缩模式相竞争的专门用于无损压缩的方案就是JPEG-LS标准。JPEG-LS较JPEG-2000的主要优势在于JPEG-LS是基于低复杂性算法的。JPEG-LS目标是为了更好的对医疗图像进行压缩。第五十三页,共62页。JPEG-LS的正式名称是“信息技术-连续色调静止图像无损/接近无损压缩标准”。JPEG-LS的核心算法是由惠普公司提出的低复杂度无损图像压缩算法。JPEG-LS算法的复杂度低,却能提供高无损压缩率。JPEG-LS标准简化的JPEG-LSA无损编码器框图第五十四页,共62页。JPEG-LS的编码过程:源图像以预先指定的扫描顺序输入编码器,无损图像压缩设计为一个归纳推理问题。编码当前像素时,先扫描过去的数据,以前面接收的像素为条件,通过分配当前像素的条件概率P,推理出当前像素值。上下文建模是JPEG-LS编码的基础,使用的建模方法是基于对上下文的认识。建立上下文模型时,一个像素值的编码要以它周围的几个像素为条件。根据a、b、c、d处像素的重建值,上下文首先决定对x处像素是按常规方式预测编码还是采用行程编码。JPEG-LS标准第五十五页,共62页。常用的图像文件格式
——PCX格式是一种在MS-DOS环境中十分常见的图像文件格式,几乎所有的图像编辑软件都支持这种格式。PCX是由Zsoft公司开发而成的。PCX图像格式使用行程编码的方法进行压缩,该压缩可将一连串重复的图像数据缩减,只存储一个重复的次数和被重复的数据。文件头图像数据调色板数据PCX文件格式的结构第五十六页,共62页。——BMP(DIB)格式BMP是BitMapped的缩写,是Microsoft公司为Windows自行开发的一种位图图像文件格式,因为在Windows环境中,画面的滚动、窗口打开或恢复,均是在绘图模式下运作,因此选择的图像文件格式必须能应付高速度的操作要求,不能有太多的计算过程。文件头调色板数据(反向排列)图像数据图BMP文件格式的结构
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030全球风电用工业碳刷行业调研及趋势分析报告
- 2025-2030全球服装金属探测器行业调研及趋势分析报告
- 2025年全球及中国高性能航空涂料行业头部企业市场占有率及排名调研报告
- 2025年全球及中国眼科手术剪行业头部企业市场占有率及排名调研报告
- 2025公路工程进度、计量、合同管理监理内容
- 餐桌茶几家具买卖合同
- 年货物运输合同范本
- 2025合同模板合伙协议范本
- 大米购销的合同
- 物联网系统定制与开发合同
- 浙江省杭州市2024-2025学年高三上学期一模英语试题(含解析无听力原文及音频)
- 2024年湖南高速铁路职业技术学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 精装修样板房房屋使用说明
- 乔迁新居结婚典礼主持词
- 小学四年级数学竞赛试题(附答案)
- 鲁科版高中化学必修2全册教案
- 《病理学基础》知识考核试题题库与答案
- 人口分布 高一地理下学期人教版 必修第二册
- 四年级上册英语试题-Module 9 Unit 1 What happened to your head--外研社(一起)(含答案)
- 子宫内膜异位症诊疗指南
- 《高级计量经济学》-上课讲义课件
评论
0/150
提交评论