小波变换在图像压缩中的应用报告_第1页
小波变换在图像压缩中的应用报告_第2页
小波变换在图像压缩中的应用报告_第3页
小波变换在图像压缩中的应用报告_第4页
小波变换在图像压缩中的应用报告_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《现代数字信号处理》期末考察报告 题目: 小波变换在图像压缩中的应用 学生姓名: 学号: 院系: 专业: 2015年6月17一、概述上个世纪八十年代初,Morlet和Arens等人首次提出了“小波”的概念。小波分析的出现和发展,源于许多不同科学领域信号处理的需要。作为一种数学工具,小波分析已广泛应用于信号分析、图像处理、数值分析等方面,而这些应用中产生的问题进一步激发了人们研究小波分析的兴趣。由此,带来了小波分析的迅速发展。小波分析主要研究函数的表示,即将函数分解为“基本函数”之和,而“基本函数”是由一个小波函数经伸缩和平移而得到的,这个小波函数具有很好的局部性和光滑性,使得人们通过分解系数刻画函数时,可以分析函数的局部性质和整体性质。小波分析出现之前,人们用Fourier基、Haar基来分解函数。Fourier基具有很好的光滑性,但局部性很差;而Haar基的局部性虽很好,但光滑性很差。小波基却兼有它们的优点。在信号分析中,由于小波变换在时域和频域都有很好的局部特性,因此在数据压缩与边缘检测方面,小波分析是一种非常有效的方法。小波分析正在处于迅速发展之中,从事小波分析的人越来越多,随着研究的进一步深入,小波分析还将更加广泛和深入地应用在理论数学、应用数学、信号处理、图像处理与分析、语音识别与合成等方面。在人类认识自然、改造自然的科学探索与实践中,信息扮演了至关重要的角色。特别是二十世纪中叶以后,随着计算机科学的迅猛发展,信息科学与计算机科学紧密结合,相互促进,其地位与日俱增。当今的人们已普遍意识到,未来的时代就是信息时代。一般的,信息需要通过媒体来进行记录、传播和获取。最终要的信息媒体包括文字、图像、声音等人们能感知到的,或微波、激光等人们无法感受的。其中,图像是最常见的信息存载和表现形式,它不仅十分直观,而且内涵非常丰富。图像作为信息的载体具有数据量非常大的缺点。例如,一副512×512象素、8bit/pixel的灰度图像占256KB,一副512×512象素、8bit/pixel的彩色图像则占3×256=768KB;一副2291×2190×8bit的气象卫星红外云图占4.90MB,而一颗卫星每半个小时可发回一次全波段数据(5个波段),每天的数据量高达1.2GB。另外电视会议数字化的视频图像需要很宽的传输带宽以及巨大的存储容量。视频大致以每秒30帧的速率传输,将达到90Mbps的数据传输率。由此可见,无论基于存储还是传输考虑,图像数据的压缩都是十分必要的。当前,图像压缩被认为是一种“开放技术”。由于现代图像传感器不断提高空间分辨率以及电视广播标准的不断发展,图像压缩已经成为一种基本技术,在许多重要且性质不同的领域中扮演着主要角色,比如,电视会议、遥感(使用卫星成像进行天气预报和其他地球资源的应用)、记录文献和医疗成像、传真(FAX)、军事上的远程遥控车辆驾驶、空间中的危险废弃物管理等方面。简而言之,不断扩大的应用领域依赖于对各种图像进行有效的处理、存储和传输。 长期以来,图像压缩编码利用离散余弦变换(DCT)作为主要的变换技术,并成功的应用于各种标准,如JPEG,MPEG-1,MPEG-2。但是,在基于DCT的图像变换编码中,人们将图像分成8×8象素或16×16象素的块来处理,从而容易出现方块效应与蚊式噪声。小波变换是全局变换,在时域和频域都具有良好的局部化性能,而且在应用中易于考虑人类的视觉特性,从而成为图像压缩编码的主要技术之一。基于小波变换的图像编码与经典的图像编码方法相比,至少具有如下优点:(1)小波变换本质上是全局变换,重建图像中可以免除采用分块正交变换编码所固有的“方块效应”。(2)小波变换采用塔式分解的数据结构,与人眼由粗到精、由全貌到细节的观察习惯相一致,这是将WT(waveletstransform)与HVS(humanvisualsystem)的空间分解特性结合起来以改善图像压缩性能的有利条件。小波变换比经典的变换(DCT)更符合人的视觉特性,通过合理的量化编码产生的人为噪声比同样比特率的JPEG方法产生的影响要小的多。(3)小波变换式图像的时-频表示,具有时间-频域定位能力,并可实现图像中平稳成分与非平稳成分的分离,从而可对其进行高效编码。因此,小波变换用于图像压缩时,除具有时-频局部化分析方法处理非平稳信号的固有长处外,还体现在它具有易于与HVS相结合的潜力上。目前,基于小波变换的图像压缩算法JPEG2000已经成为新一代的图像压缩标准。这能够说明小波变换在图像压缩编码中的应用。二、小波分析的基本理论1、连续小波变换的定义定义1如果满足“容许性”条件:,那么称是一个“容许小波”或“母小波”。关于一个基小波,在上的连续小波变换或积分小波变换定义为,容许条件是为了确保小波逆变换可以进行。定义1中的条件似乎稍弱,如果和都是窗函数,则基小波可以给出有限面积的时间-频率窗。另外是一个连续函数,则有;而是窗函数表明,这样可以得到定义2。定义2如果满足“容许性”条件:,那么称是一个“基小波”,也称“容许小波”。关于一个基小波,在上的连续小波变换或积分小波变换定义为,注:基小波属于,在理论上会对判定函数是否是基小波产生困难。定义3如果满足如下两条要求=1\*GB2⑴是连续的且呈现指数衰减[即,对某些常量C,M]=2\*GB2⑵的积分为零[即]则定义函数的小波变换为,定义3中的衰减条件和积分为零条件可以推出定义2中的容许性条件,而定义2中,可推出是一个连续函数,所以由容许性条件中的有限性可以推出,或者等价地有,这就是称为“小波”的原因。2、连续小波的重构及性质连续小波变换的重构公式为:从连续小波的定义知道,任何信号的连续小波变换是一个关于的二元函数,但是具体信号的连续小波变换的表达式一般说来是相当复杂的。下面介绍连续小波的重要性质:=1\*GB2⑴线性:一个多分量信号的小波变换等于各分量的小波变换之和。=2\*GB2⑵平移不变性:若的小波变换为,则的小波变换为。=3\*GB2⑶伸缩共变性:若的小波变换为,则的小波变换为,=4\*GB2⑷自相似性:对应不同尺度参数和不同平移参数,连续小波变换之间是自相似的。=5\*GB2⑸冗余性:连续小波变换中存在信息表述的冗余度。这种冗余性主要表现在2个方面:=1\*GB3①连续小波变换恢复原信号的重构公式不是唯一的。=2\*GB3②小波变换的核函数存在许多可能的选择,如他们可以是非正交的小波、正交小波、双正交小波、甚至允许是彼此线性相关。小波变换在不同的之间的相关性增加了分析和解释小波变换结果的困难,因此小波变换的冗余度应该尽可能的减小。连续小波的应用小波分析的最初是在工程应用中发展起来的,是工程应用与数学结合的结晶。小波变换是一个时间和频率的局域变换,因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数和信号进行多尺度细化分析,解决了傅立叶变换不能解决的许多困难问题,被誉为“数学的显微镜”。现在连续小波变换已经广泛地应用于时频联合分析、去噪、特征提取、地质勘探、涡流、力学等领域。比如在去噪中,连续小波变换具有较大的冗余性,对于去噪和数据恢复是十分有利的,而冗余对图像压缩是不利的,图像压缩中需要的是无冗余的正交小波;小波对信号的奇异点十分敏感,对突变信号的分析非常有效,因而在故障检测和边缘检测中,连续小波是很有效的,文献[15]也表明连续小波变换具有比传统的二进小波更好的检测能力,非常适合于故障检测;而复小波能够提取有关相位信息,因而可以实现包络分析处理;后面介绍的离散小波变换的各个尺度的小波分量的系数就是信号在各尺度下的连续小波变换,因此,可以这样说,几乎所有小波分析的应用都与连续小波变换有关。在实际应用中,需要将连续小波离散化。这里的离散是指将连续小波和连续小波变换离散化。在连续小波中,考虑函数,是容许的,在离散化时,总限制取正值,这样离散小波变换的容许条件就变为:当离散化时,即,则得到离散小波为从而离散小波变换表示为:其重构公式为:为一与信号无关的常数。这样,我们将信号分解为不同尺度与平移参数的小波分量之和。如果还有一个对偶,它们一起满足双正交条件,则系数是的连续小波变换在第尺度与第平移处的值。所以,连续小波变换与离散小波变换是不可分离的。实际应用中,通常用卷积形式的小波变换,对于函数,在尺度上的卷积小波变换记为这时容易计算的连续小波变换的傅立叶变换。。三、小波变换在图像压缩中的应用每天都有大量的信息进行存储、处理和传送。美国已经将整个美国国会图书馆的图书(及一些馆藏物品)编制了目录,使其成为世界上最大的电子图书馆,以此作为其进行数字化和建立电子政府的第一步;网上的许多信息是以图像形式存储的,如果需要进行快速或实时传输以及大量存储,就需要对图像数据进行压缩,在同等的通信容量下,如果图像数据压缩后再传输,就可以传输更多的图像信息,也就可以增加通信能力,所以对于存储和通信的需求是无限的。所以图像压缩方法比起图像的存储或传输具有更为突出的实用价值和商业意义。图像压缩所解决的问题是尽量减少表示数字图像时需要的数据量。减少数据量的基本原理是除去其中多余的数据。以数学的观点来看,这一过程实际上就是将二维象素阵列变换为一个在统计上无关联的数据集合。这种变化在图像存储和传输之前进行,而在以后的某个时刻再对压缩图像进行解压缩来重构原图像或原图像的近似图像。图像压缩研究的就是寻找高压缩比的方法且压缩后的图像要有合适的信噪比,在压缩传输后还要恢复原图像,而且在压缩、传输和恢复的过程中还要求图像的失真小等。图像压缩是小波分析的一个重要应用,它的特点是压缩比高,压缩速度快,压缩后能保持图像的特征基本不变,且在传递过程中可以抗干扰,实现累进传输等。3.1、小波小波编码的基本框架基于小波变换的图像压缩编码模型一般包含3个部分。首先,利用二维Mallat分解算法对原始图像进行分解,假设分解成M层,则得到3M个高频子图与一个低频子图,如图1。由于小波变换系数在幅度上还是连续的,因此,第二步需要对小波变换系数进行量化,其被量化以后产生符号流的每一个符号是对应特定量化阶层的标记,信息的损失一般发生在量化级。第三步则由熵编码把量化得到的符号流表示为比特流,以达到压缩数据的目的。常用的熵编码有算数编码,Huffman编码等。最后把比特流进行存储或传输。对于静态图像这样的二维信源,需要使用二维滤波器进行处理。考虑到小波函数的可分离性,二维滤波器可由一维滤波器复合而成。小波分解量化小波分解量化熵编码小波编码中考虑的主要问题有两个:小波滤波器的选择;量化算法。从早期的小波标量量化(WSQ)压缩指纹到嵌入式零树小波压缩算法(EZW)到新一代静止图像压缩标准JPEG2000,小波变换在图像压缩中的应用得到迅速发展。LL3HL3HL2HL1LH3HH3LH2HH2LH1HH1图1:三层小波分解3.2、标量量化与矢量量化 一般,图像编码中的量化不是A/D转换后的量化,而是指经过正交变换(例如小波变换)后,熵编码(例如算数编码)之前,对正交变换的系数的量化处理。量化输入值的动态范围很大,需要以多个比特数来表示一个数值,而量化输出只能取有限个整数,即量化级。每个量化输入被归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入量化到一个输出级上,所以量化处理是一个多对一的处理过程,是不可逆的。因此,量化是有信息损失的,是引入失真的原因。对于无损压缩来说不应该存在量化。标量量化把每一个量化系数同实数轴上的一个区间相联系,也就是把实轴的一个子集中的每一个元素映射为那个子集中的一个特定值。考虑把实轴划分为M个不相交的区间:且在每个区间内,选择点作为的输出值(码字)。则标量量化器是一个从R到的映射。确切的说,对一给定的x,使包含x的区间的索引q。即:。反量化器为:。矢量量化器定义为从k维欧几里德空间到一包含N个输出点的有限集合C的映射,即,其中,,。集合C称作码书,其大小为N。码书的N个元素称作码字或码矢量,它们均为中的矢量。从信息论的角度来看,矢量量化总能获得优于标量量化的率失真性能,因此,在基于小波变换的图像压缩编码中,矢量量化是主要的量化技术之一。3.3、误差的度量 开发和实现有损图像压缩要有一种标准度量,用来衡量与原始图像相比较的重建图像的质量。重建图像对原始图像表征得越好,该度量的生成值越大。这样一个度量还应生成一个无量纲的数,它对于重建图像的小变化不太敏感。为此而常用的一个度量是峰值信噪比(PSNR)。设原始图像和重建图像的像素分别表示为和(其中),我们首先定义两幅图像的均方误差(MSE)为:相应的均方根误差为:信噪比(SNR)和峰值信噪比(PSNR)分别定义为(单位为db):大家都熟悉PSNR,也易于计算,但与人类视觉系统所察觉到的误差只是有限的近似关系。这就是为什么较高的PSNR值意味着重建图像对原始图像表征的更好,但却不保证观察者会喜欢重建的图像。所以,使用观察者的主观评估衡量图像品质通常是更为恰当的。主观评估是通过向典型的观察者显示典型的解压缩图像并将他们的评估结果进行平均得到的。评估可能采取绝对等级或并排对比和的形式。四、基于小波树结构的矢量量化压缩算法 矢量量化是标量量化的推广,并且总是能取得优于标量量化的性能,它的操作过程主要分成:码书的产生(codebookgeneration)、编码(encoding)、解码(decoding)这三个步骤。通常来说,码书的产生都是在之前建立好的(off-line),而等到实际上要做时就能让编码端和解码端使用。矢量量化编码的基本做法是将原图像切割成许多大小相同的小方格,并把它视为一个矢量。例如一张512512的图像,可以把它切成128128个44的区域。一个矢量包含的元素的个数为它的维数。码书在矢量量化算法中扮演十分重要的角色,LBG算法是一种十分重要的码书生成方式。本文采用LBG算法生成码书,其具体步骤如下:=1\*GB2⑴给定初始码书并置k=0,设起始平均值失真,给定计算停止门限(1>>0)。=2\*GB2⑵根据最近邻域原则,利用码书中的码字把训练序列TS={}划分为N个胞腔,即=3\*GB2⑶计算平均失真与相对失真。平均失真即为其中;r=1,…,M,距离一般取为平方Euclid的距离。相对失真为若,则停止计算,当前码书即为设计好的最终码书,否则进行第=4\*GB2⑷步。=4\*GB2⑷计算=2\*GB2⑵中得到的各个胞腔的形心,以这N个形心构成码书,并置k=k+1,返回第=2\*GB2⑵步。其中,胞腔S的形心Y由下式给出这里,表示S中所含元素的个数。编码端索引解码端索引从原图像中从原图像中分割矢量码字匹配Codebook信道查表,解码重新组合矢量图2:矢量量化编码流程图本文采取小波分解与矢量量化结合的方式,先对图像做4层小波分解,如图所示:LL3单独编码;HL3中的每一个像素和其对应的子孙:HL2种的4个像素、HL1中的16个像素一起组成一个21维的矢量;同样LH3中每一个像素和其对应的子孙:LH2种的4个像素、LH1中的16个像素一起组成一个21维的矢量;而HH3中的每个像素和HH2中对应的4个孩子组成一个5维的矢量;而HH1可以完全放弃。本文的主要研究对象是指纹图像。由于指纹图像的统计特性相似,分解后小波树也相似,所以可以采用多幅图像进行训练,得到通用的全局码书。这样的码书可以用于多幅图像,可以克服局部码书的缺点。采用LBG算法生成码书,并采用分裂法生成初始码书,在分裂的时候充分考虑到小波树结构的特点。因为人眼视觉特性对低频信息敏感,对高频信息不敏感,所以,分裂时对矢量的每个分量乘以不同的分裂因子,低频系数乘以大的分裂因子,高频系数乘以相对小的分裂因子,这样可以得到更加适合小波树结构的矢量,从而有望得到更好的效果。而在码书搜索的时候也充分考虑到小波分解的特性,首先考虑第一个分量,即矢量中最低频的系数,再考虑下面的4个次低频系数,最后再考虑剩下的系数。LL3HL3HL2HL1LH3HH3LH2HH2LH1HH1图3:小波分解的矢量分割现在考虑一幅256×256的8位灰度图像,设计码书大小N=2048,即每个码书采用11位表示,不考虑LL1部分的压缩和之后的熵编码,压缩前所占比特数为256×256×8,压缩后的比特数为32×32×3×11+32*32*8=41984,计算得压缩比R约等于12.5:1。当然,如果考虑熵编码和LL1部分的编码,则可以得到更大的压缩比。下面给出分裂法与LGB算法生成码书的具体过程:步骤1:计算所有训练矢量的形心;步骤2:用参数矢量点乘码字,形成第二个码字,其中的第一个分量可取0.99,第二至第五个分量可取0.90;第六至第二十一个分量可取0.6。步骤3:以和为初始码字,用LBG算法设计仅含2个码字的码书。步骤4:将码书中的两个码字和分别乘以何时的参数矢量,得到4个码字,,,。步骤5:以这4个码书为初始码字,用LBG算法设计仅含4个码字的码书,再对设计好的4个码字乘以适当参数进一步扩大码字庶母。如此反复,经过次设计,就可得到所要求的含N个码字的初始码书。步骤6:对N个码字的初始码书采用LBG算法训练,即可得到所需要的码书。在编码的时候,我们考虑到矢量第一个分量的重要性,我们要保证矢量的第一个分量的失真最小,所以在产生码书后可以对码书进行一次排序,按照第一个分量的大小排序。这样在搜索码字的时候就可以快速搜索,可以在一个区间上搜索码字,节省搜索时间;然后对后面的20个分量采取加权的误差来衡量。这样充分考虑了小波分解的特性,极大的提高了效率。下面我们采用8幅256×256的8位的BMP指纹图像,生成两个全局码书。实验结果表明得到的重构图像质量较好。图4:原图像图5:恢复图像五、总结目前,小波分析的应用范围很广,遍布自然科学、应用科学的许多方面,乃至社会经济领域也见到小波的应用。数据压缩是伴随小波分析诞生的最早应用领域,由此带来巨大的经济效益和社会效益。基于小波变换的WSQ算法已经成为美国FBI指纹压缩的标准,而JPEG2000标准的推出也是小波在图像压缩应用的一个突破。本文介绍了小波的基本理论,如连续小波的理论、多分辨分析、双正交多分辨分析,得出了一些比较有意义的结论。讨论了连续小波变换的定义,比较分析了几种不同的连续小波的定义;提出了一种构造基小波的方法;证明了尺度函数和多分辨分析产生的小波是基小波;探讨了图形显示算法,用具体的例子实现了一维情形的图形显示算法。 参考文献[1]李弼程,罗建书.小波分析及其应用[M].电子工业出版社,2003.[2]RafaelC.Gonzalez,RichardE.Woods(阮秋琦等译).数字图像处理[M].电子工业出版社,2004.[3]DavidSalomon(吴乐南等译).数据压缩原理与应用(第二版)[M].电子工业出版社,2003.[4]孙延奎.小波分析及其应用[M].机械工业出版社,2005.[5]AlbertBoggess(芮国胜等译

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论