版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、图像有损压缩1目录引言1图像压缩基本知识介绍2图像有损压缩技术32引言 图像压缩的必要性 图像数据的特点之一是数据量庞大。给存储和传输带来 许多困难 一幅低分辨率彩色图像640 480,24bit/pixel, 该图像数据量:640 480 3=921,600Byte=0.92MB HDTV系统中,每个画面720 1280点,24bit真彩色,60帧/s,具有6倍于传统电视系统的空间分辨率和 画面动感。每秒数据量: 720 1280 3 60=166MB=1.33Gb 目前数字传输能力,6MHz带宽,只有20Mb/s的传输速率,需要压缩比: 1330/20=66.43图像压缩的可能性从信息论的
2、观点看,描述信源的数据由有用数据和冗余数据组成。例:“你的妻子,Helen,将于明天晚上6点零5分在波士顿的Logan机场接你”“你的妻子将于明晚6点零5分在Logan机场接你”“Helen将于明晚6点在Logan接你”数量可观的冗余信息及不相关信息,为数据压缩技术提供可能。如果能够消除一种或多种冗余,就可取得数据压缩效果。图像压缩的可能性图像中存在很大的冗余度。用户通常允许图像失真。4例1静止图像信息的冗余(相邻像素间的空间冗余)5例2活动图像信息的冗余(相邻帧间的时间冗余)图像序列中不同帧之间存在相关性引起的时间冗余6图像压缩的主要应用很多领域,都会遇到对大量图像数据进行传输和存储的问题,
3、没有图像压缩技术的发展,大容量图像数据的存储与传输难以实现。多媒体电视会议、数字电视,可视电话遥感图像医学图像教育商业管理等图文资料存储:在存储时压缩原始数据,而在使用时再解压缩,这样能够大大增加存储介质的存储量。传输:在发送端压缩原始数据,在接收端将压缩数据解码,减少传输时间在现代通信中,图像传输已成为重要内容之一。采用编码压缩技术,减少传输数据量,是提高通信速度的重要手段。72.图像压缩基本知识介绍2.1图像压缩概念及其原理2.2图像压缩分类82.1图像压缩概念数据压缩:数据压缩是信息论的一个重要研究内容,称信源编码。以尽可能少的数据表示信源所发出的信号,减少数据所占用的存储空间。图像压缩
4、:数据压缩技术在图像中的应用。在满足一定图像质量条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量。信源编码可分为两大类,无失真编码有失真编码(或称限失真编码)92.2图像压缩分类根据解压重建后的图像和原始图像之间是否具有误差,图像编码压缩分为无损压缩;(亦称无误差编码;无失真、无损、信息保持编码)有损压缩;(亦称有误差编码;有失真或有损编码)无损压缩(Lossless compression):原始数据可完全从压缩数据中恢复出来,即在压缩和解压缩过程中没有信息损失。压缩比2:1左右有损压缩(Lossy compression) :原始数据不能完全从压缩数据中恢
5、复出来,即恢复数据只是在某种失真度下的近似。 压缩比1000:1; 103.图像有损压缩技术3.1 图像有损压缩介绍3.2 常见有损压缩技术113.1有损压缩介绍虽然人们总是期望无损压缩,但冗余度很少的信息对象用无损压缩技术并不能得到可接受的结果。当使用的压缩方法会造成一些信息损失时,关键的问题是看这种损失的影响。有损压缩经常用于压缩音频、灰度或彩色图像和视频对象等,因为它们并不要求精确的数据。在由音频、彩色图像、视频以及其他专门数据组成的多媒体对象中,可以单独使用有损压缩技术,也可与无损压缩技术共同使用。 有损压缩编码不具有可恢复性和可逆性,该编码在压缩时舍弃冗余的数据。例如人眼较难分辨的颜
6、色或人耳难以分辨的方向源信号,实际取决于初始信号的类型、信号的相关性以及语义等内容。这些被舍去的信息值是无法再找回的,所以还原后的数据与原始数据存在差异。123.2常用的有损压缩技术预测编码 变换编码 基于模型编码 分形编码 其他编码 133.2.1预测编码预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。 预测编码中典型的压缩方法有脉冲编码调制(PCM Pulse Code Modulation)、差
7、分脉冲编码调制(DPCM,Differential Pulse Code Modulation)、自适应差分脉冲编码调制(ADPCM,Adaptive Differential Pulse Code Modulation)等,它们较适合于声音、图像数据的压缩,因为这些数据由采样得到,相邻样值之间的差相差不会很大,可以用较少位来表示。 143.2.2变换编码预测编码的压缩能力是有限的。以DPCM为例,一般只能压缩到每样值24比特。20世纪70年代后,科学家们开始探索比预测编码效率更高的编码方法。人们首先讨论了KL变换(Karhunen-Loeve Transform)、傅立叶变换等正交变换,得到
8、了比预测编码效率高得多的结果,但苦于算法的计算复杂性太高,进行科学研究可以,实际使用起来很困难。直到20世纪70年代后期,研究者发现离散余弦变换DCT与KL变换在某一特定相关函数条件下具有相似的基向量,而用DCT的变换矩阵来做正交变换就可以节省大量的求解特征向量的计算,因而大大简化了算法的计算复杂性。DCT的使用使变换编码压缩进入了实用阶段。小波变换是继DCT之后科学家们找到的又一个可以实用的正交变换,它与DCT各有千秋,因而分别被不同的研究群体所推崇。 15变换编码的原理变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。如将时域信号变换到频域
9、,因为声音、图像大部分信号都是低频信号,在频域中信号的能量较集中,再进行采样、编码,那么可以肯定能够压缩数据。 变换编码系统中压缩数据有变换、变换域采样和量化三个步骤。变换本身并不进行数据压缩,它只把信号映射到另一个域,使信号在变换域里容易进行压缩,变换后的样值更独立和有序。这样,量化操作通过比特分配可以有效地压缩数据。 在变换编码系统中,用于量化一组变换样值的比特总数是固定的,它总是小于对所有变换样值用固定长度均匀量化进行编码所需的总数,所以量化使数据得到压缩,是变换编码中不可缺少的一步。在对量化后的变换样值进行比特分配时,要考虑使整个量化失真最小。 16变换编码是一种间接编码方法。它是将原
10、始信号经过数学上的正交变换后,得到一系列的变换系数,再对这些系数进行量化、编码、传输。图3是变换编码系统方框图。17图中接收端输出信号与输入信号的误差是因为输入端采用量化器的量化误差所致。当经过正交变换后的协方差矩阵为一对角矩阵,且具有最小均方误差时,该变换称为最佳变换,也称Karhunen-Loeve变换(K-L变换)。如果变换后的协方差矩阵接近对角矩阵,该类变换称为准最佳变换,典型的有DCT(离散余弦变换)、DFT(离散傅立叶变换)、WHT等。 18离散余弦变换(DCT)离散余弦变换(Discrete Cosine Tranform,简称DCT)是一种与傅立叶变换紧密相关的数学运算。在傅立
11、叶级数展开式中,如果被展开的函数式是偶函数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之为离散余弦变换。时间域中信号需要许多数据点表示;在x轴表示时间,在y轴表示幅度。信号一旦用傅立叶变换转换到频率域,就只需要几点就可以表示这个相同的信号。如我们已经看到的那样,原因就是信号只含有少量的频率成分。这允许在频率域中只用几个数据点就可以表示信号,而在时间域中表示则需要大量数据点这一技术可以应用到彩色图像上。彩色图像有像素组成,这些像素具有RGB彩色值。每个像素都带有x,y坐标,对每种原色使用8x8或者16x16矩阵。在灰度图像中像素具有灰度值,它的x,y坐标由灰色的幅度组成。
12、为了在JPEG中压缩灰度图像,每个像素被翻译为亮度或灰度值。19为了压缩RGB彩色图像,这项工作必须进行三遍,因为JPEG分别得处理每个颜色成分,R成分第一个被压缩,然后是G成分,最后是B成分。而一个8x8矩阵的64个值,每个值都带有各自的x,y坐标,这样我们就有了一个像素的三维表示法,称作控件表达式或空间域。通过DCT变换,空间表达式就转化为频谱表达式或频率域。从而达到了数据压缩的目的。DCT式目前最佳的图像变换,它有很多优点。DCT是正交变换,它可以将8x8图像空间表达式转换为频率域,只需要用少量的数据点表示图像;DCT产生的系数很容易被量化,因此能获得好的块压缩;DCT算法的性能很好,它
13、有快速算法,如采用快速傅立叶变换可以进行高效的运算,因此它在硬件和软件中都容易实现;而且DCT算法是对称的,所以利用逆DCT算法可以用来解压缩图像。20为什么采用8x8的图像块,其原因是由于计算量和像素之间关系的数量,许多研究表明,在15或20个像素之后,像素间的相关性开始下降。就是说,一列相似的像素通常会持续15到20个像素那么长,在此之后,像素就会改变幅度水平(或反向)。模拟图像经采样后成为离散化的亮度值然后分成一个个宏块,而一个宏块有分成8x8大小的块,可以用一个矩阵来表示这个块。21在这里,N=8,矩阵中元素f(i,j)表示块中第i行、第j列像素的亮度值。把该矩阵看作一个空间域,显然,
14、块中这些亮度值的大小有一定的随机性,无序性,或者说亮度值的分布没有什么特征;DCT变换就是来解决这个问题的,把这些随机的数据变的有序,便于对数据进行编码压缩。一维DCT变换的公式为:22结论DCT的信息压缩能力比DFT和WHT的能力要强。DCT在信息压缩能力和计算复杂性之间提供了很好的平衡,因此,许多变换编码系统都是以DCT变换为基础的。对比其它方法,DCT变换具有使用单一的集成电路就可以实现,可以将最多的信息包装在最少的系数之中。可使“分块噪声”的块效应最小,这些分块噪声是由子图像之间的可见边界造成的。23小波变换传统的基于DCT 变换的图像压缩虽然在较高码率下能够提供较好的图像质量, 但在
15、码率低于0.25 bpp时,重构图像存在严重的方块效应;同时,许多情况下希望在单一码流中实现图像的有损和无损压缩,从而实现从有损到无损的累进式传输,而基于DCT 的压缩算法难以实现这一要求。针对以上问题,近年发展的离散小波变换(DWT)方法,越来越成为图像压缩领域的研究热点。所谓小波(wavelet),就是存在于一个较小区域的波。一个小波母函数经过伸缩和平移得到小波基函数。将伸缩因子和平移因子经过采样并离散化得到离散化的小波函数。所谓小波变换或小波分解,实际上就是寻求空间L2(R)上的标准正交小波基,将信号在这组小波基上分解,以便进行分析和处理,并且还可以通过这些分解系数重建原来的信号。24
16、二维图像信号的小波变换,可以按照下图分别在水平和垂直方向进行滤波的方法实现二维小波多分辨率分解。原始信号f(x, y)进行一级小波分解被分成4个子带,其中LL子带对应图像的低频成分;LH 子带对应水平低通-垂直高通成分,反映了图像在垂直方向的高频细节;HL子带对应水平高通-垂直低通成分,反映了图像在水平方向的高频细节;HH子带对应水平和垂直两个方向的高通成分反映了图像在对角线方向的高频细节。为了获得图像的多分辨率分解,低频子带LL可以继续一分为四,每经过一级分解,当前子带LLn-1被分成LLn,HLn,LHn和HHn 4 个子带。对于D 级分解,一幅图像共产生3D+1 个子带。2526经过小波
17、多分辨率分解后,得到的低频子带图像依然保持原始图像的概貌,而各高频子带各自包含了原图像在水平、垂直和对角线方向的高频分量,因而大部分区域变化幅度不大、能量低;而幅度变化大、能量高的区域集中在图像内物体的边缘和细节部分,它保持着物体的结构特征。小波分解在不同分辨率下各子带中系数的父子关系可以表示成树结构,粗尺度上的小波系数称为父系数,为树根,在较细尺度上相应空间位置上的小波系数称为子孙系数。小波分解后,子图按重要性从低到高排序为:LLn,HLn,LHn,HHn,HLn1,LHn1,HHn1,HH1。在对小波系数编码时,应按照子图重要性顺序扫描,这样的扫描顺序与图像信号的能量分布主要集中在低频,而
18、高频较少,且人的视觉对低频比高频更敏感,对水平和垂直方向的边缘比对斜向边缘更敏感的特点一致。27二维图像信号用二维小波分析进行压缩可以按照如下3 个步骤来进行:运用小波分析对二维信号进行分解。选择一个小波和小波分解的层次n, 然后计算信号f 到第n 层的分解。(2)对高频系数进行阈值量化。对于从1 到n 的每一层, 选择一个阈值, 并对这一层的高频系数进行软阈值量化处理。(3)对二维小波进行重构。根据小波分解的第n 层的低频系数和经过修改的从第1 层到第n 层的各层高频系数计算二维信号的小波重构。在以上三个步骤中, 通过小波变换将信号分成高频和低频部分。低频部分是信号的近似子带, 集中了信号的
19、主要能量; 高频部分集中了信号的大部分细节。可以对低频部分进行多级的分解, 分出更低频率的低频部分和高频部分, 从而实现信号的多分辨率分析。小波变换不仅能够很好的进行空间到频率的定位, 还具有频率域能量紧缩特性和空间域能量紧缩特性; 表现为大部分的图像能量总是集中在最低频率的子图像, 从低频到高频呈递减分布趋势。小波变换的这些特性, 构成了利用小波对图像内容进行分析的重要基础。283.2.3基于模型编码从80年代中后期开始,科学家们开始探讨基于模型的编码,并在包括人脸图像的编码等应用中使用。如果把以预测编码和变换编码为核心的基于波形的编码作为第一代编码技术,则基于模型的编码就是第二代编码技术。
20、 N. Jayant指出,压缩编码的极限结果原则上可通过那些能够反映信号产生过程最早阶段的模型而得到。这就是基于模型编码的思想。一个例子是人类发音的“清晰声带-声道模型”(The Articulatory Vocal Cord-Vocal Tract Model),它把注意焦点从线性预测编码(LPC,Linear Predictive Coding)分析扩展到声道区分析,原则上为很低码率矢量量化提供了强得多的定义域,并允许更好地处理声带-声道的相互作用。另一个例子是人脸的线框(wire-frame)模型,它为压缩可视电话这类以人脸为主要景物的序列图像提供了一个强有力的手段。 29基于模型图像编
21、码首先由瑞典Forchheimer 等人于1983年提出。基于模型方法的基本思想是:在发送端,利用图像分析模块对输入图像提取紧凑和必要的描述信息,得到一些数据量不大的模型参数;在接收端,利用图像综合模块重建原图像,是对图像信息的合成过程。基本原理如图5所示。 30与经典方法中的预测编码方法类似,基于模型编码在发送端既有分析用的编码器,同时又有综合用的解码器。只有这样,在发送端才能获得与接收端相同的综合后的重建图像,并将后者与原始图像进行“比较”,以确定图像失真是否低于“某种阈值”,以便修正模型参数。 同经典方法比较,基于模型编码还有两点显著不同: 一是编码失真。基于模型编码所引起的失真已从传统
22、方法的量化误差转化为几何失真,并可能进一步转化为物理失真或行为失真。 二是如何评价重建图像质量。传统的以像素为单位计算原始图像与重建图像之间“逼真度”(如均方误差、信噪比)不能测量几何失真和物理失真等,从原理上讲根本不适用于基于模型编码。 313.2.4分型编码分形编码的思路 1988年1月,美国Georgia理工学院的M. F. Barnsley在BYTE发表了分形压缩方法。分形编码法(Fractal Coding )的目的是发掘自然物体(比如天空、云雾、森林等)在结构上的自相似形,这种自相似形是图像整体与局部相关性的表现。分形压缩正是利用了分形几何中的自相似的原理来实现的。首先对图像进行分块,然后再去寻找各块之间的相似形,这里相似形的描述主要是依靠仿射变换确定的。一旦找到了每块的仿射变换,就保存下这个仿射变换的系数,由于每块的数据量远大于仿
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 赣南卫生健康职业学院《环境工程经济管理与伦理》2023-2024学年第一学期期末试卷
- 甘肃中医药大学《蒙台梭利教学法》2023-2024学年第一学期期末试卷
- 《心脏疾病用药》课件
- 小学生作文起步讲解课件
- 三年级数学上册第八单元分数的初步认识第2课时几分之几教案新人教版
- 2022年C基础知识速记速练考试题库(核心500题)
- 小学生校园安全知识培训制度
- 聆听培训课件
- 《柱状晶等等》课件
- 《爱车课堂上海大众斯柯达》课件
- 口腔颌面系统解剖骨
- 川骨香-川古香手撕鸭配方及制作方法
- 深圳市排水管网维护管理质量
- 变电站二次设计规范
- 能见度不良时船舶航行须知
- 软胶囊的制备
- 实习证明、实习证明表(模板)2页
- 目视化管理实施计划方案
- 晋城煤业集团寺河矿井东区开采设计(学校要求版本)
- 全国职业院校技能大赛工业分析检验赛项(中职组)团体赛学生选拔之我见
- 良渚文化——文明的曙光PPT课件
评论
0/150
提交评论