压缩编码在图像处理中的应用(毕业论文)_第1页
压缩编码在图像处理中的应用(毕业论文)_第2页
压缩编码在图像处理中的应用(毕业论文)_第3页
压缩编码在图像处理中的应用(毕业论文)_第4页
压缩编码在图像处理中的应用(毕业论文)_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、摘要数字图像的表示需要大量的数据,必须进行数据的压缩。即使采用多种方法对数据进行了压缩,其数据量仍然巨大,对传输介质、传输方法和存储介质的要求较高。因此图象压缩编码技术的研究显得特别有意义。目前图像数据压缩的方法主要有哈夫曼编码、行程编码、算术编码、离散余弦变换编码以及混合编码等。本文描述了图像编码压缩方法的主要分类,介绍了每个分类里面的典型算法的原理、特点,列举了近些年出现的新的压缩编码算法,然后在Matlab环境下运用DCT变换对JPEG图像压缩编码进行仿真,并给出了仿真图片的对比和分析。关键词:图像压缩编码;DCT变换;哈弗曼编码AbstractThe digital images re

2、quire large amounts of data, so the data must be compressed. Even with the variety of methods of data compression, the data are still huge, and transmission methods and storage media require a higher on the transmission media. Therefore, image compression coding technology research is particularly m

3、eaningful. Current image data compression methods are Huffman coding, length encoding, arithmetic coding, discrete cosine transform coding and hybrid coding, etc.This article describes the image encoding method of the main categories, introduces inside the typical algorithms for each classification

4、of the principles and characteristics, cites the recent emergence of a new coding algorithm, then in the Matlab environment using DCT transform coding of the JPEG image compression simulation, and simulation and analysis of image contrast.Keywords:Image compression;DCT transform;Huffman coding目录 TOC

5、 o 1-3 h z u HYPERLINK l _Toc264455937 第1章 绪论 PAGEREF _Toc264455937 h 1 HYPERLINK l _Toc264455938 1.1 数字图像处理 PAGEREF _Toc264455938 h 1 HYPERLINK l _Toc264455939 1.1.1 图像处理的概念 PAGEREF _Toc264455939 h 1 HYPERLINK l _Toc264455940 1.1.2 数字图像处理的应用 PAGEREF _Toc264455940 h 2 HYPERLINK l _Toc264455941 1.2 图

6、像数据压缩的研究 PAGEREF _Toc264455941 h 3 HYPERLINK l _Toc264455942 1.2.1 研究背景及意义 PAGEREF _Toc264455942 h 3 HYPERLINK l _Toc264455943 1.2.2 图像数据压缩的必要性 PAGEREF _Toc264455943 h 4 HYPERLINK l _Toc264455944 1.2.3 图像数据压缩的可行性 PAGEREF _Toc264455944 h 5 HYPERLINK l _Toc264455945 第2章 图像压缩编码理论 PAGEREF _Toc264455945

7、h 6 HYPERLINK l _Toc264455946 2.1 模拟图像信号数字传输与存储的一般过程 PAGEREF _Toc264455946 h 6 HYPERLINK l _Toc264455947 2.2 图像数据压缩原理和图像压缩系统构成 PAGEREF _Toc264455947 h 7 HYPERLINK l _Toc264455948 2.2.1 图像数据压缩的基本原理 PAGEREF _Toc264455948 h 7 HYPERLINK l _Toc264455949 2.2.2 图像压缩系统的一般构成 PAGEREF _Toc264455949 h 8 HYPERLI

8、NK l _Toc264455950 2.3 图象压缩的几种方法 PAGEREF _Toc264455950 h 8 HYPERLINK l _Toc264455951 2.4 图像压缩编码的分类 PAGEREF _Toc264455951 h 10 HYPERLINK l _Toc264455952 2.5 传统图像压缩编码方法 PAGEREF _Toc264455952 h 11 HYPERLINK l _Toc264455953 2.5.1 熵编码 PAGEREF _Toc264455953 h 11 HYPERLINK l _Toc264455954 2.5.2 线性预测编码 PAGE

9、REF _Toc264455954 h 15 HYPERLINK l _Toc264455955 2.5.3 变换编码 PAGEREF _Toc264455955 h 16 HYPERLINK l _Toc264455956 2.5.4 矢量量化编码 PAGEREF _Toc264455956 h 16 HYPERLINK l _Toc264455957 2.6 现代图像编码方法 PAGEREF _Toc264455957 h 16 HYPERLINK l _Toc264455958 2.6.1 子带编码(SBC) PAGEREF _Toc264455958 h 16 HYPERLINK l

10、_Toc264455959 2.6.2 模型基图像编码 PAGEREF _Toc264455959 h 17 HYPERLINK l _Toc264455960 2.6.3 分形编码 PAGEREF _Toc264455960 h 17 HYPERLINK l _Toc264455961 2.6.4 小波变换编码 PAGEREF _Toc264455961 h 17 HYPERLINK l _Toc264455962 2.7 图像压缩编码的国际化标准 PAGEREF _Toc264455962 h 17 HYPERLINK l _Toc264455963 2.7.1 图像压缩编码的国际标准化背

11、景 PAGEREF _Toc264455963 h 17 HYPERLINK l _Toc264455964 2.7.2 图像编码国际标准化建议的特点及适用方向 PAGEREF _Toc264455964 h 18 HYPERLINK l _Toc264455965 第3章 压缩编码在图像压缩中的应用研究 PAGEREF _Toc264455965 h 22 HYPERLINK l _Toc264455966 3.1 几种图像压缩编码的MATLAB实现示例 PAGEREF _Toc264455966 h 22 HYPERLINK l _Toc264455967 3.1.1 像素编码 PAGER

12、EF _Toc264455967 h 22 HYPERLINK l _Toc264455968 3.1.2 预测编码 PAGEREF _Toc264455968 h 23 HYPERLINK l _Toc264455969 3.1.3 变换编码 PAGEREF _Toc264455969 h 23 HYPERLINK l _Toc264455970 3.1.4 其它编码 PAGEREF _Toc264455970 h 24 HYPERLINK l _Toc264455971 3.2 JPEG压缩标准 PAGEREF _Toc264455971 h 25 HYPERLINK l _Toc2644

13、55972 3.3 基于DCT的JPEG图像压缩编码理论算法 PAGEREF _Toc264455972 h 26 HYPERLINK l _Toc264455973 3.3.1 基于离散余弦变换(DCT变换)的JPEG编码方法 PAGEREF _Toc264455973 h 26 HYPERLINK l _Toc264455974 3.3.2 基于DCT的JPEG图像压缩编码算法的过程表述 PAGEREF _Toc264455974 h 26 HYPERLINK l _Toc264455975 3.3.3 基于DCT的JPEG图像压缩编码步骤 PAGEREF _Toc264455975 h

14、27 HYPERLINK l _Toc264455976 3.3.4 DCT变换与小波变换的压缩性能比较 PAGEREF _Toc264455976 h 32 HYPERLINK l _Toc264455977 第4章 基于DCT变换的JPEG压缩过程MATLAB实现 PAGEREF _Toc264455977 h 33 HYPERLINK l _Toc264455978 4.1 MATLAB简介 PAGEREF _Toc264455978 h 33 HYPERLINK l _Toc264455979 4.1.1 MATLAB软件 PAGEREF _Toc264455979 h 33 HYPE

15、RLINK l _Toc264455980 4.1.2 MATLAB中数字图像文件的读写 PAGEREF _Toc264455980 h 33 HYPERLINK l _Toc264455981 4.2 MATLAB仿真实现流程 PAGEREF _Toc264455981 h 35 HYPERLINK l _Toc264455982 4.3 MATLAB仿真结果分析 PAGEREF _Toc264455982 h 38 HYPERLINK l _Toc264455983 结论 PAGEREF _Toc264455983 h 39 HYPERLINK l _Toc264455984 参考文献 P

16、AGEREF _Toc264455984 h 40 HYPERLINK l _Toc264455985 附录 外文文献原文 PAGEREF _Toc264455985 h 41 HYPERLINK l _Toc264455986 附录 外文文献译文 PAGEREF _Toc264455986 h 55 HYPERLINK l _Toc264455987 附录 程序清单 PAGEREF _Toc264455987 h 66 HYPERLINK l _Toc264455988 致谢 PAGEREF _Toc264455988 h 94第1章 绪论1.1 数字图像处理1.1.1 图像处理的概念1什么

17、是图像?“图”物体透射或反射光的分布(图像场),是客观存在;“像”人的视觉系统对接收在大脑中形成的图的印象或认识,是人的感觉;图像图和像的有机结合,既反映物体的客观存在,又体现人的心理因素;对客观存在物体的一种相似性的生动模仿或描述。2图像的表示一幅图像定义为一个二维函数f(x,y),这里x和y是空间坐标,在任何一对空间坐标(x,y)上的幅值f称为该点图像的强度或灰度。当幅值f为有限的、离散的数值时,称该图像为数字图像。数字图像由有限的元素组成,每个元素都有一个特定的位置和幅值,这些元素称为像素(图像元素或画面元素)。空间有界:L-xxL+x (1-1)L-yyL+y (1-2)亮度(点亮度)

18、有限:0f(x,y)Bmax (1-3)图像的数学表示:一幅图像所包含的信息首先表现为光的强度,即一幅图像可看成是空间各个坐标点上的光强度I的集合,其普遍数学表达式为:I=f(x,y,z,t) (1-4)式中(x,y,z)是空间坐标,是波长,t是时间,I是光点(x,y,z)的强度(幅度)。式(1-4)表示一幅运动的(t)、彩色/多光谱的()、立体的(x,y,z)图像。静止图像,与时间t无关;单色图像(也称灰度图像),波长为一常数;平面图像,则与坐标z无关。在每一种情况下,图像的表示可省略掉一维,即:静止图像:I=f(x,y,z,) (1-5)灰度图像:I=f(x,y,z,t) (1-6)平面图

19、像:I=f(x,y,t) (1-7)而对于平面上的静止灰度图像,其数学表达式可简化为:I=f(x,y) (1-8)运动图像可用静止图像序列表示,彩色图像可分解成三基色图像,三维图像可由二维重建。因此本文主要针对平面上的静止灰度图像进行论述。3数字图像处理的定义1:利用数字计算机或其它高速、大规模集成数字硬件,对从图像信息转换来的数字电信号进行某些运算或处理,以期提高图像质量或达到人们所要求的某些预期效果。对被噪声污染的图像去除噪声;对信息微弱的图像进行增强;失真图像的几何校正;从遥感图片中辨别农作物、森林、湖泊和军事设施等。4数字图像处理的目的对图像信息进行加工处理和分析,以满足人的视觉、心理

20、需要和实际应用或某种目的(如机器识别)的要求。着重强调在图像之间进行的变换,广义上泛指各种图像技术;狭义上指对图像进行各种加工处理,达到:改善人的视觉效果;为自动识别打基础;压缩编码等目标。5数字图像处理的内容和方法图像数字化:将非数字形式的图像信号通过数字化设备转换成数字图像,包括采样和量化。图像变换:对图像信息进行变换以便于在频域对图像进行更有效的处理。图像增强:增强图像中的有用信息,削弱干扰和噪声,提高图像的清晰度,突出图像中所感兴趣的部分。图像恢复(复原):对退化的图像进行处理,使处理后的图像尽可能地接近原始(清晰)图像。图像压缩编码:对待处理图像进行压缩编码以减少描述图像的数据量。图

21、像分割:根据选定的特征将图像划分成若干个有意义的部分,这些选定的特征包括图像的边缘、区域等。图像分析与描述:主要是对已经分割的或正在分割的图像各部分的属性及各部分之间的关系进行分析表述。图像识别分类:根据从图像中提取的各目标物的特征与目标物固有的特征进行匹配、识别,以作出对各目标物类属的判别。1.1.2 数字图像处理的应用阐述数字图像处理应用范围最简单的一种方法是根据信息源来分类。各类信息源及不同的应用领域产生各种不同的图像。宇宙探测中的应用:主要是星体图片的获取、传送和处理。通信方面的应用:图像信息传输、电视电话、卫星通信、数字电话等。主要是压缩图像数据和动态图像(序列)传送。遥感方面的应用

22、:航空遥感和卫星遥感,地形、地质、资源的勘测,自然灾害监测、预报和调查,环境监测、调查等。生物医学方面的应用:细胞分析、染色体分类、放射图像处理、血球分类、各种CT、核磁共振图像分析、DNA显示分析、显微图像处理、癌细胞识别、心脏活动的动态分析、超声图像成像、生物进化的图像分析等等。军事公安方面的应用:军事:军事目标的侦察和探测、导弹制导、各种侦察图像的判读和识别,雷达、声纳图像处理、指挥自动化系统等。公安:现场实景照片、指纹、足迹的分析与鉴别,人像、印章、手迹的识别与分析,集装箱内物品的核辐射成像检测,人随身携带物品的X射线检查等。工业生产的应用:将CAD和CAM技术应用于磨具和零件优化设计

23、和制造、印制板质量和缺陷的检测、无损探伤、石油气勘测、交通管制和机场监控、纺织物的图案设计、光的弹性场分析、运动工具的视觉反馈控制、流水线零件的自动监测识别、邮件自动分拣和包裹的自动分拣识别等。天气预报:天气云图测绘、传输,气象卫星云图的处理和识别等。考古:珍贵文物图片、名画、壁画的辅助恢复。新领域:信息安全:信息隐藏与数字水印,指纹识别、虹膜识别和面部识别等;图像检索:基于内容的图像检测、识别与检索;体育运动:运动员动作的分析、评测及优化设计。1.2 图像数据压缩的研究1.2.1 研究背景及意义近年来,随着计算机技术、现代通信技术、网络技术和信息处理技术的迅速发展,人们对各种信息的需求不断增

24、长,尤其是图像和多媒体信息。未经处理的图像信号的数据量是巨大的,使得图像信息的传输,处理和存储都受到限制。因此,研究高效的图像数据压缩编码方法,即怎样处理、组织图像数据,在应用领域中的作用将是至关重要的,图像压缩编码技术已经成为多媒体及通讯领域中的关键技术之一。多媒体数据的数据量非常巨大,如果不进行压缩,就无法在计算机中存储和传输,也无法在多媒体信息系统中处理。对数据进行压缩的目的是减小存储容量和降低数据传输率,使得现有的PC机的指标与性能方面达到能够处理声音和图像信息的要求,从而实现实时、快速、有效地处理、传输和存储数据。压缩的出发点是利用各种编码方法将数据冗余压缩到最小,并尽可能地减少失真

25、,提高数据使用效率。在掌握数据压缩技术的基本原理与方法的基础上,研究数据压缩技术来实现更高的压缩比和压缩质量。图像数据压缩编码近年来在技术及应用方面都取得了很大进展,它的进步和完善深刻影响着现代社会的方方面面。在众多编码标准中,JPEG压缩算法实现简单,在很大的压缩范围内,都能得到很好的重建图像质量。用MATLAB做仿真实验,方法简单且误差小,很达程度的提高了图像压缩的效率和压缩精度。DCT变换是最小均方误差准则下得出的次最佳正交变换。 DCT具有算法简单,易于硬件实现等优点,从而广泛应用于图像压缩领域。正是由于具有这些优点,JPEG压缩编码算法在图像压缩领域得到了越来越广泛的应用,尤其在较高

26、比特率的传输条件下能取得令人满意的压缩效果。1.2.2 图像数据压缩的必要性进入21世纪,人类已步入信息社会,新信息技术革命使人类被日益增多的多媒体信息所包围,这也正好迎合了人类对要示提高视觉信息的需求。多媒体信息主要有三种形式:文本、声音和图像。从信息传输的发展史(电报、电话、传真、收音机、电视机直至现在的网络)可以看出,人们逐渐将信息传输的重点从声音转向图像,然而图像是三种信息形式中数据量最大的,这给图像的传输和存储带来了极大的困难。例如,一幅640480分辨率的24位真彩色图像的数据量约为900kb;一个100Mb的硬盘只能存储约l00幅静止图像画面。对于如此巨大的数字图像数据量,如果不

27、经过压缩,不仅超出了计算机的存储和处理能力,而且在现有的通信信道的传输速率下,是无法完成大量多媒体信息实时传输的,数字图像高速传输和存贮所需要的巨大容量已成为推广数字图像通信和最大障碍。因此,为了存储、处理和传输这些数据,必须进行压缩。图像压缩之所以能够进行压缩是因为原始图像数据是高度相关的,存在很大的数据冗余。数字图像包含的冗余信息一般有以下几种:空间冗余、时间冗余、信息熵冗余、统计冗余、结构冗余、视觉冗余以及知识冗余等。图像压缩算法就是要在保证图像一定的重建质量的同时,尽可能多的去除这些冗余信息,以达到对图像压缩的目的。图象采样后,如果对之进行简单的8bit量化和PCM编码,其数据量是巨大

28、的。以CIF(Common Intermediate Format)格式的彩色视频信号为例,若采样速率为25帧/秒,采样样点的Y、U、V分量均为8bit量化,则一秒钟的数据量为:(1-9)352288382560.83Mbit 要传输或存储这样大的数据量是非常困难的,必需对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。虽然数字图象的数据量巨大,但图象数据是高度相关的。一幅图象的内部相邻象素之间,相邻行之间的视频序列中相邻图象之间有大量冗余信息空间相关性和时间相关性,可以使用各种方法尽量去除这些冗余信息,减少图象的数据量。除了时间冗余和空间冗余外,在一般的图象数据中还存在

29、信息熵冗余、结构冗余、知识冗余和视觉冗余。各种冗余就是压缩图象数据的出发点。图象编码的目的就在于采用各种方法去除冗余,以尽量少的数据量来表示个重建图象。1.2.3 图像数据压缩的可行性经研究发现,与音频数据一样,图像数据中存在着大量的冗余,原因在于原始图像数据是高度相关的。通过去除那些冗余数据可以节约文件所占的码字从而极大地降低原始图像数据量,解决图像数据量巨大的问题,达到数据压缩的目的。图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。因此,进行图像压缩研究的起点是研究图像数据的冗余性。空间冗余。在静态图像中有一块表面颜色均匀的区域,在这个区域中所有点的光强和色彩以及色

30、饱和度都相同,具有很大的空间冗余。这是由于基于离散像素采样的方法不能表示物体颜色之间的空间连贯性导致的。时间冗余。电视图像、动画等序列图片,当其中物体有位移时,后一帧的数据与前一帧的数据有许多共同的地方,如背景等位置不变,只有部分相邻帧改变的画面,显然是一种冗余,这种冗余称为时间冗余。结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等,称此为结构冗余。如果已知分布模式,就可以通过某一过程生成图像。知识冗余。对于图像中重复出现的部分,我们可以构造出基本模型,并创建对应各种特征的图像库,进而使图像的存储只需要保存一些特征参数,从而可以大大减少数据量。知识冗余是

31、模型编码主要利用的特性。视觉冗余。事实表明,人的视觉系统对图像的敏感性是非均匀性和非线性的。在记录原始的图像数据时,对人眼看不见或不能分辨的部分进行记录显然是不必要的。因此,大可利用人的视觉的非均匀性和非线性,降低视觉冗余。图像区域的相同性冗余。它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。在以上的情况下,当记录了一个区域中各像素的颜色值,则与其相同或相近的其他区域就不需要记录其中各像素的值。采用向量量化(Vector quantization)方法就是针对这种冗余性的图像压缩编码方法。随着对人的视觉系统和图像模型的进一步研究

32、,人们可能会发现图像中存在着更多的冗余性,使图像数据压缩编码的可能性越来越大,从而推动图像压缩技术的进一步发展。允许图像有一定的失真也是图像可以压缩的一个重要原因,在许多应用场合,并不要求经过压缩后复原的图像和原始图像完全相同,而允许有少量的失真。只要这些失真并不被人眼所察觉,在许多情况下是完全可以接受的。这就个图像压缩提供了十分有利的条件。图像质量允许的失真越多,可以实现的压缩比就越大。这种有失真的压缩编码称为限失真编码。第2章 图像压缩编码理论图象的数字化表示使得图象信号可以高质量地传输,并便于图像的检索、分析、处理和存储。但是数字图像的表示需要大量的数据,必须进行数据的压缩。即使采用多种

33、方法对数据进行了压缩,其数据量仍然巨大,对传输介质、传输方法和存储介质的要求较高。因此图象压缩编码技术的研究显得特别有意义,也正是由于图象压缩编码技术及传输技术的不断发展、更新,推动了现代多媒体技术应用的迅速发展。2.1 模拟图像信号数字传输与存储的一般过程目前,模拟图像信号的数字传输与存储的一般原理如图2-1所示:图2-1 图像传输与存储原理其中图像压缩编码一般大致分为三个过程:采样、量化和编码过程。采样图像在空间上的离散化称为采样。也就是用空间上部分点的灰度值代表图像,这些点称为采样点。采样需符合采样定理,才能使图像不失真,即:Fs=2Fmax。量化模拟图像经过采样后,在时间和空间上离散化

34、为像素。但采样所得的像素值(即灰度值)仍是连续量。把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差,但数据量小。量化可分为均匀量化和非均匀量化。均匀量化是简单地在灰度范围内等间隔量化。非均匀量化是对像素出现频度少的部分量化间隔取大,而对频度大的量化间隔取小。一般情况下,对灰度变化比较平缓的部分用比较多的量化级,在灰度变化比较剧烈的地方用比较高的分辨率。一般,当限定数字图像的大小时,为了得到质量较好的图像可采用如下原则:(1)对缓

35、变的图像,应该细量化,粗采样,以避免假轮廓。(2)对细节丰富的图像,应细采样,粗量化,以避免模糊(混叠)。编码图像编码是将模拟图像信号转换成数字信号的一种技术。图像编码方法很多,图2-2就是其中的一种。图2-2 图像编码的一种方法图2-2中的图像编码包含:(1).PCM编码;(2).压缩编码。2.2 图像数据压缩原理和图像压缩系统构成2.2.1 图像数据压缩的基本原理由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人Shannon提出把数据看作是信息和冗余度的组合。所谓冗余度,是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余

36、压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。对数字图像进行压缩通常利用两个基本原理2:(1)数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。(2)人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。2.2.2 图像压缩系统的一般构成图2-3 图像压缩系统的一般构成信源编码:完成

37、原始数据的压缩与编码。信道编码:为了抗干扰,增加一些容错、校验位,实际上是有规律地增加传输数据的冗余,以便于消除传输过程中增加的随机信号。信道:传输数据(信息)的手段。如Internet、广播、通讯、可移动介质等。信源数据编码与解码的模型如图2-4和图2-5所示:图2-4 信源编码模型映射器:减少像素冗余,如使用RLE编码。或进行图像变换。量化器:减少视觉心理冗余,仅用于有损压缩。符号编码器:减少编码冗余,如使用哈夫曼编码。图2-5 信源解码模型2.3 图象压缩的几种方法统计和字典的压缩方法常规程序和计算机熵的数据对于那些基于利用统计变种的压缩,效果很好,这些统计变种表现在单个符号的频率以及符

38、号或短语字符串的频率等方面,而基于字典的系统实际上就是假扮统计程序。可是遗憾的是,这类压缩对于连续色调图象的作用并不是很好。这些程序的主要问题产生于这样的一个事实:照片图象的象素广泛地分布在整个范围。如果将图象中的彩色用频率分布画出,那么频率分布图中,没有我们在统计压缩的成功的情况下所看到的“尖峰”状,实际上,如果延长这个分布图,那么从类似于电视那样的生活图象源中得出的分布图会趋于平展。这意味着,每个象素代码彼此是大约相同的出现机会,决对不存在挖掘熵差的任何机会。基于字典的压缩程序的运行也有类似的问题,基于扫描照片的图象决定没有任何类型的数据特征以产生相同的短语的多次出现。例如,一个栅格化的图

39、象,类似房子墙边的垂直部分,在图片的许多连续的行中可能可以给出相似的字符串。但不幸的是,由于真实世界是变化多端的,每行中的相同的性能将彼此地略有不同,对于20个象素的一个字符串,其中的一两个象素会因扫描而彼此出现一步长的变化,虽然这些不同点小到人眼不能探测或对人眼不起作用,但他们毕竟妨碍了基于字典压缩的工作,对于这类压缩方法来说,字符串必须严格匹配,由于小的变化,而使匹配的字符串长度趋于很小,这就限制了压缩的效率。有损压缩类似于音频数据,图形图象也同样有一个比常规计算机数据文件优越的地方:在压缩/扩展的循环中,他们可以被略微改动,而不会影响用户的立即质量。如果仔细修改,那么各处象素的精确灰度可

40、以完全不被注意地进行小的改变。由于计算机栅的图形图象通常来自对真实世界源的扫描,所有他们通常表达一个已经不完美的照片的表达或是不完美的其他打印接着的表达。没有改变图象基本性能的有损压缩程序应该是可行的。假设图形图象的有损压缩是可能的,那么它是如何实现的呢?研究人员最初试验了用于语音信号的同样的技术,如差分编码和自适应编码,虽然这些技术对图象有帮助,但并没有达到所希望的那么好,原因之一是音频数据和视频数据根本不同。用常规格式采样的音频数据是趋于反复的,声音,包括讲话,是由每次几秒的重复的正弦波组成的。虽然计算机上DAC的输入流可能由许多不同的频率叠加在一起而成,但是正弦波通常产生反复的波形。音频

41、反复的本性自然使他利于压缩,线性预言编码和自适应差分脉冲编码调制等技术就利于了这一点,因此将音频数据流压缩了50到95。但开始研究图形压缩时,人们也试图用相似的技术压缩数字化的图象,取得了一些成功。最初,研究人员进行栅格化数据流的压缩,如显示在电视机栅的数据。图形数据栅格化时,图形显示成一个象素流,每次一行地显示在屏幕上,从左到右,从上到下。这样,当完成一行时,图片的一个细片就画出了,直到整个屏幕填满。数字化时,象素可以使用从1位到24位,如今的图形常常使用8位来定义一个象素。差分调制差分调制依赖于模拟数据趋于“平缓”的变化,信号幅度上那个的大的跳变是例外,而不是常规。在音频数据中,只要信号的

42、采样率一定程度地高于信息本身的最大的频率分量,那么大的跳变就不会产生。音频信号的差分调制通过编码一个样点与前一个样点的不同来利用这一个特点。例如,如果单频样点位8位,差分编码系统可能用4位来编码样点之差,这就将输入数据压缩了50。这种压缩方法中所产生的损失是来自于:使用标准的差分方法不可能总是精确地编码。信号的增长可能快于比编码的允许,或者,编码可能太粗而不能容纳下的差别,差分编码的有损性可以很好的处理,以产生出好的信号。当压缩图形数据时,差分调制有很多问题。首先,图形中的象素依赖于平缓的增加或减少是不可靠的,一幅图中不同的分量间的明显界限是常有的事情。这意味着,使用差分编码的系统需要接受样点

43、间的大的不同和小的不同。这就限制了压缩的效率。带有数据长结构的许多图象可以压缩的很好。长结构中的象素,彼此之间没有什么差别或差别很少;但时,带有突变部分的那些图象不可能压缩的很好。通常,图形图象的差分的编码似乎不产生非常强于最好的无损算法的压缩结果,他当然也不会产生所需要的、对压缩的数量级上的改进。自适应编码自适应编码(常常于差分编码一同使用)根据前面看到的一些象素而对将要到来的一些象素的信息做预言。例如,如果一幅灰度级照片中的最新的十个象素的值都在45到50之间,那么自适应压缩系统可能预言,下一个象素很大可能也在这个范围中,之后,类似于霍夫曼或算术编码那样的基于熵的编码方案可能给将来到来的各

44、种代码赋以概率值,可以代替地使用压缩扩展方法,将最细的粒度赋给最接近预言猜测的范围。2.4 图像压缩编码的分类图像压缩编码的方法目前有很多,其分类方法根据出发点不同而有差异。根据解压重建后的图像和原始图像之间是否具有误差,图像编码压缩分为无损(亦称无失真、无误差、信息保持型)编码和有损(有失真、有误差、信息非保持型)编码两大类。无损压缩:这类压缩算法中删除的仅仅是图像数据中冗余的信息,因此在解压缩时能精确恢复原图像。无损压缩用于要求重建后图像严格地和原始图像保持相同的场合,例如复制、保存十分珍贵的历史、文物图像等。一些常用的无损压缩编码有哈夫曼编码、行程编码、算术编码等。有损压缩:这类算法把不

45、相干的信息也删除了,因此在解压缩时只能对原始图像进行近似的重建,而不能精确的复原,有损压缩适合大多数用于存储数字化了的模拟数据。有损编码包括预测编码、变换编码和其他编码等。根据编码原理图像编码分为熵编码、预测编码、变换编码和混合编码等。熵编码:这是纯粹基于信号统计特性的编码技术,是一种无损编码。熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使最终的平均码长很小。常见的熵编码方法有哈夫曼编码、算术编码和行程编码。预测编码:它是基于图像数据的空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和

46、编码。预测编码可分为帧内预测和帧间预测,常用的预测编码有差分脉码调制(Differential Pulse Code Modulation,DPCM)和运动补偿法。变换编码:通常是将空间域上的图像经过正交变换映射到另一变换域上,使变换后的系数之间的相关性降低。图像变换本身并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,再采用适当的量化和熵编码就可以有效地压缩图像。混合编码:是指综合了熵编码、变换编码或预测编码的编码方法,如JPEG和MPEG标准。从图像的光谱特征出发,将压缩编码分为单色图像编码、彩色图像编码和多光谱图像编码。从图像的灰度层次上,压缩编码可分为多灰度编码和二值

47、图像编码。根据编码作用域划分,图像编码为空间域编码和变换域编码两大类。2.5 传统图像压缩编码方法2.5.1 熵编码根据信息论中信源码理论,可以证明在平均码长R大于等于图像熵H的条件下,总可以设计出某种无失真编码方法,当然如果编码结果使R远大于H,表明这种编码方法效率很低,占用比特数太多;最好的编码结果是使R等于或接近于H,这种状态的编码方法称为最佳编码,它既不丢失信息而引起图像失真,又占用最少的比特数。熵编码的目的就是要使编码后的图像平均码长R尽可能接近图像熵H,一般是根据图像灰度级数出现的概率大小赋予不同长度码字,出现概率大的灰度级用短码字,出现概率小的灰度级用长码字。可以证明,这样的编码

48、结果所获得的平均码字长度最短,这就是下面要介绍的变长最佳编码定理。变长最佳编码定理3:在变长编码中,对出现概率大的信息符号赋给短码字,而对于出现概率小的信息符号赋给长码字,如果码字长度严格按照所对应符号出现概率大小逆序排列,则编码结果平均码字长度一定小于任何其它排列方式。哈夫曼编码4大多数存储数字的信息编码系统都采用位数固定的定长码,即使用相同位数对数据进行编码。如常用的ASCII码,用8位二进制数表示一个英文字符。正像一篇文章中,每个字符出现的频度是不同的。有些字符出现的频率高,有些字符出现的频率低。同样,在一幅图像中,有些图像数据出现的频率高,有些图像数据出现的频率低。如果对出现频率高的数

49、据用较少的比特数来表示,出现频率低的数据用较多的比特数来表示,这样从总的效果看还是节省了存储空间。采用这种办法对数据进行编码时,代码的位数不固定,这种码称为变长码。这种编码思想首先由香农提出,哈夫曼对它提出了改进,用这种方法得到的编码称为哈夫曼码。哈夫曼编码(Huffman)是运用信息熵原理的一种无损编码方法。哈夫曼编码于1952年问世,迄今为止仍经久不衰,广泛应用于各种数据压缩技术中。压缩编码思想是利用变长编码将图像中出现概率大的灰度值赋予短码字,而对出现概率小的灰度值赋予长字码,从而达到压缩图像数据的目的。哈夫曼编码的理论依据是变字长编码理论。在变字长编码中,编码器的编码输出码字是字长不等

50、的码字,按编码输入信息符号出现的统计概率,给输出码字分配以不同的字长。对于编码输入中,出现大概率息符号,赋以短字长的输出码字;对于编码输入中,出现小概率的信息符号,赋以长字长的输出码字。可以证明,按照概率出现大小的顺序,对输出码字分配不同码字长度的变字长编码方法,其输出码字的平均码长最短,与信源熵值最接近。哈夫曼码字长度和信息符号出现概率大小次序正好相反,即大概信息符号分配码字长度短,小概率信息符号分配码字长度长,编码方法最佳。哈夫曼编码具有以下特点:哈夫曼编码构造出来的编码值不是唯一的。原因是在给两个最小概率的图像的灰度值进行编码时,可以是大概率为“0”,小概率为“1”,但也可相反;而当两个

51、灰度值的概率相等时,“0”、“1”的分配也是随机的,这就造成了编码的不唯一性,可是其平均码长却是相同的,所以不影响编码效率和数据压缩性能。哈夫曼编码对不同的信源其编码效率是不同的,当信源概率为2的负幂次方时,哈夫曼编码的编码效率达到100。因此只有当信源概率分布很不均匀时,哈夫曼编码才会收到显著的效果。换句话说,在信源概率比较接近的情况下,一般不使用哈夫曼编码方法。哈夫曼编码结果码字不等长,虽说平均码字最短,效率最高,但是码字长短不一,实时硬件实现很复杂(特别是译码),而且在抗误码能力方面也比较差,为此,研究人员提出了一些修正方法,如双字长哈夫曼编码(也称亚最佳编码方法),希望通过降低一些效率

52、来换取硬件实现简单的实惠。双字长编码只采用两种字长的码字,对出现概率高的符号用短码字,对出现概率低的符号用长码字。短码字中留下一个码字不用,作为长码字前缀,这种方法编码压缩效果不如哈夫曼码,但其硬件实现相对简单,抗干扰能力也比哈夫曼方法强得多。哈夫曼编码应用时,均需要与其他编码结合起来使用,才能进一步提高数据压缩比。例如,在静态图像国际压缩标准JPEG中,先对图像进行分块,然后进行DCT变换、量化、Z形扫描、行程编码后,再进行哈夫曼编码。哈夫曼编码的一般算法如下:首先统计图像灰度值出现的概率,按灰度值出现概率从大到小排序。把最小的两个概率相加合并成新的概率,与剩余的概率组成新的概率集合。对新的

53、概率集合重新排序,再次把其中最小的两个概率相加,组成新的概率集合。如此重复进行,直到最后两个概率的和为1。分配码字。图像灰度值的概率分布不同,哈夫曼的编码效率有所差别。图像灰度值分布很不均匀时,哈夫曼编码的编码效率就高。而图像灰度值分布比较均匀时,哈夫曼编码的编码效率就很低。哈夫曼编码的性质:哈夫曼编码构造出来的码不是惟一的,主要有两个原因:一是在两个符号概率相加给两条支路分配“0”和“1”时,这一选择是任意的;二是当两个消息的概率相等时,0,1分配也是随意的。哈夫曼编码对不同的信源,其编码效率是不同的。哈夫曼编码中,没有一个码字是另一个码字的前缀,因此,每个码字惟一可译。香农范诺(Shann

54、on-Fannon)编码香农范诺编码也是一种常见的可变字长编码,与哈夫曼编码相似,当信源符号出现的概率正好为2的负幂次方时,采用香农范诺编码同样能够达到100%的编码效率。香农范诺编码的理论基础是符号的码字长度Ni完全由该符号出现的概率来决定。香农一范诺编码的步骤如下:将输入灰度值xi按其出现概率Pi从大到小排序计算出各概率对应的码字长度bi计算累加概率Ai把各个累加概率Ai由十进制转化为二进制取小数点后的该二进制数的前bi位作为对应输入灰度值xi的码字。香农一范诺的编码程序可由下述几个步骤来完成:首先统计出每个灰度值出现的概率;对上述概率从大到小排序;从这个概率集合中的某个位置将其分为两个子

55、集合,并尽量使两个子集合的概率附近似相等,给前面一个子集合赋值为0,后面一个子集合赋值为1;重复步骤(3),直到各个子集合中只有一个元素为止;将每个元素所属的子集合的值依次串起来。算术编码算术编码是80年代发展起来的一种熵编码方法,这种方法不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上的0到1之间的一个区间,其长度等于该序列的概率,再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出,消息序列中的每个元素都要缩短为一个区间,消息序列中元素越多,所得到的区间就越小,当区间变小时,就需要更多的数位来表示这个区间,采用算术编码,每个符号的平均编码长度可以为小数。算术编码基

56、本原理是将被编码的数据序列表示成01之间的一个间隔(也就是一个小数范围),该间隔的位置与输入数据的概率分布有关。信息越长,编码表示它的间隔就越小,因而表示这一间隔所需的二进制位数就越多(由于间隔是用小数表示的)。算术编码有两种模式:一种是基于信源概率统计特性的固定编码模式,另一种是针对未知信源概率模型的自适应模式。自适应模式中各个符号的概率初始值都相同,它们依据出现的符号而相应地改变。只要编码器和解码器都使用相同的初始值和相同的改变值的方法,那么它们的概率模型将保持一致。解码是编码的逆过程,根据编码时的概率分配表和压缩后数据代码所在的范围,确定代码所对应的每一个数据符号。上述两种形式的算术编码

57、均可用硬件实现,其中自适应模式适用于不进行概率统计的场合。有关实验数据表明,在未知信源概率分布的情况下,算术编码的实现方法要比哈夫曼编码复杂一些,一般要优于Huffman编码。在JPEG扩展系统中,就用算术编码取代了哈夫曼编码。行程编码行程编码基本方法行程编码又称行程长度编码(Run Length Encoding,RLE),是一种熵编码,也是最简单的压缩图像的方法之一。行程编码原理是在给定的图像数据中寻找连续重复的数值,然后用两个字符值取代这些连续值。即将具有相同值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。其主要思路是将一个相同值的连续串用一个代表值和串长来代

58、替。例如有一个字符串“aaabccddddd”,经过行程编码后可以用“3a1b2c5d”来表示。对图像编码来说,可以定义沿特定方向上具有相同灰度值的相邻像素为一轮,其延续长度称之为延续的行程,简称为行程或游程。例如,若沿水平方向有一串M个像素具有相同的灰度N,则行程编码后,只传递两个值(N,M)就可以代替M个像素的M个灰度值N。行程编码分为定长行程编码和变长行程编码两种。定长行程编码是指编码的行程所使用的二进制位数固定,如果灰度连续相等的个数超过了固定二进制位数所能表示的最大值,则进行下一轮行程编码。变长行程编码是指对不同范围的行程使用不同位数的二进制位数进行编码,需要增加标志位来表明所使用的

59、二进制位数。行程编码一般不直接应用于多灰度图像,但比较适合于二值图像的编码。为了达到较好的压缩效果,有时行程编码和其他一些编码方法混合使用。例如,在JPEG中,行程编码和DCT及哈夫曼方法一起使用,先对图像分块处理,然后对分块进行DCT,量化后的频域图像数据作Z形扫描,然后作行程编码,对行程编码的结果再进行哈夫曼编码。行程编码对传输差错很敏感,一位符号出错就会改变行程编码的长度,从而使整个图像出现偏移,因此一般要用行同步、列同步的方法把差错控制在一行一列之内。PCX的RLE压缩算法PCX格式的图像文件是采用行程压缩方法处理数据的。压缩原理如下:只要在图像数据中发现一串连续相同的值,就用两个字节

60、代替这串连续相同的值,存入图像文件中。这两个字节中的第一个字节代表这串相同数据的个数,第二字节代表这串数据的值。对于不重复的数据则单独处理。BMP的RLE4压缩算法利用RLE4压缩算法处理16色位图数据时,与一般的行程编码算法基本相同。不同点是RLE4压缩算法在第1字节中所表示的连续重复数据的个数是像素个数而不是一般RLE中所定义的字节个数,在RLE4压缩算法中,每个字节包含两个像素的颜色值。RLE4压缩算法与一般RLE压缩算法不同点还表现在:它是针对16色图像数据的处理,引进了4组特殊的识别码:0X000X00:表示该行图像数据己经结束0X000X01:表示整个图像数据结束。0X000X02

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论