无损压缩技术_第1页
无损压缩技术_第2页
无损压缩技术_第3页
无损压缩技术_第4页
无损压缩技术_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

无损压缩技术第1页,共41页,2023年,2月20日,星期五数据压缩技术的性能指标

压缩的必要性音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。例如:基本原理和方法一幅中等分辨率(640×480)的真彩色图像(24b/像素),它的数据量约为0.9MB/帧,若要达到每秒25帧的全动态显示要求,每秒所需的数据量约为22MB。对于声音也是如此,CD音质的声音每秒将有约为172KB的数据量。第2页,共41页,2023年,2月20日,星期五第3页,共41页,2023年,2月20日,星期五视频、图像、声音有很大的压缩潜力

信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度(信息熵冗余)。原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余、统计冗余、结构冗余、知识冗余、信息熵冗余等。基本原理和方法数据压缩技术的性能指标第4页,共41页,2023年,2月20日,星期五冗余的基本概念

指信息存在的各种性质的多余度举例:(1)广播员读文稿时每分钟约读180字,一个汉字占两个字节;文本数据量为360B;(2)如果对语音录音,由于人说话的音频范围为20Hz到4kHz,即语音的带宽为4kHz,若设量化位数为8bit,则一秒钟的数据量为:

4×2×8=64kbit/s=8KB/s则一分钟的数据是480KB。

数据冗余的类型与压缩方法分类基本原理和方法360B

480KB第5页,共41页,2023年,2月20日,星期五数据冗余的类别空间冗余时间冗余统计冗余信息熵冗余结构冗余知识冗余视觉冗余听觉冗余数据冗余的类型与压缩方法分类基本原理和方法第6页,共41页,2023年,2月20日,星期五●空间冗余数据冗余的类型与压缩方法分类规则物体和规则背景的表面物理特性都具有相关性,数字化后表现为数据冗余。●时间冗余序列图像(如电视图像和运动图像)和语音数据的前后有着很强的相关性,经常包含着冗余。在播出该序列图像时,时间发生了推移,但若干幅画面的同一部位没有变化,变化的只是其中某些地方,这就形成了时间冗余。基本原理和方法第7页,共41页,2023年,2月20日,星期五

空间冗余和时间冗余是把图像信号看作概率信号时反应出的统计特性,因此,这两种冗余也被称为统计冗余。数据冗余的类型与压缩方法分类●统计冗余●信息熵冗余信息熵实际情况又称编码冗余。信息熵是指一组数所携带的信息量。●结构冗余数字化图像中的物体表面纹理等结构往往存在着冗余基本原理和方法第8页,共41页,2023年,2月20日,星期五

由图像的记录方式与人对图像的知识差异所产生的冗余称为知识冗余。●知识冗余

人类的视觉系统对于图像场的注意在非均匀和非线性的,视觉系统并不是对图像的任何变化都能感知。●视觉冗余

●听觉冗余

人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。数据冗余的类型与压缩方法分类基本原理和方法第9页,共41页,2023年,2月20日,星期五从哪些方面评价一个压缩系统?数据压缩技术的性能指标基本原理和方法●压缩比●图像质量●压缩解压速度●硬件和软件第10页,共41页,2023年,2月20日,星期五压缩比

输入数据和输出数据比例如:图像512×480,24位输入=(512×480×24)/8=737280B

输出15000B

压缩比=737280/15000=49数据压缩技术的性能指标基本原理和方法第11页,共41页,2023年,2月20日,星期五图像质量压缩方法:无损压缩有损压缩有损压缩:失真情况很难量化,只能对测试的图像进行估计。

数据压缩技术的性能指标基本原理和方法第12页,共41页,2023年,2月20日,星期五压缩解压速度在许多应用中,压缩和解压可能不同时用,在不同的位置不同的系统中。所以,压缩、解压速度分别估计。静态图像中,压缩速度没有解压速度严格;动态图像中,压缩、解压速度都有要求,因为需实时地从摄像机或其他设备中抓取动态视频。数据压缩技术的性能指标基本原理和方法第13页,共41页,2023年,2月20日,星期五硬软件系统

有些压缩解压工作可用软件实现。设计系统时必须充分考虑:算法复杂-压缩解压过程长算法简单-压缩效果差目前有些特殊硬件可用于加速压缩/解压。硬件系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压缩/解压系统时必须先将算法标准化。数据压缩技术的性能指标基本原理和方法第14页,共41页,2023年,2月20日,星期五数据压缩技术分类指使压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。

典型的算法有:Huffman编码,算术编码,行程编码等。特点:压缩比较低,为2:1---5:1,一般用来压缩文本,数据。数据冗余的类型与压缩方法分类●无损压缩基本原理和方法第15页,共41页,2023年,2月20日,星期五是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。典型的算法有:混合编码的JPEG标准,MPEG标准等。特点:压缩比高,为几十到几百倍一般用于图像,声音,视频压缩。数据冗余的类型与压缩方法分类●有损压缩基本原理和方法第16页,共41页,2023年,2月20日,星期五数据压缩的方法统计编码预测编码变换编码混合编码

分析合成编码常用数据压缩方法的基本原理基本原理和方法第17页,共41页,2023年,2月20日,星期五熵是信息量的度量方法某个事件的信息量用表示

,其中为第个I个事件的概率。信源S的熵的定义

常用数据压缩方法的基本原理●香农-范诺与霍夫曼编码第18页,共41页,2023年,2月20日,星期五

根据消息出现概率的分布特性而进行的压缩编码。

Huffman编码行程编码词典编码算术编码常用数据压缩方法的基本原理基本原理和方法●统计编码第19页,共41页,2023年,2月20日,星期五Huffman编码它是统计独立信源能达到最小平均码长的编码方法。编码效率高。统计编码基本原理和方法第20页,共41页,2023年,2月20日,星期五Huffman编码编码步骤:

(1)初始化,根据符号概率的大小按由大到小顺序对符号进行排序。

(2)把概率最小的两个符号组成一个节点。

(3)重复步骤2。

(4)从根节点开始到相应于每个符号的“树叶”,从上到下标上“0”(上枝)或者“1”(下枝),至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。

(5)从根节点开始顺着树枝到每个叶子分别写出每个符号的代码,统计编码基本原理和方法第21页,共41页,2023年,2月20日,星期五a10.20a20.19a30.18a40.17a50.15a60.10a70.01010.11010.2600.3510.611101000.391.00码字码长01200233344平均码长:2.72Huffman编码过程第22页,共41页,2023年,2月20日,星期五Huffman编码的注意点Huffman编码没有错误保护功能,如果码中有错误,则可能引起接下来的一连串译码错误。Huffman编码是可变长编码,因此很难随意查找或调用中的文件内容。Huffman依赖于信源的统计特性。Huffman编码的每个码字都是整数,因此实际上平均码长很难达到信息熵的大小。Huffman编码解码必须要有码表,如果消息数目很多,那么所需要存储的码表也很大,这将影响系统的存储量及编、译码速度。统计编码基本原理和方法第23页,共41页,2023年,2月20日,星期五算术编码算术编码把一个信源集合表示为实数线上的0到1之间的一个区间。这个集合中的每个元素都要用来缩短这个区间。信源集合的元素越多,所得到的区间就越小,当区间变小时,就需要一些更多的数位来表示这个区间,这就是区间作为代码的原理。算术编码首先假设一个信源的概率模型,然后用这些概率来缩小表示信源集的区间。统计编码基本原理和方法第24页,共41页,2023年,2月20日,星期五算术编码新子区间的起始位置=前子区间的起始位置+当前符号的区间左端×前子区间长度新子区间的长度=前子区间的长度×当前符号的概率(等价于范围长度)最后得到的子区间的长度决定了表示该区域内的某一个数所需的位数。统计编码基本原理和方法第25页,共41页,2023年,2月20日,星期五算术编码统计编码基本原理和方法[例]假设信源符号为{00,01,10,11},这些符号的概率分别为{0.1,0.4,0.2,0.3},根据这些概率可把间隔[0,1)分成4个子间隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),其中[x,y)表示半开放间隔,即包含x不包含y。上面的信息可综合在下表中。符号00011011概率0.10.40.20.3初始编码间隔[0,0.1)[0.1,0.5)[0.5,0.7)[0.7,1)第26页,共41页,2023年,2月20日,星期五算术编码统计编码基本原理和方法第27页,共41页,2023年,2月20日,星期五算术编码要注意的几个问题:由于实际的计算机的精度不可能无限长,运算中出现溢出是一个明显的问题,但多数机器都有16位、32位或者64位的精度,因此这个问题可使用比例缩放方法解决。算术编码器对整个消息只产生一个码字,这个码字是在间隔[0,1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。统计编码基本原理和方法第28页,共41页,2023年,2月20日,星期五行程编码是最简单、最古老的压缩技术之一,主要技术是检测重复的比特或字符序列,并用它们的出现次数取而代之。该方法有两大模式:一是消零(消空白),二是行(游)程(runlength)编码。

消零(或消空白)法

将数字中连续的“0”或文本中连续的空白用一个标识符(或特殊字符)后跟数字N(连续“0”的个数)来代替。

如数字序列:742300000000000000000055

编码为:7423Z1855统计编码基本原理和方法第29页,共41页,2023年,2月20日,星期五行程编码行程编码法

任何重复的字符序列可被一个短格式取代。该算法适合于任何重复的字符。一组n个连续的字符c将被c和一个特殊的字符取代。当然,若给定字符仅重复两次就不要用此方法。任何重复4次或4次以上的字符由“该字符+记号(M)+重复次数”代替。例如数字序列:Name:..........CR

编码为:Name:

.M10CR统计编码基本原理和方法第30页,共41页,2023年,2月20日,星期五词典编码

词典编码(dictionaryencoding)的根据是数据本身包含有重复代码这个特性。例如文本文件和光栅图像就具有这种特性。归纳起来大致有两类。

统计编码基本原理和方法第31页,共41页,2023年,2月20日,星期五第一类词典法的想法是企图查找正在压缩的字符序列是否在以前输入的数据中出现过,然后用已经出现过的字符串替代重复的部分,它的输出仅仅是指向早期出现过的字符串的“指针”。

词典编码基本原理和方法第32页,共41页,2023年,2月20日,星期五第二类算法的想法是企图从输入的数据中创建一个“短语词典(dictionaryofthephrases)”,编码数据过程中当遇到已经在词典中出现的“短语”时,编码器就输出这个词典中的短语的“索引号”,而不是短语本身。

词典编码基本原理和方法第33页,共41页,2023年,2月20日,星期五词典编码基本原理和方法第34页,共41页,2023年,2月20日,星期五LZW编码简介LZW通过建立一个字符串表,用较短的代码来表示较长的字符串来实现压缩。字符串和编码的对应关系是在压缩过程中动态生成的,并且隐含在压缩数据中,解压的时候根据表来进行恢复,是一种无损压缩。全称Lempel-Ziv-WelchEncoding,简称LZW的压缩算法。词典编码基本原理和方法第35页,共41页,2023年,2月20日,星期五LZW压缩有三个重要的对象数据流(CharStream)编码流(CodeStream)编译表(StringTable)。在编码时,数据流是输入对象(文本文件的数据序列),编码流就是输出对象(经过压缩运算的编码数据);在解码时,编码流则是输入对象,数据流是输出对象;而编译表是在编码和解码时都须要用借助的对象。词典编码基本原理和方法第36页,共41页,2023年,2月20日,星期五LZW编码基本原理提取原始文本文件数据中的不同字符,基于这些字符创建一个编译表,然后用编译表中的字符的索引来替代原始文本文件数据中的相应字符,减少原始数据大小。看起来和调色板图象的实现原理差不多,但是应该注意到的是,我们这里的编译表不是事先创建好的,而是根据原始文件数据动态创建的,解码时还要从已编码的数据中还原出原来的编译表.词典编码基本原理和方法第37页,共41页,2023年,2月20日,星期五LZW算法LZW算法基于转换串表(字典)T,将输入字符串映射成定长(通常为12位)的码字。在12位4096种可能的代码中,256个代表单字符,剩下3840给出现的字符串。1)初始化:将所有的单字符串放入串表2)读第一个输入字符给前缀串ω3)Step:读下一个输入字符K;if没有这样的K(输入已穷尽):码字(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论