信息论与编码-算术编码_第1页
信息论与编码-算术编码_第2页
信息论与编码-算术编码_第3页
信息论与编码-算术编码_第4页
信息论与编码-算术编码_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息论与编码——算术编码主要内容一、信息论概念二、算术编码一、信息论概念

信息论或称为通信的数学理论,应用概率论和数理统计的方法研究有效地、可靠地、安全地传递信息的科学。

2.

分类◆信息论基础(香农信息论、狭义信息论)◆一般信息论◆广义信息论一、信息论◆信息论基础(香农信息论、狭义信息论)在信息可以量度的基础上,研究有效地、可靠地传递信息。(信息的量度、信道容量、信息率失真函数,与这三个概念相对应的香农三大定理,信源编码、信道编码)◆一般信息论研究信息传输和处理。

包括通信的全部统计问题:●Shannon:依附在信号上的信息

●Wiener:携带信息的信号◆广义信息论

不仅包括一般信息论的所有研究内容,还包括如医学、生物学、心理学、遗传学、语言学,甚至社会学和经济管理中有关信息的问题。香农信息论的基本任务:为设计有效而可靠的通信系统提供理论依据通信系统的模型二、算术编码1、算术编码的定义2、自适应算术编码3、静态算术编码4、程序设计1、算术编码的定义算术编码是一种无损数据压缩方法,也是一种熵编码的方法。和其它熵编码方法不同的地方在于,其他的熵编码方法通常是把输入的消息分割为符号,然后对每个符号进行编码,而算术编码是直接把整个输入的消息编码为一个数,一个满足(0.0≤n<1.0)的小数n。算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。分类算术编码是用符号的概率和它的编码间隔两俩个基本参数来描述的。算术编码可以是静态的或是自适应的。在自适应算术编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改。在静态算术编码中,信源符号的概率是固定的。在编码期间估算信源符号概率的过程叫建模。需要开发动态算术编码的原因,是因为事先知道精确的信源符号概率是很难的,而且是不切实际的。动态建模是确定编码器压缩效率的关键。2、自适应算术编码例1:算术编码对某条信息的输出为1010001111,那么它表示小数0.1010001111,也即十进制数0.64。

考虑某条信息中可能出现的字符仅有abc三种,要压缩保存的信息为bccb。采用的是自适应模型,开始时暂时认为三者的出现概率相等,也就是都为1/3,将0-1区间按照概率的比例分配给三个字符,即a从0.0000到0.3333,b从0.3333到0.6667,c从0.6667到1.0000。用图形表示就是:+0.0000_Pa=1/3+0.3333

Pb=1/3

+0.6667

Pc=1/3

+1.0000现在拿到第一个字符b,把目光投向b对应的区间0.3333-0.6667。这时由于多了字符b,三个字符的概率分布变成:Pa=1/4,Pb=2/4,Pc=1/4。好,按照新的概率分布比例划分0.3333-0.6667这一区间,划分的结果可以用图形表示为:+0.3333

Pa=1/4

+0.4167Pb=2/4

+0.5834

Pc=1/4

+0.6667接着拿到字符c,现在要关注上一步中得到的c的区间0.5834-0.6667。新添了c以后,三个字符的概率分布变成Pa=1/5,Pb=2/5,Pc=2/5。用这个概率分布划分区间0.5834-0.6667:+0.5834

Pa=1/5+0.6001

Pb=2/5

+0.6334

Pc=2/5

+0.6667

现在输入下一个字符c,三个字符的概率分布为:Pa=1/6,Pb=2/6,Pc=3/6。来划分c的区间0.6334-0.6667:+0.6334Pa=1/6+0.6390Pb=2/6+0.6501Pc=3/6+0.6667

输入最后一个字符b,因为是最后一个字符,不用再做进一步的划分了,上一步中得到的b的区间为0.6390-0.6501,好,在这个区间内随便选择一个容易变成二进制的数,例如0.64,将它变成二进制0.1010001111,去掉前面没有太多意义的0和小数点,我们可以输出1010001111,这就是信息被压缩后的结果,就完成了一次最简单的算术压缩过程。其译码的过程跟编码过程相似,具体如下表。自适应算术编码的译码过程:步骤间隔译码符号译码判决1[0.3333,0.6667)b0.64在[0.3333,0.6667)2[0.5834,0.6667)c0.64在[0.3333,0.6667)的最后1/4区间内3[0.6334,0.6667)c0.64在[0.3333,0.6667)的最后2/5区间内4[0.6390,0.6501)b0.64在[0.3333,0.6667)的最后第2和第3个1/6区间内5译码结果:bccb3、静态算术编码

例如输入的消息序列为:10001100101101编码和译码过程步骤1:步骤2:步骤3:4、程序设计流程图开始输入字符判断字符是否有效N输出结果编码译码Y开始编码分配初始概率判断读入的字符分配在哪个区间重新分配概率判断是否是最后一个字符转化成二进制输出NY二进制转化成十进制开始译码分配初始概率比较数据在哪个区间重新分配概率循环是否结束输出译码结果NY自适应算术编码和译码流程图:静态算术编码和译码流程图开始编码判断读入的字符分配在哪个区间循环是否结束输出结果NY开始译码比较该数据在哪个区间循环是否结束输出结果NY在算术编码中需要注意的几个问题:由于实际的计算机的精度不可能无限长,只能取一定的有效位,或者运算中出现溢出,丢失数据,但多数机器都有16位、32位或者64位的精度,因此这个问题可使用比例缩放方法解决,当然取精度误差也是难免的。算术编码器对整个消息只产生一个码字,这个码字是在间隔[0,1)中的一个实数,因此译码器在接受到表示这个实数的所有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论