版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章离散信源无失真编码1第1页,课件共44页,创作于2023年2月第三章离散信源无失真编码
内容提要:用尽可能少的符号来传输信源消息,目的是提高传输效率,这是信源编码应考虑的问题,这章讨论在不允许失真情况下的信源编码。等长编码定理给出了等长编码条件下,其码长的下限值,变长编码定理(香农第一定理)给出了信源无失真变长编码时其平均码长的上、下限值。本章还介绍了三种通用信源编码方法:香农编码法、费诺编码法和霍夫曼编码法。第2页,课件共44页,创作于2023年2月本章重点:1.唯一可译码的基本概念;2.
Shannon编码、Fano编码、Huffman编码的方法;3.平均码长和编码效率的计算。第3页,课件共44页,创作于2023年2月3.1绪论为了实现高质量、高效率的通信,引入了信源编码和信道编码。信源编码和信道编码主要需要解决以下两个问题。提高传输效率
增强通信的可靠性第4页,课件共44页,创作于2023年2月(1)提高传输效率,用尽可能少的信道传输符号来传递信源消息,目的是提高传输效率,这是信源编码主要应考虑的问题。这里又分两种情况讨论,即允许接收信号有一定的失真或不允许失真。综上所述,提高抗干扰能力往往是以牺牲信息传输效率为代价的,而为了提高传输效率又往往削弱了其抗干扰能力。这样,设计者在取舍之间就要作均衡考虑。
(2)
增强通信的可靠性如何增加信号的抗干扰能力,提高传输的可靠性,这是信道编码主要考虑的问题。解决这一问题,一般是采用冗余编码法,赋予信码自身一定的纠错和检错能力,只要采取适当的信道编码和译码措施,就可使信道传输的差错概率降到允许的范围之内。第5页,课件共44页,创作于2023年2月信源编码包括两个功能:(1)将信源符号变换成适合信道传输的符号;(2)压缩信源冗余度,提高传输效率。第6页,课件共44页,创作于2023年2月{a1,a2,…,aK}为信源符号集,序列中每一个符号uil都取自信源符号集。{b1
,b2
,…,bD}是适合信道传输的D个符号,用作信源编码器的编码符号。编码输出码字ci=ci1ci2…cin,
cik∈{b1
,b2
,…,bD}k=1,2,
…,n
,n表示码字长度,简称码长。
信源符号{a1,a2,…,aK}
信道符号(码符号){b1,b2,…,bD}
图3-1信源编码器模型信源信源编码器一般来说,信源编码可归纳为如图3-1所示的模型。消息ui=ui1ui2…uiL
码字ci=ci1ci2…cin
第7页,课件共44页,创作于2023年2月信源编码可看成是从信源符号集到码符号集的一种映射,即将信源符号集中的每个元素(可以是单符号,也可以是符号序列)映射成一个长度为n的码字。对于同一个信源,编码方法是多种的。【例3.3】用{u1
,u2
,u3,u4}表示信源的四个消息,码符号集为{0,1},表3-1列出了该信源的几种不同编码。表3-1同一信源的几种不同编码信源消息各消息概率码1码2码3码4u1q(u1)000001u2q(u2)1101110u3q(u3)101000100u4q(u4)11111110003.1.1码的分类第8页,课件共44页,创作于2023年2月3.变长码若码字集合C中的所有码字cm(m=1,2,…,M),其码长不都相同,称码C为变长码,表3-1中列出的码3、码4就是变长码。2.等长码在一组码字集合C中的所有码字cm(m=1,2,…,M),其码长都相同,则称这组码C为等长码,表3-1中列出的码1、码2就码长n=2等长码。一般,可以将码简单的分成如下几类:1.二元码若码符号集为{0,1},则码字就是二元序列,称为二元码,二元码通过二进制信道传输,这是数字通信和计算机通信中最常见的一种码,表3-1列出的4种码都是二元码。第9页,课件共44页,创作于2023年2月5.非奇异码从信源消息到码字的映射是一一对应的,每一个不同的信源消息都用不同的码字对其编码,例表3-1中的码2、码3和码4都是非奇异码。4.奇异码对奇异码来说,从信源消息到码字的映射不是一一对应的。例表3-1中的码1,信源消息u2和u4都用码字11对其编码,因此这种码就是奇异码,奇异码不具备惟一可译性。 第10页,课件共44页,创作于2023年2月扩展信源信源编码器
信源符号{a1,a2,…,aK}
信道符号(码符号){b1,b2,…,bD}
消息u1
…uN=(u11u12…u1L)…(uN1uN2…uNL)N次扩展码字
c1
…cN=(c11c12…c1n)…(cN1cN2…cNn)图3-2N次扩展信源编码器模型
原码的N次扩展码是将信源作N次扩展得到的新信源符号序列u(N)=u1
…uN=(u11u12…u1L)…(uN1uN2…uNL),对应码符号序列c(N)=c1
…cN=(c11c12…c1n)…(cN1cN2…cNn),记集合C(N)={c1(N),c2(N),…},C
(N)即原码C的N次扩展码。6.原码C的N次扩展码原码C的N次扩展码中的每个元素是N次扩展信源中的序列所对应的N个码字组成的序列。第11页,课件共44页,创作于2023年2月对于定长码,若原码是惟一可译码,则它的N次扩展码也是惟一可译的,而对于变长码则不尽然,见表3-2。信源消息各消息概率码1码2码3u1q(u1)011u2q(u2)11001u3q(u3)00100001u4q(u4)1110000001表3-2同一信源的几种不同变长编码7.惟一可译码定义3.1如果码的任意N次扩展码都是非奇异码,则称该码为惟一可译码。第12页,课件共44页,创作于2023年2月8.即时码对于变长码,又有如下定义定义3.2对于码字c
=c1c2…cn,称c、
=c1c2…ci(i<n)为码字c的字头(前缀)。定义3.3若码中任一码字都不是另一码字的字头,称该码为异字头码(无前缀码)。第13页,课件共44页,创作于2023年2月表3-2中码3,收到“1”后就知道一个码字已经完结,无须等待下一个符号抵达,所以无前缀码能够即时译码,称之为即时可译码,简称即时码。而对于码2,收到“1”后,并不能立即做出判决,就是收到“10”也不能立即做出判决,则还要收到下面的码元才能做出判决。所以非异字头码不能即时译码,称为非即时码,由于非异字头码的其中一些码字是另一些码字的延长,故也称延长码。显然,即时码是惟一可译码,而惟一可译码不一定是即时码。第14页,课件共44页,创作于2023年2月即时码可用树图法来构造。图3-3用树图法编码树根编码深度u1:1u2:01u3:001u4:00011
0u1u2u3u41
1
1
00【例3.4】用树图法表示表3-2中的码3,如图3-3所示(D=2)。第15页,课件共44页,创作于2023年2月码奇异码非奇异码非惟一可译码惟一可译码变长码等长码即时码延长码
图3-5码的分类结构图
图3-5是码的分类结构图由上面的结构图可看出,将码分为奇异码和非奇异码两大类,我们只讨论非奇异码。非奇异码又分为惟一可译码和非惟一可译码两大类,我们只讨论惟一可译码。第16页,课件共44页,创作于2023年2月3.1.2平均码长的计算
对于变长码,码集C的平均码长,用符号表示,定义为码C中每个码字cm(m=1,2,…,M)其码长的概率加权平均值为 (3-1)式中nm是码字cm所对应的码字的长度,p(cm
)是码字cm出现的概率。对于等长码,由于码集C中的每个码字的码长都相同,平均码长就等于每个码字的码长第17页,课件共44页,创作于2023年2月N次扩展码的平均码长等于扩展码中码字长度的概率加权平均值。对于2次扩展码,有: (3-2)设nm,ns分别是原信源消息um,us所对应的码长,cm,cs是um,us所对应的码字,则式(3-2)中的nm+ns是扩展后新的信源序列nmns所对应的码字cmcs的长度,q(um)q(us)是cmcs出现的概率。第18页,课件共44页,创作于2023年2月3.1.3信息传输速率信道的信息传输速率为信道单位时间内所传输的实际信息量。若信息量以比特为单位,时间以秒为单位,则信息传输率定义为: (比特/秒)(3-3)若信息量以比特为单位,时间以码元时间(传输一个码符号的时间)为单位,则信息传输率记为
(比特/码元时间) (3-4)
为编码后的平均码长;H(X)为信源熵;式中:t为传输一个码符号的时间。第19页,课件共44页,创作于2023年2月【例3.8】
给定信源,为提高传输效率,使平均码长尽可能短,遵照概率大取码长短,概率小取码长长的原则对上述信源进行二进制不等长编码,得到,求编码后的信息传输率RD。
(比特/符号)
(码元/符号)
(比特/码元时间)第20页,课件共44页,创作于2023年2月3.2等长码及等长编码定理考虑对一简单信源S进行等长编码,信源符号集有K个符号,码符号集含D个符号,码字长度记为n。要得到惟一可译码,必须满足下式K≤Dn对单符号信源S的L次扩展信源S(L)进行等长编码,要得到码长为n的惟一可译码,必须满足KL
≤Dn(3-5)对式(3-5)两边取对数,得(3-6)对于那些出现概率极小的字符序列不予编码,这样可以减小平均码长,当然这样会带来一定的失真。下面的[定理3.1]将证明,当满足一定的条件时,在L→∞时,译码错误概率pe→0第21页,课件共44页,创作于2023年2月定理3.1
等长编码定理
设离散无记忆信源S={x1
,x2
,…,xk}的熵为H(X),S的L维扩展信源为,对信源输出的L长序列si,i=1,2,…,kL进行等长编码,码字是长度为n的D进制符号串,当满足条件,则L→∞时,可使译码差错pe<δ(ε、δ为无穷小量);反之,当时,则不可能实现无差错编码。编码效率定理3.1要求,即,可看出比值是一个小于1的无量纲纯数,定义它为等长编码的编码效率,记为
(3-7)第22页,课件共44页,创作于2023年2月3.3变长码及变长编码定理3.3.1变长码对等长码的讨论是在L足够大的条件下得到的结论,当L为有限值时,则总会带来一定程度的失真。对于变长码,往往在L不是很大的情况下就可编出高效且无失真的码。变长码也要求原码的任意L次扩展码也是惟一可译的。变长码分为即时码和延长码,为保证即时译码,要求变长惟一可译码采用即时码。对于变长码,要求整个码集的平均码长力求最小,此时编码效率最高。对于给定信源,使平均码长达到最小的编码方法,称为最佳编码,得到的码集称为最佳码。第23页,课件共44页,创作于2023年2月3.3.2克拉夫特不等式定理3.2
D进制码字集合C={c1,c2,…,cM},码集中每一cm(m=1,2,…,M)都是一个D进制符号串,设c1,c2,…,cM对应的码长分别是n1,n2,…,nM
,则存在唯一可译码的充要条件是
(3-10)式(3-10)也称克拉夫特不等式
定理3.2只是说是存在惟一可译码的充要条件,这里强调的是“存在”,但它并不是唯一可译码的充要条件,换言之,惟一可译码一定满足克拉夫特不等式,反之,满足克拉夫特不等式的码不一定是惟一可译码。
第24页,课件共44页,创作于2023年2月3.3.3变长编码定理定理3.3
给定熵为H(X)的离散无记忆信源,及有D个元素的码符号集,则总可找到一种无失真编码方法,构成惟一可译码,其平均码长满足: (3-19)定理3.4变长编码定理(Shannon第一定理)
给定熵为H(X)的离散无记忆信源,其L次扩展信源的熵记为H(X),给定有D个元素的码符号集,对扩展信源进行编码,总可以找到一种惟一可译码,使码长满足(3-23)第25页,课件共44页,创作于2023年2月记为信源每个符号所对应的平均码字数,则式(3-23)为
(3-24)
Shannon第一定理的物理意义在于:对信源进行编码,使编码后的码集中各码字尽可能等概分布,如果将这码集看成为一个新的信源,这时新信源所含信息量最大。定义编码效率(3-26)η是一个无量纲的数,一般情况下η<1,在极限情况下η=1。第26页,课件共44页,创作于2023年2月上一讲复习上一讲我们主要讨论了在不允许失真前提下对信源的编码,分为两种情况,等长编码和变长编码。等长编码定理和变长编码定理分别给出了这两种情况,在无失真和码长尽可能短这两个约束条件下的平均码长的上界和下界。等长编码定理
记H(X)为单符号信源熵,L为扩展信源输出序列长度,n为码字长度,D为码符号集元素个数,当满足条件,则L→∞时,可使译码差错pe<δ(ε、δ为无穷小量);反之,当时,则不可能实现无差错编码。变长编码定理(Shannon第一定理)记H(X)为单符号信源熵,L为扩展信源输出的序列长度,为信源每个符号所对应的平均码字数,D为码符号集元素个数,则对信源进行编码,总可以找到一种惟一可译码,使码长满足第27页,课件共44页,创作于2023年2月对于同一种信源,三种编码法中以香农编码法的编码效率最低,费诺编码法也不是一种最佳编码法,但用这种方法有时候也能找到紧致码。一般情况下,霍夫曼编码法得到的平均码长最短,即编码效率最高。3.4变长码的编码方法香农(Shannon)编码法费诺(Fano)编码法霍夫曼(Huffman)编码法变长编码法:第28页,课件共44页,创作于2023年2月3.4.1香农编码法
D进制香农编码法其码长的取值范围:-logDq(xm)
nm<-logDq(xm)+1(3-30)记离散信源,给定有D个元素的码符号集,对信源进行变长编码,将各消息概率q(xm)(m=1,2,…,M)写成如下的形式:取码长nm(m=1,2,…,M)满足:tm
nm<tm
+1(3-28)第29页,课件共44页,创作于2023年2月香农编码法具体步骤如下:(以D=2为例)(4)计算出第m个消息的累加概率,再将pm变换成二进制小数,取小数点后面nm位作为第m个消息的代码组。(3)根据式(3-31):-logq(xm)
nm<-logq(xm)+1(-logq(xm)为整数时取等号),计算出每个消息的二进制代码的长度nm;(2)计算出各消息的-logq(xm)值,m=1,2,…,M;
(1)将信源发出的M个消息,按其概率递减顺序进行排列;第30页,课件共44页,创作于2023年2月【例3.14】对给定信源
进行D=2进制香农编码。消息符号xi消息概率qi-log2qi码长ni累加概率码字cix10.22.3430000x20.192.4130.2001x30.182.4830.39011x40.172.5630.57100x50.152.7430.74101x60.103.3440.891110x70.016.6670.991111110
表3-8香农编码第31页,课件共44页,创作于2023年2月以消息x5为例,对其进行编码:计算出-logq(x5)=-log0.15=2.74,取整数n5=3作为x5的码字的码长,计算出消息x1,x2,x3,x4累加概率将0.74变换成二进制小数(0.74)10=(0.1011110)2,取小数点后面三位101作为x5的代码。计算该编码的编码效率先算出信源熵=2.61(比特/符号)平均码长=3.14(比特/符号)则编码效率
第32页,课件共44页,创作于2023年2月3.4.2费诺编码法费诺编码法的具体步骤如下:(以D=2为例)(1)信源发出的M个消息,按其概率递减顺序进行排列,把消息集{
x1,x2,x3,…,xM
}按其概率大小分解成两个子集,使两个子集的概率之和尽可能接近相等,把第一个子集编码为“0”,第二个子集编码为“1”,作为代码组的第一个码元;(2)对子集做第二次分解,同样分解成两个子集,并使两个子集的概率尽可能接近相等,再把第一个子集编码为“0”,第二个子集编码为“1”,作为代码组的第二个码元;(3)如此一直进行下去,直到各子集仅含一个消息为止;(4)将逐次分解过程当中得到的码元排列起来就是各消息的代码。第33页,课件共44页,创作于2023年2月【例3.15】
对[例3.14]给出的信源进行费诺编码表3-9费诺编码第34页,课件共44页,创作于2023年2月(1)将信源消息分成两个子集{
x1,x2,x3}和{
x4,x5,x6,x7},两个子集的和概率分别为0.2+0.19+0.18=0.57与0.17+0.15+0.10+0.01=0.43,赋予第一个子集码元“0”,赋予第二个子集码元“1”;(2)又将子集分成和概率尽可能接近相等的两个子集,分别赋予第一个子集码元“0”,赋予第二个子集码元“1”;(3)一直进行下去,直到每个子集仅含一个消息为止。该编码的编码效率:[例3.14]中已算出信源熵H(X)=2.61(比特/符号)平均码长=2.74则编码效率:
第35页,课件共44页,创作于2023年2月3.4.3霍夫曼编码法设信源消息数M
2,记概率分布为,存在D进制惟一可译码C
={c1,c2,…,cM},对应的码长分别为{n1,n2,…,nM},不失一般性,设q(x1)
q(x2)
…
q(xM
),则C
={c1,c2,…,cM}是最佳码必须具备如下两条性质:1.
n1
n2
…
nM;2.最后(最长)的D*个码字,它们具有相同的前缀c,惟一的区别是最后一位码符号不同,可将这D*个最长的码字分别表示为c·0,c·1,…,c·(D*-1)其中D*∈{2,3,…,D}(3-31)且D*=Mmod(D-1)(3-32)第36页,课件共44页,创作于2023年2月定理3.5
假定C
*
={c1,c2,…,cM-D*,c
}为最佳码,对应概率Q*={q(x1)
,q(x2)
,…,q(xM-D*),q*
}其中q*可记为q*=q(xM-D*+1)+q
(xM-D*+2)+…+q(xM)且概率分布满足q(x1)
q(x2)
…
q(xM-D*)q
(xM-D*+1)…
q(xM
)则对应概率分布为Q={q(x1)
,q(x2)
,…,q(xM-D*),q(xM-D*+1),…,q(xM)
}的最佳码是C={c1,c2,…,cM-D*,c·0,
c·1,
…,c·(D*-1)}第37页,课件共44页,创作于2023年2月(3)将上述概率之和作为一新消息的概率,与余下的消息一起组成一新的信源,再按概率递减顺序重新排列,如果概率之和与原信源的某个概率相等,则把概率之和排在上面,这样可使合并消息重复编码的次数减少,使短码得到充分利用;(4)如此一直进行下去,直到两个合并消息的概率之和为1;(5)从最后一步骤开始,沿编码逆程取下各步骤得到的码符号,如此构成的码符号序列即为对应消息的码字。(2)将概率最小的二个消息分别编码为“1”和“0”,再对这两个消息求概率之和;可以按照如下步骤编码(考虑D=2的情况),参见图3-7
。(1)将信源发出的M个消息,按其概率递减顺序进行排列,得:q(x1)
q(x2)
q(x3)
…
q(xM
)第38页,课件共44页,创作于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024工程项目协议条款与监管办法
- SaaS平台定制技术开发服务协议
- 2023-2024学年重庆市永川北山中学高三二轮检测试题(二模)数学试题试卷
- 2024定制出租车辆运营协议典范
- 2024年履约担保协议范本下载指南
- 2024锅炉维修工程协议格式
- 2024年度汽车租赁协议格式
- 2024商业秘密保护竞业限制协议样本
- 2024年仓库转租协议条款
- 动产资产抵押协议范例2024年
- 高考地理一轮复习课件【知识精讲+高效课堂】美食与地理环境关系
- 分居声明告知书范本
- 2023年04月山东济南市槐荫区残联公开招聘残疾人工作“一专两员”公开招聘笔试参考题库+答案解析
- 消失的13级台阶
- 营销管理知识点
- 船体强度与结构设计课程设计
- 不宁腿综合征诊断与治疗
- 初中英语教学活动设计
- 三写作的载体与受体
- GB/T 451.3-2002纸和纸板厚度的测定
- 网签授权书(学生就业平台)
评论
0/150
提交评论