版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本文格式为Word版,下载可任意编辑——第10讲信源编码的性能指标第10讲信源编码的性能指标
1.无失真信源编码的冗余度压缩原理
为了压缩冗余度,必需改造信源输出符号的统计特性。一方面要尽量提高任一时刻输出符号的概率分布的均匀性,另一方面要尽量消除前后输出符号的统计相关性。因此,无失真信源编码的实质是将信源尽可能地改造为均匀分布的无记忆信源。这种信源的通信效率是最大的。改造后的新信源是由原信源和编码器共同组成的,称为编码后的信源。设f是信源S的一个编码,X是编码后的信源,则三者之间的关系表示如下
fS???X
信源编码f所用的码元可以与信源S的符号不同,一般是某个信道的输入符号。
从数据处理这个角度来看,编码f是一个数据处理器,输入信源S的数据,输出信源X的数据。从通信的角度看,编码f是一个信道,输入信源S的数据,输出信源X的数据。
无失真信源编码的目的是无损压缩,即用完可能少的数据表示数据中的所有信息,不能破坏数据原有信息。这相当于提高信息传输效率,使之接近于1。因此,度量无失真编码的压缩性能可以看编码后信息传输效率,称为编码效率。编码效率越接近于1,无损压缩性能越好。下面介绍信源编码的5特性能指标,包括平均码长、码率、编码效率、编码冗余度和压缩率。
2.平均码长
平均码长是信源编码的一个关键的性能指标。在已知信源熵的前提下,根据平均码长,可以计算出无损压缩编码的码率和编码效率。
定义2.1设f是一个N-分组码,各码字的码长分别记为li,1?i?q,对应的N长分组的概率为pi,则f的平均码长定义为
1L?N?pl(码元/信源)
iii?1q
注:在有的教材中,当平均码长的单位转化为“比特/信源〞时,称为编码速率。本课程用不到这个概念。
探讨:用平均码长估计编码后的数据长度
设S是一个离散无记忆信源,f:S?C是信源S的一个编码,其平均码长为L。令
s?s1s2?sn是一个信源序列。假设用f对该数据进行编码,试估计编码后码元序列的长度。
对于信源数据s?s1s2?sn,我们令Li表示信源符号si所对应的码字f(si)的长度,则编码后的数据长度为L1+L2++Ln。我们把Li视为随机变量,则对于任何i,我们有E[Li]?L。
1/6
由于S是离散无记忆的,所以{Li}是独立同分布随机序列。根据辛钦大数定理,我们有
1(L1+L2+nP+Ln)???L
这说明,编码后的数据长度可以估计为nL,并且n越大,这个估计的越确切、可信。我们把上述结论推广如下。
定理2.2(无失真编码的数据长度定理)设S是具有AEP性质的信源,f是S的一个平均码长为L的无失真N-分组码。假设在编码f下,某数据在编码前的长度为n信源,在编码后的长度为m码元,则
mP???L(n??)n意义:信源序列长度n越大,编码后所得的码元序列的长度越有可能近似于nL(码元)。3.码率和编码效率
定义3.1码率(coderate):编码后的信息传输率H∞(X),记为R,单位是“比特/码元〞。
以下定理给出了无失真编码的码率计算公式。
定理3.2设S是具有AEP性质的信源,f是信源S的无失真编码。若S的熵率为H∞,f的平均码长为L,则f的码率为
R?H?L证明:记编码后的信源为X。根据定义,X的熵率为码率R。用Sk,Xk分别表示信源S和X所产生的信源序列中的第k个符号。根据渐近等分性定理,
1I(S1S2nPSn)???H?(1)
由于S具有渐近等分割性,易知X也具有渐近等分割性。于是我们有
1I(X1X2m其中X1X2PXm)???R(2)
Xm为S1S2Sn经编码后的码元序列,故有
Sn)?I(X1X2Xm).
I(S1S2根据依概率收敛的性质,由(1)和(2)得
mPH????.nR码2/6
再由前面的编码后数据长度定理,
mP???L.n于是我们得L?H?H,即R码??。证毕R码L
定义3.2编码效率(codeefficiency):对于编码f来说,编码后信源X的信息传输效率称为f的编码效率,记为?f。因此,
?f??X?H??X?H0?X?
码率和编码效率是信源编码的两个重要性能指标,其值越大,则编码的数据压缩能力越强。注意,对于无失真信源编码来说,提高编码效率与数据压缩是一回事。而对于限失真信源编码来说,除了通过提高编码效率来实现数据压缩之外,还通过量化方法缩小信源熵率,为后面的无失真压缩提高更大的压缩空间。
提问:
(1)码率与编码效率的的最大值分别是多少?(2)试确定码率与编码效率的之间的数量关系。
答:(1)码率最大值=码元最大熵H0(X),从而最大编码效率=H0(X)/H0(X)=1。(2)编码效率=码率/码元最大熵。
定义3.3编码冗余度:度量信源编码与理想编码之间的差距,定义为
编码冗余度=最大码率-码率
编码相对冗余度=编码冗余度/最大码率=1-编码效率
4.压缩率
根据第8讲的渐近等分割性定理,对于足够长的的数据,我们有如下近似关系:
数据长度?数据信息量
信源熵率数据越长,该近似关系越确凿和可信。根据该近似关系,读者可以看出,在信息量不变的前提下,熵率越大,数据越短。因此,提高熵率所带来的结果就是数据压缩。压缩效果用压缩率来度量,定义为
压缩率=编码后的数据长度
编码前的数据长度3/6
(1)数据压缩率:对于一个数据x,其以比特为单位的长度称为x的比特数,记为l(x)。x
经过编码后的比特数记为L(x)。x的在此编码下的压缩率(也称压缩比)定义为
?(x)?L(x)l(x)(2)无失真信源编码压缩率:教材上都没有定义。能否给出一个合理的定义?
设f是信源S的无失真编码,s是S的一个信源序列,x是
在编码f下所得的码元序列。令s的长度是n,即nH0(S)比特。令x的长度是m,即mH0(X)比特。则s在f下的压缩率为
mH0?X?
nH0?S?
根据渐近等分割性,我们有
I(s)PI(x)P???H?(S)和???H?(X)nm由于编码是无失真的,故I(s)=I(x)。因此,
mPH?(S)???nH?(X)mH0(X)PH?(S)H0(X)???
nH0(S)H?(X)H0(S)即
mH0(X)P?S???
nH0(S)?X其中?S是信源S的信息传输效率,?X是编码后信源X的信息传输效率,即编码效率。这个收敛关系说明,当信源序列足够长时,其数据压缩率很有可能近似于信源效率比上编码效
率。因此,这个常数可以度量编码f的压缩效果。因此,我们定义无失真信源编码的压缩效率如下:
无失真信源的压缩效率=信源效率/编码效率
因此,编码效率越大,则压缩能力越强。
(3)信源的极限压缩率:
数据是不可能被无限压缩下去的,总存在各自的极限。我们探讨信源数据的压缩极限。假设信源S的熵率H∞在某编码下被提高到了最大值H0,则该编码的压缩性能达到理论允许的极限。此时压缩率为
编码后的数据长度数据的信息量I?编码前的数据长度编码后的信息速率H0H数据的信息量I??
编码前的信息速率H?H0因此,信源的相通信效率H?H0是信源数据的压缩率期望的极限。我们把这个极限称为信源极限压缩率。
4/6
无失真信源编码关系图信源序列s信息量:I(s)数据长度:n信源信息速率:H?r-元编码器f码元序列xI(x)m码元Rf无失真:I(s)?I(x)I(s)PI(x)PAEP:???H?且???RfnmmP辛钦大数定理:???LnH结论:Rf=?LH??f=Llogr5.信源的最优无失真编码
根据上面的计算公式,编码效率与平均码长是反比例关系。这说明,缩短平均码长与提高编码效率是同一回事。因此,对于无失真编码来说,数据压缩与提高编码效率是同一回事。编码效率越接近于1,编码的压缩能力越强。因此,在某信源的所有无失真编码中,我们把其中编码效率达到1的编码称为该信源的最优无失真编码。这为无失真编码的设计工作指明白努力的目标。一般来说,由于编码的离散性,这个目标是永远达不到的,但是可以无限地接近。因此,一般来说,信源编码没有最好,但有更好。
(当编码效率=1时,编码后的信源是均匀分布的无记忆信源。要做到这一点,信源编码必需消除原信源的记忆性,即前后输出符号之间的统计相关性,并且要让编码后的信源在任何时刻输出符号的概率分布是均匀的。对于一般的信源来说,其任何编码都不可能完全做到这一点,绝对最优的信源编码是不存在的。)
假使把上述最优编码称为绝对最优编码的话,还有一种相对最优编码,其定义如下。定义5.1在信源S的所有r-元N-分组无失真编码中,平均码长最小的称为S的最优r-元N-分组无失真编码。
注:(1)一个信源的r-元N-分组码是有限多的,所以其中一定存在最优码。
(2)比较两个不同元数的编码的平均码长时,其单位要化为一致的单位后才可以比较。无失真信源编码理论的核心问题就是寻觅最优无失真编码。根据编码效率与平均码长的反比关系,要提高编码效率只需缩短平均码长即可,这是实现无失真编码的数据压缩功能的唯一途径。下一讲我们将重点探讨这个问题。这里我们先了解最优编码的两个简单性质。命题5.2最优编码是概率匹配编码,即信源符号的概率越小,对应的码字长越大。
5/6
证明设f是信源U的最优的1-分组编码。令U的n个符号的分别为ai,对应的概率为pi,在某编码下,对应码字长为li。假设存在两个符号ai,aj,有pi>pj且li>lj,则pili+pjlj>pilj+pjli。因此,对调ai与aj的码字后,可以得到平均码长更小的编码。这与f的最优性矛盾。证毕
命题5.3最优编码充分用短字符串作为码字。设f是某信源的最优编码,最大码字长为L,则任何长度小于L的串一定是f的某个码字的前缀。
证明留给读者。证毕6.本讲要点小结
1)平均码长的定义和物理意义。2)平均码长的应用:
(1)估计无失真编码的码元序列长度≈信源序列长度×平均码长
这说明,无失真编码的平均码长越小,压缩能力越强。
(2)计算无失真编码的码率=信源熵/平均码长
(3)计算无失真编码的效率=码率/码元最大熵=信源熵/(平均码长×码元最大熵)这说明,编码效率与平均码长是反比关系,从而无失真编码的数据压缩功能与提高信息传输
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024铺面租赁合同模板:适用于商业地产租赁3篇
- 二零二五年度铲车租赁及运输配送服务合同2篇
- 二零二四医疗期间劳动合同履行与员工职业规划指导协议3篇
- 2024美团外卖平台商家合作合同版B版
- 2025年度工业用地承包租赁合同书3篇
- 2025年度标准夫妻离婚财产分割协议书3篇
- 2025年度劳动合同试用期员工培训与发展计划合同3篇
- 《办公用房租赁合同》范本
- 二零二五年度智能化工程合同执行与风险评估策略3篇
- 年度飞机及配件竞争策略分析报告
- SBT11229-2021互联网旧货交易平台建设和管理规范
- 如何打造顶尖理财顾问团队
- 土壤农化分析课件
- 小区大型团购活动策划
- NEC(新生儿坏死性小肠结肠炎)92273
- 2023年租赁风控主管年度总结及下一年展望
- 开关插座必看的七个安全隐患范文
- 高分子成型加工课件
- 消防救援-低温雨雪冰冻恶劣天气条件下灾害防范及救援行动与安全
- 硅石项目建议书范本
- 概率论在金融风险评估中的应用研究
评论
0/150
提交评论