信息论第七讲率失真函数课件_第1页
信息论第七讲率失真函数课件_第2页
信息论第七讲率失真函数课件_第3页
信息论第七讲率失真函数课件_第4页
信息论第七讲率失真函数课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.4率失真函数(RateDistortionFunction)引言上面我们介绍的编码也称为无失真编码(无损编码),另外一类编码称为限失真编码(有损编码)。率失真理论研究的就是在允许一定失真的前提下,对信源的压缩编码。率失真信源编码定理(香农第三定理)指出:率失真函数R(D)就是在给定失真测度条件下,对信源压缩的最低程度。也就是说:为了提高传输效率,可以给定一个失真度,求出在平均失真小于给定值的条件下,信源所能压缩的程度的极限值,即率失真函数R(D)。12/23/202214.4率失真函数4.4.1失真度与平均失真度(1)符号失真度设单符号离散无记忆信源、信宿及信道为:DMCXY12/23/202224.4率失真函数定义:对每一对(xi,yj),指定一个非负函数

d(xi,yj)≥0

i=1,2,…,n

j=1,2,…,m称d(xi,yj)为符号失真度(失真函数)。符号失真度表示信源发出一个符号xi,在接收端再现yj

所引起的误差或失真。12/23/202234.4率失真函数(3)平均失真度意义它是在平均意义上,对整个系统失真情况的总体描述。它是信源统计特性p(xi)、信道统计特性p(yj/xi)和失真度d(xi,yj)的函数。当p(xi),p(yj/xi)和d(xi,yj)给定后,平均失真度就是一个确定的量。如果信源和失真度一定,它就只是信道统计特性的函数。信道不同,平均失真度随之改变。12/23/202254.4率失真函数(4)失真度描述失真度一般用失真度矩阵来描述。12/23/202264.4率失真函数例:汉明(Hamming)失真度X={x1,x2,…,xn},Y={y1,y2,…,yn},约定失真度用矩阵表示为式中dij≥0i,j=1,2,…,n为信源方发送符号xi而信宿方判为yj引起的失真度。12/23/202274.4率失真函数例:平方误差失真度X={0,1,2},Y={0,1,2}

,给出失真度dij=(xi-yj)2

i,j=0,1,2则失真度矩阵为

12/23/202284.4.2率失真函数(1)允许失真度D对于单符号离散无记忆信源X、信宿Y及信道P(Y/X):给定信源X概率分布p(x)和失真度矩阵[d]=[dij],如果信道转移概率矩阵[P]=[p(Y/X)]满足如下关系,则式中的D则称为允许失真度,关系式称为保真度准则。4.4率失真函数12/23/2022104.4率失真函数(3)率失真函数的含义通过选择合适的信道转移概率p(y/x)(实际上选择某种信道编码方法),在满足一定的失真度要求前提下(平均失真度<允许失真度D),使平均交互信息量达到最小值R(D)。率失真函数表明了在满足平均失真度小于D条件下,信源传输信息量(信息速率)可压缩的最低程度。在信源和失真度给定以后,存在满足保真度准则的信道集合,一定有某个信道,使I(X;Y)达到最小。12/23/2022124.4率失真函数D的最大值Dmax当R(D)达到其最小值Rmin(D)=0时,对应的失真最大,这种情况下D对应着R(D)函数定义域的上界值Dmax。DDmax0DminH(X)R(D)12/23/2022144.4率失真函数(5)率失真函数的性质率失真函数R(D)是D的下凸函数。分别给定两个失真度D1和D2(Dmin

D1,D2

Dmax),则下式成立:

R(α1D1+α2D2)≤α1R(D1)+α2

R(D2)率失真函数R(D)是连续单调函数12/23/2022154.4率失真函数例:求率失真函数已知信源{x1=0,x2=1},概率分布为(δ,1-δ),δ<0.5,信道输出符号Y={y1=0,y2=1},失真测度为汉明(Hamming)失真测度,求率失真函数R(D)。(1)求出R(D)的定义域Dmin=0·δ+0·(1-δ)=0Dmax=min{1-δ,δ}=δ

12/23/202216(2)求出R(D)的值域R(Dmin=0)=H(X)=-δlogδ-(1-δ)log(1-δ)=H

(δ)R(Dmax)=R(δ)=0(3)在0

Dδ的范围内,计算R(D)根据熵的性质:H(X,Y)

H(X)

H(X/Y)又由:H(X)=

H()则平均互信息量

I(X;Y)=H(X)-H(X/Y),得到

I(X;Y)=

H(δ)-H(X/Y)4.4率失真函数12/23/2022174.4率失真函数对于汉明失真度,平均失真度为:在R(D)的定义中,要求满足平均失真度小于等于D,取等号则:

H(X/Y)≤H(Pe)=H(D)则:I(X;Y)

H(δ)-H(D)

根据定义:(信道误码率)可知:0≤Pe≤D≤δ(Fano不等式)12/23/2022184.4率失真函数(4)求出P(Y/X)找到一个信道转移概率矩阵为[P]的信道,使H(X/Y)=H(D),且[P]中的每一个元素p(yj︱xi)都满足p(yj︱xi)0

i,j=1,2根据[d]的对称性,假设一个反向信道(Y→X)由假设的反向信道计算平均失真度,得(满足失真准则)12/23/2022204.4率失真函数这时计算条件熵(反向信道噪声上)则平均互信息量I(X;Y)=H(X)-H(X/Y)=H(δ)-H(D),假设的[q(x/y)]确实在满足失真准则条件下,使

I(X;Y)=H(δ)-H(D)从而有

12/23/2022214.4.3限失真信源编码定理香农第三编码定理设离散无记忆信源的信息率失真函数为R(D),只要满足R>R(D),当信源序列足够长时,一定存在一种编码方法,其译码失真小于或等于D+ε,其中ε是任意小的正数;反之,若R<R(D),则无论采用什么样的编码方法,其译码失真必大于D。这个定理给出了限失真信源编码的极限。只要允许一定的失真就可以降低熵速率。4.4率失真函数12/23/2022234.4率失真函数率失真函数的理解(Rate+Distortion=Function)信息率失真函数是在满足平均失真不大于D的条件下,信源必须输出的最小信息量。如果信源输出信息速率R小于R(D),则无论对于什么信道,无法找到编码方法使信宿收到的信息保证失真度要求。如果信源输出信息速率R不小于R(D),则无论对于什么信道,总可以找到编码方法使信宿收到的信息保证失真度要求。12/23/2022244.5信源编码综述4.5.1信源编码概述在通信系统模型中,编码的目的就是实现有效、可靠和安全的信息传输、交换、存储和识别。广义地讲,针对三个目的有三大类编码,分别是信源编码、信道编码和保密编码(密码学)。(常存在矛盾)从信息论角度讲,信源编码分为无失真信源编码和限失真信源编码。无失真编码:主要用于离散信源(数字信号);限失真编码:主要用于连续信源(模拟信号);信源编码的主要性能指标是编码效率,它的本质就是理论码率和实际码率的比。12/23/2022264.5信源编码综述无失真编码也称为可逆编码(信源符号经过编码后,可以从编码中无失真地恢复信源符号)。已知符号概率即可计算信源熵H,就可以使平均码长任意接近H。编码的方法的基本思想就是概率与码长的匹配。对于符号概率不可知,或者非平稳,或长相关信源无法应用。限失真编码也称为不可逆编码(连续信源编码后无法无失真的恢复)。根据率失真理论进行限失真编码;在失真小于D的条件下码率可以压缩到R(D),但是定理没有给出实现途径。现有的方法就是最佳量化问题,标量量化不行,需要矢量量化(多个符号合成一个矢量再编码)。有记忆信源的熵小,去掉相关性可以降低码率,解决的方法就是预测编码和变换编码。12/23/2022274.5信源编码综述4.5.2信源编码方法无失真信源编码可逆编码,无损编码、熵编码(EntropyCoding)Huffman编码,算术编码,游程编码,LZW编码等。限失真信源编码不可逆编码,有损编码、源编码(SourceCoding

)预测编码:利用过去和当前的数据对在时间或空间上将来的数据进行预测,从而达到压缩的目的,如DM、ADPCM。变换编码:利用数学变换方法,将原时域或空域的数据变换到频率域或其它域,利用数据在变换域中的冗余或人类感觉的冗余特征实现的压缩,如DCT、DWT。分层编码:将原数据在时空域或频域上分成若干子区域,利用人类感觉的特征进行压缩编码,然后再合并,如子带编码其他编码:如矢量量化、运动补偿、音感编码。12/23/2022284.5信源编码综述4.5.3信源编码与数据压缩技术以山农信源编码为基础,结合信号处理和多媒体通信技术的发展,逐步形成了系统的数据压缩技术。信源数据压缩的基本条件是信源消息符号原始存在的状态冗余。1)信源数据中存在或多或少的冗余,这种冗余既存在信源本身的相关性中,也存在于信源概率分布的不均匀中;如空间冗余、时间冗余、结构冗余、知识冗余及纹理统计冗余;2)对于图像、音频和视频等特殊信源,人的感知可容忍某些细节信息的丢失(失真)(感知冗余)。12/23/2022304.5信源编码综述4.5.4算术编码(arithmeticcoding)算术编码引出:算术编码和Huffman编码一样,也是一种熵编码,无失真编码。Huffman编码是建立了一种原始信源符号Si与信道码字Wi的一一对应的映射关系。因此也称为块码(Block),或者分组码(Group)。Huffman编码的不足:不太适合二进制信源;符号相关性没有充分考虑;码长必须为整数位,码长与符号概率匹配性不是太好。12/23/2022314.5信源编码综述算术编码思想:针对序列进行编码,建立递推关系。不用二整数代码来表示符号,而改用[0,1)半开区间中实数的二元小数序列来表示。[0,1)可以分为n个子区间,每个宽度值等于一个符号的先验概率,符号表中的所有符号刚好布满整个[0,1)区间(概率和为1)。编码过程就是把输入符号串(数据流)映射成[0,1)区间中对应子区间中的一个实数值。12/23/2022324.5信源编码综述算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码。算术编码用到两个基本的参数:符号概率和它的编码间隔。编码效率取决于符号概率和编码间隔,编码间隔取决于符号概率和符号相关性,而这些间隔包含在0到1之间。12/23/2022334.5信源编码综述编码举例

假设信源符号为{00,01,10,11},这些符号的先验概率分别为{0.1,0.4,0.2,0.3},根据这些先验概率可把间隔[0,1)分成4个子间隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1),二进制序列的输入为:10001100101101。12/23/2022344.5信源编码综述12/23/2022354.5信源编码综述算术编码是一种二元码的编码方法。在不考虑信源统计的情况下,不管统计是平稳的或非平稳的,编码的码率总能趋近于信源熵,每次迭代时的编码算法只处理一个数据符号,并且只有算术运算。随着被编码数据流符号的输入,子区间宽度逐渐缩小。表示为数值精度逐渐提高,二进制代码逐渐加长。12/23/2022364.5信源编码综述新子区间的起始位置=前子区间的起始位置+当前符号的区间左端×前子区间长度;0.5=0.5+0X0.2;0.514=0.5+0.7X0.0212/23/2022374.5信源编码综述新子区间的长度=前子区间的长度×当前符号的概率(等价于范围长度);0.02=0.2X0.1;0.0006=0.006X0.112/23/2022384.5信源编码综述最后得到的子区间的长度(一个小数)决定了表示该区域内的某一个数所需的位数。算术编码在编、译码的过程中,子区间的起始位置和长度值的小数点后的位数越来越长,实际中无法实现。因此较实用的改进算法是限制小数点后的位数。12/23/2022394.5信源编码综述例如:已知信源X=(0,1);(0.25,0.75)试对1011进行算术编码.0.01.00.2510110.251.00.250.43750.2968750.43750.332031250.4375输出12/23/2022404.5信源编码综述最后的子区间起始位置C=(0.332)d=(0.01010101)b最后的子区间左端长度L=(0.10546875)d=(0.0111)b编码取值为0.011可编码为01112/23/2022414.5信源编码综述算术编码中需要注意问题:由于实际计算机精度不可能无限长,运

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论