第二章信息量化与编码_第1页
第二章信息量化与编码_第2页
第二章信息量化与编码_第3页
第二章信息量化与编码_第4页
第二章信息量化与编码_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章信息量化与编码2.1引言(1)什么是信息量化与编码量化:在数字信号处理领域,量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。量化主要应用于从连续信号到数字信号的转换中。连续信号经过采样成为离散信号,离散信号经过量化即成为数字信号。编码:编码是信息从一种形式或格式转换为另一种形式的过程也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。(2)为什么要进行信息量化与编码(3)信息量化与编码要研究的主要问题从信息的角度来看,当信号由连续幅度转换成离散幅度时,必然会有信息的损失,因此,信息量化属于有失真编码。不过,通过适当的设计,我们可以将这种损失减至能接受的地步。从这种意义出发,信息量化与编码要研究的问题便是如何进行有效的设计,使在一定条件下,编码的失真达到最小。2.2标量量化(1)标量量化的定义:

标量量化可以视为将一段连续的实轴上的线映射成一个离散的点集,这个离散点集的大小是受限的,若记此离散点集为C={y1,y2,...yN},一般我们约定下标的排列是以y值的大小为序的,即

y1<y2<…<yN

记R表示连续实轴。当量化器为n点时,相当于将R划分为N个区段Ri,Ri=(xi-1,xi],i=1,2,…,N,为半开半闭区间。显然,区间的划分是充分以及不相交的。记Q表示量化器,则Q的特性完全决定于对输入信号的分段及输出值决定。

(2)一个正规量化器还满足如下的条件:

①:每个分段Ri都是一个连续的区间,可以是开的,或半开半闭的。

②:每个分段Ri对应的量化值yi位于Ri中,即yi∈Ri=(xi-1,xi).

正规量化器的输入分段边界点xi及量化输出点yi满足已下序列关系:x0<y1<x1<y2<x2<…<yN<xN正规量化器典型量化曲线图在一般情况下,输入信号都是有界的,此时,最两端的边界点一般取为x0=min(x),xN=max(x),而量化器的量化范围为B=xN-x1。对于输入无界的情形,相当于x0=-∞,xN=+∞,量化器的量化范围定义为B=xN-1-x1,即量化范围为所有输入分段之和的长度。从结构上看,量化器可分编码器与解码器两个部分。编码器完成输入到数字的映射,即ε:R→I,I={1,2,…N},而解码器则是实现由数字到电平的转换,即D:I→C.若Q(x)=yi,则有ε(x)=i,D(i)=yi,亦即Q(x)=D(ε(x))。在通信系统中,编码器只能传送所选量化电平yi的下标i,而不是yi

本身。解码器根据接收到的下标i,通过查表可得到相应的电平值。2.2.2标量量化器结构量化器的特性完全取决于输入分段及输出电平集合,编码器实现的主要是输入分段,而解码器实现的则是输出电平。也就是说,编码器的主要功能是判定输入信号位于哪一个信号分段之内,所以我们可以定义一个选择函数Si(x)如下:实现选择函数Si(x)的系统结构如图所示

解码器的实现直接通过下标i查表即可得到相应的量化电平yi。因此,我们可将量化器的特性表示成如下形式:量化器的基本结构图2.2.3量化器性能测度1.均方误差量化器的功能是将未知输入值用有限精度的离散值来代替,因此不可避免的要引起失真,如何衡量这种失真便是本节要讨论的问题。根据量化的结果,我们无法精确知道输入值的大小,只能知道其位于某个范围内。因此通常都假设输入是一个随机变量,概率密度函数已知,相应的每个输入值的量化误差也是一个随机变量。量化器的性能指标应是描述所有输入值量化误差引起的总的失真效应。因此常用统计平均的方法来解决这类问题。最常用的的失真测度是平方误差,定义为更为一般的是乘幂误差,定义为

其中m=1时即为绝对误差,m=2时为平方误差,这两种情形应用得最为普遍。

设输入随机过程X的概率密度为fX(x),则输入量化误差的期望值为此公式所示的D是一种最常用的性能测度。而其中又以误差测度为平方误差时最为普遍,此时的性能测度又称为均方误差,可写为:2性噪比

性噪比是另一个常用的性能测度,定义为其中,D为均方误差。SNR的单位为分贝(db)2.2.4均匀量化器最常用的标量量化器是均匀量化器,大多数的模拟/数字转换器就属于此类。所谓均匀量化器,是一个正规量化器,并且满足:(1)各个分段是等长的;(2)每个分段的中点即为相应的量化输出。

换言之,对于均匀量化器,我们有当然,输入信号的左右边界可能是无限的,对于区间(-∞,y1],我们有y1=x1-△/2,对区间[yN,+∞),有yN=xN-1

+

△/2。

下面我们分析均匀量化器的均匀失真

考虑输入为有界的情形,不妨设位于区间(a,b)之内,变化范围为B=b-a。左右两边的边界点分别为:x0=a,xN=b。假定将区间分为N等分,每个子区间为△=B/N,也就是量化器有N级输出,每级之间相距△。

量化误差ε=Q(X)-X,所以在均匀量化时,最大的可能量化误差为△/2,即B/2N。所以均匀量化误差是一种使最大量化误差达到最小的量化方式。这一特点使得均匀量化在很广泛的一类输入信号下,都能保持较好的量化性能。这正是模拟/数字转换器大多采用均匀量化方式的原因。

当输入信号亦为均匀分布时,量化误差ε的均值总的失真为在实际情况中,输入信号大多不是有界的,此时,我们可将左右两端的区间(-∞,x1],(XN-1,+∞]单独取出来考虑。其余的区间与上述有界信号输入时是一样的。不过在无界输入的情况下,最大量化误差也必定是无限的,因此没有什么意义。主要的性能测度是平均量化误差,由于多数输入信号的分布主要集中于某一个区间,输入信号位于左右两端的区间的机会很小,因此上述对有限输入信号的结论依然是近似成立的,特别是当量化层数N很大时。2.2.5非均匀量化器一.压扩模型

均匀量化器有一个缺点,即当输入信号变化范围大时,量化器量化层数也必须相应变大,以保持一定的性能。而由于在许多实际场合,输入信号并不是均匀分布的,且取大值的概率相对小一些,所以,从统计的观点来看,均匀量化器这种大小信号一视同仁均匀量化的方法不太合理。因此产生了非均匀量化的概念。从直观上看,当输入信号不是均匀分布时,就应该用非均匀量化器。非均匀量化器可用均匀量化器的压扩模型表示,如图由图可见,输入信号x首先经过单调非线性变换G,变成G(x),然后对G(x)进行均匀量化,最后再经非线性变换G的逆变换G-1,得到最后的非均匀量化输出。其中,G通常是一个压缩变换,因为大多数信号的分布都是集中在某一区域内的,对应的,G-1

为一个扩张变换。结论2.1(压扩模型的通用性)对任何有限正规的量化器,都存在着如图2-2-6所示的压扩模型,其中压扩变换G及扩张变换G-1

与输入信号的概率分布有关。证明:设输入信号分段边界点为{x1,x2,…,XN-1},(x0,xN可以是无穷大,不考虑),输出值为{y1,y2,...yN}。我们按以下方式构造压扩模型。首先定义两个集合:P={(yi,i△+k),i=1,2,…,N}Q=={(xi,i△+△/2+

k),i=1,2,…,N-1}P中包含平面上N个点,这N个点横坐标是yi,而纵坐标则是一系列以△为间隔的等间距点。Q的情况类似。将P及Q两个集合代表的平面重叠在一起,则可得到平面上一个新的点集,其中,纵坐标仍是以△为间隔的等间距点,而横坐标则是xi,yi

交错(因为是正规量化器)。将相邻区间边界点对应的平面上的点以线段相连,即可构成一个分段直线的单调增曲线G(x),满足适当选取k值,可使得G(0)=0。这在实用中是常常需要的。从而构造了所需的压缩函数G。从上述结论也可由图2-2-7来直观说明。

当量化层数很大时,即△i=

xi-xi-1

很小时,我们近似可得:

此式意味着压缩特性曲线的斜率决定了量化器的局部阶距的取法。二.对数压扩

在众多的压扩器中,用得最多是对数压扩器。采用此类压扩器的原因是实际中,大多数信号都集中在较小的幅值附近,幅值大的机会相对小很多,因此,为保证平均的性噪比大,应对小的信号取小的量化阶距,而对大的信号取大的量化阶距,即保持信号幅值与量化阶距为一常数,而不是像均匀量化器中保持量化阶距为常数。根据之前的式子,可知G’(x)应与x的倒数成正比,也就是G(x)是对数型曲线。

不过,严格的对数曲线在实现上是有问题的,表现为当x→0时,G(x)→∞。为此,人们常常采用修正的对数压扩器,如在语音信号编码中,常用的就有u律及A律曲线,分别定义为:

其中V值是用于控制最大量化电平,而u及A值则是用来控制压缩特性的陡峭程度,也就是最大量化阶距与最小量化阶距之比。对于大的u及A值,可以增加信号的动态范围,但另一方面也将减少大信号的量化性噪比。因此u及A值应综合考虑多种因素,实际中用的较多的是u=255及A=87.6。三.分段线性压扩

从数学的角度看,连续可导的压扩特性固然便于分析,但在具体实现中,却不易做到低成本高精度。因此,实际中,是采用分段线性压扩器来逼近连续可导的非线性压扩特性。分段线性压扩器是指量化器在量化范围内分为许多小段,每一小段相当于一个均匀量化器,但不同小段之间量化的阶距不同。

稍作修改,即可将均匀量化的平均失真结果用到分段均匀量化器中。设输入的概率分布是均匀分布,记△i

表示第i段均匀量化的量化阶距,共有M段,则容易推出分段均匀量化器的平均失真为

其中qi

为信号位于第i段上的概率。四.渐进量化特性

所谓渐进量化特性,是指当量化层数非常大时量化器的性能。非均匀量化器的平均失真为:其中,当输入无界时,x0=-∞,xN=+∞.从理论上说,上式是一个精确的结果,然后它并不是很适合于数值计算,特别是当N很大时。为了得到更加有效的计算公式,我们采用近似方法来计算式中的积分。当N很大时,也就是△i=

xi-xi-1

很小,因此

另一方面,我们有:所以从而得到平均失真的近似计算式为

当N很大时,每个最小量化区间Ri可近似认为是一个均匀量化过程,由前面关于均匀量化器的性能分析,我们可得:

2.2.6最佳量化所谓最佳量化,是指给定量化层数N时,使平均量化误差达到最小的量化。在一般情况下,这个问题并没有显式的理论解,但可以由数值解有效的实现。量化器的结构可分为编码器跟解码器,在寻找最佳量化器时,我们常常将问题简化,如假定其中一部分是固定的,而另一部分则是可变的。下面我们首先从两个方面分析问题,即在给定编码器条件下寻找最佳解码器,以及在给定解码器条件下寻找最佳编码器。然后分析一般情况下的最佳量化问题。最佳的原则是使均方误差最小。一.给定解码器时的最佳编码器

这个问题相当于在给定解码器时,寻找对量化输入信号的最佳分段,所谓解码器给定,即相当于输出电平集合C={y1,y2,...yN}已知。从直观上看,对于输入信号x,量化输出满足以下条件显然最佳:换言之,应该有事实上,此时的量化器的平均量化输出也的确达到最小,因为很显然当输入xi位于yi-1

与yi之间时,应选择与x较近的y作为量化输出。所以对输入信号的分段边界点应位于yi-1与yi的中点,即xi=(yi-1+yi)/2二.给定编码器时的最佳解码器

给定编码器

,即意味着输入信号的分段边界点已知。寻找最佳解码器即求对位于分段Ri内信号的量化输出。

因为平均量化失真为:

令即可得:此式意味着量化输出应为信号在Ri内的重心位置处。三.一般情况下的最佳量化

所谓一般情况下,即仅知道量化层数N及输入信号的概率分布函数fX(x)。量化分段边界点及量化输出均未知。

仍从量化器的平均量化出发,令得到

令可得所以,此时的最佳量化条件是将我们前述分别讨论的结果合在一起。不过,由于xi,yi均未知,所以对于简单的fX(x),由上面两式不易得出显式的xi,yi表达式。

对于有界的服从(a,b)间均匀分布的输入信号,下式等价于

由上式及式,我们可解得对于更加一般的fX(x),我们只能采用数值解法寻找最佳量化分段及量化电平。在最佳量化器的数值设计方法中,最著名的当数Lloyd算法,下面我们简要介绍Lloyd算法。Lloyd算法是一个迭代寻优的过程。其主要思想,首先给出初始的量化电平,然后定出符合最佳量化条件的分段边界点,之后又根据此分段边界点,定出最佳量化条件下的量化电平,如此循环迭代,直至每次迭代的平均量化误差改变量很小为止。Lloyd

算法的主要步骤如下:

(1)初始量化电平,Cm={yi}

,此时m=1。再由式xi=(yi-1+yi)/2计算量化分段边界点,并计算此时量化器的平均量化误差Dm。

(2)由

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论