数据压缩第2章 信源的数字化-sxq1_第1页
数据压缩第2章 信源的数字化-sxq1_第2页
数据压缩第2章 信源的数字化-sxq1_第3页
数据压缩第2章 信源的数字化-sxq1_第4页
数据压缩第2章 信源的数字化-sxq1_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章信源的数字化

与压缩系统评价信源处理数字化(A/D变换)数据压缩处理模拟信号在幅度、时间和空间上离散化:图像等多维信源在空间上需要离散化(隐含在时间离散化);彩色图像的三基色也需要离散化。尽量降低数字信号的码率;减少所需的信号空间。信源处理的步骤数字压缩系统的评价保持一定的信号质量、能够实现的系统复杂性以及允许的通信时延等。1938年Reeves提出脉冲编码调制(PCM,PulseCodeModulation),包括:

取样(Sampling):将连续信号在时间、空间离散化;

量化(Quantization):将取样信号的幅度离散化;

编码(Coding):将量化后的脉冲取样值按幅度大小

变换成相应的二进制码。信源数字化的常用方法建立一个数学模型,能够更紧凑或更有效地“重

新表达”规律性不那么明显的原始数据;

把模型参数量化为有限的精度(二次量化,与

原始数据的量化不同);

对模型参数的量化表示或消息流进行码字分配,

以得到尽可能紧凑的压缩码—“熵编码(Entropy

Coding)”;

数据压缩的一般步骤

1取样2标量量化

3矢量量化4信号压缩系统的性能评价

本章内容设为时间连续的模拟信号,其最高角频率为;理想的周期取样就是间隔为的单位冲激函数序列,对连续信号的取样可以表达为:(2.1-2)2.1

取样gs(t)g(t)δT(t)理想抽样:

是原信号的频谱的周期延拓(周期为)

把调制在冲激序列的以为间隔的谱线上,但幅度为原来。理想取样信号的频谱:其频谱为:(2.1-5)其中为取样角频率,以为周期,分布宽度为。

互相不会重叠,采用一个截止角频率为

理想低通滤波器可以不失真地从取样信号中完全恢复原信号;

0幅度…………取样频率和信号频谱宽度关系的分布宽度大于两频谱的间隔,相互有重叠而产生叠加,采用低通滤波器取出频谱,除了原有频谱没有完全取出外,还混入了来自相邻周期的谱分量(混叠干扰,aliasing),无法从取样信号中不失真地恢复原信号。0幅度…………

各频谱分量恰好邻接,此时能否利用一个理想的低通滤波器不失真地恢复原信号,是有条件的。0幅度…………【定理2.1】一维取样:如果模拟信号的频率限制在,则只要取样频率满足,就可通过截止频率为的低通滤波器从取样信号中准确地恢复出原信号。【定理2.2】二维取样:如果二维模拟信号的空间频率和分别限制在和,那么只要取样周期和满足和,就可以准确地由取样信号恢复出原信号。奈奎斯特(Nyquist)频率:

取样定理的表述若取样时满足奈奎斯特准则即,取样信号就可以通过一个具有以下幅频特性的理想低通滤波器(LPF,LowPassFilter),无混叠失真地恢复为模拟信号。LPF的冲激响应为,故LPF的输出为:

(2.2-10)内插恢复【定理2.4】更一般表述,近似带限为赫而持续时宽为秒的信号可用个样值完全描述,称该信号具有个自由度。插值公式表明原始信号可由无穷多加权sinc函数移位后的和来重建,即:可以通过内插函数把离散信号恢复为连续信号。

【定理2.3】随机取样,取样定理推广到随机信号,具有实际意义,因为语音、图像等信号常常被看作随机过程、随机场。

取样定理表明,用一定速率的离散序列可以代替一个连续的频带有限信号而不丢失任何信息。传输连续信号可以归结为传输有限速率的样值问题。但实际取样过程仍可能产生一些噪声和失真:混叠噪声、孔径失真、插入噪声、定时抖动失真等。

1取样2标量量化

3矢量量化4信号压缩系统的性能评价

本章内容2.2

标量量化取样值幅度取样值幅度的近似表示为有限实数集合若该实数集合含有J个数,为J级量化,用二进制表示,需用位二进制符号表示。量化

量化噪声与输入信号有关系,而噪声与输

入信号无关;量化误差(有限个离散值近似表示无限多个连续值而产生的误差)理解:量化误差与噪声的区别量化器特性实际是高阶非线性的特例:量

化误差可比拟为高阶非线性失真的产物。

(2.2-1)量化失真(量化误差,量化噪声)的度量:信噪比式中,为负载因子,其中为过载点电平,为均方根信号电平,而选定后即为一常数。每增加一位编码,便可得到6dB的信噪比改善。从而

给定量化噪声或失真要求,希望每个取样的平

均位数最小。

无记忆量化器量化器的分类

带记忆量化器量化的设计方法

给定量化电平数J,希望量化失真最小;零记忆量化或标量量化(SQ:ScaleQuantization)每次只量化一个模拟取样值

无记忆量化器均匀量化量化器输入信号幅度,量化总层数为J,判决电平:

量化器输出信号幅度,量化误差为。(2.2-3)均匀量化公式:均匀量化的工作特性:1)正常量化区2)限幅区过载特性是突然截止的,失真结果远比模拟系统严重,要求量化器对输入信号幅度有一定的富裕量。正常的量化输出输出恒定值输出恒定值3)空载区当时,有两种情况:此时输入信号变化幅度小,但量化器输出却在相邻两个量化级之间往返跳变,放大了原来的输入信号,称为颗粒噪声。稍高于输出稍低于输出

a)

信号电平与判决电平一致:b)信号电平总是位于判决电平之上(或之下):对于固定判决电平和量化器输出,不同的输入信号,其量化误差是不同。即使输入信号有接近最小量化间隔的变化,量化器也总是输出恒定值: (或)量化器输入信号幅度,量化总层数为J,判决电平:最佳量化按均方误差最小来定义最佳量化:(2.2-4)

代表为一条长为的非均匀棒的质量中心,也可以说,最佳位置是概率密度在与段的概率中心。(2.2-8)量化判决电平位于量化输出电平和的中点(即为其算术平均值)。求解最佳量化的和:(2.2-7)Max-Lloyd方法(M-L算法)求解和:采用反复迭代的方法任选,直至计算出由计算计算检验是否为和段的概率中心?Y结束N存在唯一最佳量化器M-L算法必要条件:(2.2-9)充分条件:一些常见的概率分布:Gauss、Laplace、Gamma等的解满足上述充分和必要条件,故对于上述分布最佳量化器存在且唯一。M-L算法看作是利用概率密度函数的形状特性而实现最佳量化的。(2.2-10)最小的量化误差为均匀量化是为均匀分布时的最佳量化。压扩量化信号“压缩”:

非线性函数变换y=F(x)均匀量化信号“扩展”:

该非线性变换的反函数x=F-1(y)F(x)瞬时压缩均匀量化编码解码F-1(x)瞬时扩张xzyy发端收端采用瞬时压缩和瞬时扩张的非均匀量化器对数函数特性人耳对音量人眼对光强响应也呈现出对数特性总体量化噪声小,提高了量化信噪比非线性函数的选择低电平处间隔密,出现概率大,量化噪声小高电平处间隔大,出现概率小,量化噪声大xz=F(x)VV非线性压缩示意图两种常用的对数函数(2.2-11)律曲线:英、美、日、加拿大等国采用xF(x)μ

=255μ

=5μ

=0110律对数压缩特性

A律曲线:CCITT的建议,中国、欧洲采用xF(x)A=87.56A=5A=1110

A律对数压缩特性(2.2-12)A律量化器的特性可以用直线段很好地近似,以便简化直接压扩或数字压扩,并易于与线性编码格式相互转换。

A

律曲线具有与律特性相同的基本性能具有实现方面的优点在大信号区信噪比高于律量化器;在小信号区不如律量化器;A律压缩特性的13折线法:横轴x:压缩器的归一化输入信号,其取值范围为-1~1。正负部分各按对分法分成为8段。纵轴y:压缩器的归一化输出信号,其取值范围为-1~1。正负部分各按等分法均匀分成为8段。-1

-1-1/2-1/4-1/81/81/41/21x2/84/86/81-2/8-4/8-6/816段折线段的斜率按Ki=yi/xi计算!A率13折线A=87.6与13折线压缩特性注意:同一折线段内是均匀的。若取Nb=8,则L=256,即16个小区域内,还可进一步均匀的分成为16个间隔。y轴上均匀的形成正负各128个间隔,x轴上各段的量化间隔则大不相同:设最小均匀量化等级记作△,△=1/128×1/16=1/2048,如果用均匀量化,则需211(

11位)。13折线的量化(1)段0~16△,其对应量化单位为△(3)段32~64△,其对应量化单位为(64-32)/16=2△(4)段64~128△,其对应量化单位为(128-64)/16=4△(5)段128~256△,其对应量化单位为(256-128)/16=8△(6)段256~512△,其对应量化单位为(512-256)/16=16△(7)段512~1024△,其对应量化单位为(1024-512)/16=32△(8)段1024~2048△,其对应量化单位为(2048-1024)/16=64△(2)段16~32△,其对应量化单位为(32-16)/16=△例:某信号动态范围-2.5-2.5v,一采样值Vs=0.775v,若用13折线法、自然二进制编码来表示,试确定Vs的编码码组,并求出对应的均匀量化码。解:若用△来表示,△=5/4096=1.22mv,VS=0.775/1.22=635△(1)i)极性码:由于是正电平,所以b7=1

ii)段落码:VS=635>128,处于后4段,b6=1VS=635>512,处于后2段,b5=1VS=635<1024,处于第7段,b4=0iii)段内码:第七段起始电平:512△,量化间隔512/16=32。于是,可得对应的码组:11100011量化电平:+608+16=624量化电平量化误差:635-624=11量化电平,11×1.22mV=13.42mV对应11位均匀量化码:01001110000=(624)2段内16段的中心点:Iw=512+32×8=768,VS=635<Iw,故b3=0段内前8段的中心点:Iw=512+32×4=640,VS<Iw。故b2=0段内前4段的中心点:Iw=512+32×2=576,VS>Iw。故b1=1

段内3\4段的中心点:Iw=512+32×3=608,VS>Iw。故b0=11取样2标量量化

3矢量量化

4信号压缩系统的性能评价

本章内容带记忆量化实际信号各样值之间存在着相关性,如能合理利用这些相关性,就能进一步压缩数据率

DPCM

△M

VQ(VectorQuantization,矢量量化)带记忆的量化器2.3矢量量化

在DPCM中,只将前1个抽样值当作预测值,再取当前抽样值和预测值之差进行编码并传输。这相当于在下式

中,p=1,a1=1,故mk=mk-1*。

这时,预测器就简化成为一个延迟电路,其延迟时间为1个抽样间隔时间Ts。差分脉冲编码调制(DPCM)(b)译码器译码延迟Ts+延迟量化编码抽样Ts(a)编码器-

对于PCM,在发射端是用二进制或多进制码组来表示每个量化采样值,会引入量化误差。为了减小量化误差,应采用较长的码组,会增加设备的复杂度和信道带宽。

因此引入了增量调制技术。M可以看成是DPCM的一种特例。ΔM是将模拟信号变换成仅有一位二进制码组成的数字信号序列,来表示相邻信号的相对大小,通过相邻抽样值的相对变化反应模拟信号的变化规律。ΔM只用一位编码,不是表示采样值的大小,而是表示采样时刻波形的变化趋势。增量调制矢量量化信源序列:个取样值每K个为一组分为N个K维随机矢量构成信源空间

在每一个子空间中找一个代表矢量,记恢复矢量集为:

:输出空间(或码书、码本)

:为码矢(CodeVector)或码字(CodeWord)J:码书长度(2.3.2)(2.3.3)

将划分成个互不相交的子空间,即满足:编码过程输入一个任意矢量,矢量量化器首先判断它属于哪个子空间;然后输出该子空间的代表矢量:VQ过程就是用代替

(2.3.4)

式中Q为量化函数

VQ编码、解码的过程从K

维欧氏空间中的矢量X

到空间中有限子集Y

的映射矢量量化

接收端解码:

发射端编码:

图2.2

矢量量化的基本结构VQ的压缩能力为每个矢量所需要的编码比特数,

K为每个矢量所包含的信号取样数。当K=1时,VQ退化为标量量化VQ的特点:压缩能力很强;

一定产生失真,但失真量容易控制(码书中的码字越多,失真就越小,码书设计是关键技术);

计算量大,编码矢量搜索运算量大(难点,关键技术),接收端计算特别简单(只需查表),

适用于数据库应用中要求检索快的场合;

VQ是定长码,比变长码容易处理,也有利减小传输误码的影响。1取样2标量量化

3矢量量化

4信号压缩系统的性能评价

本章内容2.4信号压缩系统的性能评价信号压缩后,常会产生失真,但只要最终用户的人察觉不出或者能够容忍这些失真允许对数字信号进一步压缩以换取更高的编码效率1、信号质量对信号质量的评价,其实就是对于波形逼真度(或失真度)的测量

通过客观度量,如信噪比来表示。

用主观度量,如平均评分来表示。客观度量一维信号(如语音信号)连续波形

波形差值

均方误差(MSE)

离散波形输入/输出样值之差均方误差(MSE)

通常

对于理想的重建滤波器,可以证明离散时间误差与连续时间误差在数值上相等,因此对编码波形质量的客观评价与优化设计更多地在离散时间域进行。信噪比定义:

抽样信号方差对重建误差方差的比值

(2.4.5)

二维信号(如图像信号)峰值信噪比对于8位灰度图像

(2.4.6b)(2.4.6a)

用MSE来度量波形用SNR来度量数字波形的主观感觉并不适宜数值大的重建误差比数值小者对波形失真的影响大得多。意味着归一化均方误差(2.4.7)

对NMSE的倒数取对数,得到等效的信噪比(2.4.8)(表达黑白图像的逼真度)峰值均方误差

(2.4.9)对PMSE的倒数取对数,得到等效的峰值信噪比

(2.4.10)可以按照人类视觉系统(HVS,HumanVisualSystem)取其他更适宜的视觉心理生理函数,以便与人眼对图像主观质量的感觉更贴近。运算符主观度量感觉上的主观测试对与编码器的设计和评价不可缺少,设计这类实验的要求:

保证激励源的次序最随机,以消除排列先

后对评价的影响;保证足够的样本数,以平滑判决结果中的

噪声或起伏;

实验人数必须足够多,实验人员的类型也

必须有广泛的代表性。质量的度量:

二元判决主观SNR

平均判分(MOS:meanopinionscore)

等偏爱度曲线

多维计分(MDS)

其中MOS最常用

图像质量的主观评价要把人对图像质量的主观感觉与客观参数和性能联系起来;类型:

质量测试,评定图像的质量等级;

损伤测试,评审电视图像的损伤程度;

比较测试,对一幅给定图像和另一幅图像作

出质量比较。任务:

语音质量的主观评价类型:

5级质量MOS判分(MOS分数的标准差,来评价结果的可信度)可懂度

可接受度2、比特率单从数据压缩的角度看:而从通信的角度看:比特率常常体现一个实际编码系统或理论压缩算法技术水平的最主要指标;最终的比特率还应与要求的业务质量(QoS

:QualityofService

)和现行的数字传输体制相适应。3、复杂度信号压缩系统的复杂度指为实现编解码算法所需的硬件设备量:其他一些与复杂度相关的指标,如CODEC的算法的运算量需要的存储量体积重量价格功耗数据压缩算法的选择:对称非对称针对具体应用的要求来选择恰当的信号压缩算法,有可能使的系统的总复杂度最低。业务分类:

会话型、会议型、消息型:对称型算法;

分配型、检索型:解压尽量简单,压缩算法可

有较大运算量;采集型:压缩简单,解压可采取复杂的算法保

证总体性能。4、通信延时实际处理延时在1ms到500ms之间,一般要求控制在200ms以内。随着压缩算法复杂度增加,处理的延时常常也会相应增加,引起较大的通信延时。时延大的算法能不能用于实时通信,取决于使用环境。编码与数字通信系统的性能空间图2.4

编码器性能维数信源编码和信道编码的信号质量和时延决定了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论