版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章信源数字编码技术3.1概述3.2模拟信号时域离散化与抽样定理3.3语音数字编码技术3.4数字音频编码标准3.5图像编码技术3.6图像压缩编码标准3.1概述
图3.1为一个完整的数字通信系统框图,在该系统中,有两个编码功能块:信源编码和信道编码。
信源编码:对信源的信号进行变换,将其变换成适合数字传输系统的形式,进而提高传输的有效性。
信道编码:通过信道编码将数字信号变换成与调制方式和传输信道匹配的形式,从而降低传输误码率,提高传输的可靠性。图3.1数字通信系统3.2模拟信号时域离散化与抽样定理
信号时域离散化是用一个周期为T的脉冲信号控制抽样电路对模拟信号进行抽样,如图3.2所示。模拟信号f(t)通过一个由周期为T的抽样脉冲信号s(t)控制的抽样器得到抽样后的信号fs(t)。抽样定理:如果一个带限的模拟信号f(t)的最高频率分量为fm,当抽样频率fs≥2fm时,样值序列fs(t)可以完全代表原模拟信号f(t)。
图3.2模拟信号时域离散化过程(a)被抽样的模拟信号;(b)抽样信号;(c)抽样后的信号3.3语音数字编码技术
语音信源编码主要分三类:波形信源编码、参数信源编码以及混合信源编码。
波形编码:直接对语音信号离散样值编码;
参数编码:对离散语音信号中提取出来的反映语音的特征值编码;
混合编码:波形编码和参数编码的混合应用。3.3.1波形编码技术
波形编码可以在时域进行,也可以在频域进行。
时域编码:脉冲编码、差值脉冲编码以及子带编码。
频域编码:将语音信号的时域样值通过某种变换在另一域编码。1.脉冲编码
脉冲编码是在时域按照某种方法将离散的语音信号样值变换成一个一定位数的二进制码组的过程,由量化和编码两部分构成,如图3.3所示。图3.3脉冲编码过程
量化:幅度取值连续的模拟信号变成幅度取值离散的数字信号,分为标量量化和矢量量化,其中标量量化又分为均匀量化和非均匀量化。
编码:量化后的信号电平值转换为二进制码组,分为线性编码和非线性编码
1)线性编码线性编码是先对样值进行均匀量化,再对量化值进行简单的二进制编码。均匀量化:以等间隔对任意信号值来量化,将信号样值幅度的动态范围(-U~U)等分成N个量化级(间隔),记作Δ(3.3.1)样值幅度落在某一量化级内,就由该级的量化值来代替图3.4均匀量化曲线
量化器输入与输出间的差值称为量化误差,记作用n位二进制码对量化值进行编码,码组长度n与量化级数N之间的关系为线性编码在输入信号未过载时的量化信噪比为
其中:为量化噪声功率,为信号功率,ue为输入信号电压有效值。
(3.3.2)(3.3.3)(3.3.4)
2)非线性编码均匀量化的小信号量化信噪比小,大信号的量化信噪比大,而语音信号中小信号是大概率事件,用非均匀量化来改善小信号的量化信噪比。
(1)非均匀量化。语音信号中常用的非均匀量化方法是压扩量化。图3.5(a)为压扩量化编码的原理框图,图3.5(b)为压扩原理示意图。信号先经过具有压扩特性的放大系统,再进行均匀量化。图3.5非均匀量化原理示意图压扩特性应满足以下对数方程:
图3.6(a)为压扩特性曲线,对曲线作通过原点的切线,可得A压扩律方程
(3.3.6)式中
(3.3.7)(3.3.5)图3.6理想对数压扩特性
令式(3.3.5)中常数,并将分子由修改为ln(1+μ|x|),分母由修改为ln(1+μ),得μ压扩律方程(3.3.8)
(2)μ律、A律的折线实现通常用折线去逼近实现压扩律特性①用折线逼近非均匀量化压扩特性曲线;②各段折线的斜率应随x增大而减小;③相邻两折线段斜率之比保持为常数;④相邻的判定值或量化间隔成简单的整数比关系。条折线逼近律压扩曲线,相邻两折线斜率之比为m,各折线端点坐标为:(3.3.9)
图3.7画出了μ律255/15折线正半轴的折线图,表3.1给出了μ律255/15折线各折线段的参数。图3.7μ律255/15折线压扩律曲线
表3.1μ律255/15折线段端点坐标值和斜率
由上表可知,μ律各折线段端点之比不是m的倍数
NA条折线逼近A律压扩曲线,相邻两折线斜率之比为m,各折线段端点之比为m的倍数各折线段长度之比为A律各折线段端点坐标为:(3.3.12)
图3.8画出了A律87.6/13折线正半轴的折线图,表3.2给出了A律87.6/13折线各折线段的参数。
图3.813折线A压扩律曲线表3.2A(87.6)律曲线和13折线段端点坐标和斜率
国际上主要采用的压扩律:A律13折线和μ律15折线,欧洲各国的PCM-30/32路系统采用A律13折线压扩律,美国、加拿大、日本等国的PCM-24路系统采用μ律15折线压扩律。
(3)非线性编码
非线性编码以A律13折线为例。
码字安排:用8位码A1A2A3A4A5A6A7A8表示一个语音样值:极性码A1表示信号的极性(正信号为“1”,反之为“0”),段落码A2A3A4表示13折线的8大段,段内码A5A6A7A8表示折线段内的16个小段。
表3.3、表3.4分别给出了各段段落长度和段内量化级、段落与电平关系。表3.3各段段落长度和段内量化级
第一、二段长度为1/128,16等分后每小段为1/2048,是所有段中的最小量化单位,称为最小量化级()。
表3.4段落与电平关系
编码方法:常用的非线性PCM编码方法有代码变换法和直接编码法。
●代码变换:先进行12位线性编码,然后将12位线性代码变换为8位非线性代码。表3.5给出了非线性与线性代码电平关系。编码步骤:①将样值编成12位线性码;②将11位线性幅度码变换为7位非线性码。
表3.5非线性与线性代码电平关系表
例1设语音样值为+276Δ,用代码变换法将其编成PCM码。
a)样值极性为正,B0=1;b)将276转换成二进制码
(276)10=(100010100)2
样值的12位线性码为100100010100。
c)由表3.5知,线性代码除第1段外,其幅度代码的首位均为“1”。(3.3.13)(3.3.14)为了求得样值所在的折线段D,先求得二进制幅度码有效位长W,再由
由W=9可知k=11-9=2,(5)10=(101)2,所以样值在第6段,段落码为A2A3A4=101。
d)由表3.5知,线性代码的幅度码的第一个“1”后紧接着的4位代码就是非线性代码中的段内码。所以段内码A5A6A7A8=0001。
+276Δ的PCM码字为11010001,量化电平为256Δ+16Δ=272Δ,编码误差为276Δ-272Δ=4Δ<Δ′=256Δ/16=16Δ,Δ′为第6段内的量化级。●直接编码:直接对信号样值进行非线性编码。直接编码法最常用的实现方法是逐次反馈比较法,图3.9给出了逐次反馈编码器的实现方框图。
编码步骤:①由极性判决电路确定极性码A1;②对整流后的信号样值幅度,用三次中值比较编出段落码A2A3A4
,求出对应的段落起点电平;
③再用四次中值比较,确定段内码A5A6A7A8及相应的电平;
④
在各次比较编码的同时输出编出的码组。图3.9逐次反馈编码器原理方框图
例2对语音信号样值+276Δ,用逐次反馈比较法编出相应的PCM码组。
D1时刻,IC>0,极性码A1=1。
D2时刻,本地解码器输出IS=128Δ(第4、5段的分界电平),IC>IS,A2=1,信号在第5~8段。
D3时刻,本地解码器输出IS=512Δ(第6、7段的分界电平),IC<IS,A3=0,信号在第5~6段。
D4时刻,本地解码器输出IS=256Δ(第5、6段的分界电平),IC>IS,A4=1,信号在第6段。D5时刻,本地解码器输出IS=256Δ+8*16Δ=384Δ,(第8、9小段的分界电平),IC<IS,A5=0;
D6时刻,本地解码器输出IS=256Δ+4*16Δ=320Δ,(第4、5小段的分界电平),
IC<IS,A6=0。
D7时刻,本地解码器输出IS=256Δ+2*16Δ=288Δ,(第2、3小段的分界电平),
IC<IS,A7=0。
D8时刻,本地解码器输出IS=256Δ+16Δ=272Δ,(第1、2小段的分界电平),
IC>IS,A8=1。
+276Δ的编码为“11010001”,量化电平为256Δ+16Δ=272Δ,编码误差276Δ-272Δ=4Δ<Δ′=256Δ/16=16Δ,Δ′为第6段内的量化级。
2.差值脉冲编码差值脉冲编码是对抽样信号当前样值的真值与估值的幅度差值进行量化编码调制。图2.10为差值编码的原理框图。图3.10差值脉冲编码的原理框图
常用的差值编码主要有增量调制(DM或ΔM
)、差值编码调制(DPCM)以及自适应差值脉冲编码调制(ADPCM)
1)增量调制对输入信号样值的增量(增加量或减少量)用一位二进码进行编码传输的方法称作增量调制,简称DM或ΔM。增量大于0时为“1”,增量小于0时为“0”。图3.11为DM构成原理框图及编码过程。
图3.11简单DM原理与编码过程
DM调制原理框图主要由减法电路,判决和码形成以及本地解码电路组成。图中fs(t)为输入信号,本地解码器(可用简单的RC积分电路实现)预测输出信号估值fdˊ(t),相减电路输出e(t)=fs(t)-fdˊ(t),判决和码形成电路判决e(t)极性并编码,e(t)>0时判为“1”,输出+E电平,e(t)<0时判为“0”,输出-E电平。
图32.11(b)~(d)说明了DM的工作过程。输入信号为fs(t),积分器初始状态为零,即,则有:当t=0时,预测值编码为“1”;当t=T时,预测值编码为“0”;当t=2T时,预测值编码为“1”;当t=3T时,预测值编码为“1”;当t=4T时,预测值编码为“1”;当t=5T时,预测值编码为“1”;当t=6T时,预测值
编码为“0”;当t=7T时,预测值编码为“0”;当t=8T时,预测值编码为“1”。
2)差值脉冲编码调制将输入信号样值的差值量化、编码成n位二进码,称为差值脉冲编码调制(DPCM)。DM可看作DPCM的特例。图3.12示出了基本的DPCM系统框图,预测器产生预测信号,差值信号e(t)=fs(t)-fdˊ(t)经过多电平均匀量化器Q[·]量化为多电平信号
eˊ(t)
,eˊ(t)一路送线性PCM编码器编码成DPCM码,另一路与相加后反馈到预测器。图3.12DPCM系统原理框图
3)自适应差值脉冲编码调制自适应差值脉冲编码调制(ADPCM)系统是在DPCM系统基础上,根据差值大小调整量化阶大小(自适应量化),使输入信号与预测信号差值最小(自适应预测)。图3.13为ADPCM系统的原理框图。图3.13ADPCM系统原理框图
(a)编码器;(b)解码器(1)自适应量化量化阶距Δ(t)随输入信号能量变化。常用的自适应量化实现方案有:前馈自适应量化(直接用输入信号方差控制Δ(t)的变化,如图3.13中双虚线所示),反馈自适应量化(通过编码器输出码流估算输入信号方差,进而控制Δ(t),如图3.13中单虚线所示)。(2)自适应预测输入信号预测值随输入信号能量变化。常用的自适应预测实现方案有:前馈自适应预测和反馈自适应预测。
ADPCM是语音波形压缩编码传输广泛采用的一种方式。
3.子带编码将语音信号频带分割成若干个带宽较窄的子带,分别对这些子带信号进行独立编码的方式,称为子带编码(SBC—Sub-BandCoding)。
1)SBC基本原理首先通过一组带通滤波器把输入信号频带分拆成若干个子带信号,每个子带信号经过调制后,被变换成低通信号,然后进行单独的编码,再将各路子带码流用合路器复接起来。图3.15为子带编码原理方框图。图3.15子带编码原理框图
2)子带的划分语音信号通常分成4~6个子带,各子带的带宽应考虑到各频段对主观听觉贡献相等的原则做合理的分配,子带间允许有小的间隙,如图3.16所示。表3.6给出了一个16kb/s的子带编码器的典型参数(输入信号取样率为6400Hz)。图3.16子带划分频域示意表3.616kb/sSBC系统典型参数
4.变换域编码先将信号进行某种函数变换(从一种描述空间变换到另一种描述空间),再对变换后的信号进行编码。
1)数学模型
将一帧语音信号s(n),0≤n≤N-1,描述为一个矢量:
若A为正交变换矩阵,即(3.3.16)(3.3.17)(3.3.18)(3.3.19)
例3设,变换矩阵为输出序列:接收端反变换后恢复序列:2)几种常用变换
(1)离散傅氏变换(DFT)
正变换:
式中:(3.3.20)反变换:(3.3.21)
例4由DFT定义,4×4DFT变换矩阵为设信源信号的协方差矩阵为变换后信号的协方差矩阵:
(2)沃尔什—哈德曼变换(WHT)
变换矩阵:式中,AWH(1)=1。WHT变换公式为
例5设N=4信源信号协方差矩阵同例4,变换后信号的协方差矩阵:
(3)离散余弦变换(DCT)
正变换:(3.3.24)(3.3.25)逆变换(IDCT):
例64阶DCT变换矩阵为
c、d为实数,信源信号协方差矩阵同例4,变换后信号的协方差矩阵:
3)自适应变换编码(ATC)实现原理
ATC系统的实现原理:利用正交变换把时域信号变换到另一域,再对变换域信号进行最佳量化。图3.17为ATC系统原理框图,时域信号经变换后,将表征信号谱的边带信息提取出来,边带信息一方面用来估计信号谱,从而控制量化间隔和编码比特分配;另一方面被编码传送到收端用于重构收端信源信号。图3.17ATC系统原理框图缓存变换量化编码提取边带信息计算量化间隔、比特分配谱估计合路器分路器解码s(n)输入信道输出逆变换缓存s(n)计算量化间隔、比特分配谱估计
3.3.2参数编码技术对语音参数编码来传输语音的方式称为语音参数编码。
1语音产生模型及特征参数
1)语音信号模型根据激励源与声道模型的不同,语音可分为浊音和清音。
(1)浊音及基音浊音,又称有声音。发浊音时声带在气流的作用下准周期地开启和闭合,在声道中激励起准周期的声波,如图3.18所示。
图3.18浊音声波波形图
语音信号具有非平稳性和随机性,只能用短时傅氏变换求它的频谱。图3.19为采用汉明窗函数截短的浊音段及典型频谱。频谱图上小峰点对应基音的谐波频率,“尖峰”形状频谱说明浊音信号的能量集中在各基音谐波频率附近,而且主要集中于低于3000Hz的范围内。
图3.19浊音段窗取波形及典型频谱(a)汉明窗取浊音波形;(b)浊音典型频谱
(2)清音清音又称无声音。气流速度达到某一临界速度时就会引起湍流,此时声带不振动,声道相当于被噪声状随机波激励,产生较小幅度的声波,其波形与噪声很像,这就是清音,如图3.20所示。
图3.20清音波形图图3.21清音典型频谱
(3)共振峰及声道参数声道频率特性(唇口声速u出与声门声速u入之比)与谐振曲线类似,如图3.22所示。频率特性对应的谐振点叫共振峰频率。图3.22声道频率特性
(4)语音信号产生模型语音信号发生过程可以抽象为图3.23所示的物理模型。图3.23语音信号产生模型
2)语音特征参数及提取方法基音周期、共振峰频率、清/浊音判决和语音强度等都属于语音信号的特征参数。基音周期和清/浊音判决可以同时获得,其方法主要有三大类:①时域法,直接用语音信号波形来估计;
②频域法,将语音信号变换到频域来估计;
③混合法,综合语音信号的频域和时域特性来估计。声道参数和语音强度等特征参数通过语音分析器或合成器中的线性预测分析系统获取。
2声码器简介及发展
语音信号的分析合成:发端分析提取表征音源和声道的特征参数,通过适当量化编码方式传输到接收端,收端利用这些参数重新合成发端语音信号。声码器:实现语音信号分析合成的系统。常见的声码器有:相位声码器、通道声码器、共振峰声码器以及线性预测声码器。
1)相位声码器
估计各通道信号的幅度和相位导数,并对它们进行编码。图3.24为相位声码器单通道实现框图。图中,ωk为该通道滤波器的中心频率,Wk(n)是分析窗函数,输入信号s(n)经分析窗后得到信号的实部和虚部,转换成对应的幅度信号和相位导数信号,然后进行量化编码传输。图3.24相位声码器单通道实现框图
(a)发端;(b)收端
2)通道声码器
图3.25为通道声码器实现原理框图。利用了人耳对相位特性的不敏感性,只传送语音信号的幅度,而不考虑相位信息。图3.25通道声码器原理方框图
3)共振峰声码器采用共振峰作为语音特征传输参数的声码器成为共振峰声码器。图3.26为共振峰声码器原理框图。发端提取的语音参数有基音周期(TP)、清/浊音判决(uv/v)、语音强度(G)和共振峰参数。F1~F3为共振峰频率,A1~A3为相应的共振峰强度。
图3.26共振峰声码器原理框图
(a)发端;(b)收端
4)
线性预测声码器
线性预测声码器(LPC声码器)建立在二元语音信号模型(图3.23)基础上。将语音用少量特征参数:清/浊音判决、基音周期、声道参数和语音强度G来表示。图3.27为LPC声码器的原理框图。图3.28为LPC声码器中的合成器框图。图3.27LPC声码器原理框图
(a)发端;(b)收端预加重反预加重自相关线性预测分析量化编码s(n)Guv/vTP至信道解码合成器自信道入合成语音加窗{ai}基音周期提取清/浊音判决(a)s(n)(b)图3.28LPC声码器中的合成器
3.3.3混合编码技术
1LPC声码器的主要缺陷及改进方法
LPC声码器的缺点:①损失了语音自然度。
②降低了方案的可靠性。
③易引起共振峰位置失真。
④带宽估值误差大。
LPC声码器的改进方案:
波形自适应预测编码(APC)在压缩数码率的同时能够获得较高质量的重构语音。图3.29为APC与LPC的方案比较。图(a)为APC原理框图,线性预测分析估计出的M个LPC参数组成的M阶FIR滤波器对语音样值自适应预测得预测误差信号(余数信号),和量化编码后送入信道。收端,解码后的LPC参数和余数信号利用IIR滤波器恢复出语音信号。图3.29APC与LPC方案比较(a)APC方案;(b)LPC方案
2余数激励线性预测编码声码器(RELPC)
语音余数信号低频谱中的一部分(基带余数信号)替代清/浊音判决和基音周期传送到收端作为激励信号,图3.30为RELPC系统原理框图。发端用低通滤波器滤出基带余数信号,将预测参数
和基带余数信号量化编码送入信道。收端,基带余数信号通过插值、高频再生得到全带余数信号,解码后的LPC参数和全带余数信号用IIR滤波器恢复出语音信号。
图3.30RELPC系统原理框图
(a)发端;(b)收端3多脉冲激励线性预测编码声码器(MPC)通过研究语音模型的激励形式可以发现:
无论是合成清音还是浊音,都采用一个数目有限、幅度和位置可以调整的脉冲序列作为激励源,因而称为多脉冲激励LPC声码器。图3.31为MPC算法原理框图,根据合成语音与原始语音之间的均方误差最小准则,递推分析出一组多脉冲参数(位置及幅度),然后与LPC参数量化编码送入信道。图3.31MPC算法原理框图
(a)发端;(b)收端4规则激励长时预测编码(RPE-LTP)
用一组由余数信号获得的间距相等、相位与幅度优化的规则脉冲代替余数信号,使得合成语音波形尽量逼近原始语音信号。图3.32为GSMRPE-LTP编码器原理框图,主要由预处理、LPC分析、短时分析滤波、长时预测和规则激励码编码五大部分构成。
图3.32GSMRPE-LTP编码原理框图
①预处理去除s0(n)中的支流分量;进行高频分量预加重(鉴频器的输出噪声功率谱按频率的平方规律增加)。
②
LPC分析提取LPC参数。先求出信号的自相关系数,然后求出LPC反射系数,反射系数先取对数面积比参数(减小量化误差)后再量化编码。
③
短时分析滤波
对信号s(n)进行LPC短时预测分析,产生余数信号d。
④长时预测
对余数信号进行长时预测,分为长时分析和长时预测两部分。长时分析估计预测系数b和预测最佳延时样点数N,编码后传送到收端;长时预测利用恢复出的长时预测系数N´、b´和短时余数信号d´预测当前子帧的余数信号d"。
⑤
规则激励码编码
先提取规则序列码,然后对所确定的序列进行量化编码。
5矢量和激励线性预测编码(VSELP)
对余数信号进行矢量量化,从激励矢量码本中挑选出一个最佳序列(激励矢量)代替余数信号,使由其合成的语音波形与原始语音波形的加权均方误差最小(只传送激励矢量在码本中的序号和其他边带信息)。图334为EIA/TIAVSELP方案实现原理框图。
图3.34EIA/TIAVSELP方案实现原理框图
(a)编码器原理框图;(b)解码器原理框图
加权滤波器W(z)码本Ⅰ码本ⅡH(z)∑e2长时预测状态选择I、L和H使总加权误差最小LIHbg1加权综合滤波器长时预测状态码本Ⅰ码本Ⅱ基音滤波器综合滤波器A(z)频谱后滤波Hqg1qex(n)总加权误差+输出语音s(n)g2+{ai}+IqLqbg2q+{aiq}(a)(b)p(n)p'(n)_
VSELP编码器中除了提取LPC参数外,主要是确定长时预测状态和短时激励失量。经过短时、长时预测后的语音余数信号s(n)通过加权滤波后得信号p(n),与由矢量和激励信号通过加权综合滤波器恢复的余数信号p´(n)相减得误差信号e(n),再利用加权误差和最小准则来确定长时预测状态和短时激励矢量。
6低时延码激励线性预测编码(LD―CELP)
图3.35为LD―CELP原理框图,输入PCM信码经非线性/线性转换变成均匀量化的PCM信号并以5个样值组成一个信源矢量存入缓冲器;虚线框输出一个与输入语音样值误差最小的合成语音样值;合成语音样值与缓冲器中的输入语音矢量的误差信号经感觉加权滤波,根据最小均方误差准则输出对应的码字编号传送到接收端。图3.35LD―CELP原理框图(a)发端编码器;(b)收端编码器非线性/线性转换缓冲器5维激励码本增益控制50阶综合滤波器10阶感觉加权滤波器均方误差最小准则后向LPC分析增益自适应调节16kbit/s参数码流+-5维激励码本增益控制50阶综合滤波器10阶感觉加权滤波器线性/非线性转换16kbit/s参数码流后向LPC分析增益自适应调节64kbit/sPCM码流64kbit/sPCM码流+(a)(b)
7多带激励线性预测编码(MBE)
基于频域的语音信号产生模型——多带激励模型,提高了合成语音的自然度。图3.36为MBE语音信号产生模型,按基音各谐波频率将语音频谱分成若干个谐波带,再将几个谐波带为一组进行分带,分别对各带进行清/浊音判决。浊音带用以基音周期为周期的脉冲序列谱作为激励信号谱,清音带用白噪声谱作为激励信号谱。图3.37、图3.38分别MBE算法发端语音分析原理框图和收端语音合成框图。图3.36MBE语音信号产生模型生器发生器T
/1AM12M2Sw)P脉冲序列发生器白噪声发生器Σ浊音清音频域分带uvv开关A频带频带频带…A(图3.37MBE模型参数分析提取过程图3.38MBE方案语音合成过程3.4数字音频编码标准
3.4.1话音音频编码标准
1G.711标准
CCITT于1972年规范了模拟话音信号用PCM编码时的特性,主要内容:①模拟信号取样率标称值为每秒8000个样值,容差为±50ppm。②推荐A律和μ律两种编码率,量化值的数目由编码律决定,每个样值编码为8位二进制数码。
③A律(或μ律)的每一个“判决值”和“量化值”应当与一个“均匀的PCM值”相关联。
④串行传输时样值编码码字中首先传送极性比特,最后传送最低有效位比特。
⑤A律(或μ律)各规定了一个字符信号周期序列,周期序列加到PCM复用设备解码器输入端时,任一音频输出端应当出现一个标称电平为0dBm0的1kHz正弦信号。
⑥理论负载容量:A律为+3.14dBm0,μ律为+3.17dBm0。
2G.721标准
CCITT于1988年为实现64kb/sA律或μ律PCM与32kb/sADPCM数字信道之间相互转换而制订的。协议中提出了一种PCMADPCM转换编码算法。
3G.722标准
CCITT于1988年规范了一种音频(50~7000Hz)编码系统的特性,该系统可用于各种质量比较高的语声应用,编码系统使用比特率在64kb/s以内的子带自适应差分脉冲编码调制(SC-ADPCM)。图3.39为64kb/s
音频编/解码器的原理框图。表3.12为G.722基本工作模式。图3.39G.722编/解码器原理框图(a)发端编码器;(b)收端解码器表3.12G.722基本工作模式
4G.728标准
CCITT于1992年制订了G.728标准,使用基于短时延码本激励线性预测编码(LD―CELP)算法,标准对LD―CELP算法进行了概述,并分别介绍了发端编码器和收端解码器的实现原理和功能,而且对各种计算方法和参数进行了详细规定。
5G.729标准
ITU-T于1995年制订了G.729标准,提出一种采用共轭结构代数码激励线性预测(CS―ACELP)方法,以8kb/s速率对语音信号编码。图3.40、图3.41分别为G.729给出的发端编码器、收端解码器的原理框图。图3.40CS―ACELP编码器原理图3.41CS―ACELP译码器原理
3.4.2高保真立体声音频编码标准
目前的音频信号分为三类:电话质量的语音信号、调幅广播质量的音频信号和高保真立体声音频信号。
1MPEG-1音频编码标准(ISO/IEC11172-3)
ISO/IEC制订了MPEG-1音频编码标准,是国际上第一个高保真立体声音频编码标准,是以MUSICAM(MaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing)为基础的三层编码结构,图3.42为MUSICAM编码器的原理框图。
滤波器组对信号进行频率变换,并将信号分成32个子带,每个子带中确定一段信号的最大电平,由此得到比例因子编码参数;根据人耳的掩蔽效应确定掩蔽门限,比特分配模块自适应分配比特;最后将音频压缩数据、比例因子和比特分配信息组合在一起构成模块,形成音频编码比特流。图3.42MUSICAM编码器框图
图3.43为MPEG-1音频编码的比特流帧结构。帧标志占32比特,由同步信息和状态信息组成,同步码由12比特全1码组成;帧校验码占16比特,采用CRC校验,用于检测比特流中的传输差错;音频数据由比特分配信息、比例因子信息和子带音频样点组成,不同层的音频样点不同;辅助数据在音频比特流中提供一个长度可变的通道用于传输辅助数据。图3.43MPEG―1音频编码比特流帧结构
图3.44为MPEG-1音频解码器的基本结构,帧分解进行分解和解码,恢复出各种信息段(若编码时采用了CRC校验,还进行差错检测)。重建模块重建一组变换样点的量化形式;逆变换将这些变换样点变换回均匀的PCM音频样点。图3.44MPEG-1音频解码器基本结构
2MPEG-2音频编码标准(ISO/IEC13818-3)
ISO/IEC于1994年制订了MPEG-2音频编码标准,在MPEG-1基础上扩展了低码率多声道编码,称为MUSICAM环绕声。该方案将MPEG-1的2声道扩展至5.1个,即3个前声道(左L、中C和右R)、2个环绕声道(左LS、右RS)和1个超低音声道LFE(常称为0.1声道),多声道扩展信息加到MPEG-1音频数据帧结构的辅助数据段,图3.45为MPEG-2音频数据帧结构。
图3.45MPEG―2音频数据帧结构
MPEG-1音频编码的第一层,多声道扩展数据被分成三部分,在连续3帧MPEG-1音频数据帧的辅助数据段传送;在第二、三层,多声道扩展数据在1个MPEG-1音频数据帧的辅助数据段传送。完整的MPEG-2数据帧包括:32位帧标志码,可选的16位CRC循环冗余校验码,音频数据和辅助数据。
MPEG-2音频编码能传送多路音频,并能确保比特流与MPEG-1前向和后向兼容。
3MPEG-4音频编码标准(ISO/IEC14496)
ISO/IEC于1998年制订了MPEG-4音频编码标准,给利用窄带ISDN实现交互式多媒体应用提供支持,定义了3种类型的编码器:①低速率音频编码,对8kHz取样的语音2~4kb/s速率的编码。②中速率音频编码,对8kHz或16kHz取样的语音4~16~kb/s速率的编码。③高速率音频编码,16kb/s以上速率的编码。
4AC-3系统
AC-3系统是新一代高保真立体声音频编码系统,为美国的全数字式高清晰度电视(HDTV)提供高质量的伴音。1993年11月,美国高级电视系统委员会(ATSC)正式批准其大联盟高清晰度电视(GA-HDTV)系统采用AC-3音频编码方案。
AC-3系统继承了AC-2系统的许多优点(变换编码、自适应量化和比特分配、人耳心理听觉特性等),并采用了一些新技术(指数编码、混合前/后向自适应比特分配和耦合技术等)。图3.46为AC-3系统的原理框图。
图3.46AC-3系统音频编码原理分析滤波器组将音频信号从时域变换到频域;比特分配模块决定可接受的信噪比;最后频域参数粗糙量化到所需精度,并编码形成音频基本码流。音频基本码流的基本单元是AC-3同步帧,图3.47为AC-3音频编码比特流帧结构。每个AC-3同步帧由一个16比特同步信息(SI)字、码流信息(BSI)、32ms的音频编码流和一个CRC差错控制段(16比特)组成。图3.47AC-3音频编码比特流帧结构
3.5图像编码技术
3.5.1概述
目前,压缩后的图像信息传输主要采用两类方式:模拟传输和数字传输。模拟传输采用某种调制方式将模拟图像信号调制到相应频带传输,抗干扰能力弱,传输中易造成波形失真;数字传输抗干扰能力强,容易实现加密,与B-ISDN传输匹配,适合于未来的多媒体通信。
3.5.2图像压缩编码(预测、变换、熵编码)
1预测编码利用差分脉冲编码调制去除图像数据间的空域冗余度和时间冗余度,可以在一帧图像内进行帧内预测编码,也可在多帧图像间进行帧间预测编码。
空间冗余:在静态图像中有一块表面颜色均匀的区域,区域中所有点光强、色彩及色饱和度都相同,有很大的空间冗余。
时间冗余:动画等序列图片中物体有位移时,后一帧数据与前一帧数据有许多共同地方,只有部分相邻帧改变的画面,这种冗余称为时间冗余。
①
帧内预测编码图3.48为DPCM帧内预测编码原理框图,发端线性预测器预测当前样值的估值
,量化编码对误差信号进行量化编码传输;收端经过DPCM解码后利用一个与发端相同的预测器即可恢复发端原始信号x(n)的恢复近似值y(n)。
图3.48DPCM原理框图(a)编/解码器;(b)一维预测与二维预测
②
帧间预测编码
利用视频信号相邻帧间的相关性进行帧间编码,可获得比帧内预测编码高得多的压缩比。
1)帧间统计特性视频信号相邻帧之间的时间间隔很小,相邻帧间图像细节的变化很少
2)帧重复静止或活动很慢的视频信号,可以少传一些帧,例如,隔帧传输。未传输的帧利用接收端的帧存储器中保存的前一帧数据作为该帧数据。
3)阈值法对帧间亮度差值超过某一阈值的像素编码传送。
4)帧内插对于活动缓慢的图像,可使用前后两帧图像进行内插,得到实际帧图像的预测图像,然后对实际帧与预测帧的差值信号进行编码。
5)运动补偿预测编码知道了运动物体的运动规律,就可从前一帧图像推算出它在当前帧的位置,编码器将物体的运动信息告知解码器,解码器就可根据此信息和前一帧图像来更新当前图像。
2变换编码降低信源空间冗余度,常采用某种正交变换,将图像取样值变换到变换域,去除视频图像信号相关性。正交变换数据压缩原理:首先,正交变换产生的变换域系数之间的相关性很小,可分别独立进行处理;另外,正交变换后能量大多集中在少量变换域系数,通过量化删去对图像信号贡献小的系数,用保留下来的系数恢复原始图像。下面介绍数据压缩中广泛采用的离散余弦变换编码。DCT编码的主要步骤:(1)DCT变换(3.5.3)(3.5.4)
(2)系数量化系数量化是DCT编码的关键,常用的方法有区域编码、自适应比特分配、门限控制和综合法。区域编码:将变换系数块根据能量分布划分成若干区域,对每个区域分别进行量化编码。自适应比特分配:根据变换系数的能量大小自适应地分配变换所需的比特数。门限控制:小于门限的系数置0,增加无需编码的系数个数。
(3)系数排序
通常按“Z”字形排列量化后的系数。
(4)熵编码
通常的熵编码方法:游程长度编码、霍夫曼编码、香农编码和算术编码。视频编码中常用游程长度编码和霍夫曼编码。
3熵编码去除信源的统计冗余。
1)游程长度编码最早用于二值图像的压缩编码。二值图像的每一扫描行总是由若干段连着的白像素和黑像素组成,即所谓的白长和黑长,对不同的白长和黑长,按其出现的概率分配以不同的码字。
2)Shannon-Fano编码(次最佳不等长编码)
3)Huffman编码(最佳不等长编码)1952年霍夫曼(Huffman)提出的最佳不等长编码方法,是图像压缩编码中最重要的编码方法之一。霍夫曼编码步骤:
①将输入符号按出现概率从大到小顺序排列(概率相同的符号可任意排列);②将最小的两个概率相加,形成一个新的概率集合,再按第一步的方法重新排列,如此反复直到只有两个概率为此;③为符号分配码字。码字分配从最后一步开始反向进行,对最后两个概率,一个赋“1”码,一个赋“0”码。
图3.49霍夫曼编码结构1S2S3码长概率符号10.5S20.2530.12530.125S400.5100.25011图3.49为霍夫曼编码步骤,表3.14为霍夫曼编码示例,表3.15等长编码与霍夫曼编码的比较。
表3.14霍夫曼编码示例表3.15等长编码与霍夫曼编码的比较
3.6图像压缩编码标准3.6.1二值图像压缩标准
二值图像指只有黑、白两个亮度值的图像。
1G3、G4标准
1)G3传真装置的特征
●主要用于公用交换电话网,93年后可使用ISDN;
●
98年规定了错误校正方式(ECM)作为选用功能;
●采用编码方式(MH方式)来削减传真信号的冗余信息;
●不仅传输图像,而且规定可选用功能传输二进制文件、文档文件及字符等。
2)G4传真装置的特征
●基本是数据网用的传真装置;
●高速传输编码方式的MMR方式和错误校正功能以标准功能装在装置中;
●
以OSI协议为准;
●三个级别:1类是能够收/发编码传真文件的终端;2类是在1类的基础上,还具备传输用户电报编码文件和混合方式文件的能力;3类是在2类功能上,增加传输电传文件和混合方式文件的能力。
3)编码方式
MH方式:MH编码是G3传真的标准编码方式,对行内持续白(或黑)像素依次提取长度进行霍夫曼编码,图3.50为MH编码示例。
MR方式:MR编码将已编码的前一扫描线作为参考行,然后对其后的一条扫描线进行编码,将编码行变化像素相对参考行变化像素的位置偏差进行编码,图3.51为MR编码示例。
MMR方式:MMR方式是G4传真的标准编码方式,对全部行都参照前面行进行编码。
图3.50MH编码示例图3.51MR编码示例
2JBIG标准
G3/G4标准不适应于中间色调图像,当用G3/G4压缩二值中间色调图像时,不仅得不到压缩,反而可能扩展数据量,制订JBIG标准的主要原因是改进的压缩性能。JBIG标准可以支持很高的分辨率,使用了与JPEG标准相同的自适应无损编码算法实现对二值图像的无失真压缩,其压缩效率比G4标准提高30%。
3.6.2静止图像压缩标准
1JPEG标准
JPEG是JointPhotographicExpertsGroup(联合图片专家组)的缩写。
JPEG提供了四种算法模式:
●
基于DCT的顺序模式(基本模式):适用于有损图像压缩的大多数场合,它不仅可用于静止图像,而且可用于活动图像;
●
基于DCT的递增模式:适用于对传输时间要求不严,用户喜欢图像由粗糙到清晰的场合;
●
无损编码模式:适用于要求无失真压缩的场合;
●
分层编码模式:可按多种分辨率对图像进行编码,适用于要求不同分辨率或图像质量的场合。
JPEG编码器和解码器必须支持基本模式,基本模式基于DCT和可变长编码(VLC)压缩技术,提供高达100:1的压缩比,但是重建图像不能精确再现原始图像,表3.16为JPEG基本模式压缩举例。表3.16JPEG基本模式压缩举例2JPEG的发展趋势JPEG压缩算法主要从以下方面进一步发展:(1)自适应量化;(2)无损编码的改进;(3)其他提高JPEG性能的可能途径;(4)后向兼容。
3.6.3视频压缩标准按质量分,视频可分为三类:
●
低质量视频:画面较小,通常为QCIF(CIF格式图像像素的1/4)或CIF格式,帧速率低,可为黑白视频也可为彩色视频;
●
中等质量视频:中等大小的画面,通常为CIF或CCIR601视频格式;
●
高质量视频:画面较大,通常为CCIR601视频格式至高清晰度电视视频格式。
1H.261标准
H.261标准是CCITT制订的国际上第一个视频压缩标准,主要用于电视电话和会议电视,视频算法的核心是运动估值预测和DCT编码,图3.52为H.261视频编/解码器原理框图。信源编码器先对视频信号进行DCT变换,然后将变换后的系数量化;图象复用编码器把每帧图像数据编排成4个层次的数据结构,同时对交流DCT系数进行可变长度编码(VLC),对直流DCT系数进行固定长度编码(FLC);传输缓冲器将速变码流变换为固定码率码流。图3.52H.261视频编/解码器
2MPEG-1视频标准
1991年通过的关于码率为1.5Mb/s,用于数字存储媒体的运动图像和音频的编码标准,MPEG-1要达到以下目标:
●图像质量方面:高于电视电话的质量,与VHS录像机的图像质量和光盘CD-ROM的放像质量相当;
●
储存媒体方面:可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论