河北科技大学多媒体通信技术基础第三章_第1页
河北科技大学多媒体通信技术基础第三章_第2页
河北科技大学多媒体通信技术基础第三章_第3页
河北科技大学多媒体通信技术基础第三章_第4页
河北科技大学多媒体通信技术基础第三章_第5页
已阅读5页,还剩122页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章数据压缩的基本技术数据压缩处理一般由两个过程组成:编码过程:对原始数据进行编码压缩,以便存储和传输;解码过程:对压缩的数据进行解压,恢复成可用的数据。根据解压后数据的保真度,数据压缩技术可分为无损压缩编码:解码后的数据与原始数据完全相同,无任何偏差。这种编码通常基于信息熵原理,常用的编码有哈夫曼编码、算术编码、行程编码等。压缩比比较低,一般在2:1-5:1。主要用于要求数据无损压缩存储和传输的场合,如传真机有损压缩编码:解码后的数据与原始数据相比有一定的偏差,但仍可保持一定的视听质量和效果。它主要是在保持一定保真度下对数据进行压缩,其压缩比可达100:1。压缩比越高,其解压缩后的视、音频质量就越低。

分类:

a第一代图像压缩编码方法基于香农理论,80年代初趋于成熟,主要降低数据之间的相关性,去除冗余。

b第二代图像压缩编码方法基于人类视觉特性的压缩方法,其核心思想是力图发现人眼是根据哪些关键特征来识别图像、或图像序列的,然后根据这些特征来构造图像模型。例如,根据人眼对物体的轮廓比对物体内部细节更为敏感的特点,可以利用物体(而不是像素)的集合来表示图像。

3.2数据压缩的理论依据

3.2数据压缩的理论依据数据压缩的理论基础为Shannon信息论。它一方面给出了数据压缩的理论极限,另一方面又指明了数据压缩的技术途径。Shannon理论认为:信源中所含有的平均信息量(熵)是进行无失真压缩编码的理论极限。无记忆信源:如果设计的编码方法的码字平均长度最接近熵,则说明该编码方法是最佳的。香农三大定理是信息论的基础理论。香农三大定理是存在性定理,虽然并没有提供具体的编码实现方法,但为通信信息的研究指明了方向。第一定理:可变长无失真信源编码定理采用无失真最佳信源编码可使得用于每个信源符号的编码位数尽可能的少,但它的极限是原始信号源的熵;超过了这一极限就不可能实现无失真的译码。第二定理:有噪信道编码定理若在信息传输率R不大于信道容量C时,则存在一种编码,当码长n足够大时,它可以使信道输出端的错误概率任意小,而信息传输率无限接近C;如果R>C,则不能找到一种编码,使输出端错误概率任意小。第三定理:

第三定理:保真度准则下的信源编码定理,或称有损信源编码定理只要码长足够长,总可以找到一种信源编码,使编码后的信息传输率R(单位:bit/信源符号)略大于率失真函数R(D),而码的平均失真度不大于给定的允许失真度,即D‘<=D设R(D)为一离散无记忆信源的信息率失真函数,并且有有限的失真度D,以及任意长的码长N,ε>0,一定存在一种码字个数为M≥2N[R(D)+ε]的信源编码,使编码后的平均失真度D‘<=D

3.2.3信源的相关性与序列熵的关系

3.3信息率-失真理论率失真函数R(D):p32,(3-21)在一定允许失真D条件下的最低平均互信息量。从信源编码的角度看:率失真函数是在允许失真不大于D时,信源编码给出的平均互信息的下界。即对信源信息率压缩的极限。从接收端看,就是在满足失真不大于D的情况下,能够再现信源信息所必须获得的最低平均信息量。限失真信源编码定理1设离散无记忆信源U的率失真函数为R(D),给定允许失真D,则当信息率R>R(D),只要信源序列长度L足够长,一定存在一种编码方法其译码平均失真小于或等于D+ε逆定理:当R<R(D)时,无论采用什么编译码方法,平均失真总是大于D。实际中解决的方法通常采用相反的思路,及给定信息率R,通过改变编码方法寻找尽可能小的平均失真。例如:在最佳量化器的设计中,其中量化的分层数N给定,(相当于信息熵给定)根据一定的误差准则,如均方误差最小,可以设计出相应的最佳量化器。3.5预测编码目的:去除相邻像素之间的冗余度,减小图像信息在时间上和空间上的相关性来达到数据压缩的目的。“相邻”,可以指像素与它在同一帧图像内上、下、左、右的像素之间的空间相邻关系;也可以指该像素与相邻的前帧、后帧图像中对应于同一空间位置上的像素(同位像素)之间时间上的相邻关系。具体如下:对于一个图像信源,首先根据某一模型,并利用以往的样值对新样值进行预测,得出预测值,然后将预测值与实际样值相减,得到误差值,最后对误差值进行量化、编码、传输

3.5.1差分脉冲编码调制DPCM的简化原理方框图+-编码压缩图像输入图像enxn

xn量化器ên预测器++解码预测器解压缩图像压缩图像yn

xnên通过预测和差分,将x(n)转化为差分信息e(n),降低了信息冗余图中预测器的输出:

N为预测器所采用的样值数,也称为预测器的阶数。

等于各输入样值的线性组合,本预测器称为线性预测器。在解码器中有一个相同的预测器,收到的预测误差信号经解量化器DQ以后,与预测其的输出相加,从而恢复出原信号。由于预测误差的量化,解码输出的y(n)是x(n)的近似值。修正后的预测编码器在前面的预测器中,编码端利用原始信号为参考进行预测,而在解码端确是利用量化后的信号进行预测,这种不匹配的情况导致重建信号有y(n)与输入信号x(n)之间存在较大误差。修正:编码器反馈环模拟了解码端结构。增加一个反馈环,将量化误差和过去预测函数相加,作为新的预测函数符号编码压缩图像+-en输入图像xnQ->DQên预测器

xn++•xn

^xn=ên

+xn几个概念:一维预测:被预测的样值与用作预测的样值在同一行内二维预测:用作预测的样值位于相邻的不同行上

一维预测利用像素之间在水平方向上的相关性。在水平方向亮度变化缓慢的图像,有较好的预测效果。如果水平方向上亮度有突变,那么一阶的一维预测经常会给出错误的预测数值。在这种情况下,采用下面的二维预测,会有较好的预测值。

图3-14对应于图像黑白边界处的几个像素N阶预测器的设计问题在最小均方误差下的最佳预测器。下式表示预测误差信号e(n)平方值的统计平均。若上式最小时,表示在最小均方误差意义下,预测最准确,此时色预测器称为在最小均方误差意义下的最佳预测器。最佳预测器的系数ai可以通过求极小值的方法求得。

如果对所需要压缩的某类图像的自相关函数已经作过测量的话,则可通过求解上式所表示的方程组,获得最佳预测器的系数值。另一个事实

预测误差的平均功率比原信号的功率R(0)要小。在相同的均方量化误差下,e(n)比x(n)要求较少的量化级数,因此,传送e(n)比传送x(n)的数据率要低。3.5.2序列图像中运动矢量的估值1.运动矢量估值的必要性序列图像在时间上的冗余情况可分如下几种:

(1)对于静止不动的场景,当前帧和前一帧的图像内容是完全相同的;

(2)对于运动的物体,只要知道其运动规律,就可以从前一帧图像推算出它在当前帧中的位置;(3)摄像镜头对着场景横向移动(称为滑镜头)、焦距变化等操作会引起整个图像的平移、放大或缩小。对于这种情况,只要摄像机的运动规律和镜头改变的参数已知,图像随时间所产生的变化也是可以推算出来的。由电视图像的相关性特点,可知:发送端不一定必须把每帧图像上所有的像素都传给收端,而只要将物体(或摄像机)的运动信息告知接收端,收端就可根据运动信息和前一帧图像的内容来更新当前帧图像,这比全部传送每帧图像的具体细节所需的数据量要小得多。首先要做的是从图像序列中提取运动物体的信息--运动估值。为了简单起见,做出如下假设:(1)物体是刚体.只在与摄像机镜头的光轴垂直的平面内移动。即:物体的形变、旋转、镜头焦距的变更等因素不考虑在内;(2)无论物体移动到任何位置,照明条件都不变,即:同一物体在所有序列图像中亮度没有变化;(3)被物体遮挡的背景和由于物体移开而新暴露出来的背景部分都未不作特殊考虑。t时刻运动物体的象素值bt可用它在时间以前的值bt-τ表示:含义:t时刻的图像是t-τ时刻的图像经适当位移D后的结果。运动估值的分类:

a块匹配方法b像素递归方法2.块匹配方法方法描述:a.将图像划分为许多互不重叠的子块,并认为子块内所有像素的位移量都相同。(每个子块视为一个“运动物体”)b.寻找匹配块假设在图像序列中,t时刻对应于第k帧图像,t-τ时刻对应于k-1帧图像。对于k帧中的一个子块,在k-1帧中寻找与其最相似的子块,称为匹配块。K-1帧称为K帧的参考帧c.寻找位移矢量认为匹配块在k-1帧中的位置就是k帧块位移前的位置,根据(3-44)式则可以得到该子块的位移矢量D。块匹配方法中最重要的问题:(1)判别两个子块匹配的准则;(2)寻找匹配块搜索的方法。准则a:归一化的二维互相关函数(NCCF)当NCCF为最大值时2个子块匹配,对应的i,j值即构成位移矢量D。准则b求2帧子块亮度的均方差值MSE:当MSE最小时.表示2个子块匹配。c.MAD准则求帧间子块亮度差的绝对值的均值MAD:当MAD最小时.表示2个子块匹配。d.计算块亮度差的绝对值和SAD:SAD(I,j)=MN*MAD(i,j)当SAD最小时.表示2个子块匹配。此准则较常使用。研究结果表明,匹配判别准则的不同对匹配精度,也即是对位移适量估值的精度影响不大。(2)搜索方法:为了节省计算量,在k-1帧中的匹配搜索只在一定范围内进行。假设在τ时间间隔内最大可能的水平和垂直位移量为dm个像素,则搜索范围SR为

SR=(M+2dm

)*(N+2dm

)1)全搜索:寻找最佳的匹配块,需要将k-1帧中对应的子块在整个搜索区内沿水平和垂直方向逐个像素移动,每移动一次计算一次判决函数。总的移动次数Q为

Q=(2dm+1)2此种搜索方法运算量非常大。2)块匹配的快速搜索方法:举例:三步法搜索过程:1)以待匹配块中心的同位像素为中心,在中心点和与其距离4个像素的8个邻域上计算判决函数SAD,取SAD最小的点作为下一步搜索的中心2)以该点为中心,对于中心相距2个像素的未搜索过的邻域点进行搜索3)以上一步中SAD最小的点为中心,对距离中心1个像素的未搜索过的邻域点进行搜索,最终找到最佳匹配位置。几乎所有的快速搜索算法都基于如下的假设:当偏离最佳匹配位置时,判决函数(匹配误差)值是单调上升的。因此无需搜索所有点,只要沿着误差值减少的方向进行搜索,就能找到最佳匹配位置。保证任何情况下找到全局极值点是困难的。近几年来人们提出了许多新的快速搜索算法,这些算法的搜索策略概括如下:1)运动矢量预测:根据图像内容的连续性,相邻块的运动矢量一般是相近的。2)搜索提前中止:预先设定匹配误差阈值3)紧凑的搜索图形3.5.3具有运动补偿的帧间预测1.前向预测概念:不直接传送当前帧的像素值,而传送当前帧(即第k帧)中像素x和前1帧(即k-1帧)的同位像素x’之间的差值,称为帧间预测。对隔行扫描的电视信号,也可以用前一场来预测当前场的像素(场间预测)。当图像中存在着运动物体时简单的预测不能收到好的效果。

考虑了物体移动的帧间预测方法称为具有运动补偿的帧间预测。基本步骤:(1)将图像分割成静止的背景和若干运动的物体,各个物体可能有不同的位移。但构成同一物体的所有像素的位移相同。通过运动估值得到每个物体的位移矢量;(2)利用位移矢量计算经运动补偿后的预测值;(3)除了对预测误差进行编码、传送以外,还需要传送位移矢量以及如何进行运动物体和静止背景的分割等方面的附加信息。实际上,将图像分割成静止区域和不同的运动区域非常困难,当实时地完成时就更加困难。方法将图像分割成子块,每块看成是一个物体,按块匹配的方法估计每个子块的位移矢量,将经过位移补偿的帧间预测误差DFD和位移矢量D传送给收端,收端就可以按下式从已经收到的前1帧信息中恢复出该子块:

bk(z)=bk-1(z-D)+DFD(z,D)下图表示了K帧各块及它们在k-1帧中对应的匹配块之间的关系从该块的预测误差和它的位移矢量所指向的k-1帧中的匹配块,可以恢复出k帧中的对应子块。注意:当子块中的像素实际上属于位移量不同的物体时,这种对整个子块用同一位移量的预测就不够准确.会使预测误差增加,从而影响到数据压缩比的提高。2.后向预测和双向预测概念:前向预测:后向预测:从后续的k+1帧图像预测前面的k帧图像双向预测:采用前、后两帧来预测中间帧讨论:预测误差越小,传输的数据量就越低。双向预测所付出的代价是,对每一个子块需要传送2个位移矢量给收端,而且k帧的恢复必须等到接收到k+1帧之后才能进行。即:编码、解码运算的帧顺序是k-1、k+1、k,而图像显示的顺序是k-1、k、k+l。要保持处理和显示的连续性,编码端和解码端就分别需要多引入1帧的延时。3.6正交变换编码例1:单一频率的正弦波在时域中:采样、量化、编码在频域中:频率、波幅、初相角时域上采样值之间存在非常强的相关性,数据冗余度大,而在变换域上三个参数相互独立,没有相关性,描述信号的数据量大大减少。将空域图像信号映射变换到另一个正交矢量空间及变换域,将图像像素值转变成一组非相关的系数,然后对这些系数进行量化和编码。目的:去除相关,压缩数据。为信号找到一种最有效的表示方式。例2:由相邻两个像素组成的1×2子图像中,设每个像素取8个灰度级(3bit量化),下图中x1轴表示第一个像素可能取的8个灰度值,x2轴表示第二个像素可能取的8个灰度值,由x1,x2组成的二维坐标空间中不同坐标点对应于不同的1×2子图像。变换后的坐标系中,图像子块的两个像素之间的相关性减弱,能量的分布向x1’集中。3.6正交变换编码0X1X1’X2’X23.6.1最佳线性正交变换思路:假设:一个离散信号由N个采样值组成,则可以认为它是一个在N维空间中的一个列向量XT=(x1,x2,…,xn)。为了找到有效的表示方法,可以选取X的一个正交变换,使

Y=TX(3-53)YT=(y1,y2,…,yn)做变换的目的:要寻找一个变换矩阵T,将经上式变换得到的Y用一个由M(M<N)个分量构成的子集来近似。当删去Y中剩下的(N-M)个分量,仅用含M个分量的子集来恢复X时,不会引起明显的误差。或者说:用Y的只有M个分量的子集来代表有N个分量的信号X,从而达到数据压缩的目的。关键是:寻找变换矩阵T,即:找到最佳正交变换。最佳的判断标准:使得在恢复X时所产生的均方误差最小。设变换矩阵具有下列形式

TH=[φ1,φ2,…..,φN](3-54)φi是N维列向量,并且归一化正交,即:

1(i=k)

φiH.Φk=(3-55)0(i<>k)

φi相互正交,故其线性独立。以前的知识:N个线性独立的向量可以生成一个N维空间,这一组向量称为该空间的基,其中的每一个φi称为基向量。由(3-54)和(3-55)知:TTH=I

所以T的逆矩阵:T-1=TH(3-56)当T为实数矩阵,且T-1=TH时,称T为正交矩阵,对应的变换为正交变换。由Y=TX和(3-56)式,得到

X=THY=y1φ1+y2φ2+…..+yNφN上式表明将X转换到由基向量φi(i=1,2,…,N)生成的N维空间(通常称为变换域)中。yi代表X在φi上投影的大小,称为变换系数。因此,由变换系数所构成的向量Y是信号X在变换域中的表示。假设信号X是一个均值为零的随机向量,即<X>=0。若只保留M(M<N)个变换系数,将其余(N-M)个系数置为零,则所得到的X的近似值XM与原信号的差值ΔX为

ΔX=X-XM=其均方误差MSE为

MSE=<║ΔX║2>=<ΔXH.ΔX

>

=3—59)由Y=TX可知:标量的转置为其自身,(3-59)可改写为:当<X>=0时,<X.XH>即为X的协方差矩阵。可以证明得:φiHφi=1的条件下,使MSE为最小的条件是上式看出φi和λi分别是矩阵的本征向量和本征值。也就是说,以信号的协方差矩阵的本征向量φi(i=l,2,…,N)组成的变换矩阵是均方误差准则下的最佳变换矩阵,用此矩阵构成的最佳变换Y=TX称为卡南洛伊夫变换KLT。

经KL变换后,Y的协方差矩阵为(根据Y=TX)KL变换解除了随机向量X的分量之间的相关性,在变换域中Y的各分量之间是互不相关的应用的先修知识:A为n阶实对称矩阵,则有正交矩阵P,使P-1AP=上式说明最小均方误差等于Y向量中被丢弃的分量的方差之和。由此可知,应该选择具有较大方差的M个Y分量所构成的子集来恢复X,以使得恢复后所产生的误差最小。缺点:KL变换的基向量与信号的统计特性有关,变换矩阵不是恒定的,需要临时计算,同时也缺乏相应的快速算法3.6.2离散余弦变换选择不同的正交基向量,可以得到不同的正交变换。从数学上可以证明,各种正交变换都能在不同程度上减小随机向量的相关性。信号经过大多数正交变换后,能量会相对集中在少数变换系数上,删去对信号贡献较小(方差小)的系数,只利用保留下来的系数恢复信号时,不会引起明显的失真。因此,不同的正交变换,例如,离散傅氏变换(DFT),离散余弦变换(DCT),沃尔什-哈达马变换(WHT)等均在数据压缩中得到不同程度的应用,只是在均方误差准则下,性能不如KLT好。余弦变换是傅立叶变换的一种特殊情况。当傅立叶级数展开式中,被展开的函数是实偶函数时,傅立叶级数中只包含余弦项。余弦变换的名字由来,或称之为离散余弦变换。离散余弦变换在数字图像数据压缩编码技术中,可与最佳变换K-L变换媲美。因为DCT与K-L变换压缩性能和误差相接近,而DCT计算复杂度适中.又具有可分离特性.还有快速算法等特点,所以近年来在图像数据压缩中,采用离散余弦变换编码的方案很多,特别是20世纪90年代迅速崛起的计算机多媒体技术当中JPEG、MPEG、R.261等压缩标准。都用到离散余弦变换编码进行数据压缩。一维的DCT正变换和反变换DCT变换的核函数一维8个像素时对应的基函数数据由一维DCT可以直接扩展到二维,即u由此可以看出:DCT将能量集中于频率平面的左上角DCT变换后信号能量主要集中于左上角4×4二维DCT的基图像N=8时的变换矩阵T课后14题b图对应的图像块A:以下代码产生变换矩阵jihanshujuzhen,并按矩阵运算进行DCT变换,最后将变换结果与Matlab中的二维DCT变换函数DCT2()进行比较在以变换系数F(u,v)作加权的情况下,由正交变换的基图像的组合,可以重新得到原始图像基于DFT的快速DCT算法

(3-75)为了进一步简化上述关系,注意到,由于上式右端是实数,因此左端也应为实数。用An和Bn分别表示F(n)的实数和虚数部分,则有令上式的虚部为零则

将Bn代入(3-88)得到

(3-76)(3-76)(3-78)代入(3-75)得结论;一个函数的DCT系数可以由该函数对应的偶函数的DFT系数的实部得到。

(3-78)讨论:(1)先前知识,二维信号的傅氏变换的系数代表它所对应的空间频率分量的复振幅。(3-79)式表明,虽然DCT系数并不与空间频率分量的复振幅严格相等,但有一定的对应关系。特别是n=0时的DCT系数与DFT的零频分量一样,代表空间域内信号的均值;(2)一个函数的DCT系数可以通过与该函数对应的偶函数的DFT系数得到。由于偶函数的对称性减小了DFT中由于周期延拓而产生的空间域中边缘的不连续性,从而使能量在频率域内更为集中。因此在数据压缩应用中.DCT比DFT具有更好的性能.3.4取样频率的转换几个概念

a抽取(下取样)由高取样率的样值去推算低取样率样点上的数值的技术

b内插(上取样)由低取样率的样值去估计在原来较高频率的取样点上的样值,这种技术称为内插。应用:1)通过取样频率的转换,可以使传送数据量增多或减少,实现传送图像高低分辨率的转换。2)当需要将数字信号与一些特殊系统的时钟同步时,可能需要进行采样率的转换;3)一个数字电话系统,通过该系统传输的既有语音信号,也有传真(FAX)信号,甚至有视频信号,这些信号的频率成分相差甚远。因此,该系统应具有多种抽样频率并自动地完成采样率的转换3.4.1下取样(亚取样)取样频率f1略高于奈氏频率;用f2=f1/n(f2小于奈氏频率)作为取样频率直接对源信号抽样,发生频谱混叠情形。

取样频率为f1/2时发生频谱混叠部分

为避免混叠失真,可先用一个低通滤波器将图(a)所示的频谱的基带部分取出,恢复出原来的模拟信号,然后用另一低通滤波器将此模拟信号的频带限制到f2/2,再重新取样,便可得到取样频率为f2的样值。含义:将信号x(n)作M倍的抽取后得到的y(n)频谱等于原信号的频谱先做M倍的扩展,再在w轴上作2πk的移位,幅度降为原来的1/M后再叠加以下2页为证明过程利用周期序列的离散傅里叶级数DFS反变换:3.4.2上取样线性内插是一种广泛的内插方法,它利用两相邻样值得加权和内插出二者之间任意位置上的数值,每个样值与该值到内插位置的距离成反比。3.7子带编码3.7.1子带编码工作原理在子带编码中,如图3-24所示.首先用一组带通滤波器将输入信号分成若干个在不同频段上的子带信号;然后将这些子带信号经过频率搬移转变成基带信号,再对它们在奈氏频率上分别取样。取样后的信号经过量化、编码,并合成成一个总的码流传送给接收端。在接收端,首先把码流分成与原来的各子带信号相对应的子带码流,然后解码、将频谱搬移至原来的位置,最后经带通滤波、相加得到重建的信号。在子带编码中,若各子带的带宽△Wk是相同的,则称为等带宽子带编码;若△Wk是互不相同的,则称为变带宽子带编码。

子带编码的压缩数据的原因和优点:

(1)可以利用人耳(或人眼)对不同频率信号的感知灵敏度不同的特性,在人的听觉(或视觉)不敏感的频段采用较租糙的量化,从而达到数据压缩的目的;

(2)各子带的量化噪声都束缚在本子带内,这就可以避免能量较小的频带内的信号被其它频段中的量化噪声所掩盖。子带编码的关键部件讨论:带通滤波器组是子带编码的重要部件,它影响到子带编码的复杂程度和性能。问题1,注意到,如果各子带的下截止频率f1k恰好是该子带宽度的整数倍,即

f1k=n△Wk(k=1,2…,M)(3-92)(其中n是一非负整数,M为子带的个数),则可以不必将带通信号搬移到基带上,就直接以取样频率fsk=2△Wk对子带信号取样,而不会产生混叠失真。满足上式条件的子带滤波器组称为整数子带滤波器组。以M=4的变带宽子带为例:图3-25给出了第3个子带的取样过程。图中(a)是输入信号的频谱;(b)是第3个子带信号的频谱,其下截止频率f13=2△W3;(c)是以fs3=2△W3的频率对(b)取样后,所得到的信号的频谱。采用整数子带滤波器组的优点:采用整数于带滤波器组省去了进行频谱搬移所需要的调制器和解调器,使系统得以简化。输入信号的总带宽W,按下式计算:例子:下图给出使用抽取和内插的且M=2的子带编码和解码的原理方框图。此时,系统的输入和输出看成是已在奈氏频率下取样的离散信号,图(b)给出了它对应的频谱。假设用带通滤波器取出图(b)中斜线所示的上子带.经2:1抽取后的上子带的频谱如图(c)所示。在接收端,再用1:2的内插器,将频谱恢复到原来的位置。在采用整数子带滤波器的系统中,总的传输速率I为式中,Rk为第K个子带中每个样值量化的比特数。问题2,滤波器的具体实现不可能是理想的带通,其幅度响应不可避免地带有有限的滚降。因此在划分子带时,有两种情况:a子带间有交叠,如图所示;b:子带之间有一定的间隙,如图(b)所示。在(a)的情况下.按奈氏频率取样将会产生混叠失真;在(b)的情况下,由于原有信号的部分频带经滤波而损失掉了.重建的信号会有失真,例如以话音为例,重建的语音会产生混响的主观感觉。解决方法:正交镜像滤波器比较好地解决了混叠失真的问题,从而降低了对滤波器滚降特性的要求,简化了滤波器的复杂性,成为子带编码中最常采用的形式。3.9.5预测误差和DCT系数的量化预测误差通常近似地遵从图3-33(a)所示的拉普拉斯分布。已知概率分布,即可设计量化器。用量化后的预测误差重建原来的信号将引入失真,典型的失真情况如图3-41所示。颗粒噪声;边缘忙乱;斜率过载。预测误差的量化误差特点:只引起周围邻近区域内(局部)图像的失真。斜率过载:在信号上升沿较陡峭时,预测误差幅度很大,即使使用最大的量化值也无法表示出他的变化。表现为:图像轮廓变模糊颗粒噪声:在信号较为平坦区,信号微小的变化使量化后的预测误差在量化器的两个最小电平之间波动,造成重建信号的颗粒噪声表现为:图像在平坦区出现颗粒状的细斑边缘忙乱:由于原始图像中存在噪声,造成不同图像帧之间在同一像素位置产生的量化噪声不同,从而引起缓慢变化的边缘出现不确定的现象。表现为:在变化不快的边缘出现闪烁不定现象DCT系数的量化预测误差的量化误差只引起周围邻近区域内(局部)图像的失真,而一个DCT系数的量化误差却对产生此系效的整块(全局)图像的质量产生影响。考虑到图像特性的不均匀性,通常将一幅图像划分成8X8,或16X16的小块,再对块图像进行变换。在图像分块做DCT时,直流(DC)分量的量化误差将扩大块与块之间灰度均值的差异,从而在重建图像上显现出明显的分块结构,称之为块效应。DCT的高频系数在其幅度相当小时,将被“裁断“(即量化到零)。高频系数的量化误差(包括因截断而产生的误差),将降低图像的分辨率,使细节模糊,结果:在亮度突变的附近产生亮暗相间的条纹,在彩色突变处产生颜色的泄漏等。在活动图像序列中,这些失真还可能造成原来被运动物体遮挡而新暴露出来的背景处的图像出现脏痕。DCT变换后,系数之间的相关性已经很小,可以用各自独立的量化器分别进行量化。对变换系数量化的处理办法一般分为两种:分带编码和阈值编码。分带编码方法是将变换系数分成几个频带,每个频带根据所需量化的信号的统计特性,预先设定其量化的比特数,方差大的系数,给予较多的比特数值。由于各系数量化的比特数是固定的,所以该方法适于处理具有相同统计特性的图象,例如:卫星拍摄的地面照片。阈值编码适合:对于统计特性差异较大的图像,例如一般电视图像。步骤:先设定一个(或一组)阈值,只对幅值大于、或等于阈值的系数进行量化,小于阈值的则被截断。优点:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论