版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
12.1.4量化及其质量
量化的概念与原理
量化是将具有连续幅度值的输入信号转换为只具有有限个幅度值的输出信号的过程。
就一般而言,量化是模拟信号到数字信号的映射。模拟信号是连续量,而数字信号是离散量,因此量化过程实际上就是用有限的离散量代替无限的连续量的多对一的映射过程。2
一般的量化过程是预先设置一组判决电平和与其对应的一组码字,再将整个有效值区间划分成若干个子区间(也即量化级),每个子区间对应一个判决电平。量化时将模拟量的采样值与这些判决电平比较,若采样值幅度落在某一子区间上,则将它量化为该量化级对应的码字。3量化的方法通常有标量量化和矢量量化1标量量化
标量量化是对经过映射变换后的数据或PCM数据逐个进行量化,在这种量化中,所有采样使用同一个量化器进行量化,每个采样的量化都与其他采样无关,故也称为零记忆量化。
标量量化又有均匀量化、非均匀量化和自适应量化之分.4W3(c)(a)(b)灰度差W1W2W3W4W5W6W7W8W1W2W4W5W6W7W8点数(-255~255)图2.1量化过程示意图5
其中,(a)图是待量化的函数,是一幅图像的灰度差值直方图。其灰度范围为0~255,灰度差的范围为﹣255~255,需要log2512=9位表示一个输入。当限定输出量化级为8时,量化输出用log28=3位即可6
(b)图给出了均匀量化处理的示意,W1
~W8为8个等宽的量化箱,其宽度总和等于输入的动态范围-255~255也相应地划分成8个相同的区间,每个区间对应一个量化箱。第k个区间内的中心函数值对应第k个量化箱的量化值,其量化级定义为“k”级,该区间内的所有输入均被定义为“k”级。7(c)图给出了非均匀量化处理的示意,这时的量化箱不等宽,中间大概率处箱窄,两边小概率处箱宽。同样量化为8级,但非均匀量化的误差小于均匀量化误差。8
标量量化的量化特性采用阶梯形函数的形式。图2.2给出了几种均匀量化器的量化特性图2.2均匀量化特性xiyiyi+1yxxi+1yxyx死区(a)中平型(b)中升型(c)具有死区的中平型9图中量化器的特性都是对称的,且式中Δ称为量化台阶。
不难看出,均匀量化器适合于输入信号的统计特性(概率分布密度函数P(x))均匀分布的情况。10y图2.3
非均匀量化特性x
当输入信号的概率分布密度函数分布不均匀时,最佳的量化器应是一个非均匀量化器。图2.3给出了一个非均匀量化特性的例子。
112矢量量化
这是近年来发展起来的一种新的编码方法,是一种有损的编码方案,其主要思想是先将输入的语音信号按一定方式分组,再把这些分组数据看成一个矢量,对它进行量化。每组形成的矢量看成一个元素,又叫码字,这些码字排列起来,就构成了一个表(码表),这样在接收端放置同样的码表,当接收到码字的下标信息后,就可以通过查表的到码字信息。12输入矢量搜索器码本Y传送矢量下标i查表码本Y编码解码i输入矢量图2.5矢量量化编码解码框图
输入量是一个待编码的矢量xi(i=1,2,…,m),即先将图像分割成m个方块,其中任一方块i的大小为k(k=n2),以行(或列)便可堆叠成k维矢量xi:(xi1,xi2,…,xik)。码本Y:(y1,y2,…,yN)是一个码字集合,它实际上是一个长度为N的表,表中任一分量yi是一个k维矢量,称为码字。13
矢量量化编码过程就是从码字集合中选出最紧密适配于输入矢量xi的一个码字yi的过程。在码本中找到与输入矢量xi完全一致的码字yi的概率很小,但只要两者之间的误差最小时,便可用该码字yi来代表输入矢量xi。传输时并不传送码字yi本身,而只传送其下标号“i”。当码本长度为N时,传送下标所需的比特数为log2N。于是传送一个像素所需的平均比特数为(1/k)·log2N。14
此方法以输入矢量与选出的码字之间失真最小为依据,与标量量化相比,它有更大的数据压缩比。但其关键问题是设计一个良好的码本。15
预测编码方法中典型的有DPCM和ADPCM方法。差分脉冲调制(DPCM)预测
差分脉冲调制(DifferentialPulseCodeModulation,简称DPCM)是降低每个像素所需平均比特数最实用的方法。对于绝大多数图像来说,在局部空间和时间上是高度相关的,因而可以在已得到像素的基础上通过对当前像素的预测来减少图像的数据量。16
当输入信号进入时,先与相减得到预测误差值,量化器对差值进行量化得到,由编码器编成二进制码通过信道发送。接收端解码得到,与接收端自身形成的预测值相加,得到恢复后的。1DPCM原理17
假设用给出的样本值序列x1,x2,x3,…,xn-1来预测xn,令预测值为:
预测器设计是预测编码系统的核心,预测器的复杂程度与线性预测中使用以前的样本数有关,样本数越多,预测器越复杂。2DPCM编码预测器设计18
xn的最优估计值是使误差dn的期望值最小的之值,由均方差定义:
要使最小,应对a
i求偏导数,并令其为零,就可建立关于a1,a2,…,an-1的线性方程组即:19上式中可见,所有的n-1个ai都可由上述方程组解出整理可得
式中E{xixj}为xi和xj的协方差,可由统计学方法确定20
在预测编码系统中,预测误差的量化是造成图像质量下降的主要原因,其表现形式有:
斜率过载颗粒噪声边缘忙乱伪轮廓21
在预测编码系统中,造成图像质量下降的另一个主要原因是由图像传输过程中的误码在接收端预测器中引起的误码传播。由于接收端当前像素是由前面已经收到的像素预测而来,因而一旦某个像素编码产生误码,必然引起误码向后面的像素传播,造成局部图像的损伤。幸而这种图像损伤将随着与误码像素距离的加大而逐渐减弱。22
无失真编码器采用三邻域采样值法,由a、b、c预测x,如图2.17所示。用x′表示x的预测值,x′可由表2.2中的任选一个公式,并根据a、b、c的值得到。从x中减去x′得到一个差值,再对差值进行无失真的熵编码(可采用哈夫曼或算术编码)cbax图2.17三邻域预测(a+b)/27c3b+((a-c)/2)6b2a+((b-c)/2)5a1a+b-c4非预测0预测值x′序号
预测值x′序号表2.2三邻域预测公式23
基于DCT的有失真压缩编码
基于DCT的编码过程为:先进行DCT正变换,然后再对DCT系数进行量化,并对量化后的直流(DC)系数和交流(AC)系数分别进行差分编码和行程编码,最后再进行熵编码。编码过程的简化框图如下:2DCT正变换熵编码器码表说明无失真编码器源图像数据压缩图像数据量化器码表说明8
8块24DCT变换
这是正交变换中傅立叶变换中的一种特殊情况,叫作离散余弦变换(DiscreteCosineTransform)。在傅立叶级数展开式中,如果被展开的函数是实偶函数,那么,其傅立叶级数中只包含余弦项,将其离散化就可导出余弦变换。
离散余弦变换原理是:将信号从空间域变换到频率域,在频率域中,大部分的能量集中在少数几个低频率系数上,而且代表不同空间频率分量的系数间的相关性大大减弱,只利用几个能量较大的低频系数就可以很好地恢复原始图像。25DCT压缩编码分成6个步骤:切割分块首先把原始图像中单独的彩色图像分量(如亮度信号分量、色度信号分量)顺序分割成8×8子块,即输入分量的样本被组成8×8
大小的数据块。重采样并进行正交变换离散余弦正变换FDCT
可看作一个谐波分析仪,每个8×8二维原图像采样数据块,实际上是64点离散信号,它们是空间二维坐标的函数,FDCT把它作为输入,然后把它分解成64个正交基信号,每个正交基信号对应于64个独立二维空间频率中的一个。FDCT的输出是64个基信号的幅值,称作DCT系数,这64
个DCT系数中,有一个是直流系数(DC),其余63个是交流系数(AC)。26
量化量化处理是一个多到一的映射,在JPEG
标准中采用线性均匀量化器,量化定义为,对
64个DCT变换系数,除以量化步长,四舍五入取整得到。这里,量化器步长是量化表的元素,它随DCT变换系数的位置和每种颜色分量的色调值不同而不同。由于人眼对亮度信号比对色差信号更敏感,因此使用了两种量化表,即亮度量步长小于对应的色度量化步长;另外考虑到人眼对低频分量的图像比对高频分量的图像更敏感,因此量化表中左上角量化步长比右下角量化步长小。27
量化后处理量化后的DCT系数要重新编排,这样做可以增加连续的“0”系数的个数,也就是说尽量增加“0”行程长度,最好的办法是采用“Z字蛇行”矩阵,如右图,这样就把8×8
的矩阵变成一个1×64的矢量。28
编码由于变换后的“直流系数”数值较大,且相邻图像块系数数值变换不大,所以使用差分脉冲编码调制对直流系数
进行编码。而量化的AC“交流系数的特点是1×64矢量中包含有许多0,且0是连续的,因此使用行程编码对交流系数进行编码。接着根据数据符号出现的概率高低进行熵编码,使DPCM编码后的直流DC系数和交流系数进一步压缩。29
组成位数据流这是JPEG编码的最后一个步骤,即把各种标记代码和图像编码后的图像数据组成一帧一帧的数据,以便于传输、存储和译码器译码。
解码过程是编码过程的逆过程,解码过程的框图如下:熵解码器
DCT逆变换码表说明解码器逆量化器码表说明8
8块恢复的图像数据压缩图像数据30MPEG-1视频压缩技术
为了实现随机存取,最好要用帧内编码。为了把编码电视图像的位速率限制在1.2Mbps,既要有较高的压缩率,又要获得高质量的图像,就要求在帧内和帧间编码之间进行折中。因此,MPEG定义了3种图像:I图像(IntraPicture帧内图像)、P图像(PredictedPicture预测图像)和B图像(BidirectionalPicture双向预测图像。31
典型的排列如图下所示。这三种图像将采用三种不同的算法进行压缩。
图像组一般由一个I-图像帧、几个P-图像帧和若干个B-图像帧构成。IBBPBBPBBP…BII-图像帧(Intra-codedpicture):帧内编码图像帧,简称内帧。这类图像帧不参考其他图像帧而只利用自己的图像信息进行编码。P-图像帧(Predictive-codedpicture):预测编码图像帧,简称预测帧。此类图像帧利用最近的前一个I帧或P帧作为参考,采用带运动补偿的帧间预测进行编码,此过程称为前向预测B-图像帧(Bidirectionallypredictive-codedpicture):双向预测编码图像帧。此类图像帧既利用过去的图像帧(I帧或P帧),也利用后来的图像帧(P帧)进行带运动补偿的双向预测编码,此过程称为双向预测321帧内图像I的压缩编码算法
帧内图像I不参照任何过去的或者将来的其他图像帧,压缩编码采用类似JPEG压缩算法。如果电视图像是用RGB空间表示的,则首先把它转换成YUV空间表示的图像。每个图像平面分成8×8的图块,对每
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 食品安全追溯消费者信任反馈建立
- 专业基础-房地产经纪人《专业基础》真题汇编3
- 农场半年度工作汇报
- 统编版五年级语文上册寒假作业(十三)有答案
- 二零二五版共有产权房转让协议书3篇
- 二零二五年智能大棚土地承包合作协议范本3篇
- 宿州航空职业学院《英语专业前沿课程》2023-2024学年第一学期期末试卷
- 二零二五版公共安全防范承包合同3篇
- 二零二五年食品包装设计及委托加工合同
- 苏教版初一英语试卷单选题100道及答案
- 春季餐饮营销策划
- 企业会计机构的职责(2篇)
- 《疥疮的防治及治疗》课件
- Unit4 What can you do Part B read and write (说课稿)-2024-2025学年人教PEP版英语五年级上册
- 2025年MEMS传感器行业深度分析报告
- 《线控底盘技术》2024年课程标准(含课程思政设计)
- 学校对口帮扶计划
- 仓库仓储安全管理培训课件模板
- 风力发电场运行维护手册
- 河道旅游开发合同
- 情人合同范例
评论
0/150
提交评论