数字电视视音频信号压缩编码技术_第1页
数字电视视音频信号压缩编码技术_第2页
数字电视视音频信号压缩编码技术_第3页
数字电视视音频信号压缩编码技术_第4页
数字电视视音频信号压缩编码技术_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 数字电视视音频信号压 缩编码技术3.1视频信号紧缩的必要性和可行性一、紧缩的必要性 1、电视信号数字化后的数据量过大,使普通的存储器难以接受。 一盘12cm直径的VCD光盘,可播放74分钟的活动图像及相当于CD数字激光唱片音质的声音。存储容量为650MB=6508=5200Mbit。 4:2:2规范:R=720576258+2360576258=165.9Mb/s 一张12cm直径的VCD光盘可存储的时间 5200/165.931秒2、数码率太高使数字电视信号频带过宽,频道利用率太低,甚至无法包容。分量编码:4:2:2规范:R=165.9Mb/s 频带宽度B83MHz 4:4:4规范:

2、R=278.7Mb/s B140MHz 4次群的R为.264Mb/s,可传话路1920路 。1920路传不了一套4:2:2的数字电视节目;用11套模拟电视节目换一套数字电视节目。 信号频带太宽,频带利用率低,频率资源严重浪费。同时对电路要求高,设计复杂,维修困难,设备造价高。 二、紧缩的可行性来自: 图像本身存在大量的冗余: 空间相关冗余 时间相关冗余 符号相关冗余 构造相关冗余 知识相关冗余人眼的视觉冗余1、图像本身存在大量的冗余度 空间相关冗余 时间相关冗余 符号相关冗余 构造相关冗余 知识相关冗余2、人眼的视觉冗余 人眼对事物细节的分辨力是有限制的; 对颜色画面的分辨力低于对黑白画面的分

3、辨力; 对高频信号变化的分辨率低于低频信号的分辨率; 对屏幕中心区失真的敏感度要高于屏幕周围的失真。 三、紧缩的途径及方法 1、行、场逆程不传送,在接纳端重新构成。 2、亚奈奎斯特取样 fs2fm。使混叠分量与亮度谱线交错。 3、采用高效编码信源编码。去除电视信号中的冗余。3.3 常用的数字电视视频紧缩编码技术一、 预测编码1、预测编码的根本原理 利用某种数学方式对以前知的相关数据进行运算,得出一个与当前传送样值相接近的预测值,进而把当前要传送的值减去预测值,得到一个误差值预测误差,将这个误差值编码后传送出去。 当前样值预测值预测误差第一个样值:16016;第二个样值:16160;第三个样值:

4、第3第20第360样值:第360第3590第361样值:第361第360 23516219第362样值:第362第3610第720样值:第720第7190第二行第1第一行第10;第二行第361第一行第3610当前编码样值预测值前一个样值=预测误差2、预测编码的意义 去除了电视信号中空间、时间上的冗余。 给出了良好的概率分布,为后面的紧缩编码发明了条件。3、DPCM差值预测编码的实现 原理方框图式中 为前值序列, 称为预测系数也叫相关系数,且满足: 预测项与预测系数的选择 取:a1=1/2、a2=1/4、a3=1/8、a4=1/8、a5=0、a6=0 一维、二维和三维预测一维预测: 参考样值仅与

5、xN当前样值处于同一扫描行内的预测编码;二维预测: 参考样值除了本行之外还和前一行或前几行的样值有关; 三维预测: 参考样值除了本帧之外还和前一帧或前几帧图像的样值有关。 由于一、二维预测都是在同一帧内进展预测,所以也称为帧内预测编码;三维预测与前面的帧有关,所以也称为帧间预测编码。 二、 变换编码变换编码也有变换、量化、编码三大过程:1、离散余弦变换DCT的根本思想 DCT变换是把空间域上的信号变换到频率域上,使能量在空间域上分散分布的原信号变换后能量在频率域上相对集中到某些少数区域内,即将空间域上的信号样值变换成频率域上的系数,经变换后的系数按频率由低到高分布。2、处置步骤: 将一幅图像分

6、成假设干像块,每个像块的大小为88个像素。 对每一块像块进展DCT变换。 此式阐明这是一个二维的变换关系式,即在一个平面上进展变换。 结论: 像块样值数据f(x,y)为88的矩阵,经DCT后的频域系数F(u,v)也为88的矩阵。此矩阵的左上角系数F00相当于像块中64个样值的平均直流成分,其他的63个F(u,v)均表示64个样值中所含交流成分的系数 。 经过变换后,较大的系数集中在直流分量及附近的低频区域,即信号能量主要集中在直流及低频区域的少数变换系数上,高频区域的系数多为0或很小。如:变换系数: 图像样值:88DCT基图像 对变换后的系数进展量化。 进展之字形扫描读出和零游程编码。2、处置

7、步骤:将一幅图象分成假设干像块,每个像块的大小为88个像素。 对每一块像块进展DCT变换。对变换后的系数进展量化。进展之字形扫描读出和零游程编码。3、DCT紧缩编码的过程为:三、统计编码熵编码统计编码是基于信号统计特性的编码技术。根本原理: 按信源符号出现概率的不同分配以不同长度的码字bit数,概率大的分配以短的码字,概率小的分配以长的码字。这样使最终的平均码长很小,总的数码率大大降低。 1、信息熵的概念 香农的信息论以为,信源中所含有的平均信息量熵就是进展无失真紧缩编码的实际极限。紧缩编码只需不低于此极限,那就总能找到某种编码方法去恣意的逼近熵。平均信息量: 假设是非等概情况,设离散信源是一

8、个由n个符号组成的符号集,其中符号 出现的概率为 ,且有 ,那么x1,x2,x3xn所包含的信息量分别为 。于是,每个符号所含信息量的统计平均值,即平均信息量为:即信息源X的熵定义为:单位为bit/符号。平均码字长度 设Ni为数字信号第i个码字的编码长度即二进制代码的位数,其相应出现的概率为Pi,那么该数字信号所赋予的码字的平均长度为:编码效率比特码字将每个符号按其概率由大到小顺序陈列起来。将最小的两个概率相加,并对其中较大的概率用“1表示,较小的概率用“0表示。反之也可,但赋值方式应坚持一致。把求出的和值作为一个新的概率值再按重新陈列。按照这样的步骤反复进展,直到概率加到1。分配码字。由概率

9、为1处开场沿各点参与运算的分支线从后向前从右向左逐一写出“0、“1的代号从高位到低位写直到各符号为止。得到的代码就是各信源符号的码字。反之也可,从符号到集合点p1从左到右,但代码的写出是从低位到高位。2、霍夫曼编码 霍夫曼编码的详细步骤: xi: x1 x2 x3 x4 x5 x6 x7 x8 pi:0.20 0.19 0.10 0.15 0.005 0.17 0.18 0.005 再举例: 符号A、B、C、D、E、F、G、H概率 0.10、0.18、0.40、0.05、0.06、0.10、0.07、0.04单义可译性 :例如:接纳到下面例子中的一串数据序列110010110111011110

10、1,那么它只能独一地分为下述码字:110,0,1011,0,11101,11101,110B,0A,1011G,0A,11101D,11101D。 二、霍夫曼编码的平均码长和编码效率:以上一例结果为例:平均码长: 信息熵 :那么编码效率为: 3.4 其他视频紧缩编码技术引见一、具有运动补偿的帧间编码技术 1、帧间预测编码的概念 据统计,对普通的彩色电视广播节目,在相邻帧之间亮度信号平均只需7.5的像素有变化,而色度信号平均只需6.5的像素有变化。 电视图像的帧差信号具有更强的相关性。可见,图像的时间冗余度是相当大的。 帧间预测编码取不同帧场的像素作为预测像素,求其差值,再对差值进展编码。 帧间

11、预测编码的目的正是在于消除这些时间冗余。 2、运动处置运动估计和运动补偿 运动处置原理 通常,电视节目中只需画面镜头不切换,前后帧图像的内容是差别不大的,许多情况下仅仅很少一部分在运动,因此,只需知道画面中哪部分在运动,其运动方向和位移量怎样样,把就可以从前一帧图像中预测出当前帧图像。又由于运动预测会有误差,需求对幀间预测误差信号进展编码和传送,因此我们只需求传送运动矢量和幀间预测差值,从而可以大幅度紧缩码率。 2、运动处置运动估计和运动补偿 k-1帧, x1y1 k帧,挪动到x1+x,y1+y 位移矢量D(x,y) 把k帧x1+x,y1+y移到 k-1帧x1,y1 点,再与k-1 帧求差值

12、估计算出运动物体的位移量,这就是运动估值 借助运动估值得到的物体帧间位移矢量进展运动补偿后,再做帧间预测可以使预测误差明显下降。运动处置的两个过程: 运动估计:在帧间预测之前,对运动物体从上一帧到当前帧位移的方向和像素数做出估计,即求出运动矢量。 运动补偿:按照运动矢量,找到上一帧中相应的块,求得对当前帧的估计预测值这个过程称为运动补偿。 运动处置的全过程如前面运动着的球 然后用这个运动矢量将K-1帧过去帧位移。 将K-1帧(5,4)球的数据位移D(10,6)的位置, 移到(15,10)的位置,做K帧的预测估计值-运动补偿。 K帧为当前帧,把K帧的球的数据拿到K-1帧中比较,直到找到K-1帧中

13、球的位置,记下K帧挪动了多少,计算出运动矢量D(10,6)运动矢量; 块匹配法 对当前帧中的每一个宏块MB,在前一帧中以与其对应的位置m,n为中心,上下左右四个方向搜索找与其最正确匹配的宏块MB,宏块MB和MB在程度和垂直方向上的间隔即是求得的位移矢量。 二、具有运动补偿的帧间内插编码技术 在某些场所,为降低码率发送端会每隔一段时间丢弃一帧或几帧图像,而在接纳端再利用图像的帧间相关性将丢弃的帧恢复出来,以防止帧率下降引起闪烁和动作的不延续,这种技术称为帧间内插编码技术。最简单的帧间内插编码是线性内插法。 假设在二个知数据中的变化为线性关系,因此可由知二点的座标(A, B)去计算经过这二点的斜线

14、。 (y-y1)/(x-x1)y2-y1)/(x2-x1)=直线斜率, yy1(y2-y1)(x-x1)/(x2-x1) 另外,在帧间内插中的位移估值普通要对运动区的每一个像素进展,而不是对一个子块。 3.5 数字电视声音紧缩编码技术一、 声音信号紧缩编码的必要性常用的声音信号有:窄带语音3003400Hz,fs=8KHz宽带语音视频会议507000Hz,fs=16KHz数字音频广播信号2015KHz,fs=32KHz高保真立体声2020KHz,fs=44.1KHz或fs=48KHz3.5 数字电视声音紧缩编码技术例如:激光唱盘CD:fs=44.1KHz,n=16bit,共两个声道:其R44.

15、1162=1.411Mb/s;设信道编码率R=1/2,那么实践上传送的数据率为21.411Mb/s;假设频带利用率按(2b/s)/Hz计,那么传送一套这样的立体声节目所需射频带宽为:B21.411Mb/s/(2b/s)/Hz1.411MHz 假设5.1声道: fs=48KHz,n=18bit,6个声道,R=481865.184Mb/s。 而高明晰度电视图像信号紧缩后的码率大约为30Mb/s左右。二、声音紧缩编码的能够性 声音信号客观统计规律 人耳听觉的生理、心思学要素 根据声学实际,人耳存在着一个听觉的阈值,当某个频率的声音的强度声强小于某个特定的数值之后,人耳就听不见了,即当声音弱到人的耳朵

16、刚刚可以听见时,我们称此时的声音强度为“听阈。 掩蔽效应 指一个声音的听觉感受遭到另一个声音的影响的景象。其中前者称为被掩蔽音,后者称为掩蔽音。绝对听阈:被掩蔽音单独存在的听阈分贝值。掩蔽听阈同听阈:在掩蔽情况下的听阈。 1、频率掩蔽效应: 一个频率的声音掩盖另一个频率的声音,这就是频率掩蔽效应。2、时域掩蔽效应:a.预掩蔽前掩蔽: 在时域中,在听到强信号之前的短暂时间内,原已存在的弱音可以被掩蔽而听不到,这种景象称为预掩蔽。2、时域掩蔽效应:b.同时掩蔽同期掩蔽: 强音与弱音同时存在时,弱音被强音掩蔽称为同期掩蔽。c.后掩蔽: 当强音消逝后,经过较长的持续时间,才干重新听到弱音信号恢复到以前

17、的听力,这种景象称为后掩蔽。 在编码时 可将时间上彼此相继的取样值归并成块; 由掩蔽效应,人耳听不到的不传; 对于人耳不能分辨方向的频率接近的高频音,不用再分声道,将多声道的高频音耦合到一个公共通道; 采用子频带编码,由每个子频带中的最小同听阈来确定各子频带取样值的必要的量化。 3.6 两种主要声音紧缩编码的方法简介一、MUSICAM编码 MUSICAM-掩蔽型自顺应通用子频带集成编码与复用。1、MUSICAM的技术特征 这种编码的方法属于子频带编码,它是用滤波器组将宽频带的声音信号的频谱分割为宽度均为750Hz的32个子频带。每个子带的量化和比特分配是利用人耳听觉的心思声学模型和音频信号统计

18、特性的内在联络确定,并去除音频信号中的冗余和不相关部分,来实现有效的数据紧缩。2、MUSICAM的三个层次 Layer1简单版本。在CD质量下,比特率为384Kb/s,紧缩比为1:4。主要用于数字盒式录音磁带、VCD。Layer2规范版本,编码器的复杂度属中等。CD质量下,比特率为192Kb/s左右,紧缩比为1:8。在数字演播室、DAB、DVB、电缆和卫星广播ADR、计算机多媒体等数字节目的制造、交换、存储、传送中得到广泛运用。Layer3复杂版本。它是MUSICAM和ASPEC自顺应声频频谱感知熵编码的混合编码。声音质量最正确。在CD质量下,运用的比特率为128Kb/s,紧缩比为1:12。主要用于通讯、尤其适用于ISDN综合业务数据网上传送广播节目、运用于Internet网的声音点播、MP3光盘存储等。二、杜比AC-3编码 AC-3是杜比实验室开发的数字音频编码技术,它提供5.1环绕立体声。由于AC-3系统编码灵敏,在消费电子领域,目前大多数的电影制造都运用了该技术,美国等国家的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论