




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章数字视音频压缩编码原理本章主要内容:数字视频压缩的基本原理数字音频压缩的基本原理数字电视中常用的压缩编码方法§4.1
数字视频压缩编码概述一、压缩的必要性4:2:2格式,10bit编码的SDI信号数据量:SDSDI:270Mbit/s135MHzHDSDI:1.485Gbit/s742.5MHz二、图像数据压缩机理利用图象数据中的大量冗余实现压缩电视信号在相邻行、相邻帧存在很强的相关性。利用人眼的视觉特性实现压缩空间冗余时间冗余视觉空间分辨力亮度辨别阈值视觉阈值三、数据压缩编码方法的分类分类举例无损编码熵编码游程编码、Huffman编码、LZW编码有损编码内插法低抽样率法,行、场亚抽样法,帧亚抽样法预测编码一维预测,二维预测,三维预测变换编码DCT变换,整数变换等其他矢量量化,子带编码等§4.2预测编码预测编码:基于图像数据的空间和时间冗余特性,用相邻已知像素(图像块)来预测当前像素(图像块)的取值,然后再对误差进行量化、编码和传输。意义:如果预测模型足够好,则预测误差信号比原始信号小的多,从而用较小的电平等级对预测误差信号进行量化,可以大大的减少传输的数据量。数字电视中常用的编码方法预测编码的分类:帧内编码、帧间编码利用空间冗余利用时间冗余一、预测编码的基本原理(DPCM)输入信号样值预测值预测误差样值的重建值预测编码的误差分析:量化误差
预测系数
xin时刻之前的样值二、预测方法前值预测1、帧内预测一维预测二维预测2、帧间预测(三维预测)
利用图像序列在时间上的相关性来压缩图像序列的时间冗余。用前一帧图像的像素预测当前帧图像的像素。3、预测系数的选择...DPCM预测器
为预测系数。
为延迟元件,用来存储样值。最优线性预测法:按照某种准则选择预测系数,使最小。准则:均方误差(MSE)准则,使为最小。对{}内的信号求统计平均值对其求解可得预测系数三、预测量化器1、预测误差的统计特性
试验表明,8bit量化时,预测误差的绝对值在16--18等级之内的像素占80%--90%。2、量化器设计
根据人眼的视觉特性,采用非均匀量化。四、图像帧间编码中的运动处理1、运动处理原理运动估计(ME),通过匹配搜索产生运动矢量MV。运动补偿(MC),根据MV产生当前帧的估计值。接收端通过MV和en(x,y)由前一帧重建当前帧。2、运动估计的方法匀速直线平移运动物体的帧间位移帧间运动像素的位移:运动位移矢量运动估计的方法:块匹配法、像素递推法、相位相关法等。数字视频压缩国际标准中常用前一帧中的搜索范围N+2MMMN+2M3、块匹配法宏块(MB):每个宏块由N*N个像素组成;宏块内的像素作一致的平移运动;当前帧的像块:和前一帧内的像块作最佳匹配;搜索范围(窗口)(N+2M)*(N+2M);NN估值块的大小(N*N)考虑的因素:图像细节构成和计算量的大小。视频压缩编码中宏块的大小通常取16*16像素。SDTV信号:分解力为720*576/帧
Y:45*36=1620宏块/帧
Cr,Cb直接用Y信号的位移矢量最佳匹配准则:判断两个宏块的最佳匹配最小均方差(MSE)准则i,j为水平、垂直方向的位移量当前帧像素值最小平均绝对帧差(MAD)准则MSE准则运算量大,MAD运算量小,实现简单常用。搜索窗口大小(M)考虑的因素:帧间运动位移的大小和计算量。全搜索法:当M=16时,SDTV信号的计算速度:最大搜索次数:4、快速搜索法二维对数搜索法:最大搜索次数:搜索方法比较搜索法最大搜索次数△m4816全搜索
812891089二维对数法
162330三步法
172533共轭方向法
111935正交搜索法
913175、分级搜索离散傅里叶变换(DFT)最佳变换(KL)离散余弦变换(DCT)沃尔什变换(WH)§4.3正交变换编码一、正交变换的物理意义空间域描述的图像信号变换域描述的图像信号N*N像块N*N变换系数块很强的相关性,能量分布均匀相关性基本解除,能量分布集中变换编码系统框图:8*8或4*4像块二、一维离散余弦变换(DCT)1、离散余弦变换定义输入序列正变换:反变换:系数:核函数:DCT变换可以写成:序列可以看成是核函数和系数加权和组成。核函数展开是一组余弦函数,又称为基波向量。2、DCT基波向量例:N=8三、二维DCT变换1、二维DCT变换的定义
为N*N像块,正变换:反变换:系数:定义核函数:二维DCT变换公式:像块可以看成是核函数和系数加权和组成。
展开是N*N个N*N点的像块组(基像图)。2、DCT基图像垂直方向空间频率N=8时,展开为8*8DCT基像图。8*8点的像块(空间几何分布)变换成由8*8基图像(空间频率分布)和系数加权和构成。水平方向空间频率AC系数3、计算举例8*8点原始图像数据块DCT变换后系数块F(0,0)DC系数可以分解成级联的两次一维DCT变换计算。四、量化器方法:根据图像信号在变换域中的统计特性,在不降低预定的图像主观评价条件下,通过降低变换系数的精度或消除不必要的变换系数,实现压缩码率。举例:JPEG压缩方法量化:
根据人眼的视觉特性给定一个亮度信号量化矩阵:量化矩阵根据人眼的视觉阈值确定其中的量化因子;低频区细量化,高频区粗量化。量化因子8*8点原始图像数据块DCT变换后系数块DCT编码中,图像失真的原因:由于量化舍去了许多高频系数使图像产生模糊;对某些系数采用粗量化而产生颗粒状结构;像块的划分使相邻块的亮度不连续,即块效应。§4.4统计编码一、信息量和信息熵1、信息量
是离散无记忆信源X的符号集,i=1,2,…,N符号出现的概率
2、信息熵:信源中每个符号的平均信息量。bit/符号
是编码所需要的位数(bit)
对一个信源进行编码时最小平均码长的理论值。信息熵是测试无失真编码性能的标准。熵编码的基本原理:对于一个信源X,给出现概率较大的符号一个短码字,出现概率小的符号给一个长码字,使平均码长最小。它是基于信号统计特性的编码技术,属于无损编码。熵编码的方法:哈夫曼编码(Huffman)
算术编码(ArithmeticCoding)
游程编码用于预测编码、变换编码之后的图像系数作进一步编码。二、哈夫曼编码例:信源X,N=8出现概率信源符号新符号的概率讨论:信源X的信息熵:信源X的平均码长:编码效率高Huffman方法构造出的码不是唯一的。Huffman编码对不同信源的编码效率不一样。没有一个码字是另一个码字的前缀。应用到各种静止和活动图像压缩编码标准中。三、算术编码符号概率
符号
概率信源原始区间初始
[0,1)
0.1[0,0.1)
0.4[0.1,0.5)
0.2[0.5,0.7)
0.3[0.7,1)例:信源X,N=4,每个符号的概率为根据概率分配区间1、编码方法:输入信息为:区间定义:被编码的第n个符号的区间:被编码的第一个符号的区间:信息序列
区间初始[0,1)x3[05,0.7)x1[0.5,0.52)x4[0.514,0.52)x1[0.514,0.5146)x3[0.5143,0.51442)x4[0.514384,0.51442)x2[0.5143876,0.514402)
二进制编码并发送
算术编码器对整个消息只产生一个码字,它是[0,1)之间的一个实数。2、解码接收0.5143876第一字符为[0.5,0.7)判断所有符号的计算是否包含0.5143876确定…实际应用中采用自适应模式计算各符号的概率。当信源符号概率接近时,算术编码效率高。缺点:编码方法复杂。JPEG2000,MPEG-4,H.264压缩标准中应用。§4.5子带编码基本思想:利用带通滤波器组将信道频带分割成若干个子频带(Subband),将子频带搬移至零频处进行子带取样,再对每一个子带用一个与其统计特性相适配的编码器进行图像数据压缩。一维二子带编解码系统框图隔点采样隔点插入零样值图像的二维子带分解:水平方向滤波垂直方向滤波LL子图像LH子图像HL子图像HH子图像每个子图像可以用最适合的概率和视觉特性来分配比特率。LL频段分配较多的比特,其它频段分配较少的比特。适合于分辨率可分级的视频编码。§4.6小波变换编码小波变换:近十几年发展起来并在图像处理和语音分析等众多领域得到广泛应用的一种数学工具。一、小波变换的数学基础1、傅里叶变换正变换:反变换:
傅立叶变换是把信号分解成各种不同频率的正弦波,正弦波是傅立叶变换的基函数。2、小波变换正变换:反变换:直流分量为零
的傅里叶变换
基本小波函数(母小波),满足:由基本小波函数通过伸缩、平移后派生出来的函数族a:尺度因子,a>0,实数。b:为位移因子,实数。小波变换把信号分解成由基本小波经过移位和缩放后的一系列小波,小波函数是小波变换的基函数。小波变换结果得到的是信号不同部分、在不同伸缩尺度上的一族小波系数Wf(a,b)。卷积运算
小波变换可以看成是原始信号与一组线性带通滤波器进行卷积运算,从而把信号分解到一系列频带上进行分析处理。二、二维图像信号的小波分解LHLL1HL1LH1HH1LL2HL2LH2HH2HL1LH1HH1原图像(水平分解)(垂直分解)一级小波分解二级小波分解子带
对于不同子图像根据统计特性和人眼的视觉特性进行不同的编码传输,以压缩图像。§4.7数字声频压缩编码基础一、概论1、压缩的必要性对一套立体声信号数字化,若采样频率为48KHZ,量化比特数为20bit,则数据串行比特率为:2、压缩的途径除去声音信号中的“冗余”根据人耳的听觉特性,去除声音信号中的“不相关”时域冗余频域冗余不相关:人耳不能感知的部分二、人耳的听觉特性1、人耳的听觉阈与频率的关系等响度曲线听觉阈2、掩蔽效应同时掩蔽作用示意图掩蔽阈值和掩蔽声音的频率及强度有关系3、临界频带人耳听觉阈范围内临界频带临界频带编号中心频率(HZ)临界频带(HZ)下端截止频率(HZ)上端截止频率(HZ)150802010021501001002003250100200300
241350035001200015500251877565501550022050
如果掩蔽信号覆盖一定的频率范围,它的带宽逐渐增大时,掩蔽效应不变,直到带宽增加到超过某一个值,掩蔽效应就不在保持不变,这个带宽就是临界频带。4、时域掩蔽效应前掩蔽后掩蔽同时掩蔽5、量化噪声对编码的影响数字声频码率压缩:被
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 婴儿用品跨境贸易的机遇与挑战
- 英语阅读竞赛试卷
- 车辆交易税费抵扣贷款本金协议范本
- 成都房产交易合同范本:房屋交易售后服务及保障措施
- 隧道支护处理方案
- 车间灯光节能方案模板
- 食品项目资金使用方案
- 塔吊操作人员劳务派遣与权益保障合同
- 公共停车场车位租用及停车秩序管理合同
- 藏式风格民宿客房装修设计监理合同
- 2024年个人信用报告(个人简版)样本(带水印-可编辑)
- 2024急性脑梗死溶栓规范诊治指南(附缺血性脑卒中急诊急救专家共识总结归纳表格)
- 《智能仪器》课后习题答案
- 16J914-1 公用建筑卫生间
- 室外健身器材运输配送方案
- 20CS03-1一体化预制泵站选用与安装一
- 学前教育研究方法课题研究报告
- 文化旅游有限责任公司员工手册
- 小学语文部编版二年级上册 第三单元 口语交际:做手工(练习)
- 浅谈舞龙舞狮游戏在幼儿园中的传承 论文
- 广西华盾报废车船回收有限公司年回收拆解10000辆汽车项目环评报告
评论
0/150
提交评论