版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多媒体数据的压缩第一页,共二十三页,2022年,8月28日6.1数据压缩概述
1、
压缩的必要性声音、图像、视频和动画的数据量太大声音1分钟立体声音乐采样频率为44.1KHZ,16位量化精度的数据量为
44.1*1000*16*2*60/8=10.09MB
存储一首4分钟的歌曲约需40MB图像
1副640*480的RGB彩色图像的存储容量为
640*480*24/8=900KB视频
1秒钟(25帧/秒)的视频数据量为
25*900KB=21.97MB1张650MB的CDROM光盘只能存储约650/21.97=29.59秒的视频第二页,共二十三页,2022年,8月28日
2数据冗余空间冗余:图像内部相邻像素之间的相关性时间冗余:视频序列中前后帧之间的相关性视觉或听觉冗余(人眼或人耳具有一定的掩蔽效应)知识冗余(具有规律性的结构,用于图像理解上,如人脸)统计冗余(出现的频率具有一定的规律性,如元音多,有些辅音很少出现)结构冗余(具有纹理结构的图像区域)信息熵冗余(又叫编码冗余,用相同位数进行编码产生的冗余)第三页,共二十三页,2022年,8月28日6.2数据压缩的基本原理1、信息编码基础压缩的实质:根据数据的内在联系将数据从一种编码映射为另一种编码,又叫压缩编码。编码器(压缩)存储器或网络解码器(解压缩)输入数据输出数据数据压缩过程数据压缩方法的衡量指标压缩率:越大越好压缩质量:数据失真越小越好压缩与解压缩的速度:速度越快越好第四页,共二十三页,2022年,8月28日2、数据压缩方法无损压缩有损压缩混合编码预测编码变换编码PCM编码DPCM编码ADPCM编码帧间预测编码离散余弦变换K-L变换小波变换JPEGMPEGH.261行程编码哈夫曼编码算术编码香农编码LZW编码统计编码第五页,共二十三页,2022年,8月28日6.3数据压缩的编码算法一、无损压缩:减少或去除数据中的冗余,可以无失真地还原成原来的数据,一般适合压缩数据或程序,但是压缩比较小,一般在2:1到5:1之间。序号编码方法基本原理1行程编码将重复出现的数值序列采用出现次数和单个数值来表示2哈夫曼编码利用不同码字出现的概率不同,出现概率大的码字短,出现概率小的码字长。3算术编码将编码的消息表示成0到1之间的一个间隔,消息越长,间隔就越小,编码所需二进制位数越多。第六页,共二十三页,2022年,8月28日1.行程编码(游程编码)原理:将连续相同的数据序列用重复次数和单个数据来表示。应用:用于图像文件的压缩(尤其适合于由计算机生成的图像)如bmp和tiff等图像格式。
(1)多值信息的编码
编码格式:信息重复次数+被重复的信息
例:字符串为:atttefppppppddddss
行程编码为:a3tef6p4d2s
(2)二值信息的编码
编码格式:0或1重复的次数
例如二进制数据流为
假设行程约定以0开始,则编码为:3654
若约定以1开始,则编码为:03654第七页,共二十三页,2022年,8月28日2.哈夫曼(Huffman)编码算法步骤:(1)按照符号出现的概率大小进行排序(2)把最小的两个概率值相加,得到一个新的概率序列(3)重复上述两个步骤,直到概率值为1(4)从后往前进行编码,概率大的赋予1,概率小的赋予0。(反过来也可以)(5)写出每个符号的码字例1:字母ABCDE出现的概率分别为0.15、0.25、0.1、0.37和0.13,其哈夫曼编码为:P(C)=0.1P(E)=0.13P(CE)=0.23P(A)=0.15P(ACE)=0.38P(B)=0.25P(D)=0.37P(BD)=0.62P(ACEBD)=100001111A:00B:10C:010D:11E:011
假设共有100个字符,若采用等长编码,每个字符至少需要3位二进制,100个字母需要300位,采用哈夫曼编码则只需要15*2+25*2+10*3+37*2+13*3=223位。压缩比为300:223=1.34:1第八页,共二十三页,2022年,8月28日例2:字母ABCDE出现的概率分别为0.53、0.25、0.07、0.05和0.1,其哈夫曼编码为:A:1B:01C:0011D:0010E:000
若采用等长编码,至少需要3位二进制,100个字母需要300位,采用哈夫曼编码则需要:53*1+25*2+7*4+5*4+10*3=181位压缩比为300:181=1.65:10P(E)=0.1P(D)=0.05P(C)=0.07P(DC)=0.12P(EDC)=0.22P(B)=0.25P(EDCBA)=1000111P(EDCB)=0.47P(A)=0.5301第九页,共二十三页,2022年,8月28日3、算术编码编码原理:将被编码信源表示为[0,1)区间的一个实数,根据各符号出现的概率构造其所在区间,随着信息字符的不断出现,其所在区间越来越小,对应表示的实数也越来越小,那么表示这一消息所需的二进制位数就越多。例:假设一个4个符号的信源A={a1,a2,a3,a4},各符号出现的概率及起始编码区间如下表。信号字符出现概率编码范围a10.2[0,0.2)a20.4[0.2,0.6)a30.2[0.6,0.8)a40.2[0.8,1.0)第十页,共二十三页,2022年,8月28日如果要传送的消息为a1a2a3a2,算术编码过程为:区间计算方法:
新区间起始位置:前面区间起始位置+当前区间左端*前面区间长度
新区间长度:当前符号的概率*前面区间长度①a1,取值区间为[0,0.2)②a2,起点:0+0.2*0.2=0.04,长度0.4*0.2=0.08,新区间为[0.04,0.12)③a3,起点:0.04+0.6*0.08=0.088,长度0.2*0.08=0.016,新区间为[0.088,0.104)④a2,起点:0.088+0.2*0.016=0.0912,长度0.4*0.016=0.0064,新区间为[0.09120.0976)信息:a1a2a3a2信源符号0.20.120.1040.097600.040.0880.0912输出区间内任一数编码区间a4a3a2a10.20.60.801第十一页,共二十三页,2022年,8月28日二、有损压缩:压缩时会丢失部分数据,且丢失的数据无法恢复。是不可逆的压缩,即解压缩以后的数据与原始数据不完全一致。序号编码方法基本原理1PCM编码(脉冲编码调制)将模拟量经过采样、量化和编码得到其数字编码。2预测编码根据算法模型,用已有的样本值对新样本进行预测,得到一个预测值,将实际值与预测值相减得到预测误差,再对该误差值进行编码,如果预测越准确,误差值就越小(那误差的幅度肯定小于原始信号),那编码所需的位数就可以减少,达到压缩的目的。3变换编码将原始信号从一个域(如时间域)变换到另一个域(如频率域),然后对变换后的信号进行编码。主要用于图像数据的压缩。第十二页,共二十三页,2022年,8月28日1.PCM(PulseCodeModulation,脉冲编码调制)采样:按固定时间间隔获取一个样本值量化:按允许的误差将样本对应到近似的数值(幅度上的离散化)。有均匀量化和非均匀量化。编码:用二进制代码表示采样量化后的样本值。第十三页,共二十三页,2022年,8月28日2.预测编码(1)DPCM(差分脉冲编码调制)编码器量化器输入预测器编码器信道信道s+-ee’++s’s”编码器预测器++s’s”e’输出解码器原始信号为:s,预测器产生的预测值为:s”预测误差:e=s-s”发送端:发送经过量化的误差e’接收端:用相同的预测器获得预测值s”,
输出s’=s”+e’最终误差为:
s’-s=s”+e’-s=e’
–(s-s”)=e’-e(即量化器产生的量化误差)第十四页,共二十三页,2022年,8月28日(2)ADPCM(自适应脉冲编码调制)
自适应量化:当信号分布不均匀时,能随输入信号的变化改变量化区间的大小。自适应预测:采用过去的样本值估算下一个输入样本的预测值,得到最小的实际样本值与预测值之间的差值。(3)帧间预测编码
利用视频图像各帧之间的时间相关性,减少帧内图像信号的冗余,即不直接传送当前帧的像素值,而是传送x和其前一帧或后一帧对应像素x’之间的差值。运动补偿的帧间预测帧间内插法(4)线性预测编码(LinearPredictiveCoding,LPC)
采用过去的样本值,以一种前向反馈的方式预测当前采样值,预测值可以用过去p个样本值的线性组合来表示。该方法被广泛应用于语音处理。第十五页,共二十三页,2022年,8月28日3.变换编码将图像信号从一个域(如时间域)变换到另外一个域(如频率域),然后对变换后的信号进行量化与编码。正交变换前两个样本的联合事件正交变换后两个样本的联合事件例:有两个相邻的数据样本x1和x2,每个样本采用3bit编码,各自都有8个幅度等级,两个样本的联合事件共有64种可能,用64个点表示。对一般的像来说,两个相邻的数据样本很有可能出现近似的幅度,即很可能出现在x1=x2直线附近。对该数据进行正交变换,将坐标系逆时针旋转45度,在新坐标系中y1对应到x1=x2这条直线,那么变换后的数据样本集中在y1轴上,对这部分数据进行量化、编码和传输,其他数据不做处理,这样就达到了压缩数据的目的。常用的变换编码方法有:1、K-L变换2、傅立叶变换3、离散余弦变换等第十六页,共二十三页,2022年,8月28日1.电话语音压缩标准
数据:带宽为200Hz~3.4kHz,采样频率为8kHz,8位量化,传输速率为64kb/s
语音压缩标准:G.722(64kb/s)、G.721(32kb/s)、G.728(16kb/s)和G.729(8kb/s)
应用:数字电话通信。
6.4 常用多媒体数据压缩标准
6.4.1音频压缩标准第十七页,共二十三页,2022年,8月28日2.调幅广播语音压缩标准
数据:带宽为50hz~7khz的调幅广播语音,使用16kHz采样频率和14位量化位数时,所对应的速率为224kb/s。
语音压缩标准:G.722应用:优质语音、音乐、音频会议和视频会议等。第十八页,共二十三页,2022年,8月28日3.高保真立体声的宽带音频压缩标准
数据:采样频率44.1kHz,用16位量化,速率为每声道705kb/s。语音压缩标准:MPEG音频MPEG-1音频:层Ⅰ(简化的ASPEC)层Ⅱ(即MUSICAM,又称MP2)层Ⅲ(又称MP3)。
MPEG-2音频:多声道,5.1声道形式及7.1声道形式
应用:影剧院、家庭影院系统,及将来的高清晰度电视(HDTV)。第十九页,共二十三页,2022年,8月28日6.4.2静态图像压缩标准JPEG(jointphotographicexpertsgroup)联合照片专家组
1.JPEG标准适应于彩色和单色多灰度或连续色调的静止数字图像。支持很高的图像分辨率和量化精度,具有较高的压缩比和图像质量。包含了基于DCT的有损压缩方法和基于预测方法的无损压缩方法。
2.JPEG2000标准
特征:支持低比特率传输,支持无损和有损压缩,象素精度和分辨率的渐进式传输,感兴趣域编码,随机码流访问和处理。经典算法:包含三个部分:小波变换、画布坐标系统、嵌入式优化截断编码(EBCOT)。
第二十页,共二十三页,2022年,8月28日压缩标准屏幕比例分辨率帧频备注MPEG-14:3352x24029.97NTSC制式MPEG-14:3352x28825PAL制式MPEG-24:3720×48029.97NTSC制式MPEG-24:3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论