




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章 多媒体数据的压缩6.1 6.1 数据压缩概述数据压缩概述l数据压缩的必要性数据压缩的必要性l数据冗余数据冗余6.2 6.2 数据压缩的基本原理数据压缩的基本原理l信息编码基础信息编码基础l数据压缩方法数据压缩方法6.3 6.3 数据压缩的编码算法数据压缩的编码算法l统计编码(统计编码(行程编码行程编码 哈夫曼编码哈夫曼编码 算术编码)算术编码)l预测编码预测编码l变换编码变换编码6.4 6.4 常用多媒体数据压缩标准常用多媒体数据压缩标准l音频压缩编码标准音频压缩编码标准l静态图像压缩标准静态图像压缩标准l动态图像压缩标准视频压缩编码标准动态图像压缩标准视频压缩编码标准6.1 6.1
2、数据压缩概述数据压缩概述 1 1、 压缩的必要性压缩的必要性 声音、图像、视频和动画的数据量太大声音、图像、视频和动画的数据量太大n 声音声音1 1分钟立体声音乐采样频率为分钟立体声音乐采样频率为44.1KHZ44.1KHZ,1616位量化精度的数据量为位量化精度的数据量为 44.1 44.1 * * 1000 1000 * * 16 16 * * 2 2 * *60 / 8 =10.09MB60 / 8 =10.09MB 存储一首存储一首4 4分钟的歌曲约需分钟的歌曲约需40MB40MBn 图像图像 1 1副副640640* *480480的的RGBRGB彩色图像的存储容量为彩色图像的存储容
3、量为 640640* *480 480 * * 24 / 8 = 900KB 24 / 8 = 900KBn 视频视频 1 1秒钟(秒钟(2525帧帧/ /秒)的视频数据量为秒)的视频数据量为 2525* *900KB = 21.97 MB900KB = 21.97 MB1 1张张650MB650MB的的CD ROMCD ROM光盘只能存储约光盘只能存储约 650 / 21.97 = 29.59 650 / 21.97 = 29.59 秒的视频秒的视频l空间冗余:图像内部相邻像素之间的相关性空间冗余:图像内部相邻像素之间的相关性l时间冗余:视频序列中前后帧之间的相关性时间冗余:视频序列中前后帧
4、之间的相关性l视觉或听觉冗余(人眼或人耳具有一定的掩蔽效应)视觉或听觉冗余(人眼或人耳具有一定的掩蔽效应)l知识冗余(具有规律性的结构,用于图像理解上,如人脸)知识冗余(具有规律性的结构,用于图像理解上,如人脸)l统计冗余(字符出现的频率具有一定的规律性)统计冗余(字符出现的频率具有一定的规律性)l结构冗余(具有纹理结构的图像区域)结构冗余(具有纹理结构的图像区域)l信息熵冗余(又叫编码冗余,用相同位数进行编码产生的冗余)信息熵冗余(又叫编码冗余,用相同位数进行编码产生的冗余)2 数据冗余数据冗余6.2 6.2 数据压缩的基本原理数据压缩的基本原理1 1、信息编码基础、信息编码基础压缩的实质:
5、压缩的实质:根据数据的内在联系将数据从一种编码映射为另一种编码,又叫压缩编码压缩编码。编码器编码器(压缩)(压缩)存储器存储器或网络或网络解码器解码器(解压缩)(解压缩)输入数据输入数据输出数据输出数据数据压缩过程数据压缩过程数据压缩方法的衡量指标数据压缩方法的衡量指标n压缩率:越大越好压缩率:越大越好n压缩质量:数据失真越小越好压缩质量:数据失真越小越好n压缩与解压缩的速度:速度越快越好压缩与解压缩的速度:速度越快越好2 2、数据压缩方法、数据压缩方法无损压缩无损压缩有损压缩有损压缩混合编码混合编码预测编码预测编码变换编码变换编码PCMPCM编码编码DPCMDPCM编码编码ADPCMADPC
6、M编码编码帧间预测帧间预测编码编码离散余弦离散余弦变换变换K-LK-L变换变换小波变换小波变换JPEGJPEGMPEGMPEGH.261H.261行行程程编编码码哈哈夫夫曼曼编编码码算算术术编编码码香香农农编编码码LZWLZW编编码码统计编码统计编码6.3 6.3 数据压缩的编码算法数据压缩的编码算法一、无损压缩:一、无损压缩:减少或去除数据中的冗余,可以无失真无失真地还原成原来的数据,一般适合压缩数据或程序,但是压缩比较小,一般在2:1到5:1之间。序号编码方法基本原理1行程编码将重复出现的数值序列采用出现次数和单个数值来表示2哈夫曼编码利用不同码字出现的概率不同,出现概率大的码字短,出现概
7、率小的码字长。3算术编码将编码的消息表示成0到1之间的一个间隔,消息越长,间隔就越小,编码所需二进制位数越多。1. 1. 行程编码(游程编码)行程编码(游程编码)n 原理原理: :将连续相同的数据序列用重复次数和单个数据来表示。将连续相同的数据序列用重复次数和单个数据来表示。n 应用:应用:用于图像文件的压缩(尤其适合于由计算机生成的图像)用于图像文件的压缩(尤其适合于由计算机生成的图像)如如bmpbmp和和tifftiff等图像格式。等图像格式。 (1 1)多值信息的编码)多值信息的编码 编码格式:信息重复次数编码格式:信息重复次数+ +被重复的信息被重复的信息 例: 字符串为:atttef
8、ppppppddddss 行程编码为:a3tef6p4d2s (2 2)二值信息的编码)二值信息的编码 编码格式:编码格式:0 0或或1 1重复的次数重复的次数 例如二进制数据流为 000111111000001111 假设行程约定以0开始,则编码为:3654 若约定以1开始,则编码为:036542. 2. 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码n 算法步骤:(1)按照符号出现的概率大小进行排序(2)把最小的两个概率值相加,得到一个新的概率序列(3)重复上述两个步骤,直到概率值为1 (4)从后往前进行编码,概率大的赋予1,概率小的赋予0。 (反过来也可以)(5)写出每个符号的
9、码字例例1:字母:字母A B C D E出现的概率分别为出现的概率分别为0.15、0.25、0.1、0.37和和0.13,其哈夫曼编码为:其哈夫曼编码为:P(C)=0.1P(C)=0.1P(E)=0.13P(E)=0.13P(CE)=0.23P(CE)=0.23P(A)=0.15P(A)=0.15P(ACE)=0.38P(ACE)=0.38P(B)=0.25P(B)=0.25P(D)=0.37P(D)=0.37P(BD)=0.62P(BD)=0.62P(ACEBD)=1P(ACEBD)=10 00 00 00 01 11 11 11 1A: 00A: 00B: 10B: 10C: 010C:
10、010D: 11D: 11E: 011E: 011 假设共有100个字符,若采用等长编码,每个字符至少需要3位二进制,100个字母需要300位,采用哈夫曼编码则只需要15*2+25*2+10*3+37*2+13*3=223位。压缩比为压缩比为 300:223 = 1.34:1例例2:字母:字母A B C D E出现的概率分别为出现的概率分别为0.53、0.25、0.07、0.05和和0.1, 其哈夫曼编码为:其哈夫曼编码为:A: 1A: 1B: 01B: 01C: 0011C: 0011D: 0010D: 0010E: 000E: 000 若采用等长编码,至少需要3位二进制,100个字母需要3
11、00位,采用哈夫曼编码则需要:53*1+25*2+7*4+5*4+10*3=181位压缩比为压缩比为 300300:181 = 1.65:1181 = 1.65:10P(E)=0.1P(E)=0.1P(D)=0.05P(D)=0.05P(C)=0.07P(C)=0.07P(DC)=0.12P(DC)=0.12P(EDC)=0.22P(EDC)=0.22P(B)=0.25P(B)=0.25P(EDCBA)=1P(EDCBA)=10 00 00 01 11 11 1P(EDCB)=0.47P(EDCB)=0.47P(A)=0.53P(A)=0.530 01 13、算术编码、算术编码n 编码原理编码
12、原理:将被编码信源表示为0,1)区间的一个实数,根据各符号出现的概率构造其所在区间,随着信息字符的不断出现,其所在区间越来越小,对应表示的实数也越来越小,那么表示这一消息所需的二进制位数就越多。例例:假设一个4个符号的信源A=a1,a2,a3,a4 ,各符号出现的概率及起始编码区间如下表。信号字符出现概率编码范围a10.2 0 , 0.2 )a20.4 0.2 , 0.6 )a30.2 0.6 , 0.8 )a40.2 0.8 , 1.0 )如果要传送的消息为a1a2a3a2,算术编码过程为:n 区间计算方法:区间计算方法: 新区间起始位置:新区间起始位置:前面区间起始位置前面区间起始位置 +
13、 + 当前区间左端当前区间左端 * * 前面区间长度前面区间长度 新区间长度:新区间长度:当前符号的概率当前符号的概率 * * 前面区间长度前面区间长度 a1 a1,取值区间为,取值区间为00, 0.2)0.2) a2 a2,起点:,起点:0+0.20+0.2* *0.2=0.040.2=0.04,长度,长度0.40.4* *0.2=0.080.2=0.08,新区间为,新区间为 0.040.04, 0.12)0.12) a3 a3,起点:,起点:0.04+0.60.04+0.6* *0.08=0.0880.08=0.088,长度,长度0.20.2* *0.08=0.0160.08=0.016,
14、新区间为,新区间为 0.088 0.088 ,0.104)0.104) a2 a2,起点:,起点:0.088+0.20.088+0.2* *0.016=0.09120.016=0.0912,长度,长度0.40.4* *0.016=0.00640.016=0.0064,新区间为,新区间为 0.0912 0.0976)0.0912 0.0976)信息:信息: a a1 1 a a2 2 a a3 3 a a2 2信源符号信源符号0.2 0.12 0.104 0.09760.2 0.12 0.104 0.09760 0.04 0.088 0.09120 0.04 0.088 0.0912输出区间内任
15、一数输出区间内任一数编码区间编码区间a4a4a3a3a2a2a1a10.20.20.60.60.80.80 01 1二、有损压缩:压缩时会丢失部分数据,且丢失的数据无法恢复。是不可逆的压缩,即解压缩以后的数据与原始数据不完全一致。序号编码方法基本原理1PCM编码(脉冲编码调制)将模拟量经过采样、量化和编码得到其数字编码。2预测编码根据算法模型,用已有的样本值对新样本进行预测,得到一个预测值,将实际值与预测值相减得到预测误差,再对该误差值进行编码,对该误差值进行编码,如果预测越准确,误差值就越小(那误差的幅度肯定小于原始信号),那编码所需的位数就可以减少,达到压缩的目的。3变换编码将原始信号从一
16、个域(如时间域)变换到另一个域(如频率域),然后对变换后的信号进行编码。主要用于图像数据的压缩。1. PCM1. PCM(Pulse Code Modulation,Pulse Code Modulation,脉冲编码调制)脉冲编码调制)n采样:采样:按固定时间间隔获取一个样本值按固定时间间隔获取一个样本值n量化:量化:按允许的误差将样本对应到近似的数值(幅度上的离散化)按允许的误差将样本对应到近似的数值(幅度上的离散化) 。有均。有均匀量化和非均匀量化。匀量化和非均匀量化。n编码:编码:用二进制代码表示采样量化后的样本值。用二进制代码表示采样量化后的样本值。2.2.预测编码预测编码(1 1)
17、DPCMDPCM(差分脉冲编码调制)(差分脉冲编码调制)编码器编码器量化器输入预测器编码器信道信道s+-ee+ss”编码器预测器+ss”e输出解码器解码器n原始信号为:原始信号为:s,预测器产生的预测值为:s”n预测误差:预测误差:e=s-s”n发送端:发送端:发送经过量化的误差en接收端:接收端:用相同的预测器获得预测值s”, 输出s=s”+en最终误差为:最终误差为: s-s = s”+e-s = e (s-s”) = e-e(即量化器产生的量化误差)(2 2)ADPCMADPCM(自适应脉冲编码调制)(自适应脉冲编码调制) 自适应量化:自适应量化:当信号分布不均匀时,能随输入信号的变化改
18、变量化区间的大小。 自适应预测:自适应预测:采用过去的样本值估算下一个输入样本的预测值,得到最小的实际样本值与预测值之间的差值。(3 3)帧间预测编码)帧间预测编码 利用视频图像各帧之间的时间相关性,减少帧内图像信号的冗余,即不直接传送当前帧的像素值,而是传送x和其前一帧或后一帧对应像素x之间的差值。 运动补偿的帧间预测运动补偿的帧间预测 帧间内插法帧间内插法(4 4) 线性预测编码(线性预测编码(Linear Predictive Coding,LPCLinear Predictive Coding,LPC) 采用过去的样本值,以一种前向反馈的方式预测当前采样值,预测值可以用过去p个样本值的
19、线性组合来表示。该方法被广泛应用于语音处理。3. 3. 变换编码变换编码 将图像信号从一个域(如时间域)变换到另外一个域(如频率域),然后对变将图像信号从一个域(如时间域)变换到另外一个域(如频率域),然后对变换后的信号进行量化与编码。换后的信号进行量化与编码。正交变换前两个样本的联合事件正交变换前两个样本的联合事件正交变换后两个样本的联合事件正交变换后两个样本的联合事件例:有两个相邻的数据样本x1和x2,每个样本采用3bit编码,各自都有8个幅度等级,两个样本的联合事件共有64 种可能, 用64个点表示。对一般的像来说,两个相邻的数据样本很有可能出现近似的幅度,即很可能出现在x1=x2直线附
20、近。 对该数据进行正交变换,将坐标系逆时针旋转45度,在新坐标系中y1对应到x1=x2这条直线,那么变换后的数据样本集中在y1轴上,对这部分数据进行量化、编码和传输,其他数据不做处理,这样就达到了压缩数据的目的。常用的变换编码方法有:常用的变换编码方法有:1 1、K-LK-L变换变换2 2、傅立叶变换、傅立叶变换3 3、离散余弦变换等、离散余弦变换等1 1电话语音压缩标准电话语音压缩标准 数据:数据:带宽为200Hz3.4kHz ,采样频率为8kHz, 8位量化,传输速率为64kb/s 语音压缩标准语音压缩标准:G.722(64kb/s)、G.721(32kb/s)、G.728(16kb/s)
21、和G.729(8kb/s) 应用:应用:数字电话通信。 6.4 常用多媒体数据压缩标准常用多媒体数据压缩标准6.4.1 6.4.1 音频压缩标准音频压缩标准2. 2. 调幅广播语音压缩标准调幅广播语音压缩标准 数据:数据:带宽为50hz 7khz的调幅广播语音,使用16kHz采样频率和14位量化位数时,所对应的速率为224kb/s。 语音压缩标准语音压缩标准:G.722应用:应用:优质语音、音乐、音频会议和视频会议等。3 3高保真立体声的宽带音频压缩标准高保真立体声的宽带音频压缩标准 数据:数据:采样频率44.1kHz,用16位量化,速率为每声道705 kb/s 。语音压缩标准语音压缩标准:M
22、PEG音频MPEG-1音频: 层(简化的ASPEC) 层(即MUSICAM,又称MP2) 层(又称MP3)。 MPEG-2音频:多声道,5.1声道形式及7.1声道形式 应用:应用:影剧院、家庭影院系统,及将来的高清晰度电视(HDTV)。6.4.2 6.4.2 静态图像压缩标准静态图像压缩标准JPEG JPEG (joint photographic experts groupjoint photographic experts group)联合照片专家组)联合照片专家组 1.JPEG1.JPEG标准标准 适应于彩色和单色多灰度或连续色调的静止数字图像。支持很高的适应于彩色和单色多灰度或连续色调
23、的静止数字图像。支持很高的图像分辨率和量化精度,具有较高的压缩比和图像质量。包含了基于图像分辨率和量化精度,具有较高的压缩比和图像质量。包含了基于DCT的有损压缩方法和基于预测方法的无损压缩方法。的有损压缩方法和基于预测方法的无损压缩方法。 2.JPEG20002.JPEG2000标准标准 特征:支持特征:支持低比特率传输,支持无损和有损压缩,象素精度和分辨率的渐进式传输,感兴趣域编码,随机码流访问和处理。 经典算法:经典算法:包含三个部分:小波变换、画布坐标系统、嵌入式优化截断编码(EBCOT)。 压缩标准压缩标准屏幕比例屏幕比例分辨率分辨率帧频帧频备注备注MPEG-1 MPEG-1 4 4:3 3352x240352x24029.9729.97NTSCNTSC制式制式MPEG-1 MPEG-1 4 4:3 3352x288352x2882525PAL PAL 制式制式MPEG-2 MPEG-2 4 4:3 372072048048029.9729.97NTSCNTSC制式制式MPEG-2 MPEG-2 4 4:3 37207205765762525PAL PAL 制式制式HDTVHDTV161
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国外矿山承包合同协议
- 外包合同解除协议
- 小区废品回收合同协议
- 工厂车间包工合同协议
- 电器类加工协议合同
- 租赁舞台合同协议
- 私人购车抵押合同协议
- 石油合作协议合同协议
- 种子订购合同定金协议
- 种植项目转让合同协议
- 《工程科学与技术》论文投稿模板
- 精美乒乓球运动活动策划方案PPT
- GB/T 18050-2000潜油电泵电缆试验方法
- GB 7793-2010中小学校教室采光和照明卫生标准
- FZ/T 24011-2019羊绒机织围巾、披肩
- 金螳螂企业管理课件
- 炊事机械安全操作规程
- 最新版教育心理学课件3-成就动机
- 离合器-汽车毕业设计-设计说明书
- 中国民间美术年画-完整版PPT
- 2022年《趣味接力跑》教案
评论
0/150
提交评论