第6章多媒体数据压缩技术_第1页
第6章多媒体数据压缩技术_第2页
第6章多媒体数据压缩技术_第3页
第6章多媒体数据压缩技术_第4页
第6章多媒体数据压缩技术_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 教学目标教学目标熟悉多媒体数据压缩的基本概念及原理熟悉多媒体数据压缩的基本概念及原理 了解压缩方法的分类了解压缩方法的分类 掌握几种常用的压缩方法掌握几种常用的压缩方法掌握数据压缩的国际标准掌握数据压缩的国际标准第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.16.1多媒体数据压缩概述多媒体数据压缩概述1.1.多媒体信息的数据量巨大多媒体信息的数据量巨大 文本文本 若若10241024768768显示分辨率、显示分辨率、16161616点阵文字、点阵文字、4 4 Byte/Byte/字,则一屏汉字的总数据量为字,则一屏汉字的总数据量为: : 到到 (1024/16)(1024/16

2、)(768/16)(768/16)4 = 12288Byte4 = 12288Bytel6.1.16.1.1数据压缩的必要性数据压缩的必要性图像图像 若采用若采用640640480480显示分辨率,显示分辨率,2424位真彩色,位真彩色,则满屏图像的总数据量为则满屏图像的总数据量为: : 640 64048048024 24 8 = 8 = ?Byte(922KB)Byte(922KB)音频音频 若采样频率为若采样频率为44.1KHz16bit(2Byte) 44.1KHz16bit(2Byte) ,立体声,则,立体声,则1 1分分钟的总数据量为钟的总数据量为: : 视频视频 若采样频率最低为

3、若采样频率最低为10M,10M,样本宽度为样本宽度为24bit,24bit,扫描速度为扫描速度为2525帧帧/s,/s,则一帧数字化图像所用的最少存储空间为则一帧数字化图像所用的最少存储空间为1.2M1.2M。44.144.12 Byte2 Byte2 2 60s = 10584 KB60s = 10584 KB101024/824/81s/25= 1.2MB1s/25= 1.2MB第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术视频视频 以以PALPAL制为例,显示有效分辨率为制为例,显示有效分辨率为720720* *576576,样本宽,样本宽度为度为24bit,24bit,扫描速度为

4、扫描速度为2525帧帧/s,/s,则则1s1s的数据量是:的数据量是:720720* *576576* *24/824/8* *2525* *1s=?MB1s=?MB第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.16.1多媒体数据压缩概述多媒体数据压缩概述l6.1.16.1.1数据压缩的必要性数据压缩的必要性2.2.有效利用存储器容量有效利用存储器容量3.3.提高通信线路的传输效率提高通信线路的传输效率4.4.消除计算机系统处理视频消除计算机系统处理视频I/OI/O瓶颈瓶颈第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.16.1多媒体数据压缩概述多媒体数据压缩概述l6.1

5、.16.1.1数据压缩的必要性数据压缩的必要性数据存在冗余数据存在冗余 ( (重复数据、可忽略数据重复数据、可忽略数据) )不敏感因素不敏感因素 ( (颜色、亮度、频率、细节颜色、亮度、频率、细节) )l6.1.26.1.2数据压缩条件数据压缩条件2 224 24 颜色颜色 (16,777,216(16,777,216色色) )2 28 8 颜色颜色 (256(256色色) )第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术信息量与冗余的关系信息量与冗余的关系冗余冗余 信息所具有的各种性质中多余的无用空间信息所具有的各种性质中多余的无用空间冗余度冗余度 多余的无用空间的程度多余的无用空间的

6、程度l6.1.3 6.1.3 数据冗余数据冗余I = D du I 信息量信息量 D 数据量数据量 du 冗余量冗余量例:例:180180个汉字,文本数据量为个汉字,文本数据量为360B360B。广播员朗读使用广播员朗读使用1 1分钟,数字化时采样频率分钟,数字化时采样频率8KHz8KHz,8 8位量化,位量化,则数据量为则数据量为8 860s=480KB/60s=480KB/分分 一分钟语音数据有一分钟语音数据有 倍冗余倍冗余(480KB-360B)/360B=1300第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术冗余分类冗余分类11空间冗余空间冗余 规则物体的物理相关性规则物体的物理

7、相关性2 2 时间冗余时间冗余 运动图像中的相关性运动图像中的相关性3 3 统计冗余统计冗余 具有空间和时间冗余具有空间和时间冗余5 5 视觉冗余视觉冗余 视觉的敏感度和非线性感觉视觉的敏感度和非线性感觉6 6 知识冗余知识冗余 凭借经验识别凭借经验识别 4 4 结构冗余结构冗余 规则纹理、重叠的结构表面规则纹理、重叠的结构表面7 7 其他冗余其他冗余 图像的非特定性带来的图像的非特定性带来的冗余冗余第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术图像压缩系统的组成图像压缩系统的组成l6.1.4 6.1.4 压缩原理压缩原理变换器变换器量化器量化器编码器编码器输入图像输入图像图像压缩的的相

8、关指标图像压缩的的相关指标压缩比压缩比 算法简单算法简单 恢复效果好恢复效果好 压缩能否用硬件实现压缩能否用硬件实现第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.2 6.2 数据压缩算法数据压缩算法l6.2.1 6.2.1 数据压缩算法分类数据压缩算法分类 无损压缩编码无损压缩编码压缩数据还原后,与原始数据一致,无损失压缩数据还原后,与原始数据一致,无损失 有损压缩编码有损压缩编码 压缩后再还原的数据有损失压缩后再还原的数据有损失无损压缩编码无损压缩编码( (可逆编码可逆编码) )霍夫曼编码霍夫曼编码行行 程程 编编 码码算算 术术 编编 码码有损压缩编码有损压缩编码( (不可逆编

9、码不可逆编码) )全频带编码全频带编码PCM / ADPCMPCM / ADPCM混混 合合 编编 码码JPEG / MPEGJPEG / MPEG按是否失真来分按是否失真来分第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l6.2.1 6.2.1 数据压缩算法分类数据压缩算法分类预测编码预测编码针对空间冗余和时间冗余针对空间冗余和时间冗余利用已被编码的点的值预测邻近的点的值利用已被编码的点的值预测邻近的点的值变换编码变换编码针对复杂图像针对复杂图像将图像或时域信号变换到频域上,再进行压缩将图像或时域信号变换到频域上,再进行压缩按是压缩原理来分按是压缩原理来分信息熵编码信息熵编码根据信息熵

10、原理,对概率大符号用短码字表示,反之用长码字表示根据信息熵原理,对概率大符号用短码字表示,反之用长码字表示典型的有哈夫曼编码、行程编码、算术编码典型的有哈夫曼编码、行程编码、算术编码混合编码混合编码把变换编码和预测编码结合的编码方法把变换编码和预测编码结合的编码方法第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l几个相关的名词几个相关的名词信息是用不确定性的量度定义的。一个消息的可能性愈小,信息是用不确定性的量度定义的。一个消息的可能性愈小,其信息愈多;而消息的可能性愈大,则其信息愈少。其信息愈多;而消息的可能性愈大,则其信息愈少。信息量:指从信息量:指从N个相等的可能事件中选出一个事件

11、所需要的信个相等的可能事件中选出一个事件所需要的信息度量和含量,也就是在息度量和含量,也就是在N个事件中辩识特定的一个事件要询问个事件中辩识特定的一个事件要询问的的“是或否是或否”的次数的次数.(假如要从(假如要从64个数中选定某一个数个数中选定某一个数)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术6(bits)64log2 6.2 6.2 数据压缩算法数据压缩算法l信息量的计算公式信息量的计算公式概率概率I(x)= log2N= - log2 = - log2p(xj)N第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术P(xP(xj j) )是信源是信源X X发出发出x xj j

12、的概率的概率; ;I(xI(xj j) )是指信源是指信源X X发出发出x xj j这个消息后,这个消息后,接收端收到信息量的量度。接收端收到信息量的量度。 6.2 6.2 数据压缩算法数据压缩算法熵:如果将信源所有可能事件的信息量进行平均,就得熵:如果将信源所有可能事件的信息量进行平均,就得到了信息熵到了信息熵(entropy)(entropy)。熵就是平均信息量。熵就是平均信息量。njjjjxPxPxIEXH12)(log)()()()()()()(1jnjjjxIxPxIEXHH(X)H(X)称为信源称为信源X X的的“熵熵”,即信源,即信源X X发出任意一个随机变量的平均信息量发出任意

13、一个随机变量的平均信息量第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.2 6.2 数据压缩算法数据压缩算法l平均码长的算法平均码长的算法 P(XP(Xj j) )为信源符号出现的概率,为信源符号出现的概率,L(XL(Xj j) )是符号的编码长度是符号的编码长度。的下限。熵值是平均码长。稍大于最佳 编佳不可能;编码;时,有冗余,不是最佳NH(X)N(H(X)LH(X)LH(X)LnjjjxLxPL1)()((j=1,2,n)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.2 6.2 数据压缩算法数据压缩算法l6.2.26.2.2常用的无损压缩方法常用的无损压缩方法 香农香

14、农范洛编码范洛编码 编码原理编码原理 1 1信号源的数据按照出现概率递信号源的数据按照出现概率递减的顺序排。减的顺序排。 22将排好序的符号分成两组,使将排好序的符号分成两组,使每组的概率之和接近或相等。每组的概率之和接近或相等。 33将第一组赋值为将第一组赋值为0 0,第二组赋值,第二组赋值为为1 1。 44把每个分组按同样原则划分,把每个分组按同样原则划分,重复重复2 2,3 3,直到不能再分。,直到不能再分。 5 5 读数时,从上到下。读数时,从上到下。4 41111141412126 63 3F FE ED DC CB BA A例:有六个字母组成的字符串例:有六个字母组成的字符串长度为

15、长度为5050,各个字母出现的次,各个字母出现的次数分别为:数分别为:ABCDEFABCDEF第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术4 41111141412126 63 3F FE ED DC CB BA A3 34 46 6111112121414A AF FB BE EC CD DABCDEFD CEBFADCBFAEBFAFA0100001111符号符号编码编码A AB BC CD DE EF F11111100100101110概率概率3/503/506/506/5012/5012/5014/5014/5011/5011/504/504/50第第6 6章章 多媒体数据压

16、缩技术多媒体数据压缩技术A AB BC CD DE EF F编码编码111111001001011101.信息符号的熵值:信息符号的熵值:H(x)=符号符号概率概率3/503/506/506/5012/5012/5014/5014/5011/5011/504/504/503/25log2(25/3)+3/50log2(50/3)+2. 符号的平均码长:符号的平均码长:niiixLxPL1)()(L=3/50 4 +3/25 3+(6/25+7/25+11/50+2/25) 2+2/25 4第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.2 6.2 数据压缩算法数据压缩算法l6.2.2

17、6.2.2常用的无损压缩方法常用的无损压缩方法霍夫曼编码霍夫曼编码 无损编码无损编码 编码原理编码原理出现频率高的数据编码长度短,反之亦然出现频率高的数据编码长度短,反之亦然 1 1 信号源的数据按照出现概率递减的顺序排列信号源的数据按照出现概率递减的顺序排列 2 2 合并两个最小出现概率,作为新数据出现概率合并两个最小出现概率,作为新数据出现概率 3 3 重复进行重复进行1212,直至概率相加为,直至概率相加为1 1为止为止 4 4 合并运算时,概率大者取合并运算时,概率大者取1 1,概率小者取,概率小者取0 0 5 5 记录概率为记录概率为1 1处到信号源的处到信号源的0 0、1 1序列序

18、列l编码特点编码特点编码长度可变,压缩与解压缩较慢编码长度可变,压缩与解压缩较慢硬件实现困难硬件实现困难编码效率取决于信号源的数据出现概率编码效率取决于信号源的数据出现概率第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术ABCDEFG0.230.070.180.210.130.150.03例例:信源符号及其概率如下所示,试求霍夫曼编码、平均码长及熵。信源符号及其概率如下所示,试求霍夫曼编码、平均码长及熵。ABCDEFG0.230.070.180.210.130.150.03ADCFEBG0.230.210.180.150.130.070.03GB0.1001E0.2301FC0.33DA0

19、.4401010.56011.001A:B:C:D:E:F:G:011001111001011101000第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l解法一:解法一:A AD DC CF FE EB BG G0.230.230.210.210.180.180.150.150.130.130.070.070.030.03霍夫曼码霍夫曼码l解法二:解法二:第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术信源信源概率概率1.信息符号的熵值为:信息符号的熵值为:H(x)=-0.23log20.23-0.21log20.21-0.18log20.18-0.15log20.15-0.13lo

20、g20.13-0.07log20.07-0.03log20.03符号符号概率概率2. 符号的平均码长为:符号的平均码长为:niiixLxPL1)()(LA AD DC CF FE EB BG G霍夫曼码霍夫曼码=0.232+0.212+0.183+0.153+0.133+0.074+0.034=2.66第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术x1x2x3x4x5x6x70.200.080.350.050.150.100.07练习题练习题:信源符号及其概率如下所示信源符号及其概率如下所示:求出各信源符号的霍夫曼编码。求出各信源符号的

21、霍夫曼编码。求出平均码长。求出平均码长。求出熵并写出熵的计算公式。求出熵并写出熵的计算公式。符号符号A AD DC CF FE EB BG G霍夫曼码霍夫曼码1.1.写出写出ABCDEFABCDEF的霍夫曼的编码。(编码过程)的霍夫曼的编码。(编码过程)2.2.霍夫曼编码霍夫曼编码111111101101100010000101100110011101100000(译码过程)(译码过程)0101100110011111110000101101110110CEGABFDCEGABFD第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l霍夫曼码的编码与解码过程霍夫曼码的编码与解码过程l6.2.2

22、6.2.2常用的无损压缩方法常用的无损压缩方法算数编码算数编码 无损编码无损编码算术编码方法是将被编码的信息表示成实数算术编码方法是将被编码的信息表示成实数0 0和和1 1之间的一之间的一个间隔。个间隔。信息越长编码表示它的间隙就越小,表示这一间隙所须二信息越长编码表示它的间隙就越小,表示这一间隙所须二进位就越多,进位就越多,大概率符号出现的概率越大对应于区间愈宽,大概率符号出现的概率越大对应于区间愈宽,可用长度较短的码字表示。可用长度较短的码字表示。小概率符号出现的概率越小对应于层间愈窄,需要长度较小概率符号出现的概率越小对应于层间愈窄,需要长度较长的码字表示。长的码字表示。l2020世纪世

23、纪6060年代初,年代初,EliasElias提出了算术编码概念。提出了算术编码概念。l19761976年年RissanenRissanen和和PascoPasco首次介绍该实用技术。首次介绍该实用技术。第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术符号符号a ab bc cd d概率概率0.10.10.40.40.20.20.30.3初始间码间隔初始间码间隔0,0.1)0,0.1)0.1,0.5)0.1,0.5)0.5,0.7)0.5,0.7)0.7,10.7,1设:设:lowlow为编码间隔的低端为编码间隔的低端 ;highhigh为高端;为高端;range range 为编码间为编

24、码间隔的长度;隔的长度;rangelow rangelow 为编码字符分配的间为编码字符分配的间隔低端隔低端 ;rangehigh rangehigh 为编码字符分配的为编码字符分配的间隔高端间隔高端 。 初始初始 high=1,low=0,rangehigh=1,low=0,rangehigh-high-low,low,初始值计算公式:初始值计算公式:low =lowlow =lowrange range rangelow rangelowhigh =lowhigh =lowrangerangerangehighrangehigh此时分配给初始值的范围为此时分配给初始值的范围为low, lo

25、w, high high 例:输入序列为例:输入序列为cadacdbcadacdb第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术0.7,10.7,10.5,0.70.5,0.7)0.1,0.5)0.1,0.5)0,0.1)0,0.1)初始编码间隔初始编码间隔0.30.30.20.20.40.40.10.1概率概率d dc cb ba a符号符号设:设:lowlow为编码间隔的低端;为编码间隔的低端;highhigh为高端为高端rangerange为编码间隔的长度;为编码间隔的长度;rangelowrangelow为编码字符分配间隔低端为编码字符分配间隔低端rangehighrangehi

26、gh为编码字符分配的间隔高端为编码字符分配的间隔高端第二个数值计算公式第二个数值计算公式 以第一值后生成的编码间隔以第一值后生成的编码间隔为初始值,再重复(为初始值,再重复(1 1)(3 3)以下值的计算以此类推)以下值的计算以此类推例:输入序列为例:输入序列为cadacdbcadacdb第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.2 6.2 数据压缩算法数据压缩算法0.7,10.7,10.5,0.7)0.5,0.7)0.1,0.5)0.1,0.5)0,0.1)0,0.1)初始编码间隔初始编码间隔0.30.30.20.20.40.40.10.1 概率概率d dc cb ba a

27、符号符号例:输入序列为例:输入序列为cadacdbcadacdb初始初始 high=1,low=0,rangehigh=1,low=0,rangehigh-high-low,low,初始值计算公式:初始值计算公式:low=lowlow=lowrangerangerangelowrangelowhigh=lowhigh=lowrangerangerangehighrangehigh此时分配给初始值的范围为此时分配给初始值的范围为low, low, highhigh 第一个字符第一个字符c c编码时编码时low=0+1low=0+10.5=0.5 0.5=0.5 high=0+1high=0+10

28、.7=0.7 0.7=0.7 range=high-low=0.7-0.5=0.2 range=high-low=0.7-0.5=0.2 此时分配给此时分配给c c的范围为的范围为0.5, 0.70.5, 0.7第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术0.7,10.7,10.5,0.7)0.5,0.7)0.1,0.5)0.1,0.5)0,0.1)0,0.1)初始编码间隔初始编码间隔0.30.30.20.20.40.40.10.1概率概率d dc cb ba a 符号符号例:输入序列为例:输入序列为cadacdbcadacdb第二个数值计算公式第二个数值计算公式 以第一值后生成的编码

29、间隔为初以第一值后生成的编码间隔为初始值,再重复(始值,再重复(1 1)(3 3)以下值的计算以此类推)以下值的计算以此类推第二个字符第二个字符a a编码时编码时: :初始值为初始值为0.5, 0.5, 0.70.7range=high-low=0.7-0.5=0.2range=high-low=0.7-0.5=0.2low=0.5+0.2low=0.5+0.20=0.5 0=0.5 high=0.5+0.2high=0.5+0.20.1=0.52 0.1=0.52 此时分配给此时分配给e e的范围为的范围为0.5, 0.520.5, 0.52第第6 6章章 多媒体数据压缩技术多媒体数据压缩技

30、术0.7,10.7,10.5,0.7)0.5,0.7)0.1,0.5)0.1,0.5)0,0.1)0,0.1)初始编码间隔初始编码间隔0.30.30.20.20.40.40.10.1概率概率d dc cb ba a符号符号例:输入序列为例:输入序列为cadacdbcadacdbaabcd第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 游(行)程编码游(行)程编码 (RLE):(RLE):用一个符号值或串长代替具有相同值的用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的连续符号(连续符号构成了一段连续的“行程行程”),使符号长度少),使符号长度少于原始数据的长度。于原始

31、数据的长度。 例:例:999997777722223334444999997777722223334444(9(9,5)(7,5)(2,4)(3,3)(4,4)5)(7,5)(2,4)(3,3)(4,4)00000001111114444440000000000000111111444444000000(0,7)()(1,6)()(4,6)()(0,6)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 6.2 6.2 数据压缩算法数据压缩算法l6.2.36.2.3常用的有损压缩方法(熵压缩)常用的有损压缩方法(熵压缩)l预测编码:预测编码:l根据原始的离散信号之间存在关联性的特点,利用前面

32、的一个根据原始的离散信号之间存在关联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差或多个信号对下一个信号进行预测,然后对实际值和预测值的差进行编码。常用的有进行编码。常用的有PCMPCM(脉冲编码调制),拆分脉冲编码调制(脉冲编码调制),拆分脉冲编码调制(DPCMDPCM),自适应拆分脉冲编码调制(),自适应拆分脉冲编码调制(ADPCMADPCM). .第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l6.2.36.2.3常用的有损压缩方法(熵压缩)常用的有损压缩方法(熵压缩) 差分脉冲编码调制(差分脉冲编码调制(DPCMDPCM) 差值编码差值编码 差分

33、脉冲编码调制原理差分脉冲编码调制原理 在发送端在发送端: :处理或传输的不是图像中当前样值本身,而是该样值处理或传输的不是图像中当前样值本身,而是该样值与前一个(相邻)样值的差值,则这些差值绝大多数是很小的或为与前一个(相邻)样值的差值,则这些差值绝大多数是很小的或为零,可以用短码来表示,而对那些出现几率较少的较大差值,用长零,可以用短码来表示,而对那些出现几率较少的较大差值,用长码来表示,则可使总体码数下降。码来表示,则可使总体码数下降。 在接收端在接收端: :将已得到的前一样值与刚收到的差值相加,就可还原将已得到的前一样值与刚收到的差值相加,就可还原出所要的当前样值。出所要的当前样值。l对

34、相邻的样值差值进对相邻的样值差值进行变字长编码的方式称行变字长编码的方式称为差值编码为差值编码。第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l6.2.36.2.3常用的有损压缩方法(熵压缩)常用的有损压缩方法(熵压缩)1.1.差值编码差值编码(1)(1)视频信号的空间视频信号的空间( (帧内帧内) )相关性的统计分析相关性的统计分析 视频图的组成视频图的组成: “: “像块像块”、“轮廓轮廓”和和“细节细节”“像块像块”-是图像中成片相同像素组成的块,它的空间相关性最强。是图像中成片相同像素组成的块,它的空间相关性最强。“轮廓轮廓”-是像块间的分界,它的相关性较差。是像块间的分界,它的

35、相关性较差。”细节细节”-是图像中变化最频繁的细节描述,相关性最小。是图像中变化最频繁的细节描述,相关性最小。统计结果统计结果: “: “像块像块”要占约要占约9090以上;以上; “ “轮廓轮廓”和和“细节细节”只占不到只占不到1010。(2 2)时间)时间( (帧间帧间) )相关性的分析相关性的分析在静止画面中,其帧间相同位置的样值则在静止画面中,其帧间相同位置的样值则100100的相同。的相同。在非静止画面中,相邻帧的不同部分也只是运动物体,只占较小的比例在非静止画面中,相邻帧的不同部分也只是运动物体,只占较小的比例第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l差值编码原理图差值

36、编码原理图)1()()( D DnininiVVVV o(n)= V o(n-1)+ V i(n)+(n)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 2.2.差分脉冲编码调制(差分脉冲编码调制(DPCMDPCM)预测编码预测编码如图所示:设如图所示:设XnXn为实际样值,为实际样值,X X n n为其预测值为其预测值 A A:本行前一样值:本行前一样值 B B:上一行前一样值:上一行前一样值 C C:上一行该点样值:上一行该点样值 D D:前一帧该点样值:前一帧该点样值 预测值预测值X X n n应为:应为:X X n n= =F F(A A,B B,C C,D D) 三维预测三维预

37、测 第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术预测编码预测编码(2 2)线性预测)线性预测 上式应为:上式应为:Xn= KaA+KbB+KcC+KdD Xn= KaA+KbB+KcC+KdD 其中其中KaKa、KbKb、KcKc、KdKd分别为分别为A A、B B、C C、D D的权重或系数。的权重或系数。 一般有一般有 : Ka+Kb+Kc+Kd=1 Ka+Kb+Kc+Kd=1 讨论:讨论: 当当Kb=Kc=Kd=0Kb=Kc=Kd=0,Ka=1Ka=1时,时, 当当Ka+Kb+Kc=1Ka+Kb+Kc=1,Kd=0Kd=0时,时, 当当Kd0Kd0为三维预测,为三维预测,为一维差

38、值预测。为一维差值预测。为二维预测,即帧内预测。为二维预测,即帧内预测。即帧间预测。即帧间预测。发送端发送端: XnXn Xn第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 3.3.变换编码变换编码离散余弦变换离散余弦变换1.1.离散余弦变换(离散余弦变换(DCTDCT) (1)(1)视频图像的频率特征:低频信号的幅值大,高频信号幅值小。图像信视频图像的频率特征:低频信号的幅值大,高频信号幅值小。图像信号的能量主要集中于信号的低频分量号的能量主要集中于信号的低频分量, ,而高频分量的能量较小。而高频分量的能量较小。(2)(2)相关性分析:对于变化复杂的图像来说位置空间的相关性并不明显。相

39、关性分析:对于变化复杂的图像来说位置空间的相关性并不明显。(3)DCT(3)DCT变换的方法变换的方法 分块:将每个分量图像分成许多分块:将每个分量图像分成许多8 88=648=64个样点组成的像块,并对个样点组成的像块,并对其采样,得到在空域中的其采样,得到在空域中的8 88 8的样值矩阵。的样值矩阵。 变换:利用变换:利用FDCTFDCT公式,将空域中的公式,将空域中的8 88 8样值矩阵,正向变换样值矩阵,正向变换(FDCTFDCT)为频域中的)为频域中的8 88 DCT8 DCT系数矩阵。系数矩阵。第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术 如图示:如图示:低频低频高频高频第

40、第6 6章章 多媒体数据压缩技术多媒体数据压缩技术a:a:两个空间的同位置系数无对应两个空间的同位置系数无对应关系。关系。b:b:在频域中的右下角对应高频部在频域中的右下角对应高频部分,而在左上角对应低频部分分,而在左上角对应低频部分c:DCc:DC系数的构成系数的构成:d:DCTd:DCT系数的取值范围:在视频数字系数的取值范围:在视频数字化中,由于采用化中,由于采用8 8位量化,在空位量化,在空域中的样值的最大值应为域中的样值的最大值应为256256,所以所以 F F(0 0,0 0)MAX=DCMAX=256MAX=DCMAX=25664/8=204864/8=2048 故:故:0DC2

41、047 0DC2047 ACAC的取值范围:的取值范围: -1024AC1023 -1024AC1023DCyxfFyx7070),(81) 0 , 0(第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术e:DCTe:DCT系数规律:低频系数值大,高频系数值小系数规律:低频系数值大,高频系数值小f:f:对比两个数值矩阵观察相关性对比两个数值矩阵观察相关性 f =170 132 185 147 190 215 220185 130 190 175 195 223 199 163 180 220 202 173 197 170 154 160 170 211 185 190 166140 172

42、 190 193 150 180 140 164 198 180 177 141 172 135 190 163 140 165 132 160 140 160 200 145 135 170 199 190 129 第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术f f( (x x, ,y y),),F F( (u u, ,v v) )矩阵矩阵 F=136.2340 -48.8294 -39.2458 9.8608 -22.6310 11.6491 -63.7071 -5.3816 62.2669 -77.2554 16.1615 -12.8255 35.0540 23.9713 -5.

43、6764 -41.699117.5839 -17.4069 25.5760 26.7426 -26.4953 -12.8395 -10.5650 -43.593518.6219 18.1673 23.2682 -26.0828 17.7958 21.6025 10.0939 6.4744-9.1274 -32.1913 0.3414 12.5642 -10.6278 -7.2710 7.0297 -8.1319-9.2768 10.0678 12.2530 -9.9202 10.1096 -12.9974 10.0253 10.542210.7947 2.3326 -29.5610 -20.2

44、712 -7.3535 12.1952 9.6559 0.2945-8.3913 12.2379 -8.4750 -6.5153 15.8826 13.3316 -2.1819 2.2038第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术2.DCT2.DCT系数量化系数量化 DCTDCT之后其系数矩阵中相关性不够明显,之后其系数矩阵中相关性不够明显,DCTDCT系数量化是基于限系数量化是基于限失真编码理论进行的,容许有失真,但应在视觉容许的容限内。失真编码理论进行的,容许有失真,但应在视觉容许的容限内。视觉要求:视觉要求: a. a. 对亮度信号与色度信号的分辨能力不同对亮度信号与色度信号

45、的分辨能力不同; ; b. b. 对低频图像信号和高频图像信号的分辨能力不同。对低频图像信号和高频图像信号的分辨能力不同。 结论:可以采用不同的量化方案。结论:可以采用不同的量化方案。量化的方法:量化的方法:区域滤波法:是采用式:区域滤波法:是采用式:Q(U,V)=roundF(U,V)/W(U,V)Q(U,V)=roundF(U,V)/W(U,V)对对DCTDCT系数矩阵中的每一个值逐一量化系数矩阵中的每一个值逐一量化 。第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术Y量化步长(量化步长(W)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术-3 -2 0 0 0 0 0-4 0 0

46、 0 0 0 00 0 1 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Q=Q(U,V)=roundF(U,V)/W(U,V)Q(U,V)=roundF(U,V)/W(U,V)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术3.Zig-Zag3.Zig-Zag扫描:一种将二维数组转变为一维数组的扫描:一种将二维数组转变为一维数组的Z Z字形扫字形扫描方法。描方法。 (1)Zig-Zag(1)Zig-Zag扫描的依据:在量化后的扫描的依据:在量化后的DCTDCT系

47、数矩阵中,非系数矩阵中,非0 0的的数据主要都集中于矩阵的左上角。数据主要都集中于矩阵的左上角。第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术(2)Zig-Zag扫描的方法:扫描的方法:Zig-Zag扫描采用的是扫描采用的是Z字形扫字形扫描方式,从直流分量描方式,从直流分量DC开始进行开始进行Z字形扫描。字形扫描。 -3 -2 0 0 0 0 0-4 0 0 0 0 0 00 0 1 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Q=4.4.游程(行程)编码游程

48、(行程)编码 :(参照右边的(参照右边的Z Z形图走,可得出行程编码值)形图走,可得出行程编码值)5.5.熵编码:霍夫曼编码熵编码:霍夫曼编码(8,1)()(-3,1)()(3,1)()(0,1)()(-4,1)()(-2,1)()(0,6) (1,1) (0,51)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术lJPEGJPEG压缩是一种针对静止的连续色调的图像压缩方法,压缩是一种针对静止的连续色调的图像压缩方法,19921992年正式称为国际标准。是国际上彩色、灰度、静止图像的第一年正式称为国际标准。是国际上彩色、灰度、静止图像的第一个国际标准。个国际标准。lJPEGJPEG标准是一

49、个适合范围广泛的通用标准。它不仅适于静图标准是一个适合范围广泛的通用标准。它不仅适于静图像的压缩,电视图像序列的帧内图像的压缩编码也常采用像的压缩,电视图像序列的帧内图像的压缩编码也常采用JPEGJPEG压缩标准。压缩标准。l它包括它包括DPCMDPCM、DCTDCT的有损压缩及无损压缩两个部分的有损压缩及无损压缩两个部分l6.3.1 JPEG6.3.1 JPEG静止图像压缩标准静止图像压缩标准第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术l6.3.2 6.3.2 基于基于DCTDCT编码的编码的JPEGJPEG压缩过程压缩过程 1. 1.分块采样分块采样( (帧改组帧改组) )JPEG

50、JPEG压缩编码对象:为连续色调静止图像各分量信号压缩编码对象:为连续色调静止图像各分量信号进行单独采样。进行单独采样。4:2:04:2:0格式中各分量信号的采样点数:格式中各分量信号的采样点数: PALPAL制:亮度信号制:亮度信号(Y)(Y)的有效采样点数为的有效采样点数为720720576576 色差信号(色差信号(U U,V V)有效采样点数均为)有效采样点数均为360360288288帧改组:采样时帧改组:采样时, ,当一帧图像信号输入到编码器时,编当一帧图像信号输入到编码器时,编码器对其进行的分解处理,称为帧改组。码器对其进行的分解处理,称为帧改组。帧改组方法:(亮度信号)帧改组方

51、法:(亮度信号)第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术分片:将图像分割成许多横向条分片:将图像分割成许多横向条( (或称或称“片片”)”),每条的宽度为,每条的宽度为1616个个采样点。采样点。1616像素像素3636161645451616宏区块宏区块分像块:将宏区块再分成分像块:将宏区块再分成4 4个个8 88 8样点组成的像块。样点组成的像块。分段:以分段:以1616个采样点在横向为一段进行切割个采样点在横向为一段进行切割, , 得到得到16161616个采样点个采样点构成的块,称为宏区块。构成的块,称为宏区块。12348 88 8像块像块第第6 6章章 多媒体数据压缩技术

52、多媒体数据压缩技术宏块的形成:由宏块的形成:由4 4个个8 88 8的亮度的亮度(Y)(Y)像块组成的宏区块和与之重叠像块组成的宏区块和与之重叠的两个的两个8 88 8的色差的色差(U(U,V )V )像块,这像块,这6 6个像块组成一个宏块。如图:个像块组成一个宏块。如图: C CR RC CB BY YC CR RY Y8 88 8像块像块8 88 8像块像块8 88 88 88 88 88 88 88 8宏块结构图宏块结构图C CB B第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术2.FDCT2.FDCT变换变换由由f(xf(x,y),y),变换为变换为8 88=648=64个个F

53、DCTFDCT系数系数F(u,v)F(u,v)。3.3.量化(量化(区域滤波法区域滤波法)4.4.差值编码与差值编码与Zig-ZagZig-Zag扫描后行程编码扫描后行程编码5.5.熵编码并输出数据流熵编码并输出数据流1.1.对对DCDC系数进行差值编码传输:系数进行差值编码传输:DCDCn+1n+1-DC-DCn n2.AC2.AC系数进行系数进行Z Z扫描并行程编码扫描并行程编码DC = DCn+1-DCn=2DC = DCn+1-DCn=2已知,已知,DCn=2DCn=22 4 4 3 4 4 3 3 3 3 2 2 2 1 1 1 1 1 12 4 4 3 4 4 3 3 3 3 2

54、2 2 1 1 1 1 1 11 1 0.1 1 0.行程编码:行程编码:(2,12,1)()(4,24,2)()(3,13,1)()(4,24,2)(3,43,4)()(2,32,3)()(1,81,8)()(0,430,43)DCDC第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术44-2311004-430100043010000-21100000-21000000100000001000000000000000已知,已知,DCDCn-1n-1= =2 2. .求出:求出:霍夫曼编码霍夫曼编码平均码长平均码长熵熵l一个系数矩阵经过区域滤波法量化后,所得的一个系数矩阵经过区域滤波法量化

55、后,所得的Q Q矩阵系数如表所示:矩阵系数如表所示: 解:解:DC=DCDC=DCn n-DC-DCn-1n-1=2=2行程编码为:行程编码为:2第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术行程编码:行程编码:(2,12,1)()(4,34,3)()(-4,1-4,1)()(-2,1-2,1)(3,33,3)()(-2,2-2,2)()(1,11,1)()(0,20,2)(1,81,8)()(0 0,42)42)000000000000000000000000000000000000000000l练习题:根据下面的已知条件,填写出练习题:根据下面的已知条件,填写出Q Q矩阵中的空缺系数

56、矩阵中的空缺系数第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术已知:已知: Q Q矩阵的行程编码为:矩阵的行程编码为:(2,12,1)()(4,34,3)()(-4,1-4,1)()(-2,1-2,1)(3,33,3)()(-2,2-2,2)()(1,11,1)()(0,20,2)(1,81,8)()(0 0,42)42)5.5.熵编码并输出数据流熵编码并输出数据流PALPAL制数据流制数据流( (以像块为单位输出一组数据):以像块为单位输出一组数据):YUV=Y+U+VYUV=Y+U+VYUV=Y+U+V=YUV=Y+U+V=9072+ 4536+ 4536 =?(组(组/ /像块)像

57、块)45451616363616161616像素像素第第6 6章章 多媒体数据压缩技术多媒体数据压缩技术lMPEGMPEG标准是针对全活动视频的压缩标准。该标准包括:标准是针对全活动视频的压缩标准。该标准包括:MPEGMPEG视频、视频、MPEGMPEG音频、音频、MPEGMPEG视频与音频同步三大部分。视频与音频同步三大部分。lMPEG-1MPEG-1:适用于传输速率为:适用于传输速率为1.5Mbps1.5Mbps的数字电视标准,的数字电视标准,9191年提出草案,年提出草案,9393年年8 8月月公布公布lMPEG-2MPEG-2:适用于传输速率为:适用于传输速率为10Mbps 10Mbps 的数字电视标准,的数字电视标准,9393年提出草案,年提出草案,9494年年1111月公布月公布lMPEG-4MPEG-4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论