多媒体通信之编码_第1页
多媒体通信之编码_第2页
多媒体通信之编码_第3页
多媒体通信之编码_第4页
多媒体通信之编码_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多媒体通信之编码第1页,共91页,2023年,2月20日,星期四2第2章

数据编码

数据压缩概述

有损编码无损编码赫夫曼编码

算术编码

行程长度编码词典编码

变换编码

基于模型编码

分形编码

其他压缩编码

差错检测和校正编码

第2页,共91页,2023年,2月20日,星期四3数据编码数据编码包括:信源编码信道编码信源编码:为了表示和/或压缩从信号源产生出来的信号而进行的编码,主要解决有效性问题。信道编码:为了使处理过的信号在传输过程中不出错或少出错,以及即使出了错也能自动检错或尽量纠错而进行的编码,主要解决可靠性问题。第3页,共91页,2023年,2月20日,星期四42.1数据压缩概述

多媒体数据的压缩主要是对视频数据和音频数据的压缩,二者使用的基本技术是相同的。

为什么要压缩

数据的冗余性

压缩和解压缩过程压缩评价和分类数据压缩常常又称为数据信源编码,或简称为数据编码。数据压缩的逆过程称为数据解压缩,也称为数据信源解码,或简称为数据解码。第4页,共91页,2023年,2月20日,星期四52.1.1为什么要压缩

多媒体数据压缩的目的:为了最有效地利用有限资源(例如存储和传输资源)。一般来说,压缩是信源信号(采样和量化后数字信号),如语音、静止图像、音乐或电视等的有效的数字化表示。压缩的任务:保持信源信号在一个可以接受的状况的前提下把需要的比特数减到最少程度,以减少存储、处理和传输的成本。

第5页,共91页,2023年,2月20日,星期四6信源存储量电话(200Hz至3.4kHz)8000样本/秒×12比特/样本=96kbps宽带语音(50Hz至7kHz)16000样本/秒×14比特/样本=224kbps宽带音频(20Hz至20kHz)44100样本/秒×2通道×16比特/样本=1.412Mbps图像512×512像素彩色图像×24比特/像素≈6.3兆比特/图像视频640×480像素彩色图像×24比特/像素×30图像/秒≈221Mbps高清晰度电视1280×720像素彩色图像×60图像/秒×24比特/像素≈1.3Gbps未压缩信源的大致比特率第6页,共91页,2023年,2月20日,星期四72.1.2数据的冗余性

数据压缩的前提:基本原始信源的数据存在着很大的冗余度(Redundant)。空间冗余时间冗余信息熵冗余结构冗余知识冗余认知(视觉听觉)冗余其他冗余数据压缩就是去掉信号数据的冗余性。第7页,共91页,2023年,2月20日,星期四82.1.2数据的冗余性

空间冗余在同一幅图像中,规则物体和规则背景(所谓规则是指表面颜色分布是有序的而不是完全杂乱无章的)的表面物理特征具有相关性,这些相关性在数字化图像中就表现为数据冗余。

第8页,共91页,2023年,2月20日,星期四92.1.2数据的冗余性时间冗余

图像序列中的两幅相邻的图像,后一幅图像与前一幅图像之间有较大的相关性,这反映为时间冗余。同理,在言语中,由于人在说话时发音的音频是一连续的渐变过程,而不是一个完全在时间上独立的过程,因而存在时间冗余。

第9页,共91页,2023年,2月20日,星期四102.1.2数据的冗余性信息熵冗余(编码冗余)信息量I(xi)的概率平均值叫做信息熵,或简称熵。

熵是信息量的度量方法,定义了观察到单个信源符号输出时获得的平均信息量。第10页,共91页,2023年,2月20日,星期四信息熵冗余信息熵冗余:信源编码时,当分配给第i个码元类的比特数b(yi)=-logpi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到最佳。实际单位数据量d>H(S),即存在信息冗余熵。信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。11第11页,共91页,2023年,2月20日,星期四122.1.2数据的冗余性结构冗余

有些图像从大的区域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。

知识冗余有许多图像的理解与某些基础知识有相当大的相关性。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。

第12页,共91页,2023年,2月20日,星期四132.1.2数据的冗余性认知(视觉听觉)冗余人类视觉系统对于图像场的任何变化,并不是都能感知的。事实上人类视觉系统一般的分辨能力约为26灰度等级,而一般图像量化采用28灰度等级,这类冗余我们称为视觉冗余。对于听觉,也存在类似的冗余。

其他冗余例如由图像的空间非定常特性所带来的冗余。

第13页,共91页,2023年,2月20日,星期四142.1.3压缩和解压缩过程

数据压缩就是去掉信号数据的冗余性。数据压缩常常又称为数据信源编码,或简称为数据编码。与此对应,数据压缩的逆过程称为数据解压缩,也称为数据信源解码,或简称为数据解码。

第14页,共91页,2023年,2月20日,星期四152.1.3压缩和解压缩过程数据压缩的典型操作包括预准备、处理、量化和编码等过程。第15页,共91页,2023年,2月20日,星期四162.1.3压缩和解压缩过程解压缩是压缩的逆过程具体的编码器和解码器以不同的方法构成在对称应用中(如对话应用),编码和解码代价应基本相同在非对称应用中,解码过程比编码过程耗费的代价要小,这种技术用于以下情形:压缩的过程仅一次,采样的时间不限;解压缩经常用到并需要迅速完成。

第16页,共91页,2023年,2月20日,星期四172.1.4压缩评价和分类衡量数据压缩技术的三个重要指标:压缩比:要大。

恢复效果:要好,要尽可能地恢复原始数据。

压缩算法:要简单,压缩、解压速度快,尽可能地做到实时压缩、解压。第17页,共91页,2023年,2月20日,星期四182.1.4压缩评价和分类影响多媒体数据压缩技术发展的因素:技术的使用目的面向存储的技术:要求实时,非常看重压缩能力面向传输的技术:编解码算法实现的实时性和成本却是非常敏感的问题。压缩算法的压缩能力、实现复杂性与成本等方面进行平衡与折中数据模型数据模型的选择和参数优化对于压缩算法的进步也十分关键第18页,共91页,2023年,2月20日,星期四19压缩分类(1)根据压缩过程中是否减少了熵,目前常用的压缩编码方法可以分为两大类:无损压缩编码(Losslesscompressioncoding)压缩是可逆的,也称为无失真压缩、冗余压缩或熵编码一般用于文本、数据以及应用软件的压缩压缩比较低,如LZ编码、行程长度编码、赫夫曼编码的压缩比一般在2:1至5:1之间

有损压缩编码(Losscompressioncoding)压缩是不可逆的,也称为熵压缩法允许一定程度的失真,压缩比高第19页,共91页,2023年,2月20日,星期四20常用压缩编码方法分类

第20页,共91页,2023年,2月20日,星期四有损压缩与无损压缩21冗余压缩法:熵压缩法:第21页,共91页,2023年,2月20日,星期四22压缩分类(2)根据码词长度是否相等分类定长码(fixed-lengthcode)采用相同的位数(bit)对数据进行编码大多数存储数字信息的编码系统都采用定长码变长码(variable-lengthcode)采用不相同的位数(bit)对数据进行编码,以节省存储空间示例:赫夫曼编码第22页,共91页,2023年,2月20日,星期四232.2赫夫曼编码

赫夫曼(Huffman)在1952年提出的一种编码方法从下到上的编码方法,属于变长码类。赫夫曼编码可区别的不同码字的生成是基于不同符号出现的不同概率。自含同步码,在编码之后的码串中都不需要另外添加标记符号,即在译码时切分符号的特殊代码。基于一种称为“编码树”(codingtree)的技术。得到广泛应用第23页,共91页,2023年,2月20日,星期四24赫夫曼编码算法步骤(1)初始化,根据符号概率的大小按由大到小顺序对符号进行排序。(2)把概率最小的两个符号组成一个新符号(节点),即新符号的概率等于这两个符号概率之和。(3)重复第2步,直到形成一个符号为止(树),其概率最后等于1。(4)从编码树的根开始回溯到原始的符号,并将每一下分枝赋值为1,上分枝赋值为0。

第24页,共91页,2023年,2月20日,星期四25赫夫曼编码例

编码结果:w(A)=100,w(B)=0,w(C)=111,w(D)=101,w(E)=110

p(C)=0.09p(E)=0.11p(D)=0.13p(A)=0.16p(B)=0.51p(CE)=0.20p(AD)=0.29p(ADCE)=0.49p(ADCEB)=1.0010010101第25页,共91页,2023年,2月20日,星期四26改进的赫夫曼编码算法自适应赫夫曼编码(AdaptiveHuffmancode)根据符号概率的变化动态地改变码字,产生的代码比原始赫夫曼编码更有效扩展的赫夫曼编码(ExtendedHuffmancode)允许编码符号组而不是单个符号第26页,共91页,2023年,2月20日,星期四27采用赫夫曼编码时的问题采用赫夫曼编码时有两个问题值得注意:差错传播(errorpropagation):赫夫曼码没有错误保护功能,在译码时,如果码串中没有错误,那么就能一个接一个地正确译出代码。但如果码串中有错误,那怕仅仅是1位出现错误,也会引起一连串的错误。赫夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑。

第27页,共91页,2023年,2月20日,星期四282.3算术编码

基本原理:将编码的消息表示成实数0和1之间的一个间隔(Interval),消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。

两个基本的参数:符号的概率和它的编码间隔。

第28页,共91页,2023年,2月20日,星期四算术编码过程举例

符号ABCD

概率0.10.40.20.3

初始编码间隔[0,0.1)[0.1,0.5)[0.5,0.7)[0.7,1)信源符号、概率和初始编码间隔

第29页,共91页,2023年,2月20日,星期四30编码过程步骤输入符号编码间隔编码判决1C[0.5,0.7)符号的间隔范围[0.5,0.7)2A[0.5,0.52)[0.5,0.7)间隔的第一个1/103D[0.514,0.52)[0.5,0.52)间隔的最后3个1/104A[0.514,0.5146)[0.514,0.52)间隔的第一个1/105C[0.5143,0.51442)[0.514,0.5146)间隔的第五个1/10开始,二个1/106D[0.514384,0.51442)[0.5143,0.51442)间隔的最后3个1/107B[0.5143836,0.514402)[0.514384,0.51442)间隔的4个1/10,从第1个1/10开始8从[0.5143876,0.514402]中选择一个数作为输出:0.5143876第30页,共91页,2023年,2月20日,星期四31译码过程步骤间隔译码符号译码判决1[0.5,0.7)C0.51439在间隔[0.5,0.7)2[0.5,0.52)A0.51439在间隔[0.5,0.7)的第1个1/103[0.514,0.52)D0.51439在间隔[0.5,0.52)的第7个1/104[0.514,0.5146)A0.51439在间隔[0.514,0.52)的第1个1/105[0.5143,0.51442)C0.51439在间隔[0.514,0.5146)的第5个1/106[0.514384,0.51442)D0.51439在间隔[0.5143,0.51442)的第7个1/107[0.51439,0.5143948)B0.51439在间隔[0.51439,0.5143948)的第1个1/108译码出来的消息:CADACDB第31页,共91页,2023年,2月20日,星期四32算术编码需要注意的问题需要注意的问题:

溢出:由于实际的计算机的精度不可能无限长,运算中容易出现溢出。但多数机器都有16、32或者64位的精度,因此这个问题可使用比例缩放方法解决。

算术编码器对整个消息只产生一个码字,这个码字是在间隔[0,1)中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。

对错误很敏感:如果有一位发生错误就会导致整个消息译错。第32页,共91页,2023年,2月20日,星期四332.4行程长度编码行程长度编码(RLE,Run-lengthencoding):非常简单基于简单的编码数据原则:重复的数据值序列(或称为“流”)用一个重复次数和单个数据值来代替。这里,重复的值称为一个“顺串”或“连续”(run)。

控制符重复次数

被重复字符

三字节码字格式示例:RTAAAASDEEEEE经RLE压缩后为:RT*4ASD*5E第33页,共91页,2023年,2月20日,星期四34RLE算法应用RLE算法是BMP、PCX、TIFF等图像压缩技术的一部分,在PDF文件格式中也得到应用。存在着不同的实现技术和文件格式。零抑制:文本里的空白(space)字符压缩CompuServe格式:1比特图像的压缩MSWindows的格式:用于4比特和8比特彩色图像PDF和TIFF等第34页,共91页,2023年,2月20日,星期四352.5词典编码

词典编码分类

LZ77算法

LZSS算法

LZ78算法

LZW算法

第35页,共91页,2023年,2月20日,星期四362.5.1词典编码分类

词典编码的根据:数据本身包含有重复代码序列。属于通用编码技术和无损压缩技术词典编码法分类

第一类词典法:查找正在压缩的字符序列是否在前面的输入数据中出现过,如果是,则用指向早期出现过的字符串的“指针”替代重复的字符串。

第二类算法:从输入的数据中创建一个“短语词典(dictionaryofthephrases)”。编码数据过程中当遇到已经在词典中出现的“短语”时,编码器就输出这个词典中的短语的“索引号”,而不是短语本身。

第36页,共91页,2023年,2月20日,星期四37第一类词典法编码概念

基本思想:查找正在压缩的字符序列是否在前面的输入数据中出现过,如果是,则用指向早期出现过的字符串的“指针”替代重复的字符串。“词典”是隐含的,指用以前处理过的数据。以AbrahamLempel和JakobZiv在1977年开发和发表的算法(称为LZ77算法)为基础。改进算法是由Storer和Szymanski在1982年开发的,称为LZSS算法。第37页,共91页,2023年,2月20日,星期四38第二类词典法编码概念

基本思想:从输入的数据中创建一个“短语词典(dictionaryofthephrases)”。编码数据过程中当遇到已经在词典中出现的“短语”时,编码器就输出这个词典中的短语的“索引号”,而不是短语本身。A.Lempel和J.Ziv在1978年首次发表了介绍这种编码方法的文章,称为LZ78。TerryA.Welch在1984年改进了这种算法。称为LZW(Lempel-ZivWalch)压缩编码。

第38页,共91页,2023年,2月20日,星期四392.5.2LZ77算法

起源:1977年,JacobZiv和AbrahamLempel描述了一种基于滑动窗口缓存的技术,该缓存用于保存最近刚处理的文本(J.ZivandA.Lempel,“AUniversalAlgorithmforSequentialDataCompression”,IEEETransactiononInformationTheory,May1977)。这个算法一般称为IZ77。基本思想:在正文流中词汇和短语(GIF中的图像模式)很可能会出现重复。当出现一个重复时,重复的序列可以用一个短的编码来代替。压缩程序扫描这样的重复,同时生成编码来代替重复序列。随着时间的过去,编码可以重用来捕获新的序列。算法必须设计成解压程序能够在编码和原始数据序列推导出当前的映射。

第39页,共91页,2023年,2月20日,星期四LZ77算法40LZ77是一种普遍的无损压缩方法。ZIP就是运用这种方法。举例,比如要传输一串字符,如果使用定长二元码AABCDBCDABCD000001101101101100011011这种编码效率低下,因为--忽略了字符的模式--忽略了字符的频率第40页,共91页,2023年,2月20日,星期四LZ77算法思想41如果我们可以尝试用一段较短的代码来代替重复的模式(字符串)代码告诉解码器应该从历史数据中的何处开始读取多少位数据,编码者使用一个缓冲器来保存数据,并尝试在历史信息中匹配信息。如果没有匹配的,则输出该字符如果有匹配,则按照(位置,长度)的形式输出。第41页,共91页,2023年,2月20日,星期四LZ77算法思想42需要注意的问题

--每一次输入的数据都要在历史缓冲器搜索。

--使用最长的匹配。则刚才的字符串AABCDBCDABCD就变成AABCD(3,3)(2,4)第42页,共91页,2023年,2月20日,星期四LZ77算法思想43如果使用定长二元码编码需要12*2=24bit如果使用LZ77来进行编码,对字符仍然需要2bit,对3bit表示数字则需要5*2+4*3=22bit使用LZ77编码效率略高于使用定长二元码思考LZ77是否对于所有的多媒体信号都适用?第43页,共91页,2023年,2月20日,星期四442.6变换编码

变换的基本原理

离散傅立叶变换

离散余弦变换

小波变换

第44页,共91页,2023年,2月20日,星期四452.6.1变换的基本原理

变换编码:先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。变换编码系统中压缩数据有变换、变换域采样和量化三个步骤。

变换本身并不进行数据压缩,它只把信号映射到另一个域,使信号在变换域里容易进行压缩,变换后的样值更独立和有序。量化操作通过比特分配可以有效地压缩数据。第45页,共91页,2023年,2月20日,星期四46变换编码、解码原理框图

第46页,共91页,2023年,2月20日,星期四472.6.1变换的基本原理当经过正交变换后的协方差矩阵为一对角矩阵,且具有最小均方误差时,该变换称为最佳变换,也称Karhunen-Loeve变换(K-L变换)。K-L变换的突出优点是相关性好,是均方误差(MSE,MeanSquareError)意义下的最佳变换,它在数据压缩技术中占有重要地位。如果变换后的协方差矩阵接近对角矩阵,该类变换称为准最佳变换,典型的有DCT(离散余弦变换)、DFT(离散傅立叶变换)、DWT(离散小波变换)等。

第47页,共91页,2023年,2月20日,星期四482.6.2离散傅立叶变换

一个变量的周期函数g(x)能够通过傅立叶级数表示出来:系数(A0、An和Bn)的值按照下面的公式计算:

第48页,共91页,2023年,2月20日,星期四49傅立叶变换傅立叶变换(FourierTransform)的物理意义:将信号从时间域(timedomain)变换到频率域(frequencydomain)。第49页,共91页,2023年,2月20日,星期四50一维离散傅立叶变换(DFT)正变换:给定由N个信号样本(均匀间隔){x(0),x(1),…,x(N-1)}组成的信号序列,离散傅立叶变换(DFT,DiscreteFourierTransform):

ω=0,1,2,…,N-1逆变换:

k=0,1,2,…,N-1

第50页,共91页,2023年,2月20日,星期四51二维离散傅立叶变换(DFT)正变换:给定一个二维信号的样本序列{x(k,l),k=0,1,…,N-1,l=0,1,…,N-1},二维离散傅立叶变换(2D-DFT):

u,v=0,1,2,…,N-1逆变换:

k,l=0,1,2,…,N-1

第51页,共91页,2023年,2月20日,星期四522.6.2离散傅立叶变换傅立叶分析法是一个强有力的工具,它使许多非常困难的问题变得简单和易于处理,傅立叶系数能够被变换、存储、传送,并且还能够被用做重建信号或者信号的函数。

已经发展了一套快速傅立叶变换(FFT,FastFourierTransform)的计算机算法,促进了它在信号处理中的应用,特别是在语音处理中的应用。

第52页,共91页,2023年,2月20日,星期四532.6.3离散余弦变换

一维离散余弦变换

二维离散余弦变换

修改的离散余弦变换

第53页,共91页,2023年,2月20日,星期四542.6.3.1一维离散余弦变换

p(x)的正离散余弦变换(DCT)逆离散余弦变换(IDCT)

第54页,共91页,2023年,2月20日,星期四552.6.3.2二维离散余弦变换

(二维逆DCT)像素的二维排列能够通过水平和垂直方向的频率项乘积表示出来:p(x,y)的二维DCT

第55页,共91页,2023年,2月20日,星期四562D-DCT第56页,共91页,2023年,2月20日,星期四57DCT和IDCT例

第57页,共91页,2023年,2月20日,星期四582.6.3.3修改的离散余弦变换

实际常常使用修改的离散余弦变换(MDCT,ModifiedDCT),使用一种称为时域混叠消除(TDAC,timedomainaliasingcancellation)技术,抗混叠(anti-aliasing)效果好。

第58页,共91页,2023年,2月20日,星期四2.6.3.4小波变换编码小波变换是一个线性变换,能够将一个信号分解成对空间和时间、频率的独立贡献,同时又不失原信号所包含的信息。经过小波变换后的图像能量很集中,便于对不同的分量作不同的处理,达到较高的压缩比。

小波变换的具体内容在图像编码中详细讲解。第59页,共91页,2023年,2月20日,星期四602.7基于模型编码

基于模型的编码就是第二代编码技术。基于模型方法的基本思想是:在发送端,利用图像分析模块对输入图像提取紧凑和必要的描述信息,得到一些数据量不大的模型参数;在接收端,利用图像综合模块重建原图像,是对图像信息的合成过程。

第60页,共91页,2023年,2月20日,星期四61基于模型的图像编码基本原理框图

图像输入图像分析编码器提取的模型参数图像传输或存储解码器图像综合模型已量化的模型参数图像输出第61页,共91页,2023年,2月20日,星期四622.8其他压缩编码

子带编码

向量量化编码

感知编码

第62页,共91页,2023年,2月20日,星期四632.8.1子带编码

子带编码(SBC,SunbandCoding)是一种在频率域中进行数据压缩的方法,它主要利用一些频带比另一些在感知上作用更大。在子带编码中,若各个子带的带宽ΔWk是相同的,则称为等带宽子带编码,否则,称为变带宽子带编码。

第63页,共91页,2023年,2月20日,星期四64子带的概念

第64页,共91页,2023年,2月20日,星期四65子带编码器

第65页,共91页,2023年,2月20日,星期四66子带解码器

第66页,共91页,2023年,2月20日,星期四672.8.1子带编码对每个子带分别编码的好处是:

可以利用人耳(或人眼)对不同频率信号感知灵敏度不同的特性,在人的听觉(或视觉)不敏感的频段采用较粗糙的量化,从而达到数据压缩的目的。

各个子带的量化噪声都束缚在本子带内,这就可以避免能量较小的频带内的信号被其他频带中量化噪声所掩盖。

通过频带分裂,各个子带的取样频率可以成倍下降。

第67页,共91页,2023年,2月20日,星期四682.8.1子带编码经过分带编码、译码后合成的输出音频信号会有混迭效应。采用正交镜像滤波器(QMF,quandraturemirrorfilter)来划分频带,混迭效应在最后合成时可以抵消。

第68页,共91页,2023年,2月20日,星期四692.8.2向量量化编码

在向量量化编码中,则是把输入数据几个一组地分成许多组,成组地量化编码,即将这些数看成一个k维向量,然后以向量为单位逐个向量进行量化。向量量化是一种限失真编码,其原理仍可用信息论中的率失真函数理论来分析。

第69页,共91页,2023年,2月20日,星期四向量量化编码向量量化编码是一种量化与压缩相结合的方法。向量量化编码由两部分组成,1向量训练,2向量划分。向量训练:在离线状态下,通过训练达到最佳的量化空间划分,尽量减少平均失真。已被量化的不重叠的空间称为CodeBook(CB)代码本向量划分:将需要编码的代码看做向量,根据已有的CB进行划分到某一个空间中去。70第70页,共91页,2023年,2月20日,星期四VQtraining第71页,共91页,2023年,2月20日,星期四VQexample•GiventhefollowingCB(whichhasbeencalculatedviatrainingpreviously,findtheCBvector(andindex)thatminimimisesthedistortionfortheinputvectorx=[528]第72页,共91页,2023年,2月20日,星期四VQexample•Thedistortionforeachvectoris:•TheindexthatminimisesDisindex2andthequantisedvectoristhusy(2)=[238].第73页,共91页,2023年,2月20日,星期四74向量量化编码原理框图

第74页,共91页,2023年,2月20日,星期四752.8.2向量量化编码衡量两个向量之间接近程度的度量标准可以用均方误差准则:也可以用其他准则。第75页,共91页,2023年,2月20日,星期四762.8.2向量量化编码在向量量化编码中,关键是码本的建立和码字搜索算法。

码本的生成算法有两种类型,一种是已知信源分布特性的设计算法;另一种是未知信源分布,但已知信源的一列具有代表性且足够长的样点集合(即训练序列)的设计算法。码字搜索是向量量化中的一个最基本问题,向量量化过程本身实际上就是一个搜索过程,即搜索出与输入最为匹配的码字。

第76页,共91页,2023年,2月20日,星期四772.8.3感知编码

感知编码将感知知识应用于编码中。

感知编码的主要步骤是:首先将输入信号分解为各频谱元素,再根据某个心理听觉阈值和掩蔽门限进行量化编码,最后生成比特流。听觉阈值和掩蔽门限的计算需要对输入信号进行频域分解。

第77页,共91页,2023年,2月20日,星期四78感知编码基本结构框图

第78页,共91页,2023年,2月20日,星期四2.9差错检测和校正编码

放入附录中,请同学们自行学习

79第79页,共91页,2023年,2月20日,星期四2.10音频的压缩音频频率范围

低频声音(Infra-sound):0Hz-20Hz人类听觉频率范围的声音:20Hz-20kHz

高频(Ultrasound):20kHz-1GHz超声波(Hypersound):1GHz-10THz不同音频的带宽

电话语音:

200Hz-3.4kHz调幅广播:50Hz-7kHz

调频广播:20Hz-15kHz宽带音响:20Hz-20kHz第80页,共91页,2023年,2月20日,星期四2.10.1音频压缩编码的基本方法无失真压缩音频压缩方法有失真压缩Huffman编码行程编码波形编码参数编码混合编码全频带编码PCMDPCMADPCM子带编码自适应变换编码ATC

心理学模型矢量量化线性预测LPC矢量和激励线性预测VSELP多脉冲线性预测MP-LPC码本激励线性预测CELP第81页,共91页,2023年,2月20日,星期四2.10.2电话质量的语音压缩标准ITU—TS建议的语音压缩的标准G.711:采用PCM编码,采样速率为8kHz,量化位数为8bit,对应的比特流速率为64kbit/s。

G.721:ITU建议的G.721将64Kbps的比特流转换为32Kbps的流,它是基于ADPCM技术。每个数值差分用4位编码,其采样率为8kHz。第82页,共91页,2023年,2月20日,星期四2.10.2电话质量的语音压缩标准

G.723:G.723是一种以24Kbps运行的基于ADPCM的有损耗压缩标准。其音质不如非压缩的G.711PCM标准以及基于SB—ADPCM的G.722标准。G.723.1和G.723.2用于H.324标准。

G.728:它的比特率为16Kbps,带宽限于3.4kHz。其音质比G.711或G.722差得多。它基于一种称为低延迟代码激励线性预测(LD—CELP)的向量量化技术。第83页,共91页,2023年,2月20日,星期四2.10.2电话质量的语音压缩标准

CELP是一种常用的语音压缩技术。它用于美国联邦标准1016,可将语音压缩至4.8Kbps。美国联邦标准1015使用CELP的一个简本,称为线性预测编码(LPC)。LPC一10E标准可以运行于2.4Kbps。采用了一种向量量化方法。声音听起来有点象机器在说话,但4.8Kbps与电话差不多。第84页,共91页,2023年,2月20日,星期四2.10.3调幅广播质量的音频压缩标准

调幅广播质量:50Hz-7kHz,称“7kHz音频信号”。

G.722:G.722基于子带ADPCM技术(SB—ADPCM),它是将现有的带宽分成两个独立的子带信道分别采用差分脉码调制算法。G.722压缩信号的带宽范围为50Hz到7kHz,而G.711仅限于3.4kHz。其比特率为48、56、64Kbps,在标准模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论