




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 信源编码理论n引言n音频信号编码n图像信号编码 2.1 引言-关于信源编码 数字通信系统因具有许多优点而成为当今通信的发展方向。n在数字通信系统中,信道传输的是数字信号。n但是在自然界中,很多信源输出的是模拟量,如话音、图像等。因此在利用数字通信系统进行信息传输时,首先需先对信号(模拟的)数字化,即A/D。n模拟信号的数字化属于信源编码的范畴。数字通信中的编码概念n编码和译码是数字通信发送与接收设备的重要组成部分。数字通信中的编码概念(续) 数字通信系统中包含编码和译码,编码的逆过程是译码。数字通信中的编码涉及两部分,含义完全不同:n信源编码n信道编码信源编码的作用 n作用之一是设法减
2、少码元数目和降低码元速率,即通常所说的数据压缩。码元速率将直接影响传输所占的带宽,而传输带宽又直接反映了通信的有效性。 我们所熟悉的典型的压缩:音频压缩MP3 图像压缩JPEG、MPEG等n 作用之二是当信息源给出的是模拟信号时,信源编码器将其转换成数字信号,以实现模拟信号的数字化传输。 模拟信号数字化传输的方式有脉冲编码调制(PCM)和增量调制(M)、 ADPCM等。n作用之三是加密信道编码n信道编码是为了降低误码率,提高数字通信的可靠性而采取的编码。n信道编码技术的基本思想是通过对信息序列作某种变换,使原来彼此独立,相关性极小的信息码元产生某种相关性,从而在接收端利用这种规律检查或纠正信息
3、码元在信道传输中所造成的差错。n具体做法是信道编码器对传输的信息码元按一定的规则加入保护成分(监督元),组成所谓“抗干扰编码”。接收端的信道译码器按一定规则进行解码,从解码过程中发现错误或纠正错误,从而提高通信系统抗干扰能力,实现可靠通信。n与信源编码相反,信道编码提高了可靠性。本章涉及内容n语音信号的编码问题-重点讨论语音编码的基本方法,包括波形编码(脉冲编码调制(PCM) ,对增量调制(M)、自适应差分脉码调制(ADPCM)、参数编码(线性预测LP)、混合编码(码激励线性预测CELP等。n图像信号的编码问题-压缩编码,如静态图像压缩方法JPEG、动态图像压缩方法MPEG等。 2.2 音频信
4、号编码n语音编码概述n时域波形编码n变换域编码n参数编码n混合编码n各种音频信号编码方法的比较n现代语音处理技术及应用语音编码概述n 语音是人类进行交流的重要手段,通信系统中最常见的数据形式就是语音。语音通信是人类通信最基本、最重要的方式之一。随着移动通信与互联网的飞速发展,语音通信技术也在不断地进行更新并与之相融合。n语音信号的数字化传输和存储,在可靠性、抗干扰语音信号的数字化传输和存储,在可靠性、抗干扰能力、快速交换等方面远胜于模拟化,且灵活方便,易于保密,价格低廉,所以从20世纪50年代以来,数字化语音在通信系统中所占的比重越来越大。语音编码是数字语音通信中的一项重要技术。n为了压缩数字
5、语音传输的比特率,以使同样的信道容量能传输更多路的语音信号,节省存储空间,语音压缩编码也有了很大的发展,并在有线无线电话的话带语音信号、会议电视的宽带语音信号、HDTV和高保真音乐等的音频信号等领域有广泛的应用。语音编码算法语音编码大致分为四种方式:n时域波形编码-不基于声学模型只针对语音波形进行编码n变换域编码-不基于声学模型的编码方法n参数编码-参数编码是基于声学模型的编码方法n混合编码-结合上述几种编码方式的优点 有时也将时域的波形编码和变换域编码统称波形编码,因此也可以称语音编解码算法分为波形编码、参数编码(声码器)和混合编码三类。 2.2.1 时域波形编码n 时域波形编码不基于声学模
6、型只针对语音波形进行编码。这种方法在降低量化每个语音样本比特数的同时,又保持了相对良好的语音质量。n波形编码主要有脉冲编码调制(PCM)、增量调制(M)、自适应增量调制(ADM)、自适应差分脉码调制(ADPCM) 等。一、 采用PCM的模拟信号数字传输系统m(t)模拟随机信号mo(t)模拟随机信号ak数字随机序列ak数字随机序列模拟信息源受信者数字传输系统抽样、量化和编码译码和低通滤波PCM数字化的过程一般分三步:抽样量化编码m(t)akn “抽样”指抽取样值,或抽取样点,抽样的多少对通信的性能指标有决定影响。0 ,“1” 0,“0”段落序号段落码C2 c3 c4876543211 1 11
7、1 01 0 11 0 00 1 10 1 00 0 10 0 0电平序号段内码电平序号段内码c5c6c7c8c5c6c7c8151413121110981 1 1 11 1 1 01 1 0 11 1 0 01 0 1 11 0 1 01 0 0 11 0 0 0 765432100 1 1 10 1 1 00 1 1 00 1 0 10 0 1 10 0 1 00 0 0 10 0 0 0(三)(三)编码方法逐次比较法原理图:PCM码流速率计算:PCM系统的抗噪性能 3)总信噪比:NeNOPNS2202412二、 自适应差分脉冲编码调制(ADPCM) 64kb/s的A律或律的对数压扩PCM
8、编码已经在大容量的光纤通信系统和数字微波系统中得到了广泛的应用。 但PCM信号占用频带要比模拟通信系统中的一个标准话路带宽(3.1 kHz)宽很多倍,这样,对于大容量的长途传输系统,采用PCM的经济性能很难与模拟通信相比。 以较低的速率获得高质量编码,一直是语音编码追求的目标。通常,人们把话路速率低于64kb/s的语音编码方法, 称为语音压缩编码技术。 语音压缩编码方法很多,其中, 自适应差分脉冲编码调制是语音压缩中复杂度较低的一种编码方法,它可在32kb/s的比特率上达到64kb/s的PCM数字电话质量。近年来,ADPCM已成为长途传输中一种新型的国际通用的语音编码方法(G.721)。 AD
9、PCM ADPCM是在差分脉冲编码调制(DPCM)的基础上发展起来的,为此,下面先介绍DPCM的编码原理与系统框图。 由于相邻样值的差值比样值本身小,可以用较少的比特数表示差值。这样,用样点之间差值的编码来代替样值本身的编码, 可以在量化台阶不变的情况下(即量化噪声不变),编码位数显著减少,信号带宽大大压缩。这种利用差值的PCM编码称为差分PCM(DPCM)。 在PCM中,每个波形样值都独立编码,与其他样值无关, 这样,样值的整个幅值编码需要较多位数,比特率较高, 造成数字化的信号带宽大大增加。然而,大多数以奈奎斯特或更高速率抽样的信源信号在相邻抽样间表现出很强的相关性, 有很大的冗余度。利用
10、信源的这种相关性,一种比较简单的解决方法是对相邻样值的差值而不是样值本身进行编码。1、DPCM如果将样值之差仍用N位编码传送,则DPCM的量化信噪比显然优于PCM系统。 实现差分编码的一个好办法是根据前面的k个样值预测当前时刻的样值。编码信号只是当前样值与预测值之间的差值的量化编码。DPCM系统原理框图qPqnnnqnDPCMNSGnEeEeExEnExENs)()(222222 式中,(S/N)q是把差值序列作为信号时量化器的量化信噪比,与PCM系统考虑量化误差时所计算的信噪比相当。Gp可理解为DPCM系统相对于PCM系统而言的信噪比增益,称为预测增益。如果能够选择合理的预测规律,差值功率E
11、e2n就能远小于信号功率Ex2n,Gp就会大于1,该系统就能获得增益。对DPCM系统的研究就是围绕着如何使Gp和(S/N)q 这两个参数取最大值而逐步完善起来的。通常Gp约为611 dB。 因此DPCM系统总的量化信噪比可表示为 可见,DPCM系统总的量化信噪比远大于量化器的信噪比。因此, 要求DPCM系统达到与PCM系统相同的信噪比,则可降低对量化器信噪比的要求,即可减小量化级数,从而减少码位数,降低比特率。2、ADPCM值得注意的是,DPCM系统性能的改善是以最佳的预测和量化为前提的。但对语音信号进行预测和量化是复杂的技术问题,这是因为语音信号在较大的动态范围内变化。为了能在相当宽的变化范
12、围内获得最佳的性能,只有在DPCM基础上引入自适应系统。有自适应系统的DPCM称为自适应差分脉冲编码调制,简称ADPCM。 ADPCM的主要特点是用自适应量化取代固定量化,用自适应预测取代固定预测。自适应量化指量化台阶随信号的变化而变化,使量化误差减小;自适应预测指预测器系数可以随信号的统计特性而自适应调整,提高了预测信号的精度, 从而得到高预测增益。 通过这两点改进,可大大提高输出信噪比和编码动态范围。 如果DPCM的预测增益为611dB,自适应预测可使信噪比改善4 dB;自适应量化可使信噪比改善47dB,则ADPCM比PCM可改善1422dB,相当于编码位数可以减小 3 位到 4 位。 因
13、此,在维持相同的语音质量下,ADPCM允许用32 kb/s比特率编码,这是标准64kb/s PCM的一半。 因此,在长途传输系统中 ,ADPCM有着远大的前景。相应地,CCITT也形成了关于ADPCM系统的规范建议G.721 、 G.726等。 ADPCM(续)(续)三、 增量调制( M或DM)1、与PCM区别 PCM码表示样值大小,N位码,M代码表示相邻样值的关系,一位码,是DPCM的特例。2 、M 基本原理 (1).编码 M波形示意e(ti)=m(ti-)-m(ti-)0e(ti)=m(ti-)-m(ti-)0输出1 ,上升一个台阶s输出0,下降一个台阶s 波形编码小结 PCM、M、ADP
14、CM是基于时域的波形编码技术,不基于声学模型。 波形编码器作用于所有输入信号,因此会产生高质量的样值。然而,波形编码器工作在高比特率。 例如:ITU-G.711规范(PCM)用的比特率为64kbps。 *引出其它编码,目的是降低比特率,提高有效性。 2.2.2 变换域编码-频域编码 变换域编码方式也是不基于声学模型的编码方法,但对信号进行频域处理,再编码。 典型的变换域编码有子带编码(SBC)子带编码(subband coding,SBC) SBC利用带通滤波器将语音频带分成若干子带,并且分别进行采样、编码,编码方式可以用ADPCM或ADM,SBC速率可以达到96kbs。 可变SBC可使子带的
15、设计不固定,而是随共振峰变化,使编码效率进一步提高,这种方式在码率为48kbs时可具有相当于72kbs的固定SBC的语音质量。SBC原理框图(a) 编码器 (b)解码器 子带编码应用n1976年子带编码技术首次被美国贝尔实验室的R. E. Crochiere等人应用于语音编码。n子带编码器SBC愈来愈受到重视。在中等速率的编码系统中,SBC的动态范围宽、音质高、成本低。使用子带编码技术的编译码器已开始用于话音存储转发(voice store-and-forward)和话音邮件,采用2个子带和ADPCM的编码系统也已由CCITT作为G.722标准向全世界推荐使用。 n1986年Woods等将子带
16、编码又引入到图像编码,此后子带编码在视频信号压缩领域得到了很大发展。目前,已经研制出采用子带编码技术的具有演播室质量的140Mbps HDTV硬件编解码系统。 2.2.3 参数编码(参量编码)n与波形编码不同,参量编码又称为声源编码(声码器),是将信源信号提取特征参量,并将其变换成数字代码进行传输。解码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。n具体说,参量编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的可靠性,即保持原语音的语意,但重建信号的波形同原语音信号的波形可能会有相当大的差别。n这种编码技术可实现低速率语音编码,比特率可压缩
17、到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低,连熟人都不一定能听出讲话人是谁。线性预测编码(LPC)及其它各种改进型都属于参量编码。声码器n声码器(vocoder)不会再生原始波形。这组编码器会提取一组参数,这组参数被送到接收端,用来导出语音产生模形。声码器质量n在电话系统中使用声码器,语音质量不够好。 n对于语音数据,人们已经找到了较合理的声道模型,声音数据的参数编码方法就是基于声音参数的分析与合成来实现的。声道模型在声音合成等领域也有成功应用。n统计表明,语音过程是一个近似的短时随机过程。所谓短时,是指在1030ms的范围。由于这一性质,使一帧一
18、帧地处理语音信号成为可能,每一帧的信号近似满足同一模型,提取模型参数即可再现信号。这是方法假设的基本前提。实际应用中,每帧取20ms。语音参数编码原理n语音生成机构模型: 声源。声源分三类:元音:由声带的自激振动所产生;摩擦音:靠声道变窄时气流所产生的喘流噪声产生;爆破音:由闭合的声道急速打开时形成的脉冲波所产生的喘流噪声所产生。模型中用基音周期基音周期参数描述声源。 共鸣机构,也称声道。由鼻腔、口腔与舌头组成。模型中用共振峰共振峰参数描述。 放射机构:由嘴唇和鼻孔组成,其功能是发出声音并传播出去。模型中用语音谱和声强语音谱和声强参数描述。常用语音参数-基音周期、共振峰、语音谱、声强等。 分帧
19、:声音变为帧序列f1,f2,。 计算每一帧fi的参数向量(基音周期,共振峰,语音谱,声强)i。 直接传送参数向量或对参数向量进行矢量量化。语音参数编码过程:LPCn线性预测编码(LPC)用来获取一时变数字滤波器的参数。这个滤波器用来模拟说话人的声道输出。n 由图一中所示,声音的产生被模拟成声源和声道两个部分构成。声源为噪声和脉冲两种,声道相当于一个滤波器,气管口腔形状不同相当于声道滤波器的参数不同,最后就生成不同声音。 参数编码小结n参数编码数据量小,但计算量很大。n由于声音从发声模型出发,不是从波形出发仿真,保真难度大,目前的保真度还很差。例如,某人说了一句话,分析出参数再由参数合成的声音,
20、能听出这段话的字句就合格了,听起来不是机器语言,即自然度好一些已相当不错了,要能听出谁在说话就不容易。n由于压缩比高,成本低,很多低档的学习机就是采用了这种语音压缩方式,出来的声音生硬、含混不清、毫无语感,对英语的语音学习不但毫无帮助,而且会误导正确的语音学习。 2.2.4 混合型编码n 混合编码则是在波形编码和参数编码的基础上,以相对较低的比特率上获得较高的语音质量,所以其数据率和音质介于二者之间。n 当波形编码的比特率每声道低于16kbps后,音质下降很快。而参数法由于机理本身就是一种模拟,比特率上升到10kbps以上后再上升音质也没有多少改善。n所以,两者结合的混合编码法就被消费类电子公
21、司开发出来。 发展与应用n计算机的发展为语音编码技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现,则为语音编码的实现提供了基础。n80年代以来,语音编码技术有了实质性的进展,产生了新一代的编码算法,这就是混合编码。它将波形编码的高质量和参量编码的低数据速率组合起来,克服了原有波形编码和参量编码的弱点,结合各自的长处,力图保持波形编码的高质量和参量编码的低速率,在4-16Kbit/s速率上能够得到高质量的合成语音。n目前较为成功的混合型编码方案有多脉冲激励线性预测编码(MPLPC)和码激励线性预测编码(CELP)。n很显然,混合编码是适合于数字移动通信的语音编码技术。 LDCELPn
22、低时延码激励线性预测编码 是Low Delay-Code Excited Linear Prediction的缩写。16kbits LDCELP是CCITT G.728语音编码标准算法,这种法在CELP算法的基础上,采用后向自适应线性预测、50阶合成滤波、短激励矢量(5个样值)等改进方法,从而达到高质量和低时延的目的,总的编码时延小于2ms。 RPE/LTPn规则脉冲激励长时预测线性预测编码 是Regular Pulse Excited-Long Term Predition-Linear Predictive Coding的缩写。这种算法是MPE-LPC的改进算法,除了增加长时预测功能外,激
23、励脉冲的位置具有一定的规律。这种算法是欧洲900MHz数字蜂窝移动电话的语音编码标准(GSM),也为数字蜂窝系统DCS1800所采用。 MPE-LPC(多脉冲线性预测编码) n多脉冲线性预测编码 是Multi-Pulse Excited LPC的缩写。这种算法在一帧语音中选择几十个典型脉冲作为激励信号。INMARSAT的9.6kbits语音编码航空标准采用这种算法。 VSELPVSELP(矢量和激励线性预测编码) n矢量和激励线性预测编码 是Vector Sum Excited Linear Prediction的缩写。这种算法采用三个码本作为激励信号,其中两个是随机码本,一个是自适应码本,最
24、终的激励信号是三个激励矢量的和。美国电信工业协会(TIA)选择8kbits VSELP算法作为北美第一代数字蜂窝移动电话的编码标准(IS54)。日本的全速率数字移动电话也采用VSELP算法作为语音编码标准(JDC),速率为6.7kbits。 2.2.5 各种音频信号编码方法的比较编码方法传输速率(kb/s)最小基带带宽(kHz)质量PCMADPCMSBC+ADPCMMSBC(子带)RPE/LTP(规则脉冲激励)LD-CELP(低延迟码激励)MPE/LPC(多脉冲)CELP(码本激励)LPC(线性预测)LPC+VQ(矢量量化)6432643216161632163216888
25、长途电话质量长途电话质量广播质量通信质量通信质量通信质量接近长途质量通信质量通信质量合成质量合成质量电话质量的音频(0.3-3.4K kHz )G728, LD-CELP 16kb/s ,GSM ,RPE/LTP, 13kb/s ,(欧洲移动)GTIA ,VSELP, 8kb/s (美国移动)NSA ,CELP,4.8 kb/s NSA ,LPC,2.4kb/s 调幅广播质量的音频n50Hz-7kHz n采样率16KHz ,14bit 量化,PCM码率224Kb/s, 采用G.722(子带)标准可压缩到64Kb/s,适于ISDN的B信道,传输高质量语音。高保真立体声音频压缩
26、标准n即CD音质音频20Hz-20KHzn采样率44.1kHz,,16位量化,立体声n数据量为 44.1*16b*2=1411.2kb/s=176.4KB/sn1小时为 176.4KB/s*3600s=635MB n目前,采用MPEG音频标准,有三层(第三层MP3),采用子带及熵编码技术,可压缩到每声道32kb/s-448kb/sMP3及其基本原理nMP3就是采用国际标准MPEG中的第三层音频压缩模式,对声音信号进行压缩的一种格式,中文也称电脑网络音乐。MPEG中的第三层音频压缩模式比第一层和第二层编码要复杂得多,但音质最高,可与CD音质相比。多媒体视听业务音频 nITU关于电视电话系统和终端
27、设备的技术标准针H.320用于ISDN网,不适合窄带电话网,而H.324既适合高速数字网,也适合在普通电话之类的窄带网上使用,H.323标准用于质量不能保证的局域网LANn在H.320中,语音编码标准为G.711(64 kb/s )、G.722(64 kb/s )、G.728(16 kb/s ),nH.324分配给语音带宽6.5 kb/s (高采用MP-MLQCELP)和5.3K(低采用ACELP),采用的语音压缩标准为G.723nH.323系统语音压缩方法有6种,即G.711(64 kb/s )、G.722(64 kb/s )、G.728(16 kb/s )、G.723、G.729、MPEG
28、 AUDIO 2.2.6 现代语音处理技术及应用 2.3 图像信号的压缩n图像信号压缩的必要性n图像信号压缩基础n图像压缩编码方法n图像压缩编码标准 2.3.1图像信号压缩的必要性n与文字信息不同,图像信息占据大量的存储容量,而且传输的带宽有限n例1:一张A4(210mm297mm) 大小的照片,若用中等分辨率(300dpi)的扫描仪按真彩色扫描,其数据量为多少?(注:dpi表示每英寸像素,1英寸25.4mm)n若按每像素3个字节计算,上述结果为约26Mn例2:目前的WWW互联网包含大量的图像信息,如果图像信息的数据量太大,会使本来就已经非常紧张的网络带宽变得更加不堪重负(World Wide
29、 Web变成了World Wide Wait)图像信号压缩的必要性(续)n视频数据量:n对于电视画面的分辨率640*480的彩色图像,每秒30帧,则一秒钟的数据量为:640*480*24*30=221.12Mbit/s=28MB/sn实时传输:在10M带宽网上实时传输的话,需要压缩到原来数据量的0.045n存储: 1张CD可存640MB,如果不进行压缩,1张CD则仅可以存放20几秒的数据n可见,单纯依靠增加存储器容量和改善信道带宽无法满足需求,必须进行压缩 2.3.2 图像压缩编码基础图像数据的压缩机理来自两个方面:n一是利用图像中存在大量冗余度可供压缩;n二是利用人眼的视觉特性。(1)空间冗
30、余在一幅图像中规则的物体和规则的背景具有很强的相关性。 (2)时间冗余电视图像序列中相邻两幅图像之间有较大的相关性。(3)结构冗余和知识冗余图像从大面积上看常存在有纹理结构,称之为结构冗余。(4)视觉冗余人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。1图像数据的冗余度(1)亮度辨别阈值 当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。2人眼的视觉特性n(2)视觉阈值视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个
31、统计值。n(3)空间分辨力空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。n(4)掩盖效应“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。图像压缩的可能性与基本思想n各种冗余和视觉特性就是压缩图象数据的出发点和依据。图象编码的目的就在于采用各种方法去除冗余和不太重要的部分内容,以尽量少的数据量来表示个重建图象。n压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题, 它是使数字信号走上实用化的关键技术之一。 2.3.3 图像压缩的方法n图像压缩方法有很多种,而且很多方法还在不断地发展和完善。从不同
32、的角度出发有不同的分类方法。1.根据解压重建后的图像与原始图像是否有误差,可分为无损压缩与有损压缩两大类;图像压缩的方法(续)2. 根据实施编码所在的数据域可分为空间域和变换域编码(1)基于图像信源统计特性的压缩方法,有预测编码、变换编码、矢量量化编码、子带小波编码和神经网络编码法等。(2)基于人眼视觉特性的压缩方法,有基于方向滤波的图像编码法和基于图像轮廓纹理的编码法等。(3)基于图像景物特征的压缩方法,有分形编码法和基于模型的编码方法等。3.根据压缩机理的不同,数据压缩编码根据压缩机理的不同,数据压缩编码方法大致可以分成三类方法大致可以分成三类图像压缩的方法图像压缩有损压缩无损压缩行程编码
33、LZW编码哈夫曼编码算术编码无损预测编码位平面编码有损预测编码分形编码模型编码子带编码神经网络编码变换编码K-L变换Haar变换Walsh.Hadamard变换离散余弦变换离散傅立叶变换斜变换小波变换衡量一个压缩编码方法优劣的重要指标n(1)压缩比要高,有几倍、几十倍,也有几百乃至几千倍;(2)压缩与解压缩要快,算法要简单,硬件实现容易;(3)解压缩的图像质量要好。n需要说明的是选用编码方法时一定要考虑图像信源本身的统计特征;多媒体系统(硬件和 软件产品)的适应能力;应用环境以及技术标准。 几种典型的图像压缩方法原理n霍夫曼(Huffman)编码n游程编码n预 测 编 码n变换编码n混合编码
34、1. 霍夫曼(Huffman)编码 霍夫曼(Huffman)编码是一种可变长编码, 编码方法如下图所示。 (1) 将输入信号符号以出现概率由大至小为序排成一列。 (2) 将两处最小概率的符号相加合成为一个新概率, 再按出现概率的大小排序。 (3) 重复步骤(2), 直至最终只剩两个概率。 (4) 编码从最后一步出发逐步向前进行, 概率大的符号赋予“0”码, 另一个概率赋予“1”码, 直至到达最初的概率排列为止。 霍夫曼(Huffman)编码 将最常出现(概率大的)的符号用最短的编码,最少出现的符号用最长的编码。n游程编码(RLC, Run Length Coding)是一种十分简单的压缩方法,
35、 它将数据流中连续出现的字符用单一的记号来表示。 例如, 字符串5310000000000110000000012000000000000可以压缩为5310-10110-08120-12, 其中, “-”后面两个数字是“-”前面数字的连续个数。 游程编码的压缩率不高, 但编码、 解码的速度快, 仍被得到广泛的应用, 特别是在变换编码后再进行游程编码, 有很好的效果。 2. 游程编码3.预 测 编 码n(1) 预测编码基本原理n预测编码是根据某一模型利用过去的样值对当前样值进行预测,然后将当前样值的实际值与预测值相减得到一个误差值,只对这一预测误差值进行编码。 -DPCMn(2) 预测方法n1)
36、帧内预测n帧内预测利用图像信号的空间相关性来压缩图像的空间冗余,根据前面已经传送的同一帧内的像素来预测当前像素。n2)帧间预测n电视图像在相邻帧之间存在很强的相关性。3.预 测 编 码(续)n图像变换编码是将空间域里描述的图像, 经过某种变换(如傅立叶变换、 离散余弦变换、 沃尔什变换等)在变换域中进行描述。 这样可以将图像能量在空间域的分散分布变为在变换域的相对集中分布, 便于用“Z”(zig-zag)字形扫描、 自适应量化、 变长编码等进一步处理, 完成对图像信息的有效压缩。4. 变换编码n 变换编码将被处理数据按照某种变换规则映射到另一个域中去处理, 图像编码采用二维正交变换的方式, 若
37、将整个图像作为一个二维矩阵, 变换编码的计算量太大。 所以将一幅图像分成一个个小图像块, 通常是88或1616小方块, 每个图像块可以看成为一个二维数据矩阵, 变换编码以这些小图像块为单位进行, 变换编码把统计上密切相关的像素构成的矩阵通过线性正交变换, 变成统计上较为相互独立, 甚至完全独立的变换系数所构成的矩阵。 n在常用的正交变换中, DCT(Discrete Cosine Transform)变换的性能接近最佳, 是一种准最佳变换。 DCT变换矩阵与图像内容无关, 是因为它构造成对称的数据序列, 避免了子图像轮廓处的跳跃和不连续现象。 DCT变换也有快速算法(FDCT), 在图像编码的
38、应用中, 大都采用二维DCT变换。 典型的变换编码方法-离散余弦变换(DCT) 图像块的DCT变换(a) 背景部分图像块的DCT; (b) 细节部分图像块的DCTZ字形扫描n混合编码是近年来广泛采用的方法, 这种方法充分利用各种单一压缩方法的长处, 以期在压缩比和效率之间取得最佳的平衡。 如广泛流行的JPEG和MPEG压缩方法都是典型的混合编码方案。 5. 混合编码 2.3.4 图像压缩编码标准n制定图像标准的国际组织是ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)n静止图像:JPEG(Joint Photographic Expert Group,联合图像专家组)n通常为有损
39、压缩(采用DCT变换编码),JPEG是目前静态图像压缩比最高的,但失真的程度非常小n也支持无损压缩(采用预测编码),但压缩比降低(无损压缩的压缩比总有个极限)n运动图像:MPEG(Moving Picture Expert Group,运动图像专家组)1.JPEG压缩流程n编码流程:n解码流程:量化器DCT变换构造8x8的子图输入图像符号编码器压缩数据量化表码表压缩数据符号解码器DCT逆变换反量化器量化表输出图像码表(从压缩数据中得到)颜色空间转换nJPEG使用的颜色空间不是RGB空间,而是YCbCr空间,在进行DCT变换之前完成,这是因为人眼对亮度信息更敏感,相互之间的转换为:R = Y +
40、 1.40200(Cr 128)G = Y 0.34414(Cb 128) 0.71414(Cr 128)B = Y + 1.77200(Cb 128)Y = 0.299R + 0.5870G + 0.1140BCb = 0.1787R 0.3313G +0.5000B +128Cr = 0.5000R 0.4187G 0.0813B + 128量化nY为亮度分量,需要细量化,CbCr为色度分量,可以粗量化,因此量化表有2张),从而提高压缩比nDCT变换之后n低频分量集中在左上角,代表直流(DC)系数,由于两个相邻的子块DC系数相差很小,采用差分编码(DPCM),可以提高压缩比n后面的63个元素为高频分量,代表交流(AC)系数,采用行程编码,通过“之”字型(Zigzag)排列方法来保证低频分量先出现,高频分量后出现JPEG压缩前后的比较nCompression Ratio 8.91
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福州墨尔本理工职业学院《建筑装饰材料与工艺》2023-2024学年第一学期期末试卷
- 东南大学《土木工程施工技术A》2023-2024学年第二学期期末试卷
- 四川传媒学院《新媒体黑白故事漫画制作》2023-2024学年第一学期期末试卷
- 吉林省长春市九台区重点中学2024-2025学年初三下学期第七次月考英语试题含答案
- 2025二手房买卖合同融资协议
- 2025主要债权合同抵押物清单
- 2025学校餐厅与小商店经营合同
- 2025年北京市海淀区一零一中学初三3月份调研考试英语试题含答案
- 辽宁省大连市第十六中学2025年高三TOP20三月联考(全国II卷)物理试题含解析
- 达县2024-2025学年数学五下期末考试模拟试题含答案
- 基坑工程土方开挖支护与降水监理实施细则
- 江苏徐州市深地科学与工程云龙湖实验室社会招考聘用9人模拟试卷【附答案解析】
- 土方回填施工记录表
- 植物根茎叶课件
- 反生产行为讲稿
- 施工现场消防安全技术交底
- 冀教版二年级语文下册看图写话专项加深练习题含答案
- 焊接工艺评定及焊接工艺技术评定管理标准
- 洗衣房各岗位工作流程
- 基于SWOT分析的义乌市现代物流业发展研究
- 基于自适应滤波对音频信号的处理详解
评论
0/150
提交评论