数据预测编码2_第1页
数据预测编码2_第2页
数据预测编码2_第3页
数据预测编码2_第4页
数据预测编码2_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章预测编码课前回顾预测编码的基础是什么?预测编码(Predictivecoding)建立在信号(语音、图像等)数据的相关性的基础上。它利用以往的样本值对于新样本进行预测,减少数据在时间和空间上的相关性,以达到压缩数据的目的。数据源的建立是十分困难的,有时无法得到其数学

模型?如何进行预测?利用现代统计学和控制论的“时间序列分析”理论,可以较好地解决复杂系统的输出状态问题。课前回顾以DPCM系统为例,解释基于预测的编码方法的原理。图5.1DPCM系统原理框图量化器预测器编码器xk-ekSk信道解码器预测器发送端接收端课前回顾发送端先发送一个其始值x0;接着就只发送预测误差值;接收端接收到量化后的误差与本地算出的预测值相加,得到恢复信号;式中线性预测:

MMSE线性预测最小均方误差准则(MMSE)使得预测误差的均方值最小。经典方法:

MMSE线性预测将式(5.2-1)之带入,得到:(5.2-3)最小误差必须与预测采用的所有数据正交。当N给定后,σe2是依赖预测系数ai的函数,使MSE最小,σe2对ai求导等于0,有:因此:正交原理(Hilbert空间映射定理)得到:(5.2-4)定义数据的自相关函数:(5.2-5)自相关函数满足:(5.2-6)当{xi}广义平稳时,有:(5.2-7)

MMSE线性预测最小均方误差为:(5.2-10)最佳预测条件下必然有ek的方差σe2小于xi的方差R(0),甚至可能σe2<<R(0)意味着误差序列{ek}的相关性弱于原始信号序列{xi}的相关性,甚至可能弱很多。

如果{xi}是各态历经的且N足够大,则R(k)可用下式估计:(5.2-9)即各态遍历。在随机过程里面,指的是时间上的各个状态遍历了所有可能的情况。

MMSE线性预测R(i)越大(即{xi}的相关性越大),方差σe2越小,

所能达到的压缩比就越大;R(i)=0(即{xi}的互不相关),方差σe2min=R(0)大,

此时利用预测起不到数据压缩的目的。利用条件概率进行预测,去除了大部分相关性的误差序列{ek},有利于压缩数据。

MMSE线性预测预测阶数的选择直观上,增大预测阶数N可提高预测准确度;

实际上,当N较小时,增大N有助于减小σe2;当N足够大时,再加大N就不会有明显的结果了。一般情况下,若{xi}为N阶马尔可夫过程,则用N阶预测。当

N足够大使预测误差不相关即E{ekek+j}=0(j≠0)时,再增大N值将不会使σe2再减小。设{xi}为平稳的m

阶马尔可夫过程,则N=m阶最佳线性预测器就是在MMSE意义上最好的预测器,而且这样得到误差序列{ek}将是不相关的。结论:电视编码中:采用主观准则(例如使“大误差”出现概率最小的准则);但当考虑到人的主观感知效果特别是用于图像信号时,MMSE并不是一个好的准则。遥测信号等广泛的信源:

采用对各种信源保持一定预测增益的预测系数不变性准则。DPCM是一项简单的数据压缩技术,可以方便地用软件和硬件来实现。DPCM的压缩率不很高,相对于变换编码,它可以得到中等的压缩率。DPCM对信道噪声非常敏感。结论:5.3语音信号的预测编码语音压缩的依据语音信号本身的冗余度和人类的听觉感知机理。语音压缩的质量要求:下面三方面的折中保持可懂度和音质;限制比特率;降低编码过程的计算代价。

人的听觉感知机理人的听觉系统(HAS:HummanAuditorySystem)

具有掩蔽效应(MaskingEffect);人耳对不同频段声音的敏感程度不同;③人耳对语音信号的相位变化不敏感。人的听觉生理-心理特性对语音感知的影响:人耳听不到或感知极不灵敏的声音分量都可以视为冗余的。ITU建议制定时间码率(kp/s)编码算法说明G.711197264(56)PCM(/A)3kHz语音带宽,8kHz取样G.7211984/198632ADPCM3kHz语音带宽,8kHz取样G.722198664/56/48SBC-ADPCM7kHz语音带宽,16kHz取样G.723198640/32/24ADPCM(CDME建议)G.723.16.3/5.27MP-MLQ/ACELP算法复杂度:14.6/16MIPSG.7261990→16ADPCM(CDME建议)G.727199032/24/16ADPCM(EMB建议)G.728199216LD-CELP低时延CELPG.72919968CS-ACELP算法复杂度:20MIPSG.729A1996810.5MIPS,可用于DSVDG.729B1996用于V.70终端,语音激活表5.1语音编码的主要国际标准

人的听觉感知机理5.4

静止图像的预测编码经过统计,认为人们获取的信息的70%来自视觉系统。分类从表面形态上看:静止图像活动图像(运动图像,序列图像)按描述方法的不同:矢量图像(图形,graphics)点阵图像(位图图像,图像,image)图像数字化之后的数据量非常大,传输时很费时间,存储时很占空间,故必须对图像数据进行压缩。帧内预测器的设计预测编码时:利用多个像素进行预测①一维预测:利用处于同一行的因果样值来预测;②二维预测:不但利用同一扫描行的几个因果样值,

还利用以前几行的取样值;③三维预测:不但利用本行的因果样值前几行的相

邻取样值,还要利用相邻几帧(或不

同波段)上的取样值。图像信号:垂直方向相关水平方向相关实用中:预测器阶数不宜过高及尽量减少乘法运

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论