信源编码技术_第1页
信源编码技术_第2页
信源编码技术_第3页
信源编码技术_第4页
信源编码技术_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信源编码技术第一页,共五十三页,2022年,8月28日2023/1/181信源编码技术信源编码:将模拟信源信号转换为二进制数字信号,在接收端再将收到的数字信号还原为模拟信号的方法这是由模拟网数字网至关重要的一步类别语音编解码图像编解码目前在移动通信系统中,语音信号还是主要业务,在今后多媒体移动系统中,图像业务比重越来越大。第二页,共五十三页,2022年,8月28日2023/1/182语音编码概念:把模拟语音信号变成数字语音信号,以便在信道中传输意义提高通话质量(数字化+纠错码)提高频谱利用率(低码率编码)提高系统容量(低码率+话音激活技术)移动通信对语音编码要求码率低、语音质量高抗噪声和抗干扰能力强编译码延时小,总延时在65ms以内编译码复杂度低,便于大规模集成化功耗小,便于应用于手持台第三页,共五十三页,2022年,8月28日2023/1/183语音编码分类第四页,共五十三页,2022年,8月28日2023/1/184语音编码方法波形编码:将时间域信号直接变换成数字代码,目的是尽可能精确再现原始语音波形。基本原理是在时间轴上对模拟语音按一定速率抽样,然后将幅度样本分层量化,并用代码表示。参量编码:又称声源编码,是将信源信号在频域或其它正交变换域提取特征参量,并转换成数字代码进行传输。基本原理是以发音机制的模型为基础,用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型,从模拟语音信号中提取这些特征参量并量化编码混合编码:将波形编码和参量编码结合起来第五页,共五十三页,2022年,8月28日2023/1/185几种语音编码优缺点波形编码优点:对于比特速率较高的编码信号(16~64kbits/s),波形编码技术能够提供相当好的话音质量缺点:对低速语音编码(低于16kbits/s),波形编码的语音质量显著下降,所以不适合频谱资源紧张的移动通信系统参量编码优点:可实现低速语音编码,速率可达2~4.8kbits/s缺点:语音质量只能达到中等混合编码吸收了上述两种编码的优点,是优选方向第六页,共五十三页,2022年,8月28日2023/1/186语音编码与压缩技术要实现低速、高质量的语音编码,必须采用压缩技术;波形技术处理:削减语音波形冗余度,包括线性预测分析、频带分割、正交变换和分析合成等;量化技术:优化幅度量化,包括自适应量化、自适应比特分配和矢量量化第七页,共五十三页,2022年,8月28日2023/1/187语音评价客观评定方法:用客观测量的手段来评价语音编码的质量,常用信噪比、加权信噪比、平均分段信噪比等方法;特点有建立在度量均方误差基础上;计算简单;对于低速语音编码,不能完全反映人对语音质量的感觉主观评定方法:主观评定等级或平均评定得分(MOS)--由数十名试听者在相同信道环境中试听并给予评分,然后对评分进行统计处理,求出平均得分。要求试听者人数足够多;语音材料足够丰富;试听环境尽量相同MeanOpinionScore第八页,共五十三页,2022年,8月28日2023/1/188主观评定等级试听者对语音质量的感觉往往是和注意力集中程度相联系的,因此对于主观评定等级,还有一个收听注意力等级。第九页,共五十三页,2022年,8月28日2023/1/189MOS分与语音质量MOS分在4.0~4.5分为高质量语音编码,达到长途电话网的质量要求MOS分为3.5分左右称作通信质量,听者能感觉到语音质量有所下降,但不影响正常通话,可以满足多数通信系统使用要求MOS分为3分以下常称为合成语音质量,只有足够高的可懂度,但自然度较差,不容易识别讲话者第十页,共五十三页,2022年,8月28日2023/1/1810语音编码现状标准制定情况第十一页,共五十三页,2022年,8月28日2023/1/1811第十二页,共五十三页,2022年,8月28日2023/1/1812语音质量与比特速率第十三页,共五十三页,2022年,8月28日2023/1/1813语音波形编码模拟语音信号数字语音信号:时间和幅度离散化,即抽样与量化抽样定理:采样率大于或等于信号带宽的2倍,离散信号可以无失真恢复成原始模拟信号幅度量化:用有限个幅值表示样值幅度,从而离散化信号幅度的过程量化阶距:相邻两量化值之差均匀量化:量化阶距为常量--小信号的“信号与量化噪声比”小,因此对小信号不利非均匀量化:量化阶距可变--压缩量化,即在均匀量化前,对大信号进行压缩,对小信号进行放大第十四页,共五十三页,2022年,8月28日2023/1/1814压缩量化压缩量化:对输入信号的对数进行量化,以使量化信噪比与量化电平无关律压缩:A律压缩:第十五页,共五十三页,2022年,8月28日2023/1/1815压缩量化特性A与的物理意义:最大量化阶距与最小量化阶距之比第十六页,共五十三页,2022年,8月28日2023/1/1816PCM调制PCM(脉冲编码调制):直接将样值编码为信号,特点为64kbit/s:量化成128个正负各半的量值,用7位二进制数表示,再加上一位符号共8比特;采样率8kHz采用A律或律压缩第十七页,共五十三页,2022年,8月28日2023/1/1817参量编码原理原理:模型化人类语音产生机制,提取模型参数,并且只传送模型参数--低码率编码,导致合成的语音波形失去了自然度和音质语音信号的产生模型语音的产生:声带与声道不同语音产生原因:声音激励源和声道不同声音分类:清音和浊音浊音:声带振动基音周期波形:三角形周期脉冲波,含丰富谐音清音:声带不振动,类似白噪声发声过程:口腔和鼻腔形成时变滤波器第十八页,共五十三页,2022年,8月28日2023/1/1818清音和浊音清浊音信号清浊音频谱第十九页,共五十三页,2022年,8月28日2023/1/1819语音产生模型语音模型的建立:1、产生激励;2、响应模型参数:基音、共振峰频率及强度、清浊音判决第二十页,共五十三页,2022年,8月28日2023/1/1820特征提取参数基于语音信号的短时准平稳特性-10~20ms提取技术自相关函数法平均幅度差函数法线性预测短时波形分析短时处理技术加窗技术:方窗和哈明窗基音周期估计:基于短时自相关函数基于短时平均幅度差函数第二十一页,共五十三页,2022年,8月28日2023/1/1821线性预测编码(LPC)线性预测:一个语音采样的现在值可以用若干个语音采样的过去值的加权线性组合来逼近。其中加权系数称为预测器系数。线性预测语音编码机理:语音信源是相关信源,即使经过采样与量化,相邻样点仍有很强相关性。线性预测编码:把线性预测用于语音编码。预测模型一般为一个全极点模型准则:最小均方误差传输:预测系数、基音周期和增益、清浊音判决第二十二页,共五十三页,2022年,8月28日2023/1/1822LPC数学描述第二十三页,共五十三页,2022年,8月28日2023/1/1823LPC实现结构(a)编码器(b)译码器第二十四页,共五十三页,2022年,8月28日2023/1/1824LPC编码器缺陷缺点:损失了语音的音质抗噪声能力差谱包络估计可能产生较大失真原因:激励信号在浊音段采用周期脉冲,在清音段采用白噪声没有将发端模型的误差信号传到收端第二十五页,共五十三页,2022年,8月28日2023/1/1825混合编码为克服LPC的缺陷,采用混合编码器,即在产生模型参数的同时,激励信号从语音波形信号获得方法一条路径产生线性预测参数并传送出去一条路径滤出信号的低频成分,并通过波形编码传送出去接收端的激励信号特点不需要进行清浊音判决和基音周期提取编码速率一般比LPC高音质比LPC编码器好第二十六页,共五十三页,2022年,8月28日2023/1/1826用于移动通信的语音编码移动通信中实用的语音编码均为混合编码第二十七页,共五十三页,2022年,8月28日2023/1/1827混合编码的共同特点先进行线性预测分析去掉语音的短时相关性;再分析出最佳激励信号;对激励信号和线性预测参数进行编码传送;第二十八页,共五十三页,2022年,8月28日2023/1/1828GSM的语音编码算法名称:(RPE-LTP)规则脉冲激励长时预测编码特点:是一种混合编码技术采用间隔相等、相位和幅度优化的规则脉冲作为激励源结合长时预测,消除信号冗余度,码率低语音检测--静寂描述(SID)帧编码率13kb/s计算简单、计算量适中、易于硬件化语音质量MOS达4.0RegularPulseExcitation-LongTimePrediction第二十九页,共五十三页,2022年,8月28日2023/1/1829RPE-LTP算法方案20ms为一帧,分成4个子帧,每个子帧含40个样点(采样率8kHz)每个子帧预测误差信号的样点按3:1等间隔抽取,得到13个样点(共有4种序列)在4种序列中选择一种对语音波形贡献最大的序列找到序列中的最大非零点,用6比特编码用最大非零点归一化整个序列,用APCM编码,每个样值各用3个比特编码第三十页,共五十三页,2022年,8月28日2023/1/1830GSM语音编码框图第三十一页,共五十三页,2022年,8月28日2023/1/1831GSM语音解码框图第三十二页,共五十三页,2022年,8月28日2023/1/1832IS-95语音编码技术算法名称:(QualcommCELP)Qualcomm公司码激励线性预测编码特点:是一种混合编码技术采用矢量量化技术采用CELP技术采用话音激活技术(VAD),速率可变速率有四种:9.6kbps、4.8kbps、2.4kbps和1.2kbps第三十三页,共五十三页,2022年,8月28日2023/1/1833矢量量化技术矢量量化:将若干个标量数据组成一个矢量,然后在矢量空间中给以整体量化,从而压缩了数据而不损失很多信息--它是一种能接近率失真理论限的量化技术;是一种延迟判决编码技术,把一个矢量映射为一个码本索引并传输到接收端,而码本是一个由有限个矢量组成的集合,并且这些矢量能组合得到所有可能的矢量第三十四页,共五十三页,2022年,8月28日2023/1/1834矢量量化技术示意第三十五页,共五十三页,2022年,8月28日2023/1/1835码激励线性预测技术(CELP)特点:基于线性预测编码技术激励源从码本中搜索并乘上最佳增益,代替LP余量信号编码过程:原始语音被分成帧,帧长约为10~30ms,对每帧进行LPC预测,求出LP参数在残留信号中进行长时预测两次预测结束后,得到激励信号,并对激励信号进行矢量量化第三十六页,共五十三页,2022年,8月28日2023/1/1836QCELP框图共15个参数:滤波参数a1,a2,…,a12;音调参数L和b;增益参数G;码表参数T第三十七页,共五十三页,2022年,8月28日2023/1/1837QCELP算法算法方案:把模拟语音按8kHz采样按20ms一个语音帧,每帧160个样本用这160个样本产生3个参数子帧,这3个参数子帧不断更新,并按一定帧结构送至接收端滤波参数a1,a2,…,a12,对任何速率每20ms更新一次音调参数,不同速率更新频率不同码表参数,不同速率更新频率不同第三十八页,共五十三页,2022年,8月28日2023/1/1838QCELP不同速率的参数变化注:1/8速率不是从码表选择,而是伪随机激励第三十九页,共五十三页,2022年,8月28日2023/1/1839QCELP速率选择根据每一帧中的能量与3个门限值的比较3个门限值的选择基于对背景噪声的估计每一帧中的能量由自相关函数R(0)的值决定,与门限T1(Bi)、T2(Bi)和T3(Bi)(Bi为背景噪声)的关系:若R(0)大于3个门限,则选择速率‘1’若R(0)大于2个门限,则选择速率‘1/2’若R(0)大于1个门限,则选择速率‘1/4’若R(0)小于所有门限,则选择速率‘1/8’每次只允许变化一级半速率时,门限‘1’实际为门限‘1/2’第四十页,共五十三页,2022年,8月28日2023/1/1840IS54语音编码算法名称:矢量和激励线性预测编码(VSELP)特点:采用CELP技术有三个码本,一个为长时预测增益,另两个为矢量码本。每一激励为3个码本的信号组合在搜索最佳激励矢量方面有简化算法码本为事先确定好的结构,不用全搜索第四十一页,共五十三页,2022年,8月28日2023/1/1841WCDMA语音编码算法名称:(AMR)自适应多速率编码AMR概念:以更智能的方式解决信源编码和信道编码的速率匹配问题,实际的语音编码速率将取决于信道条件原因:WCDMA支持多媒体业务,并支持分组交换与电路交换方式移动信道是随机变化的,固定速率编码不能使系统工作在最佳的信源编码和信道编码速率上信道质量差时,信道编码不足以纠正传输错误,此时应改进信道编码,减小信源编码速率,提高语音质量信道质量好时,增加信源编码速率,提高语音质量第四十二页,共五十三页,2022年,8月28日2023/1/1842AMR语音编码原理AMR是一种集成语音编码器,有8种确定的信源速率模式,从4.75kbps~12.2kbps第四十三页,共五十三页,2022年,8月28日2023/1/1843AMR编码框图第四十四页,共五十三页,2022年,8月28日2023/1/1844AMR解码框图第四十五页,共五十三页,2022年,8月28日2023/1/1845图像压缩编码图像信息量大,处理技术复杂图像信息量远大于语音、文字、传真,所占用的传输频带也更宽传输、处理、存储图像信息都比语音、文字等更复杂、更困难图像包括:静止图像、可视电话、会议电视、广播电视和高清晰度电视等不同等级为节约传输带宽,根据图像信息中有大量的冗余信息,需要且能够对图像信息进行压缩编码第四十六页,共五十三页,2022年,8月28日2023/1/1846图像压缩编码原理根据各类图像的客观统计特性、以及接收者人眼的生理与心理特征,来制定综合匹配的压缩编码方式通过图像的帧间预测来消除图像的时域相关性通过图像的帧内离散余弦变换(DCT)来消除图像的空间域相关性利用人眼视觉生理与心理特征进行自适应量化编码通过熵编码实现与信源的概率统计匹配采用缓冲存储器实现输入变长与输出定长之间的匹配第四十七页,共五十三页,2022年,8月28日2023/1/1847图像压缩编码标准第四十八页,共五十三页,2022年,8月28日2023/1/1848MPEG4综述比前面的MPEGx更加全面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论