(信号与信息处理专业论文)从amr到efr和hr语音编码器的转码方法研究与实现.pdf_第1页
(信号与信息处理专业论文)从amr到efr和hr语音编码器的转码方法研究与实现.pdf_第2页
(信号与信息处理专业论文)从amr到efr和hr语音编码器的转码方法研究与实现.pdf_第3页
(信号与信息处理专业论文)从amr到efr和hr语音编码器的转码方法研究与实现.pdf_第4页
(信号与信息处理专业论文)从amr到efr和hr语音编码器的转码方法研究与实现.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕士学位论文 摘要 随着无线通信技术的迅速发展,通信语音编码有了新的技术和标准。包括我国在内 的很多国家移动通信系统使用g s m 网络,其语音编码技术在原有的全速率( f r ) ,增强 全速率( e f r ) 和半速率( h r ) 等算法的基础上开始使用了自适应多速率语音压缩标准 ( a m r ) 。因此,目前g s m 用户手机中各种编码器同时存在,这在g s m 网络的接收端和 发送端使用不同编码标准的情况下带来了兼容的问题。 解决此问题的方法是在蝴r 与e f i 泖刚h r 之间做一个转码系统。不同语音编码标 准之间实现转码有两种方法,其一是基于先解码再编码的d e m 算法,其二是在编码 参数层上直接转换的算法。 本文分别研究了在a 凇与e f r 和h r 之间参数层上转换的可行性,并提出了转码 方案。本论文的主要工作有: ( 1 ) 简要介绍了蝴r 、e f r 和h r 共有的码激励线性预测( c e l p ) 语音编码原理,并 对其主要模型参数( 线性预测系数、基音延时、固定码本参数和码本增益参数) 进行了详 细分析。 ( 2 ) 根据各编码器的编码原理,分别提出了a m r 向e f r 、龇r 向h r 的参数层转 码方案。a m r 向e f r 转码时,在连续语音传输的情况下进行了码流层上直接映射,而 非连续语音传输时分别做线谱对系数的转换和能量转转。在a m r 向h r 转码时,进行 线性预测系数转换、帧类型判断、基音延时的转换、固定码本的转换和码本增益的转换。 ( 3 ) 在p c 机上,基于v c + + 平台,采用定点c 语言编程对参数层转码系统进行了 仿真试验。主观与客观语音质量测试表明,本论文提出的转码算法与t 觚d e m 转码算法 的语音质量接近,但本文的转码算法比胁d e m 算法延时至少减少了5 m s ,复杂度也分 别降低了8 2 和3 7 5 。 关键词:转码;码激励线性预测编码;a m r ;e f r ;h r 从a m r 到efr 和hr 语音转码器的转码方法研究与实现 r e s e a r c ha n di m p l e m e n t a t i o no nt r a n s c o d i n gf r o m 公j 以rt oe f ra n d 公j 刀rt o 玎王s p e e c hc o d e r s a b s t r a c t s p e e c hc o d i n gf o rc o m i l l j u n i c a t i o ns y s t e mh a sn e wt e c h n o l o g i e sa i ns t a n d a r d s 她t ht h e 而p i dd e v e l o p m e n to f 谢r e i e s sc o i l l 】m u l l i c a t i o nt e c l l l l o l o g y m a n yc o 硼t r i e s ,i n c l u d i n gc 妯嗨 l l s e 吐l eg s mc o m m 吼i c a t i o nm o b i l en e t w o r k ,i t ss p e e c h c o d i n gt e c h n o l o g i e sa r es t a r t i n gt o u s e a l i t o a d a p t i v em u l t i r a t es p e e c hc o d i n gs t a n d a r db a s e d o nf r ,e f ra n dh rs p e e c hc o d i n g a l g o r i t h m s t h u s ,v 蕊o u ss p e e c hc o d e r sc o e x i s t 锄o u n gd i a e r e n tg s mm o b i l ep h o n e s , m e a i l w k l et h eu s eo fd i 缳:r e n ts p e e c hc o d e r si i lt r a n s m i t t e ra n dr e c e i v e ro fg s mn e t w o r k c a u s e dc o m p a t i b i l i 够p r o b l e m t h ew a yt os o l v et h j sp r o b l e mi st od e v e l o pat r 觚s c o d i n gs y s t e mb e t w e e na m ra i l d e f 肌r h r 1 1 1 e r ea f e 似om e t h o d st 0d e v e l o pat r a l l s c o d i n gs y s t e m o n ei st a n d e m a l g o r i t h mb a s e do nd e c o d e t h e n e n c o d em e t h o d ;t h eo t h e ri sp a r 锄e t r i cd o m a i nt r a i l s c o d i i l g m e t h o d n l i sp a p e rs t l l d i e st h ef e a s i b i l 蚵o fp a r a i n e t r i cd o r n a i n 馏a n s c o d i n g 矗o ma m r t 0 e f ra n dh r ,a n dp r e s e r l t sap i l o p o s a lt oi m p l e m e n t a t i o no ft t l a tt r a n s c o c l e r t h eo u t l i n eo ft k st h e s i si so r g a n j z e da sf o l l o w s : ( 1 ) i n 仃o d u c e dc o d ee x c “e dl i n e a rp r e d i c t i o ns p e e c hc o d i n ga l g o r i t m 砌c h i su s e db y a m r ,e f r ,h r ,a n da n a l y s i si t sp a r 锄e t e r s ,s u c h 嬲l i n e a rp r e d i c t i o nc o e 蕊c i e n t s ,p i t c hd e l a y , f i x e d c o d e b o o kp a r a m e t e r sa n dc o d e b o o kg a i l lp a r 锄n e t e r s ( 2 ) a c c o r d i n gt 0s i m i l a r i 够o fp a r 锄e t e r so f e a c hc o d e r ,p r o p o s e dt r a u l s c o d i n gm e m o d s 五ma m rt oe f ra n d 丘o ma m rt oh r o nd i s c o n t i n u o u ss p e e c h 仃a n s m i s s i o n ,也e p r o p o s e da t oe f r 仃a n s c o d i n gh a st 、v os t e p s :l p cc o n v e r s i o na n de n e r g yc o n v e r s i o n , 、) 岫e 舢瓜i sd i r e c t l ym 印p e dt oe f ro nt 1 1 eb i ts t r e a ml a y e ro nc o n t i n u o u ss p e e c h 仃a i l s m i s s i o n ;t h ep r o p o s e da m rt 0h rt r 2 l r l s c o d i l l g i sc o m p o s e do ff i v es t e p s :l p c c o n v e r s i o n ,m o d ed e t e 衄i n a t i o n ,p i t c hc o n v e r s i o n ,f i x e dc o d e b o o ks e a r c ha i l d c o d e b 0 0 k g 撕nc o n v e r s i o n ( 3 ) s i m u l a t i o n so ft h ep a r a 硼e t r i cd o m a 主nn a n s c o d i n gs y s t e ma r ec a m e do u t 晰t hn l e f i x e d p o i n tcp r o g r 锄m i n gl a i l g u a g eo np e r s o n a lc o m p u t e r t h es u b j e c t i v e a n do b j e c t i e l i s t e r l i r 毽t e s ts h o w st h ep r o p o s e da l g o r i 衄nc o u l dp r o d u c ee q u i v a l e n ts p e e c hq u a l i t ) rt o 也e 吼l d e ma j g o r i t h mb u t 谢ma tl e a s t5 m ss h o r t e rd e l a ya n d8 2 a n d3 7 5 c o m p u t a t i o n a l c o m p l e x i 锣i nt h e o r y k e yw o r d s :r r a n s c o d i n g ;c e l p ;a m r ;e f r ;h r i i 大连理工大学硕士学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题目: 作者签名: 导师签名: 丛坐坠皇! ) 里坠垒坠透盖绫登鑫塑墼整查堕笙窒墨蔹诎 日期:颦年旦月旦日 日期:趟年互月二l 日 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文题目:丛垒塑皇! ) 显垫垒璺垒逞盎盔鱼堡黧墨蜀查墨堡鱼兰室乡 作者签名:蔓蛰:蝤全整 日期: 2 四年坠月j 竺日 大连理工大学硕士学位论文 第一章绪论 1 1移动通信与语音编码技术的发展情况 移动电话是人类进行语音通信的最重要方式之一。自从2 0 世纪7 0 年代移动通信起 源以来,其技术标准已经历了三代的发展,正向第四代迈步。 以蝴p s 和t a c s 为代表的第一代蜂窝移动通信网是模拟系统。模拟蜂窝网虽然取 得了很大成功,但也暴露了一些问题。例如,频谱利用率低、移动设备复杂、费用较贵、 业务种类受限制以及通话易被窃听等;最主要的问题是其容量己不能满足日益增长的移 动用户需求。为了解决这些问题,开发了数字蜂窝移动通信系统。数字无线传输的频谱 利用率高,可大大提高系统容量。另外,数字网能提供语音、数据等多种业务服务,并 与i s d n 等兼容。到1 9 8 0 年代中期,欧洲首先推出了泛欧数字移动通信网( g s m ) 的体系。 随后,美国和日本也制定了各自的数字移动通信体制d a m p s ( i s 5 4 ) 和p d c 。继目前的 g s m 数字蜂窝网和窄带c d m a 网之后,国际电信联盟制定了第三代移动通信技术和标 准,这是以承载数据业务为主的高速、宽带移动通信网络。第三代移动通信采用了频谱 利用率更高的无线技术,可支持3 8 5 k b p s 以上速率的中高速移动数据业务,因而可实现 包括活动图像在内的移动多媒体业务。在第三代移动通信系统应用的同时,爱立信公司、 华为公司、中兴通讯等已开始进行第四代移动通信标准的研究,预计在2 0 1 1 年正式投 入运营,2 0 1 2 年奥运会就可应用。 随着信息社会和通信技术的高速发展,频率资源愈发显得宝贵。因此,压缩数字语 音信号的传输带宽或降低电话信道的传输码率一直是人们追求的目标,语音编码在实现 这一目标中担当着重要角色。语音编码就是压缩语音信号的数字表示而使表达这些信号 的比特需求最小的算法1 2 j 。 语音编码目前主要分为三类,即波形编码、参数编码和混合编码。波形编码力图使 重建语音波形保持原语音信号的波形形状,它通常将语音信号作为一般的波形信号来处 理,具有适应能力强、话音质量高等优点,但所需要的比特率高,通常能1 6 6 4 k b s 的 速率上给出高的编码质量,当速率进一步降低时,其性能会迅速下降。参数编码则通过 对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的可懂性,即保 持原语音的语意,而重建语音信号的波形同原始语音信号的波形可能会有相当大的差 别,但其编码速率很低;另外,它对讲话环境的噪声比较敏感,只有在安静的讲话环境 下才能给出高的可懂度。混合编码则克服了波形编码和参数编码的弱点,同时又结合了 他们各自的长处,在和1 6 k b s 速率上能够得到高质量的合成语音,在本质上它也具有波 从amr 到efr 和hr 语音转码器的转码方法研究与实现 形编码的优点【) j 。 目前,很多组织制定语音编码标准,它们制定的主要窄带语音编码标准如表1 1 所 示【4 j 。既然不同的组织和国家开发并采用了不同的通信标准与编码方式,就带来了兼容 的问题。例如,对移动电话g s m 网络的语音编码技术来说,原有的全速率、增强全速 率、半速率语音编码技术越来越被自适应变速率语音编码技术替代。在这新技术的过渡 期内各种编码技术同时存在。因此研究各种编码标准之间有效的转换具有很大的应用价 值。 表1 1窄带语音编码标准的性能【4 】 t a b 1 1s u m m a 叫o fm o s tn a r r o w - b a n ds p e e c hc o d e r s 1 2 语音编码转码技术现状 长期以来,语音编码码流之间的转码采用先解码后编码的d t e ( d e c o d et h e ne n c o d e , 也称t a n d e m ) 方式进行语音编码参数的转换。在这种方式下,不需要额外的算法,利用 现有的算法和资源就可实现不同编码器编码参数的转换。但其缺点也十分明显,为了实 现码流之间的转换发送端需要支持两种完整的语音编解码算法,这就带来了几个问题。 首先,由于两次编解码误差的积累,使得最终的合成语音质量下降,直接的表现就是 一2 一 大连理工大学硕士学位论文 m o s 分的降低;其次,两次完成的编解码使转换算法的复杂度大大增加,从而导致能 量消耗变大;最后,编码端在进行线性预测分析时,需要一些前一帧的数据,因此这种 转换方法还增加了系统的延时,而这个增加的延时由算法本身所决定,所以不可避免【5 1 。 ;7 一: 旧籍器h 源擀 斗 目标编码l :i 目标解码l - - - - _i 器编码 l :i 器解码 i lil i : : d d t e 转码器 ; 、一 , 图1 1d t e 方式下的码流转换 t i g 1 1 1 a n d e mm e t h o d sf o r 仃a 1 1 s c o d e o 由于d t e 方式所固有的缺点,我们需要更加有效的转码方法。针对具有相似编码 模型和相似编码参数的语音编码器有参数层上直接转换的可能性。例如,g s m 网络的 语音编码算法中,a m r 、e f r 和h r 都采用码激励线性预测( c o d ee x c i t e dl i n e a r p r e d i c t i o i n ,c e l p ) 编码技术的编码模型。所以变速率a m r 编码器与其余两种编码器之 间码流的直接转换具有一定的可行性。 图1 2 参数层转码方式下的码流转换 f 毽1 2t 咖1 s c o d i n go nt h ep a r 姗e t e rl a y e r 1 3 语音编码砖码技术国内外研究情况 目前,国内外学者研究了语音编码器参数层转码算法,并取得了一定的成果p 】。 2 0 0 0 年s h u m i i lt s a i 和j 辨f e r ry 觚g 首先提出在码流之间直接转换的思想,并给出了 g s m 和q 7 2 9 语音编码器的转码方案【1 0 j 。同年s u i l i ll e e 和s e o n g l l os e o 给出了帧尺寸 相同的两种编码器的转码方法,并且考虑了静音帧编码的特性。h o o g o ok a i l g 和h o n g k o o k 飚m 等2 0 0 3 年提出了参数域的转码算法,并给出了i t u tg 亿。7 2 9 和t 认i s 6 4 l 从a m r 到efr 和hr 语音转码器的转码方法研究与实现 之间的转码方案【l l | 1 2 1 。2 0 0 4 年徐慧,殷福亮等人提出了帧尺寸不相同的两种编码器 q 7 2 3 1 与a m r 的转码方法【1 j 。 语音转码技术的研究还存在一些问题。码书结构不同的固定码本参数之间的转换和 码本增益系数的转换采用级联的方法。首先部分解码得到合成语音,通过合成语音重新 计算固定码本参数与增益系数。这样影响转码器计算复杂度的降低。因此提高转码器的 效率还需要在固定码本和码本增益系数的转换方法上进行大量的研究。 1 4 论文研究内容与章节 本文研究了g s m 网络使用的三种语音编码技术:自适应变速率语音编码、增强全 速率编码j 半速率编码,深入剖析了它们的编码参数:线性预测系数、基音延时、固定 码本参数和码本增益参数等。并且给出了参数层直接转换的算法。最后,采用定点c 语 言编程,在v c + + 平台上对参数转码算法进行仿真实验。 本论文的主要内容安排如下; 第一章简要介绍了现代移动通信系统和语音编码标准的发展过程,语音转码课题的 背景,以及转码技术的现状。 第二章分析了码激励线性预测语音编码技术的基本原理、矢量量化技术,并描述了 码本设计、码子搜索和变速率语音编码技术。 第三章介绍了g s m 语音编码器触r 、e f r 和h r 的编码与解码原理,并着重分 析了每一种编码器的编码参数,包括线性预测系数、基音延时、固定码本参数和码本增 益参数。 第四章。分别给出了a m r1 2 2 模式向e f r 和a m r5 9 模式向h r 之间单项参数层 转码的方案。 第五章使用定点c 语言在p c 机上,基于v c + + 平台,对提出的转码算法进行了仿 真实验。对传统的d e m 转码算法与本文提出的参数层转码算法进行对比分析,从算 法复杂度、系统时间延迟和语音质量等三个方面进行了系统性能评价。 大连理工大学硕士学位论文 第二章码激励线性预测编码 自从有线电话发明以来,语音编码是信号处理领域中的一个重要部分。经过充分的 研究和发展,研究人员已经开发了许多语音编码技术,并且这些技术进一步在互联网和 无线通信等领域上应用。语音编码作为数字语音通信最基本的一个技术,随着电信服务 和功能需求的增加更加引起关注。同时通信基础设施和计算机硬件的不断改进也给语音 编码器在信号处理中的应用带来了飞速的发展。 由于大部分信号传输系统的带宽限制,语音编码显得越来越重要。理想的语音编码 是,用最少的比特数对语音信号的数字采样进行编码得到质量令人满意的合成语音。同 时保持合理的计算复杂性。语音编码有两个主要应用:数字传输和语音信号的保存。数 字传输中语音编码技术的研究目标要么是降低信号传输比特率,要么是在一定的比特率 下提高语音合成质量。 目前人们己实现了许多不同的语音编码器,其中中低速率( 码率小于1 6 k b p s ) 语音 编码技术得到了很快的发展。中低速率语音编码器的核心技术是码激励线性预测编码, 它采用了合成分析技术、感知加权、矢量量化、线性预测等技术。我们将要研究的g s m 系统语音编码器a m r 、e f r 和h r 都是基于c e l p 的编码算法。因此,下面简要地讲述码 激励线性预测编码的基本技术。 2 1 分析合成技术 码激励线性预测编码的主要原则之一是分析合成技术( a n a l a y s i sb ys y i l t h e s i s , a b s ) ,其框图如图2 1 所示。它的基本思想是,在编码端进行编码( 分析) 一解码( 合 成) 的循环,用解码端完全一致的解码器合成语音,使之原始语音相比较,根据一定的 误差准则来调整编码参数并优化合成语音,最终得到最佳的编码参数。 图2 1 分析一合成框图 f i g j 2 1 b l o c kd i a g r a mo f a n a l a y s i s b y - s y n t h e s i s 从理论上讲,最好的分析合成编码器会尝试每一个可能的比特组合并选择其中合 成语音质量最佳的一个。很显然这样做是不可能的,因为一是算法复杂度很高,二是最 从a m r 到efr 和hr 语音转码器的转码方法研究与实现 佳合成语音是一个人为定的主观目标。为了在有限的硬件资源条件下实现实时编码,分 析一合成算法需要改进。c e l p 编码器是采用感知加权算法,把整个循环体分成几个更小, 更容易计算的级联模块。每一个模块是计算复杂度不是很高的搜索计算过程。 2 2 线性预测技术 线性预测分析( l i n e a rp r e d i c t i o nc o d i n g ,l p c ) 是语音信号分析最有效的分析技术之 一。它提供了语音信号的信号模型,用模型参数来精确地表征了语音信号的频谱特征。 2 2 1 信号模型化 在随机信号谱分析中,常把一个时间序列模型化为白噪声序列通过一个数字滤波器 h ( z ) 的输出。在一般情况下,h ( z ) 可写成有理分析的形式【1 4 】。 孽 1 + 岛z 一 日( z ) = g 号一 l 一口f z “ f 互l ( 2 1 ) 式中,系数q 、岛以及增益因子g 是模型参数。因而信号可以用有限数目的参数构成的 信号模型来表示,如图2 2 所示。 h ( z ) 图2 2 信号s ( n ) 的模型化 f i g 2 3 m o d e lo fs i g n a ls ( n ) 从时域上看,信号模型的输出与输入满足下面的差分方程: s ( 疗) = 口,s 一i ) + g 6 ,“( 以一,) ,6 0 = 1 ( 2 2 ) ,= l f = o 上式表明,s ( n ) 可以模型化为它的p 个过去值s ( n i ) 和输入u ( r 1 ) 及其q 个过去值u ( n 1 ) 的 线性组合来预测得到,所以信号模型化与线性预测有内在的联系。 当输入u ( n ) 是零均值的随机信号是,系统的输出与输入关系可用相关函数或功率谱 关系来表示,即 氏( z ) = 爿( 孑) h ( z q ) r 。( z ) ( 2 3 ) 大连理工大学硕士学位论文 式中,氏( z ) 和r 。( z ) 分别为信号s ( n ) 和输入u ( n ) 自相关序列的z 变换。在信号模型中, u ( n ) 是零均值,方差为蠢的白噪声序列,其子相关为屯( 胛) = 蠢万( 行) ,所以r 。( z ) = z , 因此上式( 2 3 ) 为 比( z ) = 日( z ) h ( z 叫) ( 2 4 ) 写成功率谱形式 s 0 p ) 1 2 刊日0 p ) 2( 2 5 ) 上式假设z = 1 :这表明,信号s ( n ) 的功率谱is ( 口一) 1 2 完全由滤波器的幅频响应来决定。 从这个意义上讲,系统h ( z ) 确实可以用来模型化信号s ( n ) ,式( 2 5 ) 也是用模型参数分析 法来进行随机信号普估计的依据。信号模型化过程实际上要解决的是模型参数估计问 题,用一个有限数目的参数的模型来表示信号总是有误差的。因此,求解模型参数的过 程通常是一个逼近的过程, 2 2 2 语音信号的线性预测分析 语音信号是一个随机序列,所以它也可以用上述信号模型化来进行分析。基于信号 模型化思想的语音信号产生模型如图2 3 所示。 基音频率 图2 3 语音信号产生的数字模型 f i g 2 3d i g i t a lm o d e l0 fs p e e c hs i g i l a lg e n e r a t i o n 样本 上图中,时变数字滤波器是一个全极点系统,其函数为 以加器2 卷 亿6 ) 求解滤波器参数口,和增益g 的过程我们称之为语音信号线性预测分析,口f 即是线性预测 从amr 到efr 和hr 语音转码器的转码方法研究与实现 系数。由于语音信号的时变特性( 长时非平稳,短时准周期的随机序列) ,预测系数的 估计值必须在一短段语音信号中进行,即按帧进行。 h ( z ) 的分母子与下图2 4 所示的线性预测误差滤波器的系统函数a ( z ) 一致。这是因 图2 4 线性预测误差滤波器 f i g 2 4 l i n e a rp r e d i c t i v ee r r o rp r e d i c t i v e 为,设输入j ( ,z ) 是原始语音信号,;( 刀) 是j ( 刀) 过去n 个样本值的线性组合,也称作线性 预测值,则 ;( 玎) = q j o f ) ( 2 7 ) f = l 那么原始语音s ( 哟与其预测值之差为误差p ( 疗) 为 口( 刀) = j ( 刀) 一j ( 力) = j ( 刀) 一芝:q s ( | ,7 一,) ( 2 8 ) 扣l 上式两边求z 变换可得 e ( z ) = ( 1 一q z “) s ( z ) ( 2 9 ) j = l 因此,图2 4 所示的数字滤波器a ( z ) 的系统函数为 么( z ) = 1 一q z 一 ( 2 1 0 ) ,= j 语音信号线性预测分析就是用这线性预测误差滤波器来进行的,即求解一组预测器 系数,使得在一短段语音信号序列中均方预测误差最小,并把如此求得的参数认为是语 音产生模型中滤波器h ( z ) 的参数。 2 2 3 线谱对参数 线谱对( l i n e a rs p e c 加衄p a i r l s p ) 参数的抗干扰能力远比线性预测系数的抗干扰能 力强【1 5 】。为了提高编码器性能,一般线性预测系数转换为线谱对参数。 由上式( 2 1 0 ) ,可得线性预测误差滤波器的传递函数有以下的递推关系 大连理工大学硕士学位论文 么。( z ) = 么卜1 ( z ) 一t z 一么h ( z 一1 )( 2 1 1 ) 式中, 彳7 ( z ) = i 一q z ,f = l ,2 ,3 , ( 2 1 2 ) 记p 阶的线性预测误差滤波器传递函数为a ( z ) ,即么( z ) = 彳p ( z ) ,我们可以定义两个p + 1 阶的多项式,即 勰三怒二= 弑 亿 l q ( z ) = 彳( 力一z 1 p 彳( z _ 1 ) 不难看出;p ( z ) 相当于上式( 2 1 1 ) 中砟+ 。= 一l 的彳川( z ) ,q ( z ) 相当于+ 。= 1 的彳川( z ) , 并且由上式( 2 ,1 3 ) 可推出 么( z ) = 0 5 p ( z ) + 0 5 q ( z )( 2 1 4 ) 它和合成滤波器h ( z ) 之间的满足关系h ( z ) = l a ( z ) 。如果a ( z ) 为稳定系统,即其极点都 在单位圆内,则可以证明p ( z ) 和q ( z ) 的零点都在单位圆上,并且p ( z ) 和q ( z ) 的零点沿 着单位圆上随角频率缈的增加交替出现设p ( z ) 的零点为p 婀,q ( z ) 的零点为p 2 鸬, 那么p ( 孑) 和q ( z ) 可写为【1 l 】 哆,谚按下式关系排列为 o q 舅 岛 绵,2 巳,2 万 ( 2 1 6 ) 系数饵和谚称对出现,反映了谱的特性,称之为线谱对。它有如下主要性质: ( 1 ) 在求取线谱对频率参数及量化过程中,如果保持l s p 参数的有序有界性质,即 ( 2 1 6 ) 式成立,就可以保证全极点滤波器h ( z ) 是稳定的。 ( 2 ) l s p 参数是相对独立的。如果某个l s p 参数有误差,则只对原始语音频谱中与 之对应的频率附近有影响。所以l s p 参数的量化与内插性质比l p c 好。 ( 3 ) l s p 参数能反映语音幅度谱中的共振峰特性,即幅度大的地方分布较密,反之 $q - 严 严 + + q 乱 o o c c 2 2 一 一 0 o 胆n闽m兀 r + 一 0 o = = 力 力,l q 从amr 到efr 和hr 语音转码器的转码方法研究与实现 ( 4 ) 相邻帧l s p 参数的相关性比l p c 参数的相关性大,有利于编码时帧间参数的内 ( 5 ) 量化l s p 参数的效率高,即将l p c 参数转换为l s p 参数后,可以在量化时使 用更少的比特获得同样的精度【1 6 】。 2 3 感知加权滤波技术 感知加权滤波器( p e r c 印t u a lw 萌g h t i n gf i l t e r ) 就是利用人类听觉系统的频域掩蔽效应 进行噪声谱变形( n o i s es p e c t r a ls h 印i n g ) 。掩蔽效应指的是,使一个声音a 能够被感知的 忡,= 粼= 筹 亿忉 式中,参数所,心是感知加权因子,他们用来控制共振峰区域的去加重。y 只是扩展共 其中,z 为采样频率。通常,o y 1 ,各语音编码标准根据主观测试结果选择合适的y , 如果式( 2 6 ) 所示的合成滤波器与式( 2 1 7 ) 的感知加权滤波器级联,则可以得到感知 加权合成滤波器风( z ) 。 也攀卿,。渤去2 赤 亿1 9 ) 大连理工大学硕士学位论文 2 4 矢量量化技术 2 4 1矢量量化的概念 矢量量化【1 7 】是把欧式矢量空间尺中的任意一个k 维矢量映射到固定的矢量集合 y = 咒:扛l ,2 ,) 中的一个矢量。其中,每一个只称为码矢量或码字。全部码字的集 合称为码书或码本。与只距离最小的区域称为v 0 r o n o i 区域,它由下式定义 巧= x r 2 :| lx 一只l l | ix j ,歹f )( 2 2 0 ) 式中,x 为杉中的任意矢量,m 为k 中的码字。全部v o r o n o i 区域的集合为完整的欧式 矢量空间彤,即 n n u = r ,n k = 矽, f 歹( 2 2 1 ) ,;l,= i 下图2 5 为k = 2 ,即2 维矢量的v o r o n o i 区域,与其划分边界。图中的点表示码字。落在 某个区域中的任何一个输入矢量将会由此区域里的唯一码字来表征。 图2 5 二维矢量的v o r o n o i 区域 f i g 2 5c o d e w o r d si n 一2d i m e n s i o n a ls p a c e 该码字是离输入矢量最近的欧氏距离( e u c i i d e a nd i s t a n c e ) 来确定,即 d ( z ,弗) = 式中,_ 是输入矢量的第j 个面素,虼是码字只的第j 个元素。 ( 2 2 2 ) 从a m r 到efr 和hr 语音转码器的转码方法研究与实现 2 4 2 矢量量化器的原理 矢量量化器有两部分构成:编码器与解码器。下图2 6 是矢量量化器的原理图。其 左图为编码器,右图为解码器。编码器的输入为k 维矢量,输出为失真测度最小码字的 码本角标。失真测度是用上式( 2 2 2 ) 的欧氏距离来度量。当编码器找到失真度最小的码 字时,其角标通过信道传到解码器。解码器将此角标解码成对应的码字。 信道 图2 6 矢量量化原理框图 f i g 2 6 b l o c kd i a g r a mo fv e c t o rq u 霉m t i z a t i o n 矢量 2 4 3 码本的设计 设计一个能最佳地代表任意矢量的码本是n p - h a r d 问题。意思是随着码字数量的增 加,搜索最佳码字的计算复杂度会指数上升。所以一般采用次优的设计方案。其中最简 单的一个算法是l i n d e ,b u z o 和g r a y 等三人1 9 8 0 年提出的l b g 算法。 l b g 算法的具体步骤如下: ( 1 ) 确定码书大小,即码字的数量n 。 ( 2 ) 随机地选择n 个码字,并使它为初始码书。初始码书可以从输入训练矢量中随 机选择。 ( 3 ) 用欧氏距离度量把每个码字周围的矢量做成一个聚类。具体的做法是,输入一 个训练矢量,测量每个码字与之之间的欧氏距离,此输入训练矢量将会属于欧氏距离最 小的聚类。 ( 4 ) 计算聚类中心作为新的码字。聚类中每个矢量对应的元素相加,然后除以聚类 包含的矢量总数,就得到聚类中心,即 ”2 去善 ( 2 2 3 ) 式中,i 是聚类中任意矢量( 五,恐,誓,吒) 的第i 个元素,j 为第j 个矢量,m 是聚类中 矢量的总数。 大连理工大学硕士学位论文 ( 5 ) 重复步骤( 2 ) 、( 3 ) 、( 4 ) ,一直到( 4 ) 中计算的新码字与前一次码字一样,或者误 差很小为止。 2 4 4 矢量量化器性能的衡量标准 由于矢量量化引起的噪声最终被人主观地评价,所以没有一个很好地衡量矢量量化 器性能的方法。一般用均方误差和峰值信噪比来衡量。均方误差的定义为 , 吖 脚= 吉( 毫一葺) 2 ( 2 2 4 ) l ,一、 7、 式中,m 是信号的样本总数,五为原始样本,毫解码后的样本。 峰值信噪比的定义如下。 一划b 童。f 等) ( 2 2 5 ) 式中,n 为编码后每个样本点的比特数。 2 5 码激励线性预测编码 码激励线性预测编码是在语音编码中最广泛使用的,基于线性预测编码的语音编码 技术。其最关键的技术是编码器和解码器都存有相同的激励信号构成的码书。当编码器 找到最合适的激励信号时,将其地址发送给解码器。解码器由这地址解码得到激励信号。 因此它被称为码激励编码。 目前有许多基于c e l p 的编码器在不同的应用领域上使用。低延时码激励线性预测 编码器( l d c e l p ) 和代数码激励线性预测编码器( a c e l p ) 一般在网络语音电话和手机上 使用;i t u t 也发布了好几种基于c e l p 的语音编码标准。这些编码器主要的区别在于激 励信号的生成方法不同;还有用于主观感知上提高原始语音与合成语音质量的前置滤波 器和后置滤波的方法不同,使得这些编码器的码速也不一样。 2 。5 1c e l p 的基本原理 c e l p 一般将每一个语音帧分成2 5 个子帧,每子帧搜索一次最佳的码矢量作为激 励信号。将激励信号输入p 阶共振峰合成滤波器得到合成语音。原始语音减去经过感知 加权滤波器的合成语音得到误差信号

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论