（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf

上传人：活*** IP属地：宁夏上传时间：2019-12-11 格式：PDF 页数：62 大小：1.55MB 积分：0 举报 版权申诉

（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf_第2页

（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf_第3页

（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf_第4页

（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf_第5页

已阅读5页，还剩57页未读，继续免费阅读

（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf.pdf 免费下载

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

南京邮电大学硕士学位论文摘要学科、专业：工学通信与信息系统研究方向： i p 与宽带网络技术作者：- ；堕级研究生黄勇指导教师堡壹! 塑题目：移动c q t 中语音自动发送和采集方法的研究英文题目：t h em o b i l ec q tm e t h o ds t u d yf o rv o i c ea u t o s e n d i n g a n da u t o r e c e i v i n g 主题词：m o b i l e c q tp e s q a u t o - t e s tp d a k e y w o r d s ：m o b i l e c q t p e r c e p t u a le v a l u a t i o no fs p e e c hq u a l i t y a u t o t e s tp d a 南京邮l u 人学坝l ：t o f 究生学位论文摘要摘要 c q t 是测试移动网络覆盖情况的重要方法之一，其中m o s 分的评价是解决话音质量测试的重要途径，它建立在现场拨打及主观评价基础上，对网络的通话质量进行评估。即以主观评价的方法测试信道的话音质量。其工作原理是在各种测试点上发起呼叫，进行通话完成质量统计。过去完全靠人工进行，任务及其繁重。本文就是提出了如何完成该过程的自动化，降低劳动强度的实现方案。我论文的重点是实现活音的现场自动发送与接收采集，主被叫都采用p d a 作为语音放送器及录音机，用以发送原始语音和记录经系统衰退的接收语音，通过手机和移动通信上、下行线路完成测试和p d a 前台数据采集。同时，我的同学王晓娣完成了基于p c 及 i t u tr 8 6 2p e s q 算法的客观语音质量评测中心，将p d a 收集的语音试验数据导入后台p c 分析中心，就可以得出各次试验的p e s q 评分结果。试验结果表明，该方案是成功的，也实现了语音发送和采集的半自动化，降低了测试人员的劳动强度，为移动c q t 中m o s 分的评价开辟了一条新路。南京邮电人学硕l 研究生学位论文 a b s t r a c t a b s t r a c t c a l lq u a l i t yt e s ti so n eo ft h ei m p o r t a n tm e t h o d sf o rq u a l i t yt e s to ft h em o b i l e n e t w o r k ，a n dt h ee v a l u a t i o no fm o si so n eo ft h ew a y st ot e s tt h eq u a l i t yo ft h es p e e c h c q t i sm a i n l yo nt h eb a s i so f c a l l i n gi nr e a lf i e l da n da p p r a i s i n gs u b j e c t i v e l y 。t h ew o r k i n g p r i n c i p l eo fc q t i st h a tc a l l i n gp a r t ym a k e sc a l lt ot h ec a l l e df e l l o wi nt h ep l a c e sy o u c h o s e n ，t h e nc o n v e r s e sa n dg i v e st h eq u a l i t ye v a l u a t i o ns u b j e c t i v e l yf r o mc o n v e r s a t i o n t h ew o r kw a sf i n i s h e da r t i f i c i a l l yi nt h ep a s t ，a n di tw a ss oo n e r o u s o n ep l a nt h a tr e a l i z e st h ea u t o m a t i o no ft h i sp r o c e s si sw r i t t e ni nt h i st h e s i s t h ef o c a l p o i n to fm yw o r ki st os e n da n dr e c e i v et h es p e e c hi nr e a lf i e l da u t o m a t i c a l l y w eu s et h e p d ao nb o t hc a l l i n ga n dc a l l e dp a n ya st h es p e e c hs e n t e n c e sp l a y e ra n dr e c o r d e r ，a f t e r t h r o u g ht h em o b i l ep h o n ea n dr e a lm o b i l eu pa n dd o w nl i n k s ，y o um a yg e tt h ea l lt e s t s p e e c h e si np d a ，o r i g i n a ls e n ta n dr e c o r d e di nf a d i n g i nt h es a m et i m e ，t h ep cb a s e d s p e e c hq u a l i t ya n a l y z e r ，c o m p l y i n gw i t hi t u - te 8 6 2p e s qm e t h o d ，i sd e v e l o p e db ym y f e l l o wm s w a n g t h e nt h ep d as t o r e dt e s t e ds p e e c hm a t e r i a l s ，f i l e si n w a vv e r s i o n ，a r e s e n tt ot h i sp ca n dt h et e s tr e s u l t sa n de v a l u a t e dp e s qs c o r ea r ep r e s e n t e d t h er e s u l to f o u re x p e r i m e n ts h o w st h a tt h ep l a ni ss u c c e s s f u l ，w eh a v er e d u c e dt h ei n t e n s i t yo ft h et e s t w o r ka n dp r o v i d ean e ww a yf o re s t i m a t i n gm o si nm o b i l ec q t s y s t e m i i 南京邮电大学硕十研究生学位论文第1 幸绪论 1 1 课题背景第1 章绪论中国移动通信正处于2 g 向3 g 过渡的进程中，服务市场竞争日趋激烈，网络运营商更加关注自己和对手的网络服务质量。由于移动通信网络无缝覆盖的特殊性，对其监测的工具自然因各方面因素影响而不同。传统车载测试( d t ) 侧重于城乡主要干道，相应地测试方法考虑的是如何准确、高效的记录分析大范围无线数据，从而提供解决方案：而对于城市热点地区和重点室内场所( 如商场、写字楼、电梯 2 1 、地铁等区域) 的网络覆盖情况则要由呼叫质量测试( c q t ) 来解决。目前，d t 经过几年的发展，测试、分析方法已比较成熟，并已在一定程度上实现了自动化：与此相比，c q t 却还停留在手工记录的较低层次上，这与网络迅速发展、维护工作量急剧增加的现状和趋势极不适应。特别是c q t 中m o s 分的评价，仍然停留在人工拨号，人工说话，人工评分的阶段。针对以一1 - 这种情况，本论文提供了全新的c q t 中语音质量测试半自动化解决方案：基于手机和p d a ( 掌上电脑) 的相互配合，手机拨号，接通后，播放p d a 中参考语音文件，通过手机上行线路和下行线路后达到另一套同样的设备，对方用手机通过p d a 把经传输退化的语音记录为文件，然后将多次测试获得的原有及退化的话音样本数据文件批量送达p c 机用后台e 8 6 2p e s q 算法算出多次试验的语音的m o s 分值估计，这样就将网络维护人员从目前繁重低效的人工拨号、人工讲话、人工评分的工作中解放出来，从而减少了维护人员的劳动强度。移动c q t 自动化课题分为两个子课题：一是前台硬件实现，主要完成语音的现场自动发送和采集：另一个方面是后台p e s q ( 感知语音质量评估) 算法研究，能够通过计算得出语音的m o s 评估分。本文作者侧重对硬件实现方法的研究，完成语音的采集和发送，具体客观评价算法p e s q 的实现由我的同学王晓娣完成，本文在第二南京邮电丈学硕上研究生学位论文第i 章绪论章中将对e 8 6 2 中的客观评价算法做简单介绍。 1 2 无线网络中的语音要解决c q t 中m o s 分的正确评估，首先要对无线网络中的语音呼叫流程有所了解，同时，语音质量的评估模式也非常重要。 1 2 1 无线网络中语音呼叫流程 i 2 1 1 呼叫流程示意图图1 1 呼叫流程示意图功能体说明：移动台m s ：移动通信的终端设备。能够收发无线信号，实现移动性业务、呼叫业务及短消息业务等。与b t s 通过空中接口相连。基站收发信机b i s ：收发无线信号。基站控制器b s c ：用于管理b t s 。移动交换中，t l , m s c ：完成移动性管理，呼叫的接续等功能。 1 2 1 2 呼叫流程说明南京邮电大学硕士研究生学位论文第1 章绪论章中将对e 8 6 2 中的客观评价算法做简单介绍。 1 2 无线网络中的语音要解决c q t 中m o s 分的正确评估，首先要对无线网络中的语音呼叫流程有所了解，同时，语音质量的评估模式也非常重要。 1 , 2 1 无线网络中语音呼叫流程 1 2 1 1 呼叫流程示意图图l 一1 呼叫流程示意图功能体说明：移动台m s ：移动通信的终端没各。能够收发无线信号，实现移动性业务、呼叫业务及短消息业务等。与b t s 通过空中接口相连。基站收发信机b t s ：收发无线信号。基站控制器b s c ：用于管理b t s 。移动交换中心m s c ：完成移动性管理，呼叫的接续等功能。 1 2 1 2 呼q 流程说明 1 2 1 2 呼q 流程说明南京邮电人学坝i 研究生学位论文第1 章绪论 i 首先，手机通过空中接口把按全速率13 k b i t s 编码或半速率编码的语音信号发送到基站； 2 基站接受到信号后，传给基站控制器； 3 基站控制器后的编码转换器( t c ) 把语音信号由全，半速率g s m 转换成公众电话网交换速率的6 4 k b p sg 7 1 1 的p c m ，转发给移动交换中心 m s c ： 4 移动交换中心根据目的地选择路由，传给其他交换中心； 5 目的地交换中心再经过t c 、b s c 和b t s ，把g s m 语音信号送给目的用户m s 。 1 2 2 语音质量评估模式怎样获得无线网络中通话语音的质量，无线语音质量评估是一项非常重要的措施，其中m o s 分的评价是最主要的一部分，通常，m o s 分的无线语音评估模式有三种：单手机下行模式、两手机拨打模式、单手机上下行模式。 1 2 2 1 单手机下行模式单手机下行模式的示意图如下：图1 2 单手机下行模式示意图手机拨打交换机( m s c ) 中的某个特殊台站号码，接通后该站播放语音样本， p d a 通过手机接收语音保存，送后台p c 机算出m o s 评估分值，这样得到的是对一个下行( 网络手机) 的评估结果。优点：配置方便，测试简单，可以得到本地下行评估结果，目前可以采用此模南京邮乜人学顺i ：1 0 f 究生学位论文第1 章结论式。缺点：测试结果缺少上行( 手机网络) 语音质量评估。 1 2 2 2 两手机拨打模式两手机拨打模式的示意图如下甚m n e l w 呐隧1 髓1 图1 - 3 两手机拨打模式示意图两个测试人员可以处于相同或不同基站区，拥有对等的手机，通过拨号建立连接，通过话音交互，评分，记录试验次数、结果，完成语音质量评估。优点：配置简单。缺点：测试中得到的是一个上行( 手机网络) 加一个下行( 网络手机) 的总体评估结果，不能区分上行或下行评估质量，工作强度大。但是这种模式实现起来比较方便，可以和第一种模式结合起来使用，来完成对无线网络中通话语音的评估。 1 2 2 3 单手机上下行模式单手机上下行模式的示意图如下隧1 謦上行音译特服务器图1 4 单手机上下行模式示意图类似a u t o t e s t ，可在本地下行测试模式中增加上行语音评估服务器功能，这南京邮电大学硕士研究生学位论文第1 章绪论样便可得到本地上行方向或下行方向各自的语音质量评估结果。优点：对本地上下行方向分别作出评估。缺点：要有专门设备，投资较大。目前这种模式没有办法完成。因此，在本课题中，p e s q 评价采用的是前面两种的无线语音评估模式：单手机下行模式和双手机拨打模式。南京邮电太学硕i 研究生学位论文第2 章语音质量评估方法简介第2 章语音质量评估方法简介在语音通信技术中，对语音质量的评价是一个非常重要的问题。如何评价语音编码质量也成为语音通信领域所研究的一个重要课题，对此多年来人们提出了许多方法，归纳起来大致可以分为两类，即客观评定方法和主观评定方法。客观评定方法用客观测量的手段来评价语音编码的质量，常用的方法有信噪比、加权信噪比、平均分段信噪比等。主观评价方法符合人类听话时对语音质量的感觉，因而目前得到广泛应用。最主要的主观评价方法是主观评定等级( s u b j e c t i v eo p i n i o ns c a l e ) ，或称为平均评定得分 ( m e a no p i n i o ns c o r e ，缩写m o s ) 。 2 1 语音质量评估方法介绍 m o s 是m e a no p i n i o ns c o r e 的缩写，即平均评定得分。m o s 得分采用五级评分标准，其方法是，由数十名试听者在相同信道环境中试听并给予评分，然后对评分进行统计处理，求出平均得分。在这旱特别需要说明的是，试听者对语音质量的主观感觉往往是和其注意力集中程度相联系的，因而，对应于主观评定等级还有一个收听注意力等级( l is t e n i n ge f f e c ts c a l e ) 。从用户角度看，通常认为m o s 分4 0 4 5 为高质量语音编码，到达长途电话网的质量要求。m o s 分3 5 分左右称作通信质量，这时昕者能感觉到语音质量有所下降，但是不影响正常的通话，可以满足多数通信系统使用要求。m o s 分3 0 分以下称为合成语音质量，这种语音一般只有足够高的可懂度。但是自然度较差，不容易识别讲话者。常用的m o s 分评估方法包括主观m o s 分评估和客观m o s 分评估。南京邮i u 大学硕t ：r o f 究生学位论文第2 帝语音质量评估方法简介 2 2 主观评估主观m o s 分采用i t u t p 8 0 0 和e 8 3 0 建议书，由不同的人分别对原始语料和经过系统处理后有衰退语料进行主观感觉对比，一般需要2 0 5 0 人完成，要求每个人在听完一段语音片段后根据自己的感受给出一个分数，再将这些分数求平均值，从而得到最后的主观m o s 分。 i t u te 8 0 0 协议中给出了几种不同的主观评定方法，其中最简单的是a c r ( a b s o l u t ec a t e g o r yr a t i n g ) 方法。这种方法是建立在多人主观评定打分基础上的一种基本话音质量评估方法，分数分布如表2 1 。另外，协议还提出了 d c r ( d e g r a d a t i o nc a t e g o r yr a t i n g ) 方法和c c r ( c o m p a r i s o nc a t e g o r yr a t i n g ) 方法。 d c r 方法是让评定主体先后听到参考语音和失真语音，然后根据感觉对听觉失真评定，评定标准如表2 2 所示。c c r 方法是比较听到的参考语音和失真语音，评定失真语音的质量比参考语音好或者坏多少，评定标准如表2 - 3 所示。a c r 是在通信系统评估中最常用的方法。在对通信系统的主观听觉测试中，需要注意以下几点： 1 测试要在一个安静的噪音受到控制的房间里进行； 2 测试用的电话装置符合标准： 3 测试录音长为8 s 左右，内容是不相关的两个句子； 4 测试要对每个编译码环境下由两个男性和两个女性发声的语音进行评定： 5 测试主体皆非专家。一旦测试完成，对所有测试主体的打分取平均值，这个平均值就是m o s 分。由于主观评定方法建立在人的主观听觉之上，很切合话音通信的用户满意程度指标，也可以将各种话音损伤因素( 噪音，误码，时延抖动，时频域失真，回声等) 对人的感知效果综合到听音系统中，因此是一种最重要的语音质量评估方法。南京邮电大学硕士研究生学位论文第2 章语音质量评估方法简介表2 1m o s 的主观评定标准 5 优异( e x c e l l e n t ) 4良好( g o o d ) 3 一般( f a i r ) 2较差( p o o r ) 极差( b a d ) 表2 2d c r 评定标准曩；褥雾麓蛰1 i 嚣叠i 鼍张鳞! ：鬻鬻”i ! ：i i 。：i ：i 、! i i i i i i i 5 感觉不到失真 4 可感觉剑失真，但是不讨厌 3 感觉到失真，且有些刺耳 2 剌耳 1 非常刺耳表2 3c c r 评定标准 1 | 1 | | l 瓣i ：i ；豢簌鬻鬟l l 襄鬻! 熬镳瓣霞蘸熏麟器辫 3 非常好 2 较好 1 稍好 o 大致一样一1 稍差一2 较差 3 非常差但是，该方法也有其缺陷，应用起来费时费力，在不同试验主体间分散性大，难南京邮电大学硕1 ：研究生学位论文第2 章语音质量评估方法简介以用仪表实现，在现实的网络评估过程中很难实现，所以又引入了客观评估算法。 2 3 客观评估客观语音评估方法旨在通过对语音的材料计算给出m o s 评估分值，并使该估计值能尽量贴近主观评定方法得到的m o s 分值结果。目前能提供主客观相关性较高的音质客观评价方法，都是考虑了人耳的听觉特性，使用听觉感知模型来模拟收听这一过程的。因此当前的主流是使用感知模型来评估非线性和易出错的音频通信系统。下面具体介绍几种客观评估方法。 2 3 1p s q m 评估方法 p s q m 是p e r c e p t u a ls p e e c hq u a l i t ym e a s u r e 的缩写，即感知语音质量测量。在 1 9 9 6 年被国际电联i t u t 采纳成为r 8 6 1 建议，它用于电话带宽在3 0 0 3 4 0 0 h z 之间的语音编解码器的客观质量的测量。基本结构如图2 - 1 所示。这个模型的核心是听觉变换，它模拟了人的听觉系统的主要心理和物理处理过程。计算信号在时域和频域的响度级，表示的步骤如下： 1 用长为3 2 m s 的汉宁窗对语音信号做短期傅立叶变换，相邻的帧有5 0 的交迭： 2 经过短期傅立叶变换后，信号功率谱的频率变换到5 6 频带的巴克谱域； 3 局部衡量：对退化语音信号功率逐帧进行部分补偿到基准语音信号功率的水平，来实现消去低频增益调制： 4 模拟电话机接收频率特性滤波； 5 添加h o t h 噪声： 6 信号响度映射到压缩的晌度级域； 7 逐帧补偿退化语音信号的响度级到基准语音信号的水平。早期计算质量评估得分的方法都是基于退化语音信号与基准语音信号在听觉变换过程中产生的平均干扰计算。p s q m 引入了认知模型来描述退化语音信号与基准语音南京邮电大学硕仁研究生学位论文第2 章语音质量评估方法简介信号在听觉变换过程中产生的干扰差。它通过模拟两个效应，即不对称和对语音信号不同部分的不同加权，改进了客观评估分与主观m o s 分的相关性。当输入信号通过编解码器和传输系统非线性失真( 如时延波动) 后，此时很难将失真信号在时频分量上线性表达为原始信号加失真信号，但客观评价失真输出信号时采用了上述线性分析模型，由计算输入输出信号的时频分量的差值，得出干扰函数用以评估语音质量，这造成客观失真模型得出的失真预测值小于实际主观听觉失真，这种误差就是不对称效应。这个效应可由计算不对称干扰密度来补偿。不对称干扰密度由干扰密度乘以一个不对称因子得到，不对称因子等于失真信号对原始信号的音调功率密度比的1 2 次幂，不对称因子的合理选取改善了主客观评价模型的误差。发生在语音活动期的干扰比发生在语音静默期的干扰更令人烦扰，这个效果可以由加权因子来模拟，这个加权因子可根据试验内容改变。在1 9 9 6 1 9 9 9 年，p s q m 被进一步改进以适用于实际系统的端到端测试，产生了一个新的模型p s q m 9 9 。 2 3 2p a m s 评估方法图2 - 1p s q m 原理图预测 p a m s 是p e r c e p t u a la n a l y s i sm e a s u r e m e n ts y s t e m 的缩写，即感知分析测度系统。它的核心是扩展的巴克谱失真( b s d ) 模型，该模型是h o l l i e r 通过组合一系列用于谱分析的线性滤波器，不仅考虑了失真大小还考虑了失真的分布。p a m s 用于评估电南京邮i u 人学坝d f 究生学位论文第2 章语音质量评估方法简介话网络和语音编解码，是第一个可用于端到端系统的评估，包括滤波和时延变化造成的影响的模型。基本结构如图2 2 所示。基准语音信号。听觉变换 7 调整 k 和误亳待测系统啊 l 补偿 t 艰仆语音信号i 听觉变换图2 - 2p a m s 原理图这个模型首先进行时间轴校准，用多个处理步骤来校准基准语音信号与退化语音信号。语音信号被划分成一段一段的说话，计算时延变化，时延变化是由于基于包的传输引起的，比方说i p 电话系统。基准语音信号和退化语音信号都要补偿到一个标准的听觉电平。听觉变换过程如下： 1 用输入滤波器来模拟电话机的响应以及人耳的生理结构； 2 用一组线性滤波器把信号变换到巴克谱的1 9 个频带域； 3 计算每个巴克谱频带内每4 m s 帧的平滑的功率包络； 4 基准语音信号功率部分补偿到退化语音信号功率的水平，确定补偿因子： 5 把信号映射到响度( 单位为方) 域； 6 把信号映射到响度级( 单位为宋) 域。基于基准语音信号和退化语音信号的听觉变换过程计算一系列误差参数，从而对不同种类的失真进行了测量。这些误差参数在时间上取平均值，然后通过一个非线性函数映射到质量评估得分，这个非线性函数保证误差参数与质量评估得分间是单调的。最后计算得到两个质量评估得分，即在a c r 主观评估方法中的主观m o s 分和听觉努力度得分。南京邮i 乜人学坝1 ：研究生学位论文第2 章语音质量讦估方法简介听觉努力度是指测试主体听完测试语音后对所听到的句子的理解难易程度打分评价标准如表2 - 4 所示。表2 - 4 听觉努力度评价标准得分一臻磊糍1 | | 黧囊霞缝嚣蔓0 ) 完全放松 4 需要集巾注意，努力可忽略需要适中的努力倾听需要相当的努力倾听 1 完全无法理解 2 3 3p e s q 评估方法 2 3 3 1p s q m 、p a m s 的局限性编解码评估模型，例如p s q m ，存在局限性，使得当它们在特定应用特别是在包括线盹滤波器或具有时延变化的系统中产生的结果不可靠。这些影响，再加上定类型的编码失真、包丢失和背景噪声，就是引起p s q m 等早期模型产生不精确得分的原因。因此i t u t1 2 研究组进行了一项实验来找到一种新的模型，以期能适应更广泛的编解码器和网络情况，具有更好的性能和表现。在比较中，p a m s 和 p s q m 9 9 ( p s q m 的更新和扩展版本) 两种算法的性能最好，然后就结合了这两种算法产生了一个新的模型，叫做感知语音质量评估( p e s q ：p e r c e p t u a le v a l u a t i o no fs p e e c h q u a l i t y ) 。2 0 0 1 年2 月p e s q 被确定为e 8 6 2 建议。 2 3 3 2p e s q 原理简单介绍图2 - 3 为p e s q 的原理图。开始时两个信号都通过电平调整，调整到一个标准的听觉电平，再用输入滤波器模拟标准电话听筒进行滤波( i r s 滤波) 。这两个信号要在时j 目上对准，并通过听觉变换( 即感知模型) 转换为内部表示。这个变换包括：通南京邮电大学硕士研究生学位论文第2 章语音质量评估方法简介过加窗的快速傅立叶变换从时域转换到频域：对系统中线性滤波和增益变化的补偿和均衡；把巴克谱映射到响度级。参考语音信号与退化语音信号的变换之间的差别就是由扰动来表示。扰动过程中提取出两个失真参数，在频率和时间上总和起来，映射到对主观平均意见分的预测。扰动过程包含以下过程：计算干扰密度：不对称处理；时频干扰的总计。在有些情况下，时间定位可能不能正确地跟踪时延的改变，这样会导致每部分的时延都错了。用两交叉互相关的极大值来算出新的时延值，对每个错误的部分重新定位，重新计算干扰值。在重定位以后再总计瞬间和整个信号的性能。时间捱调整和岗佳千重新溺整晤音间隔图2 - 3p e s q 原理图 2 3 3 3p e s q 算法对原始语音资料的具体要求 1 原始语音资料应包含由静默所隔开的语音脉冲，静默代表人说话中的自然停顿，至少需要l s 。尽管不同语言各不相同，语音脉冲的持续时问典型为 1 3 s 。特定的声音活动探测器只对2 0 0 m s 以上的静默期敏感。语音的活动期应占总语音长度的4 0 8 0 ，故一般规定最小语音活动期为3 2 s ，尽管不同语言也各不相同； 2 p e s q 对参考语音和退化语音做电平调整时用的是均方根电平。如果语音的开始与结尾有很长时间的静默，那么电平调整的结果就会受影响。我们建议语音的开头与结尾的静默最小为0 5 s ，以保证参考语音能与退化语音同步。如果系统的延迟较大，那么允许语音的开头与结尾的静默最大为南京邮i u 人学倾。 i ) f 究生学位论义第2 章语音质量评估方法简介 2 s ： 3 原始语音资料应包含由静默隔开的句子对，持续8 s 左右，句子应是有意义的，句子问是没有联系的，尽量不要包含很多短的语句，例如快速数数；有些情况下可能要用包含3 - 4 个句子的语音信号，也就是1 2 s 左右。 p e s q 算法可应用于最长3 0 s 的语音。在现场的实地测试中，语音要稍短，至少需要持续3 2 s ； 4 参考语音( 即原始语音材料经过频率整形，直接用于p e s q 算法) 存储时的电平应至少达到。3 0 d b o v ，以避免峰点削减和量化失真。其中d b o v 定义如下：zd b o v = yd b m 0 + c 。对于a 率编码系统c 的值为一6l5 d b ，对于率编码系统，c 的值为6 1 8 d b ； 5 如果一个环境需要在长周期上测试，那么对每个8 - 2 0 s 长短的语音信号进行单独的p e s q 处理是比较合适的。这么做还有附加的好处：如果同一个语音信号在各个环境下使用，那么在各个环境下的时间变化将会很明显；否则，如果使用不同发声者的不同语音信号，那就要求系统对发声者和测试语音的依赖度有更精密的度量： 6 参考语音信号与退化语音信号应以8 k h z 的抽样率、1 6 b i t 的线性p c m 编码的格式存储。p e s q 同时支持8 k h z 和1 6 k h z 的抽样率。这时的语音信号不能再受到由不必要的量子化、振幅削减或再抽样引起的失真。本课题中，在计算m o s 评估分值的时候，采用的客观评估方法就是p e s q ，具体算法的实现由另一位同学王晓娣完成。本人负责语音的采集和发送，对于发送的参考语音和采集下来已经退化的语音，都要要满足p e s q 算法对原始语音资料的要求。南京邮| u 大学碳i 。研究生学位论文第3 章手机干日p d a 简介第3 章手机和p d a 简介 3 1 手机逻辑音频电路分析手机逻辑音频部分可以分为逻辑控制和音频信号处理两个部分。它完成对数字信号的处理和对整机工作的管理和控制。 3 1 1 逻辑电路手机逻辑部分电路主要由c p u 和存储器组成。在手机程序存储器中，字库( 版本) 主要是存储工作主程序，码片主要存储手机机身码( 俗称串号) 和一些检测程序。c p u 与存储器组之间通过总线和控制线相连接。c p u 就是在这些存储器的支持下，才能够发挥其繁杂多样的功能，如果没有存储器或其中某些部分出错，手机就会出现软件故障。c p u 对音频部分和射频部分的控制处理也是通过控制线完成的，这些控制信号一般包括m u t e ( 静音) 、l c d e n ( 显示屏使能) 、l i g h t ( 发光控制) 、c h a r g e ( 充电控制) 、r x e n 或r x o n ( 接收使能) 、t x e n 或t x o n ( 发送使f i r ) 、s y n e n ( 频率合成器使能) 、s y n c l k ( 频率合成器时钟) 等，这些控制信号从c p u 伸展到音频部分、射频部分和电源部分，去完成整寿l 复杂的控制工作。所有电路的工作都需要时钟。另外还有一。块实时时钟晶体，频率一般为3 2 7 6 8 k h z ，主要供显示屏提供正确的时间显示及让手机进行睡眠状态。早期机型没有这块晶体，所以没有时间显示和睡眠功能。 3 1 2 音频电路 1 接收音频处理电路：接收机解调得到的接收基带信号被送到逻辑音频电路进行处理。接收时，天线接收到的射频信号经低噪声放大、混频、中频放大、r x i q ( 同相，f 交) 解调电路，解调出6 7 7 0 7 k h z 的模拟基带信号，模拟基带信号再进行g m s k 解调( 模数转换) ，在d s p 电路内进行解密和去交织等信道解码，然后经g s m 语音解码，得到6 4 k b i t s 的数字信号，最后进行p c m 解南京邮电大学硕士研究生学位论文第3 章手机和p d a 简介码，产生模拟语音信号，经音频放大后驱动听筒发声。 2 发射音频处理电路：发射时，话筒送来的模拟语音信号，在音频部分进行 p c m 编码，得到6 4 k b i t s 的数字信号，进行g s m 语音编码、信道编码、加密、交织、g m s k 调制( 数模转换) ，最后得到6 7 7 6 8 k h z 的模拟基带信号，送到解调电路进行变频处理。 3 2 各个时代的手机 3 2 1 模拟手机时代模拟式蜂窝电话通信，模拟蜂窝移动电话通过将人讲话的声音模拟信号直接调制到载波上进行传送，因此这种通信方式被称为“模拟方式”。模拟移动电话系统的质量完全可以与固定电话媲美，使通话双方能够清晰地听出对方的声音。但模拟移动通信与数字移动通信相比保密性较差，极易被并机盗打：只能实现话音业务，无法提供丰富多彩的增值业务：网络覆盖范围小且漫游功能差：模拟手机体积大、重量沉、样式陈旧，色彩呆板，功能也往往仅仅只是局限于通话功能，而且受到技术、材料各方面的限制，款式上相当单一，缺乏变化，大可称为手机的史前时代。 3 2 2g s m 时代( 2 g 时代) 模拟式蜂窝电话迅速发展，也开始显现出它的缺点，特别是在人口密集的大城市，由于模拟式蜂窝电话采用的频分多址技术造成频率资源严重不足，同时，模拟式蜂窝电话易被窃听和干扰，造成对用户利益的危害。 1 9 8 2 年，欧洲成立了g s m ( 移动通信特别组) ，最后制定了泛欧洲的数字蜂窝移动通信系统，并用该研究小组名字的缩写“g s m ”命名。g s m 移动电话系统采用时分多址( t d m a ) ，对频谱利用率高，容量大，同时可以自动漫游和自动切换，采用 e f r ( 增强全速率编码) 后通信质量好，加上其业务种类多、易于加密、抗干扰能力强、用户设备小、成本低等优点，使移动通信进入了一个新的里程。 g s m 时代的手机不再像模拟移动电话时代的手机那样笨重，外形越来越小巧漂南京邮 u 人学坝i 。研究生学位论文第3 章手机和p d a 简介亮，而且提供比较多的功能( 比如简单的游戏、闹铃、记事本、日程安排等) ，并且除了语音业务外，还支持了短信业务。 3 2 32 5 g 时代 2 5 g 是基于2 g 与3 g 之间的过渡类型。比2 g 在速度、带宽上有所提高。可使现有g s m 网络轻易地实现与高速数据分组的简便接入，同时，c d m a 网络也迅速发展起来。c d m a 是码分多址的英文缩写( c o d ed i v i s i o nm u l t i p l ea c c e s s ) ，它是在数字技术的分支一一扩频通信技术上发展起来的一种崭新而成熟的无线通信技术。它能够满足市场对移动通信容量和品质的高要求，具有频谱利用率高、话音质量好、保密性强、掉话率低、电磁辐射小、容量大、覆盖广等特点，可以大量减少投资和降低运营成本。目静已经进行商业应用的2 。5 g 移动通信技术是从2 g 迈向3 g 的衔接性技术，突破了2 g 电路交换技术对数据传输速率的制约，引入了分组交换技术及话音数据的分离处理，数据传输速率有了突破，是一种介于2 g 与3 g 之间的过度技术，实现了低速上网、彩信等业务。主要代表为：g p r s 、w a p 、蓝牙( b l u e t o o t h ) 等技术。 2 5 g 时代的手机( 包括c d m a 和g s m ) 又比2 g 时代的手机在外观上有了更大的改变，出现了很多漂亮的机型( 翻盖、滑盖等等) ，同时支持更多的功能，支持 g p r s 、w a p 、蓝芽( b l u e t o o t h ) 等技术，并且在原来支持短信业务的基础上，又支持了彩信( 彩e ) 。 3 2 43 g 时代 3 g 移动通信系统其最基本的特征应当是智能信号处理技术，实现基于话音业务为主的多媒体数据通信，更高的频谱效率、更高的服务质量及低成本。实现全球无线覆盖，真正实现“任何人，在任何地点、任何时间与任何人”都能便利的通信。国际电信联盟( i t u ) 在2 0 0 5 年5 月确定w c d m a ，c d m a 2 0 0 0 和t d s c d m a 三大主流无线接口标准，写入3 g 技术指导性文件2 0 0 0 年国际移动通信计划( 简南京邮电火学硕士研究生学位论文第3 章手机和p d a 简介称i t m 2 0 0 0 ) 。 3 g 时代的手机一般是指将无线通信与国际互联网等多媒体通信结合的新一代移动通信系统。它能够方便、快捷的处理图像、音乐、视频流等多种媒体形式，提供包括网页浏览、电话会议、电子商务等多种信息服务，为手机融入多媒体元素提供强大的支持。手机形状各种各样( 手表、头戴式、分离式、笔式) ，它己不再仅仅是个人通讯的工具，也成为可靠的工作助手( 上网、记事、制定工作计划、照相、录音) 和有趣的娱乐伙伴( 游戏、听m p 3 、收音、看电影) 。事实上，手机发展的历史不光代表着科技的进步，同时也是人类文明发展的见证，从模拟到g s m 、从g s m 到g p r s 、从g p r s 到w c d m a 、从c d m a 到 c d m a 2 0 0 0 、从单频到双频甚至三频、从英文菜单到中文输入、从语音到短信手机发展的速度与日剧增，每一项新技术的采用，都对手机的发展起着莫大的推动力。在本课题的研究中，主要评价的是无线网络中语音的质量，不管是现有的g s m 网络以及c d m a 网络，还是3 g 系统建立起来后的w c d m a 网络及c d m a 2 0 0 0 网络，我们只是负责把通话中的语音以一定的采样率和位数保存起来，再用算法算出 m o s 评估分值，因此本课题对所有的移动网络的语音质量都能评价。 3 3p d a 介绍 p d a ，英文全称是p e r s o n a ld i g i t a la s s i s t a n t ，即个人数字助理，是辅助个人工作的数字工具。主要提供记事、通讯录、名片交换及行程安排等功能。当然，随着技术的进步，一些新的功能比如数字录音等都被增加了进来。 p d a 可细分为电子词典、掌上电脑、手持电脑设备和个人通讯助理机四大类，而后两者由于技术和市场的发展，已经慢慢融合在笔记本电脑中。而通常，仅将掌上电脑称为是p d a ，这也正代表了p d a 的真正含义。掌上电脑最大的特点就是他们有其自身的操作系统，一般都是固化在r o m 中的。其采用的存储设备多是比较昂贵的 i c 闪存，容量一般在1 6 m b 左右。掌上电脑一般没有键盘，采用手写和软键盘输入方式，同时配备有标准的串口、红外线接入方式并内置有m o d e m ，以便于与个人南京邮电大学硕士研究生学位论文第3 章手机和p d a 简介电脑连接和上网。掌上电脑和前面的产品最大的区别，就是它的应用程序的扩展能力。基于各自的操作系统，任何人可以利用编程语言开发相应的应用程序，也可以在掌上电脑上任意安装和卸载。由于其功能非常的完备，所以在操作上也比较复杂，不太适合对电脑不太了解的初级用户。而在掌上电脑部分，还会按操作系统的不同，分为p a l m 和p o c k e t p c 。p a l m 采用p a l m o s 系统，由p a l m 公司开发；而p o c k e t p c 采用 w i n c e 的系列系统，由微软开发。尽管p d a 产品形态各异，差别较大，但不管种类如何，构成p d a 的原理仍然是一样的，所有的p d a 都由下述基本设备或其中的几种组成：微处理器：没有p d a 能缺少c p u ，p d a 通常使用速率较馒、功耗较低的 c p u ，但随着i n t e l 一系列高性能的c p u 推出，或许不久后，p d a 将拥有可和p c 媲美的速度与数据处理能力。目前p d a 采用的c p u 种类比较多，无法具体比较，但针对同一种操作系统，显然是c p u 运算速度越高越好。操作系统：操作系统是p d a 能够顺利运转的管理器，也是评价一种p d a 产品使用性能的关键，通常p d a 的操作系统采用较少的指令集，占用较少的存储空间。目前p d a 上的操作系统主要有两类，分别是p a l m o s 系统和w i n c e 的系列系统。存储器：存储是p d a 的一项重要参数，因为基本应用程序所占用的空间极小，所以低端p d a 通常不单独提出存储的概念。高端p d a 由于有大量资料需要保存和编辑，存储就显得很重要。电池：p d a 有的使用碱性电池( a a a ) ，有的使用可充电电池( 锂电池、镍镉电池、镍氢电池1 ，使用时间也因为操作系统不同而区别很大。液晶显示屏：l c d p d a 一般使用液晶显示屏作为输出设备。液晶显示屏的评价标准很多，主要有l c d 屏幕的大小，显示分辨率以及显示色彩。输入设备：触摸屏是p d a 的主要输入设备( 当然还有其他数据输入途径，如串行口、红外端口、内置话筒、m o d e m 等) 。输出设备：除开极少数p d a 能直接通过外部设备输出资料，绝大部分p d a 都只能将资料传到桌面电脑或笔记本上。因此具备和p c 端通讯的数据传输功能也是p d a 南京邮电大学硕士研究生学位论文第3 章手机和p d a 简介必不可少的。目前采用的通讯方式主要是红外端口( i r ) 传输、r s 2 3 2 串口传输和u s b 口传输几种。p d a 上的红外线端口遵循了一个标准：i r d a ( t h ei n f r a r e dd a t a a s s o c i a t i o n ，红外数据协会) 。根据所能达到的最大传输速率的不同，常用的i r d a 有两种：s i r ( 低速红外线) 和f i r ( 高速红外线) 。s i r 最大传输速率为1 15 2 k b p s ，而f i r 的传输速率可达4 m b p s 。目前p d a 用的均是s i r ，它支持i r d a l 0 i r d a l 2 协议，传输速率从2 4 0 0 b p s 到1 1 5 2 k b p s ，传输距离最大可达1 米e 此外，部分高端产品还可通过m o d e m 、网卡实现网络连接，进行远程传输。随着技术的发展，p d a 的功能也越来越多，其中个人通讯助理机是p d a 发展在这么多类产品中显得最时尚的一种。它的概念就是将掌上电脑的一些功效和手机、寻呼机相结合而产生的。这种产品的最大特点就是其舍弃了一般的电话线而采用无线的数据接收方式，使产品的适应性更强。虽然如果单一而论，早期的产品是以手机为出发点而设计的产品，其的商务功能要明显逊于一般的掌上

人人文库> 全部分类> 毕业设计 > 毕业论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf

文档简介

温馨提示

最新文档

评论

（通信与信息系统专业论文）移动cqt中语音自动发送和采集方法的研究.pdf

文档简介

温馨提示

最新文档

评论

相关文档