说话人识别的系统设计大学_第1页
说话人识别的系统设计大学_第2页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京科技大学本科生毕业设计(论文)北京科技大学本科生毕业设计(论文)1111摘要说话人识别技术是一种的重要生物认证手段,也是身份鉴别学术会议中的一项重要内容。说话人识别的目的是通过话语找出或核实说话人的身份,可以被用于访问控制。它属于语音信号领域的一个模式识别问题。本文使用交叠分帧的方法短时化语音信号,使用每帧信号的能频值区分语音信号和噪声信号。特征提取方面,本文使用线性预测倒谱系数和基音频率来表征生成语音的发音器官的差异(先天的),用差分线性预测倒谱系数和差分基音频率表征发音器官发音时动作的差异(后天的)。四种特征加权扩维得到的组合特征矢量最终表征了一个特定的说话人。分类决策方面,本文使用矢量量化的方法完成对说话人语音信号的分类和判决。本文设计的系统是基于Java语言和SQLServer2000数据库实现的。Java语言用于实现语音样本采集、预处理、特征提取、分类决策等说话人识别所需的各种算法。SQLServer2000数据库用于存储已注册说话人的语音码本。本文在实现系统的基础上,分析了组合特征中各分量对说话人识别的贡献大小。得到的结论是:用于说话人识别的参数中,线性预测倒谱系数效果最好,差分线性预测倒谱系数次之,基音频率再次之,差分基音频率效果最差。根据这一结论,系统通过调整组合特征中各分量加权系数的方式突出贡献大的分量。实验表明,调整后系统识别率显著提高。对于10名男性语音的码本库,本文实现系统的识别率可达到87%。关键词:说话人识别;基音;线性预测;矢量量化Theresearchofthetext-independentspeakerrecognitionsystemAbstractSpeakerrecognitiontechnologyisoneoftheimportantbiometricways,aswellasanimportantpartinacademicconferencesofidentification.Thepurposeofspeakerrecognitionisidentifyingorverifyingthespeaker'sidentitythroughthediscourse,whichcanbeusedtocontrolaccess.Itisapatternrecognitionproblemonspeechsignals.Thispaperusesthewayofoverlappingsub-frametoshortthevoicesignal,andusestheEnergyFrequencyValueofeachframetoseparatethevoicesignalfromthenoisesignal.Intherespectoffeatureextraction,thispaperusesLPCCandpitchfrequencytocharacterizepronunciationorgansgeneratedvoicesounds(congenital),andusesdifferentialLPCCanddifferentialpitchfrequencycharacterizethediffereneeofpronunciationorganmovestopronounce(acquired).Ultimately,acomponentfeaturevector,whichisobtainedbyweightedandunitedthatfourfeatures,characterizeaparticularspeaker.Intherespectofclassificationanddecision,weusemethodofvectorquantizationtocompletetheclassificationandsentencingforspeakers'speechsignal.ThesystemthatisdesignedbythispaperisachievedbasedontheJavaIanguageandSQLServer2000database.JavaIanguageisusedtoimplementalgorithmsneededbyspeakerrecognition,suchasvoicesampling,preprocessing,featureextraction,classificationanddecisionandsoon.SQLServer2000databaseisusedtostoreregisteredspeakersvoicecodebooks.Basedonthesystemachieved,thispapeanalyzedcontributiontotheidentificationforeachcompositionofthecomponentfeatures.Theconclusionis:forspeakeridentificationparameters,LPCCisthebest,differentialLPCCisthesecondbest,thepitchfrequencyisthethirdbestanddifferentialpitchfrequencyistheworst.Basedonthisconclusion,thesystemgivesprominencetothecomposition,whichhasmorecontributiontotheidentification,byadjustingweightedcoefficient.Afteradjustment,experimentsshowthatsystemidentificationrateimprovedsignificantly.Therecognitionrateofthesystemcompletedbythispapercanreach87%tothecodebookdatabaseproducedby10malevoices.KeyWords:speakerrecognition;pitch;linearprediction;vectorquantification北京科技大学本科生毕业设计(论文)北京科技大学本科生毕业设计(论文)北京科技大学本科生毕业设计(论文)北京科技大学本科生毕业设计(论文)北京科技大学本科生毕业设计(论文)北京科技大学本科生毕业设计(论文)-参考文献赵力•语音信号处理[M].北京:机械工业出版社,2003韩焱,王召巴,杨风暴•电子信息工程专业学生的专业知识结构与课程设置[C]•全国光学光电和电子类专业教学经验交流研讨会专集,中国光学学会光电技术专业委员会,教育部高等学校电子信息科学与工程类专业教学指导分委员会,全国高等学校光学教育研究会,2002.北京:华北工学院,2002Q.Y.Hong,S.Kwong.ADiscriminativeTrainingApproachforText-independentSpeakerRecognition[J]SignalProcessing2005,85(7):1449-1463边肇祺,张学工.模式识别[M].第二版.北京:清华大学出版社,2000⑸张雄伟,陈亮,杨吉斌.现代语音处理技术及应用[M].北京:机械工业出版社,2003⑹胡航.语音信号处理[M].第二版.哈尔滨:哈尔滨工业大学出版社,2002JudithA.Markowitz,J.MarkowitzConsultantSpeakerRecognition[J]InformationSecurityTechnicalReport1998,3(1):14—20果永振,何遵文.一种多特征语音端点检测算法及实现[J].通信技术,2003,133(1):8-10韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004赵静,罗兴国,蔡文涛.噪声环境下语音信号的基音检测[J].电声技术,2007,31(3):54-62ChaiWutiwiwatchai,SadaokiFurui.Thaispeechprocessingtechnology:Ar

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论