情感语音识别研究综述_第1页
情感语音识别研究综述_第2页
情感语音识别研究综述_第3页
情感语音识别研究综述_第4页
情感语音识别研究综述_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

情感语音识别研究综述

导师:陶智肖仲喆研究生:沈燕内容概要课题背景及意义情感语音研究综述研究方向选择课题背景及意义语音是人类最有效、最自然的交流沟通手段,除了包含语义信息外,还携带有丰富的情感信息。人们的情感包括生理上的感觉,认知以及人们的行为举止。情感语音识别可应用于聋哑人学说话;电视调台;热线电话。研究综述——涉及的问题语音情感分类学语音库声学参量分类方法研究综述-语音情感分类学情感语音并没有统一的模型空间情感模型

情感轮等离散情感模型

高兴,愤怒,悲伤,平静,害怕,厌恶每类模型内部无定论模型的选取依赖于应用[1]林奕琳,韦岗,杨康才,语音情感识别的研究进展.电路与系统学报,2007.12(1):第90-98页.研究综述-语音库的选择现有的情感语言库有很多公开库,私有库,商用库[2]I.S.EngbergandA.V.Hansen,“DocumentationoftheDanishEmo-tionalSpeechDatabase(DES),”InternalAAUreport,CenterforPersonKommunikation,Denmark,1996.[3]F.Burkhardt,A.Paeschke,M.Rolfes,W.Sendlmeier,B.Weiss,AdatabaseofGermanemotionalspeech,in:ProceedingsoftheInterspeech2005,Lissabon,Portugal,2005,pp.1517–1520.名称性质语言Berlinemotionaldatabase[2]公开库德语Danishemotionaldatabase[3]公开库丹麦语Natural私有库普通话BabyEars私有库英语研究综述-声学参量情感语音的最佳特征:全局统计特征&局部特征

特征参数优化多类特征组合[4]M.E.Ayadi,M.S.Kamel,andF.Karray,“SurveyonSpeechEmotionRecognition:Features,ClassificationSchemes,andDatabases,”PatternRecognition,vol.44,no.3,pp.572-587,Mar.2011.研究综述-情感语音的最佳特征SpeechFeaturesContinuousQualitativeSpectralTEO-BasedPitchDurationFormantsVoicequality:happy,tense,angryLPCCMFCC[5]Kim,E.H.,Hyun,K.H.,“ImprovedEmotionRecognitionWithaNovelSpeaker-IndependentFeature,”IEEETransactionsonMechatronics,2009,14(3):317-325.[6]H.Teager,Someobservationsonoralairflowduringphonation,IEEETrans.Acoust.SpeechSignalProcess.1990,28(5):599–601.研究综述-特征参数优化

浮动前向选择(SFFS)主成分分析(PCA)线性判别分析(LDA)[7]D.VerveridisandC.Kotropoulos,“AutomaticSpeechClassificationtofiveemotionalstatesbasedongenderinformation,”inProc.12thEuropeanSignalProcessingConf.,pp.341-344,Vienna,September,2004.[8]Z.Chuang,C.Wu,Emotionrecognitionusingacousticfeaturesandtextualcontent,MultimediaandExpo,2004.IEEEInternationalConferenceonICME’04,vol.1,2004,pp.53–56.[9]M.You,C.Chen,J.Bu,J.Liu,J.Tao,Emotionrecognitionfromnoisyspeech,in:IEEEInternationalConferenceonMultimediaandExpo,2006,2006,pp.1653–1656l.研究综述-多类特征组合

结合韵律特征与语意信息结合韵律特征、语意信息以及语言结构结合韵律特征以及视频信息(人脸识别)[10]Chung-HsienWu,Wei-BinLiang,“EmotionRecognitionofAffectiveSpeechBasedonMultipleClassifiersUsingAcoustic-ProsodicInformationandSemanticLabels,”IEEETransactionsonAffectiveComputing,2011,2(1):10-21.[11]T.Otsuka,J.Ohya,Recognizingmultiplepersons’facialexpressionsusinghmmbasedonautomaticextractionofsignificantframesfromimagesequences,in:ProceedingsoftheInternationalConferenceonImageProcessing(ICIP-97),1997,pp.546–549.研究综述-分类方法

GMM,SV

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论