![第三讲语音合成概述课件_第1页](http://file4.renrendoc.com/view/83cb7bf86d6a650d1f87d1ec74566b5a/83cb7bf86d6a650d1f87d1ec74566b5a1.gif)
![第三讲语音合成概述课件_第2页](http://file4.renrendoc.com/view/83cb7bf86d6a650d1f87d1ec74566b5a/83cb7bf86d6a650d1f87d1ec74566b5a2.gif)
![第三讲语音合成概述课件_第3页](http://file4.renrendoc.com/view/83cb7bf86d6a650d1f87d1ec74566b5a/83cb7bf86d6a650d1f87d1ec74566b5a3.gif)
![第三讲语音合成概述课件_第4页](http://file4.renrendoc.com/view/83cb7bf86d6a650d1f87d1ec74566b5a/83cb7bf86d6a650d1f87d1ec74566b5a4.gif)
![第三讲语音合成概述课件_第5页](http://file4.renrendoc.com/view/83cb7bf86d6a650d1f87d1ec74566b5a/83cb7bf86d6a650d1f87d1ec74566b5a5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲语音合成概述背景目标基本问题技术历程典型系统第三讲语音合成概述背景目标基本问题技术历程典型系统背景计算机的普及人机自然语言交互语音合成在人机交互系统中的作用语音合成的其它应用SpeechRecognitionNaturalLanguageUnderstandingDialogManagerSpeechSynthesisNaturalLanguageGenerationInformationDatabaseSpeechInSpeechOut第三讲语音合成概述背景目标基本问题技术历程典型系统目标“让计算机像人一样说话”从文字到语音TTS(Text-To-Speech)从概念到语音CTS(Concept-To-Speech)从意念到语音ITS(Intention-To-Speech)现阶段-TTS前瞻性-CTS等待时机-ITS第三讲语音合成概述背景目标基本问题技术历程典型系统基本问题原因从语音到文字的信息缺失从文字到语音(TTS)从文字到发音描述发什么音如何发音从发音描述到语音合成第三讲语音合成概述背景目标基本问题技术历程典型系统技术历程1937,Voder,BellLab.,H.Dudly1962,级联共振峰,KTH,G.Fant1970s,混合共振峰,MIT,D.Klatt1986,PSOLA,F.Charpentier2000s,Unit-selection,N.Campbell&A.Black1970s1980s1990s2000sQualityTimeFormatPSOLAUnit-selection:Segment-orientedUnit-selection:Prosody-orientedExcellent:Human-likedFair:acceptableBad:unacceptable技术历程1937,Voder,BellLab.,H.Dudly1962,级联共振峰,KTH,G.Fant1970s,混合共振峰,MIT,D.Klatt1986,PSOLA,F.Charpentier2000s,Unit-selection,N.Campbell&A.Black1970s1980s1990s2000sQualityTimeFormatPSOLAUnit-selection:Segment-orientedUnit-selection:Prosody-orientedExcellent:Human-likedFair:acceptableBad:unacceptable音色,孤立音段音色,孤立音段音色,孤立词音色、韵律,语句韵律,语句第三讲语音合成概述背景目标基本问题技术历程典型系统典型系统基于单元挑选的TTS系统构成(韵律导向)两个模块前端:文本处理,从文字到发音描述后端:语音处理,从发音描述到语音合成一个接口,发音描述数据库,合成单元ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend典型系统例:北京交通大学成立于1896年。TextNormalization:北京交通大学成立于1896年ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend典型系统例:北京交通大学成立于1896年。TextNormalization:北京交通大学成立于1896年Parser:北京(npr)交通(ng)大学(ng)成立(vgo)于(pg)1896年(t) ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackendPOS(PartOfSpeech)典型系统例:北京交通大学成立于1896年。TextNormalization:北京交通大学成立于1896年Parser:北京(npr)交通(ng)大学(ng)成立(vgo)于(pg)1896年(t)ProsodicEvent:OutPut
PWordLayer:北京ng
交通ng
大学ng
成立于vg_pg
一八九六年t
OutPut
PPhraseLayer:##北京交通大学##成立于##一八九六年
OutPut
IPhraseLayer:##北京交通大学成立于一八九六年
OutPutSentenceLayer:##北京交通大学成立于一八九六年ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend典型系统例:北京交通大学成立于1896年。TextNormalization:北京交通大学成立于1896年Parser:北京(npr)交通(ng)大学(ng)成立(vgo)于(pg)1896年(t)ProsodicEvent:OutPut
PWordLayer:北京ng
交通ng
大学ng
成立于vg_pg
一八九六年tPhonetizer:北bei3京jing1(BL:北京)交jiao1(BL:交通)通tong1(BL:交通)大da4(BL:大学)学xue2(BL:大学)成cheng2(BL:成立)立li4(BL:成立)于yu2(BL:于)一yi1(BL:一八九六年)八ba1(BL:一八九六年)九jiu3(BL:一八九六年)六liu4(BL:一八九六年)年nian2(BL:一八九六年)ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend典型系统例:北京交通大学成立于1896年。Interface:{2{1^2%0{0^2%0[@ng^2%0<@npr(#bei3&MC$北)(#jing1&MC$京)>][@ng^2%0<@ng(#jiao1&MC$交)(#tong1&MC$通)>][@ng^2%0<@ng(#da4&MC$大)(#xue2&MC$学)>]0}{0^2%0[@vg_pg^2%0<@vgo(#cheng2&MC$成)(#li4&MC$立)><@pg(#yu2&MC$于)>]0}{0^2%0[@t^2%0<@t(#yi1&MC$一)(#ba1&MC$八)(#jiu3&MC$九)(#liu4&MC$六)(#nian2&MC$年|)>]0}1}2}ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend典型系统例:北京交通大学成立于1896年。ProsodicAcousticPredictor: GMM(bei3)GMM(jing1)GMM(jiao1)GMM(tong1)GMM(da4)GMM(xue2)GMM(cheng2)GMM(li4)GMM(yu2)GMM(yi1)GMM(ba1)GMM(jiu3)GMM(liu4)GMM(nian4)SegmentAcousticPredictor:
occ(bei3)occ(jing1)occ(jiao1)occ(tong1)occ(da4)occ(xue2)occ(cheng2)occ(li4)occ(yu2)occ(yi1)occ(ba1)occ(jiu3)occ(liu4)occ(nian4)ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend典型系统例:北京交通大学成立于1896年。ProsodicAcousticPredictor: GMM(bei3)GMM(jing1)…SegmentAcousticPredictor:
occ(bei3)occ(jing1)…UnitSelection:
argmincost(sam(bei3),sam(jing1),sam(jiao1),…)Corpus:bei3
jing1ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend典型系统例:北京交通大学成立于1896年。ProsodicAcousticPredictor: GMM(bei3)GMM(jing1)…SegmentAcousticPredictor:
occ(bei3)occ(jing1)…UnitSelection:
argmincost(sam(bei3),sam(jing1),sam(jiao1),…)Corpus:bei3
jing1…SpeechSynthesizer:北京交通大学成立于1896年。ParserProsodicEventPredictorPhonetizerProsodic&PhonemiccontextProsodicAcousticsPredictorSegmentAcousticsPredictorUnitSelectionSpeechSynthesizerTextNormalizationCorpora:speechphoneticalignment,prosodicparameterDictionary:Lexicon,Rules,HomographInputtextInterfaceOutputspeechFrontendBackend后续题目基础知识韵律原理分析关键技术数据库构建文本处理声学建模最优搜索/合成器相关研究音色调整/转换HMM合成器挑战基于数据驱动的韵律建模Twotrainablecomponents:basedonanannotatedcorpusProsodiceventpredictorProsodicparameterpredictor韵律功能ProsodystructureEx.1,已经取得文凭的和尚未取得文凭的干部Ex.2,顺天府秋捐归您啦,八旗兵丁一年的赏讨下来了。Ex.3,政协十届一次会议主席团常务主席会议审议通过了政协十届一次会议提案审查委员会关于政协十届一次会议提案审查情况的报告草案(58)IntonationEx.4,明天是个晴天,最高气温...(flat) Ex.5,明天是个晴天!我们可以...(glad)Ex.6,明天是个晴天?(interrogative)AccentEx.7,明天是个晴天vs.明天是个晴天MoodEx.8,明天是个晴天
gladvs.
明天是个晴天
sadprosodyisnotallformood,timbreischangedalso韵律的声学实现Inacoustic,prosodyispresentedasthevariancesofpitchdurationintensitypause韵律描述C-ToBIdefined1'st,prosodystructure知觉判断等级与韵律层级结构对应coming,accentindex汉语韵律层次韵律结构标注,按照语调短语、中间短语、音步/韵律词三个韵律层级,描述每段发音。语调短语(intonationalphrase):具有完整的语调,听感上可独立成句的一段发音音步(foot):节奏的基本单位,一般由两个或三个音节构成,少数为单音节。韵律词(prosodicword):所有的句法词具有类似词的连调模式和词重音模式、较短的词组其它凡是属于一个音步的结构跨度为1-4个音节,极大多数为2-3个音节,少数为单音节和四音节结构。中间短语(intermediatephrase):介于语调短语和韵律词之间的节奏单元由一个或多个韵律词构成中间短语之间可能存在嵌套结构韵律标注依据听觉进行边界类型的判断,并辅助以特定类型处理的约定听觉判决所依据的线索基频重置,边界末音节展延,停顿,节奏的变化需从全局的、层级的角度考察每段发音标注符号BP2:用以界定语调短语边界BP1:用以界定中间短语边界BP0:用以界定有明显停顿的音步/韵律词间的边界空格:用以界定音步/韵律词边界*:用以界定韵律词内的音步边界特定类型约定位于短语边界的、听感上轻读的、作为短语间过渡的虚词,倾向于划归后一短语BP0为音步边界,且具有明显的停、顿,倾向于从严标出一个韵律结构标注的例子S1 编者按(BP2)世界上(BP1)有些事是相似的(BP2)甚至(BP0)惊人地相似S2 编者按(BP2)世界上有些事(BP1)是相似的(BP2)甚至(BP0)惊人地相似Problemofconsistency training acceptable韵律的深层次标注AccentIndexWhatisAI Sample催眠师有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国硫酸镁数据监测研究报告
- 2025至2030年中国喂料阀数据监测研究报告
- 2025-2030年城市天际线动态照明系统行业深度调研及发展战略咨询报告
- 核磁共振岩心测试仪项目风险识别与评估综合报告
- 2025年合伙购买房产售后服务合同
- 2025年度建筑工程施工安全教育培训劳务分包合同范本(年度版)
- 2025年度健身俱乐部健身俱乐部会员卡激活与解冻服务合同
- 2025年度医疗贷款合同关爱版
- 2025年出租车司机劳动合同模板(含合同续签与升级)3篇
- 2025年度空调产品节能认证服务合同
- 城市基础设施修缮工程的重点与应对措施
- 油气勘探风险控制-洞察分析
- GB 12710-2024焦化安全规范
- 2022年中考化学模拟卷1(南京专用)
- 医疗机构质量管理指南
- 【牛客网】2024秋季校园招聘白皮书
- 2024-2025银行对公业务场景金融创新报告
- 2025届郑州市高三一诊考试英语试卷含解析
- 《我国个人所得税制下税收征管问题研究》
- 建筑工程三通一平技术方案
- 肿瘤中医治疗及调养
评论
0/150
提交评论