版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、开源TTS/语音合成和处理工具eSpeak eSpeak是一个紧凑的开放源码软件的语音合成器为英语和其他语言,为Linux 和 Windows 。eSpeak生产高质量的英语演讲。它使用了不同的合成方法从其他开源语音合成 引擎,和声音完全不同。这也许不是作为自然人或“平稳”,但我觉得发音更 清晰,更容易听很长时间。它可以运行命令行程序发言的文本文件或从标准输入。一个共享库的版本也已 推出。包括不同的声音,其特点可以改变。能产生语音输出为WAV文件。SSML (语音合成标记语言)的支持(未完成),并使用HTML。该计划及其数据,其中包括数种语言,总计约700千字节。可以把文字,音素代码,所以它能
2、够适应作为一个前端另一个语音合成引擎。 潜在的其他语言。一些包含在不同阶段所取得的进展。帮助母语为这些或 其他语言的欢迎。开发工具可用于生产和调整音素数据。写在C + +Windows版本 目前的Windows SAPI5和命令行版本的eSpeak。SAPI5版本的 可以使用屏幕阅读器,如完,颌骨,超新星,以及窗的眼睛。它们可以作为一个Windows安装程序包该eSpeak语音合成器支持几种语言,但在大多数情况下,这些都是初稿,并需 要更多的工作来改善。援助的母语是值得欢迎的这些或其他新的语言。请与我 联系如果你想帮助。eSpeak没有文字,语音合成的语言,一些比别人做得更好。南 非荷兰语,粤
3、语, 克罗地亚语,捷克语,荷兰语,英语,世界语,芬兰语,法语,德语,希腊语, 印地语,匈牙利语,冰岛语,意大利语,Lojban,马其顿语,普通话,挪威语, 波兰语,葡萄牙语,罗马尼亚语,俄语,塞尔维亚语,斯洛伐克语,西班牙语, 斯瓦希里语,瑞典,越南,威尔士。FreeTTSFreeTTS是完全采用Java开发的语音合成系统,它是卡内基梅隆大学基于 Flite这个小型的语音合成引擎开发的。FreeTTS是一个语音合成系统写的JavaTM编程语言完全。它是根据Flite公司: 一个小运行时语音合成引擎卡内基梅隆大学的发展。弗莱特来源于节语音合成系 统,从爱丁堡大学和卡内基梅隆大学的festvox项
4、目。这种FreeTTS版本包括: *核心语音合成引擎*支持的多寡:邻一 8kHz的双音子,男,美国英语语音办公16KHz的双音子,男,美国英语语音办公16KHz的有限域,男*美国英语语音的 festvox的进口(美国英语的声音只)*对进口的festvox (仅限美式英文)*支 持工具中央结算系统的MBROLA北极的具体支持,支持的声音声音(单独下载): 办公自动化16KHz的女性,美国英语语音O 2个16KHz的男性声音*美国英语为 JSAPI 1.0 *广泛的API文档部分支持*几个演示应用eSpeak-ChineseeSpeak-Chinese 是一个 TTS 软件。它是基于 Jonath
5、an Duddington 的 eSpeak 由于中文词典太大,eSpeak缺省并不带中文词典,需另外下载。发布 eSpeak-Chinese只是为了方便用户安装。国语支持的主要贡献者:Kyle Wang (waxaca at )-创建了最初的字典,规则和声音文 件。Silas S. Brown ( HYPERLINK http:/people.pwf.cam.ac.uk/ssb22/ http:/people.pwf.cam.ac.uk/ssb22/)- 改进词典(加 入 CEDICT 等).粤语支持的主要贡献者:黄冠能-创建了粤语字典,简易的规则和声音文件。eSpeak-Chinese是e
6、GuideDog项目的重要组成部分。另一个中文TTS(余音)在开 发中。它在设计上更简易但文件较大。由于使用了真人发声,它比eSpeak的声 音更自然。目前它只支持粤语。FliteFlite是一个小型、快速的TTS系统,是著名的语音合成系统festival的c版 本。可用于嵌入式系统5.OpenVXIOpenVXI提供的是完整的VXML解析服务,同时也提供了有限语言的TTS支持。Voice eXtensible Markup Language (简称VXML)是被用来创建语音对话系统, 可以调用语音合成以及语音识别服务,可以用来记录语音录入和连接电话系统。 创建VXML语音的主要目的就是用We
7、b开发的理念来开发交互式的语音应用。 VXML提供了基于Menu和基于Form的两套框架,整合了语音识别和语音合成 两个关键服务,使得语音应用的开发变得更为方便和快捷。VXML和普通的标记语言一样,需要有浏览器进行解析;还需要提供语音识别和 语音合成服务的应用服务器;有时也需要有http服务器提供文档服务;当然, 如果需要与电话系统相连,就必须加上VOIP (网络电话)的支持。如下图所示 的就是VXML的运行环境: 图1. VXML运行环境一个企业级应用的系统框架IVR (interactive voice-response services)也就是自动应答服务,是使用 VXML的典型企业级应
8、用。IVR和使用者通过电话,按键(DTMF)互动,如语音 订票,语音查询,语音投票等。普通的IVR都是支持VXML的解析和提供了 sip 协议的支持,通过和ASR (语音识别)应用服务器以及TTS(语音合成)应 用服务器的集成,可以实现几乎所有的VXML封装的操作。企业级的VXML应用需要如下的体系结构,以使用IBM Voice Server (WVS)为 例:图2. 一个VXML具体应用的例子上图中的IVR事实上就是VXML解析器,通过解析VXML,分发相应的工作给 WVS,实现VXML封装的语音识别和语音合成的功能。FestivalFestival是Linux下的一个语音合成软件使用方法:
9、$ festival -tts letter.txt$ festivalfestival (SayText Greetings from )$festival (tts myfile.txt)在线演示: HYPERLINK http:/www.cstr.ed.ac.uk/projects/festival/onlinedemo.html http:/www.cstr.ed.ac.uk/projects/festival/onlinedemo.htmlMBROLAMBROLA是一个TTS引擎,旨在尽可能的提供各种语言的语音合成器,这些语言 在其首页上都有说明。AstLinuxAstLinux是一
10、个定制的Linux发行版,主要是围绕这asterisk这个语音交换 软件定制的。HTS (HMM-based Speech Synthesis System)HTS (HMM-based Speech Synthesis System)是一个语音合成系统 阅读HTS所使用的技术和算法,请看: HYPERLINK http:/hts.sp.nitech.ac.jp/PPublications http:/hts.sp.nitech.ac.jp/PPublicationsFestvoxFestvox是卡内基梅隆大学语音项目组开发的语音合成系统ll.Speak It阅读的书页或选定文本使用微软语音合
11、成引擎.语音识别系统SimonSimon是一个开源的语音识别系统,它不仅可以输入文字,而且可以代替键盘、 鼠标操作电脑。Simon基于Qt用C+开发,因为某些支持库与KDE相同,所 以可完美的集成到KDE4中。除KDE之外,Simon也可在GNOME、fe、及其 他X11环境下运行。hmonkJ语音合成引擎gnuspeechGnuspeech是一个可扩展的语音合成实现包的基础上,实时,发音,语音合成按 规则。也就是说,它转换成语音的描述文本字符串,由一个发音辞典,信中对声 音的规则,节奏和语调模型资助;参数转换成一个低级别的发音合成的语音说明, 以及利用这些驱动发音模型的制作人声是正常的声音输
12、出的GNU / Linux的设备 输出合适的道语音合成引擎EposEpos是一个跟语言本身无关的规则驱动的语音合成系统,主要作科研用途 在线演示: HYPERLINK http:/epos.ure.cas.cz/cgi-bin/saye.cgi?lang=czech http:/epos.ure.cas.cz/cgi-bin/saye.cgi?lang=czech语音合成软件NeXTeNSNeXTeNS是一个荷兰语的Text-to-Speech的软件。:;File FontToDi FO Parameters Command Line LogOp een dag kwam de eekhoor
13、n erachter dat het onversti%LH*L 职 LH+LH去 Lwas om niet verder te kunnen tellen dan tot vij f.H*LH 班L%Hij ging naar de school aan de voet van de eik in 1 TOC o 1-5 h z %L H*LH*LH*LH*Lmidden van het bos en vroeg aan de mus die daarH*LH*LH*LH*Londerwij zer was of hij hem tot tien kon leren tellen.H*LH*
14、LIk zal mijn best doenz 7 zei de mus.%LH*L H*L H*LH*L L%Maar wat je vraagt is niet eenvoudig.%LH*LH*L L%Ik kan zelf tot zeventien tellen, maar vraag mij nie%LH*LH*Llang ik daarvoor heb gestuderdr want dat weet ik alH*LH*LH*Lmeet.L%Ik heb er alles voor over, zei de eekhoorn.%LH*LH*L L%De meeste dieren ko
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课题申报参考:教育家精神引领高校思政课教师职业素养评价体系建构研究
- 二零二五版铝合金建筑模板采购协议书4篇
- 商场内品牌专卖店装修许可协议(2025年)2篇
- 2025年度苗木种植与林业产业发展合作合同4篇
- 二手房合作投资合同模板2024版B版
- 二零二五年度人工智能教育培训合同补充协议6篇
- 二零二五年度旅行社与航空公司合作协议书3篇
- 2025年度品牌跨界合作与品牌授权合作协议4篇
- 二零二五版个人贷款居间中介服务协议书6篇
- 2025年度个人房产抵押借款合同规范文本8篇
- 【寒假预习】专题04 阅读理解 20篇 集训-2025年人教版(PEP)六年级英语下册寒假提前学(含答案)
- 2024年智能监狱安防监控工程合同3篇
- 2024年度窑炉施工协议详例细则版B版
- 幼儿园篮球课培训
- 【企业盈利能力探析的国内外文献综述2400字】
- 统编版(2024新版)七年级《道德与法治》上册第一单元《少年有梦》单元测试卷(含答案)
- 100道20以内的口算题共20份
- 高三完形填空专项训练单选(部分答案)
- 护理查房高钾血症
- 项目监理策划方案汇报
- 《职业培训师的培训》课件
评论
0/150
提交评论