智能语音技术及应用开发 课件 实践项目:语音标注_第1页
智能语音技术及应用开发 课件 实践项目:语音标注_第2页
智能语音技术及应用开发 课件 实践项目:语音标注_第3页
智能语音技术及应用开发 课件 实践项目:语音标注_第4页
智能语音技术及应用开发 课件 实践项目:语音标注_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能语音处理技术实践项目基于Praat的语音标注环境安装读取音频文件软件操作任务描述:首先下载Praat软件,熟悉软件界面;然后,在Praat中录音或读取音频文件;接下来,利用软件工具进行语音分析,显示三维语谱图、频谱切片、音高曲线、共振峰曲线、音强曲线等,并将相应的对象数据保存为磁盘文件;最后,利用软件实现语音标注,并保存标注文件。步骤一:安装Praat步骤二:Praat---Open---Readfromfile...---找到对应的声音或者Textrid文件,打开即可。注意:如果录音较长,选择Extractpart,输入起始时间(单位为秒),点击OK即可。步骤三:语图分析在PraatObject列表中选中要进行分析的录音片段,单击右侧的Analysespectrum下的Tospectrogram…,按OK按钮提交程序后,会得到一个类型Spectrogram的声音文件,单击右侧的View即可观察到语图,如图所示。语谱图是一种三维图形,横坐标和纵坐标分别表示语音持续的时间和对应的频率,而第三维坐标一般为灰度图或者是彩色图,代表对应时刻语音的强度。在语图分析中,如果要重点分析不同时间下的频率可以选择宽带语图,如果时间区域不明显可以选择分析窄带语图,前者常用来分析音色,后者常分析谐波和音高。步骤三:语图分析在PraatPicture窗口中选定画图的区域,单击右侧的Draw下的Paint...,在弹出的对话框中填入所要分析的录音片段的起始时间就得到了宽带语图,其中,横坐标表示时间,纵坐标表示频率,能量的强弱用颜色的浓淡来表示,如图所示。还可以单击Margins菜单下的marksleftevery和marksbottomevery可以为语图添加横纵坐标。步骤三:语图分析如果要得到特定时间点的频率和能量,我们可以做二维频谱分析,下面我们针对上面做出的宽带语图来做其片段分析。首先,在PraatObject列表中选中类型为Spectrogram的对象,单击右侧Analyse下的ToSpectrum(slice),在弹出的文本框中输入某一时间点会得到一个类型为Spectrum的声音文件,如图所示。步骤四:语音标注创建一个空白的标注文件。同时选中语音文件和TextGrid文件,点击View&Edit,就可以进行标注了。步骤四:语音标注标注时,根据听辨边界,以及查看语图的信息,确定音素或者音节的边界。使用菜单上的showpitch可以显示基频线,用showformant可以显示共振峰线,用showintensity可以显示音强线。步骤四:语音标注GLOBAL层主要标注语音文件的一些全局信息,包括说话人性别信息和语种信息(方言区)。标注格式如下:[speaker]:[空格]1[空格]性别,[空格]2[空格]性别;[空格][language]:[空格]1[空格]方言区,[空格]2[空格]方言区例如:[speaker]:1male,2female;[language]:1普通话,2普通话步骤四:语音标注SPEAKER层和CONTENT层的时间边界的数目是完全一致的,每一对时间边界也是完全相等的,也就是说不管点击哪一层的时间边界,另外一层一定是空心蓝色,而不是实心蓝色。添加时间边界的方法为:将鼠标移动到语音波形的相应位置,这时会出现一条虚线以及圆圈,分别点击SPEAKER层和CONTENT层对应的圆圈即可。步骤四:语音标注在整个语音文件中,SPEAKER层需要标注的是说话人信息,“说话人”取值为以下两种:1、2,分别表示说话人1、说话人2。(说话人1、2仅标注在文字段上,符号段不标注);如果是客服类对话,则SPEAKER层的“说话人”取值为1的语音,必须是话务员;用户的语音取值为2;客服一定是和用户有直接对话。步骤四:语音标注CONENT层标注说话内容,包括正常语音(如表2.3)和噪音(如表2.4)两类。其中,CONTENT层短暂噪音的标注都是中括号与语音内容的组合,不要标注时间边界。CONTENT层持续噪音的标注需要标注中括号和时间边界,SPEAKER层不标注内容。步骤四:语音标注表2.3CONENT层的正常语音标注步骤四:语音标注表2.4

CONENT层的噪音标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论