VAD、解码、自动录音模块_第1页
VAD、解码、自动录音模块_第2页
VAD、解码、自动录音模块_第3页
VAD、解码、自动录音模块_第4页
VAD、解码、自动录音模块_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

VAD、解码、自动录音李龙2015.1.14模块关系cfg\categorypps:试卷解析arc:自动录音模块ftr:特征提取模块,提取MFCC特征,用于识别,速度慢pth:基频提取模块sftr:特征提取,用于跟踪,速度快ick:输入检测模块,检测输入语音的能量、有效语音长度、信噪比、截幅比例,以决策出是否存在相应异常trk:自动跟踪解码dbf:神经网络ssp:文本切分orc:音段识别,用于打分特征edt:检错,用于打分特征mcp:打分特征smp:计算分数oct:xml模块关系判断结尾音素解码直接结束最大静音时长后结束是否Arc模块cfg\categoryVADVADVAD原理VADVoiceActivityDetection(端点检测)目的从数字语音信号中将语音和各种非语音信号区分开来,确定出语音信号的端点。意义减少数据的采集量,节约处理时间;排除无声段或噪声段的干扰,提高信息质量;

VAD算法分类基于特征的方法-能量vad思想:寻找能对语音与噪声具有区分性的特征特征:能量、子带能量、过零率、基频、熵等基于模型的方法-模型vad思想:对语音与噪声分别建模以区分语音时段建模方法:GMM、HMM、MLP、SVM、Gamma分布等能量双门限算法流程图能量双门限算法算法示意图能量双门限算法算法描述寻找语音前端点:当前位置后的X帧内有连续Y帧超过E_Low;当前位置后的M帧内有连续N帧超过E_High;寻找语音后端点:找到低于E_Low的点;低于E_Low点后的A帧内没有连续B帧超过E_High;VAD能量双门限算法

模型vad模型训练特征为MFCC等Speech、Nonspeech两个模型Hmm、Gmm

、DNN…计算语音每帧的后验概率得到每帧语音是Speech的概率;模型决策最终判定与能量vad的四种状态跳转类似解码解码原理解码什么是解码?1我们所说的解码是什么?2解码(Decoding):用特定方法把数码还原成它所代表的内容或将电脉冲信号、光信号、无线电波等转换成它所代表的信息、数据等的过程。在语音领域,语音识别就是解码。物理意义:对于输入语音,算出概率最高的词序列。问题这里的解码器是什么?3解码器就是将语音信号识别成相应的文字信息的模型算法HMMHMM:可以用五个元素来描述,包括2个状态集合和3个概率矩阵。1.隐含状态S2.可观测状态O3.初始状态概率矩阵π4.隐含状态转移概率矩阵A。5.观测状态输出概率矩阵B。HMM晴天(0.4)下雨(0.6)散步购物清理0.60.70.40.30.60.30.10.10.40.5HMM—解码(维特比解码)一个例子:

想象一个乡村诊所。村民有着非常理想化的特性,要么健康要么发烧。他们只有问诊所的医生的才能知道是否发烧。聪明医生通过询问病人的感觉诊断他们是否发烧。村民只回答他们感觉正常、头晕或冷。假设一个病人每天来到诊所并告诉医生他的感觉。医生相信病人的健康状况如同一个离散马尔可夫链。病人的状态有两种“健康”和“发烧”,但医生不能直接观察到,这意味着状态对他是“隐含”的。每天病人会告诉医生自己有以下几种由他的健康状态决定的感觉的一种:正常、冷或头晕。这些是观察结果。整个系统为一个隐马尔可夫模型(HMM)。医生知道村民的总体健康状况,还知道发烧和没发烧的病人通常会抱有什么症状。换句话说,医生知道隐马尔可夫模型的参数。HMM—解码(维特比解码)构建医生看病的HMM模型:HMM—解码(维特比解码)一个问题:

病人连续三天看医生,医生发现第一天他感觉正常,第二天感觉冷,第三天感觉头晕。于是医生产生了一个问题:怎样的健康状态序列最能够解释这些观察结果。NORMALCOLDDIZZYHEALTHYFEVER?HMM—解码(维特比解码)医生看病流程(维特比解码):

NORMALCOLDDIZZY维特比解码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论