深度学习案例教程 教案1.4 深度学习的应用领域-语音识别_第1页
深度学习案例教程 教案1.4 深度学习的应用领域-语音识别_第2页
深度学习案例教程 教案1.4 深度学习的应用领域-语音识别_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1-04深度学习的应用领域-语音识别(p15)同学们,大家好。接下来我们开始学习第四节,深度学习的应用领域。深度学习作为一种重要的人工智能技术,在各个领域都有广泛的应用,在计算机视觉领域,可以进行图像识别、目标监测、人脸识别等任务,也可以为自动驾驶、安防监控、医学影像分析提供强大支持。在自然语言处理领域,能够实现机器翻译、文本生成、情感分析。应用于智能助理、社交媒体分析、智能客服等场景。(p16)下面我们来介绍一下深度学习的一个重要的领域-语音识别。语音识别是一门交叉学科。它需要用到数字信号处理,模式识别等方法,还涉及到概率论等理论知识,随着深度学习的发展,也让语音识别有了很大幅度的提升。具体的应用场景有很多,(1)比如说我们打一个10086智能客服,跟他说帮我查一下话费余额,这个时候,模型将会把我们的声音识别成文字,然后提取相关信息了解我们的需求,然后去数据库中查询我们的话费余额。(2)还有常见的行车导航软件,它通过语音合成技术为司机进行道路指引,播报路况信息,甚至可以选择自己喜欢的声音,比如可以选择一个明星的声音来帮我们进行语音播报。(3)还有像我们的智能家居系统。通过语音识别以及合成技术,让我们和智能家具进行交流,通过“嘴”来控制家具的运行。大大提高了我们的生活质量。(4)再比如说,学生也可以通过一些智能语音系统来学习,可以跟着他读单词、读句子,学习语言,大大的提高了学习效果。(p17)下面我们简单介绍一下深度学习中,如何进行语音识别。首先,因为声波是一种信号,具体我们可以将其称为音频信号。原始的音频信号通常由于人类发声器官或者语音采集设备所带来的静音片段、混叠、噪声、高次谐波失真等因素,一定程度上会对语音信号质量产生影响。所以在正式使用声学模型进行语音识别之前,我们必须对音频信号进行预处理和特征提取。最初始的预处理工作就是静音切除,也叫语音激活检测(VoiceActivityDetection,VAD)或者语音边界检测。目的是从音频信号流里识别和消除长时间的静音片段,在截取出来的有效片段上进行后续处理会很大程度上降低静音片段带来的干扰。除此之外,还有许多其他的音频预处理技术,大家可以找来信号处理相关的资料进行阅读。然后就是特征提取工作。音频信号中通常包含着非常丰富的特征参数,不同的特征向量表征着不同的声学意义,从音频信号中选择有效的音频表征的过程就是语音特征提取。常用的语音特征包括线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC),其中LPCC特征是根据声管模型建立的特征参数,是对声道响应的特征表征。而MFCC特征是基于人的听觉特征提取出来的特征参数,是对人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论