![基于凸优化的少量样本语音识别_第1页](http://file4.renrendoc.com/view/82320a4893fd9fc0a5c472df0009feb8/82320a4893fd9fc0a5c472df0009feb81.gif)
![基于凸优化的少量样本语音识别_第2页](http://file4.renrendoc.com/view/82320a4893fd9fc0a5c472df0009feb8/82320a4893fd9fc0a5c472df0009feb82.gif)
![基于凸优化的少量样本语音识别_第3页](http://file4.renrendoc.com/view/82320a4893fd9fc0a5c472df0009feb8/82320a4893fd9fc0a5c472df0009feb83.gif)
![基于凸优化的少量样本语音识别_第4页](http://file4.renrendoc.com/view/82320a4893fd9fc0a5c472df0009feb8/82320a4893fd9fc0a5c472df0009feb84.gif)
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 基于凸优化的少量样本语音识别 罗光圣黎文伟摘 要:本文首先討论了语音识别的应用研究状况,以及介绍了语音识别的应用流程。在此基础上讨论了少量样本的基本概念,分析了少量样本的研究状况,然后分析了凸优化的基本原理和算法。 其中重点讨论凸优化算法。最后总结了少量样本语音识别的工作和展望。Key:语音识别 少量样本 凸优化:TP181:A:1003-9082(2020)02-0-01一、语音识别语音识别通过运用语言学、计算机科学、电子工程、模式识别、概率论、信息论以及人工智能等领域的方法和技术,使计算机设备能够精准识别和翻译语音信息,也被称为自动语音识别(ASR)或者语音到文本(STT)。语音识别的流
2、程如下:二、少量样本对图像识别的机器学习少量样本目前大致可分为 模型大致可分为三类:Mode Based,Metric Based 和 Optimization Based。在专业领域语音识别样本不会很多,如银行的电子渠道手机银行语音导航,样本数有账户管理,我的账户,交易明细等类别很少,可以从训练训练50个类,每个类100个样本。训练过程中,从训练集(50 个类,每类 100 个样本)中随机采样 5 个类,每个类 5 个样本,构成支撑集,去学习 learner;然后从训练集的样本(采出的 5 个类,每类剩下的样本)中采样构成 Batch 集,集合中每类有 15 个样本,用来获得 learner
3、 的 loss,去学习 meta leaner具体地,它显式的定义一个基于支撑集 S的分类器,对于一个新的数据X ,其分类概率由X与支撑集 S之间的距离度量得出:其中 a 是基于距离度量的 attention score:三、凸优化如果一个最优化问题的可行域是凸集,并且目标函数是凸函数,则该问题为凸优化问题。凸优化问题可以形式化的写成其中x为优化变量;f为凸目标函数;C是优化变量的可行域,是一个凸集。这个定义给了我们证明一个问题是凸优化问题的思路,即证明目标函数是凸函数(一般是证明它的Hessian矩阵半正定),可行域是凸集。凸优化的证明如下:1.目标函数2. 目标函数展开之后为3. 二阶偏导
4、数为4. Hessian矩阵为Hessian矩阵是半正定矩阵,上面的优化问题是一个不带约束条件的凸优化问题。可以用梯度下降法或牛顿法求解。训练一个语音识别的神经网络模型,来预测梯度,用一次二次方程的回归问题来训练,采用凸优化的方法进行优化,到的神经网络优化器比Adam,RMSProp还要好。结语在这边文章中,我们基于专业语音识别应用领域中,样本少的实际情况,提出了少量样本与优化器凸优化结合的分类模型。未来的工作,将少量样本的语音,扩展到有噪音环境下的语音识别,同时迁移到其他专业应用领域中如医疗等,或者在此基础上迁移到其他少量语种中去,经过简单的微调而不用太多数据就是准确的实现语音识别功能。实验
5、验证一下基于凸优化的少量样本语音识别模型和其他优化器的模型性能进行比较。Reference1 G. Dahl, D. Yu, L. Deng, A. Acero. Context-Dependent Pre-trained Deep Neural Networks for Large Vocabulary Speech Recognition. IEEE Transactions on Audio, Speech, and Language Processing. 2012.2 H. Sak, A. Senior, F. Beaufays. Long Short-term Memory Recurrent Neural N
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年综合接入服务系统项目可行性研究报告
- 2025年电脑雕刻圣诞灯饰项目可行性研究报告
- 2025至2031年中国牛角扣羊羔绒马甲行业投资前景及策略咨询研究报告
- 2025年果蔬宝农药项目可行性研究报告
- 2025至2031年中国异型结构件行业投资前景及策略咨询研究报告
- 2025年工艺温度计项目可行性研究报告
- 延安2024年陕西延安市市直事业单位选聘70人笔试历年参考题库附带答案详解
- 2025至2031年中国一体式顶置空调器行业投资前景及策略咨询研究报告
- 2025至2030年中国黑豆粉数据监测研究报告
- 2025至2030年高效板式密闭过滤机项目投资价值分析报告
- 水土保持方案中沉沙池的布设技术
- 安全生产技术规范 第25部分:城镇天然气经营企业DB50-T 867.25-2021
- 现代企业管理 (全套完整课件)
- 走进本土项目化设计-读《PBL项目化学习设计》有感
- 《网店运营与管理》整本书电子教案全套教学教案
- 教师信息技术能力提升培训课件希沃的课件
- 高端公寓住宅项目营销策划方案(项目定位 发展建议)
- 执业兽医师聘用协议(合同)书
- 第1本书出体旅程journeys out of the body精教版2003版
- [英语考试]同等学力英语新大纲全部词汇
- 2022年肝动脉化疗栓塞术(TACE)
评论
0/150
提交评论