版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息技术与人工智能基础项目11
智能语音01项目背景02思维导图03思政聚焦04项目相关知识05项目任务目录CONTENTS06项目小结与展望01项目背景智能语音技术介绍“当我们去餐馆吃饭,一个语音机器人帮助你完成菜单推荐、价格咨询、特色介绍、买单结账等行为。这些需求都可以由机器人理解并形成服务需求发给离你最近的服务人员,从而避免了你不断招手,而服务员来回奔跑的过程。此外,你在开车的时候,可以询问“附近的加油站”、“肚子饿了去哪里”;回家的时候对智能音箱说帮你开空调、开窗帘等都是智能语音技术的典型应用。
这段感性认识很重要,请仔细修改,写完整、写通顺,建议先写感性内容,再讲上面的理论。理论部分也可以不写,项目概述的意义是引导教学,理论可以放到后面再讲。
已修改、还不够好,回头再完善一下。智能语音技术应用
智能语音技术相关产品很早就已经走入了我们生活,如苹果的Siri、微软的Cortanna、百度的小爱音箱
、阿里巴巴的天猫精灵等,它们可以解决日常生活中很多的人机交互问题。
这是小米的产品?
小爱是百度的产品。02思维导图项目五思维导图03思政聚焦智能语音技术应用2019年学习强国2.5.0版本于苹果商店和安卓商店同步上线,其中图文内容新增语音播报功能,以实用性强、高逼真度受到用户好评。语音播报的“强伴随性”恰是学习最大的优势,音频播报流量使用不大、所占介质内存空间小;打破时空限制,合理利用碎片化时间学习。开车途中、地铁里、公交上、跑步时,只要你想学,随时随地,即可投入专属个人的沉浸式学习。从最开始的语音播报,到声貌都惟妙惟肖的多语种人工智能虚拟主播,背后其实是不断迭代升级的人工智能技术。其中,语音播报核心技术是语音合成。04项目知识准备智能语音交互智能语音是人工智能技术的重要组成部分,实现了人机语言的通信,其主要技术包括了语音识别(AutomaticSpeechRecognition,ASR)和语音合成(Text-To-Speech,TTS)。语音识别是让机器能够“听见”周围的声音实现机器感知智能;语音合成则是让机器模仿人类“说出”给定的文字内容。因此,智能语音技术既模拟了人类的耳朵又模拟了人类的嘴巴语音识别的概述语音识别的目的就是让机器明白你说什么,而语音识别的过程就是机器模拟人类的听觉系统的过程。因此,语音识别技术就是让机器通过识别和理解过程把语音信号转变为文本和指令的技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。RadioRex2052565980初80末语音识别的历史贝尔实验室模拟电子器件RCA实验室统计学的原理数据库语音查询系统、办公语音助手系统和笔记记录听写机隐马尔科夫模型神经网络00云模式语音识别相关技术与面临的挑战相关技术面临挑战上文内容对语音信号的语义产生的影响;发音人的口音、发音的方式与习惯会导致语音特征在参数空间分布的不同;发音人心理和生理变化直接影响了语音信号的变化;环境及各种突发的干扰等因素造成的语音信号失真问题。语音合成的概述语音合成技术是通过机械的、电子的方法来模仿人类的语音的技术。它能将你输入的句子实时转化为标准语音流畅的朗读出来,整个过程如同人类边看文本内容变朗读出来的过程。它主要如何让机器像人一样开口说话,涉及的技术包括声学、语言学、数字信号处理、计算机科学等多个学科技术。起源阶段18-19世纪19301980199020xx今天语音合成的历史电子合成器阶段共振峰合成器阶段单元挑选拼接合成阶段基于机器学习技术合成阶段DNN/CNN/RNN语音合成相关技术与面临的挑战相关技术面临挑战如何处理远场复杂环境的挑战如何让语义理解更智能如何满足在不同场景下人们的个性化需求。04项目任务任务1:制作一个语音识别器1、任务描述本任务实践的主要目的是掌握语音识别的过程。首先通过了解认识语音信号,学习如何去可视化不同类别音频信号,并通过不同技术来处理语音信号来制作一个语音识别系统。任务1:制作一个语音识别器2、技术分析音频信号结构时域信号与频域信号音频特征提取语音中文字的识别任务1:制作一个语音识别器3、任务实现---请大家扫二维码根据步骤测试实现任务2:制作一个语音合成器1、任务描述本任务实践的主要目的是掌握语音合成的过程。首先通过制作一段合成电子音乐了解基于波形拼接的语音合成过程。然后,输入一段文本来展示基于深度学习的智能语音合成效果。任务2:制作一个语音合成器2、技术分析语调语速语音库任务1:制作一个语音合成器3、任务实现---请大家扫二维码根据步骤测试实现04项目小结与展望项目小结
本章介绍了智能语音技术的概念、发展历程、相关的技术与挑战等内容。以制作一个语音识别器和语音合成器这两个项目实践,对智能语音的两大关键技术的应用做了案例具体实现。其中语音识别实现过程主要包括音频基本信息的查看、音频信号可视化、频域信号的可视化、信号的MFCC特征可视化、信号的FilterBank特征可视化、根据语言模型识别出文字等重要步骤。制作一个语音合成器则试听电子合成音乐、制作电子合成音乐、语音合成文本分词、文本词语拼音生成、选择合成的参数来合成给定文本的语音。读者可以在学习智能语音技术理论的基础上动手实践,体会到智能语音应用的趣味。。项目展望目前的智能语音已经应用于各种场景,产生了很多可落地的成熟产品。当前基于深度学习的语音识别和语音合成技术已经可以做很好了,满足了市场上绝大部分需求。当前的主要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《肠炎性疾病》课件
- 《军人核心价值观》课件
- 2024中国电信股份限公司保山分公司(保山电信)招聘16人(云南)易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国旅游集团战略发展部副总经理公开招聘1人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国国际工程咨询限公司总部社招易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国人文科学发展公司管理岗位公开招聘1人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中交铁道设计研究总院限公司招聘21人易考易错模拟试题(共500题)试卷后附参考答案
- 2024上海申通地铁建设集团限公司高校毕业生招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2024年度技术秘密转让合同-技术秘密保密与使用权2篇
- 2024年度品牌授权使用与管理合同3篇
- 项目进度跟进汇总表模板
- 人工智能基础与应用课件
- 2022-2023学年广州市南沙区小升初全真模拟数学检测卷含答案
- 第六讲 以新发展理念引领高质量发展PPT习概论2023优化版教学课件
- 会议记录格式及范文电子版(24篇)
- 比亚迪宋PLUS EV说明书
- 家长学校教研活动记录文本表
- 儿童口腔项目方案
- 树合规风做合规人银行合规培训PPT
- 新媒体营销完整PPT全套教学课件
- 枣庄市专业技术人员继续教育公需科目2021年度补考题库及卫生专科课题库
评论
0/150
提交评论