




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
能力模块四
掌握智能座舱中语音交互技术的应用任务一
了解智能座舱语音交互技术作为一名智能座舱测试工程师的你现在需要对智能座舱中的语音交互功能进行测试,测试之前,主管要求你先查阅相关智能座舱语音交互的资料确保自己对其充分了解。任务引入Tasktointroduce01智能语音交互概述02智能语音交互的发展趋势目录
CONTENTS03智能语音交互在驾驶过程中的应用智能语音交互概述PART0101智能语音交互概述车内环境噪声源包含发动机噪声、胎噪、风噪、周围车辆噪声、转向灯噪声以及媒体播放声等,这些噪声源都会减弱人声的信号特征,从而加大语言识别难度。
声音的信号特征提取的质量将直接影响语音识别的准确率。语音增强01智能语音交互概述
语音唤醒是现阶段语音交互的第一入口,通过指定的唤醒词来开启人机交互对话,其技术原理是指在连续语流中实时检测说话人特定语音片段,要求高时效性和低功耗。语音唤醒在技术发展上也经历3个阶段:启蒙阶段新技术探索阶段大规模产业化阶段语音唤醒01智能语音交互概述
语音唤醒
从最初的模板规则到最新基于神经网络的方案。另外,语音唤醒配合语音增强中声源定位技术,可实现车内主副驾、前后排等多音区唤醒。01智能语音交互概述
语音识别是将人的语音内容转成文字,其技术原理如图所示,主要包括两大关键模型,声学模型和语言模型,通过模型训练将提取到的特性进行解码,最终得到识别结果。语音识别01智能语音交互概述
语义理解技术大致包含三个层面:词法分析、句法分析、语义分析。具体来说需要解决自动分词、词性标注、词义消歧、短语结构分析、单复句结构分析、文本分类等问题,最终达到理解人类语言中的因果、逻辑和推理等关系,进而执行语言中包含的指令。语义理解01智能语音交互概述
语音合成是将文字信息转化为可听的声音信息,让机器会说话,其技术原理是将文字序列转换成音韵序列,再用语音合成器生成语音波形。语音合成的方法有共振峰合成、发音规则合成、波形拼接合成和基于HMM参数合成4种。语音合成智能语音交互的发展趋势PART0202智能语音交互的发展趋势
目前,中国在汽车智能化网联方面处于领先水平,这涉及“中国汽车市场规模全球最大”、“中国互联网和移动互联网发展迅速”、“国家政策倾向”和“自主车企进步较大”等众多因素影响。面对重大的机遇与挑战,车联网人机交互作为整个智能化的入口,如何给用户提供最便捷和安全的交互方式,对于其未来的发展至关重要。02智能语音交互的发展趋势
在人机交互方面的升级将会为未来汽车产生革命性的消费体验,车云研究院发布《2020智能汽车趋势洞察及消费者调研报告》。报告提到智能汽车3大体验革命:个性化体验、智能交互体验和车路协同体验,其中智能交互1.0基本围绕功能交互、触控交互和初级语音交互,智能汽车2.0应建立起以人为中心的个性化服务全新体验,多模、主动和情感交互将成为智能交互典型特征。智能语音交互在驾驶过程中的应用PART0303智能语音交互在驾驶过程中的应用
语音交互包含条目式语音命令和自然语音识别两种类型。类别功能通讯拨打电话呼叫后台服务导航开启/关闭导航定位查找路途导航路况查询周边设施查询交互式语音导航辅助驾驶车载空调控制(空调开关、模式和温度调节,风速和风向调节)03智能语音交互在驾驶过程中的应用类别功能辅助驾驶车载空调控制(空调开关、模式和温度调节,风速和风向调节)车载应用控制车身信息查询(油量、胎压、水温等)车身控制(天窗、远光灯、警示灯、后视镜)车载娱乐电台广播搜索音乐播放控制天气和新闻查询
所谓条目式的语音命令,就是系统只能识别一些固定的词组和句子,要想通过语音实现对汽车功能的控制,必须按照功能分级别说出语音指令。1、查阅资料,整车OTA进行了解,并简述其发展。1、各组派代表阐述资料查询结果。2、各组就各自的查询结果进行交流,并分享技巧。随堂讨论独立完成智能座舱语音交互相关资料的查询,并填写教材所示工单。任务实施感谢观看能力模块四
掌握智能座舱中语音交互技术的应用任务二
实现座舱中语音交互技术的应用作为一名智能座舱测试工程师,今天主管要求你测试智能座舱中语音交互是否可以实现,你需要进行一个简单的语音交互的设计与实现,来验证语音交互技术的可行性。任务引入Tasktointroduce01主流的车载语音助手功能认知02NLP技术应用(唤醒、聆听、理解、播报)认知目录
CONTENTS03案例:“你好,小驰!”设计与实现04百度智能云实现语音识别主流的车载语音助手功能认知PART0101主流的车载语音助手功能认知
常见的车载语音助手功能:语音交互功能语音交互功能语音交互功能语音交互功能常见的车载语音助手功能01主流的车载语音助手功能认知语音交互功能主要包括语音识别、语音合成。通过语音交互功能,系统能够通过用户的语音指令,从而实现各应用程序的功能控制。同时,针对接收到的语音指令,系统能够给予用户正确的语音反馈。基于语音识别技术,当车载语音系统接收到用户指令后,系统能够“听懂”人类的语言;基于语音合成技术,系统能够将执行结果通过语音播报的形式反馈给用户。语音交互功能01主流的车载语音助手功能认知相较于打开第三方应用程序的传统方式,用户仅通过全语音交互的形式即可实现信息的自主查询功能,从而在提高系统执行效率的同时,避免了用户注意力的分散,保障了用户的驾驶安全。例如,天气查询:基于“今天天气如何”、“明天深圳会下雨吗”等语音指令,用户可对天气信息执行查询操作。语音查询功能01主流的车载语音助手功能认知娱乐功能是车载语音系统的核心功能,具体包含有本地音乐、在线音乐、本地电台、在线节目四个子功能。例如,针对在线音乐的功能,车载语音系统设计用户的语音指令分为控制指令和搜索指令。用户可通过控制指令实现音乐应用程序的打开、关闭,实现对歌曲播放模式的控制。娱乐功能01主流的车载语音助手功能认知语音控制车辆原有设备,针对车辆内的空调、车窗、天窗等设备,通过采用全语音交互的方式,从而使系统控制更为快捷、便利。相较于传统的触摸屏幕的形式,语音交互不会分散用户的注意力,能够用户的行车安全。语音控制功能NLP技术应用PART0202
NLP技术应用
通过前面的学习,我们知道智能座舱语音交互分为语音交互的唤醒、聆听、理解、播报4个部分。02NLP技术应用设计唤醒状态前需要考虑当前设备采用哪种语音交互方式,还需要考虑该设备使用的是近场语音交互还是远场语音交互。近场语音交互主要是指人距离机器不超过30cm的语音识别技术,像带有智能语音助手的电视遥控器和手机都属于近场语音交互。远场语音交互主要解决人距离机器0.3~5m的语音交互问题。唤醒02NLP技术应用为了营造认真聆听用户说话的效果,设计相应的反馈机制。聆听
我们可以在等待用户响应时,灯光和智能语音助手可以保持一个相对平静的状态,这意味着设备接收不到任何信息。如果智能语音助手是一个人物或动物,则可以通过动作表示正在倾听,在时间达到上限时可以反馈给用户“听不到”的动作。02NLP技术应用
理解又称网络等待状态,因为绝大部分语音交互的识别和处理都是在云端进行的,所以返回语音结果需要一段时间。理解状态必须反馈给用户,因为用户不知道该状态何时才会结束。如果整个语音交互流程需要很长时间才能完成响应,那么系统应该告知用户当前流程出现异常,需要重新发起语音交互流程。理解02NLP技术应用不同产品在处理语音播报状态方面有着不一样的反馈设计。播报
在Echo智能音箱上,Alexa会用蓝色和青色交替表示设备正在播报内容,颜色的交替模拟了Alexa说话时的呼吸节奏。手机/平板电脑上的Siri在播报内容时会将内容显示在屏幕上,同时显示一个球形来告知用户当前无法持续聆听。案例:“你好,小驰!”设计与实现PART0303案例:“你好,小驰!”设计与实现利用snowboy实现snowboy是一个开源的、轻量级语音唤醒引擎,可以通过它很轻松地创建属于自己的类似“hey,Siri”的唤醒词。我们接下来具体实现唤醒功能。
一、安装依赖03案例:“你好,小驰!”设计与实现利用snowboy实现二、获取snowboy源码进行编译
获取源码
拉取源码成功后,进入Python3目录
然后使用make命令开始编译
下载Swig3.0.12的源码包03案例:“你好,小驰!”设计与实现利用snowboy实现二、获取snowboy源码进行编译
解压Swig
安装编译工具
进入Swig源码03案例:“你好,小驰!”设计与实现利用snowboy实现二、获取snowboy源码进行编译
配置
编译
安装03案例:“你好,小驰!”设计与实现利用snowboy实现二、获取snowboy源码进行编译
将swig导入到环境变量,打开bashrc
添加环境
刷新环境
确认版本型号03案例:“你好,小驰!”设计与实现利用snowboy实现三、生成语音模型借助SnowboyPersonalWakeWord()官网生成语音唤醒模型。有如下7个步骤: 1.打开Snowboy网站
03案例:“你好,小驰!”设计与实现利用snowboy实现三、生成语音模型2.点击按钮启动麦克风,如下图所示
03案例:“你好,小驰!”设计与实现利用snowboy实现三、生成语音模型 3.单击“Record”并等待准备就绪
03案例:“你好,小驰!”设计与实现利用snowboy实现三、生成语音模型4.说出唤醒词,你好,小驰。并等待结束,结束后将产生一条语音。
03案例:“你好,小驰!”设计与实现利用snowboy实现三、生成语音模型5.重复步骤4,并直至产生3条语音结束。
03案例:“你好,小驰!”设计与实现利用snowboy实现三、生成语音模型6.输入模型名称,提交音频。
03案例:“你好,小驰!”设计与实现利用snowboy实现三、生成语音模型 7.下载模型。
03案例:“你好,小驰!”设计与实现利用snowboy实现
四、部署模型
下载好的模型文件放入到snowboy/examples/Python3/文件中。
五、在命令行中输入:python3demo.py模型名字.pmdl并使用自己的唤醒词进行测试。
03案例:“你好,小驰!”设计与实现API的概念早在20世纪60年代就已经出现,其代表的是应用程序的编程接口,是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。换句话说,API是一个信使,它将用户的请求交付给用户所请求的提供者,然后将响应交付给用户。使用第三方API的好处如下:降低开发周期和开发成本,减少了产品的推广成本,使得自己的服务被第三方依赖。借助第三方API实现03案例:“你好,小驰!”设计与实现借助第三方API实现一、在控制台下载对应sdk 1.在浏览器打开开放平台-以语音交互为核心的人工智能开放平台(),登录控制台。03案例:“你好,小驰!”设计与实现借助第三方API实现一、在控制台下载对应sdk 2.创建应用控制台-讯飞开放平台(),如下图所示:03案例:“你好,小驰!”设计与实现借助第三方API实现一、在控制台下载对应sdk 3.点击应用,选择语音唤醒服务,如图所示。03案例:“你好,小驰!”设计与实现借助第三方API实现一、在控制台下载对应sdk 4.设置唤醒词,我以“你好,小驰”为例,如图所示。03案例:“你好,小驰!”设计与实现借助第三方API实现一、在控制台下载对应sdk 5.下载SDK,我选择Linux为例,如下图所示:03案例:“你好,小驰!”设计与实现借助第三方API实现
二、设置音频文件
将音频文件(要求16k,16bit,pcm格式)放入bin/audio目录下,并将音频命名为awake.pcm 三、选择sdk文件
进入sdk内samples/awaken_offline_sample目录,选择source64bit_make.sh或32bit_make.sh,视系统位数选择 四、查看结果
运行成功后进入sd
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纤维支气管镜肺泡灌洗治疗小儿重症肺炎的临床效果观察
- 驾校安全协议书(2篇)
- 宁波十校2025届高三3月联考地理试卷(含答案)
- 暑假去旅游创意画
- 2025年热敏型CTP版项目合作计划书
- 2025年关于小马过河标准教案
- 腰椎结核术中护理查房
- 2025年《机电工程管理与实务》考试备考宝典:基础知识点库与典型试题
- 2025年护士执业资格考试题库:护理教育与培训护理外科护理历年真题及解析
- 2025年小学教师资格《综合素质》教育资源整合试卷含答案分析
- 2024年浙江长征职业技术学院招聘笔试真题
- 文明交通知识培训课件
- 2025年台州职业技术学院单招职业倾向性考试题库1套
- T-SSFSIDC 021-2024 认股权综合服务工作准则
- 2025年亳州职业技术学院单招职业适应性测试题库完整
- 2025年公立医院与心理咨询机构合作协议
- 2025年南京城市职业学院单招职业技能测试题库完整版
- (统编版)2025年小升初语文模拟考试卷(附带答案)
- 2024年广东省中考数学试卷(附答案)
- 旅行社安全管理培训
- DB65T 8024-2024 建筑用室外气象参数标准
评论
0/150
提交评论