语音控制无人机初探_第1页
语音控制无人机初探_第2页
语音控制无人机初探_第3页
语音控制无人机初探_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、    语音控制无人机初探    朱立鑫 崔韫鑫摘要:随着无人机技术的迅猛发展,控制无人机的方式也在不断革新。研究在开源地面站上实现无人机语音指令控制技术,可使操作更加便捷。通过简洁、友好的语音界面就可与控制系统进行深入信息交互,完成语音指令所代表复杂控制内容。由于本文仅为语音控制无人机初探,主要介绍通过特定的一种方式实现语音控制。本文以开源地面站mission planner作为基础进行软件开发,利用windows自带的语音识别模块进行识别及其在无人机控制中的应用为研究内容,借此来简化无人机控制流程、提供一种简洁的语音指令控制界面,重点研究了语音识别技

2、术在无人机控制上的应用。关键词:语音识别;无人机;地面站语音识别技术是一种人机交互技术。语言作为信息沟通的最主要方式,可为人机交互使用时提供其它方式不可替代的直接和便利。因此,将语音识别这种人机交互手段应用于无人机控制方面,可以为操作人员提供一种简便的语音指令控制界面,使操作更加便捷。一、语音控制无人机研究现状2001年,美国斯坦福大学研制出witas多模态对话系统用于控制无人机设备。随后,语音控制技术高速发展。目前,我国民用无人机领域内,语音控制无人机已成为下一发展阶段。二、语音控制无人机总体设计本人主要从三个方面介绍语音控制无人机,即语音识别技术、指令控制及地面站软件开发。三、无人机语音识

3、别技术本文主要介绍通过使用c#和speech sdk来进行语音识别。本文介绍的语音识别功能,其实就是利用windows的语音引擎,它包含在speech sdk开发包中。我们就是使用此开发包根据自己的需要开发程序。speech sdk包含语音识别sr引擎和语音合成ss引擎两种语音引擎。语音识别引擎用于识别语音命令,调用接口完成某个功能,实现语音控制。语音合成引擎用于将文字转换成语音输出。语音识别引擎分两种模式识别:文本识别模式和命令识别模式。此两种模式的主要区别在于识别过程中使用的匹配字典不同。前者使用的是通用字典,特点是覆盖的词汇量大,因为词汇量大直接导致识别的精度降低,识别速度较慢。后者的字

4、典需要开发者自己编写,这种方式由开发者定义词汇的数量,大大降低匹配过程中需要检索的词汇量,提高了识别速度,同时因为候选项极少,所以一般不会识别错误。由于控制无人机飞行仅需要几个特定的指令,而且对识别率要求较高,所以选用命令识别模式进行语音识别开发。四、无人机飞行协议及控制指令(一)mavlink简介mavlink协议是在串口通讯基础上的一种更高层的开源通讯协议,主要应用在微型飞行器(micro aerial vehicle)的通讯上。mavlink是为小型飞行器和地面站通讯时常常用到的那些数据制定一种发送和接收的规则并加入了校验(checksum)功能。如图所示,每个消息帧都是上述的结构,除了

5、灰色外,其他的格子都代表了一个字节的数据。灰色格子里面的数据长度是不固定的。红色的是起始标志位(stx)。这个标志位用于mavlink消息帧接收端进行消息解码。第二个格子代表的是payload的字节长度(len),范围从0255。第三个格子代表的是本次消息帧的序号(seq),每次发完一个消息,这个字节的内容会加1,加到255后会从0重新开始。这个序号用于mavlink消息帧接收端计算消息丢失比例。第四个格子代表发送本条消息帧的设备的系统编号(sys)。第五个格子代表了发送本条消息帧的设备的单元编号(comp)。第六个格子代表了有效载荷中消息包的编号(msg),mavlink消息帧接收端根据这个

6、编号来确定有效载荷里的消息包并根据编号选择对应的方式来处理有效载荷里的信息包。最后两个字节是16位校验位,ckb是高八位,cka是低八位。校验码由crc16算法得到。(二)地面站和飞控的通讯流程无人机连接好mp地面站后,都会主动向地面站发送心跳包、飞行器姿态、系统状态等组成的数据流。地面站会在刚连接上飞控时发送命令,请求飞控传回所有参数,飞控根据自己的情况判断是否接受地面站的请求,并根据不同的命令执行相应的操作。mp地面站比较成熟,在软件内已经预设了无人机飞行所需的各种指令。这些指令通过mavlink协议传递给飞控,从而实现对无人机的控制。我们只需在地面站中找到这些指令,将语音识别结果与这些指

7、令相对应就可以实现对无人机的语音控制。五、地面站软件开发mission planner是一个功能齐全的开源地面站应用程序。本人在此软件的基础上进行二次开发,加入语音识别模块,将识别结果与无人机飞行命令相对应,从而实现对无人机的语音控制。实现语音控制用到的mp地面站内的飞行指令,主要是导航命令。导航命令是用于控制无人机的运动,包括起飞、航路点和移动至周围和着陆。本人用到的导航命令:mav_cmd_nav_takeoff:从地面起飞(发射)。实现“起飞”指令。mav_cmd_nav_return_to_launch:返回home位置或就近的集结点。home的位置是飞行器解锁位置。实现“返航”指令。mav_cmd_nav_land:在当前或指定位置降落。实现“降落”指令。mav_cmd_nav_guided_enable:启用引导控制模式切换到外部控制器。在guided模式下,在预先建立的三维坐标系中,引导无人机在空间中实现“前进”、“后退”、“向左”、“向右”、“上升”、“下降”等指令。六、总结本文以开源地面站mission planner作为基础进行软件开发,利用windows自带的语音识别模块进行识别及其在无人机控制中的应用为研究内容,借此简化无人机控制流程、提供一种简洁的语音指令控制界面,实现了语音控制无人机功能。本文仅为语音控制无人机初探,主要介绍通过特

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论