一个内嵌FPGA硬件加速器的低价语音识别平台_第1页
一个内嵌FPGA硬件加速器的低价语音识别平台_第2页
一个内嵌FPGA硬件加速器的低价语音识别平台_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一个内嵌FPGA硬件加速器的低价语音识别平台与机器进行语言交谈,让它听明白你在说什么,语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比机器的听觉系统,该技术让机器可以通过识别和理解,把语音信号转变为相应的文本或命令。自1952年贝尔实验室研制出世界上第一个能识别10个英文数字发音的实验系统,到如今,语音识别技术有了突破性的发展,不再局限于识别孤立词的识别,现在,可以实现连续的多语言的实时识别。在现实生活中,语音识别的产品也已经变得十分普遍,比如iPhone手机自带的Srir应用软件,google基于安卓系统开发的googleNow以及百度语音和微软开发的十分调皮的Cortana语音识别软件。不过,目前市场上流行的都是软件实现的语音识别,下面将介绍一款基于FPGA实现的可应用于语言识别板卡。MATRIXVoice语音识别平台:在Indiegogo项目筹资只剩下一个月的时候,MATRIXVoice开源语音平台的筹款已经超出其预期目标$5000达到预期的289%。MATRIXVoice是弗罗里达迈阿密MATRIX发起的第三个众筹项目,实际上MATRIXVoice平台是一个只有3.14英寸的环形电路板,但是此电路板不仅兼容最新的语言库而且可以实时进行连续的语言识别,还得到多家云端语言服务的认可,包括微软的识别服务器,亚马逊的Alexa语音服务,谷歌的语音API以及Wit的ai和Houndify。就结构而言,MAXTRIXVoice是基于Xilinx的Spartan-6LX4FPGA实现的,其设计外形可以作为一个器件直插到一个低功耗的RaspberryPi的单板机上,也可以作为一个独立的板卡使用。下面两张图分别显示MATRIXVoice的顶层和底层版面视图:图1MATRIXVoicetopview

图2MATRIXVoicebottomview从上面的图片中可以看到,MATRIXVoice板卡的背面有七个MEMS麦克风,七个REG多色LED,同时Spartan-6FPGA芯片也在前面板上,在AMTRIXVoice的背面,有一个64Mbit的SDRAM和一组可以兼容Raspberrypi单板机的I/O接口。由于这是MATRIX实现系列开发板中的最新版,所以,针对MATRIXVoice板卡已经有具备比较复杂的分层的软件堆支持,包括一个为透明化FPGA代码的HAL(硬件抽象层)和一个C++函数库,还有以一个介于视频流接口和视觉库(主要是RaspberryPi摄像头)之间的中间层,此外,还为MATRIXVoice顶层提供了MATRIX操作系统和高层API接口。同时,在基于MATRIXVoice开发的时候,用户可以根据自己习惯选择喜欢的语言,主要是因为MATRIXVoice软件库支持比较多的语言,包括主流的C++、Python、JavaScript以及硬件人员常用的Verilog和VHDL语言。下图可以看到MATRIXVoice平台的软件开发层次:图3Softwarelayerview总结:现在,科创众筹项目已经越来越普遍,基于FPGA开发功能更强灵活性更大的前沿应用是一个十分好的点子,不仅使得产品具有更自由丰富的接口,还可以自由加入有针对性的加速器模块,使得最

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论