计算机课堂教学论文计算机辅助教学论文基于SAPI的远程智能语_第1页
计算机课堂教学论文计算机辅助教学论文基于SAPI的远程智能语_第2页
计算机课堂教学论文计算机辅助教学论文基于SAPI的远程智能语_第3页
计算机课堂教学论文计算机辅助教学论文基于SAPI的远程智能语_第4页
计算机课堂教学论文计算机辅助教学论文基于SAPI的远程智能语_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 计算机课堂教学论文计算机辅助教学论文:基于SAPI的远程智能语音控制系统开发【摘要】基于SAPI语音开发平台,无线传输使用FM收发方式,实现了通过语音对计算机上PowerPoint软件进行无线远程语音控制的功能,传输距离可以达到普通教室使用的要求。系统可用于教师在课堂上的多媒体教学,具有很好的通用性、扩展性和良好的应用前景。【关键词】语音识别;SAPI语音开发平台;无线传输;语音控制0引言随着计算机技术的快速发展,在与计算机的交互过程中,人们越来越需要一种自然、方便的方式。语言是人类交流信息最有效、自然和方便的手段。从20世纪90年代开始语音识别技术从实验室走向实用,特别是IBM推出的Via

2、Voice语音系统和微软推出Speech SDK平台之后,为研究者提供了一个语音识别和合成的二次开发平台,使人类与计算机用语言进行交流变得更加容易。随着计算机的普及,现在很多学校的教室都安装了多媒体设备,可以计算机控制多媒体。这样虽然在一定程度上方便了教师的课堂教学,但是却使教师与学生之间的课堂互动受到很大程度的限制。由于语言是人类交流最自然、直接和快速的方式,通过简单的语音指令对多媒体设备进行操作将会给教学带来更大的便利。本文基于SAPI语音开发平台,采用FM收发方式,实现了通过语音对计算机上PowerPoint软件进行无线远程语音控制的功能,传输距离可以达到普通教室使用的要求。下面详细阐述

3、这套无线语音控制系统。1基于SAPI的语音识别微软的Speech SDK是基于COM的视窗操作系统开发工具包。这个SDK中含有语音应用程序接口(SAPI)、微软连续语音识别引擎(MCSR)以及串联语音合成(又称文本到语音)引擎(TTS)等等,其结构如图1所示。SAPI中还包括对于低层控制和高度适应性的直接语音管理、训练向导、事件、语法、编译、资源、语音识别管理以及文本到语音管理。鉴于SDK的中文包对中文识别的支持以及其非特定人语音识别功能的良好实现,本系统的语音识别部分便基于此开发包进行开发,其中语音信号的输入可以直接采用计算机的声卡音频输入接口即可,方便了系统设计。关于SAPI及其使用的的详

4、细阐述可以参考123,在此不再赘述。2 FM无线传输为了用于课堂教学,需要在一定距离内实现无线传输。考虑到语音信号对采集频率以及传输速度的要求,再加上成本的考虑,选择简单成熟的FM无线传输方式,考虑到很多课堂已经配备有相应的扩音用的无线麦克设备,并且市场上这种产品已经相当成熟,所以没有再进行重新设计,而是采用了罗斯通电子集团的新世纪WR-601无线麦克产品,并配备上6.5mm转3.5mm转接头,可以直接用于计算机的声卡音频输入,传输距离大约十几米左右,基本可以达到课堂教学的要求,同时其他型号的无线麦克也配备上转接头后也都可以直接使用,从而更加方便。3对PowerPoint软件的语音控制语音识别

5、出不同的语音指令后,需要根据相应的指令对PowerPoint进行控制,其中包括幻灯片的打开、放映和关闭等多种操作。Microsoft的Office产品中,提供了OLE Automation自动化程序的接口,OLE自动化是一种应用程序使用的工业标准,它提供了从应用程序外创建和管理应用程序的方法,也就是说允许应用程序对象将属性和操作自动暴露,其它程序可以使用这些属性和操作来完成相应功能。可以通过VC+编写的外部程序来实现PowerPoint中常用的操作。考虑到系统仅仅是对语音命令的识别与根据命令进行控制,所以软件去繁从简,编写成基于对话框的应用程序。关于VC对Office进行控制的详细阐述可以参考

6、456,在此不再阐述。4系统结构框图及部分程序4.1系统结构框图4.2语音命令识别void CSapiTestDlg:OnRecord(WPARAM wParam,LPARAM lParam)USES_CONVERSION;/字符转换(ASSIC<->Unicode)CSpEvent event;HRESULT hr=S_OK;if(m_cpRecoCtxt)CComPtr<ISpRecoResult>cpResult;CSpDynamicString dstrText;CString strResult;while(event.GetFrom(m_cpRecoCtxt

7、)=S_OK)switch(event.eEventId)Case SPEI_FALSE_RECOGNITION:/如果没有识别成功,则忽略break;case SPEI_RECOGNITION:/成功识别,获得结果cpResult=event.RecoResult();cpResult->GetText (SP_GETWHOLEPHRASESP_GETWHOLEPHRASE,TRUE,&dstrText,NULL);strResult=W2T(dstrText); /省略根据语音命令进行控制的部分程序break;4.3语法规则文件(CmdCtrl.xml):<GRAMMA

8、R LANGID="804"><DEFINE><ID NAME="CMD"VAL="10"/></DEFINE><RULENAME="COMMAND"ID="CMD"TOPLEVEL="ACTIVE"><L><P>退出</P><P>启动幻灯片</P><P>退出幻灯片</P>(省略其他指令)</L></RULE><

9、;/GRAMMAR>5程序运行及现场测试为了验证系统的功能,在学校的普通多媒体教室对本系统进行了测试,选择了不同性别的十个测试对象,对预置的所有语音命令进行语音命令测试,结果在无线装置的距离范围(十五米)内,准确识别并控制成功率在85%以上,基本达到普通课堂使用的要求。6结束语本系统基于SAPI语音开发平台,在VC开发环境下,利用FM的无线收发方式,实现了无线远程对计算机进行语音控制的功能。由于这种远程语音识别装置可以应用于很多工业控制以及日常生活领域中,并且对计算机的控制不限于简单的对Office软件的控制,所以可以实现更复杂的控制,具有很强的通用性和可扩展性。【参考文献】1肖玮.使用SAPI实现语音识别和合成J.现代计算机,2005,(2):91-94.2李禹材,左友东.基于Speech SDK的语音控制应用程序的设计与实现J.计算机应用,2006,(6):114-116.3Microsoft Speech SDK5.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论