版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、0 / 63 题 目 基于单片机的语音控制开关设计学生 朱朱 楠楠学号 11130240501113024050 所在学院物物 理理 与与 电电 信信 工工 程程 学学 院院专业班级通通 信信 工工 程程 专专 业业 1102 班班 指导教师 争争 兵兵 完成地点物物 理理 与与 电电 信信 工工 程程 学学 院院 实实 验验 室室20152015 年年 6 6 月月 0303 日日1 / 63毕业论文设计任务书院(系) 物理与电信工程学院 专业班级 通信 1102 学生 朱楠 一、毕业论文设计题目基于单片机的语音控制开关设计 二、毕业论文设计工作自_2015 _年_ 1_月_10_日 起至_
2、2015_年 6 月_ 10 日止三、毕业论文设计进行地点: 物理与电信工程学院实验室 四、毕业论文设计的容要求:智能家居作为一个新生产业,目前处于一个导入期与成长期的临界点,随着智能家居市场推广普与的进一步落实,培育起消费者的使用习惯,智能家居市场的消费潜力必然是巨大的,产业前景光明。本课题设计语音智能控制开关,具体要求如下: 1. 掌握语音识别的工作原理,使用语音识别芯片完成硬件设计; 2能实现语音控制开关的开启和关闭; 3. 系统集成,焊接电路板,调试。 成果形式:实验样机一套。 毕业设计进度安排: 1.103.20:查阅资料(参考文献不少于 10 篇),进行方案论证,完成开题报告。完成
3、不少于 3000 字的外文翻译; 3.204.30:设计硬件电路,编写相关软件、完成电路仿真与样机调试; 5.15.20:完善系统调试,撰写论文,准备毕业设计验收等工作; 5.21-6.10:整理资料,修改论文,准备毕业答辩。 指 导 教 师系 (教 研 室) 通 信 教 研 室 系(教研室)主任签名批准日期接受论文 (设计)任务开始执行日期学生签名 / 63基于单片机的语音智能开关设计基于单片机的语音智能开关设计朱楠(理工学院物理与电信工程学院通信 1102 班, 723003)指导教师:争兵 摘摘 要要 语音识别是解决机器“听懂”人类语言的一项技术。随着语音识别理论研究的深入和数字信号处理
4、软、硬件技术的发展,语音识别技术应用的研究越来越受到人们的关注。智能语音家电控制系统实质上就是一个替代传统手动开关的受声控制的电子开关。此系统以STC11L08XE和LD3320语音芯片为硬件核心,对语音芯片LD3320的信息进行处理,并对开关进行控制,通过LD3320外界的麦克风采集声音信号,再通过LD3320语音芯片进行频谱分析,在提取语音特征,之后和关键词语列表中的关键词进行对比匹配,最后找出得分最高的关键词作为识别结果输出给单片机,单片机进行处理后,再输出信号来控制继电器,再通过继电器来控制开关工作,开关又可实现对电器的控制。语音芯片的功能都是通过单片机控制实现的。最终实现对智能语音开
5、关的控制 关关 键键 词词 STC11L08XE 单片机 语音芯片 LD3320 语音识别 I / 63 DesignDesign ofof intelligentintelligent voicevoice switchswitch basedbased onon MCUMCUZhu nan(Grade11,Class2,Major of Communication Engineering,School of Physics and telecommunication Engineering of Shaanxi University of Technology, Hanzhong 7230
6、03,China)Tutor:Zheng Zheng bingAbstractAbstract:Speech recognition is a technology to solve the machine to understand human language. Along with the research of speech recognition theory and the development of digital signal processing software and hardware technology, The research on the applicatio
7、n of speech recognition technology is getting more and more attention.The intelligent speech appliance control system is essentially an electronic switch which replaces the traditional acoustic control with the manual switch. This system LD3320 voice chip and the stc11l08xe as hardware core and the
8、voice chip ld3320 information for processing, and control the switch, through ld3320 external microphone audio signal acquisition, and then through the ld3320 voice chip spectrum analysis, key words in speech feature extraction, and the list of key words contrast matching, finally to find the highes
9、t score of the words as recognition results output to the MCU, MCU processing, then the output signal to control the relay, then through the relay to control of the switch, the switch can be to achieve control of the electric appliances. The function of the speech chip is realized by the MCU control
10、. Control of the intelligent speech switch is realized finally.KeyKey wordswords : : STC11L08XEMCU LD3320 voice chipSpeech recognition II / 63III / 63目录目录1 绪论 .11.1 选题的目的与研究意义 11.2 选题的发展现状和趋势 11.4 设计的目的和任务.32 系统方案选择和论证 .42.1 设计要求.42.2 方案选择和论证.42.3 最佳主体方案.53 硬件设计与实现 .63.1 单片机电路设计.63.2 语音控制部分 .83.3 复位
11、电路 113.4 时钟电路.123.5 继电器电路概述 133.6 电路连接总图 144 软件设计 .154.1LD3320 的软件编程 154.2 寄存器的操作 164.3 寄存器功能简介 184.4 芯片关键字的设置 194.5 语音开关源程序 194.6stc 单片机 PC 端下载 215 实物的制作和调试 225.1PCB 板制图步骤 22IV / 635.2 硬件电路板的制作 225.3 系统调试.23总 结 .24致 .25参考文献 .26附录 A 外文翻译 27附录 C 源程序 .41附录 D 元器件清单 .54附录 E 实物图 550 / 631 1 绪论绪论1.11.1 选题
12、的目的与研究意义选题的目的与研究意义智能家居作为一项新开发的项目,目前处于一个导入期与成长期的临界点,目前智能家居市场已逐步形成,培养起消费者的消费习惯,智能家居市场有着不可估量的产业前景,所以,国外很逗企业已经把市场转向智能家居这个方向,特别是对企业发展环境和客户需求趋势的深入研究,一大批优秀的智能家居品牌迅速崛起,逐渐成为智能家居中的翘楚,在日常家居生活中,为了使我们对家庭的控制系统能随时掌控,需要的信息随时获取,操作的终端形式非常重要,多种形式的操作终端是必不可少的。语音智能家居控制是智能家居中很重要的部课题主要研究容。机器进行语音交流,让机器明白人类语言,从而可以通过语音控制机器,是人
13、类一直研究的课题。语音识别就如同机器的听觉系统。语音识别就是让机器通过语音识别和理解从而把语音信号转变为相应的文字或命令的高技术。近二十年来,语音识别技术取得革命性的进步,开始走进我们生活的方方面面。人们预计,未来 10 年,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为 1997年计算机发展十件大事之一。很多专家都认为语音识别技术是 2000 年至 2020 年间信息技术领域十大重要的科技发展之一。 语音识别的大概过程依据在实际中的不同作用,语音识别系统可以分为:特定人与非特定人的识别、独立词与连续词的识别
14、、小词汇量与大词汇量以与无限词汇量的识别。但是任何一个语音识别系统,它的理论基础和处理步骤都基本一致。语音识别过程主要包括语音信号的预处理、特征提取、模式匹配几个部分。预处理包括预滤波、采样和量化、加窗、端点检测、预加重等过程。语音信号识别必不可缺的一步就是特征参数提取。提取的特征参数需要达到以下要求:(1)提取的特征参数可以很好的表现出它自身的特征,比较容易区分;(2)各阶参数之间有都有各自良好的区分特征;特征参数要计算方便,使用效率高的算法,是语音有所保证。在训练的时候,将特征参数进行稍微的加工后,为每种词条录入一个特征模型,保存为模板库。在识别阶段,语音信号经过同一个通道得到语音特征参数
15、,得到测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为语音输出的结果。同时,还可以在很多先验知识的帮助下,提高识别的准确率。(1)语音特征提取:是为了从语音波形中得到随时间变化的语音特征序列;(2)声学模型与模式匹配(识别算法):声学模型一般情况下将获得的语音特征通过学习算法获取。在识别时通过对输入的语音特征同声学模式的匹配比较,得到最准确的识别结果;(3)语言模型与语言处理:语言模型涵盖了由语音识别指令组成的语法网络或由统计方法组成的语言模型,语言处理可以完成语法、语义分析,对小词表语音识别系统,通常语言处理部分可以省略。 声学模型作为语音识别系统的底层模型,并且是语音识别系统中最
16、不可或缺的一部分。声学模型是为了是提供一种快捷的办法计算语言的特征矢量序列与每个发音模板之间的距离。声学模板的设计和语言发音特点密切相关,声学模型单元大小(字发音模型、半音节模型、因素模型)对语音训练数据量的多少、系统识别率,包括灵活性都会产生很大的作用。必须依据不同的语言特征、识别系统词汇量的大小决定识别单元的大小。语言模型中对中、大词汇量的语言识别系统相当重要。当分类有错误时就能依据语言模型、语法结构、语义学进行纠错,尤其是一些同音字必须经过全文结构才可以肯定词义,语言学理论涵盖语义结构、语法结构、语言的数学模型等全方位。现在相对成功的语言模型一般使用统计语法的语言模型和基于规则法结构命令
17、语言模型。语法结构可以限定不同词之间的相互连接关系,减少识别系统的搜索空间。这有利于提高系统识别。1.21.2 选题的发展现状和趋势选题的发展现状和趋势1 / 631952 年贝尔研究所 Davis 等人研发出了全球上第一个可以识别 10 个英文字母发音的实验系统。1960 年英国的 Denes 等人研发出了人类第一个计算机语音识别系统。大量的的语音识别研究是进入了 70 年代后,小词汇量、孤立词的识别方面取得了很大的突破展。到了 80 年代以后,研究的方向开始向大词汇量转变。非特定人连续语音识别,在研究方法上也产生了翻天覆地的变化,也就是说传统的基于标准模板匹配的技术思路转变成基于统计模板(
18、HMM)的技术方法。此外,再次提出了将神经网络技术引入语音识别问题的技术方法。进入 90 年代,语音识别的系统框架方向发展缓慢处于低谷。不过,语音识别技术的应用与产品化发展很是迅速。DARPA(Defense Advanced Research Projects Agency)这一个 10 年计划是由由美国国防远景研究计划局资助的,它的重要意义是鼓励语言理解系统的研发;到了 80 年代,美国国防部远景研究计划局又一次出资赞助一项为期 10 年的 DARPA 的项目,它涵盖了噪声下的语音识别和会话(口语)识别系统,识别任务设定为 “(1000 单词)连续语音数据库管理”;到了 90 年代,这一
19、DARPA 计划仍然在持续进行中。其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。从此中国进入了一个前所未有的发展阶段。语音作为人机对话的最高手段,使人机对话向人-”人”对话的终端目标发展,它在形式是人机对话的一个新突破,语音的对话方式可使人机界面从数字领域进入语音领域。不过,与真正意义上的完全语音模糊参数的人机对话模式的实现还差很多,这中间还有重大的技术领域需要突破,不过,可以肯定的是伴随着语音识别,语音合成,信息综合,网络通信等许多技术的攻克和发展,人类这一梦寐以求的梦想的一定会在不远的将来实现,它的前景是一片光明璀璨和无限美妙,目前,主流的大词汇量语音识
20、别系统采用统计识别技术。 典型的基于在计模式识别方法的语音识别系统由以下几个基本模块所构成:(1)信号处理与特征提取模块。这个人模块的作用是是从输入信号中提取特征,提供给声学模型进行分析。而且,这个模块通常涵盖一些信号处理技术,用来降低降低环境噪声、环境、录音者等外界因素对特征形成的干扰。(2)统计声学模型。典型系统多采用基于一阶隐马尔科夫模型进行建模。(3)发音词典。发音词典涵盖了系统所能分析的词汇集与它们的发音。发音词典在本质上为声学建模单元与语言模型建模单元间提供了映射。(4)语言模型。 语音模型针对系统所针对的语言进行建模,理论上,包括正则语言,和全文无关文包括在里面的的全部模型都能做
21、成为语言模型,不过现在各种系统普遍采用的还是基于统计的 N 元文法与其变体。(5)解码器。语音识别系统的核心就是解码器,它的作用是是对输入的信号,根据声学,语言模型和词典找出可以以最大几率输出这个信号的词串。1.31.3 选题的应用领域选题的应用领域(1)通信的语音拨号。特别是中高档上,现已普遍的具有语言拨号功能,随着语音芯片的价格降低,普通也将具备语音拨号的功能。(2)汽车的语音控制,由于汽车在行驶过程中,驾驶员必须要用手安全驾驶,因此如果在汽车上需要使用手机,就一定要使用有语音拨号功能的免提语音通信方式。而且,对汽车的卫星导航定位系统的操作、以与车其他功能的操作同样使用语音实现控制。(3)
22、工业控制与医疗领域。操作人员在忙的时候,还有其他情况同样需要处理时,比较好的犯法就是增加一个人与机器的语言交互界面,操作人员通过语音对机器发出操作命令,机器可以使用语音做出回应。(4)个人数字助理。个人数字助理的语音交互界面,PDA 的体积非常小,人机界面始终是它应用和技术的困难之一,因为 PDA 上使用键盘是特别麻烦的,因此,现在通常使用手写体识别的办法录入和搜索信息。不过,用户依然感觉这些办法很麻烦。目前业界普遍认为,PDA 的最佳人机交换界面是通过语音作为传输媒介的交互放方法,并且已有很少量使用。面对语音识别技术的高速发展,可以预见,在不远的未来来语音会成为 PDA 不可缺少的人机交互界
23、面。2 / 63(5)智能玩具。我们可以使用语音识别技术和智能娃娃交流,也能使用语音对玩具发出指令,让它去做一点可行的任务,也能生产出可以带有语音锁功能的电子看门狗,智能玩具有不可估量的市场价值,它的关键之处就是要减少语音芯片的价格。(6)家电遥控。我们可以用语音控制家里的电视机、VCD、空调、电扇、窗帘,我们仅仅使用一个语音遥控器就能控制把家中所有的的电器,这样,就能让让琳琅满目的电器的控制变的非常容易了。1.41.4 设计的目的和任务设计的目的和任务1.4.1 设计目的: (1) 掌握语音识别的工作原理,使用语音识别芯片完成硬件设计; (2) 能实现语音控制开关的开启和关闭; (3) 系统
24、集成,焊接电路板,调试。1.4.2 设计任务:(1)具有语音控制功能;(2)完成接口电路的设计,完成控制程序的编写;(3)设计硬件电路,编写相关软件、完成电路仿真与样机调试。2 2 系统方案选择和论证系统方案选择和论证2.12.1 设计要求设计要求智能家居作为一个新生产业,目前处于一个导入期与成长期的临界点,随着智能家居市场推广普与的进一步落实,培育起消费者的使用习惯,智能家居市场的消费潜力必然是巨大的,产业前景光明,因此设计一种语音智能开关灯,要求具有语音控制模块和单片机控制系统,可以实现语音控制,方便了人们的生活,实现了智能家居。2.22.2 方案选择和论证方案选择和论证整个智能开关系统电
25、路可分为六大部分:STC11L08XE 单片机、电源、语音识别系统、复位电路、时钟电路组成。下图是一个构件图,它可以用来说明本系统的体系结构。电源复位电路时钟电路开关电路语音识别芯模块单片机3 / 63图 2.1 整体系统框图 2.2.12.2.1 主控芯片的选择说明主控芯片的选择说明 现在市面上单片机的种类比较多,每种单片机都有自己的优缺点,STC 系列单片机是由宏晶科技公司研发的增强型核单片机,相对于传统的 8051 核单片机,在片资源、性能以与工作速度上都有很大的改善,尤其采用了基于 Flash 的在线系统(ISP)技术,而且,STC11L08XE 可在系统编程,不需要专用的编程器,也不
26、需要专用的仿真,使得单片的应用系统开发变得简单。还可以选择使用部 RC 振荡电路还是外部晶振电路时钟。掉地模式可由部掉电唤醒也可用定时器唤醒,也可由外部中断断口中断唤醒,因为 INT/RXT 支持下降沿中断,所以它也支持远程通信唤醒。2.2.22.2.2 语音芯片的选择语音芯片的选择LD3320 是一颗由 ICRouat 公司生产的基于非特定人语音识别(SI-ASR,Speaker Independent Automatic Speech Recognition)技术的语音识别/声控芯片。该芯片集成了语音处理器和一些外部电路,包括 AD、DA 转换、麦克风接口、声音输出接口等, LD3320
27、芯片是一款“语音识别”专用芯片。它置有非特定语音识别的 DSP 算法,支持动态添加 50 条识别指令,该芯片注重节能和高效因此无需外挂其他辅助器件,单一芯片即可完成语音识别。它只需要一个 MCU 与其并行,写入识别短语,就可以对其进行语音控制。并且关键词列表是可以任意编辑的所谓的非特定语音输入指的就是针对不同音色音调的的人,不需要对其进行语音训练,即使不同年龄不同性别的人,只要说出同一个设定的词语,它都可以识别。识别准确率高达95%。2.2.32.2.3 继电器模块的选择说明继电器模块的选择说明继电器是我们生活中常用的一种控制设备,通俗的意义上来说就是开关,在特定的条件下打开或者关闭。继电器的
28、开关特性在很多的控制系统特别是在离散的控制系统中得到非常广泛的使用。从其他方面来说,因为一些其他用途设计使用的电子电路,最后多少都可能会和其他机械设备相交互,因此继电器也可以作为电子设备和机械设备的接口。本设计方案中只要是用单片机来实现对开关的控制,由于语音芯片和单片机的控制电压都为3.3V,所以触发电平必须是 3.3V,设计初衷是应用到智能家居这一方面,所以选用交流继电器,SRS-05VDC-SL 是一款可以任意选择高电平或低电平触发的 5V 继电器。由于继电器得出发电压为5V,而语音芯片提供的输出电压为 3.3V,所以在输出端架三极管 NPN 做电压的放大。可控制交流250V/3A,直流
29、30V/3A,完全可以满足此次设计任务的要求,故开关模块就选用 SRS-05VDC-SL 继电器对开关进行控制。2.32.3 最佳主体方案最佳主体方案 本课题设计语音智能开关采用了以单片机为语音智能控制开关的核心部件件,对语音芯片LD3320 的信息进行处理,并对开关进行控制,通过 LD3320 外界的麦克风采集声音信号,再通过LD3320 语音芯片进行频谱分析,在提取语音特征,之后和关键词语列表中的关键词进行对比匹配,最后找出得分最高的关键词作为识别结果输出给单片机,单片机进行处理后,再输出信号来控制继电器,再通过继电器来控制开关工作,开关又可实现很多对电器的控制,从而实现语音智能控制,整个
30、系统硬件设计合理软件设计可行,测试可表明,在环境背景的噪声不是太大,控制者发音不模糊的前提下,语音控制开关的语音语音识别系统能对语音指令做出智能反应,实现了预想中的功能。4 / 633 3 硬件设计与实现硬件设计与实现本系统硬件系统主要由电源语音识别系统,复位电路,单片机,时钟电路组成。通过麦克风把语音信号收集进来,进行 A/D 转换,并能对声音进行识别,控制继电器输出实现电器开关功能,通过对声音指令的识别,来产生控制信号,以控制外继电器的终端,以此来控制外部开关的动作。3.13.1 单片机电路设计单片机电路设计3.1.23.1.2 部结构部结构STC11L08XE 具有 44 个引脚,其封装
31、为 LQF44。的部结构如图 3.1 所示,包含以下几个方面一个八位微处理器 CPU片数据存储器 RAM 和特殊功能寄存器 SFR片程序存储器 ROM两个定时/计时器 T0,T1,可用作定时器,也可用作对外脉冲进行 四个八位可编程的并行 I/O 端口,每个端口即可做输入也可作输出一个串行端口,用做数据的串行通信中断系统时钟电路时时钟钟电电路路定定时时/ /计计数数器器R RO OM MS SF FR R和和R RA AM MC CP PU U系系统统总总线线并并行行端端口口串串行行端端口口中中断断系系统统时时钟钟源源T T0 0T T1 1P P0 0 P P1 1P P3 3P P2 2T
32、TX XD DR RX XD DI IN NT T1 1I IN NT T0 0图 3.1 STC11L08XE 单片机部结构图3.1.33.1.3 引脚描述引脚描述其引脚功能分别为(1)电源引脚 Vcc 和 GND Vcc 电源端接 +3.3V5 / 63 GND 接 1 (2)时钟电路引脚 XTAL1 和 XTAL2XTAL1:接外部晶振和微调电容的一端,在片它是振荡器倒向放大器的入端,若使用外部 TTL 时钟时,该引脚必须接地。XTAL2:接外部晶振和微调电容的另一端,在片它是振荡器倒向放大器的出端,若使用外部 TTL 时钟时,该引脚为外部时钟的输入端。(3)复位信号 RST该信号高电平
33、有效,在输入端保持两个周期的高电平后,完成复位操作。(4)地址锁存允许 ALE 系统扩展时,ALE 用于控制地址锁存器锁存 P0 口输出的低 8 位地址,从而实现了 P0 口数据与低位地址的复用(5)最小系统单片机最小系统包括 CPU、供电系统、时钟系统、复位系统。(6)I/O 口功能STCL1108XE 共有五组 I/O 端口,每组八路,共 40 根 I/O 口线。P0 口。P0 口共 8 根 I/O 口线,分别为:P0.0-P0.7,做一般 I/O 口使用。P1 口。P1 口共 8 根 I/O 口线,分别为:P1.0-P1.7,其中 P1.0,P1.6,P1.7 具有复用功能,具体如表 1
34、 所示。P2 口。P2 口共 8 根 I/O 口线,分别为:P2.0-P2.7,做一般 I/O 口使用。P3 口。P3 口共 8 根 I/O 口线,分别为:P3.0-P3.7,每一位都具有复用功能,具体如表 2 所示。P4 口。P4 口共 8 根 I/O 口线,分别为:P4.0-P4.7,其中 P4.4、P4,7 具有复用功能。具体如表3 所示。表 1 p1 口的复用功能端口引脚复用功能P1.0CLKOUT2:可编程时钟输出引脚 2,利用独立波特率发生器 BRT 的益处作为时钟输出P1.6:扩展外部中断触发或节电模式的唤醒引脚,可设置INT为外部下降沿中断,并可在停机、省电模式时,将 MCU唤
35、醒RXD:可设置为串行口的数据接收端,用作第二串口P1.7TDX:可设置为串行口的数据发送,用做第二串口表 3 P3 口的复用功能端口引脚复用功能P4.5ALE:访问片外数据存储器的地址锁存端冲输出端P4.7RST:片外复位信号输入端6 / 63表 2 P2 口的复用功能端口引脚复用功能P3.0:扩展外部中断触发或节电模式的唤醒引脚,可设置INT为外部下降沿中断,并可在停机、省电模式时,将 MCU唤醒RXD:可设置为串行口的数据接收端,用作第二串口P3.1TXD:串行口的默认数据发送端P3.2:外部中断 0 中断请求输入端0INTP3.3:外部中断 1 请求输入端1INTP3.4CLKOUT0
36、:可编程时钟输出引脚 0,利用 T0 的益处作为时钟的输出:扩展外部中断触发或节电模式的唤醒引脚,可设置INT为外部下降沿中断,并可在停机、省电模式时将 MCU 唤醒P3.5CLKOUT1:可编程时钟输出引脚 1,利用 T1 的益处作为时钟的输出:扩展外部中断触发或节电模式的唤醒引脚,可设置INT为外部下降沿中断,并可在停机、省电模式时将 MCU 唤醒P3.6:扩展外数据存储器的写扩展端WRP3.7:扩展片外数据存储器的读控制端RD3.23.2 语音控制部分语音控制部分3.2.1LD33203.2.1LD3320管脚介绍管脚介绍说明:IO方向: I表示输入 O表示输出 AD分类: A表示模拟信
37、号 D表示数字信号7 / 63 表4 LD3320部分管脚说明管脚标号管脚名称IO 方向AD 方向说明31CLKID时钟输入 4-48MHZ34-38P7-P3I/OD并行口连接上拉电阻39P2/SDCKI/OD并行口第 2 位共用 SPI 时钟,上拉电阻40P1/SDOI/OD并行口第 1 位,公用 SPI 输出41P0/SDII/OD并行口第 0 位,公用 SPI 输入42WRB/SPISID写允许低电平有效,公用 SPI 允许连接上拉电阻43CSB/SCSID并行方式片选信号,公用 SPI 片选信号连接上拉电阻44A0ID地址或数据选择。在 WRB 有效时,高电平表示 P0-P7 是地址
38、,而低电平表示 P0-P7 是数据45RDBID读允许低电平有效连接上拉电阻46MDID0:并行工作方式 1:串行工作方式连接上拉电阻47RSTBID复位信号低电平有效连接上拉电阻48INTBOD中断输出信号低电平有效连接上拉电阻2-5-根据电路原理图连接上拉电阻12MBS-A麦克风偏置18VREF-A声音信号参考电压8 / 633.2.23.2.2语音识别原理语音识别原理LD3320是一颗基于非特定人语音识别(SI-ASR,Speaker Independent Automatic Speech Recognition)技术的语音识别/声控芯片。 LD3320 芯片是“语音识别”专用芯片。芯
39、片包括了语音识别处理器和一些外部电路,有ADC、DAC 转换器、麦克风接口、声音输出接口等。LD3320芯片可以不连接任何外部的辅助芯片如Flash、RAM 等,直接集成在自身的产品中就能完成语音识别/声控/人机对话功能。而且,语音芯片的关键词语列表能够被随意的动态改变的的,本文介绍如何编写程序实现芯片的功能LD3320完成非特定人语音识别,每次识别能设置50项候选句以供识别参考,单字、词组或短句都可以作为识别的句子,每个是别句的长度应该少于10个汉字或79个字节的拼音串。另外,识别句容是能随意动态编辑修改的,所以一个系统能完成多种场景。芯用片采用48脚QFN塑料封装,工作供电固定为3.3V。
40、芯片部电路图描述如图3.2所示。芯片的主旨就是是语音识别运算器,加上输入、输出、AD/DA转换等模块,完成语音识别的功能。LD3320还支持并行和串行接口与其他模块的连接。 LD3320部集成了快速稳定的优化算法,因此不需要外接Flash和RAM等存储设备,并且也不需要用户事先经过语音训练和录音来完成非特定的语音识别,所以LD3320的识别率比较高,也比较稳定。MBSVREFMUXADCDACMUXDACMUXClockPLL语音识别运算器并行和串行(SPI)接口输入电源H HP PO OL LL LO OU UT TL LE EQ Q1 1E EQ Q2 2E EQ Q3 3L LO OU
41、UT TR RV VD DD D V VD DD DI IO OV VD DD DA AP P0 0- -P P7 7控控制制信信号号图 3.2 LD3320 部电路的逻辑框图时钟(Clock)芯片必须连接外部时钟,可接受的频率围是 234MHz,而芯片部还有 PLL 频率合成器,可产生特定的频率供部模块使用。对芯片的复位信号(RSTB*)必须在 VDD/VDDA/VDDIO 都稳定后进行,无论芯片正在进行何种运算,复位信号都可以使它恢复初始状态,并使各寄存器复位。如果没有后续的指令(对寄存器的设置),复位后芯片将进入休眠状态。此后,一个 CSB*信号就可以重新激活芯片进入工作状态。并行芯片可
42、通过并行方式和外部主 CPU 连接,此时使用 8 根数据线(P0-P7),4 个控制信号(WRB*, RDB*, CS*, A0), 以与一个中断返回信号(INTB*)。串行接口通过 SPI 协议和外部主 CPU 连接,首先要将 MD 接高电平,而将(SPIS*)接地。此时只使用4 个管脚:片选(SCS*)、SPI 时钟(SDCK)、SPI 输入(SDI)和 SPI 输出(SDO)。 寄存器对芯片的设置和命令,包括传送数据和接受数据,都是通过对寄存器控制来完成的。例如进行语音识别时,设置识别的关键词语列表,设定芯片的识别模式,识别完成后获得识别结果都是通过读/写寄存器9 / 63来完成。播放声
43、音时,就是将 MP3 格式的数据循环放入 FIFO 对应的寄存器。(识别结果是通过寄存器返回识别出的关键词语在关键词语列表中的排列序号 Index 数值,该 Index 数值是在设置关键词语列表时指定)喇叭音量的外部控制除了特定寄存器来控制音量以外,芯片外部的电路可以控制喇叭的音量增益。使用的是 EP1、EP2、EP3 对应的管脚。 此次设计的语音识别中,LD3320 与 STC11L08XE 直接相连,而且采用 10K 电阻上拉,A0 用来判断是数据段还是地址段,控制信号 RDB、WRB、CSB、RSTB 以与中断返回信号 INTB 与 STC11L08XE 直接相连,为了辅助系统稳定工作,
44、均采用 10K 电阻上拉。LD3320 和 STC11L08XE 采用同一个外部22.1184MHz 时钟,MBS 作为麦克风偏置,并接一个 RC 电路,以保证输出一个浮动电压给麦克风。 LD3320 部语音识别的原理是先通过 MIC 输入的声音信号进行频谱分析,其次提取语音特征,通过以上两步将得到语音的特征信息,第三步是将关键词列表中的数据与特征信息进行匹配,最终找出得分最高的关键词作为识别结果输出,具体过程如图 3.3 所示:MIC频谱分析特征提取语音识别器关键词列表拼音串MCULD3320芯片图 3.3 LD3320 语音识别原理图3.2.3LD33203.2.3LD3320应用电路设计
45、应用电路设计一个微控制器MCU和LD3320组成了LD3320的基本应用电路,电路中的主控芯片单片机,是为了完成对LD3320芯片寄存器的操作。对于LD3320芯片的所有操作,都是通过对寄存器的控制来完成。例如设置标志位、读取状态、向FIFO写入数据、识别完成后获取识别结果等。比如在编辑关键词的时候,是单片机通过把关键词语的拼音串设置进LD3320有关寄存器来完成关键字编辑的。 LD3320的寄存器大概分为这几类:FIFO数据缓存器、语音识别控制寄存器、音量调节、模拟电路和其他辅助寄存器。寄存器的读写方式有两种方式,即串行SPI方式和标准并行方式。LD3320地址寄存器的地址空间为8位,编号从
46、00H-FFH。 我们将演示程序全部烧录在MCU置的Flash中,主控MCU直接控制LD3320完成所有语音识别工作。 电源部分主要由21K电阻,10uF电容,瓷电容,和电源指示灯,将5v电源转换成LD3320需要的3.3V的电压。音频的输入和输出可以使用驻极体MIC和0.5W的麦克风。语音识别完成后,为了完成对后续电路的驱动,可以利用MCU的串行口与其他模块进行连接。 MCU的P0端口的8根线和LD3320的并行方式连接,控制线也分别连接,此外还要连接复位信号和中断信号。对于LD3320来说,复位信号(RSTB)通过单片机发出,不过中断信号通过LD3320发出,再由的单片机来负责接收。3.3
47、3.3复位电路复位电路10 / 63 在振荡器工作时,在 RST 引脚上出现多个时钟周期的高电平使单片机复位。根据设计的的要求,两种基本形式的复位操作:上电复位和上按键与上电复位。上电复位就是在接通电源后自动完成复位操作。如下图所示电容 C1 和电阻 R1 对电源十 5V 来说构成微分电路。上电后,RST 维持一段高电平时间,因为单片机的等效电阻的影响,图中电阻 R1 不使用,也可以有上电复位的操作能力,如下图 3.4 所示。图 3.4 复位电路 在电源接通后单片机就可以自动复位,而且在单片机运行的时候使用开关控制也可以使单片机复位。常用的是上电或开关复位电路。上电后,由于电容 C2 的充电和
48、反相门的作用,使 RST 持续一段时间的高电平。在单片机正在运行当中时,按下复位键 K 然后松开,也可以使 RST 为维持在高电平,因此实现上电与开关复位的操作。根据以往的操作经验,可以得出这复位电路的电容、电阻的参考值。Cl10uF,R11k C2104本次电路采用的是上电与上电复位。3.43.4 时钟电路时钟电路时钟电路是用来产生单片机工作时所必须的时钟信号,单片机自身就是一个相当复杂的同步时序电路,为确保工作方式的顺利完成,单片机遵循时序执行指令进行工作在单一的时钟信号的严格监控下控制下,时钟的频率与单片机的速度和稳定性息息相关。一般有两种形式的时钟分别为:部时钟和外部时钟。我们系统提供
49、时钟信号使用的是的是部时钟,用于构成振荡器的高增益反向放大器在就在单片机的部,这个放大器的输入输出引脚为 XTAL1 和 XTAL2,XTAL1 和 XTAL2 跨接在晶体振荡器和用于微调的电容,就组成了了一个自激励振荡器。电路中的 C1、C2 的选择在 30PF 左右,但电容太小会影响振荡的频率、稳定性和快速性。晶振频率为 22.1184MHZ,频率越高单片机的速度就越快,但对存储器速度要求就高。外部时钟电路如图 3.5 所示。 至内部时钟电路振荡器石英晶体C1C2XTAL2XTAL1STC1F08XE30PF30PF图 3.5 STC11L08XE 单片机外部时钟电路11 / 633.53
50、.5 继电器电路概述继电器电路概述继电器是控制系统中一种重要的原件,它的作用就是按照某种要求接通或断开控制系统的电路。根据动作的原理不同,继电器可以分为:电磁式、感应式、电子式、热效应式、气动式和电动机式等,最常用的是电磁式继电器,它是根据吸引线圈中的电流量的大小来动作的。常用的继电器是有触点的,触点有通和断两种状态,状态的改变由某种信号控制,可以用一个电磁铁的吸合或断开控制触点状态,这样就组成一个电磁式继电器,因此,继电器就是根据某种物理量的变化来改变其触点状态的控制元件。继电器在控制系统中的作用有两点: (1)传递信号。它用触电的转换接通或断开电路以传递控制信号;(2)功率放大。使继电器动
51、作的功率通常是非常小的,而被其触点所控制电路的功率要大得多,因此继电器电路必须有放大功率的作用,从而可以实现对电路的控制。 继电器分为交流和直流两种:吸引线圈采用直流控制的直流继电器;吸引线圈采用交流控制的叫交流继电器,本次毕业设计采用的是交流继电器。它实际上是一种可以用低电压、小电流来控制大电流、高电压的自动开关。本课题选用的继电器是 SRS-05VDC-SL 型号的继电器模块,SRS-05VDC-SL 型号的继电器模块常开口可接最大负载为交流 250V/3A,直流 30V/3A,控制电压为 5V,具有电源和继电器动作指示,吸合亮,断开灭,信号输入端有信号时,公共端与常开端会导通 。H 为高
52、电平触发选择端,即短接 H 处,H_IN 为高电平触发输入端,L 为高电平触发选择端,即短接 L 处,L_IN 为高电平触发输入端,高电平触发指的是信号输入端与地之间有电压的触发方式,可以理解为信号输入端与 VCC 正极短路触发的一种方式,低电平触发指的是信号输入端与地之间的电压为0V 的触发方式,可以理解为信号输入端与 GND 负极短路触发的一种方式.电路如图3.6 所示 图 3.6 继电器电路单片机 P2.3 口与继电器电路相连,继电器电路由 1K 电阻,PNP 型三极管,二极管和继电器组成,三极管在电路中的作用是放大,而放大的极限就是开关,而此处就用到了三极管的开关作用,通过放大单片机
53、P2.3 端口的信号,来控制继电器吸合或开。二极管起到保护作用,此电路中继电器控制 220V 电压,外接一个电灯来显示继电器状态。 3.63.6 电路连接总图电路连接总图12 / 634 4 软件设计软件设计4.14.1LD3320LD3320 的软件编程的软件编程4.1.14.1.1 编程模式编程模式主控 MCU 通过读/写 LD3320 的寄存器完成操作。用户有两种编程模式:中断模式和轮询模式。所谓中断模式,就是系统的主控 MCU 在接收到外界一个触发后(比如用户按动某个按键),启动 LD3320 芯片的一个定时识别过程(比如 5s),要求用户在这个定时过程中说出要识别的语音关键词语。过了
54、这个过程后,需要用户再次触发才能再次启动一个识别过程。所谓轮询模式,就是系统13 / 63的主控 MCU 反复启动识别过程。如果没有人说话没有识别结果,则每次识别过程的定时到时后再启动一个识别过程;如果有识别结果,则根据识别作相应处理后(比如播放某个声音作为回答)再启动一个识别过程。在编程时,由于是本次论文是声控语音识别开关,讲究的实用方便。所以,选择轮询模式而不是传统的中断模式。4.1.2LD33204.1.2LD3320程序流程程序流程如图4.1所示LD3320的功能是完成有限词组的非特定人语音的识别的中断处理,我们将其应用在一个虚拟环境下训练,训练中,通常需要下达几个短口令,但是在我们所
55、设计的训练环境中,如果口令使用键盘或鼠标的方法进行输入,明显是不符合毕业设计的要求。因此,我们就用LD3320设计VUI来控制电路,实现语音识别的方式,将获得的识别结果再转换成串口信号,输入计算机,达到语音控制的目的。实践证明,这种方式可以满足语音控制的要求,但是语音识别的速度,即实时性还有待改进。语音识别的操作流程(1)语音识别初始化(包括通用初始化),在初始化程序里,主要完成软复位、模式设定、时钟频率设定和FIFO设定。芯片复位是芯片的第47脚(RSTB)发送低电平,然后需对片选CS做一次地至高的操作,以激活部数据处理模块。(2)写入识别列表,LD3320语音芯片是基于语音词库的语音识别芯
56、片,在这一步中可以将待识别的短语写入列表中。列表的规定是,每个识别条目对应一个特定的编号(一个字符),不同识别条目的编号可以一样,但是可以不用连续,不过数值一定不大于于256(00H-FFH)。(3)开始识别,设置若干个相关的寄存器,就可以开始识别,ADC通道即为麦克风输入通道,ADC增益即为麦克风音量,可以设定为00H-7FH,可以设定的围设置值为40H-6FH,值如果越大代表MIC音量越大,识别启动可以很灵敏,不过可能带来比较多多的错误识别。如果值越小代表MIC音量越小,不过需要近距离说话才能启动语音识别,它的好处就是对于远处的干扰噪声不会做出处理。(4)响应中断,如果麦克风采集到的声音信
57、号,不管是否识别出正确结果,都会做出一个中断响应,而中断响应要根据寄存器的值进行分析,读取BA寄存器的值可以知道有几个候选答案值,而C5寄存器里的答案是得分最高,最可能输出的结果。14 / 63向寄存器写入ADC增益清空寄存器设置寄存器设置芯片状态空闲?设置寄存器准备开始识别设置寄存器IC开启ADC设置寄存器开中断YN 图4.1 语音芯片中断流程图4.24.2寄存器的操作寄存器的操作本芯片的各种操作,都必须通过寄存器的操作来完成。比如设置标志位、读取状态、向FIFO写入数据等。寄存器读写操作有4种方式,即并行方式(软、硬)和串行SPI方式(软、硬)。4.2.14.2.1并行方式并行方式 第 4
58、6 脚(MD)接低电平时按照此方式工作。 写和读的时序图如下:15 / 63图 4.2 并行方式写时序图 4.3 并行方式读时序由时序图可以看到,A0 用来识别芯片是数据段还是地址段。A0 为高时是地址,如果 A0 为低时是数据。发送地址的时候 CSB*和 WRB*必须有效,同样的,写数据是 CSB*和 WRB*也必须有效,而且读数据时 CSB*和 RDB*也必须有效。 4.2.24.2.2 串行串行 SPISPI 方式方式 第 46 脚(MD)接高电平,且第 42 腿(SPIS*)接地时按照此方式工作。写和读的时序图如下图 4.4 SPI 方式写时序在写的时候首先给 SDI 发送一个“写”指
59、令(04H),再给 SDI 发送 8 位寄存器地址,然后给SDI 发送 8 位数据。在这个时候,SCS*必须保持在有效(低电平)。在写的时候要首先 SDI 发送一个“读”指令(05H),再给 SDI 发送 8 位寄存器地址,然后从SDO 接受 8 位数据。在这期间,SCS*必须保持在有效(低电平)。16 / 63图 4.5 SPI 方式读时序4.34.3寄存器功能简介寄存器功能简介1.B5寄存器 B5寄存器在检测完语音数据段以后还会有噪音,连续监测到多长时间的背景噪音才确认是真正的语音结束,通常情况下的默认值是600毫秒,这个设定值也不能太小,否则用户在中间的小小的停顿也会被判定为录音结束;2
60、.35寄存器修改麦克风音量的是35寄存器,它的数值一般设定在40H-58H之间,具体数值根据麦克风以与使用的环境来确定,本次程序使用的是43H;值越大代表MIC音量越大,识别启动越灵敏,但可能带来更多的误识别;值越小代表MIC音量越小,但是需要近距离说话才能启动识别功能,好处是对于外界的干扰没有反应。3.FIFO寄存器FIFO英文First In First Out 的缩写,是一种先进先出的数据缓存器,它与普通存储器的区别是没有外部读写地址线,这样使用起来就很容易。(*) LD3320芯片部有2个FIFO,分别是: FIFO_EXTFIFO_DATA FIFO_DATA 主数据处理FIFO缓存
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023七年级英语下册 Unit 10 I'd like some noodles说课稿 (新版)人教新目标版
- 消防控制室管理制度
- 2024-2025学年初中同步测控优化设计物理八年级上册配人教版专项训练含答案
- 法国课件湘教版
- 简讯格式与范文
- 西京学院《机械工程测试技术》2022-2023学年第一学期期末试卷
- 西京学院《产品造型材料与工艺》2023-2024学年第一学期期末试卷
- 西华师范大学《中国近现代政治思想史》2023-2024学年第一学期期末试卷
- 西华师范大学《信息技术教育应用》2023-2024学年第一学期期末试卷
- 西华师范大学《统计计算与软件》2023-2024学年第一学期期末试卷
- 《地产公司图纸管理办法》的通知
- 装饰图案(第2版)课件 李健婷 模块7、8 装饰图案的组织形式装饰图案在现代设计中的应用
- 企业宣传视频拍摄制作方案
- 中华民族共同体概论学习通超星期末考试答案章节答案2024年
- 脑出血课件完整版本
- 世界慢阻肺日
- 2024年资格考试-CPSM认证考试近5年真题附答案
- 混料机的安全操作规程有哪些(8篇)
- 期中 (试题) -2024-2025学年译林版(三起)英语六年级上册
- 2024秋期国家开放大学《财务报表分析》一平台在线形考(作业一至五)试题及答案
- 国家基本医疗保险、工伤保险和生育保险药品目录(2023年)
评论
0/150
提交评论