基于单片机的语音识别控制灯-毕业论文_第1页
基于单片机的语音识别控制灯-毕业论文_第2页
基于单片机的语音识别控制灯-毕业论文_第3页
基于单片机的语音识别控制灯-毕业论文_第4页
基于单片机的语音识别控制灯-毕业论文_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学城市学院毕业论文 STYLEREF"标题1"1绪论文档均为word文档,下载后可直接编辑使用亦可打印摘要自然语音作为人机交互在目前得以广泛的应用以及极大的发展前景。该设计介绍了基于非指定人语音芯片LD3320的语音控制器结构及其实现语音控制的方法。该语音控制器利用CST89C52单片机作为主要控制器,控制芯片对输入的进行语音识别并处理,根据语音指令产生相对应的脉冲序列,替代按键式遥控器,实现对电路的语音控制。本次设计采用了ICRpute公司的LD3320语音识别芯片和相关控制电路,设计实现一款语音控制系统,该系统可以通过语音控制操作,实现无键盘语音控制家用电器工作的功能。关键词:LD3320;语音识别;CST89C52单片机;

SpeechrecognitioncontrollampbasedonMCUAbstractNaturalvoiceashuman-computerinteractionincurrenttoawiderangeofapplicationandgreatdevelopmentprospectofthedesignisintroducedbasedonthespecifiedpersonvoicechipLD3320voicecontrollerstructureandtherealizationofvoicecontrolmethodusingthevoicecontrollerCST89C52singlechipmicrocomputerasmaincontroller,thecontrolchipofinputspeechrecognitionandprocessing,accordingtovoicecommandsshouldberelativepulsesequence,alternativebuttonremotecontrol,realizethevoicecontrolofthecircuitThisdesignUSEStheLD3320speechrecognitionchipofICRputecompanyandtherelevantcontrolcircuit,anddesignsandrealizesaspeechcontrolsystem,whichcanoperatethroughspeechcontrolandrealizethefunctionofkeylessspeechcontrolofhouseholdappliancesKeywords:LD3320;Speechrecognition;CST89C52Singlechipmicrocomputer;

目录1绪论 11.1课题研究意义 11.2世界研究现状 11.3研究的内容和要求 22方案论证 32.1方案论证 32.2芯片选择 33硬件单元电路设计 43.1LD3320语音识别模块 43.1.1LD3320芯片的部分参数 63.2STC89C52单片机核心控制版块 63.2.1主要性能 73.2.2单片机引脚 83.2.3时钟电路 103.2.4

复位电路 113.2.5继电器 123.3

电源电路的设计 134软件设计 134.1

主程序流程图 134.2

语音识别程序设计 144.2.1

LD3320语音识别原理 144.2.2

非特定语音识别程序流程图 15参考文献 18谢辞 19附录 201绪论1.1课题研究意义

伴随着科学的技术发展,互联网时代的高速发展,各类产品的研究也是百家争鸣,更多性能、功能齐全的各类产品出现在人们的日常生活中,其中与我们生活息息相关的便是各类电子产品,如电话,家电,办公用品等等,曾经我们幻想着机器人,我们可以操控他们实现我们想要的功能,而如今随着各国科学家利用语音识别技术研发出的新颖的电子产品,让我们曾经遥不可及的梦想变得日益普及,不仅仅是对家用电器的控制,乃至各类声控产品也慢慢的涌入市场,供人们选用,我们会发现,在我们的生活中对各类电子产品慢慢的不再需要以有繁多按键的遥控来控制,正如现在中国国内火爆的小米公司的"小爱同学",苹果手机上的"siri"同志,他们不再以之前的按键控制,只需要随口的一句之灵,便可以很轻松的利用说话来控制电器产品,为当今家庭以及工业提供了更多便利。 语音识别作为人类与机器之间的沟通中很重要的环节,它的应用领域十分广阔。集成电路的迅速发展有利于将拥有多种功能的语音识别系统嵌入到芯片或模块上,使得语音识别这一技术在各个方面都得以利用,而嵌入式语音识别技术开发也会变得更有价值。 该设计利用语音识别,语音控制系统来完成这项工作。该系统用LED指示灯来模拟工作状态。1.2世界研究现状

随着时代的发展,科技的进步,语音识别这一技术也成了世界各国研究的一重要技术,为了使各类语音识别产品得到推广普及,各国不同领域的企业公司都拥有自己的语音识别研究所,世界知名的因乔布斯而出名的Iphone公司、还有我们互联网时代的前辈以及开创者比尔盖茨的Microsoft微软公司、还有各类相关研发电子产品的大型企业公司投入大量人力物力以及大量资金来进行语音识别的应用研发,各种各样的外资企业的语音识别产品以及能完成特定任务的产品已经慢慢出现在我们日常生活的各个角落。人们对于语音技术的认知可能要追溯到十九世纪的爱迪生以及贝尔等人发明的电话,留声机等等,这是人类第一次可以通过一个电子设备来传达我们想要说的话,对信息的传输。这之后的数百年,越来越多通过语音为基础的产品被研发出来,语音信号逐渐成为了一种可以进行存储并对其传输的信号。在语音技术的不断发展以及新老更替的情况下,语音技术开始慢慢分化,如今世界上大体研究的关于语音技术的有三大类方向,在早些时候人们研究的是单纯的如何捕捉到语音信号,对其进行处理与保存。随着语音技术的慢慢发展,人们也不再局限于利用声音来保存声音,慢慢的便开始研究如何将我们写出的字想传达的东西,利用机器将其转换为语音,这便是语音技术历史上的第二个研究方向,对于语音的合成处理,贝尔实验室于上世纪九十年代末年发明了一台电子语音合成器,他根据语音技术的应用,是世界上第一个利用文字制造声音的机器,此机器用于保障通话的安全,让人无法辨别是谁的声音。如今在全世界范围内人们对于语音技术钻研最多的一个方向,语音识别,它的主要任务就是把我们的语音信号通过处理转化成文本,方便收集信息,不再像之前一样繁琐,这一个方向听起来是第二个方向语音合成的逆过程,但其中技术部分的研究困难是它的数倍。现如今,语音识别框架主要由解码器、声学模型、语言模型、前段处理和后处理这几个部分,许多著名学院以及研究机构纷纷投入对其的研究,其中不乏有麻省理工学院,剑桥大学等高等学府,还有贝尔实验室这些大型研究机构。声学模型是如今世界研究较为主流方向,因为人们对端到端技术的研究日益透彻,使得这一方向的研究较多,我国在声学模型结构的研究是相对来说是更快且更深入更复杂,这得益于中文的复杂化,使得语音识别也变得多样化。如LFR-DFSMN神经网络模型,DFCNN(深度全序列卷积神经网络模型),截断注意力模型SMLTA等等,这些都是我国国内实力雄厚的公司所研究而出。如今我国对语音识别框架更多的研究还是前段处理和后处理这两个方面。对于解码器和语言模型的研究,目前的世界范围内的技术还不足以支撑这两部分框架的研究,他们都处在理论虽然较丰富,但在程序的实际操作上还是拥有较大的不足以及困难,所以语言模型和解码器这两个部分在各行各业的关注度并不是很高。数字信号处理成为20世纪70年代语音技术最热门的领域之一。这也是许多世界知名大学为基础的语音识别的研究机构和企业开展如火如荼起来。到了80年代初,随着计算机技术和存储技术还有网络时代的完善以及健全,还有实验室语音识别研究取得的全新重要成果;语音技术的商业应用开始初露锋芒,逐渐占领市场,为企业等服务行业以及航空航天等科研方面带来全新的便捷的服务方式。许多教授、专家都认为语音识别技术在二十一世纪将会是科学研究的重要发展方向。1.3研究的内容和要求

本设计的主要内容是基于STC89C52单片机,利用语音来控制指示灯的状态来显示工作状态,需要完成这些,设计并焊接一个硬件电路是必不可少的,而利用编程来控制硬件电路的运行,当然也是不可或缺的。在硬件电路部分我们需要的是指示灯、语音识别模块、单片机模块、复位电路、最小电路等等;在软件编程部分应该实现对输入的语音数据进行语音处理以及识别,并通过识别出的语音操控指示灯和继电器的指示状态。2方案论证2.1方案论证

本次设计使用STC89C52单片机,它属于MCS-51系列,STC89C52是一个应用范围广泛的8位单片机,成本低是他的一大优势。STC89C52作为控制中心,他的功能是对专门的语音进行处理并接受芯片传输的指令,使用声音控制传感器,来实现系统的控制与指示情况。但由于STC89C52单片机的闪存较低无法实时存储,只能通过电路来实现功能。如今,语音识别系统是近年来发展迅速的一项信息技术,它可以完成信息的精简,编译以及解译,不但可以完成信息的存储,而且可重复提取利用该信息,最终完成信息的语音识别,而这些实现起来不仅较为繁琐,效率低,还需要进行大量的运算。实现该结构方案如图2-1表示图2-1

采用MCS-51系列单片机实现语音控制指示灯状态2.2芯片选择在如今为了让生活更加智能及快捷,为了使得人们不再依赖于繁琐的遥控设备,而是可以直接通过说话来下达指令,迎来较为智能的生活环境,语音识别芯片的兴起无疑推动智能时代了智能时代的发展进程。 语音识别芯片涉及的技术大多包括:语音信号的处理、信号模式的识别、概率计算、听觉能力以及发生原理、人工智能(AI)等等。而语音识别技术在其中作为作为人工智能的支撑,语音信号的识别,语音信号的控制以及现如今的wifi组合是该技术应用的基本要求。 现如今市面上相对流行的语音识别芯片主要有:无锡ICRoute的LD3320芯片,它主要应用于各类家居,会议等场合。新唐科技的ISD9160芯片,它主要应用于高端声控玩具的制造。人麦的YQ1210芯片,它主要应用于小家电,以及照明的应用。唯创知音的WTK6900B01芯片,它主要应用于低端声控玩具的生产制造。上海华镇的WS117芯片,它主要应用于各类会议系统。图2-2市面上常见语音识别芯片性能对比 可见无锡ICRoute的LD3320芯片的拾音距离,唤醒率,硬件参数等各项指标综合起来优于其他四类芯片。3硬件单元电路设计该设计的系统中,硬件电路部分的主要内容分为两部分,分别是语音信号识别版块以及核心控制版块。语音信号识别版块我们采用无锡ICRoute公司生产的LD3320语音识别芯片,核心控制版块我们采用MCS-51系列的STC89C52单片机。

3.1LD3320语音识别模块在本次设计中,语音识别模块是最为重要且关键的步骤,它最重要的功能是对输入的语音信息进行采集,识别,转换,执行,而我们需要语音信息识别处理器、声音输入输出接口、模拟信号与数字信号转换器等等功能,本次设计采用的LD3320模块以及相应的LD3320芯片,便可以满足以上需求,集多项功能于一个PCB板上,它拥有可动态编写更换的识别信息的功能,只需这一个模块便可以完成语音识别的功能,无需再使用其他辅助功能的芯片,这款产品提供了只需单一的一款芯片便可以完成语音识别,十分适合该设计。LD3320模块将必须的元件以及LD3320语音识别芯片集中在PCB板上,将芯片管脚通过连线将该模块以及核心控制板块连接,同时通过该模块输入适合的晶振信号,提供外部电源,从而实现STC89C52单片机的程序的执行,LD3320语音识别芯片的语音识别功能。LD3320语音识别芯片的主要特征大致分为以下:(1)该语音识别模块上只可以从相对应的电源接口,用户利用外部电源进行电源输入,因为该模块上没有自带电源元件。(2)可以通过将晶振信号输入到芯片的相应接口处,或在模块上留出晶振的连接点由用户自己将晶振焊接在模块上,这两种方法可以为该语音识别模块提供CLK的输入。(3)该模块的语音识别芯片上的音频模拟接口连接相应的保护元件后接出。(4)该模块上拥有两个音频接口,直接引出输出信号(Speaker)和麦克风(MIC)的输入信号,操作简单便捷,使用者可以使用麦克风和接受设备进行声音的播放和语音识别的功能。用户可以通过相对应的接口进行设备的连接,也通过模块上的插座上直接将接受设备连接。(5)LD3320模块上拥有两个指示灯,连接在芯片的相应接口上,当该模块接收到电源开始平稳运行后,芯片的接口会输出低电平使得指示灯亮起,可以通过这两个指示灯来辨识芯片是否通电成功。下图3-1是LD3320A的非特定语音识别芯片图3-1

LD3320的非特定语音识别芯片LD3320语音识别芯片是无锡的ICRoute公司研发的一款高性能离线语音芯片,该芯片支持SPI接口和并行接口的非特定语音识别模块,有源晶振和板载咪头,它方便在产品中实现语音识别的功能。该产品优点明显,可分为以下几点:(1)它拥有高效且高精确度的语音识别效果。(2)它拥有可动态编写更换的识别信息列表,例如,我们在STC89C52单片机的使用时,利用芯片中的寄存器,将“吃饭”“睡觉”等类似的需要识别的内容带有可编辑性的写入芯片中,这样芯片在设定后就可以自动识别这种可动态编写更换的识别信息了。而它这样的工作原理是把需要识别的信息以字符串的形式输入芯片,便可以在下次信息输入时立即进行查询并执行。(3)它拥有非指定或固定对象的语音识别功能:无需对象对该芯片进行个人信息的录入,上手即用。(4)它拥有对对象任意输入50条关键词可编辑的功能:对象面对不同的使用需求,该芯片可以在提前录入的50条关键词语中进行搜索识别,随着需求的变化而对关键词的内容进行编辑并自动更新覆盖。(5)它工作需求电压较低,仅需3.3V,适合便于携带或体积较小的设计。(6)它集语音信息识别处理器、声音输入输出接口、模拟信号与数字信号转换器等等功能为一体,无需其他辅助的芯片。(7)它支持两种连接方式,串行接口和并行接口,便于与其他模块的互通。(8)它支持将芯片设置为省电状态,耗电极小,并且方便重新启用。3.1.1LD3320芯片的部分参数 芯片内置耳机输出和扬声器输出 芯片内置双声道的数模转换(stereo16-bitD/A) 芯片内置单声道的模数转换(mono16-bitA/D) 芯片内置锁相电路,输入主控时钟频率为2MHz--34MHz 芯片支持并行接口或者串行SPI接口 芯片省电模式下耗电:1uA3.2STC89C52单片机核心控制版块本次设计采用的STC89C52RC单片机是深圳市宏晶科技公司研发的一款CMOS8位控制器,它的特点是:指令代码适配于传统单片机、高性能、低功耗、抗干扰能力强,系统中有8KB的可编辑闪存存储器,该单片机采用美国的爱特梅尔公司(Atmel)的技术制造,它的特点是高精度非易失性存储。它适用于传统常见的编程器,片上闪存也允许程序的存储在系统内可进行编辑。STC89C52单片机机器内部带有4KB的带电可擦编程只读存储器(EEPROM),拥有512字节的随机存取存储器(RAM),拥有三个16位计数器器和定时器,8k字节的闪存空间(FLASH),32位I/O口线,一个看门狗定时器(WDT),带有片上振荡器和时钟电路,MAX810的复位电路,4个外部中断,一个七向量四级中断结构,全双工串行口,两个数据指针,一个六级中断向量结构,正是由于这些功能,STC89C52是目前在电子设计类比赛中最常用的单片机之一。除上述结构之外,STC89C52单片机还可以降低至0赫兹进行静态运行,可以通过调节设置为低功耗模式。在低功耗空闲模式下运行,CPU将中止运行,但是允许随机存取存储器、串口、定时器/计数器、中断等结构继续运行。在断电方式下,单片机会停止一切进程,并会进行自我保护,振荡器停止运行,存储器内的信息将被保存,直到硬件复位或者接收到下一个中断指令为止。

STC89C52SCM是把基本内容的那些所需的应用控制集成在集成电路的限制芯片尺寸。它的基本结构可以分为正常传统的外部连接结构,以及系统的中枢大脑——芯片,而在这一定的尺寸内,每个元件都有他不同的功能,数据存储器、程序存储器用来存储传输的数据以及需要该单片机完成的任务的存储的部位,而I/O端口、串口则用来连接外部模块以及一些必要的外部结构,通过他们才可以更加完善系统,中断元件负责传输出中断指令,使得单片机停止当前指令,还有一些特殊功能的寄存器。它们通过唯一的一个芯片通过接线而互相连通。3.2.1主要性能(1)可以在6时钟/机器周期和12时钟/机器周期两种内可以任意选择,代码适用于8051单片机,属于8051的升级版本产品(2)工作电压:5.5V~3.3V(5V单片机)/3.8V~2.0V(3V单片机)(3)工作频率范围:0~40MHz,相当于普通8051的0~80MHz,实际工作频率可达48MHz(4)用户应用程序空间为8K字节(5)片上集成512字节RAM(6)拥有32个可编程的通用I/O口(7)无需专用编程器,无需专用仿真器,可通过指定串口直接下载需求程序,可在系统内编程,也可在应用内编程(8)具有EEPROM功能(9)具有看门狗功能(10)共3个16位定时器/计数器。即定时器T0、T1、T2(11)外部中断、下降沿中断或低电平触发电路,(12)通用异步串行口(UART),还可用定时器软件实现多个UART(13)工作温度范围:-40~+85℃(工业级)/0~75℃(商业级)(14)PDIP封装3.2.2单片机引脚下图3-2为STC89C52单片机的引脚图图3-2STC89C52单片机引脚图VCC:电源GND:地P0端口:P0端口作为一个输出端端口,它的每一个引脚都能带动8个负载。P0端口是一个8位漏极双向I/O端口。在进行软件编程时,P0口可以用来进行接收相应的动作指令;当它需要与外部程序对接时,它可以提供低8位地址作为总线。当对P0端口写入“1”时,P0端口引脚可以作为为高阻抗输入,此时它用有内部上拉电阻。在程序设计完成后需要检验时,它会输出输出相应的动作指令。此时需要注意,当程序进行验证,P0端口需要外接一个外部上拉电阻。P1口:P1口是一个具有内部上拉电阻的8位双向I/O口。对端口写入“1”时,通过内部的上拉电阻把端口拉到高电位,此时可以将它作为输入口使用。当P1口作输入口使用时,因为有内部上拉电阻的原因,那些被外部拉低的引脚会输出一个电流(IIL)。P1的输出缓冲器可驱动(吸收或者输出电流方式)4个TTL逻辑电平。在进行flash编程和校验时,P1口接收低8位地址字节。除此之外,P1.0和P1.1还可以作为定时器/计数器2的触发输入(P1.1/T2EX)和定时器/计数器2的外部技术输入(P1.0/T2),具体如下表:P2口:P2端口是一个准双向端口,它的8位引脚为P2.0—P2.7,它和P1口相同具有内部的上拉负载,可作为通用I/O口使用,具体功能与P1口相同,直接接入输入和输出。P2口的功能之一是可以直接当做输入口,当端口P2写入“1”,则端口的内部上拉拉动时,这种情况下可以被用作输入。当系统复位时,输出的下拉驱动停止运动。当P2口在系统拓展时输出高8位地址,作为地址总线使用的时候,使得复用器引向相应的地址,再将信号输出到相应的引脚。当有一些字节和企业控制信号需要接收时,此时P2口也可作为输入口。P3口:P3是一个内部的8位双向I/O端口,它含有上拉负载,所有引脚都具有不同的功能,如下:P3.0RXD,串行通信输入口,不使用串行通信功能时,可做普通IO口使用P3.1TXD,串行通信输出口,不使用串行通信功能时,可做普通IO口使用P3.2INT0,外部中断0输入口,不使用外部中断0功能时,可做普通IO口使用P3.3INT1,外部中断1输入口,不使用外部中断1功能时,可做普通IO口使用P3.4T0,定时器0外部计数输入口,不使用定时器0外部计数功能时,可做普通IO口使用P3.5T1,定时器1外部计数输入口,不使用定时器1外部计数功能时,可做普通IO口使用P3.6WR,外部存储器写信号,不使用外部存储器写功能时,可做普通IO口使用P3.7RD,外部存储器读信号,不使用外部存储器读功能时,可做普通IO口使用PROG/ALE:当我们需要一个输出脉冲信号将低8位的地址存储并停止运行时,ALE引脚便拥有这个功能。当我们在编程中需要一个编程输入脉冲时,PROG可以实现该功能。在进行编程时,ALE拥有稳定的输出脉冲,可以将它作为时钟或定时器,它的工作频率以晶振的1/6来进行。然而,需要注意的是,在每次访问外部数据存储器时,ALE脉冲被跳过。当我们需要ALE操作将无效时,这时需要将地址为8EH的SFR的第0位置“1”即可。该位置“1”,同时只有当一个MOVX指令或MOVC时,ALE是生效的。否则,ALE将被轻轻拉起。此ALE使标志位(SFR地址8EH的位0)的设置对外部执行模式下的微控制器无效。RST(RESET):引导内部复位程序或电路。该引脚的功能是将程序以及单片机复位,回到初始状态,它的工作原理是当晶振进行震动时,该引脚会输入高电平,持续两个周期。WDT完成之后,该引脚又会进行96个振荡周期的高输出动作,CPU进入冻结状态,停止工作,程序的计数器返回到0000H,即回到初始状态。VPP/EA:EA为程序中存储器的选择,它分为两种情况,当EA=0时,中央处理器会将系统外部的程序存储器里的程序命令进行运行;当EA=1时,中央处理器会将系统内部的程序存储器里的程序命令进行运行,当超出存储器容量时时,它会到外部的程序存储器内执行。EA在编程的过程中也可以接受12V的电压源电压。VPP的功能是提供编程的脉冲,在内部程序存储器的数据变换时使用。PSEN:PSEN是一股脉冲,它是外部的程序存储器读取选取的信号。当单片机读取内部的程序存储器内的信号时,此时PSEN不工作,当单片机执行外部的程序存储器内的信号时,PSEN开始工作。当PSEN处于工作状态时,在每一个工作周期内PSEN会产生两个有效值。在闪存编程过程中,EA也接收12vVPP电压。XTAL(外部晶振)1:该引脚为内部时钟电路的反相器的输入端,外部有源晶振的信号一般从XTAL1引入。XTAL(外部晶振)2:该引脚为内部时钟电路的反相器的输出端,外部有源晶振的信号一般将XTAL2悬空。3.2.3时钟电路电路如图3-3所示:图3-3

单片机晶振电路每个系统都具有单芯片晶体振荡器,专业称它为晶体振荡器,在单片机系统中晶体振荡器具有十分重要的作用。单片机的所有动作执行都要通过晶振震动才可以正常运行,它会根据单片机内部所形成的电路,产生其相对应的必须的频率,当晶振产生的时钟频率越高,那么单片机系统执行命令的速度和反馈速度也会增大。单片机的晶振中两个不同电容两个系统电容叫晶振的负载通过电容,分别可以接在晶振的两个自己脚上和对地的电容,一般在几十皮发。它会影响谐振频率和振荡器的输出振幅。晶体振荡器的负载电容=[(CD*Cg)/(CdCg)]是CD,在晶体振荡器的两英尺和地面上分别在IC△C(电容在P-CB上)是3到5个值。3.2.4

复位电路

复位电路如图3-4所示:图3-4单片机复位电路复位电路是一种用来使系统恢复到初始状态的电路设备,就像计算器的清零按钮的作用一样,以便回到原始状态,重新进行计算。它的作用是当系统进行上电或复位时,控制中央处理器的状态,确定使它复位,在这段时间内他会使中央处理器处于停止工作的初始状态,防止中央处理器执行错误指令而导致系统出错,防止刚接入电源或刚进入复位状态时系统就开始运行,同时复位电路也可以提高电磁一定的兼容性能。STC89C52单片机是整个系统开发板的主脑,它控制着开发板的任何动作以及指令,所以在选用一个电路前,我们应该对系统中的各个电子器件的不同需求,不同参数,来选取参数合适,具有一定的抗干扰性和稳定性的电路。3.2.5继电器电磁继电器,简称继电器(reply),是一种当在系统的输出电路中使被控制的一个数据实现特定的数值变化的电控制器,它一般由衔铁、铁芯、触电、线圈几部分构成,它通过电流使继电器上的衔铁通断,实现对电路的运行与停止的控制。当对继电器两端接入电压时,线圈中会产生相应的电流,而电流产生的电磁力会吸引继电器上的衔铁,克服弹簧的的返回弹力,吸向铁芯,带动衔铁上触点的贴合,这就是继电器的电磁效应;当继电器两端停止供电,电流消失,电磁力的吸引作用也会消失,衔铁会返回原来的位置,使得衔铁上触点的分断。继电器如图3-5所示图3-5电磁继电器继电器在系统中有高压工作电路和低压控制电路两种,继电器的特点之一就是利用小电流来驱使大电流的动作,它在系统内的电路中具有保护电路安全,实现对电路的转换,按照实际情况进行调节的功能。3.3

电源电路的设计

如下图3-6所示,它是用于开发板上的负责输送电源的电源电路电路。它可以通过电源插座外接转接头进行供电,也可以利用引脚连接外部电源进行供电。一般情况下是利用+5V电源对开发板供电。图3-6

电源原理图4软件设计4.1

主程序流程图

该系统包括以下程序:单片机芯片的初始化程序,非特定人的语音的输入以及识别处理程序,系统的中断程序,系统的复位程序,还有相关的延时函数。具体流程图可见图4-1。当非特定人的语音输入系统后,语音识别芯片会将接收到的信号进行处理,传输到主控制器(单片机),单片机将信号进行再处理后,传达一定的指令到指定部分电路,实现对输入的语音的相应指令动作。图4-1

系统主程序流程图4.2

语音识别程序设计

4.2.1

LD3320语音识别原理

语音识别(ASR)技术,最开始研究该技术时大多是依照传入的数据对其单个字节、词汇以及相关语音末班进行配对,选取与其相似度最大的一种工作方式。该技术的一大特点是可以进行非特定人的语音识别,即进行语音识别时,不需要发出指令的人提前对语音识别模块进行语音训练。该技术的核心内容是对关键字在列表中进行匹配识别,我们想要传达的语音内容将通过字符形式输入LD3320语音识别模块,再根据我们提前设置好的关键词的列表,进行匹配,对输入的字符进行识别处理,最后进行相应的动作。语音识别模块中的识别引擎功能强大,只需要对与输入相关的寄存器,便可以识别各类语音输入,如命令、歌曲、相关动作、姓名等基于字符串的指令,而不需要关注其关键词的内容。而对于相对较复杂的命令,其内部提供了完整的开发源代码,以及图形界面的下载工具,当我们需要进行相关语音识别时,仅需将源代码进行修改以及一定的拼凑,就可以实现基本上的语音识别。语音识别模块可以完整的进行一次语音识别需要的工作环境为:对麦克风的输入进行收集→利用频谱的数据对输入的语音进行分析→对输入的语音的特征进行特征的提取→将提取出的特征在关键词列表中进行寻找配对→在配对结果中寻找相似度最高的关键词语句→将语音输出,按照匹配结果进行相应动作。在图4-3所示的为上述流程:图4-3

LD3320进行语音识别的原理框图注意:(1)语音模块进行识别时的最大候选句选项为50,可以是任何形式的不超过十个汉字或80个字节的输入,如字符,字符,语句等。(2)在识别列表中,每一个识别对象都有一个1字节专属代号,相对于不一样的识别对象的对应于特定的识别代号可以重复,也可以不用连续,LD3320语音识别芯片支持容纳50个识别对象,而且会在识别对象中的字符中拥有一定的空间间隔。(3)应在LD3320语音识别芯片的每个控制端口添加内部上拉电阻。(4)在时钟输入信号和模拟串口内不可以接内部上拉电阻。4.2.2

非特定语音识别程序流程图

LD3320语音识别芯片可以说是为语音识别系统专门研发的一款芯片,在日常的工作或一般企业内应用居多,它的特点之一就是可以在非特定人的基础上实现语音识别功能,它的工作程序也是有一套基本流程,如下图4-4所示:LD3320语音识别芯片不像传统的芯片那样,仅仅提供一款数字处理信号的微处理器对输入的语音进行处理分析,它拥有良好的硬件软件上的优化,以及对程序处理的效率,还有特有的不排外非特定人的语音识别系统和完整的特征库,使它一跃成为市场主流。图4-4

语音识别程序流程图因此该语音识别芯片不需要外部的存储器来进行语音处理,它拥有内部的存储器以及处理器,同时也不需要外部的闪存来存储相关的代码以及语音信息。LD3320语音芯片强大的处理功能,使得它不需要外接其他保护作用的芯片。LD3320语音芯片内部自带的处理系统,使得它不需要通过外部下载特征库便可以实现语音识别功能。LD3320同样不需要外接其他芯片和设备来完成MP3播放功能。在本次设计中,语音识别程序的设计是十分重要的,在本次设计中,我反复查阅并参考关于LD3320语音芯片的使用手册,在本次设计中,中断过程是十分重要的,几乎每一次工作与中断都离不开关系,而它的一般流程通常是将语音识别系统进行初始化→将信号传输入特征库→对信号进行匹配→匹配结束后程序中断。(1)对语音识别系统进行初始化。当程序对语音识别系统初始化时,我们要对复位的模式、时钟电路的工作频率、以及信号的输入输出的优先级进行设置。(2)对输入的信号传输进处理系统进行处理识别。信号的传输原理是,每一个需要识别的信号都有一个1字节的专属代号,对于不同的识别对象,识别的代号可以重复,也可以不连续,本次设计使用的LD3320语音识别芯片支持容纳50个识别的对象,本次设计中,我们需要用到的指令如下:

小白:本次设计中语音识别系统的"姓名",我们需要对着麦克风传达"小白"信号,当语音识别模块接受到小白的指令时,会将引脚的一个蓝色指示灯亮起,方可进行下一步操作,此时我们设置的延时为5S,需要在5S内给出下一步指令。开灯:当我们唤醒小白后,对着麦克风传达"开灯"信号,此时单片机将会传输信号,将三个指示灯依次亮起,然后使负载的灯泡亮起;关灯:当我们的负载灯泡处于工作状态下,唤醒小白,对着麦克风传达"关灯"信号,此时单片机收到指令,将三个指示灯依次亮起,使负载的灯泡关闭。打开开关:当我们在唤醒小白的状态下,对着麦克风传达"打开开关"信号,此时单片机收到指令,会使得继电器接通,同时会有一颗指示灯显示继电器状态,表明已接通。关闭开关:当我们在唤醒小白的状态下,对着麦克风传达"关闭开关"信号,此时单片机收到指令,将继电器断开,同时指示灯熄灭,表示继电器已断开。本次设计中采取了代号不同的但连续的识别对象,见下表4-1。表4-1识别列表:编号字符串1Kaideng2Dakaikaiguan3Guanbikaiguan4Guandeng5Xiaobai(3)对信号进行识别处理,我们需要设置ADC通道、ADC增益等寄存器便可以进行语音识别操作,ADC通道是在设计中MIC的输入信息的一条通道,ADC增益是可以设置MIC的00H~7FH的音量大小,设置的大小也是根据环境需要来进行设置,当我们需要快速的进行语音识别并进行工作时,我们可以将ADC增益的数值增大,这样麦克风的音量会变大大,系统的识别反应更快,但对环境内的杂音也会采集到,可能会造成不必要的失误操作;当我们在需要一些微小的需要识别的信号,此时我们需要将ADC增益的数值设置的小一些,这样麦克风的音量会减小,虽然需要近距离的对其发出指令,但它受环境干扰的因素较小,在本次设计中我将ADC增益的数值设定为43H。(4)响应中断。如果麦克风拾取的声音,无论是否还是认不出正常的结果,会产生一个中断信号。中断程序根据值分析结果读取BA寄存器的值,可以知道有几个候选答案,而C5寄存器中的答案是最高分,最有可能正确答案.参考文献[1]雷思孝.单片机原理及实用技术[M].西安:西安电子科技大学出版社,2003

[2]谭浩强,张基温.C语言程序设计教程[M].北京:高等教育出版社,1991

[3]彭伟.单片机程序设计100例[M].北京:电子工业出版社,2009年

[4]马忠梅.单片机C语言应用程序设计[M].北京:北京航空航天大学出版社,2007

[5]郭天祥.新概念51单片机C语言教程[M].北京:电子工业出版社,2009

[6]刘鲲,孙春亮.单片机C语言入门(修订版)[M].北京:人民邮电出版社,2010

[7]陈超.C语言常用函数速查手册[M].北京:化学工业出版社,2010

[8]黄菊生.单片机原理与接口技术[M].北京:国防工业出版社,2007

[9]沈美明,温冬蝉.IBM-PC汇编语言程序设计[M].北京:清华大学出版社,2001

[10]齐向东,刘立群.单片机控制技术实践[M].北京:中国电力出版社,2009

[11]樊尚春.传感器技术与应用[M].北京:北京航空航天大学出版社,2004[12]谭浩强.C语言程序设计[M].北京:清华大学出版社,2005[13]赵力.语音信号处理[M].2版,北京:机械工业出版社,2011[14]杨大志.基于声卡的信号采集技术[J].仪表技术与传感器,2007,7(7):74-75[15]赵亮.单片机应用系统设计与产品开发[M].人民邮电出版社[16]张雄伟,陈亮.现代语音处理技术及应用[M].机械工业出版社,2003,5:26-30[17]马丽静.基于单片机控制的语音识别系统的软件开发[J].电脑开发与应用,2003(05):37-38[18]DavidCook毕树生.机器人制作提高篇[M].北京航空航天大学出版社[19]张彦斌,薛钧义,凌阳.16位单片机原理及应用[M].清华大学出版社[20]耿德根,詹卫前,李青.单片机创新开发与机器人制作[M].北京航天航天大学

谢辞时光匆匆,转眼间大学四年的生活便迎来了尾声,此次毕业设计令我受益匪浅,这不仅是对我大学四年来所学到的知识的一次考察,也是对我的收集资料的能力以及动手能力的一次考验。在设计的过程中,我对单片机编程以及Protel仿真等知识得到了巩固和不少提升,翻阅了相关的书籍以及资料,学习到了不少新的知识。在动手能力方面焊接对我来说也是一个不小的挑战,经过反复练习我才得以成功完成实物。此次毕业设计拓展了我的知识层面,开阔了我的眼睛,巩固了我曾学过的专业知识,锻炼了我查阅资料的能力,在动手能力方面使我学会了认真,谨慎,耐心以及细致。这将近一个学期的毕业设计的任务即将结束时,我内心也松了一口气。在进行毕业设计过程中,也曾有过迷茫,不知下一步该如何下手,对专业知识的不够透彻也对我的进展造成了极大的困扰。在这里我要感谢我的指导教师冯伟功老师,他在我毕业设计的过程中多次对我的疑问做出了解答,也为我寻找资料供我参考,提出了极为宝贵的修改意见和建议,极大地保证了此次设计以及论文的质量和内容,是我毕业设计道路上的指路人,在此由衷的感谢冯老师对我的帮助,以及在设计过程中询问过的同学老师们。

附录附录1:完整电路图

附录2:完整电路PCB图

附录3:完整程序代码#include<REGX51

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论