数字语音迎宾器设计_第1页
数字语音迎宾器设计_第2页
数字语音迎宾器设计_第3页
数字语音迎宾器设计_第4页
数字语音迎宾器设计_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数字语音迎宾器设计摘要在当前社会竞争加剧的形势下,许多服务行业推出了各种新奇的项目来吸引消费者。根据市场调研结果显示,许多商场、酒店、歌厅等场所门口都会站着许多接待员,这种接待方式不仅浪费了很多资源,由于人力成本的不断上升,各企业的成本也随之增加。此外,长时间重复单调的工作不仅会影响接待员的工作热情,还会影响服务质量。目前市面上虽已有许多电子迎宾产品,但有些功能不够完善,人性化程度较低,不能全面体现人类的服务特点。因此,开发设计电子迎宾系统至关重要。数字语音迎宾器是一种基于语音播放,红外检测等技术实现的迎宾系统,能为人员提供快捷、便利的服务体验。与此同时,数字语音迎宾器在设计上需考虑人性化需求,例如可根据不同场景和用户需求提供不同语音提示。本课题研究的内容是关于数字语音迎宾器的设计。该套系统由K210单片机、人体红外检测模块、语音模块、按键、喇叭、摄像头、显示屏、稳压模块。通过人体红外检测模块当监测到人员进门时,播报“欢迎光临”,通过摄像头记录检测人脸并保存在内存卡上;当检测到人员出门时播报“谢谢惠顾”,同时人员图像在液晶屏显示。单片机采用C语言在Keil5环境下进行编译。关键词:单片机技术;语音播报技术;红外检测目录TOC\o"1-3"\h\u第1章绪论 [4]。需要注意的是,由于研究领域不断发展和创新,上述内容只是总结了一些常见的国内外研究现状。随着科技的进步和应用需求的不断变化,数字迎宾器的研究和应用将继续发展并取得更多进展。1.3主要研究内容本课题研究的内容是关于数字语音迎宾器的设计。该套系统由K210单片机、人体红外检测模块、语音模块、按键、喇叭、摄像头、显示屏、稳压模块、蓝牙模块、内存卡。当检测到人员进门时,播报“欢迎光临”;当检测到人员出门时播报“谢谢惠顾”。同时人员图像在液晶屏显示,通过摄像头记录检测人脸并保存在内存卡上。单片机采用C语言在Keil5环境下进行编译。设计成果为实物。第2章系统总体结构2.1单片机型号选择方案一:32单片机指的是中国自主研发的一类单片机产品,由中国电子科技集团公司(CETC)下属的中国长城计算机集团有限公司(CSMC)推出。以下是对32单片机的介绍:架构和指令集:32单片机采用了基于RISC(精简指令集计算机)的架构,具有较高的性能和低功耗特性。它们的指令集主要基于ARMCortex-M系列,包括32位ARM核心和一系列标准指令。高性能和丰富外设:32单片机提供了丰富的外设和接口,包括通用输入输出端口(GPIO)、定时器、串口、模拟到数字转换器(ADC)、数字到模拟转换器(DAC)等。这些外设使得32单片机适用于各种应用领域,如嵌入式系统、工业控制、物联网设备等。开发工具和生态系统:32单片机拥有完善的开发工具链和生态系统支持,包括集成开发环境(IDE)、编译器、调试器等。此外,还有丰富的开发文档、示例代码和社区支持,方便开发者进行软硬件开发和问题解决。低成本和广泛应用:32单片机以其性价比高、成本低廉的特点受到广泛应用。它们适用于各种嵌入式系统和消费电子产品,如智能家居、智能穿戴设备、工业自动化、汽车电子等领域。需要注意的是,32单片机并非特指某一款具体的芯片,而是指一类单片机产品,其中包括了多个型号和系列。在选择和使用32单片机时,需要根据具体的需求和应用场景来选取合适的型号和规格。方案二:52单片机是指基于Intel8051核心的一类单片机产品。8051系列单片机是一种经典的8位单片机,具有广泛的应用领域和较高的市场份额。以下是对52单片机的介绍:架构和指令集:52单片机采用经典的Harvard架构,由CPU核心、片内RAM、片内ROM/Flash存储器、各种外设和接口组成。它们的指令集基于8051架构,包括一系列标准指令和扩展指令,支持8位数据操作。外设和接口:52单片机提供了丰富的外设和接口,包括通用输入输出端口(GPIO)、定时器、串口、模拟到数字转换器(ADC)、数字到模拟转换器(DAC)等。这些外设使得52单片机适用于各种应用领域,如家电控制、电子仪器、工业自动化等。开发工具和生态系统:52单片机有多个厂家提供的开发工具和配套支持,包括集成开发环境(IDE)、编译器、调试器等。此外,有大量的开发文档、示例代码和社区支持可供开发者参考和交流。成熟和广泛应用:由于8051系列单片机的成熟和稳定性,以及广泛的市场应用,52单片机在各个行业中得到了广泛应用。它们被广泛应用于家用电器、电子设备、工业控制、通信设备等领域。软件兼容性:由于8051系列单片机的广泛应用,开发者可以利用现有的软件资源和经验进行开发。许多编译器、开发工具和代码库都对52单片机提供了支持,简化了开发过程。需要注意的是,52单片机是基于8051核心的一类单片机产品,而不是特指某一款具体的芯片。在选择和使用52单片机时,需要根据具体的需求和应用场景来选取合适的型号和规格。方案三:K210单片机是一款由中国自主研发的高性能人工智能芯片,由国内科技公司旷视科技(Megvii)推出。以下是对K210单片机的介绍:架构和处理能力:K210单片机采用了RISC-V架构,是中国自主研发的首款RISC-V指令集的AI芯片。它集成了双核处理器,包括双核RISC-VCPU和AI协处理器。K210单片机具有较高的运算能力和处理性能,适用于各种复杂的AI计算任务。AI功能和应用:K210单片机内置了强大的AI算法加速器,能够高效地进行机器视觉和深度学习计算。它支持多种常见的神经网络模型,如卷积神经网络(CNN)、循环神经网络(RNN)等,用于图像识别、目标检测、人脸识别等人工智能应用。外设和接口:K210单片机提供了丰富的外设和接口,包括通用输入输出端口(GPIO)、UART串口、SPI、I2C等,以及摄像头接口、音频接口等。这些外设和接口使得K210单片机能够连接各种传感器和外部设备,实现更广泛的应用。开发工具和生态系统:K210单片机拥有完善的开发工具链和生态系统支持。它提供了开发板和相关配套的软件开发工具,包括编译器、调试器、软件库等。此外,旷视科技还建立了开发者社区,提供技术文档、示例代码和技术支持,方便开发者学习和使用K210单片机。应用领域:K210单片机在人工智能和物联网领域有广泛的应用潜力。它可以用于智能摄像头、智能家居、机器人、无人驾驶、工业自动化等领域,以实现智能感知、智能决策和智能控制等功能。K210单片机作为一款国内自主研发的AI芯片,具有高性能的处理能力和丰富的外设接口,以及广泛的应用潜力。它在推动中国芯片产业发展和促进人工智能技术应用方面发挥了重要作用。这里选择方案三。本实验采用的最小系统如下图。图2-1K210单片机最小系统原理图2.2显示模块选择方案一:LED,发光二极管。它是一种通过控制半导体发光二级管的显示方式。LED显示屏是经LED点阵组成的电子显示屏,可以在各种场景下使用。LED显示屏亮度很高而且可以进行调节,可以根据室内室外不同场景下,调节不同的亮度。LED显示屏全屏显示效果非常显著,也有防水防晒防潮的优点,但是LED显示屏具有自燃的风险,如果对长期未进行线路检查导致线路老化和短路,就会导致自燃。而且随着城市的进步,长期未更换的显示屏会出现模糊,运行卡顿的现象,影响城市的良好形象。它的色彩对比度一般,在显示比较亮丽的图像时,展现的效果并不是很好,会导致屏幕发灰,而且容易死灯,个别像素点不亮导致整体观感较差,维修费用普遍较高。方案二:液晶显示屏是目前市场上出现比较多的显示屏,作为一种比较先进的显示设备,它显示出的效果很清晰,在日常生活中,很多地方都离不开它的身影,也给大家的生活提供了很多帮助并产生了很大影响。凭借着本身良好的性能,它适用于很多使用电池的电子在电子市场上发展得越来越好。LCD显示屏是根据电光效应生产制造的,现在大部分厂家出售的LCD显示屏大多采用的是定线状液晶,通过不断的发展和研究,现在市面上LCD显示屏体积变得很小,厚度也比以前的显示屏要薄,在产品质量上也是有着质的飞跃。它在工作时能耗和电压都比较低,工作时不仅经济实惠而且比较安全,最重要的是它没有辐射,对人们追求健康生活有很好的反应。组装时,这种显示屏能与其他部件很好地匹配,适应性和工作效率都很好。依靠先进的技术和保护措施,所以在使用时液晶显示屏具有很好的显示效果,对人的眼睛能够起到一定的保护作用。这里选择方案二。图2-2LCD显示屏实物图第3章系统的硬件部分设计3.1系统总体设计本系统主要设计数字语音迎宾器,系统主要包括K210核心板,2.4寸LCD显示屏,TF内存卡,GC0328摄像头,备用电源,语音模块,红外感应模块,按键,喇叭,蓝牙模块。总体原理图如下所示:图3-1总体原理图3.2系统的主要功能模块设计3.2.1CH340模块设计CH340是一款常见的USB转串口芯片,由中国厂商江苏长电科技股份有限公司(WCH)研发和生产。以下是对CH340的介绍:功能和特点:CH340芯片是一种高度集成的USB转串口解决方案。它将USB接口转换为串行通信接口(如RS232、RS485等),使计算机可以通过USB接口与外部设备进行串口通信。CH340具有较小的封装尺寸、低功耗、稳定可靠的性能。USB驱动程序:使用CH340芯片进行USB转串口通信时,需要安装相应的USB驱动程序。不同操作系统(如Windows、Linux、Mac)可能需要不同的驱动程序。一旦安装了正确的驱动程序,计算机将能够识别CH340芯片并使用相应的串口通信功能。应用领域:CH340芯片被广泛应用于各种需要串口通信的设备和系统中。它常用于单片机开发板、嵌入式系统、工业自动化设备、电子测量仪器等领域。通过CH340芯片,这些设备可以与计算机进行方便的数据交互和通信。开发工具和支持:CH340芯片具有完善的开发工具和支持生态系统。开发者可以使用常见的串口调试工具和编程软件进行开发和调试。此外,CH340芯片的文档和示例代码也提供了丰富的参考资料,方便开发者使用和集成。低成本和普及度:CH340芯片的成本相对较低,使其成为大量产品中的常用芯片之一。由于其性价比高和广泛的应用范围,CH340芯片在中国乃至全球市场上得到了广泛普及和应用。需要注意的是,CH340芯片是一种USB转串口解决方案,用于实现USB与串口之间的转换。它并非特指某一款具体的芯片,而是一个代表了该系列芯片的名称。在使用CH340芯片时,需要根据具体的需求和系统要求选择相应的型号和版本。图3-2CH340模块原理图3.2.2红外传感器模块设计红外传感器是一种能够探测和测量红外辐射的电子器件。它利用红外辐射与物体之间的相互作用,将红外辐射转化为电信号,从而实现对目标物体的探测和测量。以下是对红外传感器的介绍:工作原理:红外传感器通过感知环境中的红外辐射来实现目标物体的检测。物体在自然环境中会辐射出红外光,其特征与物体的温度和表面特性有关。红外传感器接收到红外辐射后,使用内部的光敏元件(如红外光敏二极管)将其转换为电信号,然后通过信号处理电路对这些信号进行分析和解读。类型和应用:红外传感器的类型多种多样,包括红外接收器和红外发射器等。常见的红外传感器有红外接近传感器、红外遥控器、红外体温计、红外安防系统等。红外传感器在自动化控制、安防监控、无人驾驶、消费电子等领域有广泛的应用。工作频段:红外传感器通常工作在红外光谱的特定频段,常见的频段有近红外(NIR)、中红外(MIR)和远红外(FIR)。不同的红外传感器适用于不同频段的红外辐射检测和测量。特点和优势:非接触性:红外传感器可以在没有物理接触的情况下进行目标物体的探测,无需直接接触目标物体。高灵敏度:红外传感器对红外辐射具有较高的灵敏度,能够检测到微弱的红外信号。快速响应:红外传感器具有快速的响应速度,可以实时检测和测量目标物体的红外辐射。宽波长范围:不同类型的红外传感器可以覆盖不同的红外光谱范围,适用于不同应用场景的需求。图3-3红外传感器模块原理图3.2.3显示模块设计LCD显示模块是一种液晶显示技术的应用,通过液晶分子的定向排列和光的透过来实现图像显示。以下是LCD显示模块的工作原理:液晶层:LCD显示模块包含一个液晶层,液晶层由液晶分子组成,通常是液晶材料夹在两个平行的玻璃基板之间。液晶分子具有长而细长的形状,在没有外界影响下呈现无规则排列。偏振器:液晶层的上下两侧分别放置了偏振器。偏振器是一种具有方向性的光过滤器,只允许特定方向的光通过。电极和电场:在液晶层的两个玻璃基板上分别涂覆了透明导电层,形成电极。当给液晶层施加电压时,电极之间会形成电场。像素和液晶分子排列:液晶显示模块的每个像素都与电极相对应。液晶分子在电场的作用下,会沿着电场方向排列,改变其定向状态。液晶分子的排列状态决定了光的透过程度。光透过和阻挡:当没有电场施加到液晶层时,液晶分子呈现无规则排列,光无法通过液晶层,显示为暗状态。当施加电场时,液晶分子会按照电场方向排列,使得光能够透过液晶层,显示为亮状态。色彩滤光片:为了实现彩色显示,LCD显示模块在液晶层上方加入了色彩滤光片。色彩滤光片可分为红、绿、蓝三原色,通过调节透过的光的颜色来呈现不同的颜色。后光源:为了提供显示背景的光源,LCD显示模块通常会在背光源后方安置一个光源,例如冷阴极管(CCFL)或LED。图3-4显示模块原理图3.2.4稳压模块设计稳压模块(VoltageRegulatorModule,VRM)是一种电源管理器件,用于将输入电压调节为稳定的输出电压,以供给电路中的其他组件和设备。稳压模块的主要功能是确保输出电压在输入电压变化、负载变化和环境变化的情况下保持稳定。以下是对稳压模块的介绍:输入和输出:稳压模块通常有一个输入端和一个输出端。输入端连接到电源供电,可以接受一定范围的输入电压。输出端提供稳定的输出电压,以供给电路中的其他电子器件使用。工作原理:稳压模块采用一系列的电子元件和电路来实现电压调节。其中最常见的是使用稳压器芯片(例如线性稳压器或开关稳压器)来实现电压调节功能。稳压器芯片根据输入电压和负载变化调整其内部电路,以产生稳定的输出电压。稳定性和精度:稳压模块的关键目标是提供稳定和精确的输出电压。它需要对输入电压的波动、负载的变化和温度的变化具有良好的抑制能力,以确保输出电压的稳定性和精度。保护功能:稳压模块通常还具有多种保护功能,以保护电路和器件免受故障和损坏。常见的保护功能包括过载保护、过热保护、短路保护和过压保护等。类型和规格:稳压模块有多种类型和规格可供选择,以适应不同的应用需求。常见的包括线性稳压模块(LDO)、开关稳压模块(DC-DCConverter)、可调稳压模块和固定稳压模块等。应用领域:稳压模块广泛应用于各种电子设备和系统中,例如计算机、通信设备、消费电子产品、工业自动化设备等。它们可用于提供稳定的电源供应,保证电路和器件的正常运行。图3-5稳压模块原理图3.2.5摄像头模块设计摄像头又叫电子眼,是视频输入设备,本设计采用摄像头是用于实时监控,GC0328摄像头:通用24P摄像头200W像素。其工作电压较低,体积很小,具备UXGA摄像和影像处理器的所有功能。当人物通过镜头生成光学图像映射到图像传感器,然后转变为电信号,经过模数变换后变成数字图像信号,在信号处理芯片中加工处理,最后通过接口传输,通过显示器就可以看见图像了。它一般具有静态图像捕捉和视频摄像功能。图3-6摄像头模块原理图3.2.6语音模块设计SYN6288是一款语音合成芯片,由深圳市思必驰科技有限公司开发和生产。以下是对SYN6288的介绍:语音合成功能:SYN6288芯片是一种专门用于语音合成的集成电路。它能够将输入的文字信息转换为自然流畅的人工语音输出。通过SYN6288芯片,用户可以实现将文字信息转化为语音的功能。内置音频库:SYN6288芯片内置了丰富的音频库,包含了各种不同的语音音色和语音效果。用户可以通过选择合适的音频库来实现不同语音风格和语音特点的输出。高质量语音输出:SYN6288芯片具有较高的语音合成质量,能够产生清晰、自然、流畅的语音输出。它采用先进的语音合成算法和声学模型,通过数字信号处理技术实现高保真度的语音合成。控制接口:SYN6288芯片提供了多种控制接口,例如串行接口(UART)、并行接口(DATA)、I2C接口等。这些接口使得芯片可以与外部的控制器或主机系统进行通信和控制。图3-7语音模块原理图3.2.7TF内存卡TF卡存储数据是通过数字存储技术来存储的。相比其他的存储设备,TF内存卡体积小,便于携带并且具有很大的存储空间。TF内存卡是可插拔的。在日常生活中,我们使用的很多设备比如电脑,照相机,MP4等,通过设备采集信息,将信息存储到内存卡中,极大程度上提高了产品的功能,不但方便采集数据,而且提高了设备的灵活性。图3-8TF内存卡原理图

3.2.8蓝牙模块设计本设计通过蓝牙模块将上位机和实物进行连接。从而可以在上位机进行一些日期时间的设置,并且可以监测到人员进出状态,人脸识别结果,以及当前系统时间。蓝牙模块是一种在短程无线通信中,将蓝牙功能整合在一起的PCBA板,按照功能划分,可以将它分成两种:数据模块和语音模块。蓝牙模块指的是集成蓝牙功能的芯片基本电路集合,在无线网络通讯中经常使用到蓝牙模块,它可以被划分为三种主要类型:数据传输、蓝牙音频、蓝牙音频+数据二合一等。图3-9蓝牙模块原理图

3.2.9按键本设计采用六个按键分别是RST,BOOT,SYS,KEY1,KEY2,KEY3。RST按键是复位按键,可以通过此按键将设计变为初始状态。SYS按键是开始按键,按下SYS后系统开始正常运行。KEY1,KEY2,KEY3可以调试时间。按键是日常情况下见得比较多并且可以操作简单的来控制实物。按键通常由一个按键开关和触发装置组成。按键开关是一个电气开关,当按下按键时,内部的金属触点会闭合,形成电路通路。触发装置通常是按键的外部结构,包括按键帽、弹簧等,用于提供按下和释放的力量。按键通常通过引脚或线路与电路板或电子设备连接。按键的引脚通常与其他元件的引脚相连接,形成电路的输入端。图3-10按键原理图第4章系统的软件设计4.1供电模块设计采用两种供电方式,首选是电源供电,当电源停止供电的时候,再进行电池供电以防数据丢失。单片机初始化成功会判断供电方式,当没有检测到电源供电时会重新判断供电方式。图4-1供电模块流程图

4.2红外感应模块设计红外感应是将一个红外发射器和一个红外接收器连接在一起,当红外发射器发出红外线时,红外接收器就会接收到红外线的反射信号,从而检测物体的运动状态或某种物体的存在。在设计中,通过人体红外感应模块检测到人员进入,检测成功后上传数据到单片机。图4-2红外感应模块流程图

4.3语音模块设计检测人物的进出移动,从而发出不同的语音播报。当检测到人员进门时,播报“欢迎光临”;当检测到人员出门时播报“谢谢惠顾”。图4-3语音模块流程图第5章系统测试5.1系统实物图图5-1系统完整实物图5.2测试原理测试用例要包括欲测试的功能、应输入的数据和预期的输出结果。测试数据应该选用少量、高效的测试数据进行尽可能完备的测试;基本目标是:设计一组发现某个错误或某类错误的测试数据,测试用例应覆盖方面:输入用户实际数据以验证系统是满足需求规格说明书的要求;测试用例中的测试点应首先保证要至少覆盖需求规格说明书中的各项功能,并且正常。

5.3供电功能测试数字语音迎宾器采用电源供电和电池供电两种,电池供电是通过锂电池进行供电,当没有电源供电时,电池会进行供电不会因为断电而造成数据丢失。图5-2电池供电实物图电源供电是通过Type-C接口进行供电,电源供电会保证设计实物更稳定的进行工作。图5-3电源供电实物图

5.4上位机功能测试上位机可以显示当前系统时间,系统状态,人脸识别结果,人员状态,通过上位机对数字语音迎宾器进行时间日期的设定。系统运行状态为RUN,当无状况时人员状态显示为0。图5-4上位机设置实物图系统运行状态下,当有人进入人员状态显示为0,当有人出人员状态显示为2。图5-5上位机设置实物图

5.5语音功能测试当有人从左到右通过数字迎宾器的时候,数字迎宾器识别到人脸,进行语音播报,欢迎光临,当人从右往左通过数字迎宾器的时候,进行语音播报谢谢惠顾。图5-6模块实物图第6章总结与展望6.1总结本文介绍了一种数字语音迎宾器系统的设计,该系统能够通过人体红外检测模块检测到人员进出,并通过摄像头实时监测,当监测到人员进门时,进行语音播报,同时人员图像在液晶屏显示。以下是对该系统设计的总结:该系统是通过使用单片机作为控制核心,通过人体红外检测模块、语音模块、按键、喇叭、摄像头、显示屏、无线模块等硬件组件,实现对人员进出的提醒和监测。系统中的人体红外感应模块可以实时监测,并将数据传输给单片机进行处理。在供电模块设计方面,在实验中,采用两种供电方式,首选是电源供电,当电源停止供电的时候,再进行电池供电以防数据丢失。该系统经过测试并取得了良好的结果。实验结果表明,该系统能够准确地监测人员进出,并进行语音播报,当监测到人员进门时,播报“欢迎光临”;当检测到人员出门时播报“谢谢惠顾”。人员进出数据记录在内存卡内。6.2展望目前,市面上出现了很多电子迎宾器,但是有些产品没有较为完善的功能,人性化程度比较低,不能全方位的体现人的服务特点。与此相比,数字语音迎宾器具有很强的优势,不仅价格便宜,整体工作方式稳定,还可以给顾客带来了很好的体验。随着电子信息技术与数字化技语音技术的发展,开发出一种服务质量好,经济实用的控制系统是很有必要的。并且电子迎宾系统不仅可以减少人力成本,并且便于管理,还可以改善环境、提高经济效益。为此决定设计新型的电子迎宾器来替代人员接待。数字语音迎宾装置是以红外激光为传感源,配合语音电路组装而成,可以随时随地改变语音电路中的录音,以满足不同场所的不同使用要求,并且可以通过摄像头记录人员进出状态,并存储到内存卡中。总之,数字语音迎宾器的设计需要综合运用多种技术和方法进行实现和优化。只要设计合理、功能完善,数字语音迎宾器将会成为各种场景中不可或缺的智能化服务工具,为用户提供更加便捷、快速、舒适的服务体验。该数字语音迎宾系统的研究设计,符合社会经济发展的必然趋势,并且具有广阔的市场前景。参考文献相迎军,李兴城,李传军.基于AT89C4051单片机的专用信号发生器设计与应用[J].微计算机信息.2004.王水思,李改霞,阳泳.基于STC15F104W单片机的迎宾器设计[J].电子制作.2014.李敏.基于单片机的迎宾机器人设计[J].电子测试.2018.卢飞跃,刘志锋.基于AT89S52单片机的迎宾机器人设计[J].机电工程技术.2010.张志科,张素豪.基于51单片机人流量单向检测程序设计[J].忻州师范学院学报.2009.王水思,李改霞,阳泳,江世明.基于STC15F104W单片机的迎宾器设计[J].电子制作.2014.吴子俊,余建坤,阳泳,周毅.多功能智能迎宾器设计与制作[J].数字技术与应用,2015.谭思佳,江世明,阳泳.基于AT89C4051单片机的单向迎宾器设计[J].电子制作.2015.郭洪红,毛智勇,雷保珍.基于AT89C52与工控机的迎宾机器人设计[J].机器人技术与应用.2012.魏佳鑫.面向语音识别的听觉诱发脑机接口研究[D].太原科技大学.2021.宋青松,田正鑫,孙文磊,吴小杰,安毅生.用于孤立数字语音识别的一种组合降维方法[J].西安交通大学学报,2016,50(06):42-46.张静亚.基于HMM的汉语连续数字语音识别[D].苏州大学,2005.向晖.数字语音识别与合成[J].电子世界,2019(15):163-164.高文曦,孙小琪,镇丽华.基于遗传算法数据降维的汉语数字语音识别[J].计算机系统应用,2016,25(01):150-153.王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005(10):64-67.郑展恒.数字语音识别系统[J].桂林电子科技大学学报,2011,31(06):439-441.王艳芬.一种用于无线通信的数字语音识别系统设计[J].现代电子技术,2016,39(16):151-154.RancangBangunAlatMonitoringArusdanTeganganBerbasisMikrokontrolerdenganSMSGatewayRancangBangunAlatMonitoringArusdanTeganganBerbasisMikrokontrolerdenganSMSGateway[J].AfrizalFitriandi,EndahKomalasari,HerriGusmediElectrician..2016.DesignandDevelopmentofECGSimulatorandMicrocontrollerBasedDisplayer[J].ShirzadfarH,KhanahmadiMJournalofBiosensors&Bioelectronics.2018.DesignofanAdaptivePredictiveCoderUsingaSingle-ChipDigitalSignalProcessor[R].Randolph,M.A.1985.DesignofUnidirectionalHigh-frequencyLinkInverterBasedonSTCSingleChip[C].XingYalang,ZhaoJincheng,SunShiyuTheSecondInternationalSymposiumonTestAutomationInstrumentation(ISTAI'2008).2008.Pseudorobotbasedmethodstoanalyzekinematicsanddynamicsofroboticsystemsfromadesignperspective.[D].Deshpande,AshishD.2007.附录电路图

源代码importsensorimportimageimportlcdimportKPUaskpuimporttimefromMaiximportFPIOA,GPIOimportgcfromfpioa_managerimportfmfromboardimportboard_infoimportutime#task_fd=kpu.load(0x300000)#task_ld=kpu.load(0x400000)#task_fe=kpu.load(0x500000)task_fd=kpu.load("/sd/FaceDetection.smodel")task_ld=kpu.load("/sd/FaceLandmarkDetection.smodel")task_fe=kpu.load("/sd/FeatureExtraction.smodel")clock=time.clock()fm.register(board_info.BOOT_KEY,fm.fpioa.GPIOHS0)key_gpio=GPIO(GPIO.GPIOHS0,GPIO.IN)start_processing=FalseBOUNCE_PROTECTION=50defset_key_state(*_):globalstart_processingstart_processing=Trueutime.sleep_ms(BOUNCE_PROTECTION)key_gpio.irq(set_key_state,GPIO.IRQ_RISING,GPIO.WAKEUP_NOT_SUPPORT)lcd.init()sensor.reset()sensor.set_pixformat(sensor.RGB565)sensor.set_framesize(sensor.QVGA)sensor.set_hmirror(1)sensor.set_vflip(1)sensor.run(1)anchor=(1.889,2.5245,2.9465,3.94056,3.99987,5.3658,5.155437,6.92275,6.718375,9.01025)#anchorforfacedetectdst_point=[(44,59),(84,59),(64,82),(47,105),(81,105)]#standardfacekeypointpositiona=kpu.init_yolo2(task_fd,0.5,0.3,5,anchor)img_lcd=image.Image()img_face=image.Image(size=(128,128))a=img_face.pix_to_ai()record_ftr=[]record_ftrs=[]names=['Mr.1','Mr.2','Mr.3','Mr.4','Mr.5','Mr.6','Mr.7','Mr.8','Mr.9','Mr.10']ACCURACY=85while(1):img=sensor.snapshot()clock.tick()code=kpu.run_yolo2(task_fd,img)ifcode:foriincode:#Cutfaceandresizeto128x128a=img.draw_rectangle(i.rect())face_cut=img.cut(i.x(),i.y(),i.w(),i.h())face_cut_128=face_cut.resize(128,128)a=face_cut_128.pix_to_ai()#a=img.draw_image(face_cut_128,(0,0))#Landmarkforface5pointsfmap=kpu.forward(task_ld,face_cut_128)plist=fmap[:]le=(i.x()+int(plist[0]*i.w()-10),i.y()+int(plist[1]*i.h()))re=(i.x()+int(plist[2]*i.w()),i.y()+int(plist[3]*i.h()))nose=(i.x()+int(plist[4]*i.w()),i.y()+int(plist[5]*i.h()))lm=(i.x()+int(plist[6]*i.w()),i.y()+int(plist[7]*i.h()))rm=(i.x()+int(plist[8]*i.w()),i.y()+int(plist[9]*i.h()))a=img.draw_circle(le[0],le[1],4)a=img.draw_circle(re[0],re[1],4)a=img.draw_circle(nose[0],nose[1],4)a=img.draw_circle(lm[0],lm[1],4)a=img.draw_circle(rm[0],rm[1],4)#alignfacetostandardpositionsrc_point=[le,re,nose,lm,rm]T=image.get_affine_transform(src_point,dst_point)a=image.warp_affine_ai(img,img_face,T)a=img_face.ai_to_pix()#a=img.draw_image(img_face,(128,0))del(face_cut_128)#calculatefacefeaturevectorfmap=kpu.forward(task_fe,img_face)feature=kpu.face_encode(fmap[:])reg_flag=Falsescores=[]forjinrange(len(record_ftrs)):score=kpu.face_compare(record_ftrs[j],feature)scores.append(score)max_score=0index=0forkinrange(len(scores)):ifmax_score<scores[k]:max_score=scores[k]index=kifmax_score>ACCURACY:a=img.draw_string(i.x(),i.y(),("%s:%2.1f"%(names[index],max_score)),color=(0,255,0),scale=2)else:a=img.draw_string(i.x(),i.y(),("X:%2.1f"%(max_score)),color=(255,0,0),scale=2)ifstart_processing:record_ftr=featurerecord_ftrs.append(record_ftr)start_processing=Falsebreakfps=clock.fps()print("%2.1ffps"%fps)a=lcd.display(img)gc.collect()#kpu.memtest()#a=kpu.deinit(task_fe)#a=kpu.deinit(task_ld)#a=kpu.deinit(task_fd)importKPUaskpuimportsensorimportlcdfromMaiximportGPIOfromfpioa_managerimportfmfromboardimportboard_infoimporttimeimportgc###############config#################class_num=3sample_num=15THRESHOLD=11class_names=['class1','class2','class3']board_cube=0########################################defdraw_string(img,x,y,text,color,scale,bg=None):ifbg:img.draw_rectangle(x-2,y-2,len(text)*8*scale+4,16*scale,fill=True,color=bg)img=img.draw_string(x,y,text,color=color,scale=scale)returnimgsensor.reset()sensor.set_pixformat(sensor.RGB565)sensor.set_framesize(sensor.QVGA)sensor.set_windowing((224,224))ifboard_cube==1:sensor.set_vflip(True)sensor.set_hmirror(True)lcd.init(type=2)lcd.rotation(2)else:lcd.init()fm.register(board_info.BOOT_KEY,fm.fpioa.GPIOHS0)key=GPIO(GPIO.GPIOHS0,GPIO.PULL_UP)try:delmodelexceptException:passtry:delclassifierexceptException:passgc.collect()model=kpu.load(0x300000)classifier=kpu.classifier(model,class_num,sample_num)cap_num=0train_status=0last_cap_time=0last_btn_status=1while1:img=sensor.snapshot()ifboard_cube:img=img.rotation_corr(z_rotation=90)img.pix_to_ai()#captureimgiftrain_status==0:ifkey.value()==0:time.sleep_ms(30)ifkey.value()==0and(last_btn_status==1)and(time.ticks_ms()-last_cap_time>500):last_btn_status=0last_cap_time=time.ticks_ms()ifcap_num<class_num:index=classifier.add_class_img(img)cap_num+=1print("addclassimg:",index)elifcap_num<class_num+sample_num:index=classifier.ad

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论