毕业设计语音文本显示系统.doc

上传人：过*** IP属地：江西上传时间：2019-12-16 格式：DOC 页数：44 大小：347.50KB 积分：15 举报 版权申诉

免费预览已结束，剩余39页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

兰州工业学院毕业设计说明书（论文） I 摘要让机器听懂人类的语音 ,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术, 语音识别是一门交叉学科，所涉及的领域有信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。其应用领域也非常广，例如相对于键盘输入方法的语音输入系统、可用于工业控制的语音控制系统及服务领域的智能对话查询系统，在信息高度化的今天，语音识别技术及其应用已成为信息社会不可或缺的重要组成部分。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时，语言也是人与机器之间进行通信的重要工具，它是一种理想的人机通信方式，因而可为信息处理系统建立良好的人机交互环境，进一步推动计算机和其他智能机器的应用，提高社会的信息化程度。随着嵌入式技术和通信技术的发展，智能机已成为电子技术发展的主流趋势，目前在智能机领域，从处理器选型、操作系统选择以及应用程序开发都是研究的热点。本设计利用 ARM 处理器开发处理音频信号，通过一个 ARM9 芯片 S3C2410 作为处理器的嵌入式语音采集系统，结合 LD 3320 的嵌入式语音识别系统阐述了语音数据的采集与处理，采用带汉字库的 12864 显示屏作为语音显示系统。它完成了基于非特定人的语音识别系统的静态测试，其对于语音命令的平均识别率可达 90%，并应用该系统构成了语音文本显示系统，该系统能对近距离规范的语音进行采样识别，在内部处理转换成文本信息在显示屏上显示。关关键键词词：语音识别； ARM 处理器； LD 3320; 12864; 信号。兰州工业学院毕业设计说明书（论文） II Abstract Let the machine to understand human speech,it is a long dreamed of things. The speech recognition technology is to make the machine hrough the recognition and understanding of the process of speech signal transfer into the corresponding text or command of high technology,speech recognition is a cross-discipinary, involved in the areas of signal processing, pattern recognition theory, sound mechanism and auditory mechanism,artificial intelligence and so on.its application field is very wide,such as relative to the keyboard input mothod of speech input system, can be used for industrial control voice control system and service in the field of intelligent dialogue in the information inquiry system, highly today,speech recognition technology and its appliication in the information society has become an important part of. Through the phonetic transfer information is the most important and the most effective, most commonly used and the most convenient exchange information form. At the same time, the language is human and machine the important tool of communication between, it is a kind of ideal man-machine communication way, thus for information processing system to retablish good interactive environment, further promote computer and other intelligent machine application,improve the social information degree. With the embedded technology and communication technology development, the intelligent electronic technology has becom the mainstream of development trend,in the field of intelligent,from the processor selection,operating system selection and application development is the research hotspot. this design based on the ARM processor development processing audio signal trough a ARM9 processor S3C2410 chip as the embedded speech acquisition system, LD 3320 embedded speech recognition system elaborated the voice data acquisition and processing,the adoption of the beld which consists of 12864 display as a voice 兰州工业学院毕业设计说明书（论文） III display system, It completed based on speaker-independent speech recognition system static test,the voice commands for the average recognition rate of up to 90%,and application of the system constitutes the speech text display system,this system could be used for close standard speech sampling recognition,in the internal processing into text information in the screen display. Keywords: speech recognition； ARM processor； LD 3320; 12864; Signal. 兰州工业学院毕业设计说明书（论文） IV 目录摘要 . Abstract. 前言.1 1 系统整体方案 .4 1.1 总体方案 .4 1.2 语音识别原理 .4 2 系统硬件设计 .7 2.1 硬件模块主体关系.7 2.2 电源模块 .8 2.3 寄存器模块 .9 2.4 控制单元模块 .10 2.4.1 ARMS3C2410 芯片简介 .10 2.5 语音识别模块 .11 2.5.1 LD 3320 芯片简介 .12 2.5.2 LD 3320 功能单元 .13 2.5.3 LD 3320 芯片模式选择.14 2.5.4 关键词的 ID 及其设置 .16 2.5.5 反应时间 .16 2.6 GPRS 模块 .18 2.7 语音拨号模块 .18 2.8 语音短信模块 .19 2.9 LCD 显示连接电路 .19 2.9.1 12864 芯片简介 .21 3 系统软件设计 .23 3.1 语音识别操作流程.23 3.2 系统程序流程 .24 兰州工业学院毕业设计说明书（论文） V 4 软件调试 .26 4.1 上电调试 .26 4.2 读写寄存器调试 .26 4.3 检查存储器初始值.26 5 硬件调试 .28 5.1 硬件电路调试 .28 5.2 硬件功能检查 .28 5.3 综合调试 .28 结论.29 致谢.30 参考文献 .31 附录.32 兰州工业学院毕业设计说明书（论文） 1 前言 1、背景介绍语言是人类传递信息的主要手段，语音识别技术是目前世界上最热门和最具发展前景的新型信息技术之一。语音识别技术是近年来十分活跃的研究领域。语音识别系统的实用化研究是语音识别研究的一个主要方向。语言是人类特有的功能 ,是人们思维最重要的寄托体，是人类交流最主要的途径。语音是语言的声学表现，是人类交流信息最自然、最有效、最方便的手段。语言和语音与人类社会科学文化发展紧密相连。语音识别技术是让机器接收，识别和理解语音信号，并将其转换成相应的数字信号的技术。它是一门交叉学科，涉及到语音语言学、数理统计、计算机、信号处理等一系列学科。 2、发展历史语音识别技术的研究开始二十世纪50 年代。1952 年，AT 内置外部存储器控制器（ SDRAM 控制和芯片选择逻辑）; LCD 控制器，一个 LCD 专业 DMA; 4 个带外部请求线的 DMA; 3 个通用异步串行端口（ IrDA1.0，16-Byte Tx FIFO and 16-Byte Rx FIFO）; 2 通道 SPI; 一个多主 I2C 总线，一个 I2S 总线控制器 ; SD 主接口版本 1.0 兰州工业学院毕业设计说明书（论文） 11 和多媒体卡协议版本 2.11 兼容; 两个 USB HOST，一个 USB DEVICE（VER1.1）;4 个 PWM 定时器和一个内部定时器 ;看门狗定时器 ;117 个通用 I/O;56 个中断源 ;24 个外部中断 ;电源控制模式：标准、慢速、休眠、掉电;8 通道 10 位 ADC 和触摸屏接口 ;带日历功能的实时时钟 ;芯片内置 PLL;设计用于手持设备和通用嵌入式系统 ;16/32 位 RISC 体系结构，使用 ARM920T CPU 核的强大指令集 ;带 MMU 的先进的体系结构支持 WinCE、EPOC32、Linux; 指令缓存（ Cache）、数据缓存、写缓存和物理地址TAG RAM，减小了对主存储器带宽和性能的影响 ;ARM920T CPU 核支持 ARM 调试的体系结构 ;内部先进的位控制器总线（ AMBA）（AMBA2.0，AHB/APB）。 S3C2410 系统管理 :小端/大端支持 ;地址空间：每个 BANK128MB（全部为 1GB）;每个 BANK 可编程为 8/16/32 位数据总线 ;BANK0 到 BANK6 为固定起始地址;BANK7 可编程 BANK 起始地址和大小 ;一共 8 个存储器 BANK;前 6 个存储器 BANK 用于 ROM、SRAM 和其它;两个存储器 BANK 用于 ROM、SRAM、和 SDRAM（同步随机存储器） ;支持等待信号用以扩展总线周期 ;支持 SDRAM 掉电模式下的自刷新 ;支持不同类型的 ROM 用于启动（NOR/NAND Flash、EEPROM 和其它）。 S3C2410 芯片封装与型号:272-FBGA 封装;S3C2410A-20、S3C2410A-26; 区别：前者主频最高为 200MHZ、后者主频最高为 266MHZ。 S3C2410 连接电路图 2-4 所示: 兰州工业学院毕业设计说明书（论文） 12 CO NV ST CS RD WR EO C R39 10K BU SY FRSTDA TA INT/EX T-CLK CLKIN STBY R40 10K H /S SEL EIN T0 1 2 CO NV STA RT 3 N G CSI 4 nO E 5 V D D5V 6 44 27 2 1 28 V D D33V 36 A V DD 5V 22 11 21 C39 104 V D D5V V D D5V 35 37 17 A G ND 12 A G ND 26 A G ND 25 A D D5V 24 1 23 2 10 9 8 7 D V DD D G ND AG N D A G ND A G ND A VD D V REF V REF-GN D SL4 SL3 SL2 SL1 43DATA0 42DATA1 41DATA2 40DATA3 39DATA4 38DATA5 34DATA6 33DATA7 32DATA8 31DATA9 30DATA10 29DATA11 DB0 DB1 DB2 DB3 DB4 DB5 DB6 DB7 DB8 DB9 DB10 DB11 Vin4b Vin4a Vin3b Vin3a Vin2b Vin2a Vin1b Vin1a 13 14 15 16 18 19 20 21 AGND AIN8 AGND AIN7 AGND AIN6 AGND AIN5 图 2-4 S3C2410 连接电路图 2.5 语音识别模块 LD 3320 的内部集成了快速稳定的优化算法，不需外接Fla-sh、RAM，不需要用户事先训练和录音而完成非特定人语音识别，识别准确率高。 LD 3320 采用并行方式直接与 AR9 S3C2410 相接,均采用 1 k 电阻上拉 , A0 用于判断是数据段还是地址段 ;控制信号 RDB、WRB、CSB,复位信号 RSTB 以及中断返回信号 INTB 与 AR9 S3C2410 直接相连 ,采用 10k 电阻上拉 ,辅助系统稳定工作 ;和 AR9 S3C2410 采用同一个外部 8 MHz 时钟;发光二极管 D1、D2 用于复位后的上电指示 ;MBS(引脚 12)作为麦克风偏置 ,接了一个 RC 电路,保证能输出一个浮动电压给麦克风。 LD 3320 语音识别单元设计原理图如图2-5 所示：兰州工业学院毕业设计说明书（论文） 13 图 2-5 LD 3320 语音识别单元设计原理图 2.5.1 LD 3320 芯片简介 LD 3320 是一颗基于非特定人语音识别 (SI-ASR，Speaker Independent Automatic Speech Recognition)技术的语音识别 /声控芯片。该芯片集成了语音识别处理器和一些外部电路，包括ADC、DAC、麦克风接口、声音输出接口等。该芯片不需要外接任何的辅助芯片如Flash、RAM 等，直接集成在现有的产品中，即可以实现语音识别 /声控/人机对话功能，并且，识别的关键词语列表是可以任意动态编辑的。 LD 3320 完成非特定人语音识别，每次识别最多可以设置 50 项候选识别句，每个识别句可以是单字、词组或短句，长度为不超过 10 个汉字或者 79 个字节的拼音串。另一方面，识别句内容可以动态编辑修改，因此可由一个系统支持多种场景。芯片采用48 脚 QFN 塑料封装，工作供电为 3.3V。其核心是语音识别运算器，配合输入、输出、AD/DA 转换等模块，完成语音识别的功能。 LD 3320 还支持并行和串行接口，串行方式可以简化与其他兰州工业学院毕业设计说明书（论文） 14 模块的连接。 LD 3320 电路说明：1、电压要求 VDD: 数字电路用电源输入 3.0 V3.3 V ，VDDIO: 数字 I/O 电路用电源输入 1.65 VVDD ，VDDA:模拟电路用电源输入 3.0 V4.0 V。 2、芯片管脚输入电压范围：高电压（逻辑 “1”）: 0.7*VDDIO VDDIO 低电压（逻辑 “0”）：00.3*VDDIO 因此，开发者需要保证自己使用的主控 MCU 同样工作在 3.3v，保证主控 MCU 向 LD 3320 的管脚输出的高电压不超过 3.3V。 2.5.2 LD 3320 功能单元 1、时钟（Clock）芯片必须连接外部时钟，可接受的频率范围是 448MHz，而芯片内部还有 PLL 频率合成器，可产生特定的频率供内部模块使用。 2、复位对芯片的复位信号（ RSTB*）必须在 VDD/VDDA/VDDIO 都稳定后进行。无论芯片正在进行何种运算，复位信号都可以使它恢复初始状态，并使各寄存器复位。如果没有后续的指令（对寄存器的设置），复位后芯片将进入休眠状态。此后，一个 CSB*信号就可以重新激活芯片进入工作状态。 3、并行接口本芯片可通过并行方式和外部主CPU 连接，此时使用 8 根数据线（ P0- P7），4 个控制信号（ WRB*, RDB*, CS*，A0），以及一个中断返回信号（INTB*）。 4、串行接口串行接口通过 SPI 协议和外部 CPU 连接，首先要将 MD 接高电平，而将（SPIS*）接地。此时只使用 4 个管脚：片选（ SCS*）、SPI 时钟（SDCK）、 SPI 输入(SDI)和 SPI 输出（SDO）。 5、寄存器对芯片的设置和命令，包括传送数据和接受数据，都是通过对寄存器的操作来完成的。例如进行语音识别时，设置识别的关键词语列表，设定兰州工业学院毕业设计说明书（论文） 15 芯片的识别模式，识别完成后获得识别结果都是通过读/写寄存器来完成。播放声音时，就是将 MP3 格式的数据循环放入 FIFO 对应的寄存器。（识别结果是通过寄存器返回识别出的关键词语在关键词语列表中的排列序号 Index 数值，该 Index 数值是在设置关键词语列表时指定）。 6、喇叭音量的外部控制除了特定寄存器来控制音量以外，芯片外部的电路可以控制喇叭的音量增益。使用的是 EP1、EP2、EP3 对应的管脚。 7、快速开发和评估验证为了方便开发者对于 LD 3320 芯片进行快速开发和评估验证， ICRoute 提供了开发板和模块。 2.5.3 LD 3320 芯片模式选择用户可以通过编程，设置两种不同的用户使用模式：“触发识别模式 ” 和“循环识别模式 ”： 1、触发识别模式：系统的主控 MCU 在接受到外界一个触发后 (比如用户按动某个按键 )，启动 LD 3320 芯片的一个定时识别过程 (比如 5 秒钟)，要求用户在这个定时过程中说出要识别的语音关键词语。过了这个过程后，需要用户再次触发才能再次启动一个识别过程。 2、循环识别模式：系统的主控 MCU 反复启动识别过程。如果没有人说话没有识别结果，则每次识别过程的定时到时后再启动一个识别过程;如果有识别结果，则根据识别作相应处理后 (比如播放某个声音作为回答 )再启动一个识别过程。一般来说，触发识别适合识别精度要求比较高的场合。外界触发后，产品可以播放提示音或者其他方式来提示用户在接下来的几秒钟内说出要识别的内容，这样来引导用户在规定的时间内只说出要识别的内容，从而保证比较高的识别率。而循环识别比较适合需要始终进行语音监控的场合，或者没有按键等其他设备控制识别开始的场合。而这种状态，识别准确度会有一定下降，在循环识别的过程中，兰州工业学院毕业设计说明书（论文） 16 用户的其他说话声音，或者外界的其他声音，都有可能被识别引擎误识别出错误的结果，需要产品的控制逻辑都作相应的处理。在识别精度要求高的场景中，应该采用 “触发识别 ”模式。原因是：（1）用户在每次按键后，精神处于最集中的状态，此时用户说的语音命令会比较认真、清晰。避免了用户过时随意的发音导致的识别误差。（2）每次按键后，产品应该给以一个明显的开始信号，比如发出“当” 的一声或者其他提示信号，可以给用户一个明确开始的提示，方便用户掌握说语音命令的时间。（3）由于按键触发后，用户就会贴近麦克风并说出语音命令，避免了其他环境声音被录入 LD 3320 芯片导致的误识别，这种方式还是一种省电的方式，在不识别时，彻底不让芯片工作以省电。 3、口令触发模式在一些应用场合，希望识别精度高，但是又无法要求用户每次都用手按键来 “触发识别 ” 。此时，可以采用 “口令触发模式 ” 。产品定义一句短语，作为触发口令。比如，可以定义“你好”作为触发口令。产品在等待用户触发时，启动一个 “循环识别 ”模式，把触发口令 “你好”和其他几十个用来吸收错误的词汇设置进LD 3320。只有当检测到识别出的结果是触发口令时，才认为是终端用户叫了这个口令。此时，给出提示音，并启动一个 “触发识别模式 ” ，并把相应的识别列表设置进LD 3320,提示用户在提示音后几秒钟内说出要执行的操作。在等待用户的过程时，如果识别的结果是那些用来吸收错误的词汇，则认为是误识别，或者其他的声音干扰，而不进行任何的处理，直接再次进入 “循环识别 ”模式。这种口令触发模式，融合了其他两种模式的优点，并且结合第二节提到的 “垃圾关键词语 ”的方法，可以为产品提供更加方便实用的语音操作特性。 2.5.4 关键词的 ID 及其设置在把关键词语设置进 LD 3320 时，是把关键词语的拼音串传入LD 3320，兰州工业学院毕业设计说明书（论文） 17 并同时传入一个 ID，用来代表这个关键词语。 LD 3320 的识别结果，也是把识别出的关键词语的 ID 作为结果输出。在 LD 3320 芯片，不同的关键词语是可以对应同一个ID。而且 ID 不需要是连续的。这样就为产品开发者提供了很方便的编程手段。例如:“北京” ， “首都” ，可以设置为同一个 ID，进行后续处理。例如:在使用第二节提到的 “垃圾关键词语 ”时，可以把添加的这些用来吸收错误的关键词语的 ID 都标记成一个值，或者把它们标注为比较特殊的 ID 值，如大于 200。在程序中就比较简单，很容易处理误识别，避免了添加进很多关键词语后，写程序中需要为这些关键词语的处理增加过多的程序分支。终端用户在说语音指令时，可能对同一个词汇有不同的发音习惯。例如， “打开电灯 ” ，用户可能会说 “开灯” ， “打开灯” ， “打开电灯 ” ， “把灯打开 ”等等。充分利用 LD 3320 的 50 条可动态编辑的关键识别条目的特性，开发者可以把这些习惯发音都设置进芯片，这样无论用户怎么说，都会被正确识别出来，进一步增加终端用户的良好体验。 2.5.5 反应时间 LD 3320 芯片内部是通过 VAD(端点检测 )机制来判断人是否说完语音，并给出识别结果根据 VAD 机制，语音识别芯片监测出有一段连续的背景噪音后，认为用户已经说完了语音识别命令，然后再给出识别结果。默认设置是监测到在人声开始后有连续的600 毫秒的不说话时，才会给出识别结果。也就是说，根据默认设置，从人说话结束，到语音识别芯片主动送出结果中断，至少要有 600 毫秒的间隔，如果用户希望调节这个反应间隔，可以从以下几方面入手： 1、改变使用方式采用类似于步话机的方式，每次人按键后，按下不放，开始说命令，说完命令后，松开按键，每次检测到松开按键时，主控的单片机通过设置BC 寄存器来立即获得识别结果。兰州工业学院毕业设计说明书（论文） 18 2、修改 VAD 判断的寄存器 Vad Silence End 在语音检测到语音数据段以后，又检测到背景噪音段，连续检测到多长时间的背景噪音段才可以确认为是真正的语音结束。每1 单位，10 毫秒。Default：60,相当于 600 毫秒数值范围： 20200(相当于 2002000 毫秒)但是这个修改会导致，如果这个时间过短，导致用户在说话时的说话停顿也会造成 VAD 检测认为说话结束，从而降低某些用户的识别率。 3、修改麦克风的音量 35 寄存器， (建议调整范围在 40H58H 之间)，看哪个录音增益适合使用的麦克风，以及使用的环境。 4、修改 B8 寄存器比如修改为 2，那么这意味着，无论如何，在每次识别开始后2 秒钟的时间内，必然会停止识别给出一个识别结果。如果 b8 值特别小，比如设置： 1, 2, 3，就需要在开始识别前，给用户一个很明确的提示，要开始识别了。免得用户还没有准备就识别时间过去了。但这个间隔设置的过短，也必然会引起一些可能存在的误识别，比如语音命令比较长，那么这个时间设置的太小，就会造成比较长的语音命令无法在特定时间内完整念完引起误识别。所以当这个数值设置比较小的时候，一般建议使用 “触发识别 ”的用户界面，避免使用 “循环识别 ”的用户界面。 5、改变使用环境或许在某些环境中的噪声或者回声会影响到判断说话结束。以及说话人自己的音量，如果声音很低，也会导致判断人说话是否结束比较困难。改变命令词语内容，比较好念，开口音响亮等，方便使用者连续清晰念出语音命令。 2.6 GPRS 模块 GPRS（General Packet Radio Service 通用分组无线业务）是在现有 GSM（Global System for Mobile communication 全球移动通信系统）基础上发展起来的一种新的承载业务，目的是为GSM 用户提供分组形式的数据业务。 GPRS 采用与 GSM 同样的无线调制标准、频带、 TDMA 帧结构，因此在现有的基兰州工业学院毕业设计说明书（论文） 19 站子系统中增加一些模块即可提供 GPRS 服务。GPRS 允许用户在分组交换模式下发送和接收数据，从而提供了一种高效、低成本的无线数据分组业务。在 GSM 系统中，无线信道资源非常宝贵，而采用 GPRS 则可灵活运用无线信道，即每一个用户可以有多个无线信道，而同一信道又可以由几个用户共享，极大地提高了无线资源的利用率。 GPRS 使现有 GSM 网的数据业务突破了最高速率为 9.6kbit/s 的限制，最高数据速率可达171.2kbit/s。将计算机通过串行通信技术与 GPRS 无线通信网络建立连接，可以实现手机与计算机的通信。计算机与 GPRS 网络的连接可以采用 GPRS 模块，也可以采用 GPRS Modem,此处采用基于 AT 指令的 M22 GPRS 模块使计算机与 GPRS 网络进行连接，系统组成结构如图 2-4 所示。本文在 Windows 环境下，利用 VB6.0 中的 Macomb 控件实现 GPRS 模块与计算机的串行通信，采用ADO 对象模型对数据库进行访问，实现语音拨号、语音发短信的功能。基于 GPRS 网络的应用系统组成结构如图 2-6 所示：计算机 ARM9 微处理器 BenQ M22 GPRS 手机图 2-6 基于 GPRS 网络的应用系统组成结构 2.7 语音拨号模块摘机后无需再用手拨（前提是手机支语音拨号表面地来说就是摘机后手动指向手机语音拨号功能，说出被叫者姓名，电话即自动拔向被叫者。一般分为 6 个步骤： 1、从第一画面进入拨号程序； 2、听到“请说出人名 ”的提示后说出要与之通信的人名； 3、手机将根据你的语音计算出数名声音类似的人名，第一条为首选； 4、如果第一条正确，且该人名仅有一个号码，按键拨号，或在默认时间内自动拨号，通话；如果该人名的联系电话多于一条，则启动 “个人电话表 ”，兰州工业学院毕业设计说明书（论文） 20 选择，拨号； 5、如果第一条不正确，其余条中有正确的，按动上下键选择正确，按键，通话； 6、如果都不正确，按 C 键，返回第一画面。在使用语音拨号之前，必须要录制声控标签，也就是说为电话薄中的几个电话号码录制声控标签。录制声控标签的具体操作步骤为：首先在手机面板中选择“加声控标签 ”按钮，在随后弹出的界面中选择所需的姓名和电话号码，接着再用手机按一下 “功能键”，然后将手机贴近耳朵，用标准的话语来说出要录制的词语就算完成录制声控工作了。 2.8 语音短信模块语音发短信是一款功能强大的语音声控助手，只要对软件下指令，软件即可用迅速简洁的方式协助用户达成任务，包括打开关闭应用程序，发送短信，拨打电话，撰写文本等等。重要的是，软件支持中文。同时语音发短信是一款出色的语音控制软件，其界面精美，简单易用。语音识别率很高，并支持中文等语言，对完成手机的基本操作非常实用。软件的使用方法如下： 1、单击“语音输入 ”按钮，进行语音短信输入，短信内容将会自动显示； 2、编辑好语音内容，单击 “发送短信 ”按钮即可进入短信界面，进行短信发送； 3、也可以通过清空按钮清空短信框中的内容。 2.9 LCD 显示连接电路汉字一般是以点阵式存储的，如1616，2424 点阵，汉字的字模其实是汉字字形的图形化，所谓16 点阵字模，就是把汉字写在一个1616 的网格内，汉字的笔划通过某网格时该网格就对应1，否则该网格对应 0，这样，每一网格均对应 1 或 0，把对应 1 的网格连起来看，就是这个汉字，汉字就是这样通过字节表示其点阵存储在字符字库中的，为了方便查找所需汉字的点阵，每个汉字都与一个双字节的内码一一对应，通过汉字的内码可以计算出它的点兰州工业学院毕业设计说明书（论文） 21 阵起始字节。现以 16 点阵为例来进行说明，首先，可由内码计算出它在汉字库中的区位码，其计算公式为： BQ=Bn1-160 BW=Bn2-160 式中，BQ表示区码， Bw为表示位码，而 Bn1和 Bn2则分别表示内码的第一字节和内码的第二字节。当这些区位码被计算出来之后，就可以用区位码得到它在汉字库中字模第一个字节的位置，即：（BQ94+Bw）32。这样，接下来就可以向连续读出由 32 个字节组成的该字的点阵数据。液晶显示器作为一种低功耗显示器件，广泛应用于计算器、数字式仪表等低功耗系统中。但一般使用的液晶显示器均为七段笔划式，只能显示数字和少量字符，对于较复杂的字符或图形则无能为力。而点阵式液晶显示模块可以显示各种各样的字符（包括简单的汉字），而且点阵显示模块具有可编程能力。由于以上优点，点阵式液晶显示模块获得了广泛的应用。 LCD 显示连接电路如图 2-7 所示：图 2-7 LCD 显示连接电路 2.9.1 12864 芯片简介 12864 汉字图形点阵液晶显示模块，是12864 点阵的汉字图形型液晶显示模块，可显示汉字及图形，内置8192 个中文汉字（ 16X16 点阵）、 128 个字符（8X16 点阵）及 64X256 点阵显示 RAM（GDRAM）。可与 CPU 直接接口， 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 C SA C SB +5 V CC G ND R 17 A 0 A 1 EN A D 0 A D 1 A D 2 AD 3 A D 4 A D 5 A D6 A D7 兰州工业学院毕业设计说明书（论文） 22 提供两种界面来连接微处理机，8 位并行及串行两种连接方式。 1、主要技术参数和现实特性：（1）电源：VDD 3.3V +5V (内置升压电路，无需负压 )；（2）现实内容： 128 列64 行；（3）显示颜色：黄绿；（4）显示角度 :6:00 钟直视；（5）LCD 类型：STN；（6）与 MCU 接口：8 位或 4 位并行/3 位串行配置 LED 背光；（7）多种软件功能：光标显示、画面移位、自定义字符、睡眠模式等。 2、外观尺寸与视域尺寸（1）外观尺寸： 937012.5mm；（2）视频尺寸： 7339mm。 3、显示步骤显示资料 RAM 提供 642 个位元组的空间，最多可以控制4 行 16 字（64 个字）的中文字型显示，当写入显示资料RAM 时，可以分别显示 CGROM、HCGROM 与 CGRAM 的字型； ST7920A 可以显示三种字型，分别是半宽的 HCGROM 字型、CGRAM 字型及中文 CGROM 字型，三种字型的选择，由在 DDRAM 中写入的编码选择，在 0000H0006H 的编码中将自动的结合下一个位元组，组成两个位元组的编码达成中文字型的编码（ A140D75F），各种字型详细编码如下：（1）显示半宽字型：将 8 位元资料写入 DDRAM 中，范围为 02H7FH 的编码；（2）显示 CGRAM 字型：将 16 位元资料写入 DDRAM 中，总共有 0000H， 0002H，0004H，0006H 四种编码；（3）显示中文字形：将 16 位元资料写入 DDRAMK，范围为 A1A1HF7FEH 的编码。 4、绘图 RAM（GDRAM）兰州工业学院毕业设计说明书（论文） 23 绘图显示 RAM 提供 6432 个位元组的记忆空间，最多可以控制25664 点的二维也纳绘图缓冲空间，在更改绘图RAM 时，先连续写入水平与垂直的坐标值，再写入两个 8 位元的资料到绘图 RAM，而地址计数器（ AC）会自动加一；在写入绘图 RAM 的期间，绘图显示必须关闭，整个写入绘图RAM 的步骤如下：（1）关闭绘图显示功能；（2）先将水平的位元组坐标（ X）写入绘图 RAM 地址；（3）再将垂直的坐标（ Y）写入绘图 RAM 地址；（4）将 D15D8 写入到 RAM 中；（5）将 D7D0 写入到 RAM 中；（6）打开绘图显示功能。 3 系统软件设计 3.1 语音识别操作流程语音识别的操作顺序是：兰州工业学院毕业设计说明书（论文） 24 1、语音识别初始化 2、写入识别列表列表的规则是，每个识别条目对应一个特定的编号(1 个字节)不同的识别条目的编号可以相同，而且不用连续。本芯片最多支持50 个识别条目，每个识别条目是标准普通话的汉语拼音 (小写)，每 2 个字(汉语拼音 )之间用一个空格间隔。编号可以相同，可以不连续，但数值要小于256 (OOHFFH）。例子中“北京”和“首都”对应同一编号，说这两个词会有相同结果返回。 1Bei jing 1Shou du 3Shang hai 7Tian jing 8Chong qing 表 3-1 识别列表举例编号可以相同，可以不连续，但数值要小于256 (OOHFFH）。例子中“北京和“首都”对应同一编号，说这两个词会有。相同结果返回 3、开始识别并准备好中断响应函数，打开中断允许位。设置几个相关的寄存器，就可以控制 LD3320 芯片开始语音识别。值得注意 :单片机程序中，一般会用一个全局变量控制当前状态， (例如:LD_ASR_ RUNING 状态或者 LD_ ASR_ FOUNDOK 状态)在编程时一定要把对该状态的设置放在正式LD3320 芯片开始识别以前。 4、响应中断如果麦克风采集到声音，不管是否识别出正常结果，都会产生一个中断信号。而中断程序要根据寄存器的值分析结果。读取BA 寄存器的值，可以知道有几个候选答案，而 C5 寄存器里的答案是得分最高、最可能正确的答案。例如发音为“上海”并被成功识别 (无其他候选 )，那么 BA 寄存器里的数值是 1, 而 C5 寄存器里的值是对应的编码3。语音识别操作流程如图 3-1 所示：兰州工业学院毕业设计说明书（论文） 25 开始初始化 RAM 执行训练，获得训练结果训练成功返回 N Y 开始定时采集语音样本返回中断服务语音特征模型开始初始化识别器获得识别结果识别出语音命令执行相应操作返回 N Y 训练过程识别过程图 3-1 语音识别操作流程 3.2 系统程序流程 1、程序工作过程：程序开始后，首先完成程序的初始化，随后进入语音识别循环程序，将通过麦克风输入的语音信号在语音识别芯片 LD 3320中进行频谱分析，分析后将提取到的语音特征和关键词语列表中的关键词语进行对比匹配。经过语音比较判断后，如果语音识别成功，则播放相应的语音或者在显示屏上显示；如果语音识别不成功，则程序返回到语音识别循环程序，重新进行语音比较，直到语音识别成功，循环程序结束。 2、系统的操作顺序是 : 语音识别用初始化 (包括通用初始化 )一写入识别列表一开始识别，并准备好中断响应函数，打开中断允许位。这里需要说明一下，如果不用中断方式，也可以通过查询方式工作。在 “开始识别 ”后，读取寄存器 B2H 的值，如果为 21H 就表示有识别结果产生。此之后读取候选项等操作与中断方式相同。系统程序流程图如图 3-2 示: 兰州工业学院毕业设计说明书（论文） 26 开始训练第一条命令训练成功训练第二条命令训练成功语音识别开始获得识别结果识别出语音命令播放相应的语音提示 N N Y Y N Y 图 3-2 系统程序流程图 4 软件调试 4.1 上电调试 LD 芯片重启后， LD_ Reset，就是把 (RSTB)管脚的电平拉低拉高后管脚兰州工业学院毕业设计说明书（论文） 27 29，30 会稳定地送出低电平，这个可以作为一个上电是否正常的检测。 4.2 读写寄存器调试检查寄存器的读写是否正确 :向可读写的寄存器写入某个数值，再读出来，用来检查寄存器读写是否正常。由于曾经出现过每次读写都是在自己的总线上进行，没有真正 touch 到 LD 3320 芯片。所以每次先向一个寄存器写，再读出来，内容是完全正确，但实际上没有真正地读写进寄存器，而只是把刚刚写的数值再显示了出来。所以读写寄存器的序列如下： LD reset ()； LD_ReadReg (Ox6)； LD_ WriteReg (0 x35, 0 x33)； LD_ WriteReg (Ox1b, 0 x55

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

毕业设计语音文本显示系统.doc

文档简介

温馨提示

最新文档

评论

毕业设计语音文本显示系统.doc

文档简介

温馨提示

最新文档

评论

相关文档