细明电子设计大赛优先遥控器isdfile2-copy_第1页
细明电子设计大赛优先遥控器isdfile2-copy_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、电子世界99年4期新型ISD语音组合电路设计与应用周湘峻现代电子、电器产品及设备的智能化水平不断提高,在人机界面设计上不但有了文字标识、发光管指示、显像屏显示等视觉表达,而且还有各种听觉表达,如最简单的“滴滴、嘟嘟”讯响声、稍丰富些的音乐声,甚至用人的语言直接对用户“说话”等。用简单的数码语音集成电路可以实现一句或多句语言的播放,如掩模芯片中的“欢迎光临”、“有电危险、请勿靠近”等,还有如ISD系列、APR9600(IVS1560)等芯片可由开发人员或用户任意录制、播放需要的一段或几段语音等。在听觉表达中最复杂的就是语音的组合,它是将用户预存的多段语音选择顺序连续播放,将字或词素组合成一句话、

2、甚至一段话播放出来,从而实现最准确、定量的语义表达,例如“嘟,现在温度37.5度,温度偏高”、“现在时间五点二十五分三十三秒”等。传统语音组合电路的设计十分复杂,开发工具十分昂贵,语音录制及软件编制工作量巨大,而且组合出来的语音效果也不甚理想,尤其在投资不大的产品、系统中最为突出,从而制约了这一技术的应用和发展。只在近一、两年来,模拟存储语音技术的ISD芯片及其廉价的开发编辑工具问世后,情况才大为改观。现在已有专业公司开发出通用ISD语音组合模块,用户只需要在ISD语音芯片中分段录入要求的词素,即可方便地用单片机控制输出这些词素的任意组合成句、成段,词素的语音容量从20秒至480秒甚至更长,以

3、至可以容纳所有的中文汉字发音,详见 http:/ 。下面介绍一种用途最广泛的通用语音组合模板的设计与应用。一、原理ISD1420是采用模拟存取技术集成的可反复录放的20秒语音芯片,掉电语音不丢失,最大可分160段,最小每段语音长度为125ms,每段语音都可由地址线控制输出,每125ms为一个地址,由A0-A7八根地址线控制,地址语音控制表如表(一)所示。用户录制的语音每一段结束后芯片自动设有段结束标志(EOM),芯片录满后设有溢出标志(OVF),一片分段录好音的ISD1420芯片语音地址结构如图(一)示意。如果用单片机等控制电路按某一段的起始地址进行放音操作,遇到段结束标志(EOM)即自动停止

4、放音,单片机收到段结束标志(EOM)就开始触发下一段语音的起始地址,如此控制,即可以将很多、不同段的语音组合在一起成一句话放音出来,实现语音的自动组合。用户可以先通过专用的ISD1425语音编程拷贝机将需要的语音分段编程、连续录制到芯片中,每段语音的长度不限,制成语音源片后,将源片的录音端封住不让其再做录音操作,再由单片机电路控制放音。首先,单片机将ISD1420语音芯片完整搜索一遍,自动找出每一段的起始地址,按分段顺序编号存入外置的串行存储器中;然后用户通过单片机串口发出指令,单片机即将这些段的编号、地址一一调出,依次向语音芯片发出首地址放音该段该段结束,单片机收到EOM标志单片机发出下一段

5、语音的首地址放音该段如此工作,直到要求的一句话合成完毕。这种控制方式有较强的通用性和方便性,它不需要事先规定每段语音的时间长度、总段数,甚至不需要知道每段语音在ISD1420芯片上的具体地址,只要用户记住录入语音的段顺序即可控制各段语音的自由组合。十进制地址数二进制A7 A6 A5 A4 A3 A2 A1 A0ISD1420(秒)0 0 0 0 0 0 0 0 001 0 0 0 0 0 0 0 10.1252 0 0 0 0 0 0 1 00.258 0 0 0 0 1 0 0 01.010 0 0 0 0 1 0 1 01.2550 0 0 1 1 0 0 1 06.25100 0 1 1

6、 0 0 1 0 0 12.5159 1 0 0 1 1 1 1 119.875160 1 0 1 0 0 0 0 0溢出标志表(一)ISD1420地址语音表语音段数语音段数 第一段 第二段 第三段第四段时间长度1秒5.25秒 6.25秒7.5秒起始地址数 0 8 50100标志位 EOM EOMEOM OVF图(一)ISD1420内部语音地址分段示意图二、电路结构图(二) ISD1420语音组合电路图图(二)的电路图可以很好地实现语音组合。由于其中包含了大量最新的器件和技术成果,如可更换、反复使用的先进数字语音录放芯片(ISD1420),控制灵活功能强大的片内可擦写程序存储器的微型单片机(A

7、T89C2051),非易失大容量I2C串行存储器24C16,低压差微功耗的三端稳压器(HT7251)使输入电源电压范围扩至5-12伏,平衡输入单端输出的LM386功放可提供0.5W的喇叭输出,等等。因此,它的功能虽然十分强大,但电路却十分简单,制作出来也仅火柴盒大小,应用十分方便。首先,跳线开关置于“1-2”学习功能位上,用户按动按键AN,单片机89C2051即控制ISD1420语音芯片从头至尾放音一遍,它会将语音芯片中的每一段语音的起始地址都记录到串行存储器24C16中,即完成了芯片搜索操作。然后,跳线开关置于“2-3”组合功能位上,用户可按照RS232标准串口协议向单片机的RX端发送合成指

8、令,单片机即将合成命令翻译成对应的语音芯片中各段语音的起始地址并控制语音芯片发出需要的语音,一段结束后立刻又播发需要的下一段,如此将一句话合成“说”完。在单片机的TX端将作为忙信号端使用,当有语音输出时该端将保持低电平,空闲时为高电平。 起始位 结束位 8个数据位图(三)串口数据格式单片机遵循标准5V的RS232串口协议方式(TX、RX双线,串口方式一、无校验),数据格式见图(三),协议如下:串口速率:4800 bit/s引导码:AA AA静音延迟0.5秒:DD (在一句话中停顿一会,起逗号作用)句结束放音存储码:FF (立刻语音合成放音)TX端放音忙信号:低电平有效 (空闲为高电平,语音合成

9、放音期间变为低电平输出。)数据码:码址与语音段位序号对应,如00为第一段,01为第二段,02为第三段,.每句话最多48段。整个电路的电源电压5-12V,静态电流13mA,工作电流150mA,接口电平5V,外接喇叭4-8,输出音频功率0.5W,还可以方便地外接功放机或有源音箱扩音使用。三、应用下面举例说明该语音组合电路的应用。现在我们的产品系统中需要一个能实时播报时间和温度的语音单元,经过对所有语句的拆字分析,有以下31段字、词素、提示音需要组合使用:幺(00)、零(01)、壹(02)、贰(03)、叁(04)、肆(05)、伍(06)、六(07)、柒(08)、捌(09)、玖(0A)、十(0B)、百

10、(0C)、千(0D)、万(0E)、温度(0F)、度(10)、正(11)、负(12)、现在(13)、正常(14)、偏高(15)、偏低(16)、上升(17)、下降(18)、号(19)、小时(1A)、分(1B)、秒(1C)、点(1D),嘟(1E)。于是,我们先找专业播音员将这些字词录到磁带上,再转录到多媒体电脑中,其中的“嘟嘟”提示音可从电脑的音效文件中找到,然后通过ISD1425语音编程拷贝机及其电脑软件,将这些语音都按上述顺序分段录入到ISD1420芯片中。如果语音效果不满意可反复重新录制,直到满意后将ISD1420芯片插到本语音组合电路板上,内部语音及分段信息在断电后也能保持100年。插上新的

11、语音片后语音组合电路还需要搜索并存储一次该语音芯片的各段地址,即将语音组合电路板上的跳针置于1-2位置按一下AN按钮,语音芯片即将内部的语音从头到尾完整播放一遍,放音完毕后即将跳针置回2-3即可开始组合放音了。这样,当我们需要语音单元说“嘟,现在温度126.5度,偏高。”时,就可以按照语音芯片中语音段的段位序号和命令格式对本电路单片机的RX端发码:AA AA 1E DD 13 0F 02 0C 03 0B 07 1D 06 10 DD 15 FF。其中“AA AA”表示“下面开始输入放音的段号了”,“1E”是用十六进制表示的语音芯片第31段(十进制),这一段是“嘟”提示音,“DD”是表示此时要暂停放音0.5秒,相当于一个逗号,“13”是用十六进制表示的语音芯片第20段(十进制),这一段是语音“现在”,如此类推都是要播放的各段语音,最后“FF”表示“现在即将上述各段语音顺序播放出来

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论