版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Petri 网在留学生汉语语音评价系统中的应用摘 要:本文介绍了 Petri 网在留学生汉语语音评价系统中的应用实例,提出了该系统的形式化的定义和语音评价过程的执行规则,结合汉语发音评价体系的特点,利用 Petri 网实现了留学生汉语语音评价的基本过程,降低了时间成本,提高了留学生汉语语音评价的效率。关键词: Petri 网 汉语语音评价 形式化 语音信号一、引言汉语发音在留学生汉语学习及交流中起着举足轻重的作用,语音评价是第二语言习得过程中的基础内容和重要环节,而汉语发音数据则是语音评价的主体和前提,是语音库的重要来源。如何对留学生的发音做出科学、有效的评价,一直是语音评价研究的热点。近年来
2、,随着信息技术的不断发展,国内对汉语语音识别、语音评价系统做了大量研究,主要成果如下:袁毅、吴晨 1 提出了柔性可扩展体系结构非特定人语音识别系统的框架模型,验证了在该模型指导下所开发出的语音识别系统的实用性和稳定性;施伟 2 提出了对外汉语教学中的发音自动评价系统,通过分析输入语音数据,提取语音特征并与参考标准进行匹配比较,由评分机制根据相似程度大小给出相应的评价;潘志松等3 提出了 Petri 网原理在语音识别中的基础应用方法,并以简单实例加以研证。以上研究均采用了不用的技术和方法来实现汉语语音数据评价过程,产生了一系列的应用结果,取得了一些进步和成果。本文在前人研究的基础上, 提出了一种
3、用 Petri 网实现留学生汉语语音数据识别、评价及偏误分析的方法,大大降低了汉语语音数据评价成本,提高了评价过程的效率和留学生习得汉语语音的效率,使语音评价过程具有一定的兼容性、扩展性和适应性,符合当代汉语语音数据评价发展的特点及要求。二、 Petri 网与留学生汉语语音评价体系(一) Petri 网简介Petri 网起源于 1962 年 Carl Adam Petri 的博士论文,它是一种可以用网状图形表示的系统模型,其概念是在尊重自然规律的前提下定义的,以确保以其为模型描述的系统都是可以实现的 4 。Petri 网有丰富的系统描述手段和系统行为分析技术,最初主要应用于系统的建模、分布式系
4、统的设计、并行处理等领域,经过50 多年的研究发展,Petri 网理论日益完善,被广泛应用于实现各类流程和系统行为过程问题。按研究对象 (过程),Petri 网的模型可分为网、网系统、库所 / 变迁系统、 高级网系统等模型系统,每类模型均有不同的层次结构。本文涉及到的是高级网系统中的有色自控系统5 ,它的一个库所中可以包含多种资源(汉语语音信号),一个变迁代表一种流动关系,涵盖因资源差异而发生的不同变化和特征。Petri 网最基本的构成单元为: 库所( Place)圆形节点(下文以 S代替),变迁( Transition)方形节点(下文以 P 代替);有向弧( Connection )是库所和
5、变迁之间的有向弧;托肯(Token)是库所中的动态对象 (如为完成某个语音输入的识别或备份需要调用到的资源个数) ,可以从一个库所移动到另一个库所。 Petri 网的运行规则视具体情况而定,但基本规则是:有向弧是有方向的;两个库所或变迁之间不允许有库所;库所可以拥有任意数量的托肯。(二)留学生汉语语音评价体系留学生汉语语音评价体系 67 是根据留学生发音特征和汉语发音偏误建立的一个衡量和评价汉语语音习得程度和发音质量高低的智能化系统,使留学生能利用该系统对发音进行测评,该系统可在第一时间反馈汉语发音评价结果、错误类型和改进建议,能有效地提高留学生汉语发音的正确率,使其能更好地掌握汉语发音。根据
6、留学生汉语发音特点以及现有语音识别技术,汉语语音评价体系由语音识别层、语音评价层及偏误分析层三大功能模块构成,在每一个功能模块下又设有子模块,如图 1 所示。三个主要功能模块之间相互依存、相互影响和相互作用,通过联动和反馈机制不断地在其间传递语音及语音评价信息,构成了一个完备的汉语语音评价体系。(三)评价测试项目组利用矢量化编码VQF技术 8 进行汉语语音数据采集,通过对普通的汉语语音评价实现方案和基于Petri网的语音评价实现方案做出了测试和对比,结果如图2 所示。假设 L 为留学生汉语发音习得等级,它是一个五元组L=( L1,L2,L3,L4,H),其中: L1 为元音习得等级, L2 为
7、辅音习得等级, L3 为声调习得等级, L4 为语调习得等级, H 为权重因子 7 , F 为基频参数。 L 值越高,证明发音偏误率越低,发音更加接近标准,发音质量高; L 值越低,证明发音偏误率越高, 发音偏离标准, 发音质量低。 图 2 中 L1 为普通的汉语语音评价实现方案对应的语音评价等级,L2 为利用Petri 网实现方案对应的语音评价等级;右侧测试数据则为某个汉字发音单元(本研究仅限于单音节词)在两种方案下得出的等级值。由图可知,L2 实现方案较为合理,大体上符合汉语发音规律, 评价值接近预设的汉语发音习得等级值(L)。(四)留学生汉语语音评价体系与Petri 网的关系从理论意义上
8、讲,二者在形式上是一一对应的关系,只是涵盖的内容不同,Petri 网及网系统发生记录也是语音评价体系的执行结果。 经过以上测试可发现:以 Petri 网为工具能有效实现留学生汉语语音评价系统的模型化,以网络图形方式描述语音评价系统模块之间的关系和语音评价的全过程,从而使抽象的语音评价过程具体化。此外,Petri 网语音执行记录还能有效地反馈发音偏误、缺陷和系统异常情况,有利于针对某一个(组)语音的分析和处理,为整个留学生汉语语音系统的运行提供有效的支持和保障。三、 Petri 网在汉语语音识别系统中的应用Petri 网是研究和模拟汉语语音评价并行发生,依次发生和循环发生最理想的工具,与其他智能
9、化系统一样,留学生汉语语音评价系统有一套完备的实现程序,系统中各模块间通过联动机制有机地联系在一起,这是利用 Petri 网对其形式化描述的物质基础。 下面是一个用Petri 网来描述留学生汉语语音评价系统中语音识别层的实例。(一)图形化的汉语语音识别过程语音识别层由语音信号输入模块、预处理模块、特征提取模块及标准语音数据库构成,如图1 所示,当某个语音信号产生时,语音信号输入模块首先将语音转换为计算机能读取的数字信号,随后通过预处理模块分辨出语音信号及非语音信号。经预处理后的音频数据一方面会被传送到标准语音库进行备份,另一方面作为特征提取模块的输入数据。将以上汉语语音识别过程以Petri 网
10、描述如下:S1、S2、S3、S4 为不同状态下的汉语语音信号;P1 为语音识别功能模块,P2 为预处理功能模块,P3 为特征提取功能模块; s0 为经预处理后的音频数据;p0为标准语音库和偏误语音库之间的联动功能模块。图 3 是对一个典型的形式化的语音识别过程:汉语语音在处理过程中移动,每个处理环节再调用相关的函数及算法,直至语音识别过程结束。显然,语音处理环节对应着Petri网系统中的变迁元素“ T”,而不同状态下的汉语语音数据则对应库所元素“ S”。图 3 是整个汉语语音评价过程中截取出来的一个语音识别片段 s,其中库所中的黑点个数代表该种语音识别资源的个数,箭头代表系统中资源流动的方向,
11、弧上的数字代表语音处理需要调用到的资源的个数,也称为权值,没有数字的弧,其权值为1。例如,语音识别环节P1 需要输入 1 个汉语语音,调用1 个语音识别资源后完成识别,S2 中语音资源个数显然少于预处理需要调用的资源总数,就上模型片段而言, 不能继续进行语音数据的预处理,P2将等待系统具备充分的资源数后,方可执行。另一方面,s0中已经有足够资源对识别后的语音进行备份和比对,从而p0 过程得以进行。当语音识别系统中存在资源竞争时,经常出现以下情况:某个语音在识别后备份到标准语音库中,占用到一定的资源个数,与此同时,偏误分析功能模块也要调用标准语音库中的数据或资源进行比对,资源情况不满足既定操作,
12、即语音识别层和偏误分析层在同时对标准语音库和偏误语音库中的资源进行调用时存在资源竞争现象,有向弧上的权值不允许操作继续,语音识别系统将会反馈异常处理记录,系统将重新分配现有资源,寻求其他途径解决冲突。就汉语语音资源来说,存放它们的库所S(语音信号)具有语音库存贮数据的性质,它只能存放一定种类的语音资源,并且有一定的数量限制。但S 和语音库又不完全一样,语音库在语音评价网系统中有固定的位置,而S 在网中的位置毫无意义,不管它们处于何种位置,语音识别系统(网)的含义是不变的。(二)基于Petri 网的留学生汉语语音评价网系统1.留学生汉语语音评价网系统的形式化定义结合留学生汉语语音评价过程与Pet
13、ri 网中有色自控系统的特点和性质,可得出: =( S,P;F,W,R)为留学生汉语语音评价网系统的条件是:( 1)( S, P; F)为有向网,它为的基本网;( 2)W: S P P S 0, 1, 2 S,且 W( x, y) 0,当且仅当( x, y) F,也成为的语音权函数;( 3) R: S0, 1,2 为的资源标记。该定义假设每个语音信号( S)的容量为无穷(因为考虑到本文设计的语音评价系统对象是无穷尽的汉语语音数据,故做上述假设) ,有向弧的权值可以作为库所名,定义中( S;P;F)可映射到留学生汉语语音评价的各个环节。例如: W( x,y)=sn,则可从库所画一个以小圆圈为箭头
14、的有向弧指向弧( x,y),如图 3 所示。由于该网系统没有可变的权值,故设 S=s0,s1,s2sn,P=p0,p1 , p2pn ,由的权函数W 可产生模糊矩阵R,R 的第 i 行第 j 列的矩阵元素即W( pj ,si) -W( si, pj),可依此计算出所需资源标记(个数)。2.留学生汉语语音评价网系统的运行规则( 1)映射 R: S0,1,2 为的资源标记;( 2)表示 R 下的权值函数 Wr 定义为:( x,y) S P P S;若 W( x, y)S,则 Wr ( x, y) =W( x, y);若 W( x,y) =s s S,则 Wr( x,y) =R( s);( 3)变迁
15、 p P 满足 R 的发生权,即 Rp的条件是: s S: R(s) Wr (s, p),且有 sS,使 Wr( s, p)0,则 p 至少有一个输入权值;(4)若 Rp,则 p 可以发生,后继标识R( s)为 R( s)=R( s)+Wr( p, s)-Wr ( s, p),有 RpR以上就是留学生汉语语音评价网系统的运行规则,权函数 Wr 随着标识 R 的改变而改变,体现了该系统的缺陷跟踪能力和语音修正能力。从严格意义上讲, “”只是语音评价系统中各子系统的总和,运行规则里也指出了“ p”的输入弧上的权值必须大于 0 方可执行,以避免无中生有的变迁发生,如只要有语音信号,语音评价系统中有无
16、语音数据都可完成语音评价,这种情况是不允许的。根据定义和运行规则,可对照图 3,s 中语音识别过程P1、特征提取过程P3 均可发生,假若S2(识别后的语音)中没有足够的托肯,预处理过程P2 永远都不会发生,则语音评价系统中的语音输入识别功能无法完成,这也将造成之后语音评价系统功能的紊乱和终止。从另外一方面看,Wr函数体现了语音评价过程的自我修正和反馈意见功能,可针对因资源竞争,产生死锁而造成系统瘫痪、运行异常等情况做出反应,并重新配置语音处理资源,使系统在第一时间里回复正常运行,保证了该系统智能、稳定和高效的特点。3.语音评价结果本研究前期预测效果显著,项目组利用以上方法对测试汉语语音评价系统
17、以来的所有汉语语音评价记录做了相关统计。抽样调查中,95%的留学生参与了语音评价的各个环节,语音评价系统成功识别汉语语音数据共计15891 条(按单个音节计算) ,其中有效数据13936 条,占 87.69%。在执行语音评价的指令中,同时执行多条语音处理指令称为指令并行。图4 中的并行度是指在语音评价关系网中,指令并行执行的最大条数。经测算,该留学生汉语语音评价系统在完成所有语音处理指令和不出现异常的情况下,各模块语音指令总数为:分割与对比功能模块,124 条;发音评价功能模块, 298 条;习得等级测评功能模块,21 条;联动模块,9 条。根据上表数据,可见本文设计的留学生汉语语音评价系统中
18、的指令并行程度较高,大大提高了语音处理和评价的速度,降低了时间成本,有利于在同一时间处理和分析多条汉语语音数据。4.语音数据的保存为建立留学生汉语标准语音库和偏误语音库,为语音识别、对比研究奠定数据技术基础,为最大程度的保证语音评价的准确性和扩展性,应做好标准汉语语音的采集和偏误语音的收集。 项目组在对产生的每一个汉语语音 (或多个语音)评价结果后都要对其进行备存和入库管理, 这是 Petri 网技术做不到的。四、结语人类处于一个信息技术迅猛发展的时代,语言学和计算机科学越来越紧密地结合在一起,这也是当今跨学科发展的必然结果。对于研究人员来说,留学生汉语语音评价是由一系列复杂的活动组成的,对其进行形式化的定义不仅需要将语言学和计算机技术基础理论和实践经验相结合,还需进行大量的测试和技术研发。 本文介绍的基于 Petri 网的留学生汉语语音评价系统实现方法只是语音评价技术中的一种,以期能够给业内人士提供有效参考。(本文是云南省社科规划办项目“基于东盟国家语言政策的云南汉语国际推广策略研究以GMS 五国为例”, 项目编号: KKSK201335026;云南省教育厅本科教学质量与教学改革工程项目“东南亚语种人才培养示范点” 项目编号:10968258 。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 许昌学院《虚拟现实开源系统开发实验》2023-2024学年第一学期期末试卷
- 许昌学院《设计思维表达》2021-2022学年第一学期期末试卷
- 徐州工程学院《理论物理概论(Ⅰ)》2022-2023学年第一学期期末试卷
- 消防器材维护保养培训
- 创新思维的月度发展策略计划
- 秋季课程设置与调整计划
- 调动社区资源的有效利用计划
- 信阳师范大学《书籍设计》2023-2024学年第一学期期末试卷
- 尽展宝贝潜能幼儿园学期班级工作计划
- 信阳师范大学《计算机三维模型设计实验》2023-2024学年第一学期期末试卷
- 摄影测量学答案
- 保罗大叔分比萨绘本PPT课件
- 圆盘式脚手架产品使用说明书
- 美国超声医学会AIUM透析通路术后血管超声评估实践指南中文(2014年版)江西超声网
- 考古学课件 单元8(秦汉考古:秦汉墓葬2)
- 光伏发电项目达标投产实施细则
- 吸收塔防腐施工方案(电厂脱硫装置防腐施工工艺)
- 班组民主生活活动记录
- 标准法兰盘尺寸表PgMPa
- 雍琦版-《法律逻辑学》课后习题答案(全)
- 沪科版数学七年级上册4.3 线段的长短比较
评论
0/150
提交评论