合成语音感知学习模型的建立和效应验证_第1页
合成语音感知学习模型的建立和效应验证_第2页
合成语音感知学习模型的建立和效应验证_第3页
合成语音感知学习模型的建立和效应验证_第4页
合成语音感知学习模型的建立和效应验证_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

合成语音感知学习模型的建立和效应验证【摘要】目的:建立合成语音的感知学习模型并验证该模型的学习效应.方法:编写合成语音感知学习模型的计算机程序,并在29名大学本科生中应用该程序模型.将被试学员随机分为4组:组1,组2,组3,组4.采用配对t检验和方差分析验证该模型的学习效应.结果:依照4种不同的实验模式实施该模型,各组平均得分由学习前的%提高到学习后的%,且具有显着性差异.其中程序模型改良组的学习效果最为显着,成绩平均提高了%.结论:本研究所建立的英语合成语音感知学习模型有良好的学习效应,学习的过程体现出了人的概括和泛化能力.该模型为深入研究比较复杂的认知活动奠定了基础.

【关键词】感知学习;模型;合成语音

0引言

针对感知学习的研究模型有许多种,其中绝大多数是针对记忆的,包括研究程序性记忆的运动技能学习[1],研究知觉表征系统的视觉[2]或听觉[3]辨别任务等.在合成发音的感知学习过程中,人们对于不同字符组合发音规律的学习和掌握反映除记忆之外的其他学习技能,其模型为人们深入研究学习的生理心理机制提供了帮助[4].本研究旨在尝试建立基于英语语音的感知学习模型,并以中国青年为被试验证该模型的学习效应.

1对象和方法

对象

29名健康男性大学生,年龄19~21岁.裸眼视力或矫正视力正常,听力正常,均已通过英语四级考试,右利手,熟悉计算机键盘操作,从未参加过类似实验.全部被试根据所采用的程序和词汇列表随机分为4组.组1和组2各6人,组3为7人,组4为10人.模型中采用的单词为辅元辅结构的单音节英文词(如bad,tap等),词汇的选取来源于各个英语音素分布均匀的语音均衡表[5].单词的发音由程序合成,在PⅢ计算机上运行并测试,语音通过YongWei耳机播放.

方法

模型设计了两个略有差别的程序.程序A与B均包含测试、练习和再测试三个阶段,练习包括学习和复习两个环节,程序B练习的学习环节单词的发音能够点击重听.程序A有两个版本的词汇列表,程序B仅有一个版本的词汇列表(L2),L1完全来源于Fenn等[4]的设计,L2是范围限制在四级词汇之内的语音均衡词汇.具体程序为:①测试阶段包含100个单词,要求被试在听到单词的发音后在计算机上键入与之对应的拼写,每个单词的发音只出现1次,而且不会重复,单词之间间隔10s.②练习包括两个单元,每单元两组或者三组,每组50个单词.每组间被试休息2min,单元间休息10min.每组被试先学习,即在听到每个单词的发音后随即看到与之对应的拼写.50个单词之后,被试可以进行复习.复习时,被试在听到发音之后,有6s时间可以将单词键入空栏,并在随后看到该单词的正确拼写.在整个学习的过程中,被试所听到单词没有重复,也不与测试及再测试中的单词重复.③再测试与测试的形式与要求相同,单词不与测试及练习中的单词重复.组1采用程序A和词汇列表L1,完成6组练习;组2采用程序A和词汇列表L1,完成4组练习;组3采用程序A和词汇列表L2,完成6组练习;组4采用程序B和词汇列表L2,完成6组练习.

统计学处理:统计学分析用统计分析软件包,结果采用表示.统计方法采用配对t检验,单因素方差分析和协方差分析.表示有显着性差异.

2结果

英语合成语音感知学习模型的学习效应所有被试在测试时语音识别的平均得分%,练习后,绝大部分被试的正确率都有所提高,平均提高%.

尽管组1和组2所使用的词汇列表与组3和组4不同,但是,各组被试在测试时反映出来的正确率却未见显着差异.组1在学习阶段完全采用了文献所报道的实验方法,经过6组共300个单词的学习后,语音识别的正确率由测试的%提高到学习后再测试的%,平均提高%.与之相比较,组2平均提高%.组3学习后正确率平均提高%.

学习形式影响语音感知学习的效果基于组1,2,3的实验结果,我们发现,通过练习或者学习,被试的成绩尽管有显着的提高,但是提高幅度不是很理想.为了防止实验过程中有可能出现的“地板效应”,我们通过问卷调查的形式,总结出了一些可以促进学习效果的方法,并且将它们以可执行的操作方式加入了改良后的程序B.在使用程序B的组4中,我们发现该组被试的正确率由学习前的%提高到了学习后的%,平均提高%.而各个组之间以测试正确率为协变量(总均数为)比较的协方差分析也表明,组4成绩的提高与组1,2,3相比较均有显着差异,同时组1,2,3成绩的提高之间则未见有显着差异.表1各组所提高成绩的比较和协方差分析

3讨论

针对感知学习的研究在揭示人类的学习、记忆等高级认知活动的生理和心理机制方面有着极为重要的作用[5-6].感知学习的研究模型有很多种,主要集中在视觉[2,7,8]、听觉[9-10]和运动[1,11]三大领域.这些模型大多数都是只针对视觉或者听觉的刺激信息来做出的识别、记忆或者辨别反应.然而,除了记忆之外,学习的过程中还有更复杂的感知活动参与.语音学习时,由于在不同的字符组合中,相同的发音单元常会因为其前后所连接字符的不同而表现出不同的发音,而不同的发音单元也会由于其前后所连接字符而表现出相同的发音.因而,对于语音发音规律的学习和掌握就不是单凭记忆不同音素的发音模式可以完成的.它还需要记忆之外的概括和泛化能力[4].语音学习任务为人们进一步深入的研究感知学习提供了非常有意义的模型.

人工合成的英语发音非常难于识别,即使在母语是英语的被试中,初次识别的成功率也只有33%左右[4].这主要是因为机械的发音模式与人类自然的语音发音有明显的区别,人们在对合成发音初次感知时,很容易产生错误的知觉.不过,有研究表明,一段时间的规律学习能使得对合成发音识别的正确率提高平均约45%,而即使只是短期的一次性集中学习,正确率也能提高平均约20%[4].本研究尝试了以中国青年为被试的合成英语语音感知学习模型.由于英语不是母语,而且人工合成发音本身难于识别,因此,在整个实验过程中,被试对语音识别的正确率普遍都比较低.尽管如此,学习或者说练习能够有效的提高被试的成绩.由于被试听到的单词不重复,在识别单词的发音时,成绩的提高就完全有赖于对一过性的发音和拼写进行高度的概括和泛化,并把获得的规律应用到新单词中去,以此来适应新的测试内容.从影响感知学习效果的因素方面考虑,我们认为词汇的难易程度、练习量以及学习的方式都是比较重要的影响因素.本研究中,我们发现优化后的学习程序使被试正确率的提高达到了平均约14%,与Fenn等[4]所得到的数据接近,可以说是较为显着的提高了学习的效果.我们由此认为,学习方式对感知学习的效果有显着影响.选择不同的词汇列表以及调整练习的数量并未在不同的被试分组之间得出差异显着的结论,考虑到本研究所涉及的被试数量较少,我们正在尝试扩大被试数目以及对词汇的难易程度和练习量进一步的分级,以期能够更好的对上述各因素做出解释.

【参考文献】

[1]FischerS,HallschmidM,ElsnerAL,etal.Sleepformsmemoryforfingerskills[J].ProcNatlAcadSci,2002,99:11987-11991.

[2]KarniA,SagiD.Wherepracticemakesperfectintexturediscrimination:Evidenceforprimaryvisualcortexplasticity[J].ProcNatlAcadSciUSA,1991,88:4966-4970.

[3]GaabN,PaetzoldM,BeckerM,etal.Theinfluenceofsleeponauditorylearning:Abehavioralstudy[J].Neuroreport,2004,15:731-734.

[4]FennKM,NusbaumHC,MargoliashD.Consolidationduringsleepofperceptuallearningofspokenlanguage[J].Nature,2003,425:614-616.

[5]EganJP.Articulationtestingmethods[J].Laryngoscope,1948,58:955-991.

[6]WalkerMP,StickgoldR.Sleep,Memory,andPlasticity[J].AnnuRevPsychol,2005,[Epubaheadofprint]

[7]HauptmannB,KarniA.Fromprimedtolearn:Thesaturationofrepetitionprimingandtheinductionoflong-termmemory[J].BrainResCognBrainRes,2002,13:313-322.

[8]MaquetP,LaureysS,PeigneuxP,etal.Experience-dependentchangesincerebralactivationduringhumansleep[J].NatNeurosci,2000,3:831-836.

[9]AtienzaM,CanteroJL,StickgoldR.Posttrainingsleepenhancesautomaticityinperceptualdiscrimination[J].JCognNeurosci,2004,16:53-64.

[10]RothDA,Kishon-RabinL,HildesheimerM,etal.Alatentconsolidationphaseinauditoryidentificationlearn

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论