高适应度四字成语识别的实验研究_第1页
高适应度四字成语识别的实验研究_第2页
高适应度四字成语识别的实验研究_第3页
高适应度四字成语识别的实验研究_第4页
高适应度四字成语识别的实验研究_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高适应度四字成语识别的实验研究

1实验对词汇识别的作用自20世纪70年代以来,多词素词的表现和加工成为心理学和语言学研究的热点。多词素词是如何通达的,是直接通达整词词条还是通过词素词条的通达来识别整词?这是多词素词表征研究的一个重点。在拼音文字的研究中,研究者提出了几种比较有代表性的理论模型。(1)整词表征模型:该模型认为多词素词在心理词典中是以整词形式表征的,没有独立的词素表征。(2)分解表征模型:即多词素词在心理词典中是以分解的词素方式表征的,识别词汇必先表征词素。(3)混合表征模型:认为在词汇通达中既有整词又有词素,元素间可以交互激活。比较具有代表性的混合模型如:AAM模型(augmentedaddressedmorphologymodel),该模型认为对于熟悉的高频词来说是整词识别,对于不熟悉的低频词则是词素识别。中文虽不同于拼音文字,但目前对中文材料的研究结论与对拼音文字的研究结论有相一致的方面,而且分别有实验研究支持以上三种理论模型。关于整词频率对词汇识别的作用的研究,结论和拼音文字的研究结论基本一致,即高频词的识别显著快于低频词。也有研究者研究了词素频率对词语识别的影响。张必隐等采用控制词频,变化词素频率的方法,分别对联合式合成词和偏正式合成词的表征方式进行了研究,结果表明:词素频率和整词频率对词的识别都有影响。作者认为在心理词典中双字词是以分解形式表征和存储的,同时整词频率对词素表征之间的联系强度也有影响,所以对词的识别有作用。Taft等人也发现了类似的词素频率效应,在他们的研究中实验材料为词频相同的双字词,根据词素的频率分为四组:高频—高频组,高频—低频组,低频—高频组和低频—低频组。结果发现词素频率对词语的识别有影响,高频—低频组和低频—高频组的反应时长于高频—高频组的反应时;但一个有趣的现象是,低频—低频组的反应时却与高频—高频组相同。作者认为可能的原因是低频—低频组的材料多为连绵词,这些词可能是作为一个整体单元被表征的。王春茂等在研究中同时考察词频和词素累积频率(即词素频率之和)对词汇识别的作用,结果发现在高频词中,高词素累积频率的词语的识别快于低词素累积频率的词语;但在低频词中没有这种差异。作者用连接主义的观点解释了该现象:即高频词的词素与整词间连接较强,因此出现了词素累积频率效应,在低频词中,这种连接比较弱,词素对整词的作用较小,因此没有出现词素累积频率效应。有研究同时控制了词频、首字字频和尾字字频,并从发展角度对词汇识别问题进行了探讨。实验的结果支持混合表征模型,对于高频词是以整词形式储存的,低频词则以词素分解形式储存;而且混合表征模型在个体年龄很小时就已形成,不随年龄的增长而变化。以上研究都是以汉语双字词为材料,得到的结论也仅限于此类词语。对于汉语中的一种特殊的多词素词类型―四字成语,它的识别机制如何,是否和双字词一致?本研究选用高熟悉度的成语,控制构成成语的成份词(即首词和尾词)的频率,考察成份词的频率对成语识别的影响,分析成语识别的内在机制。2方法2.1测试对象被试为天津师范大学35名在读本科生,男生15人,女生20人。实验结束后被试可以获得一份礼物。2.2实验设备采用DMDX系统,显示器分辨率为1024×768像素,刷新频率为60Hz。刺激以初号宋体字呈现在屏幕中央,黑底白字。2.3实验材料2.3.1双词语的熟悉度从《汉语成语多用词典》(增订本)中选取了194个成语,其中构成这些成语的起始两个字和最后两个字又分别可以构成两个不同的双字词,如:“人心涣散”,还可构成“人心”与“涣散”两个双字词。请20名大学生对这些成语的熟悉度进行7点评定,分值越高,熟悉度越高。选取熟悉度>5的成语为高熟悉度成语,共168个,这些成语的平均熟悉度为6.43。2.3.2总体上选取不同类型的成语用《现代汉语频率词典》查构成这些成语的首词和尾词词频(单位为1/131万)。以词频≤30为低频,词频>100为高频的标准分别选取四种不同类型的成语,即首词频高尾词频高(HH)、首词频高尾词频低(HL)、首词频低尾词频高(LH)和首词频低尾词频低(LL)各20个。材料的匹配见表1。2.3.3刺激呈现序列编造40个四字非成语作为填充词,且这些填充词的起始两个字和最后两个字也可以分别构成一个双字词,将这些填充词和80个成语随机混合构成一个刺激呈现序列。2.4实验设计本实验为2(首词频高、首词频低)×2(尾词频高、尾词频低)被试内重复测量实验设计。因变量指标为反应时和错误率。2.5被试操作启动实验个别进行,整个实验过程大约需要10分钟。第一阶段为练习,确保被试熟悉实验过程,第二阶段进行正式实验。实验开始时,首先在屏幕中央呈现一个“+”字形注视点,呈现时间由被试按键控制;被试按键后在屏幕中央出现刺激项目,要求被试迅速而又准确地判断刺激是否为成语,如果是,用左手按键盘左侧“shift”键,如果不是,用右手按右侧“shift”键,按键后刺激项目消失。计算机记录下从刺激开始呈现到被试做出反应的时间和错误的反应。3正确反应时和错误率数据分析时,删除每个被试平均数加减三个标准差以外的数据。由于被试在部分成语上的反应错误率较高,因此又删除错误率大于50%的11个成语,最后只对69个成语进行了分析。对反应时进行分析时删去所有错误反应的时间。不同类型成语的正确反应时和错误率见表2。采用SPSS12.0软件包对正确反应时和错误率进行多因素的方差分析。数据分别以被试为随机变量(F1)和以项目为随机变量(F2)进行方差分析。3.1简单效应检验结果反应时的数据显示,首词频的主效应显著,F1(1,34)=12.29,p<0.01;F2(4,65)=6.92,p<0.05,表现为首词频低的成语的反应时间显著快于首词频高的成语的反应时间。尾词频的主效应在以被试为随机变量的方差分析上显著,F1(1,34)=6.30,p<0.05,尾词频低的成语的反应时间比尾词频高的成语快67ms;在以项目为随机变量的方差分析上边缘显著,F2(4,65)=3.14,p=0.08。首词频与尾词频的交互作用在以被试为随机变量的方差分析上显著,F1(1,34)=13.70,p<0.01;在以项目为随机变量的方差分析上边缘显著,F2(4,65)=3.63,p=0.06。由于首词频与尾词频的交互作用显著,进一步进行简单效应检验。结果显示,当首词频为低频时,尾词频的简单效应在被试分析上显著,t=4.23,p<0.01,尾词频低的成语的反应时比尾词频高的成语快150ms。其它均不显著(p>0.1)。这一结果表明,只有当首词频为低频时,存在尾词的频率效应。3.2尾词频的构拟和交互作用统计数据显示,首词频的主效应显著,F1(1,34)=30.23,p<0.01;F2(4,65)=5.50,p<0.01,首词频高的成语的反应错误率高于首词频低的成语。尾词频的主效应显著,F1(1,34)=18.76,p<0.01;F2(4,65)=10.90,p<0.01,尾词频高的成语的反应错误率高于尾词频低的成语。尾词频与首词频的交互作用不显著,F1(1,34)=0.72,p>0.1;F2(4,65)=0.27,p>0.1。4成瘾词频率的作用模式由于目前的词频词典仅对极小部分成语进行了统计,因此很难对成语的词频进行匹配,所以在本实验中对成语的熟悉度进行了评定。根据本研究的需要,在选择成语时,必须考虑到构成成语的两个成份词在词频词典中能查到词频,按这一标准选择的成语在进行熟悉度评定时,发现绝大多数成语为高熟悉度成语,难以进行熟悉度匹配,因此在最终的实验材料中只选择了高熟悉度的成语。这可能也说明了为什么对成语识别的研究较少的原因,即材料的选择和匹配较难。本实验的结果发现,构成成语的成份词的词频对成语的识别有影响,具体表现为:首词频低的成语的反应时间短于首词频高的成语;对于首词频低的成语,尾词频低的反应时短于尾词频高的反应时。而且错误率分析的结果与反应时的结果比较一致,首词频低的成语的错误率显著低于首词频高的成语,尾词频低的成语的反应错误率显著低于尾词频高的成语。这一结果证明在成语识别中存在成份词的词频效应。有趣的是,成语成份词频率的作用模式与双字词词素频率的作用模式相反。在对双字词的研究中,发现词素累积频率高的词语的反应时短于词素累积频率低的词语,高首字字频词识别的反应时短于低首字字频词的反应时;高尾字字频词识别的反应时短于对低尾字字频词的反应时。如何解释这种与双字词识别相反的现象呢?中文双字词的表征和加工的理论观点主要有两种:一种是张必隐等提出的分解存储的观点,另一种为周晓林等提出的多层聚类表征模型(themulti-levelclusterrepresentationmodel)。分解存储观点认为,在心理词典中双字词的表征是以分解形式存储的,即以字的表征为存储单位,字表征之间存在不同的联系而形成一个网络。而多层聚类表征模型则认为心理词典中含有音节、词素和整词三个表征层,每一表征层内是一种网络结构,其中相互联系的多个表征形成一个Cluster,Cluster内的表征间是相互竞争的关系,而各表征层间是相互激活的关系。尽管这两种观点都是根据对双字词的研究提出的,对四字成语不一定合适。但这两种观点的基本思想可以对解释四字成语的识别现象有一定的参考价值。从以上分析可以看出,分解表征模型比较强调内部表征的基本单元和识别加工的基本单元,而多层聚类表征模型则更强调内部表征层间的相互竞争和联系。由于四字成语的特殊性,成语本身可能以整词的形式在心理词典中存储,同时其成份词本身也可能以双字词的形式储存在心理词典中,具有自己独立的词条。在成语识别时,成语本身的表征和成份词的表征可能相互竞争,因为频率较高的成份词比频率较低的成份词会更快地激活作为双字词的表征,因此这一表征激活可能和对成语本身的表征激活相竞争,干扰较大,从而造成对高频率成份词的成语的识别反应时较长,且错误率较高。但对于低频率成份词的成语而言,由于成份词频率较低,激活表征较慢,因此对成语表征的激活的竞争力不如高频率成份词,干扰性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论