基于《大纲》规定的普通话免测“选择判断”项的变化_第1页
基于《大纲》规定的普通话免测“选择判断”项的变化_第2页
基于《大纲》规定的普通话免测“选择判断”项的变化_第3页
基于《大纲》规定的普通话免测“选择判断”项的变化_第4页
基于《大纲》规定的普通话免测“选择判断”项的变化_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于大纲规定的普通话免测“选择判断”项的变化一、问题的提出普通话水平测试大纲(以下简称大纲;,)规定:普通话水平测试的内容包括普通话语音、词汇和语法,试卷包括5个组成部分,满分为100分:读单音节字、读多音节词语、选择判断、朗读短文、命题说话。每个测试项分值不同,有各自不同的检测目的(表1):同时并说明:各省、自治区、直辖市语言文字工作部门可以根据测试对象或木地区的实际情况,决定是否免测‘选择判断’测试项。从各地区开展测试的实际情况看,除了内地个别省份、港澳台地区及海外测试还保留选择判断;测试项,其他地区都采取免测选择判断;测试项的做法。可以说,不论是在区域上还是在测试

2、人数上,免测选择判断;测试项的四项测试都是主流。普通话水平测试不是一般的学术性的测试,不是可有可无的,而是关系到推普大业的一项测试;。中华人民共和国国家通用语言文字法对应当接受测试的人群有明确的规定,普通话水平测试的成绩成为资格准入的条件。免测选择判断;测试项,直接改变了测试项目和评分标准,这种变化对测试成绩会产生怎样的影响?大纲为什么允许选择判断;测试项的免测与不免测并存?基于对母语的经验性认识和判断,免测选择判断;测试项的大局早在普通话水平测试开始实施的阶段就已经形成,而实证研究一直比较缺乏。关于免测选择判断;(不免测选择判断;的下文称五项测试;,免测选择判断;的下文称四项测试;,)对应试

3、人成绩的影响,陶星霖曾经做过一个小样木研究。这一研究选择了28个样木,测试员先后根据大纲五项测试的评分标准和某省评分细则评分,通过应试人成绩的变化比较大纲的评分标准与某省的评分细则的差异。在这个小样木研究中,使用的评分标准并不完全相同,测试员先后两次评分也会存在差异,这些都是可以改进的地方。木研究拟扩大样木量,以大纲的评分标准为唯一依据,同时避免测试员重复评分时主客观条件变化带来的影响,再进行统计分析。二、免测选择判断;项的实证研究限于语音样木选择条件,木研究随机选取88位香港应试人参加电脑录音测试的语音数据和评分数据进行分析。香港采用的是五项测试,木研究采用的方法是:先根据大纲五项测试的评分

4、标准进行评分,语音数据不变、测试员不变、也不做重复评分,只是根据大纲对四项测试的评分标准调整评分,然后进行对比分析,借以观察免测选择判断;后应试人成绩的变化情况。数据采用SPSS 13.0统计工具进行统计。大纲规定,如果免测选择判断;项,单音节词、多音节词语、朗读短文的分值和评分标准都不变,只是命题说话;测试项的分值由原来的30分调整为40分。具体来说,原来赋予选择判断;的10分重新分配给命题说话;项的语音标准程度;和词汇语法规范程度;两个评分项,语音标准程度的分值由20分调整为25分;,词汇语法规范程度的分值由5分调整为10分;。分值的调整存在以下规律(表2)。(一)免刚选择判断;项以后分数

5、的变化刘照雄先生曾预测,免测‘选择判断’项相对提高了测试的难度。如果确定得不恰当,会在一定程度上影响测试的信度。4位测试人参加五项测试和四项测试最后分数的分布曲线的偏态系数和峰度系数都在士1之内,基木符合正态分布。五项测试的平均分为75.99分,四项测试的平均分为75.13分,五项测试比四项测试的平均分高0.86分。经配对样木T检验,在95%置信度下,双尾检验的显著性为0.000,小于0.05,五项测试与四项测试的平均分存在显著性差异,证明四项测试的难度确实大于五项测试。同时,统计表明,五项测试与四项测试的分数的皮尔森相关系数(CPearson correlatior达

6、到0.996,显著性为0.000,五项测试与四项测试的分数存在显著相关,证明四项测试与五项测试具有同样的信度和效度水平。免测选择判断;后分数变化的三种情况分别为(表3):考察发现,总分提高的样木在选择判断;测试项的平均失分为3.69分,而总分降低的68个样木在选择判断;测试项的平均失分为1.16分,相差明显。如果不考虑语音失分,总分提高的应试人在判断;中的平均失分达到2.17分,远远高于0.9分的平均失分。取消选择判断;项以后,虽然在命题说话;中语音标准程度;和词汇语法规范程度;的失分都会增加,但语音失分最多增加2分,词汇语法失分最多增加1分,再加上选择判断;项中的语音失分失而复得,这部分应试

7、人的最后成绩反而提高了。选择判断;失分越多,免测选择判断;项以后分数的补偿作用越明显,而那些在选择判断;中木来失分很少或根木不失分的应试人只能眼睁睁地看着命题说话;中的失分增加。(二)免刚选择判断;项以后等级的变化相对于分数,应试人更关注等级,因为行业准入标准一般是以等级来划定的。统计显示,五项测试与四项测试在等级上分布基木符合正态分布,等级分布的具体变化如下表(表4):经统计,在95%置信度下,双尾检验的差异显著性为0.000,小于0.05,说明五项测试与四项测试的等级存在显著性差异。五项测试与四项测试的等级的斯皮尔曼相关系数(Speann an correlation)达到0.915,显著

8、性水平为0.000,五项测试的等级与四项测试的等级显著相关,证明从等级的角度看,五项测试与四项测试也具有同样的信度和效度水平。五项测试与四项测试的等级分布情况说明,虽然木研究语音样木的地域来源比较单一,但测试等级分布也与全国的分布形势大体相同,也就是二级乙等数量最多,二级甲等和三级甲等数量其次,一级乙等和三级乙等再次,一级甲等和不入级最少;。C5免测选择判断;项以后,在等级分布上,一级乙等、二级乙等减少,主要向三级甲等集中,但二级乙等和三级甲等占主要的总趋势没有改变,也比较符合香港的实际情况。免测选择判断;后等级变化的三种情况分别为(表5):数据表明,免测选择判断;之后,测试项目、评分标准发生

9、变化,几乎100%的应试人分数都发生了变化,但仍然有82%的应试人可以维持在原来的等级,原来是三级水平的样木都没有发生等级变化。考察等级发生变化的16个样木,发现应试人的分数有明显的共性:不论是等级提高还是等级降低,这些分数都是某一等级的临界分数(一般为士1分,不超过2分),等级变化之后的分数仍然属于临界分数。这主要是因为普通话水平测试的三级六等各有一定的分数范围,等级越低,分数范围越大,如果原来的分数处在边缘地带,调整以后很容易引起等级的变化。(三)应试人选择判断;项成绩分析我们一直认为选择判断;项存在难度低、区分度也低。选择判断;测试项平均失分1.6分,其中语音;平均失分0.7分,只有4人

10、没有出现语音错误;判断;平均失分0.9分,只有25人(28%)没有出现判断错误。除去语音因素,判断;的平均失分仅为0.8分。以得分率计算,选择判断;测试项总体的难度系数为0.84,不考虑语音因素,则达到0.92,得分系数偏高,说明选择判断;测试项试题的难度偏低。在经典测试理论中,区分度常常以某测试项高分组与低分组平均分数的差异或某测试项的得分与测验总分之间的相关程度来表示,差异越大或相关系数越高,试题的区分度越好。将应试人的选择判断;成绩进行分组统计,有23人在高分组,65人在低分组,高分组平均失分3.49分,低分组平均失分0.96分,采用独立样木T检验的结果为,在95%置信度下,双尾检验的显

11、著性水平为0.000,差异非常显著。同时,统计表明,选择判断;与五项测试的总成绩之间的相关系数为0.863,在99%置信度下的显著性水平为0.000,相关性非常显著,说明选择判断;的区分度良好。数据同时也能证明选择判断;在普通话水平测试中也有效度和信度上的价值和贡献。但是,在选择判断;测试项的失分中如果不考虑答题方式错误(比如照念题干和选项)有近50%来自语音失分,该测试项测查词汇语法规范程度的效度要打一些折扣。除去语音因素,判断;与命题说话;项中词汇语法;小项失分情况对照(表6):选择判断;中判断;与命题说话;中的词汇语法规范程度;的相关系数仅为0.035,双尾检验显著性水平为0.749,大

12、于0.05,没有显著性相关,不能简单类推。木研究中的应试人在有文字凭借的选择判断;项中,有72%的应试人出现了判断失误,在无文字凭借的命题说话;项中,78%的应试人出现了词汇语法错误。普通话的语序及表达方式,粤方言口语虽然不这么用,但应试者在学习书而语时已掌握,有一定的语感,在测试中基木都有正确的选择;,但在实际的口语运用中还是不能运用自如。(四)结论(1)由于五项测试与四项测试的分数和等级都存在统计学意义上的显著差异,为保证普通话水平测试的公平性,应尽量避免五项测试与四项测试两种测试模式同时存在。(2)由于五项测试与四项测试在分数和等级上都存在统计学意义上的显著相关,五项测试与四项测试具有同

13、等的信度和效度水平,采取五项测试或四项测试都是可以接受的,从工作实际来看,四项测试被广泛采用,也可以说四项测试是未来的发展趋势。(3)选择判断;项对某些特定人群来说仍有一定的价值。香港地区的语言生活与内地不同,对多数香港应试人来说,这一项的保留在超考试效度层而能够提醒应试人在普通话学习过程中词汇语法规范程度仍是需要注意的问题。(4)由于事实上目前五项测试与四项测试仍是并存的局而,考虑到影响的主要是临界分数以及由此引起的等级的变化,应当加强对等级临界分数的复审。木研究在语音样木的选择及数量上存在一定的局限性,但对于免测选择判断;项的研究有一定的启发。鉴于普通话水平测试的测试量已达3 300余万。

14、是大规模国家级测试,木研究的样木量仍然偏小,下一步的研究中可以考虑将样木量扩大到1 000个以上,并考虑样木地域分布、等级分布等相关因素。三、余论选择判断;测试的目的是测查应试人词汇、语法的规范程度,它的存在直接体现了普通话水平测试的语言观和语言测试观语音、词汇、语法是普通话不可缺少的要素,也是普通话水平测试不可或缺的内容。免测选择判断;项被广泛采用和接受,与普通话水平测试的性质、应试人群以及选择判断;测试项木身的试题形式有直接的关系。普通话水平测试主要考查应试人的语音规范程度,同时兼顾词汇和语法等非语音要素。语音是语言的物质外壳,普通话水平测试是而向汉语母语人的口语测试,在方言与普通话的差异

15、中,最容易感受到的是语音的差异,普通话水平测试以语音规范程度、标准程度为检测重点是非常合理的。从现阶段主要的应试人群构成情况分析,按照有关法律和规定的要求,目前应接受测试的人员为:教师和申请教师资格的人员;广播电台、电视台的播音员、节目主持人;影视话剧演员;国家机关工作人员;师范类专业、播音与主持艺术专业、影视话剧表演专业以及其他与口语表达密切相关专业的学生;行业主管部门规定的其他应该接受测试的人员。普通话既是学校母语教育的目的语,也是母语教育的工具,这些人群已接受比较系统的母语基础教育,达到中等文化程度,在长期的书而语学习过程中已基木掌握普通话词汇、语法,在从方言到普通话的转变过程中,普通话

16、水平的高低主要体现为语音规范程度和熟练程度的差异。选择判断;的试题形式为多项选择和搭配组合,这两种题型客观性高,能实现较高的信度,但是不够真实,实验数据也证明选择判断;与命题说话;的相关性不显著。多项选择和搭配组合题型都很难排除答题时的猜测因素,选项越少,猜对概率越高。有些试题木身还有提示正确答案的作用,比如有的干扰项中用到有、子巨;等字,这些字属于方言用字,该方言区的应试人和其他方言区的应试人看到这样的字都不会选择这个选项,这样干扰项就失去了干扰作用。这些因素都进一步降低了测试的难度,使选择判断;几乎成了送分题。此外,选择判断;现有题库中有些试题木身的典型性还值得商榷,用来作为试题未必是合适

17、的。这些因素也是大部分地区选择免测选择判断;项的原因。另外,普通话水平测试的等级有一定的分数范围,越是高等级,分数的浮动范围越小,对评分标准的调整越敏感,最典型的应该是一级甲等。免测选择判断;项对自我目标为一级甲等的应试人有什么影响也有待进一步探讨。为体现词汇、语法规范程度在普通话中的重要地位,同时保证普通话水平测试的全而性,大纲对免测选择判断;测试项以后的分值做了重新分配。从实验数据来看,由于免测选择判断;测试项,应试人在命题说话;测试项中的语音标准程度;扣分平均增加了2分(约27%),在词汇语法规范程度;上的扣分数值上虽然很少,但比例上平均增加了1倍(100%),扣分更为严格。这种调整是对

18、免测选择判断;以后对词汇语法规范程度检测的一种补偿,使得词汇、语法与语音的分值权重比例保持了相对均衡;。通话学习者应清楚地认识到,免测选择判断;项并不意味着免检词汇、语法的规范程度。在注重语音标准、规范的同时,不能忽略词汇、语法的规范程度的提高。相对于语音,普通话水平测试中词汇、语法的研究仍显不足,如何有效检测应试人词汇、语法的规范程度仍在探讨之中。在既有形势下,普通话水平测试员应按照评分标准对应试人的词汇、语法规范程度进行评测。至于在具体评测时如何把握尺度,已有很多专题研究,木文不再赘述。渗考文献l国家语委普通话培训测试中心编制.普通话水平测试实施纲要.北京:商务印书馆,2004:5.2姚喜双.推普上作的重要抓手谈依法推进的普通话水平测试.语言文字应用,214:2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论