对外汉语教学的测试和评估教学课件_第1页
对外汉语教学的测试和评估教学课件_第2页
对外汉语教学的测试和评估教学课件_第3页
对外汉语教学的测试和评估教学课件_第4页
对外汉语教学的测试和评估教学课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

对外汉语教学的测试和评估测试的类别语言测试的内容和类型试卷设计测试质量的保证【一】测试的类别第二语言教学的全过程和全部教学活动可以概括为总体设计、教材编写(或选择)、课堂教学和成绩测试四大环节。语言测试是语言教学的四大环节之一,是语言教学活动的一个组成部分。语言测试有不同的目的,不同的目的决定了测试的要求、内容和方法的各异。按照不同的测试目的,可以把语言测试划分为不同的类别:(1)水平测试(2)成绩测试(3)诊断测试(4)潜能测试(一)水平测试水平测试(proficiencytest)的目的是测量测试对象的第二语言水平。水平测试的内容和方法以能够有效地测量测试对象的实际语言水平为原则。一般而言,水平测试有专门的考试大纲、统一的试题和统一的评分标准。它以尽可能客观的标准来测量考生的目的语水平,能够证明达到同样分数线的考生具有基本相同的目的语水平。因此,水平测试不以任何一个教学单位的教学大纲或某一种教材为依据,不考虑任何一个教学单位的课程特点。水平测试跟教学过程没有直接的联系。由于水平测试不需要考虑测试对象的特点和他们的学习过程,所以同一种水平测试可以适用于不同的测试对象。因此,水平测试的结果也可以作为新生入学分班的依据。《中国汉语水平考试[HSK(初、中等)]大纲》1989年11月由现代出版社第一次出版,半年后于1990年8月再版,1991年9月第三版,1993年11月第四版,1995年4月第五版,1996年12月第六版。为了适应海外学习中国汉语学生的考试的需要,1992年、1993年先后在日本和韩国出版了汉日对照本和汉韩对照本。2003年6月出第八版。2006年修订再版,主要对“中国汉语水平考试(HSK)介绍”、“HSK(初、中等)统一指导用语”,进行了修改。增补了一套样题。中国汉语水平考试(HSK)由北京语言大学汉语水平考试中心设计研制:包括基础汉语水平考试[简写为HSK(基础)],初、中等汉语水平考试[简写为HSK(初、中等)]和高等汉语水平考试[简写为HSK(高等)],三者在等级水平上互相衔接。初、中等汉语水平考试[HSK(初、中等)]是专为测量母语非汉语者的初等和中等汉语水平而设立的标准化考试,也是中国首次推向海外的标准化考试。中国国家教育部设立国家汉语水平考试委员会,每年定期在中国国内和海外举办HSK,凡考试成绩达到规定标准者,由国家汉语水平考试委员会统一颁发《汉语水平证书》。为有效测量第一语言非汉语者从事商务活动的汉语水平,满足国内外母语非汉语学习市场的需求,特委托北京大学研制开发商务汉语考试。商务汉语考试研究项目为国家重点科研项目。

2005年7月,中国召开首次“世界汉语大会”,此会的召开标志着汉语国际推广进入了新的阶段。为更好地适应新形势,使商务汉语考试大纲在理论阐述、试题设计、文字表达上都能达到更高的水准,以满足世界各地对商务考试的需求,由此又特邀国内外专家再次对大纲进行审定修改,并决定考试定名为“商务汉语考试”,简称BCT。此后,根据专家意见再次对考试试卷进行了相应的调整。2006年,修订后的新试卷在国内外进行了新一轮预测,并最终确定了题型。在听取专家意见的基础上,于2006年8月完成了考试大纲的修订工作。为使商务汉语考试真正测出应试者在商务环境中的语言交际能力,试卷中的语料大多取自商务环境中的真实语料,并根据需要作了必要的修改。(二)成绩测试成绩测试(achievementtest)是一门课程或一种课型在一定学习阶段的测试,所以也称之为课程测试。成绩测试用以检查测试对象在学习的一定阶段掌握所学课程的情况,测量他们的学习成绩,因此,成绩测试是教学中最常用的一种测试,通常在教学过程中的某个或若干个教学单位之后,或在期中、期末进行。结业考试或毕业考试也是成绩测试。由于成绩测试是课程测试,因此,它跟教学过程和教学对象紧密相关。这种相关性体现在成绩测试的内容和方法一般跟教学大纲所规定的教学要求相一致,跟教材中的教学内容和课堂教学中的教学方法相一致。不同的教学单位有不同的教学要求、内容以及教学方法,也有不同的考试制度、考试方法,试题的难度以及评分标准往往也不尽相同。因此成绩测试可以测定受试者的学习成绩,但不一定能反映受试者的语言水平,这是因为同样的分数并不能反映同样的语言水平。(三)诊断测试诊断测试(diagnostictest)是检查受试者对学习内容的掌握情况,以期发现受试者在学习某一具体内容或语言知识中的困难或不足之处;同时也检查教学效果是否达到教学大纲所预期的要求;从测试中可以反映出教和学双方存在的问题,以便在教学中采取措施,加以弥补、改进。诊断性测试一般不受教学进度的限制,随时可以进行,以尽早发现问题。诊断性测试的测试内容可以相对集中,突出针对性,以观察课堂教学中随堂观察或成绩测试中不易发现的现象,并获得相应的数据。(四)潜能测试潜能测试(aptitudetest)也称为学能测度、预示测试或素质测试。这种测试的目的在于了解受试者学习第二语言的潜在能力。这种能力一般包括模仿能力、记忆能力和理解能力,具体而言指辨音的能力、模仿语音的能力、词汇记忆的能力、解释语法现象和理解语句的能力以及归纳学习的能力等等。潜能测试的内容一般根据测量这几方面的能力的需要来确定。测试用的语言必须是受试者从未接触过的语言,并在教学之前进行测试,以测定受试者在多大程度上适合学习第二语言。潜能测试既不能反映受试者第二语言学习已达到的水平,也不能反映他们的学习成绩和学习中所存在的问题,但是它具有第二语言学习能力的预测作用,因而也是不可或缺的一种测试类型。【二】语言测试的内容和类型(一)语言测试的内容:第二语言教学的根本目的是培养学生的语言能力和语言交际能力。第二语言测试,尤其是水平测试、成绩测试和诊断测试应当与这一教学目的相一致,应当以测量测试对象的语言能力和语言交际能力为出发点。因此,语音、词汇、语法、汉字等语言要素,听说读写言语技能和在言语交际技能中涉及的语用规则、话语规则、交际策略,以及语言文化因素、基本国情和文化背景知识等等,都是语言测试的内容。具体而言,成绩测试和诊断测试要配合教学大纲和教学计划的实施,按教学内容确定测试内容。

水平测试要全面测量受试者的语言能力和语言交际能力,要检验受试者的整体语言运用能力,因此要全面、综合地测量语言知识、言语技能、言语交际技能以及相关的文化知识等各项内容。总之,理想的水平测试应当包括全部测试项目和测试内容。对外汉语教学界于1984年开始研制汉语水平考试(HSK),1985年完成第一套试题,1986年6月,在北京语言学院举行了首次考试。(二)语言测试的类型:

试题的类型——题型:对外汉语教学常用的测试题型有:

1.多项选择题也叫四项选择题,是阅读、听力等语言技能考试的常用题型。最大的优点:评分客观,信度大。受试者一般不回避,效度也大。命题的关键点:设置干扰项。缺点:命题费时费力,且有25%猜中率。

2.综合填空题是完形填空的基本形式,在一篇短文里隔开一定的字数删掉一个词,让受试者补上。优点:既能考察出综合运用语言的能力,又具客观性。命题应注意:短文长度在200-300字之间,填空以词为单位,距离间隔要平衡。

3.口试目前,水平考试几乎是测试听、读能力,最多加上写作能力。测试说的能力,因技术和人力原因还难以操作。HSK高等采用了录音方式,但不够自然。口语表达能力是语言交际最直接、最重要的能力,不包括口语的水平考试是不完整的测试。

4.写作可以全面反映受试者语法、词汇、汉字及成段表达的能力。最大缺点:评分的主观性。【三】试卷设计试卷设计主要包括两部分内容,即卷面的构成和试题的类别,以下分而述之。(一)卷面构成

卷面是指一次考试中的一种试卷。如果在考试中要用两种试卷分别测试会话和阅读,那么这两种试卷就是两个卷面。卷面的构成是指测试的项目和内容分布在几个卷面中,以及一个卷面包括的测试项目和测试内容。卷面的构成分为单项卷面、双项卷面和多项卷面,它是根据试卷所包括的项目的多少来区分的。单项卷面只测试一个项目;双项卷面测试两个项目,项目的组合可以根据需要而定,例如听和说、读和写;多项卷面测试三、四个项目,例如:听、说、写的组合等等。无论哪种卷面,每个项目既可以包括该项目的全部测试内容,也可以只包括该项目的部分内容。卷面的构成一般要考虑两方面的因素:因素一是测试目的、测试项目和内容;二是测试时间的长短。一般情况下,测试一个项目,则采用单项卷面;测试两个或两个以上项目,则根据测试内容及题量,每个项目的测试内容和题量大的,可采用单项卷面,把不同测试项目分散到几个单项卷面中;每个项目的测试内容和题量小的,可采用双项或多项卷面,把不同的测试项目集中到双项或多项卷面中。目前最常用的是单项和双项卷面。另外,任何考试,测试时间都有一定的限制,所以卷面的构成要考虑到时间的因素,不能太长,要让受试者能在规定的时间内完成。不同的测试类型有不同的卷面构成:

1.水平测试:要求全面测量测试对象的语言能力和语言交际能力,水平测试通常应包括全部测试项目和测试内容,宜采用单项卷面,或者有的项目采用单项卷,有的项目采用双项卷面。

2.成绩测试:对外汉语教学有多种课型,有综合课也有专项技能课,每种课型都要进行成绩测试,因此成绩测试的卷面构成应跟课型的教学任务相一致。测试项目单一的可以采用单项卷面;测试项目较多的,则根据每个项目测试内容和题量,可以采用单项卷面,也可以采用双项或多项卷面。一般而言,初级阶段可采用双项或多项卷面,中高级阶段测试内容较多的,则多项卷面的采用就不太适宜。

3.诊断测试的目的在于了解受试者在学习中所存在的困难和问题,以便在教学中加以改进和提高,因而诊断测试具有较强的针对性,测试内容相对集中,测试项目和题量都有所控制,所以宜采用单项卷面。(二)试题的类别语言测试题可以从不同的角度进行分类:1.标准化试题和非标准化试题。这是按测试制作的要求,也就是从命题过程和试题的可靠性程度的角度划分出来的类。标准化测试一般以现代教育测量学的理论为依据,遵照科学的程序,对考试的全过程,从设计、命题到评分、分析等等实施标准化运作,严格控制误差,能高效、准确地测出受试者的真实语言水平。标准化测试一般由权威机构和专业队伍研制,试题经过反复试测和筛选而确定下来,具有相对的稳定性。非标准化测试指由任课教师根据具体教学需要而自行设计、命题、实施测试以及进行评分的测试。这类测试大都没有统一的标准,并在小范围内施测。成绩测试和诊断测试即属此类。

2.主观性试题和客观性试题这是按评卷的客观化程度进行的分类。主观性试题指测试结果的评判在很大程度上决定于阅卷者的主观判断。作文、口试、翻译等属于主观性测试。客观性试题有统一的阅卷标准,答案固定,不因阅卷人的主观意愿而改变。多项选择、判断正误等大都属于客观性测试。主观性试题能较为全面地考察受试者的综合语言能力,命题相对简单,但是阅卷评分较难,往往会因为阅卷者的个人认识及喜好而左右测试的结果,如果是大规模的测试则要耗费大量的人力和经费。客观性试题阅卷评分比较简单、方便,可以运用机器进行阅卷,试题的覆盖面也能有所保证。但是客观性试题的命题有一定的难度,而且较难考察受试者的语言表达能力和综合能力。要全面考察测试对象的各项言语技能和言语交际技能,则主观性试题与客观性试题的结合是比较理想的方式。

3.分立式试题和综合性试题这是从试题的题型角度进行的分类,或者说是根据试题所包含的测试内容的特点划分出来的类。

分立式试题是对受试者所掌握的语言知识和语言技能进行分项测试,以考察受试者各个单项的能力,例如填空、改错、多项选择等题型属于分立式试题。

综合性试题是对受试者的整体语言能力(语言知识和语言技能)进行综合性的测试,它全面考察受试者的语言能力,听力理解、完形填空、写作等等属于综合性测试。

分立式试题的优点在于测试项目往往有很强的针对性,受试者很难进行回避,因而它容易体现客观性,实现标准化。它的缺点是各个项目测试的结果的总和不一定能反映受试者的整体语言水平和语言能力,不容易全面测量测试对象的言语技能和言语交际技能。综合性试题不同于分立式试题,它全面综合考察受试者运用语言的能力,但有些试题如写作、会话,不容易体现客观性,也较难实现标准化。要使分立式试题和综合性试题两者互补,扬长避短,关键是找到语言点的掌握与相应的言语技能和言语交际技能之间的对应关系。【四】测试质量的保证语言测试的质量能否得到保证,可以从效度、信度、区分度及反馈作用四个方面加以考察和评析。理想的语言测试的质量应当在这四个方面都达到较高的水平。(一)效度效度即有效性,指测试的有效程度,也就是测试的内容和方法是否达到了测试的目的。要保证效度,关键是测试的项目和内容要与测试目的相一致。这种一致性具体表现在这几个方面:首先该测的当测,不该测的尽量不涉及。其次该测量的部分还要注意是否有缺漏或出现偏题、怪题。第三,要注意试题所包含的内容的代表性、准确度和覆盖面如何。例如测量阅读理解的能力,就要保证一定的卷面长度。卷面太短,则阅读速度就测量不出。再如,成绩测试要以教学主要内容为主,如果试题内容超过了一定的教学范围,那么试题本身的代表性和准确度就打了折扣,自然也无法实现测试的目的。影响效度的主要因素有:①目的不明确,测试什么不清楚。例如听力理解,用篇幅过长的文本,则难以确定受试者的听力理解水平和记忆力二者之间哪一个起的作用。②命题本身的问题。试题不明确,试题本身的语言表达不清楚或试题要求不明了;试题过多或过少,过难或太容易,不能真实、全面地反映受试者的水平;试题之间相互暗示或在编排顺序方面可能暗示某些试题的答案。③考试的组织管理方面的不足和欠缺。如测试指导语不明确,环境、设备差;考场组织、纪律无序,监考人员的行为如收发卷未按规定执行,甚至提示、暗示等等。(二)信度信度即可靠性,指测试结果的可靠程度和稳定性。也就是同一个卷面和难易程度相同的试题用于水平基本相同的受试者,测试结果是否基本相同,是否反映了受试者的实际水平。语言测试是测量语言的工具,工具本身必须可靠。同一试卷测量同一受试者,在其语言知识和能力水平没有变化的情况下,如果几次测量的结果都不同,则说明测量工具有问题。测试的成绩越接近受试者的真实水平,则测试的信度也就越大。要保证试卷的稳定性,必须讲究测试的信度。而试卷的稳定性对水平测试而言,可以保证达到同一分数线的受试者具有基本相同的水平;对成绩测试而言,除了保证达到同一分数线的受试者具有基本相同水平外,还能较为客观地反映教学质量和教学情况。构成卷面信度的因素主要有:①卷面构成。卷面构成要达到测试项目合理安排、测试内容有一定的代表性和覆盖面的要求。②试题的数量。难易相当的同类题型的题数越多则信度越高。题量少,偶然性大,则信度低。③评

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论