




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1第十章
中文测试与评价2
测试与教学大纲、教材编写及课堂教学并称语言教学四大要素。语言测试可以用来对受试的语言能力作出判断,同时也可以用来检验和评估语言教学的效果。3第一节
测试与评价的设计一、测试与评价的基本概念与理论(一)基本概念教学中经常会遇到“测试”“考试”“测验”“测量”“评价”“评估”等术语,这些术语之间既相互关联又存在不同程度的差异。测试指的是在教育过程中,测量学生某一个领域的能力或知识的系统程序或方法。考试与测试是同义词,但更多时候是指与教学大纲相联系的评价。
4测试和测验也是同义词。测验的种类主要分为四大类:智力测验、教育测验、心理测验、职业测验。在心理学领域的测量专指心理测量。斯克瑞文:评价的核心是价值判断。根据教学评价的不同目的,评价分为形成性评价和总结性评价。形成性评价是在教学活动过程中进行的评价,对提高教育活动质量有重要作用;总结性评价是在教学活动结束后对其结果进行的评价,主要目的是问责。5布鲁姆:将形成性评价定义为在教学过程中为了获得有关教学的反馈信息,改进教学,使学生对所学知识达到其所需掌握的程度而进行的系统性评价,是教学控制的关键一环。
安置性评价:发生在教学开始前,是教师根据教学大纲,对学生已学知识和技能的掌握程度进行的评价,不仅包括对旧知识与技能的掌握程度,也包括对即将开展的新的教学知识的掌握程度。诊断性评价:在学生学习的形成性阶段就对学生的学习进行必要的检测,诊断学习中存在的问题,通过必要的矫正来实现掌握。6(二)理论基础
语言测试从语言学、语言教学法和学习论取得科学内容,从心理与教育测量学获得科学手段,成了一门跨学科的综合性科学。
语言测试经历了三个发展阶段:传统或科学前阶段,现代或心理测量结构主义阶段,以及后现代或心理语言学社会语言学阶段。7二、语言测试的整体设计(一)确定测试的目的/功能;(2)确定测试目标;(3)确定测试形式与题型。8二、语言测试的整体设计(一)确定测试的目的/功能;1.安置性测试、诊断性测试和选拔性测试安置性测试(PlacementTest)。用于评估学生的语言能力水平,以便将学生安排到合适的课程或班级中。诊断性测试(DiagnosticTest)的目的在于确定学生在特定方面是否需要更多的帮助。选拔性测试(SelectiveTest)的目的在于通过测试,按一定的条件进行选拔。92.形成性测试和总结性测试。依据测试实施阶段的不同,可将测试分为形成性测试、总结性测试。形成性测试(FormativeTest)是在正在开展的语言课程的不同阶段设置的考试,用来测试学生们学到了什么,通过及时揭示问题,及时反馈以促进教学。总结性测试(SummativeTest)更倾向于在课程结束的时候设置,是对学生一定时期的较全面的学习状况所进行的价值判断,旨在对教育活动作出总结性的结论,甄别优劣,鉴定分等,为各级决策人员提供参考依据。103.成绩测试、能力测试和表现性测试。
成绩测试(AchievementTest)的目的,是在不同的学习阶段,检查学生对所学内容的掌握程度,看是否达到了教学大纲预定的目标。
能力测试(ProficiencyTest)与成绩测试不同,并不考虑考生的具体学习内容,是为了测试不同教育背景下学生的能力而设计的。
表现性测试(PerformanceTest)既有别于能力测试,也有别于成绩测试。表现性测试同样不考虑考生的具体学习内容,在这一点上与能力测试是相同的。11(二)确定测试目标
语言测试整体设计的第二个步骤,是要依据课程目标或教学目标确定测试目标。
评价的目的是检验课程目标或教学目标的实现程度,因此应根据教学目标的性质选择适当的评价方法。12(三)确定测试形式与题型
在确定测试目标之后,需要确定测试形式,如是档案袋测试还是面试,是直接测试还是间接测试,是客观测试还是主观测试,等等。从题型的角度可将测试分为客观性测试和主观性测试。客观性测试题指考生得分客观、评分不受评卷人主观因素(如英语水平、情感、疲劳等)影响的试题。常见的题型有多项选择题、完形填空题、正误判断题、配对题等。主观性测试题的评分需要评分员的主观参与,要依据评分标准给出分数,考生得分会受评卷人主观因素影响或控制,如写作题。13考试大纲至少需要包括以下方面:(1)考查目标,亦称考查能力层次。它反映了该门课程对学生知识和能力的要求。(2)考查内容,反映了课程的基本纲要或内容体系。如果测试内容的覆盖面过窄或过宽,测试结果就难以真正反映学生的学习发展水平;而测试内容的覆盖面具有代表性,是保证测试效度以及对测试结果进行解释的重要前提条件。(3)考查目标与考查内容的比例,亦称权重。它反映了考查目标和考查内容各项目之间的相对重要性。可以结合学生完成测试所需时间、题目难度等因素综合考虑,确定测试内容和试题分布。14三、测试试题的设计与编写
为了编好试题,可以这样做:(1)把握试题编写原则及编写时需要考虑的各个细节,避免出现编写时的一些常见问题。(2)了解考试对象,如考生使用的课本和所学习的内容、考生考试心理、答题行为等。(3)积累命题素材。一方面是积累考试时使用的语言材料,为题目设计做准备;另一方面则是累积考生之前的语言错误及相关研究等,为选项设计做准备。(4)完成试题编写后,应认真进行审查修改。15(一)题干的编写第一,题干简单、准确、明了地陈述问题。编写题目时,措辞需反复推敲。第二,题干一般只使用特指问句,不用是非疑问句、正反问句和选择疑问句。第三,题干设计关注与语言材料有关的核心问题。题目要有效地,反映计划考查的目标。第四,尽量不使用反向提问,尤其不要使用双重否定。第五,题目与题目之间应有相对的独立性,避免相互依赖、相互包含或相互暗示。16(二)选项的编写1.选项的编写原则如果是设计单项选择题,首先要保证在多个选项中只有一个正确答案或最佳答案。其次,选项中应避免使用诸如“以上皆对”“以上皆错”之类的词以减少猜测概率。再次,正确答案与其他选项应大致相同。最后,选项应尽量避免使用与语言材料一样的措辞。2.干扰项的编写首先,教师根据自己的教学经验判断学生可能会犯的错误。其次,所有的干扰项都应显得合情合理,具有吸引力。再次,每个干扰项都应该似是而非,具有一定的迷惑性。最后,为了使干扰项发挥作用,保证难度,应最大限度地避免题目内部的相互暗示。17编写选项要注意避开以下暗示:(1)语法暗示。如果题干是不完整的,那么每一选项填入题干都应语法正确(考查语法的题目除外)。(2)选项间的不一致。各选项的难度、词性、语体、感情色彩等如果截然不同,或其中一个与其他的不同,便会给考生造成暗示,使得测试效度降低。(3)答案位置。如果正确答案总是出现在某个位置,考生找到规律后也可能对不把握的题目进行猜测,固定选某个选项,从而降低了测试的效度。18第二节
测试与评价的质量分析
测试与评价的质量分析无论测试还是评价,都是对一组行为进行衡量,这组行为是表征目标能力的全部行为的一个抽样。测试或评价的目的是提供一种客观、准确、科学的测试工具,搜集有关教学的信息,为提高教学质量服务。一、测试与评价的质量分析
测试与评价的质量分析是借助数据统计方法,运用定量分析指标,如成绩分数分布、平均分、信度、效度、难度以及区分度等指标,来判断考试作为测量工具的检测质量如何。质量分析也离不开价值判断。19(一)基本分析
1.集中程度分析(1)平均数。所有数据xi的总和除以总个(次)数所得之商,简称平均数(Mean)或均数。(2)中数。将一组数据按大小顺序排列后,处在数列中点位置的数值,即为中数(Median)。(3)众数。众数(Mode)是在一组数据中出现次数最多的数值。202.分散程度分析(1)全距。全距(Range)又称两极差,用符号R表示。它是说明数据离散程度的最简单统计量。
(2)方差和标准差。方差也称变异数、均方,它是每个数据与该组数据平均数之差乘方后的均值。方差也是表示数据离散程度的特征数。21(二)信度与效度分析大规模测试一般会报告本次测试的信度(Reliability)和效度(Validity)。信度又称可靠性,指的是测量结果的一致性和稳定性程度。效度是指测量结果的有效性程度,也就是所测得的结果与测量目标的符合程度。经典测量理论的几个相关概念1.真分数经典测量理论的基础是真分数理论,经典的信度理论是由真分数理论导出的。2.两类误差误差是指在测量过程中由那些与测量目的无关的因素所产生的一种不准确的测量效应。223.CTT的三个假设假设一,真分数不变。考生具有恒定的心理特质,取值是常数。假设二,误差完全随机。这里包含两层意思:一是重复测量无限多次,误差的期望值为0;二是误差与真分数之间、误差与误差之间、误差与其他变量之间相互独立。假设三,观察分数等于真分数与误差分数之和。X=T+E公式9以这一公式为基础,可以做出一个意义重大而用途广泛的推论,即观察分数的方差等于真分数方差与误差分数方差的和。4.平行测验平行测验是指能以相同的程度测量同一种心理特质的两个或多个测验。235.信度的不同定义在平行测验中,所有误差分数的方差相等,所有考生的误差分数的方差相等。6.信度指数和信度系数信度指数,指观察分数与真分数的相关,其值等于真分数标准差与观察分数标准差的比值。信度系数,指两个平行测验间观察分数的相关,其值等于真分数方差与观察分数方差的比值。7.测量的标准误248.常用的相关关系有积差相关、等级相关、质与量相关。(1)积差相关。积差相关也称皮尔逊相关,是求直线相关的基本方法,适用于两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的情况,即正态双变量。25(2)等级相关。①斯皮尔曼等级相关。斯皮尔曼等级相关适用于只有两列变量,而且是属于等级变量性质,具有线性关系的数据。②肯德尔等级相关。肯德尔等级相关中多计算肯德尔W系数,又称和谐系数(theKendallCoefficientofConcordance),是表示多列等级变量相关程度的一种数据。26
(3)质与量相关。若一列变量是等比或等距的测量数据,另一列变量是按性质划分的类别,那么这样两列变量的直线相关,称为质与量相关,包括①点二列相关②二列相关③多系列相关27(三)试题质量分析对试题的定量分析,主要是测量每一道题的难度和区分度,随后计算题目平均难度和平均区分度作为试卷的难度与区分度质量评价的参考。28二、测试分数的报告
在大规模标准化测试中,依据分数解释的不同,可将测试分为标准参照测试和常模参照测试。标准参照测试是在一定的行为领域中按照具体的行为标准水平对被试的测试结果做出直接解释的测试。测试结束后,一般以书面测试报告的形式向学生、家长及测试使用者告知测试结果。描述性报告是一种典型的质性反馈形式,是指对学生在评价中的表现以书面报告形式进行描述,一般由教师完成。描述性报告有时也显得有些过分注意细节,难以形成一个整体的反馈。29第三节
中文水平考试与
“教”“学”“考”一体化
考试、教学和考试结果的使用,三者构成一个系统,要发挥系统的作用,三者必须协调。考试、教学和考试结果的使用又是完全不同的过程,应当区分开来,各司其职、各尽其责。一、中文水平考试
中文水平考试是为测试母语非汉语者的汉语水平而设立的国家级标准化考试。30HSK总体能力描述如下:通过HSK(一级)的考生能理解并使用一些非常简单的中文词语和句子,具备进一步学习中文的能力。通过HSK(二级)的考生能用中文就生活中一些常见的话题进行简单而直接的交流。通过HSK(三级)的考生能用中文完成生活、学习、工作等方面的基本交际任务。通过HSK(四级)的考生能用中文就比较复杂的话题进行交流,表达较为规范、得体。通过HSK(五级)的考生能用中文就比较抽象或专业的话题进行讨论、评价和发表看法,能较轻松地应对各种交际任务。通过HSK(六级)的考生能用中文自如地进行各种社会交际活动,中文应用水平接近中文为母语者。31HSKK总体能力描述如下:通过HSKK(初级)的考生可以听懂并用中文口头表达较为熟悉的日常话题,满足基本交际需求。通过HSKK(中级)的考生可以听懂并用中文较为流利地与中文为母语者进行交流。通过HSKK(高级)的考生可以听懂并用中文流利地表达自己的见解。32HSK七至九级能力描述如下:HSK七至九级全面考查《标准》规定的中文言语交际能力、话题任务内容,衡量听、说、读、写、译五种语言技能。通过HSK(七级)的考生具备良好的听、说、读、写能力和初步的专业翻译能力。能够就较为广泛和较高层次的话题进行基本规范、流利、得体的社会交际。通过HSK(八级)的考生具备良好的听、说、读、写能力和基本的专业翻译能力。能够就各类高层次或专业话题进行较为规范、流利、得体的社会交际。通过HSK(九级)的考生具备良好的听、说、读、写能力和专业翻译能力。能够综合运用各种技能,在各种情境下,就各类话题进行规范、流利、得体的社会交际。33二、中文水平考试的反拨效应
与小规模的校内测试不同,大规模测试往往是高风险测试、高利害测试。反拨效应是考试后效的一种。语言测试对语言学习、语言教学的影响被称为语言测试的反拨效应。从影响对象看,包括考试的使用、考试对考生与教育者的影响、决策者对考试结果的解释、任何可能产生的考试误用和滥用以及预期以外的影响。34HSK面向成人中文学习者,其成绩可以满足多元需求,除了可以为中文学习者了解、提高自己的中文应用能力提供参考依据以外,还可以发挥以下作用:(1)为院校招生、分班授课、课程免修、学分授予提供参考依据。(2)为用人机构录用、培训、晋升工作人员提供参考依据。(3)为相关中文教学单位、培训机构评价教学或培训成效提供参考依据。35正面反拨效应主要体现在三个方面:第一,HSK基本能反映学生的中文水平,有助于学生发现自己目前的不足,从而调整学习方法和策略。第二,HSK能够帮助学生提高中文交际水平。第三,HSK增加了学生学习中文的热情,为后续的中文学习提供持续的动力。36负面反拨效应表现为阻碍学生的学习,不利于持续性、发展性学习。主要表现在两个方面:第一,对于高级别的HSK考试,如HSK(五级)(六级),学生往往需要花费过多的精力备考,同时由于一般的课程教学与备考无关,因而准备HSK考试会在一定程度上影响课堂学习效率,学生会由此产生焦虑和压力。第二,学生过分注重应试技巧,违背了语言学习的规律。从长远角度看,学生的应试技巧学习行为会阻碍中文学习的进展,尤其是当课程学习与HSK考试无关时。37三、“教”“学”“考”一体化
要想实现中文水平考试与“教”“学”“考”一体化,教师、学生以及测试设计者应共同努力。
就教师来说,首先应全方位了解各等级的考试大纲及其相对应的能力要求,明确测试目标。其次,适当拓展教学内容,采取多样的教学方法。最后,在组织测试反馈的过程中,教师要把握好知识特点,坚持“新知识及时测试,旧知识定期测试,易错知识反复测试”的原则,尊重记忆和遗忘规律,促使学生及时掌握知识。
38
就学习者来说,首先应对HSK有正确的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年法律职业资格考试主要知识点试题及答案
- 比亚迪入职培训
- 企业培训课件
- 承台安全教育培训
- 竞选护理总带教
- 素质教育评价体系构建与实施路径
- 肿瘤科护患工休座谈会
- 幼儿园小班美术种子粘贴画教案
- 员工制度管理制度培训
- 部门培训方案
- 新生儿糖尿病喂养指导
- 山西省太原市(2024年-2025年小学五年级语文)统编版期末考试(下学期)试卷及答案
- 住院患者跌倒、坠床、压力性损伤的风险评估及管理
- 2023风光互补路灯设计方案
- 2023年山东省夏季普通高中学业水平合格考试会考生物试题及参考答案
- 2024年山东省青岛市中考英语试卷附答案
- 材料力学(山东联盟-中国石油大学(华东))智慧树知到期末考试答案章节答案2024年中国石油大学(华东)
- 江西省南昌二中心远教育集团九湾学校2023-2024学年八年级下学期期末考试物理试题
- 深入理解Nginx(模块开发与架构解析)
- MOOC 中国文化概论-华南师范大学 中国大学慕课答案
- 初中人教版八年级下册期末物理真题模拟试卷经典套题
评论
0/150
提交评论