试题的难度区分度信度和效度_第1页
试题的难度区分度信度和效度_第2页
试题的难度区分度信度和效度_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试卷的难度、区分度、信度和效度一 . 试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。一个题目, 如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。客观题难度计算公式:P (难度指数)=试卷答对人数/考生人数;主观题难 度计算公式:P=试卷平均得分/试卷满分。试卷难度计算公式:P=为平均分,K 为试卷满分值。易、中、难的标准为:易:P>0.7,中:0.4&P00.69,难:P00.39; P 值越大,难度越低,P 值越小,难度越高。一般来说,难度值平均在0.5 最佳,难度值过高或过低,都会降低测

2、验的信度。(二)难度的计算(1)客观性试卷难度P (这时也称通过率)计算公式:P=k/N (k为答对该题的人数,N为参加测验的总人数)( 2)主观性试卷难度P 计算公式:P=X/M (X为试卷平均得分;M为试卷满分)( 3)适用于主、客观试卷的计算公式:P= (Ph+FL) /2 (P小Pl分别为试卷针对高分组和低分组考生的难度值)步骤为:将考生的总分由高至低排列;从最高分开始向下取全部试卷的 27%乍为高分组;从最低分开始向上取全部试卷的27%乍为低分组;计算。(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3-0.7 之间为好,整卷以0.5-0.6 之间为最佳。一般

3、将难度值大于和等于0.7 的试卷定为容易题;大于 0.4 和小于 0.7 的定为中档题;小于和等于0.4 的试卷定为难题。命题时难度一般要按一定比例分配,如3: 6: 1 或 3: 5: 2。二 . 试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。(二)区分度的计算1. 单个选择题目区分度的计算将全体考生总分从高到低排列,将总分最高的27%考生定为高分组,总分最

4、低的27%考生定为低分组,分别计算两组考生在某道题目上的通过率,两个通过率之差就是这道题的区分度(又叫鉴别指数)。计算公式为:D=RPl. P h和Pl分别为高分组和低分组的通过率。2. 整个试卷的区分度计算(常用)计算公式为:D=2 (Xh Xl) W 其中D为试卷区分度,Xh为27%b分组平均 分,XL 为 27%低分组平均分,W 为试卷总分。一般也将全体考生总分从高到低排列,将总分最高的27%的考生定为高分组,总分最低的27%考生定为低分组,再分别计算各组的平均分。(三)试卷区分度的一般要求区分度(D)的取值范围介于-1.00至+1.00之间。通常D为正值,称为积极 区分;D为负值称为消

5、极区分;D值为0称为无区分作用。具有积极区分作用的 试卷,具D值越大,区分的效果越好。试卷的区分度在0.4以上表明此题的区分度很好,0.30.39表明此题的区 分度较好,0.20.29表明此题的区分度不太好需要修改,0.19以下表明此题的 区分度不好应淘汰,高考的区分度一般要求在0.3 以上。三 . 试卷的信度信度是指使用同一试卷对考生重复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性程度。信度除了要说明成绩的真实性之外,还要说明题目涉及的内容与教学的相关程度。信度系数愈高即表示该测验的结果愈一致、稳定与可靠。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的

6、,因此不会造成不一致性。反之,随机误差可能导致不致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果 R=0,就认为测量是完全可信的,信度最高。信度主要是指测量结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。和信度相关的一个概念是效度,信度是效度的前提条件。信度只受随机误差的影响,随机误差越大,信度越低。因此,信度可以视为测试结果受随机误差影响的程度。系统误差产生恒定效应,不影响信度。四 . 试卷的效度效度是指考试有效性或正确性的质量指标,即是否考了要考的内容,试卷难度、区分度是否适宜,考试最终是否达到了它的预定目的等。测试效度 (test v

7、alidity) 亦称测试的有效性,指一套测试对应该测试的内容所测的程度。也就是说,一套测试是否达到了它预定的目的以及是否测量了它要测量的内容。测试的效度一般可分为以下几类:1)表面效度(face validity )。指测试应达到的卷面标准,即一套测试卷从表面看来是否是合适的。例如, 若一次阅读理解力的测试包括许多受试者没有学过的方言词汇,则可认为这次测试缺乏表面效度。表面效度是测试出受试者正常水平的一种保证因素。2)内容效度(content validity )。指测试卷是否测试了应该测试的内容或者说所测试的内容是否反映了测试的要求,即测试的代表性和覆盖面的程度。3)编制效度(constr

8、uct validity)。指测试卷的诸项目对编制该测试所依据的理论的各个基本方面的反映程度。4)经验效度(empirical validity)。经验效度是一种衡量测试有效性的量度,通过把一次测试与一个或多个标准尺度相对照而得出。一般来说,对某次测试的效度进行检验时,除了要根据教学大纲的要求和观念有效性的理论对试卷的内容进行考查以外,还须采用计算相关系数的定量方法, 即计算出本次试卷与另一份已被确定能正确反映受试者水平的试卷之间的相关系数。 系数高则有效性大。课堂测试的效度应在0.4-0.7 之间, 规模较大的测试其效度应在0.7 以上。五、高考题的信度、效度、难度和区分度高考的性质最主要的在两个方面:首先、 高考是一种选拔性考试,高考成绩是高等学校录取新生的依

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论