第三讲测验的项目分析_第1页
第三讲测验的项目分析_第2页
第三讲测验的项目分析_第3页
第三讲测验的项目分析_第4页
第三讲测验的项目分析_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三讲测验的项目分析本章提要:测验项目难度的意义难度指标的计算及项目难度对测验的影响测验项目区分度的意义区分度的计算和区分度对对测验的影响多重选择题的项目分析的方法调查问卷尊敬的老师:您好!感谢您在百忙之中帮助我们完成此问卷!希望您能认真阅读,如实填写,在您认为符合自己实际情况的选项上划“√”。非常感谢!师范教育研究中心第一部分:1.性别A男B女2.年龄A30岁以下B30-40岁C40-50岁D50岁以上3.职称A助教或初级B讲师或中级C副教授或副高D教授或高级4.在高校你所从事的是A专职教师B兼职教师C专职行政工作D图书馆工作E后勤工作5.教龄A5年以下B5-10年C11-20年D20年以上6.健康状况A非常好B良好C一般D患病7.月收入(含奖金)A3000元以下B3000-4000元C4000-5000元D5000-6000元E6000元以上8.是否有其它兼职A有B没有9.婚姻状况A未婚B已婚C离异D丧偶1.第一位开拓"童话园地"的作家是:2.第一位女诗人是:

3.新中国第一位获得"人民艺术家"称号的作家:4.第一位伟大的爱国诗人:5.第一位女词人,亦称"一代词宗":6.第一位田园诗人7.文章西汉两司马:8.乐府双璧:9.先秦时期的两大显学是:10.儒家两大代表人物是:

答案:1叶圣陶

2蔡琰(文姬)3老舍。其作品是:《龙须沟》4屈原5李清照6东晋,陶渊明

7司马迁.司马相如

8木兰词孔雀东南飞,9儒墨10孔丘和孟子,分别被尊至圣和亚圣。1.下列几种效度中,不具有效度真正意义的是(

)A.结构效度

B.内容效度C.表面效度

D.效标关联效度2.以下量尺中数字量化水平最高的是()。A.名义量尺B.顺序量尺C.等距量尺D.比率量尺3.学生的智力测验成绩属于(

)

A.名义量尺

B.顺序量尺C.等距量尺

D.比率量尺第一节测验的难度一、难度的意义难度是指测验项目的难易程度。一个测验如果大部分都能够答对,则该项目的难度小;如果大部分被试都不能够答对,则难度大。难度是一个相对概念例:鸡兔15只,共40条腿,鸡兔各几何?

二、难度计算

(一)二分法记分项目难度的计算1.通过率P=R/N(5.1)例题:有200参加测试,某项目答对的人数为120人,该项目的难度是多少?难度与难度值不同2.极端分组法当被试人数比较多时,则可以将被试依照测验总分从高到低排列,分成三组,总分最高的27%为高分组(NH),总分最低的27%为低分组(NL),分别计算高分组与低分组的通过率,再计算项目的难度。P=(PH+PL)/2(5.2)例题:有370参加测试,高分组和低分组的被试各100名,高分组有70人答对第1题,低分组有40人答对第1题,第1题的难度是多少?例题:某数学测验的第七题的满分为15分,该题考生的平均得分为9.6分,则该题的难度为多少?三、测验难度水平的确定测验难度水平的确定取决于测验的目的和性质测验的目的是测查某方面知识技能的掌握情况,不必过多地考虑难度测验的目的是选拔录用人员,智力测验、成就水平测验,则需要把握好难度的分布。四、难度的等距变换以项目通过率来表示项目的难度,计算方便,但不能比较大小,要比较大小就需要转换。首先把百分数转换为Z分数,并根据转换公式进行计算。即:∆=13+4Z(5.4)根据正态分布表,可以知道∆是以25为上限,1为下限的等距量表,∆值越大,难度越高,∆值越小,难度越低。五、难度对测验的影响(一)测验难度影响测验的分布形态测验的难度直接依赖于组成测验的项目的难度,通过考察测验分数的分布,可以对测验的难度做出直观的分析。若测验项目的难度普遍比较大时,被试的得分普遍低,测验分数集中在低分端,其分数分布呈正偏态;当测验的难度普遍比较小,被试得分普遍比较高,测验分数集中在高分端,分数分布呈负偏态。(二)测验的难度影响测验分数的离散程度过难或过易的测验会使测验分数相对集中在低分端或高分端,从而使得分数的全距缩小。项目的难度集中在0.50左右测验分数分布呈正态分布,信度也比较高。第二节测验的区分度一、区分度的意义区分度(D)是指测验项目对被试心理特质水平差异的区分能力。具有良好区分度的项目,高水平的被试在该项目上得分高,低水平的被试在该项目上得分低。区分度的取值范围介于-1.0至+1.0之间,若D值为正值,称作积极区分,D为负值为消极区分;0为无区分作用。具有积极区分作用的项目,D越大,区分的效果越好。二、区分度的计算(一)项目鉴别指数法D=PH-PL(5.5)例题:有370参加测试,高分组和低分组的被试各100名,搞分组有70人答对第1题,低分组有40人答对第1题,该项目的区分度值是多少?D值是鉴别测量有效性的重要指标,D值越高,项目越有效。美国测量学家R.L.Ebel根据长期的经验提出用鉴别指数评价题目性能的标准:(二)相关法在大规模的或标准化的测验中,多采用相关法计算区分度,即以项目分数与效标分数或测验总分的相关作为项目区分度的指标。1.二列相关二列相关适用于两个连续变量,但其中一个被人为的分成两类。例如,当一个测验的题目分数是连续的,而效标分数或测验总分被人为的分为及格和不及格时,就可以采用二列相关法;当效标或测验总分是连续的,而题目分数被划分为通过或不通过时,也可以采用这种方法。计算公式如下:2.点二列相关点二列相关适用于一个为连续变量,另一个为二分变量的数据资料,如选择题答对记1分,答错记0分,这时题目分数为二分变量,而总分为连续变量,可以采用点二列相关计算区分度。计算公式如下:

计算时,只要求连续变量是单峰或对称分布,而二分变量不受正态分布的限制。计算例题的选择题的区分度。3.φ相关4.积差相关三、区分度与难度系数的关系区分度与难度有密切的关系。假如某项目的通过率为1.00或0,说明高分组与低分组在通过率上不存在差异,因此鉴别指数D为0。假如项目通过率为0.50,则可能是高分组的人全部通过,而低分组没有人通过,这样D的最大值可能达到1.00。因此,难度系数接近0.50,项目的潜在区分度大,难度系数接近1.00或0时,项目的潜在区分度小。第三节难度的校正与多重选择题的项目分析

一、猜测与猜测率在选择项目中,存在一个猜测的问题,如果项目的备选答案是K个,猜对的概率为。这样是非题(K=2),凭猜测答对的概率是0.50,四项选择答案题目(K=4),凭猜测答对的概率是0.25。在测验中,大量的猜测会对是非题和选择题产生影响,从而带来测量误差,即猜测误差。例题:有A、B两个测题,A项目为四重选择,通过率为0.58,B项目为五重选择,通过率为0.56,哪个项目的难度大呢?如果某个被试参加测验,测验项目是由100道四重选择题组成,测验结果是答对82道,答错18道,该测试者的实际得分应该是多少呢?三、多重选择题的项目分析多重选择题的难度、区分度的分析与一般的二分记分法的难度、区分度分析相同。对于多重选择题,除了难度与区分度的分析外,还要对每个被试对每个备选答案的反应情况进行分析。1.如果正确的备选答案被所有的被试选择,则说明该题目太容易,或题目中提供了某种暗示,使正确答案过于明显。2.如果某个错误答案没有一个被试选择,则说明该选项不具有迷惑性,错的过于明显。一般来说,错误选项应该有2%以上的选择。3.如果所有被试都选择了同一个错误答案,可能是编制测验时把答案搞错了,也可能是在教学中发生了错误。4.如果高分组被试的选择集中在两个答案上,二者选择率相近,说明该项目可能本来就有两个正确答案,或者另外一个选项在一定意义也有道理。5.如果高分组对正确答案的选择率与低分组相等或低于低分组,说明该项目所考察的与被试的水平无关,即该项目不具有鉴别力。6.如果一个项目被试未作答的人数比较多,或选择各个备选答案的人数相等,说明该项目可能过难或题意不清,被试无法作答或进行猜测。在实际分析时,可以将多重选择题的选答情况登记在一张选择分析表中,以便于分析评价。例题:下表为370人参加测验中的4道题的项目统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论