标准参照测验的设计与编制_第1页
标准参照测验的设计与编制_第2页
标准参照测验的设计与编制_第3页
标准参照测验的设计与编制_第4页
标准参照测验的设计与编制_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 标准参照测验的设计与编制第六章 标准参照测验的设计与编制第一节标准参照测验概述一、标准参照测验的定义 常模参照测验测量的是“相对能力”,广泛应用于能力、能力倾向、成就、人格、态度等多种特质的测量中,并发展出一套比较成熟的统计方法,用于项目分析,质量控制以及分数解释之中。 常模参照测验模式的局限:并不是所有的测验都只关心个体间的差异。第六章 标准参照测验的设计与编制第一节标准参照测验概述一、标准参照测验的定义 1962,r.glaser & d.claus建议把测验分成参照常模和参照标准两种,提出“标准参照测验”的概念。 标准参照测验是根据某一明确界定的内容范围而缜密编制的测验;被试在测

2、验中所得结果,也是根据某一明确界定的行为标准直接进行解释的。第六章 标准参照测验的设计与编制第一节标准参照测验概述一、标准参照测验的定义 该概念需注意: 1 标准参照测验中的“标准”指编制测验和解释测验分数时所依据的知识和技能范围,而不是指划界分数。 2 标准参照测验有不同的名称,如内容参照测验和结果参照测验。第六章 标准参照测验的设计与编制第一节标准参照测验概述一、标准参照测验的定义 该概念需注意: 内容参照测验:指测验所使用的标准是内容材料定义的,即掌握某领域知识和技能的比例。 被试在内容测验上答对题目数占所有测验题目数的百分比视为整个内容范围的掌握程度。第六章 标准参照测验的设计与编制第

3、一节标准参照测验概述一、标准参照测验的定义 该概念需注意: 如果已知测验分数和某个外部效标有关,则可用被试在效标上的表现直接解释测验分数,这种测验称为结果参照测验。其目的是预测,关心的是被试达到某种目标特质的可能性。第六章 标准参照测验的设计与编制第一节标准参照测验概述l二、标准参照测验的编制l1 界定目标 :测验编制前,对所欲测量的内容范围作出清晰界定,并给与操作定义l测验题目的选择限制在此内容范围内;l构成测验的所有题目,须是所依据的内容范围的一个代表性样本。l2 进行题目编写,评估内容效度。l考察测验题目目标一致性,题目领域代表性以及难度和偏差等其他技术特征。第六章 标准参照测验的设计与

4、编制第一节标准参照测验概述l二、标准参照测验的编制l3 修改删减项目,合成测验l4 确定临界分数,区分被试掌握掌握状态的标准l5 试测及测量学分析l选取一个有代表性的样本接受测验,进行项目分析和信效度检验。l6 编写测验使用说明书l将正式测验的各项测量学指标编入测验使用说明中。第六章 标准参照测验的设计与编制第一节标准参照测验概述l三、标准参照测验的用途l1 各类教育水平、职业水平测试采取了标准参照测验的编制、施测、计分和解释模式;l2 在内容上有一个最低要求,其结果是决定相关人员能否从事某种职业。l3 广泛应用于教育实践,发现应该补救的问题,发挥考试的诊断功能和发展功能。第六章 标准参照测验

5、的设计与编制第二节标准参照测验的信、效度和与误差控制l一、标准参照测验的项目分析l(一)难度分析 标准参照测验的项目难度一般以通过率来表示,侧重于考察项目的代表性。在大多数情况下只是作为项目区分度分析的基础。第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l一、标准参照测验的项目分析l(二)区分度分析 1 前测后测法 (1)教学敏感性指数 同一组被试,在其接受与测验目标有关的教学过程前后各施测一次,得到前测和后测的分数,计算每个项目前后测的通过率之差,可得到每个项目区分掌握和未掌握两组被试的能力。 d=p后测- p前测第六章 标准参照测验的设计与编制第二节标准参照测验的

6、信、效度和与误差控制l一、标准参照测验的项目分析l(二)区分度分析 1 前测后测法 (2)个人获得指数l采取前测后测法,获得在前测中错误回答某项目而在后测中能够正确回答的被试人数比例,即该项目的个人获得指数。被试 1前测 后测 2前测 后测 3前测 后测1 1 1 1 1 1 12 1 1 0 1 1 13 0 1 1 1 1 14 0 0 1 1 1 15 1 0 0 1 1 16 0 0 0 0 1 17 1 0 1 1 1 18 1 1 0 0 1 19 0 1 0 1 1 110 1 0 0 1 1 1第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l一、标准参

7、照测验的项目分析l(二)区分度分析 2 控制组法 (1)已接受教学组-未接受教学组方法 选取两组被试,其中一组已经接受了有关测验目标内容的教学,而另一组从未接受过,将测验对两组被试同时施测,考察两组通过率之差。 d=p甲-p乙第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l一、标准参照测验的项目分析l(二)区分度分析 2 控制组法 (2)对照组方法: 前测-后测法假设凡是接受了有关教学活动的被试均已掌握了教学内容,而未接受教学活动的被试均没有掌握教学内容。 选择两组被试,由教师评定为掌握组和未掌握组,求掌握组和未掌握组的通过率之差。第六章 标准参照测验的设计与编制第二

8、节标准参照测验的信、效度和与误差控制l二、标准参照测验的信度(一)分类一致性信度 标准参照测验对其分数的解释通常是根据某一分数分界点将被试分为掌握者和未掌握者两类,称作“达标-未达标”或“及格-未及格”。 从测验的分类决策一致性的角度定义其信度,称作分类一致性信度。第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l二、标准参照测验的信度(一)分类一致性信度 对分类一致性信度考察的简单常用的方法是考查被试在同一测验的两次施测中或两个复本的施测中是否被分在同一类中。具体方法类似于常模参照测验中的再测法和复本法。 采用同一批被试团体在两次测验结果中均被分为及格和不及格类别中的

9、人数百分比例作为分类一致性信度的指标。一、信度及其估计(一)分类一致性信度测验a测验b及格不及格及格不及格acbdp0 = ( a + d ) / n p0的最大值为1,说明两次施测结果对被试的分类一致。关键点:测验分数分界点的确定问题第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l二、标准参照测验的信度l(二)荷伊特信度l利用方差分析的方法,找出个体水平的真正变异在总变异中的比例,以此作为信度的估计值。第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l二、标准参照测验的信

10、度l(二)荷伊特信度l设有n名被试参加一项有k个项目的测试,测验分数的总变异可分解为被试间变异ss人、项目间变异ss题、和人与试题的交互作用ss人题三部分,荷伊特认为被试方差可以用被试间变异作为估计值,误差方差可以用人和试题的交互作用作估计值,并用下式作为测验信度的估计值:lrxx=1ms人题/ms人第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l二、标准参照测验的信度l(二)荷伊特信度 这种方法不受测验目的或被试异质性的影响,适用于标准参照测验的信度评估,且不会随测验分数分界点而变化,更具普遍性。第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控

11、制l三、标准参照测验的效度(一)内容效度1、标准参照测验注重被试在其所测内容范围内的掌握程度,因而测验本身的题目组成对所要测的内容范围的覆盖程度或代表性程度(即内容效度)显得尤为重要。第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l三、标准参照测验的效度(一)内容效度 2、内容效度的评估依赖于两个条件: 项目与测验目标的一致性 项目是测验内容范围的代表性取样第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l三、标准参照测验的效度l(二)实证效度 标准参照测验的效标关联效度和常模参照测验中的方法在具体实施中相似,不同之处在于统计指标。 常模参照测

12、验一般用测验与效标间的相关系数作为效标关联效度的指标,但相关系数受分数分布的影响,不适合标准参照测验。第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制l三、标准参照测验的效度l(二)实证效度 所以,有人提出用“决策效度(decision validity)”来评估标准参照测验的效标关联效度。 以教学情境中某目标参照测验为例:l三、标准参照测验的效度l(二)实证效度效标测验预测源测验通过不通过通过不通过acbd决策效度指在预测源测验和效标测验中均通过和均不通过的被试人数百分比例。第六章 标准参照测验的设计与编制第二节标准参照测验的信、效度和与误差控制第六章 标准参照测验的

13、设计与编制第三节 划界分数设置方法与被试评价l测验分数的分界点,切割分数线,及格线 根据分数分界点,可以将被试分为“及格”和“不及格”两类。 分数分界点的确定争议很大。 分数的分界点并非必需,可以用“被试掌握了测验的内容范围的百分之多少”来解释被试的分数;知识学习是一个连续的过程,知识的掌握也只是一个程度的问题,从理论上说并不存在可以清晰辨别的掌握者或非掌握者。 分数分界点的确定方法很有必要也很重要。第六章 标准参照测验的设计与编制第三节划界分数设置方法与被试评价l一、判断法l(一)整体判断法l在测验的内容范围明确界定的基础上,每位专家从整体上对测验与和内容范围进行判断,提出处于临界水平的被试

14、能够正确回答的题目的比例,然后将所有专家的分数平均,作为划界分数。l临界水平的被试指那些由未掌握水平转入掌握水平的被试,这些被试实际上是在专家的想象中虚拟出来的。第六章 标准参照测验的设计与编制第三节划界分数设置方法与被试评价一、专家判定法(二)nedelsky方法:1954 适合由多重选择题组成的测验。 由专家来判断处于临界水平的被试在每一题上有能力排除的错误选择项,并记录下剩余的反应数的倒数; 将该份测验中所有题目的倒数和记为a,作为该专家确定的临界水平考生的可能分数; 对所有专家的a值进行平均,即为及格线。第六章 标准参照测验的设计与编制第三节划界分数设置方法与被试评价一、专家判定法(三

15、)angoff方法:1971 由专家直接判断处于临界水平的被试在某测验的每一题目上正确作答的可能性(pi),设每题的满分为fi,则该测验的分数分界点()为: = fi pi第六章 标准参照测验的设计与编制第三节划界分数设置方法与被试评价一、专家判定法(四)ebel法:1972 专家把题目的难度分为几个等级; 然后依题目的代表性程度将题目分成若干等级; 再由专家估计临界被试答对某一代表性程度、某一困难等级题目的百分比p。 则划界分数的计算方法为:xr = pn第六章 标准参照测验的设计与编制第三节划界分数设置方法与被试评价l二、综合法l既考虑实际测试数据,又考虑专家判断l(一)临界组法 由专家判定和选择一组正处于临界水平的被试,将测验施测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论