第9章测验等值_第1页
第9章测验等值_第2页
第9章测验等值_第3页
第9章测验等值_第4页
第9章测验等值_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章第九章 测验等值测验等值心理测量学心理测量学测验等值概述测验等值概述1常用等值资料采集方法设计常用等值资料采集方法设计2测验分数等值关系计算的基本方法测验分数等值关系计算的基本方法3心理测量学心理测量学测验等值概述测验等值概述1心理测量学心理测量学测验等值概述测验等值概述测验等值的含义测验等值的含义测验等值的条件测验等值的条件等值步骤等值步骤等值误差等值误差测验等值的含义测验等值的含义 测验、考试被作为一种尺度来对人的心理测验、考试被作为一种尺度来对人的心理特质进行测量。这种尺度应该具有稳定性。特质进行测量。这种尺度应该具有稳定性。不同的考试版本之间应该具有一致性。对于不同的考试版本之间

2、应该具有一致性。对于同一个测量对象,不能用这个版本测量得到同一个测量对象,不能用这个版本测量得到一个度量,用另一个版本测量却得到相差很一个度量,用另一个版本测量却得到相差很大的另一个度量。大的另一个度量。 心理测量学心理测量学测验等值的含义测验等值的含义 尽管我们在命题过程中总是尽量保持考试尽管我们在命题过程中总是尽量保持考试难度的稳定性,但不同试卷之间在难度、信难度的稳定性,但不同试卷之间在难度、信度、分数分布方面的差别很难完全避免的。度、分数分布方面的差别很难完全避免的。这种差别不仅会影响到测验的质量,影响到这种差别不仅会影响到测验的质量,影响到评价标准的客观性,而且会使参加考试时间评价标

3、准的客观性,而且会使参加考试时间不同、使用试卷不同的考生受到不公平的对不同、使用试卷不同的考生受到不公平的对待。待。心理测量学心理测量学测验等值的含义测验等值的含义 这样,就需要将具有不同难度、分数分布这样,就需要将具有不同难度、分数分布的试卷的分数转换到一个统一的量尺之上,的试卷的分数转换到一个统一的量尺之上,采用统一的量尺对应考者进行测量。采用统一的量尺对应考者进行测量。 这种将一个测验的不同版本的分数统一在这种将一个测验的不同版本的分数统一在一个量表上的过程即等值(一个量表上的过程即等值(equating)。)。心理测量学心理测量学测验等值的条件测验等值的条件心理测量学心理测量学 测验等

4、值必须满足的要求与条件测验等值必须满足的要求与条件u测验所测心理结构或特性的同一性测验所测心理结构或特性的同一性u等信度等信度u测验等值转换关系的公平性测验等值转换关系的公平性u测验等值转换关系的可递推性测验等值转换关系的可递推性测验等值的条件测验等值的条件心理测量学心理测量学 测验等值必须满足的要求与条件测验等值必须满足的要求与条件(续)(续)u测验等值转换关系的对称性测验等值转换关系的对称性u测验等值转换关系对总体的惟一性或称样测验等值转换关系对总体的惟一性或称样本不变性本不变性 在测验等值处理中,如果待等值测验能在测验等值处理中,如果待等值测验能完全符合上述完全符合上述6个条件,则等值的

5、结果将个条件,则等值的结果将令人满意。令人满意。等值步骤等值步骤心理测量学心理测量学 两测验形式之间的等值关系,必须依据两测验形式之间的等值关系,必须依据等值条件去寻找这一隐性等值关系,并用等值条件去寻找这一隐性等值关系,并用某种形式将其显示出来。某种形式将其显示出来。 揭示两测验形式的等值关系,实现测验揭示两测验形式的等值关系,实现测验等值应该按一定步骤进行。等值应该按一定步骤进行。等值步骤等值步骤心理测量学心理测量学测验等值步骤(测验等值步骤(七步七步)u确定等值目的确定等值目的u编制测验复份编制测验复份u选择一种数据采集的设计方法选择一种数据采集的设计方法u贯彻数据采集设计方案贯彻数据采

6、集设计方案等值步骤等值步骤心理测量学心理测量学u选择一个或多个等值的操作性定义,以确选择一个或多个等值的操作性定义,以确定拟予等值的测验形式之间存在什么关系。定拟予等值的测验形式之间存在什么关系。u选择一种或多种统计估计方法选择一种或多种统计估计方法u评价等值结果评价等值结果 测验等值的步骤一般依据以上七步完成,测验等值的步骤一般依据以上七步完成,有时个别步骤的顺序可能会有所调整,但总有时个别步骤的顺序可能会有所调整,但总体上不会有很大变化。体上不会有很大变化。等值误差等值误差心理测量学心理测量学 等值完成后必须对等值结果进行评价。评等值完成后必须对等值结果进行评价。评价等值关系可靠性与准确性

7、的指标是等值关价等值关系可靠性与准确性的指标是等值关系中所包含等值误差的大小。等值误差有两系中所包含等值误差的大小。等值误差有两类:随机等值误差与系统等值误差。测验误类:随机等值误差与系统等值误差。测验误差不可避免一样,等值误差也是不可避免的。差不可避免一样,等值误差也是不可避免的。等值误差等值误差心理测量学心理测量学影响等值误差的主要因素影响等值误差的主要因素u被等值测验的同质性被等值测验的同质性u被等值测验之间的难度差别被等值测验之间的难度差别u被等值测验分数的分布特点,包括偏度、峰度等被等值测验分数的分布特点,包括偏度、峰度等u被等值测验的单维性被等值测验的单维性等值误差等值误差心理测量

8、学心理测量学影响等值误差的主要因素影响等值误差的主要因素(续续)u铆题对测验的代表性,或锚题分数与测验分数的铆题对测验的代表性,或锚题分数与测验分数的相关相关u用于等值估计的考生样本的容量用于等值估计的考生样本的容量u用于等值估计的考生样本分数分布的相似性用于等值估计的考生样本分数分布的相似性等值误差等值误差心理测量学心理测量学影响等值误差的主要因素(续)影响等值误差的主要因素(续)u测验长度测验长度u铆题铆题数量数量u铆题铆题在测验中的位置在测验中的位置 实际的影响因素可能更多。等值还会受到实际的影响因素可能更多。等值还会受到测验所关注的分数段、测验目的对分数精确性测验所关注的分数段、测验目

9、的对分数精确性的要求水平、测验分数的应用、计算条件等多的要求水平、测验分数的应用、计算条件等多种因素的影响。种因素的影响。心理测量学心理测量学常用等值资料采集方法设计常用等值资料采集方法设计2常用等值资料采集方法设计常用等值资料采集方法设计1单组设计单组设计2随机等组随机等组设计设计3铆测验铆测验非等组非等组设计设计单组设计 单组设计:单组设计:即把拟予等值的两个或多个测验即把拟予等值的两个或多个测验同时向同一被试组施测,然后借助于同一被同时向同一被试组施测,然后借助于同一被试组把拟予等值的测验联系起来,这时两组试组把拟予等值的测验联系起来,这时两组测验分数的差异主要是由于两个测验的难度测验分

10、数的差异主要是由于两个测验的难度不同而引起的,因而从理论上来说这种等值不同而引起的,因而从理论上来说这种等值设计既简单又无抽样误差。但实际上由于练设计既简单又无抽样误差。但实际上由于练习效应、疲劳及厌倦等因素的影响,会给等习效应、疲劳及厌倦等因素的影响,会给等值结果带来误差。值结果带来误差。心理测量学心理测量学随机等组设计 随机等组设计:随机等组设计:从同一总体中随机抽取两组从同一总体中随机抽取两组考生,这两组考生被认为在能力分布上是相考生,这两组考生被认为在能力分布上是相同的或很接近,让这两组考生分别接受两份同的或很接近,让这两组考生分别接受两份不同测验不同测验x和和y,然后估计两测验形式的

11、等值,然后估计两测验形式的等值关系。这种设计方案可克服练习效应和疲劳关系。这种设计方案可克服练习效应和疲劳等因素的不利影响。这种数据采集设计有一等因素的不利影响。这种数据采集设计有一个假设,即两被试样本的总体分布是相同的个假设,即两被试样本的总体分布是相同的。由于从同一总体抽样,因此,不考虑其间。由于从同一总体抽样,因此,不考虑其间的抽样误差,这一假设比较容易得到满足。的抽样误差,这一假设比较容易得到满足。心理测量学心理测量学铆测验非等组设计 铆测验铆测验非等组设计:非等组设计:在测验编制时另外编在测验编制时另外编制一组测验试题,这些试题被称为共同题,制一组测验试题,这些试题被称为共同题,也称

12、为铆(也称为铆(anchor)题。在数据采集时,)题。在数据采集时,铆测验题即对第一组被试施测,又对第二组铆测验题即对第一组被试施测,又对第二组被试施测。被试施测。心理测量学心理测量学等值设计方法图示单组设计单组设计样本样本测测 验验x yp 随机等组随机等组设计设计样本样本测测 验验x yp1 p2 铆测验铆测验非等组非等组设计设计样本样本测测 验验x v yp1 q1 心理测量学心理测量学心理测量学心理测量学测验分数等值关系计算的基本方法测验分数等值关系计算的基本方法3测验分数等值关系计算的基本方法测验分数等值关系计算的基本方法心理测量学心理测量学v线性等值线性等值v等百分位等值等百分位等

13、值v铆测验非等组设计下的等值关系计算铆测验非等组设计下的等值关系计算方法方法线性等值线性等值心理测量学心理测量学 在单组设计或随机等组设计下的两个分在单组设计或随机等组设计下的两个分数,一个在测验形式数,一个在测验形式x x上,另一个在测验形上,另一个在测验形式式y y上,如果它们的标准分数相等,这两个上,如果它们的标准分数相等,这两个分数就被认为是等值的。分数就被认为是等值的。线性等值线性等值心理测量学心理测量学 用数学公式表示,所谓测验分数用数学公式表示,所谓测验分数x x等值于等值于测验分数测验分数y y,即有下式成立:,即有下式成立: 改写为:改写为: 其中:其中:等百分位等值等百分位

14、等值心理测量学心理测量学 在单组设计或随机等组设计下的两个分在单组设计或随机等组设计下的两个分数,一个在测验形式数,一个在测验形式 x x上,另一个在测验形上,另一个在测验形式式 y y上,如果这两个分数有相同的百分等级,上,如果这两个分数有相同的百分等级,那么这两个分数就被认为是等值的。按照这那么这两个分数就被认为是等值的。按照这个原理,寻找与个原理,寻找与 x x 分数等值的分数等值的 y y 分数,只分数,只要找到与要找到与 x x 分数有相等百分等级的分数有相等百分等级的y y分数就分数就可以。可以。等百分位等值等百分位等值心理测量学心理测量学 对于测验对于测验x x的每个一分数,可根

15、据公式的每个一分数,可根据公式在在x x测验分布中先求出与其对应的百分等级,测验分布中先求出与其对应的百分等级,然后在然后在y y测验上求取具有该百分等级的分数。测验上求取具有该百分等级的分数。即在两个测验上就有相同百分等级的分数就即在两个测验上就有相同百分等级的分数就是等值分数。是等值分数。心理测量学心理测量学百分等级计算公式为:百分等级计算公式为:根据百分等级计算测验分数公式为:根据百分等级计算测验分数公式为:铆测验非等组设计计算铆测验非等组设计计算心理测量学心理测量学 让两个被试组分别参加两个形式的测验,让两个被试组分别参加两个形式的测验,在两个测验中有部分项目是共同的在两个测验中有部分

16、项目是共同的铆题,铆题,这样两组被试被铆题铆接在一起。使用该设这样两组被试被铆题铆接在一起。使用该设计可以采用线性等值方法来完成等值计算。计可以采用线性等值方法来完成等值计算。铆测验非等组设计计算铆测验非等组设计计算心理测量学心理测量学铆测验非等组铆测验非等组设计线性等值方法计算公式如下:设计线性等值方法计算公式如下: 其中,其中, 是是x x测验向全体被试测验向全体被试t t施测时的平均施测时的平均数与标准差的估计值,数与标准差的估计值, 是是y y测验向全体测验向全体被试被试t t施测时的平均数与标准差的估计值。施测时的平均数与标准差的估计值。心理测量学心理测量学如果两组被试能力差异不大,

17、四项估计值为:如果两组被试能力差异不大,四项估计值为: 心理测量学心理测量学 其中,其中, 与与 是只参加测验是只参加测验x x被试的平均数被试的平均数和标准差,和标准差, 与与 是只参加测验是只参加测验y y被试的平均被试的平均数和标准差,数和标准差, 与与 是铆测验向全体被试是铆测验向全体被试t t施施测得到的平均数和标准差,测得到的平均数和标准差, 与与 是既参加是既参加测验测验x x又参加铆测验被试的平均数和标准差,又参加铆测验被试的平均数和标准差, 与与 是即参加测验是即参加测验y y又参加铆测验被试的平又参加铆测验被试的平均数和标准差,均数和标准差, 是测验是测验x x对测验对测验

18、v v的回归系数,的回归系数, 是测验是测验y y对测验对测验v v的回归系数。的回归系数。心理测量学心理测量学如果两组被试能力有差异,这四项估计值为:如果两组被试能力有差异,这四项估计值为:式中,式中, 、 、 与与 分别是各个测验的信度系数。分别是各个测验的信度系数。 本章小结心理测量学心理测量学 测验等值是测验公平性的保证,其在测验测验等值是测验公平性的保证,其在测验实施、编制与结果分析,题库的建立,不同单实施、编制与结果分析,题库的建立,不同单位、地区、时间所测学科成绩的比较等方面,位、地区、时间所测学科成绩的比较等方面,都是极为必要的。都是极为必要的。本章小结心理测量学心理测量学 如

19、果不进行等值处理,不同时间举行的考如果不进行等值处理,不同时间举行的考试的成绩之间不具备可比性,评价标准或证书试的成绩之间不具备可比性,评价标准或证书授予标准会受到试卷难度起伏的影响。这种状授予标准会受到试卷难度起伏的影响。这种状况,不仅影响到选拔效率和人员素质,而且对况,不仅影响到选拔效率和人员素质,而且对考生也是很不公平的。考生也是很不公平的。本章小结心理测量学心理测量学 等值研究的意义并不局限于保证考试公平。等值研究的意义并不局限于保证考试公平。今天,为了避免命题和试卷编制中的盲目性和今天,为了避免命题和试卷编制中的盲目性和偶然性,国内许多考试机构都在致力于建设题偶然性,国内许多考试机构

20、都在致力于建设题库。实现基于项目反应理论(库。实现基于项目反应理论(item response item response theorytheory,简称,简称irtirt)的题目参数等值是建设科)的题目参数等值是建设科学化、大规模题库的前提。学化、大规模题库的前提。 本章小结心理测量学心理测量学 基于经典测验理论(基于经典测验理论(classical classical tesingtesing theorytheory,简称,简称c ct tt t)之上的等值方法只能实现)之上的等值方法只能实现不同试卷之间的等值,满足不同试卷之间的等值,满足“试卷库试卷库”建设的建设的需要,很难实现在统一

21、的量尺上标定试题难度需要,很难实现在统一的量尺上标定试题难度和区分度的任务,很难满足大规模题库建设的和区分度的任务,很难满足大规模题库建设的需要。需要。参考文献参考文献心理测量学心理测量学参考文献参考文献11叶佩华等译:测验等值,广东高教出版社叶佩华等译:测验等值,广东高教出版社19881988年年出版。出版。22漆书青、戴海琦、丁树良编著:现代教育与心理漆书青、戴海琦、丁树良编著:现代教育与心理测量学原理,江西师大心理与教育统计测量中心测量学原理,江西师大心理与教育统计测量中心20022002年出版。年出版。33漆书青编著:现代测量理论在考试中的应用,华漆书青编著:现代测量理论在考试中的应用

22、,华中师范大学出版社中师范大学出版社20032003年出版。年出版。参考文献参考文献心理测量学心理测量学参考文献(续)参考文献(续)44戴海琦、张峰、陈雪枫编著:心理与教育测量,戴海琦、张峰、陈雪枫编著:心理与教育测量,暨南大学出版社暨南大学出版社2006年出版。年出版。55戴海琦戴海琦. .锚题题型与等值估计方法对等值的影响锚题题型与等值估计方法对等值的影响. .心理学报,心理学报,20022002,3434(4 4):):367-370367-370。66罗照盛罗照盛. .经典测量理论等值的误差研究经典测量理论等值的误差研究. .心理科心理科学学,2000,2000,23(4):494 5

23、0123(4):494 501。参考文献参考文献心理测量学心理测量学参考文献(续)参考文献(续)7angoff, w. h. (1971). scales, norms, and 7angoff, w. h. (1971). scales, norms, and equivalent scores. in r. l. thorndike (ed.), equivalent scores. in r. l. thorndike (ed.), educational measurement (2nd ed.) (pp.508-educational measurement (2nd ed.) (p

24、p.508-600). 600). 8washington, dc: american council on 8washington, dc: american council on education. psychological measurement, 14, education. psychological measurement, 14, 313-321.313-321.参考文献参考文献心理测量学心理测量学参考文献(续)参考文献(续)9lord, f. m.(1980) applications of item 9lord, f. m.(1980) applications of item response theory to practical testing problems, response theory to practical testing problems, lawrence-erlbaum associates.lawrence-erlbaum associ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论