第三章 测量的误差及其检验_第1页
第三章 测量的误差及其检验_第2页
第三章 测量的误差及其检验_第3页
第三章 测量的误差及其检验_第4页
第三章 测量的误差及其检验_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第三章第三章 测量的误差及其检验测量的误差及其检验 一、心理测量误差及其来源一、心理测量误差及其来源二、心理心理测验的基本指标二、心理心理测验的基本指标三、心理测量的信度三、心理测量的信度四、心理测量的效度四、心理测量的效度 请列举一些你所使用过或接触过的量表请列举一些你所使用过或接触过的量表 思考思考: 量表的作用是什么?量表的作用是什么?你如何解释下述现象?你如何解释下述现象?一个很聪明的孩子,测得智商是一个很聪明的孩子,测得智商是80分。分。一个学习很好的学生,考试成绩为一个学习很好的学生,考试成绩为60分。分。一个人缘很好的人,人际关系测量低于常模值。一个人缘很好的人,人际关系测量低

2、于常模值。 尺子的数据与我们的目测更一致,而秤盘尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具测量身高的有效工具效度。效度。 什么材料的尺子?什么材料的尺子?钢铁(热胀冷缩)钢铁(热胀冷缩) 涉及到一致性的问题。涉及到一致性的问题。信度信度 总结:量表是我们用来了解心理特总结:量表是我们用来了解心理特质的工具,但这个工具是有误差的。误质的工具,但这个工具是有误差的。误差要控制在一个许可的范围内。差要控制在一个许可的范围内。 第一节测量的误差第一节测量的误差一、误差种类及其含义一、误差种类及其含义系统误差:系

3、统误差:与测量目的无关的因素所引起的恒定与测量目的无关的因素所引起的恒定的有规律的误差,稳定地存在与每一次测量之的有规律的误差,稳定地存在与每一次测量之中,这种误差就叫做系统误差。中,这种误差就叫做系统误差。随机误差:随机误差:与测量目的无关的偶然因素所引起的与测量目的无关的偶然因素所引起的变化无规律的误差,使得多次的测量结果不一变化无规律的误差,使得多次的测量结果不一致,其误差的大小和方向是随机的。这种误差致,其误差的大小和方向是随机的。这种误差叫随机误差。叫随机误差。系统误差只影响测量的准确性,而随机误差既影系统误差只影响测量的准确性,而随机误差既影响准确性,又影响一致性。响准确性,又影响

4、一致性。 二、误差的来源二、误差的来源 1、测量工具:测量工具:项目取样项目取样 ;表述的清晰与;表述的清晰与准确,及其可操作性准确,及其可操作性 ;信度与效度的问;信度与效度的问题题 。2、测量对象测量对象被试:情绪、动机、疲劳、被试:情绪、动机、疲劳、经验(技能与技巧)、学习效应、反应经验(技能与技巧)、学习效应、反应倾向等;倾向等;3、实测过程:实测过程:由于一些恒定因素容易控制,由于一些恒定因素容易控制,故主要指一些偶然因素:如物理环境、故主要指一些偶然因素:如物理环境、时间安排、主试因素、意外干扰、评分时间安排、主试因素、意外干扰、评分等。等。 三、真分数三、真分数 真分数是一个理论

5、上构想的概念,指测真分数是一个理论上构想的概念,指测量没有误差时的所得到的值。量没有误差时的所得到的值。 任何一个测验分数都是真分数与测量误任何一个测验分数都是真分数与测量误差的和,即:差的和,即:X=T+E 这里的误差这里的误差E只是随机误差,而系统误差只是随机误差,而系统误差则包含在真分数则包含在真分数T中。中。E可以是正的,也可能可以是正的,也可能是负的。是负的。 对团体来说,实得分数的变异数(方差)对团体来说,实得分数的变异数(方差)等于真分数的变异数加上误差的变异数,即等于真分数的变异数加上误差的变异数,即SX2=ST2+SE2 而系统误差的变异数包含在真分数的变异而系统误差的变异数

6、包含在真分数的变异数之中,所以真分数的变异数是由两部分组成:数之中,所以真分数的变异数是由两部分组成:与测量目的有关的变异数,与测量目的无关的变与测量目的有关的变异数,与测量目的无关的变异数。即:异数。即:ST2=SV2+SI2 这样,一组分数的变异性就由三部分组成:这样,一组分数的变异性就由三部分组成:与测量目的有关的变异数,与测量目的无关的变与测量目的有关的变异数,与测量目的无关的变异数,以及随机误差变异数,即:异数,以及随机误差变异数,即:SX2=SV2+SI2+SE2。 SX2ST2 SE2SI2SV2 四、心理测验的基本指标四、心理测验的基本指标1、行为样本、行为样本(behavio

7、r sample):测查的是部分心理特质与特定的行为,而非全部,这与质检、水检、血检一样涉及抽样问题(根据心理理论抽样)。2、标准化、标准化3、信度、信度(reliability):测验的可靠性,表示测量结果的一致性,通常用同一测验多次测量同一团体或个体的结果之间的一致程度来表示。4、效度、效度(validity):有效性,实际测出所要测的心理特质的程度。5、难度或应答率、难度或应答率 难度难度:成就测验或能力测验要求项目难度值(天花板天花板效应和地板效应),效应和地板效应),题目应由简到难、由易到繁排列难度控制。 第二节心理测量的信度第二节心理测量的信度一、什么是信度:一、什么是信度:稳定性

8、稳定性 、可靠性、可靠性 、一致性、一致性 1信度指实测值和真值相差的程度信度指实测值和真值相差的程度 2信度指统计量与参数之间的接近程度信度指统计量与参数之间的接近程度 3信度是指一种测验对相同的应试者再次测验时引信度是指一种测验对相同的应试者再次测验时引起同样反应的程度起同样反应的程度 一个良好的心理测量,多次进行测量,其结果应该一个良好的心理测量,多次进行测量,其结果应该的是始终保持不变。的是始终保持不变。 通常,心理测量的信度通过信度系数来衡量:通常,心理测量的信度通过信度系数来衡量: 1 1、 信度乃是一个被测团体真分数的变异数与实信度乃是一个被测团体真分数的变异数与实得分数的变异数

9、之比。得分数的变异数之比。 r rXXXX=S=ST T2 2/S/SX X2 2 2 2、信度乃是一个被测团体真分数与实得分数的相关、信度乃是一个被测团体真分数与实得分数的相关系数的平方。系数的平方。 r rXXXX=P=P2 2TXTX 3 3、信度乃是一个测验、信度乃是一个测验X X与它的任意一个平行测验与它的任意一个平行测验XX的相关系数。的相关系数。 r rXXXX=P=PXXXX 二、信度的种类:二、信度的种类: 1、重测信度、重测信度(test-retest reliability):):也叫稳定系数,是一组被试在不同时间用同也叫稳定系数,是一组被试在不同时间用同一测验测量两次(

10、间隔一段时距)所得分数一测验测量两次(间隔一段时距)所得分数的相关系数。的相关系数。 实质:表示测验结果的稳定性。故称之为稳定性系数实质:表示测验结果的稳定性。故称之为稳定性系数(Coefficient of Stability) 形式:施测形式:施测适当时间适当时间再施测再施测 重测信度的计算方法是积差相关法,因而重测信度的计算方法是积差相关法,因而rxx就是皮尔就是皮尔逊的积差相关系数。逊的积差相关系数。 时间间隔的把握:时间间隔的把握: 间隔时间越长,稳定性系数越低。适宜时间间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。间隔依照测验目的、性质及被试特点而定。

11、几分钟至几年。几分钟至几年。 年幼儿童,间隔要小;年长群体,间隔可大。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔智力测验的间隔不能太短,成就测验的间隔不能太长。不能太长。 一般间隔时间不超过六个月。(即不能让一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)。特质发生变化,或对所学知识产生遗忘)。 在一般情况下,间隔施测的副本信度最低,在一般情况下,间隔施测的副本信度最低,因为很多因素有机会影响到分数。相反,因为很多因素有机会影响到分数。相反,校正过的分半相关,因为

12、影响的因素少,校正过的分半相关,因为影响的因素少,所得的信度估计为最高。所得的信度估计为最高。 l使用重测信度应注意:不是所有测验使用重测信度应注意:不是所有测验都可以计算重测信度。并且重测信度都可以计算重测信度。并且重测信度只是反映了随机误差的影响,而不是只是反映了随机误差的影响,而不是反映被试心理特点的长期变化。反映被试心理特点的长期变化。 2、复本信度、复本信度(alternate-form reliability):): 两个平行测验,也叫等值系数,估计两个平行测验,也叫等值系数,估计的是两个假定相等的复份测验之间的一致性,的是两个假定相等的复份测验之间的一致性,是两个平行测验分数的相

13、关。当一个测验不是两个平行测验分数的相关。当一个测验不能用来实施两次时,就需要给同一个测验编能用来实施两次时,就需要给同一个测验编制两份平行的测验。制两份平行的测验。 定义:两个复本施测同一被试群定义:两个复本施测同一被试群体,求其相关。体,求其相关。 等值性系数:同时连续施测,反映内容等值性系数:同时连续施测,反映内容变异。变异。 形式:复本形式:复本A A最短时间最短时间复本复本B B 稳定性与等值性系数:时间间隔施测,稳定性与等值性系数:时间间隔施测,内容变异重测信度误差内容变异重测信度误差 形式:复本形式:复本A A适当时间适当时间复本复本B B 复本等值要符合下列条件:复本等值要符合

14、下列条件: 各份测验测量的是同一种心理特性。各份测验测量的是同一种心理特性。 各份测验具有相同的内容、形式、数各份测验具有相同的内容、形式、数量、难度、区分度、时限、指导语等。量、难度、区分度、时限、指导语等。 各份测验的题目不应重复。各份测验的题目不应重复。 前后测验的时间间隔要适当,太长和前后测验的时间间隔要适当,太长和太短都不好。太短都不好。 各份测验的分数分布(平均数和标准各份测验的分数分布(平均数和标准差)大致相等。差)大致相等。 复本编好后,应再测一次,以确保各份复本编好后,应再测一次,以确保各份测验的等值。测验的等值。 优点:优点:避免了重测带来的记忆效应和避免了重测带来的记忆效

15、应和练习效应;可用于长期追踪研究前后练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。测量;减少了作弊的可能性。 缺陷:缺陷:1 1、有些测验因正迁移效应使测、有些测验因正迁移效应使测验性质改变;如测量的内容很容易受验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这练习的影响,复本信度也无法清除这种练习效应。种练习效应。 2 2、对许多测验来说,难以编制、对许多测验来说,难以编制合适的复本。合适的复本。 重测复本信度:即在不同的时间里施重测复本信度:即在不同的时间里施测两个等值的测验(复本),得到的测两个等值的测验(复本),得到的相关就是重测复本信度,也叫稳定等相关就是重

16、测复本信度,也叫稳定等值系数。它比单一的重测信度或复本值系数。它比单一的重测信度或复本信度都要严格、全面一些。信度都要严格、全面一些。 3、折半信度、折半信度(split-half reliability):): 在测验没有复本且只能实施一次的在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。算相关系数,即得分半信度。 计算分半信度先要对测验分半。不计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。同的分半法可能会得到不同的信度值。 为

17、了使两半基本等值,可将项目按由易到为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会联系紧密的项目分在相同的一半,否则会使信度值偏高。也不要出现前后直接分段使信度值偏高。也不要出现前后直接分段. . 由于分半信度实际上只是半个测验的信度,由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校越高。因此,对长度不同的测验,要用校正公式。正公式

18、。 当试卷中存在任选题或试卷为速度测验时当试卷中存在任选题或试卷为速度测验时, ,不宜采用分半法不宜采用分半法. . 4、同质性信度、同质性信度(homogeneity reliability):所:所有题目间的一致性程度。有题目间的一致性程度。 同质性指测验的所有题目测量的是同一种心同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强,相关,相关越高则同质性越强,如果相关很如果相关很低或是呈负相关,则题目为异质。低或是呈负相关,则题目为异质。 因素分析的思路因素分析的思路 分半信度是求测验两半之间的一致分

19、半信度是求测验两半之间的一致性或同质性,而同质性是求所有题目间性或同质性,而同质性是求所有题目间的一致性。因此分半信度实际上是同质的一致性。因此分半信度实际上是同质性信度的一种,可以作为测验同质性评性信度的一种,可以作为测验同质性评价的粗略估计指标。因为可以根据测验价的粗略估计指标。因为可以根据测验得分来推论或验证某种概念或理论构思,得分来推论或验证某种概念或理论构思,因此同质性信度也是一种构思效度,或因此同质性信度也是一种构思效度,或叫结构效度,它实际上介于信度与效度叫结构效度,它实际上介于信度与效度之间。之间。 5、评分者信度:、评分者信度:多个评分者对同多个评分者对同一测验结果评分所得分

20、数之间的一致性。一测验结果评分所得分数之间的一致性。 评分者信度是指不同评分者之间在测验结评分者信度是指不同评分者之间在测验结果计分上的一致性。果计分上的一致性。 在心理测验中在心理测验中, ,评分者信度的计算评分者信度的计算, ,通常是通常是随机抽取若干份试卷随机抽取若干份试卷, ,由至少两位受过训由至少两位受过训练的评分者按计分规则分别判分练的评分者按计分规则分别判分, ,然后计然后计算它们的相关。几个评分者的评分越一致算它们的相关。几个评分者的评分越一致, ,评分者信度越高评分者信度越高. . 估计信度的方法与测验复本的数目估计信度的方法与测验复本的数目以及施测次数的关系以及施测次数的关

21、系被试所需要被试所需要施测的次数施测的次数所需要所需要复复本的数目本的数目一一二二一一分半信度分半信度同质性信度同质性信度评分者信度评分者信度复复本信度本信度(连续施测)(连续施测)二二再测信度再测信度复本信度复本信度(间隔施测)(间隔施测)在一般情况下,间隔施测的复本信度最低,因为很多因素有在一般情况下,间隔施测的复本信度最低,因为很多因素有机会影响到分数。相反,校正过的分半信度,因为影响的因素机会影响到分数。相反,校正过的分半信度,因为影响的因素少,所得的信度估计为最高。少,所得的信度估计为最高。 各种信度系数相应误差变异的来源各种信度系数相应误差变异的来源信度系数的类型信度系数的类型误差

22、变异的来源误差变异的来源再测信度再测信度复本信度(连续施测)复本信度(连续施测)复本信度(间隔施测)复本信度(间隔施测)分半信度分半信度同质性信度同质性信度评分者信度评分者信度时间取样时间取样内容取样内容取样时间与内容取样时间与内容取样内容取样内容取样内容的异质性内容的异质性评分者间的差异评分者间的差异 三、信度系数的应用三、信度系数的应用 1、解释预测个人分数的意义。、解释预测个人分数的意义。 2、解释真实分数与实得分数间的关系,明、解释真实分数与实得分数间的关系,明确告诉我们测验误差大小。确告诉我们测验误差大小。 3、 新编的测验信度应高于原有的同类测验新编的测验信度应高于原有的同类测验或

23、相似测验。或相似测验。 4、下结论说某测验比较可靠,必须是依据、下结论说某测验比较可靠,必须是依据情境的,经多次证实的。情境的,经多次证实的。 5、它是确定测验好坏的一个指标。一般的、它是确定测验好坏的一个指标。一般的原则是:原则是: 当当rxx 0.70时,测验不能用于对个人作出评价或预测,时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。而且不能做团体间比较。 当当0.70rxx0.85时,可用于团体比较。时,可用于团体比较。 当当rxx 0.85时,才可以用来鉴别或预测个人成绩时,才可以用来鉴别或预测个人成绩 实际上,有多少种误差来源,便有多实际上,有多少种误差来源,便有多少种

24、估计信度的方法。一个测验哪种误差大,少种估计信度的方法。一个测验哪种误差大,便应该用哪种误差估计。有时一个测验需要便应该用哪种误差估计。有时一个测验需要有几种信度系数,这样我们就把总分数的变有几种信度系数,这样我们就把总分数的变异数分成不同的分支。异数分成不同的分支。 假设对假设对100个六年级学生以两个月的个六年级学生以两个月的时间间隔先后施测一个创造力测验的时间间隔先后施测一个创造力测验的A、B两个复本,所得的等值性与稳定性系数为两个复本,所得的等值性与稳定性系数为0.70。我们还根据被试对每个复本的反应。我们还根据被试对每个复本的反应计算出分半信度为计算出分半信度为0.80(先计算每个复

25、本(先计算每个复本的分半相关系数。将二者平均后再用斯皮的分半相关系数。将二者平均后再用斯皮尔曼尔曼-布朗公式校正)。同时,我们让另一布朗公式校正)。同时,我们让另一个评分者随机抽取个评分者随机抽取50份卷子另外评分,得份卷子另外评分,得到评分者信度为到评分者信度为0.92。然后,我们对这三。然后,我们对这三种方法所产生的误差变异进行分析。种方法所产生的误差变异进行分析。 一个假想测验的误差变异来源分析一个假想测验的误差变异来源分析信度类型信度类型误差变异量误差变异量误差变异来源误差变异来源复本信度(间隔施复本信度(间隔施测测)1-0.70=0.30时间与内容取样时间与内容取样分半信度分半信度1

26、-0.80=0.20内容取样内容取样上述二者差异上述二者差异0.30-0.20=0.10 时间取样时间取样评分者信度评分者信度1-0.92=0.08评分者差异评分者差异误差变异总和误差变异总和0.20+0.10+0.08=0.38真实变异真实变异1-0.38=0.62 一个假想测验的误差变异来源分析一个假想测验的误差变异来源分析真实变异真实变异误差变异误差变异时间上的稳定性,时间上的稳定性,复本之间的一致性,复本之间的一致性,评分者之间的一致评分者之间的一致性性 内容取内容取样误差样误差时间时间取样取样误差误差评分者评分者间差异间差异62%20%10%8% 四、影响信度的因素:四、影响信度的因

27、素: 1、被试样本与同质程度:个体身心、被试样本与同质程度:个体身心状况,如应试动机、注意力、耐心、求状况,如应试动机、注意力、耐心、求胜心、作答态度等会影响测量的误差。胜心、作答态度等会影响测量的误差。团体被试:团体内部的离散程度以及团团体被试:团体内部的离散程度以及团体的平均水平;被试的样本。体的平均水平;被试的样本。 (1) 样本团体得分分布的影响:求信度样本团体得分分布的影响:求信度的样本团体得分分布如果比较窄小的话信度就的样本团体得分分布如果比较窄小的话信度就低。低。 (2) 样本团体异质性的影响:样本团体样本团体异质性的影响:样本团体异质的话,测验分数的分布就比同质样本的要异质的话

28、,测验分数的分布就比同质样本的要广,分数的离差就大,样本的方差就大,信度广,分数的离差就大,样本的方差就大,信度就高。实际上,高信度可能是假性高信度,是就高。实际上,高信度可能是假性高信度,是由样本团体的异质造成的。但如果常模总体要由样本团体的异质造成的。但如果常模总体要求各种各样的人,则异质的信度样本求得的信求各种各样的人,则异质的信度样本求得的信度就是真信度。这时,相反的情况就需要校正度就是真信度。这时,相反的情况就需要校正信度。信度。 (3)样本团体平均能力水平)样本团体平均能力水平的影响。由于信度也会因样的影响。由于信度也会因样本间团体平均能力水平的不本间团体平均能力水平的不同而不同,

29、因此在求信度时,同而不同,因此在求信度时,一定要注意信度样本与常模一定要注意信度样本与常模总体间是否一致。总体间是否一致。 2、测验的长度:在其他条件均等的、测验的长度:在其他条件均等的情况下,测验越长,信度越高。情况下,测验越长,信度越高。 原因在于:(原因在于:(1) 测验越长,即测验越长,即题目越多,测验的内容取样就越有题目越多,测验的内容取样就越有可能有代表性。可能有代表性。 (2) 测验越长,被试的猜测因测验越长,被试的猜测因素影响就越小。增加的项目须与原素影响就越小。增加的项目须与原项目同质;增加的数目适当,过项目同质;增加的数目适当,过多多疲劳、反感,从而降低信度。疲劳、反感,从

30、而降低信度。 3、测验的难度:难度对信度的影响只、测验的难度:难度对信度的影响只存在于某些测验中,如智力测验、成存在于某些测验中,如智力测验、成就测验、能力倾向测验、教育测验等。就测验、能力倾向测验、教育测验等。测验的难度对信度有间接影响,因为测验的难度对信度有间接影响,因为如果测验过难,被试的得分会集中在如果测验过难,被试的得分会集中在低分区。过于容易,分数则集中在高低分区。过于容易,分数则集中在高分区。两种情况都使信度样本的得分分区。两种情况都使信度样本的得分范围变窄,变异量降低,从而低估测范围变窄,变异量降低,从而低估测验信度。因此,当难度为验信度。因此,当难度为0.5时信度时信度最高。

31、最高。 4、测验的时间间隔:这一因素之对、测验的时间间隔:这一因素之对重测信度和不同时测量时的复本信重测信度和不同时测量时的复本信度有影响,对其余的信度来说不存度有影响,对其余的信度来说不存在时间间隔问题。在时间间隔问题。 第四节心理测量的效度第四节心理测量的效度效度要回答的基本问题:效度要回答的基本问题:l要测量的是什么东西?或者说是否要测量的是什么东西?或者说是否测到了它所要测的东西?测到了它所要测的东西?l测验对它所测量的东西测到什么程测验对它所测量的东西测到什么程度?度? 一一 效度的一般定义及其内涵效度的一般定义及其内涵效度是指测验的准确性,即测验能够测出效度是指测验的准确性,即测验

32、能够测出他们所欲测的特质的程度。他们所欲测的特质的程度。、效度的性质:效度的真实含义是指测验结果、效度的性质:效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。的效度,也就是测验结果的准确程度。 (1) 效度具有相对性。效度具有相对性。 (2) 效度具有连续性。测验的有效性只有程效度具有连续性。测验的有效性只有程度上的差别。度上的差别。 (3) 效度也不是直接就可以测量到的,它是效度也不是直接就可以测量到的,它是从已有的证据推理而来的。从已有的证据推理而来的。 2 效度的统计与原理:效度的统计与原理:3 效度和信度关系:效度和信度关系: 两者所涉及的误差不同:信度仅考虑两者所涉及的误

33、差不同:信度仅考虑偶然的随机误差占测验总变异的比例,效偶然的随机误差占测验总变异的比例,效度则还包括与测验无关的但稳定的测量误度则还包括与测验无关的但稳定的测量误差。差。 (1) 信度是效度的必要而非充分条件。信度是效度的必要而非充分条件。 (2) 效度是受信度制约的。效度是受信度制约的。 l高效度,高信度高效度,高信度l高信度,低效度高信度,低效度l低信度,低效度低信度,低效度 二、二、 效度的估计效度的估计1966年美国心理学会在年美国心理学会在教育心理测验值标教育心理测验值标准准中将效度分为三大类:中将效度分为三大类:(一)内容效度(一)内容效度(Content Validity)内容效

34、度指测验实际测到的内容与所要测量内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。的内容之间的吻合程度。、满足条件:、满足条件:l要确定好内容范围,并使测验的全部要确定好内容范围,并使测验的全部项目均在此范围内;项目均在此范围内;l测验项目应是已界定内容范围的代表测验项目应是已界定内容范围的代表性样本。性样本。 、确定内容效度的方法、确定内容效度的方法:l专家判断法专家判断法定义好内容总体,并描绘出有关知识与技能的轮廓;定义好内容总体,并描绘出有关知识与技能的轮廓;划分细纲目,并根据重要性规划好各个纲目的加权比例,划分细纲目,并根据重要性规划好各个纲目的加权比例,作出尽可能详细的描述

35、;作出尽可能详细的描述;确定每道题目所测的知识与技能,将自己的分类与测验编确定每道题目所测的知识与技能,将自己的分类与测验编制的纲目做比较;制的纲目做比较;指定判定量表,从各方面对测验作出评定。指定判定量表,从各方面对测验作出评定。l复本法复本法l再测法再测法l经验法经验法、内容效度应用:、内容效度应用:内容效度内容效度表面效度表面效度 (二)构想效度(二)构想效度(Construct Validity)构想效度是指测验对于被称作构想的构想效度是指测验对于被称作构想的某一理论概念或特质测量的程度。某一理论概念或特质测量的程度。研究构想效度就是要搞清楚:研究构想效度就是要搞清楚:l测验测量的是什

36、么构想(概念或特质)?测验测量的是什么构想(概念或特质)?l测验分数的变异中有多少来自于测验的理测验分数的变异中有多少来自于测验的理论构想?论构想?l构想效度是没有单一指标的,它是由各方构想效度是没有单一指标的,它是由各方面证据累积起来作出评价的。面证据累积起来作出评价的。 、构想效度的基本步骤:、构想效度的基本步骤:确定结构效度的基本步骤:建立理论框确定结构效度的基本步骤:建立理论框架、根据理论框架推演出有关测验成绩的假架、根据理论框架推演出有关测验成绩的假设、用逻辑或实证的方法来证明假设。设、用逻辑或实证的方法来证明假设。 相关、因素分析相关、因素分析 、确定构想效度的方法:、确定构想效度

37、的方法:l测验内法:是通过研究测验内部结构来界定理论测验内法:是通过研究测验内部结构来界定理论构想,从而为构想效度提供证据。构想,从而为构想效度提供证据。 确定测验的内容效度确定测验的内容效度分析被试对项目作反应的过程分析被试对项目作反应的过程考察测验的同质性考察测验的同质性l测验间法:通过分析几个测验间的相关关系,找测验间法:通过分析几个测验间的相关关系,找出其共同之处,进行推断这些测验测量的特质是出其共同之处,进行推断这些测验测量的特质是什么,也可以确定这些测验构想效度如何。什么,也可以确定这些测验构想效度如何。 相容效度相容效度区分效度区分效度因素效度因素效度l效标关联法效标关联法l实验操作法实验操作法 (三)效标效度:指一个测验对处于特定情(三)效标效度:指一个测验对处于特定情景中的个体的行为进行估计的有效性。景中的个体的行为进行估计的有效性。、预测效度与同时性效度、预测效度与同时性效度、效标和效标测量:、效标和效标测量:效标:效标:指衡量测验有效性的外在标准,通常指我们所要预指衡量测验有效性的外在标准,通常指我们所要预测的行为。测的行为。效标测量:效标测量:对观念效标的数量化。对观念效标的数量化。 观念效标是效标的理论定义,效标测量是效标的操作观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论