信度完整版本_第1页
信度完整版本_第2页
信度完整版本_第3页
信度完整版本_第4页
信度完整版本_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信度一、信度的概念二、信度的统计定义四、信度与测验分数的解释三、信度的统计方法五、影响信度的因素一、信度的概念

信度(reliability)指的是测量结果的稳定性程度。换句话说,若能用同一测量工具反复测量某人的同一心理特质,则其多次测量的结果间的一致性程度就叫信度。有时也叫测量的可靠性。例如:比较钢尺与具有弹性的皮尺测量长度的信度。各种类型的测量,无论是物理测量还是教育与心理测量,先后向同一对象施测后,所测得的值很难做到绝对一致。当然,教育测量由于对象的特殊性,出现测量误差的可能性更大,如施测环境、完成时限、主被试关系、被试的情绪等等,都会造成所得测值的不规则随机起伏。二、信度的统计定义(一)真分数理论(二)信度的统计定义(一)真分数理论

我们不妨把测验实施过程中直接的得到的分数,叫做观察分数,记为X;把被试在所测特质上客观具有的水平值,叫一般真分数,记为T;那么,观测分数与一般真分数的差就是测量误差,记为E。这样,三者的关系就可以表示为:X=T+E

由X=T+E可以推出:S2X=S2T+S2E

S2X表示观察分数的方差;S2T表示真分数的方差;S2E表示误差分数的方差(二)信度的统计定义第一,信度是一个被测团体的真分数方差与观察分数方差之比,即:rxx=第二,信度是一个被试团体的真分数与观察分数的相关系数的平方,即:

rxx=第三,信度是一个被试团体在测验X(A卷)上的观察分数与在测验X的任意一个平行测验X’(B卷)上的观察分数的相关系数。即:rxx=(一)重测信度(二)复本信度(三)同质性信度(四)评分者信度三、信度的估计方法

(一)重测信度1、定义重测信度,也称稳定系数,是指用同一个量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。2、使用的前提条件(1)所测量的心理特性必须是稳定的。(2)遗忘和练习的效果基本上互相抵消。(3)在两次施测的间隔时期内,被试的心理特质方面没有获得更多的学习和训练。3、优缺点(1)优点能够提供测验是否随时间而变异的资料,可作为被试将来行为表现的依据。(2)缺点易受练习和记忆的影响。如果两次施测间隔的时间太短,则记忆犹新,练习的影响较大,夸大稳定性;如果间隔的时间太长,则身心发展与学习经验的积累等足以改变分数的意义,而使相关减低,降低稳定性。最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周为宜,时间间隔最好不超过六个月。

(二)复本信度1、定义复本信度,又称等值系数,指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。实施复本测验,有两种方式:一种是在同一个时间连续施测,另一种是间隔一段时间后施测。前者主要可以反映出测验内容造成的误差的多少,也就是说可以反映出两个测验是否是真正的平行测验,所以这种复本信度称作等值性系数。而后者所得到的复本信度,不仅反映出测验内容的抽样误差,而且也反映了被试本身状况的改变,这种同时兼顾试题抽样与时间影响的信度,称作等值稳定性系数。2、使用的前提条件(1)构造出两份或两份以上真正平行的测验。复本测验必须在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式和测验等其它方面都相同或相似。(2)被试有条件接受两个测验。例如,时间、经费等。3、优缺点(1)优点能够避免重测信度的一些问题,如记忆效果、学习效应等。(2)缺点其一,如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;其二,由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题;最后,对许多测验来说,建立复本是非常困难的。1、分半信度2、库德——理查逊信度3、克龙巴赫α系数(三)同质性信度

同质性信度也叫内部一致性信度,它是指测验内部所有题目间的一致性程度。这里题目间的一致性含有两层意思:其一是指所有题目测的是同一种心理特质;其二是指所有题目得分之间都具有较高的正相关。估计同质性信度的方法主要有以下几种方法:1、分半信度(1)定义分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。它反映了测验内两半题目间的一致性,所以属于同质性信度。但是,也可以将分半信度和等值性系数一样解释,即把对等两半测验看成是在最短时间距离内施测的两个平行测验。1、分半信度(2)计算A.如果两半测验的变异数相等(即方差齐性),则用斯皮尔曼—布朗公式加以校正:rxx为整个测验的信度系数,rhh为两个“半测验”上得分的相关系数B.如果两半测验的变异数不相等,则使用弗朗拉根公式或卢仑公式弗朗拉根公式:rxx=2(1-)式中S2a和S2b分别是两个分半测验的方差,S2x表示总得分的方差卢仑公式:rxx=1-Sd2是两半测验分数之差的方差,S2x表示总得分的方差1、分半信度(3)使用的前提条件及范围A.分半信度通常在只能施测一次或没有复本的情况下使用。B.将一个测验分成两半的方法很多,所以,同一测验通常会有多个分半信度。C.分半的方法:按题号的奇偶性分半、按题目的难度分半、按题目的内容分半等。2、库德——理查逊信度

该方法适合于测验题目全部为二分计分题的测验的内部一致性信度分析。库德——理查逊公式有好几个,其中常用的有KR20和KR21公式。(1)KR20公式KR20=式中KR20为测验的信度;K为题目数;pi和qi分别表示答对和答错第i题得被试人数比例;S2x为测验总分的方差。(2)KR21公式

KR21=式中KR21为测验的信度;是全体被试测验总分的方差;其它符号的含义同上3、克龙巴赫系数

当测验题型较多,并非都是二分计分题时,估计测验信度可采用克龙巴赫系数,其计算公式为:=(1-)

S2i表示所有被试在第i题上得分的方差,S2x表示所有被试各自总分的方差,K为题目数。(四)评分者信度1、定义

评分者信度指的是多个评分者给同一批人的答卷进行评分的一致性程度。用于测量不同评分者产生的误差。2、计算(1)当评分者为两人时评分者信度等于两个评分者给同一批被试的答卷所评分数的相关系数。2、计算(2)当评分者人数多于两人时评分者信度可用肯德尔和谐系数进行估计。肯德尔和谐系数是表示多列等级变量相关程度的一种方法。这种资料的获得一般采用等级评定的方法,即让K个评价者对N个被试的试卷(或作品)进行等级评定,每个评价者都能对N份试卷(或作品)排出一个等级顺序,这样就可以得到K列等级顺序变量。其计算公式为:W=

式中,W为肯德尔和谐系数;K为评价者的人数;N为被评价的试卷(或作品)个数;S为每一个评价对象的K个等级之和的离均差平方和,即S=,Ri为第i个被评价对象的K个等级之和。严格地讲,W值是否达到显著性水平,需要做统计假设检验。(一)解释真实分数与实得分数的相关(三)解释个人分数的意义四、信度与测验分数的解释(二)确定信度可以接受的水平(四)比较不同测验分数的差异(一)解释真实分数与实得分数的相关

信度系数可以解释为总方差中有多少比例是由真实分数的方差决定的,也就是说,测验的总变异中真分数造成的变异占百分之几。信度系数的分布从0-1的正数范围,代表了从缺乏信度到完全可信的所有情况。(二)确定信度可以接受的水平

一般能力测验和成就测验的信度系数都在0.90以上。人格测验、兴趣、态度、价值观等测验的信度一般都在0.80-0.85。一般原则是:☆当rXX<0.70时,测验不能用于对个人作出评价或预测,而且也不能做团体比较;☆当0.70≤rXX<0.85时,可用于团体比较;☆当rXX≥0.85时,才能用来鉴别或预测个人成绩或行为。另一原则是:新编的测验信度应高于原有的同类测验或相似测验。(三)解释个人分数的意义作用:1、估计真实分数的范围;

2、了解真实分数再测时可能的变化情形。

X-1.96SE≤XT≤X+1.96SE

其中SE为测量的标准误(测量标准误是指测验中所得测值偏离真分数的程度),SX是所得分数的标准差,rXX为测验的信度系数。例题例题:在一个智力测验中,某个被试的IQ为100,这是否反映了他的真实水平?如果再测一次他的分数将改变多少?已知该智力测验的标准差为15,信度系数为0.84,则其IQ的测量标准误和可能范围分别为:我们可以说,这个被试的真实IQ有95%的可能性落在88-112之间。即若再测一次,他的智商低于88、高于112的可能性不超过5%。(四)比较不同测验分数的差异差异分数的标准误:SEd=S式中SEd为差异的标准误,S代表两个测验使用的标准差,这个标准差要求相同,因为只有在两个分数具有相同的单位时才可以比较。(四)比较不同测验分数的差异例题;某被试在韦式成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否显著高于言语智商?在统计上,经常要求两个平均分数的差异程度达到0.05的显著性水平,才承认不是误差的影响。因此,将差异标准误7.5乘以1.96,结果为14.7,这表明个体在韦氏测验两半部分的差异高于大约15分,才能达到0.05水平。上述被试的差异分数是8,所以是不显著的。(一)样本的特征(三)测验的难度五、影响信度的因素(二)测验的长度(一)样本的特征

影响信度估计的一个重要因素是被试样本的情况。团体的异质程度与分数的分布有关,一个团体越是异质,其分数分布的范围也就越大,信度系数也就越高。由于信度系数与样本团体的异质性有关,因此我们在使用测验时,不能认为当该测验在一个团体中有较高的信度时,在另一个团体中也具有较高的信度。此时,往往需要重新确定测量的信度。(二)测验的长度

一般来说

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论