误差测量的信度与效度第二讲

上传人：f*** IP属地：广东上传时间：2023-07-07 格式：PPT 页数：151 大小：1.45MB 积分：40 举报 版权申诉

已阅读5页，还剩146页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

人啊，准确地（accurately）认识你自己！准：一致确：正确心理测量试图帮助我们准确了解人的心理现象（心理特质），就像尺子帮助我们测量身高。

但这个工具是有误差的。

为了准确地认识心理特质，误差要控制在一个许可的范围内。

二、误差的来源

（一）测验内部引起的误差（二）由施测过程引起的误差（三）由受测者本身引起的误差

三、真分数所谓真分数就是一个测量工具在测量没有误差时，所得到的纯正值。

其操作定义是：经过无数次测量所得到的平均值。真分数的定义表明，一个人在一个测验上所得的分数，即是它的真分数的函数，也是测量误差的函数，用公式表示如下：

X=T+E

这里X为实得分数或观测分数，T是假设的真分数，E是测量误差。

对于一个团体来说，实得分数、真分数和测量误差之间有如下关系：

2=ST2+SE2

即实得分数的变异数等于真分数的变异数加上误差变异数。

可得公式：

2=SV2+SI2+SE2

这就是说，一组测验分数之间的变异性是由与测量目的有关的变异数、稳定的但出自无关来源的变异数和测量误差变异数所决定的。

SV2

SI2SE2

Sx2

ST2第一节测量信度一、什么是信度1.定义信度（reliability）是指测量结果的稳定性（stability）和可靠性程度。一个好的测验必须稳定可靠，即多次测量结果要保持一致。

2.信度的测量学定义一信度系数

该定义有两点需要注意：第一、信度指的是一组测验分数或一列测量的特性，而不是个人分数的特性；第二、真分数的变异数是不能直接测量的，因此信度是一个理论上构想的概念，只能根据一组实得分数做出估计。信度涉及的主要问题是对测验分数意义的概化能力，即从一次测量来推论总体能达到何种正确程度。

3.误差方差与信度的关系信度的范围:0到1.00信度不受系统误差影响，受随机误差影响信度的定义二信度乃是一个被测团体真分数与实得分数的相关系数的平方。rXX=P2TX信度的定义三信度乃是一个测验X与它的任意一个平行测验X＇的相关系数。rXX=PXX＇

对信度系数要注意三点：第一，在不同情况下，对不同样本，采用不同方法会得到不同的信度系数，因此一个测验可能不止一个信度系数；第二，信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因；第三，获得较高的信度系数并不是心理测量追求的最终目的，它只是迈向目标的一步，是使测验有效的一个必要条件。

信度系数要达到多高才可以接受呢？

一般能力与学绩测验的信度系数在0.90以上；

人格测验的信度系数通常在0.80以上。当rxx＜0.70时，不能用测验对个人作评价，也不能在团体间作比较；

当rxx≥0.70时，可用于团体间比较;当rxx≥0.85时，可用于鉴别个人。第三节信度的估计方法

一、重测信度二、复本信度三、分半信度四、同质性信度五、评分者信度六、几种信度估计方法的比较

信度是一个理论上构想的概念，在实际应用时，通常以同一样本所得的两组资料的相关，作为测量一致性的指标。

因为测验分数的误差来源不同，估计信度的方法也不同，故每一种信度系数只能说明信度的不同方面，因而具有不同的意义。

一、重测信度（test-retestreliability）１．定义用同一种测验，对同一组受试者，前后施测两次，再根据受试者两次测验分数计算其相关系数，即得再测信度。即测验

时距（几分－几年）

再测验

此种信度能表示两次测验结果有无变动，反映测验分数的稳定程度，故又称稳定性系数。

2.重测信度使用的条件（1）所测量的心理特质必须是稳定的（2）遗忘和练习的效果基本上相互抵消（3）在两次测试时间间隔内，被试在所要测查的心理特质方面没有其他的学习和练习3.计算重测信度应注意的问题（1）两次测验时间间隔要适当（2）应提高被试的积极性（3）适宜于人格测验与速度测验，不适合于智力等难度测验时间间隔的把握间隔时间越长，稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童，间隔要小；年长群体，间隔可大。智力测验的间隔不能太短，成就测验的间隔不能太长。一般间隔时间不超过六个月。（即不能让被试记住上一次测验的内容，又不能让其特质发生变化，或对所学知识产生遗忘）

（二）误差来源1.测验本身：测验所测的特性本身就不稳定，例如情绪。2.被试方面：成熟、知识的发展并非人人都等量增长，且练习因素、记忆效果也存在个体差异。3.施测情境：偶发因素的干扰，如计时错误，情绪波动，健康状况，动机变化等。重测信度高，说明分数受被试状况和测验情境变化影响小。这里题目取样并不影响重测信度。

（四）使用重测信度的优缺点１．（优点）能提供有关测验结果是否随时间而变异的资料，可作为预测受测者将来行为的依据。２．（缺点）容易受练习和记忆的影响，前后两次施测间隔的长短必须适度;第一次尝试所发现的错误也可能导致第二次反应的变化而增加误差变异。

二、复本信度（等值系数）（一）定义与计算1.定义根据一组被试在两个平行（等值）测验上的得分计算相关系数。即测验复份A测验复份B

因为它反映的是两个测验之间的等值程度，故又称等值系数。

最短时距

2.计算方法

rxx=∑ＸAＸB／Ｎ－ＸAＸB

ＳAＳB

式中ＸA、ＸB为同一被试在两个测验复份A、B上的分数，ＸA、ＸB为A、B两型测验的平均分数，ＳA、ＳB为A、B两型测验的标准差，N为被试人数。

两个复本测验实施的时间不同，复本信度所表达的含义略有不同。（1）等值性系数如果两个复本测验是同时连续测试的，则称这种复本信度为等值性系数。等值性系数的大小主要反映着两个复本测验的题目差别带来的变异情况。（２）稳定性与等值性系数如果两个复本测验是相距一段时间分两次测试，则称这种复本信度为稳定性与等值性系数。此时两个题目间的差别、两次施测情境、被试特质水平等方面的差别都会成为测验结果不一致的原因。

（二）误差来源1.测验两种形式是否等值：（1）测题取样是否匹配；（2）格式是否相同；（3）内容、题数、难度、平均数、标准差是否一致。2.被试方面情绪波动、动机变化等。3.测验情境的变化,偶发因素的干扰。

（三）等值测验应符合的条件等值测验可避免重测法的缺点，但所使用的必须是真正的复本。复本应符合以下条件：1.各份测验测量的是同一种心理特性；2.各份测验具有相同的内容和形式；3.各份测验的题目不应有重复的地方；4.各份测验题目数量相等，并且有大体相等的难度、区分度；5.分数分布（平均数和差异度）大致相等。

（四）注意事项1.两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似；2.两次测验的时间间隔要适当，若太短，由于测验太相似被试可能厌倦，若太长可能又会因新的学习而产生干扰。

（五）使用复本信度的局限1.只能减少但不能完全消除练习和记忆的影响；2.由于第二个测验只改变了题目的具体内容，已经掌握的解题原则，可以很容易地迁移到同类问题。3.对许多测验来说，建立复本是十分困难的。内部一致性系数（coefficientofinternalconsistency）将测验项目分成不同的样本，从而间接考虑信度。

三、分半信度（一）定义和计算在测验无复本且只能施测一次的情况下，通常用分半法估计信度，即将测题分成对等的两半，根据各人在这两半测验的分数，用皮尔逊积差相关公式计算其相关系数，作为信度指标。分半信度考察的是两半题目之间的一致性，故这种信度系数也称内部一致性系数。计算分半信度仍然可用积差相关方法。（二）分半的方法要计算分半信度，首先是如何将测验分半，以便得到最接近的可比较的两半。题目分半的方法：按题号奇偶性分半、按题目难度分半、按题目内容分半等。通常采用奇偶分半法。使用此方法应注意：1．一组解决同一问题或互相有牵连的题目应尽量安排在同一半内。2．当试卷中有任选题时不宜使用分半法，速度测验也不宜用。（三）校正公式分半法求得的相关仅是半个测验分数相关，应使用“斯皮尔曼—布朗”公式加以校正，藉以估计整个测验的信度。1.斯皮尔曼—布朗公式

rxx=2rhh/（1+rhh）

其中，rhh为两半分数的相关系数，rxx为测验在原长度时的信度估计。此法假设：两半测验分数的变异性相等。当两半不等值时，即上述假设不满足时，可采用下面两公式之一：2．弗朗那根公式：

rxx=2[1-（Sa2+Sb2）/Sx2]

其中Sa2和Sb2分别表示两半测验分数的变异数，Sx2表示测验总分的变异数。3．卢伦公式：

rxx=1-(Sd2/Sx2)

其中Sd2表示两半测验分数之差的变异数，Sx2表示整个测验分数的变异数。四、同质性信度（一）同质性的含义所谓同质性指的是测验内部各题目的一致性。这里的一致性有两种含义：一是所有题目都测的是同一种心理特质，二是所有题目得分之间都具有较高的正相关。（测验里各题得分相关为零叫异质）。同质性信度就是一个测验所测内容或特质的相同程度。题目内部的一致性主要受两方面变异的影响：1．内容的一致性；2．所研究的行为的同质性。（二）同质性信度的计算1．库德—理查逊公式：（1）K-R20公式：

rkk=[K/(K-1)][（Sx2-∑piqi)/Sx2)]

式中K表示整个测验的题数，pi为项目通过率，qi为项目未通过率，Sx2表示测验总分的变异数（方差）。

（2）K-R21公式，适用于各题难度相近的情况：

rkk=[K/(K-1)][(Sx2-Kpiqi)/Sx2]pi为题目的平均通过率，qi为1-piK-R21公式计算较为简单，但求得的信度系数有低估的倾向，当题目难度相差大时偏差更大。公式K-R20和K-R21只适用于0，1记分的测验。2．克伦巴赫α系数适用于非0，1记分的一种内在一致性系数。其公式如下：

α=[K/(K-1)][1-（∑Si2/Sx2）]

其中Si2为每一项目分数的变异数，其他字母意义与K-R20相同。实际上α系数是所有可能分半信度的平均值，但它是测验信度的一个下界值，即α系数值大，测量信度必然高，但α系数值小，却不能判断测量信度不高。

上面这些公式均不适用于速度测验，因为只有每个人都做完全部题目时，题目的变异数才是准确的。

五．评分者信度评分者信度指的是多个评分者给同一批人的答卷进行评分的一致性程度。对于主观试题，不同的评分者给出的分数是不等的，这样会造成误差，如何降低评分者信度是心理测量的重要任务之一。考察评分者信度的方法是：随机抽取相当份数的试卷，由两位或多位评分者按记分规则分别给分，然后根据每份试卷的分数计算其相关系数，即得评分者信度。

一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上，才认为评分是客观的。当评分者人数为2时，评分者信度等于两个评分者给同一批被试答卷所给分数的相关系数。

当多个评分者评多个对象，并以等级法记分时，可用肯德尔和谐系数作为评分者信度的估计：

W=[∑Rt2-（∑Ri)2/N]/[(1/12)K2(N3-N)]

其中，K是评分者人数，N是被评的对象数，Rt是每一个对象被评等级的总和。

六、几种信度估计方法的总结比较

估计信度的方法与测验复本的数目以及施测次数的关系

所需要的施测次数所需复本的数目一二一二分半信度同质性信度评分者信度再测信度复本信度（连续施测）复本信度（间隔施测）各种信度系数相应的误差来源信度系数的类型误差变异的来源再测信度时间取样复本信度（连续施测）内容取样复本信度（间隔施测）时间与内容取样分半信度内容取样同质性信度内容的异质性评分者信度评分者间的差异三、信度的作用（一）评价测验信度是测量过程中所存在的随机误差大小的反映。信度低，测量随机误差大，测量结果就会与真分数发生较大偏离。信度是衡量一个测验好坏的重要指标之一，测验的信度达到多少才可以接受呢？一般来讲，能力与成就测验的信度应该在0.90以上，人格测量信度系数应该在0.80以上。测量中的系统误差与信度无关。（二）解释分数1.解释个人测验分数的意义从理论上讲，一个人的真分数本来是用同一测验对他反复施测所得的平均值，其误差则是这些实测值的标准差。但实际上，这是做不到的。实际的做法是用一个团体（人数足够多）两次施测得结果来代替对同一个人的反复施测，以估计测量误差的变异数。2．不同测验分数的比较四、影响测量信度的主要因素测量信度是测量过程中随机误差大小的反映，随机误差大，信度就低，随机误差小，信度就高。因此，在测量过程中凡是能引起测量随机误差的因素都会影响测量信度。影响信度的几种主要因素为：（一）被试方面就单个被试而言，其身心健康状况、应试动机、注意水平、作答态度等会影响测量信度。就团体而言，团体的异质程度与分数的分布密切相关，一个团体越是异质，其分数分布范围越大，计算出来的信度系数值越高，这样会高估真正的信度值。当团体内部水平相差不大（同质）时，其得分分布必然会狭窄，以相关为基础计算出来的信度值必然小，可能会低估真正的信度值。此外若团体的平均数太高或太低，同样使测验的总分分布变窄，低估测验的真正信度。图中大方框显示的是一个较大的异质团体在两次施测中的分数分布,显然有很高的正相关.在小方框中显示的是一个高度同质的亚团体,两次分数几乎呈随机变化,相关接近于零.（二）团体的平均水平对于不同的团体，题目具有不同的难度。每个题目在难度上的微小差异积累起来便会影响信度。例如，同一量表对不同年龄，不同IQ水平的被试，信度则不尽相同。因此，我们在编制测验量表，抽选被试时，往往要考虑选取不同层次的被试，以使得测验团体呈异质性，从而使得信度提高。反之，当需要同质团体的信度时，就应该尽量选取同一层次的被试。（二）主试者方面就主试者而言，若不按指导手册中的规定施测，或故意制造紧张气氛，或给考生一定的暗示、协助等，测量信度会大大降低。就阅卷评分者而言，若评分标准掌握不一，或前后标准不统一，甚至随心所欲，则也会降低测量信度。（三）施测情境方面实施测验时，环境是否安静，光线和通风状况是否良好，所需设备是否齐全，桌面是否合乎要求等都可能影响到测量信度。（四）测量工具方面测量的取样、测验的长度、难度等是影响测量信度的主要因素或关键因素。一般来说，测验越长，信度值越高。这是因为：测验加长，能够改进项目取样的代表性，从而能够更好地反映受测者的真实水平。测验的项目越多，每个项目上得随机误差会相互抵消。测验太难或太容易，都会降低测验的信度。（五）两次施测之间的时间间隔计算重测信度、稳定性与等值性系数时，两次测验相隔时间越短，其信度值可能会越大；两次测验相隔时间越长，其信度值可能会越小。五、提高测量信度的常用方法（一）适当增加测验的长度增加新项目必须与原试卷中的所有项目同质，新增项目必须适度。（二）使测验中题目的难度接近正态分布，并控制在中等难度（三）努力提高测验试题的区分度（四）选取适当的被试团体（五）主试者严格按照要求去做第五节测量的标准误差

一、测量的标准误差

个人在两次测验中的分数差异就是测量误差，据此可制成误差分数的分布。这个测量误差分布的标准差就是测量的标准误（SE），是表示测量误差大小的指标。测量标准误可以通过一次测验结果及信度估计得到，公式如下：

SE=Sx√1－rxx式中，SE为测量标准误，Sx

为所得分数的标准差，rxx为测验的信度。从信度可以解释个人分数的意义，这就是测量标准误的应用。它有两个作用：其一是估计真分数的范围；其二是了解实得分数再测时可能的变化情况。在实际中，我们往往用一组被试施测两次的结果来代替对同一个人反复施测，以估计误差变异数。

测量的标准误与信度之间有互为消长的关系：信度越高，标准误越小；信度越低，标准误越大。根据公式，知道了一组测量的标准差和信度系数，就可以求出测量的标准误，进一步我们就可以从每个人的实得分数估计出真分数的可能范围，即确定出在不同置信水平上真分数的置信区间。（人们一般采用95%的置信水平，其置信区间为：X－1.96SE<T≤X＋1.96SE）可见，测量的标准误差可以用来估计个人的真分数。例如，已知WISC－R的标准差为15，信度系数为0.95，对一名12岁的儿童实施该测验后，IQ（即X）为110，那么他的真分数在95%的可靠度要求下，变动范围应是多大？解：∵SE=Sx√1－rxx

∴SE=Sx√1－rxx=15√1－0.95=3.35

已知X=110

将其代入X－1.96SE≤T≤X＋1.96SE中，则110－1.96×3.35＜T＜110+1.96×3.35即103.4＜T＜116.6

这就是说有95%的把握断定该儿童真分数在103.4到116.6之间。练习：在WISC－R中，甲生在测验中得到78分，乙生得了81分，那么乙生比甲生的成绩高吗？

（注意事项）第一、SE

对真分数作的是区间估计，不可能由此得到一个确切的点。这就说明，测验分数不是一个定点，而是具有一定的分布范围，或呈带状。这样就不会对两次测验之间微小的差别作过分的解释。

第二、置信水平确定后，估计的精确度主要取决于SE，SE越小，估计就越精确，相反则越粗略。第三、真分数不等同于真正能力或特质。当系统误差对实测分数产生影响时，用此方法估计出的真分数就并非代表被试的真正能力或特质。

二、直接估计标准误差用复份法和重测法估计标准误差时，可以采用公式SE=0.707SX1-X2SX1-X2是两次测验分数差异的标准差。本章小结信度又叫可靠性。指的是测量的一致性程度。一个好的测验必须稳定可靠，即多次测量结果要保持一致。在测量理论中，信度被定义为：一组测验分数的真变异数与总变异数（实得变异数）的比率。大部分的信度指标都以相关系数表示，即用同一被试样本所得的两组资料的相关作为测量一致性的指标。信度是个理论上构想的概念，在实际应用时，通常以同一样本所得的两组资料的相关，作为测量一致性的指标。因为测验分数的误差来源不同，估计信度的方法也不同。信度与误差变异之间有密切的关系。误差变异越大，信度越低。被试样本、测验长度、测验难度及间隔时间都会影响信度的估计。考研对其的要求测量误差的定义；测量误差的来源及控制；测量误差的估计。信度的定义信度系数的估计；信度的影响因素与改进。信度与效度的关系。两个复本测验实施的时间不同，复本信度所表达的含义略有不同。（1）等值性系数如果两个复本测验是同时连续测试的，则称这种复本信度为等值性系数。等值性系数的大小主要反映着两个复本测验的题目差别带来的变异情况。（２）稳定性与等值性系数如果两个复本测验是相距一段时间分两次测试，则称这种复本信度为稳定性与等值性系数。此时两个题目间的差别、两次施测情境、被试特质水平等方面的差别都会成为测验结果不一致的原因。2.复本信度使用的条件（1）两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似。（2）两次测验的时间间隔要适当。局限：（1）复本法只能减少而不能排除练习和记忆效应。（2）对于许多测验来说要建立复本是非常困难的。

内部一致性系数（coefficientofinternalconsistency）将测验项目分成不同的样本，从而间接考虑信度。（三）分半信度（Split-halfreliability）1.含义与计算是指将一个测验分成对等的两半后，所有被试在这两半上得分的一致性。分半信度信度与等值性系数的解释一样，即可以把对等的两半测验看成是最短时距内施测的两个平行测验。分半信度描述的是两半题目间的一致性，所以也叫内部一致性系数。注意题目分半的方法：按题号奇偶性分半、按题目难度分半、按题目内容分半等。计算方法与复本信度类似，但被试在两半测验上得分的相关系数只是半个测验的信度，所以必须用斯皮尔曼—布朗公式加以校正：2.使用的前提条件和范围分半信度通常是在只能施测一次或没有复本的情况下使用。其中使用斯皮尔曼—布朗公式时要求全体被试在两半测验分数的变异数相等。当测验无法分成对等的两半时，无法使用。（四）同质性信度（Homogeneityreliability）1.含义同质性信度也叫内部一致性系数，它是测验内部所有题目间的一致性程度。这里的一致性有两种含义：一是所有题目都测的是同一种心理特质，二是所有题目得分之间都具有较高的正相关。同质性信度就是一个测验所测内容或特质的相同程度。实际上α系数是所有可能分半信度的平均值，但它是测验信度的一个下界值，即α系数值大，测量信度必然高，但α系数值小，却不能判断测量信度不高。例题：某态度量表共７道题目，100个被试在各题上得分的方差分别是0.81,0.82,0.80,0.86,0.88,0.79,0.89,测验总分的方差是26.00,计算该测量的信度。（五）评分者信度（Scorerreliability）1.含义与计算评分者信度指的是多个评分者给同一批人的答卷进行评分的一致性程度。对于主观试题，不同的评分者给出的分数是不等的，这样会造成误差，如何降低评分者信度是心理测量的重要任务之一。当评分者人数为2时，评分者信度等于两个评分者给同一批被试答卷所给分数的相关系数。如果是多个评分者，评分者信度采用肯德尔和谐系数进行估计。三、信度的作用（一）评价测验信度是测量过程中所存在的随机误差大小的反映。信度低，测量随机误差大，测量结果就会与真分数发生较大偏离。信度是衡量一个测验好坏的重要指标之一，测验的信度达到多少才可以接受呢？一般来讲，能力与成就测验的信度应该在0.90以上，人格测量信度系数应该在0.80以上。测量中的系统误差与信度无关。（二）解释分数1.解释个人测验分数的意义从理论上讲，一个人的真分数本来是用同一测验对他反复施测所得的平均值，其误差则是这些实测值的标准差。但实际上，这是做不到的。实际的做法是用一个团体（人数足够多）两次施测得结果来代替对同一个人的反复施测，以估计测量误差的变异数。此时每个人两次测量的分数之差构成一个新的分布，这个分布的标准差就是测量的标准误，它是此次测量中误差大小的客观指标，有了这一指标，就可以对团体中任何一个人的测验成绩做出恰当的解释。2．不同测验分数的比较四、影响测量信度的主要因素测量信度是测量过程中随机误差大小的反映，随机误差大，信度就低，随机误差小，信度就高。因此，在测量过程中凡是能引起测量随机误差的因素都会影响测量信度。影响信度的几种主要因素为：（一）被试方面就单个被试而言，其身心健康状况、应试动机、注意水平、作答态度等会影响测量信度。就团体而言，团体的异质程度与分数的分布密切相关，一个团体越是异质，其分数分布范围越大，计算出来的信度系数值越高，这样会高估真正的信度值。当团体内部水平相差不大（同质）时，其得分分布必然会狭窄，以相关为基础计算出来的信度值必然小，可能会低估真正的信度值。此外若团体的平均数太高或太低，同样使测验的总分分布变窄，低估测验的真正信度。（二）主试者方面就主试者而言，若不按指导手册中的规定施测，或故意制造紧张气氛，或给考生一定的暗示、协助等，测量信度会大大降低。就阅卷评分者而言，若评分标准掌握不一，或前后标准不统一，甚至随心所欲，则也会降低测量信度。（三）施测情境方面实施测验时，环境是否安静，光线和通风状况是否良好，所需设备是否齐全，桌面是否合乎要求等都可能影响到测量信度。（四）测量工具方面测量的取样、测验的长度、难度等是影响测量信度的主要因素或关键因素。一般来说，测验越长，信度值越高。这是因为：测验加长，能够改进项目取样的代表性，从而能够更好地反映受测者的真实水平。测验的项目越多，每个项目上得随机误差会相互抵消。测验太难或太容易，都会降低测验的信度。（五）两次施测之间的时间间隔计算重测信度、稳定性与等值性系数时，两次测验相隔时间越短，其信度值可能会越大；两次测验相隔时间越长，其信度值可能会越小。五、提高测量信度的常用方法（一）适当增加测验的长度增加新项目必须与原试卷中的所有项目同质，新增项目必须适度。（二）使测验中题目的难度接近正态分布，并控制在中等难度（三）努力提高测验试题的区分度（四）选取适当的被试团体（五）主试者严格按照要求去做考研对其的要求测量误差的定义；测量误差的来源及控制；测量误差的估计。信度的定义信度系数的估计；信度的影响因素与改进。信度与效度的关系。

第二节测量效度一、什么是效度（validity）（一）效度的概念效度是指一个测验或量表实际能测出其所要测的心理特质的程度。或者说实测结果与所要测查的结果的吻合或一致程度。例如：一个小学数学测验的成绩若同时受到数学能力和语文能力（读懂题意的能力）的影响，测试结果成绩低，就不能认为实际所要测的数学能力这一心理特质水平不高。关于效度应该注意以下几个方面：1.效度是一个相对的概念，其相对性表现在：（1）效度是相对于测量目的而言的。一个测验或量表是否有效主要看它是否达到了测量的目的。（2）心理特质是比较隐蔽的特性，心理测量不可能百分之百的准确，只能达到一定的准确度。2.效度是随机误差和系统误差的综合反映。3.判断一个测量是否有效要从多方面收集证据。

（二）效度的测量学定义二、效度与信度的关系三、效度的估计由于测量效度是就测量的结果达到测量目的的程度而言的，所以测量效度在很大程度上取决于人们对于测量目的的解释。效度的种类很多，分类方法也有所不同。目前被广泛采用的是弗兰士（J.W.French）和米希尔（B.Michel）提出的分类方法：他们将效度分为内容效度、结构效度（构想效度）和效标效度（实证效度）。（一）内容效度（contentvalidity）1.内容效度的含义及其应用的范围内容效度是指一个测验实际测到的内容与所要测的内容之间的吻合程度。估计一个测验的内容效度就是确定该测验在多大程度上代表了所要测量的心理特质。或者说内容效度就是测验的测题对测验内容范围的代表程度。一个测验要有好的内容效度必须满足以下两个条件：（1）确定好测验内容的范围，并使得测验的全部项目均在此范围内。（2）确定好行为样本及其不同行为样本项目的比例。2.确定内容效度的方法（1）专家判断的方法内容效度的确定方法主要是逻辑分析的方法。其工作思路是请专家对测验题目与原定内容范围的吻合程度作出判断。步骤如下：①明确测验目的及测验内容的范围②确定每个题目所测的内容，并与测验编制者所列的双向细目表对照③制订评定量表，考察题目对所定义的内容范围的覆盖率、判断题目难度与能力要求之间的差异等。（2）复本法（3）重测法（4）经验法3.内容效度的应用内容效度主要应用于成就测验以及职业选拔和分类测验。在这类测验中，测验内容是实际工作所需要的知识和技能。使用内容效度要注意与表面效度（surfacevalidity）的区别。表面效度是指一个测验在使用者和被试看来，直觉地认为它在测量什么，是否测到了测验所要测量的内容。表面效度不是效度。（二）结构效度（constructvalidity）1.结构效度的含义、特点与应用范围结构效度是指一个测验实际测到所要测量的理论结构和特质的程度，或者说测验分数能够说明测量的理论结构和特质的程度。结构效度有如下特点：

（1）结构效度首先取决于事先假定的心理特质的结构理论（2）当实际测量的资料无法证实事先的理论假设时，并不一定就表明该测验结构效度不高。（3）结构效度通过测量什么、不测量什么的证据积累起来给以确定的，因而不可能有单一的数量指标来描述结构效度。结构效度主要应用于智力测验、人格测验等一些心理测验方面。2.结构效度的确定确定结构效度的基本程序第一，对所研究的心理特质的结构进行界定第二，依据理论框架，提出可能的假设第三，收集数据，验证假设确定结构效度的具体方法

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

误差测量的信度与效度第二讲

文档简介

温馨提示

最新文档

评论

误差测量的信度与效度第二讲

文档简介

温馨提示

最新文档

评论

相关文档