




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三节第三节 测验的信度测验的信度第一单元 信度的概念第二单元 信度评估的方法第三单元 信度与测验分数的解释第四单元 影响信度的因素2一、信度的定义一、信度的定义n信度是指信度是指同一受测者同一受测者者在者在不同时间不同时间内用内用同一测验同一测验重复测量,所得重复测量,所得结果的一致程度结果的一致程度。即测量的。即测量的可靠可靠性性或或一致性一致性,多次测量结果保持一致。,多次测量结果保持一致。n信度是一组测量分数的特性,不是某个测量分数信度是一组测量分数的特性,不是某个测量分数的特性。是对一个人测量多次或对一个群体进行的特性。是对一个人测量多次或对一个群体进行测量得到一组测量分数的特性。测
2、量得到一组测量分数的特性。3信度与随机误差信度与随机误差 随机误差越大,信度越低。随机误差越大,信度越低。 信度亦可视为测验结果受机遇影响的程度。信度亦可视为测验结果受机遇影响的程度。 系统误差产生恒定效应,不影响信度。系统误差产生恒定效应,不影响信度。二、信度的指标二、信度的指标n1 1、信度系数与信度指数、信度系数与信度指数n信度系数:同一受测者样本所得的两组资料的信度系数:同一受测者样本所得的两组资料的相关。相关。 n信度指数:信度系数的平方根。信度指数:信度系数的平方根。n2 2、测量标准误、测量标准误 n式中式中SESE表示测量的标准误,表示测量的标准误,S Sx x表示一次测量分表
3、示一次测量分数的标准差;数的标准差;r rxxxx表示信度系数。标准误与信度表示信度系数。标准误与信度互为消长。互为消长。xxxrSSE15第二单元第二单元 信度评估的方法信度评估的方法n(一)重测信度(一)重测信度n(二)复本信度(二)复本信度n(三)内部一致性信度(三)内部一致性信度n(四)评分者信度(四)评分者信度6(一)重测信度(一)重测信度n1 1、定义:又称、定义:又称稳定性系数稳定性系数。用同一个测验,。用同一个测验,在同样条件下对同一组受测者前后施测两次,在同样条件下对同一组受测者前后施测两次,求两次得分间的相关系数。求两次得分间的相关系数。一段时距一段时距测验再测验测验再测验
4、重测信度的注意问题重测信度的注意问题n优点:提供有关测验是否随时间而变化的资料,可作为受优点:提供有关测验是否随时间而变化的资料,可作为受测者将来行为表现的依据。测者将来行为表现的依据。n缺点:缺点:易受练习和记忆的影响易受练习和记忆的影响,两次测试的时间间隔要适,两次测试的时间间隔要适当,一般是当,一般是2 24 4周周较宜,间隔时间较宜,间隔时间最好不超过最好不超过6 6个月个月。8(二)复本信度(二)复本信度n定义:定义:又称又称等值性系数等值性系数,是以两个等值但题目不,是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得受同的测验(复本)来测量同一群体,然后求得受测者在两个测
5、验上得分的相关系数。测者在两个测验上得分的相关系数。 n方法:为排除施测顺序的影响,在实施时,可方法:为排除施测顺序的影响,在实施时,可将受测者先分为两组,一组人先作将受测者先分为两组,一组人先作A A本再作本再作B B本;本;另一组人则反之。另一组人则反之。测验复本测验复本A测验复本测验复本B最短时距最短时距n复本信度也要考虑两个等值测验实施的时间间隔。复本信度也要考虑两个等值测验实施的时间间隔。如果两个复本的施测间隔一段时间,则称如果两个复本的施测间隔一段时间,则称重测复重测复本信度本信度或或稳定与等值系数稳定与等值系数。n稳定与等值系数既考虑测验在时间上的稳定性,稳定与等值系数既考虑测验
6、在时间上的稳定性,又考虑了不同题目样本反应的一致性,是更严格又考虑了不同题目样本反应的一致性,是更严格的信度考察方法,应用较为广泛。的信度考察方法,应用较为广泛。一段时距一段时距测验测验A 测验测验B复本信度的注意问题复本信度的注意问题n优点:能够避免重测信度的一些问题,如记忆效果、学习优点:能够避免重测信度的一些问题,如记忆效果、学习效应等。效应等。n局限性:局限性: (1 1)复本信度只能减少而)复本信度只能减少而不能完全消除练习不能完全消除练习的影响。的影响。 (2 2)解题原则很容易)解题原则很容易迁移迁移到复本中的同类问题中,到复本中的同类问题中,从而影响复本信度。从而影响复本信度。
7、 (3 3)对于许多测验来说,对于许多测验来说,建立复本是相当困难建立复本是相当困难的,的,如人格、动机等,则不易找到等值的测题如人格、动机等,则不易找到等值的测题 。 11(三)内部一致性信度(三)内部一致性信度定义:定义: 反映的是反映的是题目之间的关系题目之间的关系,表示测验能够测量相同内容或特质的程度。,表示测验能够测量相同内容或特质的程度。 (1)(1)分半信度分半信度 (2)(2)同质性信度同质性信度n分半信度分半信度: :n采用分半法估计所得的信度系数。只需实施一次采用分半法估计所得的信度系数。只需实施一次测验。常见的方法是把一个测验按题目编号分为测验。常见的方法是把一个测验按题
8、目编号分为两半,一半是奇数题,另一半是偶数题,计算每两半,一半是奇数题,另一半是偶数题,计算每位受测者奇数题得分和偶数题得分,然后求出这位受测者奇数题得分和偶数题得分,然后求出这两半得分的相关系数,这个相关系数就代表了两两半得分的相关系数,这个相关系数就代表了两半测验内容取样的一致程度,因而叫做内部一致半测验内容取样的一致程度,因而叫做内部一致性信度系数。性信度系数。n这个系数往往低估整个测验的信度,还需利用一这个系数往往低估整个测验的信度,还需利用一些公式对相关系数进行校正,借以估计整个测验些公式对相关系数进行校正,借以估计整个测验的信度。的信度。 n同质性信度:同质性信度: 代表测验内部所
9、有题目间的一致性。代表测验内部所有题目间的一致性。n对于一些复杂的、异质的心理学变量,常常采用对于一些复杂的、异质的心理学变量,常常采用若干相对异质的分测验,使每个分测验内部具有若干相对异质的分测验,使每个分测验内部具有同质性。同质性。14(四)评分者信度(四)评分者信度n评分者信度:用于测量评分者信度:用于测量不同评分者之间不同评分者之间所产生的所产生的误差。随机抽取部分试卷,由两位评分者按评分误差。随机抽取部分试卷,由两位评分者按评分标准分别打分,然后求其间的相关,所得的相关标准分别打分,然后求其间的相关,所得的相关系数即为评分者信度。系数即为评分者信度。n一般要求在成对的受过训练的评分者
10、之间平均一一般要求在成对的受过训练的评分者之间平均一致性达致性达0.900.90以上,才认为评分是客观的。以上,才认为评分是客观的。n当多个评分者评定多个对象,并以等级法记分时,当多个评分者评定多个对象,并以等级法记分时,可采用特定公式估计评分者信度。可采用特定公式估计评分者信度。总结:总结:n再测信度:估计测验跨时间的一致性再测信度:估计测验跨时间的一致性n复本信度:估计测验跨形式的一致性复本信度:估计测验跨形式的一致性n等值稳定性系数:估计测验跨时间和形式的一致等值稳定性系数:估计测验跨时间和形式的一致性性n内部一致性系数:估计测验跨项目或两个分半测内部一致性系数:估计测验跨项目或两个分半
11、测验之间的一致性验之间的一致性n评分者信度:估计测验跨评分者的一致性评分者信度:估计测验跨评分者的一致性n有多少误差的来源,就有多少估计信度的方法。有多少误差的来源,就有多少估计信度的方法。在考察测验的信度时,应根据情况采用不同的信在考察测验的信度时,应根据情况采用不同的信度指标,原则上一种测验哪种误差大,便采用哪度指标,原则上一种测验哪种误差大,便采用哪种误差估计。种误差估计。16第三单元第三单元 信度与测验分数的解释信度与测验分数的解释n一、解释真实分数与实得分数的相关一、解释真实分数与实得分数的相关n二、确定信度可以接受的水平二、确定信度可以接受的水平n三、解释个人分数的意义三、解释个人
12、分数的意义n四、比较不同测验分数的差异四、比较不同测验分数的差异一、解释真实分数与实得分数的相关一、解释真实分数与实得分数的相关n信度系数解释为总的方差中有多少比例是由真实信度系数解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。数造成的变异占百分之几。n当当r=0.90r=0.90时,表示实得分数中有时,表示实得分数中有90%90%的变异是真分的变异是真分数造成的,仅数造成的,仅10%10%是来自测验的误差。是来自测验的误差。n极端情况下:极端情况下: r=1.00r=1.00, r=0.00 r=0
13、.00,n注意:信度系数的分布是从注意:信度系数的分布是从0.000.00到到1.001.00的正数范的正数范围,代表了从缺乏信度到完全可信的所有状况。围,代表了从缺乏信度到完全可信的所有状况。表示完全没有测量误差表示完全没有测量误差表示所有变异和差别都反映的是测量误差表示所有变异和差别都反映的是测量误差二.确定可以接受的水平n信度系数是衡量测验好坏的一个重要的技术指标。信度系数是衡量测验好坏的一个重要的技术指标。 n一般能力与成就测验的信度系数为一般能力与成就测验的信度系数为0.900.90以上,有的以上,有的可以达到可以达到0.950.95;人格、兴趣、态度、价值观等测验;人格、兴趣、态度
14、、价值观等测验的信度系数,通常在的信度系数,通常在0.800.800.850.85或更高一些。或更高一些。 n一般原则:一般原则: 当当r0.70r0.70时,测验不可靠不能用;时,测验不可靠不能用; 当当0.700.70r0.85r0.85时,可用于团体比较时,可用于团体比较 当当r r0.850.85时,可用来鉴别或预测个人成绩或作时,可用来鉴别或预测个人成绩或作为为n另一原则:另一原则: 新编测验信度应高于原有的同类测验或相似测验。新编测验信度应高于原有的同类测验或相似测验。测验类型测验类型 信度信度低低中中高高成套成就测验成套成就测验0.660.920.98学术能力测验学术能力测验0.
15、560.900.97成套倾向性测验成套倾向性测验0.260.880.96客观人格测验客观人格测验0.460.850.97兴趣测量兴趣测量0.420.840.93态度测量态度测量0.470.790.98三.解释个人分数的意义n利用测量的标准误,可以解释个人分数的意义。利用测量的标准误,可以解释个人分数的意义。n体现在:体现在:1 1、估计真实分数的范围,、估计真实分数的范围, 2 2、了解实得分数再测时可能的变化情形。、了解实得分数再测时可能的变化情形。n计算公式为:计算公式为: X X1.96SE 1.96SE T T X X1.96 SE 1.96 SE (.05.05) X X2.58SE
16、 2.58SE T T X X2.58 SE 2.58 SE (.01.01) n式中式中SESE表示测量的标准误,表示测量的标准误,S Sx x表示一次测量分数表示一次测量分数的标准差;的标准差;r rxxxx表示信度系数。表示信度系数。xxxrSSE1n假设在一个智力测验中,某个受测者的假设在一个智力测验中,某个受测者的IQIQ为为100100,这是否,这是否反映了他的真实水平?如果再测一次他的分数将改变多少?反映了他的真实水平?如果再测一次他的分数将改变多少?已知该智力测验的标准差为已知该智力测验的标准差为1515,信度系数为,信度系数为0.840.84。 解:解: SE=15 (1-0
17、.84)1/2=6.0 1001.96 6=88 100+1.96 6=112我们可以说受测者的真实我们可以说受测者的真实IQ有有95的可能性落在的可能性落在88和和112之间。之间。 四、比较不同测验分数的差异n这种比较包括两个人不同分数的差别和同一个人这种比较包括两个人不同分数的差别和同一个人在两个测验上的差别。在两个测验上的差别。n利用利用差异分数的标准误差异分数的标准误:n 为差异的标准误,为差异的标准误,S S代表两个测验的标准差,代表两个测验的标准差,这个标准差必须相同。这个标准差必须相同。 、 分别为两个测分别为两个测验的信度系数。验的信度系数。n两个分数的差异与两个分数的差异与
18、1.961.96SESEd d(0.050.05显著性水平)进显著性水平)进行比较,如果其绝对值大于此值,则差异显著,行比较,如果其绝对值大于此值,则差异显著,否则差异不显著。否则差异不显著。yyxxdrrSSESESE22221dSExxryyrn某受测者在韦氏成人智力测验中言语智商为某受测者在韦氏成人智力测验中言语智商为102102,操作智商为操作智商为110110。已知两个分数都是以。已知两个分数都是以100100为平均为平均数、以数、以1515为标准差的标准分数。假设言语测验和为标准差的标准分数。假设言语测验和操作测验的分半信度分别为操作测验的分半信度分别为0.870.87和和0.88
19、0.88。问其操。问其操作智商是否显著高于言语智商?作智商是否显著高于言语智商?SEd=15SEd=15(2(20.87 0.87 0.88)0.88)1/21/2=7.5=7.5统计上,要求两个分数的差异程度达到统计上,要求两个分数的差异程度达到0.050.05的显著水平,的显著水平,才能认为不是误差的影响。才能认为不是误差的影响。7.57.51.96=14.71.96=14.7110110102=8102=814.714.7所以不能认为其操作智商显著高于言语智商。所以不能认为其操作智商显著高于言语智商。第四单元第四单元 影响信度的因素影响信度的因素n一、样本特征一、样本特征n二、测验长度二
20、、测验长度n三、测验难度三、测验难度n四、时间间隔四、时间间隔一、样本特征n1 1、样本团体异质性的影响样本团体异质性的影响 团体的分数范围与异质程度有关,一个团体越是异团体的分数范围与异质程度有关,一个团体越是异质,其分数分布的范围越广,信度系数就越大。反之也然。质,其分数分布的范围越广,信度系数就越大。反之也然。 这是因为,在同质团体中,受测者水平比较接近,这是因为,在同质团体中,受测者水平比较接近,两次测验成绩差异主要受随机因素的影响,这次可能是甲两次测验成绩差异主要受随机因素的影响,这次可能是甲高于乙,下次可能是乙高于甲,变化受随机因素的影响,高于乙,下次可能是乙高于甲,变化受随机因素
21、的影响,没有规律性,因此相关很低。没有规律性,因此相关很低。n2 2、样本团体平均能力、样本团体平均能力 不同水平的团体,题目具有不同的难度,每个题不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。目在难度上的微小差异累计起来便会影响信度。二、测验长度的影响n测验的长度,即题目的数量,也是影响信度系数测验的长度,即题目的数量,也是影响信度系数的一个因素。题目数量越多,信度越高。的一个因素。题目数量越多,信度越高。 n测验越长,测题取样或内容取样就越有代表性。测验越长,测题取样或内容取样就越有代表性。n测验越长,受测者的猜测因素影响就越小。测验越长,受测者的猜测
22、因素影响就越小。n注意:注意: 增加测验长度的效果应遵循报酬递减率原则,测增加测验长度的效果应遵循报酬递减率原则,测验过长是得不偿失的,有时会引起受测者疲劳和验过长是得不偿失的,有时会引起受测者疲劳和反感从而降低可靠性。反感从而降低可靠性。三、测验的难度三、测验的难度n难度对信度的影响,只存在于智力测验、成就测难度对信度的影响,只存在于智力测验、成就测验、能力倾向测验等,对人格测验、兴趣测验、验、能力倾向测验等,对人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题态度量表等不存在难度问题,因为这些测验的题目不存在正误之分。目不存在正误之分。n如果测验太难或太易,分数范围就会缩小,从
23、而如果测验太难或太易,分数范围就会缩小,从而使信度降低。使信度降低。n在实际情况中,如果某个测验使用范围很广,难在实际情况中,如果某个测验使用范围很广,难度水平通常只适用于中等能力水平的受测者,而度水平通常只适用于中等能力水平的受测者,而对较高水平和较低水平的受测者可能较易或较难,对较高水平和较低水平的受测者可能较易或较难,使得分数分布范围缩小,信度降低。因此,一个使得分数分布范围缩小,信度降低。因此,一个标准化的测验,应根据不同能力水平报告测验的标准化的测验,应根据不同能力水平报告测验的难度,以作为选择测验的参考。难度,以作为选择测验的参考。四、时间间隔四、时间间隔 时间间隔只对重测信度和重
24、测复本信度有影响,时间间隔只对重测信度和重测复本信度有影响,以再测法或复本法求信度,时间间隔越短,其信以再测法或复本法求信度,时间间隔越短,其信度系数越大;间隔时间越久,其他变因介入的可度系数越大;间隔时间越久,其他变因介入的可能性越大,受外界影响也越大,信度系数便越低。能性越大,受外界影响也越大,信度系数便越低。复习题:复习题:1.1.根据一组受测者在()测验上的得分计算的相根据一组受测者在()测验上的得分计算的相关系数即为复本信度。关系数即为复本信度。2.2.各种估计信度的方法都是对测验的一致性进行各种估计信度的方法都是对测验的一致性进行估计,但由于误差来源不同,它们研究的侧面各估计,但由于误差来源不同,它们研究的侧面各不相同,说明的是信度的不同方面。其中,再测不相同,说明的是信度的不同方面。其中,再测信度可用来估计(),复本信度可用来估计(),信度可用来估计(),复本信度可用来估计(),等值稳定性系
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 购物中心特色海鲜市场行业跨境出海项目商业计划书
- 农业工程AI智能应用行业跨境出海项目商业计划书
- 历史与文化之旅行业深度调研及发展项目商业计划书
- 休闲车自驾游户外生存装备创新创业项目商业计划书
- 神经外科手术器械套装行业深度调研及发展项目商业计划书
- 调味品公众号营销运营计划
- 幼儿园家长会环保主题活动发言稿范文
- 大班健康课件-自己洗澡
- 铝膜包装印刷施工质量缺陷及解决措施
- 人教部编版小学六年级语文上册教师培训计划
- 福建省公路水运工程试验检测费用参考指标
- 暑假初二升初三数学衔接班精品教材
- 故障录波四步分析法讲解
- 安装定额管件含量表
- 风力发电机组主传动链滚动轴承运行状态评估结果和措施、定期维护项目及要求、基于评估结果备件计划
- 易经全文注音(修订版)
- 库板安装工艺
- 重庆市地名命名更名报批意见表
- 电气防火安全检测技术导则
- 抗生素降阶梯疗法
- 港口基础设施设备介绍资料讲解
评论
0/150
提交评论