心理咨询师三级第3节测验的信度_第1页
心理咨询师三级第3节测验的信度_第2页
心理咨询师三级第3节测验的信度_第3页
心理咨询师三级第3节测验的信度_第4页
心理咨询师三级第3节测验的信度_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、w信度概念信度概念w信度的评估方法信度的评估方法w信度与测验分数的解释信度与测验分数的解释w影响信度的因素影响信度的因素成熟成熟标志标志20世纪世纪50年代年代古利科逊古利科逊心理测验理论心理测验理论三大三大支柱支柱基本假设基本假设信度信度效度效度第一单元第一单元 信度的概念信度的概念一、经典测验理论一、经典测验理论w Classical Test Theory(CTT)(一)测量误差(一)测量误差1、定义、定义与测量目的无关与测量目的无关不准确不准确测量测量效应效应测量测量因素因素测量测量结果结果或不一致或不一致测验真值2、误差的种类、误差的种类 系统误差系统误差随机误差随机误差随机误差与系

2、统误差的比较随机误差与系统误差的比较类型类型产生原因产生原因结果表现结果表现(结果不一致)(结果不一致)特特 点点指指标标同同异异随机随机误差误差偶然因素偶然因素不易控制不易控制方向和大小上方向和大小上完全随机完全随机稳稳定定性性准准确确性性信信度度系统系统误差误差因素因素恒定、规律恒定、规律稳定地存在于每稳定地存在于每次测量中次测量中 正正确确性性效效度度3、误差来源、误差来源三层面模式三层面模式测量测量工具工具测试对象测试对象施测施测过程过程(二)基本假设与真分数(二)基本假设与真分数1、分数、分数观测观测分数分数误差误差分数分数真真分数分数测验所得测验所得未加工未加工无误差无误差理论上理

3、论上真正特质水平真正特质水平操作上操作上多个平等测验的平均数多个平等测验的平均数2、基本假设、基本假设w 例例2-1:某一物理测量结果(单位:微):某一物理测量结果(单位:微)物质编号物质编号 实测重量实测重量X 真正重量真正重量T 误误 差差E A 12 10 2 B 19 20 1 C 27 30 3 D 41 40 1 E 51 50 1 150 150 0 S 203.2 200 3.2SE 1.8M 30 30 0定义定义T与与X关系关系数学模型数学模型X = T ET = X E222ETXSSS二、信度的概念二、信度的概念S2T, S2E , S2X的关系与信度的关系与信度S2X

4、S2X S2T S2E S2T S2ESX2测验实得分数的方差;测验实得分数的方差; SE2为测验误差的方差,为测验误差的方差,ST2为测验真分数的方差。为测验真分数的方差。(一)信度的定义(一)信度的定义222XTTXSSr1、理论定义、理论定义真分数方差与观测分数方差的比值真分数方差与观测分数方差的比值2221XETXSSr或或EXT222EXTSSS2222XEXTXSSSr222TXXTrSS2、操作定义、操作定义两组测验分数之间的相关系数两组测验分数之间的相关系数测量工具或结果的一致性(稳定性)程度测量工具或结果的一致性(稳定性)程度XXTXrr23、rXX值与测验误差的关系值与测验

5、误差的关系r=0.50r=0.75r=0.90S2ESTSTSTSESE(二)信度的指标(二)信度的指标1、信度系数与信度指数、信度系数与信度指数XTXTTXSSSSr22同一群人同一群人几次测验结果几次测验结果一致性一致性信度系数的信度系数的平方根平方根22XTSSXXr2TXrw 缘由:缘由:rXXn只反映只反映X与与T的符合程度的符合程度n未反映个体测验分数的变异未反映个体测验分数的变异2、测验标准误(二级)、测验标准误(二级)w 测验中个体真分数的指标测验中个体真分数的指标n理论上:一个个体多次测验结果分布的变异理论上:一个个体多次测验结果分布的变异n实际上:一组个体两次测验结果分布的

6、变异实际上:一组个体两次测验结果分布的变异w 测量标准误测量标准误n测量误差分数分布的标准差测量误差分数分布的标准差w 用途用途n衡量测量值(衡量测量值(X)与测量对象真值(与测量对象真值(T)的的偏离程度的一种指标偏离程度的一种指标n用来估计个人的真分数用来估计个人的真分数w 个人分数的误差个人分数的误差n个体测验分数个体测验分数重测时重测时的的变化变化w 公式公式XXXErSSE1实得分数实得分数标准差标准差w 个人分数的误差个人分数的误差n rXX越大:变化的可能性越小越大:变化的可能性越小n rXX = 1:完全不变化完全不变化第二单元第二单元 信度评估的方法信度评估的方法信度信度重测

7、信度重测信度复本信度复本信度内部一致性内部一致性信度信度评分者信度评分者信度分半信度分半信度 同质性信度同质性信度重测复本信度重测复本信度不同的信度反映测验误差的不同来源。不同的信度反映测验误差的不同来源。一、重测信度一、重测信度含义含义同一测验同一测验同组对象同组对象前后测前后测2次次相关系数相关系数稳定稳定性性程序程序误差误差时间时间太短太短练习效应练习效应记忆效应记忆效应A卷卷一一定定时时距距A卷卷太长太长身心变化身心变化2-4周为宜周为宜不超过不超过6个月个月 优点优点省力、省时省力、省时测量属性相同测量属性相同提供随时间变化的资料提供随时间变化的资料 不足不足适用范围适用范围异质性异

8、质性运动技能运动技能速度速度时间间隔长短时间间隔长短评价评价二、复本信度二、复本信度含义含义两等值测验两等值测验最短时间内最短时间内对同组对象对同组对象施测结果施测结果r等值等值性性程序程序误差误差内容内容取样取样A卷卷最最短短时时距距B卷卷 优点优点代表性增强,信度更准代表性增强,信度更准避免练习、记忆效应避免练习、记忆效应 不足不足编制复本难编制复本难影响积极性影响积极性触类旁通触类旁通评价评价重测复本信度重测复本信度(二级)(二级)含义含义两等值测验两等值测验一定时间内一定时间内对同组对象对同组对象施测结果施测结果r等值性等值性稳定性稳定性程序程序误差误差内容取样内容取样时间时间A卷卷一

9、一定定时时距距B卷卷重测信度与复本信度有何异同?重测信度与复本信度有何异同?重测复本信度与重测、复本信度重测复本信度与重测、复本信度谁得估计更严格,为何?谁得估计更严格,为何?小结与问题小结与问题跨时间跨时间一致性一致性跨形式跨形式一致性一致性试题之间试题之间有何关系有何关系三、内部一致性信度三、内部一致性信度含义含义测验测验各题间各题间一致性一致性题目题目一致一致性性所有题目间所有题目间的一致性的一致性分半分半信度信度类型类型两半测验两半测验内容取样内容取样同质性同质性信度信度(一)分半信度(一)分半信度1、分半条件与程序、分半条件与程序分半分半方法方法奇偶题奇偶题分半分半分析分析程序程序两

10、半相关:两半相关:rhh校校 正:正:rnn难易:低难易:低高高分半分半条件条件两半相似:两半相似:M、S项目组间相关项目组间相关分布形态分布形态内容内容2、校正方法(二级)、校正方法(二级)斯皮尔曼斯皮尔曼-布朗公式布朗公式方差相等时方差相等时弗拉南根公式弗拉南根公式卢尤公式卢尤公式方差不等时方差不等时hhhhnnrrr12(二)同质信度(二)同质信度题目间的内部一致性题目间的内部一致性类型类型库库-理信度理信度克龙巴赫克龙巴赫 系数系数0、1题型题型K-R20难度不同难度不同k-R21难度相近难度相近各类各类题型题型(二级)(二级)四、评分者信度四、评分者信度(一)含义与方法(一)含义与方

11、法含义含义评分者评分的一致性评分者评分的一致性0.9以上,以上,才认为是客观的才认为是客观的。方法方法2评分者评分者2个以上者个以上者rXYr肯德尔和谐系数肯德尔和谐系数(二)(二)肯德尔和谐系数(肯德尔和谐系数(二级)二级)K个评价者评个评价者评N个被评者或作品个被评者或作品应用范围和应用范围和W系数系数应用应用1个评价者先后个评价者先后K次评次评N个被评者或作品个被评者或作品W范围范围01第三单元第三单元 信度与测验分数的解释信度与测验分数的解释w 真分数与实得分数相关的解释真分数与实得分数相关的解释n信度系数和信度指数信度系数和信度指数n测量标准误测量标准误w 信度的评价信度的评价直接解

12、释直接解释一、真分数与实得分数相关的解释一、真分数与实得分数相关的解释rXX间接解释间接解释信度系数信度系数决定系数决定系数 r2XT = ST/SX =rXX rXX为各方差的百分比为各方差的百分比S2X分为分为各各S2E和和S2T误差源不同误差源不同信度估计法不同信度估计法不同rXX=0.90(一)信度系数和指数(一)信度系数和指数w 用途用途n衡量测量值(衡量测量值(X)与测量对象真值()与测量对象真值(T)的偏离程度的一)的偏离程度的一种指标种指标n用来估计个人的真分数用来估计个人的真分数w 信度系数可以解释为总的方差中有多少比例是由真信度系数可以解释为总的方差中有多少比例是由真实分数

13、的方差决定的。范围在实分数的方差决定的。范围在0-1之间。之间。n rXX=0:所有变异和差别都反映的是测量误差:所有变异和差别都反映的是测量误差n rXX = 1:完全没有测量误差,所有变异均来自真实分数:完全没有测量误差,所有变异均来自真实分数二、确定信度可接受水平二、确定信度可接受水平测验类型测验类型最低标准最低标准标准化测验标准化测验人格测验等人格测验等 非标准化测验非标准化测验0.900.80-0.850.60-0.85w 典型测验的一般标准典型测验的一般标准低于低于0.700.70时,不能对个人作出预测或评价;时,不能对个人作出预测或评价;在在0.70-0.850.70-0.85之

14、间,可用于团体比较;之间,可用于团体比较;高于等于高于等于0.850.85,才能用来鉴别或预测个人成绩,才能用来鉴别或预测个人成绩w 典型测验的信度高低水平典型测验的信度高低水平测验类型测验类型 低低 中中 高高成套成就测验成套成就测验 学术能力测验学术能力测验 成套倾向性测验成套倾向性测验 客观人格测验客观人格测验 兴趣问卷兴趣问卷 态度量表态度量表.66 .92 .98.56 .90 .97.26 .88 .96.46 .85 .97.42 .84 .93.47 .79 .98三、解释个人分数的意义三、解释个人分数的意义w 公式公式个体真分数估计(二级)个体真分数估计(二级)XXXerSS

15、E1eSEXT96. 1例如:某班一次标准化成就测验例如:某班一次标准化成就测验(rxx=0.80)中的)中的SE为为5,某生的测验,某生的测验分分80。试问该生测验的真分数是多少?。试问该生测验的真分数是多少?置信度置信度D=.95置信区间置信区间05.8 .892 .70596. 180eSEXT96. 1分析结果分析结果 表表2-9 某生测验真分数的信度区间某生测验真分数的信度区间SEe数目数目 置信水平置信水平 置置 信信 区区 间间 1 68.26 805(7585) 2 95.45 8010(7090) 3 99.93 8015(8595) 1.96 95 809.8(70.289

16、.8) 2.58 99 8012.9(67.192.9) 四、比较不同测验分数的差异四、比较不同测验分数的差异(二级)(二级) 例如,某生在韦氏成人智测中,例如,某生在韦氏成人智测中,语言语言IQ为为102,操作,操作IQ为为106。且知言语。且知言语与操作的分半信度各为与操作的分半信度各为0.96和和0.93。问该。问该生操作能力是否显著优于言语能力?生操作能力是否显著优于言语能力?212XXXXdrrSSE97. 493. 096. 0215dSE分析结果分析结果w 结论结论n差异未达差异未达1个标准误个标准误n操作操作IQ并不高于语言并不高于语言IQw 差异显著性:差异显著性:n n本例

17、本例:96. 1,05. 0Z(106-102=4)74. 996. 197. 4第四单元第四单元 影响信度的因素影响信度的因素w样本特征样本特征w测验长度测验长度w测验难度测验难度w时间间隔时间间隔 w 特点特点n样本越异质,分数分布越广,样本越异质,分数分布越广,S,r ,测验,测验越可靠越可靠 一、样本特征一、样本特征(一)样本团体异质性的影响(一)样本团体异质性的影响w 分析分析n信度信度n相关相关n散布图散布图n计算计算散布图散布图整段范围整段范围低低高高 (二)样本团体平均能力水平的影响(二)样本团体平均能力水平的影响 例如,例如,SB量表,不同年龄和难度水量表,不同年龄和难度水平

18、信度值从平信度值从0.830.98。显然,每个信度都显然,每个信度都要求对建立信度的团体进行描述。要求对建立信度的团体进行描述。w 选择测验时应注意选择测验时应注意n取样团体的变异性和能力水平取样团体的变异性和能力水平n建立信度的团体与欲测团体是否一致建立信度的团体与欲测团体是否一致w 趋势趋势n分别对非常同质团体建立标准化样本。分别对非常同质团体建立标准化样本。n考虑年龄、性别、年级、职业和相似性等,考虑年龄、性别、年级、职业和相似性等,选择适合其所在测验团体性质的信度系数和选择适合其所在测验团体性质的信度系数和测验。测验。二、测验长度二、测验长度w 含义含义n测验试题的数量测验试题的数量

19、w 特点特点n测验越长,试题取样越恰当,测验越长,试题取样越恰当,n测验越长,猜测性越小测验越长,猜测性越小XXXXnnrkkrr11w 长度与信度的关系长度与信度的关系 (二级二级) nnXXXXnnrrrrk11 例例2-16:某测验有:某测验有40题,信度题,信度0.65,若增至若增至120题,信度会是多少?题,信度会是多少? 例例2-17:某测验有:某测验有30题,信度题,信度0.75,试问要达到多少题才能使信度达到试问要达到多少题才能使信度达到0.90?82. 0nnr90, 3nkw 一般趋势一般趋势n难度分布越广,信度越高难度分布越广,信度越高w 难度与题型难度与题型n简答题:简答题:P=0.5时,时,X为为0100,信度最高。,信度最高。n选择题的理想难度选择题的理想难度 (二级)(二级) 三、测验难度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论