《心理测量》测量的信度(61P).ppt_第1页
《心理测量》测量的信度(61P).ppt_第2页
《心理测量》测量的信度(61P).ppt_第3页
《心理测量》测量的信度(61P).ppt_第4页
《心理测量》测量的信度(61P).ppt_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、测量的信度,案例一,有一个体操运动员参加跳马比赛,第一次跳了8.9分,转播席上的嘉宾评论员说这不是他真实的水平,他的真实水平应该在9.5分以上。果然第二次他跳出了9.9分。如果没有嘉宾的点评,你认为哪次成绩是该运动员的真实水平?,案例二,王先生去应聘某公司的经理岗位,考官拿出一个企业忠诚度测验让王先生答卷,经评估后得出结论,王先生忠诚度不够。结果王先生不服,要求重新答一次,结果正好相反。,案例三,小明学习成绩一直很差,他找张老师咨询,张老师找了一个智力测验让他做,结果还不错,智商有120。母亲觉得不可思议,这么高的智商为什么学习成绩那么差呢,于是她带着小明去了一家咨询机构,那里的咨询师拿出了同

2、样一个智力测验让小明做,结果算出来智商只有88。哪一次的结果是可信的。,第一节 信度概述,定义:测验结果一致性的判断 (一个测验可靠性和稳定性的指标) 一个好的测验在多次测量同一个人的时候结果应该是基本一致的.,真分数理论,在实测分数中真分数所占的比率 实测分数=真分数+误差 (X = T + E),公式,105.0 r = - = 0.87 120.2,真分数理论的三个假设,误差分数的平均数是零 (因为误差是随机的) 误差分数与真分数相互独立,没有任何相关 (如果有相关,那误差就不成为误差了) 两次测量的误差分数之间的相关为零 (因为误差是随机的,所以测量之间没有必然的联系),测量分数、真分

3、数和误差分数的分布假设,学生 测量分数 = 真分数 + 误差分数 A 3 5 -2 B 17 15 +2 C 16 20 -4 D 23 25 -2 E 27 25 +2 F 25 25 0 G 35 25 +10 H 26 30 -4 I 33 35 -2 J 45 45 0 总数 250 250 0 平均数 25.0 25.0 0 方差 120.2 105.0 15.2 标准差 10.9 10.2 3.9,测量分数=真分数+误差分数 误差之和为零 测量分数的平均数=真分数的平均数 测量分数的方差等于真分数的方差与误差方差之和(但标准差并没有如此之关系),因为每一次测量结果中都可能有误差的存

4、在,所以一次测量不一定能准确反映真实的情况,而多次测量可以弥补这一不足,因为误差是随机出现的,所以理论上可以用多次测量结果的平均数来代表真分数,而每一次测量分数与平均数的离差就是误差。一个测验结果的离散度越小说明误差也就越小。,真正在心理测量中真分数是不可能直接获得的。可行的是探查一个测验的误差有多大,然后通过用测验分数与误差分数相减来求取真分数。,信度是真分数与实测分数相关的平方,用相关系数来表示.相关系数越大说明真分数在实测分数中的比率越大,也就说明信度越高.,第二节 误差及误差的来源,定义:与测量目的无关的因素造成了测 验结果的 不一致或不准确 种类: 1 随机误差: 方向和大小完全是随

5、机 的,没有规律性 2 系统误差: 稳定地存在于每一次测 量中,有规律可循 3 抽样误差:由抽样变动而引起的,误差来源,1 .测验内部引起 1)题目取样误差 2)题目用词模棱两可 3)题目太难 4)规定的测验时间太短 5)题型的原因,2 测验过程引起的 1)物理环境 2)主试方面 3)意外干扰 4)计分,3 被试引起的 1)动机 2)焦虑 3)练习 4)经验 5)生理因素,第三节 估计信度的方法,一 、稳定系数 (重测信度)(跨时间的一致性) 对同一个测验前后做两次,然后计算两次测 验结果的一致性。 公式:,统计值,公式二,采用重测信度需注意之处,两次测验的时间应该是合理的,即既不能太长又不能

6、太短。 相隔太长的时间被试在所测量的特征上可能会发生变化,相隔太短有记忆的效应。,重测信度的使用局限性,1.被试在这期间自身发生了变化 2.第一次测验的经验对第二次测验产生影响 (如第一次测验产生了焦虑就会影响第二次测验) 3. 记忆的作用 4.耗时耗精力,被试不好找,二 等值系数 (复本信度) (跨形式的一致性),一个测验有A,B两个版本,对一组被试测试, 求取两个测验结果的一致性,两个版本连续施测称为等值性系数,如果两个版本间隔一段时间施测称为稳定性等值系数.,三 内在一致性系数,以一次测验的结果来估计测验的信度.用以估计测验内部的一致性.,内在一致性系数的几种估计方法,1. 分半信度 把

7、一次测验的结果人为地分成对等的两半,然后计算两半分数之间的相关。 计算分半信度的一个重要之处是如何进行合理的分半.,分半信度只是半个测验的信度,所以需加以校正。 校正公式:,2. 库德理查逊估计法,库德理查逊1937年提出了一种分析题目间一致性来估计信度的方法,即应用项目统计量来避免任意的两半分法导致产生的误差。常用KR20公式: 公式:,假设一个测验有5个测题,施测于一个30个人的样本,结果求出标准差为2.5,测题 答对人数 p q pq 1 15 0.50 0.50 0.25 2 20 0.67 0.33 0.22 3 12 0.40 0.60 0.24 4 10 0.33 0.67 0.

8、22 5 6 0.20 0.80 0.16 pq=1.09,3. 稳定系数,稳定系数(克伦巴赫 系数) 公式:,内在一致性系数的使用局限性,只适合于同质性的测验 特别不适合于速度测验,二个评分者分别对一组被试的测验结果加以评分,然后求取两组人分数的一致性。 另一种方法是求取完全相同评分的比例.,四 评分者信度,三个以上评分者对一组被试的测验结果评分,其一致性的求取采用肯特尔和谐系数。 公式:,三个教师给6篇作文评分,将分数值转换为得分等级(最高为1)然后求出每一篇作文所得等级之和(Ri ),Ri 14+7+13+18+8+363 Ri2811 K3 N = 6 被评对象在3-7人时,直接查表,

9、w值大于表中数值说明信度是高的,如被评对象超过7人,则可计算2值,作2检验。 2k (N-1) w df=N-1,不同类型测验的信度要求,标准化智力测验 0.90 (中等到高的信度) 标准化成就测验 0.85 标准化人格测验 0.80 (中等到低的信度) 标准化团体测验 0.70 某些投射测验 0.60 (低信度),第四节 影响信度的因素,测验分数分布的范围对信度的影响 分数分布的范围越大,信度就越高,分数分布的范围越小信度就越低。,用异质团体的信度来推测同质团体的信度 公式: 例:,二 测验的长度对信度的影响,测题数量越多信度就越高 以已有测题数量所得信度来预测达到某种信度水平需增加的题数

10、公式: 例:,以增加题目的数量来推测所能达到的信度 公式: 例:,进一步增加题数可达到的信度水平,三 测验的难度对信度的影响,难度间接影响信度。 即难度影响测验分数的分布,然后影响信度。,第五节 测量的标准误差,定义:误差分数分布的标准差 标准误也可用来判断一个测验的稳定性程度。 信度系数是估计整个样本的误差程度,而标准误则是用来估计个人分数中的误差水平。,标准误的计算公式,标准误的用途,确定分数的有效区间 例:一个儿童做韦氏智力测验测得智商120,已知韦氏测验的标准差为15,信度是0.95。,公式:,以95%的置信水平来确定这个儿童智商分数的有效区间,那么真分数有95%的可能性会落在X+/- 1. 96 Se的范围内, 即 120+/-1.96 3.35 =113-127。,评价两个不同测验分数是否有明显的差异。 例:一个儿童的韦氏言语智商是102,操作智商为108,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论