信度与随机误差_第1页
信度与随机误差_第2页
信度与随机误差_第3页
信度与随机误差_第4页
信度与随机误差_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信度与随机误差第一页,共二十六页,2022年,8月28日误差与测量的准确性和稳定性误差就是在测量中与目的无关的因素所产生的不准确或不一致的效应。准确性与一致性的关系:一.测量的误差第二页,共二十六页,2022年,8月28日误差的种类:

随机误差系统误差抽样与测量误差误差的来源:(编制过程中,测题本身存在的误差)

测量自身引起的误差

题目取样时,题量少,或无代表性其他编制过程

Eg:句子意义不明确,题目太难,测验时间设定不对

施测过程引起的误差:

物理环境测试时间主试因素意外干扰评分记分被试引起的误差:

应试动机测验焦虑测验经验练习效应反应倾向生理因素第三页,共二十六页,2022年,8月28日真分数

指的是在测量没有误差时所得到的真值。

在测量学中,真分数是一个很重要的概念。

•定义化•假设

•X=T+E•(Gullikson,1950):X=观测分数(你的实得分数)1对一个人测量无数T=真分数(构想分数)次,其平均误差为0,E=误差分数(猜测,疲劳);即E=0

误差是一种随机的、2真分数与误差没有正态的偏离关系,即rTE=03不同测量上的误差没有关系,即rE1E2=0

如果进行无数次测量,X的平均值等于T第四页,共二十六页,2022年,8月28日对于一个团体来说,实得分数、真分数和测量误差之间有如下关系:

SX2=ST2+SE2

即实得分数的变异数SX2等于真分数的变异数ST2加上误差变异数SE2

而真分数变异数可分成与测量目的有关(有效)的变异数SV2和与测量目的无关但却稳定的变异数SI2

ST2=SV2+SI2最后二式合并可得

SX2=SV2+SI2+SE2第五页,共二十六页,2022年,8月28日稳定性\可靠性\一致性你的观测分数在多大程度上反映了你的“真实”分数?在不同时间测验同一个人获得的结果是一致吗?人们通常把测量结果的可靠性称为信度,即测量结果的一致性或可信性程度。信度的意义

1.信度指实测值和真值相差的程度

2.信度指统计量与参数之间的接近程度

3.信度是指一种测验对相同的应试者再次测验时引起同样反应的程度二.测量信度第六页,共二十六页,2022年,8月28日信度定义一:

信度乃是一组测验分数中真分数的变异数与实得分数的变异数之比。即

rXX=ST2/SX2第七页,共二十六页,2022年,8月28日信度定义二:

信度乃是一个测验X与它的任意一个平行测验X'的相关系数。即

rXX=ρXX'第八页,共二十六页,2022年,8月28日信度定义三:

信度乃是一组测验分数中真分数与实得分数的相关系数的平方。即

rXX=ρ2TX第九页,共二十六页,2022年,8月28日实测分数对真分数的回归图第十页,共二十六页,2022年,8月28日1.稳定性系数(重测信度)2.等值性系数(复本、分半信度)3.等值稳定性系数(复本、分半信度)4.内部一致性系数(同质性信度)5.评分者的信度系数估计信度的方法第十一页,共二十六页,2022年,8月28日重测信度(Test-RetestReliability)定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。实质:表示测验结果的稳定性。故称之为稳定性系数(CoefficientofStability)形式:施测—适当时间—再施测计算公式参见教材P43第十二页,共二十六页,2022年,8月28日时间间隔的把握间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月。(既不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)第十三页,共二十六页,2022年,8月28日复本信度(Alternate-formraliability)因为任何测验只是所有可能题目中的一份取样(行为样本),所以可编制许多平行的等值测验,叫做复本。复本等值要符合下列条件:

1.各份测验测量的是同一种心理特性。

2.各份测验具有相同的内容和形式。

3.各份测验的题目不应重复。

4.各份测验题目数量相等,难度和区分度大体相同。

5.各份测验的分数分布(平均数和标准差)大致相等。

6.复本编好后,应再测一次,以确保各份测验的等值。第十四页,共二十六页,2022年,8月28日计算方法:

两个复本施测同一被试群体,求其相关。等值性系数:同时连续施测,反映内容变异。形式:复本A—最短时间—复本B稳定性与等值性系数:时间间隔施测,内容变异+重测信度误差形式:复本A—适当时间—复本B第十五页,共二十六页,2022年,8月28日分半信度(Split-HalfReliability)定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。第十六页,共二十六页,2022年,8月28日为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。

计算公式参见教材P35~36

斯皮尔曼—布朗校正公式弗朗那根公式卢伦公式第十七页,共二十六页,2022年,8月28日同质性信度(HomogeneityReliability)同质性指测验的所有题目测量的是同一种心理特质,表现为各个题目得分之间有较高的相关,相关越高则同质性越强。因素分析的思路计算公式:

参见教材P36~37

基本公式库德—理查逊公式克伦巴赫系数第十八页,共二十六页,2022年,8月28日评分者信度(ScorerReliability)评分者信度是指不同评分者之间在测验结果计分上的一致性。在心理测验中,评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。几个评分者的评分越一致,评分者信度越高。第十九页,共二十六页,2022年,8月28日评分者信度最简单的估计方法就是随机抽取若干份答卷,由两个独立的评分者打分,再求每份答卷两个评判分数的相关系数。这种相关系数的计算可以用积差相关方法,也可以采用斯皮尔曼等级相关方法。如果评分者在三人以上,而且又采用等级记分时,就需要用肯德尔和谐系数来求评分者信度。计算公式:肯德尔和谐系数W第二十页,共二十六页,2022年,8月28日各种信度系数相应误差变异的来源信度系数的类型误差变异的来源再测信度复本信度(连续施测)复本信度(间隔施测)分半信度同质性信度评分者信度时间取样内容取样时间与内容取样内容取样内容的异质性评分者间的差异第二十一页,共二十六页,2022年,8月28日假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的A\B两个复本,所得的等值性与稳定性系数为0.70。根据被试对每个复本的反应计算出分半信度为0.80(先计算每个复本的分半相关系数。将二者平均后再用斯皮尔曼-布朗公式校正)。同时,我们让另一个评分者随机抽取50份卷子另外评分,得到评分者信度为0.92。然后,我们对这三种方法所产生的误差变异进行分析。第二十二页,共二十六页,2022年,8月28日这个假想测验的误差变异来源分析信度类型误差变异量误差变异来源复本信度(间隔施测)1-0.70=0.30时间与内容取样分半信度1-0.80=0.20内容取样上述二者差异0.30-0.20=0.10时间取样评分者信度1-0.92=0.08评分者差异误差变异总和0.20+0.10+0.08=0.38真实变异1-0.38=0.62第二十三页,共二十六页,2022年,8月28日这个假想测验的误差变异来源分析真实变异误差变异时间上的稳定性,复本之间的一致性,评分者之间的一致性内容取样误差时间取样误差评分者间差异62%20%10%8%第二十四页,共二十六页,2022年,8月28日信度的作用

反映了测量过程中所存在的随机误差大小可以用来解释个人测验分数的意义可以帮助进行不同测验分数的比较影响信度的因素:

被试的样本—样本团体的异质程度与平均水平测验的长度—一般说来,测验越长,信度值超高测验的难度—测验难度水平使测验分数的分布范围最大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论