心理测验的信度_第1页
心理测验的信度_第2页
心理测验的信度_第3页
心理测验的信度_第4页
心理测验的信度_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于心理测验的信度第1页,共43页,2023年,2月20日,星期四第二章心理测量的信度信度与误差1信度的种类与估方法

2信度的影响因素

3心理测量发展简史

4第2页,共43页,2023年,2月20日,星期四你如何解释下述现象?

一个很聪明的孩子,测得智商是80分一个学习很好的学生,考试成绩为60分一个人缘很好的人,人际关系测量低于常模值第3页,共43页,2023年,2月20日,星期四量表帮助我们了解教育、心理现象就像尺子帮助我们测量身高。

思考:我们如何知道我们有多高?有两个工具:尺子/秤

第4页,共43页,2023年,2月20日,星期四尺子的数据与我们的目测更一致,而秤盘的数据则与我们的目测不一致。因此,尺子是测量身高的有效工具——效度。什么材料的尺子?——钢铁(热胀冷缩)涉及到一致性的问题。——信度第5页,共43页,2023年,2月20日,星期四第二章心理测量的信度第一节信度与误差1第6页,共43页,2023年,2月20日,星期四一、误差随机误差(RandomError)在不同情境下测量结果是不稳定的,与测量情境和测量条件有关由于这一误差是由测量过程造成的,因此也称测量误差(MeasurementEroor)系统误差(SystemError)。由于测量本身所造成,测量结果向一个方向偏离,其数值按一定规律变化。以相同的方式影响测量值随机误差-----信度,如何控制和减少随机误差系统误差-----效度,如何提高测量工具本身的准确性第7页,共43页,2023年,2月20日,星期四二、信度的定义(一)信度的概念可信性\稳定性\一致性测量结果的可信程度

测验结果的一致性和稳定性程度

受随机误差的影响,随机误差越大,信度越低同一测试---同一测试对象---多次施测—结果不稳定---缺乏信度。测验本身---抗干扰能力强----误差控制的好---多次施测分数的一致性高-----信度高,

第8页,共43页,2023年,2月20日,星期四(二)信度的统计学定义真分数T真实分数,在测量学上叫真分数(TrueScore)理论定义:所谓真分数就是一个测量工具在测量没有误差时,所得到的真值(纯正值)。操作定义:真分数是,经过无数次测量所得的平均值。即一个被试在许多(理论上无限多)平行测验上得分的平均值。第9页,共43页,2023年,2月20日,星期四(二)信度的统计学定义真分数与观测分数的关系实的分数与真分数关系:X=T+EσX2=σT2+σE2(方差可加性)如果误差为0,则T=X-σX2=ΣT2测验误差期望为0(或误差的平均数为0)误差大小、正负方向是随机的,因此其平均数为0误差与真分数之间是相互独立的即误差的出现、大小方向都与真分数无关因此得出:T=X即一组被试真分数的平均数与实的分数的平均数相等。X:实的分数观测分数T:真分数E:测验误差第10页,共43页,2023年,2月20日,星期四(二)信度的统计定义信度的统计定义1定义1:信度是被试团体真分数方差与实得分数方差之比真分数的变异在实得分数变异中所占的比重

实得分数的变异在多大程度上是由真分数的变异引起的。当实得分数的变异可以由全部真分数的变异解释时,测验误差就是0,这时测验的信度为1(rxx=1)第11页,共43页,2023年,2月20日,星期四信度的统计定义二信度乃是一个被测团体真分数与实得分数的相关系数的平方。rXX=ρ

2TX思考:相关系数的平方?(二)信度的统计定义第12页,共43页,2023年,2月20日,星期四信度的统计定义三信度乃是一个测验X与它的任意一个平行测验X'的相关系数。rXX=ρXX'

(操作定义)于是,可根据测试结果分数的形式,是连续变量还是二分变量等,可采用不同的相关系数计算公式。(二)信度的统计定义第13页,共43页,2023年,2月20日,星期四三、信度的作用评价测验信度越高,说明测验所得分数越接近被试的真分数,分数就可靠。信度要求:解释分数对被试的真分数进行估计,信度越高,实得分数越能代表他的真分数,信度为1时,实得分数就是真分数.能力测验:>0.90人格/兴趣测验:0.80-0.85r>0.85时,可对个人进行诊断、鉴别、解也可以进行团体比较r=0.70-0.85,只能进行团体比较r<0.70时,不能评价个人,也不能进行团体比较第14页,共43页,2023年,2月20日,星期四第二章心理测量的信度第二节信度的种类与估方法

2第15页,共43页,2023年,2月20日,星期四信度的种类重测信度复本信度同质性信度分半信度克龙巴赫(cronbach)α系数库德-理查森信度评分者信度第16页,共43页,2023年,2月20日,星期四一、重测信度Test-RetestReliability定义:同一量表,同一被试群体,在不同时间,两次施测,求其相关。实质:表示测验结果的稳定性。故称之为稳定性系数(CoefficientofStability)形式:施测再施测间隔适当时间第17页,共43页,2023年,2月20日,星期四重测信度时间间隔的把握间隔时间越长,稳定性系数越低。适宜时间间隔依照测验目的、性质及被试特点而定。几分钟至几年。年幼儿童,间隔要小;年长群体,间隔可大。智力测验的间隔不能太短,成就测验的间隔不能太长。一般间隔时间不超过六个月。(即不能让被试记住上一次测验的内容,又不能让其特质发生变化,或对所学知识产生遗忘)第18页,共43页,2023年,2月20日,星期四重测信度的计算方法求取同一组被试在两个不同时间施测同一个测量工具所得的结果分数的相关系数,一般使用积差相关法(r)计算重测信度的原理是对平行测验的假定,假设某测验所要测量的潜在特质,短期内不会随着时间推移而改变。但因为重测时被试的心理特质会发生变化,导致真分数变异,练习和疲劳效应也会也会使得重测的结果出现差异。在测验手册上报告的重测信度,一般要注明被试样本的性质、大小,及是间隔多长时间所测的信度系数,以便使用者了解样本及时间因素对测验稳定性的影响。第19页,共43页,2023年,2月20日,星期四计算重测信度时应注意的问题所欲测量的心理特质是否稳定所测的如果是人格、智力、兴趣等心理特质,则可以使用重测法,而知识、情绪等不稳定的心理特质使用重测法必须慎重。重测结果要尽量减少练习或遗忘因素的影响智力测验的时间间隔不能太短,成就测验则不能间隔太长,既不能让被试记住上次测验的内容,又不能使其特质发生变化,或对所学知识产生遗忘。如果使用年龄小的被试时,测验间隔要小些,年龄大的被试可以长些。对儿童的智力测验一般是两周到四周为宜。对成年人,间隔可到半年,很少超过6个月。第20页,共43页,2023年,2月20日,星期四重测信度适用条件重测信度适用于异质性测验。所谓异质性测验就是说一个测验包括几个不同的部分,这几个部分分别测量着几个不同的心理特质,它们之间可能并不存在相关,或相关较低。重测信度适用于速度测验而不适用于难度测验。速度测验的测题数量多,而且有一定的时间限制,被试很难记住第一次施测的内容,所以第二次施测较少受记忆的影响,而难度测验则相反。重测信度还适用于运动技能的测验,如跑、跳、掷等,其测验成绩较少受重复测量的影响。第21页,共43页,2023年,2月20日,星期四二、复本信度复本测验/平行测验指在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验。(AB卷)第22页,共43页,2023年,2月20日,星期四复本测验等值要符合下列条件:各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。第23页,共43页,2023年,2月20日,星期四复本信度(Alternate-formraliability)指两个平行测验测量同一批被试所得结果的一致性程度数值上是两个复本施测于同一被试样本所得测验分数的相关系数.施测方式同一个时间连续施测--等值性系数间隔一段时间后施测--等值稳定性系数第24页,共43页,2023年,2月20日,星期四复本测验的形式1等值性系数:同时连续施测,反映内容变异。形式:复本A—最短时间—复本B被试易出现疲劳、失去积极性、会出现迁移(顺序效应)可随机分配一半被试先做复本A后做复本B,另一半先做B再做A,以平衡顺序效应。第25页,共43页,2023年,2月20日,星期四复本测验的形式2等值稳定性系数:时间间隔施测,内容变异+重测信度误差同时兼顾试题抽样与时间影响形式:复本A—适当时间—复本B时间间隔,减少了练习效应和疲劳效应时间间隔适当,可用于计算稳定性不高的心理特质的测验信度,克服了等值性系数的局限第26页,共43页,2023年,2月20日,星期四复本信度优缺点优点:复本信度优于重测信度避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。

缺点:有些测验的复本很难找到;有些测验因正迁移效应使测验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。第27页,共43页,2023年,2月20日,星期四复本信度使用条件各份测验测量的是同一种心理特性。各份测验具有相同的内容和形式。各份测验的题目不应重复。各份测验题目数量相等,难度和区分度大体相同。各份测验的分数分布(平均数和标准差)大致相等。复本编好后,应再测一次,以确保各份测验的等值。第28页,共43页,2023年,2月20日,星期四三、同质性信度也叫内部一致性信度,指测验内部所有题目间的一致性程度,是一个测验所测内容或特质的相同程度所有题目测的是同一种心理特质所有题目得分之间都具有较高的正相关假设同质性信度高,说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映估计方法分半信度克龙巴赫(cronbach)α系数库德-理查森系数第29页,共43页,2023年,2月20日,星期四*分半信度(Split-HalfReliability)定义:在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据被试在这两半测验中所得的分数计算相关系数,即得分半信度。计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。第30页,共43页,2023年,2月20日,星期四分半方法:为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用校正公式。斯皮尔曼-布朗公式:rxx=2rhh/(1+rhh)rxx:---信度系数rhh---两个“半测验”的的相关系数第31页,共43页,2023年,2月20日,星期四库德-理查森系数当测验都是二计分题目时,可以用库德-理查森系数来估计同质性信度适用条件:只适合预测题目是二分法计分题目。公式:K:测验题目的个数Pi:被试在项目i上的正确做答比例qi:被试在项目i上错误作答的比例S2x:测验的总方差第32页,共43页,2023年,2月20日,星期四当测验题型较多、并非都是二分记分题时,估计测验信度可采用克龙巴赫α系数表征多个测验项目的内部一致性公式:K:测验题目的个数Si2:被试在项目i上的得分的方差Sx2:测验总分的总方差

*克龙巴赫(Alpha)α系数第33页,共43页,2023年,2月20日,星期四四、评分者信度ScorerReliability指不同评分者之间在测验结果计分上的一致性。随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算它们的相关。评分越一致,评分者信度越高。适用条件作文、创造力、投射、道德判断等测验第34页,共43页,2023年,2月20日,星期四评分者信度的评估方法计算积差相关或斯皮尔曼相关系数两个评分者、或一个人两次评分计算肯德尔和谐系数:评分者在三人以上,而且采用等级记分。第35页,共43页,2023年,2月20日,星期四五、信度系数误差来源1、不同类型信度的误差来源第36页,共43页,20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论