心理咨询师三级考试教材培训课件(心理测量学)_第1页
心理咨询师三级考试教材培训课件(心理测量学)_第2页
心理咨询师三级考试教材培训课件(心理测量学)_第3页
心理咨询师三级考试教材培训课件(心理测量学)_第4页
心理咨询师三级考试教材培训课件(心理测量学)_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第一节第一节概述概述第二节第二节测验的常模测验的常模第三节第三节测验的信度测验的信度第四节第四节测验的效度测验的效度第五节第五节项目分析项目分析第六节第六节测验编制的一般程序测验编制的一般程序第七节第七节心理测验的使用心理测验的使用l第一单元第一单元测量与测量量表测量与测量量表l第二单元第二单元心理测验的基本概念心理测验的基本概念l第三单元第三单元心理测验的分类心理测验的分类l第四单元第四单元纠正错误的测验观纠正错误的测验观l第五单元第五单元心理测验在心理咨询中的应用心理测验在心理咨询中的应用l第六单元第六单元心理测验的发展史心理测验的发展史l什么是测量什么是测量l测量要素测量要素l测量量表

2、测量量表l测量就是依据一定的法则用数字对事物加以确定。测量就是依据一定的法则用数字对事物加以确定。从字面上看,该定义包括三个主要的元素:从字面上看,该定义包括三个主要的元素:事物;事物;数字;数字;法则。法则。 1.“1.“事物事物”,指的是我们要测量的对象,更准确地说,指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征。就是引起我们兴趣的事物的属性或特征。 2.“2.“数字数字”,是代表某一事物或事物某一属性的量。,是代表某一事物或事物某一属性的量。 3.“3.“法则法则”,代表的是测量所依据的规则和方法。,代表的是测量所依据的规则和方法。 l任何测量都应该具备这样两个要

3、素:即参照点和单位。任何测量都应该具备这样两个要素:即参照点和单位。l参照点:要确定事物的量,必须有一个计算的起点,这参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。个起点叫做参照点。绝对零点绝对零点 人定的参照点即相对零点人定的参照点即相对零点l单位:是测量的基本要求,没有单位就无法进行测量单位:是测量的基本要求,没有单位就无法进行测量 确定的意义确定的意义 有相同的价值有相同的价值l测量的本质是根据某一法则将事物数量化,即在一个定有单位测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为和参照点的连续体上把事物的属性

4、表现出来,这个连续体称为量表。量表。l量表的四种水平量表的四种水平命名量表命名量表:代号代号/类别类别顺序量表顺序量表:在顺序量表中,既无相等单位,又无绝对零点,数字在顺序量表中,既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种属性的真正量或绝对值。仅表示等级,并不表示某种属性的真正量或绝对值。等距量表等距量表:不但有大小关系,而且具有相等的单位,其数值可以不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。等比量表等比量表:是最高水平的量表,既有相等单位又有绝对零点。是最高水

5、平的量表,既有相等单位又有绝对零点。l那么,心理测量中使用的量表一般是什么量表呢?一般说来,那么,心理测量中使用的量表一般是什么量表呢?一般说来,心理测量是在顺序量表上进行的。心理测量是在顺序量表上进行的。8大小关系大小关系相等单位相等单位绝对零点绝对零点类别量表类别量表无无无无无无顺序量表顺序量表有有无无无无等距量表等距量表有有有有无无等比量表等比量表有有有有有有l心理测验的定义心理测验的定义l心理测验的性质心理测验的性质l所谓心理测验,就是依据心理学理论,使用一定的操作程序,所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行通过观察人

6、的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。为活动中的心理特点作出推论和数量化分析的一种科学手段。首先,心理测验测量的是人的行为首先,心理测验测量的是人的行为。其次,心理测验在测量个别差异的时候,往往只是对少数经其次,心理测验在测量个别差异的时候,往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。特征。第三,为了使不同的被试者所获得的分数有比较的可能性,第三,为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。测验的条件对所有的被试者

7、都必须是相同的。第四,个人在测验中所得到的原始分数并不具有什么意义,第四,个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。只有将它与其他人的分数或常模相比较才有意义。l心理测量的间接性心理测量的间接性迄今为止,我们还无法直接测量人的心理,只能通过测迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即通过测量人们对测验题目的反应来量人的外显行为,即通过测量人们对测验题目的反应来推论出他的推论出他的心理特质心理特质。l心理测量的相对性心理测量的相对性 我们在比较不同人之间的行为或心理特征时,没有绝对我们在比较不同人之间的行为或心理特征时,没有

8、绝对的标准,也没有绝对的零点,我们有的只是一个连续的的标准,也没有绝对的零点,我们有的只是一个连续的行为序列。行为序列。l心理测量的客观性:心理测量的客观性:1 1、测验的刺激是客观的、测验的刺激是客观的2 2、对反应的量化是客观的、对反应的量化是客观的3 3、对结果的推论是客观的、对结果的推论是客观的l按测验的功能分类按测验的功能分类 智力测验、特殊能力测验、人格测验l按测验材料的性质分类按测验材料的性质分类文字测验、操作测验l按测验材料的严谨程度分类按测验材料的严谨程度分类客观测验、投射测验l按测验的方式分类按测验的方式分类个别测验、团体测验l按测验的要求分类按测验的要求分类最高作为测验、

9、典型行为测验l错误的测验观错误的测验观测验万能论测验万能论测验无用论测验无用论l某些人格测验侵犯了个人隐私,违背民主原则某些人格测验侵犯了个人隐私,违背民主原则l测验为宿命论和种族歧视提供了心理学依据测验为宿命论和种族歧视提供了心理学依据心理测验即智力测验心理测验即智力测验l正确的测验观正确的测验观心理测验是重要的心理学研究方法之一,是决策的辅心理测验是重要的心理学研究方法之一,是决策的辅助工具助工具心理测验作为研究方法和测量工具尚不完善心理测验作为研究方法和测量工具尚不完善三种测验在心理门诊中的使用(领会)三种测验在心理门诊中的使用(领会)l智力测验智力测验:可在求助者有特殊要求时及对方有可

10、:可在求助者有特殊要求时及对方有可疑智力障碍的情况下应用;疑智力障碍的情况下应用;l人格测验人格测验:有助于治疗者对求助者人格特征的了:有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可针对解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作;性地开展咨询与心理治疗工作;l心理评定量表心理评定量表:用于检查求助者某方面心理障碍:用于检查求助者某方面心理障碍的存在与否或其程度如何。的存在与否或其程度如何。l科学心理测验的产生与发展科学心理测验的产生与发展l现代心理测验在我国的发展现代心理测验在我国的发展l首先倡导科学心理测验的学者是英国生物学家和心理学首先倡导

11、科学心理测验的学者是英国生物学家和心理学家高尔登(家高尔登(F. GaltonF. Galton),因此他的工作被视为心理测验),因此他的工作被视为心理测验的开端。此外,高尔登也为心理测验奠定了统计学基础的开端。此外,高尔登也为心理测验奠定了统计学基础。 l18901890年,卡特尔在年,卡特尔在心理心理杂志上发表杂志上发表“心理测验与测心理测验与测量量”一文,这是心理测验第一次出现于心理学文献中一文,这是心理测验第一次出现于心理学文献中。并认为心理测验的结果应与常模进行比较。l19051905年,年,比内(比内(A.BinetA.Binet)与其助手西蒙()与其助手西蒙(T.SimonT.S

12、imon)研)研究制作了世界上第一个正式的心理测验究制作了世界上第一个正式的心理测验。l操作测验的发展操作测验的发展由于理论上的缺陷和实际上的需要,所以有操作测验由于理论上的缺陷和实际上的需要,所以有操作测验的问世。的问世。l团体智力测验的发展团体智力测验的发展团体测验始于第一次世界大战,在推孟的研究生欧提团体测验始于第一次世界大战,在推孟的研究生欧提斯所编团体智力测验的基础上发展了陆军甲种和乙种智斯所编团体智力测验的基础上发展了陆军甲种和乙种智力测验。力测验。l能力倾向测验的发展能力倾向测验的发展分析个人心理品质的内部结构,为职业选拔与安置提分析个人心理品质的内部结构,为职业选拔与安置提纲依

13、据。纲依据。 普通能力倾向(智力)测验也向多元化发展。普通能力倾向(智力)测验也向多元化发展。l人格测验的发展人格测验的发展测量情感或行为等非智力方面的人格因素。测量情感或行为等非智力方面的人格因素。l我国近代心理测验大约源于我国近代心理测验大约源于1914年前后。年前后。l本世纪二、三十年代,我国心理学家曾两次修订过比内本世纪二、三十年代,我国心理学家曾两次修订过比内-西蒙量表。西蒙量表。l 1979年后,全国各地的心理学家组织起多个协作组,先年后,全国各地的心理学家组织起多个协作组,先后对国外的广泛采用的智力和人格测量工具进行修订。后对国外的广泛采用的智力和人格测量工具进行修订。l近些年来

14、我国的心理学家正在致力于测验本土化,编制适近些年来我国的心理学家正在致力于测验本土化,编制适合我国文化背景的智力测验,适应行为量表等,并已取得合我国文化背景的智力测验,适应行为量表等,并已取得了初步成功。了初步成功。l第一单元第一单元常模团体常模团体l第二单元第二单元常模的类型常模的类型l第三单元第三单元常模分数的表示方法常模分数的表示方法l常模团体的性质常模团体的性质l常模团体的条件常模团体的条件l取样的方法取样的方法l常模分数与常模常模分数与常模l常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。它用一个标准的、规范的分数表示出来,以提供比较的基础。l对测验编制者而

15、言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:确定一般总体、确定目标总体、确定样本。l对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。l群体的构成必须明确界定 可以用来区分和限定群体的变量是很多的,如性别、年龄、职业、文化程度、民族、地理地域、社会经济地位等。依据不同的变量确定群体,便可得到不同的常模。 l常模团体必须是所测群体的代表性样本当所要测量的群体很小时,将所有的人逐个测量,其平均分便是该群体的最可靠的常模。在群体较大时,因为时间和人力物力的限制,只能测量一部分人作为总体的代表,这就提出了取样是否适当的问题 l样本的大小要

16、适当总体数目小,只有几十个人,则需要100%的样本。如果总体数目大,相应的样本也大,一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。l取样即从目标总体中选择有代表性的样本取样即从目标总体中选择有代表性的样本简单随机抽样:简单随机抽样:在简单随机抽样中,每个人或抽样单位都有相同在简单随机抽样中,每个人或抽样单位都有相同的机会作为常模中的一部分。的机会作为常模中的一部分。系统抽样:系统抽样:有时在总体数目为有时在总体数目为N N的情况下,若要选择的情况下,若要选择K K分之一的被分之一的被试作为样本,则可以在抽样范围内选择每个第试作为样本,则可以在抽样范围内选择每个第K

17、K个人来构成样本。个人来构成样本。分组抽样:分组抽样:有时总体数目较大,无法进行编号,而且群体又有多有时总体数目较大,无法进行编号,而且群体又有多样性,这时可以先将群体进行分组,再在组内进行随机取样样性,这时可以先将群体进行分组,再在组内进行随机取样。分层抽样分层抽样:它是先将目标总体按某种变量(如年龄)分成若干层它是先将目标总体按某种变量(如年龄)分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模样本。包括分层比例抽样和分层非比例抽样常模样本。包括分层比例抽样和分层非比例抽样24l分层比例抽样分层比例抽样如果各层抽样

18、的个案数如果各层抽样的个案数ni是根据各层的个案数是根据各层的个案数Ni占总体数目占总体数目N的比例决定的,则:的比例决定的,则:其中其中n是样本容量,是样本容量,N是目标总体数目,是目标总体数目,Ni是第是第i层的人数,层的人数,ni是第是第i层该抽样的人数,比例就是层该抽样的人数,比例就是Ni/N。l分层非比例抽样分层非比例抽样当各层次的差异很大时,就不宜用比例抽样。因为有些层次当各层次的差异很大时,就不宜用比例抽样。因为有些层次的重要性大于其他层次,这时应该用非比例抽样方法。的重要性大于其他层次,这时应该用非比例抽样方法。Si为各层调查单位的标准差为各层调查单位的标准差其它符号同上式。其

19、它符号同上式。nNNnii)(iiiiiSNSNnnl常模分数 常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。导出分数具有一定的参照点和单位,它实际上是一个有意义的测验量表,它与原始分数等值,可以进行比较 l常模常模分数构成的分布,就是通常所说的常模(norm),它是解释心理测验分数的基础。常模有一般常模与特殊常模之分 l发展常模发展常模l百分位常模百分位常模l标准分常模标准分常模l智商的计算及意义智商的计算及意义l发展顺序量表l智力年龄l年级当量l最直观的发展常模是发展顺序量表,因为它告诉人们多最直观的发展常模是发展顺序量表,因为它告诉人们多大的儿童具备什么

20、能力或行为就表明其发育正常,相应大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。发育滞后。l最早的一个范例是最早的一个范例是葛塞尔发展程序表葛塞尔发展程序表,其中按月份显示,其中按月份显示出儿童在运动水平、适应性、语言、社会性四个方面的出儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。大致发展水平。l皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展,尤其注重某些特殊概念的形成,其中最著名的工作展,尤其注重某些特殊概念的形成,其中

21、最著名的工作就是对守恒概念的研究。就是对守恒概念的研究。29l4周,能控制眼睛运动,去追随一个对象看周,能控制眼睛运动,去追随一个对象看l16周,能保持头部平衡周,能保持头部平衡l28周,能用手抓握东西并玩弄它周,能用手抓握东西并玩弄它l40周,能控制躯干、坐立或爬行周,能控制躯干、坐立或爬行l52周,能控制腿脚运动、站立和行走周,能控制腿脚运动、站立和行走l方法一方法一:基础年龄与在较高年龄水平的题:基础年龄与在较高年龄水平的题目上获得的附加月份之和。目上获得的附加月份之和。l方法二:将标准化样本中每个年龄组的平方法二:将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分均原始分

22、数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智数与年龄常模对比,便可求得每个人的智龄。龄。31已知某儿童完成比内已知某儿童完成比内-西蒙的测题如下:西蒙的测题如下:6岁以下岁以下全部通过全部通过7岁岁通过通过4题题8岁岁通过通过3题题9岁岁通过通过2题题9岁以上岁以上均未通过均未通过则:智龄则:智龄=6岁岁+42(月)(月)+32(月)(月)+22(月)(月)=6岁岁+18月月=7岁岁6个月个月l年级当量实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。其表述方式常常是:某学生的算术是6年级水平,阅读是4年级水平,理解是5年级的水平等。 l年级量表的单

23、位通常为10个月间隔,在一学年中假设两个月的假期在所测量目标上的发展是不重要的,因此以10个月为一个年级。例如,40(或4.0)表示四年级开始时的平均成绩,45(或4.5)表示学年中间的平均成绩。l百分等级百分等级指在常模样本中低于这个分数的人数百分比。指在常模样本中低于这个分数的人数百分比。l百分点百分点百分点也称百分位数,与百分等级的计算方法正好相百分点也称百分位数,与百分等级的计算方法正好相反。百分等级是计算低于反。百分等级是计算低于某测验分数某测验分数的人数的人数百分比百分比,而百分点则是计算处于某一而百分点则是计算处于某一百分比例百分比例的人对应的的人对应的测验测验分数分数是多少是多

24、少。l四分位数和十分位数四分位数和十分位数百分位数是将量表分成百分位数是将量表分成100100份,而四分位数是将量表份,而四分位数是将量表分成四等份,相当于百分等级的分成四等份,相当于百分等级的25%25%、50%50%和和75%75%对应对应的三个百分分成的四段。十分位数也可以依此类推出,的三个百分分成的四段。十分位数也可以依此类推出,1%1%10%10%为第一段,为第一段,91%91%100%100%为第十段。为第十段。34l一种是未分组资料的百分等级计算,其公式为:一种是未分组资料的百分等级计算,其公式为:其中其中R是原始分数排列顺序数,是原始分数排列顺序数,N是指总人数。例小东在是指总

25、人数。例小东在30名同学中语文成绩是名同学中语文成绩是80分,排列第五名,则其百分等级为:分,排列第五名,则其百分等级为:百分等级为百分等级为85即指,在即指,在100名被试中,语文成绩低于小东的名被试中,语文成绩低于小东的80分的有分的有85人。人。l另一种是分组资料的百分等级计算,其公式为:另一种是分组资料的百分等级计算,其公式为:其中其中x指任意原始分数,指任意原始分数,l为该原始分数所在组的精确下限,为该原始分数所在组的精确下限,fp是该分数所在组的频数,是该分数所在组的频数,cf是指是指l以下的累计频数,以下的累计频数,h为分组后的为分组后的组距。组距。)50100(100NRPR8

26、5)30505100(100PRfpchflxNPR10035l百分位数的计算可根据直线内插法进行。例如,高考百分位数的计算可根据直线内插法进行。例如,高考的最高分为的最高分为695分,其百分等级为分,其百分等级为100,最低分为,最低分为103分,分,百分等级为百分等级为1,百分等级为,百分等级为80的百分位数(的百分位数(PP)可以用)可以用下式计算得出:下式计算得出:l所以,要想知道在全国录取所以,要想知道在全国录取20%的考生,总分数线就的考生,总分数线就应该为应该为575分。分。57540.575,10318069580100PPPPPP得l标准分数是将原始分数与平均数的距离以标准差

27、为单位表示出来的标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。量表。因为它的基本单位是标准差,所以叫标准分数。l1线性转换的标准分数线性转换的标准分数 l2非线性转换的标准分数非线性转换的标准分数对每个原始分数值计算累积百分比;对每个原始分数值计算累积百分比;在常态曲线面积表中,求出对于该百分比的标准(在常态曲线面积表中,求出对于该百分比的标准(zz)分数)分数。lT T分数:平均数为分数:平均数为5050,标准差为,标准差为1010l标准九分:以标准九分:以5 5为平均数,以为平均数,以2 2为标准差为标准差l标准十分:平均数为标准

28、十分:平均数为5.55.5,标准差为,标准差为1.51.5;l标准二十分:平均数为标准二十分:平均数为1010,标准差为,标准差为3 3。SDXXzBzAZl比率智商比率智商l离差智商离差智商l必须指出,从不同测验获得的离差智商只有当标准差相必须指出,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便同或接近时才可以比较,标准差不同,其分数的意义便不同不同(见附表见附表)。)。100CAMAIQ SD)XX(15100IQ 38百百分分数数分分布布分组分数分组分数SD=12SD=14SD=16SD=18130以上以上0.71.63.15.11201294.3

29、6.37.58.511011915.216.015.815.410010929.826.123.621.0909929.826.123.621.0808915.216.015.815.470794.36.37.58.570以下以下0.71.63.15.1总计总计100100100100l转换表表示法转换表表示法一个转换表显示出一个特定的标准化样组的原始分数一个转换表显示出一个特定的标准化样组的原始分数与其相对应的等值分数与其相对应的等值分数百分位、标准分数、百分位、标准分数、T T分分数或者其它任何分数。因此测验的使用者利用转换表数或者其它任何分数。因此测验的使用者利用转换表可将原始分数转换为

30、与其对应的导出分数,从而对测可将原始分数转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。验的分数作出有意义的解释。l剖面图表示法剖面图表示法剖面图是将测验分数的转换关系用图形表示出来。从剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。现及其相对的位置。4041l剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。l现以韦克斯勒儿童智力量表的记录纸上的剖面图来说明。见图5-1(书346页)。l第一单元第一单元信度的概念信

31、度的概念l第二单元第二单元信度的估计方法信度的估计方法l第三单元第三单元信度与测验分数的解释信度与测验分数的解释l第四单元第四单元影响信度的因素影响信度的因素l信度的定义信度的定义信度是指同一被试在不同时间内用同一测验(或用另一套相等信度是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。的测验)重复测量,所得结果的一致程度。在测量理论中,信度被定义为:一组测量分数的真分数方差与在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。总方差(实得分数的方差)的比率。X=T+ESX2=ST2+SE2rxx=ST2/SX2=1-SE

32、2/SX2l信度的指标信度的指标信度系数和信度指数信度系数和信度指数 rxx=rXT2=ST2/SX2测量标准误测量标准误l重测信度重测信度l复本信度复本信度l内部一致性信度内部一致性信度l评分者信度评分者信度l重测信度(重测信度(test-retestreliability)又称又称稳定性系数稳定性系数。它的计算方法是采用重测法,即使用同一测。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。得分间的相关系数。最适宜的时距随测验的目的、性质和被试特点而异,一般是两最适宜的时距随测

33、验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最长不超过六个月。周到四周较宜,间隔时间最长不超过六个月。212121/SSXXNXXrxxl复本信度(复本信度(alternate-formreliability)又称又称等值性系数等值性系数,它是以两个等值但题目不同的测验它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信验上得分的相关系数,这个相关系数就代表了复本信度的高低。度的高低。如果两个复本的施测相隔一段时间,则称如果两个复本的施测相隔一段时间,则称稳定与等

34、值稳定与等值系数系数。在计算复本信度时,应该有半数的被试先作在计算复本信度时,应该有半数的被试先作A本再作本再作B本,另一半被试先作本,另一半被试先作B本再作本再作A本,由此可以抵消施本,由此可以抵消施测顺序的效应。测顺序的效应。l内部一致性信度(内部一致性信度(internalconsistencyreliability)分半信度(分半信度(split-halfreliability)l是在测验实施后将测验按奇、偶数分为等值的两半,并分别是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关计算每位被试在两半测验上的得分,求出这两半分数的相关

35、系数。系数。l分半法经常会低估信度,必须修正,借以估计整个测验的信分半法经常会低估信度,必须修正,借以估计整个测验的信度度。同质性信度同质性信度(homogeneityreliability)l同质性主要代表测验内部所有题目间的一致性。当各个测题同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,则的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。相反,即使所有题目看起来好象测量同一特测验为同质的。相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异质的。质,但相关很低或为负相关时,则测验为异质的。)hh

36、1/(hh2xxrrr 48l库德库德-理查逊公式理查逊公式K-R20公式:适合于公式:适合于0、1记分的测题。记分的测题。K-R21公式:适合于公式:适合于0、1记分,难度相同的测题。记分,难度相同的测题。l克伦巴赫克伦巴赫系数:适合于多重记分的测题系数:适合于多重记分的测题21120 xiiKRSqpNNr22) 1()(21xxKRSNXNXNSr2211xiSSNNl评分者信度(评分者信度(scorerreliability)随机抽取若干份测验卷,由两位评分者按评分标准分别给分,随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度

37、。然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,以上,才认为评分是客观的。才认为评分是客观的。当多个评分者评定多个对象,并以等级法记分时,可采用当多个评分者评定多个对象,并以等级法记分时,可采用肯德肯德尔和谐系数尔和谐系数作为评分者信度的估计。作为评分者信度的估计。)(121)(3222NNKNRRWiil解释真实分数与实得分数的相关解释真实分数与实得分数的相关信度系数可以解释为总的方差中有多少比例是由真实分数的方信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的

38、,也就是测验的总变异中真分数造成的变异占百分之差决定的,也就是测验的总变异中真分数造成的变异占百分之几。几。l确定信度可以接受的水平确定信度可以接受的水平当当r rxxxx0.700.70时,测验不能用于对个人作出评价或预测,而且不能时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当作团体比较;当0.70r0.70rxxxx0.850.85时,可用于团体比较;当时,可用于团体比较;当r rxxxx0.850.85时,才能用来鉴别或预测个人成绩或作为。时,才能用来鉴别或预测个人成绩或作为。l解释个人分数的意义解释个人分数的意义其一是估计真实分数的范围;其二是了解实得分数再测时可能其一是

39、估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。这就是测量标准误的应用。的变化情形。这就是测量标准误的应用。l比较不同测验分数的差异比较不同测验分数的差异这种比较包括两个人不同分数的差别和同一被试在两个测验上这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。这就是差异分数的标准误问题。的差别。这就是差异分数的标准误问题。51l几种常用测验的信度系数几种常用测验的信度系数测验类型测验类型信信度度低低中中高高成套成就测验成套成就测验0.660.920.98学术能力测验学术能力测验0.560.900.97成套倾向性测验成套倾向性测验0.460.880.96客观人格测验客观人格

40、测验0.460.850.97兴趣测验兴趣测验0.420.840.93态度测验态度测验0.470.790.98(根据(根据Aiken,1985,第,第91页)页)52l测量的标准误测量的标准误l例:在一个智力测验中,某个被试的例:在一个智力测验中,某个被试的IQ为为100,这是,这是否反映了他的真实水平?如果再测一次,他的分数将否反映了他的真实水平?如果再测一次,他的分数将改变多少?改变多少?已知该智力测验的标准差为已知该智力测验的标准差为15,信度系数为,信度系数为0.89,则其则其IQ的测量标准误和可能范围为:的测量标准误和可能范围为:IQ=1001.965=1009.8=90110我们可以

41、说,这个被试的真实我们可以说,这个被试的真实IQ有有95%的可能性的可能性落在落在90至至110之间。即若再测一次,他的智商低于之间。即若再测一次,他的智商低于90、高于高于110的可能性不超过的可能性不超过5%。0 . 589. 0115SExxr1SxSE 53l例:某被试在韦氏成人智力测验中的例:某被试在韦氏成人智力测验中的VIQ=102,PIQ=108。假设言语测验和操。假设言语测验和操作测验的分半信度分别为作测验的分半信度分别为0.97和和0.93。问其操作智商是否显著高于言语智商呢?。问其操作智商是否显著高于言语智商呢?首先计算出差异分数的标准误首先计算出差异分数的标准误在统计学上

42、,经常要求两个分数的差异程度达到在统计学上,经常要求两个分数的差异程度达到0.05的显著水平,才能承的显著水平,才能承认不是误差的影响。因此,将差异标准误(认不是误差的影响。因此,将差异标准误(4.74)乘以)乘以1.96,结果为,结果为9.29,这,这表明个体在韦氏测验两半得分的差异高于大约表明个体在韦氏测验两半得分的差异高于大约10分时,才能达到分时,才能达到0.05的显著水的显著水平。上述被试的差异分数平。上述被试的差异分数108-102=6是不显著的。是不显著的。74.493.097.0215SEdl样本特征样本特征样本团体的异质性:一般而言,若获得信度的取样团样本团体的异质性:一般而

43、言,若获得信度的取样团体较常模总体为异质的话,往往会高估测验的信度,体较常模总体为异质的话,往往会高估测验的信度,相反会低估测验的信度。相反会低估测验的信度。样本团体的平均能力水平样本团体的平均能力水平l测验的长度测验的长度;一般来说,在一个测验中增加同质;一般来说,在一个测验中增加同质的题目,可以使信度提高。的题目,可以使信度提高。l测验的难度:通常难度的平均水平为测验的难度:通常难度的平均水平为0.50较好。较好。l测量的时间间隔测量的时间间隔55l假设我们希望用增加测验长度的方式提高测验的信度假设我们希望用增加测验长度的方式提高测验的信度以达到某种理想值,通过斯皮尔曼以达到某种理想值,通

44、过斯皮尔曼-布朗公式的导出公布朗公式的导出公式就可以计算出最少应增加的题数。其公式为:式就可以计算出最少应增加的题数。其公式为:l例如:有一个包含例如:有一个包含50个题的测验,信度为个题的测验,信度为0.75,若把,若把信度提高到信度提高到0.90,应该增加多少个题目。,应该增加多少个题目。l50350=100(题)(题))1()1(kkxxxxkkrrrrK3)90.01(75.0)75.01(90.0Kl第一单元第一单元效度的概念效度的概念l第二单元第二单元效度评估的方法效度评估的方法l第三单元第三单元效度的功能效度的功能l第四单元第四单元影响效度的因素影响效度的因素l效度的定义效度的定

45、义效度是指所测量的与所要测量的心理特点之间的符合程度,或效度是指所测量的与所要测量的心理特点之间的符合程度,或者简单地说是指一个心理测验的准确性者简单地说是指一个心理测验的准确性.在测验理论中,效度被定义为在一组测量中,与测量目标有关在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率的真实方差(或称有效方差)与总方差的比率. . rxy2=Sv2/Sx2 SX2=ST2+SE2=SV2+SI2+SE2l效度的性质效度的性质效度具有相对性效度具有相对性效度具有连续性效度具有连续性l信度是效度的必要而非充分条件信度是效度的必要而非充分条件效度高必然信度高

46、,而信度高并不一定保证效度高,效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必要条件,并不是效度高的说明信度高只是效度高的必要条件,并不是效度高的充分条件。充分条件。l效度是受信度制约的效度是受信度制约的信度系数与效度系数之间有这样一种关系:信度系数信度系数与效度系数之间有这样一种关系:信度系数的平方根是效度系数的最高限度。用公式表示如下:的平方根是效度系数的最高限度。用公式表示如下:xxxyrr5960SX2SV2SI2SE2ST2因为:因为:rxx=ST2/SX2rxy2=SV2/SX2而且:而且:ST2=SV2+SI2可得到:可得到:rxy2=(ST2-SI2)/S

47、X2=rxx-SI2/SX2由于由于SI2/SX20故:故:xxxyrr l内容效度内容效度l构想效度构想效度l效标效度效标效度l定义定义: : 指的是测验题目对有关内容或行为取样的适用性,从而确定指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。测验是否是所欲测量的行为领域的代表性取样。l估计方法估计方法 专家判断法专家判断法l定义好测验内容的总体范围;定义好测验内容的总体范围;l编制双向细目表,确定内容和技能各自所占的比例;编制双向细目表,确定内容和技能各自所占的比例;l由每位评判者在评定量表上作出判断。由每位评判者在评定量表上作出判断。统计分析

48、法统计分析法l计算两个评分者之间评定的一致性(评分者信度)计算两个评分者之间评定的一致性(评分者信度)l两个测验复本上得分之相关(复本信度)两个测验复本上得分之相关(复本信度)l再测法也可用于内容效度的评估(测验再测法也可用于内容效度的评估(测验- -学习学习- -再测验再测验)经验推测法经验推测法l这种效度是通过实践来检验效度这种效度是通过实践来检验效度l内容效度与表面效度内容效度与表面效度l定义:是指测验能够测量到理论上的构思或特质的程度,即测验的定义:是指测验能够测量到理论上的构思或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构思,解释的程度结果是否能证实或解释某一理论

49、的假设、术语或构思,解释的程度如何。如何。l估计方法估计方法对测验本身的分析对测验本身的分析l测验的内容效度测验的内容效度l测验的同质性测验的同质性l分析被试者对题目的反应特点分析被试者对题目的反应特点测验间的相互比较测验间的相互比较l相容效度是构思效度的一个证据。相容效度是构思效度的一个证据。l区分效度是构思效度的又一个证据。区分效度是构思效度的又一个证据。l因素分析法也是建立构思效度的常用方法因素分析法也是建立构思效度的常用方法。效标效度的研究证明(效标分组效标效度的研究证明(效标分组/分数分组,年龄变化)分数分组,年龄变化)实验法和观察法证实(训练)实验法和观察法证实(训练)l定义:又称

50、实证效度,反映的是测验预测个体在某种情境下行为表定义:又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。现的有效性程度。l估计方法估计方法相关法:相关法是评估效标效度最常用的方法,它是求测验分相关法:相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。数与效标资料间的相关,这一相关系数称为效度系数。区分法区分法 :分析高分组与低分组分布的重叠量。或者计算每一组:分析高分组与低分组分布的重叠量。或者计算每一组内得分超过(或低于)另一组平均数的人数百分比,或者计算内得分超过(或低于)另一组平均数的人数百分比,或者计算两组分布的共同区的百分

51、比。重叠量越大,说明两组分数差异两组分布的共同区的百分比。重叠量越大,说明两组分数差异越小,即测验的效度越差。越小,即测验的效度越差。命中率法命中率法:命中率法是当测验用来做取舍的依据时,用其正确:命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。决定的比例作为效度指标的一种方法。65LLHHLHNSNSXXt/2266l测验命中与失误的四中情况测验命中与失误的四中情况l效标成绩效标成绩失败(失败(-)成功(成功(+)l预测测验预测测验l成功(成功(+)(A)失误)失误(B)命中)命中l失败(失败(-)(C)命中)命中(D)失误)失误DCBACBPCT失误命中命中)

52、总命中率(BABPCP测验成功的人测验与效标皆成功的人)正命中率(l预测效标分数预测效标分数在测验工作中,人们感兴趣的是从测验分数预测效标成绩,因在测验工作中,人们感兴趣的是从测验分数预测效标成绩,因此最常用的是此最常用的是Y对对X的回归方程。的回归方程。l预测误差预测误差效度系数的实际意义常常以决定性系数来表示,意旨相关系数效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,其表达式是的平方,其表达式是rxy2,它表示测验正确预测或解释的效标的,它表示测验正确预测或解释的效标的方差占总方差的比例。方差占总方差的比例。另一种表达方法是另一种表达方法是估计的标准误估计的标准误,简写为,

53、简写为Sest,它是指所有具有,它是指所有具有某一测验分数的被试其效标分数(某一测验分数的被试其效标分数(Y)分布的标准差,也即真正)分布的标准差,也即真正效标分数落在某一范围内有多大可能性。效标分数落在某一范围内有多大可能性。l预测效率指数预测效率指数68l回归方程:回归方程:l为了得到一个回归方程,必须确定为了得到一个回归方程,必须确定a和和byx这两个常数的值。这两个常数的值。XbaYyx xyxyyxSSrb/.XbYayx69l估计标准误的公式为:估计标准误的公式为:l估计的标准误如同其他标准误一样解释。估计的标准误如同其他标准误一样解释。真正分数落在预测效标分数真正分数落在预测效标

54、分数1.96Sest的范围内,有的范围内,有95%的可能性,数落在预的可能性,数落在预测效标分数测效标分数2.58Sest的范围内,有的范围内,有99%的可能性。的可能性。2xyr1SDySest 70l预测效率指数:预测效率指数:lE值的大小表明使用测验比盲目猜测能减少多少误差。值的大小表明使用测验比盲目猜测能减少多少误差。例如一个测验的效度系数为例如一个测验的效度系数为0.80,那么,那么E=40,这表明,这表明由于测验的使用,使得我们在估计被试的效度分数时由于测验的使用,使得我们在估计被试的效度分数时减少了减少了40%的误差。的误差。)r11(100E2xy l测验本身的因素测验本身的因

55、素:测验取材的代表性、测验长度、试题类型、难度、区分度以及编排测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式都会影响效度。方式都会影响效度。l测验实施中的干扰因素测验实施中的干扰因素主试的影响因素主试的影响因素被试的影响因素被试的影响因素l样本团体的性质样本团体的性质样本团体的异质性样本团体的异质性干涉变量干涉变量l效标的性质效标的性质效标与测验分数之间的关系是否线性相关也是需要注意的一个因素。效标与测验分数之间的关系是否线性相关也是需要注意的一个因素。效标测量本身的可靠性如何亦是值得考虑的一个问题。效标测量本身的可靠性如何亦是值得考虑的一个问题。l第一单元第一单元项目的难度项

56、目的难度l第二单元第二单元项目的区分度项目的区分度l难度(难度(difficulty)的定义:是指项目的难易程度。)的定义:是指项目的难易程度。l难度的计算难度的计算二分法记分的项目二分法记分的项目非二分记分的项目非二分记分的项目l难度水平的确定难度水平的确定项目的难度项目的难度:P:P值越接近于值越接近于0.500.50,区别力越高。,区别力越高。测验的难度测验的难度l如果被试样本具有代表性,对于中等难度的测验,如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。其测验总分应该接近常态分配。l对于正偏态分布,必须增加足够数量的较容易的项对于正偏态分布,必须增加足够数量的较

57、容易的项目;对于负偏态分布,必须增加足够数量的有较高目;对于负偏态分布,必须增加足够数量的有较高难度的项目。难度的项目。74l二分法记分的项目二分法记分的项目未分组资料未分组资料分组资料分组资料校正通过率校正通过率l非二分法记分的项目非二分法记分的项目%100NRP 2PPPLH %100XXPmax 11KKPCP75为了使测验具有更大的鉴别力,应该选择难度在为了使测验具有更大的鉴别力,应该选择难度在0.500.50左右的试题比较左右的试题比较合适。但是,在实际工作中并非如此简单。如果难度都是合适。但是,在实际工作中并非如此简单。如果难度都是0.500.50,而试,而试题间都完全相关,则易形

58、成题间都完全相关,则易形成“U”U”分布。所以在选择题目时,最好难度分布。所以在选择题目时,最好难度水平接近水平接近0.500.50,而各题难度在,而各题难度在0.500.50 0.200.20之间变化。之间变化。当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。如选拔提高难度,诊断应降低难度。如选拔提高难度,诊断应降低难度。对于选择题来说,对于选择题来说,P P值一般应大于概率水平。如是非题,难度应该为值一般应大于概率水平。如是非题,难度应该为0.750.75最为合适;而对于四选一的题目,其难度约为最为合适;而对于四选一的

59、题目,其难度约为0.630.63时最为合适。时最为合适。76l定义:也叫鉴别力,是指测验项目对被试者的心理特性定义:也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。的区分能力。l计算方法计算方法鉴别指数鉴别指数lD=PH-PL相关法相关法l点二列相关:适用于一类变量为二分称名变量,另一类变量点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。为连续变量的成对变量的相关计算。l二列相关:适用于两个连续变量,但其中一个变量被人为分二列相关:适用于两个连续变量,但其中一个变量被人为分成两类成两类l相关法:适用于两个变量均为二分称名变量。若将测验总相关法:适用于两

60、个变量均为二分称名变量。若将测验总分按及格、不及格或录取、淘汰划分,便可计算分按及格、不及格或录取、淘汰划分,便可计算相关系数。相关系数。l区分度与难度的关系区分度与难度的关系781965年,美国心理测验专家伊贝尔(年,美国心理测验专家伊贝尔(L.Ebel)根)根据长期的经验提出鉴别指数评价项目性能的标准,见据长期的经验提出鉴别指数评价项目性能的标准,见下表。下表。鉴别指数(鉴别指数(D)项目评价项目评价0.40以上以上很好很好0.300.39良好,修改后会更佳良好,修改后会更佳0.200.29尚可,但需修改尚可,但需修改0.19以下以下差,必须淘汰差,必须淘汰79l点二列相关点二列相关l二列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论