测量心理学知识_第1页
测量心理学知识_第2页
测量心理学知识_第3页
测量心理学知识_第4页
测量心理学知识_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理测量学知识心理测量学知识姜长青姜长都医科大学附属北京安定医院首都医科大学附属北京安定医院国家职业资格培训教程国家职业资格培训教程讲课内容讲课内容 第一节第一节概述概述第二节第二节测验的常模测验的常模第三节第三节测验的信度测验的信度第四节第四节测验的效度测验的效度第五节第五节项目分析项目分析第六节第六节测验编制的一般程序测验编制的一般程序第七节第七节心理测验的使用心理测验的使用附:附:几个常用统计学概念几个常用统计学概念3第一节第一节概述概述 第一单元第一单元测量与测量量表测量与测量量表 第二单元第二单元心理测验的基本概念心理测验的基本概念 第三单元第三单元心理测

2、验的分类心理测验的分类 第四单元第四单元纠正错误的测验观纠正错误的测验观 第五单元第五单元心理测验在心理咨询中的应用心理测验在心理咨询中的应用 第六单元第六单元心理测验的发展史心理测验的发展史4第一单元第一单元测量与测量量表测量与测量量表 什么是测量什么是测量 测量要素测量要素 测量量表测量量表5什么是测量什么是测量 测量就是依据一定的法则用数字对事物加以确定。该测量就是依据一定的法则用数字对事物加以确定。该定义包括三个元素:事物、数字和法则。定义包括三个元素:事物、数字和法则。 1.1.所谓所谓“事物事物”,指的是我们要测量的对象,更准确,指的是我们要测量的对象,更准确地说,就是引起我们兴趣

3、的事物的属性或特征。地说,就是引起我们兴趣的事物的属性或特征。 2.2.所谓所谓“数字数字”,是代表某一事物或事物某一属性的,是代表某一事物或事物某一属性的量。量。 区分性、区分性、 序列性、序列性、等距性、等距性、 可加性可加性 3.3.所谓所谓“法则法则”,代表的是测量所依据的规则和方法。,代表的是测量所依据的规则和方法。 6测量要素测量要素 任何测量都应该具备这样两个要素:即参照点和单位。任何测量都应该具备这样两个要素:即参照点和单位。 参照点:要确定事物的量,必须有一个计算的起点,参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。这个起点叫做参照点。绝对零点绝对零点人定

4、的参照点即相对零点人定的参照点即相对零点 单位:是测量的基本要求,没有单位就无法进行测量单位:是测量的基本要求,没有单位就无法进行测量 有确定的意义有确定的意义有相同的价值有相同的价值7测量量表测量量表 测量的本质是根据某一法则在一个定有单位和参照点的连续测量的本质是根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。体上把事物的属性表现出来,这个连续体称为量表。量表的四种水平量表的四种水平 命名量表命名量表:代号代号/类别类别 顺序量表顺序量表:在顺序量表中,既无相等单位,又无绝对零点,数在顺序量表中,既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种

5、属性的真正量或绝对值。字仅表示等级,并不表示某种属性的真正量或绝对值。 等距量表等距量表:不但有大小关系,而且具有相等的单位,其数值可不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对的零点,因此不能做乘、除以相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。运算。 等比量表等比量表:是最高水平的量表,既有相等单位又有绝对零点。是最高水平的量表,既有相等单位又有绝对零点。那么,心理测量中使用的量表一般是什么量表呢?一般说来,那么,心理测量中使用的量表一般是什么量表呢?一般说来,心理测量是在顺序量表上进行的。心理测量是在顺序量表上进行的。8第二单元第二单元心理测验

6、的基本概念心理测验的基本概念 心理测验的定义心理测验的定义 心理测验的性质心理测验的性质9心理测验的定义心理测验的定义所谓心理测验,就是依据心理学理论,使用一定的操作程所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。科学手段。首先,心理测量的对象是人的行为首先,心理测量的对象是人的行为。其次,心理测量往往只是对少数经过慎重选择的行为样本其次,心理测量往往只是对少数经过慎重选择的行为样本

7、进行观察,来间接推知被试者的心理特征。进行观察,来间接推知被试者的心理特征。第三,为了使不同的被试者所获得的分数有比较的可能性,第三,为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。测验的条件对所有的被试者都必须是相同的。第四,个人在测验中所得到的原始分数并不具有什么意义,第四,个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。只有将它与其他人的分数或常模相比较才有意义。10心理测验的性质心理测验的性质 心理测量的间接性心理测量的间接性迄今为止,我们还无法直接测量人的心理,只能通过迄今为止,我们还无法直接测量人的心理

8、,只能通过测量人的外显行为,即通过测量人们对测验题目的反测量人的外显行为,即通过测量人们对测验题目的反应来推论出他的应来推论出他的心理特质心理特质。 心理测量的相对性心理测量的相对性 在对人的行为做比较时,没有绝对的标准,有的只是在对人的行为做比较时,没有绝对的标准,有的只是一个连续的行为序列。心理测量就是看某个人处在这一个连续的行为序列。心理测量就是看某个人处在这个序列的什么位置上。个序列的什么位置上。 心理测量的客观性:心理测量的客观性:1 1、测验的刺激是客观的、测验的刺激是客观的2 2、对反应的量化是客观的、对反应的量化是客观的3 3、对结果的推论是客观的、对结果的推论是客观的11第三

9、单元第三单元心理测验的分类心理测验的分类 按测验的功能分类按测验的功能分类 智力测验、特殊能力测验、人格测验智力测验、特殊能力测验、人格测验 按测验材料的性质分类按测验材料的性质分类 文字测验、操作测验文字测验、操作测验 按测验材料的严谨程度分类按测验材料的严谨程度分类 客观测验、投射测验客观测验、投射测验 按测验的方式分类按测验的方式分类 个别测验、团体测验个别测验、团体测验 按测验的要求分类按测验的要求分类 最高作为测验、典型行为测验最高作为测验、典型行为测验12第四单元第四单元纠正错误的测验观纠正错误的测验观 错误的测验观错误的测验观 测验万能论测验万能论 测验无用论测验无用论 某些人格

10、测验侵犯了个人隐私,违背民主原则某些人格测验侵犯了个人隐私,违背民主原则 测验为宿命论和种族歧视提供了心理学依据测验为宿命论和种族歧视提供了心理学依据 心理测验心理测验=智力测验智力测验=智商智商=遗传决定论遗传决定论 正确的测验观正确的测验观 心理测验是重要的心理学研究方法之一,是决策的心理测验是重要的心理学研究方法之一,是决策的辅助工具辅助工具 心理测验作为研究方法和测量工具尚不完善心理测验作为研究方法和测量工具尚不完善13第五单元第五单元心理测验在心理咨询中的应用心理测验在心理咨询中的应用 智力测验智力测验:可在求助者有特殊要求时及对方有:可在求助者有特殊要求时及对方有可疑智力障碍的情况

11、下应用;可疑智力障碍的情况下应用; 人格测验人格测验:有助于治疗者对求助者人格特征的:有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作;针对性地开展咨询与心理治疗工作; 心理评定量表心理评定量表:用于检查求助者某方面心理障:用于检查求助者某方面心理障碍的存在与否或其程度如何。碍的存在与否或其程度如何。14第六单元第六单元心理测验的发展史心理测验的发展史 科学心理测验的产生与发展科学心理测验的产生与发展 现代心理测验在我国的发展现代心理测验在我国的发展15科学心理测验的产生与发展(科学心理测验的产生与发展

12、(1) 首先倡导科学心理测验首先倡导科学心理测验的学者是英国生物学家的学者是英国生物学家和心理学家高尔登(和心理学家高尔登(F. F. GaltonGalton),因此他的工),因此他的工作被视为作被视为心理测验的开心理测验的开端端。此外,高尔登也为。此外,高尔登也为心理测验奠定了心理测验奠定了统计学统计学基础基础,即首先提出了,即首先提出了相相关的概念关的概念。FrancisGalton(1822-1911)16 18901890年,卡特尔在年,卡特尔在心理心理杂志上发表杂志上发表“心理测验与测量心理测验与测量”一文,这是一文,这是心理测验心理测验第一次出现于心理学第一次出现于心理学文献中文

13、献中。并提出心理并提出心理测验的结果应与测验的结果应与常模常模进行比较。进行比较。科学心理测验的产生与发展(科学心理测验的产生与发展(2)J.M.Cattell(1860-1944)17科学心理测验的产生与发展(科学心理测验的产生与发展(3) 19051905年,年,比内比内(A.BinetA.Binet)与其助手西蒙(与其助手西蒙(T.SimonT.Simon)研究制作了研究制作了世界上第一个世界上第一个正式的心理测验正式的心理测验。AfredBinet(1857-1911)18科学心理测验的产生与发展(科学心理测验的产生与发展(4) 操作测验的发展操作测验的发展由于理论上的缺陷和实际上的需

14、要,所以有操作测由于理论上的缺陷和实际上的需要,所以有操作测验的问世。验的问世。 团体智力测验的发展团体智力测验的发展团体测验始于第一次世界大战,在推孟的研究生欧团体测验始于第一次世界大战,在推孟的研究生欧提斯所编团体智力测验的基础上发展了陆军甲种和乙提斯所编团体智力测验的基础上发展了陆军甲种和乙种智力测验。种智力测验。 能力倾向测验的发展能力倾向测验的发展分析个人心理品质的内部结构,为职业选拔与安置分析个人心理品质的内部结构,为职业选拔与安置提供依据。提供依据。 普通能力倾向(智力)测验也向多元化发展。普通能力倾向(智力)测验也向多元化发展。 人格测验的发展人格测验的发展测量情感或行为等非智

15、力方面的人格因素。测量情感或行为等非智力方面的人格因素。19现代心理测验在我国的发展现代心理测验在我国的发展 我国近代心理测验大约源于我国近代心理测验大约源于1914年前后。年前后。 上世纪二、三十年代,我国心理学家曾两次修订过比内上世纪二、三十年代,我国心理学家曾两次修订过比内-西蒙量表。西蒙量表。 1979年后,全国各地的心理学家组织起多个协作组,年后,全国各地的心理学家组织起多个协作组,先后对国外的广泛采用的智力和人格测量工具进行修订。先后对国外的广泛采用的智力和人格测量工具进行修订。 近些年来我国的心理学家正在致力于测验本土化,编制近些年来我国的心理学家正在致力于测验本土化,编制适合我

16、国文化背景的智力测验,适应行为量表等,并已适合我国文化背景的智力测验,适应行为量表等,并已取得了初步成功。取得了初步成功。20第二节第二节测验的常模测验的常模 第一单元第一单元常模团体常模团体 第二单元第二单元常模的类型常模的类型 第三单元第三单元常模分数的表示方法常模分数的表示方法21第一单元第一单元常模团体常模团体 常模团体的性质常模团体的性质 常模团体的条件常模团体的条件 取样的方法取样的方法 常模与常模分数常模与常模分数22常模团体的性质常模团体的性质 常模团体是由具有某种共同特征的人所组成的常模团体是由具有某种共同特征的人所组成的一个一个群体群体,或者是该群体的一个,或者是该群体的一

17、个样本样本。 对测验编制者而言,常模的选择主要是基于对对测验编制者而言,常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:够代表该总体。这种工作包括:确定一般总体确定一般总体确定目标总体确定目标总体确定样本。确定样本。 对测验的使用者来说,要考虑的问题是,现有对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。的常模团体哪一个最合适。23常模团体的条件常模团体的条件 群体的构成必须明确界定群体的构成必须明确界定依据不同的变量确定群体,便可得到不同的常模。依据不同的变量确定群体,便可得到不同的常模。 常模

18、团体必须是所测群体的代表性样本常模团体必须是所测群体的代表性样本当所要测量的群体很小时,将所有的人逐个测量,当所要测量的群体很小时,将所有的人逐个测量,其平均分便是该群体的最可靠的常模。其平均分便是该群体的最可靠的常模。在群体较大时,因为时间和人力物力的限制,只能在群体较大时,因为时间和人力物力的限制,只能测量一部分人作为总体的代表。测量一部分人作为总体的代表。 样本的大小要适当样本的大小要适当总体数目小,只有几十个人,则需要总体数目小,只有几十个人,则需要100%100%的样本。的样本。如果总体数目大,相应的样本也大,一般最低不小如果总体数目大,相应的样本也大,一般最低不小于于3030或或1

19、00100个。个。样本大小适当的关键是样本要有代表性。样本大小适当的关键是样本要有代表性。 标准化样组是一定时空的产物标准化样组是一定时空的产物24取样的方法取样的方法 取样即从目标总体或目标人群中选择有代表性的样本取样即从目标总体或目标人群中选择有代表性的样本 简单随机抽样简单随机抽样:在简单随机抽样中,每个人或抽样单在简单随机抽样中,每个人或抽样单位都有相同的机会被抽中。位都有相同的机会被抽中。 系统抽样系统抽样: 又称等距抽样,就是将已经编好号码的个体排成顺序,然后又称等距抽样,就是将已经编好号码的个体排成顺序,然后按每隔若干个号码抽取一个。按每隔若干个号码抽取一个。 系统抽样要求目标总

20、体无序可排,也无等级结构存在。系统抽样要求目标总体无序可排,也无等级结构存在。 分组抽样分组抽样:先将群体分组,再在组内进行随机取样先将群体分组,再在组内进行随机取样。 分层抽样分层抽样:先将目标总体分成若干层次,再从各层次先将目标总体分成若干层次,再从各层次中随机抽取若干被试,最后把各层的被试组合成常模中随机抽取若干被试,最后把各层的被试组合成常模样本。包括分层比例抽样和分层非比例抽样样本。包括分层比例抽样和分层非比例抽样25常模与常模分数常模与常模分数 常模常模 常模是一种供比较的标准量数,由标准化样本测试常模是一种供比较的标准量数,由标准化样本测试结果计算而来,它是心理测验时用于比较和解

21、释测结果计算而来,它是心理测验时用于比较和解释测验结果的参照分数标准。验结果的参照分数标准。常模有全国常模、区域常模和特殊常模常模有全国常模、区域常模和特殊常模。 常模分数常模分数 常模分数就是施测常模样本被试后,将被试者的原常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。始分数按一定规则转换出来的导出分数。 原始分数本身没有多大意义,必须转换成导出分数原始分数本身没有多大意义,必须转换成导出分数。26第二单元第二单元常模的类型常模的类型 发展常模发展常模 百分位常模百分位常模 标准分常模标准分常模 智商的计算及意义智商的计算及意义27发展常模发展常模 发展常模

22、,亦称发展常模,亦称年龄量表年龄量表。在此量表中,个人。在此量表中,个人的分数指出他的行为在按正常途径发展方面处的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。于什么样的发展水平。 发展常模主要包括:发展常模主要包括: 发展顺序量表发展顺序量表 智力年龄智力年龄 年级当量年级当量28发展常模(发展常模(1)/发展顺序量表发展顺序量表 最直观的发展常模最直观的发展常模是发展顺序量表,因为它告是发展顺序量表,因为它告诉人们多大的儿童具备什么能力或行为就表明诉人们多大的儿童具备什么能力或行为就表明其发育其发育正常正常,相应能力或行为早于某年龄出现,相应能力或行为早于某年龄出现,说明发育说

23、明发育超前超前,否则即为发育,否则即为发育滞后滞后。 最早的一个范例是最早的一个范例是葛塞尔发展程序表葛塞尔发展程序表,其中按,其中按月份显示出儿童在运动水平、适应性、语言、月份显示出儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。社会性四个方面的大致发展水平。29发展常模(发展常模(2)/智力年龄智力年龄 简称智龄,比内简称智龄,比内- -西蒙量表中首先使用智西蒙量表中首先使用智龄的概念。龄的概念。 计算方法:计算方法:方法一方法一:基础年龄与在较高年龄水平的题基础年龄与在较高年龄水平的题目上获得的附加月份之和。目上获得的附加月份之和。方法二:将标准化样本中每个年龄组的平方法二:

24、将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分数均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智龄。与年龄常模对比,便可求得每个人的智龄。30发展常模(发展常模(3)/年级当量年级当量 年级当量实际上就是年级当量实际上就是年级量表年级量表,测验结果说明属哪一,测验结果说明属哪一年级的水平,在教育成就测验中最常用。其表述方式年级的水平,在教育成就测验中最常用。其表述方式常常是:某学生的算术是常常是:某学生的算术是6 6年级水平,阅读是年级水平,阅读是4 4年级水年级水平,理解是平,理解是5 5年级的水平等。年级的水平等。 年级量表的单位年级量表的单位通常

25、为通常为10个月个月,以,以10个月为一个年级,个月为一个年级,这种做法是假设一学年中两个月的假期在所测量目标这种做法是假设一学年中两个月的假期在所测量目标的发展上是不重要的。例如,的发展上是不重要的。例如,40(或(或4.0)表示四年)表示四年级开始时的平均成绩,级开始时的平均成绩,45(或(或4.5)表示学年中间的)表示学年中间的平均成绩。平均成绩。31百分位常模百分位常模 百分等级百分等级 指在常模样本中低于这个分数的人数百分比。指在常模样本中低于这个分数的人数百分比。 百分点百分点百分点也称百分位数,与百分等级的计算方法不同。百分点也称百分位数,与百分等级的计算方法不同。百分等级是计算

26、低于百分等级是计算低于某测验分数某测验分数的人数的人数百分比百分比,而,而百分点则是计算处于某一百分点则是计算处于某一百分比例百分比例的人对应的的人对应的测验测验分数分数是多少是多少。 四分位数和十分位数四分位数和十分位数四分位数和十分位数是百分位数的两个变式,其含四分位数和十分位数是百分位数的两个变式,其含义相似。义相似。32标准分标准分常模常模标准分数是将原始分数与平均数的距离以标准差为单位表示出来标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。的量表。因为它的基本单位是标准差,所以叫标准分数。1线性转换的标准分数(按下面公式计算)

27、线性转换的标准分数(按下面公式计算)T T分数:平均数为分数:平均数为5050,标准差为,标准差为1010标准九分:以标准九分:以5 5为平均数,以为平均数,以2 2为标准差为标准差标准十分:平均数为标准十分:平均数为5.55.5,标准差为,标准差为1.51.5;标准二十分:平均数为标准二十分:平均数为1010,标准差为,标准差为3 32非线性转换的标准分数(根据常态化转换)非线性转换的标准分数(根据常态化转换)对每个原始分数值计算累积百分比对每个原始分数值计算累积百分比/ /百分等级;百分等级;在常态曲线面积表中,求出对于该百分比的在常态曲线面积表中,求出对于该百分比的z z分数分数。SDX

28、XzBzAZ33智商的计算及其意义智商的计算及其意义 心理年龄心理年龄/智力年龄智力年龄 比率智商比率智商 离差智商离差智商 离差智商表示个体智力在年龄组中所处的位置,因而离差智商表示个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。是表示智力高低的一种理想的指标。100CAMAIQ SD)XX(15100IQ 34第三单元第三单元常模分数表示法常模分数表示法 转换表法转换表法最简单、最基本的表示常模的方法就是转换表,也最简单、最基本的表示常模的方法就是转换表,也叫叫常模表常模表。测验的使用者利用转换表可将原始分数。测验的使用者利用转换表可将原始分数转换为与其对应的导出分数,从

29、而对测验的分数作转换为与其对应的导出分数,从而对测验的分数作出有意义的解释。出有意义的解释。 剖面图法剖面图法 剖面图是将测验分数的转换关系用图形表示出来。剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。的表现及其相对的位置。35第三节第三节测验的信度测验的信度 第一单元第一单元信度的概念信度的概念 第二单元第二单元信度的估计方法信度的估计方法 第三单元第三单元信度与测验分数的解释信度与测验分数的解释 第四单元第四单元影响信度的因素影响信度的因素36第一单元第一单元信度的概念信度的概念 信

30、度的定义信度的定义 也称也称稳定性稳定性或或可靠性可靠性,指同一被试在不同时间内用同一测验,指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的(或用另一套相等的测验)重复测量,所得结果的一致程度一致程度。 信度只受信度只受随机误差随机误差的影响,随机误差越大,信度越低。系统的影响,随机误差越大,信度越低。系统误差产生恒定效应,不影响信度。误差产生恒定效应,不影响信度。 信度的指标信度的指标 信度系数:信度系数: 信度指数信度指数:信度指数的平方就是信度系数。信度指数的平方就是信度系数。 测量标准误测量标准误xxxrSSE1xxr37第二单元第二单元信度的估计方法信度的

31、估计方法 重测信度重测信度 复本信度复本信度 内部一致性信度内部一致性信度 评分者信度评分者信度38信度的估计方法(信度的估计方法(1) 重测信度(重测信度(test-retestreliability) 又称又称稳定性系数稳定性系数。它的计算方法是采用重测法,即。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。施测两次测验,求两次得分间的相关系数。 最适宜的时距随测验的目的、性质和被试特点而异,最适宜的时距随测验的目的、性质和被试特点而异,一般是一般是两周到四周较宜两周到四周较宜,间隔时

32、间最长,间隔时间最长不超过六个不超过六个月月。 重测信度的误差来源主要是重测信度的误差来源主要是时间误差时间误差。39信度的估计方法(信度的估计方法(2) 复本信度(复本信度(alternate-formreliability) 又称又称等值性系数等值性系数,它是以两个等值但题目不同的测它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度的高低。 如果两个复本的施测相隔一段时间,则称如果两个复本的施测相隔一段时间,则称重

33、测复本重测复本信度信度或或稳定与等值系数稳定与等值系数。 复本信度高低主要受内容误差的影响,重测复本信复本信度高低主要受内容误差的影响,重测复本信度则既受内容误差影响,也受时间误差影响。度则既受内容误差影响,也受时间误差影响。40信度的估计方法(信度的估计方法(3) 内部一致性信度(内部一致性信度(internalconsistencyreliability) 分半信度(分半信度(split-halfreliability) 是在测验实施后将测验按奇、偶数分为等值的两半,并分是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的别计算每位被试在两半

34、测验上的得分,求出这两半分数的相关系数。相关系数。 分半法经常会低估信度,必须通过一些公式去修正,借以分半法经常会低估信度,必须通过一些公式去修正,借以估计整个测验的信度估计整个测验的信度。 同质性信度(同质性信度(homogeneityreliability) 同质性主要代表测验内部所有题目间的一致性。同质性主要代表测验内部所有题目间的一致性。 当各个测题的得分有较高的正相关时,不论题目的内容和当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验为同质的。相反,即使所有题目看起来好形式如何,测验为同质的。相反,即使所有题目看起来好象测量同一特质,但相关很低或为负相关时,则测验为异

35、象测量同一特质,但相关很低或为负相关时,则测验为异质的。质的。41信度的估计方法(信度的估计方法(4) 评分者信度(评分者信度(scorerreliability) 随机抽取若干份测验卷,由两位评分者按评分标准随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。相关,即得评分者信度。 一般要求在成对的受过训练的评分者之间平均一致一般要求在成对的受过训练的评分者之间平均一致性达性达0.90以上,才认为评分是客观的。以上,才认为评分是客观的。 当多个评分者评定多个对象,并以等级法记分时,当多个评分

36、者评定多个对象,并以等级法记分时,可采用特定公式去估计评分者信度。可采用特定公式去估计评分者信度。 评分者主要用于测量不同评分者之间所产生的误差。评分者主要用于测量不同评分者之间所产生的误差。42第三单元第三单元信度与测验分数的解释(信度与测验分数的解释(1) 解释真实分数与实得分数的相关解释真实分数与实得分数的相关 信度系数可以解释为总的方差中有多少比例是由真信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。数造成的变异占百分之几。 确定信度可以接受的水平确定信度可以接受的水平当当r r

37、xxxx0.700.70时,测验不能用于对个人作出评价或时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当预测,而且不能作团体比较;当0.70r0.70rxxxx0.850.85时,时,可用于团体比较;当可用于团体比较;当r rxxxx0.850.85时,才能用来鉴别或时,才能用来鉴别或预测个人成绩或作为。预测个人成绩或作为。43第三单元第三单元信度与测验分数的解释(信度与测验分数的解释(2) 解释个人分数的意义解释个人分数的意义 其一是估计真实分数的范围其一是估计真实分数的范围;其二是了解实得分数再其二是了解实得分数再测时可能的变化情形测时可能的变化情形。这就是测量标准误的应用。这

38、就是测量标准误的应用。 人们一般采用人们一般采用95%的概率水平,其置信区间为:的概率水平,其置信区间为:X1.96SEXT1.961.96SE 比较不同测验分数的差异比较不同测验分数的差异 这种比较包括这种比较包括两个人不同分数的差别两个人不同分数的差别和和同一被试在两同一被试在两个测验上的差别个测验上的差别。这就是差异分数的标准误问题。这就是差异分数的标准误问题。 当当两个分数的两个分数的差异差异1.96SEd时,说明有时,说明有显著意义。显著意义。44第四单元第四单元影响信度的因素影响信度的因素 样本特征样本特征 样本团体的异质性:一般而言,若获得信度的取样团体较常样本团体的异质性:一般

39、而言,若获得信度的取样团体较常模总体为异质的话,往往会高估测验的信度,相反会低估测模总体为异质的话,往往会高估测验的信度,相反会低估测验的信度。验的信度。 样本团体的平均能力水平:不同水平的团体,难度不同样本团体的平均能力水平:不同水平的团体,难度不同 测验长度测验长度:一般来说,在一个测验中增加同质的题:一般来说,在一个测验中增加同质的题目,可以使信度提高。目,可以使信度提高。 测验越长,测验的测题取样或内容取样就越有代表性。测验越长,测验的测题取样或内容取样就越有代表性。 测验越长,被试的猜测因素影响就越小。测验越长,被试的猜测因素影响就越小。 测验难度测验难度 通常难度的平均水平为中等难

40、度(通常难度的平均水平为中等难度(0.50)较好。)较好。 时间间隔时间间隔45第四节第四节测验的效度测验的效度 第一单元第一单元效度的概念效度的概念 第二单元第二单元效度评估的方法效度评估的方法 第三单元第三单元效度的功能效度的功能 第四单元第四单元影响效度的因素影响效度的因素46第一单元第一单元效度的概念效度的概念 效度的定义效度的定义 效度也称效度也称准确性准确性或或有效性有效性,是指所测量的与所要测量的心理,是指所测量的与所要测量的心理特点之间的特点之间的符合程度符合程度。 效度除受随机误差影响外,还受系统误差的影响。效度除受随机误差影响外,还受系统误差的影响。 效度的性质效度的性质

41、效度具有相对性效度具有相对性 任何测验的效度是对一定的目标来说的,或者说测验只有用于任何测验的效度是对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效。与测验目标一致的目的和场合才会有效。 效度具有连续性效度具有连续性 测验效度通常用相关系数(测验效度通常用相关系数()来表示,它只有程度上的不)来表示,它只有程度上的不同。我们评价一个测验时,不应该说同。我们评价一个测验时,不应该说“有效有效”或或“无效无效”,而,而应该用效度较高或效度较低来评价。应该用效度较高或效度较低来评价。xyr47第二单元第二单元效度的估计方法效度的估计方法 内容效度内容效度 构想效度构想效度 效

42、标效度效标效度48内容效度内容效度定义定义: : 也称也称逻辑效度逻辑效度,指的是测验题目对有关内容或行为取样的,指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。估计方法估计方法 专家判断法专家判断法 定义好测验内容的总体范围;定义好测验内容的总体范围; 编制双向细目表,确定内容和技能各自所占的比例;编制双向细目表,确定内容和技能各自所占的比例; 制定评定量表来测量测验的整个效度。制定评定量表来测量测验的整个效度。统计分析法统计分析法 计算两个评分者之间评定的一致性(评分者信度)计算两个评分

43、者之间评定的一致性(评分者信度) 两个测验复本上得分之相关(复本信度)两个测验复本上得分之相关(复本信度) 再测法也可用于内容效度的评估(测验再测法也可用于内容效度的评估(测验- -学习学习- -再测验)再测验)经验推测法经验推测法 这种效度是通过实践来检验效度这种效度是通过实践来检验效度内容效度与表面效度内容效度与表面效度49构想效度构想效度定义:也称定义:也称构思效度构思效度或或结构效度结构效度,是指测验能够测量到理论上的,是指测验能够测量到理论上的构思或特质的程度,即测验的结果是否能证实或解释某一理论的构思或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构思,解释的程度如

44、何。假设、术语或构思,解释的程度如何。估计方法估计方法 对测验本身的分析对测验本身的分析 测验的内容效度测验的内容效度 测验的内部一致性测验的内部一致性 分析被试者对题目的反应特点分析被试者对题目的反应特点 测验间的相互比较测验间的相互比较 相容效度是构思效度的一个证据。相容效度是构思效度的一个证据。 区分效度是构思效度的又一个证据。区分效度是构思效度的又一个证据。 因素分析法也是建立构思效度的常用方法因素分析法也是建立构思效度的常用方法。 效标效度的研究证明(效标分组效标效度的研究证明(效标分组/分数分组,年龄变化)分数分组,年龄变化) 实验法和观察法证实(训练)实验法和观察法证实(训练)5

45、0效标效度效标效度定义:又称定义:又称实证效度实证效度,反映的是测验预测个体在某种情境下行为,反映的是测验预测个体在某种情境下行为表现的有效性程度。表现的有效性程度。估计方法估计方法相关法相关法:相关法是评估效标效度最常用的方法,它是相关法是评估效标效度最常用的方法,它是求测验求测验分数与效标资料间的相关分数与效标资料间的相关,这一相关系数称为效度系数。,这一相关系数称为效度系数。区分法区分法 :是检验测验分数能否有效地分析由效标所定义的团是检验测验分数能否有效地分析由效标所定义的团体的一种方法。或者计算每一组内得分超过(或低于)另一体的一种方法。或者计算每一组内得分超过(或低于)另一组平均数

46、的人数百分比,或者计算两组分布的共同区的百分组平均数的人数百分比,或者计算两组分布的共同区的百分比。比。重叠量越大,说明两组分数差异越小,即测验的效度越重叠量越大,说明两组分数差异越小,即测验的效度越差。差。命中率法命中率法:命中率法是当测验用来做取舍的依据时,用其正:命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。确决定的比例作为效度指标的一种方法。51第三节第三节效度的功能效度的功能 预测误差预测误差 效度系数的实际意义常常以决定性系数来表示,意旨相关系效度系数的实际意义常常以决定性系数来表示,意旨相关系数的平方,其表达式是数的平方,其表达式是rxy2,它表示

47、测验正确预测或解释的效,它表示测验正确预测或解释的效标的方差占总方差的比例。标的方差占总方差的比例。 另一种表达方法是另一种表达方法是估计的标准误估计的标准误,简写为,简写为Sest,它是指所有具,它是指所有具有某一测验分数的被试其效标分数(有某一测验分数的被试其效标分数(Y)分布的标准差,也即)分布的标准差,也即真正效标分数落在某一范围内有多大可能性。真正效标分数落在某一范围内有多大可能性。 预测效标分数预测效标分数 在测验工作中,人们感兴趣的是从测验分数预测效标成绩,在测验工作中,人们感兴趣的是从测验分数预测效标成绩,因此最常用的是因此最常用的是Y对对X的回归方程。的回归方程。 预测效率指

48、数预测效率指数52第四单元第四单元影响效度的因素影响效度的因素 测验本身的因素测验本身的因素: 测验取材的代表性、测验长度、试题类型、难度、区分度以及编测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式都会影响效度。排方式都会影响效度。 测验实施中的干扰因素测验实施中的干扰因素 主试的影响因素:包括指导语、时限、评分、测验情境等。主试的影响因素:包括指导语、时限、评分、测验情境等。 被试的影响因素:包括兴趣、动机、情绪、态度、心身状态等。被试的影响因素:包括兴趣、动机、情绪、态度、心身状态等。 样本团体的性质样本团体的性质 样本团体的异质性样本团体的异质性 干涉变量干涉变量:如动机

49、、兴趣(:如动机、兴趣(0.20 0.60)等。)等。 效标的性质效标的性质效标测量本身的可靠性如何是值得考虑的一个问题。效标测量本身的可靠性如何是值得考虑的一个问题。53第五节第五节项目分析项目分析 第一单元第一单元项目的难度项目的难度 第二单元第二单元项目的区分度项目的区分度54第一单元第一单元项目的难度(项目的难度(1) 难度(难度(difficulty)的定义:是指项目的难易程度,在非)的定义:是指项目的难易程度,在非能力测验中类似的指标称为能力测验中类似的指标称为“通俗性通俗性”。 计算方法计算方法 二分法记分的项目二分法记分的项目 未分组资料未分组资料 分组资料分组资料 非二分记分

50、的项目非二分记分的项目%100NRP 2PPPLH %100XXPmax 55第一单元第一单元项目的难度(项目的难度(2) 难度水平的确定难度水平的确定项目的难度项目的难度:P:P值越接近于值越接近于0.500.50,区别力越高。,区别力越高。 测验的难度测验的难度 如果被试样本具有代表性,对于中等难度的测验,如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近其测验总分应该接近常态分配常态分配。 正偏态分布正偏态分布,大多数得分集中在低分端,必须增,大多数得分集中在低分端,必须增加足够数量的较容易的项目;加足够数量的较容易的项目;负偏态分布负偏态分布,大多,大多数得分集中在高高分端

51、,必须增加足够数量的有数得分集中在高高分端,必须增加足够数量的有较高难度的项目。较高难度的项目。 一般来说,最好使测验中所包含的试题的难度在一般来说,最好使测验中所包含的试题的难度在0.50.50.20.2之间,平均难度接近之间,平均难度接近0.5.0.5.56第二单元第二单元项目的区分度项目的区分度 定义:也叫鉴别力,是指测验项目对被试者的心理特定义:也叫鉴别力,是指测验项目对被试者的心理特性的区分能力。性的区分能力。 计算方法计算方法 鉴别指数鉴别指数D=PHPL 相关法相关法 常用的计算方法有点二列相关、二列相关和常用的计算方法有点二列相关、二列相关和相关法。相关法。 相关越高,表明项目

52、越具有区分的能力。相关越高,表明项目越具有区分的能力。 区分度与难度的关系区分度与难度的关系为了使测验具有更大的区别力,应选择难度值在为了使测验具有更大的区别力,应选择难度值在0.50.5左右的试左右的试题比较合适。假如某测验各试题间的相关系数均为题比较合适。假如某测验各试题间的相关系数均为1.001.00,项,项目难度均为目难度均为0.500.50,则易形成,则易形成“U U”形分布,这样反而降低测验形分布,这样反而降低测验总分的区分能力。总分的区分能力。57第六节第六节 测验编制的一般程序测验编制的一般程序 第一单元第一单元测验的目标分析测验的目标分析 第二单元第二单元测题的编写测题的编写

53、 第三单元第三单元测题的编排与组织测题的编排与组织58第一单元第一单元测验的目标分析测验的目标分析 测验的对象测验的对象 测验的用途测验的用途 测验的目标测验的目标59测验的对象测验的对象 描述:描述:在编制测验时必须明确测量对象,也就是该测验编在编制测验时必须明确测量对象,也就是该测验编成后要用于何种团体。成后要用于何种团体。 要考虑的因素:要考虑的因素:年龄、文化程度、社会经济条件及阅读水平等。年龄、文化程度、社会经济条件及阅读水平等。如如WAIS-RCWAIS-RC按被试者生活的社会经济条件分为城市版按被试者生活的社会经济条件分为城市版和农村版。和农村版。60测验的用途测验的用途 描述:

54、描述:所所编编的的测验是要对被试做描述测验是要对被试做描述还是预测还是预测,是用于诊是用于诊断还是断还是还是选拔,这一点在测验编制前就应明确还是选拔,这一点在测验编制前就应明确的的。用途不同,编制测验时的取材范围及试题难度等也用途不同,编制测验时的取材范围及试题难度等也不尽相同不尽相同。 测验的分类:测验的分类:显示性测验:指测验题目和要测量的特征相似的测显示性测验:指测验题目和要测量的特征相似的测验,比如成就测验,它所反映的是被试具有什么能验,比如成就测验,它所反映的是被试具有什么能力,能完成什么任务。力,能完成什么任务。预测性测验:为了预测一些没有被测量的行为的测预测性测验:为了预测一些没

55、有被测量的行为的测验,即希望测验能作出对未知情况的预测。验,即希望测验能作出对未知情况的预测。61测验的目标测验的目标 描述描述:指编制的测验是测什么的,即测什么样的心理指编制的测验是测什么的,即测什么样的心理变量变量或或行为特征行为特征。 目标分析目标分析工作分析工作分析/ / 第一是确定哪些心理特征和行为可以使要预测的活动达到第一是确定哪些心理特征和行为可以使要预测的活动达到成功成功 第二是建立衡量被试是否成功的标准,这个标准我们称之第二是建立衡量被试是否成功的标准,这个标准我们称之为效标为效标 对特定概念下定义对特定概念下定义/ /确定测验的具体内容确定测验的具体内容/ /62第二单元第

56、二单元测题的编写测题的编写 搜集资料搜集资料 命题原则命题原则 编制要领编制要领63搜集资料搜集资料 已出版的标准测验已出版的标准测验最简单、最直接的方法是从已经出版的各种标准测最简单、最直接的方法是从已经出版的各种标准测验中选择合适的题目验中选择合适的题目 理论和专家的经验理论和专家的经验理论和专家经验有时也可以作为题目的来源之一理论和专家经验有时也可以作为题目的来源之一 临床观察和记录临床观察和记录临床的观察也可以作为题目的来源临床的观察也可以作为题目的来源 64命题原则命题原则 (1)内容方面内容方面试题要符合测验的目的;试题要符合测验的目的;内容取样要有代表性;内容取样要有代表性;题目

57、间内容相互独立,互不牵连;题目间内容相互独立,互不牵连;文字方面文字方面使用准确的当代语言,避免使用生僻的字句或词汇使用准确的当代语言,避免使用生僻的字句或词汇 语句要简明扼要,既要排除与答案无关的因素,又不能遗漏语句要简明扼要,既要排除与答案无关的因素,又不能遗漏答题所依据的必要条件答题所依据的必要条件;最好是一句话说明一个概念,尽量少使用双重否定句最好是一句话说明一个概念,尽量少使用双重否定句 理解方面理解方面题目应有确切的题目应有确切的答案答案,题目内容不能超出受测团体的知识水,题目内容不能超出受测团体的知识水平和理解能力;平和理解能力;题目题目不可令人费解,更不能有歧义。不可令人费解,

58、更不能有歧义。社会敏感性方面社会敏感性方面避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。应使用。65命题原则命题原则 (2) 可是有些测验必须涉及这类社会敏感性问题,可是有些测验必须涉及这类社会敏感性问题,那么怎样鼓励被试作出真实的回答呢?菲力普那么怎样鼓励被试作出真实的回答呢?菲力普(Phillips,D.L.)列举了几条策略值得参考:)列举了几条策略值得参考: 命题时假定被试具有某种行为,使他不得不命题时假定被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定答在确实没有该行为时才否定,可避免否定答案过多的倾向。

59、案过多的倾向。 命题时假定规范不一致命题时假定规范不一致 指出该行为是常见的,虽然是违规的指出该行为是常见的,虽然是违规的66编制要领编制要领 对心理测验的题目进行分类的标准很多,常见的分类是对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:提供型根据对被试的要求不同来分,可以分为两大类:提供型(supply)和选择型()和选择型(selection)题目。)题目。 选择型题目:要求被试在几个选项中选择正确答案选择型题目:要求被试在几个选项中选择正确答案选择题选择题是非题是非题匹配题匹配题 提供型题目:要求被试提供答案提供型题目:要求被试提供答案简答题简

60、答题论文题:论文题:填充题填充题67第三单元第三单元测验的编排和组织测验的编排和组织 合成测验合成测验 测验的预试测验的预试 信度与效度考察信度与效度考察 常模制定常模制定 编写指导手册编写指导手册68合成测验(合成测验(1) 筛选与审定试题筛选与审定试题选择试题形式选择试题形式 测验的目的和材料的性质:简答题、选择题、论文题测验的目的和材料的性质:简答题、选择题、论文题 接受测验的团体的特点:口头测验、操作测验接受测验的团体的特点:口头测验、操作测验 各种实际因素:团体纸笔测验、操作测验各种实际因素:团体纸笔测验、操作测验 审定题目审定题目 材料内容以及所测量的认知技能上的比率与材料内容以及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论