心理测量学知识_第1页
心理测量学知识_第2页
心理测量学知识_第3页
心理测量学知识_第4页
心理测量学知识_第5页
已阅读5页,还剩205页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

心理测量学信忠义E-mail:心理测量学知识感悟测量测量无处不在……心理测量学知识城市夜晚灯光亮度与GDP科学家发现可以通过太空拍摄城市夜间灯光亮度,来反映全球各国经济的发展水平。心理测量学知识这是一张卫星合成图。一些国家经济增长迅速,建了更多的基础设施(如街道照明),而人们晚上也会打开更多的灯。这表明,从太空中看到的夜间灯光强度与一个国家的国内生产总值存在关联。在某些相关经济数据极少或存在误导的地区,这种经济情况评估方式会大有用武之地。心理测量学知识这是北美地区夜间灯光的分布情况。北美是世界上最富裕的地区之一。心理测量学知识西欧的夜晚同样是灯火通明心理测量学知识这张图显示的是南美海岸、哥伦比亚北部和委内瑞拉的人口稠密地区。不难看出,内陆地区灯光强度相对很弱。心理测量学知识亚洲既有发达国家,也有发展中国家,中印两国经济的快速增长尤其引人注意。这张图上,还可以看到日本稠密的灯光覆盖情况。对比最明显的是南北朝鲜。心理测量学知识2012年中国家庭金融调查与研究中心发布一份《中国家庭金融调查报告》称,中国家庭资产平均为121.69万元,城市家庭平均为247.60万元;中国家庭自有住房拥有率为89.68%,远超世界60%左右的水平,甚至高过美国和日本;2011年中国城市户均拥有住房为1.22套。事实上这一报告的出炉,引起了人们的议论。与人们对人均GDP的反应一样,首先认为数据准确度不高;其次,惊呼自己拖了国家的后腿。这一数据与我们的现实感受符合吗?为什么人们的感受与数据存在差距呢?一个原因可能数据的准确性上确实存在偏差;另一个可能的原因在于求平均。比如你的隔壁住了一位富翁,资产1000万,你身无分文,但平均资产都是500万,瞬间变成了富翁心理测量学知识“心”如何测量?心理测量学知识心理小测验1

假如你的恋人在一个孤立的小岛上,小岛没有陆地之间没有桥,请你选择到去小岛的方式。A划船过去B坐乌龟过去C不过去D游泳过去请在纸上写下你的答案!心理测量学知识此测验是性取向测验。划船过去——正常的异性恋坐乌龟过去——性变态不过去——性冷淡游泳过去——同性恋心理测量学知识心理小测验2请你回忆自己洗澡的顺序,选择你最后清洗的部位:A头发B面部C隐私部位D腿请在纸上写下你的答案!心理测量学知识此测验是一项自信测验。最后清洗的部位即为你最不自信的部位!心理测量学知识刚才的两个测验科学吗?这两个测验是“三无产品”,且施测过程缺乏科学性。心理测量学知识科学心理测量学的主要内容第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用心理测量学知识第一节概述第一单元测量与测量量表第二单元心理测验的基本概念第三单元心理测验的分类第四单元纠正错误的测验观第五单元心理测验在心理咨询中的应用第六单元心理测验的发展史心理测量学知识第一单元测量与测量量表一、什么是测量二、测量要素三、测量量表心理测量学知识一、什么是测量测量就是依据一定的法则用数字对事物加以确定。三个主要的元素:(1)事物;(2)数字;(3)法则。心理测量学知识1.所谓“事物”,指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征。2.所谓“数字”,是代表某一事物或事物某一属性的量。数字的特性:区分性--1与2等级性或位次性--3>2>1等距性--3-2=1、2-1=1可加性3.所谓“法则”,代表的是测量所依据的规则和方法测量三元素心理测量学知识二、测量要素(一)参照点参照点就是确定事物的量时,计算的起点。参照点有两种:绝对零点:重量,长度人定的参照点,即相对零点:智力,新生儿能说他没有智力吗?(二)单位好的单位必须具备两个条件:确定的意义:所有人理解的意义都一样相同的价值:相邻单位之间的差别是相等的心理测验对象往往难以满足这两个条件思考:1.小明考试得了60分,说明了什么?2.小明考试得了60分,班里排名第三说明了什么?3.小明考试得了60分,班里排名第三,班里共5人,说明了什么?心理测量学知识三、测量量表测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。由于制定量表的单位和参照点不同,量表的种类也不同。心理测量学知识四类量表(斯蒂文斯)(一)命名量表(和,或)是最低水平量表,只用数字来代表事物或把事物归类,具体分为两种:(1)代号——用数字代表个别事物,如编号、学号(2)类别——用数字代表具有某一属性的事物的全体,即用数字代表某一群体命名量表,数字反映差别(代号)与类别(分类),不能数量化分析,不能做加减乘除运算(二)顺序量表(>,<)反映差别并对事物分类,也反映事物某方面属性的程度,如名次、级别、喜好程度等顺序量表无相等单位和绝对零点,仅表示等级心理测量学知识(三)等距量表反映差别并对事物分类;反映先后、大小和强度等;有相等的单位(能加减);没有绝对的零点(不能乘除)等距量表的数值加、减一个常数不影响等距关系。因此,一个量表上的数值可以转换为另一个具有不同单位的量表上的数值,而且几个不同单位的数值可以转换到一个量表上便于比较。(四)等比量表反映差别并对事物分类;反映先后、大小和强度等;有相等的单位;有绝对的零点可以加减乘除。心理测量是在顺序量表上进行的并且可以将顺序量表转化为等距量表心理测量学知识这些说法合理吗?我比你聪明一百倍!我心理比你健康一百倍?青海西宁夏天平均温度是15度,陕西西安夏天平均温度是30度,西安的炎热度是西宁的两倍。心理测量学知识第二单元心理测验的基本概念一、心理测验的定义二、心理测验的性质心理测量学知识一、心理测验的定义所谓心理测验,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。心理测量学知识1.心理测量的对象是人的行为(不是对心理的直接测量)2.心理测量往往只是对少数人经过慎重选择的行为样本进行观察,来间接推知受测者的心理特征。(心理测验出现偏差的原因)3.测验条件对所有的受测者都必须相同(测验的编制、印刷、施测、评分标准化)4.原始分数不具有意义,须与常模比较(85分属于高分还是低分?)心理测量学知识二、心理测验的性质(一)间接性(二)相对性(三)客观性心理测量学知识心理测验的间接性研究者无法直接测量人的心理,只能测量人的外显行为,也就是说,只能通过一个人对测验题目的反应来推论他的心理特质。心理测量学知识心理测验的相对性

人的心理与行为没有绝对标准,只有一个连续的行为序列。心理测验就是确定个人处在行为序列的什么位置。连续序列是由某一个团体或一群人的某类行为特点或心理特征构成,所以每个人被测得的结果都是与所在团体或大多数人群的行为相比较而言。心理测量学知识心理测验的客观性所测量的对象(心理)是客观存在的;心理测验是标准化的测验:测验用的项目或作业、施测说明、施测者的言语态度及施测时的环境等,要要求标准化,测验的刺激是客观的。测验评分记分的原则和手续也要经过标准化,使反应的量化是客观的。最后,分数转换和解释标准化,对结果的推论是客观的。心理测量学知识第三单元心理测验的分类按测验的功能分类按测验材料的性质分类按测验材料的严谨程度分类按测验的方式分类按测验的要求分类心理测量学知识一、按测验的功能分类(一)智力测验

测量人的一般智力水平(二)特殊能力测验

测量个人的特殊潜在能力,如绘画、写作、机械等(三)人格测验

测量人的性格、气质、兴趣、态度、动机等。测验方法包括问卷法和投射法艾森克人格问卷——EPQ卡特尔16种人格因素——16PF明尼苏达多项人格问卷——MMPI心理测量学知识二、按测验的性质分类(一)文字测验

文字测验所用的是文字材料,以言语提出刺激,受测者用言语作反应。团体测验多采用此种方式编制,施测方便缺点:受测者文化程度影响测验结果(二)操作测验也称非文字测验。测验题项多属于对图形、实物、工具、模型的辨认和操作,不受文化程度影响,可用于幼儿或文盲。如,瑞文和韦克斯勒心理测量学知识三、按测验材科的严谨程度分类(一)客观测验测验中句子、图形意义明确,明确界定,不需想象、猜测和遐想。绝大多数都属于客观测验。(二)投射测验——罗夏墨迹、房树人测验没有明确意义,问题模糊,对受测者反应没有明确界定。由受测者想象使之赋予意义,以此投射出受测者的思想、情感和经验。心理测量学知识四、按测验的方式分类(一)个别测验

测验以一对一的形式进行。优点:主测对受测言、行有仔细观察,结果可靠。缺点:不能在短时间内收集到大量资料,程序复杂,主测需接受严格训练,专业化程度高(二)团体测验

一个或几个主测对较多的受测者同时进行测验。优点:时间经济,主测不需要接受严格专业训练缺点:对受测者不能作切实控制,结果不及个别测验,临床上使用较少。团体测验可以用来个别测验,但是个别测验一般不能用来团体测验心理测量学知识五、按测验的要求分类(一)最高作为测验(智力测验、成就测验)

要求受测者尽可能的作出做好的回答,与认知过程有关,有正确答案。(二)典型行为测验(人格测验)要求受测者按通常的习惯方式作出反应,没有正确答案。心理测量学知识第四单元纠正错误的测验观错误的测验观正确的测验观心理测量学知识一、错误的测验观(一)测验万能论认为测验可以解决一切问题,迷信测验,测验分数绝对化

“福勒效应”(二)测验无用论

人格测验侵犯隐私;测验为宿命论、种族歧视提供依据;测验存在偏差。因此反对使用测验(三)心理测验即智力测验

心理测验=智力测验=智商=遗传决定论心理测量学知识二、正确的测验观(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具

心理测验仅仅是研究方法的一种,是一种工具,对心理学研究与部门决策有一定的参考价值。(二)心理测验作为研究方法和测量工具尚不完善

心理测验的理论基础不够坚实,因而作为方法与工具的测验尚不完善。心理测量学知识第五单元心理测验在心理咨询中的应用

心理咨询有效性的前提是对求助者的心理特性、问题有正确的评估和诊断。

目前,在心理门诊中运用较多的大致有三类心理测验,即智力测验、人格测验以及心理评定量表。

心理测量学知识智力测验:韦氏成人、韦氏儿童、韦氏幼儿、瑞文——智力障碍的诊断人格测验:EPQ,16PF,MMPI——了解人格特性,尤其是MMPI能够了解人格异常心理评定量表:精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表等。评分简便,以了解心理障碍的存在与否及程度,并反映病情演变。(一般来说,这类量表仅仅作为诊断的参照,而不是唯一的依据)心理测量学知识第六单元心理测验的发展史科学心理测验的产生和发展现代心理测验在我国的发展心理测量学知识心理测量学历史较短,但思想与实践源远流长。

始于汉代、兴于隋唐的科举制度被公认为世界上最早的心理测量的实践。

科学的心理测量于工业革命成功后的19世纪的欧洲发展起来的。心理测量学知识一、科学心理测验的产生与发展高尔顿(F·Galton)——“怪诞心理学”第一人(19世纪80年代的十年)提出人的不同气质特点和智能是按身体特点的不同而遗传的。(遗传决定论者)为了研究差异的遗传性,便设计了测量差异的方法。为心理测验奠定了统计学基础。他第一个提出了相关的概念,并由学生皮尔逊发展创立了积差相关法。心理测量学知识卡特尔(19世纪90年代十年)卡特尔是对心理测验发展做出巨大贡献美国心理学家。1890年,卡特尔在《心理》杂志上发表《心理测验与测量》一文,这是心理测验第一次出现于心理学文献中。倡导心理学的科学化——“心理学若不立足于实验与测量上,决不能够有自然科学之准确性。”倡导心理学的客观化——“心理测验如果有一个普遍的标准,则其科学的与实用的价值都可以增加。”主张测验手续和考试方法应有统一规定,并要有常模以便比较。心理测量学知识比内(A·Binet)(20世纪头十年)1905年,与助手西蒙制定了世界上第一个正式的心理测验,用于诊断和发现智力发展落后儿童心理测量学知识20世纪以后,心理测验主要有以下几个方面的发展:1.操作测验的发展:使未受过教育的儿童能够接受测验,且反应了心理学界对操作能力的重视2.团体智力测验的发展:始于推孟的学生奥蒂斯所编制的陆军甲种和乙种智力测验3.能力倾向测验的发展:因素分析的盛行,成为分析心理品质的内部结构的重要工具。普通能力倾向(智力)多元化发展,以韦克斯勒的智力量表为代表4.人格测验的发展:先驱是克雷丕林,罗夏测验是投射测验的开端,20世纪40年代以后,人格测验增多心理测量学知识二、现代心理测验在我国的发展我国近代心理测验源于1914年前后,20世纪二三十年代两次修订比内——西蒙量表,此后,处于停滞。1979年后蓬勃发展。近些年来我国的心理学家正在致力于测验本土化.心理测量学知识第二节测验的常模第一单元常模团体第二单元常模的类型第三单元常模分数的表示方法心理测量学知识什么是常模?思考:1.85分算高分还是低分?2.来自不同省份的大一新生比较高考分数,意义大吗?建立心理测量的思维,关注心理常模!心理测量学知识第一单元常模团体一、常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。由于个人的等级会随着用作比较的群体不同而有很大变化,因此必须确定合理的常模群体心理测量学知识对于测验编制者来说:常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。常模的选择包括:确定一般总体:确定目标总体:计划实施的对象确定样本:根据总体的性质确定有代表性的样本对于测验使用者来说:由于同一测验同时存在多个常模团体,分数的转化与解释时需选择合适的常模团体心理测量学知识二、常模团体的条件(一)群体的构成必须明确界定

确定常模团体时必须清楚说明所要测量的群体的性质与特征。尤其是群体过大时,群体内部出现许多小团体,他们在测验上存在差异,因此对每个团体建立常模。例如EPQ就分性别建立常模,韦氏成人量表分城市和农村等(二)常模团体必须是所测群体的代表性样本

所测群体较小,则全测;若较大,一定要选择有代表性的样本作为常模,现实中往往因为某个群体取样容易,造成常模团体取样存在偏差。心理测量学知识(三)样本的大小要适当在实际工作中,应从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小。一般最低不小于30或100个。全国性常模,一般应有2000~3000人为宜。样本大小适当的关键是样本要有代表性。——不是“大”就好(四)标准化样组是一定时空的产物——随时间而须修订在选择合适常模时,要注意选择较为新近的常模。心理测量学知识三、取样的方法取样即从目标人群中选择有代表性的样本。抽样方法:简单随机抽样系统抽样分组抽样分层抽样心理测量学知识(一)简单随机抽样按照随机表顺序选择被试构成样本1.随机表:按照随机表顺序选择受测者构成样本2.编号后随机抽取:将抽样范围的每人进行编号,再随机选择避免了由于标记、姓名、性别或其他社会赞许性偏见造成抽样误差心理测量学知识首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。系统抽样要求目标总体无序可排,也无等级结构存在。系统抽样法的关键是计算组距。(二)系统抽样(等距抽样)将已编好号码的个体排成顺序,然后每隔若干个号码抽取一个。心理测量学知识(三)分组抽样适用情况:总体数目较大,无法进行编好,且群体多样性做法:先将群体进行分组,再在组内进行随机取样。心理测量学知识(四)分层抽样——最常使用的抽样方法。

中国人的主观幸福感,可以完全随机抽吗?步骤:将目标总体按某种变量分成若干层次,再从各层次中随机抽取若干受测者,最后把各层的受测者组合成常模样本。优点:避免简单随机抽样中样本集中于某种特性或缺少某种特性,使层次间差异显著,层次内一致性高,增加了样本代表性分类:分层比例抽样与分层非比例抽样心理测量学知识四、常模分数与常模(一)常模分数常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。由原始分数构成的分布转换而来的分数,叫导出分数原始分数是在测验中直接获得的分数,不能反映被试之间的差异,地位。导出分数具有一定的参照点和单位,它实际是一个有意义的测验量表,它与原始分数等值。(有意义

等单位

带参照点)心理测量学知识(二)常模常模分数构成的分布,就是通常所说的常模,它由标准化样本测试结果计算而来,是心理测验用于比较与解释测验结果的参照分数标准。按照样本大小来源分:全国常模、区域常模和特殊常模;按照具体应用标准与分数特征分:百分位常模和标准分常模心理测量学知识第二单元常模的类型发展常模百分位常模标准分常模智商及其意义心理测量学知识一、发展常模人的许多心理特质是随着时间以有规律的方式发展的,所以可将个人的成绩与各种发展水平的人的平均成绩相比较,确定个体的发展水平。根据这种平均表现所制成的量表就是发展常模,亦称年龄量表。在年龄量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。心理测量学知识常见的发展常模(一)发展顺序量表(二)智力年龄(三)年级当量心理测量学知识(一)发展顺序量表最直观的发展常模。因为它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。优点:这种常模对儿童家长来说最易于理解,并可以监察儿童的生长发育情况。最早的一个范例是格塞尔发展程序表(见363)皮亚杰最著名的工作就是对守恒概念的研究。儿童获得不同守恒形式的年龄是不一样的,5岁掌握的是质量守恒,6岁掌握重量守恒,7岁容量守恒。心理测量学知识比内-西蒙量表中首先使用智力年龄的概念。在比内-西蒙量表式的年龄量表中,每个题目放在大部分儿童都能成功地完成的那个年龄水平,从而把题目分成若干年龄组。例如,某题若被大多数7岁儿童通过,则该题放在7岁水平,5岁儿童大多数能回答的题目则放在5岁水平。如果为每个年龄水平都编制一些适当的题目,便可得到一个评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫做智力年龄,简称智龄。(二)智力年龄心理测量学知识智龄是年龄量表上衡量智力的单位。计算方法:将儿童测验分数与各年龄组儿童对比,便可得到年龄分数。①基础年龄+附加月份=智龄②不对题目进行年龄分组,将正确题数当做测验原始分数,将标准化样本中每个年龄组平均原始分数作为年龄常模,通过将原始分数与年龄常模比较,得出智龄解释:智龄高于实际年龄——聪明;智龄低于实际年龄——愚笨智龄等于实际年龄——一般心理测量学知识(三)年级当量年级当量实际上就是年级量表,测验结果说明属于哪一年级的水平,在教育成就测验中最常用。将被试的测验成绩与某一年级的学生的平均分数作比较,而说成相当于某一年级水平。

年级量表单位为10个月,10个月为一个年级心理测量学知识二、百分位常模百分位常模包括百分等级和百分点、四分位数和十分位数。心理测量学知识(一)百分等级应用最广的导出分数。一个原始分数的百分等级是指在一个群体的测验分数中,得分低于这个分数的人数百分比。例如,某人得分82,经换算百分等级为75,即表示参加该项测验的人得分低于82分的占全体被试的75%,并说明超过他的成绩82分的人仅有25%。百分等级取值越大,成绩越优秀心理测量学知识(二)百分点(百分位数)在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。即处于某一百分比例的人对应的测验分数是多少。例如,在招聘、招生中,分数线的划定实际应用过程,可以由原始分数计算百分等级,也可由百分等级确定原始分数。这种双向方式编制的原始分数与百分等级对照表,就是百分位常模。心理测量学知识(三)四分位数和十分位数四分位数是将量表分成四等份,相当于百分等级的25%、50%和75%对应的三个点分成的四段。十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与9个分割点上相对应的数据称为十分位数。心理测量学知识三、标准分常模标准分数常模是将原始分数与平均分数的距离以标准差为单位表示出来的量表。标准分数是一种具有相等单位的量数(以平均数为参照点,以标准差为单位),具有可加性,它由符号与绝对值两部分组成,正负号表示原始分数在平均数之下或之上,绝对值表示原始分数与平均数的距离。标准分数可以通过线性转换,也可以通过非线性转换得到心理测量学知识(一)线性转换的标准分数

(公式5-1)其中X为任一原始分数,为样本平均数,SD为样本标准差。由于z分数易出现小数点和负数,计算不方便,所以将其转化:Z=A+Bz(公式5-2)加上一个常数(A)是为了去掉负值,乘以一个常数(B)是为了使单位变小从而去掉小数点。心理测量学知识常见的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。心理测量学知识当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T分数,即:T=50+10×(公式5-3)T分数心理测量学知识标准九分、十分、二十分标准九分=5+2×标准十分=5.5+1.5×标准二十分=10+3×使用最广、影响最大的离差智商以100为平均数,以15为标准差心理测量学知识(二)非线性转换的标准分数

当原始分数不是常态分部时,可通过非线性转换使之常态化。步骤:1.对每个原始分数计算累积百分比;2.在常态曲线面积表中,求出对应于该百分比的Z分数心理测量学知识四、智商及其意义比内-西蒙用心理年龄表示智力高低。若心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在使用中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性,于是提出了比率智商和离差智商表示智力高低心理测量学知识(一)比率智商推孟修订的斯坦福-比内量表,以比率智商表示测验结果。比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。

(公式5-3)由于个体心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试。心理测量学知识(二)离差智商韦克斯勒提出离差智商。它是以年龄组为样本计算而得的标准分数,它表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。韦克斯勒将离差智商的平均数定为100,标准差定为15。

(公式5-4)心理测量学知识离差智商实际应用过程,将原始分数与IQ值的对应关系计算出来作为常模表,使用时可以直接按年龄查出智商。

离差智商的提出影响巨大,许多测验都采用离差智商。1960年的S-B,使用平均分为100,标准差为16的标准分数量表。心理测量学知识

需要注意:从不同测验获得离差智商只有当标准差相同或接近时才能比较,标准差不同,分数意义也不同。(详见367)心理测量学知识几种导出分数间的相互关系正负一个标准差的面积为68.27%;正负1.96个标准差的面积为95.45%;正负2.58个标准差的面积为99.73%。心理测量学知识第三单元常模分数的表示方法一、转换表法——最简单、最基本

也叫常模表,是一种最简单、最基本且最常用的呈现常模资料的方法,它由原始分数、相应的导出分数和对常模团体的有关具体描述三个要素构成。

分为简单转换表与复杂转换表。前者将单项测验的原始分数转化成一种或几种导出分数;后者指包括几个分测验或几种常模团体的原始分数与导出分数的对应关系。二、剖析图将测验分数的转换关系用图形表示出来。心理测量学知识常模转换表心理测量学知识剖面图心理测量学知识第三节测验的信度第一单元信度的概念第二单元信度评估的方法第三单元信度与测验分数的解释第四单元影响信度的因素心理测量学知识第一单元信度的概念一、信度的定义信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。心理测量学知识信度只受随机误差的影响。X=T+EE=Er+Es心理测量学知识二、信度的指标1.信度系数:同一受测者样本所得到的两组资料的相关,实际上就是相关系数:0≤r≤12.信度指数:信度指数的平方就是信度系数3.测量标准误信度系数表示一组测量的实得分数与真分数的符合程度,但未指出个人测验分数的变异量。理论上,若对被试无数次施测即可得到个人真分数(多次观测分数的平均数),标准差则为测量误差的大小。

心理测量学知识

但实际上不能施测无数次,仅能以同一组被试两次施测结果来代替对同一个人的反复施测,于是有了信度另一个指标——标准误(SE)。(个人在两次测验中分数的差异就是测验误差,测验误差分数形成一个分布,这个分布的标准差即为标准误)SE为测量的标准误,SX为所得分数的标准差,rxx为测验的信度系数。

可以发现:标准误与信度互为消长的关系——信度越高,标准误越小;信度越低,标准误越大心理测量学知识第二单元信度评估的方法对信度的评估方法是没有通用法则的,因为不同的信度反映测验误差的不同来源,故每一种信度系数只能说明信度的不同方面,因而具有不同的意义。重测信度复本信度内部一致性信度评分者信度心理测量学知识一、重测信度(稳定性系数)使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。(重测法)重测信度的提出的原因:多数心理特征具有相对的稳定性,短时间不会变化很大一般是两周到四周较宜,间隔时间最好不超过六个月。优点:提供测验跨时间的稳定性缺点:受练习与记忆,身心发展变化的影响心理测量学知识二、复本信度以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数复本信度反映的是测验在内容上的等值性,故又称等值性系数。施测过程中需要采用AB/BA施测顺序来平衡顺序效应若副本先后施测,存在时间间隔,具有了重测信度的特征,称重测复本信度或稳定性等值系数。优点:避免了一定的记忆、学习效应(应用较为广泛)缺点:练习能够减少但不能消除;易产生迁移作用;复本建立困难心理测量学知识三、内部一致性信度重测信度和复本信度主要考察了测验跨时间的一致性(稳定性)和跨形式的一致性(等值性),而内部一致性信度系数主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。分半信度同质性信度心理测量学知识(一)分半信度

采用分半法估计信度系数。实际做法:测验完成后,把测验项目按奇偶分为两半,计算相关,这个相关系数就代表了两半测验内容取样的一致程度。缺点:低估信度系数(测验长度影响使然)心理测量学知识代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,则测验为同质的。相反,即使所有题目看起来好像测量同一特质,但相关很低或为负相关时,则测验为异质的。(二)同质性信度心理测量学知识四、评分者信度目的:

用于测量不同评分者之间产生的误差。程序:随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。心理测量学知识第三单元信度与测验分数的解释解释真实分数与实得分数的相关确定信度可以接受的水平解释个人分数的意义比较不同测验分数的差异心理测量学知识一、解释真分数与实得分数的相关信度系数可以解释为测验的总变异中,真分数造成的变异占百分之几。

若rxx=0.9,则表示观测分数中90%的变异由真分数造成,10%为误差。

在极端的情况下,如有rxx=1.00,则表示完全没有测量误差,所有的变异均来自真实分数;若有rxx=0,则所有的变异和差别都反映的是测量误差。心理测量学知识二、确定信度可以接受的水平

多高的信度水平才是可以接受的?

能力、成就测验信度系数0.9以上,甚至0.95;人格、兴趣测验信度0.8~0.85一般原则是:当rxx<0.70时,测验不能用于对个人做出评价或预测,而且不能作团体比较;当0.70≤rxx

<0.85时,可用于团体比较;当rxx≥0.85时,才能用来鉴别或预测个人成绩或作为。注意哪里有“=”心理测量学知识三、解释个人分数的意义通过标准误去解释分数意义。具体来说两个作用:其一是估计真实分数的范围;从实得观测分数推测得到真分数,即确定置信区间:X-1.96SE<XT<X+1.96SE(有等号)X-2.58SE<XT<X+2.58SE(有等号)其二是了解实得分数再测时可能的变化情形。案例见书本375心理测量学知识四、比较不同测验分数的差异测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括:两个人不同分数的差别;同一被试在两个测验上的差别。这就是差异分数标准误问题:SEd=S(2-rxx-ryy)1/2s相同时,两个分数才能比较

案例见书本375心理测量学知识第四单元影响信度的因素一、样本特征二、测验长度三、测验难度四、时间间隔心理测量学知识一、样本特征信度常用信度系数来表示,信度系数就是相关系数,相关系数受样本是否异质及样本团体平均能力水平的影响。(一)样本团体异质性的影响(二)样本团体平均能力水平的影响心理测量学知识㈠样本团体异质性的影响任何相关系数都要受到团体中分数分布的范围所影响,而分数范围与样本团体的异质程度有关。若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。同质团体,受测者水平接近,两次测验成绩受随机误差影响;异质团体受随机误差影响较小。心理测量学知识㈡样本团体平均能力水平的影响测验的信度还受取样不同团体间平均能力水平的不同而不同。这是因为,对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。因此报告信度系数时,需要对建立信度系数的团体进行描述。心理测量学知识二、测验长度测验长度,亦即测验的数量,也是影响信度系数的一个因素。一般来说,在一个测验中增加同质的题目,可以使信度提高。第一,测验越长,测验的测题取样或内容取样就越有代表性。第二,测验越长,被试的猜测因素影响就越小。不过——测验过长有时会引起被试的疲劳和反感而降低可靠性。心理测量学知识三、测验难度难度对信度的影响,只存在于某些测验中。如智力测验、成就测验、能力倾向测验等,对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题目没有正确或错误答案之分。在实际情况下,如果某个测验难度水平针对特定的团体可能会显得太难、太易,使得分数分布范围缩小,信度水平降低。(难度水平使测验分数分布范围较大时,测验信度最高,通常平均难度水平为0.5)心理测量学知识四、时间间隔以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其他变因介入的可能性越大,受外界的影响也越大,信度系数便越低。心理测量学知识第四节测验的效度第一单元效度的概念第二单元效度评估的方法第三单元效度的功能第四单元影响效度的因素心理测量学知识一、效度的定义(概念定义与操作性定义的符合程度)效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。也称为测验有效性,指一套测验对应该测试的内容所测的程度,即一套测试是否达到了它预定的目的以及是否测量了他要测量的内容。在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与总方差的比率。心理测量学知识测验效度受随机误差和系统误差的影响。可信的测验未必有效,而有效的测验必定可信。心理测量学知识二、效度的性质(一)效度具有相对性在评鉴测验的效度时,必须考虑其目的与功能。不能笼统说,测验有效还是无效,而应该说对测什么有效还是无效。(二)效度具有连续性测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。因此,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或较低来评价。(例用ipad称体重,高效吗?)另外,效度是针对测验结果的,即测验效度是“测验结果”的有效性程度。心理测量学知识信度和效度的关系一、信度是效度的必要而非充分条件二、效度是受信度制约的心理测量学知识心理测量学知识第二单元效度评估的方法美国心理学会在1974年所发行的《教育与心理测量之标准》一书中将效度分为三大类:内容效度构想效度效标效度测量的效度就是测量结果达到测量目的的程度,所以测量效度的估计很大程度上取决于人们对测量目的的解释。目前常见的解释角度有三种:用测量的内容说明目的;用心理学某种理论结构说明目的;用工作实效说明目的心理测量学知识一、内容效度(测验的代表性和覆盖性)(一)什么是内容效度内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。内容效度是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。例如判断高中物理试卷的内容效度,我们需要分析题目是否涵盖了力、电、光、热以及原子物理五方面内容,并且没有化学和地理其他题目掺入。心理测量学知识编制较高的内容效度心理测验需要注意:第一,对所测量的心理特性有明确的概念;第二,测验题目应是所界定的内容范围的代表性取样。需要注意的是,要求内容效度的测验不一定要求测验同质,具体情况应随实际情况而定。心理测量学知识内容效度与表面效度表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是测量所要测的东西;内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价而建立的。最高行为测验要求较高表面效度典型行为测验要求较低表面效度心理测量学知识在编制“领导能力测验”时编写了这么三个问题:a.我愿指挥别人.不愿别人指挥我。b.我喜欢听古典音乐。c.人们经常征求我的意见。通过预测发现,领导干部对a、b作肯定回答的人数比例明显地高于一般群众,对c作肯定回答的人数比例与一般群众差不多。从区分能力来看,c题应被淘汰。但是,若从表面上看,a、c两题都有表面效度,b题没有表面效度。这个例子说明,对于一个具体的测量目标来说,有表面效度的题目不见得真正有效,没有表面效度的题目也可能有效,因此,表面效度不是确定内容效度的客观指标。心理测量学知识(二)内容效度的评估方法1.专家判断法2.统计分析法3.经验推测法心理测量学知识1.专家判断法请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。又称“逻辑效度”(logicalvalidity)。心理测量学知识增加专家评定客观性的步骤:1.定义好测验内容的总体范围,描述有关知识与技能及所用材料的来源;2.编制双向细目表3.制定评定量表来测量测验的整个效度

最后由每位评判者在评定量表上做出判断,从而获得测验内容效度的证据。心理测量学知识2.统计分析法重测信度(再测法):训练前与训练后评分者一致性信度:多个评分者之间的一致程度复本信度:复本求相关——相关低则至少一个测验缺乏效度心理测量学知识3.经验推测法即通过实践来检验效度。如儿童发展量表是否有效,经过对不同年龄阶段的儿童进行调查,然后分析其结果。若通过率是随着年龄的增加而增加,就可以推测该测验有内容效度。心理测量学知识(三)内容效度的特性内容效度与所有效度的性质一样,不是普遍适用的,而是根据具体情况分析得来。如果测验分析者和测验使用者定义的内容范围相同,则编制者报告的内容效度对使用者而言是有意义的,否则就没有意义。

内容效度也有时间特定性,适合过去总体的代表性测验未必符合现在的总体。心理测量学知识二、构想效度(一)什么是构想效度(二)构想效度的估计方法心理测量学知识(一)什么是构想效度构思效度,或结构效度。主要涉及心理学的理论概念问题。指测验能够测量到理论上的构想或特质的程度,即测验的结果能否证实或解释某一理论的假设、术语或构想,解释的程度如何。心理测量学知识建立构想效度的步骤:欲建立构想效度,必需先从某一构想的理论出发,提出关于某一心理特质的假设,然后设计和编制测验并进行施测,最后对结果采用相关或因素分析进行分析,验证理论假设的符合程度。心理测量学知识(二)构想效度的估计方法1.对测验本身的分析(测验内部寻找证据)(1)内容效度:分析内容效度即可得出结构效度(2)内部一致性信度:测验是单一特质还是多种特质(3)被试对题目的反应特点:若有证据表明某一题目的作答除了反映着所要测的特质之外还反映着其他因素的影响,则构想效度受到影响。心理测量学知识2.测验间的相互比较(测验之间寻找证据)(1)相容效度:待研究效度测验与同一成熟测验求相关(2)区分效度:待研究效度测验与其他异质测验求相关(3)因素分析法:因素分析因子与构想符合程度心理测量学知识3.效标效度的研究证明

实测成绩能否真正将个体分类:选取不同的被试构成对照组,施测后比较两组的分数,若二者分数将两组截然分开,则构想效度不错。

分析心理特质的发展变化,如智力随年龄而发展,若测验能反应这一规律则,结构效度高4.实验法和观察法证实

训练前后测验分数的变化心理测量学知识三、效标效度(一)什么是效标效度(二)效标效度的估计方法心理测量学知识(一)什么是效标效度(实证效度)效标效度反映的是测验预测个体在某种情境下行为表现的有效程度。(实证效度)被预测的行为是检验效度的标准,简称效标。根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类,前者在于诊断现状;后者在于预测未来。一个测验是否有效,以实践的效果来作为检验标准心理测量学知识检验一个测验的效标效度时,关键在于找到合适的效标一个好的效标必须具备以下条件:

(1)效标必须能最有效地反映测验的目标,即效标测量本身必须有效;(2)效标必须具有较高的信度,稳定可靠,不随时间等因素而变化;(3)效标可以客观地加以测量,可用数据或等级来表示;(4)效标测量的方法简单,省时省力,经济实用。心理测量学知识(二)效标效度的评估方法1.相关法2.区分法3.命中率法心理测量学知识1.相关法相关法是评估效标效度最常用的方法,它是求测验分数与效标资料间的相关,这一相关系数称为效度系数。计算效度系数最常用的是积差相关法(连续变量、二列(两个变量都为连续变量,一个人为划分为二分变量)、点二列相关(一个是真正的二分变量,另一个是连续变量)、贾斯朋多系列相关(测验分数为连续变量,效标资料为等级评定)心理测量学知识2.区分法区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。某政府机关通过测验录用了一批公务员,经半年试用期后,根据他们的实际工作成绩,将这批公务员区分为称职和不称职两组,然后回过头来检查这两组人在测验上的分数是否有显著差异,如果差异显著,说明这个测验在录用公务员的选拔性测验中是有效的。具体做法是分析高分组与低分组分布的重叠量:一种是计算每一组内得分超过(低于)另一组平均数的人数百分比;一种是计算两组共同分布的百分比(详见书本384)心理测量学知识3.命中率法命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。使用命中率法,可将测验分数和效标资料分为两类。在测验分数方面是确定一个临界分数(即分数线),高于临界分数者预测其成功,低于临界分数者预测其失败;在效标资料方面根据实际工作或学习成绩,确定一个合格标准,标准之上与之下。心理测量学知识根据测验分数与实际工作情况,可以分为四种情况:失败成功成功失误命中失败命中失误心理测量学知识命中率计算:总命中率=命中/(命中+失误)正命中率=测验与效标皆成功人数/测验成功人数分数线越高,正命中率越高;否则越低。心理测量学知识第三单元效度的功能一、预测误差效度系数的实际意义常以决定系数来表示。决定系数即为效度系数的平方,表示测验正确预测或解释的效标的方差占总方差的比例。另一种表达方法,估计的标准误,指所有具有某一测验分数的受测者其效标分数分布的标准差,即预测误差大小的估计值(见385)表示预测误差大小的估计值。测验效度完美(为1),估计标准误为0心理测量学知识二、预测效标分数

若X、Y呈直线相关,可利用回归方程从测验分数预测效标分数三、预测效度指数E=100(1-K)E值大小表明使用测验比盲目猜测能减少多少误差例如,效度系数为0.8,K=0.6,E=0.4,这表明预测误差仅为随机猜测所产生误差的60%,即减少了40%误差。心理测量学知识第四单元影响效度的因素一、测验本身的因素二、测验实施中的干扰因表三、样本团体的性质四、效标的性质心理测量学知识一、测验本身的因素1.测验材料必须对整个内容具有代表性;2.测题设计时应尽量避免容易引起误差的题型(如是非题);3.测题难度要适中,具有较高的区分度;4.测验长度要恰当,即要有一定的测题量;5.测题的排列按先易后难顺序。心理测量学知识二、测验实施中的干扰因表(一)主试的影响因素测验实施过程、评分标准化与否。

效标与测验时间间隔越长,效度降低

测验情境(二)被试的影响因素兴趣、态度、情绪等心理测量学知识三、样本团体的性质(一)样本团体的异质性如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低

选拔测验和选拔标准的增高,导致样本团体同质性增大,效度降低(二)干涉变量

性别、年龄、教育水平、智力、动机等心理测量学知识四、效标的性质

效标效度以测验分数与效标测量的相关系数来表示,效标性质影响效度评价。

效标测量的可靠性——即效标测量的信度心理测量学知识第五节项目分析心理测量学知识测验的项目分析包括定性分析和定量分析两个方面。定性分析包括考虑内容效度,题目编写的恰当性和有效性等;定量分析主要是指对题目难度和区分度等进行分析。心理测量学知识第一单元项目的难度心理测量学知识一、定义难度(difficulty),顾名思义,是指项目的难易程度。难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示:

(公式5-31)通过人数越多(即P值越大),难度越低;心理测量学知识二、项目难度的估计方法(1)二值记分的测题:答对的百分比(或比率)

P值越大,则难度越小。心理测量学知识(2)不是二值记分(3)分组计分项目心理测量学知识三、难度水平的确定——主要目的在于筛选项目(一)项目的难度——取决于测验目的、性质与形式标准测验,为了测量个体差异。P接近0.5最大程度上提供个体差异信息选拔诊断测验,选择难度接近录取率的项目。对于选择题来说,P应大于概率水平:是非题难度应为0.75;四择一,难度0.63心理测量学知识(二)测验的难度取决于项目难度,通过测验分数分布对难度进行检验如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。正偏态——难度大;负偏态——测验过易心理测量学知识第二单元项目的区分度心理测量学知识一、定义项目区分度,也叫鉴别力,是指测验项目对被试的心理特性的区分能力。是评价项目质量和筛选项目的主要指标。水平高者得高分,水平低者得低分——区分度高区分度D取值范围为-1~+1之间,D为正值,则积极区分;D为负值,为消极区分;D为0,则无区分。D值越大,区分效果越好。心理测量学知识二、计算方法(一)鉴别指数按测验总分高低排列答卷确定高分组与低分组,每组取答卷总数的27%分别计算高分组与低分组在该项目上的通过率高分组通过率-低分组通过率得项目鉴别指数据项目鉴别指数进行项目取舍D=PH-PL0.4以上,很好0.3-0.39,良好,修改后更好0.2-029尚可,仍需修改0.19以下,差,必须淘汰心理测量学知识(二)相关法鉴别指数易于理解,计算方便,但结果不精确,因此采用相关法。以项目分数与效标分数或测验总分的相关作为项目区分度的指标。计算区分度最常用的方法是相关法1.点二列相关:2.二列相关:3.Ф相关法:相关越高表明项目越有区分功能心理测量学知识三、区分度与难度的关系一般来说,较难的项目对高水平的被试区分度高,较易的项目对水平低的被试区分度高,中等难度的项目对中等水平的被试区分度高。若项目通过率为1,则D=?0若项目通过率为0,则D=?0若项目通过率为0.5,则D=?1难度越接近0.5,区分度越接近1;平均难度水平为0.5心理测量学知识第六节测验编制的一般程序第一单元

测验的目标分析第二单元测题的编写第三单元测验的编排和组织心理测量学知识编制心理与教育测验的基本程序一、确定测验目的二、制定编题计划三、编辑测验项目四、预测与分析五、合成测验六、测验标准化七、鉴定测验八、编写测验说明书心理测量学知识第一单元

测验的目标分析

一、测验的对象二、测验的用途三、测验的目标心理测量学知识一、测验的对象明确测验对象,明确测量哪些个人和团体。通常以年龄、性别、职业、受教育程度、经济状况、民族、文化背景等指标来区分测量对象。心理测量学知识二、测验的用途所编出的测验是要对被试做描述,还是做诊断,亦或是选拔和预测,(一)显示性测验显示性测验是指测验题目和所要测量的心理特征相似的测验。(二)预测性测验心理测量学知识三、测验的目标心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。(一)工作分析对所预测的行为活动作具体分析确定哪些心理特征和行为可以使要预测的活动达到成功建立衡量被试是否成功的标准(二)对特定概念下定义(三)确定测验的具体内容心理测量学知识第二单元测题的编写一、搜集资料二、命题的一般原则三、测题的编制要领心理测量学知识一、搜集资科(一)已出版的标准测验(二)理论和专家的经验(三)临床观察和记录心理测量学知识二、命题的一般原则(一)内容方面(二)文字方面(三)理解方面(四)社会敏感性方面心理测量学知识三、测题的编制要领可以分为两大类:提供型(supply)和选择型(selection)题目。选择题是非题简答题操作题心理测量学知识第三单元测验的编排和组织一、合成测验二、预测与项目分析三、信度和效度考察四、常模制定五、编写指导手册心理测量学知识一、合成测验合成测验就是把经过预测以后证明有价值的项目排成有组织的测验。解决两个问题:一是测验项目的选择;二是测验项目的编排心理测量学知识(一)选择与审定试题1.选择试题形式2.审定题目心理测量学知识(二)测题的编排测验编排的一般原则:1.测题的难度排列宜逐步上升。2.尽可能将同类型的测题组合在一起。3.注意根据各种类型测题本身的特点排列题目。两种常见的排列方式。1.并列直进式(按题目)2.混合螺旋式(按难度)心理测量学知识二、预测与项目分析(一)预测(二)项目分析心理测量学知识三、信度和效度考察(一)信度(二)效度心理测量学知识四、常模制订选择常模团体施测获得常模原始分数转化为导出分数心理测量学知识五、编写指导手册测验指导手册的内容有:1.测验的目的和功用。2.测验编制的理论背景3.如何实施测验的说明。4.测验的标准答案和记分标准。5.常模资料6.测验的基本特征心理测量学知识第七节心理测验的使用第一单元主试的资格第二单元测验的选择第三单元测验前的准备工作第四单元测验实施的程序及要素第五单元被试误

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论