版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2005年4月心理测量-串讲第一章 总论 第一节 心理测验的历史回顾 1孔子把人分为中人、中人以上和中人以下三个类别,这实际上相当于现代测量学中的命名量表和次序量表。 2南朝人刘勰在新论专学篇中提到的实验,可以算是世界上最早的“分心测验”。 3南北朝学者颜之推对周岁试儿加以总结,可以说是格塞尔婴儿发展量表的前导。 4七巧板在某些方面可以作为创造力测验的一种方法。 5科举考试中的帖经和对偶,类似于现代西方言语测验中常见的填字和类比。 6中国古代心理测验的思想,他们都是描述性的,没有定量的标准;心理测验往往将心理特点与道德观念联系起来。 7简述科学心理测验产生的原因。 对智力落后者分类和训练的早期
2、关注。心理测验产生的最初原因是对智力落后和精神病人治疗的需要 冯特的实验心理学。实验心理学的诞生是心理测验产生的另一个重要原因,它给心理测验带来了严格的标准化程序。 8英国生物学家和心理学家高尔顿是倡导测验运动的主要人物,他是评定量表和问卷法应用的先驱,并经常使用自由联想技术,他还为心理测验奠定了统计学基础,第一个提出相关的概念。 9美国心理学家卡特尔1890年在心理杂志上发表了“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中。 10比内-西蒙量表在1905年发表,它是世界上第一个正式的心理测验。 11心理测验的蓬勃发展 操作测验的发展。由于理论上的缺陷和实际上的需要,所以就有操作
3、测验的问世和发展。 团体智力测验的发展。运用团体测验可以在同一时间内测量许多被试,扩大了测验的应用范围。 能力倾向测验的发展。能力倾向测验为分析个人心理品质的内部结构提供了适用的工具,逐渐受到人们的重视。 人格测验的发展。人格测验的先驱是克雷佩林,它涉及人的情感或行为等非智力方面。 121922年廖世承和陈鹤琴出版的心理测验法,是中国最早的心理测验专著。 第二节 心理测验的性质、种类和功能 1测量:就是根据一定的法则,用数字对事物加以确定。所谓“一定的法则”是指测量行为发生时采用的规则或方法。所谓“事物”是指我们要测量的感兴趣的事物的属性或特征。用数字对事物加以确定,就是确定一个事物的属性的量
4、的多少。 2测量有两个要素:一是参照点,二是单位。参照点可以分为两种,一种是绝对的零点,表示什么也测不到;另一种是相对参照点,是人为确定的。心理测验中所用的参照点都是相对的,因而测量结果不能以“倍数”的方式解释。 3简述测量量表的种类。 斯蒂文斯根据测量精度高低,将测量量表分为4个水平,由低到高依次为命名量表、顺序量表、等距量表和比例量表。 命名量表:是水平最低的一种测量量表,只是用数字来代表事物或对事物进行分类,没有任何意义,只是表明类别。 顺序量表:不仅可以表明类别,还能表明不同类别的大小等级,或具有某种属性的程度。 等距量表:不仅有大小关系,而且又有相等的单位,因此可以加减运算,但没有绝
5、对零点,所以不能做乘除运算。 比例量表:是最精确的测量,既有相等的单位,又有绝对零点。不仅可以知道事物之间在某种特点上相差多少,还可以知道它们之间的倍数关系。 4心理学家喜欢把测验成绩(顺序量表)转换为等距量表,最常用的转换方法是转换为标准分数。 5所谓测验,是对行为样本进行测量的系统程序。它包括三个基本要素: 行为样本:指有代表性的样本,根据某些条件取得的标准样本。 标准化:指测验、实施、计分以及测验分数解释程序的一致性,需要建立有代表性的常模。 客观性:在不受被试主观判断支配的范围内,测验的实施、评分、解释应是客观的,尽量减少主试和被试的随意程度,且测题或整个测验的难度水平的确定要客观。
6、6神经心理测验客观性最高,智力测验也较高,人格问卷次之,而投射测验的客观性较低。 7心理测验的性质。 心理测验的间接性:心理测验只能以测量个体对测验题目的反应来推断出他的心理特质。 心理测验的相对性:心理测验测得个体的结果,是与他所在团体或人群中大多数人的行为确定的标准相比较而言的。 心理测验的客观性:实际上就是测验的标准化,包括:测验的刺激是客观的;评分计分原则和手续是客观的;分数转换和解释是客观的。 8心理测验的种类: 按测验的功能分类:智力测验、特殊能力测验和人格测验。 按测验材料的性质分类:文字测验、操作测验。 按测验材料的严谨程度分类:客观测验、投射测验。 按测验的方式分类:个别测验
7、、团体测验。 9论述心理测验的功能。 从实际应用角度看: 人才选拔,预测人们从事各种活动的适宜性,提高人才选拔和职业训练的有效率。 岗位安置,借助心理测验,做到人与工作较好匹配,做到人尽其才。 临床诊断,借助心理测验可以观察病情程度,比较疗效。 教育评价,帮助教师了解学生能力水平、性格特点等,有利于教师因材施教。 心理咨询和治疗,借助心理测验可以使求助者了解问题所在,以便进行适当的指导、帮助和进行行为矫正训练。 从理论研究角度看 搜集资料,心理测验是收集个体差异资料最快捷的办法。 提出和验证假设,心理学中的许多理论是在测验资料的基础上提出来的,并且用测验来验证。 试验分组,在心理学研究中,可以
8、根据心理测验的结果对被试进行分类,以满足实验设计的要求。 第三节 正确对待和使用测验 1错误的测验观: 测验万能论;测验无用论,认为某些测验侵犯了个人隐私,为宿命论和种族歧视提供了心理学依据;心理测验即智力测验。 2正确的测验观 它是重要的心理学研究方法和决策的辅助工具;它作为研究方法和测量工具尚不完善,最大的问题是理论基础不够坚实;科学地看待心理测验,防止乱用测验。 3为防止测验的滥用,需要注意以下几个问题: 测验使用者必须具备一定的资格;慎重选择测验量表;与被试建立良好的协调关系;正确解释测验结果;注意测验的保密。 第二章 心理测验的编制 第一节 心理测验的对象、目的及目标 1在编制测验前
9、首先要明确测量的对象,其包括三个重要的维度,即年龄、教育水平和文化背景。 2测验的目的可以分为两类:显示和预测。 3显示性测验是指测验题目和所要测量的心理特征相似的测验,如成就测验。 4预测性测验是指预测一些没被测量的行为的测验,主要是利用测验分数使我们能够预测一个人在不同情境下的行为。 5心理测验的目标是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。 6对心理测验的目标分析以测验不同,有3种情况: 工作分析。对于选拔和预测功用的预测性测验,它的主要任务是要对所预测的行为活动作具体分析。 对特定概念下定义。测验者为了测量某种特殊的心理品质或特点,就必须给所要测量的心理或行为特质
10、下定义。 确定测验的具体内容。如果测验是描述性的显示测验,它的目标分析的主要任务是确定显示的内容和技能。 第二节 测题的编写技术 1简述编制测验题目的来源。 已出版的标准测验。最简单、最直接的方法是从已经出版的各种标准测验中选择合适的题目。 理论和专家的经验。理论和专家经验可以作为测验题目的来源之一,比如编制态度量表,就可以将理论上对态度的类型、性质维度、定义等描述转换为测验题目。 临床观察和记录。各种观察量表或检核表很多都是来源于观察到的行为表现。 2考虑测题的来源时应注意:资料来源要尽可能丰富;材料应该有普遍性。 3简述测验题目的命题原则。 内容方面。首先,要求题目的内容符合测验的目的;其
11、次,内容取样要有代表性;第三,题目间内容相互独立,互不牵连。 文字方面。使用语言要准确,语句要简明扼要,最好一句话说明一个概念,尽量少使用双重否定句。 理解方面。题目应有确切的答案,题目的内容不要超出受测团体的知识水平和理解能力,题目格式要容易理解。 社会敏感性方面。应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。 4简述涉及社会敏感性问题时,测验命题的思路。 命题时假设被试具有某种行为,使他不得不在确实没有该行为时才否定。 命题时假定规范不一致。 指出该行为是常见的,虽然是违规的。 5心理测验的题目可以分为两大类:提供型和选择型题目。提供型题目包括:论文题、简答题、填充题等
12、;选择型题目包括:选择题、是否题、匹配题等。 6选择题包括两部分:题干和选项。题干就是呈现一个问题的情境,一般由直接问句或不完全的陈述句构成。选项就是问题的多种可能答案,其中错误的答案叫“诱答”。 第三节 测验的编排和组织 1测验编排的一般原则。 测题的难度排列易逐步上升。对试题的总的编排原则是要由易到难,这样可以避免受测者在难题上耽搁时间过多,而影响对后面问题的解答。 尽可能将同类型的测题组合在一起。这样可以简化记分工作和对测验结果的统计分析。 注意各种类型测题本身的特点。是非题或选择题中必须避免将选择相同选项的测题安排在一起,以免引起被试的定势反应。 2两种常见的试题排列方式:并列直进式(
13、韦克斯勒智力量表)和混合螺旋式(比内西蒙智力量表)。 第三章测验的信度 第一节信度的概念 1信度是指同一被试在不同时间内用同一测验重复测量,所得结果的一致程度。信度只受随机误差的影响,随机误差越大,信度越低。 2传统信度理论认为,每一个测验的实得分数是由两部分组成的,即 实得分数(x)=真实分数(t)+误差(e) 3信度可定义为:一组测量分数的真分数方差与总方差的比率,或者是真分数方差占总方差的百分比。 4信度的指标有三种常见的表示方法,即 信度系数。它是一种相关系数,常常是同一被试样本所得的两组资料的相关,理论上就是真分数方差与实得分数的方差的比值, 。 信度指数。真分数标准差与实得分数的标
14、准差的比值,叫信度指数, 测量标准误。测量的标准误与信度之间呈反比关系:标准误越小,信度越;标准误越大,信度越低。 5信度与测验分数的解释 解释真实分数与实得分数的相关。信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,当 =0.90时,我们可以说实得分数中有90%的变异是真分数造成的,仅有10%是来自测验的误差。 比较信度可以接受的水平。一般原则是:当 0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70 0.85时,可用于团体比较;当 0.85时,才能用来鉴别或预测个人成绩或作为。 解释个人分数的意义。其一是估计真实分数的范围;其二是了解实得分数再测时
15、可能的变化情形。 比较不同测验分数的差异。可利用差异的标准误 。 第二节 信度的类型及估计方法 1重测信度:又称稳定性系数,它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。 2最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。 3重测信度的前提假设是:所测量的特性必须是稳定的;每个人对前一次反应的遗忘程度相同;在时间间隔中没有学习另外的与测验有关的东西。 4复本信度:又称等值性系数,它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就
16、代表了复本信度的高低。 5同重测信度一样,复本信度也要考虑两个复本实施的时间间隔。 6如果两个复本的施测相隔一段时间,则称稳定与等值系数。 7内部一致性信度包括:分半信度和同质性信度。 8分半信度:指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。 9简述分半信度在进行奇、偶分半时的前提。 测题是按某种特定顺序排列的; 如果是随机排列的题目,则必须是所有的题目平等的; 如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关
17、。 10同质性指测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验即为同质的。 11评分者信度:用于测量不同评分者之间所产生的误差。为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。 12当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数作为评分者信度的估计。 各种信度系数相应误差方差的来源 信度系数类型 误差方差来源 重测信度 时间取样 复本信度(连续施测) 内容取样
18、 复本信度(间隔施测) 时间和内容取样 分半信度 内容取样 同质性信度 内容的异质性 评分者信度 评分者之间的差异第三节 影响信度的因素 1论述影响信度的因素。 影响信度的因素包括:样本特征、测验的长度、测验的难度和测量的时间间隔。 样本的特征。任何相关关系都要受到团体中分数分布的影响,当分布范围增大时,其信度估计就较高;若取样团体较为异质,往往会高估测验的信度;对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。 测验的长度。在测验中增加同质的题目,可以使信度提高,测验越长,测验的测题取样或内容取样越有代表性;测验越长,被试的猜测因素影响越小。 测验的难度
19、。只有难度水平为50%时,才能使测验分数分布范围最大,求得的信度也越高。 测验的时间间隔。时间间隔只对重测信度和不同时测量时的复本信度有影响。间隔时间越长,信度系数越低。 第四节 信度的特殊问题 第四章 测验的效度 第一节 效度的概念 1效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。 2效度被定义为在一组测量中,与测量目标有关的真实方差与总方差的比率,即 3简述信度与效度之间的关系。 信度是效度的必要而非充分条件。从方差分配公式: 可以看出, 增大,即效度高,信度的真方差( )必然大,故信度必然高。当信度高时,即 降低时, 是否增加还要看 是否增减,
20、因此效度不一定就高。 效度是受信度制约的。信度系数的平方根是效度系数的最高限度。 4效度的性质: 效度具有相对性。在评鉴测验的效度时,必须考虑其目的与功能。只有所测的结果符合该测验的目,才能认为它是个有效的测量工具。 效度具有连续性。测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。 第二节 效度的类型与估计方法 1效度可以分为三大类:内容效度、构想效度和效标效度。 2内容效度:指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。 3内容效度的评估方法: 专家判断法:为了确定一个测验是否有内容效度,最常用的方法是请有关专家
21、对测验题目与原定内容的符合性作出判断,看测验的题目是否代表规定的内容,也可称为“逻辑效度”。 统计分析法:计算两个评分者之间评定的一致性;也可由一组被试在独立取自同样内容范围的两个测验复本上得分之间相关来作数量的估计;或采用再测法。 经验推测法:通过实践来检验效度。 4简述内容效度与表面效度的关系。 表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是所要测的东西;内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价建立的。虽然二者都是根据测验内容作出的主观判断,但判断的标准不同。前者只考虑题目与测量目的之间的明显的、直接的关系,后者则考虑
22、到题目与测量目的和内容总体之间逻辑的微妙关系。 5最高作为的测验通常要求有较高的表面效度,以使被试有较强的动机,尽最大努力去完成;典型行为测验要求有较低的表面效度,如果被试很容易从测验题目看出测验的目的,就可能产生反应偏差。智力测验表面效度高,人格测验表面效度低。 6构想效度是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。 7构想效度的估计方法: 对测验本身的分析:测验的内容效度可以作为构思效度的证据;测验的同质性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构思效度提供证据;分析被试对题目的反应特点也可以作为
23、构思效度的证据。 测验间的相互比较:相容效度是构思效度的一个证据,相容效度是两组测验分数所共同解释的变异的大小;区分效度是构思效度的又一个证据,一个有效的测验不仅应与其他测量同一构思的测验有关,而且还必须与测量不同构思的测验无相关;因素分析法也是建立构思效度的常用方法,通过对一组测验进行因素分析,可以找到影响测验分数的共同因素,这种因素可能就是我们要测量的心理特质。 效标效度的研究证明:一个测验若效标度理想,那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标,也可用心理特质的发展变化来证实构思效度。 实验法和观察法证实:观察实验前和实验后分数的差异是验证构思效度的方法。 8效标
24、效度:又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标。由于这种效度是看测验对效标预测如何,所以叫效标效度。这种效度需在实践中检验,所以又称为实证效标。 9根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类。同时效度即测验所得分数可与效标同时验证,通常与心理特征的评估及诊断有关;预测效度的效标资料需要一段时间才可搜集到,通常用于选拔、分组。 10同时效度和预测效度意义上的差异,不是来源于时间,而是来自测验的目的。前者与用来诊断现状的测验有关,后者与预测将来结果的测验有关。 11所谓效标,即衡量测验有效性的参照标准,指的是
25、可以直接而且独立测量的我们感兴趣的行为。效标可以分为两个层次,其一是理论水平的观念效标,其二是操作定义水平的效标测量。 12企业家选拔工人时,技术水平就是观念效标,而技术的具体等级如七级工、八级工就是效标测量。 13常用的效标包括:学业成就;实际工作表现;特殊训练成绩;精神病诊断;等级评定;效标团体的比较;先前有效的测验。 第三节 效度的表示方法及应用 1效度系数是最常用的效度指标,尤其是效标效度。它是以皮尔逊积差相关系数来表示的,主要反映测验分数与效标测量的相关。 2当测验成绩是连续变量,而效标资料是二分变量时,计算效度系数可用点二列相关公式或二列相关公式;当测验分数为连续变量,效标资料为等
26、级评定时,可用贾斯朋多系列相关公式计算。 3区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。若差异显著,说明该测验能够有效地区分由效标定义的团体,否则,测验是无效的。 4重叠百分比可以通过计算每一组内得分超过(或低于)另一组平均数的人数百分比得出;另外,还可以计算两组分布的共同区的百分比。重叠量越大,说明两组分数差异越小,即测验的效度越差。 5命中率法是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。命中率的计算有两种方法,一是计算总命中率,另一种是计算正命中率。 6预期表法:从左下至右上对角线上各百分数字越大,而其它的百分数字越小,表示测验的效标效度越高;
27、反之,数字越分散,则效度越低。 7效度的应用包括:预测误差;预测效标分数;预测效标指数。 第四节 影响效度的因素 1试述影响效度的因素有哪些。 测验本身的因素。 测验题目的质量。测验的指导语和试题的答案说明要明确,试题编制符合测验的目的,试题难度要适中。 测验的长度。一般而言,增加测验的长度通常可以提高测验的信度,而信度又制约着效度,因此增加测验的长度也能提高测验的效度。 测验实施中的干扰因素。 主试的影响因素。主试是否遵从测验使用手册的各项规定进行标准化的实施,评分是否合理等,都可以影响测验的效度。 被试的影响因素。被试在测验时的兴趣、动机、情绪、态度和身心状况、健康状态等都会影响测验的效度
28、。被试的反应定势也会降低测验的效度。 样本团体的性质。 样本团体的异质性。如果其它条件相同,样本团体越同质,分数分布范围越小,测验效度就越低;样本团体越异质,分数分布范围越大,测验效度就越高。 干涉变量。样本团体的特质包括:年龄、性别、教育水平、智力、动机等对测验效度均有影响。 效标的性质。 效标与测验分数之间的关系是否线性关系是一个很重要的因素;效标测量本身的可靠性如何亦是值得考虑的一个问题。 第五章 项目分析 第一节 难度分析 1难度是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验(人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答
29、该题的人数。 2难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。 3难度的计算:二分法记分的项目;非二分记分的项目。 4由于选择题允许猜测,所以通过率可能因机遇作用而变大,备选答案的数目越少,机遇的作用越大,越不能真正反映测验的难度。 5试述项目难度水平的确定。 项目难度的确定。 进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。为了使测验具有更大的区别力,应选择难度在0.50左右的试题比较合适。在选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.50 0.20之间。当测验用于选拔或诊断时,应该比较多地选择难度值接近录
30、取率的项目。对于选择题来说,p值一般应大于概率水平。p值等于概率水平,说明题目可能过难或题意不清,p值小于概率无意义,说明题目质量有问题。对于是非题而言,其难度值应该为0.75最合适,而对于四选一的题目,其难度值约为0.63时cp=(4+1)/24=0.63最为合适。 测验难度的确定。 测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布,可以对测验的难度做出直观检验。偏态分布又有“正偏态分布”和“负偏态分布”两种。正偏态分布得分多集中于低端,因此必须增加足够数量的较容易的题目;负偏态分布得分集中在高分端,说明测验过易,必须增加足够数量的有较高难度的项目。 第二节 项目的区分度 1
31、项目区分度:也叫鉴别力,是指测验项目对被试的心理特性的区分能力。如果一个项目,实际水平高的被试能顺利通过,而实际水平低的被试不能通过,那么我们就可以认为该项目有较高的区分度。它是评价项目质量和筛选项目的主要指标,也是影响测验效度的重要因素。 2项目区分度的估计方法。 鉴别指数。首先分别计算高分组与低分组在该项目上的通过率,然后用高分组在该项目上的通过率减去低分组在该项目上的通过率。 项目鉴别指数与评价标准 鉴别指数 项目评价 0.40以上 很好 0.30-0.39 良好,修改后会更佳 0.20-0.29 尚可,但需修改 0.19以下 差,必须淘汰相关系数。 点二列相关法适用于一类变量为二分称名
32、变量,另一类变量为连续变量的成对变量的相关计算。 二列相关适用于两个连续变量,但其中一个变量被人为分成两类。 相关适用于两个变量均为二分称名变量。若将测验总分按及格、不及格或录取、淘汰划分,便可计算 相关系数。 3简述项目区分度与难度的关系。 如果项目难度为0.5时,该题目的区分度可能最高。但如果每个项目的难度均处于0.5,有可能造成该项目同质性提高,会降低总分的区分能力。所以,测验项目之间难度分布要广一些,梯度多一些。 难度和区分度都是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在的。 第三节 项目分析的特殊问题 1项目特征曲线:是项目特征函数或项目反应函数的图解形式,它反映了被试
33、对某一测验项目的正确反应概率与该项目所对应的能力或特质的水平之间的一种函数关系。这一方法不仅适用于项目分析,而且也适用于某些测验量表的编制。 项目特征曲线可图解测验的鉴别力,主要在于其曲线的倾斜度,曲线坡度越陡,鉴别能力越好,预测的误差越小。当坡度为0或90度时,题目出得有问题或定错了答案。 项目特征曲线可以图解项目难度。对难度高的项目,项目特征曲线在图的右侧开始上升,也就是对大多数被试来说,正确回答难度高的项目的概率是低的。 项目特征曲线还可以图解选择题的诱答反应。 第六章 测验的实施、记分及其误差 第一节 测验的实施及其误差的控制 1实施的程序及其要素: 标准化指导语。指导语通常包括两部分
34、,一部分是对被试的指导语,另一部分是对主试的指导语。 标准时限。大多数典型行为测验是不受时间限制的,例如人格测验。但在最高作为测验中,速度是需要考虑的重要因素之一。在速度测验中,尤其要注意时间限制,不得随意延长或缩短。 测验的环境条件。主试必须对测验时的光线、通风、温度及噪音水平等物理条件做好安排,统一布置,使之对每一个被试都保持相同。心理测验时,务必不能有外界干扰。 2试述主试误差及控制方法。 做好测验前的准备工作。 预告测验。应当事先通知被试,保证被试确切知道试验的时间和地点以及内容范围、测题的类型等,使被试对测验有充分准备,及时调整自己的情绪和生理状态。 准备测验材料。 熟悉测验指导语。
35、 熟悉测验的具体程序。 测验中主试的职责。 按照指导语的要求实施测验,不带任何暗示。 测验前不讲太多无关的话。 对被试的反应,主试不应做出点头、皱眉、摇头等暗示性反应。 对特殊问题要有心理准备,比如在测验中出现突发事件,应沉着冷静、灵活地应付。 与被试建立良好的协调关系。在心理测验实施中,协调关系是指主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系,其必须是规范的。 3试述被试误差及控制方法。 被试技巧与练习效应。尽量使每个被试对测验材料的步骤和所需技巧有相同的熟悉程度,并提高标准化测验题目编制水平。 被试的动机与焦虑因素。被试参加测验的动机不同,会影响其回答问题的态度
36、、注意力、持久性以及反应速度等,从而影响测验的成绩;测验焦虑是指被试在应试前和测试中出现的一种不愉快的、表现为焦虑、担心、恐惧和紧张的情绪体验。适度的焦虑会使人兴奋型提高,注意力增强,提高反应速度,提高测验的成绩。 反应定势。亦称反应风格,是指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试得到不同的测验分数。几种常见的反应定势是:求快与求精确的反应定势;喜好正面叙述的反应定势;喜好特殊位置的反应定势;喜好较长选项的反应定势;猜测的反应定势。 第二节 测验的记分及其误差的校正 1对于测验编制者而言,记分标准化应该包括选择和设计合式的标准化记分程序,考虑分数的分配、权
37、数的分配、猜测的处理以及分数是由原始分数表示还是转化成其他形式。 2对测验使用者而言,记分标准化则是要求完全按照测验手册的规定和标准答案给予被试分数,有时还可以完全依据套板或计算机记分。 3记分的一般程序: 记录被试反应。在心理测验中,应对被试的反应给予及时而清楚、详细的记录,特别是对口试和操作测验,此点尤为重要。 参考标准答案。主试应当熟悉掌握记分键,特别是非客观题的记分要求,不得随意记分。 计算最后得分并转换原始分数。把所有分数汇总,计算出原始分数的总分。在心理测量中,一般原始分数本身很少有意义,只有将原始分数进行适当的转换处理或与参照标准加以对照,即把原始分数转换为导出分数,测验分数才有
38、意义。 第七章 测验分数的解释 第一节 参照常模的分数解释 1常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。它用一个标准的、规范的分数表示出来,以提供比较的基础。 2对测验的编制者而言,常模的选择主要是基于对测验将要施测得总体的认识,常模团体必须能够代表该总体。这种工作包括:确定一般总体、确定目标总体、确定样本。 3对测验的使用者来说,要考虑的问题是,现有的常模团体哪一个最合适。 4简述常模团体的条件。 群体的构成必须明确界定。在制定常模时,必须清楚地说明所要测量的群体的性质与特征。 常模团体必须是所测群体的代表性样本。在群体较大时,可以测量一部分人作为总体的代表。
39、 样本的大小要适当。总体数目小,只有几十个人,需要100%的样本;如果总体数目达,相应的样本也大,一般最低不小于30或100个;全国性常模,一般应有2000-3000人为宜。 标准化样组是一定时空的产物。在选择合适常模时,注意选择较为新近的常模。 5取样的方法包括:简单随机抽样、系统抽样、分组抽样和分层抽样。 6常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。 7常模分数构成的分布,就是通常所说的常模,它是解释心理测验分数的基础。常模一般有一般常模与特殊常模之分。测验手册上所列的常模通常为一般常模,不一定适合使用者的具体情况;特殊常模是为非典型团体建立的,一般比
40、为小团体建立的常模范围更窄。 8发展常模及解释 人的许多心理特质如智力、技能等,是随着时间以有规律的方式发展的,所以可将个人的成绩与各种发展水平的人的平均表现相比较。根据这种平均表现所制成的量表就是发展常模,亦称年龄量表。 发展顺序量表。最早的一个范例是格塞尔发展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。 智力年龄。比内-西蒙量表中首先使用智力年龄的概念。智力年龄的计算为6(岁)42(月)32(月)22(月)=6岁18月=7岁6个月。 年级当量。实际上就是年级量表,测验结果说明被试属哪一年级的水平,在教育成就测验中最常用。 9百分位常模及解释 百分位常模
41、包括百分等级和百分点、四分位数和十分位数。 百分等级。一个测验分数的百分等级是指在常模样本中低于这个分数的人的百分比。 百分点。百分点是计算处于某一百分比例的人对应的测验分数是多少。 四分位数和十分位数是百分位数的两个变式,其含义相似。 10标准分常模及解释 标准分是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。包括线性转换的标准分数和非线性转换的标准分数。 11智商及其意义 比率智商。斯坦福-比内量表在心理年龄的基础上,以智商表示测验结果,即以后所说的比率智商。 离差智商。是一种以年龄组为样本计算而得的标准分数,韦克斯勒将离差智商的平均数定为
42、100,标准差定为15。 12常模分数的表示方法包括转换表和剖析图。 第二节 参照效标的分数解释 1在效标参照测验中,一种标准是对测验所包括的材料熟练或掌握的程度,另一个比较标准是外在效标,即用预期的效标成绩来解释测验分数。 2简述效标参照测验与常模参照测验相比的优点。 常模参照测验可以使能力强者骄傲自满,能力差者长期遭受挫折,效标参照测验巧妙地避开了对得分、名次的过分纠缠,使各人都有自己的奋斗目标和希望。 常模参照测验无法反映出被试的真正能力和水平,甚至对被试到底能做什么,不能做什么也不清楚。效标参照测验既能发现个人特有的长处,也会找到问题的症结所在,而常模参照测验就做不到这一点。 从常模参
43、照测验的得分不能得到被试在外在效标上的表现,效标参照测验则可直接作出解释,有时测验结果的本身可能就是效标。 效标参照测验与教师在教学过程中的自编测验关系更为密切,因而效标参照测验的理论概念更易为教师接受和应用。 3内容参照又叫范围参照,主要是依据被试对某个确定的材料内容或技能的掌握程度和熟悉程度来表示和解释测验结果。 4内容参照的表示方法有掌握分数和正确百分数。 5结果参照分数实际上是一个效标分数,即用效标行为的水准来表示测验的结果,而且也是对被试未来作为的预测。 6结果参照分数表示法有期望结果的概率和预期的效标分数。 第三节 测验分数的解释与报告 1测验分数的综合分析: 根据心理测量的特点进
44、行分析。由于测验误差的影响,被试测验分数会在一定范围内波动,故应该永远把测验分数视为一个范围而不是一个确定的点。 要考虑测验前的经历和测验时的情景。个人在测验前的经历和测验情境会影响被试的得分。 要考虑测验的信度和效度。 对于来自不同测验的分数不能直接加以比较。 2简述报告分数的具体建议。 不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应告诉的是测验分数的解释和建议。 避免使用专业术语。 要保证当事人知道这个测验测量或预测什么。 要使当事人知道他是和什么团体在进行比较。 要使当事人知道如何运用他的分数。 要考虑测验分数将给当事人带来什么心理影响。 要让当事人积极参与测验分数的解释
45、。 测验结果应向无关人员保密。 第八章 智力测验 第一节 智力的概念及智力分数 1对智力的四种看法:智力是抽象思维的能力;智力是学习的能力;智力是适应新环境的能力;智力是综合的能力。 2智力结构理论: 斯皮尔曼的二因素理论。 斯皮尔曼认为智力主要是一种普遍而概括的能力,他称这种因素为g因素(普通因素),另外,人的智力活动中还存在着s因素(特殊因素)。 瑟斯顿的群因素理论。 美国心理学家瑟斯顿认为,智力是由一群彼此无关的原始能力构成的,各种智力活动可以分成不同的组群,每一群中有一个基本因素是共同的。 简述吉尔福特的三维结构理论。 美国心理学家吉尔福特认为,智力结构应从内容、操作和产品三个维度去考
46、虑。 所谓内容是引起心智活动的各种刺激,即智力测验所包括的各类题目,包括图形、符号、语义、行为等。 所谓操作是指由各种刺激引起的心智活动方式,即解决问题的心理过程,包括认知、记忆、发散思维、聚敛思维和评价等。 所谓产品是指心智活动的产物,即运用各种心智活动对各类问题处理的结果,包括单元、类别、关系、系统、转换、蕴涵等。 简述卡特尔的流体智力与晶体智力理论。 美国心理学家卡特尔等人认为智力由两种成分构成,一种是流体智力,另一种是晶体智力。他认为流体智力是人的一种潜在智力,主要和神经生理的结构和功能有关;它可以转换到一切要求智力的练习活动中,所以称为流体智力。晶体智力则主要是后天获得的,受文化背景
47、影响很大,与知识经验的积累有关,是流体智力运用在不同文化环境中的产物。 3修订后的比内-西蒙量表首先采用了心理年龄,或称智力年龄的概念,心理年龄实际上是一种年龄量表,是用年龄来表示测验分数。 4比率智商:最早由德国心理学家施太伦提出,是心理年龄除以生理年龄所得商数,即为智力商数,或比率商数。 5比率智商可使不同年龄者的智力水平相互比较,可以表示一个人的聪明程度,但不适用于20岁以上的成年人,现在很少使用。 6离差智商:韦克斯勒提出离差智商的概念,是采用统计学中的均数和标准差计算出来的,表示被试偏离他本人这个年龄组平均成绩的量数,是依据测验分数的常态分布来确定的。 71960年推孟在修订斯坦福-
48、比内量表时,标准化样本得到的数值,定iq均值为100,标准差为16。 第二节 个体智力测验 1比内-西蒙量表在1905年编制而成,1908年修订后提出“智力年龄”概念,并建立了常模。 21916年斯坦福大学的教授推孟修订的斯坦福-比内量表最负盛名,史称1916量表,并首次引入了比率智商的概念,以iq作为比较人聪明程度的相对指标。 3s- 的理论模型 斯坦福-比内量表第四版又称为s- 。它用一个三个层次的认知能力结构模型作为编制量表的框架,最高层是一般智力g因子;第二层次采用改良过的卡特尔的流体智力与晶体智力,在此之外又增加了短时记忆能力;第三层次是15个s- 分测验。 4比内-西蒙测验于191
49、6年传入中国。 5中国的修订本wais-rc分城市和农村两式 6韦氏智力量表的实施与记分: 进行测验时,一般按先语言测验后操作测验的顺序进行; 在每个分测验中,题目都是按难度顺序排列的; 一个分测验中的各项目得分相加,称分测验的粗分。 7分别计算语言智商(viq)和操作智商(piq)是韦氏智力测验的一个特点。如优势半球有损害,则viq明显低于piq;非优势半球有损害,则piq明显低于viq;若是弥漫性损害,其表现与非优势侧损害时相似。 8分析韦氏智力量表的多个分测验时,有三种主要的方法: 各言语分测验的量表分与言语量表的平均分比较; 各操作分测验的量表分与操作量表的平均分比较; 各分测验的量表
50、分与全量表的平均分比较。 9wisc-cr有12个分测验,其中有10个分测验,2个备用测验。备用测验只能在某一同类测验因故实效时使用。通常备用测验的分数不用于计算智商。 10wisc-cr的实施程序是先做一个言语测验,再做一个操作测验,交替进行,以维持儿童的兴趣,避免疲劳和厌倦。 11wisc-cr的每个分测验的原始分在转化为量表分时,是在儿童自己所属的年龄组内进行的。 12对韦氏智力量表的评价: 韦氏智力量表的优点有: 具有复杂的结构,不但有言语分测验,还有操作分测验,能较好地反映一个人智力的全貌和测量各种智力因素。 用离差智商代替比率智商,既克服了计算成人智商的困难,又解决了在智商变异上长
51、期困扰人们的问题。 韦氏智力量表临床应用的多,积累了大量的资料,已成为临床测验中的重要工具。 韦氏智力量表的缺点有: 韦氏智力量表的三个独立本的衔接欠佳。 测验的起点有点偏难,有的分测验对低智力者难以说明,故不便测量低智力者。 有的分测验项目过多,增加了测验时间,有的相反,项目过少,难以调整项目难度,且不便作分半相关信度检验。 第三节 团体实施的智力测验 1简述团体测验与个体测验的差异。 团体测验采用多项选择,而个体测验多采用开放式问题。 团体测验的记分较个别测验的记分更为严格而客观。 团体测验为团体施测,对主试要求不高。个别测验为个体施测,对主试要求较高。 团体测验多用于筛选,而个体测验则多
52、用于诊断及弥补工作。 团体测验能较个体测验更好地建立常模。 2简述团体测验的优缺点。 团体测验的优点有:节省人力、物力和主试施测时间,测验程序简便、对主试要求低、记分客观和更易建立常模。 团体测验的缺点有: 无法对被试详细观察,不易发现疾病、疲劳、焦虑等可能影响测验成绩的特殊反应。 主试与被试之间无法建立和谐的协调关系。 题目类型受到限制,缺乏灵活性,不利于有独创性的被试。 由于动机问题或不能看懂指导语,有些测验者的成绩会大大低于实际水平。 3瑞文渐进测验是以智力的二因素理论为基础的,主要测量了一般因素(g)中的推断性能力。瑞文测验分为两型:标准型是瑞文测验的基本型,有5个黑白系列;彩色型分为
53、三个系列。瑞文测验既可以团体施测,也可以作为个别测验。 第四节 婴幼儿智力发展量表 1格塞尔是婴幼儿智力发展量表的创始人,1940年发表了格塞尔发展量表,它适用于4周至3岁,包括四大行为领域:运动发展、适应行为、语言发展和个人-社会行为。如果各领域的dq均低于6575分,说明发育严重落后。 2丹弗发育筛选测验共提出105个要求或项目,分别测量四大行为领域的能力:应人能、应物能、言语能和动作能。 3考夫曼儿童成套评估测验是智力和成就的综合测量,适用于2.512.5岁的儿童,它有三个量表:同时性加工量表、继时性加工量表和成就量表。 4贝利婴儿发展量表由心理量表、运动量表和婴儿行为记录表三部分组成。
54、 第五节 创造力测验 第六节 智力测验相关的心理学问题 1智力发展的一般趋势:智力在童年期迅速增长,在青春期增长缓慢,约在25岁达到顶峰,以后保持稳定到中年后期,在老年期逐渐下降。 2智力的个别差异:在全人口中,智力分布曲线基本上呈常态,其智力极高(iq在130以上)与极低(iq在70以下)者均占少数,智力属于中常或接近中常(iq在80120)之间者约占全体人群的80%,其中(iq在90109)的人数约占50%。 3简述如何正确理解和解释智力测验的结果。 不能以一次测验来确定智力水平。首先,测验是有误差的;其次,人的一生中智商会产生许多变化。 测验要为智力的开发服务。测验的目的不是为每一个人贴
55、上智力高低的标签,而是为了更好地开发人类的智力服务。第九章 能力倾向测验 第一节 能力倾向测验概述 1能力倾向测验一般是指测量从事某种职业或活动的潜在能力,或预测未来作为水平的评估工具。 2简述能力倾向测验产生的原因。 弥补智力测验的局限。智力测验只是涉及到智力的某些方面,特殊能力倾向测验可以补充笼统的智力测验。 个体能力倾向存在差异。个体在某一测验的各部分上的作业,常常表现出显著的差异,智力测验由于分测验项目太少,不足以作出这种能力倾向差异的分析。 因素分析技术的发展。因素分析使我们能够编制多重能力倾向测验,从而为个体各种能力倾向的强弱提供比较。 来自实际的需要。随着科学管理,尤其是人事选拔和测评的发展,对个体的能力倾向进行评估的工具越来越受重视。 3试述能力倾向测验的特点。 能力倾向测验预测失败比预测成功更为正确。 能力倾向测验只是测量某方面的潜在能力,并不保证他在该方面的必然成就,具有某种能力倾向的个体,不一定在某方面很成功,但缺乏这种能力,则必然没有成功的机会。 必须审慎解释各种特殊能力分数间的差异。 测验分数间的差异只是标准化团体的差异,而不是能力上的不同;被试施测某种能力倾向测验的结果应该与实际从事这种活动的团体相比较;特殊能力倾向测验应重视特殊团体常模的建立。 能力倾向测验在训练
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴工学院《机械设计基础》2021-2022学年第一学期期末试卷
- 淮阴工学院《国际工程管理》2023-2024学年第一学期期末试卷
- 生活用纸相关行业投资方案范本
- 保险监管相关保险服务相关行业投资方案范本
- 人造岗石树脂行业相关投资计划提议范本
- 变速操纵软轴行业相关投资计划提议范本
- 2024【瑞丰F000789546】智能冰柜定制合同
- 2024年全新二婚财产分割协议
- 2024年区域销售独家合作协议
- 2024年公司利润分配合同
- (新版)糖尿病知识竞赛考试题库300题(含答案)
- 《创意改善生活》课件 2024-2025学年湘美版(2024)初中美术七年级上册
- CHT 1027-2012 数字正射影像图质量检验技术规程(正式版)
- 走遍德国 A1(课堂PPT)
- 380V变频器招标技术文件2010
- 基于PLC的门禁系统的设计
- 第一章特殊教育概述-特殊教育概论(共4页)
- 报废农业机械回收确认表(样式)
- 机房精密空调维护验收报告
- 《数字信号处理》教案
- 铁科研微机控制直通式电空制动系统
评论
0/150
提交评论