心理测量和量表操作_第1页
心理测量和量表操作_第2页
心理测量和量表操作_第3页
心理测量和量表操作_第4页
心理测量和量表操作_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、心理测量和量表操作大概的介绍。凡是客观存在的事物都是有数量的。桑代克凡是有数量的东西都是可以测量的。麦克尔心理用间接测量。测量行为,来推测心理。心理测量的结果不绝对。I.心理测量的发展史一中国古代的心理测量思想与实践1905法国科学心理测量.孔子心理测量的思想“中人以上,可以语上也;中人以下,不可以语上也。”孟子“权,然后知轻重;度,然后知长短;物皆然,心为甚。”刘劭人物志,“观其感变,以审常度。”翻译后,名为人类能力之研究韩非一手画圆,一手画方。到现在,用于测注意力民间,周岁试儿到现在,婴幼儿的动作测量古代的问答法到现在,临床谈话法,问卷法庄子:九征到现在,情景法博弈(棋)九连环、七巧板一一

2、古代测智力水平的器具八阵图。二心理测量早期探索及尝试英国高尔顿最早想通过测量人的证明他的“遗传论”。美国卞特尔心理学只有立足于实验与测量之上,才会有自然科学的准确度。德国冯特心理测量的思想。三科学心理测量的诞生与发展1905法国比纳(Binet)1895创办第一本心理学杂志心理学年报心理测量的原理:把结果与他人比较,以求概括。1905:比纳西蒙量表(的标志)标志着科学心理测量的诞生。30题,从易到难。1908、1911两次修订,制订了“智龄”之后,有斯坦福”比纳量表(推孟修订1916)现在的所谓“比纳量表引入了斯腾(德国)的心理商数概念,变化为:智龄IQ=*100使不同年龄层次间儿童的智力水平

3、比较成为可能。也叫比率智商实龄后来量表的特点操作性量表(比纳的量表是语言性量表)团体测验(比纳的量表是个别的测验)教育测验(学习测验,eg桑代克,斯坦福成就测验)人格的测验特殊能力测验(eg音乐,绘画能力etc)四心理测验在中国的发展1916樊炳清介绍比纳的量表1920南京高等师范学校(现南大),廖世承、陈鹤琴开设心理测量课。之后,制定量表,开创杂志抗日战争开始一度中断。1979后,心理测量在中国走进辉煌。智力测验方面,陆志韦,吴天敏;人格测验方面,肖孝嵘;艾伟,学业成就方面。中国国内著名心理测量方面的学者。第二章心理测量的性质测量最基本的特征:对事物进行区分一测量的基本问题。定义:利用一定的

4、法则现在,心理学中的法则还不完善,所以结果不精确。用数字对事物心理学中,是对事物的特征及属性加以区分(描述)。“数字”的特性:区分性等级性/序列性等距性可加性要素绝对的零点(没有此特性)理想的参照点,加减乘除都可以参照点人为参照点只能加减,不能乘除。确定的意义单位应有相等的价值心理测量中的单位,不具有上面的特点,所以单位不够理想eg“年龄”不具有相等的价值4岁-5岁的1年比44-45的1年发展快得多。3.种类名称测量/类别特征:仅区分功能,符号意义使用数学统计方法一一次数、百分比、X2、列联相关等级(代表符号一大于号,小于号)特二分等性使中位数、百分位数、等级相关,秩次相关等距测量特分等且等距

5、使加减,均数,标准差,t检验F检验比率测量(最好的一种测量水平)特具有绝对零点使几何均数、等比量数,加减乘除4.直接与间接测量直接测量:准确间接测量:需中介,可能失真二测量的特征定义:依据一定的心理学理论,使用一定的操作程序,给人的行为定出数量化的价值2.可行性3.性质间接性(测外显行为,推测大脑中的活动)II.相对性III.客观性(测量要做到标准化)4.心理测量的水平智力、价格测验等:等级测量无绝对零点无等距的单位但,可转化为标准分数,则可使用等距测量的方法。三心理测验的基本概念定义心理测验是对行为样组的和标准化的测量(eg题目代表全域,则题目是f,数据结果也域,则数据也是f)测量的编制实施

6、,评分,解释都有一致性四心理测验的种类功能按功能分1.能力测验智力、潜力(eg职业能力)特殊能力学习成就测验各科目的学习能力、技能掌握情况人格测验态度、性格、情绪、气质按人数分1个别测验2团体测验/比较特点按材料分1.器具测验文字测验(纸笔测验)按目的分1.诊断测验(具体)筛选测验(大致)使用对象的不同功能人才选拔心理问题的预防与诊断对一个人能力等的评价五怎样正确对待心理测验编制量表示合理、使心理测验有偏差的原因实施测验有问题/测验保密(内容保密、结果保密)心理测验的资格(接受过培训、有考核)测验常模的使用范围不能“测定终身”。(过几个月可再测几次)对测验本身的认识。(参照其他各方面情况,得出

7、适当的结果)测验结果不能作为歧视人的依据,操作规范。第三章智力测验1.概述1.定义:智力对问题的理解与推理的一般能力。具有正相关的特殊能力的总和。产抽象思维为核心的多种能力的总和。/(国内较认同)智力测验:在一定条件下,使用特定的标准化测验量表,对被试施加测验,从被试的一定反应中测量共智力高低。智龄与智商智龄比率智商=实龄*100推孟10岁前10-18具体年龄点有1、贝雷、韦克斯勒:13岁前13-25离差智商=X同龄人X智商的稳定性和可变性稳定性。时间间隔越短,相关越大;第一次做,年龄小时做,与产后结果的相关越小(5岁后做较好)可变性。智商的分布和分类分类:推孟的分类IQ140以上类别天才12

8、0-140上智110-12090-11080-90聪颖中材迟钝70-8050-7025-5025以下近愚低能无能白痴IQ类别理论(百分比)实际样组130以上极优秀2.22.3120-129优秀6.77.4110-119中上16.116.590-109中等5049.480-89中下16.116.270-79边缘6.76.070以下智力缺陷2.22.255-69轻度,可学习40-55中度,可训练25-39重度,需护理,训练后可处理韦克斯勒的分类82%25以下极重度,全护理。智力的性别差异总体上,没有。发展上,女性先快后慢;男性先慢后快。女性在语言,记忆上强。男性在数理、空间上强。女性分布集中,男性

9、分布广。7.遗传,环境对智力的影响同卵双生子同一环境.88(智力相关)同卵双生子不同环境.75异生双生子相同环境同性别.60t不同性别.50同胞兄弟姐妹相同环境.50不同环境.35无血缘关系,但自幼在同一环境下长大.20无血缘关系,但自幼在不同环境下长大.00另:亲生父母与子女的智力相关.50养父母与子女的智力相关.30&2.智力理论斯腾伯格超越智商智力非一个单一结构,是一个综合的有整体的结构因素说,(英)斯皮尔曼一般因素(G因素)特殊因素(S因素)多因素说,(美)桑代克凯利。反对二因素说(尤其是G因素)。认为智力是各种特殊能力的综合群因素(美)瑟斯顿智力可以分为各种组群,每一组群都有一共同的

10、G因素。分为七种组群(语文理解,语词流畅,数字运算,空间关系,机械记忆、知觉速度、一般推理)是先天的。发展早衰退也早。由于七个组群仍有较高相关,所以修改后的该理论加入了“次组因素”的说法。后来该理论被称为“群因一一般因素,理论”5.智力的三维结构(吉尔福特美)三维度内容操作成果视听图形认知单元符号记忆(短时长时)类别语义发散性思维关系行为会聚性思维系统评价转换蕴涵4*5*6=120细分有5*6*6=1806.三重结构论斯腾伯格已找出105种因素)4.卡特尔流体智力与晶体智力。流体随神经系统成熟该能力自然发展开Eg.机械记忆,图形分辨(反应)知觉速度。晶体:受后天环境。教育的影响。发展晚,后来会

11、加快。Eg.语词常识词汇(认为:传统的智商是静态的。)情境理论三重:经验理论成分理论核心内容最基本的信息加工单元。元成分对其他成分进行计划、评价、加工等。另,操作成分执行元成分的指令,同时,有反馈;知识获得成分,选择问解解决的策略。操作成分知识获得成分前两种理论,从外部世界、经验角度来看。情境理论指出智力是主体对环境的适应、选择、改造。经验理论指导测验编制中应运用大多数人都有(或无)的经验。或新异或熟悉7.智力的PASS模型(DSA戴斯):要产全新的理论取代传统的。/同时性三个方面(三级认知功能)计划一注意一加工_;继时性这一状态决定是两步的基础。生理基础:三级机能联合区。(鲁利亚)DAS编制

12、的智力测验:DN认知评价系统。分四个分量表:第一分量表(计划性功能系统)视觉搜索,计划连接,数字匹配。第二分量表(注意一唤醒系统)同时性加工图形记忆、矩阵问题,同时性言语加工。表现的注意,找数字,听觉选择注意。继时性加工句子重复、句子问题、字词测验&3.智力测验一.福一比纳量表(SB量表)1.19.6推孟第一次修订首次用“智商概念”(第一版)1937推孟第一次修订采用复本的形式。(L版、M版)1960推孟第三次修订删除过时的题目,对题目重新排版,两个版本合二为一,题量增加(第三版)1972在第三版上,对常模进行修改1986第四次修订版(桑代克Hagen)对S-B量表大规模修改(第四版)f现在使

13、用的版本。理论框架与构成引八卡特尔的“流体”“晶体”理论,及桑代克与Hagan的认知理论:化理论框架是认知能力测验。流体智力/分析能力短时记忆I珠子记忆构成:3层次,15分测验晶体智力获取、运用语文、语文推理I词汇数字的知识来解决问题与学校教育有关I算术抽象/视觉能力II语句记忆I对图形或形态的分析III数字记忆II仿造/仿画IV物品记忆III矩阵(小年龄,7岁上)II数列关系II理解III等式III谬误IV语文关系共15个分测验IV折纸和剪纸3.S-B测验的特点内容上含概了更广的知识能力与信息加工的能力。采取分量表的形式(而前之版为年龄量表),框架有很大变化。对能力的各个方面进行评价。保留了

14、传统的适应性测验除了给总智商外,还有四个方面的分数及更多分支详细。使用范围:2岁半成人适于找出弱智或超常儿的人。测验的实施与评分先测词汇分测验,以其成绩及年龄决定起测点。停测点因卷而易。采取一边操作一边评分。评分多是“0/1计分”。每个分测验的分数相加(即:原始分数,转换成标准量表分把分测检量表分相加),查常模,得四个量表分。再把四个分相加得总智商。二麦卡锡幼儿智能量表(2岁半8岁半)(1972编)1.特点:测验材料起点低,近似玩具。不受民族、地域文化差异的影响。年龄范围侧重于学龄期儿童。弱智儿童可用到14岁2.构成五个分量表。十八个分测验总智商语言.1一知觉操作数量记忆运动I.图画记忆I.积

15、木I数的问题(把其他四部分(眼、手II.语词知识II.拼图II.数字记忆与记忆有关的的动作)语词记忆III.连续敲击III.计数和数的区分测验组合在一起)IV词语流畅性IV.左右方向反义类推V.图形临摹画人概括归类3.评分原始分数。查表,每分量表的分数相加,得合成粗分。智商把前三部分的合成粗分相加得智商。还可评判“一侧性”(或叫“单侧化”)单侧化的完成也意味着智力的发展。三.瑞文测验(Rowen)渐进矩阵ABCDE60题标准型ABCD36题彩色型用于幼儿及弱智儿童高级型标准型+彩色型一联合型5岁75岁A套:简单类比、直接辨别B套:简单推理8岁以前只做A.Ab.B三套即可。C套:单维推理(数量、

16、位移、组合)D套:二维推理E套:套合、互换特点:无文化差别的问题,可用于大规模筛选。四.韦克斯勒智力量表。1.发展:纽约贝勒维精神病院中,雏形,因为韦克斯勒认为比纳量表的常模不适于成人。智商术法不适于成人。智商并不能完全反映智力。韦克斯勒提出离差智商儿童量表:WISC,WISC-R(修订版)WISC-III成人量表:WAIS,WAIS-R学龄前及学龄初儿童量表(4.5岁-6.5岁)WPPSI,WPPSI-R语言量表2.WISC-R简介操作量表语言量表分测验:常识(生活常识检查对日常事物的认知能力一般知识)类同算术词汇理解VI.数字广度备用替代(智力有问题,顺背不超过5个,倒背不到3个)操作量表

17、填图图片排列积木拼图译码VI.迷津一(备用/替代)原始分查表,相加得分量表分,再相加,得全量表分。1991年修订版总智商言语理解知觉组织注意集中加工速度(常识,类同、(填图,图克服分心(译码、符号搜索)词汇、理解)画排列,积(算术,木,拼配)背数)另配:成绩测验:用于学力能力、策略上有困难的学生(智商不低)五考夫曼儿童成套评估测验(21/2岁121/2岁)KanfmanAssessmentBatteryforChildren(K-ABC)以Das的PASS模型为依据设想效果:从认知心理学与神经心理学角度测量智力,不仅测量已有知识水平,而且测量解决新问题的能力。所得分数便于教育安排上的采用。另,

18、也有非语言量表总量表同时性加工成就量表继时性加工智力(设想为解决I动作模仿I图形辨认I词汇表达数字背诵II.人物辨认II.人地辨认系列记忆III.完形测验III.数字运用新问题的能力流体智力(先天)智力量表分=IV.图形组合IV.物体猜迷继时性加工的组分V.图形类推V.阅读发音+同时性加工的得分VI.位置记忆VI.阅读理解+非语言量表)照片系列晶体智力(后天)4对智力测验的反思的评价1.存在价值智力测验的优点有标准化的过程最大的优点比通过学业成就来评价智力要科学得多。一一评价人的各种能力评价范围广快速、有效存在的问题与局限性局限性表现在智商只提供量的数据,而无质的分析只测当时的智力,而不能考虑

19、到以后的发展速度和趋势标准答案有利于聚合思维、抽象思维和推理,而无利于发散思维与文化教育有关,只能部分反映一个人的智力水平。(受理论局限)适应性行为也是智力的一部分。作智力测验受很多因素影响(Eg:情绪、动机、疲劳etc)智力测验的新理论与新方法。I.皮亚杰的发生认识论重要的不在于对与错,而在于怎么推理得到了结果。方法:综合了观察、测量、访谈etc,组合成了一一临床法。II.生态文化理论:强调重视现时的环境、情景中人的智力活动。从各种社会环境中对智力进行评价。第四章学业成就测验(学绩测验、教育测验)*特征与智力测验相比的异用旨在对学生在某一科目、某一知识中掌握的程度进行评价。心理测验中的学业成

20、就测验是标准化了的。1概述一发展1.1894,Rice的拼字测验揭开了标准化测验的序幕桑代克教育测验之父(学生)Stune的算术测验一一最早的标准化的学科测验桑代克的书法测验第一个用科学方法编制的教育测量工具。2.性质:学生对某一科目的学习效果,无预测功能。标准化测验与白编测验的不同之处。教师自编的测验因教师的进展,班级的情况的不同而不同,易反映所在学校现行的具体的教育目标;标准化中含有的教育目标更普遍。得到很多教育家的共识。标准化测验重于理解、思维过程;自编的测验重于具体知识。二成就测验的类型。(综合)成套测验斯坦福成就测验(幼级)学术能力成就测验基础教育及基本技能最低限度测验单科测验品质量

21、表教师自编测验eg:作文(优缺点)要求:量多,范围广,覆盖面大学生的回答形式越易越好要有客观标准的评分方法测验形式多样化尽量用要推理思考的题目,避免机械记忆第五章人格测验(个性)EysenckPersonalityQuestionnaive(EPQ)艾森克个性问卷。1752年1959年1964年1975年产生N分量表(神经质)E分量表(外倾性)L分量表(说谎)P分量表(精神质)L量表值超过一定值之后,表明这份测量无效。克雷普林,荣格。“联想法”武德沃斯人格测验的四种形式一自陈测验基本假设:人对自己最了解。忽略了:了解的正确性,报告的真实性非自我描述,而是测验,一般是纸笔测验采用是非题或选择题1

22、内容消毒人格测验(早期采用)根据某一种人格理论,来确定要测量的一个特质。缺点:特质与试题的联系,过于明显,容易使结果失真。2因素分析人格测验因素间相关较小。一个因素测一种特质eg:YG人格测验3经验效标人格测验根据不同的人的反应来编制eg:MMTI(明尼苏达。)用词要尽量中性化一般加入测慌题目卡特尔16种人格因素量表(一)根据“特质理论“。特质比习惯更一般化。整个人格体系所包含的行为都可用语词表现出来。通过因素分析,找到了15个因素:第二项B是从智力理论而来的。为第16个因素。有ABC三个英文版,各187题。(二)特点:1。客观,明确,中性化的词语表面效度低,看不出测什么编排2标准化。经过三次

23、抽样,准确性高。测验程序,抽样都符合标准化。有部面图3非单一功能,是多功能的十六个因素组合,得次级得一些人格因素4广普性。用来评价正常人。16岁以上到老。8岁到14岁用14P下(或CPQ)5岁到8岁。还有一个量表。5多元性信息量大。三)要求。1。每题都要选一个答案2全部要回答3尽量做得快4少选折中得答案明尼苏达多项人格文卷根据经验效标来测验。(一)编制思路和过程19301940收集1000多个题目,在效标组(异常人)和对照组(正常人)做实验。为了测多项,要有许多效标组10个临床量表和4个效度量表(Q量表无专门题目)13个分量表共654题。(有重叠得题目)。不重复,共550题,其中有16题可用两

24、次。1至399题是测验用,其他供研究用二)施测和评分。约45分钟,一般不超过90分钟有:卡片式;问卷式男女分开;把重叠的题的答案比较,不同的在6题以上,作废;这些题与无法回答的题在30题以上,作废。疑病症:T60不愉快,敌意,需求,同情抑郁症:T70表现:易怒,胆小,自责癔病:T70歇斯底里,天真,缺少自知力。用否认,压抑来处理事情。精神病态高分很难接受社会价值观和社会道德规范易接受反社会行为。外露,善交际,爱享受,不成熟家庭关系处理不好,虚伪。男子气好气。(非病)T越高,越远离自己的性别男:敏感,被动,爱美。(高分)好攻击,粗鲁(低分)女:(与男相反)妄想症:T70明显精神病行为:认为自己受

25、欺负障碍80(极端)精神病60,70倾向精神衰弱强迫行为,恐怖,刻板,自责,不安。精神分裂7080分裂的生活方式,退缩,胆小,心情易变,紧张,有奇怪的思想,判断力差。有幻想,幻觉轻躁狂T70,75外露,乐观,精力过分充沛,易怒,纵酒,轻浮,夸张,过高估计自己75情绪反复无常社会内向(非病)高分内向倾向严重胆小,退缩,屈服,过于谨慎,反应慢低份外向,冲动,任性,做作,不太真诚注:要根据双高分的原则。高:60或70(三)优缺点优点:(I)客观;与医学诊断一致性高(II)首次把效度量表引入测验(III)既可作医学诊断,也可以作正常人的人格诊断(IV)丰富的题库缺点:(i)人格测验信度不够(ii)易受

26、被试的年龄,性别,学历,社会环境的影响(iii)对人格特质的描述多用病理学解释(iv)题目多,时间过长易引起烦躁。二投射测验投射:个体把自己的思想,态度,愿望,情绪,性格等人格特质不自觉地反映于外界事物或他人身上的心理作用。特点:刺激本身没有意义。强调无意识,否认自陈测验。投射测验的类型:1联想法词的联想(荣格)罗夏墨迹图RorschachInk-BlotTest2.构造法根据被试看到的图片,构造一个故事(有过去,现在,将来)。主题统觉测验TAT儿童主题统觉测验:(i)动物版(ii)人物版3完成法提供残缺不全的图片或句子,要求补充完整语句完成测验(SSCT)60题(类:家庭,性,人际关系,自我

27、观念4排选造给予几张照片,按(任何方法)某种顺序排列5表露法让被试利用某种媒介自由表露心理状态画树测验20个标准投射测验优缺点优:(I)不受题目限制,可测出题目以外的线索,对人格做出综合探索缺:评分缺乏标准,无常模,信效度不够,不易量化理论深奥,对主试要求高,不易普及三评定量表(他评量表)类型:1数字评定量表2图标评定3标准评定4强迫选择评定量表四情境测验1品格教育测验主要用来测儿童的品格发展(1)诚实测验。Eg:不肯能成绩(2)自控测验(3)公正测验(多用于幼儿)2情境压力测验eg:无领袖团体情境测验3优缺点:优:在实际情境中做测验,表现出来的人格特征较真实,准确。缺:实施起来较困难,主试需

28、经过严格培训。但仍有误差。四种人格测验的缺陷(i)人格的定义还不一致。测验内容也不一致。所测的人格特质也不相同。(ii)人格测验的信度。效度较低。原因在于:人格受情境和个人当时心态的影响;人格测验很难找到准确的效标。(iii)人格测验编测题很难(iv)测验结果的解释有多样性。答案无对错之分。(v)测验中有伪装和社会赞许的反应。(vi)人格测验关系隐私问题。第六章态度测验法社会心理学领域多用此测验法。一态度的性质及态度量表的公用。1基本性质。斯宾塞(Spencen)第一次用此词。Combell:态度是针对一组社会事物而产生的具有一致性的反应群。三个层面:1.认知(尤其是评价性认知)2情感性。3行

29、为倾向。态度有方向性;也有强弱之分;有多面性;有三层面一致性。2态度量表:由一组相互有关联的陈述句组成,一组态度语或项目。陈述句的方向,强度是有区别的。明确的目的,测题质量.数量是好的态度量表的决定因素.3.功用(1)衡量一宣传工具影响人们态度的程度.(或政治预测,市场调查,偏好)(2)评估教育的成果等距量表法根据研究主题,搜集符合的态度语100200句.其中反对及赞成的比例1:1.(或1/3反对,1/3中立,1/3赞成).按反对到赞成份57组.主义:语句通顺,简单;没有歧义,每句句子对主体有清晰的态度.公认的事实不要放在测验中,无鉴别力.请5060人对反对至赞成的句子分组,至少7组(客观,对

30、主体明确的人)对每名态度语做次数分布表和累积百分比表画累积百分比图5.找出(又值小的句子,并且在011组的分布合理.143,574,8113三利克特量表法(Likert)针对一个研究主体,收集有关资料,编制成态度语(包括肯定的态度和否定的态度语).回答分五或六等题目及答案由肯定至否定得5,4,3,2,1分.总加量表特点:(1)假定每一题都有相同得量值(因为题目要求同质性)被试对题目得态度强度可以尽量分出等级.编制方法(1)项目的制订题目性质相同(若对不同质题目的态度与对研究内容的态度一致,则也可选用)不少于20个预测和评分选一样组做预测,看题目是否编得理想(预先测验)(a值:内在一致性)项目分

31、析分析题目的鉴别力被试题目得分由高到低排列,取前后各25%人.一个题目:(高分中)(同意人数/高分组人数)(低分组中)(同意人数)/低分组人数)=鉴别指数鉴别指数:0.2以下淘汰,0.3以上通过.0.20.3修改四.哥特曼量表法1.构造原理项目少(不超过10个),效果较好的一种量表,结构复杂.每一题程度上有不同eg:战场中的柑桔经常(a)有时(b)只有一次(c)从来没有(d)不予回答(e)(1)心脏脉搏跳动很快胃有下沉感感到虚弱或晕眩胃感到不适出冷汗呕吐全身颤抖尿撒在身上(9)膀胱失去控制(10)有僵硬感觉(2),(3)题中a.b.c一分;d.e零分其它题中a.b零分;c.d.e一分去掉第(5

32、)题恐惧程度由弱到强:1274103698一道题目:(理论上)表(略)2步骤设计句子,及五或六种反应态度选一个代表性样组进行预测把题目按分数由上到下(从最赞成到最不赞成)排列3缺点。只注重单向性,不注意设计项目。题目。第七章兴趣测验一.1915.迈纳(Miner)不标准化的1927斯特朗(Strong)1939库德(Kuder)高中,高中以后。职业兴趣才稳定下来(15岁18岁)因为找被试有年龄限制。可通过(i)兴趣表达,(ii)对行为进行观察,(iii)进行能力测验(iv)兴趣问卷,四个方法来了解个体的兴趣。(综合以上三种方法,是最常用的)只能说明有兴趣,未必胜任。二.斯特朗坎贝尔兴趣问卷1.

33、评卷(I)浏览(II)一般职业框架(转换成七分)低于34,此方面兴趣很低3542低4357平均5865高高于66极高(III)对照常模(IV)做一般解释,也可再进行特殊分析2.信度0.80效度极好库德职业兴趣调查表强迫选择有48个大学专业量表信度0.90另外还有“个人匹配”。可以深入了解一个人的兴趣自我指导问卷职业类型测验人格特点职业搜索表先测兴趣特征,再根据人格特点查找兴趣再写职业码。查指南。现实型(R),研究型(I),艺术型(A)社会型(S),企业型(E),传统型(C)eg:心理AIC图(略)第八章测量的误差稳定性(一致性)准确性一误差形式(i)随机误差(ii)常定误差(系统误差)只影响准

34、确性,而不影响稳定性(iii)抽样误差二误差的来源1测验内部引起的误差(编制过程种,测题本身存在的误差。)题目取样时,题量少,或无代表性其他编制过程。Eg:句子意义不明确,题目太难,测验时间设定不对2测验过程中引起的误差a.物理环境主试的情况(尤其对儿童会有影响)步骤,说明被试是否清楚儿童,或有情绪障碍的人需先交流意外干扰eg:团体测量中。计分过程中eg:不客观,尺寸掌握不同3来自于被试本身的误差图(略)能力高的人不太会产生焦虑;能力不自信求胜心切的人会产生较高;缺乏自信,适应性不强,情绪不稳定的人易高焦虑很少参加测验的人,对程序不熟悉易高焦虑测验成绩对被试而言很重要。易高焦虑第九章.测量的信

35、度信度与随机误差的关系:信度大,误差小一信度的定义实测分数=真分数+误差X=T+E信度:真分数/实测分数(真分数不可能测得,只能通过对误差的推测来估计)判断信度系数的高低:(能力测验,信度需0.90,人格(态度)测验,0.80)一估计信度的方法1稳定系数(重测信度)成人隔2,3月至半年皮尔逊积分相关公式儿童隔1,2周至半个月r=(工XlX2/N-#*#)/Sl*S2跨时间的一致性2复本信度(等值系数)跨形式的一致性。时间间隔不要太长。3内在一致性。跨题目的一致性克伦巴赫a系数:(i)分半信度:以奇偶数分半r校正=(2*r分半)/(l+r分半库德理查逊估计法KR20公式Rkk=(k/(k-1)*

36、(1-EPiGi)/Sx2)适用于二极性的答案(iii)a=k/(k-1)*(1-工Si2/Sx2)适用于二级以上的答案内在一致性优点:只须做一次测验,信度比以前两种方式高。注:测验是同质性的或有分量表才可用。4因素分析。5评分者信度(主观题)三影响信度的因素。1不同测验范围与信度分数分布越大(误差越小),信度高eg:612岁,信度0.95,其中,10岁,信度0.95所以被试年龄多,信度易高。2测验长度与信度题目多,信度高n=rnn(1-r11)/r11(1-rnn)r11原信度rnn目标信度11nn斯皮尔曼一一布朗公式K:改变以后的长度与原长度之比r:原长度XXr=Kr/1+(k-1)rXX

37、XX测验难度和信度分数分散的分布越广,信度越高四测量的标准误差尤其适用于解释个人分数标准误差,误差分数分布的标准差。实践中,以一组被试两次测验的得分代替一个被试多次测量的得分。Se=St*(1-rtt)1/2Eg:韦式测验Se=St*(1-rtt)1/2=3.35在95的置信水平上,被试的区间。3.35*1.96=6.6若得分100,在100-6.6,00+6.6区间1概率为95,也可用标准误差判断一名被试两个测验的差异第十章效度信度只从测量角度评定测验效度:测测验的特性的程度,测测验是测什么特性。&1.效度的概述一什么是效度一个测验的结果必须符合测验的目的。有效性效度相对信度更重要。实测分数

38、=真分数+误差(随机)必要条件:信度,效度效度:实测分数中与目的有关的真分数占实测分数的比例二信度与效度的联系三影响效度的误差来源1测题本身(最主要的来源)测题长度,编排方式2实施过程中3被试的反应四效度的性质对效度的评价高,中,低效度通过推测得到&2.准则关联效度或效标效度eg:智力水平的效标可以是:学习成绩,教师评语,以后的成就效标:相对的,受时间的考验分:同时性继时性eg:将来的工作成就效度系数(测验分数与准则的相关程度)1相关法积差相关法两分数要求连续图(略)二列相关法(一组分数连续,另一组不连续)多元相关法(有多等级)2区分法(小规模不易看出有差异,大规模易看出有差异)3命中率图(略

39、)注意:以上三种方法都要求效标的可靠性&3.内容效度一包含主要方面各方面的题目要有比例,有一定难度学业成就测验尤其注重内容效度二考验内容效度的方法1专家判断缺陷(i)无量化指标(ii)判断不一致(iii)由于教育思想不同,所以判断内容范围时不一致)2统计分析法(克伦巴赫提出)根据相同的内容范围,编两套测题,对被试测试,再进行相关处理(类似复本心信度)3再测法两次测验,后一次测验分数明显提高,则内容效度高(中间有教学)4经验法测验分数随年龄增长而提高,内容效度高三内容效度和表面效度的关系被试或外行人从题目看出要测的内容。两者之间不要求同步。表面效度不是一种客观指标,但会影响被试动机,从而影响内容

40、效度。学习成就,职业测验,兴趣测验的表面效度高,人格测验表面效度要低。表面效度降低只要改变措词。四提高内容效度的方法编制命题双向细目表图(略)&4.结构效度一概述1954念提出按一定理论编制测验,测验结果证明了理论,则有结构效度二考验结构效度的方法1测验内方法研究测验的内部结构,来界定测验的结构范围借用内容效度(结构效度与之有直接关系)(ii)考察测验的同质性一个因素中的应是同质性的,不同因素,之间不能是同质性的。(iii)分析被试对题目的反应过程外来影响因素越小,结构效度越高2测验间方法研究几个测验(同类)间的相关,来考察是否测同一特质。(i)相容效度求一个新测验与一已有测验的相关(若无已有

41、测验,用部分有关系的测验代替)(ii)会聚效度和区分效度(1960坎贝尔提出)要求:测同一特质的变量有很高相关,并且,测不同特质的变量有很低相关,特别适合于人格测验。多种特质多种方法矩阵3准则关联效度研究对准则的预测水平越高,效度越高,主要看测验分数可否区别不同的人。Eg:Barron巴龙,自我强度量表4其他变它证据随自然事件的发生,测验结果应有所变化5实验操作看是否受训练的影响。Eg:学业成就一一训练有影响。智商一一训练无影响。非训练测题。证明了预期,则有效度对效度的总结任何测验,都二要效度证据。不同测验,偏重于不同种类的效度,实际运用中,多用准则关联效度,内容效度只需说明。三种效度有不同作

42、用。结构:帮助我们运用分数去解释人的不同心理特质。准则关联:了解分数是否可以有效估计某种行为表现内容:帮助决定分数是否代表测验结果。效度分析通常是编完测验后做,但效度的思想已知影响编制过程。效度比信度更重要第十一章测验的实施与计分12121234567&1.测验的准备一测验者的准备主试的准备。经过严格的训练与考核,熟悉指导语。二测验环境的准备1房间的选择;2。桌椅安排。(不能太大,易分散主义;不能太小,不易施展开来。一般的光线,温度,对儿童,引起注意分散的物品拿走)。位置远离喧闹,不准有人进出。(主试与被试中不可有一方站着,椅子太高或太低影响视线,桌子太小,倾斜都不能做测验。不要坐沙发,转椅,

43、应是直靠椅背的高度适中,桌面足够大,不要太宽)3测验材料的准备4参加测验的人员父母,班主任不可做主试三被试的准备。放在被试最佳心理,生理状态1选择的时间(无吸引他们的活动的时间,心理情绪稳定,生理状态良好的时候)2生理的准备(在测验时无急迫的生理需要)3心理的准备,亲密关系的建立(i)先介绍自己(姓名,职业)(ii)问一些一般的信息,使他高兴(iii)不直接地讲一些“目的”。(避免提“作业”)(iv)对大致的一些任务作介绍(所需时间,将有的活动,测验的难度,鼓励他们对不明确的地方立即提一些问题)&2.测验的实施作记录记录要隐蔽记录要真是如何对待被试的要求如果被试没有听清题意,要求重复,一般允许

44、,但记忆测验不能重复如果被试要求修改回答,一般允许,但若规定只记第一时间的反应,则不允许更正。对主试的要求。主试必须集中注意力不能对被试的回答有所暗示适当强化被试的行为(适当鼓励)鼓励被试的回答对磨棱两可的答案,主试先重复回答,再让被试解释。若这类答案无论如何理解都错则不需追问。对计时题,题目说完就按下表计分严格按照手册要求&3.测验的计分年龄的计算法测验日期出生年月注:借位。有30日,12个月。原始分计算法10,1(对,错)计分法2多级计分法三原始分换算为标准分数(以年龄分,以年级分,以百分位。来表示)第十二章。测验的项目分析可以分:质的分析。专家对项目内容,形式进行分析量的分析。采用统计方

45、法来测定项目的品质。包括难度分析与鉴别力分析。&1.项目的难度一难度:测题的难易程度难度分析在能力测验中,指:对测题难易程度作标定在非能力测验中,指:对内容通俗性和流行性程度作分析在题目范围之内,做回答的人的估计难度的指标。1通过率通过的百分比越高,题目越容易(i)二值记分测题:0,1计分P=R/N(R:通过人数,N:总人数)(ii)非二值记分的测题P=#/#廿实际的平均分#若都得满分,所得得平均分。maxmax但,先要做修正以排除“猜”得机率即:再用校正公式CP=(KP-1)/(K-1)(K代表“K择一)选项数目不一样,不可直接比较两题难度,要做校正。(iii)分组法当被试样本很大,把分数从

46、高到低排列取高分组,上限27人;低分组:下限27P=(P+P)/2(P,P可用P=R/N或P=/#等得)HzHzmax2项目难度的等距量表(通过率反映出的难度不等距)二测验难度的确定和分数的分布通过率越接近0或1,就无鉴别力;越接近0.5,越有区分力。但每道题都是50,一方面不太可能做到;另一方面,题目间的相关会很高。所以一般,把测验的平均难度控制在0.5,而每道题可在0.30.7中波动若选择的人数少,参选的人多,则P可以很小,难度高一些,eg:P可在0.05,当从100人中取5人时)分数分布是常态的,测题难度就恰当。反之,图(略)&2.项目的鉴别力(区分度)1鉴别力:测题对于不同水平的被试反

47、应的区分程度和鉴别能力。2鉴别力估计方式:项目效度分析:主要依据效标,来考察测验中的反应与效标的相关可用相关系数用鉴别指数:分数从高到低排列,对半分,分高分组,低分组小样本时,D=PHP指数越高,鉴别力好。Hz大样本时,用两端来挑高分组,低分组27为最佳有的测量效标难找,就用总分做效标,将每道题的分数与总分做相关相关高;鉴别力也高;相关低,鉴别力不够计算方法:(i)点二列相关系数rpbi=#p#g/St(pg)1/2#p答对的人的总分平均数(g=1-p)#g答错的。St标准差P为难度值条件:测题0;1记分,总分连续(ii)二列相关条件:测题与总分都是连续的值,测验又认为分成两类rb=#p-#q

48、/St(pg/y)1/2(iii)积差相关方差法看离散程度一道题目,离散程度大,有区分度。难度与鉴别力的关系通过率为1或0,无鉴别力通过率为0.5,鉴别力为1。通过率为0.7,鉴别力最大值为0.6(书P124)&3.项目分析实例一步骤1选取有代表性的样组,按规定程序预测2批出分数。按总分高到低排序,高分组,低分组各27同一测题,高分组,低分组通过人数比率PHPH,z分别求出难度,鉴别力比较高分组,低分组在每题答案上的反应。根据统计结果修改测题二.实例题号组别选答人数正确答案难度鉴别力ABCD未答prbD1高分组592120B.71.52.42低分组2250121602高581015161A.42.33.32低2621153623高1715282812D.31.-.04-.06低25111934114高14414365C.12.08.04低15610285首先看鉴别力1,2题号,3,4题淘汰或修改难度(0.350.65之间最好,总难度要居中)就难度而言,4个题都可使用选答人数异常:正确答案无人或很少有人选,选的人数少于其他答案选的人;选错的人过多高分组选正确答案的人少于低分组的,高分组选错人多(iii)某一选项无人选择(iv)未答人数较多4修改&4.准则参照测验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论