版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章心理测量学知识国家职业资格培训-心理咨询师云南大学解亚宁小测验1、知识分测验分为16算术分测验分为7数字符号分测验分为4积木图案分测验分为7这是什么测验的结果?此结果是如何得到的?如何分析和报告此结果?小测验2、N维度T分为60E维度T分为40P维度T分为50L维度T分为65这是什么测验的结果?如何分析和报告此结果?小测验3、SCL90总平均分为1.2SCL90抑郁因子分为3.3SCL90焦虑因子分为2.3SCL90其余因子分在0-1之间这是什么测验的结果?此结果是如何得到的?如何分析和报告此结果?心理咨询师国家职业标准
国家职业资格三级
—心理咨询员心理咨询师国家职业标准
国家职业资格三级
—心理咨询员心理咨询师国家职业标准
国家职业资格三级
—心理咨询员心理咨询师国家职业标准
国家职业资格三级
—心理咨询员心理咨询师国家职业标准
国家职业资格三级
—心理咨询员相关知识心理咨询师国家职业标准
国家职业资格二级
—心理咨询师心理咨询师国家职业标准
国家职业资格二级
—心理咨询师心理咨询师国家职业标准
国家职业资格二级
—心理咨询师学习内容
〔05年版教材324-392〕第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节工程分析第六节测验编制的一般程序第七节心理测验的使用第一节概述第一单元测量与测量量表定义3元素:事物、数字、法那么测量2要素:参照点、单位分类4量表:命名、顺序、等距、等比一、什么是测量?“测量〞——是依据一定法那么用数字对事物加以确定。测量构成的3个根本元素事物:能力、人格、外显行为。数字:有区分性、系列或等级性、可加性法那么:规那么、方法,理论依据和指标。
二、测量要素参照点事物的起点绝对零点和参照零点单位有确定定义有相同价值三、测量量表
斯蒂文思〔S.S.Stevens)将测量从低级到高级划分成四种水平命名量表只是用数字来代表事物或把事物归类。顺序量表分等或排出顺序。无相等单位,无绝对零点。等距量表有大小关系,有相等单位,无绝对零点。等比量表有相等单位,有绝对零点。第一节概述第一单元测量与测量量表第二单元心理测验的根本概念心理测验定义四特点心理测验性质三特性心理测验定义有四个特点工具特点:测验是引起某种行为的工具。行为样本特点:测验是通过行为样本间接地推知被试者的心理特征。标准化特点:是指测验编制、实施、计分和测验分数解释的一致性,即对所有被试来说施测的条件都相同。常模特点:一组有代表性的被试群体的测验分数。测验分数只有与他人的成绩或常模比较才具有意义。二、心理测验的性质间接性根据对测验工程的反响推论心理特质;相对性结果是与团体行为进行比较而言;客观性工程、实施与评分和解释标准化;第一节概述第一单元测量与测量量表第二单元心理测验的根本概念第三单元心理测验分类5种分类:功能分类性质分类严谨程度分类测验方式分类测验要求分类第三单元心理测验的分类一、按测验功能分类
智力测验特殊能力测验人格测验二、按测验的材料分类
文字测验操作测验三、按测验材料的严谨程度分类
客观测验投射测验四、按测验的方式分类
个别测验团体测验五、按测验的要求分类
最高行为测验典型行为测验一、按测验的功能分类智力测验Binet-Simon智力测验、Stanford-Binet智力量表、Wechsler儿童和成人智力量表等。特殊能力测验职业性向测验、音乐、绘画能力测验等人格测验问卷法——MMPI、16PF、EPQ等;投射法——罗夏墨迹测验、主体统觉测验〔TAT〕二、按测验材料的性质分类文字测验Binet-Simon智力测验、Stanford-Binet智力量表、Wechsler儿童、成人智力量表中的言语量表、MMPI、16PF、EPQ等。非文字测验罗夏墨迹测验、主体统觉测验〔TAT〕、Wechsler儿童、成人智力量表中的操作量表、Raven测验等。三、按测验材料的严谨程度分类客观测验Binet-Simon智力测验、Stanford-Binet智力量表、Wechsler儿童、成人智力量表MMPI、16PF、EPQ等。投射测验罗夏墨迹测验、主体统觉测验〔TAT〕、自由联想测验、句子完成测验。四、按测验的方式分类个别测验Binet-Simon智力测验、Stanford-Binet智力量表、Wechsler儿童、成人智力量表罗夏墨迹测验、主体统觉测验〔TAT〕等。团体测验MMPI、16PF、EPQ。五、按测验的要求分类最高作为测验
Binet-Simon智力测验、Stanford-Binet智力量表、Wechsler儿童、成人智力量表、Raven测验等。典型行为测验MMPI、16PF、EPQ。第一节概述第一单元测量与测量量表第二单元心理测验的根本概念第三单元心理测验分类第四单元错误与正确的测验观3个错误观2个正确观一、测验的错误观测验万能论测验解决一切问题,分数绝对化。测验无用论测验侵犯个人隐私、违背民主原那么。为宿命论和种族歧视提供依据。测验单一论心理测验等于智力测验二、正确的测验观测验是重要心理学研究方法、决策辅助工具;测验作为研究方法和工具尚不完善;第一节概述第一单元测量与测量量表第二单元心理测验的根本概念第三单元心理测验分类第四单元错误与正确的测验观第五单元咨询中常用测验及其应用智力测验人格测验评定量表咨询中常用的三类测验及其应用智力测验中国比内测验、韦氏量表、Raven测验等;求助者有特殊要求及有可疑智力障碍时使用。人格测验EPQ、16PF、MMPI等;了解求助者人格及是否有精神异常。评定量表精神病评定量表、病症评定量表等;了解心理障碍存在与否、程度及病情演变。第一节概述第一单元测量与测量量表(2,3,4)第二单元心理测验的根本概念(3,4)第三单元心理测验分类(5)第四单元错误与正确的测验观(2,3)第五单元咨询中常用测验及其应用(3)第六单元心理测验开展史三个十年四个开展方面第二节测验的常模第一单元常模团体3W,1H什么是常模团体常模团体的条件常模团体的取样方法常模团体的分数表达形式一、常模团体的性质〔What〕什么是常模团体:是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。常模团体的组成:确定一般总体--确定目标总体--确定样本。例:大学生价值观研究一般总体-大学生目标总体-各大学的学生样本-不同性别、年龄和专业的大学生群体常模团体的标准:性别、年龄、年级、教育水平、职业、社会经济地位、种族二、常模团体的条件〔Who〕常模团体的构成必须要明确界定必须由具有共同特征的人组成的群体(性别、年龄、年级、教育水平、职业、社会经济地位、种族);常模团体的获取必须具有代表性随机取样、分层抽样。样本大小要适当总体只有几十个人,那么需要100%的样本;总体数目大的样本,最低不少于30-100人;全国常模应有2000-3000人。常模团体会随时空的变化而变化常模要定期修订;要选择时空较为接近的常模。三、常模团体的取样方法〔How〕简单随机抽样在简单随机抽样中,每个人或抽样单位都有相同的时机作为常模中的一局部。系统抽样有时在总体数目为N的情况下,假设要选择K分之一的被试作为样本,那么可以在抽样范围内选择每个第K个人来构成样本。分组抽样有时总体数目较大,无法进行编号,而且群体又有多样性,这时可以先将群体进行分组,再在组内进行随机取样。分层抽样它是先将目标总体按某种变量〔如年龄〕分成假设干层次,再从各层次中随机抽取假设干被试,最后把各层的被试组合成常模样本。包括分层比例抽样和分层非比例抽样四、常模团体的分数表达形式〔What〕常模分数由常模样本的测验原始分数按一定的规那么转换出来的导出分数。它有参照点和单位。例:IQ、韦氏智力量表的分测验量表分、T分数等。常模指常模分数构成的分布。如心理测量手册中的原始分数与导出分数的转换表。解释测验分数的根底。一般常模特殊常模第二节测验的常模第一单元常模团体第二单元常模类型开展常模百分位常模标准分常模智商一、开展常模许多心理特质是随时间〔年龄〕变化而开展的。将被测者的成绩与各种开展水平人群平均表现相比较,这种常模即开展常模,该量表亦称年龄量表。开展顺序量表测验条目〔能力或行为〕按出现的早晚排列,完成该条目说明到达相应的年龄水平。葛塞尔婴幼儿发育量表:包括运动水平、适应性、语言、社会性四个方面。一个人在采用年龄量表方式编制的智力测验上得到的分数,简称智龄。计算方法每个条目代表一定的年〔月〕龄,将所通过的条目折算出月龄,然后相加计算出智力年龄。如比内量表。以标准化样本每个年龄组平均原始分数作为常模,被试者从测验中得到原始分数与其比较,从而确定智龄。智力年龄心理年龄的分数计算确定根底年龄全部题目都通过的那组题目所代表的年龄确定心理年龄将在所有更高年龄水平上通过的题目,用月份计算,加在根底年龄上例:某儿童6岁组题目全部通过,7岁组通过4题,8岁组通过3题,9岁组通过2题。〔1936年陆志韦修订版〕智龄:6+〔4×2+3×2+2×2〕/12=7岁6个月一、开展常模年级当量〔年级量表〕即年级水平,指各年级常模样本的平均原始得分。〔参看教材340页例〕二、百分位常模百分位常模包括百分等级、百分点、四分位数和十分位数。
百分位常模分数的计算及解释百分等级百分等级是应用最广泛的表示测验分数的方法,百分等级指出的是个体在常模团体中所处的位置百分等级的计算未分组资料
PR=100-(100R-50)/N
R指某人原始分排列的顺序数N指样本总人数举例:小东在30名同学中语文成绩是80分,排列第5名,其百分等级多少?
PR=100-(100×5-50)/30=85正态分布与标准分关系百分点百分点用于计算处于某一百分比例的人相对应的测验分数是多少,因而在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数计算方法〔直线内插法〕举例:高考的最高分为695,其百分等级为100,最低分为103分,百分等级为1,求百分等级80所对应的分数是多少?公式:C指上限百分等级SC上限百分等级对应的分数F指下限百分等级SF下限百分等级对应的分数X百分等级PP根据百分等级,要求的对应分数PP=575.420/(695-PP)=79/(PP-103)79(695-PP)=20(PP-103)〔等号两侧交叉相乘〕54905-79PP=20PP-206054905+2060=20PP+79PP56965=99PPPP=56965/99PP=575.4百分点例题计算部骤〔因式分解〕四分位数
百分位数的变式,将量表分4等份,1~25%、26~50%、51~75%和76~100%四段。十分位数
百分位数的变式,将量表分成10份,1~10%为第一段,91~100%为第十段。三、标准分数常模标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的根本单位是标准差,所以叫标准分数。1.线性转换的标准分数根本公式为:常见的标准分数有z分数、Z分数〔Z=A+BZ〕、T分数、标准九分数、离差智商〔IQ〕等。2.非线性转换的标准分数z’分数对每个原始分数值计算累积百分比;在常态曲线面积表中,求出对于该百分比的标准〔z’〕分数。线性转换的标准分:
Z=A+Bz非线性转换的标准分:原始分百分等级常态分布的离均值〔查常态曲线面积表〕
求出对应的z分数常见的标准分形式根本形式z分:z=(X–X)/SDX为任一原始分X为样本平均数SD为样本标准差常用标准分Z分数Z=A+BzA为量表的平均数〔根据需要指定的常数〕B为量表的标准差〔根据需要指定的常数〕z为根本形式的z分举例:韦氏智力量表智商的平均值为100(A),标准差为15(B)。某人的全量表分高于常模1个标准差,问其FIQ应为多少?115(IQ)=100+15×1T分数T分数由麦克尔于1939年提出,有纪念推孟和桑代克之意T分数目前表示任何常态化和非常态化的转换标准系统,量表分平均值固定为50,量表分标准差固定为10。许多人格问卷均采用T分量表,如MMPI、EPQT=50+10(X–X)/SD或T=50+10z50(A)为T分数〔量表分〕的平均值10(B)为T分数〔量表分〕的标准差标准九分1~9分的九级分数量表,平均值为5、标准差为2。标准9分=5+2(X–X)/SD或标准9分=5+2z标准十分 1~10分的十级分数量表,平均值为5、标准差为1.5。卡特尔16PF标准10分=5+1.5(X–X)/SD或标准10分=5+1.5z举例:〔16PF〕30岁女性被试乐群性得分为15分,常模平均值为10.90、标准差3.23,其量表分是多少?标准二十分1~19分的分数量表,平均值为10、标准差为3。韦氏智力量表标准20分=10+3(X–X)/SD或标准20分=10+3z举例:〔WAIS-RC〕16岁被试算术分测验得分为15分,常模平均值为12.73、标准差3.55,其量表分是多少?四、智商及其意义比率智商
离差智商智商的计算及其意义最早的比内–西蒙量表用心理年龄来表示智力的上下测验题目的安排完全按难度排列,某条目在某年龄组中50%能通过,该条目就被当成该年龄组的题目。比率智商比率IQ=MA〔心理年龄〕/CA〔实足年龄〕×100比率智商的缺乏之处个体智力的增长与年龄的关系并非一直呈直线关系,因此不适合于成人。比率智商的分数在不同年龄组具有不同的意义。离差智商是一种以年龄组为样本计算而得的标准分数,为了使其与传统的比率智商根本一致,一般研究者将离差智商的平均值定为100。韦克斯勒智力量表的标准差定在15IQ=100+15(X–X)/SD或IQ=100+15z斯坦福-比内量表的标准差定在16IQ=100+16(X–X)/SD或IQ=100+16z常模标准分转换表在实际工作中,测验编制者会采用某种标准分公式计算出与原始分相对应的标准分,并编制成原始分转换标准分等值表,附在手册上方便使用。每个测验采用何种标准分,以及量表分的平均值和标准差均可从测验手册中查到。举例〔C-WYCSI〕4岁城市儿童,言语分量表得分42分,常模平均值为49.94、标准差11.58,其言语IQ是多少?第二节测验的常模第一单元常模团体第二单元常模类型第三单元常模分数表示方法转换表法剖面图法2种常模分数表示方法转换表或常模表又称常模表,最简单、根本的表示方法。将测验的原始分转换成相对应的常模分数〔如百分位、标准分、T分等〕〔P346〕剖面图将测验分数的转换关系用图形表示出来,如韦氏智力量表剖面图(P346)。剖面图能直观地表示出被试在各分测验上的表现及相对位置。第三节测验的信度第一单元信度的概念2种定义3个指标一、信度的定义1、通俗的定义即测量的可靠性、一致性或稳定性,指对同一被试者在不同时间内用同一测验重复测量,所得结果的一致性程度。2、测量学定义——理论定义信度为一组测量分数的真分数方差〔变异数〕和总方差〔实得分数的方差〕的比率。
2、测量学定义——操作定义X=T+E二、信度的指标
1、信度系数——常用相关系数来表示,通常是同一被试样本所得的两组资料的相关。它表示实得分数的变异数中有多少比例是由真分数的变异决定的,例如rXX=0.9意指变异的90%来自真分数的差异。
相关系数:表示相关程度的统计学指标相关系数取值于–1.00~+1.00之间。负值表示负相关,正值表示正相关。“0〞表示两个变量之间完全没有关系,“1〞表示两个变量之间呈现一对一的关系。相关系数不是等距的度量值,因此在比较时只能说绝对值大者比绝对值小者相关更密切一些。相关系数与其他统计量一样也存在抽样误差,因此其统计学意义也应进行显著性检验。相关分析计算两种具有相关关系的不同现象之间关系程度的统计学方法,结果用相关系数表示。二、信度的指标
信度系数相关系数信度指数信度系数的根底,是真分数标准差与实得分数标准差的比值。二、信度的指标测量标准误——测验分数的变异量,信度越高,标准误越小;信度越低,标准误越大。第三节测验的信度第一单元信度的概念第二单元信度评估方法4种方法:重测信度复本信度内部一致性信度评分者信度
重测信度——同一测验、同一组被试,前后两次施测,求两次测验分数的相关系数。举例:10名学生两次测验的成绩如下,求它们之间的相关?第1次成绩:86587964885855823275第2次成绩:88568976856847764575思考题:
1、如何进行重测信度检验获得相应的相关系数?2、重测方法的优点、缺点?一、重测信度〔test-retestreliability〕复本信度——等值平行的测验叫复本,计算同一组被试在两个复本测验上得分的相关系数,这个系数就是复本信度系数。思考题:1、如何进行复本信度检验并获得相应的相关系数?2、复本信度的优点、缺点?二、复本信度〔alternate-formrelaibility〕1、要有两份或以上真正平行的测验,即在题目内容、数量、形式、难度、区分度、指导语、时限以及所用例题、公式和测验等其他方面都相同或相似。2、被试有条件接受两个测验。复本信度使用前提条件:〔一〕分半信度〔split-halfreliability〕将测验题目对等分开,计算两半测验分数的相关。注意:所用的公式仍然可以采用积差相关公式,但由于分半后题量地方减少会导致信度被低估,因此,要对信度系数加以修订。常用斯皮尔曼—布朗的公式三、内部一致性信度举例〔例3〕:
10名被试者在一个有10个条目的测验中得分如下,求该测验的分半信度?被试测验题目得分单号得分双号得分单双之差1234567891012221221001761221121001004403222212111178-1410010000001105120100000013-2622122111107617221211000045-18222201101065192222211000752102211211001651合计18171315119633350482信度系数修订方法:1、斯皮尔曼-布郎公式校正公式rxx=2rhh/〔1+rhh〕rhh——两半分数的相关系数,rxx——测验在原长度时的信度估计。缺陷:该公式假设两半测验分数的变异相等,如两半测验分数的变异不等值时可采用以下公式:2、弗郎那根〔Flanagan〕公式:
rxx=2[1-〔Sa2+Sb2)/Sx2]
Sa2、Sb2——两半测验分数的变异数,Sx2——测验总分的变异数。3、卢伦〔Lulon〕公式:rxx=1-Sd2/Sx2Sd2——两半测验分数之差的变异数,Sx2——整个测验分数的变异数。同质信度——测验内部所有题目间分数的一致性。
〔二〕同质信度〔homogeneityreliability〕1、库德〔G.K.Kuder〕—理查逊〔M.W.Richardson〕公式〔1〕K-R20公式:rkk=[K/〔K-1〕][1-(∑piqi)/Sx2]K——题目数Pi——通过第i个题目的人数比例qi——未通过第i个题目的人数比例Sx2——为测验总分的变异数。注:适用答对一题得一分,答错无分的测验。同质信度的计算方法:〔2〕K-R21公式:
pi——题目的平均通过率qi——1-piK——题目数Sx2为测验总分的变异数注:适用各题难度相近的情况;当题目难度相差大时,所求信度系数有低估倾向。2、克伦巴赫α系数
α=[K/〔K-1〕][1-〔∑Si2〕/Sx2]Si2——某工程分数的变异数;其它字母意义同k-R20公式,当题目以二分法记分时,∑Si2=∑Piqi,所以K-R20公式为α系数的特例。注:1、适用多重记分的测验;上述公式不适用速度测验。2、库德-理查逊公式和克伦巴赫α系数所求得的信度通常比分半信度低。评定者信度——两个或多个评分者之间评分的一致性。计算方法:
1、两个评分者的一致性的计算计算每份试卷两个评阅人打出分数的相关系数,一般要求在0.9以上,才被认为是客观的。四、评定者信度2、多个评分者时的一致性计算方法——肯德尔和谐系数
当多评分者、多对象并以等级法记分时,用肯德尔和谐系数计算。
K——评分者的人数;N——被评的对象数;Ri——第i个被评对象的被评等级之和。当K为3~20人,N为3~7人时,可通过直接查W表检验,当实际计算的W值大于表中的相应数值时,说明评分所得信度较高。当N大于7时,可计算x2值,作x2检验x2=K〔N-1〕W,查df=N-1时的x2值表,如到达显著水平,W也算到达显著水平。评分中如果有相同等级出现时,可用下公式:W=12[∑Ri2-(∑Ri)2/N]/[K2(N2-N)-K∑∑(n3-n)/12)]n——相同等级的个数,其他与前面公式相同。
123456A253027202832B222621202530C152018142122举例:
设有A、B、C三位教师给6篇作文评分,结果如下,试求评分者信度。
123456A524631B425631
C534621Ri147131883〔1〕将所评分数转化为得分等级,并求出每一篇文章所得等级之和;K=3,N=6∑Ri=14+7+13+18+8+3=63(2)带入公式计算后,W≈0.95,经查表小于103.9,在.05水平不显著,由此认定评分者的一直性程度低.各种信度系数相应误差变异的来源信度系数类型误差变异来源再测信度时间取样复本信度〔连续施测〕内容取样复本信度〔间隔施测〕时间内容取样分半信度内容取样同质信度内容异质性评分者信度评分者间差异第三节测验的信度第一单元信度的概念第二单元信度评估方法第三单元信度与测验分数的解释四个方面一、解释真实分数与实得分数的相关信度系数可以解释在总的方差中有多少比例是由真实分数的方差决定的;信度系数也同样说明了测量的误差比例是多少;信度系数的分布为0.00~1.00范围,代表了从缺乏信度到完全可信的所有状况。二、确定信度可以接受的水平当rxx<0.7时,测验不能用于对个人做出评价或预测,而且不能做团体比较;当0.70≤rxx<0.85时,可用于团体比较;当rxx≥0.85时,可用来鉴别或预测个人的成绩或作为。新编的测验信度应高于原有的同类测验或相似测验。参见教材P352的几种心理测验的信度系数几种心理测验的信度系数测验类型信度低中高成套成就测验0.660.920.98学术能力测验0.560.900.97成套倾向性测验0.460.880.96客观人格测验0.460.850.97兴趣测验0.420.840.93态度量表0.470.790.98三、解释个人分数的意义测量标准误的应用意义估计真实分数的范围;了解实得分数再测时可能变化情形。SE—测量的标准误;Sx—所得分数的标准差;rxx—测验的信度。注:该方法只能用同质性信度来计算。在95%或然水平上真分数的置信区间:X-1.96SE<XT≤X+1.96SE说明大约有95%是可能性说明,真分数落在所得分数的±1.96SE的范围内。例题:某被试的IQ为100,这是否反映了他的真实水平?如果再测一次,他的分数将改变多少?该测验的标准差为15,信度系数为0.84,其被试的IQ的可能范围是多少?〔答案见教材P353〕四、比较不同测验分数的差异差异分数标准误:可比较两个人不同分数的差异或同一个人在两个测验上的差异。
SEd—差异的标准误;S—两个测验使用的标准差,要求相同。例题:〔见教材P353〕。第三节测验的信度第一单元信度的概念第二单元信度评估方法第三单元信度对测验分数的解释第四单元影响信度的因素四个方面第四单元影响信度的因素一、样本的影响样本团体异质性的影响同质易得低相关,易低估;异质易得高相关,易高估。样本团体平均能力水平的影响能力水平低的团体信度相对低。二、测验长度同质性题目的增加,可提高测验信度;测验越长,内容取样越具有代表性;测验越长,被试的猜测影响因素就越小。确定测验长度所遵循的原那么:增加测验长度的效果应遵循报酬递减率原那么。测题数目的计算斯皮尔曼-布朗公式的导出公式:K—改变后的长度与原长度之比;γxx——原测验的信度;γkk—测验长度是原来K倍时的信度估计;例题:〔见教材P355〕第四单元影响信度的因素三、测验难度只存在某些测验中,如智力测验、成就测验等,对人格测验、兴趣测验等没有难度问题。从理论上说,只有平均难度水平为0.50时,测验分数分布的范围最大,求得的信度也最高。太难或太易时信度减低。洛得〔Lord〕提出的各类选择题的理想平均难度:五择一题为0.70;四择一题为0.74;三择一题为0.77;是非题为0.85。第四单元影响信度的因素四、时间间隔对重测信度和重测复本信度有影响;两次测验间隔时间越短,信度系数越大;间隔时间越长,信度系数越小。第四节测验的效度第一单元效度的概念2种定义2种性质问题:什么是效度?检验效度的方法有那些?效度检验常用那些统计分析方法?如何进行效度检验?1、通俗的定义效度指的是测量的准确性,即一个测验或量具能够测量出其所要测量的东西的程度。效度是科学测量工具最重要的必备条件,一个测验假设无效度,那么无论其具有任何优点,一律无法发挥其真正的功能。一、效度的定义2、测量学的定义〔1〕理论定义——效度是指在一个测量中,与测量目的有关的真实方差〔变异、变化〕与总方差〔变异、变化〕的比率,〔2〕操作定义——用公式表示,即:rxy2=SV2/SX2SV2代表有效方差,SX2代表总方差,rxy2代表测量的效度系数。Sx2=SV2+SI2+SE2ST2=SV2+SI2一个测验的效度说明,在一组测验分数中,有多少比例的方差〔变异数、变化〕是由测验所要测量的变因引起的,其结果用效度系数表示。二、效度的性质效度具有相对性相对某一目标的有效性效度具有连续性反映有效性程度上下第四节测验的效度第一单元效度的概念第二单元效度评估的方法3类方法:内容效度设想效度效标效度一、内容效度〔一〕什么是内容效度内容效度指的是测验题目对有关内容或行为范围取样的适当性。由于这种测验的效度主要同测验的内容有关,所以叫内容效度。
〔二〕内容效度的评估方法1、专家判断法
请有关专家对测验题目与原定内容的符合性做出判断,看测验题目是否代表规定的内容。因为这是一个逻辑分析的过程,也叫逻辑效度。
1、专家判断法——具体操作步骤①定义测验总体范围,描述相关知识与技能及所用材料的来源。②编制双向细目表,确定各种内容所占比例,标出每个条目设计所测内容。③制定一个相应的评定量表来评价效度,如测验包括的内容、技能、材料的重要程度、条目对内容的实用性等。请每位评定者对各方面进行评价,然后总合所有评定者的评价。〔二〕确定内容效度的方法1、专家判断法2、统计分析法
复本分析法——内容效度可由一组被试在取自同样内容范围的两个测验复本上得分之相关来作数量估计。如果相关低,说明其中至少有一个缺乏内容效度。如果相关高,一般推论测验有内容效度。当然也可能两个测验取样有同样或相似的偏差。评分者一致性分析再测分析——先将测验施测于某个团体,该团体对测验所包含的内容仅具有最少量的知识因而得分很低。让这个团体参与有关材料的教学和培训,结束后再进行测验。如果成绩提高,说明测验测量的是课堂上所教的内容,推论测验具有较高的内容效度。二、内容效度〔二〕确定内容效度的方法1、专家判断法2、统计分析法3、经验推测法例如,经验说明测验成绩随年龄提高,因此分析测验成绩或题目通过率与年龄大小的关系,如果测验分和题目通过率随年龄而提高,那么说明测验内容有效。二、内容效度〔三〕内容效度的特点1、外表效度与内容效度外表效度是由外行对测验作外表上的检查所确定的;内容效度是由够资格的专家详尽地、系统地对测验作评价而建立的。前者只考虑题目与测量目的之间明显的、直接的关系;后者那么同时考虑题目与测量目的和内容总体之间逻辑的微妙关系。2、内容效度的应用最高行为测验〔如能力测验〕要求有较高的外表效度,以使受测验者具有较强的动机,尽最大的努力完成。典型行为测验〔如人格测验〕却要求较低的外表效度,如果受试者很容易就从题目上看出测题的目的,就可能作出假的反响。二、设想效度〔一〕什么是设想效度设想效度就是测验对某一理论概念或特质测量的程度,即测验的结果能否证实或解释某一理论的假设、术语或设想,解释的程度如何,也称结构效度。确定设想效度的根本步骤先从某一设想的理论出发,提出各项心理功能或行为的根本假设。据此设计和编制测验,实施测验,对结果采用相关和因素分析等方法,检验测验结果是否符合理论假设。例:智力测验的结构效度确实定〔1〕从一般智力理论,提出下面假设:智力随年龄增长;智力与学业成就有密切的关系;〔2〕根据上面的假设编制智力测验,对测量数据进行以下分析:测试者的分数随年龄的相关;智力与学业的相关。〔二〕确定设想效度的方法
1、对测验本身的分析〔1〕测验内容效度有时可以作为测验的结构效度的证据。比方编制语文能力测验时,对内容范围的界定描述为:对词汇下定义对语言作类比推理在句子中正确运用文字的能力。这实际上就是对“语文能力〞的设想下了定义。〔二〕确定设想效度的方法
1、对测验本身的分析〔2〕考察测验的同质性通过计算被试在每个题目上的反响与测验总分的相关或分测验分数与总分的相关,以及α系数、库德-理查逊系数等内部一致性的指标,可以推估测验是测单一特质还是测多种特质,从而确定测验的设想效度的上下。〔二〕确定设想效度的方法
1、对测验本身的分析〔3〕分析被试对题目作反响的过程通过被试的操作,询问他如何处理题目,通过必要的统计处理分析,发现有些什么样的变量影响反响,因而可确定测验是否测量了所要测的特质。比方,人格测验有这样的题目——“我总是防止批评别人的言行。〞通过分析,发现对这类题目的反响受道德观念的影响,不单纯是人格特质内容,设想效度会降低。〔二〕确定设想效度的方法1、对测验本身的分析2、测验间相互比较〔1〕相容效度计算与另一个效度的同类测验的相关。思考:如何进行?〔二〕确定设想效度的方法1、对测验本身的分析2、测验间相互比较〔1〕相容效度〔2〕区分效度一个测验不仅应与其他测量同样设想的测验相关,而且还必须与测量不同设想的测验无相关。测验要有效,必须测量与其他变量无关的独立设想。用这种方法确定的效度叫区分效度。相关越低,区分度越大。〔二〕确定设想效度的方法1、对测验本身的分析2、测验间相互比较〔1〕相容效度〔2〕区分效度〔3〕因素分析法建立设想效度的常用方法是因素分析。通过对一组测验进行因素分析,可以找到影响测验分数的共同因素,每个因素在共同因素上的负荷量,称为设想效度的指标。思考题:如何进行因素分析?〔二〕确定设想效度的方法1、对测验本身的分析2、测验间相互比较3、效标效度的研究证明
〔1〕根据效标〔如学习成绩、诊断标准〕选取不同的被试,形成相对照的两组,再比较两组被试的测验成绩,假设测验分数很好地将两组分开,那么说明其设想效度不错。〔2〕将被试分成高分组和低分组〔例如按学习成绩分组〕,检查被试行为特点是否与理论构思〔例如智力水平上下〕相吻合,如果吻合,说明该测验的构思效度不错。〔3〕根据心理的开展变化特点验证构思效度〔例如智力的年龄变化特点〕。〔二〕确定设想效度的方法1、对测验本身的分析2、测验间相互比较3、效标效度的研究证明4、实验法和观察法证实
观察实验前和实验后分数的差异,也是验证设想效度的方法〔例如学习训练对学业成就成绩的影响〕。某考试焦虑测验及其设想——考试焦虑是当考试结果对个人有重大意义时的一种害怕失败的紧张情绪。有效的考试焦虑测验应当能反映出这种情绪变化。考察这测验是否有设想效度。设计几种实验情境〔见下页〕设想效度检验例:设计1:比较不同重要性考试时该测验的分数按照设想,重要考试时焦虑分数高平时考试前实施此焦虑测验重要考试之前实施该焦虑测验比较两次分数,如重要考试前的焦虑分数显著提高,就说明这个测验对测量考试焦虑是有效的。设计2:两场考试的测验分数的比较举行两场考试,使被试相信一场考试关系重大,一场考试无关要紧。挑选两组被试,高焦虑组和低焦虑组。比较考试成绩,出现下述情况,说明测验有设想效度:焦虑分数高组学生,如在第一场考试中成绩比平时有所下降,在第二场考试中却能正常发挥。焦虑分数低组学生,无论在哪场考试都发挥正常。设计3:收集相关事件证据为测验分数的比较指标收集被试在经历一场重大考试时的生理心理参数作为焦虑的指标将其同焦虑测验分数比较相关高证明焦虑测验测量了焦虑这个特质。收集某些变异上的证据假设一个特质被定义为随学习或成熟而改变,那么测量该特质的测验分数应该随着年龄的增长而递增。由此,我们根据分数的变异便可知道一个测验是否具有设想效度。〔三〕对设想效度的评价优点:设想效度这一概念提出的最大奉献是把着眼点放在提出假设、检验假设上,因此使心理测验不再只是作实际决定的辅助工具,同时还成为开展心理学理论的重要工具。缺点:有些设想概念模糊,缺乏一致的定义。同样的设想可能有不同名称;同样的概念可能有不同解释理解。确定效度时没有明确的操作步骤与程序。没有单一的数量指标来描述有效程度。三、效标效度〔实证效度〕〔一〕什么是效标效度指一个测验对处于特定情境中的个体的行为进行预测时的有效性。被预测的行为是检验测验效度的标准,简称效标。所以实证效度也叫效标效度。例如:用大学入学成绩预测大学生的学习成绩用职业测验预测工作能力用人格测验预测哪种人容易得精神病等。效标与效标测量
1、效标——所谓效标就是衡量测验有效性的参照标准,指的是可以直接、独立测量的我们所感兴趣的行为。
常见的效标有:学业成就:如在校成绩、学业测验分数、学历等可以作为智力和学习能力测验的效标。等级评定:如对学习成绩、智力、人格、工作等表现可以通过判断评定一个量数,用来作为各有关测验的效标。临床诊断:临床观察诊断的结果可以作为智力、人格等测验的效标。效标与效标测量2、效标测量——将观念上的效标用可操作的测量确定下来。例如:对于大学入学测验来说,我们感兴趣的或要预测的行为是“大学的成功〞,即入大学后能否学得好。“大学的成功〞就是观念效标,我们必须要数量化或操作化。比方大学的成绩常常就用来作为对“大学的成功〞的测量,所以,大学成就就是效标测量。一个好的效标必须具备的条件:效标必须能最有效地反映测验的目标;效标稳定、可靠,具有较高的信度;效标可以客观地加以测量,可用数据或等级来表示;效标测量的方法简单,经济实用。
效标效度是通过考察测验分数与效标的经验关系确定的,一般都可以通过统计分析得到一个数量指标,所以也叫统计效度。
常用统计方法有:相关法、分组法、预期表法、命中率法、功利率法等。〔二〕确定效标效度的方法1、相关法最常用来建立实证效度的方法是求测验分数与效标测量之间的相关,所得到的数量指标称为效度系数。测验成绩或分数同效标都是连续变量时,使用积差相关法。当测验分数是连续变量,而效标是等级评定时,可用贾斯朋〔Juspen〕多系列相关公式计算。当测验分数是连续变量,而效标是二分变量时,可用点二列相关或二列相关公式计算。当测验与效标都是二分变量时,可用皮尔逊余弦π法计算四分相关。以上几种方法的运算公式可参考?心理与教育统计?〔张厚灿粲、孟庆茂〕。相关法求效度的优缺点:优点:提供一个统计指标以总结预测源与效标间的关系。可利用回归方程式来预测每个人的期望效标成绩。效度系数为大家广泛接受,便于比较研究。缺点:假设预测源与效标的关系不是直线的,那么必须采用特殊的相关法。测验结果不能提供有关取舍正确性的指标。2、区分法检验测验分数能否有效地区分由效标所定义的团体的一种方法。检验平均数测验录取一批工人,工作一段后,根据工作成绩〔产品数量、质量〕分成称职和不称职两组,然后再检查当初的测验分数,用t检验看两组在测验的平均分数上有无显著的差异,如果有,说明测验有预测作用,否那么就没效。2、区分法检验平均数时应注意当团体数量大时,很小的一点平均数的差异都会有显著意义,此时测验区分这些团体的实际价值就很小。为了防止上述问题,必须把两组的平均分数、标准差、重叠量以及平均分数的差异在统计学上的显著性一并报告。3、命中率当测验用来作取舍的根据时,其有效性的指标就是正确决定的比例。预测源分数确定一个临界分数〔分数线〕,高于分数线者接受,低于分数线拒绝。在效标方面根据情况确定一个标准,高于标准为成功,低于标准为失败。此时可以得到预测命中表。具体内容详见教材P364。第四节测验的效度第一单元效度度的概念〔2种定义、2种性质〕第二单元效度评估的方法〔3类方法〕第三单元效度的功能3种功能:预测误差预测效标分数预测效率指数一、预测误差效度系数的实际意义常用决定性系数来表示,即相关系数的平方,它表示正确预测或解释的效标方差占总方差的比例。例如,测验的效度是0.80,意味着测验的总方差中有64%的方差是测验分数的方差,即测验分数正确预测的比例是64%。一、预测误差标准误表达法Sest—标准误Sy—效标成绩的标准差rxy—效标系数标准误的解释:真正效标分数落在预测效标分数±1Sest的范围内,有68%的可能性;落在预测效标分数±1.96Sest的范围内,有95%的可能性;落在预测效标分数±2.58Sest的范围内,有99%的可能性。二、预测效标分数最常用的是Y对X的回归方程:
Y—预测的效标分数a—纵轴的截距,用来纠正平均数的差异;bxy—斜率,Y向X回归的系数;X—测验的分数三、预测效率指数预测效率指数用E表示,它说明使用测验比盲目猜测能减少多少误差。例如,E=40,意为预测误差仅为随机猜测所产生误差的60%,即在估计效标分数时减少了40%的误差。E=100〔1-K〕K为无关系数,说明预测源分数与效标分数无关的程度。
第四节测验的效度第一单元效度度的概念〔2种定义、2种性质〕第二单元效度评估的方法〔3类方法〕第三单元效度的功能〔3种功能〕第四单元影响效度的因素4类因素:第四单元影响效度的因素
一、测验本身的因素〔材料、题型、难度、长度、排列〕二、测验实施中的干扰因素〔主试、被试〕三、样本团体的性质1、样本团体的异质性2、干预变量四、效标的性质第五节工程分析第一单元工程的难度一、难度的定义
二、计算方法
三、难度水平确实定第二单元工程的区分度
一、区分度的定义
二、计算方法三、区分度与难度的关系工程分析测验的工程分析包括定性分析和定量分析定性分析:测验的内容效度、题目编写的恰当性和有效性定量分析:对题目的难度和区分度进行分析工程分析的目的通过选择和修改测验题目,提高测验的信度和效度。第一单元工程的难度一、定义难度〔difficulty〕,指工程的难易程度,能力测验中一个重要的指标。在人格测验中,类似的指标是“通俗性〞。即取自相同总体样本中,能在答案方向上答复该题的人数。两种指标的计算方法是相同的难度的指标通常以通过率表示易度?P值大时,难度?P值小时,难度?
一、工程的难度一、定义二、计算方法二分法记分的工程〔1、0记分〕-直接计算法公式〔通过率〕:P=R/N×100%P指工程的难度〔通过率〕R答对或通过该工程的人数N全体被试人数举例:答复某题时,10名被试中8人答对,其难度为:P=8/10×100%=80%
二分法记分的工程〔1、0记分〕
样本例数较大时的计算方法根据测验总成绩将被试分为三组高分组〔NH〕:分数最高的27%中间组:分数居中的46%低分组〔NL〕:分数最低的27%计算高分和低分组的通过率计算两组平均通过率作为难度指标公式:P=(PH+PL)/2P指难度〔通过率〕PH指高分组通过率PL指低分组通过率举例:某测验条目高分组通过率为85%,中间组通过率为52%,低分组通过率为35%,问平均通过率是多少?吉尔福特难度矫正公式〔因为选择题易受到猜测的影响,备选答案越少,机遇的作用越大,越不能反映真实难度,吉尔福特的校正公式用于对此进行校正。〕CP—矫正后的通过率P—实际得到的通过率K—备选答案的数目非二分法计分工程的平均分计算法X为全体受试者在该题目上的平均分数,Xmax为该题的总分值。
举例:计算难度〔通过率〕某题平均得分1.8分,最高分2分,通过率:P=1.8/2.0×100%=90三、难度水平确实定〔一〕工程的难度P值越接近0.50,区别力越高;试题的平均难度应接近0.50,各题难度分布应该在0.50±0.20之间;测验用于选拔或诊断时,应较多项选择择难度值接近录取率的工程;例:录取率20%时,难度20%。对于选择题来说,P值一般应大于概率水平〔P值等于概率,说明题目过难或不清;P值小于概率,说明题目有问题〕。〔二〕测验的难度〔与分数分布的关系〕测验的难度取决于组成测验工程的难度通过观察测验分数的分布,可以进行直观检验。如果测验难度适中,分数的分布应当接近常态分布;如果测验偏难,分布呈正偏态〔图5-4,A〕如果测验偏容易,分布呈负偏态〔图5-4,B〕测验偏难或容易时,可以通过增加或减少不同难易程度的条目来解决。某些测验〔如标准参照测验〕允许测验分数呈偏态分布。正偏负偏第二单元工程的区分度一、定义指测验工程对所测量的心理特性的区分程度或鉴别能力。区分度取值在-1~+1之间;工程得分与实际能力水平之间相关系数越大,区分度越高。区分度低意味工程不能区分受试水平,影响效度。确定区分度的方法包括鉴别指数法和相关法。〔一〕鉴别指数法当效标测量是一个连续变量时,可从分布的两端〔各占27%〕选出高分组〔H〕和低分组〔L〕,然后计算高分组和低分组在该工程的通过率,这两个百分数之间的差异就提供了题目区分度的指标。D=PH-PLD为鉴别指数PH为高分组某工程通过人数百分比PL低分组某工程通过人数百分比。D值越大,工程区分度越高,工程越有效。二、计算方法例:32名被试在4个题目的得分被试题1题2题3题4总分被试题1题2题3题4总分11111417110022111141810102311114191100241111420011025101132111002611103221000171110323010018110132410001911103250100110110132600101111110327100011211002280100113101022900000141001230000001511002310000016011023200000计算鉴别指数按总分排序确定高、低分组分组人数=32×0.27≈9人高分组:1~9号低分组:24~32号分别计算高、低分组在各题的通过率P1H=9÷9=1.00P1L=2÷9=0.22P2H=8÷9=0.89P2L=2÷9=0.22P3H=8÷9=0.89P3L=1÷9=0.11P4H=6÷9=0.67P4L=0÷9=0.00分别计算各题鉴别指数D1=1.00-0.22=0.78D2=0.89-0.22=0.67D3=0.89-0.11=0.78D4=0.67-0.00=0.67鉴别指数〔D〕题目评价0.40非常优良0.30~0.39良好,如能改进更佳0.20~0.29尚可,仍须修改0.19以下劣等,必须淘汰L.Ebel提出的鉴别指数标准〔二〕相关法计算区分度常用的方法是相关法,即以某一条目得分与效标成绩或测验总分进行相关运算。相关系数越高,说明该条目越具有区分功能。常用于工程分析的相关方法点二列相关二列相关Ф相关1、点二列相关〔1〕适用性:适用于一个变量是连续变量,另一个是二分变量的资料。例如,某工程答对记1分,答错记0分,那么此工程为二分变量,而总分为连续变量。〔2〕计算公式:
2、二列相关适用于两个连续测量的变量,但其中有一个变量由于某种原因被分成两个类别。〔1〕工程分数连续,效标或测验总分为上下或及格与不及格两类。〔2〕效标连续,工程分数分为对、错或通过、不通过两类。二列相关公式:Xp—通过该工程被试的平均效标分数Xq—未通过该工程被试的平均效标分数P—通过该工程的人数百分比q—未通过该工程的人数百分比St—全体被试效标分数的标准差y—正态分布下p与q分割点正态曲线的高度例子:15名被试在某测验第1题上的作答情况〔通过1分,未通过0分〕与效标分数见下表:学生序号123456789101112131415效标分数657031498050351681697855779042第1题得分010110100110110P=8/15=0.5333q=1-p=0.4667Xp=548/8=68.5Xq=334/7=47.71Z0.000.05...0.080.391.02.03.0p0.000.0190.03180.150.34130.47720.4986y0.39890.39840.397670.37040.24190.05390.00433、φ相关(1〕适用性:适用两个变量都是二分变量。一些连续变量也可以用此方法计算相关系数。φ相关不要求变量呈正态分布。用该系数作为区分度指标时,要求题目反响和效标量都是二分变量。〔2〕公式:45名考生考取大学的人数和在某题上通过的人数见下表:升学情况题考取未考取合计目通过13〔A〕7〔B〕20反未通过5〔C〕20〔D〕25应合计182745例题:三、区分度与难度的关系工程通过率P鉴别指数D1.000.00.90.20.70.60.501.00.30.60.10.200.00.00三、区分度与难度的关系区分度与难度的关系区分度与难度有密切的关系难度为0.5时,区分度最高难度较高或较低时,区分度中等非常高或非常低的难度时,区分度也很低不同水平被试中区分度与难度的关系较难的题目对高水平被试有较高的区分度中等难度的题目对中水平被试有较高的区分度较容易的题目对低水平被试有较高的区分度平均难度0.5左右,能保持整体较好的区分度。第六节测验编制的一般程序第一单元测验的目标分析第二单元测题的编写第三单元测验的编排和组织第一单元测验的目标分析一、测验的对象明确测量对象二、测验的用途〔描述、诊断、选拔、预测〕显示性测验预测性测验三、测验的目标工作分析对特定概念下定义确定测验的具体内容确定哪些
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川雅安市政务服务中心直属事业单位2025年公招拟聘用人员历年高频重点提升(共500题)附带答案详解
- 二零二五年度生态别墅木工分包安装服务合同3篇
- 四川成都市青白江区机关事业单位招聘5人历年高频重点提升(共500题)附带答案详解
- 四川乐山夹江县乡镇事业单位从“大学生志愿服务西部”人员中招聘2人高频重点提升(共500题)附带答案详解
- 南宁铁路局招聘2025年高校毕业生133人历年高频重点提升(共500题)附带答案详解
- 南京市鼓楼区事业单位2025年上半年公开招聘历年高频重点提升(共500题)附带答案详解
- 华能榆社电厂招聘高频重点提升(共500题)附带答案详解
- 北京语言大学语言资源高精尖创新中心招考聘用高频重点提升(共500题)附带答案详解
- 北京市2025科学技术进修学院公开招考事业单位工作人员高频重点提升(共500题)附带答案详解
- 北京农学院幼儿园招考聘用高频重点提升(共500题)附带答案详解
- 2025年北京生命科技研究院招聘笔试参考题库含答案解析
- 九年级数学上册期末复习综合测试题(含答案)
- 2025年月度工作日历含农历节假日电子表格版
- 机动车查验员技能理论考试题库大全-上(单选题部分)
- 监理人员安全生产培训
- 2024-2030年中国电力检修行业运行状况及投资前景趋势分析报告
- 河北省百师联盟2023-2024学年高二上学期期末大联考历史试题(解析版)
- 中央空调系统运行与管理考核试卷
- 核电工程排水隧道专项施工方案
- 山西省吕梁市2023-2024学年高二上学期期末考试数学试题(解析版)
- 2024年市场运营部职责样本(3篇)
评论
0/150
提交评论