版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、心理咨询师之心理测量学心理咨询师之心理测量学 基础考试理论满分为基础考试理论满分为100分。分。 其中心理测量基础约占其中心理测量基础约占10-13分。分。 考试以单选和多项选择题为主。单选题约考试以单选和多项选择题为主。单选题约5-8分,多选约分,多选约5分。分。占三级分数:占三级分数:8分分12分分占二级分数:占二级分数:7分分9分分4 一、什么是心理测量第一单元:心理测量与测量量表 二、三、测量量表三、测量量表 三、8第二单元:心理测量的基本概念一、心理测量的定义 心理测量,就是依据心理学理论心理学理论。使用一定的操作程序,通过观察人的少数有代表性的行为代表性的行为,对某些行为活动中的心
2、理特点做出推论和数量化分析的一种和数量化分析的一种科学手段科学手段。心理测量是心理学应用中的一个重要的辅助工具心理测量是心理学应用中的一个重要的辅助工具。 二、1 1、因为我们无法直接测量人的心理活动,只能测量人的外显行为、因为我们无法直接测量人的心理活动,只能测量人的外显行为间接性间接性2 2、测量结果必需根据一些参照比较来确定测量结果的意义、测量结果必需根据一些参照比较来确定测量结果的意义相对性相对性3 3、测验的标准化,如测验做的项目、评分、分数转换等标准、测验的标准化,如测验做的项目、评分、分数转换等标准 客观性客观性11121315 帮助咨询师在心理咨询中了解来访者心理帮助咨询师在心
3、理咨询中了解来访者心理特性、行为问题及性质得到正确的评估和特性、行为问题及性质得到正确的评估和诊断,以便于提供适当的指导、帮助和行诊断,以便于提供适当的指导、帮助和行为矫正训练。为矫正训练。16 吴天敏修订的中国比内量表吴天敏修订的中国比内量表 龚耀先等人修订的:龚耀先等人修订的: 韦氏成人智力量表(韦氏成人智力量表(WAIS-RC) 韦氏儿童智力量表(韦氏儿童智力量表(C-WISC) 韦氏幼儿智力量表(韦氏幼儿智力量表(C-WYC-SI) 张厚粲主持修订的瑞文标准测验张厚粲主持修订的瑞文标准测验(SPM) 李丹等修订的联合型瑞文测验(李丹等修订的联合型瑞文测验(CRT)17 目前应用较多的有
4、:艾森克人格问卷(目前应用较多的有:艾森克人格问卷(EPQ),卡特尔),卡特尔16种人格因素问卷(种人格因素问卷(16PF),以),以及明尼苏达多项人格调查表及明尼苏达多项人格调查表(MMPI)等等18 主要包括:主要包括: 精神病评定量表精神病评定量表 躁狂状态评定量表躁狂状态评定量表 抑郁量表抑郁量表 焦虑量表焦虑量表 恐怖量表恐怖量表19冯特冯特. .高尔顿爵士高尔顿爵士高尔登高尔登(F.GaltonF.Galton英国)英国) 提出人的气质和智能是提出人的气质和智能是按身体特点的不同而遗传的按身体特点的不同而遗传的. .设计了测量遗传差异的方法设计了测量遗传差异的方法. .这虽不是正式
5、的心理测验这虽不是正式的心理测验, ,但但可视为心理测验的开端可视为心理测验的开端. .( (一一) )科学心理测验的产生与发展科学心理测验的产生与发展21卡特尔卡特尔(J.M.CattellJ.M.Cattell美国)美国) 18901890年在年在心理心理杂志杂志上发表上发表心理测验与测量心理测验与测量(心(心理测验第一次出现在文献中)理测验第一次出现在文献中)22比内(比内(A.BinetA.Binet法国)法国) 极力主张用一种测验极力主张用一种测验的方法去辨别和发现智力落后的方法去辨别和发现智力落后儿童。他儿童。他19051905年在年在心理学年心理学年报报发表的发表的诊断异常儿童的
6、诊断异常儿童的新方法新方法是世界上是世界上第一个正式第一个正式的心理测验。的心理测验。235050关于测量正确的说法是(关于测量正确的说法是( )。)。 A A测量就是心理测量测量就是心理测量 B B就是依据一定的法则用数字对事物加以确定就是依据一定的法则用数字对事物加以确定 CC就是用数字来描述事物的法则就是用数字来描述事物的法则 D D就是用一些题目或数字来描述事物的属性就是用一些题目或数字来描述事物的属性5858错误的测验观不包括(错误的测验观不包括( )。)。A A测验万能论测验万能论 B B测验无用论测验无用论CC心理测验即智力测验心理测验即智力测验 D D测验是辅助工具测验是辅助工
7、具 单选:单选:2577我们通常将学生的考试结果按名次排队,这些名次属于( )变量。A命名 B顺序C等距 D等比5959不能把分数(不能把分数( ),更不能仅仅根据一次测),更不能仅仅根据一次测验的结果轻易下结论。一个人在任何一个测验上验的结果轻易下结论。一个人在任何一个测验上的分数,都是他的遗传特征、测验前的学习与经的分数,都是他的遗传特征、测验前的学习与经验以及测验情境的函数验以及测验情境的函数。 A A绝对化绝对化 B B神化神化 C C系统化系统化 D D泛化泛化 26106、按测验的方式分类,可将测、按测验的方式分类,可将测验分为(验分为( ) A、操作测验、操作测验 B、文字测验、
8、文字测验 C、个别测验、个别测验 D、团体测验、团体测验 2758错误的测验观包括( )。 A测验万能论 B测验无用论C心理测验即智力测验 D测验是辅助工具 2858下面属于测量要素有是( )。 A照点B数字C绝对零点D单位第一单元第一单元 常模团体常模团体常模是一种供比较的标准量数,标准化样本的分数分布31常模团体的定义:是由具有某种常模团体的定义:是由具有某种共共同特征同特征的人所组成的一个群体,或的人所组成的一个群体,或者是该者是该群体的一个样本群体的一个样本。(一)常模团体的性质(一)常模团体的性质分数分数人数人数1.群体的构成必须明确界定群体的构成必须明确界定2.常模团体必须是所测群
9、体的代表性样本常模团体必须是所测群体的代表性样本3.样本的大小要适当样本的大小要适当4.标准化样组是一定时空的产物标准化样组是一定时空的产物包括:确定一般总体、确定目标总体和确定样本。例如, UPI问卷调查 一般总体:大学生 目标总体:大学生心理健康 样本:如新生 35样本大小要适当:全国性常模一样本大小要适当:全国性常模一般应有般应有2000-30002000-3000人宜。人宜。三三、常模的取样方法、常模的取样方法:四、常模分数与常模:四、常模分数与常模:38原始分数与导出分数的区别联系原始分数与导出分数的区别联系标准分常模标准分常模 百分位常模百分位常模智商及其意义发展常模发展常模40一
10、、发展常模一、发展常模也叫年龄量表,个人分数指出他的行为在按正常途径发展方面处于什么样的发展水平。41(一)(一). 发展顺序量表发展顺序量表(为最直观的发展常模为最直观的发展常模) 它告诉人们多大的儿童具备什么能力或行它告诉人们多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育某年龄出现,说明发育超前,否则即为发育滞后。滞后。 瑞士心理学家皮亚杰的关于儿童认知过程瑞士心理学家皮亚杰的关于儿童认知过程的发展理论。的发展理论。 基础年龄与在较高年龄水平的题目上获得基础年龄与在较高年龄水平的题目上获得的附加月
11、份之和。将标准化样本中每个年的附加月份之和。将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每将原始分数与年龄常模对比,便可求得每个人的智龄。个人的智龄。 (考点考点)智龄计算:智龄计算: 1.比内比内-西蒙量表中产生使用智力年龄概念西蒙量表中产生使用智力年龄概念 2.原始分数和年龄常模比较原始分数和年龄常模比较年级当量即年级量表。年级当量即年级量表。个体分数与年级常模比较个体分数与年级常模比较年级量表的单位通常为年级量表的单位通常为10个月间隔。个月间隔。总结:发展常模总结:发展常模发展顺序量表发展顺序量表以儿童发
12、展顺序为标准,如:葛赛尔强调早期行为的发展有规律,来说明发展的规范性和行为变化的顺序性。智力年龄智力年龄比内-西蒙量表中首先使用。以年龄段来确定智力水平的一种标准。年级当量年级当量年级量表,如考试测验。 也叫年龄量表,个人分数指出他的行为在按正常途径发展方面处于什么样的发展水平。二、百分位常模二、百分位常模(一)百分等级(一)百分等级个体在常模团体中所处的位置,百分等级越低,个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低。个体所处的位置就越低。常模样本中低于这个分数的人数的百分比常模样本中低于这个分数的人数的百分比。(二)百分点(二)百分点也叫百分位数。也叫百分位数。百分点是计
13、算处于某一百分比例百分点是计算处于某一百分比例的人对应的测验分数是多少。的人对应的测验分数是多少。(三)四分位数和十分位数。(三)四分位数和十分位数。四分位数是将量表分成四等分如:25%十分位数也以此类推。三、标准分常模三、标准分常模 各数据偏离平均数的距离(离均差)的平均各数据偏离平均数的距离(离均差)的平均数,它是离差平方和平均后的方根。数,它是离差平方和平均后的方根。 因此,标准差也是一种平均数。标准差能反映一因此,标准差也是一种平均数。标准差能反映一个数据集的离散程度。平均数相同的,标准差未个数据集的离散程度。平均数相同的,标准差未必相同。必相同。5051 由测验直接得到的分数属于顺序
14、数据,不能作进一步的运算,为了充分利用测验所得到的信息,就有必要对原始分进行某种处理,使之成为等距数据。(一)线性转换的标准分数(一)线性转换的标准分数X X任一原始分数,任一原始分数, 为样本均数,为样本均数, SD SD为样本标准差。为样本标准差。例:例:Z Z分数分数公式:公式:53z分数包含了比原始分更多的信息。比如,如果只知道某一学生考试得了87分,考试的题目的难度?学生的现有知识水平?以及评分标准都会影响到学生的得分?87可以说很高,也可以说很低;Z分数可以说明学生这次考试是低于平均分还是高于平均分以及在全班(或者总体)的一个什么位置。54Z=A+BzZ=A+Bz另:公式:公式:加
15、一个常数A乘一个常数B。常见的标准分有:T T分数、标准九分数、标准十分、标准二十分、离差智商(分数、标准九分数、标准十分、标准二十分、离差智商(IQIQ)T T分数:分数:T=50+10z当以当以5050为平均数,以为平均数,以1010为标准差,求为标准差,求T T分数分数:公式:常态化标准分数常态化标准分数标准分数标准分数= =平均分数平均分数+ +标准差标准差XZXZ离差智商标准九分标准十分标准二十分标准二十分标准九分:量表是标准九分:量表是9 9个级的分数量表,以个级的分数量表,以5 5为平均数,为平均数,以以2 2为标准的分数量表。为标准的分数量表。标准十分:平均数为标准十分:平均数
16、为5.55.5,标准差为,标准差为1.51.5标准二十分:平均数为标准二十分:平均数为1010,标准差为,标准差为3 35+2z5.5+1.5z10+3z离差智商:平均数为离差智商:平均数为100100,标准差为,标准差为1515使不常态的分布(不对称)使不常态的分布(不对称)常态化过程。常态化过程。步骤步骤(二)非线性转换的标准分数(二)非线性转换的标准分数区别曲线性转换所求得的Z分数1 1、对每个原始分数、对每个原始分数值计算累积百分比值计算累积百分比2 2、在常态曲线面积表中,求、在常态曲线面积表中,求出对应于应百分比的出对应于应百分比的Z Z分数。分数。四、智商及其意义四、智商及其意义
17、(一)比率智商(一)比率智商: :比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。为了避免小数,将商数乘以100:公式:1916年斯福坦大学推孟(Term an)教授不足: 比率智商不适合年龄较大的被试,且相同的比率智商在不同年龄也具有不同的意义。(二)离差智商(二)离差智商: :一种以年龄组为样本计算而得到的标准分一种以年龄组为样本计算而得到的标准分数,是建立在统计学基础之上的。数,是建立在统计学基础之上的。(P343)公式:韦克斯勒一、转换表法一、转换表法也叫常模表也叫常模表某项测验的百分等级和T分数转换表 二、剖面图法二、剖面图法51系统抽样法的关键是计算( )。A样本量
18、 B总体 C随机数 D组距 6452百分等级55的分数表示在常模样本中有55%的人比这个分数( )。 A低B相等C高 D以上都不正确 6560Z=A+BZ式中Z为转换后的标准分数,A、B为根据需要指定的常数。加上一个常数是为了去掉( ),乘以一个常数是为了使单位变小从而去掉小数点。 A整数 B小数 C负值 D分值 6661标准十分,平均数为(标准十分,平均数为( ),),标准差为(标准差为( )。)。 A6:2 B5.5:1.5 C6:1.5 D7:1.5 6734以以50为平均数、以为平均数、以10为标为标准差表示的标准分数叫(准差表示的标准分数叫( )。)。 A标准九分数标准九分数BT分数
19、分数 C离差智商离差智商 DZ分数分数 68107107百分位常模包括(百分位常模包括( )。)。 A A百分等级百分等级 B B百分点百分点 C C四分位数四分位数 D D十分位数十分位数 69105标准分数可以通过(标准分数可以通过( )得到。)得到。 A线性转换线性转换 B非线性转换非线性转换 C分析分析 D变化变化 71第三节 测验的信度第一节第一节 信度的概念信度的概念一、信度定义一、信度定义被测在不同时间内用同一测验(或用另一被测在不同时间内用同一测验(或用另一相等的测验)重复测量。所得相等的测验)重复测量。所得结果的一致结果的一致程度。程度。即一个测验的稳定性、一致性。即一个测验
20、的稳定性、一致性。73信度只受随机误差的影响。随机误差越大,信度就越低。X = T + EX = T + E测验实得分数(X)总是由真实分数(T)和误差(E)两部分构成的如上图公式。二、信度的指标二、信度的指标75 信度系数:信度系数:信度是以信度系统为指标,它是一种相关系信度是以信度系统为指标,它是一种相关系数常常是同一被试样本所得的两组资料的相数常常是同一被试样本所得的两组资料的相关。关。即真分数方差与实分数的方差的比值。即真分数方差与实分数的方差的比值。76测量标准误测量标准误分数的变异量分数的变异量测量的标准误与信度之间有互为消除的关系:信度越高,标准误越小;信度越低,标准误越大.SE
21、为测量的标准误,是所得分数的标准差。一、重测度一、重测度-也叫稳定性系数也叫稳定性系数 同一测验对同一组被试的先后两次测量之同一测验对同一组被试的先后两次测量之间的相关。间的相关。优点:在于能提供有关测验是否随时间而变异的资料,可作优点:在于能提供有关测验是否随时间而变异的资料,可作被试将来的行为依据被试将来的行为依据缺点:缺点:易受练习和记忆的影响。易受练习和记忆的影响。时间间隔时间间隔施测施测再测再测相关系数相关系数 二、复本信度二、复本信度 优点:优点:能够避免重测信度的一些问题。能够避免重测信度的一些问题。缺点:缺点:1.如果测量行为受影响,复本信度只能减少而不能如果测量行为受影响,复
22、本信度只能减少而不能完全消除。完全消除。 2.由于第二个测验只改变了题目内容,已经掌握由于第二个测验只改变了题目内容,已经掌握的解题原则,可以很容易地迁移到同类问题。的解题原则,可以很容易地迁移到同类问题。又称等值性系数又称等值性系数, 两个内容、结构相两个内容、结构相同的测验对同一组被试测量结果的相关同的测验对同一组被试测量结果的相关NEXT1=1=绝对是绝对是 2=2=是是 3=3=不一定不一定 4=4=不是不是 5=5=绝对不是绝对不是1=1=绝对是绝对是 2=2=是是 3=3=不一定不一定 4=4=不是不是 5=5=绝对不是绝对不是BACK三、内部一致性信度三、内部一致性信度主要反映的
23、是题目之间的关系表示测验能够测量相同内容或物质的程度。斯皮尔曼斯皮尔曼-布朗公式为检验公式。它的假设布朗公式为检验公式。它的假设条件是两半测验分数的变异数相等。条件是两半测验分数的变异数相等。831、分半信度、分半信度一种测验形式,实施一次测验,在测验一种测验形式,实施一次测验,在测验后按不同方式分为等值的两半,分别计后按不同方式分为等值的两半,分别计算得分,示两个半分数的相关数。算得分,示两个半分数的相关数。2 2、同质性信度、同质性信度 也叫内部一致性,指测验内部所也叫内部一致性,指测验内部所有题目间的一致性。有题目间的一致性。四、评分者信度四、评分者信度 (一)解释真实分数与实得分数的相
24、关(一)解释真实分数与实得分数的相关 (二)确定信度可以接受的水平(二)确定信度可以接受的水平 (三)解释个人分数的意义(三)解释个人分数的意义 (四)比较不同测验分数的差异(四)比较不同测验分数的差异86信度的意义信度的意义(一)解释真实分数与实得分数的相关(一)解释真实分数与实得分数的相关 信度系数可以解释为总的方差中有多少比例是信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异由真实分数的方差决定的,也就是测验的总变异( (总总方差方差) )中真分数造成的变异占百分之几。中真分数造成的变异占百分之几。 例如,例如, rxx =0.90时,即实得分数中有时,
25、即实得分数中有90%的的变异是真实分数造成的,误差造成的只占变异是真实分数造成的,误差造成的只占10%。 rxx =1时,表示没有测量误差。时,表示没有测量误差。 值得注意的是,信度系数的分布是值得注意的是,信度系数的分布是 0.001.00的正数范围,表示信度缺乏完全的正数范围,表示信度缺乏完全可信。可信。(二二) 确定信度可以接受的水平确定信度可以接受的水平 1.当rxx0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较; 当0.70rxx0.85时,可用于团体比较; 当rxx0.85时,才能用来鉴别或预测个人成绩或作为。 2.新编的测验信度应过于原有的同类测验或相似测验.(
26、三)解释个人分数的意义(三)解释个人分数的意义 其一是估计真实分数的范围;其一是估计真实分数的范围; 其二是了解实得分数再测时可能的变化情形。其二是了解实得分数再测时可能的变化情形。这就是测量标准误的应用。这就是测量标准误的应用。信度在评价两个不同测验的分数是否有明显差信度在评价两个不同测验的分数是否有明显差异时起着非常重要的作用。异时起着非常重要的作用。 两个不同测验的分数:两个不同测验的分数:两个人不同分数的差别两个人不同分数的差别同一被试在两个测验上的差别。同一被试在两个测验上的差别。时间间隔一、样本特征-也叫被试的特征二、测验长度二、测验长度在一个测验中增加同质题目,可以使信度提高。测
27、验越长,被试的猜测因素影响就越小。测验越长,测验的测量取样就越有代表性。注意事项: 以重测法或复本法求信度,两次测验相隔时间间隔时间越久以重测法或复本法求信度,两次测验相隔时间间隔时间越久,其他变因介入的可能性越大,受外界影响也越大,信度系数,其他变因介入的可能性越大,受外界影响也越大,信度系数便越低。便越低。三、测验难度三、测验难度测验太难或太易难以测出个体差异,从而降低测验太难或太易难以测出个体差异,从而降低信度。信度。四、时间间隔四、时间间隔5454同质性信度主要代表测验内部同质性信度主要代表测验内部( )间的一致性。)间的一致性。 A A两半测验两半测验 B B题目与分测验题目与分测验
28、 CC所有题目所有题目 D D分测验分测验 9778.78.( )是指同一被试在不同时间)是指同一被试在不同时间内用同一测验(或用另一套相同的测验)内用同一测验(或用另一套相同的测验)重复测验,所得结果的一致程度。重复测验,所得结果的一致程度。A A信度信度 B B效度效度 CC难度难度 D D区分度区分度9859、信度只受(、信度只受( )的影响)的影响 A、系统误差、系统误差 B、随机误差、随机误差 C、恒定效应、恒定效应 D、概化理论、概化理论 9935以再测法或复本法求信度,两次以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越测验相隔时间越短,其信度系数越( )。)。 A大大
29、 B低低 C小小 D不确定不确定100102使用同一测验,在同样条件下对使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两同一组被试者前后施测两次测验,求两次得分之间的相关系数,叫(次得分之间的相关系数,叫( ),又),又称(称( )。)。 A复本信度复本信度 B重测信度重测信度 C稳定性系数稳定性系数 D分半信度分半信度 1021、测验本身的因素、测验本身的因素2、测验实施中的干扰因素、测验实施中的干扰因素3、样本团体的性质、样本团体的性质4、效标的性质、效标的性质1、效度的通俗定义、效度的通俗定义所测量的与所要测量的心理特点之间符合所测量的与所要测量的心理特点之间符合的程度,简
30、单说是测量的的程度,简单说是测量的准确性准确性。103 效度是科学测量工效度是科学测量工具具最重要的必备条最重要的必备条件件。 测量的效度除受随机误差影响外,还受系测量的效度除受随机误差影响外,还受系统误差影响。统误差影响。 可信的测验未必有效,而有效的必定可信可信的测验未必有效,而有效的必定可信。 信度是效度的必要条件。信度是效度的必要条件。1041051 1、相对性、相对性性质性质2 2、连续性、连续性1.1.效度具有相对性效度具有相对性 任何测验的效度都是针对一定的目标而任何测验的效度都是针对一定的目标而言。言。( (指测量什么有效或没效指测量什么有效或没效) )2.2.效度具有连续性效
31、度具有连续性 只有程度上的不同,没有只有程度上的不同,没有“全有全有”或或“全全无无”的区别。的区别。( (有效度较高或较低有效度较高或较低) ) 测验效度是测验结果的有效性程度测验效度是测验结果的有效性程度106 1、信度是效度的必要而非充分条件。、信度是效度的必要而非充分条件。 信度高,效度就高。信度高,效度就高。 效度高,信度不一定高。效度高,信度不一定高。 2、效度是受信度制约的。、效度是受信度制约的。 评价效度的前提是信度一定要稳定。评价效度的前提是信度一定要稳定。 108 1、定义:指、定义:指测验题目对欲测内容或行为取测验题目对欲测内容或行为取样的适用性样的适用性,从而确定测验是
32、否是所欲测从而确定测验是否是所欲测量的行为领域的代表性取样量的行为领域的代表性取样明确概念明确概念; ;划定行为划定行为; ;查阅资料查阅资料; ;方法方法: :观察观察法与访谈法法与访谈法取样要有代表性取样要有代表性同质问题同质问题 ( (强调同质的量表与不必强调同强调同质的量表与不必强调同质的量表质的量表) )109 2 2、确定内容效度的方法、确定内容效度的方法请专家看测验题目请专家看测验题目专家判专家判断法断法统计分统计分析法析法经验法经验法以下面两种方法以下面两种方法评价两者的一至性评价两者的一至性通过实践来检验通过实践来检验 内容效度与所有效度一样,并非普遍适内容效度与所有效度一样
33、,并非普遍适用。只有编制者与使用者定义的内容范围用。只有编制者与使用者定义的内容范围相同,编制者报告的内容效度对使用者才相同,编制者报告的内容效度对使用者才有意义。有意义。 内容效度也有时间上的特定性。内容效度也有时间上的特定性。 内容效度内容效度(专家的评价专家的评价)与表面效度与表面效度(外外行对测验的检查行对测验的检查)不同。不同。1111 1、定义:、定义: 指测验对理论上的构想或特质指测验对理论上的构想或特质的测量程度。的测量程度。又称又称: :结构结构效度效度。 即测验的结果是否能证实即测验的结果是否能证实或解释某一或解释某一心理理论心理理论的假设、的假设、术语或构思,解释的程度如
34、何。术语或构思,解释的程度如何。1 1、对测验本身的分析、对测验本身的分析2 2、测验间的相互比较、测验间的相互比较检验内法检验内法同质性法同质性法3 3、效标效度研究发明、效标效度研究发明4 4、实验法和观察法、实验法和观察法 通过研究测验内部结构来界定理论构想,通过研究测验内部结构来界定理论构想,从也提供构思效度的证据。从也提供构思效度的证据。 有时候分析被试者对题目的反应特点也可有时候分析被试者对题目的反应特点也可以作为构思效度的证据。以作为构思效度的证据。 通过分析几个测验间相互关系,找出其共同之处,通过分析几个测验间相互关系,找出其共同之处,进而推断这些测验测量的特质是什么,也可以确
35、定进而推断这些测验测量的特质是什么,也可以确定这些测验构思效度如何。这些测验构思效度如何。 相容效度相容效度(成熟测验与研究测验的相关成熟测验与研究测验的相关)是构思效度是构思效度的一个证据的一个证据 。 区分效度区分效度(测验此有效必然测验彼无效测验此有效必然测验彼无效)是构思效度是构思效度的又一个证据。的又一个证据。 因素分析法也是建立构思效度的常用方法。因素分析法也是建立构思效度的常用方法。 检验一个测验的的效度效度也能推断出构检验一个测验的的效度效度也能推断出构思效度的指数。思效度的指数。观察实验前后分数的差异程度。观察实验前后分数的差异程度。1 1、定义:什么是效标效度?、定义:什么
36、是效标效度?118 测验测个体在某种情境下行为表现的测验测个体在某种情境下行为表现的有效性程度,被预测的行为是检验测有效性程度,被预测的行为是检验测验效度的标准,简称效标,验效度的标准,简称效标,也叫实证也叫实证效度。效度。 指一个测验对处于特定情境中的指一个测验对处于特定情境中的个体的行为进行预测时的有效性。个体的行为进行预测时的有效性。 效标资料是否与测验同时获得效标资料是否与测验同时获得, ,分为分为 同时效度:同时效度:如智力测验以学业为效标如智力测验以学业为效标 预测效度:预测效度:职业测验以职业能力为效标职业测验以职业能力为效标119 例如:例如:高三模拟考试,果然能恰当地反应大学
37、联考成高三模拟考试,果然能恰当地反应大学联考成绩,说明此模拟测验效度绩,说明此模拟测验效度预测效度好。预测效度好。用大学入学成绩预测大学生的学习成绩用大学入学成绩预测大学生的学习成绩用职业测验预测工作能力用职业测验预测工作能力用人格测验预测哪种人容易得精神病等用人格测验预测哪种人容易得精神病等第一第一.效标本身必须有效;效标本身必须有效;第二第二.效标必须具有较高的信度,不随时间等因效标必须具有较高的信度,不随时间等因素而变化;素而变化;第三第三.效标可以客观地加以测量,可用数据或等效标可以客观地加以测量,可用数据或等级来表示;级来表示;第四第四.效标测量的方法简单,省时省力,经济实效标测量的
38、方法简单,省时省力,经济实用。用。121求测验分数与效标资料间的相关。效度系数效度系数高于临界分数者,预测其成功(成功)低于临界分数者,预测其失败(失误)在取舍测验依据时用在取舍测验依据时用其正确决定的比例作其正确决定的比例作为分界分数为分界分数检验分数是否能检验分数是否能有效地区分由效有效地区分由效标定义的团体标定义的团体 总命中率与正命中率一般情况下完全一致,正命率高低总命中率与正命中率一般情况下完全一致,正命率高低常随划分测验分数成功与失败的临界分数的高低而变化。常随划分测验分数成功与失败的临界分数的高低而变化。二、预测效标分数二、预测效标分数 常用的是常用的是Y Y对对X X的回归方程
39、,可以从一个变量推估的回归方程,可以从一个变量推估出另一个变量。出另一个变量。三、预料效率指数三、预料效率指数 预测效标指数的大小表明使用测验比盲目猜预测效标指数的大小表明使用测验比盲目猜测能减少多少误差测能减少多少误差126( (一一) ) 测验本身的因素测验本身的因素 为了提高效度,要做到:为了提高效度,要做到: 1.1.测验材料必须对整个内容具有代表性;测验材料必须对整个内容具有代表性; 2.2.测题设计时应尽量避免容易引起误差的题型(如是非题);测题设计时应尽量避免容易引起误差的题型(如是非题); 3.3.测题难度要适中,具有较高的区分度;测题难度要适中,具有较高的区分度; 4.4.测
40、验长度要恰当,即要有一定的测题量;测验长度要恰当,即要有一定的测题量; 5.5.测题的排列按先易后难顺序。测题的排列按先易后难顺序。 1.主试的影响因素主试的影响因素 主试不符合标准化要求的任何做法主试不符合标准化要求的任何做法 2.被试的影响因素被试的影响因素 兴趣、动机、情绪、态度和健康状况等。兴趣、动机、情绪、态度和健康状况等。127 1. 样本团体的异质性样本团体的异质性 异质性越高,分数分布范围大,测验效度越异质性越高,分数分布范围大,测验效度越高。高。128n2.干涉变量干涉变量n 包括年龄、性别、教育水平、智力、动机、包括年龄、性别、教育水平、智力、动机、兴趣、职业等。兴趣、职业
41、等。 效标与测验分数之间是否呈线性关系(一次函数关系)是很重要的因素。 效标测量本身的可靠性如何亦是值得考虑的问题。如果效标测量的信度不可靠,它与测验分数之间的关系也无可靠性可言。1291 1、测验本身因素、测验本身因素2 2、测验实施中的干扰因素、测验实施中的干扰因素 (主试和被试)(主试和被试)3 3、样本团体的性质、样本团体的性质 (异质性和干涉变量)(异质性和干涉变量)4 4、效标的性质、效标的性质7575( )指的是测验题目对有)指的是测验题目对有关内容或行为取样的适用性,从而关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领确定测验是否是所欲测量的行为领域的代表性取样。域
42、的代表性取样。A A内容效度内容效度 B构想效度构想效度C C效标效度效标效度 D区分效度区分效度64( )是检验测验分数能否)是检验测验分数能否有效地区分由效标所定义的团体的有效地区分由效标所定义的团体的一种方法。一种方法。 A相关法相关法 B区分法区分法 C命中率法命中率法 D失误法失误法102效度具有相对性,因此在评效度具有相对性,因此在评鉴测验的效度时,必须考虑测验的鉴测验的效度时,必须考虑测验的( )。)。 A信度信度 B目的目的 C功能功能 D长度长度 103内容效度的评估方法包括内容效度的评估方法包括( )。)。 A专家判断法专家判断法 B双向细目表法双向细目表法 C统计分析法统
43、计分析法 D经验推测法经验推测法 105构想效度的估计方法包括构想效度的估计方法包括( )。)。 A对测验本身的分析对测验本身的分析 B测验间的相互比较测验间的相互比较 C效标效度的研究证明效标效度的研究证明 D实验法和观察法证实实验法和观察法证实104影响效度的因素包括影响效度的因素包括( )。)。 A主试者的影响因素主试者的影响因素 B测验本身测验本身C样本团体的性质样本团体的性质D测验实施干扰因素测验实施干扰因素138一、难度的定义:一、难度的定义:难度(Difficulty)就是指项目的难易程度。139心理测验心理测验(以难度划分以难度划分)能力测验能力测验非能力测验非能力测验难度指标
44、难度指标: :通俗性通俗性总体样本中回答该题的人数总体样本中回答该题的人数难易程度难易程度难度的指标通常以通过率表示难度的指标通常以通过率表示 注注: P: P为通过率为通过率; N; N为全体被试者人数为全体被试者人数;R;R为通过人数为通过人数. . P P值与难度高低成反比值与难度高低成反比(1 1)二分法记分的项目)二分法记分的项目二分法记分二分法记分: :选择题选择题, ,通过记通过记2 2分分, ,错误记错误记0 0分分. .一般可直接用通一般可直接用通过率计算难度过率计算难度. .(2 2)非二分记分的项目)非二分记分的项目当测验项目不能用二分法记分时,可用下面的公式计算难度当测
45、验项目不能用二分法记分时,可用下面的公式计算难度注注: : 全体被试的平均分全体被试的平均分,X max,X max为满分为满分. .%100maxXXPX(一)、项目难度: P值直接于0或接近于1,越无法区分被试间能力的差异。相反,P值越接近于0.50,区别力越高。 选择题目时,最好使试题的平均难选择题目时,最好使试题的平均难度接近度接近0.500.50,而各题难度在,而各题难度在0.500.500.200.20之间。之间。 第二单元第二单元 项目的区分度项目的区分度一、定义:一、定义:项目区分度也叫鉴别力是指项目区分度也叫鉴别力是指测验项目测验项目对对被试的心理特性的区分能力被试的心理特性
46、的区分能力。如果一个项目,实际水平高的被试能顺如果一个项目,实际水平高的被试能顺利通过,而实际水平低的被试不能通过利通过,而实际水平低的被试不能通过,则认为该项目具有较高的区分度。,则认为该项目具有较高的区分度。二、计算方法二、计算方法144(1)(1)鉴别指数步骤:鉴别指数步骤:1 1、按测验总分的高低排列答卷、按测验总分的高低排列答卷2 2、确定高分组与低分组,每一组取答卷总数的、确定高分组与低分组,每一组取答卷总数的27%27%3 3、分别计算高分与低分组在该项目上的通过率或得、分别计算高分与低分组在该项目上的通过率或得分率。分率。4 4、按公式估计出项目的鉴别指数、按公式估计出项目的鉴
47、别指数 鉴别指数评价项目性能的标准鉴别指数评价项目性能的标准 鉴别指数(鉴别指数(D D) 项目评价项目评价 0.400.40以上以上 很好很好 0.300.300.39 0.39 良好,修改后会更佳良好,修改后会更佳 0.200.200.29 0.29 尚可,但需修改尚可,但需修改 0.190.19以下以下 差,必须淘汰差,必须淘汰 某一项目分数与效标或测验总分的相关作某一项目分数与效标或测验总分的相关作为该项目区分的指标,相关越高,表明项为该项目区分的指标,相关越高,表明项目越具有区分功能。目越具有区分功能。 假如样本中通过某一项目的人数比率为1.00或0,则说明高分组与低分组在通过率上不
48、存在差异,因此D为0. 假如项目通过率为0.50,则可能高分组的所有人都通过了,而低分组却无人通过,这样D的最大值可能到1.00难度区分度7474为了使测验具有更大的区别力,应该为了使测验具有更大的区别力,应该选择难度在选择难度在0.50左右的试题比较合适。各题左右的试题比较合适。各题难度在(难度在( )之间。)之间。A0.500.10B0.500.20C0.500.30D0.500.4055项目的难易程度,用项目的难易程度,用P表示。表示。P值越(值越( ),难度越低。),难度越低。 A大大 B低低C小小 D接近于接近于0人人次次B分数分数难度小难度小正偏态分布负偏态分布153测验的目标分析
49、测验的目标分析1测题的编写测题的编写2测验的编排和组织测验的编排和组织3154题目来源题目来源已出版的标准测验已出版的标准测验理论和专家的经验理论和专家的经验临床观察和记录临床观察和记录内容方面内容方面文字方面文字方面理解方面理解方面社会敏感性方面社会敏感性方面测题的编测题的编制要领制要领选择题选择题是非题是非题简答题简答题操作题操作题15679测验编排的一般原则(测验编排的一般原则( )。)。A难度逐步上升,先易后难难度逐步上升,先易后难B将同类型的测题组合在一起将同类型的测题组合在一起C答案混合排列答案混合排列D依各种类型测题本身的特点编依各种类型测题本身的特点编排题目与选项排题目与选项1
50、03103多选:测题常见的排列方式多选:测题常见的排列方式有(有( )。)。 A A并列直进式并列直进式 B B公共汽车式公共汽车式 C C混合螺旋式混合螺旋式 D D专列式专列式 159主试的资格主试的资格1测验的选择测验的选择2测验前的准备及注意事项测验前的准备及注意事项3测验实施的程序及要素测验实施的程序及要素4测验的评分测验的评分5测验结果的报告测验结果的报告6160包含技术和道德两方面的要求:包含技术和道德两方面的要求:1 1、技术、技术方面方面知识结构知识结构专业理论知识和专业理论知识和专业技能专业技能测验中个人隐私的保护测验中个人隐私的保护 2、职、职业道德业道德测验的保密与控制使用测验的保密与控制使用保证测验的价值,保证测验的价值,避免滥用和误用测验避免滥用和误用测验非对个人或社会
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石河子大学《西方法律思想史》2021-2022学年第一学期期末试卷
- 石河子大学《生态工程学》2023-2024学年第一学期期末试卷
- 石河子大学《基础工程》2023-2024学年第一学期期末试卷
- 石河子大学《电子技术》2022-2023学年期末试卷
- 沈阳理工大学《信号变换》2021-2022学年第一学期期末试卷
- 沈阳理工大学《计算机网络与通信》2022-2023学年期末试卷
- 温病息风止痉法
- 消毒设备维护管理
- 沈阳理工大学《光纤传感技术》2023-2024学年第一学期期末试卷
- 广告合同高空作业免责协议书
- 发现生活中的美-完整版PPT
- 小学道德与法治人教三年级上册第三单元安全护我成长-《遭遇陌生人》教案
- CAMDS操作方法及使用技巧
- 平狄克《微观经济学》(第8版)笔记和课后习题详解
- 最优化理论与算法课程教学大纲
- 2022年湖北省武汉市江岸区育才第二小学六上期中数学试卷
- (最新版)中小学思政课一体化建设实施方案三篇
- PSA提氢装置操作规程
- 水工隧洞概述(67页清楚明了)
- 计算机维修工技能考核试卷
- 2020年四川省德阳市高三一诊考试地理试卷(Word版,含答案)
评论
0/150
提交评论