心理测量学-项目分析等课件_第1页
心理测量学-项目分析等课件_第2页
心理测量学-项目分析等课件_第3页
心理测量学-项目分析等课件_第4页
心理测量学-项目分析等课件_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章心理测量学知识

第一节

概述第二节

测验的常模第三节

测验的信度第四节测验的效度

第五节项目分析

第六节测验编制的一般程序第七节心理测验的使用12/26/20221第五章心理测量学知识第一节

概述12/20/20第五节项目分析第一单元项目的难度第二单元项目的区分度12/26/20222第五节项目分析第一单元项目的难度12/20/202项目分析包括:定量分析、定性分析

定量分析包括:题目难度和区分度定性分析包括:考虑内容效度、题目编写的恰当性、有效性第五节项目分析12/26/20223项目分析包括:定量分析、定性分析第五节项目分析12/2第一单元项目的难度12/26/20224第一单元项目的难度12/20/20224一、难度(difficulty)的定义难度是指,项目的难易程度。在能力测验中,需要一个反应难度水平的指标,在非能力测验中,类似的指标是“通俗性”。通俗性是指取自相同总体的样本中,能在答案方向上回答该题的人数。难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。P大小与难度高低成反比。所以,有人称其为“易度”。第一单元项目的难度12/26/20225一、难度(difficulty)的定义P大小与难度高低成反比二、计算的方法(一)二分法记分的项目心理测验的项目大多为选择题,通过计1分,未通过计0分。其难度的计算为:当被试较多时,可根据测验总成绩将被试分组:分数最高的27%为高分组,最低的27%为低分组,中间46%为中间组。分别计算高低组通过率,以两组平均值作为每一道题的通过率。第一单元项目的难度12/26/20226二、计算的方法心理测验的项目大多为选择题,通过计1分,未通过由于选择题允许猜测,所以通过率可能因为猜测而变大。被选答案越少,猜测作用越大。越不能真正反映测验的难度。为了平衡猜测的影响,吉尔福特提出了一个校正公式。Cp=KP-1/K-1第一单元项目的难度

Cp是校正后的通过率。K是被选答案数,P实际通过率。比较被选答案数目不同的测题难度时,可以用此公式。12/26/20227由于选择题允许猜测,所以通过率可能因为猜测而变大。Cp=K二、计算的方法(二)非二分记分的项目当测验项目为问答题或不能用二分法计分的形式时,难度如下计算:第一单元项目的难度全体被试在该题目上的平均分,除以该题的满分。12/26/20228二、计算的方法第一单元项目的难度全体被试在该题目上的平均三、难度水平的确定(一)项目难度水平的确定难度分析的目的是:筛选项目。项目的难度取决于测验的目的、性质以及项目的形式。标准测验希望能准确测量个体差异。某个题目,被试都答对或错,那么该题无法提供个别差异的信息,对测验的信度和效度没有作用,所以,P值越接近1或0,越无法区分个体差异,而P值越接近于0.50,区别力就越高。第一单元项目的难度12/26/20229三、难度水平的确定第一单元项目的难度12/20/2022

为了使测验更有区别力,应该选难度在0.5左右的试题。但是,如果一个测验,所有试题相关均为1.00。难度为0.50。有一种可能:50%的被试答对所有题目,50%被试答错所有题目。那这个难度0.50还有意义吗?所以,选择题目时,所有题目平均难度接近0.5,各测题难度0.5±0.2之间最好。第一单元项目的难度12/26/202210为了使测验更有区别力,应该选难度在0.5左右的试题。第一单当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。例如,测验为了选秀,就应当有高难度,P值要小。如果录取率是20%,测题难度就应该是0.2。对于选择题来说,P值一般应大于概率水平。P值等于概率,说明题目过难或题意不清,被试凭猜测做答。P值小于概率无意义,说明题目质量有问题。是非题,难度应该在0.75最合适,四选一,0.63最合适。第一单元项目的难度12/26/202211当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。(二)测验难度水平的确定

测验的难度依赖于项目的难度。人的心理特性基本是呈常态分布的。我们使用的统计方法是以正态分布为前提。所以测验设计时,希望分数呈现常态分布。如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。如果获得的分数不是常态,而是偏态分布的,说明题目偏难或偏易。第一单元项目的难度12/26/202212(二)测验难度水平的确定第一单元项目的难度12/20/2如左图,属于正偏态分布。题目难了,必须增加足够数量的较容易的项目;而右图,属于负偏态分布,题目容易了,必须增加足够数量的有较高难度的项目。第一单元项目的难度12/26/202213如左图,属于正偏态分布。题目难了,必须增加足够数量的较容易的有些测验,如掌握性测验,或标准参照测验,分数分布出现偏态是允许的。其难度根据情况而定第一单元项目的难度12/26/202214有些测验,如掌握性测验,或标准参照测验,分数分布出现偏态第二单元项目区分度一、定义(itemdiscrimination)也叫鉴别力,是指测验项目对被试的心理特性的区分能力。水平高者通过,低者通不过,就有区分度。它是评价项目质量和筛选项目的主要指标,也是影响测验效度的重要原因。区分度低意味着项目不能区分被试的实际水平,这类项目达不到测验的目的,必定影响测验效度。区分度取值介于-1至+1之间。项目得分与实际能力之间的相关来表示。相关系数越大,区分度越高。负相关说明水平越高,该项目得分反而越低,有问题,淘汰。12/26/202215第二单元项目区分度一、定义(itemdiscrimin第二单元项目区分度二、计算方法在理论上,项目区分度是以项目得分高低与实际能力水平高低之间的相关来表示。但是实际水平很难估计,只好用其他指标代替,常用的是测验总分。(一)鉴别指数计算方法:1、按测验总分高低排列答卷;2、确定高分组、低分组,27%;3、分别计算高分组、低分组通过率;3、项目鉴别指数为:D=PH-PL12/26/202216第二单元项目区分度二、计算方法12/20/202216第二单元项目区分度

用D=PH-PL作为项目鉴别指数,理由是,高分组得分率高于低分组,则D>0,D越大,该项目区分两种不同水平的程度越高。如果D<0,项目有问题。12/26/202217第二单元项目区分度用D=PH-PL作为项目鉴别指数,1965年,伊贝尔(L.Ebel)提出用鉴别指数评价项目性能的评价标准:鉴别指数项目评价0.4以上0.3-0.390.20-0.290.19以下很好良好,修改后更佳尚可,但需修改差,必须淘汰第二单元项目区分度12/26/2022181965年,伊贝尔(L.Ebel)提出用鉴别指数评价项目性能(二)相关法计算区分度最常用的方法是相关法以某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标。相关越高,区分力越大。点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。第二单元项目区分度不是考试内容12/26/202219(二)相关法第二单元项目区分度不是考试内容12/20/2二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。第二单元项目区分度不是考试内容12/26/202220二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。相关法:适用于两个变量均为二分称名变量。若将测验总分按及格、不及格或录取、淘汰划分,便可计算相关系数。第二单元项目区分度不是考试内容12/26/202221相关法:适用于两个变量均为二分称名变量。若将测验总分按及格三、区分度与难度的关系区分度与难度关系密切。如某一项目通过人数比率为1.00或0,说明难度P=1.00或0,也说明高分组和低分组在通过率上没有差异,区分度D=0。即太难、太易的项目区分度都差。如果通过率为50%,即难度为P=0.50,则有可能高分组都通过,低分组通过0,那么区分度很大,鉴别指数为D=1.00第二单元项目区分度12/26/202222三、区分度与难度的关系第二单元项目区分度12/20/20D的最大值与项目难度的关系

项目通过率D的最大值1.0000.900.200.800.400.700.600.600.80

0.501.000.400.800.300.600.200.400.100.200012/26/202223D的最大值与项目难度的关系项目通过率从上表可以发现,为了增大项目区分度,似乎应该使每个项目难度处于0.50水平,是这样吗?如果每一个项目难度为0.50,项目内容一致性提高,同质性增大。极端情况下,50%的人得满分,50%的人得0分。总分的区分能力反而低。所以,中等难度的项目之间0相关,区分度才能最高。第二单元项目区分度12/26/202224从上表可以发现,为了增大项目区分度,似乎应该使每个项目难度处难度和区分度都是相对的。一般来说。较难的项目对高水平的被试区分度高;较易项目对低水平的被试区分度高;中等难度项目对中等水平的被试区分度高。总体上,特别难和特别易的项目少些,中等难度的项目多些,所有项目平均难度为0.50。即可以保证多数项目的区分度,也保证整个测验的区分能力。第二单元项目区分度12/26/202225难度和区分度都是相对的。一般来说。较难的项目对高水平的被试区记住了吗?1、难度是指项目的难易程度,用P代表,P值越大,难度越低吗?(yes)2、在200个学生中,答对某项目的人数为120人,该项目的难度是多少?0.63、P值越接近于0.50,区别力越高吗?Yes4、测验项目对被试的心理特性的区分能力,叫区分度,还叫什么?也叫鉴别力12/26/202226记住了吗?1、难度是指项目的难易程度,用P代表,P值越大,难第五章心理测量学知识

第一节

概述第二节

测验的常模第三节

测验的信度第四节测验的效度第五节项目分析

第六节测验编制的一般程序第七节心理测验的使用12/26/202227第五章心理测量学知识第一节

概述12/20/20第六节测验编制的一般程序第一单元测验的目标分析第二单元测题的编写第三单元测验的编排和组织12/26/202228第六节测验编制的一般程序第一单元测验的目标分析12/第一单元测验的目标分析12/26/202229第一单元测验的目标分析12/20/202229第一单元测验的目标分析一、测验的对象编制测验前,首先明确要测量的对象。….在我国,农村、城市在文化教育上差异较大,编制测验、制定常模一定要考虑文化因素。龚耀先修订韦氏量表时,将长期生活、工作或学习在县属集镇以上的人口,称之为城镇人口,用城市式;长期生活、工作或学习于农村的称农村人口,用农村式。12/26/202230第一单元测验的目标分析一、测验的对象12/20/2022第一单元测验的目标分析二、测验的用途所编制的测验是对被试做描述,还是做诊断、选拔、预测,应该事先确定。一般来说,测验可以分为两类:显示性测验、预测性测验。12/26/202231第一单元测验的目标分析二、测验的用途12/20/2022第一单元测验的目标分析(一)显示性测验,是指测验题目和所要测量的心理特征相似的测验。如成就测验。古德纳夫把显示性测验分为:样本测验、标记测验。题目取自一个很明确的总体的测验就是样本测验。测量学生混合运算能力,从四则混合运算题目总体中选一组题目作为样本的测量。题目取自一个全开放的总体的测验就是标记测验。智力测验。如果测验成绩高的被试,实际上也很聪明,那么这个智力测验就是智力很好的标记。12/26/202232第一单元测验的目标分析(一)显示性测验,是指测验题目和所第一单元测验的目标分析(二)预测性测验:是指预测一些没被测量的行为的测验。对测验的兴趣,主要在于测验分数能在多大程度上预测行为。GRE中的词汇测验,不是对词汇感兴趣。而是用这个分数预测被试将来在大学的表现。注意:

显示性测验和预测性测验,不是绝对的,有时是统一的。比如高考。题目来自教材,属于显示性测验的样本测验,考试分数可以预测大学的学习成绩,又是预测测验。12/26/202233第一单元测验的目标分析(二)预测性测验:是指预测一些没被三、测验的目标测验的目标是指,编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。要明确测验的目标,还要对测验目标加以分析。将其转换成可操作的术语,这个过程叫目标分析过程。目标分析包括:工作分析、对特定概念下定义、确定测验具体内容。第一单元测验的目标分析12/26/202234三、测验的目标第一单元测验的目标分析12/20/2022工作分析:对于选拔和预测用的预测性测验,要对所预测的行为活动作具体分析。包括:(1)确定哪些心理特征和行为可以使要预测的活动达到成功,…进而确定题目;(2)建立衡量被试是否成功的标准,即效标。……对特定概念下定义:对所测的东西进行界定。比如,创造力的定义:有人定义为:发散思维的能力。据此创造力应该从反应的流畅性、灵活性、独创性、详尽性来测量。确定测验的具体内容:………第一单元测验的目标分析12/26/202235工作分析:对于选拔和预测用的预测性测验,要对所预测的行为活动再看看,你会不会?1、什么是显示性测验?是指测验题目和所要测量的心理特征相似的测验。2、什么预测性测验?是指预测一些没被测量的行为的测验。3、什么是测验目标?编制的测验是测什么的,即用来测量什么样的心理变量或行为特征4、目标分析包括几部分?工作分析、对特定概念下定义、确定测验具体内容、12/26/202236再看看,你会不会?1、什么是显示性测验?12/20/2022第二单元测题的编写12/26/202237第二单元测题的编写12/20/202237第二单元测题的编写一、搜集资料题目来源可以分为:(一)已出版的标准测验(二)理论和专家的经验(三)临床观察和记录12/26/202238第二单元测题的编写一、搜集资料12/20/202238二、命题的一般原则(一)内容方面:要求题目符合测验的目的,避免贪多;内容取样要有代表性;题目间内容相对独立。(二)文字方面:语言准确,简明扼要,一句话一个概念,意义明确。(三)理解方面:题目要有确切答案,内容可理解,题目格式不要引起误解。(四)社会敏感性方面:不要涉及性、自杀等敏感性问题。如果一定要涉及,鼓励被试真实作答的方法有:见书376。第二单元测题的编写12/26/202239二、命题的一般原则第二单元测题的编写12/20/2022三、测题的编制要领心理测验题目分类标准很多,常见的是根据对被试的要求分为:提供型、选择型。提供型题目,要求被试给出正确答案。选择型题目要求被试在有限的几个答案中选择正确的答案。分别来看一下编排要领:第二单元测题的编写12/26/202240三、测题的编制要领第二单元测题的编写12/20/2022(一)选择题选择题由两部分构成:题干和选项。题干就是呈现一个问题的情境,选项就是问题的多种可能答案。常常包括一个正确的答案,和一些错误的答案,也叫“诱答”。对选择题我们既要编好题干,也要编好选项。注意题干所提问题必须明确,使用简单而明确的词语;选项简明扼要;每题只给一个正确答案,其他属诱答;各选项长度相等;避免题干用词与选项用词一致;选项最好用同一形式。第二单元测题的编写12/26/202241(一)选择题第二单元测题的编写12/20/202241(二)是非题是非题又叫正误题,是指出一个论点要被试判断是否正确,或是从“是、非”两个答案作出选择。编制时,应该注意内容应以有意义的概念、事实或基本原则为基础;每道题只能包含一个概念;尽量避免否定的叙述;若是表达意见的题目,最好说明意见的来源和根据;“是”“非”题的数目应有适当比利,基本相等,随即排列第二单元测题的编写12/26/202242(二)是非题第二单元测题的编写12/20/202242(三)简答题在客观测验试题中,只有简答题是提供型题目,它要求被试用一个正确的词或句子来完成或填充一个未完成句子的空白,或是提供一个正确的答案。编制原则宜用问句形式;如果是填充形式,空格不宜太多;每题应只有一个正确答案。第二单元测题的编写12/26/202243(三)简答题第二单元测题的编写12/20/202243(四)操作题是介于一般认知结果的纸笔测验和在未来真实情境的实际活动之间的测验,是让被试实际操作,如画图、走迷津等。编制原则明确所要测量的目标,并将其操作化;尽量选择真实性程度较高的项目;指导语要简明扼要;制定评分标准,确定计分方法。第二单元测题的编写12/26/202244(四)操作题第二单元测题的编写12/20/202244第三单元测验的编排和组织12/26/202245第三单元测验的编排和组织12/20/202245第三单元测验的编排和组织一、合成测验(一)选择和审定试题1.选择试题形式:在大多数情况下,任何题目都可以有很多种形式,关键是如何选择“最优的”形式。选择测题形式应该注意:3792.审定题目:编制者或有关专家要对题目反复审查修订;改正意义不明确的词语,取消一些重复和不适用的题目。要注意:37912/26/202246第三单元测验的编排和组织一、合成测验12/20/2022第三单元测验的编排和组织(二)测题的编排测验题目选出以后,必须根据测验的目的和性质,考虑被试作答时的心理反应方式,加以合理安排。编排的原则:1.测题的难度排列逐步上升2.尽可能将同类型的测题组合在一起3.注意根据各种类型测题本身的特点排列题目排列方式1、并列直进式:2、混合螺旋式:12/26/202247第三单元测验的编排和组织(二)测题的编排12/20/20二、预测与项目分析初步筛选出的项目,要通过预测进行项目分析。(一)预测目的:获得被试对题目如何反应的资料。注意的问题:预测对象问题;预测的实施过程与情境问题;预测的时限可稍宽;对被试的反应做记录。第三单元测验的编排和组织12/26/202248二、预测与项目分析第三单元测验的编排和组织12/20/2二、预测与项目分析(二)项目分析:质的分析、量的分析第三单元测验的编排和组织12/26/202249二、预测与项目分析第三单元测验的编排和组织12/20/2三、信度效度考察(一)信度信度是衡量测验质量的最基本指标。获得较高的信度,是使测验有效的必要条件。(二)效度测验的效度高低,反应测验所测的东西是不是所要侧的。第三单元测验的编排和组织12/26/202250三、信度效度考察第三单元测验的编排和组织12/20/20四、常模制订五、编写指导手册第三单元测验的编排和组织12/26/202251四、常模制订第三单元测验的编排和组织12/20/2022第七节心理测验的使用第一单元主试的资格第二单元测验的选择第三单元测验前的准备及注意事项第四单元测验实施的程序及要素第五单元被试误差及控制方法第六单元测验的评分第七单元测验结果的报告12/26/202252第七节心理测验的使用第一单元主试的资格12/20/2第一单元主试资格主试资格包含:技术、道德。技术方面,要求主试必须具备一定的知识结构、心理测验专业理论知识和相应的专业技能;道德方面,则要求主试恪守测验工作者的职业道德。12/26/202253第一单元主试资格主试资格包含:技术、道德。12/20/2一、知识结构主试者的知识结构,是指开展心理测验工作所必须具备的基础知识和与专业相关的知识。基础知识,主要包括:普心、儿心、社心等以及扎实的心理统计学的基础知识;与专业相关的知识,包括:人格P、能力P、变态p等,以及本行业的专业知识。第一单元主试资格12/26/202254一、知识结构第一单元主试资格12/20/202254二、专业理论知识和专业技能(一)专业理论知识

主试资格考察的最基本条件,是知晓心理测验专业理论知识。包括:了解心理测验的性质和特点、作用和局限性,基本特征(信度、效度、难度、区分度)等(二)专业技能

主试者必须具有实际操作心理测验的专业技能和经验,接受严格的、系统的心理测验专业训练。第一单元主试资格12/26/202255二、专业理论知识和专业技能第一单元主试资格12/20/2三、职业道德(一)测验的保密和控制使用保密是为了保证测验的价值。泄漏内容,测验将失效。控制使用是指并非所有的人都可以接触和使用测验。(二)测验中个人隐私的保护第一单元主试资格12/26/202256三、职业道德第一单元主试资格12/20/202256第二单元测验的选择一、所选测验必须适合测量的目的二、所选测验必须符合心理测量学的要求12/26/202257第二单元测验的选择一、所选测验必须适合测量的目的12/2第三单元测验前的准备及注意事项一、测验前的准备工作(一)预告测验(二)准备测验材料(三)熟悉测验指导语(四)熟悉测验的具体程序二、测验中主试的职责三、建立协调关系12/26/202258第三单元测验前的准备及注意事项一、测验前的准备工作12/第四单元测验实施的程序及要素一、指导语(一)对被试的指导语(二)对主试的指导语二、时限三、测验的环境条件12/26/202259第四单元测验实施的程序及要素一、指导语12/20/202第五单元被试误差及控制方法一、应试技巧与练习效应(一)应试技巧(二)练习效应:具体表现教育背景差、经验少、智力高者,练习效应明显速度测验,明显重复同一测验,比复本测验,效应明显两次测验之间时间距离越大,效应越小一般平均练习效应,在1/5标准差以下,仅限于1、2次,三次后效应增加不明显。12/26/202260第五单元被试误差及控制方法一、应试技巧与练习效应12/2第五单元被试误差及控制方法二、动机与焦虑因素(一)应试动机(二)测验焦虑:影响因素能力抱负水平人格特点测验成绩的意义参加测验的次数12/26/202261第五单元被试误差及控制方法二、动机与焦虑因素12/20/第五单元被试误差及控制方法三、反应定势(一)求快、求精确的反应定势(二)喜好正面叙述的反应定势(三)喜好特殊未至的反应定势(四)喜好较长选项的反应定势(五)猜测的反应定势12/26/202262第五单元被试误差及控制方法三、反应定势12/20/202第六单元测验的评分一、原始分数的获得二、原始分数的转换12/26/202263第六单元测验的评分一、原始分数的获得12/20/2022第七单元测验结果的报告一、测验分数的综合分析(一)应根据心理测验的特点进行分析(二)不能把分数绝对化(三)对照常模、信度、效度,进行解释(四)不同测验分数的比较12/26/202264第七单元测验结果的报告一、测验分数的综合分析12/20/第七单元测验结果的报告二、报告分数的具体建议(一)不把测验分数直接告知家长(二)避免使用专业术语(三)要保证当事人知道这个测验测量、预测什么(四)要使当事人知道它与什么团体比较(五)要使当事人知道如何运用他的分数(六)要考虑测验分数将给当事人带来什么影响(七)要让当事人积极参与测验分数的解释END12/26/202265第七单元测验结果的报告二、报告分数的具体建议12/20/第五章心理测量学知识

第一节

概述第二节

测验的常模第三节

测验的信度第四节测验的效度

第五节项目分析

第六节测验编制的一般程序第七节心理测验的使用12/26/202266第五章心理测量学知识第一节

概述12/20/20第五节项目分析第一单元项目的难度第二单元项目的区分度12/26/202267第五节项目分析第一单元项目的难度12/20/202项目分析包括:定量分析、定性分析

定量分析包括:题目难度和区分度定性分析包括:考虑内容效度、题目编写的恰当性、有效性第五节项目分析12/26/202268项目分析包括:定量分析、定性分析第五节项目分析12/2第一单元项目的难度12/26/202269第一单元项目的难度12/20/20224一、难度(difficulty)的定义难度是指,项目的难易程度。在能力测验中,需要一个反应难度水平的指标,在非能力测验中,类似的指标是“通俗性”。通俗性是指取自相同总体的样本中,能在答案方向上回答该题的人数。难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。P大小与难度高低成反比。所以,有人称其为“易度”。第一单元项目的难度12/26/202270一、难度(difficulty)的定义P大小与难度高低成反比二、计算的方法(一)二分法记分的项目心理测验的项目大多为选择题,通过计1分,未通过计0分。其难度的计算为:当被试较多时,可根据测验总成绩将被试分组:分数最高的27%为高分组,最低的27%为低分组,中间46%为中间组。分别计算高低组通过率,以两组平均值作为每一道题的通过率。第一单元项目的难度12/26/202271二、计算的方法心理测验的项目大多为选择题,通过计1分,未通过由于选择题允许猜测,所以通过率可能因为猜测而变大。被选答案越少,猜测作用越大。越不能真正反映测验的难度。为了平衡猜测的影响,吉尔福特提出了一个校正公式。Cp=KP-1/K-1第一单元项目的难度

Cp是校正后的通过率。K是被选答案数,P实际通过率。比较被选答案数目不同的测题难度时,可以用此公式。12/26/202272由于选择题允许猜测,所以通过率可能因为猜测而变大。Cp=K二、计算的方法(二)非二分记分的项目当测验项目为问答题或不能用二分法计分的形式时,难度如下计算:第一单元项目的难度全体被试在该题目上的平均分,除以该题的满分。12/26/202273二、计算的方法第一单元项目的难度全体被试在该题目上的平均三、难度水平的确定(一)项目难度水平的确定难度分析的目的是:筛选项目。项目的难度取决于测验的目的、性质以及项目的形式。标准测验希望能准确测量个体差异。某个题目,被试都答对或错,那么该题无法提供个别差异的信息,对测验的信度和效度没有作用,所以,P值越接近1或0,越无法区分个体差异,而P值越接近于0.50,区别力就越高。第一单元项目的难度12/26/202274三、难度水平的确定第一单元项目的难度12/20/2022

为了使测验更有区别力,应该选难度在0.5左右的试题。但是,如果一个测验,所有试题相关均为1.00。难度为0.50。有一种可能:50%的被试答对所有题目,50%被试答错所有题目。那这个难度0.50还有意义吗?所以,选择题目时,所有题目平均难度接近0.5,各测题难度0.5±0.2之间最好。第一单元项目的难度12/26/202275为了使测验更有区别力,应该选难度在0.5左右的试题。第一单当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。例如,测验为了选秀,就应当有高难度,P值要小。如果录取率是20%,测题难度就应该是0.2。对于选择题来说,P值一般应大于概率水平。P值等于概率,说明题目过难或题意不清,被试凭猜测做答。P值小于概率无意义,说明题目质量有问题。是非题,难度应该在0.75最合适,四选一,0.63最合适。第一单元项目的难度12/26/202276当测验用于选拔或诊断时,应较多地选择难度值接近录取率的项目。(二)测验难度水平的确定

测验的难度依赖于项目的难度。人的心理特性基本是呈常态分布的。我们使用的统计方法是以正态分布为前提。所以测验设计时,希望分数呈现常态分布。如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。如果获得的分数不是常态,而是偏态分布的,说明题目偏难或偏易。第一单元项目的难度12/26/202277(二)测验难度水平的确定第一单元项目的难度12/20/2如左图,属于正偏态分布。题目难了,必须增加足够数量的较容易的项目;而右图,属于负偏态分布,题目容易了,必须增加足够数量的有较高难度的项目。第一单元项目的难度12/26/202278如左图,属于正偏态分布。题目难了,必须增加足够数量的较容易的有些测验,如掌握性测验,或标准参照测验,分数分布出现偏态是允许的。其难度根据情况而定第一单元项目的难度12/26/202279有些测验,如掌握性测验,或标准参照测验,分数分布出现偏态第二单元项目区分度一、定义(itemdiscrimination)也叫鉴别力,是指测验项目对被试的心理特性的区分能力。水平高者通过,低者通不过,就有区分度。它是评价项目质量和筛选项目的主要指标,也是影响测验效度的重要原因。区分度低意味着项目不能区分被试的实际水平,这类项目达不到测验的目的,必定影响测验效度。区分度取值介于-1至+1之间。项目得分与实际能力之间的相关来表示。相关系数越大,区分度越高。负相关说明水平越高,该项目得分反而越低,有问题,淘汰。12/26/202280第二单元项目区分度一、定义(itemdiscrimin第二单元项目区分度二、计算方法在理论上,项目区分度是以项目得分高低与实际能力水平高低之间的相关来表示。但是实际水平很难估计,只好用其他指标代替,常用的是测验总分。(一)鉴别指数计算方法:1、按测验总分高低排列答卷;2、确定高分组、低分组,27%;3、分别计算高分组、低分组通过率;3、项目鉴别指数为:D=PH-PL12/26/202281第二单元项目区分度二、计算方法12/20/202216第二单元项目区分度

用D=PH-PL作为项目鉴别指数,理由是,高分组得分率高于低分组,则D>0,D越大,该项目区分两种不同水平的程度越高。如果D<0,项目有问题。12/26/202282第二单元项目区分度用D=PH-PL作为项目鉴别指数,1965年,伊贝尔(L.Ebel)提出用鉴别指数评价项目性能的评价标准:鉴别指数项目评价0.4以上0.3-0.390.20-0.290.19以下很好良好,修改后更佳尚可,但需修改差,必须淘汰第二单元项目区分度12/26/2022831965年,伊贝尔(L.Ebel)提出用鉴别指数评价项目性能(二)相关法计算区分度最常用的方法是相关法以某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标。相关越高,区分力越大。点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。第二单元项目区分度不是考试内容12/26/202284(二)相关法第二单元项目区分度不是考试内容12/20/2二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。第二单元项目区分度不是考试内容12/26/202285二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。相关法:适用于两个变量均为二分称名变量。若将测验总分按及格、不及格或录取、淘汰划分,便可计算相关系数。第二单元项目区分度不是考试内容12/26/202286相关法:适用于两个变量均为二分称名变量。若将测验总分按及格三、区分度与难度的关系区分度与难度关系密切。如某一项目通过人数比率为1.00或0,说明难度P=1.00或0,也说明高分组和低分组在通过率上没有差异,区分度D=0。即太难、太易的项目区分度都差。如果通过率为50%,即难度为P=0.50,则有可能高分组都通过,低分组通过0,那么区分度很大,鉴别指数为D=1.00第二单元项目区分度12/26/202287三、区分度与难度的关系第二单元项目区分度12/20/20D的最大值与项目难度的关系

项目通过率D的最大值1.0000.900.200.800.400.700.600.600.80

0.501.000.400.800.300.600.200.400.100.200012/26/202288D的最大值与项目难度的关系项目通过率从上表可以发现,为了增大项目区分度,似乎应该使每个项目难度处于0.50水平,是这样吗?如果每一个项目难度为0.50,项目内容一致性提高,同质性增大。极端情况下,50%的人得满分,50%的人得0分。总分的区分能力反而低。所以,中等难度的项目之间0相关,区分度才能最高。第二单元项目区分度12/26/202289从上表可以发现,为了增大项目区分度,似乎应该使每个项目难度处难度和区分度都是相对的。一般来说。较难的项目对高水平的被试区分度高;较易项目对低水平的被试区分度高;中等难度项目对中等水平的被试区分度高。总体上,特别难和特别易的项目少些,中等难度的项目多些,所有项目平均难度为0.50。即可以保证多数项目的区分度,也保证整个测验的区分能力。第二单元项目区分度12/26/202290难度和区分度都是相对的。一般来说。较难的项目对高水平的被试区记住了吗?1、难度是指项目的难易程度,用P代表,P值越大,难度越低吗?(yes)2、在200个学生中,答对某项目的人数为120人,该项目的难度是多少?0.63、P值越接近于0.50,区别力越高吗?Yes4、测验项目对被试的心理特性的区分能力,叫区分度,还叫什么?也叫鉴别力12/26/202291记住了吗?1、难度是指项目的难易程度,用P代表,P值越大,难第五章心理测量学知识

第一节

概述第二节

测验的常模第三节

测验的信度第四节测验的效度第五节项目分析

第六节测验编制的一般程序第七节心理测验的使用12/26/202292第五章心理测量学知识第一节

概述12/20/20第六节测验编制的一般程序第一单元测验的目标分析第二单元测题的编写第三单元测验的编排和组织12/26/202293第六节测验编制的一般程序第一单元测验的目标分析12/第一单元测验的目标分析12/26/202294第一单元测验的目标分析12/20/202229第一单元测验的目标分析一、测验的对象编制测验前,首先明确要测量的对象。….在我国,农村、城市在文化教育上差异较大,编制测验、制定常模一定要考虑文化因素。龚耀先修订韦氏量表时,将长期生活、工作或学习在县属集镇以上的人口,称之为城镇人口,用城市式;长期生活、工作或学习于农村的称农村人口,用农村式。12/26/202295第一单元测验的目标分析一、测验的对象12/20/2022第一单元测验的目标分析二、测验的用途所编制的测验是对被试做描述,还是做诊断、选拔、预测,应该事先确定。一般来说,测验可以分为两类:显示性测验、预测性测验。12/26/202296第一单元测验的目标分析二、测验的用途12/20/2022第一单元测验的目标分析(一)显示性测验,是指测验题目和所要测量的心理特征相似的测验。如成就测验。古德纳夫把显示性测验分为:样本测验、标记测验。题目取自一个很明确的总体的测验就是样本测验。测量学生混合运算能力,从四则混合运算题目总体中选一组题目作为样本的测量。题目取自一个全开放的总体的测验就是标记测验。智力测验。如果测验成绩高的被试,实际上也很聪明,那么这个智力测验就是智力很好的标记。12/26/202297第一单元测验的目标分析(一)显示性测验,是指测验题目和所第一单元测验的目标分析(二)预测性测验:是指预测一些没被测量的行为的测验。对测验的兴趣,主要在于测验分数能在多大程度上预测行为。GRE中的词汇测验,不是对词汇感兴趣。而是用这个分数预测被试将来在大学的表现。注意:

显示性测验和预测性测验,不是绝对的,有时是统一的。比如高考。题目来自教材,属于显示性测验的样本测验,考试分数可以预测大学的学习成绩,又是预测测验。12/26/202298第一单元测验的目标分析(二)预测性测验:是指预测一些没被三、测验的目标测验的目标是指,编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。要明确测验的目标,还要对测验目标加以分析。将其转换成可操作的术语,这个过程叫目标分析过程。目标分析包括:工作分析、对特定概念下定义、确定测验具体内容。第一单元测验的目标分析12/26/202299三、测验的目标第一单元测验的目标分析12/20/2022工作分析:对于选拔和预测用的预测性测验,要对所预测的行为活动作具体分析。包括:(1)确定哪些心理特征和行为可以使要预测的活动达到成功,…进而确定题目;(2)建立衡量被试是否成功的标准,即效标。……对特定概念下定义:对所测的东西进行界定。比如,创造力的定义:有人定义为:发散思维的能力。据此创造力应该从反应的流畅性、灵活性、独创性、详尽性来测量。确定测验的具体内容:………第一单元测验的目标分析12/26/2022100工作分析:对于选拔和预测用的预测性测验,要对所预测的行为活动再看看,你会不会?1、什么是显示性测验?是指测验题目和所要测量的心理特征相似的测验。2、什么预测性测验?是指预测一些没被测量的行为的测验。3、什么是测验目标?编制的测验是测什么的,即用来测量什么样的心理变量或行为特征4、目标分析包括几部分?工作分析、对特定概念下定义、确定测验具体内容、12/26/2022101再看看,你会不会?1、什么是显示性测验?12/20/2022第二单元测题的编写12/26/2022102第二单元测题的编写12/20/202237第二单元测题的编写一、搜集资料题目来源可以分为:(一)已出版的标准测验(二)理论和专家的经验(三)临床观察和记录12/26/2022103第二单元测题的编写一、搜集资料12/20/202238二、命题的一般原则(一)内容方面:要求题目符合测验的目的,避免贪多;内容取样要有代表性;题目间内容相对独立。(二)文字方面:语言准确,简明扼要,一句话一个概念,意义明确。(三)理解方面:题目要有确切答案,内容可理解,题目格式不要引起误解。(四)社会敏感性方面:不要涉及性、自杀等敏感性问题。如果一定要涉及,鼓励被试真实作答的方法有:见书376。第二单元测题的编写12/26/2022104二、命题的一般原则第二单元测题的编写12/20/2022三、测题的编制要领心理测验题目分类标准很多,常见的是根据对被试的要求分为:提供型、选择型。提供型题目,要求被试给出正确答案。选择型题目要求被试在有限的几个答案中选择正确的答案。分别来看一下编排要领:第二单元测题的编写12/26/2022105三、测题的编制要领第二单元测题的编写12/20/2022(一)选择题选择题由两部分构成:题干和选项。题干就是呈现一个问题的情境,选项就是问题的多种可能答案。常常包括一个正确的答案,和一些错误的答案,也叫“诱答”。对选择题我们既要编好题干,也要编好选项。注意题干所提问题必须明确,使用简单而明确的词语;选项简明扼要;每题只给一个正确答案,其他属诱答;各选项长度相等;避免题干用词与选项用词一致;选项最好用同一形式。第二单元测题的编写12/26/2022106(一)选择题第二单元测题的编写12/20/202241(二)是非题是非题又叫正误题,是指出一个论点要被试判断是否正确,或是从“是、非”两个答案作出选择。编制时,应该注意内容应以有意义的概念、事实或基本原则为基础;每道题只能包含一个概念;尽量避免否定的叙述;若是表达意见的题目,最好说明意见的来源和根据;“是”“非”题的数目应有适当比利,基本相等,随即排列第二单元测题的编写12/26/2022107(二)是非题第二单元测题的编写12/20/202242(三)简答题在客观测验试题中,只有简答题是提供型题目,它要求被试用一个正确的词或句子来完成或填充一个未完成句子的空白,或是提供一个正确的答案。编制原则宜用问句形式;如果是填充形式,空格不宜太多;每题应只有一个正确答案。第二单元测题的编写12/26/2022108(三)简答题第二单元测题的编写12/20/202243(四)操作题是介于一般认知结果的纸笔测验和在未来真实情境的实际活动之间的测验,是让被试实际操作,如画图、走迷津等。编制原则明确所要测量的目标,并将其操作化;尽量选择真实性程度较高的项目;指导语要简明扼要;制定评分标准,确定计分方法。第二单元测题的编写12/26/2022109(四)操作题第二单元测题的编写12/20/202244第三单元测验的编排和组织12/26/2022110第三单元测验的编排和组织12/20/202245第三单元测验的编排和组织一、合成测验(一)选择和审定试题1.选择试题形式:在大多数情况下,任何题目都可以有很多种形式,关键是如何选择“最优的”形式。选择测题形式应该注意:3792.审定题目:编制者或有关专家要对题目反复审查修订;改正意义不明确的词语,取消一些重复和不适用的题目。要注意:37912/26/2022111第三单元测验的编排和组织一、合成测验12/20/2022第三单元测验的编排和组织(二)测题的编排测验题目选出以后,必须根据测验的目的和性质,考虑被试作答时的心理反应方式,加以合理安排。编排的原则:1.测题的难度排列逐步上升2.尽可能将同类型的测题组合在一起3.注意根据各种类型测题本身的特点排列题目排列方式1、并列直进式:2、混合螺旋式:12/26/2022112第三单元测验的编排和组织(二)测题的编排12/20/20二、预测与项目分析初步筛选出的项目,要通过预测进行项目分析。(一)预测目的:获得被试对题目如何反应的资料。注意的问题:预测对象问题;预测的实施过程与情境问题;预测的时限可稍宽;对被试的反应做记录。第三单元测验的编排和组织12/26/2022113二、预测与项目分析第三单元测验的编排和组织12/20/2二、预测与项目分析(二)项目分析:质的分析、量的分析第三单元测验的编排和组织12/26/2022114二、预测与项目分析第三单元测验的编排和组织12/20/2三、信度效度考察(一)信度信度是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论