心理测量学复习_第1页
心理测量学复习_第2页
心理测量学复习_第3页
心理测量学复习_第4页
心理测量学复习_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

测验的项目分析项目分析的目的和任务项目分析是根据具有代表性的被试样本的测验数据,对每个题目进行质量分析。主要包括:项目的难度分析项目的区分度分析项目间的相关分析项目的答案选项分析目的和任务?对测验题目进行筛选、修订,保留质量较好的题目,删除品质较差的题目,以保证测验的效度、鉴别力和信度。测验项目的难度分析(一) 什么是测验项目的难度项目的难度(difficulty)是指测验的项目(或试题)难易程度,通常用P表示。在能力测验中,它就是指试题的难度水平。在非能力测验(如个性、态度等测验)中,难度被称为“通俗性”、“流行性”水平,指被试样本中所选答案的倾向性。(二) 项目难度的计算二级评分法题目的难度计算公式这类项目属客观题,一般是答对给1分,答错给0分.难度计算公式:P=R/N[即:试题通过率]R为其中的答对人数N代表总体(或被试样本)人数•练习:在一次200人参加的测验中,第一道单项选择题的答对人数为60人,第二道题目的答对人数为150人,两道题目的难度系数分别是多少?多级评分项目的难度计算这类题目题目的评分有三个以上分值。-在能力测验中,这类题目可以根据被试的答案与标准答案的接近程度,评定出多个分值。如:测验中的名词解释、简答、论述、案例分析、作文、列举等题目-在非能力测验中,这类项目一般有多个程度(或层次)不同的答案选项,根据选项的程度(或层次),评定相应的分值。例如:-我喜欢可以拆开的玩具:-A.完全符合、B.部分符合、C.完全不符合-我的思想似乎:A.走在了时代前面;B.一般;C.比较保守多级评分项目的难度计算公式:P=X/Xmax曲_被试总体(或代表性样本)某题的平均得分即:P= 该题目满分值•练习:在一次测验中,某道论述题的满分值为15分,90名学生的平均得分为10分。则对于这90名学生来说,该题的难度系数是多少?大规模测验中题目的难度计算:极端分组法当测试人数非常多,而对难度的精确度要求不高时,可以采用面步骤和方法计算题目的难度系数:可将被试按总分高低排列,然后取得分最高的27%作为高分组,取得分最低的27%的被试作为低分组。分别计算题目对于两组被试的难度系数:PH和PL根据下面公式,计算题目对于被试总体的难度系数:P=(PH+PL)/2凯利(Kelley)1939年的研究表明,取27%最精确。二级评分题目的难度校正能力测验中,是非和单项选择题作答有猜测的可能。答案备选项越少,猜测得分的可能性越大。为平衡猜测对难度系数的影响,可用下式校正:CP=(KP-1)/(K-1)CP为校正后的难度;K为备选答案数目;P为由题目得分直接计算出的难度(即通过率)。校正目的:比较答案选项数不同的题目的难度•练习:一个四选一题目的难度系数为0.60;一个是非判断题的难度为0.70。哪个题目的难度大?CP=(4*0.60-1)/(4-1)=0.467CP=(2*0.70-1)/(2-1)=0.40测验难度对测验结果的影响测验难度对测验分数分布形态的影响如果测验项目是同质的,项目间相关在0.25~0.70间,那么•题目难度在0.25~0.75间均匀分布,测验难度适中时,测验分数会出现什么情况?扁平的、近似正态的对称分布,分数的离散程度较大。•题目难度大多在0.80以上,测验难度较小时,测验分数的分布会出现什么情况?负偏态分布:高分偏多且较接近,低分少且较分散•题目难度大多在0.20以下,测验难度较大时,测验分数的分布会出现什么情况?正偏态分布:低分偏多且较接近,高分少且较分散题目的难度分布对测验分数分布的影响?入:题目难度在0.25~0.75间均匀分布扁平的对称分布(多数测验的追求)B:题目的难度大都>0.80负偏态分布。哪类测验希望这样?^题目的难度大都V0.20正偏态分布。哪类测验希望这样?。:题目间相关都很低,难度在0.50左右分数:尖峰的对称分布(不希望的)£:题目间高度相关,题目难度相近,分数:双峰或多峰分布(不希望的)测验题目的难度分布对测验信度的影响艾伯尔的研究表明,题目的难度分布影响测验信度:•正确回答率(或得分率)在25%~75%之间的题目,对测验信度有可能做出较大贡献。•正确回答率(或得分率)在50%左右的题目,能对测验的信度做出更大的贡献。•正确回答率(或得分率)大于90%或小于10%的题目,对测验的信度不可能做出多少贡献。测验的难度对测验鉴别力的影响鉴别学生能力水平的高低,区分出他们之间的差异,是心理与教育测验的主要功能。判断测验的鉴别和区分能力主要看的统计指标?测验分数的分布形态、离散程度等。测验题目的难度对测验的鉴别能力有什么影响?•练习:下面五套测验测量的都是同一种心理属性,题目数量一样,记分方法一样。从理论上讲,下面哪套测验的鉴别力最好?()-测验入:题目的难度均在0.4~0.6之间-测验压题目的难度均匀地分布在0.2〜0.8之间-测验C:绝大数题目的难度都在0.2以下-测验D:绝大数题目的难度都在0.8以上-测验£:题目的难度集中在0.2与0.8两端。(四)测验题目难度分布的要求测验题目的难度分布:是指各种难度的题目数量在题目总数中所占比率的情况。确定项目的难度分布,要考虑两个重要因素:测验目的和项目间的相关程度-测验目的和任务不同,对题目的难度要求也不同;-项目间的相关越高,项目的难度分布范围应越广。不同类别测验对题目难度的要求:-目标参照测验-针对普通群体的常模参照测验-选拔性测验-针对少数特殊群体的标准化测验目标参照测验:测验目的:判断教学目标是否实现题目难度要求:以教学目标的要求为标准,即:教学计划和目标要求学生形成什么样的心理品质和行为表现、能解决什么样的问题,就编制相应的问题情境、评定项目。针对普通群体的常模参照测验:测验目的:对大规模群体的个体水平进行区分和鉴别对于能力和特性水平测验:・题目的难度分布应接近正态分布,-绝大多数题目的难度应在0.25~0.75之间;・平均难度在0.50左右对于个性、态度测验:各个项目被选答案的评定等级的次数分布应接近正态分布。选拔性(或筛选)测验:难度要求测验目的:选拔或筛选出某方面能力水平较高(或较低)的少数人。测验题目的难度:应向选拔率(筛选率)方向靠近。•思考与练习:如果要从2000人的总体中选拔出能力水平较高的100人,并进一步区分其能力水平高低,那么测验题目的难度多大比较合适?选拔率:100/2000=0.05-题目难度系数:0.3或0.2以下-使测验分数分布为:正偏态第一•章心理浏输的编制*图2-1测睑分数分布为谨偏态状芹不是所有测验都要求其分散分布为正态,例如.标准参照测验的分数分布就常常是偏态的C二、项目的区分度区分度是指测验项II对被试的心理特性的区分能力。区分度高的项目,能将不同水平的被试区分开来;区分度低的项目.则不能很好地缪别被试水平,水平高和水平低的被试得分差不多,计算区分度有多种方法,可以根据测验的目的与数据资料的性质进行选择:当然,有时也可以同肘用几种方法相互验让:(-)鉴别指数法区分度分析的一种简便方法是比较烈验总分高和总分低的两组被试在项目通过率上的差别:式中p“为高分组在某项目上的通过率,p,为低分组在该项目上的通过率。二者通过率之差为鉴别指数0。D值越大,项目的区分度越高,即项目越有效=1965年,美国测验专家伊贝尔(LEbel)根据长期的经验提出用鉴别指数评价项目性能的标准,如表2-2所示。(二)相关法计算区分度最常•用的方法是相关法,即以某一项目分数与效标分数或测验总分的相关作为该项目区分度的指标。相关越高,

衰2-2项目鉴别指敷与评价标准项目评价0.40以t0.40以t0.30-0.390.20-0.29。,】9以下良好.修改后会更佳尚好,但需修改差,必须海汰听该项目区分度越高。1.二列相关二列相关适用于两个连续变量,但其中-个变果被人为分成两类。例如,当一个测验的题目分数是连续的,而效标分数或测验总分被分为及格和不及格两类时,就可以采用二列相关法;当效标或莉验总分是连续的,而题目分数被分成通过、不通过两类时,也可采用此法。其公式为:式中&为与二分变量通过组对应的连续变量的平均数.X.为与二分变单未通过组对应的连续变扭的平均数,咒为连续变量的平均数•S,为连续变量的标准差,p为通过组人数与总人数之比,9为未通过组人数与.枝人数之比。'为p与q交界处正态曲线的高度。在ft算二列相关时,要求二分变最的分布在连续测最时必须是正态分布”如果样本分布不是正态,总体分布也应是正态>对于连续变敏的分布,虽不要求其是正态,但必须是单峰,而且要对称。当两个变量均为连续变量时,一般使用皮尔逊(K.Pearson)积差相关公式计算°(参看-般统汁学教科书)二列相关系数G的显著性考验可用下面的公式:gBl塑度2.点二列相关或二列相关适用于••个变仙为连续变另•个变量为二分变址(或双峰分布)的数据资札例如.选择题答对记I分,答错记0分,这时题目分数为二分变量,而总分为连续变量:为了计算其区分度可采用点.•列相关,找公式为:[•-t。广’y1-vp<?式中符号意义与二列相关公式所用符号意义相同,在叶算3时.只要求连续变是是单峰和对称的分布,而二分咨虻不受正•态分布的限制,因此它比二列相关的用途更广泛。例如:根据例1的资料,订算选择题的区分度。解:A>(86+72+65+83+80+75,76+62+91+74+81)N1=76.82.Y=(52+94+22+76+73-^474-88+62+58)^9=63.56,=11+20=0.55<7=1-0.55=0.45§二16.66京坦整空,竺,\/0:55^0.45=039610.00考验点二列相关是否显著q考验枳差相关系数的显著性相同,此外还可以用t检验的方法比较与二分变敏对偶的两组连续变筮的平均数的差界是否显著.如平均数的整异显著,则相关系数也显著,三、区分度与难度的关系区分度勺难度有密切关系〉假如,某项目的通过犁为].(X)或0,则说明高分组与低分组在通过率上不存在差异.因此,鉴别指数/>第.漳心埋瓣砌的编制皋为仇假如.项灯的通过率为0.50.卿可能是高分现的所有人都通过「,而低分组却无人通过,这祥"的最大值可能达到1回。从上述分析中可以看出,难度越接近0.50,项日的潜在区分度越大,谁度越接近(.00或0时,项目的潜在区分度越小(见图2-3)。但是在实际编制测验时,不能要求所有项目的难度均为0.50。由于一个测验中的顼目大多趋向于有关的内容或技能而具有某种程度的相关,假如,所有的项目都完全相关(r=l),并且谁度均为0.5(),在-•个项目匕通过的人在其他各项上也会通过,在一个项目上失败的人在其他各顼上也将失败,那么,一半被试将通过每-个项目,另一半将全不通过。在这种情况下,测验将只有两种分数:满分和零分.成U型分布。这样.从整体来说,测验所提供的信息便相对减少。事实上,如果测验的所有项目都是中等谁度,只有项目的内在相关为尊时,整个测验分数才能产生正态分布°考虑到一般测验项目之间都具有某种相关,推度的分布广一些,梯度多一麒,是合乎需要的。分布广,才能把各种水平的人都区分开来;梯按多,才能区分得更细一,好比-•把尺子,全距越长,刻度越多,可应用的范围便越大,测员也越精细。难度和区分度都是相对的,是针对一定团体而言的(绝对的玳度和区分度是不存在的)。--般说来,较难的项目对高水平的被试区分度高,较容易的项目对水平低的被试区分度高,中等难度的项目娜,心朝.学对中等水平的被试区分度高,这与中等难度的项目区分度最高的说法并不矛盾.因为对被试总体是较难或较易的项目,对水平高或水平低的被试便成「中等谁度:由于人的多数心理特征呈正态分布、所以当霄要把人作最大程度区分时,项目难度的分布也以正态为好.即特别难与特别容易的项目较少,越接近中等难度的项目越多.而所有项目的平均难度为0.50.四、项目分析的特殊问题(■0选择题反应模式的分析对于选择厩,除「分析其谁厦和区分度外,还要分析被试对每个备选答案的反应情况。-般主要做以下分析:'如果正确的务选答案被所有被试所选择.则说明该题目太容易或者题目中洱能提供了某种暗示;如果某个错误答案没有一个被试选择,说明该选项不具■迷惑性,错得过于明显,-般说来,除非有2%以上的人选择,否则这个备选答案就应该修改;,如果所有被试都选择了同个错误答案,可能是编制测羚时把答案定错了,也可能是在教学中发生了错误;如果高分组被试的选择集中在两个答案上,二者选择率相近,说明邮可能有两个正确答案或另一答案也有一定道理;如果高分组对正确答案的选择与低分组相等或祇于后者,说明所考察的东西与水平无关;如果~个题目被试未答人数过多或选择各个备选答案人数相等・则说明题目过难或题意不清,使得被试无法作答或凭猜测作答。仁)标准参照渊验的项目分析以上讨论的均是常模参照测验的项目分析方法C标准参照测验主要用于判断被试是否掌握了某些知识技能,是否达到r一个弟先第二革心浒裾盼的编制*确定的标准,测蚣结果只与既定标准比较而不在被试之间作比较因此,调胎分数的变异杵不是弥准参照测验的必要条件=所以.常模参照测I续的项H分析方法不完全适用于标准参照测捡难度分析标准参照测验可以采用常模参照测验的方法来计算琳度.但是在筛选项片时,对谁度水平的要求与常模参照测验不同.、巾「•标准参照测验的目的是为「考察被试对某方面的知识技能的掌握情况,因此,只要能反映教育口标或教育者认为粮要的内容,无论其难度为多少.耶可以编入测验:例如,我们在教学开始之前,为了了解学生的准备状态所进行的谢洲,多数题目将产生很低的通过率,但这些题目应该保留,因为它们表明r哪些东商需要学习“在进行,段教学之后.为r检查学生的掌握情况所进行的后测.即使每个题目都有很高的通过率,这些题目也是可用的,因为它们反映了教学的效果,同一道题在教学前后对学生进行测验,学生的得分如为fp模式(F为失败,p为通过),则说明教学取得r较好的效果或题目较好;如为FF模式,说明教学效果太船或题月太难了;如为PP模式,说明题目过于容易了;如为PF模式.则说明这个题编制有错误或者教学上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论